【免费】使用selenium+OpenCV破解极验滑动/滑块验证码项目源码

共9个文件

png：3个

txt：1个

py：1个

opencv

selenium

5星 · 超过95%的资源需积分: 0 93 浏览量更新于2024-02-22 1 收藏 1.32MB ZIP 举报

本项目演示了如何使用selenium+OpenCV破解极验的滑动/滑块验证码，本项目仅作为技术交流使用，禁止用于非法用途。

收起资源包目录

geetest-slide-crack-v1.zip （9个子文件）

geetest-slide-crack-v1

stealth.min.js 176KB

.DS_Store 6KB

main.py 7KB

result.png 39KB

bg.png 44KB

requirements.txt 55B

README.md 4KB

tp.png 7KB

demo.gif 1.46MB

资源推荐

资源预览

资源评论

# 使用selenium+OpenCV破解极验滑动/滑块验证码本文主要讲解如何使用selenium+OpenCV来破解极验滑动验证码，主要步骤如下： 1. 使用selenium打开目标网页，获取验证码背景图片和滑块图片 2. 使用OpenCV来识别滑块的位置并计算滑动的距离 3. 使用selenium模拟鼠标拖动滑块，完成验证 ## 实现效果 ![demo.gif](demo.gif) ## 主要难点 ### 极验验证码会检测当前浏览器环境，如果发现是自动化脚本控制的浏览器，则验证将失败。自动化脚本控制的浏览器都具有一些特征，网站可以通过检测这些特征来识别非正常访问。不过这些特征可以通过一些特殊的技术进行隐藏伪装，比如puppeteer-extra-plugin-stealth插件中提供的stealth.min.js脚本。我们可以配置selenium在加载网页之前先加载stealth.min.js脚本，这样就可以绕过网页自身的检测机制。 ```python def open_browser(url: str) -> webdriver.Chrome: """打开浏览器并导航到指定网址""" print('打开验证码页面...') # 创建一个Chrome浏览器实例 browser = webdriver.Chrome() # 在加载页面之前先加载stealth.min.js，防止被识别为机器人访问 with open('stealth.min.js', 'r') as f: js = f.read() browser.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': js}) # 打开指定网址 browser.get(url) return browser ``` ### 识别滑块的位置使用OpenCV的matchTemplate函数可以比较两张图片的相似度，从而找到滑块的位置。 ```python def compute_slide_offset(bg_canvas_content, slide_canvas_content): """根据背景图片和滑块图片计算滑块位置，并返回需要滑动的距离。""" bg_img = cv2.imdecode(np.frombuffer(base64.b64decode(bg_canvas_content), np.uint8), cv2.IMREAD_UNCHANGED) tp_img, tp_bounding_box = crop_slider(slide_canvas_content) # 裁剪掉滑块图片的透明背景，只留下滑块本身 # 识别图片边缘 bg_edge = cv2.Canny(bg_img, 100, 200) tp_edge = cv2.Canny(tp_img, 100, 200) # 转换图片格式 bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB) tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB) # 缺口匹配 res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED) min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配 return max_loc[0] - tp_bounding_box[0] ``` 识别效果：背景图： ![bg.png](bg.png) 滑块图： ![tp.png](tp.png) 识别结果： ![result.png](result.png) 绿框是滑块初始位置，红框是识别需要拖动到的滑块位置，这两个位置之间的水平位移就是滑动的距离。 ### 模拟人类拖动滑块直接拖动滑块将被极验识别为机器人操作，本来想通过采集人类轨迹然后构建轨迹库来模拟人类操作，后来发现在拖动滑块后延迟两秒释放滑块就可以通过验证，看来极验对轨迹的验证还是有漏洞的。 ```python def slide(slide_offset): """拖动滑块""" print('拖动滑块...') wait = WebDriverWait(browser, 1800) element = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, 'body > div.geetest_fullpage_click.geetest_float.geetest_wind.geetest_slide3 > div.geetest_fullpage_click_wrap > div.geetest_fullpage_click_box > div > div.geetest_wrap > div.geetest_slider.geetest_ready > div.geetest_slider_button'))) actions = ActionChains(browser, duration=2000) # 拖动不能太快，不然验证会失败 actions.drag_and_drop_by_offset(element, slide_offset, 0) actions.perform() ``` ## 运行DEMO ```shell cd <path_to_project> python3.10 -m venv ./venv source ./venv/bin/activate pip install -r requirements.txt python main.py ``` ## 备注本文章仅作为技术交流使用，禁止用于非法用途。