# 使用selenium+OpenCV破解极验滑动/滑块验证码
本文主要讲解如何使用selenium+OpenCV来破解极验滑动验证码,主要步骤如下:
1. 使用selenium打开目标网页,获取验证码背景图片和滑块图片
2. 使用OpenCV来识别滑块的位置并计算滑动的距离
3. 使用selenium模拟鼠标拖动滑块,完成验证
## 实现效果
![demo.gif](demo.gif)
## 主要难点
### 极验验证码会检测当前浏览器环境,如果发现是自动化脚本控制的浏览器,则验证将失败。
自动化脚本控制的浏览器都具有一些特征,网站可以通过检测这些特征来识别非正常访问。
不过这些特征可以通过一些特殊的技术进行隐藏伪装,比如puppeteer-extra-plugin-stealth插件中提供的stealth.min.js脚本。
我们可以配置selenium在加载网页之前先加载stealth.min.js脚本,这样就可以绕过网页自身的检测机制。
```python
def open_browser(url: str) -> webdriver.Chrome:
"""打开浏览器并导航到指定网址"""
print('打开验证码页面...')
# 创建一个Chrome浏览器实例
browser = webdriver.Chrome()
# 在加载页面之前先加载stealth.min.js,防止被识别为机器人访问
with open('stealth.min.js', 'r') as f:
js = f.read()
browser.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': js})
# 打开指定网址
browser.get(url)
return browser
```
### 识别滑块的位置
使用OpenCV的matchTemplate函数可以比较两张图片的相似度,从而找到滑块的位置。
```python
def compute_slide_offset(bg_canvas_content, slide_canvas_content):
"""根据背景图片和滑块图片计算滑块位置,并返回需要滑动的距离。"""
bg_img = cv2.imdecode(np.frombuffer(base64.b64decode(bg_canvas_content), np.uint8), cv2.IMREAD_UNCHANGED)
tp_img, tp_bounding_box = crop_slider(slide_canvas_content) # 裁剪掉滑块图片的透明背景,只留下滑块本身
# 识别图片边缘
bg_edge = cv2.Canny(bg_img, 100, 200)
tp_edge = cv2.Canny(tp_img, 100, 200)
# 转换图片格式
bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)
# 缺口匹配
res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配
return max_loc[0] - tp_bounding_box[0]
```
识别效果:
背景图:
![bg.png](bg.png)
滑块图:
![tp.png](tp.png)
识别结果:
![result.png](result.png)
绿框是滑块初始位置,红框是识别需要拖动到的滑块位置,这两个位置之间的水平位移就是滑动的距离。
### 模拟人类拖动滑块
直接拖动滑块将被极验识别为机器人操作,本来想通过采集人类轨迹然后构建轨迹库来模拟人类操作,后来发现在拖动滑块后延迟两秒释放滑块就可以通过验证,
看来极验对轨迹的验证还是有漏洞的。
```python
def slide(slide_offset):
"""拖动滑块"""
print('拖动滑块...')
wait = WebDriverWait(browser, 1800)
element = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,
'body > div.geetest_fullpage_click.geetest_float.geetest_wind.geetest_slide3 > div.geetest_fullpage_click_wrap > div.geetest_fullpage_click_box > div > div.geetest_wrap > div.geetest_slider.geetest_ready > div.geetest_slider_button')))
actions = ActionChains(browser, duration=2000) # 拖动不能太快,不然验证会失败
actions.drag_and_drop_by_offset(element, slide_offset, 0)
actions.perform()
```
## 运行DEMO
```shell
cd <path_to_project>
python3.10 -m venv ./venv
source ./venv/bin/activate
pip install -r requirements.txt
python main.py
```
## 备注
本文章仅作为技术交流使用,禁止用于非法用途。
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
geetest-slide-crack-v1.zip (9个子文件)
geetest-slide-crack-v1
stealth.min.js 176KB
.DS_Store 6KB
main.py 7KB
result.png 39KB
bg.png 44KB
requirements.txt 55B
README.md 4KB
tp.png 7KB
demo.gif 1.46MB
共 9 条
- 1
资源评论
- 努力成为废物的小励志2024-04-04代码可以用,下载还不要积分,好人一生平安。 #完美解决问题 #注释完整 #内容详尽 #运行顺畅
AppRen
- 粉丝: 4
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 筷手引流工具.apk
- 论文(最终)_20240430235101.pdf
- 基于python编写的Keras深度学习框架开发,利用卷积神经网络CNN,快速识别图片并进行分类
- 最全空间计量实证方法(空间杜宾模型和检验以及结果解释文档).txt
- 5uonly.apk
- 蓝桥杯Python组的历年真题
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 前端开发技术实验报告:内含4四实验&实验报告
- Highlight Plus v20.0.1
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功