# 使用selenium+OpenCV破解极验滑动/滑块验证码
本文主要讲解如何使用selenium+OpenCV来破解极验滑动验证码,主要步骤如下:
1. 使用selenium打开目标网页,获取验证码背景图片和滑块图片
2. 使用OpenCV来识别滑块的位置并计算滑动的距离
3. 使用selenium模拟鼠标拖动滑块,完成验证
## 实现效果
![demo.gif](demo.gif)
## 主要难点
### 极验验证码会检测当前浏览器环境,如果发现是自动化脚本控制的浏览器,则验证将失败。
自动化脚本控制的浏览器都具有一些特征,网站可以通过检测这些特征来识别非正常访问。
不过这些特征可以通过一些特殊的技术进行隐藏伪装,比如puppeteer-extra-plugin-stealth插件中提供的stealth.min.js脚本。
我们可以配置selenium在加载网页之前先加载stealth.min.js脚本,这样就可以绕过网页自身的检测机制。
```python
def open_browser(url: str) -> webdriver.Chrome:
"""打开浏览器并导航到指定网址"""
print('打开验证码页面...')
# 创建一个Chrome浏览器实例
browser = webdriver.Chrome()
# 在加载页面之前先加载stealth.min.js,防止被识别为机器人访问
with open('stealth.min.js', 'r') as f:
js = f.read()
browser.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': js})
# 打开指定网址
browser.get(url)
return browser
```
### 识别滑块的位置
使用OpenCV的matchTemplate函数可以比较两张图片的相似度,从而找到滑块的位置。
```python
def compute_slide_offset(bg_canvas_content, slide_canvas_content):
"""根据背景图片和滑块图片计算滑块位置,并返回需要滑动的距离。"""
bg_img = cv2.imdecode(np.frombuffer(base64.b64decode(bg_canvas_content), np.uint8), cv2.IMREAD_UNCHANGED)
tp_img, tp_bounding_box = crop_slider(slide_canvas_content) # 裁剪掉滑块图片的透明背景,只留下滑块本身
# 识别图片边缘
bg_edge = cv2.Canny(bg_img, 100, 200)
tp_edge = cv2.Canny(tp_img, 100, 200)
# 转换图片格式
bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)
# 缺口匹配
res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # 寻找最优匹配
return max_loc[0] - tp_bounding_box[0]
```
识别效果:
背景图:
![bg.png](bg.png)
滑块图:
![tp.png](tp.png)
识别结果:
![result.png](result.png)
绿框是滑块初始位置,红框是识别需要拖动到的滑块位置,这两个位置之间的水平位移就是滑动的距离。
### 模拟人类拖动滑块
直接拖动滑块将被极验识别为机器人操作,本来想通过采集人类轨迹然后构建轨迹库来模拟人类操作,后来发现在拖动滑块后延迟两秒释放滑块就可以通过验证,
看来极验对轨迹的验证还是有漏洞的。
```python
def slide(slide_offset):
"""拖动滑块"""
print('拖动滑块...')
wait = WebDriverWait(browser, 1800)
element = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,
'body > div.geetest_fullpage_click.geetest_float.geetest_wind.geetest_slide3 > div.geetest_fullpage_click_wrap > div.geetest_fullpage_click_box > div > div.geetest_wrap > div.geetest_slider.geetest_ready > div.geetest_slider_button')))
actions = ActionChains(browser, duration=2000) # 拖动不能太快,不然验证会失败
actions.drag_and_drop_by_offset(element, slide_offset, 0)
actions.perform()
```
## 运行DEMO
```shell
cd <path_to_project>
python3.10 -m venv ./venv
source ./venv/bin/activate
pip install -r requirements.txt
python main.py
```
## 备注
本文章仅作为技术交流使用,禁止用于非法用途。
使用selenium+OpenCV破解极验滑动/滑块验证码项目源码
5星 · 超过95%的资源 需积分: 0 93 浏览量
更新于2024-02-22
1
收藏 1.32MB ZIP 举报
本项目演示了如何使用selenium+OpenCV破解极验的滑动/滑块验证码,本项目仅作为技术交流使用,禁止用于非法用途。
AppRen
- 粉丝: 49
- 资源: 1
最新资源
- 2kw, 2.4kw, 3.6kw全系列双向储能电源解决方案,c语言源代码仿真,电池充电1200w, 离网逆变2kw,并网逆变2kw,全程工作最优模式
- 基于comsol的高频振动击碎微颗粒的乳化仿真 采用较高频率振动,击碎微颗粒,达到均质或其他目的 本模型计算了整个击碎的微观过程 通过comsol的流固耦合和两相流进行计算,合理的设置调试后,可以
- 基于范围选择的多目标进化算法,多目标优化算法程序代码,PESA-II,采用pesa2求解多目标优化问题,求解得到pareto最优解 基于matlab的.m程序,采用模块化编程,便于修改,注释率高,易
- 松下FP-XH PLC程序 旋转上下料机 松下FP-XH系列PLC程序,等输入输出模块 四轴轴脉冲控制伺服电机,绝对定位,真空报警、正负极限位报警、气缸报警,位置控制模式采用数据表设置模式
- 汽车制动盘热仿真分析matlab源代码 可用于不同材料,不同体积汽车制动盘的热性能仿真对比分析 适用于赛道刹车盘热工况,AMS工况热容量仿真分析等
- 转动惯量离线辨识算法仿真 1.模型简介 模型为永磁同步电机伺服控制仿真,采用Matlab R2018a Simulink搭建 模型内主要包含DC直流电压源、三相逆变器、永磁同步电机、采样模块、SVP
- 三菱FX5U系列程序 三菱FX5U程序,FX5U-80MT ES,FX5-16ET ES-H*4共12轴运动控制,FX5-32ET ES等输入输出模块 尺寸检测机 轴JOG,回原点,绝对定
- MATLAB代码:考虑电动汽车负荷随机性的蓄电池容量优化配置 关键词:蓄电池容量优化配置 储能优化配置 中长期配置 并网波动性 参考文档:《不确定环境下并网型光储微电网的容量规划》考虑电动汽车
- MATLAB代码:基于改进萤火虫算法的分布式电源选址定容-IEEE33节点 关键词:改进萤火虫算法 选址定容 分布式电源 参考文档:《基于改进萤火虫算法的分布式电源的选址和定容-史吏》基本复现
- MATLAB代码:基于NSGA-II的风光水多能互补协调优化调度 关键词:NSGA-II算法 多目标优化 水电-光伏多能互补 参考文档:《店主自写文档》基本复现; 仿真平台:MATLAB 主要
- 基于改进鲸鱼优化算法的冷热电联供微网多时间尺度优化调度模型 关键词:改进鲸鱼算法 冷热电联供微网 优化调度 多时间尺度 容量配置 主要内容:代码主要做的是一个冷热电联供微网的优化调度问题,为了优化其
- MATLAB代码:基于遗传算法的电动汽车有序充放电优化 关键词:遗传算法 电动汽车 有序充电 优化调度 参考文档:《精英自适应混合遗传算法及其实现-江建》 MATLAB 利用遗传算法对电动汽车有序
- MATLAB代码:基于MATLAB的三母线高斯赛德尔潮流分析计算 关键词:潮流计算 电力系统 高斯赛德尔迭代法 MATLAB 参考文献+自制详细实验文档 仿真平台:MATLAB 主要内容:潮流计算是判
- STM32 EtherCAT EtherCAT通信,量产伺服驱动器 采用STM32作为主控 支持ethercat从站IO,模拟输入 已实现底层驱动,中断处理,数据通信 包括原理图,源代码,说明文档 已
- 西门子smart 200 rtu方式通讯四台三菱E700变频器资料 硬件:smart plc.三菱E700变频器,mcgs触摸屏(电脑仿真也可) 功能:指针写法,通过modbus rtu方式,实现对
- 模块化多电平变器MMC的pi 无源控制 滑模控制策略实现(交流7kV-直流20kV整流)仿真,三个仿真均为外环pi控制输出稳压20kV,内环分别采用pi 无源控制 滑模控制 单桥臂二十子模块(子模块