分享好友 最新动态首页 最新动态分类 切换频道
教你python自动识别图文验证码的解决方案!
2024-12-25 11:08

验证码识别解决方案 对于web应用程序来讲,处于安全性考虑,在登录的时候,都会设置验证码,验证码的类型种类繁多,有图片中辨别数字字母的,有点击图片中指定的文字的,也有算术计算结果的,再复杂一点就是滑动验证的。诸如此类的验证码,对我们的系统增加了安全性的保障,但是对于我们测试人员来讲,在自动化测试的过程中,无疑是一个棘手的问题。

如果对软件测试、接口、自动化、性能测试、测试开发、面试经验交流。感兴趣可以加裙485187702,群内会有不定期的发放免费的资料链接,这些资料都是从各个技术网站搜集、整理出来的,如果你有好的学习资料可以私聊发我,我会注明出处之后分享给大家。

1、web自动化验证码解决方案 一般在我们测试过程中,登录遇到上述的验证码的时候,有以下种解决方案:

第一种、让开发去掉验证码 第二种、设置一个万能的验证码 第三种、通过cookie绕过登录 第四种、自动识别技术识别验证码 2、自动识别技术识别验证码 前三种解决方案,想必大家都比较了解,本文重点阐述第四种解决方案,也就是验证码的自动识别,关于验证码识别这一块,可以通过两个方案来解决

第一种是:OCR自动识别技术, 第二种是:通过第三方打码平台的接口来识别。 OCR识别技术 OCR中文名称光学识别, tesseract是一个有名的开源OCR识别框架,它与Leptonica图片处理库结合,可以读取各种格式的图像并将它们转化成超过60种语言的文本,可以不断训练自己的识别库,使图像转换文本的能力不断增强。如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。那么接下来给大家介绍一下如何使用tessract来识别我们的验证码。

关于OCR自动识别这一块,需要大家安装Tesseract,并配置好环境,步骤如下 1)、安装tesseract

适用于Tesseract 3.05-02和Tesseract 4.00-beta的

Windows安装程序下载地址:github.com/UB-Mannheim…

2)、加入培训数据

tesseract 默认只能识别英文,如果您想要识别其他语言,则需要下载相应的培训数据

下载地址:github.com/tesseract-o…

下图为中文数据包

我们只做中文,暂时下载一个中文的文字训练数据就可以 ,然后将.traineddata文件复制到安装之后的'tessdata'目录中。C:OCRTesseract-OCR essdata

3)、配置环境变量

要从任何位置访问tesseract-OCR,您可能必须将tesseract-OCR二进制文件所在的目录添加到Path变量中C:OCRTesseract-OCR。

安装后tesseract之后 ,并不能直接在python中使用,我们要想在python中使用,需要安装pytesseract模块我们可以通过 pip 安装 pip install pytesseract python中识别验证码图片内容 安装好后。找一张验证码图片,如下图(命名为test.jpg,放在当前python文件同级目录下面

使用 PIL中的Image中的open方法打开验证码图片,调用pytesseract.image_to_string方法,可以识别图片中的文字,并且转换成字符串,如下面代码所示。

import pytesseract from PIL import Image pic = Image.open('test.jpg')

text = pytesseract.image_to_string(pic,lang='chi_sim') print(text) 通过上述方法能识别简单的验证码,但是存在一定的问题,识别的精度不高,对于一些复杂一点,有干扰线的验证码无法正确识别出结果。

接下来给大家介绍一下第二种识别的方案,第三方的打码平台识别

打码平台识别验证码 第三方的打码平台相对于OCR来讲,优势在于识别的精准度高,网络上的第三方打码平台很多,百度随便一搜就有几十个,这个给大家列举几个,如下所示

网络上的第三方打码平台众多,这里小编选择超级鹰这个第三方的平台来给大家做演示。

首先登录我们需要注册登录超级鹰这个网站 www.chaojiying.com,进入之后我们找到python对应的开发文档并下载, 下载开发文档 下载之后解压缩,得到如下文件 第三方打码平台的接口分析 我们打开chaojiying.py这个文件后,会发现这个文件中给出了的接口非常简单,如下所示

首先第一步创建一个用户对象:三个参数(账号,密码,软件ID,账号密码就是该网站的账号密码,那么软件ID呢?软件ID我们可以在用户中心找到软件ID,然后进去点击生成一个软件ID(如下图

第二行代码就是打开一个要识别的验证码图片,并读取内容, 第三行,调用PostPic方法识别验证码,两个参数(验证码图片内容,验证码类型,关于验证码类型,请参考该网站的价格体系(如下图),根据验证码类型选择对应的数值传入。

结果提取: PostPic返回的是一个字典类型的数据,识别的验证码在该字典中的pic_str这个键中 res = cjy.PostPic(im, 1902) # 1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加() data = res['pic_str'] print(data) 第三方接口给大家介绍到这里,接下来我们实际应用到登录中去。 提示:打码平台一般都是收费的(差不多是一分钱,识别一次

3、自动识别验证码登录案例 登录案例 接下来以超级鹰这个网站为列,使用web自动化测试框架selenium来实现验证码识别自动登录, 需要用到的库有selenium、pillow、time,和我们上面下载的超级鹰的接口文件 环境安装 1、selenium安装 pip install selenium 2、chromedriver 安装

chromedriver.storage.googleapis.com/index.html 下载和自己chrome浏览器对应的chromedriver版本, 配置环境变量

3、pillow模块安装(处理图像的库) pip install pillow

实现步骤分析 1、获取账号密码输入框:输入账号密码 2、获取验证码图片 将当前页面截图 选择图片元素,获取上下左右位置 使用PIL模块对页面图片进行再次截图(获取验证码图片) 将验证码图片保存

3、调用第三方接口识别验证码 4、输入验证码结果 5、点击登录 1 具体代码实现 1、selenium打开登录页面 import time from selenium import webdriver from PIL import Image from chaojiying import Chaojiying_Client ​

browser = webdriver.Chrome()

url = 'www.chaojiying.com/user/mysoft…' browser.get(url) time.sleep(1) # 暂停一秒钟 2、获取账号密码输入框:输入账号密码

input_user=browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[1]/input')

input_user.send_keys('账号') input_pwd=browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[2]/input')

input_pwd.send_keys('密码') 2、获取验证码图片 将当前页面截图

browser.save_screenshot('login.png') 选择图片元素,获取上下左右位置

yzm_btn = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/div/img')

loc = yzm_btn.location

size = yzm_btn.size 获取验证码上下左右的位置,此处要注意查看电脑显示的缩放比列(如下图,根据比列乘以相应的系数,我这边的显示比列是125,那么对于的系数就是1.25(如果你的是150,那么就乘以1.5) left = loc['x']*1.25 # 计算左边界 top = loc['y']*1.25 # 计算上边界 right = (loc['x'] + size['width'])*1.25 # 计算右边界 botom = (loc['y'] + size['height'])*1.25 # 计算下边界

local = (left, top, right, botom)

使用PIL模块对页面图片进行再次截图(获取验证码图片,将验证码图片保存 pic = PIL.Image.open('file') pic.crop(local) pic.sava('zym,png')

3、调用第三方接口识别验证码

cjy = Chaojiying_Client('账号', '密码', '软件ID') # 用户中心>>软件ID 生成一个 im = open('yzm.png', 'rb').read() # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// res = cjy.PostPic(im, 1902) # 1902 验证码类型 data = res['pic_str'] print(data) 4、输入验证码结果

yzm_input = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[3]/input') yzm_input.send_keys(data) 5、点击登录

submit = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[4]/input') submit.click( import time from selenium import webdriver from PIL import Image from chaojiying import Chaojiying_Client ​

browser = webdriver.Chrome()

url = 'www.chaojiying.com/user/mysoft…' browser.get(url) time.sleep(1) # 暂停一秒钟

input_user = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[1]/input') input_user.send_keys('qq121292679') input_pwd = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[2]/input') input_pwd.send_keys('546245426')

browser.save_screenshot('login.png')

yzm_btn = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/div/img')

loc = yzm_btn.location

size = yzm_btn.size

left = loc['x']*1.25 top = loc['y']*1.25 right = (loc['x'] + size['width'])*1.25 botom = (loc['y'] + size['height'])*1.25 val = (left, top, right, botom)

login_pic = Image.open('login.png')

yzm_pic = login_pic.crop(val) yzm_pic.save('yzm.png') ​

cjy = Chaojiying_Client('qq121292679', '546245426', '96001') # 用户中心>>软件ID 生成一个替换 96001 im = open('yzm.png', 'rb').read() # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// res = cjy.PostPic(im, 1902) # 1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加() data = res['pic_str'] print(data) ​

yzm_input = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[3]/input') yzm_input.send_keys(data) ​ ​

submit = browser.find_element_by_xpath('/html/body/div[3]/div/div[3]/div[1]/form/p[4]/input') submit.click() ​

最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走

最新文章
DevEco Studio可视化界面开发教程
为了帮助刚入行的小白快速上手使用DevEco Studio进行可视化界面开发,以下是整体的流程:创建新项目设计界面布局添加控件元素设置控件属性和事件编写逻辑代码运行和调试下面将逐一介绍每个步骤需要做的事情以及相关的代码。首先,我们需要
2025最佳页面设计软件推荐,专业设计师常用的都在这里了
更新时间:2024-10-23 15:28:34今天这期不容错过,专业设计师们常用的 7 款软件都会在这期进行呈现,分别是即时设计、、Affinity Designer、Gravit Designer、Marvel、Bootstrap 与 Squarespace。对于专业设计师而言,选择适合自己的页面设
B站直播的极速排障建设
一、概述直播业务具有实时性强,复杂度高,排查链路长,影响面大等特征,线上问题如果不能立刻排查处理,分分秒秒都在影响用户的观看体验、主播的收入。但各端的问题可能都只是表象,例如,一个看似简单的画面卡顿问题,可能涉及到编码器配
Google 给我们展示了下一代搜索引擎的样子
作为一家靠搜索引擎发展起来的科技巨头,Google 在今年的开发者大会上给我们展示了下一代搜索引擎。1996 年 8 月,拉里·佩奇和谢尔盖·布林在斯坦福大学的网络上发布了一个名为 BackRub 的搜索引擎,后来这个搜索引擎改名为「Google」。到
C++实现DDos攻击测试
//for basic C funtions#includelt;stdio.hgt;//for string operations#includelt;stringgt;//only for cin and cout#includelt;iostreamgt;//for the socket programming in cpp#includelt;winsock2.hgt;//linking to ws2_32 library#prag
GCDF全球职业规划师认证:解锁职业发展新境界
在瞬息万变的职场江湖,如何规划自己的职业生涯成为许多人关注的焦点。全球职业规划师认证(GCDF)应运而生,为广大职场人士提供了一把解锁职业发展新境界的钥匙。本文北森生涯将深入剖析GCDF的内涵、价值及发展前景,助你把握全球职业规划
AI 绘画碰上经典古诗词,当真是笑不活了
用 AI 给“中文难度 10 级”的古诗词、文言文配插图,会是什么 Style?B站百万网友会告诉你:堪比“灵魂出窍”,直接绷不住了。具体啥情况?请各位观众老爷来看 VCR。现在展示的是李白《将进酒》名场面,这下可是真・300 杯:△网友:连羊
docker 中文官网 docker wiki
Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Windows操作系统的机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。Dcoker 是基
boss直聘苹果手机ios版
boss直聘ios版是苹果手机客户端版本,boss直聘专注于求职招聘,很多人都在用的找工作软件,超丰富的全面的职业岗位信息,公司企业在线查询,信息真实,让求职更高效,感兴趣的小伙伴不要错过哦!BOSS直聘专注互联网招聘求职找工作APP,求职
DBY DCY 250450500 三级圆柱齿轮减速机配5马力电机
ZQ JZQ软齿表面减速器ZSY / ZLY / ZDY圆柱齿轮减速机,齿轮渗碳,淬火,研磨,高承载能力,低噪音;主要用于皮带输送机和各种运输机械,也可用于驾驶其他一般机械。优点是:输入轴和输出轴在驱动装置中垂直布置,轴承容量强,使用寿命长,体
相关文章
推荐文章
发表评论
0评