点触验证码
1.点触验证码简介
点触验证码的类型比较多,我们今天要进行处理的是文字点选,给若干个关键字和一张图片,按照顺序选出图片当中对应的关键字。网易易盾
2.点触验证码处理思路
对于这一类验证码,通常是采用图像处理+文字识别的方式进行处理,相对于前面的图像处理来说,没有太大的区别,依然是通过
1.读取图片
2.转换成灰度图
3.去噪处理
4.边缘处理
5.找到文字的轮廓
6.定位所有的文字位置
但是点触验证中的文字是通过一些特殊的处理的,与普通的印刷体字不一样,而pytesseract这类图像识别库只能识别印刷体,对于其他字体识别率非常低,所以不能使用。当然,我们可以通过深度学习进行模型训练实现。但是训练模型需要大量的样本,数据清洗;花费的时间和精力成本太高,从实用性来说,绝大部分企业都会选择使用第三方打码平台。由专门的企业去做这样的事情。
3.点触验证码处理流程
访问网址——》找到所在标签——》截图保存——》打码平台识别——》获取对应的坐标——》点击对应坐标并验证