第七篇:爬虫实战-
作者:互联网
破解极验滑动验证码
一、介绍
一些网站会在正常的账号密码认证之外加一些验证码,以此来明确地区分人/机行为,从一定程度上达到反爬的效果,对于简单的校验码Tesserocr就可以搞定,如下
但一些网站加入了滑动验证码,最典型的要属于极验滑动认证了,极验官网:http://www.geetest.com/,下图是极验的登录界面
现在极验验证码已经更新到了 3.0 版本,截至 2017 年 7 月全球已有十六万家企业正在使用极验,每天服务响应超过四亿次,广泛应用于直播视频、金融服务、电子商务、游戏娱乐、政府企业等各大类型网站
对于这类验证,如果我们直接模拟表单请求,繁琐的认证参数与认证流程会让你蛋碎一地,我们可以用selenium驱动浏览器来解决这个问题,大致分为以下几个步骤
#1、输入账号、密码,然后点击登陆 #2、点击按钮,弹出没有缺口的图 #3、针对没有缺口的图片进行截图 #4、点击滑动按钮,弹出有缺口的图 #5、针对有缺口的图片进行截图 #6、对比两张图片,找出缺口,即滑动的位移 #7、按照人的行为行为习惯,把总位移切成一段段小的位移 #8、按照位移移动
#9、完成登录
二、实现
安装:selenium+chrome/phantomjs #安装:Pillow Pillow:基于PIL,处理python 3.x的图形图像库.因为PIL只能处理到python 2.x,而这个模块能处理Python3.x,目前用它做图形的很多. http://www.cnblogs.com/apexchu/p/4231041.html C:\Users\Administrator>pip3 install pillow C:\Users\Administrator>python3 Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> from PIL import Image >>>View Code
案例:
破解博客园后台登录 修订版用类封装的版本
svcr 使用类
标签:实战,极验,PIL,验证码,爬虫,第七篇,滑动,缺口,位移 来源: https://www.cnblogs.com/mqhpy/p/11370767.html