验证码简介
作者:互联网
图片验证码:
(1) 图片验证码如下,识别图形验证码,需要用到 OCR 技术,即光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程
(2) 在 Python 中,使用 tesserocr 库来实现 OCR 技术,tesserocr 底层是 tesseract,因此要先安装 tesseract
Linux 下安装 tesserocr:
[root@localhost ~]# yum install -y tesseract [root@localhost ~]# git clone https://github.com/tesseract-ocr/tessdata.git //安装支持识别多国语言,默认只能识别英文 [root@localhost ~]# mv tessdata/* /usr/share/tesseract/tessdata [root@localhost ~]# pip3 install tesserocr pillow
Windows 下安装 tesserocr:
(1) 先安装 tesseract,下载地址:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe ,安装过程中记得勾选 Additional language data,以便 OCR 支持识别多国语言
(2) 再安装 tesserocr,先去 https://github.com/simonflueckiger/tesserocr-windows_build/releases 下载 whl 文件,然后再通过 pip3 install C:\Users\Administrator\Desktop\tesserocr-2.4.0-cp36-cp36m-win32.whl 安装
标签:简介,验证码,root,tesseract,安装,localhost,tesserocr 来源: https://www.cnblogs.com/pzk7788/p/10605820.html