其他分享
首页 > 其他分享> > 验证码简介

验证码简介

作者:互联网

图片验证码:

(1) 图片验证码如下,识别图形验证码,需要用到 OCR 技术,即光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程
(2) 在 Python 中,使用 tesserocr 库来实现 OCR 技术,tesserocr 底层是 tesseract,因此要先安装 tesseract

         


Linux 下安装 tesserocr:

[root@localhost ~]# yum install -y tesseract
[root@localhost ~]# git clone https://github.com/tesseract-ocr/tessdata.git    //安装支持识别多国语言,默认只能识别英文
[root@localhost ~]# mv tessdata/* /usr/share/tesseract/tessdata
[root@localhost ~]# pip3 install tesserocr pillow


Windows 下安装 tesserocr:

(1) 先安装 tesseract,下载地址:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe ,安装过程中记得勾选 Additional language data,以便 OCR 支持识别多国语言
(2) 再安装 tesserocr,先去 https://github.com/simonflueckiger/tesserocr-windows_build/releases 下载 whl 文件,然后再通过 pip3 install C:\Users\Administrator\Desktop\tesserocr-2.4.0-cp36-cp36m-win32.whl 安装

 

 

 

 

 

 

 

    

 

标签:简介,验证码,root,tesseract,安装,localhost,tesserocr
来源: https://www.cnblogs.com/pzk7788/p/10605820.html