编程语言
首页 > 编程语言> > 我从哪里开始进行文本模式识别-基于Java

我从哪里开始进行文本模式识别-基于Java

作者:互联网

我正在认真考虑进行光学字符识别程序.我精通Java,很想知道那里的可用库.基本上,我想将以下内容转换为文本.我将需要手动中断以指定模式.例如,我需要让用户在此文本中标记f,以便我知道f出现在哪里.

我完全是个新手,所以我也不介意从头开始学习.需要指导.

解决方法:

如果您想从头开始编写OCR程序,请继续阅读技术.我发现OCR Survey from 1996可以回顾十年半前的一些流行技术.阅读可能会有所帮助;追踪它引用的文件或引用它的文件.

通常,过程如下:

find text
find characters in the text
extract features from the characters found
do pattern matching
report suspected character

虽然让用户注释文本很有趣并且令人兴奋,但是找到已经注释的笔迹集可以节省您大量的时间,这样您就可以专注于进行OCR的基本操作而不是构建自己的注释数据库文本.

要开始一个稍微简单的任务,您可能需要考虑构建一个检测手写数字的系统. USPS为开发系统生产了corpus,以进行邮政编码处理.该链接是我通过快速搜索找到的.

标签:ocr,java,pattern-matching
来源: https://codeday.me/bug/20191102/1992144.html