字符图片分割研究小结(搬运、整理、分类、汇总)
作者:互联网
目录
一、定义
文字图像识别近年来应用广泛
包括传统OCR和自然场景下的文字识别
关系图
字符定位→字符分割→字符识别
例如车牌识别
车牌识别一般分为车牌检测、字符分割和字符识别三个主要步骤。
字符分割是指将原始图像切分成单个字符并提取保存为图像的过程。字符分割对整个文本识别的效果影响很大,一旦在分割环节出现了错误,那么后续字符识别的正确性就会大打折扣。
二、分类
A.按分割场景
传统文档印刷体
自然场景(车牌)
验证码
B.按分割对象
汉字
数字、字母
其他分割
三、分割难点
光照
角度
扭曲
颜色
模糊
污损
遮挡
粘连
四、常用算法
一直以来,各类参考文献提出了多种多样的字符分割方法,经过整理后基本可以归为以下几种:基于连通域(轮廓)特征分析的字符分割、基于(水平、垂直)投影特征分析的字符分割、基于识别的字符分割。但是上述方法都有一定的局限性,目前还没有一种能够广泛通用的切割方法。特别地,对于一些低质量字符图像来说,图像中通常会存在污损区域或其他干扰,字符分辨率较低、相邻字符间的界限较模糊,此时若单独使用上述方法中的一种,则对字符的分割能力极其有限,效果也欠佳。
基于连通域特征分析的字符分割
又称基于轮廓特征分析的字符分割
基于投影特征分析的字符分割
滴水算法
滴水算法,如其名,算法参考了雨滴的智慧,黑色区域如同空旷的天空,连在一起的字符就像连在一起的两个房屋. 水滴从天空中掉落,顺着缝隙向下流淌,如果他们遇到了困难不能继续下落,就冲破禁锢,水滴石穿,打开缺口向下渗透,直至滑落出画面.整个过程形成的轨迹,就是两个字符之间的分割线.不同于我们之前介绍的柱状图分割法,滴水算法的分割线可以非常灵活.
滴水算法是一种用于分割手写粘连字符的算法,与以往的直线式地分割不同 ,它模拟水滴的滚动,通过水滴的滚动路径来分割字符,可以解决直线切割造成的过分分割问题。
图[1-1]滴水算法滴落规则
五、相关论文研读
六、参考所用到的文献和博客等
标签:字符,分割,特征分析,滴水,汇总,字符识别,算法,小结 来源: https://blog.csdn.net/Xiaofang_123a/article/details/113924753