首页 > TAG信息列表 > CTPN

CTPN理论学习笔记

https://zhuanlan.zhihu.com/p/34757009 https://zhuanlan.zhihu.com/p/51383402  [CRNN] https://zhuanlan.zhihu.com/p/43534801 介绍   CTPN是在ECCV 2016提出的一种文字检测算法。 CTPN <------ Faster RCNN【也就是接引入LSTM】 CNN作用是:提取感受野内的空间信息; LST

CTPN

CTPN paper link Detecting Text in Natural Image with Connectionist Text Proposal Network code link 基于caffe实现——CTPN 对于复杂场景的文字识别,首先要定位文字的位置,即文字检测。这一直是一个研究热点。 CTPN是在ECCV 2016提出的一种文字检测算法。CTPN结合CNN与LSTM深

山东大学暑期实训第二次记载(第一周第二次)

       时间6月30号-7月1号,在确定了小组的任务后,我们开始了各自的任务,由于我现在的任务是查找训练好的有关文字检测的机器学习模型,因此我决定先学习一下有关的知识,比如卷积神经网络CNN等。 一.CNN        卷积神经网络与普通神经网络非常相似,它们都由具有可学习的权重和

CV学习笔记(十七):Windows环境复现ChineseOCR

作者:云时之间来源:知乎链接:https://zhuanlan.zhihu.com/p/134050443编辑:王萌 项目地址:github.com/xiaofengShi/为了方便下载:gitee.com/yunshizhijian因为项目中推荐使用的环境为MAC和Linux,因此迁移到Windows上仍需要一些改动,但是在网上的资料很少,并且处理报错不够全面,踩了一路坑,因此

OCR-CTPN

  OCR-CTPN  https://www.bilibili.com/video/BV1ZK4y1r7un     水平方向:50像素以内 竖直方向:重叠率0.7 竖直方向 小数表示,可以很准;水平方向 像素表示,可能有较大偏差   可以识别多语言,取决于训练数据了。。。        水平 方向步子迈得太大,不准,需要微调   x:一列一列过

OCR经典pipeline的发展

Yolo+CRNN--->CTPN+CRNN--->SegLink+CRNN--->East+CRNN--->ABCnet(Bezier曲线文本检测+CRNN变体) 检测头问题: 1.由于文字的特殊性,导致通用的目标检测容易在文本中间识别文本行的子集 2. CTPN:适合水平反向的文本检测 3. SegLink适合水平和倾斜。 4.East认为1和2这种先检测字符单

机器学习踩坑之CTPN

今天在服务器上搭建CTPN的训练环境,问题可谓是一个接一个,整得我整个人都不好了,所以写这篇文章一是记录一下,二是希望自己的踩坑经验能帮到大家,废话不多说,开整! 先说一下我的配置,cuda10.0,tensorflow1.13(至于我的tensor为啥用1.13这个是由于我的cuda版本限制的,关于tensorflow和cuda版

场景文字检测—CTPN原理与实现

原文地址: https://zhuanlan.zhihu.com/p/34757009 推荐原文 对于复杂场景的文字识别,首先要定位文字的位置,即文字检测。这一直是一个研究热点。 Detecting Text in Natural Image with Connectionist Text Proposal Network​arxiv.org   CTPN是在ECCV 2016提出的一种文字检

CTPN训练自己的数据集过程大白话记录

一.算法理解   此处省略1万字。。。。。。。。。。。。。。 二.训练及源码理解   配置以下3步:   在utils文件夹和utils\bbox文件夹下创建__init__.py文件   在utils\bbox文件夹下执行python setup.py install   将.pyd文件拷贝到utils\bbox文件夹下 数据介绍:检测图片当

Scene Text Detection论文思路总结

任意角度的场景文本检测论文思路总结共同点:重新添加分支的创新更突出场景文本检测基于分割的检测方法 spcnet(mask_rcnn+tcm+rescore) psenet(渐进扩展) mask text spottor(新加分割分支) craft incepText 基于回归的检测方法: r2cnn(类别分支,水平分支,倾斜分支) rrpn(旋转rpn)

CTPN CRNN-Pytorch 银行卡号识别

通过利用keras以及一些自定义函数进行数据增强, CTPN进行文字定位,CRNN进行文字识别以及Flask Web实现银行卡号码识别 Github地址 由于我并不是机器学习方向,完成此项目只是学校课程需要 所以文章可能只是如何开始并完成这个项目,至于深层次的原理,推荐两篇中文博文 【OCR技术系列之五

CTPN代码研读(一)数据集的使用以及模型

CTPN代码研读系列: 1. 数据集的使用以及模型 2. utils/prepare/label 3. utils/dataset/data_provider (本内容为自己理解,如有错误欢迎指正) 基础信息介绍: 本系列代码为ctpn的tensorflow版本研读: 博主的论文原文研读(中文版):https://blog.csdn.net/qq_35307005/article/details/8