ocr比较好的资料链接-需要的记得广播

xiaoxiao2021-02-28  25

tesseract-ocr广为传播的,必需置顶,但是对中文的处理不是很好,如果是自然场景,基本就呵呵了,

参考链接:   https://github.com/tesseract-ocr   

这是北京的一位AI大牛个人的试验程序,中文效果不错,本人也有参与,大家可以试下在这基础上结合自己的应用场景,进行拓展,

参考链接:https://github.com/senlinuc/caffe_ocr

关于图片合成的链接,大家可以关注佟派AI团队的研究进展   我看过他们的论文,他们就是首个主张运用合成图片数据,并且取得比较好的效果的团队,鸡冻,

参考链接:https://github.com/tongpi

,如果你有可以共享的标注数据,请在留言区留言,或私信我,很想发起一个共建共用标注数据图片库。

另外对于图片处理,主流的有OpenCV,PIL,leptonica,我随大流了,选择了OpenCV,可是很少有人知道在OpenCV之前就有的Leptonica,如果你用Linux系统,你就会知道她的功能强大与速度惊人,Tesseract-OCR源码中处理图片就是选择了Leptonica。

转载请注明原文地址: https://www.6miu.com/read-2350031.html

最新回复(0)