描述 Tesseract 各种方面的技术论文
版权声明
此处发布的材料受版权保护,未经各自版权所有者的许可,不得出售或分发。
阅读论文
以下链接将带您到 PDF 下载页面。
IEEE 版权材料
以下材料出现在 IEEE 出版物中,并且都带有 IEEE 版权标识。未经 IEEE 书面许可,不得出售或进一步分发论文。
ACM 版权材料
为多语言 OCR 调整 Tesseract 开源 OCR 引擎
©ACM,2009。这是作者的版本。它已在 ACM 的许可下发布在此,供您个人使用。不得重新分发。最终版本发表在 2009 年 7 月 25 日西班牙巴塞罗那举行的多语言 OCR 国际研讨会论文集中。https://dl.acm.org/citation.cfm?id=1577804
Ray Smith 的其他出版物
- Ray Smith 出版物
- 从多媒体文档图像中提取和识别文本 作者:Smith, R.W.(博士论文),1987 年
- DAS2014 上 Tesseract 讲座幻灯片
- DAS2016 上 Tesseract 讲座幻灯片
其他
- 视频 PhotoTechEDU 第 11 天:使用 Leptonica 进行文档图像分析
- 为古希腊 OCR 训练 Tesseract 作者:Nick White
- 为增强印地语识别而集成 Tesseract OCR 引擎的 Shirorekha 切割 作者:Nitin Mishra、C. Patvardhan、C. Vasantha Lakshmi、Sarika Singh
- 关于 Tesseract 和 ABBYY FineReader OCR 引擎比较的报告 作者:Heliński、Kmieciak 和 Parkoła
- hOCR 嵌入式 OCR 工作流和输出格式(hOCR 规范)
- 使用笔划宽度变换在诺基亚 N900 上进行文本检测(附源代码)
- 使用长短期记忆网络进行通用文本识别 - 博士论文
- 使用计算机视觉和深度学习创建现代 OCR 管道
- 受翻译启发的 OCR 作者:Dmitriy Genzel、Ashok C. Popat、Nemanja Spasojevic、Michael Jahr、Andrew Senior、Eugene le、Frank … 关键词-光学字符识别;统计机器 …(字符)位置在阿拉伯语、英语和印地语 PRAN 数据示例中。
- 在 Google 开发多语言 OCR 和手写识别 作者:Ashok Popat。Google Inc. 研究科学家。IAPR 夏季学校,斋浦尔:2017 年 1 月 23 日。
- 通过图卷积神经网络进行通用 OCR 段落识别 作者:Renshen Wang、Yasuhisa Fujii、Ashok C. Popat 2021 年 1 月