使用 Tesseract OCR 的 GUI 和其他项目
1. GUI
名称 | Linux | Mac | Windows | 许可证 | 描述 |
---|---|---|---|---|---|
Scribe OCR | X | X | X | AGPL-3.0 许可证 | Scribe OCR 是一款免费的开源 Web 应用程序,用于识别文本、校对 OCR 数据和创建完全数字化文档。实时网站位于 scribeocr.com。 |
Rescribe | X | X | X | GPL v3 | 易于使用的 Tesseract 前端,无需安装,包括 PDF 处理、Google 图书下载以及额外的预处理和后处理功能。 |
normcap | X | X | X | GPL v3 | OCR 驱动的屏幕截图工具,用于捕获信息而不是图像。 |
gImageReader | X | X | GPL v3 | Tesseract-ocr 的图形化 GTK 前端 | |
VietOCR | X | X | X | Apache 2.0 | Tesseract OCR 引擎的 GUI 前端。支持对越南语和其他 Tesseract 支持的语言进行光学字符识别 |
NeOCR | X | 免费软件 | Tesseract 4.0 OCR 引擎的 GUI 前端。 | ||
Free-Ocr-Windows-Desktop | X | GNU AGPL v3 | Windows 桌面的免费 OCR 应用程序 - 本质上是 Tesseract OCR 引擎的图形用户界面 (GUI)。该应用程序还包括对读取和扫描 PDF 文件的支持 | ||
YAGF | X | GPL v3 | cuneiform 和 tesseract 的图形化前端 | ||
OCR2Text | X | X | X | MIT | 用于 PDF 到 TXT 批量处理的 CLI 工具 |
OCRFeeder | X | GPL v3 | OCRFeeder 是一个文档布局分析和光学字符识别系统 | ||
Lector | X | X | GPL v2 | 基于 Python、Qt4 和 Tesseract OCR 的 GNU/Linux 图形化 OCR 解决方案 | |
Tesseract-OCR QT4 gui | X | Apache 2.0 | Tesseract-OCR QT4 gui 是 tesseract 的简单 GUI | ||
Lime OCR | X | GPL v3 | 使用 tesseract-ocr 引擎的 Windows 简单免费 OCR 软件 | ||
Ocrivist | X | GPL v3 | Ocrivist 是一款实用程序,可以将书籍和其他印刷文档扫描并识别为 PDF 或 Djvu 格式 | ||
Tesseract-GUI | X | GPL v2 | Tessract-GUI 不是 tesseract-ocr 的前端,它只是使用 ImageMagick 通过简单图像操作来使用它的图形化方法 | ||
QTesseract | X | LGPL v3 | Tesseract OCR 的 QT GUI | ||
dpScreenOCR | X | X | zlib | 用于识别屏幕上文本的程序 | |
pmOCR | X | BSD | 批量 OCR 工具,也是使用 tesseract 的文件监控事件 OCR | ||
tesseract4java | X | X | X | GPLv3 | 用于训练和运行 Tesseract 的跨平台 GUI,具有批量识别和准确性评估等高级功能 |
Linux-Intelligent-OCR-Solution(lios) | X | GPLv3 | 用于扫描、运行和训练 Tesseract 的 GUI,为视障人士提供完全可访问性,并提供扫描仪亮度优化器、文本清理器等高级功能 | ||
SunnyPages OCR | X | 专有 | Tesseract OCR 引擎的 GUI 前端,具有自动调整图像亮度、图像处理和 PDF 支持功能。 | ||
PDF OCR X | X | X | 专有 | PDF OCR 是一款适用于 Mac OS X 和 Windows 的简单拖放实用程序,可将您的 PDF 和图像转换为文本文档或可搜索的 PDF 文件 | |
TaxWorkFlow | X | 专有 | TaxWorkFlow 是一款会计实践管理应用程序,包含 Tesseract OCR 引擎的 GUI 前端。该应用程序支持 AVX,并允许从 PDF 文件和 100 多种图像文件格式创建选定分辨率和压缩的 OCR 处理后的 PDF 文件。 | ||
AmhOCR | X | GPLv3 | Tesseract 支持的 Windows 桌面 OCR 应用程序,具有多个预处理/后处理 GUI | ||
TesseractStudio.Net Github | X | 专有 | (Exe、源代码不可用,网站 URL 已失效)Tesseract 4.0 的图形界面 | ||
TesseractStudio.Net | X | 专有 | Tesseract 4.0 的图形界面 | ||
ImageTrans | X | X | X | 专有 | 图像翻译工具,可以使用 Tesseract 对整个页面、图像的选定区域或屏幕截图进行 OCR 处理 |
NAPS2 | X | X | X | GLP2 | 尽可能简单地将文档扫描为 PDF 以及更多内容。 |
Ave React OCR | X | MIT | 一个由 avernakis react 提供支持的简单 OCR 应用程序。 |
2. 在线 OCR 服务
- OCR.net: 由 PDF OCR X 在后端提供支持。将 PDF 和图像转换为文本或可搜索的 PDF。
- 免费 OCR
- i2OCR
- Indic-OCR OCR 服务 针对印度语言的在线 OCR 服务
3. 移动
- Android:
- tess-two - Tesseract 工具的 Android 分支 tesseract-android-tools,它添加了一些额外的功能。
- Tesseract4Android - tess-two 的分支,从头开始重写以支持最新版本的 Tesseract OCR。
- textfairy Android OCR 应用程序,源代码位于 github.com
- 字符识别 Android OCR 应用程序,源代码位于 gitorious.org
- tesseract-android-tools: 一组 Android API(已存档于 2013-01-28 的 Google Code Archive 中)
- 移动 OCR: 移动 OCR 的目标是为 Android 平台创建一个应用程序,用于识别手机摄像头拍摄的图像中的文本。该应用程序将完全可供视障和盲人用户使用
- 横跨印度: 一个应用程序,允许用户拍摄印度语言或英语的标志牌照片,并将其音译成他们可以阅读的语言。
- iOS:
- Tesseract-OCR-iOS - Tesseract OCR iOS 是 iOS7+ 的框架,也为 armv7s 和 arm64 编译。
- OCR-iOS-Example - 在 iOS 上执行光学字符识别 (OCR) 的简单示例。
- Tesseract-iPhone-Demo - 基于 tesseract 2.04 的示例。
- 更多操作系统:
- ScanBizCards: 用于名片扫描的移动解决方案。要求: iPhone 4/iPhone 3/Android 2.0
- macOS:
- Tesseract macOS - 适用于 macOS 的 Tesseract OCR 框架,支持 Objective C 和 swift。为 x86 和 arm64 编译。
4. 其他(实用程序、工具、命令行界面 [CLI] 等)
A. PDF 到可搜索 PDF 工具
(即:任何可以处理不可搜索 PDF 作为输入的工具)
- OCRmyPDF - 为扫描的 PDF 文件和图像添加 OCR 文本层,使其可搜索。在多核 CPU 上并行处理页面。尽可能保留原始嵌入图像的精确分辨率,而不重新压缩 JPEG。包括图像预处理选项、详细文档以及对许多异国 PDF 的支持。
- pdf2pdfocr 是一款用于识别 PDF(或支持的图像)并向原始文件添加文本层以使其成为可搜索的 PDF 的工具。它是一个使用 tesseract 和其他开源工具的 python 脚本。支持 Linux、macOS 和 Windows。
- pdf2searchablepdf - 允许将任何不可搜索的 PDF 或任何整个图像目录转换为可搜索的 PDF 的工具
B. 其他
- Scantools - 用于图形处理的库和匹配的命令行应用程序集,旨在处理扫描的文档并生成高质量的 PDF 文件。image2pdf 将图像转换为 PDF。可选地可以指定由 Tesseract 等光学字符识别程序生成的 HOCR 文件,以使 PDF 文件可搜索。生成的符合 ISO PDF/A 标准,适用于数字文档的长期存档。hocr2any 将 HOCR 文件转换为文本,或将其呈现为光栅图形或 PDF 文件 ocrPDF 使用 Tesseract OCR 引擎来检测文本并在 PDF 文件中生成文本层。
- ocr-fileformat - 验证和转换 OCR 文件格式(hOCR、ALTO、PAGE、FineReader)
- Tess4J - Tesseract OCR API 的 Java JNA 包装器。
- 训练数据检查器 - 用于检查训练数据文件内部的一些内容
- TopOCR - 支持 tesseract-ocr 的高质量相机 OCR(付费产品)
- 简单 OCR Web 服务器 使用 python、flask、tesseract-ocr 和 leptonica
- 显示 OCR 是 OpenCV-Python + python-tesseract 实时图像预处理和 7 段字体 OCR。
- OpenOCR 使得托管您自己的 OCR REST API 变得简单。
- https://github.com/guitarmind/tesseract-web-service 是使用 tornado 为 tesseract-OCR 实现的 RESTful Web 服务
- RasterEdge .NET 图像 SDK - OCR 识别 是一款强大的、高性能的识别应用程序,适用于桌面或服务器应用程序的免版税分发。
- DevScope OCR SDK 是一个基于 Tesseract OCR v3 的光学字符识别工具包引擎,允许使用 Microsoft .NET 框架开发应用程序
- Paperwork - 使用 OCR 以简单的方式从死树中搜索(需要 pyocr)
- Aletheia - 用于生产环境的先进文档布局和文本地面真实系统
- gscan2pdf 是一个 GUI,用于从扫描的文档中生成 PDF 或 DjVu。
- Audiveris 是一款开源光学乐谱识别软件,它处理乐谱图像以自动提供 MusicXML 标准中的符号音乐信息。
- Ocrivist 是一款实用程序,可以将书籍和其他印刷文档扫描并识别为 PDF 或 Djvu 格式。
- thu-ipv6-login 是一个 python 脚本,用于清华大学的 IPv6 身份验证,支持识别验证码
- Wolfram Mathematica 9.0 使用 tesseract 识别文本
- node-dv 是一个用于处理和理解扫描文档的 node.js 库
- hocr-tools - 用于操作和评估 hOCR 格式的 python 工具,用于通过将其嵌入 HTML 来表示多语言 OCR 结果。它们包括用于创建可搜索 pdf 的 hocr-pdf 工具。
- PyPDFOCR - 基于 Tesseract-OCR 的 PDF 归档
- ChronoScan 是用于文档扫描和数据录入的完整套件
- speedy-ocr 实用程序,简化扫描和 OCR 聚焦,以帮助盲人和视障人士。它是 Vinux 项目 的一部分。
- Project VIRAL 使用辅助学习的 Varico 发票识别
- Bindery: 用于将后处理扫描页面绑定到数字文档的简单 GUI
- Clarify: Clarify 帮助您识别“仅图像”PDF。您的输入是您通常无法提取文本的 PDF。输出是文本。Clarify 是一个将 tesseract-ocr、xpdf 和 netpbm 包裹在一起的 python 模块。要求: python、tesseract-ocr、xpdf、netpbm
- hOcr2Pdf.NET: hOcr2Pdf.NET 是一个库,程序员可以使用它为应用程序创建高度压缩的可搜索 PDF。要求: .NET 2.0 或更高版本、Tesseract 3.0、JBig2.exe
- PDFBeads: 基于 hOCR 文件将扫描的图像转换为单个可搜索的 PDF 文件。要求: ruby、RMagick、hpricot
- ExactImage/hocr2pdf: 从 hOCR 输入创建可搜索的 PDF。要求: libagg
- HocrConverter: 从 hOCR 文档创建 PDF 和纯文本。要求: python、reportlab
- HocrToPdf.java: 用于非常基本的 hOCR 到 PDF 转换器的 java 源代码。编译版本可以在项目 modi2hocr 中找到。要求: java、jericho、iText2
- hOcr2Pdf.NET: 是一个 .NET 库,用于使用 HtmlAgilityPack 和 iTextSharp 将 Tesseract 或 Cuneiform 生成的 .hocr html 转换为可搜索的 pdf。要求: C#。
- Tally-Ho: Tally-Ho 是一款针对谷歌图书等网站的屏幕阅读器
- Mayan EDMS: 以 tesseract 为基础的文档管理系统
- Olena: 一个通用且高效的图像处理平台(tesseract 用于其名为 scribo 的部分)
- ocrodjvu 是 OCR 系统的包装器,允许您对 DjVu 文件执行 OCR
- PaRADIIT(用于文档图像索引和转录的模式冗余分析)是一个由两个连续的 Google DH 奖项发起和赞助的项目。它旨在将古代书籍,特别是文艺复兴时期的书籍,转变为可访问的数字图书馆。
- ISRI 分析工具 包含 17 种工具,用于衡量 OCR 输出的性能和进行实验。
- Indic Messenger 是一个 Facebook 聊天机器人,可以识别包含印度语/英语文本的图像并将其音译成其他印度文字。
- LibreOCR 是一个 LibreOffice 扩展,可以将图像转换为 OCT 并在 Writer 应用程序中打开。
- hertzg/tesseract-server 是一款轻量级的、基于 docker 的、多架构的、无状态 JSON HTTP API 服务,用于 tesseract。
IMPACT 相关
- IMPACT 中心 - 一个非营利组织,旨在维持 IMPACT 的成果并促进社区建设
- IMPACT 数据
- IMPACT 工具
- IMPACT 互操作性框架 - 支持 IMPACT 项目期间开发的软件组件之间松散耦合的互操作性层。
- 库存提取工具原型 是一个具有图形用户界面 (GUI) 的原型,允许提取文档中的完整字符列表,而无需参考特定语言字典或字体库。
- 后校正工具 是 OCR 处理文档的交互式后校正。使用文本和错误分析器获得的信息,整个校正过程会适应正在处理的文档。通过这种方式,通常可以用少量击键来纠正大量系统错误。
- OCR 评估工具.
- BlackLab 是一个基于 Apache Lucene 的语料库检索引擎。它允许在大型标记和注释的文本语料库上进行快速、复杂的搜索,并具有准确的命中突出显示。它是在荷兰语言学研究所 (INL) 开发的,用于为我们历史和当代文本语料库提供快速且功能丰富的搜索界面。
有关 IMPACT 项目的更多信息,请参见 tesseract 论坛中的讨论。