使用 Tesseract OCR 的 GUI 和其他项目

1. GUI

名称	Linux	Mac	Windows	许可证	描述
Scribe OCR	X	X	X	AGPL-3.0 许可证	Scribe OCR 是一款免费的开源 Web 应用程序，用于识别文本、校对 OCR 数据和创建完全数字化文档。实时网站位于 scribeocr.com。
Rescribe	X	X	X	GPL v3	易于使用的 Tesseract 前端，无需安装，包括 PDF 处理、Google 图书下载以及额外的预处理和后处理功能。
normcap	X	X	X	GPL v3	OCR 驱动的屏幕截图工具，用于捕获信息而不是图像。
gImageReader	X		X	GPL v3	Tesseract-ocr 的图形化 GTK 前端
VietOCR	X	X	X	Apache 2.0	Tesseract OCR 引擎的 GUI 前端。支持对越南语和其他 Tesseract 支持的语言进行光学字符识别
NeOCR			X	免费软件	Tesseract 4.0 OCR 引擎的 GUI 前端。
Free-Ocr-Windows-Desktop			X	GNU AGPL v3	Windows 桌面的免费 OCR 应用程序 - 本质上是 Tesseract OCR 引擎的图形用户界面 (GUI)。该应用程序还包括对读取和扫描 PDF 文件的支持
YAGF	X			GPL v3	cuneiform 和 tesseract 的图形化前端
OCR2Text	X	X	X	MIT	用于 PDF 到 TXT 批量处理的 CLI 工具
OCRFeeder	X			GPL v3	OCRFeeder 是一个文档布局分析和光学字符识别系统
Lector	X		X	GPL v2	基于 Python、Qt4 和 Tesseract OCR 的 GNU/Linux 图形化 OCR 解决方案
Tesseract-OCR QT4 gui	X			Apache 2.0	Tesseract-OCR QT4 gui 是 tesseract 的简单 GUI
Lime OCR			X	GPL v3	使用 tesseract-ocr 引擎的 Windows 简单免费 OCR 软件
Ocrivist	X			GPL v3	Ocrivist 是一款实用程序，可以将书籍和其他印刷文档扫描并识别为 PDF 或 Djvu 格式
Tesseract-GUI	X			GPL v2	Tessract-GUI 不是 tesseract-ocr 的前端，它只是使用 ImageMagick 通过简单图像操作来使用它的图形化方法
QTesseract	X			LGPL v3	Tesseract OCR 的 QT GUI
dpScreenOCR	X		X	zlib	用于识别屏幕上文本的程序
pmOCR	X			BSD	批量 OCR 工具，也是使用 tesseract 的文件监控事件 OCR
tesseract4java	X	X	X	GPLv3	用于训练和运行 Tesseract 的跨平台 GUI，具有批量识别和准确性评估等高级功能
Linux-Intelligent-OCR-Solution(lios)	X			GPLv3	用于扫描、运行和训练 Tesseract 的 GUI，为视障人士提供完全可访问性，并提供扫描仪亮度优化器、文本清理器等高级功能
SunnyPages OCR			X	专有	Tesseract OCR 引擎的 GUI 前端，具有自动调整图像亮度、图像处理和 PDF 支持功能。
PDF OCR X		X	X	专有	PDF OCR 是一款适用于 Mac OS X 和 Windows 的简单拖放实用程序，可将您的 PDF 和图像转换为文本文档或可搜索的 PDF 文件
TaxWorkFlow			X	专有	TaxWorkFlow 是一款会计实践管理应用程序，包含 Tesseract OCR 引擎的 GUI 前端。该应用程序支持 AVX，并允许从 PDF 文件和 100 多种图像文件格式创建选定分辨率和压缩的 OCR 处理后的 PDF 文件。
AmhOCR			X	GPLv3	Tesseract 支持的 Windows 桌面 OCR 应用程序，具有多个预处理/后处理 GUI
TesseractStudio.Net Github			X	专有	（Exe、源代码不可用，网站 URL 已失效）Tesseract 4.0 的图形界面
TesseractStudio.Net			X	专有	Tesseract 4.0 的图形界面
ImageTrans	X	X	X	专有	图像翻译工具，可以使用 Tesseract 对整个页面、图像的选定区域或屏幕截图进行 OCR 处理
NAPS2	X	X	X	GLP2	尽可能简单地将文档扫描为 PDF 以及更多内容。
Ave React OCR			X	MIT	一个由 avernakis react 提供支持的简单 OCR 应用程序。

2. 在线 OCR 服务

OCR.net: 由 PDF OCR X 在后端提供支持。将 PDF 和图像转换为文本或可搜索的 PDF。
免费 OCR
i2OCR
Indic-OCR OCR 服务针对印度语言的在线 OCR 服务

3. 移动

Android:
- tess-two - Tesseract 工具的 Android 分支 tesseract-android-tools，它添加了一些额外的功能。
- Tesseract4Android - tess-two 的分支，从头开始重写以支持最新版本的 Tesseract OCR。
- textfairy Android OCR 应用程序，源代码位于 github.com
- 字符识别 Android OCR 应用程序，源代码位于 gitorious.org
- tesseract-android-tools: 一组 Android API（已存档于 2013-01-28 的 Google Code Archive 中）
- 移动 OCR: 移动 OCR 的目标是为 Android 平台创建一个应用程序，用于识别手机摄像头拍摄的图像中的文本。该应用程序将完全可供视障和盲人用户使用
- 横跨印度: 一个应用程序，允许用户拍摄印度语言或英语的标志牌照片，并将其音译成他们可以阅读的语言。
iOS:
- Tesseract-OCR-iOS - Tesseract OCR iOS 是 iOS7+ 的框架，也为 armv7s 和 arm64 编译。
- OCR-iOS-Example - 在 iOS 上执行光学字符识别 (OCR) 的简单示例。
- Tesseract-iPhone-Demo - 基于 tesseract 2.04 的示例。
更多操作系统:
- ScanBizCards: 用于名片扫描的移动解决方案。要求: iPhone 4/iPhone 3/Android 2.0
macOS:
- Tesseract macOS - 适用于 macOS 的 Tesseract OCR 框架，支持 Objective C 和 swift。为 x86 和 arm64 编译。

4. 其他（实用程序、工具、命令行界面 [CLI] 等）

A. PDF 到可搜索 PDF 工具

（即：任何可以处理不可搜索 PDF 作为输入的工具）

OCRmyPDF - 为扫描的 PDF 文件和图像添加 OCR 文本层，使其可搜索。在多核 CPU 上并行处理页面。尽可能保留原始嵌入图像的精确分辨率，而不重新压缩 JPEG。包括图像预处理选项、详细文档以及对许多异国 PDF 的支持。
pdf2pdfocr 是一款用于识别 PDF（或支持的图像）并向原始文件添加文本层以使其成为可搜索的 PDF 的工具。它是一个使用 tesseract 和其他开源工具的 python 脚本。支持 Linux、macOS 和 Windows。
pdf2searchablepdf - 允许将任何不可搜索的 PDF 或任何整个图像目录转换为可搜索的 PDF 的工具

B. 其他

Scantools - 用于图形处理的库和匹配的命令行应用程序集，旨在处理扫描的文档并生成高质量的 PDF 文件。image2pdf 将图像转换为 PDF。可选地可以指定由 Tesseract 等光学字符识别程序生成的 HOCR 文件，以使 PDF 文件可搜索。生成的符合 ISO PDF/A 标准，适用于数字文档的长期存档。hocr2any 将 HOCR 文件转换为文本，或将其呈现为光栅图形或 PDF 文件 ocrPDF 使用 Tesseract OCR 引擎来检测文本并在 PDF 文件中生成文本层。
ocr-fileformat - 验证和转换 OCR 文件格式（hOCR、ALTO、PAGE、FineReader）
Tess4J - Tesseract OCR API 的 Java JNA 包装器。
训练数据检查器 - 用于检查训练数据文件内部的一些内容
TopOCR - 支持 tesseract-ocr 的高质量相机 OCR（付费产品）
简单 OCR Web 服务器使用 python、flask、tesseract-ocr 和 leptonica
显示 OCR 是 OpenCV-Python + python-tesseract 实时图像预处理和 7 段字体 OCR。
OpenOCR 使得托管您自己的 OCR REST API 变得简单。
https://github.com/guitarmind/tesseract-web-service 是使用 tornado 为 tesseract-OCR 实现的 RESTful Web 服务
RasterEdge .NET 图像 SDK - OCR 识别是一款强大的、高性能的识别应用程序，适用于桌面或服务器应用程序的免版税分发。
DevScope OCR SDK 是一个基于 Tesseract OCR v3 的光学字符识别工具包引擎，允许使用 Microsoft .NET 框架开发应用程序
Paperwork - 使用 OCR 以简单的方式从死树中搜索（需要 pyocr）
Aletheia - 用于生产环境的先进文档布局和文本地面真实系统
gscan2pdf 是一个 GUI，用于从扫描的文档中生成 PDF 或 DjVu。
Audiveris 是一款开源光学乐谱识别软件，它处理乐谱图像以自动提供 MusicXML 标准中的符号音乐信息。
Ocrivist 是一款实用程序，可以将书籍和其他印刷文档扫描并识别为 PDF 或 Djvu 格式。
thu-ipv6-login 是一个 python 脚本，用于清华大学的 IPv6 身份验证，支持识别验证码
Wolfram Mathematica 9.0 使用 tesseract 识别文本
node-dv 是一个用于处理和理解扫描文档的 node.js 库
hocr-tools - 用于操作和评估 hOCR 格式的 python 工具，用于通过将其嵌入 HTML 来表示多语言 OCR 结果。它们包括用于创建可搜索 pdf 的 hocr-pdf 工具。
PyPDFOCR - 基于 Tesseract-OCR 的 PDF 归档
ChronoScan 是用于文档扫描和数据录入的完整套件
speedy-ocr 实用程序，简化扫描和 OCR 聚焦，以帮助盲人和视障人士。它是 Vinux 项目的一部分。
Project VIRAL 使用辅助学习的 Varico 发票识别
Bindery: 用于将后处理扫描页面绑定到数字文档的简单 GUI
Clarify: Clarify 帮助您识别“仅图像”PDF。您的输入是您通常无法提取文本的 PDF。输出是文本。Clarify 是一个将 tesseract-ocr、xpdf 和 netpbm 包裹在一起的 python 模块。要求: python、tesseract-ocr、xpdf、netpbm
hOcr2Pdf.NET: hOcr2Pdf.NET 是一个库，程序员可以使用它为应用程序创建高度压缩的可搜索 PDF。要求: .NET 2.0 或更高版本、Tesseract 3.0、JBig2.exe
PDFBeads: 基于 hOCR 文件将扫描的图像转换为单个可搜索的 PDF 文件。要求: ruby、RMagick、hpricot
ExactImage/hocr2pdf: 从 hOCR 输入创建可搜索的 PDF。要求: libagg
HocrConverter: 从 hOCR 文档创建 PDF 和纯文本。要求: python、reportlab
HocrToPdf.java: 用于非常基本的 hOCR 到 PDF 转换器的 java 源代码。编译版本可以在项目 modi2hocr 中找到。要求: java、jericho、iText2
hOcr2Pdf.NET: 是一个 .NET 库，用于使用 HtmlAgilityPack 和 iTextSharp 将 Tesseract 或 Cuneiform 生成的 .hocr html 转换为可搜索的 pdf。要求: C#。
Tally-Ho: Tally-Ho 是一款针对谷歌图书等网站的屏幕阅读器
Mayan EDMS: 以 tesseract 为基础的文档管理系统
Olena: 一个通用且高效的图像处理平台（tesseract 用于其名为 scribo 的部分）
ocrodjvu 是 OCR 系统的包装器，允许您对 DjVu 文件执行 OCR
PaRADIIT（用于文档图像索引和转录的模式冗余分析）是一个由两个连续的 Google DH 奖项发起和赞助的项目。它旨在将古代书籍，特别是文艺复兴时期的书籍，转变为可访问的数字图书馆。
ISRI 分析工具包含 17 种工具，用于衡量 OCR 输出的性能和进行实验。
Indic Messenger 是一个 Facebook 聊天机器人，可以识别包含印度语/英语文本的图像并将其音译成其他印度文字。
LibreOCR 是一个 LibreOffice 扩展，可以将图像转换为 OCT 并在 Writer 应用程序中打开。
hertzg/tesseract-server 是一款轻量级的、基于 docker 的、多架构的、无状态 JSON HTTP API 服务，用于 tesseract。

IMPACT 中心 - 一个非营利组织，旨在维持 IMPACT 的成果并促进社区建设
IMPACT 数据
IMPACT 工具
IMPACT 互操作性框架 - 支持 IMPACT 项目期间开发的软件组件之间松散耦合的互操作性层。
库存提取工具原型是一个具有图形用户界面 (GUI) 的原型，允许提取文档中的完整字符列表，而无需参考特定语言字典或字体库。
后校正工具是 OCR 处理文档的交互式后校正。使用文本和错误分析器获得的信息，整个校正过程会适应正在处理的文档。通过这种方式，通常可以用少量击键来纠正大量系统错误。
OCR 评估工具.
BlackLab 是一个基于 Apache Lucene 的语料库检索引擎。它允许在大型标记和注释的文本语料库上进行快速、复杂的搜索，并具有准确的命中突出显示。它是在荷兰语言学研究所 (INL) 开发的，用于为我们历史和当代文本语料库提供快速且功能丰富的搜索界面。

有关 IMPACT 项目的更多信息，请参见 tesseract 论坛中的讨论。

使用 Tesseract OCR 的 GUI 和其他项目

1. GUI

2. 在线 OCR 服务

3. 移动

4. 其他（实用程序、工具、命令行界面 [CLI] 等）

A. PDF 到可搜索 PDF 工具

B. 其他

IMPACT 相关