跳到内容。

使用 Tesseract OCR 的 GUI 和其他项目

1. GUI

名称 Linux Mac Windows 许可证 描述
Scribe OCR X X X AGPL-3.0 许可证 Scribe OCR 是一款免费的开源 Web 应用程序,用于识别文本、校对 OCR 数据和创建完全数字化文档。实时网站位于 scribeocr.com
Rescribe X X X GPL v3 易于使用的 Tesseract 前端,无需安装,包括 PDF 处理、Google 图书下载以及额外的预处理和后处理功能。
normcap X X X GPL v3 OCR 驱动的屏幕截图工具,用于捕获信息而不是图像。
gImageReader X   X GPL v3 Tesseract-ocr 的图形化 GTK 前端
VietOCR X X X Apache 2.0 Tesseract OCR 引擎的 GUI 前端。支持对越南语和其他 Tesseract 支持的语言进行光学字符识别
NeOCR     X 免费软件 Tesseract 4.0 OCR 引擎的 GUI 前端。
Free-Ocr-Windows-Desktop     X GNU AGPL v3 Windows 桌面的免费 OCR 应用程序 - 本质上是 Tesseract OCR 引擎的图形用户界面 (GUI)。该应用程序还包括对读取和扫描 PDF 文件的支持
YAGF X     GPL v3 cuneiform 和 tesseract 的图形化前端
OCR2Text X X X MIT 用于 PDF 到 TXT 批量处理的 CLI 工具
OCRFeeder X     GPL v3 OCRFeeder 是一个文档布局分析和光学字符识别系统
Lector X   X GPL v2 基于 Python、Qt4 和 Tesseract OCR 的 GNU/Linux 图形化 OCR 解决方案
Tesseract-OCR QT4 gui X     Apache 2.0 Tesseract-OCR QT4 gui 是 tesseract 的简单 GUI
Lime OCR     X GPL v3 使用 tesseract-ocr 引擎的 Windows 简单免费 OCR 软件
Ocrivist X     GPL v3 Ocrivist 是一款实用程序,可以将书籍和其他印刷文档扫描并识别为 PDF 或 Djvu 格式
Tesseract-GUI X     GPL v2 Tessract-GUI 不是 tesseract-ocr 的前端,它只是使用 ImageMagick 通过简单图像操作来使用它的图形化方法
QTesseract X     LGPL v3 Tesseract OCR 的 QT GUI
dpScreenOCR X   X zlib 用于识别屏幕上文本的程序
pmOCR X     BSD 批量 OCR 工具,也是使用 tesseract 的文件监控事件 OCR
tesseract4java X X X GPLv3 用于训练和运行 Tesseract 的跨平台 GUI,具有批量识别和准确性评估等高级功能
Linux-Intelligent-OCR-Solution(lios) X     GPLv3 用于扫描、运行和训练 Tesseract 的 GUI,为视障人士提供完全可访问性,并提供扫描仪亮度优化器、文本清理器等高级功能
SunnyPages OCR     X 专有 Tesseract OCR 引擎的 GUI 前端,具有自动调整图像亮度、图像处理和 PDF 支持功能。
PDF OCR X   X X 专有 PDF OCR 是一款适用于 Mac OS X 和 Windows 的简单拖放实用程序,可将您的 PDF 和图像转换为文本文档或可搜索的 PDF 文件
TaxWorkFlow     X 专有 TaxWorkFlow 是一款会计实践管理应用程序,包含 Tesseract OCR 引擎的 GUI 前端。该应用程序支持 AVX,并允许从 PDF 文件和 100 多种图像文件格式创建选定分辨率和压缩的 OCR 处理后的 PDF 文件。
AmhOCR     X GPLv3 Tesseract 支持的 Windows 桌面 OCR 应用程序,具有多个预处理/后处理 GUI
TesseractStudio.Net Github     X 专有 (Exe、源代码不可用,网站 URL 已失效)Tesseract 4.0 的图形界面
TesseractStudio.Net     X 专有 Tesseract 4.0 的图形界面
ImageTrans X X X 专有 图像翻译工具,可以使用 Tesseract 对整个页面、图像的选定区域或屏幕截图进行 OCR 处理
NAPS2 X X X GLP2 尽可能简单地将文档扫描为 PDF 以及更多内容。
Ave React OCR     X MIT 一个由 avernakis react 提供支持的简单 OCR 应用程序。

2. 在线 OCR 服务

3. 移动

4. 其他(实用程序、工具、命令行界面 [CLI] 等)

A. PDF 到可搜索 PDF 工具

(即:任何可以处理不可搜索 PDF 作为输入的工具)

  1. OCRmyPDF - 为扫描的 PDF 文件和图像添加 OCR 文本层,使其可搜索。在多核 CPU 上并行处理页面。尽可能保留原始嵌入图像的精确分辨率,而不重新压缩 JPEG。包括图像预处理选项、详细文档以及对许多异国 PDF 的支持。
  2. pdf2pdfocr 是一款用于识别 PDF(或支持的图像)并向原始文件添加文本层以使其成为可搜索的 PDF 的工具。它是一个使用 tesseract 和其他开源工具的 python 脚本。支持 Linux、macOS 和 Windows。
  3. pdf2searchablepdf - 允许将任何不可搜索的 PDF 或任何整个图像目录转换为可搜索的 PDF 的工具

B. 其他

  1. Scantools - 用于图形处理的库和匹配的命令行应用程序集,旨在处理扫描的文档并生成高质量的 PDF 文件。image2pdf 将图像转换为 PDF。可选地可以指定由 Tesseract 等光学字符识别程序生成的 HOCR 文件,以使 PDF 文件可搜索。生成的符合 ISO PDF/A 标准,适用于数字文档的长期存档。hocr2any 将 HOCR 文件转换为文本,或将其呈现为光栅图形或 PDF 文件 ocrPDF 使用 Tesseract OCR 引擎来检测文本并在 PDF 文件中生成文本层。
  2. ocr-fileformat - 验证和转换 OCR 文件格式(hOCR、ALTO、PAGE、FineReader)
  3. Tess4J - Tesseract OCR API 的 Java JNA 包装器。
  4. 训练数据检查器 - 用于检查训练数据文件内部的一些内容
  5. TopOCR - 支持 tesseract-ocr 的高质量相机 OCR(付费产品)
  6. 简单 OCR Web 服务器 使用 python、flask、tesseract-ocr 和 leptonica
  7. 显示 OCR 是 OpenCV-Python + python-tesseract 实时图像预处理和 7 段字体 OCR。
  8. OpenOCR 使得托管您自己的 OCR REST API 变得简单。
  9. https://github.com/guitarmind/tesseract-web-service 是使用 tornado 为 tesseract-OCR 实现的 RESTful Web 服务
  10. RasterEdge .NET 图像 SDK - OCR 识别 是一款强大的、高性能的识别应用程序,适用于桌面或服务器应用程序的免版税分发。
  11. DevScope OCR SDK 是一个基于 Tesseract OCR v3 的光学字符识别工具包引擎,允许使用 Microsoft .NET 框架开发应用程序
  12. Paperwork - 使用 OCR 以简单的方式从死树中搜索(需要 pyocr)
  13. Aletheia - 用于生产环境的先进文档布局和文本地面真实系统
  14. gscan2pdf 是一个 GUI,用于从扫描的文档中生成 PDF 或 DjVu。
  15. Audiveris 是一款开源光学乐谱识别软件,它处理乐谱图像以自动提供 MusicXML 标准中的符号音乐信息。
  16. Ocrivist 是一款实用程序,可以将书籍和其他印刷文档扫描并识别为 PDF 或 Djvu 格式。
  17. thu-ipv6-login 是一个 python 脚本,用于清华大学的 IPv6 身份验证,支持识别验证码
  18. Wolfram Mathematica 9.0 使用 tesseract 识别文本
  19. node-dv 是一个用于处理和理解扫描文档的 node.js 库
  20. hocr-tools - 用于操作和评估 hOCR 格式的 python 工具,用于通过将其嵌入 HTML 来表示多语言 OCR 结果。它们包括用于创建可搜索 pdf 的 hocr-pdf 工具。
  21. PyPDFOCR - 基于 Tesseract-OCR 的 PDF 归档
  22. ChronoScan 是用于文档扫描和数据录入的完整套件
  23. speedy-ocr 实用程序,简化扫描和 OCR 聚焦,以帮助盲人和视障人士。它是 Vinux 项目 的一部分。
  24. Project VIRAL 使用辅助学习的 Varico 发票识别
  25. Bindery: 用于将后处理扫描页面绑定到数字文档的简单 GUI
  26. Clarify: Clarify 帮助您识别“仅图像”PDF。您的输入是您通常无法提取文本的 PDF。输出是文本。Clarify 是一个将 tesseract-ocr、xpdf 和 netpbm 包裹在一起的 python 模块。要求: python、tesseract-ocr、xpdf、netpbm
  27. hOcr2Pdf.NET: hOcr2Pdf.NET 是一个库,程序员可以使用它为应用程序创建高度压缩的可搜索 PDF。要求: .NET 2.0 或更高版本、Tesseract 3.0、JBig2.exe
  28. PDFBeads: 基于 hOCR 文件将扫描的图像转换为单个可搜索的 PDF 文件。要求: ruby、RMagick、hpricot
  29. ExactImage/hocr2pdf: 从 hOCR 输入创建可搜索的 PDF。要求: libagg
  30. HocrConverter: 从 hOCR 文档创建 PDF 和纯文本。要求: python、reportlab
  31. HocrToPdf.java: 用于非常基本的 hOCR 到 PDF 转换器的 java 源代码。编译版本可以在项目 modi2hocr 中找到。要求: java、jericho、iText2
  32. hOcr2Pdf.NET: 是一个 .NET 库,用于使用 HtmlAgilityPack 和 iTextSharp 将 Tesseract 或 Cuneiform 生成的 .hocr html 转换为可搜索的 pdf。要求: C#。
  33. Tally-Ho: Tally-Ho 是一款针对谷歌图书等网站的屏幕阅读器
  34. Mayan EDMS: 以 tesseract 为基础的文档管理系统
  35. Olena: 一个通用且高效的图像处理平台(tesseract 用于其名为 scribo 的部分)
  36. ocrodjvu 是 OCR 系统的包装器,允许您对 DjVu 文件执行 OCR
  37. PaRADIIT(用于文档图像索引和转录的模式冗余分析)是一个由两个连续的 Google DH 奖项发起和赞助的项目。它旨在将古代书籍,特别是文艺复兴时期的书籍,转变为可访问的数字图书馆。
  38. ISRI 分析工具 包含 17 种工具,用于衡量 OCR 输出的性能和进行实验。
  39. Indic Messenger 是一个 Facebook 聊天机器人,可以识别包含印度语/英语文本的图像并将其音译成其他印度文字。
  40. LibreOCR 是一个 LibreOffice 扩展,可以将图像转换为 OCT 并在 Writer 应用程序中打开。
  41. hertzg/tesseract-server 是一款轻量级的、基于 docker 的、多架构的、无状态 JSON HTTP API 服务,用于 tesseract。

有关 IMPACT 项目的更多信息,请参见 tesseract 论坛中的讨论