此页面列出了 Tesseract 社区提供的与 Tesseract4 兼容的 tessdata 存储库(适用于 -oem 1 - LSTM)。
理想情况下,此类 tessdata 贡献应记录所有必要的训练过程(字体、图像、真实值、文本、脚本、文档等)。
| 语言代码 | 语言 | 数据文件 | 贡献者 | 信息 |
|---|---|---|---|---|
| khmLimon | 高棉语 | best | OpenInstituteCambodia/phyrumsk | tessdata_best 中的 PR |
| cop | 科普特语 | best | shreeshrii/tessdata_coptic | tesseract-ocr 论坛帖子 |
| jpn_vert | 日语竖排 | best | zodiac3539/jpn_vert | tesseract-ocr 论坛帖子 |
| ocrb_plus | MRZ | best | shreeshrii/tessdata_ocrb | tesseract-ocr 论坛帖子 |
| jav_java | 爪哇文 | best | Shreeshrii/tessdata_jav_java | tesseract-ocr 论坛帖子 |
| mrz | MRZ | best | DoubangoTelecom/tesseractMRZ | tesseract-ocr 论坛帖子 |
| dot_matrix | MRZ | best | ameera3/OCR_Expiration_Date | tesseract-ocr 论坛帖子 |
| e13b | E13B(或 MICR) | best | ElMagoElGato/tess_e13b_training | tesseract-ocr 论坛帖子 |
| e13b | E13B(或 MICR) | best | DoubangoTelecom/tesseractMICR | tesseract-ocr 论坛帖子 |
| frak | 哥特体 | best | bib.uni-mannheim.de/~stweil | tesstrain wiki |