此页面列出了 Tesseract 社区提供的与 Tesseract4 兼容的 tessdata 存储库(适用于 -oem 1 - LSTM)。
理想情况下,此类 tessdata 贡献应记录所有必要的训练过程(字体、图像、真实值、文本、脚本、文档等)。
语言代码 | 语言 | 数据文件 | 贡献者 | 信息 |
---|---|---|---|---|
khmLimon | 高棉语 | best | OpenInstituteCambodia/phyrumsk | tessdata_best 中的 PR |
cop | 科普特语 | best | shreeshrii/tessdata_coptic | tesseract-ocr 论坛帖子 |
jpn_vert | 日语竖排 | best | zodiac3539/jpn_vert | tesseract-ocr 论坛帖子 |
ocrb_plus | MRZ | best | shreeshrii/tessdata_ocrb | tesseract-ocr 论坛帖子 |
jav_java | 爪哇文 | best | Shreeshrii/tessdata_jav_java | tesseract-ocr 论坛帖子 |
mrz | MRZ | best | DoubangoTelecom/tesseractMRZ | tesseract-ocr 论坛帖子 |
dot_matrix | MRZ | best | ameera3/OCR_Expiration_Date | tesseract-ocr 论坛帖子 |
e13b | E13B(或 MICR) | best | ElMagoElGato/tess_e13b_training | tesseract-ocr 论坛帖子 |
e13b | E13B(或 MICR) | best | DoubangoTelecom/tesseractMICR | tesseract-ocr 论坛帖子 |
frak | 哥特体 | best | bib.uni-mannheim.de/~stweil | tesstrain wiki |