跳到内容。

此页面列出了 Tesseract 社区提供的与 Tesseract4 兼容的 tessdata 存储库(适用于 -oem 1 - LSTM)。

理想情况下,此类 tessdata 贡献应记录所有必要的训练过程(字体、图像、真实值、文本、脚本、文档等)。


语言代码 语言 数据文件 贡献者 信息
khmLimon 高棉语 best OpenInstituteCambodia/phyrumsk tessdata_best 中的 PR
cop 科普特语 best shreeshrii/tessdata_coptic tesseract-ocr 论坛帖子
jpn_vert 日语竖排 best zodiac3539/jpn_vert tesseract-ocr 论坛帖子
ocrb_plus MRZ best shreeshrii/tessdata_ocrb tesseract-ocr 论坛帖子
jav_java 爪哇文 best Shreeshrii/tessdata_jav_java tesseract-ocr 论坛帖子
mrz MRZ best DoubangoTelecom/tesseractMRZ tesseract-ocr 论坛帖子
dot_matrix MRZ best ameera3/OCR_Expiration_Date tesseract-ocr 论坛帖子
e13b E13B(或 MICR) best ElMagoElGato/tess_e13b_training tesseract-ocr 论坛帖子
e13b E13B(或 MICR) best DoubangoTelecom/tesseractMICR tesseract-ocr 论坛帖子
frak 哥特体 best bib.uni-mannheim.de/~stweil tesstrain wiki