泰语OCR识别介绍
泰语OCR识别是将泰语印刷体或手写体图片转为可编辑和检索的文本信息,以促进信息化、教育普及等。
泰语OCR识别难点
基字和上下标符号,如:เฎิด;
多音字与歧义,如:"กา"(乌鸦) vs "เกา"(划船);
复杂版式:横排和竖排文本组合;
连写形式,如:"เป"
泰语OCR识别解决方向
泰语OCR识别以LSTM+CTC技术为基线,采用双流混合网络技术,增加SAT(泰语符号感知训练)+CSRG校正,保证泰语识别准确率达到97%以上。
发布于:北京市辉煌优配提示:文章来自网络,不代表本站观点。