-
Notifications
You must be signed in to change notification settings - Fork 8.1k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
自训练文字检测,文字识别使用官方模型,出现漏识别情况 #10534
Comments
测试的时候,姓名是准确框到了,但是文字识别只识别到了第二个字,没识别到第一个字。 |
我使用的是官方的det,自己训练的rec,也遇到相似的问题,测试时候没有问题,但是最后很多图片都是空白的,蹲一个解决方案 |
@xuxiansheng2018 whats the solution? |
下面的地址等信息识别的情况如何呢? det和rec之间的关联是这样的: 我猜测导致上述现象的原因是补0操作引入了噪声信息,使得宽高比较低的文本(即只有几个字的文本)容易被识别错误。可以参考类似的Issue |
在那一张图里,处理姓名漏掉一个字儿以外,其他信息全都识别出来了。然后我分别测试了ch_PP-OCRv3和ch_ppocr_sever_v2这两个版本,我发现ch_PP-OCRv3相比ch_ppocr_sever_v2在那一张图里不会漏掉文字,但是测多张图的比较结果中,ch_ppocr_sever_v2的表现相对更好一些。然后同一个版本里,我也分别测试了默认的SVTR以及CRNN,结果在ch_ppocr_server_v2中,这两种文字识别算法,都没法识别到漏掉的那个字。 |
您好,我具体描述一下我的问题:我的测试集有8500张图片,使用自己训练的det去单独只做检测的话,只有200张图片没有检测到框,可能是这些图片自身比较难识别。但是使用det和rec的联合指令的时候predict_system.py 指定了自己训练的det和自己训练的rec,以及官方的cls,却出现1700张图片检测结果为空,这种是det和rec之间的关联出现了问题吗?不知道问题出在哪里,希望您能给我个可行的建议。(自己训练的det验证acc=0.9 rec的acc=0.8) |
This issue has not been updated for a long time. This issue is temporarily closed and can be reopened if necessary. |
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem
这边基于飞桨AI studio进行了卡证文字检测的训练,然后文字检测训练指标还可以,但是在测试的时候,在图像质量还可以的情况下,文字检测也检测到了,但是文字识别的时候漏了一个字。请问一下,这种是什么情况?det+rec之间,有存在什么关联吗?我看代码,就是det检测完,把文字提取出来传输给rec【文字识别rec使用的是官方提供的ch_ppocr_v2通用模型】

下面是示意图,文字检测框的情况差不多是下图【但不是当时的测试图,涉及隐私】:
The text was updated successfully, but these errors were encountered: