一种文本自纠错识别方法、系统、设备和介质与流程

文档序号：36261335发布日期：2023-12-05 20:13阅读：30来源：国知局

本公开涉及计算机应用领域，具体涉及一种文本自纠错识别方法、系统、设备和介质。

背景技术：

1、随着ocr（光学字符识别）技术的成熟，ocr技术在人们的日常工作生活中有着广泛的应用，一般来说，ocr技术会用于大批量的文本数据识别，这就产出了大量的识别结果。但是由于一些原因（识别图像的质量参差不齐、算法本身准确率不高等），识别结果无法保证100%正确，尤其在一些应用场景中，识别的准确率尤为重要，错误是0容忍的，这就必须要对识别结果进行人工复核。虽然ocr识别技术大大降低了人工识别的人力成本，但是对大量的识别结果进行矫正也是一个非常消耗人力的工作。

2、目前的ocr识别算法有很多，不过都只能返回识别结果以及识别结果的置信度。并不能告诉用户哪些识别结果准确无误，哪里可能存在错误。

技术实现思路

1、本公开提供一种文本自纠错识别方法、系统、设备和介质，能够解决ocr识别算法只能返回识别结果以及识别结果的置信度，用户仍需要对每个识别结果进行人工复核，且不能确保识别结果的准确性的问题。为解决上述技术问题，本公开提供如下技术方案：

2、作为本公开实施例的一个方面，提供一种文本自纠错识别方法。包括如下步骤：

3、s10、获取图像样本，将所述图像样本通过图像扰动得到n个不同的扰动样本，n为不小于2的自然数；

4、s20、将所述n个不同的扰动样本分别通过m种不同的文本识别算法进行文本识别，得到m*n个识别结果，其中，m为不小于2的自然数；

5、s30、对所述m*n个识别结果进行投票，判断识别结果是否全部相同，如果识别结果全部相同，则该识别结果正确，无需人工复核，如果识别结果不全部相同，则通过编辑距离算法寻找不同的识别结果中存在错误的字符。

6、可选地，所述图像扰动为一系列的图像增强方法的随机组合，所述图像增强算法包括如下中的至少两种：随机角度旋转、高斯模糊、rgb颜色通道变化、图像对比度亮度变化或图像水平垂直翻转。

7、可选地，所述文本识别算法包括如下中的至少两种：ctc算法、ace算法或attention算法。

8、可选地，所述编辑距离算法为所述不同的识别结果中两个字符串的差异度的量化算法，所述差异度的量化算法为确定将其中一个字符串变成另一个字符串至少需要多少步操作。

9、可选地，在所述将其中一个字符串变成另一个字符串的操作包括：插入一个字符、删除一个字符和替换一个字符。

10、可选地，所述通过编辑距离算法寻找不同的识别结果中存在错误的字符，包括：通过将其中一个字符串变成另一个字符串的操作，推导出所述两个字符串中的差异字符，所述差异字符说明识别结果中的这些字符存在错误。

11、可选地，所述在步骤s30之后还包括如下步骤：

12、将步骤s30运行后得到的输出结果进行输出，所述输出结果包括可信标志位和文本结果，所述文本结果为最高票结果，所述可信标志位包括：表示可信的位、表示不可信的位和表示漏识别字符位。

13、作为本公开实施例的另一个方面，提供一种文本自纠错识别系统，包括：

14、图像扰动模块，获取图像样本，将所述图像样本通过图像扰动得到n个不同的扰动样本，n为不小于2的自然数；

15、文本识别模块，将所述n个不同的扰动样本分别通过m种不同的文本识别算法进行文本识别，得到m*n个识别结果，其中，m为不小于2的自然数；

16、错误字符识别模块，对所述m*n个识别结果进行投票，判断识别结果是否全部相同，如果识别结果全部相同，则该识别结果正确，无需人工复核，如果识别结果不全部相同，则通过编辑距离算法寻找不同的识别结果中可能存在错误的字符。

17、作为本公开实施例的另一个方面，提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的文本自纠错识别方法。

18、作为本公开实施例的另一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现上述的文本自纠错识别方法。

19、相对于现有技术，本公开的有益效果为：

20、1、本公开的文本识别结果中会告诉用户哪些字符是准确无误的，哪些字符是可能存在错误的，哪些地方可能漏识别，哪些地方可能多识别。用户不需要对结果进行全部的人工复核，极大地降低了人工复核的成本。

21、2、本公开的文本识别，用户只需关注可能存在问题的字符即可，来确保识别结果的准确性。

技术特征：

1.一种文本自纠错识别方法，其特征在于，包括如下步骤：

2.如权利要求1所述的文本自纠错识别方法，其特征在于，所述图像扰动为一系列的图像增强方法的随机组合，所述图像增强算法包括如下中的至少两种：随机角度旋转、高斯模糊、rgb颜色通道变化、图像对比度亮度变化或图像水平垂直翻转。

3.如权利要求1或2任一项所述的文本自纠错识别方法，其特征在于，所述文本识别算法包括如下中的至少两种：ctc算法、ace算法或attention算法。

4.如权利要求1所述的文本自纠错识别方法，其特征在于，所述编辑距离算法为所述不同的识别结果中两个字符串的差异度的量化算法，所述差异度的量化算法为确定将其中一个字符串变成另一个字符串至少需要多少步操作。

5.如权利要求4所述的文本自纠错识别方法，其特征在于，在所述将其中一个字符串变成另一个字符串的操作包括：插入一个字符、删除一个字符和替换一个字符。

6.如权利要求5所述的文本自纠错识别方法，其特征在于，所述通过编辑距离算法寻找不同的识别结果中存在错误的字符，包括：通过将其中一个字符串变成另一个字符串的操作，推导出所述两个字符串中的差异字符，所述差异字符说明识别结果中的这些字符存在错误。

7.如权利要求1所述的文本自纠错识别方法，其特征在于，所述在步骤s30之后还包括如下步骤：

8.一种文本自纠错识别系统，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的文本自纠错识别方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至7任一项所述的文本自纠错识别方法。

技术总结
本公开涉及一种文本自纠错识别方法、系统、设备和介质，所述方法包括如下步骤：获取图像样本，将所述图像样本通过图像扰动得到n个不同的扰动样本，n为不小于2的自然数；将所述n个不同的扰动样本分别通过m种不同的文本识别算法进行文本识别，得到m*n个识别结果，其中，m为不小于2的自然数；对所述m*n个识别结果进行投票，判断识别结果是否全部相同，如果识别结果全部相同，则该识别结果正确，无需人工复核，如果识别结果不全部相同，则通过编辑距离算法寻找不同的识别结果中存在错误的字符。本公开提出的文本自纠错识别方法，用户只需复核一下可能存在错误的字符，就可以确保整个识别结果的准确性，极大地降低了人工复核的成本。

技术研发人员：夏天
受保护的技术使用者：北京汉仪创新科技股份有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏天
技术所有人：上海驿创信息技术有限公司
我是此专利的发明人

上一篇：语音控制方法与流程
上一篇：一种用于政务文件管理的政务信息管理方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。