本发明涉及金融科技,尤其涉及一种基于人工智能的字符识别纠错方法、装置、设备及介质。
背景技术:
1、随着互联网金融的发展,在线金融业务(譬如支付,理财等)获得越来越广泛的应用需求。对于个人消费者而言,在线金融业务交易时的安全性与便捷性直接影响着其用户体验。银行卡号搭配密码的方式,因为具有较高的安全性,成为一种被普遍接受的在线交易方式。但是银行卡号往往较为冗长,其所在的银行卡背景常常较为复杂,手工输入银行卡号需要用户反复辨认多次校正,因此通过机器学习自动从银行卡图像中识别出银行卡号,成为一种提升该在线交易方式便捷性的有效手段,逐步受到关注。一般通过定位银行卡卡号行,并在该卡号行中定位出各个字符,最后根据字符识别技术(optical characterrecognition,ocr)识别各个字符,从而实现对银行卡的识别目的。然而,由于用户上传的银行卡图片质量参差不齐,存在反光、拍照模糊、抖动、银行卡背景多样对卡号识别的干扰等问题,使识别结果出现错误字符,需要对ocr技术识别结果中的错误字符进行纠错。
2、现有技术中,一般基于多模态特征的纠错任务,如在候选字召回时通过一些公开的型近字、近音字字典找到相近的字,对一些没有公开的型近字、近音字无法进行纠错,使纠错精度较低,因此,如何提高纠错精度成为亟需解决的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种基于人工智能的字符识别纠错方法、装置、设备及介质,以解决纠错精度较低的问题。
2、本申请实施例的第一方面提供了一种基于人工智能的字符识别纠错方法,所述字符识别纠错方法,包括:
3、获取待识别文本块,对所述待识别文本块进行字符识别,得到所述待识别文本块中每个字符的识别结果,以及每个字符在对应时序中的每个时刻的n个第一预测字符与每个第一预测字符的预测概率值,n为大于1整数;
4、针对任一字符,选取每个第一预测字符在对应时序中的预测概率值最大值作为对应第一预测字符的目标概率值,得到n个第一预测字符对应的n个目标概率值,若所述n个目标概率值中的最大值小于第一预设阈值,确定所述字符为待纠错字符,得到待纠错字符位置;
5、使用预设语言模型对所述待识别文本块进行识别预测,得到所述待识别文本块中每个字符位置的m个第二预测字符与每个第二预测字符的预测概率值,根据所述待纠错字符位置,将所述待纠错字符位置对应的m个第二预测字符与所述待纠错字符对应的n个第一预测字符确定为候选字符集,m为大于1的整数;
6、计算所述候选字符集中相同字符对应预测概率值的均值,若所述均值最大值大于第二预设阈值,将所述均值最大值对应的字符作为替换字符,使用所述替换字符替换所述待纠错字符,得到所述待纠错字符对应的纠错结果。
7、本申请实施例的第二方面提供了一种基于人工智能的字符识别纠错装置,所述字符识别纠错装置,包括:
8、获取模块,用于获取待识别文本块,利用字符识别模型对所述待识别文本块进行字符识别,得到所述待识别文本块中每个字符的识别结果,以及每个字符在对应时序中的每个时刻的n个第一预测字符与对应每个第一预测字符的预测概率值,n为大于1整数;
9、选取模块,用于针对任一字符,选取每个第一预测字符在对应时序中的预测概率值最大值作为对应第一预测字符的目标概率值,得到n个第一预测字符对应的n个目标概率值,若所述n个目标概率值中的最大值小于第一预设阈值,确定所述字符为待纠错字符,得到待纠错字符位置;
10、预测模块,用于使用预设语言模型对所述待识别文本块进行识别预测,得到所述待识别文本块中每个字符位置的m个第二预测字符与对应每个第二预测字符的预测概率值,根据所述待纠错字符位置,将所述待纠错字符位置对应的m个第二预测字符与所述待纠错字符对应的n个第一预测字符确定为候选字符集,m为大于1的整数;
11、计算模块,用于计算所述候选字符集中相同字符对应预测概率值的均值,若所述均值最大值大于第二预设阈值,将所述均值最大值对应的字符作为替换字符,使用所述替换字符替换所述待纠错字符,得到所述待纠错字符对应的纠错结果。
12、第三方面,本发明实施例提供一种终端设备,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于人工智能的字符识别纠错方法。
13、第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于人工智能的字符识别纠错方法。
14、本发明与现有技术相比存在的有益效果是:
15、获取待识别文本块,利用字符识别模型对待识别文本块进行字符识别,得到待识别文本块中每个字符的识别结果,以及每个字符在对应时序中的每个时刻的n个第一预测字符与对应每个第一预测字符的预测概率值,n为大于1整数,针对任一字符,选取每个第一预测字符在对应时序中的预测概率值最大值作为对应第一预测字符的目标概率值,得到n个第一预测字符对应的n个目标概率值,若n个目标概率值中的最大值小于第一预设阈值,确定字符为待纠错字符,得到待纠错字符位置,使用预设语言模型对待识别文本块进行识别预测,得到待识别文本块中每个字符位置的m个第二预测字符与对应每个第二预测字符的预测概率值,根据待纠错字符位置,将待纠错字符位置对应的m个第二预测字符与待纠错字符对应的n个第一预测字符确定为候选字符集,m为大于1的整数,计算候选字符集中相同字符对应预测概率值的均值,将均值最大值大于第二预设阈值,将均值最大值对应的字符作为替换字符,使用替换字符替换待纠错字符,得到待纠错字符对应的纠错结果。本申请中,通过字符识别模型确定出待纠错字符的位置,将字符识别模型与预设语言模型中预测出的字符概率值的平均值的最大值对应的字符作为替换字符,根据待纠错字符的先验知识,确定纠错位置,以便进行端到端的纠错处理,从而提高了纠错精度。
1.一种基于人工智能的字符识别纠错方法,其特征在于,所述字符识别纠错方法,包括:
2.如权利要求1所述的字符识别纠错方法,其特征在于,所述对所述待识别文本块进行字符识别,得到所述待识别文本块中每个字符的识别结果,包括:
3.如权利要求1所述的字符识别纠错方法,其特征在于,所述对所述待识别文本块进行字符识别,得到每个字符在对应时序中的每个时刻的n个第一预测字符与每个第一预测字符的预测概率值,包括:
4.如权利要求1所述的字符识别纠错方法,其特征在于,在所述使用预设语言模型对所述待识别文本块进行识别预测之前,还包括:
5.如权利要求4所述的字符识别纠错方法,其特征在于,所述使用所述训练样本对所述初始语言模型进行无监督训练,得到训练好的语言模型,包括:
6.如权利要求5所述的字符识别纠错方法,其特征在于,所述使用所述掩码字符对应的形近字符替代所述掩码字符之前,还包括:
7.一种基于人工智能的字符识别纠错装置,其特征在于,所述字符识别纠错装置,包括:
8.如权利要求7所述的字符识别纠错装置,其特征在于,所述获取模块包括:
9.一种终端设备,其特征在于,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的字符识别纠错方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的字符识别纠错方法。