本申请涉及文本识别,特别是涉及一种拼音串识别方法、装置、设备和存储介质。
背景技术:
1、目前,用户进行文字输入时通常使用拼音进行输入。而目前已出现输入法支持整句的拼音串输入,但目前为止,并没有充足数据或者足够大的模型支撑对句子、特别是长句的准确识别。其中,句子越长,用户的意图就越多,对应的长句的拼音串的识别结果准确度则越低,模型输出的句子识别结果往往不是用户想要的最终结果。
2、因此,在拼音串识别中,如何提高拼音串的文本识别的准确率意义重大。
技术实现思路
1、本申请主要解决的技术问题是提供一种拼音串识别方法、装置、设备和存储介质,能够提高拼音串的文本识别的准确率。
2、为解决上述技术问题,本申请采用的一个技术方案是:提供一种拼音串识别方法,该方法包括:获取目标拼音串;为目标拼音串确定满足切分要求的目标切分方式;按照目标切分方式对目标拼音串进行切分,得到至少两个音节片段;基于用户对各音节片段解码得到的候选片段文本的选择,得到各音节片段的目标片段文本。
3、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种拼音串识别装置,该装置包括:获取模块,用于获取目标拼音串;确定模块,用于为目标拼音串确定满足切分要求的目标切分方式;切分模块,用于按照目标切分方式对目标拼音串进行切分,得到至少两个音节片段;得到模块,用于基于用户对各音节片段解码得到的候选片段文本的选择,得到各音节片段的目标片段文本。
4、为解决上述技术问题,本申请采用的又一个技术方案是:提供一种电子设备,包括相互耦接的存储器和处理器,存储器存储有程序指令;处理器用于执行存储器中存储的程序指令,以实现上述方法。
5、为解决上述技术问题,本申请采用的再一个技术方案是:提供一种计算机可读存储介质,计算机可读存储介质用于存储程序指令,程序指令能够被执行以实现上述方法。
6、上述方案,在获取到目标拼音串后,为目标拼音串确定满足切分要求的目标切分方式,并按照该目标切分方式对目标拼音串进行切分,得到至少两个音节片段,然后,基于用户对各音节片段解码得到的候选片段文本的选择,得到各音节片段的目标片段文本。因此,本申请能够先将目标拼音串切分为音节片段,使得用户可选择各音节片段对应的候选片段文本,以实现拼音串的文本识别,相对于直接使用现有模型对整个拼音串进行文本识别,本申请方案能够提高拼音串的文本识别的准确率。
7、进一步地,通过选择满足切分要求的方式对拼音串进行切分,例如可以基于切分片段数或者切分后的音节片段的解码准确率确定该切分要求,因为考虑到了切分后的音节片段的数量和切分后音节片段的解码准确率,由此可以使得用户对后续切分得到的音节片段的选词操作减少,进而能够提高用户的选词效率。
1.一种拼音串识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述为所述目标拼音串确定满足切分要求的目标切分方式,包括:
3.根据权利要求2所述的方法,其特征在于,所述获取各所述候选切分方式的评估因子,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述评估因子,从所述若干候选切分方式中选出满足所述切分要求的所述目标切分方式,包括:
5.根据权利要求4所述的方法,其特征在于,满足置信要求的所述候选切分方式为:在所述切分片段数相同的候选切分方式中所述置信概率最高、且概率差异满足预设差异要求,所述概率差异为所述切分片段数相同的候选切分方式中最高的所述置信概率与次高的所述置信概率之间的差异。
6.根据权利要求5所述的方法,其特征在于,所述预设差异要求为所述概率差异大于所述候选切分方式的切分片段数对应的差异阈值,所述差异阈值与所述切分片段数呈正相关关系。
7.根据权利要求2所述的方法,其特征在于,在所述获取目标拼音串后,所述方法还包括:
8.根据权利要求1所述的方法,其特征在于,所述基于用户对各所述音节片段解码得到的候选文本的选择,得到各所述音节片段的目标片段文本,包括:
9.根据权利要求1所述的方法,其特征在于,所述目标拼音串是用户通过终端的输入键盘输入的,所述为所述目标拼音串确定满足切分要求的目标切分方式,包括:
10.一种拼音串识别装置,其特征在于,所述装置包括:
11.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序指令,所述程序指令能够被执行以实现权利要求1-9任一项所述的方法。