语法纠错方法及装置与流程

文档序号:31562433发布日期:2022-09-20 17:25阅读:来源:国知局

技术特征:
1.一种语法纠错方法,其特征在于,所述方法包括:获取输入文本,以及获取所述输入文本的特征;对所述特征执行第一编码过程,获得第一编码向量,并对所述输入文本执行第二编码过程,获得第二编码向量;所述第一编码过程和所述第二编码过程并行;利用所述第一编码向量和所述第二编码向量,获得输入文本向量;对所述输入文本向量进行解码,输出解码后的输出文本。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一编码向量和所述第二编码向量,获得输入文本向量,包括:获得所述第二编码向量中每一词向量与所述第一编码向量中的特征向量对应的权重,基于所述权重,获得所述输入文本向量。3.根据权利要求2所述的方法,其特征在于,所述第一编码向量与所述第二编码向量相对应;所述获得所述第二编码向量中每一词向量与所述第一编码向量中的特征向量对应的权重,包括:确定第一时刻时,所述第二编码向量中的第一词向量在所述第一编码向量中对应的第一特征向量;所述第一编码向量包含第一部分特征向量和第二部分特征向量,所述第一部分特征向量包含所述第一特征向量,所述第二部分特征向量不包含所述第一特征向量;获得所述第一词向量与所述第一部分特征向量中每一特征向量对应的第一权重,以及获得所述第一词向量与所述第二部分特征向量中按照预设规则抽取的特征向量对应的第二权重。4.根据权利要求1-3任一项所述的方法,其特征在于,所述获取所述输入文本的特征,包括:根据所述输入文本对应的应用场景,利用第一知识库,获取所述输入文本在所述应用场景中对应的特征。5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述特征执行第一编码过程,获得第一编码向量,包括:基于transformer编码模型,在所述第一编码过程中,对所述特征中的每一特征进行编码,获得所述第一编码向量;或者,基于知识图谱,在所述第一编码过程中,建立所述输入文本中目标单词或目标文本片段与所述知识图谱中对应的语义信息的映射关系,获得所述第一编码向量。6.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述输入文本执行第二编码过程,获得第二编码向量,包括:基于transformer编码模型,在所述第二编码过程中,对所述输入文本进行词语切分后,对切分后的每一词语进行编码,获得所述第二编码向量。7.一种语法纠错装置,其特征在于,包括:处理器和存储器,所述存储器与所述处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器从所述存储器中读取所述计算机指令,使得所述语法纠错装置执行如下操作:获取输入文本,以及获取所述输入文本的特征;对所述特征执行第一编码过程,获得第一编码向量,并对所述输入文本执行第二编码过程,获得第二编码向量;所述第一编码过程和所述第二编码过程并行;
利用所述第一编码向量和所述第二编码向量,获得输入文本向量;对所述输入文本向量进行解码,输出解码后的输出文本。8.根据权利要求7所述的装置,其特征在于,所述利用所述第一编码向量和所述第二编码向量,获得输入文本向量,包括:获得所述第二编码向量中每一词向量与所述第一编码向量中的特征向量对应的权重,基于所述权重,获得所述输入文本向量。9.根据权利要求8所述的装置,其特征在于,所述第一编码向量与所述第二编码向量相对应;所述获得所述第二编码向量中每一词向量与所述第一编码向量中的特征向量对应的权重,包括:确定第一时刻时,所述第二编码向量中的第一词向量在所述第一编码向量中对应的第一特征向量;所述第一编码向量包含第一部分特征向量和第二部分特征向量,所述第一部分特征向量包含所述第一特征向量,所述第二部分特征向量不包含所述第一特征向量;获得所述第一词向量与所述第一部分特征向量中每一特征向量对应的第一权重,以及获得所述第一词向量与所述第二部分特征向量中按照预设规则抽取的特征向量对应的第二权重。10.根据权利要求7-9任一项所述的装置,其特征在于,所述获取所述输入文本的特征,包括:根据所述输入文本对应的应用场景,利用第一知识库,获取所述输入文本在所述应用场景中对应的特征。11.根据权利要求7-10任一项所述的装置,其特征在于,所述对所述特征执行第一编码过程,获得第一编码向量,包括:基于transformer编码模型,在所述第一编码过程中,对所述特征中的每一特征进行编码,获得所述第一编码向量;或者,基于知识图谱,在所述第一编码过程中,建立所述输入文本中目标单词或目标文本片段与所述知识图谱中对应的语义信息的映射关系,获得所述第一编码向量。12.根据权利要求7-10任一项所述的装置,其特征在于,所述对所述输入文本执行第二编码过程,获得第二编码向量,包括:基于transformer编码模型,在所述第二编码过程中,对所述输入文本进行词语切分后,对切分后的每一词语进行编码,获得所述第二编码向量。13.一种计算机可读存储介质,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1-6中任一项所述的方法被实现。14.一种包含指令的计算机程序产品,其特征在于,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行如权利要求1-6中任一项所述的语法纠错方法。

技术总结
本申请提供语法纠错方法及装置;涉及人工智能领域以及自然语言生成领域,能够利用输入文本的特征对输入文本进行语法纠错,提升语法纠错效果。并且,将特征和输入文本并行进行编码,有效提高语法纠错效率。该方法包括:获取输入文本以及输入文本的特征,对输入文本以及特征进行并行编码,获得对应的两个编码向量,利用两个编码向量获得输入文本向量,之后对输入文本向量进行解码,以获得语法纠错后的输出文本。本。本。


技术研发人员:刘杰 王笑 张穗云 张晴
受保护的技术使用者:华为技术有限公司
技术研发日:2021.03.10
技术公布日:2022/9/19
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1