基于对话改写信息的处理方法、装置、电子设备及介质与流程

文档序号:35817092发布日期:2023-10-22 07:47阅读:29来源:国知局
基于对话改写信息的处理方法、装置、电子设备及介质与流程

本申请涉及人工智能,尤其涉及一种基于对话改写信息的处理方法、装置、电子设备及存储介质。


背景技术:

1、相关技术中有基于语法纠错的解决方案,即将语法纠错模型拼接在对话改写模型之后,进行语法纠错。这种方式一方面来说需要花费较大资源跑额外的模型;另外一方面,由于纠错模型需要单独训练,预测的时候也是基于单句,没有上下文的概念,所以在纠错时可能会脱离语义本身进行纠错,导致表达上没问题,但是和上下文不相关。针对该问题,目前尚无有效解决方案。


技术实现思路

1、为解决相关技术问题,本申请实施例提供一种基于对话改写信息的处理方法、装置、电子设备及存储介质。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供了一种基于对话改写信息的处理方法,应用于对话改写系统中的处理装置;所述处理装置设置在所述对话改写系统中的模型预测装置之后,所述方法包括:

4、通过所述模型预测装置获取第一文本;

5、对第一文本进行分词处理,得到第一词文本和第二词文本;所述第一词文本表征用户的原始词信息;所述第二词文本表征所述原始词信息对应的预测词信息;

6、根据所述第一词文本和所述第二词文本确定至少一个目标词;所述至少一个目标词所述目标词属于所述第二词文本但不属于所述第一词文本;

7、基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词;

8、根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本。

9、上述方案中,所述第一词文本包括至少一个第一词语;所述基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词,包括:

10、判断第一目标词是否为至少一个所述第一词语的子词;所述第一目标词为所述至少一个目标词中的任一目标词;

11、在所述第一目标词为至少一个所述第一词语的子词的情况下,将至少一个所述第一词语作为所述目标词对应的修正词。

12、上述方案中,在所述第一目标词对应的修正词为多个所述第一词语的情况下,所述方法还包括:

13、确定所述第一目标词分别与所述多个所述第一词语中的每个所述第一词语的距离参数;

14、基于所述距离参数确定与所述第一目标词最小距离对应的第二词语;

15、将所述第二词语作为所述第一目标词对应的修正词。

16、上述方案中,所述方法还包括:

17、判断所述修正词是否具有明确语义,得到判断结果;

18、在所述判断结果表明所述修正词具有明确语义的情况下,根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本。

19、上述方案中,所述判断所述修正词是否具有明确语义,得到判断结果,包括:

20、确定所述修正词的词性;

21、判断所述修正词的词性是否属于预设词性;

22、在所述修正词的词性属于所述预设词性的情况下,确定所述判断结果为所述修正词具有明确语义;

23、在所述修正词的词性不属于所述预设词性的情况下,确定所述判断结果为所述修正词不具有明确语义。

24、上述方案中,所述判断所述修正词是否具有明确语义,得到判断结果,包括:

25、将所述修正词与预设停用词进行匹配;所述预设停用词基于用户确定;

26、在所述修正词与预设停用词匹配成功的情况下,确定所述判断结果为所述修正词不具有明确语义;

27、在所述修正词与预设停用词匹配不成功的情况下,确定所述判断结果为所述修正词具有明确语义。

28、上述方案中,所述根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本,包括:

29、将所述修正词替换所述第二词文本中与所述修正词对应的所述目标词,所述第二词文本对应的对话改写文本。

30、本申请实施例还提供了一种基于对话改写信息的处理装置,所述处理装置包括:

31、分词处理单元,用于对第一文本进行分词处理,得到第一词文本和第二词文本;所述第一词文本表征用户的原始词信息;所述第二词文本表征所述原始词信息对应的预测词信息;

32、确定单元,用于根据所述第一词文本和所述第二词文本确定至少一个目标词;所述至少一个目标词包括至少一个目标词;所述目标词属于所述第二词文本但不属于所述第一词文本;基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词;根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本。

33、本申请实施例还提供了一种电子设备,包括:

34、存储器,用于存储可执行指令;

35、处理器,用于执行所述存储器中存储的可执行指令时,实现上述所述方法的任一步骤。

36、本申请实施例还提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现上述所述方法的任一步骤。

37、本申请实施例提供的基于对话改写信息的处理方法、装置、电子设备及存储介质,其中,方法应用于对话改写系统中的处理装置;所述处理装置设置在所述对话改写系统中的模型预测装置之后,包括:通过所述模型预测装置获取第一文本;对第一文本进行分词处理,得到第一词文本和第二词文本;所述第一词文本表征用户的原始词信息;所述第二词文本表征所述原始词信息对应的预测词信息;根据所述第一词文本和所述第二词文本确定至少一个目标词;所述目标词属于所述第二词文本但不属于所述第一词文本;基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词;根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本。采用本申请的技术方案,通过对话改写系统中的处理装置独立存在,对模型预测装置输出的第一文本进行分词处理,得到第一文本中包括的第一词文本和第二词文本;根据所述第一词文本和所述第二词文本确定至少一个目标词;基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词;根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本;即无需额外的复杂模型,从而使使用成本更低,且更加贴近上下文语义。



技术特征:

1.一种基于对话改写信息的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一词文本包括至少一个第一词语;所述基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词,包括:

3.根据权利要求2所述的方法,其特征在于,在所述第一目标词对应的修正词为多个所述第一词语的情况下,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述判断所述修正词是否具有明确语义,得到判断结果,包括:

6.根据权利要求4所述的方法,其特征在于,所述判断所述修正词是否具有明确语义,得到判断结果,包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本,包括:

8.一种基于对话改写信息的处理装置,其特征在于,所述处理装置包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于被处理器执行时,实现权利要求1至7任一项所述的基于对话改写信息的处理方法。


技术总结
本申请公开了一种基于对话改写信息的处理方法、装置、电子设备及存储介质。所述方法包括:对第一文本进行分词处理,得到第一词文本和第二词文本;所述第一词文本表征用户的原始词信息;所述第二词文本表征所述原始词信息对应的预测词信息;根据所述第一词文本和所述第二词文本确定至少一个目标词;所述目标词属于所述第二词文本但不属于所述第一词文本;基于所述至少一个目标词和所述第一词文本确定所述目标词对应的修正词;根据所述修正词和所述第二词文本确定所述第二词文本对应的对话改写文本。

技术研发人员:张禹尧
受保护的技术使用者:中国移动通信有限公司研究院
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1