文本增强方法、装置、计算机设备及存储介质与流程

文档序号:26589847发布日期:2021-09-10 20:33阅读:来源:国知局

技术特征:
1.一种文本增强方法,其特征在于,包括:接收多条原始对话数据,将每条所述原始对话数据中的每一轮对话解析为相应的单轮对话模板,所述单轮对话模板中包括单轮对话函数,所述单轮对话函数包括如下元素:当前信念状态、前一轮信念状态、当前对话槽、下一轮对话槽;将多条所述原始对话数据中的具有相同单轮对话模板的单轮对话作为同一级节点,组成对话模板树,遍历所述对话模板树的每个节点,如果第一节点的当前对话槽与上一级中的第二节点的下一轮对话槽相同,并且所述第一节点的前一轮信念状态与所述上一级的第二节点的当前信念状态相同,则将所述第一节点和第二节点相连接;遍历所述对话模板树,按照等级由高到低的顺序沿着节点连线生成多条完整路径,每条所述完整路径由多个不同等级的节点组成,将所述完整路径上的多个节点对应的原始对话语句按照由高到低的等级进行顺序组合,组成多个完整对话,作为增强后的任务型对话数据。2.如权利要求1所述的文本增强方法,其特征在于,所述信念状态包含所述原始对话数据中的所有语义关键信息。3.如权利要求1所述的文本增强方法,其特征在于,所述对话槽包含所述原始对话数据中单轮对话的唯一语义关键信息。4.如权利要求1所述的文本增强方法,其特征在于,所述对话模板树由多个等级的节点分级连线而组成,每个等级内部的节点的单轮对话模板所包含的单轮对话函数相同。5.如权利要求4所述的文本增强方法,其特征在于,在所述对话模板树中,每个节点代表所述原始对话数据中的一轮对话,等级高一级的节点作为下一个等级的父节点,并且当前节点的对话槽与父节点的下一轮对话槽相同,而当前节点的前一轮信念状态与父节点的当前信念状态相同。6.如权利要求2或3所述的文本增强方法,其特征在于,所述语义关键信息通过人工标注或机器自动标注而获得。7.如权利要求1所述的文本增强方法,其特征在于,所述将所述完整路径上的多个节点对应的原始对话语句还原为自然语言,组成多个完整对话,包括:所述完整路径上的每个节点对应的原始对话语句为多条;从多条原始对话语句中随机抽取一条还原为自然语言;整合每个节点对应的自然语言,组成一个完整对话;重复以上过程,组成多个完整对话。8.一种文本增强装置,其特征在于,包括:单论对话模板生成模块,用于接收多条原始对话数据,将每条所述原始对话数据中的每一轮对话解析为相应的单轮对话模板,所述单轮对话模板中包括单轮对话函数,所述单轮对话函数包括如下元素:当前信念状态、前一轮信念状态、当前对话槽、下一轮对话槽;对话模板树生成模块,用于将多条所述原始对话数据中的具有相同单轮对话模板的单轮对话作为同一级节点,组成对话模板树,遍历所述对话模板树的每个节点,如果第一节点的当前对话槽与上一级中的第二节点的下一轮对话槽相同,并且所述第一节点的前一轮信
念状态与所述上一级的第二节点的当前信念状态相同,则将所述第一节点和第二节点相连接;新对话合成模块,用于遍历所述对话模板树,按照等级由高到低的顺序沿着节点连线生成多条完整路径,每条所述完整路径由多个不同等级的节点组成,将所述完整路径上的多个节点对应的原始对话语句按照由高到低的等级进行顺序组合,组成多个完整对话,作为增强后的任务型对话数据。9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项权利要求所述文本增强方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被一个或多个处理器执行时,实现如权利要求1至6中任一项权利要求所述文本增强方法的步骤。

技术总结
本申请涉及一种文本增强方法和装置,该方法包括:接收多条原始对话数据,将每条原始对话数据中的每一轮对话解析为相应的单轮对话模板,单轮对话模板中包括单轮对话函数;将多条原始对话数据生成的具有相同单轮对话模板的单轮对话作为同一级节点,组成对话模板树,遍历对话模板树的每个节点,如果第一节点的当前对话槽和前一轮信念状态与上一级中的第二节点的相同,则将第一节点和第二节点相连接;遍历对话模板树,生成多条完整路径,每条完整路径由多个不同等级的节点组成,将完整路径上的多个节点对应的原始对话语句还原为自然语言,组成多个完整对话,作为增强后的任务型对话数据。本申请减少了很多的计算量,通用性强。通用性强。通用性强。


技术研发人员:黄海龙
受保护的技术使用者:中国平安人寿保险股份有限公司
技术研发日:2021.06.28
技术公布日:2021/9/9
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1