一种多轮对话的场景意图中断方法与流程

文档序号:14774208发布日期:2018-06-23 02:35阅读:109来源:国知局

本发明涉及一种多轮对话的场景意图中断方法,属于人工智能领域。



背景技术:

垂直领域的智能人机交互系统的优越性取决于其多轮对话的能力,这也是为何业界把智能人机交互系统研究重点放在多轮对话。常见的多轮对话系统通常采取如下策略:首先获取到用户问题后进行自然语言处理获取内在信息以及隐含信息;同时利用上下文信息进行对话意图判断以及场景建模,根据对话过程中已提供的信息以及预设模型中缺少的信息进行针对性的问答。很明显在上述策略中用户意图的不同将直接决定多轮对话系统分支的走向以及对话的推进。

在目前用户意图驱动的多轮对话系统中多轮对话实质上是在不同的场景意图之间的开始、跳转、复位、结束。如何在自然语言交互过程中如何进行新意图的建立,何时进行意图的切换、如何判断意图的结束决定着多轮对话系统的质量和用户体验。但是多数的对话系统当用户意图出现不同时立即进行场景切换和话题转移,这有点不符合正常合理的对话过程。在人们的日常交互中如果两人正在谈论某一话题,在话题结束前一般不会出现话题内容的大幅度转换。倘若突然进行急剧话题转换,另一方往往会做出意图确认的回应。所以有必要在多轮对话系统中加入中断机制对意图进行再判断,判断当前后意图出现差别超过特定阈值时,则不进行话题的转变,否则进行话题的转变。但是多数的对话系统当用户意图出现不同时立即进行场景切换和话题转移,缺乏再判断机制,导致多轮对话场景误切换的情况发生。

针对现有技术的缺陷,本发明提供一种多轮对话的场景意图中断方法,能自动适应完成多轮交互过程中出现的意图中断问题。

为了解决所述技术问题,本发明采用的技术方案是:一种多轮对话的场景意图中断方法,其特征在于:包括以下步骤:S01)、获取用户输入的多模态输入信息;S02)、对输入信息进行实体信息的抽取和结构化切片处理,获得结构化文本信息;S03)、基于结构化文本信息抽取用户初始意图;S04)、基于历史信息、结构化文本信息和用户初始意图,自适应判断用户真实意图,实现对对话意图的再判断以及对话容错;S05)、基于用户真实意图和对话模式,构建对话场景,获得结构化引导性问题或者答案;S06)、基于结构化引导性问题或者答案生成对应的自然语言问题或者答案。

本发明所述多轮对话的场景意图中断方法,步骤S04中,通过机器学习算法对用户初始意图进行再判断,首先对用户初始意图进行向量化,获得用户初始意图在高维空间的向量,计算用户初始意图Iteni与最近历史意图Iteni-1的空间距离Dis,并设置第一阈值Th1和第二阈值Th2,Th1< Th2,如果Dis小于第一阈值Th1,表明当前意图与历史意图重合度过大,步骤S05中生成提醒用户已经提问过相似问题的答案,如果Dis大于第二阈值Th2,表明当前意图与历史意图距离过大,此时不应进行意图跳转需要进行意图确认,步骤S05中生成进行意图确认的结构化引导性问题;如果Dis大于第一阈值Th1小于第二阈值Th2,则根据用户真实意图进行正常的意图中断及跳转。

本发明所述多轮对话的场景意图中断方法,采用Word2Vec对用户初始意图进行向量化,采用杰卡德相似距离计算当前用户意图Iteni与最近历史意图Iteni-1的空间距离Dis。

本发明所述多轮对话的场景意图中断方法,第一阈值和第二阈值通过机器学习算法训练得到,机器学习算法设有反馈机制,根据用户反馈对第一阈值和第二阈值进行迭代优化。

本发明所述多轮对话的场景意图中断方法,第一阈值和第二阈值通过SVM或者Bayes的机器学习算法训练得到。

本发明所述多轮对话的场景意图中断方法,多模态输入信息包括语音、文本和触摸动作。

本发明所述多轮对话的场景意图中断方法,获取用户输入的多模态输入信息时,利用预先定义动作指令集将触屏动作转换为文本信息、利用基于离线或者云端的语音识别技术将语音文件转换为自然语言文本或者直接接受用户输入的文本信息,并且支持多模态数据的同时录入,其中触屏动作的优先级最高,语音输入优先级次之,文本输入优先级最低。

本发明所述多轮对话的场景意图中断方法,S02中,通过词法分析完成自然语言文本的分词和词性标记,得到自然语言文本的词语集,保留文本的全部信息;然后利用句法分析技术得到关键信息之间的语法依存关系和修饰关系,抽取自然语言文本中关键信息;语义分析基于语义网络完成词语、词组以及句子的渐层语义分析,最终完成自然语言的结构化切片处理,获得结构化文本信息。

本发明所述多轮对话的场景意图中断方法,步骤S03中,采用决策树或者随机森林的机器学习方法,利用结构化文本信息和疑问句类型抽取用户意图,结合系统历史信息和当前对话信息实现结构化文本信息与多个业务场景的之间映射。

本发明所述多轮对话的场景意图中断方法,抽取用户意图时,进行多层意图判断。

本发明所述多轮对话的场景意图中断方法,步骤S05中,基于Bayes算法推理机制和知识库模块内部业务信息生成结构化引导性问题或者答案,Bayes算法推理机制基于用户意图以及对话模式,进行深层语义理解,构建对话场景,自动推理获取答案或者引导性问句的关键信息,进而推进人机交互过程。

本发明所述多轮对话的场景意图中断方法,步骤S06中,采用随机算法,灵活动态生成结构化引导性问题或者答案对应的问题或答案,避免答案格式僵化。

本发明的有益效果:本发明所述方法在抽取出用户初始意图后进行再判断,计算用户当前意图与最近历史意图的空间距离,将该空间距离与设置的阈值相比较从而得出用户当前会话是正常会话、已提问过的相似问题或者是与历史意图距离过大需要再确认的问题,根据用户的真实意图给出相应的结构化引导性问题或者答案。引入再判断机制,可以确认用户的真实意图或者避免实际场景中周围环境噪声的影响,可以避免多轮对话场景误切换的情况发生,并提高多轮对话的容错能力,能自动适应完成多轮交互过程中出现的意图中断问题。

附图说明

图1为本发明所述方法的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

一种多轮对话的场景意图中断方法,如图1所示,为其流程图,包括以下步骤:

S01)、获取用户输入的多模态输入信息;

本实施例中,输入信息包含但不限于语音、文本、触摸动作等。

获取多模态用户输入信息时,可以利用预先定义动作指令集将触屏操作转换为文本信息,或利用基于离线或者云端的语音识别技术将语音文件转换为自然语言文本,再或者直接接受用户输入的文本信息;并且输入模块支持多模态数据的同时录入。其中触屏动作的优先级最高,语音输入的优先级次之,文本输入的优先级最低。

S02)、对输入信息进行实体信息的抽取和结构化切片处理,获得结构化文本信息;

基于具体业务信息整理分析,完成业务的结构化、切片化以及多维度定义,具体而言完成实体信息的抽取和多层次多维度标记。

本实施例中,通过词法分析完成自然语言文本的分词和词性标记,得到自然语言文本的词语集,保留文本的全部信息;然后利用句法分析技术,例如有限图分析法、短语结构分析、完全语法、局部语法以及依存分析等得到关键信息之间的语法依存关系,修饰关系等等,抽取自然语言文本中关键信息;语义分析基于语义网络完成词语、词组以及句子的浅层语义分析。最终完成自然语言的结构化切片处理,获得结构化文本信息。

S03)、采用机器学习算法,利用结构化文本信息以及疑问句类型抽取用户意图;

本实施例中,机器学习算法包括但不限于决策树,随机森林算法等。结合系统历史信息和当前对话信息实现结构化文本信息与多个业务场景的之间映射。

本实施例中,抽取用户意图时,进行多层意图判断,可有效避免在业务场景分类过细时意图过分细化的问题。例如“我想办理养老保险”,此时用户的意图为养老保险相关业务去哪办理。系统应该推荐窗口,不易在进行细化判断,也就是说不用判断养老保险子业务(例如开户,缴费、关系转移)。但是如果用户提出“办理养老保险需要什么材料”,由于养老保险各个子业务所需材料不同,故需要对意图进行细化。

S04)、基于历史信息、结构化文本信息和用户初始意图,自适应判断用户真实意图,实现对对话意图的再判断以及对话容错;

本实施例中,通过机器学习算法对用户初始意图进行再判断,首先对用户初始意图进行向量化,获得用户初始意图在高维空间的向量,计算用户初始意图Iteni与最近历史意图Iteni-1的空间距离Dis,并设置第一阈值Th1和第二阈值Th2,Th1< Th2,如果Dis小于第一阈值Th1,表明当前意图与历史意图重合度过大,步骤S05中生成提醒用户已经提问过相似问题的答案,如果Dis大于第二阈值Th2,表明当前意图与历史意图距离过大,此时不应进行意图跳转需要进行意图确认,步骤S05中生成进行意图确认的结构化引导性问题;如果Dis大于第一阈值Th1小于第二阈值Th2,则根据用户真实意图进行正常的意图中断及跳转。

进一步的,意图向量化的方法包含但不限于Word2Vec,意图之间空间距离计算方法采用杰卡德相似距离,但不限于该方法,比如也可以采用欧氏距离等。

本实施例中,第一阈值和第二阈值的大小可随行业业务动态调整,在开发具体的业务系统时,通过机器学习算法,例如SVM,Bayes等等,训练得到相关阈值大小。机器学习算法设有反馈机制,可以根据用户反馈对阈值进行迭代优化。

具体而言,本方法引入再判断机制可以避免多轮对话场景误切换的情况发生,并提高多轮对话的容错能力。

比如进行人机交互对话,用户首先提出“我有点发烧、还有点咳嗽,应该去哪”,系统回应“请问您有咽喉肿疼或拉肚子吗”。然后用户接着提问“今天天会下雨吗”。此时系统判断前后意图距离过大,不应进行意图跳转反而需要进行意图确认,生成意图确认类的结构化引导性问题,确认出用户真实意图后再进行正确的交互。

提高多轮对话的容错能力是指缓解实际场景中周围环境噪声的影响。在实际运用过程中,系统很可能接受到噪声或者无意义的对话,此时依据场景对话的完成度自适应选择重复多轮对话的提问或者提示用户进行重新提问,

S05)、基于Bayes算法推理机制和知识库模块内部业务信息生成结构化引导性问题或者答案;

本实施例中,推理机制包括但不仅限于Bayes算法推理机制。Bayes算法推理机制基于用户意图以及对话模式,进行深层语义理解,构建对话场景,自动推理获取答案或者引导性问句的关键信息,进而推进人机交互过程。推理机制使得可处理知识库记录数量一个数量级或者多个数量级的问题。

S06)、基于结构化引导性问题或者答案生成对应的自然语言问题或者答案。主要完成结构化数据和非结构化处理。本实施例中,采用随机算法,灵活动态生成相应问题和答案,避免答案格式僵化。

以上描述的仅是本发明的基本原理和优选实施例,本领域技术人员根据本发明做出的改进和替换,属于本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1