一种人机对话中教授意图答案生成方法

文档序号:10725075阅读:241来源:国知局
一种人机对话中教授意图答案生成方法
【专利摘要】本发明公开了一种人机对话中教授意图答案生成方法,所述方法包括:对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图则进入下一步骤;在所述历史记录中寻找当前对话对应的问句;结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;对于相关答案集合进行过滤;基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果及当前对话的回答返回。本发明能够对人机对话中教授意图下对用户的教授内容进行良好的反馈,提高人机对话的满意度。
【专利说明】
一种人机对话中教授意图答案生成方法
技术领域
[0001] 本发明涉及人机对话技术领域,具体来说涉及一种人机对话中的教授意图答案生 成方法。
【背景技术】
[0002] 人机对话作为人工智能领域一个重要的研究课题,在对话过程中,用户的体验度 十分重要。随着语音识别技术的发展,人机对话在聊天机器人、语音助手、虚拟人场景对话、 儿童陪聊机器人等各个领域均具有重要作用。然而,在人机对话过程中,对于一些问题,机 器人的回答并不正确,或者用户对机器人返回的答案持有不同的意见,此时,用户往往会表 达自己的意见,来纠正或者教授机器人,这种情况下,用户更希望的是机器人能够针对他的 观点进行回答,但目前的人机对话系统往往是直接返回知识库的答案或者给以模棱两可的 回复,虽然这样的回复可以减少计算机的正面回答及回答的错误率,但带给用户的感觉是 计算机并没有领会用户交流或者教授的意图,这样的对话体验并不友好。

【发明内容】

[0003] 为解决上述的一个或多个问题,本发明提供了一种人机对话中教授意图答案生成 方法,本发明能够对人机对话教授意图下对用户的教授内容进行良好的反馈,从而提高人 机对话的满意度。
[0004] 本发明提供的一种人机对话中教授意图答案生成方法包括以下步骤:
[0005] 步骤1,对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图 识别;
[0006] 步骤2,如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添 加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授 意图,则进入步骤3进行自我对话;
[0007] 步骤3,在确认当前对话的意图是教授意图后,在所述历史记录中寻找当前对话对 应的问句;
[0008] 步骤4,根据所述步骤3找到的问句,结合当前对话及网络信息,进行多轮模拟自我 对话获取相关答案集合;
[0009] 步骤5,对于所述步骤4获得的相关答案集合进行过滤,去除不相关的答案;
[0010] 步骤6,对于过滤后的答案集合,基于每条答案的权重进行摘要抽取,权重值最高 的答案作为摘要抽取的结果,并作为当前对话的回答进行返回。
[0011] 可选地,所述步骤1进一步包括以下步骤:
[0012] 步骤11,对于当前对话所包含的句子进行分词操作,得到每个句子的词向量序列, 所述词向量序列由每个句子分词后得到的词向量组成;
[0013] 步骤12,基于每个句子的词向量序列,计算句间相似度;
[0014] 步骤13,基于所述句间相似度,采用词向量模型对于当前对话进行对话意图识别, 获得当前对话的对话意图。
[0015]可选地,所述步骤12中,采用如下公式计算句间相似度:
[0017]其中,S(x,y)表示句间相似度,1,7分别表示句子X和句子y的词向量序列。
[0018] 可选地,所述对话意图至少包括闲聊意图和教授意图,其中,所述教授意图是指用 户对计算机返回答案的纠正,或者用户对计算机答案表达自己的观点。
[0019] 可选地,所述询问意图值是指用户对话是问句的概率。
[0020] 可选地,所述步骤3中,采用下式在历史记录中寻找当前对话对应的问句:
[0022]其中,表示第i条历史对话是当前对话语句对应问句的概率值,D(Xl,Xt)表示第i 条历史对话与当前对话之间的距离,Xt表示当前对话,Xl表示第i条历史对话,Ask( Xl)表示 第i条历史对话询问意图值的大小,len表示对话历史记录的长度,α,β,γ分别表示权重;S (Xl,Xt)表示第i条历史对话与当前对话之间的句间相似度。
[0023] 可选地,所述步骤4中,采用下式来进行多轮自我对话以获取相关答案集合:
[0024] ai+i=F(q,ai)
[0025] 其中,q表示步骤3找到的当前对话对应的问句,ai表示第i轮自我对话得到的答 案,ao表示当前对话,F(q, ai)表示通过问句q和当前答案ai,得到的自我对话下一轮的答案, η为对话的最多轮数。
[0026] 可选地,所述步骤5中,采用下式来迭代计算每条答案的权重:
[0028] 其中,W(Vj)表示第i条答案的权重,V」表示第j条答案,Vl表示第i条答案,Vk表示第 k条答案,In(Vl)是指存在指向第i条答案信息的句子集合,0ut(Vj)是第j条答案所指向的句 子集合,S(i,j)及S(j,k)表示两个句子的相似程度。
[0029] 可选地,所述步骤5中,当摘要抽取得到的信息数量较多时,采用句间词向量的相 似度对得到的信息进行聚类,将相似度较高的一类信息作为摘要抽取的内容。
[0030] 从上述技术方案可以看出,本发明在人机对话教授意图下具有以下有益效果:
[0031] (1)本发明能够自动判断用户对话的教授意图,针对用户教授内容,进行自我对 话,生成与用户对话更加相关的答案;
[0032] (2)本发明针对人机对话中的教授意图,通过自我对话生成的答案具有更好的用 户体验度。
【附图说明】
[0033] 图1是根据本发明一实施例的人机对话中教授意图答案生成方法的流程图。
【具体实施方式】
[0034] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本发明进一步详细说明。
[0035] 本发明针对人机对话中的教授意图,采用词向量模型对于用户对话语句进行意图 识别,获得用户对话的询问意图;明确用户教授意图情况下,首先从对话历史中选出当前对 话语句对应的问题;根据匹配到的问题,结合用户教授答案及互联网相关信息模拟多轮自 我对话,然后对自我对话获取的多轮信息进行过滤和摘要抽取;最终将抽取得到的摘要作 为计算机对用户教授意图的反馈。
[0036] 在本发明的一个示例性实施例中,提供了一种人机对话中基于自我对话的用户教 授意图答案生成方法。图1为根据本发明一实施例的人机对话中基于自我对话的用户教授 意图答案生成方法的流程图。如图1所示,所述方法包括以下步骤:
[0037] 步骤1,对于收到的用户的对话,计算其句间相似度,然后对当前对话语句进行对 话意图识别;
[0038] 所述步骤1进一步包括以下步骤:
[0039] 步骤11,对于当前对话所包含的句子进行分词操作,得到每个句子的词向量序列, 所述词向量序列由每个句子分词后得到的词向量组成;
[0040] 步骤12,基于每个句子的词向量序列,采用如下公式计算句间相似度:
[0042] 其中,S(x,y)表示句间相似度,x,y分别表示句子X和句子y的词向量序列,其由句 子X,y分词后得到的词向量组成。
[0043] 步骤13,基于所述句间相似度,采用词向量模型对于当前对话进行对话意图识别, 获得当前对话的对话意图。
[0044] 步骤2,如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添 加至历史记录中,并直接通过搜索知识库或者网络返回答案,无需进行自我对话步骤;如果 当前对话的意图是教授意图,则进入步骤3,进行自我对话,生成最佳答案返回;
[0045] 其中,教授意图是指用户对计算机返回答案的纠正,或者用户对计算机答案表达 自己的观点;询问意图值是指用户对话是问句的概率。
[0046] 步骤3,在确认当前对话的意图是教授意图后,在所述历史记录中寻找当前对话对 应的问句;
[0047] 在本发明一实施例中,采用下式在历史记录中寻找当前对话对应的问句:
[0049] 其中,Pl表示第i条历史对话是当前对话语句对应问句的概率值,D(Xl,Xt)表示第i 条历史对话与当前对话之间的距离,xt表示当前对话,Xl表示第i条历史对话,Ask(Xl)表示 第i条历史对话询问意图值的大小,len表示对话历史记录的长度,len< = 10,当前对话为 第〇条,当前对话的前一句历史对话为第1条历史,以此类推;α,β,γ分别表示权重;S(Xl, Xt) 表示第i条历史对话与当前对话之间的句间相似度,其计算方法如公式(5)所示。
[0050] 步骤4,根据所述步骤3找到的问句,结合当前对话及相关网络信息,进行多轮模拟 自我对话获取相关答案集合;
[0051] 在本发明一实施例中,采用下式来进行多轮自我对话以获取相关答案集合:
[0052] ai+i=F(q,ai)CKi^in (7)
[0053] 其中,q表示步骤3找到的当前对话对应的问句,ai表示第i轮自我对话得到的答 案,ao表示当前对话,F(q,ai)表示通过问句q和当前答案ai,得到的自我对话下一轮的答案, η为对话的最多轮数,由此可以得到与当前对话相关的答案集合为{a^m,......an}。
[0054] 步骤5,对于所述步骤4获得的相关答案集合进行过滤,去除不相关的答案;
[0055] 其中,所述过滤可采用多种过滤方法,只要是能够过滤掉冗余信息和不相关信息 的方法都可以使用,本发明对其不作具体限定。
[0056] 步骤6,对于过滤后的答案集合,基于每条答案的权重进行摘要抽取,权重值最高 的答案作为摘要抽取的结果,并作为当前对话的回答进行返回。
[0057] 在本发明一实施例中,采用下式来计算每条答案的权重:
[0059]其中,W(Vj)表示第i条答案的权重,V」表示第j条答案,Vl表示第i条答案,V k表示第 k条答案,In(Vl)是指存在指向第i条答案信息的句子集合,在本方法中,默认除了第i条答 案^的其他答案集合为In( Vl),0ut(Vj)是第j条答案所指向的句子(这里的句子指的是答案 集合中的答案)集合,在本方法中,默认除了第j条答案W的其他答案集合为〇ut( Vj),求和的 分子S(i,j)及分母S(j,k)表示两个句子的相似程度,其计算方法如公式(5)所示,d是阻尼 系数。
[0060]公式(8)是一个迭代的过程,通过多次的迭代计算,所有句子的权值会收敛到一个 稳定的值,最后获取权值最高的答案,即最重要的答案。
[0061] 在本发明一实施例中,当摘要抽取得到的信息数量较多时,可采用句间词向量的 相似度对得到的信息进行聚类,将相似度较高的一类信息作为摘要抽取的结果,其中,句间 词向量的相似度计算如公式(1)所示。
[0062] 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详 细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡 在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保 护范围之内。
【主权项】
1. 一种人机对话中教授意图答案生成方法,其特征在于,所述方法包括W下步骤: 步骤1,对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别; 步骤2,如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至 历史记录中,并直接通过捜索知识库或者网络返回答案;如果当前对话的意图是教授意图, 则进入步骤3进行自我对话; 步骤3,在确认当前对话的意图是教授意图后,在所述历史记录中寻找当前对话对应的 问句; 步骤4,根据所述步骤3找到的问句,结合当前对话及网络信息,进行多轮模拟自我对话 获取相关答案集合; 步骤5,对于所述步骤4获得的相关答案集合进行过滤,去除不相关的答案; 步骤6,对于过滤后的答案集合,基于每条答案的权重进行摘要抽取,权重值最高的答 案作为摘要抽取的结果,并作为当前对话的回答进行返回。2. 根据权利要求1所述的方法,其特征在于,所述步骤1进一步包括W下步骤: 步骤11,对于当前对话所包含的句子进行分词操作,得到每个句子的词向量序列,所述 词向量序列由每个句子分词后得到的词向量组成; 步骤12,基于每个句子的词向量序列,计算句间相似度; 步骤13,基于所述句间相似度,采用词向量模型对于当前对话进行对话意图识别,获得 当前对话的对话意图。3. 根据权利要求2所述的方法,其特征在于,所述步骤12中,采用如下公式计算句间相 似度:其中,S(x,y)表示句间相似度,x,y分别表示句子X和句子y的词向量序列。4. 根据权利要求2所述的方法,其特征在于,所述对话意图至少包括闲聊意图和教授意 图,其中,所述教授意图是指用户对计算机返回答案的纠正,或者用户对计算机答案表达自 己的观点。5. 根据权利要求1所述的方法,其特征在于,所述询问意图值是指用户对话是问句的概 率。6. 根据权利要求1所述的方法,其特征在于,所述步骤3中,采用下式在历史记录中寻找 当前对话对应的问句:其中,化表示第i条历史对话是当前对话语句对应问句的概率值,D(xi,xt)表示第i条历 史对话与当前对话之间的距离,xt表示当前对话,xi表示第i条历史对话,Ask(xi)表示第i条 历史对话询问意图值的大小,len表示对话历史记录的长度,α,β,丫分别表示权重;S(xi,xt) 表示第i条历史对话与当前对话之间的句间相似度。7. 根据权利要求1所述的方法,其特征在于,所述步骤4中,采用下式来进行多轮自我对 话W获取相关答案集合: 化+1 =尸^,日〇 ,0《i《n 其中,q表示步骤3找到的当前对话对应的问句,a康示第i轮自我对话得到的答案,ao表 示当前对话,F(q,ai)表示通过问句q和当前答案曰1,得到的自我对话下一轮的答案,η为对话 的最多轮数。8. 根据权利要求1所述的方法,其特征在于,所述步骤5中,采用下式来迭代计算每条答 案的权重:其中,W(vj)表示第i条答案的权重,V康示第j条答案,V康示第i条答案,Vk表示第k条答 案,In(vi)是指存在指向第i条答案信息的句子集合,Out(vj)是第j条答案所指向的句子集 合,S(i,j)及S( j,k)表示两个句子的相似程度。9. 根据权利要求1所述的方法,其特征在于,所述步骤5中,当摘要抽取得到的信息数量 较多时,采用句间词向量的相似度对得到的信息进行聚类,将相似度较高的一类信息作为 摘要抽取的内容。
【文档编号】G06F17/30GK106095950SQ201610422829
【公开日】2016年11月9日
【申请日】2016年6月14日 公开号201610422829.X, CN 106095950 A, CN 106095950A, CN 201610422829, CN-A-106095950, CN106095950 A, CN106095950A, CN201610422829, CN201610422829.X
【发明人】陶建华, 杨明浩, 张珂, 那燊若阳, 张大伟, 高廷丽
【申请人】中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1