基于上下文进行意图识别的方法和系统的制作方法

文档序号：9235410阅读：1352来源：国知局

基于上下文进行意图识别的方法和系统的制作方法
【技术领域】
[0001] 本发明设及人工智能领域，特别设及基于上下文进行意图识别的方法和系统。
【背景技术】
[0002] 意图识别是识别一种行为的意图。例如，在问答对话中，提问者每句话都带有一定的意图，应答方根据对方的意图进行回答。
[0003] 相关问题在捜索引擎、聊天机器人等场景下有广泛的应用。尤其在聊天机器人中，意图识别是整个系统的核屯、模块。在回答用户的问题时，就是通过分析用户意图，在了解用户想问什么之后给出相应的答案。
[0004] 现有技术中进行意图识别的方法主要是获取一批数据，然后对每条数据的意图进行人工标注，从而得到训练数据。通过训练数据结合特定的算法训练出模型，并使用所得到的模型对新的语料进行意图识别。然而，当前意图识别大多是基于单句对话的，但是人的对话都是在一定的上下文中进行的，同一句话在不同的上下文中可能表述的意思完全不一样。如果仅仅使用单句进行意图识别完全违背了自然语言的形式，很多意图是无法区分出来的。
[0005] 例如，在京东客服日常咨询的问题中有售后运费（退货产生的费用）和售前运费 (商家寄给客户商品产生的费用）两种。如果用户询问"运费谁出"，仅仅根据该句话无法区分用户是咨询售前运费还是售后运费。当将该句话放到上下文场景中时就很容易区分：如果用户先咨询"我要退货"，再问"运费谁出"，很明显是售后运费；如果先咨询"现在下单什么时候到"，再问"运费谁出"，则是售前运费。
[0006] 由此，可W看到仅仅根据单句的信息进行意图识别存在一些缺陷。一方面，在对训练语料进行人工标注时无法区分很多问题中用户的真实意图，导致不同人标注的结果不一样，从而影响训练数据质量。另一方面，训练出来的模型对同样的话预测的意图永远是一致的，不会根据不同的上下文变化，从而导致预测错误。
[0007] 因此，需要一种能够基于上下文进行意图识别的方法和系统。

【发明内容】

[000引根据本发明的一个实施例，提供了一种基于上下文进行意图识别的方法，包括：基于用户历史咨询日志，对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注；对每一个问题执行特征提取，W生成训练语料；根据监督学习算法，对所生成的训练语料进行模型训练，W获得训练模型；W及基于所获得的训练模型，对当前的问题进行预估并获得预估后的用户意图识别结果。
[0009] 优选地，对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注进一步包括；按照会话对所获取的用户历史咨询日志进行划分，并逐句对所述用户历史咨询日志进行人工标注。
[0010] 优选地，对所生成的训练语料进行模型训练进一步包括：对每一个问题添加上文意图分类信息；提取每一个问题的位置信息；w及将每一个问题转化为特征向量作为所述训练语料。
[0011] 优选地，对所生成的训练语料进行模型训练进一步包括：对特征提取后的所有数据进行分词，并根据增益来获取增益最大的预定数目个分词作为特征词典；基于所述特征词典，将每个训练数据转化为训练向量；W及将所述训练向量作为所述监督学习算法的输入，执行所述监督学习算法W获得训练模型。
[0012] 优选地，对当前的问题进行预估进一步包括；获取当前问题和用户信息；根据用户ID获取用户的历史信息，得到本句问题在会话中的位置信息W及上文意图分类信息；对所述当前问题执行特征提取W获得特征向量；W及基于训练模型，输入所述特征向量W获得对当前的问题的预估结果。
[0013]根据本发明的另一个实施例，提供了一种基于上下文进行意图识别的系统，包括：人工标注模块，所述人工标注模块被配置成基于用户历史咨询日志，对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注；特征提取模块，所述特征提取模块被配置成对每一个问题执行特征提取，W生成训练语料；模型训练模块，所述模型训练模块被配置成根据监督学习算法，对所生成的训练语料进行模型训练，W获得训练模型；W及线上预估模块，所述线上预估模块被配置成基于所获得的训练模型，对当前的问题进行预估并获得预估后的用户意图识别结果。
[0014]优选地，所述人工标注模块进一步被配置成按照会话对所获取的用户历史咨询日志进行划分，并逐句对所述用户历史咨询日志进行人工标注。
[0015]优选地，所述特征提取模块进一步被配置成；对每一个问题添加上文意图分类信息；提取每一个问题的位置信息；W及将每一个问题转化为特征向量作为所述训练语料。
[0016]优选地，所述模型训练模块进一步被配置成：对特征提取后的所有数据进行分词，并根据增益来获取增益最大的预定数目个分词作为特征词典；基于所述特征词典，将每个训练数据转化为训练向量；W及将所述训练向量作为所述监督学习算法的输入，执行所述监督学习算法W获得训练模型。
[0017]优选地，所述线上预估模块进一步被配置成；获取当前问题和用户信息；根据用户ID获取用户的历史信息，得到本句问题在会话中的位置信息W及上文意图分类信息；对所述当前问题执行特征提取W获得特征向量；W及基于训练模型，输入所述特征向量W获得对当前的问题的预估结果。
[001引根据本公开和附图的下面的详细描述，对本领域的普通技术人员来说其它的目的、特征、W及优点将是显而易见的。
【附图说明】
[0019]附图图示了本发明的实施例，并与说明书一起用于解释本发明的原理。在附图中：
[0020] 图1图示了根据本发明实施例的基于上下文进行意图识别的系统的示意图。
[0021] 图2图示了根据本发明实施例的人工标注模块的处理流程图。
[0022] 图3图示了根据本发明实施例的特征提取模块的处理流程图。
[0023]图4图示了根据本发明实施例的模型训练模块的处理流程图。
[0024] 图5图示了根据本发明实施例的线上预估模块的处理流程图。
【具体实施方式】
[0025] 根据本发明的实施例公开了一种基于上下文进行意图识别的方法和系统。在W下描述中，为了说明的目的，阐述了多个具体细节W提供对本发明的实施例的全面理解。然而，对于本领域技术人员显而易见的是，本发明的实施例可W在没有该些具体细节的情况下实现。
[0026] 如在此所使用的术语"机器学习"是一口人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。常见的机器学习方法可W分为监督学习、半监督学习和无监督学习。
[0027] 如在此所使用的术语"监督学习"指的是从给定的训练数据集中学习出一个函数，当新的数据到来时，可W根据该个函数预测结果。监督学习的训练集要求是包括输入和输出，也可W说是特征和目标。训练集中的目标是人工标注的。
[002引如在此所使用的术语"词袋"是一种文本表示方法。例如假定存在W下一个词典；（"John":1, "1 ikes":2, "to":3, "watch":4, "movies":5, "also":6, "football":7," games":8, "Mary":9, "too": 10}，并且存在一个文本；"John l;Lkes to watch movies. Mary 1化es too."。在该种情况下，1根据W上词典，可W将该文本转换成如下向量： [1，1，1，1，1，0, 0, 0, 1，1]，其中"1"表示词典中的词出现过，"0"表示没有出现。
[0029] 图1图示了根据本发明实施例的基于上下文进行意图识别的系统100的示意图。如图1所示，基于上下文进行意图识别的系统100包括人工标注模块101、特征提取模块 103、模型训练模块105和线上预估模块107。根据本发明的实施例，人工标注模块101、特征提取模块103和模型训练模块105属于线下模块，用来生成特征词典、模型。线上预估模块107属于线上模块，通过所生成的特征词典、模型对实时问题进行分类评估。下面W京东客服回答用户咨询问题为场景对每个模块进行说明。
[0030] 人工梳注橫块
[0031] 京东客服回答的问题可W分为不同的业务点，用户的每个问题可W对应到该些业务点。该里直接将该些业务点看作用户意图，常见的业务点例如有；退货、换货、配送、运费等。
[003引图2图示了根据本发明实施例的人工标注模块101的处理流程图。如图2所示，人工标注模块101首先获取用户历史咨询日志，并对所获取的用户历史咨询日志按照会话进行划分，然后逐句地对包括在所述用户历史咨询日志中的用户提出的问题进行人工标注。
[0033] 在本发明的实施例中，一个会话是由同一个对话场景中的连续的问题组成。例如，会话划分方法可W如下；将所获取的用户历史咨询日志按照用户咨询时间进行排序，如果咨询的用户或回答问题的客服不同，则将连续的问题划分到不同的会话中。而且，如果用户和客服一致，但相邻两句话的时间间隔大于预定时间（例如，半小时），则也将该对话划分为不同的会话。
[0034] 在用户历史咨询日志按会话划分完成之后，将数据交由人工对每句话进行标注。该样，人工标注过程不再仅根据单句，而是根据该句话在整个会话中的意图进行标注，更准确地说，是根据该句话的上下文进行标注。因为在实际对话时，我们只能获取或知道用户之前所说的话，而无法获取他接下来会说什么。表1示出了在示例场景1的情况下会话标注完成后的效果。
[0035]
[0036] 表1场景1情况下的标注效果
[0037] 可W看出，如果使用单句标注的方案，"运费谁出"是无法区分出用户咨询的是售前还是售后运费。同样，"可W寄邮政吗"也无法区分出是发货方式还是退货方式。然而，例如W上的该两句话放在整个会话中看是没有任何歧义的。
[00%] 特佈摇取橫块
[0039] 图3图示了根据本发明实施例的特征提取模块103的处理流程图。如图3所示，特征提取模块103被配置成对每一个问题执行特征提取，W生成训练语料。具体地，特征提取模块103首先针对每句话或每个问题添加上文意图分类信息，提取每句话或每个问题的位置信息，并将每一个问题转化为特征向量作为所述训练语料。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘佳;俞晓光;
技术所有人：北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司;
我是此专利的发明人

上一篇：品牌情绪的确定方法和装置的制造方法
上一篇：一种对信息进行处理的方法及装置的制造方法

该领域下的技术专家

如您需求助技术专家，请点此查看客服电话进行咨询。

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

如您是高校老师，可以点此联系我们加入专家库。

相关技术

一种对信息进行处理的方法及装...
一种安卓智能终端网页业务识别...
产品特征标签的提取方法及装置...
版式电子文档的页眉页脚识别方...
用户意图识别方法及装置的制造...
以矩阵为中心的分布式计算框架...
一种拍照分类处理的方法、装置...
一种基于深度学习的云服务性能...
一种具有多处理器和共用外存储...
一种多功能触摸屏数学式计算器...

网友询问留言已有0条留言

还没有人留言评论。精彩留言会获得点赞！

1

精彩留言，会给你点赞！

上下文感知推荐系统相关技术
基于群智感知网络的小区路径地图形成系统和方法
一种基于上下文感知的音乐推荐方法及装置的制造方法
用于感知情境并推荐信息的电子计算装置及其方法
用于感知情境并推荐信息的电子计算装置及其方法
上下文感知邻近服务的制作方法
一种基于收听上下文的音乐推荐方法
上下文内容翻译系统的制作方法
数据交换层上的上下文感知网络的制作方法
一种基于体域网的心电感知诊断系统的制作方法
基于上下文感知的重复数据删除的方法和装置的制造方法
系统上下文相关技术
基于群智感知网络的小区路径地图形成系统和方法
一种基于上下文感知的音乐推荐方法及装置的制造方法
运动耳机的应用操作切换方法及系统的制作方法
一种移动终端及其操作系统切换的方法
一种操作模式切换系统及方法
上下文感知邻近服务的制作方法
一种基于收听上下文的音乐推荐方法
上下文内容翻译系统的制作方法
数据交换层上的上下文感知网络的制作方法
用户词语和用户动作的上下文关系预测的制作方法
系统上下文图相关技术
长寿命的上下文交互的系统和方法
用于共享公共pdp上下文的系统和方法
分散系统和上下文对应中间链接方法
发送分组流上下文状态信息的方法及系统的制作方法
一种无线通信系统中ak上下文缓存的方法
用于认证上下文转移的系统和方法
会话上下文的处理方法、装置和系统的制作方法
用于管理上下文的方法、系统和装置的制作方法
一种协商启用安全上下文的方法和系统的制作方法
基于上下文和群组组合的视频推荐方法及系统的制作方法
软件系统上下文定义相关技术
用于显示上下文敏感注释的系统和方法
基于软件定义网络的访问控制列表运行系统和方法
基于上下文进行意图识别的方法和系统的制作方法
软件定义联网灾难恢复的方法和系统的制作方法
一种软件定义的分布式无线系统及其上行数据通信方法
一种软件定义的分布式无线系统的制作方法
一种软件定义的分布式无线系统及其下行数据通信方法
基于分类模型的上下文识别的方法和系统的制作方法
提供同义词的上下文验证的方法和系统的制作方法
用于rfid系统的基于上下文相关的安全访问控制方法
查看系统的安全上下文相关技术
基于上下文的安全计算的制作方法
用于共享公共pdp上下文的系统和方法
分散系统和上下文对应中间链接方法
发送分组流上下文状态信息的方法及系统的制作方法
用于认证上下文转移的系统和方法
会话上下文的处理方法、装置和系统的制作方法
用于管理上下文的方法、系统和装置的制作方法
一种协商启用安全上下文的方法和系统的制作方法
基于上下文和群组组合的视频推荐方法及系统的制作方法
用于安全扩增现实应用的基于上下文的管理的制作方法
系统上下文切换相关技术
具有上下文交互机制的计算系统及其操作方法
基于上下文进行意图识别的方法和系统的制作方法
提供同义词的上下文验证的方法和系统的制作方法
长寿命的上下文交互的系统和方法
一种零拷贝接收报文的方法和系统的制作方法
发送分组流上下文状态信息的方法及系统的制作方法
基于上下文和群组组合的视频推荐方法及系统的制作方法
上下文重用的方法及系统的制作方法
Eps承载上下文状态的同步方法及系统的制作方法
上下文相关的web页面系统和方法
系统上下文关系图相关技术
长寿命的上下文交互的系统和方法
用于共享公共pdp上下文的系统和方法
分散系统和上下文对应中间链接方法
发送分组流上下文状态信息的方法及系统的制作方法
一种无线通信系统中ak上下文缓存的方法
用于认证上下文转移的系统和方法
会话上下文的处理方法、装置和系统的制作方法
用于管理上下文的方法、系统和装置的制作方法
一种协商启用安全上下文的方法和系统的制作方法
虚拟区域上下文中的基于关系的在场指示的制作方法