本发明涉及人工智能领域,尤其涉及智能问答方法与系统。
背景技术:
目前,问答系统能够根据用户所提问题,在知识库中查询问句的关键词,从而定位答案的位置。
本发明人在实施本发明的过程中发现,现有技术至少存在以下缺点:
现有技术仅是简单地进行关键字查询,而没有考虑概念与概念之间的联系,因此,现有的智能问答方法提供的答案准确性不高,难有说服力。
技术实现要素:
本发明实施例提出智能问答方法与系统,能够提高智能问答的可靠性,减少客户等待时间,提高客服服务质量。
本发明一方面提供一种智能问答方法,所述方法包括:
当接收到用户输入的问题时,获取所述问题的关键词;
将获取到的所有关键词输入预设的匹配模型,以得到所述问题的实体信息;其中,所述匹配模型为通过语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络所生成;所述实体信息包括实体和属性;
在精确搜索模式下,将所述实体信息作为搜索条件对预先构建的知识图谱进行首次搜索;
当搜索到所述属性的值时,将搜索到的所述属性的值确定为所述问题的答案;
当搜索不到结果时,从所述精确搜索模式进入模糊搜索模式;
在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集;
以所述实体信息作为搜索条件,在所述关联实体集中进行搜索,以获得模糊搜索结果;
根据所述模糊搜索结果获取所述问题的答案。
在一种可选的实施方式中,所述当接收到用户输入的问题时,获取所述问题的关键词,包括:
当接收到用户输入的问题时,基于自然语义理解对所述问题进行关键词提取,以得到提取结果;
采用预设的映射模板获取所述提取结果中的词语的映射词,作为所述问题的关键词;其中,所述映射模板包括若干词语的映射词。
在一种可选的实施方式中,所述方法还包括:
响应于所述匹配模型的预设指令,提取所述语料库中的每一标准文本的关键词;
将所述语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络,以得到所述匹配模型。
在一种可选的实施方式中,所述在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集,包括:
在模糊搜索模式下,根据预设的数量确定所述实体的关系的搜索深度;
将与所述实体通过所述搜索深度内的关系联结的实体确定为关联实体集的实体。
在一种可选的实施方式中,所述根据所述模糊搜索结果获取所述问题的答案,包括:
判断所述搜索结果中是否具有所述属性的值;
当判定所述搜索结果中具有所述属性的值时,将所述搜索结果中的所述属性的值确定为所述问题的答案;
当判定所述搜索结果中没有所述属性的值时,返回搜索失败信息。
本发明另一方面还提供一种智能问答系统,第一获取模块,用于当接收到用户输入的问题时,获取所述问题的关键词;
匹配模块,用于将获取到的所有关键词输入预设的匹配模型,以得到所述问题的实体信息;其中,所述匹配模型为通过语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络所生成;所述实体信息包括实体和属性;
精确搜索模块,用于在精确搜索模式下,将所述实体信息作为搜索条件对预先构建的知识图谱进行首次搜索;
第一确定模块,用于当搜索到所述属性的值时,将搜索到的所述属性的值确定为所述问题的答案;
模式切换模块,用于当搜索不到结果时,从所述精确搜索模式进入模糊搜索模式;
第二确定模块,用于在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集;
模糊搜索模块,用于以所述实体信息作为搜索条件,在所述关联实体集中进行搜索,以获得模糊搜索结果;
第二获取模块,用于根据所述模糊搜索结果获取所述问题的答案。
在一种可选的实施方式中,所述第一获取模块包括:
第一提取单元,用于当接收到用户输入的问题时,基于自然语义理解对所述问题进行关键词提取,以得到提取结果;
第一获取单元,用于采用预设的映射模板获取所述提取结果中的词语的映射词,作为所述问题的关键词;其中,所述映射模板包括若干词语的映射词。
在一种可选的实施方式中,所述系统还包括:
第一提取模块,用于响应于所述匹配模型的预设指令,提取所述语料库中的每一标准文本的关键词;
训练模块,用于将所述语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络,以得到所述匹配模型。
在一种可选的实施方式中,所述第二确定模块包括:
第一确定单元,用于在模糊搜索模式下,根据预设的数量确定所述实体的关系的搜索深度;
第二确定单元,用于将与所述实体通过所述搜索深度内的关系联结的实体确定为关联实体集的实体。
在一种可选的实施方式中,所述第二获取模块包括:
第一判断单元,用于判断所述搜索结果中是否具有所述属性的值;
第三确定单元,用于当判定所述搜索结果中具有所述属性的值时,将所述搜索结果中的所述属性的值确定为所述问题的答案;
返回单元,用于当判定所述搜索结果中没有所述属性的值时,返回搜索失败信息。
相对于现有技术,本发明具有如下突出的有益效果:本发明提供了一种智能问答方法与系统,其中,所述方法通过神经网络的逼近能力和自学习能力,准确快速地从关键词映射到实体、属性和关系,从而减少了用户等待时间,及当搜索到所述属性的值时,将搜索到的所述属性的值确定为所述问题的答案,当搜索不到结果时,从所述精确搜索模式进入模糊搜索模式;在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集,以所述实体信息作为搜索条件,在所述关联实体集中进行搜索,以获得模糊搜索结果;根据所述模糊搜索结果获取所述问题的答案,对不同情况采用不同搜索机制,从而高效地响应用户的提问,通过知识图谱提高智能问答的准确性和客观性,提高了智能客服系统的服务质量,提升了用户体验。
附图说明
图1是本发明提供的智能问答方法的第一实施例的流程示意图;
图2是本发明提供的智能问答系统的第一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,其是本发明提供的智能问答方法的第一实施例的流程示意图,如图1所示,所述方法包括:
步骤s101、当接收到用户输入的问题时,获取所述问题的关键词;
步骤s102、将获取到的所有关键词输入预设的匹配模型,以得到所述问题的实体信息;其中,所述匹配模型为通过语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络所生成;所述实体信息包括实体的主体和属性;
步骤s103、在精确搜索模式下,将所述实体信息作为搜索条件对预先构建的知识图谱进行首次搜索;
步骤s104、当搜索到所述属性的值时,将搜索到的所述属性的值确定为所述问题的答案;
步骤s105、当搜索不到结果时,从所述精确搜索模式进入模糊搜索模式;
步骤s106、在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集;
步骤s107、以所述实体信息作为搜索条件,在所述关联实体集中进行搜索,以获得模糊搜索结果;
步骤s108、根据所述模糊搜索结果获取所述问题的答案。
例如,用户的问题是:甲的身高是多少?从问题中构建实体(a代表),这里是甲这个实体,a的主体为甲和a的属性为身高。a中不用考虑关系。
精确搜索:
用a主体和属性作为搜索条件,如果知识图谱中存在甲这个实体并包含身高这个属性,这样的话就得到了答案。
模糊搜索:
用a主体和属性作为搜索条件,如果知识图谱中存在甲实体但并没有身高属性或如果知识图谱根本不存在甲的实体,那就得通过知识图谱中与a的主体(即甲)相关的实体进行搜索。举例,在知识图谱中通过a的主体乙这个实体(关系为夫妻),但这个实体中没有她老公的身高的属性,继续搜索乙这个实体的主体相关的实体,找到了丙这个实体(这里用b代表,关系为家公),在b的实体中以身高(a的属性)为条件进行搜索,得到了b中有项属性为他儿子的身高为2.2米,通过所述关系推导,甲—(夫妻)—乙—(家公)--丙,推理得出丙为甲的父亲,即其属性“他儿子的身高”为甲的身高。
需要说明的是,知识图谱是结构化的语义知识库,是一个具有属性的实体通过所述关系链接而成的网状知识库。实体之间通过所述关系相互联结,构成网状的知识结构。所述标准文本对应的实体和属性为所述标准文本中根据人工制定的标准所确定。所述语料库包括大量文本数据。所述关键词可以为词向量形式。
即通过神经网络的逼近能力和自学习能力,准确快速地从关键词映射到实体、属性和关系,从而减少了用户等待时间,及当搜索到所述属性的值时,将搜索到的所述属性的值确定为所述问题的答案,当搜索不到结果时,从所述精确搜索模式进入模糊搜索模式;在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集,以所述实体信息作为搜索条件,在所述关联实体集中进行搜索,以获得模糊搜索结果;根据所述模糊搜索结果获取所述问题的答案,对不同情况采用不同搜索机制,从而高效地响应用户的提问,通过知识图谱提高智能问答的准确性和客观性,提高了智能客服系统的服务质量,提升了用户体验。
在一种可选的实施方式中,所述语料库包括目标领域的大量文本数据;其中,所述目标领域为所述问题所属领域。
在一种可选的实施方式中,所述语料库的文本数据为目标领域的文本数据。
本发明还提供了一种智能问答方法的第二实施例,所述方法包括上述智能问答方法的第一实施例中的步骤s101 ̄s108,还进一步限定了:所述当接收到用户输入的问题时,获取所述问题的关键词,包括:
当接收到用户输入的问题时,基于自然语义理解对所述问题进行关键词提取,以得到提取结果;
采用预设的映射模板获取所述提取结果中的词语的映射词,作为所述问题的关键词;其中,所述映射模板包括若干词语的映射词。
需要说明的是,自然语义理解(nlu,naturallanguageunderstanding)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
即通过自然语义理解对所述问题进行关键词提取,提高关键词提取的准确性,进一步提高智能问答的准确性。
需要说明的是,所述映射模板可将词语映射为具有不容易产生歧义、更加精简等更易于搜索的特点的词语;例如,
用户提问:
一汽4s店是不是在天河南路?。
采用映射模板将词语:一汽4s店、是不是、在、天河南路进行映射:
是不是——>是否
在——>位于
需要说明的是,该映射模板仅为示例,本发明不限于该种实施方式。
使用映射模板,将用户的提问中的词语进行映射,以得到词语的映射词,有利于提高后续搜索效率。
本发明还提供了一种智能问答方法的第三实施例,所述方法包括上述智能问答方法的第一实施例中的步骤s101 ̄s108,还进一步限定了:所述方法还包括:
响应于所述匹配模型的预设指令,提取所述语料库中的每一标准文本的关键词;
将所述语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络,以得到所述匹配模型。
本发明还提供了一种智能问答方法的第四实施例,所述方法包括上述智能问答方法的第一实施例中的步骤s101 ̄s108,还进一步限定了:所述在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集,包括:
在模糊搜索模式下,根据预设的数量确定所述实体的关系的搜索深度;
将与所述实体通过所述搜索深度内的关系联结的实体确定为关联实体集的实体。
即通过预设的数量来确定搜索深度,从而确定搜索深度内的关系,避免搜索深度太大而降低响应速度,进一步保证了智能问答的高效率。
本发明还提供了一种智能问答方法的第五实施例,所述方法包括上述智能问答方法的第四实施例中的步骤s101 ̄s108,还进一步限定了:所述根据所述模糊搜索结果获取所述问题的答案,包括:
判断所述搜索结果中是否具有所述属性的值;
当判定所述搜索结果中具有所述属性的值时,将所述搜索结果中的所述属性的值确定为所述问题的答案;
当判定所述搜索结果中没有所述属性的值时,返回搜索失败信息。
即通过反馈模糊搜索结果的信息,提高用户体验。
参见图2,其是本发明提供的智能问答系统的第一实施例的结构示意图,如图2所示,所述系统包括:
第一获取模块201,用于当接收到用户输入的问题时,获取所述问题的关键词;
匹配模块202,用于将获取到的所有关键词输入预设的匹配模型,以得到所述问题的实体信息;其中,所述匹配模型为通过语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络所生成;所述实体信息包括实体和属性;
精确搜索模块203,用于在精确搜索模式下,将所述实体信息作为搜索条件对预先构建的知识图谱进行首次搜索;
第一确定模块204,用于当搜索到所述属性的值时,将搜索到的所述属性的值确定为所述问题的答案;
模式切换模块205,用于当搜索不到结果时,从所述精确搜索模式进入模糊搜索模式;
第二确定模块206,用于在模糊搜索模式下,确定所述实体的关系,并根据与所述实体通过所述关系联结的实体确定关联实体集;
模糊搜索模块207,用于以所述实体信息作为搜索条件,在所述关联实体集中进行搜索,以获得模糊搜索结果;
第二获取模块208,用于根据所述模糊搜索结果获取所述问题的答案。
在一种可选的实施方式中,所述语料库包括目标领域的大量文本数据;其中,所述目标领域为所述问题所属领域。
在一种可选的实施方式中,所述语料库的文本数据为目标领域的文本数据。
在一种可选的实施方式中,所述第一获取模块包括:
第一提取单元,用于当接收到用户输入的问题时,基于自然语义理解对所述问题进行关键词提取,以得到提取结果;
第一获取单元,用于采用预设的映射模板获取所述提取结果中的词语的映射词,作为所述问题的关键词;其中,所述映射模板包括若干词语的映射词。
在一种可选的实施方式中,所述系统还包括:
第一提取模块,用于响应于所述匹配模型的预设指令,提取所述语料库中的每一标准文本的关键词;
训练模块,用于将所述语料库中的每一标准文本的所有关键词作为输入、以及所述标准文本的实体信息作为输出训练神经网络,以得到所述匹配模型。
在一种可选的实施方式中,所述第二确定模块包括:
第一确定单元,用于在模糊搜索模式下,根据预设的数量确定所述实体的关系的级数,作为搜索深度;
第二确定单元,用于将与所述实体通过所述搜索深度内的关系联结的实体确定为关联实体集的实体。
在一种可选的实施方式中,所述第二获取模块包括:
第一判断单元,用于判断所述搜索结果中是否具有所述属性的值;
第三确定单元,用于当判定所述搜索结果中具有所述属性的值时,将所述搜索结果中的所述属性的值确定为所述问题的答案;
返回单元,用于当判定所述搜索结果中没有所述属性的值时,返回搜索失败信息。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。
需说明的是,以上所描述的装置或系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。