查询处理方法、装置及电子设备与流程

文档序号：17476398发布日期：2019-04-20 06:09阅读：150来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明实施例涉及计算机技术，尤其涉及一种查询处理方法、装置及电子设备。

背景技术：

随着科学技术的不断发展，越来越多的行业希望借助智能问答来降低运营成本，提升运营效率。例如，智能客服，智能咨询，智能决策等都依赖智能问答能力。因此，如何不断提升智能问答的能力，是研究的热点。

现有技术中，主要通过人工配置模板或者基于自然语言理解的匹配方法实现智能问答。其中，人工配置模板的方法需要由人工为不同表达形式的问题配置回答结果。基于自然语言理解的匹配方法通过对问题进行语义解析，并根据解析结果进行查询，进而得到回答结果。

但是，现有技术的方法均不能同时满足智能问答的高准确率、高召回率以及低成本的要求。

技术实现要素：

本发明实施例提供一种查询处理方法、装置及电子设备，用于解决现有技术中不能同时满足智能问答的高准确率、高召回率以及低成本的要求的问题。

本发明实施例第一方面提供一种查询处理方法，包括：

根据用户输入的查询消息，生成显式查询语句；

若根据所述显式查询语句，在知识图谱中无法得到查询结果，则根据所述查询消息，生成隐式查询矩阵；

在知识集合中匹配所述隐式查询矩阵对应的查询结果，所述知识集合中包括所述知识图谱；

向用户输出所述查询结果。

进一步的，所述在知识集合中匹配所述隐式查询矩阵对应的查询结果，包括：

根据所述知识集合所包括的所述知识图谱以及所述知识集合所包括的所述知识图谱之外的数据，生成所述知识集合对应的隐式表达矩阵，所述隐式表达矩阵用于表征所述知识集合；

对所述隐式表达矩阵和所述隐式查询矩阵进行匹配处理，得到所述隐式查询矩阵对应的查询结果。

进一步的，所述对所述隐式表达矩阵和所述隐式查询矩阵进行匹配处理，包括：

将所述隐式表达矩阵和所述隐式查询矩阵输入第一模型，由所述第一模型对所述隐式表达矩阵和所述隐式查询矩阵进行匹配处理，所述第一模型为基于交互的神经网络模型或者基于注意力机制的神经网络模型。

进一步的，所述根据用户输入的查询消息，生成显式查询语句，包括：

基于预设的规则信息，对用户输入的查询消息进行解析，得到所述显式查询语句，所述规则信息用于表征自然查询语言映射至知识图谱的规则。

进一步的，所述根据用户输入的查询消息，生成显式查询语句，包括：

将所述用户输入的查询消息输入第二模型，得到由所述第二模型输出的所述显式查询语句。

进一步的，所述根据用户输入的查询消息，生成显式查询语句之后，还包括：

使用所述显式查询语句，在所述知识图谱对应的数据库进行查询。

进一步的，所述若根据所述显式查询语句，在知识图谱中无法得到查询结果，则根据所述查询消息，生成隐式查询矩阵之前，还包括：

若根据所述显式查询语句，在知识图谱中查询到查询结果，则将在所述知识图谱中查询到的查询结果作为向用户输出的查询结果。

本发明实施例第二方面提供一种查询处理装置，包括：

第一生成模块，用于根据用户输入的查询消息，生成显式查询语句；

第二生成模块，用于在根据所述显式查询语句，在知识图谱中无法得到查询结果时，根据所述查询消息，生成隐式查询矩阵；

匹配模块，用于在知识集合中匹配所述隐式查询矩阵对应的查询结果，所述知识集合中包括所述知识图谱；

输出模块，用于向用户输出所述查询结果。

进一步的，所述匹配模块，包括：

生成单元，用于根据所述知识集合所包括的所述知识图谱以及所述知识集合所包括的所述知识图谱之外的数据，生成所述知识集合对应的隐式表达矩阵，所述隐式表达矩阵用于表征所述知识集合；

匹配单元，用于对所述隐式表达矩阵和所述隐式查询矩阵进行匹配处理，得到所述隐式查询矩阵对应的查询结果。

进一步的，所述匹配单元具体用于：

进一步的，所述第一生成模块，包括：

第一解析单元，用于基于预设的规则信息，对用户输入的查询消息进行解析，得到所述显式查询语句，所述规则信息用于表征自然查询语言映射至知识图谱的规则。

进一步的，所所述第一生成模块，还包括：

第二解析单元，用于将所述用户输入的查询消息输入第二模型，得到由所述第二模型输出的所述显式查询语句。

进一步的，还包括：

查询模块，用于使用所述显式查询语句，在所述知识图谱对应的数据库进行查询。

进一步的，还包括：

确定模块，用于在根据所述显式查询语句，在知识图谱中查询到查询结果时，将在所述知识图谱中查询到的查询结果作为向用户输出的查询结果。

本发明实施例第三方面提供一种电子设备，包括：

存储器，用于存储程序指令；

处理器，用于调用并执行所述存储器中的程序指令，执行上述第一方面所述的方法步骤。

本发明实施第四方面提供一种可读存储介质，其特征在于，所述可读存储介质中存储有计算机程序，所述计算机程序用于执行上述第一方面所述的方法。

本发明实施例所提供的查询处理方法、装置及电子设备，当无法在结构化的知识图谱中查询到查询结果时，可以生成隐式查询矩阵并在知识集合中匹配该隐式查询矩阵的查询结果，由于该知识集合包含了行业中的完整的知识，因此，基于该知识集合进行查询，可以极大提升查询的准确率和召回率，同时，本发明实施例可以基于预先构建好的知识集合自动完成，因此，可以极大降低智能问答的成本。因此，本发明实施例能够同时满足智能问答的高准确率、高召回率以及低成本的要求。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的查询处理方法的流程示意图；

图2为本发明实施例提供的查询处理方法的流程示意图；

图3为本发明实施例提供的查询处理方法的流程示意图；

图4为本发明实施例提供的查询处理方法的流程示意图；

图5为本发明实施例提供的查询处理装置实施例一的模块结构图；

图6为本发明实施例提供的查询处理装置实施例二的模块结构图；

图7为本发明实施例提供的查询处理装置实施例三的模块结构图；

图8为本发明实施例提供的查询处理装置实施例四的模块结构图；

图9为本发明实施例提供的查询处理装置实施例五的模块结构图；

图10为本发明实施例提供的查询处理装置实施例六的模块结构图；

图11为本发明实施例提供的一种电子设备的实体框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在智能问答领域，使用人工配置模板的方法，其准确率较高，但同时成本也过高。使用基于自然语言理解的匹配方法，虽然具有低成本的优点，但是该方法在满足召回率时，无法达到较高的准确率，在满足准确率时，可能又无法满足召回率。其中，该召回率是指能够正常反馈查询结果的概率。因此，使用现有的方法，均无法满足智能问答的高准确率、高召回率以及低成本的要求。

本发明实施例所提供的方案，旨在解决上述问题。

本发明实施例的方法可以应用于各种行业的智能问答场景。对于一个特定的行业，在使用本发明实施例的方法实现智能问答之前，已经预先建立好该行业的行业知识集合集合。该知识集合基于预设的行业知识集合建立，所建立的该知识集合的结构与该知识集合的结构一致。图1为本发明实施例所涉及的行业知识集合的结构示意图，如图1所示，该行业知识集合为层次化的知识集合，该行业知识集合从下至上可以包括知识图谱层、图谱外延层、规则/决策/过程层、常见问题(frequentlyaskedquestions，简称faq)层以及知识参数(parameter，简称para)层。其中，知识图谱层为结构化符号化描述的知识图谱，行业知识中能够使用结构化符号化描述的知识均可包含在这一层。在知识图谱之上可以建立各种知识外延，该知识外延可以通过图谱外延层、规则/决策/过程层、faq层以及知识para层来表示。其中，图谱外延层，可以包括实体关联的图片，实体关联的评论信息以及实体关联的服务信息等。在图谱外延层之上的规则/决策/过程层，可以完成行业知识的推理计算。在规则/决策/过程层之上的faq层，可以通过键值-数值(key-value，简称kv)的形式表达行业知识。在faq层之上的知识para层，可以通过文本段落来表达行业知识。

本发明实施例所涉及的上述行业知识集合，在将行业知识以层次化的知识表示的同时，还形成以知识图谱为核心的知识集合。即利用知识图谱的表达方式丰富并增强规则/决策/过程，以及faq和知识para的表达能力，将符号化和非符号化的知识表达进行了融合。相应的，本发明实施例所基于的知识集合也具有如上的特点。

示例性的，对于一个传统的知识para段落，将其应用到智能化的应用中，其表示形式为n(n为大于0的整数)维的知识词嵌入(wordembedding)向量。在结合了知识图谱的知识化理解后的标示形式为n+m维(m为大于0的整数)的知识向量。其中的n为原始的词嵌入，m为知识图谱的知识嵌入。该n+m维向量，在具体的应用过程中再通过多层神经网络组成的知识学习，可以形成一个融合了文字和知识的表达向量r。

本发明实施例的下述方案，基于上述的行业知识集合集合来执行。

图2为本发明实施例提供的查询处理方法的流程示意图，该方法的执行主体可以为具有处理能力的电子设备。如图2所示，该方法包括：

s201、根据用户输入的查询消息，生成显式查询语句。

可选的，在一个特定行业中，当用户需要查询行业知识时，用户可以首先输入查询消息，该查询消息可以是语音消息，也可以是文本消息，本发明实施例对此不做具体限定。

进而，在接收到用户输入的查询消息之后，可以根据该查询消息生成显式查询语句。

可选的，上述显式查询语句例如可以是gremlin语句或者lambda表达式等。

其中，gremlin是一种图遍历语言，具体为一种函数式数据流原，可以使得用户使用简洁的方式表示复杂的属性图的遍历或查询。每个gremlin遍历由一系列步骤组成，每一步都在数据流上执行一个原子操作。

lambda表达式为一个匿名函数，即没有函数名的函数，具体可以包括语句lambda以及表达式lambda。

s202、若根据上述显式查询语句，在知识图谱中无法得到查询结果，则根据上述查询消息，生成隐式查询矩阵。

如上述图1所示，在发明实施例所基于的行业知识集合集合中，知识图谱为基础的低层。当根据用户的查询消息生成显式查询语句之后，首先使用该显式查询语句查询知识图谱。在具体实施过程中，知识图谱可以由s-p-o三元组，s-s关联关系，s-s概念上下位关系的图谱化形式存储。相应的，可以使用上述显式查询语句，基于图检索和/或计算推理引擎等，对知识图谱进行查询。

在一种可选的实施方式中，知识图谱可以保存在数据库中，则可以使用上述显式查询语句，在知识图谱对应的数据库中进行查询。

使用知识图谱所表示的行业知识属于显式的表达方式，如果基于这种显式表达方式能够查询出查询结果，则该查询结果的准确率必然较高。因此，作为一种可选的实施方式，如果能够在知识图谱中得到查询结果，则可以直接将在知识图谱中查询到的查询结果作为向用户输出的查询结果，而不再执行后续的处理过程。

而在本步骤中，如果根据上述显式查询语句在知识图谱中无法得到查询结果，则可以根据上述查询消息，生成隐式查询矩阵。

其中，上述隐式查询矩阵是指通过矩阵的形式来表达查询语句，由于显式查询语句可以看作是一种显式的查询语句，因此，通过矩阵形式来表达的查询语句可以看作是隐式的表达形式，即可以称为隐式查询矩阵。

一种可选方式中，可以通过对用户输入的查询消息进行查询知识化解析，得到上述隐式查询矩阵。

另一种可选方式中，可以通过对用户输入的查询消息进行查询嵌入(query-embedding)，得到上述隐式查询矩阵。

s203、在知识集合中匹配上述隐式查询矩阵对应的查询结果，上述知识集合中包括上述知识图谱。

其中，该知识集合为具有上述图1所示的结构的行业知识集合，该知识集合中包括了一个行业的较为完整的知识，即在该知识集合中，除了包括由知识图谱所表示的结构化的知识，还包括自有文本、图片等其他表示形式的知识，这些多种表示形式所表示的知识共同构成了一个行业的知识集合。因此，在该知识集合中匹配上述隐式查询矩阵对应的查询结果，能够极大提升查询的准确率以及召回率。

s204、向用户输出上述查询结果。

可选的，可以使用与用户输入方式一致的方式向用户输出查询结果。示例性的，用户输入的为语音消息，则可以通过语音方式向用户播放上述查询结果。

本实施例中，当无法在结构化的知识图谱中查询到查询结果时，可以生成隐式查询矩阵并在知识集合中匹配该隐式查询矩阵的查询结果，由于该知识集合包含了行业中的完整的知识，因此，基于该知识集合进行查询，可以极大提升查询的准确率和召回率，同时，本发明实施例可以基于预先构建好的知识集合自动完成，因此，可以极大降低智能问答的成本。因此，本发明实施例能够同时满足智能问答的高准确率、高召回率以及低成本的要求。

在上述实施例的基础上，本实施例涉及在上述知识集合中匹配上述隐式查询矩阵对应的查询结果的过程。

图3为本发明实施例提供的查询处理方法的流程示意图，如图3所示，上述步骤s203的一种可选实施方式包括：

s301、根据上述知识集合所包括的上述知识图谱以及上述知识集合所包括的上述知识图谱之外的数据，生成上述知识集合对应的隐式表达矩阵，该隐式表达矩阵用于表征上述知识集合。

其中，上述知识图谱之外的数据，是指上述图1中除知识图谱外的任意一层或多层知识表示方式。在具体实施过程中，针对一个特定的行业，其行业知识集合可以使用图1所示的所有层进行表示，或者，也可以选择知识图谱以及其余部分中的一部分层进行表示，本发明实施例对此不做具体限定。

在一种可选的实施方式中，可以将知识图谱以及知识图谱之外的数据进行联合表示学习，从而得到上述知识集合的隐式表达矩阵。通过该隐式表达矩阵所表达的知识，能够极大优化数据的语义表达能力。

s302、对上述隐式表达矩阵和上述隐式查询矩阵进行匹配处理，得到上述隐式查询矩阵对应的查询结果。

在一种可选的实施方式中，可以将上述隐式表达矩阵和上述隐式查询矩阵输入第一模型，由上述第一模型对上述隐式表达矩阵和上述隐式查询矩阵进行匹配处理，上述第一模型为基于交互的神经网络模型或者基于注意力机制的神经网络模型。

可选的，上述第一模型可以为神经网络模型。

可选的，上述第一模型可以将经过表示学习进行优化过的隐式表达矩阵，以及隐式查询矩阵进行神经网络层面的匹配。上述第一模型可以是基于交互的神经网络模型(kb-awareinterationnet)或者是基于注意力机制的神经网络模型(kb-awareattentionnet)。

其中，上述基于交互的神经网络模型使用多阶段匹配的方法，每个阶段中，使用每个待匹配的矩阵中的一部分进行匹配，进而，基于该阶段的匹配结果进行下一阶段的匹配。

其中，基于注意力机制的神经网络模型在匹配时，将两个待匹配矩阵中的不同重点片段分别进行匹配，该重点片段可以指矩阵中的一部分。

在上述实施例的基础上，本实施例涉及生成显式查询语句的过程。

图4为本发明实施例提供的查询处理方法的流程示意图，如图4所示，上述步骤s201的一种可选实施方式包括：

s401、基于预设的规则信息，对用户输入的查询消息进行解析。

s402、得到上述显式查询语句。

其中，上述规则信息用于表征自然查询语言映射至知识图谱的规则。

其中，上述自然查询语言可以指用户使用自然语言所表达的查询信息。例如用户说出或写出的一个问题等。

示例性的，用户说出语句“张三今年多大了”，该语句即为以个自然查询语言。

可选的，上述规则信息可以基于对大规模用户行为或者自有用户行为数据进行挖掘来产生。示例性的，对于海量用户查询同一个问题所使用的不同表达形式，挖掘出这一问题对应的规则信息。

进而，在本实施例中，基于上述规则信息，可以直接将用户输入的查询消息解析为形式化的查询语句。

上述规则信息基于自动挖掘过程得到，不需要任何人工配置行为。

另一实施例中，上述步骤s201的另一种可选实施方式包括：

将上述用户输入的查询消息输入第二模型，得到由上述第二模型输出的上述显式查询语句。

可选的，上述第二模型可以为神经网络模型。

可选的，上述第二模型可以预先训练完成，以使得该第二模型具有将自然语言解析为显式查询语句的能力。进而，在本实施例中，通过该第二模型可以直接得到查询消息所对应的显式查询语句。

本实施例中，仅通过第二模型即可完成从自然语言到显式查询语句的转化，而无需依赖任何的规则，从而实现了不基于规则也可以完成形式化解析。

图5为本发明实施例提供的查询处理装置实施例一的模块结构图，如图5所示，该装置包括：

第一生成模块501，用于根据用户输入的查询消息，生成显式查询语句。

第二生成模块502，用于在根据所述显式查询语句，在知识图谱中无法得到查询结果时，根据所述查询消息，生成隐式查询矩阵。

匹配模块503，用于在知识集合中匹配所述隐式查询矩阵对应的查询结果，所述知识集合中包括所述知识图谱。

输出模块504，用于向用户输出所述查询结果。

图6为本发明实施例提供的查询处理装置实施例二的模块结构图，如图6所示，匹配模块503，包括：

生成单元5031，用于根据所述知识集合所包括的所述知识图谱以及所述知识集合所包括的所述知识图谱之外的数据，生成所述知识集合对应的隐式表达矩阵，所述隐式表达矩阵用于表征所述知识集合。

匹配单元5032，用于对所述隐式表达矩阵和所述隐式查询矩阵进行匹配处理，得到所述隐式查询矩阵对应的查询结果。

另一实施例中，匹配单元5032具体用于：

图7为本发明实施例提供的查询处理装置实施例三的模块结构图，如图7所示，第一生成模块501，包括：

第一解析单元5011，用于基于预设的规则信息，对用户输入的查询消息进行解析，得到所述显式查询语句，所述规则信息用于表征自然查询语言映射至知识图谱的规则。

图8为本发明实施例提供的查询处理装置实施例四的模块结构图，如图8所示，第一生成模块501，还包括：

第二解析单元5012，用于将所述用户输入的查询消息输入第二模型，得到由所述第二模型输出的所述显式查询语句。

图9为本发明实施例提供的查询处理装置实施例五的模块结构图，如图9所示，上述装置还包括：

查询模块505，用于使用所述显式查询语句，在所述知识图谱对应的数据库进行查询。

图10为本发明实施例提供的查询处理装置实施例六的模块结构图，如图10所示，上述装置还包括：

确定模块506，用于在根据所述显式查询语句，在知识图谱中查询到查询结果时，将在所述知识图谱中查询到的查询结果作为向用户输出的查询结果。

图11为本发明实施例提供的一种电子设备的实体框图，如图11所示，该电子设备包括：

存储器1101，用于存储程序指令。

处理器1102，用于调用并执行存储器1101中的程序指令，执行上述方法实施中所述的方法步骤。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋勋超;施文祥;张一麟;朱勇
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：一种烟气分布器的制作方法
上一篇：一种风力机翼段防除冰测试方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。