基于卷积神经网络的信息检索方法、及其相关设备与流程

文档序号:19991535发布日期:2020-02-22 02:20阅读:200来源:国知局
基于卷积神经网络的信息检索方法、及其相关设备与流程

本发明涉及大数据技术领域,尤其涉及一种基于卷积神经网络的信息检索方法、及其相关设备。



背景技术:

传统的信息检索方法主要基于关键词对信息进行检索或者基于互联网表格,通过搜索引擎进行检索,但这两种方法都存在缺陷,其中,基于关键词对信息进行检索的方法命中率较低,其搜索引擎的关键词检索需要大量语料,在许多场景下,小规模或中等规模的语料难以达到理想的效果;而基于互联网表格,通过搜索引擎进行检索的方法存在精确度不高、性能欠佳的问题;从而导致用户无法根据传统的信息检索方法准确查询到对应的信息,进一步影响用户的工作效率。



技术实现要素:

本发明实施例提供一种基于卷积神经网络的信息检索方法、及其相关设备,以解决传统的信息检索方法准确性不高,导致用户无法准确查询信息,进而影响工作效率的问题。

一种基于卷积神经网络的信息检索方法,包括:

从预设数据库中获取查询用户输入的查询语句;

对所述查询语句进行分词处理,得到目标分词;

应用预先训练好的意图模型对所述目标分词进行意图识别,得到意图识别结果;

将所述意图识别结果与预设模型库中的标识信息进行匹配,其中,所述预设模型库包含不同的标识信息及标识信息对应的语义槽模型;

若匹配到与所述意图识别结果相应的标识信息,则从预设模型库中选取所述标识信息对应的语义槽模型对所述目标分词进行语义槽类型识别,得到槽位识别结果;

根据所述意图识别结果与所述槽位识别结果,确定查询对象;

从查询数据库中获取所述查询对象对应的查询结果,并将所述查询结果发送给所述查询用户。

一种基于卷积神经网络的信息检索装置,包括:

获取模块,用于从预设数据库中获取查询用户输入的查询语句;

分词模块,用于对所述查询语句进行分词处理,得到目标分词;

意图识别模块,用于应用预先训练好的意图模型对所述目标分词进行意图识别,得到意图识别结果;

匹配模块,用于将所述意图识别结果与预设模型库中的标识信息进行匹配,其中,所述预设模型库包含不同的标识信息及标识信息对应的语义槽模型;

槽位识别模块,用于若匹配到与所述意图识别结果相应的标识信息,则从预设模型库中选取所述标识信息对应的语义槽模型对所述目标分词进行语义槽类型识别,得到槽位识别结果;

确定模块,用于根据所述意图识别结果与所述槽位识别结果,确定查询对象;

发送模块,用于从查询数据库中获取所述查询对象对应的查询结果,并将所述查询结果发送给所述查询用户。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于卷积神经网络的信息检索方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于卷积神经网络的信息检索方法的步骤。

上述基于卷积神经网络的信息检索方法、装置、计算机设备及存储介质,通过对查询语句进行分词处理得到目标分词,利用预先训练好的意图模型对目标分词进行意图识别,将识别后得到的意图识别结果与预设模型库中的标识信息进行匹配,选取匹配成功的标识信息对应的语义槽模型对目标分词进行语义槽类型识别,得到槽位识别结果,根据意图识别结果与槽位识别结果确定查询对象,最后获取查询对象对应的查询结果发送给查询用户。从而实现根据查询语句自动反馈查询结果,通过结合意图识别与槽位识别的方式,能够准确获取查询对象,提高信息查询的准确性,进一步提高用户的工作效率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于卷积神经网络的信息检索方法的流程图;

图2是本发明实施例提供的基于卷积神经网络的信息检索方法中步骤s2的流程图;

图3是本发明实施例提供的基于卷积神经网络的信息检索方法中步骤s3的流程图;

图4是本发明实施例提供的基于卷积神经网络的信息检索方法中步骤s31的流程图;

图5是本发明实施例提供的基于卷积神经网络的信息检索方法中在未匹配到与意图识别结果相应的标识信息的情况下进行处理的流程图;

图6是本发明实施例提供的基于卷积神经网络的信息检索方法中在槽位识别结果为识别失败的情况下进行处理的流程图;

图7是本发明实施例提供的基于卷积神经网络的信息检索方法中在根据查询对象从查询库中查询不到查询结果的情况下进行处理的流程图;

图8是本发明实施例提供的基于卷积神经网络的信息检索装置的示意图;

图9是本发明实施例提供的计算机设备的基本机构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请提供的基于卷积神经网络的信息检索方法应用于服务端,服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。在一实施例中,如图1所示,提供一种基于卷积神经网络的信息检索方法,包括如下步骤:

s1:从预设数据库中获取查询用户输入的查询语句。

在本实施例中,通过对预设数据库进行检测,当检测到预设数据库中存在查询语句时,则对查询语句进行提取。其中,预设数据库是指专门用于存储查询用户输入的查询语句的数据库。

需要说明的是,当从预设数据库中获取到查询用户输入的查询语句时,将该查询语句从预设数据库中进行删除处理。

s2:对查询语句进行分词处理,得到目标分词。

在本发明实施例中,通过将查询语句导入到预设分词端口中进行分词处理,得到分词处理后的目标分词。其中,预设分词端口是指专门用于对查询语句进行分词处理的处理端口。

分词处理是指将连续的字序列按照一定的规范重新组合成词序列的过程,例如,将连续的字序列“abcd”通过分词处理得到“ab”和“cd”。

s3:应用预先训练好的意图模型对目标分词进行意图识别,得到意图识别结果。

具体地,通过将目标分词导入到预先训练好的意图模型中进行意图识别,意图模型将根据输入的目标分词直接识别出该目标分词对应的输出结果,并将该输出结果作为意图识别结果。

其中,预先训练好的意图模型是指专门用于对目标分词进行意图识别的卷积神经网络模型。

s4:将意图识别结果与预设模型库中的标识信息进行匹配,其中,预设模型库包含不同的标识信息及标识信息对应的语义槽模型。

具体地,将步骤s3中得到的意图识别结果与预设模型库中的标识信息进行匹配,其中,预设模型库用于存储不同的标识信息,以及标识信息对应的语义槽模型的数据库,并且,不同标识信息对应的语义槽模型也不相同。

需要说明的是,标识信息是指专门用于与意图识别结果进行匹配的标签信息,且不同标识信息对应的不同的语义槽模型。

语义槽模型是指根据用户需求预先训练好用于对目标分词进行语义槽类型识别的卷积神经网络模型,由于语义槽模型是由语义训练样本训练得到,不同语义训练样本训练得到的语义槽模型的识别效果也不同,因此选取与意图识别结果对应的语义槽模型,即选取标识信息对应的语义槽模型对目标分词进行语义槽类型识别,能够保证识别的准确性。

s5:若匹配到与意图识别结果相应的标识信息,则从预设模型库中选取该标识信息对应的语义槽模型对目标分词进行语义槽类型识别,得到槽位识别结果。

在本发明实施例中,根据步骤s4中将意图识别结果与预设模型库中的标识信息进行匹配的方式,若意图识别结果与标识信息相同,则表示意图识别结果与标识信息相匹配,并将目标分词导入到该标识信息对应的语义槽模型中进行语义槽类型识别,语义槽模型将根据输入的目标分词直接识别出目标分词对应的输出结果,并将该输出结果作为槽位识别结果。

例如,预设模型库中存在标识信息分别为“产品种类”、“产品费用”和“产品规格”,其对应的语义槽模型分别为模型a、模型b和模型c,若存在意图识别结果为“产品种类”,将该意图识别结果分别与预设模型库中的标识信息进匹配,得到意图识别结果“产品种类”与标识信息“产品种类”相匹配,故选取标识信息“产品种类”对应的语义槽模型模型a对目标分词进行语义槽类型识别。

s6:根据意图识别结果与槽位识别结果,确定查询对象。

在本发明实施例中,根据意图识别结果,从预设信息库中查询与该意图识别结果相同的描述信息,并获取该描述信息对应的文件列表,将文件列表中的文件标识信息与槽位识别结果进行匹配,选取匹配成功的文件标识信息对应的文件对象作为查询对象。

其中,预设信息库用于存储不同的描述信息、描述信息对应的文件列表,且文件列表包含不同的文件标识信息、文件标识信息对应的文件对象。

例如,若意图识别结果为“产品费用”,槽位识别结果为“产品名称”,预设信息库中存在2个描述信息分别为“产品费用”、“产品质量”,其对应的文件列表为分别为列表a和列表b,列表a包含2个文件标识信息分别为“产品名称”、“产品id”,其对应的文件对象分别为q1和w1;列表b包含2个文件标识信息分别为“产品规格”、“产品产家”,其对应的文件对象分别为q2和w2;通过利用意图识别结果“产品费用”与描述信息进行匹配,获取列表a,再将槽位识别结果“产品名称”与列表a中的文件标识信息进行匹配,获取文件对象q1作为查询对象。

s7:从查询数据库中获取查询对象对应的查询结果,并将查询结果发送给查询用户。

具体地,根据步骤s6得到的查询对象,将查询对象与查询数据库中的查询标识进行匹配,若匹配成功,则获取该查询标识对应的查询结果,并按照预设发送方式将该查询结果发送给查询用户。

其中,查询数据库中包含不同的查询标识及查询标识对应的查询结果。

预设发送方式具体可以是以邮件的形式,也可以根据用户的实际需求进行设置,此处不做限制。

本实施例中,通过对查询语句进行分词处理得到目标分词,利用预先训练好的意图模型对目标分词进行意图识别,将识别后得到的意图识别结果与预设模型库中的标识信息进行匹配,选取匹配成功的标识信息对应的语义槽模型对目标分词进行语义槽类型识别,得到槽位识别结果,根据意图识别结果与槽位识别结果确定查询对象,最后获取查询对象对应的查询结果发送给查询用户。从而实现根据查询语句自动反馈查询结果,通过结合意图识别与槽位识别的方式,能够准确获取查询对象,提高信息查询的准确性,进一步提高用户的工作效率。

在一实施例中,如图2所示,步骤s2中,即对查询语句进行分词处理,得到目标分词包括如下步骤:

s21:对查询语句进行非文字字符滤除处理,得到纯文本。

在本发明实施例中,非文字字符滤除处理是指针对查询语句中的非文字字符进行删除处理,最终只保留文字字符。由于查询语句中可能存在非文字字符,为了避免非文字字符在后续进行分词处理过程中造成干扰,故对查询语句进行非文字字符滤除处理,确保后续分词处理的准确性。

具体地,将查询语句导入到预设滤除端口中进行非文字字符滤除处理,得到处理后的只包含文字字符的文本,即为纯文本。其中,预设滤除端口是指用于对查询语句中的非文字字符进行滤除处理的处理端口。

例如,查询语句为:查询“a类”保险,该查询语句中存在非文字字符“”,将该查询语句导入到预设滤除端口中进行非文字字符滤除处理,得到纯文本,即为:查询a类保险。

s22:通过预设分词词库对纯文本进行分词处理,得到目标分词。

具体地,将预设分词词库中的合法词汇分别与纯文本进行匹配,若匹配到纯文本中存在与合法词汇相同的文字字符,则将该文字字符确定为目标分词,若纯文本中存在与合法词汇不相同的文字字符,则将单个文字字符确定为目标分词。其中,预设分词词库是指专门用于存储不同合法词汇的数据库。

需要说明的是,若涉及到新的保险产品名称,需要预先将此类新的保险名称作为合法词汇加入到预设分词库中,以保证利用预设分词词库进行分词时能够准确分词。

其中,预先新的保险名称作为合法词汇加入到预设分词词库的方法为,当保险公司推出新的保险产品名称时,用户将预先将该新的保险产品名称作为合法词汇发送到预设分词词库,若预设分词词库接收到用户发送的合法词汇,则将该合法词汇添加到预设分词词库中,从而不断完善预设分词词库中的合法词汇,保证利用预设分词词库进分词处理的准确性。

本实施例中,通过对查询语句进行非文字字符滤除处理,得到纯文本,再利用预设分词库对纯文本进行分词处理,得到目标分词。从而实现对查询语句的分词处理,通过进行非文字字符滤除处理能够有效避免非文字字符对分词处理过程造成的干扰,进一步保证分词的准确性,提高后续利用目标分词进行意图识别的准确性。

在一实施例中,如图3所示,意图模型包含输入层、卷积层、池化层和全连接层,步骤s3中,即应用预先训练好的意图模型对目标分词进行意图识别,得到意图识别结果包括如下步骤:

s31:利用输入层对目标分词进行词向量转换处理,得到词向量。

在本发明实施例中,将目标分词导入到意图模型的输入层,输入层在接收到目标分词后,通过word2vec算法对目标分词进行词向量转换处理,得到处理后的词向量。

其中,word2vec算法是指用于对目标分词进行词向量转换的处理算法。

s32:根据卷积层对词向量进行卷积操作,得到特征矩阵。

在本发明实施例中,卷积层包含用户预先设置好的卷积核,根据步骤s31得到的词向量,将词向量导入到卷积层中,卷积层根据预先设置好卷积核对词向量进行卷积操作,通过卷积操作得到对应的特征矩阵。

其中,预先设置好的卷积核是指根据用户实际需求设定用于卷积处理的核函数。

需要说明的是,卷积层中包含第一卷积层、第二卷积层和第三卷积层,其中,第一卷积层包含长度为1的一维卷积核,通道数量为128,第二卷积层和第三卷积层均包含长度为3的一维卷积核,通道数量为384。

s33:利用池化层对特征矩阵进行降维处理,得到目标矩阵。

在本发明实施例中,池化层中包含预设降维函数,根据步骤s32得到的特征矩阵,将该特征矩阵导入到池化层中,池化层在接收到特征矩阵后利用预设降维函数对该特征矩阵进行降维处理,得到处理后的目标矩阵。其中,预设降维函数是指用于对特征进行降维处理的处理函数。

s34:通过全连接层对目标矩阵进行运算处理,得到意图识别结果。

具体地,在全连接层有n个训练好的分类器,将每个分类器均与目标矩阵进行相似度计算,得到目标矩阵属于该分类器对应的行为类别的概率,共得到n个概率,在这n个分类器中,每个分类器都有目标矩阵对应的意图识别结果及意图识别结果对应的概率。并将每个分类器包含的意图识别结果对应的概率进行比较,选取概率最大的分类器对应的意图识别结果进行输出,即输出准确率最高的意图识别结果。

其中,分类器对应的意图识别结果及意图识别结果对应的概率可根据实际需要进行训练,分类器的数量n也可根据需要进行设置,此处不作具体限制,例如,n设置为14。

分类器实现方法包括但不限于:逻辑回归(logisticregression,lr)、支持向量机((supportvectormachine,svm)、交叉熵(corssentropy)和softmax回归等。

优选地,本发明实施例采用softmax回归来实现多个分类器的分类识别。

本实施例中,通过利用预先训练好的意图模型中的输出层、卷积层、池化层和全连接层对目标分词进行一系列处理,得到处理后的意图识别结果。从而实现利用预先训练好的意图模型能够快速准确地识别出目标分词对应的意图识别结果,保证后续利用意图识别结果与槽位识别确定查询对象的准确性。

在一实施例中,如图4所示,步骤s31中,即利用输入层对目标分词进行词向量转换处理,得到词向量包括如下步骤:

s311:基于预设语料库,构建每个目标分词的基础词向量。

具体地,将每个目标分词按照预设语料库映射到一个向量中,将这些向量联系在一起,形成一个词向量空间,每个向量相当于是这个空间中的一个点。其中,预设语料库是指用于构建目标分词对应的基础词向量的数据库。

例如,存在目标分词为:宝马、奔驰,根据预设语料库,获取了这两个目标分词的所有可能分类:“汽车”、“奢侈品”、“动物”、“动作”和“美食”。因此,对这两个目标分词引入一种向量表示:

<汽车,奢侈品,动物,动作,美食>;

根据统计学习的方法计算这两个目标分词属于每个分类的概率,计算机学到的可能是:

宝马=<0.5,0.2,0.2,0.0,0.1>;

奔驰=<0.7,0.2,0.0,0.1,0.0>。

可以理解地,基础词向量的每一维的值代表一个具有一定的语义和语法上能够解释的特征,故可以将基础词向量的每一维称为一个目标分词特征。

进一步地,为每个目标分词均构建关键字词向量,得到基础词向量。

需要说明的是,每个目标分词对应唯一的基础词向量,每个基础词向量对应至少一个目标分词。

通过基于预设语料库,构建每个目标分词的基础词向量,使得将机器无法准确理解的文字转换成了机器容易识别并进行运算的词向量,有利于对用户意图的准确识别。

s312:针对每个基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从空间距离中选取最小值作为该基础词向量的最小空间距离。

具体地,针对每个基础词向量,使用空间距离的计算公式,分别计算该基础词向量与其他所有基础词向量之间的空间距离,并找出这些空间距离的最小值。

按照公式(1)计算基础词向量a(a1,a2,...,an)和基础词向量b(b1,b2,...,bn)之间的空间距离l:

其中,l为空间距离,n为大于或等于2的正整数,bi和ai均为基础词向量。

例如,若基础词向量包含g1(0.9,0.1)、g2(0.5,0.5)和g3(0.8,0.2),针g1,按照公式(1)分别计算g1到g2的空间距离为0.5659,以及g1到g3的空间距离为0.1414,则g1的最小空间距离为0.1414。

s313:将最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为词向量。

具体地,根据步骤s312计算出每个基础词向量的最小空间距离之后,对这些最小空间距离与预设的空间距离阈值进行比较,将最小空间距离小于或等于空间距离阈值的基础词向量作为词向量。其中,预设的空间距离阈值具体可以是0.5,也可以根据用户的实际需求进行设置,此处不做限制。

通过对不符合预设的空间距离阈值要求的基础词向量进行过滤,避免了将用户关注度低的内容也放入词向量,从而可以更准确的确定用户意图。

例如,在一具体实施方式中,预设的空间距离阈值为0.8,基础词向量包括h1(0.9,0.1,0)、h2(0.8,0.1,0.1)和h3(0,0.1,0.9),通过步骤s312中的公式(1)计算得到h1的最小空间距离为0.4243,h2的最小空间距离为0.4243,h3的最小空间距离为1.1314,h1和h2的最小空间距离小于预设的空间距离阈值0.8,因此,将h1和h2作为词向量。

本实施例中,通过根据预设语料库构建每个目标分词的基础词向量,在计算每个基础词向量与其他基础词向量之间的空间距离,并选取最小空间距离,将最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为词向量。从而实现快速将目标分词转换为对应的词向量,有利于后续意图模型对词向量的准确识别,从而提高后续模型识别的准确性。

在一实施例中,如图5所示,步骤s4之后,该基于卷积神经网络的信息检索方法还包括如下步骤:

s81:若未匹配到与意图识别结果相应的标识信息,则将意图识别结果和查询语句发送给第一目标用户进行确认。

在本发明实施例中,第一目标用户是指针对未匹配到与意图识别结果相应的标识信息的情况,对意图识别结果和查询语句进行分析确认的处理用户。

具体地,根据步骤s4中将意图识别结果与预设模型库中的标识信息进行匹配的方式,若未匹配到与意图识别结果相应的标识信息,则表示预设模型库中没有存在能够对该意图识别结果进行语义槽类型识别的语义槽模型,并将该意图识别结果与该意图识别结果对应的查询语句按照预设的方式发送给第一目标用户。

其中,预设的方式具体可以是以邮件的形式,也可以是以短信的形式,此处不做限制。

s82:接收第一目标用户反馈的初始识别结果,并将初始识别结果作为槽位识别结果。

具体地,第一目标用户在接收到步骤s81中发送的意图识别结果和查询语句之后,通过根据意图识别结果和查询语句进行分析处理后得到初始识别结果,并将初始识别结果进行反馈,当检测到预设第一反馈库中存在初始识别结果时,对初始识别结果进行提取,并将该初始识别结果作为槽位识别结果。

其中,预设第一反馈库是指专门用于存储第一目标用户反馈的初始识别结果的数据库。

需要说明的是,当从预设第一反馈库中对初始识别结果进行提取后,将提取到的初始识别结果从预设第一反馈库中进行删除处理。

本实施例中,在未匹配到与意图识别结果相应的标识信息的情况下,将意图识别结果和查询语句发送给第一目标用户进行确认,最后接收第一目标用户反馈的初始识别结果,并将该初始识别结果作为槽位识别结果。从而实现在未匹配到与意图识别结果相应的标识信息的情况下,能够结合人工交互的方式确定槽位识别结果,从而保证后续利用槽位识别结果确定查询对象的准确性。

在一实施例中,如图6所示,步骤s5之后,该基于卷积神经网络的信息检索方法还包括如下步骤:

s91:若槽位识别结果为识别失败,则从预设问题库中选取与意图识别结果匹配的关联问题发送给查询用户进行确认。

在本发明实施例中,槽位识别结果包含识别失败,若槽位识别结果为识别失败,则将该槽位识别结果对应的意图识别结果与预设问题库中的问题标识进行匹配,当意图识别结果与问题标识相同时,表示匹配成功,并将该问题标识对应的关联问题按照预设的方式发送给查询用户进行确认。

其中,预设问题库是指专门用于存储不同的问题标识及问题标识对应的关联问题的数据库,且预设问题库中包含与所有意图识别结果相同的问题标识。

例如,预设问题库中存在2个问题标识分别为“产品价格”、“产品质量”,其对应的关联问题分别为“产品c价格怎样”、“产品c质量如何”,若意图识别结果为“产品价格”,通过将意图识别结果与问题标识进行匹配,得到意图识别结果“产品价格”与问题标识“产品价格”相同,故将问题标识“产品价格”对应的关联问题“产品c价格怎样”按照预设的方式发送给查询用户进行确认。

s92:接收查询用户反馈的反馈信息,并将反馈信息作为新的查询语句重新进行识别。

具体地,查询用户在接收到关联问题后,可以直接将关联问题作为反馈信息进行反馈,也可以重新输入查询语句作为反馈信息进行反馈,当检测到预设用户库中存在反馈信息时,对反馈信息进行提取,并将该反馈信息作为新的查询语句,基于该查询语句重新进行意图识别和槽位识别的步骤继续执行。

其中,预设用户库是指专门用于接收查询用户发送的反馈信息的数据库。

需要说明的是,当从预设用户库中对反馈信息进行提取后,将提取到的反馈信息从预设用户库中进行删除处理。

本实施例中,在槽位识别结果为识别失败的情况下,选取与意图识别结果相匹配的关联问题发送给查询用户进行确认,最后将查询用户反馈的反馈信息作为新的查询语句重新进行识别。从而实现在槽位识别结果为识别失败的情况下,能够自动选取关联问题发给查询用户确认,避免在识别出现失误直接将结果进行输出,进一步提高信息查询的准确性。

在一实施例中,如图7所示,步骤s6之后,该基于卷积神经网络的信息检索方法还包括如下步骤:

s101:若根据查询对象从查询库中查询不到查询结果,则将查询对象与查询语句发送给第二目标用户进行确认。

在本发明实施例中,第二目标用户是指针对根据查询对象从查询库中查询不到查询结果的情况,对查询语句进行分析确认的处理用户。由于查询库中可能存在某个路径下的信息为空,故存在查询对象在查询库中没有对应的查询结果的情况。

具体地,当根据查询对象从查询库中查询不到查询结果时,将该查询对象及查询对象对应的查询语句按照预设的方式发送给目标用户进行分析确认。

s102:接收第二目标用户反馈的反馈结果,将该反馈结果确定为查询结果并发送给查询用户。

具体地,当检测到预设第二反馈库中存在反馈结果时,则对反馈结果进行提取,将该反馈结果确定为查询结果,并按照预设的方式发送给查询用户。其中,预设第二反馈库是指专门用于接收第二目标用户发送的反馈结果的数据库。

本实施例中,若根据查询对象从查询库中未能查询到查询结果,则将查询对象及查询语句发送给第二目标用户进行确认,最后将第二目标用户反馈的反馈结果作为查询结果并发送给查询用户。从而实现在根据查询对象无法查询到查询结果的情况下,能够结合人工交互的方式确定查询结果,进而提高信息查询的准确性。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种基于卷积神经网络的信息检索装置,该基于卷积神经网络的信息检索装置与上述实施例中基于卷积神经网络的信息检索方法一一对应。如图8所示,该基于卷积神经网络的信息检索装置包括获取模块81、分词模块82、意图识别模块83、匹配模块84、槽位识别模块85、确定模块86和发送模块87。各功能模块详细说明如下:

获取模块81,用于从预设数据库中获取查询用户输入的查询语句;

分词模块82,用于对查询语句进行分词处理,得到目标分词;

意图识别模块83,用于应用预先训练好的意图模型对目标分词进行意图识别,得到意图识别结果;

匹配模块84,用于将意图识别结果与预设模型库中的标识信息进行匹配,其中,预设模型库包含不同的标识信息及标识信息对应的语义槽模型;

槽位识别模块85,用于若匹配到与意图识别结果相应的标识信息,则从预设模型库中选取该标识信息对应的语义槽模型对目标分词进行语义槽类型识别,得到槽位识别结果;

确定模块86,用于根据意图识别结果与槽位识别结果,确定查询对象;

发送模块87,用于从查询数据库中获取查询对象对应的查询结果,并将查询结果发送给查询用户。

进一步地,分词模块82包括:

滤除子模块,用于对查询语句进行非文字字符滤除处理,得到纯文本;

纯文本分词子模块,用于通过预设分词词库对纯文本进行分词处理,得到目标分词。

进一步地,意图识别模块83包括:

词向量转换子模块,用于利用输入层对目标分词进行词向量转换处理,得到词向量;

卷积子模块,用于根据卷积层对词向量进行卷积操作,得到特征矩阵;

降维子模块,用于利用池化层对特征矩阵进行降维处理,得到目标矩阵;

运算子模块,用于通过全连接层对目标矩阵进行运算处理,得到意图识别结果。

进一步地,词向量转换子模块包括:

构建单元,用于基于预设语料库,构建每个目标分词的基础词向量;

计算单元,用于针对每个基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从空间距离中选取最小值作为该基础词向量的最小空间距离;

词向量确定单元,用于将最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为词向量。

进一步地,基于卷积神经网络的信息检索装置还包括:

第一发送模块,用于若未匹配到与意图识别结果相应的标识信息,则将意图识别结果和查询语句发送给第一目标用户进行确认;

第一接收模块,用于接收第一目标用户反馈的初始识别结果,并将初始识别结果作为槽位识别结果。

进一步地,基于卷积神经网络的信息检索装置还包括:

第二发送模块,用于若槽位识别结果为识别失败,则从预设问题库中选取与意图识别结果匹配的关联问题发送给查询用户进行确认;

第二接收模块,用于接收查询用户反馈的反馈信息,并将反馈信息作为新的查询语句重新进行识别。

进一步地,基于卷积神经网络的信息检索装置还包括:

第三发送模块,用于若根据查询对象从查询库中查询不到查询结果,则将查询对象与查询语句发送给第二目标用户进行确认;

第三接收模块,用于接收第二目标用户反馈的反馈结果,将该反馈结果确定为查询结果并发送给查询用户。

本申请的一些实施例公开了计算机设备。具体请参阅图9,为本申请的一实施例中计算机设备90基本结构框图。

如图9中所示意的,所述计算机设备90包括通过系统总线相互通信连接存储器91、处理器92、网络接口93。需要指出的是,图9中仅示出了具有组件91-93的计算机设备90,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器91至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器91可以是所述计算机设备90的内部存储单元,例如该计算机设备90的硬盘或内存。在另一些实施例中,所述存储器91也可以是所述计算机设备90的外部存储设备,例如该计算机设备90上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,所述存储器91还可以既包括所述计算机设备90的内部存储单元也包括其外部存储设备。本实施例中,所述存储器91通常用于存储安装于所述计算机设备90的操作系统和各类应用软件,例如所述基于卷积神经网络的信息检索方法的程序代码等。此外,所述存储器91还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器92在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器92通常用于控制所述计算机设备90的总体操作。本实施例中,所述处理器92用于运行所述存储器91中存储的程序代码或者处理数据,例如运行所述基于卷积神经网络的信息检索方法的程序代码。

所述网络接口93可包括无线网络接口或有线网络接口,该网络接口93通常用于在所述计算机设备90与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有查询信息录入程序,所述查询信息录入程序可被至少一个处理器执行,以使所述至少一个处理器执行上述任意一种基于卷积神经网络的信息检索方法的步骤。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台计算机设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。

最后应说明的是,显然以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1