基于计算机网络的专家问答系统及其构建方法

文档序号:9579335阅读:970来源:国知局
基于计算机网络的专家问答系统及其构建方法
【技术领域】
[0001]本发明属于计算机网络领域,特别涉及一种基于计算机网络的专家问答系统及其构建方法。
【背景技术】
[0002]随着互联网信息技术的发展,互联网用户进行信息交流的方式和对象逐渐多样化。当用户存在需要解答的问题时,可以通过多种方式获取答案。传统的方式包括使用例如电话、电子邮件或其他即时通讯工具,向熟悉的或者处于相识的社交圈提出问题,从而获取答案。
[0003]最近一种常用的方式是,计算机网络用户还可以在具有问答系统的网站上直接提交问题,例如在搜索网站上直接输入需要搜索的问题内容,由问答系统通过关键字匹配已有的问答数据库,给出检索结果。主要的实现方式是问答系统首先建立属于自己的知识数据库,通过不同输入方式(文字、图像)等,以输入的关键字进行检索匹配,获取答案。
[0004]然而,上述传统方式,无法突破熟悉或相识人群的限制,当所欲了解的问题在已有的通讯圈之内无人知道答案或者联系不上时,无法获取答案。上述第二种方式即最近常用的方式虽然克服了传统方式的弊端,例如,只能通过关键字进行匹配,由此导致检索出的问题的答案与用户实际想获取问题的答案不相符。
[0005]鉴于此,如何在具有问答系统的网站上提问题时,获取与该问题所属领域内专家的解答成为当前需要解决的技术问题。

【发明内容】

[0006]针对现有技术中的缺陷,本发明提供一种基于计算机网络的专家问答系统及其构建方法。
[0007]第一方面,本发明实施例提供一种基于计算机网络的专家问答系统,知识库构建单元,用于构建领域知识库,所述领域知识库包括:所述领域的至少一个概念、与每一概念对应的多个实体;
[0008]领域专家确定单元,用于根据所述领域的信息集合,确定所述信息集合中所述信息所属的专家,所述信息集合中的信息为从所述领域相关的网站或评论中获取的与所述概念或所述实体关联的信息,所述专家为所述信息的发出者或所述信息的接收者;
[0009]问题接收单元,用于接收用户输入的问题;
[0010]相似度确定单元,用于确定所述领域专家确定单元确定的专家与所述问题接收单元接收的问题的第一相似度;
[0011]专家匹配单元,用于将所述相似度确定单元确定的第一相似度按照大小排序,选取排在前N位的第一相似度对应的专家解答所述问题,N为大于等于1的自然数。
[0012]可选地,所述知识库构建单元,具体用于
[0013]向所述领域对应的网站进行定向抓取,建立二元组表单的表单集合,所述表单集合中的表单包括:导航词、所述导航词对应的多个元素组成的元素集合;
[0014]确定所述表单集合中每一表单的导航词与所述至少一个概念是否匹配,若一表单中所述导航词与所述至少一个概念匹配,则将所述导航词所属表单中的元素作为所述至少一个概念对应的核心实体,且每一概念对应的核心实体组成所述概念的实体集合。
[0015]可选地,所述知识库构建单元,还用于
[0016]在所述表单集合中存在至少一个表单的导航词未与所述至少一个概念相匹配时,则分别获取未与所述至少一个概念相匹配的导航词所属表单中的元素集合与每一概念的实体集合的第二相似度;
[0017]针对每一未匹配的导航词的多个第二相似度,将该导航词的多个所述第二相似度按照大小排序,该导航词所属表单中的元素作为排在前Μ位的第二相似度对应的概念中的非核心实体;Μ为大于等于1的自然数。
[0018]可选地,所述知识库构建单元,还用于
[0019]在所述概念中未包括核心实体和非核心实体时,补充所述概念对应的核心实体;
[0020]其中,所述概念对应多个实体包括:所述核心实体和/或所述非核心实体。
[0021]可选地,所述领域专家确定单元,具体用于
[0022]获取所述领域对应的社交网站中的信息,确定所述信息内容是否包括所述领域知识库中的概念名称或实体名称;
[0023]若所述信息内容包括所述概念名称或实体名称,则根据所述信息的发送者、接收者生成专家候选集合,以及
[0024]计算所述信息与所述领域的第三相似度,将所述信息的发送者,接受者和所述信息的第三相似度作为一个三元组信息,生成信息集合;
[0025]根据所述专家候选集合的专家和所述信息集合中的信息,获取所述专家候选集合中每一专家的排名;
[0026]和/ 或,
[0027]选取排名靠前的X个专家作为所述信息集合中所述信息所属的专家,X为大于等于1的自然数。
[0028]可选地,所述领域专家确定单元,还用于
[0029]针对所述专家候选集合中的每一专家,获取每一专家在所述信息集合中的所有信息;
[0030]根据每一专家在所述信息集合中的所有信息和所述领域知识库中的所有概念,获取每一专家对所有概念的概念相似向量。
[0031]可选地,所述相似度确定单元,具体用于
[0032]对所述问题接收单元接收的所述问题进行切词处理,得到与所述问题对应的词的第一集合;
[0033]获取所述第一集合与所述领域知识库中所有概念的问题相似向量;
[0034]根据所述概念相似向量和所述问题相似向量,确定所述专家与所述问题的第一相似度。
[0035]第二方面,本发明提供一种专家问答系统,包括:
[0036]接收单元,用于接收用户输入的问题;
[0037]相似度确定单元,用于确定所述问题与专家问答系统中每一专家的相似度,所述专家为所述问题所属领域的技术熟悉人;
[0038]专家选取单元,用于将所述相似度按照大小排序,选取排在前N位的相似度对应的专家,N为大于等于1的自然数;
[0039]问题解答单元,用于使所述专家选取单元选取的专家为所述用户解答所述问题。
[0040]可选地,所述相似度确定单元,具体用于
[0041]对所述问题进行切词处理,得到与所述问题对应的词的第一集合;
[0042]获取所述第一集合与领域知识库中所有概念的问题相似向量,所述领域知识库为所述专家问答系统中预先获取的包括至少一个概念、所述至少一个概念对应的多个实体的知识库;
[0043]根据每一专家的概念相似向量和所述问题相似向量,确定所述专家问答系统中专家与所述问题的相似度;所述每一专家的概念相似向量为根据该专家发送的所有信息和所述领域知识库中所有概念预先获取的,且所述专家发送的所有信息为从所述领域相关网站或评论中获取的与所述概念或者所述实体关联的信息。
[0044]第三方面,本发明实施例提供一种基于计算机网络的专家问答系统的构建方法,包括:
[0045]构建领域知识库,所述领域知识库包括:所述领域的至少一个概念、与每一概念对应的多个实体;
[0046]根据所述领域的信息集合,确定所述信息集合中所述信息所属的专家,所述信息集合中的信息为从所述领域相关的网站或评论中获取的与所述概念或所述实体关联的信息,所述专家为所述信息的发出者或所述信息的接收者;
[0047]若所述专家问答系统接收到问题,则确定所述专家与所述问题的第一相似度,将所述第一相似度按照大小排序,选取排在前N位的第一相似度对应的专家解答所述问题,N为大于等于1的自然数。
[0048]可选地,所述构建领域知识库,包括:
[0049]向所述领域对应的网站进行定向抓取,建立二元组表单的表单集合,所述表单集合中的表单包括:导航词、所述导航词对应的多个元素组成的元素集合;
[0050]确定所述表单集合中每一表单的导航词与所述至少一个概念是否匹配,若一表单中所述导航词与所述至少一个概念匹配,则将所述导航词所属表单中的元素作为所述至少一个概念对应的核心实体,且每一概念对应的核心实体组成所述概念的实体集合。
[0051 ] 可选地,所述构建领域知识库,还包括:
[0052]若所述表单集合中存在至少一个表单的导航词未与所述至少一个概念相匹配,则分别获取未与所述至少一个概念相匹配的导航词所属表单中的元素集合与每一概念的实体集合的第二相似度;
[0053]针对每一未匹配的导航词的多个第二相似度,将该导航词的多个所述第二相似度按照大小排序,该导航词所属表单中的元素作为排在前Μ位的第二相似度对应的概念中的非核心实体;
[0054]Μ为大于等于1的自然数。
[0055]可选地,所述构建领域知识库,还包括:
[0056]若所述概念中未包括核心实体和非核心实体,则补充所述概念对应的核心实体;
[0057]其中,所述概念对应的多个实体包括:所述核心实体和/或所述非核心实体。
[0058]可选地,所述根据所述领域的信息集合,确定所述信息集合中所述信息所属的专家,包括:
[0059]获取所述领域对应的社交网站中的信息,确定所述信息内容是否包括所述领域知识库中的概念名称或实体名称;
[0060]若所述信息内容包括所述概念名称或实体名称,则根据所述信息的发送者、接收者生成专家候选集合,以及
[0061]计算所述信息与所述领域的第三相似度,将所述信息的发送者、接收者和所述信息的第三相似度作为一个三元组信息,生成所述信息集合;
[0062]根据所述专家候选集合的专家和所述信息集合中的信息,获取所述专家候选集合中每一专家的排名;
[0063]和/ 或,
[0064]选取排名靠前的X个专家作为所述信息集合中所述信息所属的专家,X为大于等于1的自然数。
[0065]可选地,还包括:
[0066]针对所述专家候选集合中的每一专家,获取每一专家在所述信息集合中的所有信息;
[0067]根据每一专家在所述信息集合中的所有信息和所述领域知识库中的所有概念,获取每一专家对所有概念的概念相似向量。
[0068]可选地,若所述专家问答系统接收到问题,确定所述专家与所述问题的第一相似度,包括:
[0069]对所述问题进行切词处理,得到与所述问题对应的词的第一集合;
[0070]获取所述第一集合与所述领域知识库中所有概念的问题相似向量;
[0071]根据所述概念相似向量和所述问题相似向量,确定所述专家与所述问题的第一相似度。
[0072]第四方面,本发明提供一种自动问答方法,包括:
[0073]接收用户输入的问题,确定所述问题与专家问答系统中每一专家的相似度,所述专家为所述问题所属领域的技术熟悉人;
[0074]将所述相似度按照大小排序,选取排在前N位的相似度对应的专家解答所述问题,N为大于等于1的自然数。
[0075]可选地,所述确定所述问题与专家问答系统中专家的相似度,包括:
[0076]对所述问题进行切词处理,得到与所述问题对应的词的第一集合;
[0077]获取所述第一集合与领域知识库中所有概念的问题相似向量,所述领域知识库为所述专家问答系统中预先获取的包括至少一个概念、所述至少一个概念对应的多个实体的知识库;
[0078]根据每一专家的概念相似向量和所述问题相似向量,确定所述专家问答系统中专家与所述问题的相似度;所
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1