基于相似度计算的问答知识库的建立方法、装置及系统的制作方法_4

文档序号:9911689阅读:来源:国知局
置知识,所述预置知识包括:一个标准问以及一个或多个扩展问;
[0108]基于相似度计算的问答知识库的建立装置21,所述基于相似度计算的问答知识库的建立装置21包括:
[0109]预置知识获取单元201,用于从领域知识数据库401中获取多个预置知识;
[0110]接收单元202,用于接收初始请求信息;
[0111]计算单元203,用于将所述初始请求信息与所述预置知识进行语义相似度计算;
[0112]判断单元204,用于判断语义相似度计算结果的最大值是否大于相似度阈值;
[0113]存入单元205,用于当相似度计算结果的最大值大于相似度阈值时,将相似度计算结果的最大值对应的预置知识中的标准问以及扩展问以及对应的初始请求信息存入智能问答知识库206。
[0114]可以对领域知识数据库401中预置知识进行编辑操作,所述编辑操作包括:增加、删除、替换等操作。
[0115]需要说明的是,关于建立系统的各单元、模块的其他限定或描述,请参考前述实施例,在此不再赘述。
[0116]综上,本发明实施例的基于相似度计算的问答知识库的建立方法,在接收初始请求信息后,将所述初始请求信息与所述领域知识数据库中的预置知识进行语义相似度计算,并判断语义相似度计算结果的最大值是否大于相似度阈值,当相似度计算结果的最大值大于相似度阈值时,将该初始请求信息以及相似度计算结果的最大值对应的预置知识中的标准问以及扩展问存入智能问答知识库。本发明的方法,在接收到用户输入的一条初始请求信息后,在进行语义相似度计算以及将相似度计算结果与相似度阈值进行比较后,将相似度计算结果的最大值对应的预置知识及对应的初始请求信息存储到智能问答知识库中存储到智能问答知识库中,因而用户在建立智能问答知识库,无需多次向智能问答知识库输入相关联的多个问题,从而提高了智能问答知识库建立效率。
[0117]本发明实施例的基于相似度计算的问答知识库的建立装置,接收单元在接收到用户输入的一条初始请求信息后,计算单元将所述初始请求信息与所述预置知识进行语义相似度计算,判断单元将所述初始请求信息与所述预置知识进行语义相似度计算,存入单元在当相似度计算结果的最大值大于相似度阈值时,将该初始请求信息以及相似度计算结果的最大值对应的预置知识中的标准问以及扩展问存入智能问答知识库,因而用户在使用本发明的装置建立智能问答知识库时,无需多次向智能问答知识库输入相关联的多个问题,从而提高了智能问答知识库建立效率。
[0118]本发明实施例的基于相似度计算的问答知识库的建立系统,除了包括建立装置外还包括领域知识数据库,领域知识数据库用于提供预置知识,因而在基于相似度计算的问答知识库的建立时,一个领域知识数据库可以向不同的建立装置提供数据信息。
[0119]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:R0M、RAM、磁盘或光盘等。
[0120]虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
【主权项】
1.一种基于相似度计算的问答知识库的建立,其特征在于,包括: 提供领域知识数据库,所述领域知识数据库包括多个预置知识,所述预置知识包括:一个标准问以及一个或多个扩展问; 接收初始请求信息; 将所述初始请求信息与所述领域知识数据库中的预置知识进行语义相似度计算,并判断语义相似度计算结果的最大值是否大于相似度阈值,当相似度计算结果的最大值大于相似度阈值时,将该初始请求信息以及相似度计算结果的最大值对应的预置知识中的标准问以及扩展问存入智能问答知识库。2.如权利要求1所述的建立方法,其特征在于,所述语义相似度计算采用以下一种或多种方式的结合:基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法。3.如权利要求1所述的建立方法,其特征在于,分别计算所述初始请求信息与所述标准问的语义相似度以及所述初始请求信息与每个所述扩展问的语义相似度,并将计算结果中的最高值作为所述初始请求信息与该预置知识的语义相似度结果。4.如权利要求1所述的建立方法,其特征在于,所述相似度阈值大于或等于0.7且小于或等于1.0。5.如权利要求1所述的建立方法,其特征在于,在进行相似度计算之前还包括:对所述初始请求信息进行文本预处理,从待更新信息中抽取出有代表性的特征,作为相似度计算的基础。6.如权利要求5所述的建立方法,其特征在于,所述文本预处理包括分词处理和去停用词处理。7.如权利要求1所述的建立方法,其特征在于,还包括:将所述初始请求信息存入智能问答知识库的同时,提供与所述初始请求信息对应的答案,并将该答案一并存入智能问答知识库。8.如权利要求1所述的建立方法,其特征在于,还包括:当停止接收初始请求信息之后,从领域知识数据库中至少提取未存入智能问答知识库的部分数目的预置知识,并将提取的预置知识存入智能问答知识库,所述预置知识还包括答案。9.一种基于相似度计算的问答知识库的建立装置,其特征在于,包括: 预置知识获取单元,用于获取多个预置知识,所述预置知识包括:一个标准问以及一个或多个扩展问; 接收单元,用于接收初始请求信息; 计算单元,用于将所述初始请求信息与所述预置知识进行语义相似度计算; 判断单元,用于判断语义相似度计算结果的最大值是否大于相似度阈值; 存入单元,用于当相似度计算结果的最大值大于相似度阈值时,将相似度计算结果的最大值对应的预置知识中的标准问和扩展问以及对应的初始请求信息存入智能问答知识库。10.如权利要求9所述的建立装置,其特征在于,所述计算单元采用以下一种或多种方式的结合进行语义相似度计算:基于向量空间模型的计算方法、基于隐形语义索引模型的计算方法、基于属性论的语义相似度计算方法和基于汉明距离的语义相似度计算方法。11.如权利要求9所述的建立装置,其特征在于,所述计算单元分别计算所述初始请求信息与所述标准问的语义相似度以及所述初始请求信息与每个所述扩展问的语义相似度,并将计算结果中的最高值作为所述初始请求信息与该预置知识的语义相似度结果。12.如权利要求9所述的建立装置,其特征在于,所述相似度阈值大于或等于0.7且小于或等于1.0。13.如权利要求9所述的建立装置,其特征在于,所述装置还包括文本预处理单元:用于对所述初始请求信息进行文本预处理,从待更新信息中抽取出有代表性的特征,作为相似度计算的基础。14.如权利要求9所述的建立装置,其特征在于,还包括:答案提供单元,用于提供与初始请求信息对应的答案;所述存入单元将所述初始请求信息存入智能问答知识库的同时,将答案提供单元提供的答案一并存入智能问答知识库。15.如权利要求9所述的建立装置,其特征在于,还包括:提取单元,用于当接收单元停止接收初始请求信息之后,从预置知识获取单元中至少提取未存入智能问答知识库的部分数目的预置知识;所述存入单元将提取单元提取的预置知识存入智能问答知识库。16.一种基于相似度计算的问答知识库的建立系统,其特征在于,包括: 领域知识数据库,所述领域知识数据库包括多个预置知识,所述预置知识包括:一个标准问以及一个或多个扩展问; 权利要求9?15任一项所述的建立装置。
【专利摘要】一种基于相似度计算的问答知识库的建立方法、装置及系统,其中建立方法包括:提供领域知识数据库,所述领域知识数据库包括多个预置知识,所述预置知识包括:一个标准问以及一个或多个扩展问;接收初始请求信息;将所述初始请求信息与所述领域知识数据库中的预置知识进行语义相似度计算,并判断语义相似度计算结果的最大值是否大于相似度阈值,当相似度计算结果的最大值大于相似度阈值时,将该初始请求信息以及相似度计算结果的最大值对应的预置知识中的标准问以及扩展问存入智能问答知识库。本发明的建立方法、建立装置及建立系统提高了智能问答知识库的建立效率。
【IPC分类】G06K9/62, G06F17/30
【公开号】CN105678324
【申请号】CN201511030353
【发明人】曾永梅, 李波, 姚贡之, 朱频频
【申请人】上海智臻智能网络科技股份有限公司
【公开日】2016年6月15日
【申请日】2015年12月31日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1