基于问答系统的信息匹配的方法和装置的制造方法

文档序号：8258740阅读：290来源：国知局

基于问答系统的信息匹配的方法和装置的制造方法
【技术领域】
[0001] 本申请涉及问答信息技术领域，特别是涉及一种基于问答系统的信息匹配的方法和装置。
【背景技术】
[0002] 近年来，随着自然语言处理技术的发展，智能问答系统受到了极大的关注，从聊天软件'小黄鸡'的风靡，到流行于各大网络平台的应答机器人，智能问答系统在众多领域得到应用。
[0003] 现有技术中，通常采用如图1所示的问答系统实现对用户输入信息的处理。
[0004] 步骤101 :问答系统接收用户输入信息。
[0005] 步骤102 :对接收的用户输入信息进行分析，分析包括关键词提取以及关键词扩展等一系列的预处理，获得预处理后的用户输入信息。
[0006] 步骤103 :将预处理后的用户输入彳目息进行lucene检索，获得用户输入彳目息的多个问题候选结果，从多个问题候选结果中选择出用户输入信息的最优答案。
[0007] 上述检索中通过关键词匹配和关键词扩展得到用户输入信息的最优答案，但是由于汉语中表达方式灵活，具有相同语义句子其关键词的出现的位置也不定，关键词按序匹配往往不能满足检索要求，因此，通过关键词进行检索和匹配，尽管该算法简单易行，毕竟停留在语言的表层，而没有触及语义，因此，问答系统提供的最优答案往往不是用户所需要的答案。

【发明内容】

[0008] 本申请提供一种基于问答系统的信息匹配的方法和装置，以解决现有技术中无法高效准确的实现问答系统的信息匹配的问题。
[0009] 为了解决上述问题，本申请公开了一种基于问答系统的信息匹配方法，包括：获取用户输入信息的打分最高的模糊问题候选结果和打分最高的Lucene问题候选结果；
[0010] 判断所述打分最高的模糊问题候选结果是否大于模糊问题候选结果的第一阈值；
[0011] 若打分最高的模糊问题候选结果大于第一阈值，则将所述打分最高的模糊问题候选结果作为所述用户输入信息的输出结果；
[0012] 若所述打分最高的模糊问题候选结果小于或等于第一阈值时，则获得打分最高的 Lucene问题候选结果；
[0013] 判断打分最高的Lucene问题候选结果是否大于Lucene问题候选结果的第二阈值，若是，则将所述打分最高的Lucene问题候选结果作为所述用户输入信息的输出结果。
[0014] 优选地，若所述打分最高的Lucene问题候选结果小于或等于第二阈值时，贝输出未找到用户输入信息。
[0015] 优选地，包括：使用遗传算法计算第一阈值和第二阈值的取值，其中，所述遗传算法包括：选择算子、交叉算子和变异算子。
[0016] 优选地，使用遗传算法计算第一阈值和第二阈值的取值步骤包括：
[0017] 将所述第一阈值和第二阈值进行随机赋值，得到多个一维数组；
[0018] 使用选择算子选择满足一定标准的多个一维数组；
[0019] 使用交叉算子处理满足一定标准的多个一维数组，得到多个交叉后的一维数组；
[0020] 使用变异算子处理所述多个交叉后的一维数组，得到多个变异后的一维数组；
[0021] 将满足一定标准的多个一维数组、多个交叉后的一维数组和多个变异后的一维数组输入到问答系统中，得到用户输入信息的准确率；
[0022] 从排序后的准确率中筛选出至少两个准确率；
[0023] 将至少两个准确率对应的一维数组重复进行以上操作，直至找到一个收敛准确率；
[0024] 将所述收敛准确率对应的一维数组作为第一阈值和第二阈值的取值。
[0025] 本申请公开了一种基于问答系统的信息匹配方法，包括：将获取的多个Lucene问题候选结果按照不同类型分为领域问题候选结果和闲聊问题候选结果；
[0026] 利用模糊算法对所述多个领域问题候选结果进行打分，获得打分最高的领域问题候选结果；
[0027] 判断所述打分最高的领域问题候选结果是否大于模糊问题候选结果的第一阈值；
[0028] 若打分最高的领域问题候选结果大于第一阈值，则将所述打分最高的领域问题候选结果作为所述用户输入信息的输出结果；
[0029] 若打分最高的领域问题候选结果小于或等于第一阈值时，则输出未找到用户输入信息；
[0030] 利用模糊算法对所述多个闲聊问题候选结果进行打分，获得打分最高的闲聊问题候选结果；
[0031] 判断打分最高的闲聊问题候选结果是否大于闲聊问题候选结果的第三阈值；
[0032] 若打分最高的闲聊问题候选结果大于第三阈值，则将所述打分最高的闲聊问题候选结果作为用户输入信息的输出结果；
[0033] 若打分最高的闲聊问题候选结果小于或等于第三阈值时，则获得打分最高的 Lucene问题候选结果；
[0034] 判断打分最高的Lucene问题候选结果是否大于Lucene问题候选结果的第二阈值，若是，则将所述打分最高的Lucene问题候选结果作为所述用户输入信息的输出结果。
[0035] 优选地，包括：若所述打分最高的Lucene问题候选结果小于或等于第二阈值时，则输出未找到用户输入信息。
[0036] 优选地，包括：使用遗传算法计算第一阈值、第二阈值和第三阈值的取值，其中，所述遗传算法包括：选择算子、交叉算子和变异算子。
[0037] 优选地，包括：使用遗传算法计算第一阈值、第二阈值和第三阈值的取值步骤包括：
[0038] 将所述第一阈值、第二阈值和第三阈值进行随机赋值，得到多个一维数组；
[0039] 使用选择算子从所述多个一维数组中选择满足一定标准的多个一维数组；
[0040] 使用交叉算子处理满足一定标准的的多个一维数组，得到多个交叉后的一维数组；
[0041] 使用变异算子处理所述多个交叉后的一维数组，得到多个变异后的一维数组；
[0042] 将满足一定标准的多个一维数组、多个交叉后的一维数组和多个变异后的一维数组输入到问答系统中，得到用户输入信息的准确率；
[0043] 使用评价函数从所述准确率中筛选出至少两个准确率；
[0044] 将至少两个准确率对应的一维数组重复进行以上操作，直至找到一个收敛准确率；
[0045] 将所述收敛准确率对应的一维数组作为第一阈值、第二阈值和第三阈值的取值。
[0046] 优选地，所述评价函数的函数公式为：

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王东;游世学;刘荣;杜新凯;
技术所有人：清华大学;北京中科汇联信息技术有限公司;
我是此专利的发明人

上一篇：一种雷达知识库中基于多种分布类型的动态更新方法
上一篇：一种基于Oracle的数据处理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。