基于问答系统的信息匹配的方法和装置的制造方法

文档序号:8258740阅读:290来源:国知局
基于问答系统的信息匹配的方法和装置的制造方法
【技术领域】
[0001] 本申请涉及问答信息技术领域,特别是涉及一种基于问答系统的信息匹配的方法 和装置。
【背景技术】
[0002] 近年来,随着自然语言处理技术的发展,智能问答系统受到了极大的关注,从聊天 软件'小黄鸡'的风靡,到流行于各大网络平台的应答机器人,智能问答系统在众多领域得 到应用。
[0003] 现有技术中,通常采用如图1所示的问答系统实现对用户输入信息的处理。
[0004] 步骤101 :问答系统接收用户输入信息。
[0005] 步骤102 :对接收的用户输入信息进行分析,分析包括关键词提取以及关键词扩 展等一系列的预处理,获得预处理后的用户输入信息。
[0006] 步骤103 :将预处理后的用户输入彳目息进行lucene检索,获得用户输入彳目息的多 个问题候选结果,从多个问题候选结果中选择出用户输入信息的最优答案。
[0007] 上述检索中通过关键词匹配和关键词扩展得到用户输入信息的最优答案,但是由 于汉语中表达方式灵活,具有相同语义句子其关键词的出现的位置也不定,关键词按序匹 配往往不能满足检索要求,因此,通过关键词进行检索和匹配,尽管该算法简单易行,毕竟 停留在语言的表层,而没有触及语义,因此,问答系统提供的最优答案往往不是用户所需要 的答案。

【发明内容】

[0008] 本申请提供一种基于问答系统的信息匹配的方法和装置,以解决现有技术中无法 高效准确的实现问答系统的信息匹配的问题。
[0009] 为了解决上述问题,本申请公开了一种基于问答系统的信息匹配方法,包括:获取 用户输入信息的打分最高的模糊问题候选结果和打分最高的Lucene问题候选结果;
[0010] 判断所述打分最高的模糊问题候选结果是否大于模糊问题候选结果的第一阈 值;
[0011] 若打分最高的模糊问题候选结果大于第一阈值,则将所述打分最高的模糊问题候 选结果作为所述用户输入信息的输出结果;
[0012] 若所述打分最高的模糊问题候选结果小于或等于第一阈值时,则获得打分最高的 Lucene问题候选结果;
[0013] 判断打分最高的Lucene问题候选结果是否大于Lucene问题候选结果的第二阈 值,若是,则将所述打分最高的Lucene问题候选结果作为所述用户输入信息的输出结果。
[0014] 优选地,若所述打分最高的Lucene问题候选结果小于或等于第二阈值时,贝输出 未找到用户输入信息。
[0015] 优选地,包括:使用遗传算法计算第一阈值和第二阈值的取值,其中,所述遗传算 法包括:选择算子、交叉算子和变异算子。
[0016] 优选地,使用遗传算法计算第一阈值和第二阈值的取值步骤包括:
[0017] 将所述第一阈值和第二阈值进行随机赋值,得到多个一维数组;
[0018] 使用选择算子选择满足一定标准的多个一维数组;
[0019] 使用交叉算子处理满足一定标准的多个一维数组,得到多个交叉后的一维数组;
[0020] 使用变异算子处理所述多个交叉后的一维数组,得到多个变异后的一维数组;
[0021] 将满足一定标准的多个一维数组、多个交叉后的一维数组和多个变异后的一维数 组输入到问答系统中,得到用户输入信息的准确率;
[0022] 从排序后的准确率中筛选出至少两个准确率;
[0023] 将至少两个准确率对应的一维数组重复进行以上操作,直至找到一个收敛准确 率;
[0024] 将所述收敛准确率对应的一维数组作为第一阈值和第二阈值的取值。
[0025] 本申请公开了一种基于问答系统的信息匹配方法,包括:将获取的多个Lucene问 题候选结果按照不同类型分为领域问题候选结果和闲聊问题候选结果;
[0026] 利用模糊算法对所述多个领域问题候选结果进行打分,获得打分最高的领域问题 候选结果;
[0027] 判断所述打分最高的领域问题候选结果是否大于模糊问题候选结果的第一阈 值;
[0028] 若打分最高的领域问题候选结果大于第一阈值,则将所述打分最高的领域问题候 选结果作为所述用户输入信息的输出结果;
[0029] 若打分最高的领域问题候选结果小于或等于第一阈值时,则输出未找到用户输入 信息;
[0030] 利用模糊算法对所述多个闲聊问题候选结果进行打分,获得打分最高的闲聊问题 候选结果;
[0031] 判断打分最高的闲聊问题候选结果是否大于闲聊问题候选结果的第三阈值;
[0032] 若打分最高的闲聊问题候选结果大于第三阈值,则将所述打分最高的闲聊问题候 选结果作为用户输入信息的输出结果;
[0033] 若打分最高的闲聊问题候选结果小于或等于第三阈值时,则获得打分最高的 Lucene问题候选结果;
[0034] 判断打分最高的Lucene问题候选结果是否大于Lucene问题候选结果的第二阈 值,若是,则将所述打分最高的Lucene问题候选结果作为所述用户输入信息的输出结果。
[0035] 优选地,包括:若所述打分最高的Lucene问题候选结果小于或等于第二阈值时, 则输出未找到用户输入信息。
[0036] 优选地,包括:使用遗传算法计算第一阈值、第二阈值和第三阈值的取值,其中,所 述遗传算法包括:选择算子、交叉算子和变异算子。
[0037] 优选地,包括:使用遗传算法计算第一阈值、第二阈值和第三阈值的取值步骤包 括:
[0038] 将所述第一阈值、第二阈值和第三阈值进行随机赋值,得到多个一维数组;
[0039] 使用选择算子从所述多个一维数组中选择满足一定标准的多个一维数组;
[0040] 使用交叉算子处理满足一定标准的的多个一维数组,得到多个交叉后的一维数 组;
[0041] 使用变异算子处理所述多个交叉后的一维数组,得到多个变异后的一维数组;
[0042] 将满足一定标准的多个一维数组、多个交叉后的一维数组和多个变异后的一维数 组输入到问答系统中,得到用户输入信息的准确率;
[0043] 使用评价函数从所述准确率中筛选出至少两个准确率;
[0044] 将至少两个准确率对应的一维数组重复进行以上操作,直至找到一个收敛准确 率;
[0045] 将所述收敛准确率对应的一维数组作为第一阈值、第二阈值和第三阈值的取值。
[0046] 优选地,所述评价函数的函数公式为:
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1