一种智能问答方法及装置的制造方法

文档序号:10552985阅读:324来源:国知局
一种智能问答方法及装置的制造方法
【专利摘要】一种智能问答方法及装置,所述方法包括:接收用户输入信息;获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案;当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息;从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。上述方案可提高智能问答系统回复答案的准确率,并提升用户体验。
【专利说明】
一种智能问答方法及装置
技术领域
[0001]本发明涉及数据处理技术领域,特别是涉及一种智能问答方法及装置。
【背景技术】
[0002]知识库,又称为智能数据库或人工智能数据库,在知识库中,信息被有效组织以便进行检索和利用。知识库广泛应用于人工智能领域,其中一个典型的应用就是智能问答系统,又称为自动问题系统。
[0003]应用于智能问答系统的知识库中存储多个知识点,每个知识点包括一个或多个预设的问题以及对应的答案信息。当用户通过输入请求信息提出问题时,获取请求信息与预设问题的语义相似度,如果存在语义相似度大于预设阈值的预设问题,则将该问题对应的答案信息返回给用户。
[0004]然而在很多领域的问答系统中,通过相似度计算得到的答案十分冗杂,包括了一些实际与用户问题无关的答案,因此答案不够精准及简要。

【发明内容】

[0005]本发明解决的技术问题是提高智能问答系统回复答案的准确性。
[0006]为解决上述技术问题,本发明实施例提供一种智能问答方法,所述方法包括:
[0007]接收用户输入信息;获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案;当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息;从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。
[0008]可选地,所述第二语用信息对应一个或多个第二语用关键词,所述第一语用信息对应一个或多个第一语用关键词,当所述第一语用关键词和所述第二语用关键词属于同一词类时,则对应所述第一语用关键词的第一语用信息与对应所述第二语用关键词的第二语用信息对应。
[0009]可选地,所述智能问答方法,所述方法还包括:
[0010]预先为所述问答知识库中每个答案设置第一语用信息,具体包括:
[0011 ]定义多个第一语用信息,每个第一语用信息对应一个或多个第一语用关键词;对每个所述初始答案进行分句处理;根据所述第一语用关键词为每个分句设置第一语用信息。
[0012]可选地,进行抽象语义推荐处理还得到抽象语义表达式,所述抽象语义表达式包括缺失语义成分,当从多个所述第一语用信息中提取与所述第二语用信息对应的分句为两个以上时,所述方法还包括:
[0013]从用户输入信息中提取与其抽象语义表达式中缺失语义成分对应的填充内容;除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。
[0014]可选地,所述抽象语义推荐处理包括:
[0015]对所述用户输入信息进行分词处理,得到若干单独词;分别对每个单独词进行词性标注处理,得到每个单独词的词性信息;分别对每个单独词进行词类判断处理,得到每个单独词的词类信息;对所述抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。
[0016]本发明实施例还提供一种智能问答装置,所述装置包括:
[0017]接收单元,适于接收用户输入信息;
[0018]初始答案获取单元,适于获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案;
[0019]抽象语义推荐处理单元,适于当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息;
[0020]最终答案获取单元,适于从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。
[0021]可选地,所述第二语用信息对应一个或多个第二语用关键词,所述第一语用信息对应一个或多个第一语用关键词,当所述第一语用关键词和所述第二语用关键词属于同一词类时,则对应所述第一语用关键词的第一语用信息与对应所述第二语用关键词的第二语用信息对应。
[0022]可选地,所述装置还包括:
[0023]第一语用信息定义单元,适于定义多个第一语用信息,每个第一语用信息对应一个或多个第一语用关键词;
[0024]分句处理单元,适于对每个所述初始答案进行分句处理;
[0025]第一语用信息设置单元,适于根据所述第一语用关键词为每个分句设置第一语用
?目息O
[0026]可选地,所述抽象语义表达式包括缺失语义成分,当从多个所述第一语用信息中提取与所述第二语用信息对应的分句为两个以上时,所述装置还包括:
[0027]提取单元,适于从用户输入信息中提取与其抽象语义表达式中缺失语义成分对应的填充内容;
[0028]最终答案获取单元,还适于除根据所述第二语用信息外,根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。
[0029]可选地,所述抽象语义推荐处理单元包括:
[0030]分词子单元,适于对所述用户输入信息进行分词处理,得到若干单独词;
[0031]词性标注子单元,适于分别对每个单独词进行词性标注处理,得到每个单独词的词性信息;
[0032]词类判断子单元,适于分别对每个单独词进行词类判断处理,得到每个单独词的词类信息;
[0033]搜索子单元,适于对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;
[0034]匹配子单元,适于根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。
[0035]与现有技术相比,本发明实施例的技术方案具有以下有益效果:
[0036]本发明实施例通过接收用户输入信息,获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案,当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息,并从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。上述过程由于通过第二语用信息来进一步确定答案,而第二语用信息表征了用户输入信息的语义指向的答案目标,从而可以锁定初始答案中的特定分句,进而可以筛选出与用户输入信息的语义更加接近的分句内容作为答案,剔除冗长的初始答案中的其他信息,使得智能问答系统的回复精准,也避免现有技术中回复冗长答案带来的用户体验差的问题。
[0037]进一步地,本发明实施例除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案,从而可以从根据第二语用信息获取的答案中进一步确定更加准确的答案,提高答案回复的准确性。
【附图说明】
[0038]图1是本发明实施例中的一种智能问答方法的流程图;
[0039]图2是本发明实施例中的一种抽象语义推荐处理方法的流程图;
[0040]图3是本发明实施例中的另一种智能问答方法的流程图;
[0041]图4是本发明实施例中的一种智能问答装置的结构示意图;
[0042]图5是本发明实施例中的另一种智能问答装置的结构示意图。
【具体实施方式】
[0043]如前所述,在很多领域的问答系统中,通过相似度计算得到的答案十分冗杂,包括了一些实际与用户问题无关的答案。例如在政务公开问答领域中,用户输入一个问句咨询“婚假是多少天”,按照现有的方式,获取“婚假是多少天”与知识库中所有问题的最高语义相似度,当最高语义相似度大于预设阈值时,返回相应的答案,但是该答案内容可能十分冗杂,包括引用过的一些法律法规的内容。然而,用户想问的其实是具体的婚假的天数,而并不关心关于婚假引用的现有规定,历史规定等等。因此智能问答系统回复的该答案是不够精准及简要的。
[0044]本发明实施例通过接收用户输入信息,获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案,当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息,并从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。上述过程由于通过第二语用信息来进一步确定答案,而第二语用信息表征了用户输入信息的语义指向的答案目标,从而可以锁定初始答案中的特定分句,进而可以筛选出与用户输入信息的语义更加接近的分句内容作为答案,剔除冗长的初始答案中的其他信息,使得智能问答系统的回复精准,也避免现有技术中回复冗长答案带来的用户体验差的问题。
[0045]为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0046]图1是本发明实施例中的一种智能问答方法的流程图。下面参照图1说明所示的步骤说明智能问答方法。
[0047 ]步骤S11:接收用户输入信息。
[0048]在具体实施中,所述用户输入信息可以通过键盘或触摸屏等人机交互装置输入的文本信息,也可以是通过语音输入后经过转换得到的文本信息。
[0049]步骤S102:获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案。
[0050]在具体实施中,需要提供问答知识库,所述问答知识库包括多个知识点,每个知识点包括答案以及多个问题,所述多个问题与答案具有对应关系。
[0051]在具体实施中,还可以对所述用户输入信息做一些预处理,比如去除脏词等,再获取与问答知识库中问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案。其中,所述预设相似度阈值可以根据需要进行不同设定。
[0052]一般而言,所述知识点中的答案内容的多少或复杂程度与智能问答系统应用的业务领域有关,在一些特定的业务领域,问题相关的答案内容可能出现长篇大论的情况。这是因为智能问答系统不能精准的理解用户问句的意图,所以在建立知识点时,对于答案的建设尽可能地使其与问句相关。比如跟问句信息中的关键词相关,而将用户输入问句的语义模糊化。因而,初始答案相对用户意图来说,是不够精准和简洁的。所以,需要进一步对初始答案进行后续处理。
[0053]步骤S103:当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息。
[0054]在具体实施中,判断所述初始答案是否有分句时,可以通过识别分隔符来实现,例如逗号、句号、分号和空格等。
[0055]在具体实施中,语用信息表征信息内容的有用性,也就是说对于用户问题的意图的有用性,所以语用信息表征了用户问题指向的答案目标,答案目标就是用户问题语义下希望得到的答案。例如,用户的问题是“如何开通信用卡”,那么希望得到的答案应该是一个关于开通信用卡的方法步骤的介绍,这时的语用信息为操作流程;又如,用户的问题是“为什么无法上网”,那么希望得到的答案给出无法上网的解释,那么这时的语用信息是原因解释;再如,用户的问题是“法定婚假是多少天”,希望得到的答案应该是一个日期,那么这时的语用信息是日期。其他语用信息还有具体金额、具体日期等等。
[0056]需要说明的是,所述语用信息不限于上述示例中的类别,表示方式也仅是为描述方便,其不应限制本发明的保护范围。
[0057]在具体实施中,所述语用关键词是具体表达语用信息的一些词汇,例如,语用信息为“原因解释”,即希望得到的答案是对“原因解释”的一些内容,那么在答案文本中表达原因解释的词汇可以是“原因”、“因为”、“由于”、“造成”、“导致”等这类说明原因需要用到的表达词汇。可以理解的是,可以预定义语用信息及其对应的语用关键词集合,那么当得到语用信息时,则可以得到对应的语用关键词有哪些。
[0058]在具体实施中,可以预先为所述问答知识库中每个答案设置第一语用信息,可以采用下述方式:
[0059]定义多个第一语用信息,每个第一语用信息对应一个或多个第一语用关键词;对每个所述初始答案进行分句处理;根据所述第一语用关键词为每个分句设置第一语用信息。
[0060]定义多个所述第一语用信息是为后续根据第二语用信息匹配第一语用信息时使用。由于第一语用关键词与特定类别的第一语用信息对应,那么根据分句中出现的第一语用关键词,可以设置该分句的第一语用信息。
[0061]在具体实施中,为所述问答知识库中每个答案设置第一语用信息时,可以在建立知识点时同步完成该设置。具体地,可以对知识点中的答案进行分句处理,之后根据分句中的具体语用关键词来判断应设置什么类别的第一语用信息,例如,分句中出现“导致”这个词,而如果“导致”预定义为“原因解释”这个类别的语用信息,那么可以设置该分句的第一语用信息为“原因解释”。
[0062]下面具体说明步骤S103中所述的推荐语义推荐处理,进行推荐语义推荐处理操作是为了得到与所述用户输入信息对应的抽象语义的类别和第二语用信息。
[0063]其中,所述抽象语义的类别表征了某一类用户问题所应对应答案的语义,例如,当抽象语义的类别为概念说明(如:[concept]是什么),表征了对应答案内容应该表达对某个概念的说明、定义或介绍。其他示例有:行为方式(如:[concept]如何[act1n])、行为原因(如:[concept]为什么会[act1n])、主体关系介绍(如:[concept]的[attribute]是谁)。其中,[concept]、[act1n]和[attribute]为抽象语义的缺失语义成分。[concept]表示主体或客体成份的词或短语,[act1n]表示动作成分的词或短语,[attribute]表示属性成份的词或短语。
[0064]需要说明的是,抽象语义的类别可以预先进行区分和定义,不限于上述示例。
[0065]所述抽象语义数据库中存储有多个抽象语义表达式,每个类别的抽象语义包括一个或多个抽象语义表达式。每个抽象语义表达式包括一个或多个缺失语义成分,后续根据抽象语义表达式中的缺失语义成分可以从所述用户输入信息中提取对应的填充内容。
[0066]下面以用户输入信息为“通过网上银行如何开通信用卡”为例说明本文所指的抽象语义表达式以及抽象语义推荐处理操作。
[0067]在一具体实施例中,所述抽象语义数据库中存储的若干抽象语义表达式包括:通过[conceptl] [act1n] [ concept2] ($如何)办理;通过[concept ]办理($如何)办理;[concept2] ($如何)通过[conceptI]办理;($如何)通过[concept]办理;通过[concept] ($如何)办理;通过[conceptl ]($如何)办理[concept2];通过[concept] [act1n] ($如何)办理;[concept2]通过[conceptl]($如何)办理;通过[conceptl]($如何)开通[concept2];通过[conceptl ]($如何)[act1n] [concept2]; [act1nI] [conceptl ]($如何)[act1n2][concept2];[act1nl ][conceptl ]($如何)[act1n2][concept2];哪里可以[act1n][concept] ; [act1n] [concept]的步骤;[conceptl ] [act1n] [concept2]。
[0068]上述语义表达式中,“[]”表示缺失语义成分,“[]”的内容表示该缺失语义成分的属性,语义表达式中其他内容表示语义规则词,具体的上述表达式中,“[concept]”,“[conceptl],,,“[concept2],,,“[act1n],,,“[act1nl],,,“[act1n2],,表不缺失语义成分,方框“[],,的内容“concept,,,“conceptl,,,“concept2,,,“act1n,,,“act1nl,,,“act1n2,,表示对应的缺失语义成分的属性,其中“concept”表示缺失语义成分“[concept]”为概念属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括用户输入信息中的一个具有名词词性的单独词,或者包括用户输入信息中一个具有名词词性的单独词以及若干具有其他词性的单独词的组合;“conceptl”表示缺失语义成分“[conceptl]”为第一个概念属性的缺失语义成分,其中“concept”和“I”结合表示该缺失语义成分的属性,“concept”表示概念属性,“I”表示位置属性,为第一个,后续填充该缺失语义成分的内容为至少包括用户输入信息中第一个具有名词词性的单独词,或者包括用户输入信息中第一个具有名词词性的单独词以及若干具有其他词性的单独词的组合;“concept2”表示缺失语义成分“[concept2]”为第二个概念属性的缺失语义成分,后续填充该缺失语义成分的内容为至少包括用户输入信息中第二个具有名词词性的单独词,或者包括用户输入信息中第二个具有名词词性的单独词以及若干其他词性的单独词的组合;“act1n”表示缺失语义成分“[act1n]”为动作属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括用户输入信息中的一个具有动词词性的单独词,或者包括用户输入信息中一个具有动词词性的单独词以及若干具有其他词性的单独词的组合;“act1nl”表示缺失语义成分“[act1nl]”为第一个具有动作属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括用户输入信息中的第一个具有动词词性的单独词,或者包括用户输入信息中第一个具有动词词性的单独词以及若干具有其他词性的单独词的组合;“act1n2”表示缺失语义成分“[act1n2]”为第二个具有动作属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括用户输入信息中的第二个具有动词词性的单独词,或者包括用户输入信息中第二个具有动词词性的单独词以及若干具有其他词性的单独词的组合。
[0069]上述各语义表达式中缺失语义成分之外的内容如“通过”,“($如何)”,“办理”,“开通”,“的步骤”等表示语义规则词,其中语义规则词“($如何)”表示“如何”这个语义规则词属于词类“$如何”,在一实施例中,所述“$如何”词类包括“如何”,“怎么”,“怎么样”,“怎样”等一组词义相近的词语,词类可以在建立抽象语义表达式时同时建立。相应的通过表示这个语义规则词属于词类“$通过”,在一实施例,所述词类“$开通”中包括关键词“开通”、“办理”、“订购” “申请”。后续在进行缺失语义成分的填充形成具体语义时,具有词类的语义规则词可以用该词类中的其他关键词代替。
[0070]需要说明的是,上述抽象语义表达式中缺失语义成分的表示方式以及词类信息的表示方式是为描述和表示的方便,仅作为一个示例,其不用限制本发明的保护范围,本发明的其他实施例中,对抽象语义表达式中缺失语义和词类信息可以采用其他的表示方式。
[0071]通过上述说明,可以了解到用户输入信息对应的抽象语义表达式及抽象语义类别的概念。下面参照图2所示说明步骤S103中所述的抽象语义推荐处理操作。通过抽象语义推荐处理操作,可以得到抽象语义表达式及抽象语义的类别。所述抽象语义推荐处理可以包括步骤S103a、步骤S103b、步骤S103c、步骤S103d和步骤S103h。
[0072]进行步骤S103a,对所述用户输入信息进行分词处理,得到若干单独词。
[0073]所述分词处理依据一定分词规则进行,在系统中预先设定分词的规则,进行分词处理时,调用设定的分词规则,对用户输入信息与对应的领域知识数据库中的预置知识分别进行分词处理。
[0074]所述分词处理可用采用正向(逆向)最大匹配法、最佳匹配法、逐词遍历法或词频统计法,或其他合适的分词方法。
[0075]下面仍以接收的用户输入信息为“通过网上银行如何开通信用卡”作为示例进行说明。
[0076]对用户输入信息“通过网上银行如何开通信用卡”进行分词处理,得到若干单独词“通过”,“网上银行”,“如何”,“开通”,“信用卡”。
[0077]进行步骤S103b,分别对每个所述单独词进行词性标注处理,得到每个单独词的词性信息。
[0078]对单独词进行词性标注处理,得到每个单独词的词性信息的目的是为后续将用户输入信息与抽象语义表达式的匹配提供匹配的依据。
[0079]具体以上例进行说明,标注上述的单独词“通过”的词性为第一个动词、介词,标注单独词“网上银行”的词性为第一个名词,标注单独词“如何”的词性为代词,标注单独词“开通”的词性为第二个动词,标注单独词“信用卡”的词性为第二个名词。需要说明的是词性标注为第一个名词时表示单独词“网上银行”为第一个具有名词词性的单独词,第二个名词、第一个动词或第二个动词的解释类似。
[0080]进行步骤S103c,分别对每个所述单独词进行词类判断处理,得到每个单独词的词类信息。
[0081]分别对每个所述单独词进行词类判断处理的目的是为了判断每个单独词是否具有相应的词类,在一实施例中,其具体过程为:将每个单独词与词类库中的若干词类进行匹配,若某一词类中存在该单独词,则该单独词具有相应的词类,当单独词具有相应的词类,则对该单独词进行属于某一词类(或词类信息)的标记,后续在进行匹配处理时,通过判断用户输入信息中部分内容与抽象语义表达式中的对应的语义规则词的是否属于同一词类,从而判断用户输入信息与该抽象语义表达式的匹配程度,提高了匹配的精度和效率。
[0082]进行步骤S103d,对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式。
[0083]对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集的目的是为了减少后续进行匹配处理时的负担以及减少处理时间,以提高系统的性能。
[0084]所述抽象语义候选集中抽象语义表达式的至少部分语义规则词与所述用户输入信息中至少部分单独词相同或属于同一词类。在一实施例中,进行搜索处理时,若某个抽象语义表达式的至少部分语义规则词与所述用户输入信息中至少部分单独词相同或属于同一词类,则将该抽象语义表达式作为抽象语义候选集中的一个抽象语义表达式。在其他实施例中,可以根据其他的搜索方式对抽象语义数据库进行搜索,得到与所述用户输入信息相关的抽象语义候选集。
[0085]在具体的实施例中,对抽象语义数据库进行搜索处理,得到与所述用户输入信息“通过网上银行如何开通信用卡”相关的抽象语义候选集包括抽象语义表达式:通过[conceptl][act1n][concept2]($ 如何)办理;通过[concept]办理($ 如何)办理;[concept2] ($如何)通过[conceptI]办理;($如何)通过[concept]办理;通过[concept] ($如何)办理;通过[conceptl ] ($如何)办理[concept2];通过[conceptl ] ($如何)开通[concept2];通过[concept][act1n]($ 如何)办理;通过[conceptl]($ 如何)开通[concept2] ; [concept2]通过[conceptl]($如何)办理;通过[conceptl ]($如何)[act1n][concept2]。上述抽象语义候选集中的抽象语义表达式部分语义规则词(通过,通过,办理或($如何))与所述用户输入信息中至少部分单独词(通过,办理或如何)相同或属于同一词类。
[0086]步骤S103h,根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。
[0087]具体的,通过匹配处理,得到与所述用户输入信息“通过网上银行如何开通信用卡”匹配的抽象语义表达式包括:通过[conceptl ]($如何)[act1nl ][concept2],该语义表达式中相应的缺失语义成分[conceptl]与单独词“网上银行”对应,缺失语义成分[concept〗]与单独词“信用卡”对应,缺失语义成分[act1nl]与单独词“开通”对应;通过[conceptl] ($如何)开通[concept2],该语义表达式中相应的缺失语义成分[conceptl]与单独词“网上银行”对应,缺失语义成分[cone印t2]与单独词“信用卡”对应。
[0088]此外,得到抽象语义表达式后,可以判断该抽象语义表达式属于哪一种抽象语义类别,例如上述用户输入信息的抽象语义表达式为“通过[conceptl] ($如何)[act1nl][concept〗]”,该抽象语义表达式属于行为方式介绍这个类别。需要说明的是,本领域技术人员应该可以理解如何将得到的抽象语义表达式划分到预定义的某个类别。
[0089]通过上述步骤S103a至步骤S103h可以得到用户输入信息对应的抽象语义表达式及抽象语义类别,以及该抽象语义表达式的各缺失语义成分。
[0090]在具体实施中,每个类别的抽象语义具有对应的第二语用信息。所述第二语用信息是所述抽象语义类别对应的语用信息,记为第二语用信息是为了区分上述第一语用信息,其表征的仍然是针对用户输入信息的答案目标。
[0091]例如,抽象语义的类别为“概念说明”,其对应的语用信息为“概念介绍”;又如,抽象语义的类别为“行为方式”,其对应的语用信息为“操作流程”;再如,抽象语义的类别为行为原因,其对应的语用信息为“原因介绍”,等等。
[0092]与所述第一语用信息类似,每个所述第二语用信息包括一个或多个的第一语用关键词,可参照上述第二语用关键词的说明,不再赘述。
[0093]通过建立抽象类别与第二语用信息的对应关系,可以根据用户输入信息得到其第二语用信息,进而找到与之匹配的第一语用信息,从而根据所述第一语用信息可以得到对应的分句,进而以该分句作为最终答案。具体见步骤S104的说明。
[0094]步骤S104:从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。
[0095]在具体实施中,判断所述第二语用信息与第一语用信息是否对应,或者是否匹配是根据各自的语用关键词进行判断的。具体而言,当第二语用信息的第二语用关键词与第一语用信息的第一语用关键词属于同一词类时,则所述第二语用信息与第一语用信息对应。
[0096]例如,所述第二语用信息的第二语用关键词中有“由于”一词,所述第一语用信息的第二语用关键词中有“因为”一词,则二者属于同一词类,那么所述第二语用信息与第一语用信息是对应的。
[0097]当所述初始答案包括多个分句,所述分句对应两个以上的第一语用信息时,则根据所述第二语用信息可以匹配到对应的第一语用信息,进而找到对应的分句作为答案。
[0098]下面以“为什么不能上网”为例,说明本实施例的各个步骤的实施。
[0099]实施步骤SlOl:接收用户输入信息“为什么不能上网”。
[0100]实施步骤S102:获取“为什么不能上网”与问答知识库中所有问题的最高语义相似度值,假设最高语义相似度值大于预设相似度阈值时,得到对应的初始答案。
[0101 ]实施步骤S103:得到的初始答案较为繁杂,包含了一些网络相关的内容,所述初始答案包括多个分句,且所述多个分句共对应三个第一语用信息时,分别有“原因解释”,“时间”和“操作流程”,每个第一语用信息对应各自的分句。对“为什么不能上网”进行抽象语义推荐处理,得到抽象语义的类别为“行为原因”,该抽象语义的类别对应的第二语用信息为“原因介绍”,第二语用关键词有“因为”、“由于”等。
[0102]实施步骤S104:由于第二语用信息为“原因介绍”中的第二关键词“因为”、“由于”等与第一语用信息中的“原因解释”这一语用信息的第一语用关键词属于同一词类,则判定所述第二语用信息与所述第一语用信息对应,则可根据第一语用信息“原因解释”确定对应的分句,并将确定的分句作为最终答案。
[0103]分析上例可知,步骤S102得到初始答案较为冗长,并没有具体针对用户的语义提供精准的答案,而是包括了其他无关紧要的内容。通过进一步实施后续步骤,通过抽象语义推荐处理得到抽象语义的类别,进而得到对应的第二语用信息,从而实现了一定程度的对用户输入信息的语义理解,得到应该获取的答案目标,再根据第二语用信息找到对应的第一语用信息,进而确定所述初始答案中的相应分句,从而锁定这些相应的分句作为最终答案,由于分句包括了属于第一语用信息的第一语用关键词“导致”,则推断该分句是对原因的具体介绍,将该分句作为最终答案给用户无疑是排除了其他不相关的内容,使得回复答案更加精准。
[0104]图3是本发明实施例中的另一种智能问答方法的流程图。下面参照图1和图3所示的步骤说明智能问答方法。
[0105]步骤S301:接收用户输入信息。
[0106]步骤S302:获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案。
[0107]步骤S303:当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息。
[0108]在本实施例中,步骤S301、步骤S302和步骤S303的具体实施可对应参照步骤S101、步骤S102和步骤S103的说明,不再赘述。
[0109]步骤S304:从用户输入信息中提取与其抽象语义表达式中缺失语义成分对应的填充内容。
[0110]在本实施例中,还利用到了进行抽象语义推荐处理得到的抽象语义表达式和缺失语义成分,所述抽象语义表达式和缺失语义成分在上述抽象语义推荐处理的说明中已一并说明,不再赘述。
[0111]步骤S305:除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。
[0112]在本实施例中,根据所述第二语用信息可以确定与所述第一语用信息对应的分句作为答案,具体实施可按照步骤S101。除此之外,本实施例还根据所述第二语用信息从锁定的分句中进一步筛选出更准确的答案。
[0113]例如,用户输入信息为“手机为什么不能上网”。通过实施步骤S301至步骤S303后,得到抽象语义的类别为“行为原因”,该抽象语义的类别对应的第二语用信息为“原因介绍”,第二语用关键词有“因为”、“由于”等,同时抽象语义推荐处理得到抽象语义表达式及其缺失语义成分。
[0114]实施步骤S304,从“手机为什么不能上网”中提取与其抽象语义表达式中缺失语义成分对应的填充内容,得到“手机”和“不能上网”。
[0115]在本实施例的步骤S305中,根据第二语用信息“原因介绍”可以找到匹配的第一语用信息,进而确定一个或多个分句,这些分句均为不能上网的原因表达。根据填充内容“手机”和“不能上网”中的“手机”可进一步确定包含“手机”的分句,从而将该分句作为最终答案。
[0116]通过上述过程和上述示例的说明可以得出,本发明实施例除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案,从而可以从根据第二语用信息获取的答案中进一步确定更加准确的答案,提高答案回复的准确性。
[0117]图4是本发明实施例中的一种智能问答装置的结构示意图。如图4所示的智能问答装置,可以包括:接收单元401、初始答案获取单元402、抽象语义推荐处理单元403和最终答案获取单元404。其中:
[0118]所述接收单元401,适于接收用户输入信息。
[0119]所述初始答案获取单元402,适于获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案。
[0120]所述抽象语义推荐处理单元403,适于当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用
?目息O
[0121]在具体实施中,所述抽象语义推荐处理单元403可以包括:
[0122]分词子单元,适于对所述用户输入信息进行分词处理,得到若干单独词;
[0123]词性标注子单元,适于分别对每个单独词进行词性标注处理,得到每个单独词的词性信息;
[0124]词类判断子单元,适于分别对每个单独词进行词类判断处理,得到每个单独词的词类信息;
[0125]搜索子单元,适于对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;
[0126]匹配子单元,适于根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。
[0127]所述最终答案获取单元404,适于从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。
[0128]在具体实施中,所述第二语用信息对应一个或多个第二语用关键词,所述第一语用信息对应一个或多个第一语用关键词,当所述第一语用关键词和所述第二语用关键词属于同一词类时,则对应所述第一语用关键词的第一语用信息与对应所述第二语用关键词的第二语用信息对应。
[0129]在具体实施中,所述智能问答装置40还可以包括:第一语用信息定义单元,适于定义多个第一语用信息,每个第一语用信息对应一个或多个第一语用关键词;分句处理单元,适于对每个所述初始答案进行分句处理;第一语用信息设置单元,适于根据所述第一语用关键词为每个分句设置第一语用信息。
[0130]本发明实施例通过接收用户输入信息,获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案,当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息,并从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。上述过程由于通过第二语用信息来进一步确定答案,而第二语用信息表征了用户输入信息的语义指向的答案目标,从而可以锁定初始答案中的特定分句,进而可以筛选出与用户输入信息的语义更加接近的分句内容作为答案,剔除冗长的初始答案中的其他信息,使得智能问答系统的回复精准,也避免现有技术中回复冗长答案带来的用户体验差的问题。
[0131]图5是本发明实施例中另一种智能问答装置的结构示意图。所述智能问答装置可以包括:接收单元501、初始答案获取单元502、抽象语义推荐处理单元503和最终答案获取单元504。其中:
[0132]所述接收单元501、所述初始答案获取单元502和所述抽象语义推荐处理单元503的说明可对应参照图4中所述接收单元401、所述初始答案获取单元402和所述抽象语义推荐处理单元403的说明,不再赘述。
[0133]所述智能问答装置还可以包括提取单元505,所述提取单元505适于从用户输入信息中提取与其抽象语义表达式中缺失语义成分对应的填充内容;最终答案获取单元,还适于除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。
[0134]在本实施例中,所述最终答案获取单元,适于从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案,还适于除根据所述第二语用信息外,根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。
[0135]本发明实施例通过除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案,从而可以从根据第二语用信息获取的答案中进一步确定更加准确的答案,提高答案回复的准确性。
[0136]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:R0M、RAM、磁盘或光盘等。
[0137]虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
【主权项】
1.一种智能问答方法,其特征在于,包括: 接收用户输入信息; 获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时,得到对应的初始答案; 当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息; 从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。2.根据权利要求1所述的智能问答方法,其特征在于,所述第二语用信息对应一个或多个第二语用关键词,所述第一语用信息对应一个或多个第一语用关键词,当所述第一语用关键词和所述第二语用关键词属于同一词类时,则对应所述第一语用关键词的第一语用信息与对应所述第二语用关键词的第二语用信息对应。3.根据权利要求1所述的智能问答方法,其特征在于,所述方法还包括: 预先为所述问答知识库中每个答案设置第一语用信息,具体包括: 定义多个第一语用信息,每个第一语用信息对应一个或多个第一语用关键词; 对每个所述初始答案进行分句处理; 根据所述第一语用关键词为每个分句设置第一语用信息。4.根据权利要求1所述的智能问答方法,其特征在于,进行抽象语义推荐处理还得到抽象语义表达式,所述抽象语义表达式包括缺失语义成分,当从多个所述第一语用信息中提取与所述第二语用信息对应的分句为两个以上时,所述方法还包括: 从用户输入信息中提取与其抽象语义表达式中缺失语义成分对应的填充内容; 除根据所述第二语用信息外,还根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。5.根据权利要求1所述的智能问答方法,其特征在于,所述抽象语义推荐处理包括: 对所述用户输入信息进行分词处理,得到若干单独词; 分别对每个单独词进行词性标注处理,得到每个单独词的词性信息; 分别对每个单独词进行词类判断处理,得到每个单独词的词类信息; 对所述抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式; 根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。6.一种智能问答装置,其特征在于,包括: 接收单元,适于接收用户输入信息; 初始答案获取单元,适于获取所述用户输入信息与问答知识库中所有问题的最高语义相似度值,当所述最高语义相似度值大于预设相似度阈值时, 得到对应的初始答案; 抽象语义推荐处理单元,适于当所述初始答案包括多个分句,且所述多个分句至少对应两个以上的第一语用信息时,根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式和抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义具有对应的第二语用信息; 最终答案获取单元,适于从所述初始答案中提取与所述第二语用信息对应的第一语用信息的分句作为最终答案。7.根据权利要求6所述的智能问答装置,其特征在于,所述第二语用信息对应一个或多个第二语用关键词,所述第一语用信息对应一个或多个第一语用关键词,当所述第一语用关键词和所述第二语用关键词属于同一词类时,则对应所述第一语用关键词的第一语用信息与对应所述第二语用关键词的第二语用信息对应。8.根据权利要求6所述的智能问答装置,其特征在于,所述装置还包括: 第一语用信息单元,适于定义多个第一语用信息,每个第一语用信息对应一个或多个第一语用关键词; 分句处理单元,适于对每个所述初始答案进行分句处理; 第一语用信息设置单元,适于根据所述第一语用关键词为每个分句设置第一语用信息。9.根据权利要求6所述的智能问答装置,其特征在于,所述抽象语义表达式包括缺失语义成分,当从多个所述第一语用信息中提取与所述第二语用信息对应的分句为两个以上时,所述装置还包括: 提取单元,适于从用户输入信息中提取与其抽象语义表达式中缺失语义成分对应的填充内容; 最终答案获取单元,还适于除根据所述第二语用信息外,根据所述填充内容从所述初始答案中提取与所述填充内容对应的分句作为最终答案。10.根据权利要求6所述的智能问答装置,其特征在于,所述抽象语义推荐处理单元包括: 分词子单元,适于对所述用户输入信息进行分词处理,得到若干单独词; 词性标注子单元,适于分别对每个单独词进行词性标注处理,得到每个单独词的词性信息; 词类判断子单元,适于分别对每个单独词进行词类判断处理,得到每个单独词的词类信息; 搜索子单元,适于对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式; 匹配子单元,适于根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。
【文档编号】G06F17/30GK105912629SQ201610213623
【公开日】2016年8月31日
【申请日】2016年4月7日
【发明人】曾永梅, 朱频频
【申请人】上海智臻智能网络科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1