基于抽象语义推荐的问答知识库建立方法、装置及系统的制作方法_2

文档序号:9865756阅读:来源:国知局
070]可选的,还包括:答案提供单元,用于提供与初始请求信息对应的答案;所述存入单元将所述初始请求信息存入智能问答知识库的同时,将答案提供单元提供的答案一并存入智能问答知识库。
[0071]本发明还提供了一种基于抽象语义推荐的问答知识库建立系统,包括:
[0072]抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;
[0073]上述的建立装置。
[0074]与现有技术相比,本发明的技术方案具有以下优点:
[0075]本发明基于抽象语义推荐的问答知识库建立方法,提供抽象语义数据库,在接收初始请求信息后,根据所述抽象语义数据库对所述初始请求信息进行抽象语义推荐处理,当获得与所述初始请求信息对应的一个或多个抽象语义表达式时,从所述初始请求信息中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述初始请求信息对应的一个或多个具体语义表达式,将该初始请求信息以及所述具体语义表达式存入智能问答知识库。因而本发明的方法用户只需要输入一条初始请求信息,本发明的方法可以对该初始请求信息进行自动的扩展,获得与该初始请求信息相关的若干条信息(一个或多个具体语义表达式),存入智能问答知识库,因此用户在建立智能问答知识库时,无需多次向智能问答知识库输入相关联的多个问题,从而提高了智能问答知识库的建立效率。
[0076]进一步,对单独词进行词性标注处理,得到每个单独词的词性信息的目的是为后续将输入的初始信息与抽象语义表达式的匹配提供匹配的依据,提高了后续匹配的精度和效率。
[0077]进一步,分别对每个所述单独词进行词类判断处理的目的是为了判断每个单独词是否具有相应的词类,在进行匹配处理时,通过判断初始请求信息中部分内容与抽象语义表达式中的对应的语义规则词的是否属于同一词类,从而判断初始请求信息与该抽象语义表达式的匹配程度,提高了匹配的精度和效率。
[0078]进一步,对抽象语义数据库进行搜索处理,得到与所述初始请求信息相关的抽象语义候选的目的是为了减少后续进行匹配处理时的负担以及减少处理时间,以提高系统的性能。
[0079]进一步,与所述初始请求信息匹配的抽象语义表达式满足以下条件:缺失语义成分对应的词性(或属性)包括对应的填充内容的词性;初始请求信息中填充内容外对应的单独词与语义规则词相同或两者属于同一词类;该抽象语义表达式与初始请求信息的顺序相同,使得获得的抽象语义表达式与初始请求信息匹配程度较高。
[0080]进一步,在进行词性标注处理和词类判断处理之前,进行识别每个单独词为语义规则词或非语义规则词的步骤,然后对识别为非语义规则词的每个单独词进行词性标注处理,对识别为语义规则词的每个单独词进行词类判断处理,因而词性标注处理和词类判断处理的对象分别是部分单独词,减少了词性标注处理和词类判断处理所需的时间,提高了处理效率。
[0081]进一步,当与所述初始请求信息匹配的抽象语义表达式的数目M大于需要存入智能问答知识库中具体语义表达式的数目N时,还包括:分别对与所述初始请求信息匹配的抽象语义表达式进行打分处理,因而可以将与初始请求信息最匹配的具体语义表达式存入智能问答知识库,从而保证建立的智能问答知识库具有较高的准确性。
[0082]本发明基于抽象语义推荐的问答知识库建立装置,接收单元在接收到用户输入的一条初始请求信息后,抽象语义推荐模块进行抽象语义的推荐处理,获得与所述初始请求信息对应的一个或多个具体语义表达式,填充单元在获得的一个或多个具体语义表达式表达的语义与初始请求信息所要表达的语义相同或近似,存入单元将一个或多个具体语义表达式及对应的初始请求信息存入智能问答知识库。本发明的建立装置,用户使用本发明的装置只需要输入一条初始请求信息,本发明的装置可以对该初始请求信息进行自动的扩展,获得与该初始请求信息相关的若干条信息(一个或多个具体语义表达式),存入智能问答知识库,因此用户在建立智能问答知识库时,无需多次向智能问答知识库输入相关联的多个问题,从而提高了智能问答知识库的建立效率。
[0083]本发明基于抽象语义推荐的问答知识库建立系统,除了包括建立装置外还包括抽象语义数据库,抽象语义数据库用于提供抽象语义表达式,因而在智能问答知识库的建立时,一个抽象语义数据库可以向不同的建立装置提供数据信息。
【附图说明】
[0084]图1为现有技术智能问答系统中的知识库建立装置的结构示意图;
[0085]图2?图6为本发明实施例基于抽象语义推荐的问答知识库建立方法的流程示意图;
[0086]图7?图10为本发明实施例基于抽象语义推荐的问答知识库建立装置的结构示意图;
[0087]图11为本发明实施例基于抽象语义推荐的问答知识库建立系统的结构示意图。
【具体实施方式】
[0088]下面结合附图对本发明的具体实施例做详细的说明。
[0089]图2?图6为本发明实施例基于抽象语义推荐的问答知识库建立方法的流程示意图;图7?图10为本发明实施例基于抽象语义推荐的问答知识库建立装置的结构示意图;图11为本发明实施例基于抽象语义推荐的问答知识库建立系统的结构示意图。
[0090]请参考图2,所述基于抽象语义推荐的问答知识库建立方法,包括步骤:
[0091]步骤SlOl,提供抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;
[0092]步骤S102,接收初始请求信息;
[0093]步骤S103,根据所述抽象语义数据库对所述初始请求信息进行抽象语义推荐处理;
[0094]步骤S104,当获得与所述初始请求信息对应的一个或多个抽象语义表达式时,从所述初始请求信息中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述初始请求信息对应的一个或多个具体语义表达式;
[0095]步骤S105,将该初始请求信息以及所述具体语义表达式存入智能问答知识库。
[0096]下面对上述过程进行详细的描述。
[0097]进行步骤SlOl,提供抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分。
[0098]所述抽象语义数据库中存储有多个抽象语义表达式,每个抽象语义表达式包括缺失语义成分,后续在抽象语义表达式中的缺失语义成分对应的位置填充内容构成具体语义表达式。
[0099]所述抽象语义表达式中除了包括缺失语义成分之外,还可以包括语义规则词。在一实施例中,所述语义规则词还标注有词类信息,词类信息表示该规则词属于某一词类,一个词类中具有若干用法相同或语义相近的若干关键词。
[0100]所述抽象语义表达式可以只具有缺失语义成分,将这种形式的抽象语义表达式定义为默认集合。
[0101]—个抽象语义表达式中可以包括多个缺失语义成分,每个缺失语义成分具有对应的属性,并且不同缺失语义成分的属性不同,缺失语义成分的属性定义了填充该缺失语义成分对应的内容的属性,即初始请求信息中只有满足缺失语义成分对应属性的部分内容才能填充对应的缺失语义成分,从而形成具体语义表达式。
[0102]在一具体实施例中,所述抽象语义数据库中存储的若干抽象语义表达式包括:通过[conceptl] [act1n] [ concept2] ($如何)办理;通过[concept ]办理($如何)办理;[concept2] ($如何)通过[conceptI]办理;($如何)通过[concept]办理;通过[concept] ($如何)办理;通过[conceptl ]($如何)办理[concept2];通过[concept] [act1n] ($如何)办理;[concept2]通过[conceptl]($如何)办理;通过[conceptl]($如何)开通[concept2];通过[conceptl ]($如何)[act1n] [concept2]; [act1nI] [conceptl ]($如何)[act1n2][concept2];[act1nl ][conceptl ]($如何)[act1n2][concept2];哪里可以[act1n][concept] ; [act1n] [concept]的步骤;[conceptl ] [act1n] [concept2]。
[0103]上述语义表达式中,“[]”表示缺失语义成分,“[]”的内容表示该缺失语义成分的属性,语义表达式中其他内容表示语义规则词,具体的上述表达式中,“[concept]”,“[conceptl],,,“[concept2],,,“[act1n],,,“[act1nl],,,“[act1n2],,表不缺失语义成分,“[],,的内容“concept,,,“conceptl,,,“concept2,,,“act1n,,,“act1nl,,,“act1n2,,表不对应的缺失语义成分的属性,其中“concept”表示缺失语义成分“[concept]”为概念属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括初始请求信息中的一个具有名词词性的单独词,或者包括初始请求信息中一个具有名词词性的单独词以及若干具有其他词性的单独词的组合;“conceptl”表示缺失语义成分“[conceptI]”为第一个概念属性的缺失语义成分,其中“concept”和“I”结合表示该缺失语义成分的属性,“concept”表示概念属性,“I”表示位置属性,为第一个,后续填充该缺失语义成分的内容为至少包括初始请求信息中第一个具有名词词性的单独词,或者包括初始请求信息中第一个具有名词词性的单独词以及若干具有其他词性的单独词的组合;“concept2”表示缺失语义成分“[concept2]”为第二个概念属性的缺失语义成分,后续填充该缺失语义成分的内容为至少包括初始请求信息中第二个具有名词词性的单独词,或者包括初始请求信息中第二个具有名词词性的单独词以及若干其他词性的单独词的组合;“act1n”表示缺失语义成分“[act1n]”为动作属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括初始请求信息中的一个具有动词词性的单独词,或者包括初始请求信息中一个具有动词词性的单独词以及若干具有其他词性的单独词的组合;“act1nl”表示缺失语义成分“[act1nl ]”为第一个具有动作属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括初始请求信息中的第一个具有动词词性的单独词,或者包括初始请求信息中第一个具有动词词性的单独词以及若干具有其他词性的单独词的组合;“act1n2”表示缺失语义成分“[act1n2]”为第二个具有动作属性的缺失语义成分,后续填充该缺失语义成分的内容至少包括初始请求信息中的第二个具有动词词性的单独词,或者包括初始请求信息中第二个具有动词词性的单独词以及若干具有其他词性的单独词的组合。
[0104]上述各语义表达式中缺失语义成分之外的内容如“通过”,“($如何)”,“办理”,“开通”,“的步骤”等表示语义规则词,其中语义规则词“($如何)”表示“如何”这个语义规则词属于词类“$如何”,在一实施例中,所述“$如何”词类包括关键词“如何”,“怎么”,“怎么样”,“怎样”,词类可以在建立抽象语义表达式时同时建立。相应的通过表示这个语义规则词属于词类通过”,在一实施例,所述词类“$开通”中包括关键词“开通”、“
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1