基于抽象语义推荐的问答知识库建立方法、装置及系统的制作方法_3

文档序号:9865756阅读:来源:国知局
办理”、“订购” “申请”。后续在进行缺失语义成分的填充形成具体语义时,具有词类的语义规则词可以用该词类中的其他关键词代替。
[0?05] 上述语义表达式中,将语义表达式“[conceptI] [act1n] [concept2]”定义为默认隹A
口 O
[0106]需要说明的是,上述抽象语义表达式中缺失语义成分的表示方式以及词类信息的表示方式是为描述和表示的方便,仅作为一个示例,其不用限制本发明的保护范围,本发明的其他实施例中,对抽象语义表达式中缺失语义和词类信息可以采用其他的表示方式。
[0107]进行步骤S102,接收初始请求信息。
[0108]所述初始请求信息为需要进行抽象语义推荐的信息。
[0109]在一实施例中,所述初始请求信息为人机界面输入的信息,比如所述初始请求信息为键盘或触摸屏等输入的文本信息,或者所述初始信息也可以从话筒输入,然后经语音识别引擎转化为的文本信息。
[0110]以办理信用卡作为示例进行说明,本实施例中,所述接收的初始请求信息为“通过网上银行如何开通信用卡”。
[0111]进行步骤S103,根据所述抽象语义数据库对所述初始请求信息进行抽象语义推荐处理,获得与所述初始请求信息对应的一个或多个抽象语义表达式。
[0112]进行抽象语义推荐处理的目的是从抽象语义数据库中获得与所述初始请求信息对应的一个或多个抽象语义表达式,从而可以将初始请求信息部分内容填充在该一个或多个抽象语义表达式中的对应的缺失语义成分以得到一个或多个具体语义表达式,一个或多个具体语义表达式表达的语义与初始请求信息所要表达的语义相同或近似,后续可以将获得一个或多个具体语义表达式及对应的初始请求信息存入智能问答知识库,因而用户只需要输入一条初始请求信息,本发明的方法可以对该初始请求信息进行自动的扩展,获得与该初始请求信息相关的若干条信息(一个或多个具体语义表达式),存入智能问答知识库,提高了智能问答知识库的建立效率。
[0113]本实施例中可以将初始请求信息作为标准问,将具体语义表达式作为对应的扩展问,并将所述初始请求信息存入智能问答知识库的同时,提供与所述初始请求信息对应的答案,并将该答案一并存入智能问答知识库,从而形成智能问答知识库的一个知识点,后续可以不断对该知识点进行更新优化。
[0114]在一实施例中,请参考图3,步骤S103包括步骤S103a、步骤S103b、步骤S103c、步骤S103d和步骤S103h五个子步骤。
[0115]进行步骤S103a,对所述初始请求信息进行分词处理,得到若干单独词。
[0116]所述分词处理依据一定分词规则进行,在系统中预先设定分词的规则,进行分词处理时,调用设定的分词规则,对初始请求信息与对应的领域知识数据库中的预置知识分别进行分词处理,形成若干词条构成的两个词条串。
[0117]所述分词处理可用采用正向(逆向)最大匹配法、最佳匹配法、逐词遍历法或词频统计法,或其他合适的分词方法。
[0118]以接收的初始请求信息为“通过网上银行如何开通信用卡”作为示例进行说明。
[0119]对初始请求信息“通过网上银行如何开通信用卡”进行分词处理,得到若干单独词“通过”,“网上银行”,“如何”,“开通”,“信用卡”。
[0120]进行步骤S103b,分别对每个所述单独词进行词性标注处理,得到每个单独词的词性信息。
[0121]对单独词进行词性标注处理,得到每个单独词的词性信息的目的是为后续将输入的初始信息与抽象语义表达式的匹配提供匹配的依据。
[0122]具体的,在一实施例中,标注上述的单独词“通过”的词性为第一个动词、介词,标注单独词“网上银行”的词性为第一个名词,标注单独词“如何”的词性为代词,标注单独词“开通”的词性为第二个动词,标注单独词“信用卡”的词性为第二个名词。需要说明的是词性标注为第一个名词时表示单独词“网上银行”为第一个具有名词词性的单独词,第二个名词、第一个动词或第二个动词的解释类似。
[0123]在另一实施例中,标注上述的单独词“通过”的词性为动词、介词,标注单独词“网上银行”的词性为第一个名词,标注单独词“如何”的词性为代词,标注单独词“开通”的词性为动词,标注单独词“信用卡”的词性为第二个名词。
[0124]在进行词性标注时,还可以结合上下文的语义环境,以提高词性标注的准确率。
[0125]进行步骤S103c,分别对每个所述单独词进行词类判断处理,得到每个单独词的词类信息。
[0126]分别对每个所述单独词进行词类判断处理的目的是为了判断每个单独词是否具有相应的词类,在一实施例中,其具体过程为:将每个单独词与词类库中的若干词类进行匹配,若某一词类中存在该单独词,则该单独词具有相应的词类,当单独词具有相应的词类,则对该单独词进行属于某一词类(或词类信息)的标记,后续在进行匹配处理时,通过判断初始请求信息中部分内容与抽象语义表达式中的对应的语义规则词的是否属于同一词类,从而判断初始请求信息与该抽象语义表达式的匹配程度,提高了匹配的精度和效率。
[0127]具体的,对单独词“通过”,“网上银行”,“如何”,“开通”,“信用卡”进行词类判断处理,通过判断,单独词“如何”具有对应的词类“$如何”,所述“$如何”词类中包括关键词“如何”,“怎么”,“怎么样”,“怎样”,对单独词“如何”进行属于词类如何”的标记。单独词“开通”具有对应的词类开通”,所述词类“$开通”中包括关键词“开通”、“办理”、“订购” “申请”。后续在进行缺失语义成分的填充形成具体语义时,具有词类的某一单独词对某个缺失语义成分进行填充时,可以将该词类中的其他关键词代替该单独词对对应的某个缺失语义成分进行填充。
[0128]进行步骤S103d,对抽象语义数据库进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式。
[0129]对抽象语义数据库进行搜索处理,得到与所述初始请求信息相关的抽象语义候选的目的是为了减少后续进行匹配处理时的负担以及减少处理时间,以提高系统的性能。
[0130]所述抽象语义候选集中抽象语义表达式的至少部分语义规则词与所述初始请求信息中至少部分单独词相同或属于同一词类。在一实施例中,进行搜索处理时,根据抽象语义数据库中的抽象语义表达式的至少部分语义规则词与所述初始请求信息中至少部分单独词是否相同或是否属于同一词类,若某个抽象语义表达式的至少部分语义规则词与所述初始请求信息中至少部分单独词相同或属于同一词类,则将该抽象语义表达式作为抽象语义候选集中的一个抽象语义表达式。在其他实施例中,可以根据其他的搜索方式对抽象语义数据库进行搜索,得到与所述初始请求信息相关的抽象语义候选集。
[0131]在具体的实施例中,对抽象语义数据库进行搜索处理,得到与所述初始请求信息“通过网上银行如何开通信用卡”相关的抽象语义候选集包括抽象语义表达式:通过[conceptl][act1n][concept2]($ 如何)办理;通过[concept]办理($ 如何)办理;[concept2] ($如何)通过[conceptI]办理;($如何)通过[concept]办理;通过[concept] ($如何)办理;通过[conceptl ] ($如何)办理[concept2];通过[conceptl ] ($如何)开通[concept2];通过[concept][act1n]($ 如何)办理;通过[conceptl]($ 如何)开通[concept2] ; [concept2]通过[conceptl]($如何)办理;通过[conceptl ]($如何)[act1n][concept2] ; [act1nl ] [conceptl ] ($如何)[act1n2] [concept2] ; [act1nl ] [conceptl ]($如何)[act1n2][concept2]。上述抽象语义候选集中的抽象语义表达式部分语义规则词(通过,通过,办理或($如何))与所述初始请求信息中至少部分单独词(通过,办理或如何)相同或属于同一词类。
[0132]步骤S103h,根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。
[0133]在一实施例中,与所述初始请求信息匹配的抽象语义表达式满足以下条件:缺失语义成分对应的词性(或属性)包括对应的填充内容的词性;初始请求信息中填充内容外对应的单独词与语义规则词相同或两者属于同一词类;该抽象语义表达式与初始请求信息的顺序相同。即进行匹配时,根据以上条件进行匹配,当抽象语义候选集中某一个抽象语义表达式同时满足上述三个条件时,该抽象语义表达式即为与所述初始请求信息匹配的抽象语义表达式,以提高匹配的精度和准确度。即进行匹配处理时,根据上述条件判断某抽象语义表达式是否为与初始请求信息匹配的抽象语义表达式。
[0134]在其他实施例中,与所述初始请求信息匹配的抽象语义表达式可以只满足前述的一个或两个条件,具体为,与所述初始请求信息匹配的抽象语义表达式满足以下条件:缺失语义成分对应的词性(或属性)包括对应的填充内容的词性。或者,与所述初始请求信息匹配的抽象语义表达式满足以下条件:缺失语义成分对应的词性(或属性)包括对应的填充内容的词性;初始请求信息中填充内容外对应的单独词与语义规则词相同或两者属于同一词类。或者,与所述初始请求信息匹配的抽象语义表达式满足以下条件:缺失语义成分对应的词性(或属性)包括对应的填充内容的词性;该抽象语义表达式与初始请求信息的顺序相同。
[0135]具体的,通过匹配处理,得到与所述初始请求信息“通过网上银行如何开通信用卡”匹配的抽象语义表达式包括:通过[conceptl ]($如何)[act1n] [concept2],该语义表达式中相应的缺失语义成分[conceptl]与单独词“网上银行”对应,缺失语义成分[act 1n ]与单独词“开通”对应,缺失语义成分[concept〗]与单独词“信用卡”对应;[act1nl][conceptliKMlHsniiact1r^HconceptS],该语义表达式中相应的缺失语义成分[conceptl]与单独词“网上银行”对应,缺失语义成分[act1nl]与单独词“通过”对应;缺失语义成分[concept〗]与单独词“信用卡”对应,缺失语义成分[act1n2]与单独词“开通”对应;通过[conceptI ] ($如何)开通[concept2],该语义表达式中相应的缺失语义成分[conc印tl]与单独词“网上银行”对应,缺失语义成分[conc印t2]与单独词“信用卡”对应。
[0136]在其他实施例中,当无法获得与所述初始请求信息对应的抽象语义表达式时,还可以通过人工方式在所述智能问答知识库中添加与所述初始请求信息对应的扩展问。
[0137]在另一实施例中,请参考图4,步骤S103包括步骤S103a、步骤S103b、步骤S103c、步骤S103d、步骤S103e、步骤S103f、步骤S103g和步骤S103h八个子步骤,本实施例中与前一实施例的区别在于在进行步骤S103d之后以及步骤S103h之前,还要进行步骤S103e、步骤S103f、步骤S103g。本实施例中的目的是防止抽象语义候选集中的抽象语义表达式的数量过多或过少,以提高智能问答知识库的建立效率和精确度。
[0138]下面对步骤S103
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1