抽象语义的推荐方法、推荐装置及推荐系统的制作方法_5

文档序号:9911161阅读:来源:国知局
信用卡”对应,每个缺失语义成分均有对应的填充内容,因而该抽象语义表达式的缺失语义成分匹配的数量很多,得分较高。
[0164]方式二,设定一抽象语义表达式中某一缺失语义成分为核心语义成分,其他缺失语义成分与该核心语义成分的距离越近,得分越高。
[0165]比如,通过匹配处理,得到与所述初始请求信息“通过网上银行如何开通信用卡”匹配的抽象语义表达式,包括,抽象语义表达式I:通过[concept I ] ($如何)[act1n][concept2];抽象语义表达式2: [act1nl ] [conceptl ]($如何)[act1n2] [concept2]。
[0166]设定缺失语义成分[concept2]为核心语义成分,由于抽象语义表达式2中,缺失语义成分[act1nl]距离核心语义成分[concept2]的距离大于抽象语义表达式I中缺失语义成分[concept I]距离核心语义成分[concept2]的距离,抽象语义表达式I的得分高于抽象语义表达式2的得分。
[0167]方式三,词性置信度越大,得分越高。当多个单独词构成的内容填充抽象语义表达式中对应的某一缺失语义成分时,若填充内容的某个位置的一个单独词为业务属性词汇时,则该抽象语义表达式得分较高。
[0168]在一实施例中,当至少两个单独词构成的内容填充抽象语义表达式中对应的某一缺失语义成分时,若所述内容的末尾的一个单独词为业务属性词汇,则该抽象语义表达式得分较高。
[0169]比如,当填充某一填充抽象语义表达式中某一缺失语义成分对应的内容为“个人信用卡”时,该内容有两个单独词“个人”和“信用卡”构成,“个人信用卡”中的末尾的一个单独词为“信用卡”,单独词“信用卡”属于业务属性词汇,则该抽象语义表达式得分较高。
[0170]方式四,根据预先设定的抽象语义表达式的优先级,优先级越高,得分越高。
[0171]在建立抽象语义数据库时,可以定义抽象语义数据库中某些抽象语义表达式的优先级较高,在匹配处理时,如果得到该优先级较高的抽象语义表达式,则该优先级较高的抽象语义表达式的得分较高。
[0172]比如,在建立抽象语义数据库时,定义抽象语义表达式“通过[conceptl]($如何)[act1n] [concept2]”具有较高的优先级。在具体的实施例中,可以对该抽象语义表达式打上标记,该标记代表该抽象语义表达式的具有较高的优先级,或者该标记表示该抽象语义表达式的优先级别的尚低。
[0173]通过匹配处理,得到与所述初始请求信息“通过网上银行如何开通信用卡”匹配的抽象语义表达式为:通过[conceptl ]($如何)[act1n] [concept2],由于该语义表达式的具有较高的优先级,因而得分较高。
[0174]方式五,根据自然语言模型进行判断,对爬取的大量语料数据的分词给出对抽象语义表达式进行填充后获得的数据信息语义是否正确的概率,概率越高,得分越高。
[0175]需要说明的是,进行步骤S109时,本实施例可以根据不同的设定,仅将得分最靠前的一个具体语义表达式及对应的初始请求信息一并存入智能问答知识库,也可以将得分最靠前的多个具体语义表达式及对应的初始请求信息一并存入智能问答知识库。
[0176]本发明的方法既可以用于建立知识库的过程中,也可以用于信息检索的过程中,还可以用于其他的信息处理过程中。
[0177]本发明实施例还提供了一种抽象语义的推荐装置,请参考图8,包括:
[0178]抽象语义表达式获取单元301,用于获取多个抽象语义表达式;
[0179]接收单元302,用于接收初始请求信息;
[0180]分词单元303,用于对所述初始请求信息进行分词处理,得到若干单独词;
[0181]词性标注单元304,用于至少对部分所述单独词进行词性标注处理,得到单独词的词性信息;
[0182]词类判断单元305,用于至少对部分所述单独词进行词类判断处理,得到单独词的词性信息;
[0183]搜索单元306,用于对获取的多个抽象语义表达式进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;
[0184]匹配单元307,用于根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。
[0185]所述推荐装置还包括:数目判断单元、去除单元和补充单元,其中:数目判断单元,用于判断所述抽象语义候选集中抽象语义表达式的数目是否位于预定范围内;去除单元,用于当所述抽象语义候选集中抽象语义表达式的数目大于预定范围时,去除部分抽象语义表达式;补充单元,用于当所述抽象语义候选集中抽象语义表达式的数目小于预定范围时,从默认集合中补充部分抽象语义表达式。
[0186]所述抽象语义表达式还包括语义规则词;所述搜索单元306搜索得到的所述抽象语义候选集中抽象语义表达式的至少部分语义规则词与所述初始请求信息中至少部分单独词相同或属于同一词类。
[0187]所述抽象语义表达式包括缺失语义成分;所述匹配单元307得到与所述初始请求信息匹配的抽象语义表达式满足以下条件:
[0188]缺失语义成分对应的词性包括对应的填充内容的词性;
[0189]初始请求信息中填充内容外对应的关键词与语义规则词相同或两者属于同一词类;
[0190]该抽象语义表达式与初始请求信息的顺序相同。
[0191 ]在一实施例中,所述词性标注单元304进行词性标注处理时,分别对每个所述单独词进行词性标注处理,得到每个单独词的词性信息;词类判断单元305进行词类判断处理时,分别对每个所述单独词进行词类判断处理,得到每个单独词的词类信息。
[0192]在一实施例中,请参考图9,所述推荐装置还包括:规则词识别单元308,用于将每个单独词识别为语义规则词或非语义规则词;所述词性标注单元304进行词性标注处理时,分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;所述词类判断单元305进行词类判断处理时,分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息。
[0193]在另一实施例中,请参考图10,所述抽象语义表达式包括缺失语义成分,所述推荐装置还包括填充单元309,用于当获得与所述初始请求信息对应的一个或多个抽象语义表达式时,从所述初始请求信息中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述初始请求信息对应的一个或多个具体语义表达式。
[0194]在一实施例中,所述推荐装置还可以包括打分单元312,用于当匹配单元307获得的与所述初始请求信息匹配的抽象语义表达式的数目M大于预设数目N时,分别对与所述初始请求信息匹配的抽象语义表达式进行打分处理,填充单元309将提取的内容填充到得分较高的N个抽象语义表达式对应的缺失语义成分,得到与所述初始请求信息对应的N个具体语义表达式。
[0195]所述打分单元312采用以下一种或多种方式的结合进行打分处理:
[0196]缺失语义成分匹配的数量越多,得分越高;
[0197]设定一抽象语义表达式中某一缺失语义成分为核心语义成分,其他缺失语义成分与该核心语义成分的距离越近,得分越高;
[0198]词性置信度越大,得分越高;
[0199]根据预先设定的抽象语义表达式的优先级,优先级越高,得分越高;
[0200]根据自然语言模型进行判断,对爬取的大量语料数据的分词给出对抽象语义表达式进行填充后获得的数据信息语义是否正确的概率,概率越高,得分越高。
[0201]需要说明的是,当匹配单元无法获得与所述初始请求信息对应的抽象语义表达式时,通过人工方式添加与所述初始请求信息对应的扩展问。
[0202]需要说明的是,本实施例和后续实施例关于推荐装置的某个单元(或模块)功能的其他限定或描述请参考前述抽象语义的推荐方法部分的相关限定或描述,在此不再赘述。
[0203]在另一实施例中,当将上述抽象语义的推荐装置用于智能问答知识库的建立时,请参考图11,所述推荐装置还可以包括:存入单元310,用于将填充单元309获得的具体语义表达式以及对应的初始请求信息存入智能问答知识库311。在一实施例中,所述推荐装置还包括:答案提供单元(图中未示出),用于提供与初始请求信息对应的答案;所述存入单元将所述初始请求信息存入智能问答知识库的同时,将答案提供单元提供的答案一并存入智能问答知识库。
[0204]本发明还提供了一种抽象语义的推荐系统,请参考图12,包括:
[0205]抽象语义数据库501,所述抽象语义数据库501包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;
[0206]抽象语义的推荐装置21,所述抽象语义的推荐装置21包括:
[0207]抽象语义表达式获取单元301,用于从抽象语义数据库501获取多个抽象语义表达式;
[0208]接收单元302,用于接收初始请求信息;
[0209]分词单元303,用于对所述初始请求信息进行分词处理,得到若干单独词;
[0210]词性标注单元304,用于至少对部分所述单独词进行词性标注处理,得到单独词的词性信息;
[0211]词类判断单元305,用于至少对部分所述单独词进行词类判断处理,得到单独词的词性信息;
[0212]搜索单元306,用于对抽象语义表达式获取单元获取的多个抽象语义表达式进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;
[0213]匹配单元307,用于根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。
[0214]当将上述抽象语义的推荐系统用于智能问答知识库的建立时,所述推荐系统还可以包括:填充单元309,用于当获得与所述初始请求信息对应的一个或多个抽象语义表达式时,从所述初始请求信息中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述初始请求信息对应的一个或多个具体语义表达式:存入单元310,用于将所述具体语义表达式以及对应的初始请求信息存入智能问答知识库311。
[0215]可以对对抽象语义数据库501中抽象语义表达式进行编辑操作,所述编辑操作包括:增加、删除、替换等操作。
[0216]需要说明的是,关于建立系统的各单元、模块的其他限定或描述,请参考前述实施例,在此不再赘述。
[0217]综上,本发明实施例的抽象语义的推荐方法,在接收到初始请求信息后,对所述初始请求信息进行分词处理,得到若干单独词;至少对部分所述单独词进行词性标注处理,得到单独词的词性信息;至少对部分所述单独词进行词类判断处理,得到单独词的词类信息;对抽象语义数据库进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。进行分词处理后,得到若干单独词,若干单独词为后续步骤的对象,使得后续的步骤针对性强,减少本发明方法推荐的难度;对单独词进行词性标注处理,得到每个单独词的词性信息的目的是为后续将输入的初始信息与抽象语义表达式的匹配提供匹配的依据,提高了后续匹配的精度和效率;分别对每个所述单独词进
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1