抽象语义的推荐方法、推荐装置及推荐系统的制作方法

文档序号:9911161阅读:412来源:国知局
抽象语义的推荐方法、推荐装置及推荐系统的制作方法
【技术领域】
[0001]本发明涉及数据处理技术领域,特别涉及一种抽象语义的推荐方法、推荐装置及推荐系统。
【背景技术】
[0002]在过去的二十年里,数据库系统和人工智能的理论和应用,分别作为计算机科学与技术的两个不同领域,近年来围绕信息智能处理这一方向,他们的结合更为的密切。
[0003]—方面,随着数据库理论的深入研究,为了克服数据库模型在表达能力的方面的不足,加强语义知识成分,使得数据库具有推理能力,已经提出了若干更高抽象层次的概念模型,有的已经利用了相应的知识表达方式。另一方面,无论是人工智能理论本身,还是人工智能的技术和应用,都有一个以知识来描述的完成智力行为的能力问题,即如何建立知识库的问题。
[0004]知识库,又称为智能数据库或人工智能数据库。知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
[0005]知识库有着广泛的应用,典型的应用有智能问答系统或自动问题系统,自动问题系统中存储着一些预设的问题,并存储预设问题对应的答案信息,在公众用户提出问题时,自动问题系统会将公众用户提出的问题与预设的问题进行匹配,若匹配成功,自动问题系统会将该预设问题对应的答案信息反馈给公众用户。
[0006]参考图1,图1为现有技术智能问答系统中的知识库推荐装置的结构示意图,包括:人机界面10,用于输入待存储的问题;存入单元11,用于接收人机界面10输入的待存储问题,并将接收的待存储问题存入问题库12;问题库12,用于存储接收的待存储问题。
[0007]现有技术在对知识库进行建立时,需要人工从人机界面输入不同表达方式的多个问题,用户从人机界面输入什么问题,问题库就存储什么问题,费时费力,效率很低,现有的推荐装置并不能根据用户的请求自动的向问题库推荐内容。

【发明内容】

[0008]本发明解决的问题是怎样获得与初始请求信息较匹配的推荐内容。
[0009]为解决上述问题,本发明提供了一种抽象语义的推荐方法,包括:
[0010]提供抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式;
[0011]接收初始请求信息;
[0012]对所述初始请求信息进行分词处理,得到若干单独词;
[0013]至少对部分所述单独词进行词性标注处理,得到单独词的词性信息;
[0014]至少对部分所述单独词进行词类判断处理,得到单独词的词类信息;
[0015]对抽象语义数据库进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;
[0016]根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。
[0017]可选的,还包括:进行分词处理后,将每个单独词识别为语义规则词或非语义规则词;进行词性标注处理时,分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;进行词类判断处理时,分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息。
[0018]可选的,进行词性标注处理时,分别对每个单独词进行词性标注处理,得到每个单独词的词性信息;进行词类判断处理时,分别对每个单独词进行词类判断处理,得到每个单独词的词类信息。
[0019]可选的,在进行匹配处理之前还包括:判断所述抽象语义候选集中抽象语义表达式的数目是否位于预定范围内,当所述抽象语义候选集中抽象语义表达式的数目大于预定范围时,去除部分抽象语义表达式;当所述抽象语义候选集中抽象语义表达式的数目小于预定范围时,从默认集合中补充部分抽象语义表达式。
[0020]可选的,所述抽象语义表达式包括语义规则词;所述抽象语义候选集中抽象语义表达式的至少部分语义规则词与所述初始请求信息中至少部分单独词相同或属于同一词类。
[0021]可选的,所述抽象语义表达式包括缺失语义成分;与所述初始请求信息匹配的抽象语义表达式满足以下条件:
[0022]缺失语义成分对应的词性包括对应的填充内容的词性;
[0023]初始请求信息中填充内容外对应的单独词与语义规则词相同或两者属于同一词类;
[0024]该抽象语义表达式与初始请求信息的顺序相同。
[0025]可选的,所述抽象语义表达式包括缺失语义成分,所述推荐方法还包括:当获得与所述初始请求信息对应的一个或多个抽象语义表达式时,从所述初始请求信息中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述初始请求信息对应的一个或多个具体语义表达式。
[0026]可选的,当与所述初始请求信息匹配的抽象语义表达式的数目M大于预设数目N时,还包括:
[0027]分别对与所述初始请求信息匹配的抽象语义表达式进行打分处理,从所述初始请求信息中提取与得分较高的N个抽象语义表达式的缺失语义成分对应的内容,将提取的内容填充到得分较高的N个抽象语义表达式对应的缺失语义成分,得到与所述初始请求信息对应的N个具体语义表达式。
[0028]可选的,所述打分处理采用以下一种或多种方式的结合:
[0029]缺失语义成分匹配的数量越多,得分越高;
[0030]设定一抽象语义表达式中某一缺失语义成分为核心语义成分,其他缺失语义成分与该核心语义成分的距离越近,得分越高;
[0031]词性置信度越大,得分越高;
[0032]根据预先设定的抽象语义表达式的优先级,优先级越高,得分越高;
[0033]根据自然语言模型进行判断,对爬取的大量语料数据的分词给出对抽象语义表达式进行填充后获得的数据信息语义是否正确的概率,概率越高,得分越高。
[0034]本发明还提供了一种抽象语义的推荐装置,包括:
[0035]抽象语义表达式获取单元,用于获取多个抽象语义表达式;
[0036]接收单元,用于接收初始请求信息;
[0037]分词单元,用于对所述初始请求信息进行分词处理,得到若干单独词;
[0038]词性标注单元,用于至少对部分所述单独词进行词性标注处理,得到单独词的词性信息;
[0039]词类判断单元,用于至少对部分所述单独词进行词类判断处理,得到单独词的词性信息;
[0040]搜索单元,用于对抽象语义表达式获取单元获取的多个抽象语义表达式进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;
[0041]匹配单元,用于根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。
[0042]可选的,所述推荐装置还包括:规则词识别单元,用于将每个单独词识别为语义规则词或非语义规则词;所述词性标注单元进行词性标注处理时,分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;所述词类判断单元进行词类判断处理时,分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息。
[0043]可选的,所述词性标注单元进行词性标注处理时,分别对每个所述单独词进行词性标注处理,得到每个单独词的词性信息;词类判断单元进行词类判断处理时,分别对每个所述单独词进行词类判断处理,得到每个单独词的词类信息。
[0044]可选的,所述推荐装置还包括:数目判断单元、去除单元和补充单元,其中:数目判断单元,用于判断所述抽象语义候选集中抽象语义表达式的数目是否位于预定范围内;去除单元,用于当所述抽象语义候选集中抽象语义表达式的数目大于预定范围时,去除部分抽象语义表达式;补充单元,用于当所述抽象语义候选集中抽象语义表达式的数目小于预定范围时,从默认集合中补充部分抽象语义表达式。
[0045]可选的,所述抽象语义表达式还包括语义规则词;所述搜索单元搜索得到的所述抽象语义候选集中抽象语义表达式的至少部分语义规则词与所述初始请求信息中至少部分单独词相同或属于同一词类。
[0046]可选的,所述抽象语义表达式包括缺失语义成分;所述匹配单元得到与所述初始请求信息匹配的抽象语义表达式满足以下条件:
[0047]缺失语义成分对应的词性包括对应的填充内容的词性;
[0048]初始请求信息中填充内容外对应的关键词与语义规则词相同或两者属于同一词类;
[0049]该抽象语义表达式与初始请求信息的顺序相同。
[0050]可选的,所述抽象语义表达式包括缺失语义成分,所述推荐装置还包括填充单元,用于当获得与所述初始请求信息对应的一个或多个抽象语义表达式时,从所述初始请求信息中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述初始请求信息对应的一个或多个具体语义表达式
[0051]可选的,所述推荐装置还包括打分单元,用于当匹配单元获得的与所述初始请求信息匹配的抽象语义表达式的数目M大于预设数目N时,分别对与所述初始请求信息匹配的抽象语义表达式进行打分处理,填充单元将提取的内容填充到得分较高的N个抽象语义表达式对应的缺失语义成分,得到与所述初始请求信息对应的N个具体语义表达式。
[0052]可选的,所述打分单元采用以下一种或多种方式的结合进行打分处理:
[0053]缺失语义成分匹配的数量越多,得分越高;
[0054]设定一抽象语义表达式中某一缺失语义成分为核心语义成分,其他缺失语义成分与该核心语义成分的距离越近,得分越高;
[0055]词性置信度越大,得分越高;
[0056]根据预先设定的抽象语义表达式的优先级,优先级越高,得分越高;
[0057]根据自然语言模型进行判断,对爬取的大量语料数据的分词给出对抽象语义表达式进行填充后获得的数据信息语义是否正确的概率,概率越高,得分越高。
[0058]本发明还提供了一种抽象语义的推荐系统,包括:
[0059]抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;
[0060]前述所述的推荐装置。
[0061]与现有技术相比,本发明的技术方案具有以下优点:
[0062]本发明抽象语义的推荐方法,在接收到初始请求信息后,对所述初始请求信息进行分词处理,得到若干单独词;至少对部分所述单独词进行词性标注处理,得到单独词的词性信息;至少对部分所述单独词进行词类判断处理,得到单独词的词类信息;对抽象语义数据库进行搜索处理,得到与所述初始请求信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述初始请求信息匹配的抽象语义表达式。进行分词处理后,得到若干单独词,若干单独词为后续步骤的对象,使得后续的步骤针对性强,减少本发明方法推荐的难度;对单独词进行词性标注处理,得到每个单独词的词性信息的目的是为后续将输入的初始信息与抽象语义表达式的匹配提供匹配的依据,提高了后续匹配的精度和效率;分别对每个所述单独词进行词类判断处理的目的是为了判断每个单独词
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1