优化抽象语义库的方法及装置的制造方法_5

文档序号:9787567阅读:来源:国知局
问没有定位到某一抽象语义类别,就生成该相似问的抽象语义表达式并添加到相应的抽象语义类别中,以完善优化该抽象语义类别。通过对正确日志库中的所有标准问进行相同的处理,以优化整个抽象语义库,从而可以加快知识运维效率,降低知识运维的人工成本。
[0239]本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
[0240]软件应当被宽泛地解释成意味着指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行件、执行的线程、规程、函数等,无论其是用软件、固件、中间件、微代码、硬件描述语言、还是其它术语来述及皆是如此。
[0241]结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
[0242]结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、⑶-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。
[0243]提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。
【主权项】
1.一种基于智能问答系统的正确日志库优化抽象语义库的方法,所述正确日志库包括标准问以及与各标准问相关联的相似问,所述抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,所述方法包括: 对所述标准问进行抽象语义推荐; 对所述标准问的相似问进行抽象语义推荐; 响应于所述标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式; 将新生成的抽象语义表达式添加至所述标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。2.如权利要求1所述的方法,其特征在于,所述抽象语义推荐包括: 对所述标准问和所述标准问的相似问进行分词处理,分别得到若干单词,所述单词为语义规则词或非语义规则词; 对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息; 对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息; 根据所述词性信息和词类信息对抽象语义库进行搜索处理,得到与所述标准问及其相似问分别相匹配的抽象语义表达式。3.如权利要求2所述的方法,其特征在于,所述抽象语义表达式包括缺失语义成分和语义规则词,与所述标准问匹配的抽象语义表达式满足以下条件: 抽象语义表达式的缺失语义成分对应的词性包括标准问中对应内容的词性; 抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类; 抽象语义表达式的顺序与标准问的表达顺序相同,以及 与所述相似问匹配的抽象语义表达式满足以下条件: 抽象语义表达式的缺失语义成分对应的词性包括相似问中对应内容的词性; 抽象语义表达式和相似问中对应的语义规则词相同或属于同一词类; 抽象语义表达式的顺序与相似问的表达顺序相同。4.如权利要求1所述的方法,其特征在于,所述根据该相似问自动生成对应的抽象语义表达式包括: 对所述相似问进行分词以获得若干单词,每个单词为语义规则词或非语义规则词;对每个非语义规则词进行词性标注,得到每个非语义规则词的词性信息;以及至少基于每个非语义规则词的词性信息将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。5.如权利要求4所述的方法,其特征在于,所述至少基于每个非语义规则词的词性信息将每个非语义规则词替换为相应语义成分符还包括: 基于所述相似问的上下文将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。6.如权利要求1所述的方法,其特征在于,所述新生成的抽象语义表达式在经人工确认正确后被添加至所述标准问所对应的类别的抽象语义集合中。7.如权利要求1所述的方法,其特征在于,响应于所述标准问的该相似问的抽象语义推荐成功但与所述标准问对应不同类别的抽象语义集合,对该相似问所被推荐到的抽象语义表达式进行人工确认。8.如权利要求1所述的方法,其特征在于,还包括: 对所述标准问推荐到的抽象语义表达式对应的类别进行人工确认。9.一种基于智能问答系统的正确日志库优化抽象语义库的装置,所述正确日志库包括标准问以及与各标准问相关联的相似问,所述抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,所述装置包括: 抽象语义推荐模块,用于对所述标准问进行抽象语义推荐,以及对所述标准问的相似问进行抽象语义推荐; 抽象语义表达式生成模块,用于响应于所述标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式;以及 抽象语义库编辑模块,用于将新生成的抽象语义表达式添加至所述标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。10.如权利要求9所述的装置,其特征在于,所述抽象语义推模块包括: 分词模块,对所述标准问和所述标准问的相似问进行分词处理,分别得到若干单词,所述单词为语义规则词或非语义规则词; 词性标注模块,用于对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息; 词类判断模块,用于对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息; 搜索模块,用于根据所述词性信息和词类信息对抽象语义库进行搜索处理,得到与所述标准问及其相似问分别相匹配的抽象语义表达式。11.如权利要求10所述的装置,其特征在于,所述抽象语义表达式包括缺失语义成分和语义规则词,与所述标准问匹配的抽象语义表达式满足以下条件: 抽象语义表达式的缺失语义成分对应的词性包括标准问中对应内容的词性; 抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类; 抽象语义表达式的顺序与标准问的表达顺序相同,以及 与所述相似问匹配的抽象语义表达式满足以下条件: 抽象语义表达式的缺失语义成分对应的词性包括相似问中对应内容的词性; 抽象语义表达式和相似问中对应的语义规则词相同或属于同一词类; 抽象语义表达式的顺序与相似问的表达顺序相同。12.如权利要求9所述的装置,其特征在于,所述抽象语义表达式生成模块包括: 分词模块,用于对所述相似问进行分词以获得若干单词,每个单词为语义规则词或非语义规则词; 词性标注模块,用于对每个非语义规则词进行词性标注,得到每个非语义规则词的词性信息;以及 填充模块,用于至少基于每个非语义规则词的词性信息将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。13.如权利要求12所述的装置,其特征在于,所述填充模块进一步用于基于所述相似问的上下文将每个非语义规则词替换为相应语义成分符以作为新生成抽象语义规则的缺失语义成分。14.如权利要求8所述的装置,其特征在于,所述根据该相似问自动生成的抽象语义表达式在经人工确认正确后被添加至所述标准问所对应的类别的抽象语义集合中。
【专利摘要】本发明提供了一种基于智能问答系统的正确日志库优化抽象语义库的方法,该正确日志库包括标准问以及与各标准问相关联的相似问,该抽象语义库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该方法包括对该标准问进行抽象语义推荐;对该标准问的相似问进行抽象语义推荐;响应于该标准问的该相似问的抽象语义推荐失败,根据该相似问自动生成对应的抽象语义表达式;将新生成的抽象语义表达式添加至该标准问所被推荐到的抽象语义表达式对应的类别的抽象语义集合中。
【IPC分类】G06F17/30, G06F17/27
【公开号】CN105550360
【申请号】CN201511030026
【发明人】曾永梅, 朱频频
【申请人】上海智臻智能网络科技股份有限公司
【公开日】2016年5月4日
【申请日】2015年12月31日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1