一种云管理平台知识库的搜索的方法和设备与流程

文档序号:23003819发布日期:2020-11-20 11:52阅读:134来源:国知局
一种云管理平台知识库的搜索的方法和设备与流程

本领域涉及计算机领域,并且更具体地涉及一种云管理平台知识库的搜索的方法和设备。



背景技术:

云管理平台实现了对多种云平台的纳管,提供了云资源服务、运维监控、运营分析等功能,随着云管理平台功能和规模的扩展,用户在使用过程中遇到的问题也越来越多,为了提高问题的处理效率,实现系统问题的知识积累,目前大部分云管理平台都引入了知识库的功能,系统会在知识库中内置常见的系统问题的处理方式,用户可以在知识库中进行问题的交流与评论,用户还可以通过搜索的方式检索知识库中的问题。目前大部分的知识库检索都是基于关键字的搜索,不支持自然语言收缩,搜索准确率不高,用户易用性不好。



技术实现要素:

有鉴于此,本发明实施例的目的在于提出一种云管理平台知识库的搜索的方法和设备,通过使用本发明的方法,能够提高云管理平台的分词准确度,提高分词器的可扩展性,提高了用户的易用性,提高了自然语言搜索知识库的准确率。

基于上述目的,本发明的实施例的一个方面提供了一种云管理平台知识库的搜索的方法,包括以下步骤:

将用于对自然语言分词的分词器集成到搜索组件中,并将搜索组件集成到云管理平台知识库中;

响应于接收到用户使用自然语言在知识库中搜索的指令,将用户输入的自然语言发送到搜索组件,经由搜索组件的分词器进行分词后得到关键字;

将关键字在知识库中的词典中进行匹配,并将词典中与关键字匹配度最高的内容展示给用户。

根据本发明的一个实施例,还包括:

在词典中添加由多个词组组成的特殊词组作为匹配关键词;

将特殊词组添加到分词器中以使分词器不会将特殊词组拆分成多个词组。

根据本发明的一个实施例,还包括:

定期巡检知识库中的标题和内容,并计算相邻词组组合成特定词组的词频;

响应于词频达到预设阈值,判断特定词组是否在词典中;

响应于特定词组不在词典中,将特定词组反馈给管理员以判断是否需要添加到词典中。

根据本发明的一个实施例,还包括:

响应于特定词组在词典中,将特定词组进行标记以不再对上述特定词组进行词频统计。

根据本发明的一个实施例,还包括:响应于将特定词组添加到词典中,将特定词组添加到分词器中以使分词器不会将特定词组拆分成多个词组。

根据本发明的一个实施例,用于对自然语言分词的分词器包括jieba分词器。

根据本发明的一个实施例,搜索组件包括elasticsearch搜索引擎。

本发明的实施例的另一个方面,还提供了一种云管理平台知识库的搜索的设备,设备包括:

集成模块,集成模块配置为将用于对自然语言分词的分词器集成到搜索组件中,并将搜索组件集成到云管理平台知识库中;

分词模块,分词模块配置为响应于接收到用户使用自然语言在知识库中搜索的指令,将用户输入的自然语言发送到搜索组件,经由搜索组件的分词器进行分词后得到关键字;

匹配模块,匹配模块配置为将关键字在知识库中的词典中进行匹配,并将词典中与关键字匹配度最高的内容展示给用户。

根据本发明的一个实施例,还包括添加模块,添加模块配置为:

在词典中添加由多个词组组成的特殊词组作为匹配关键词;

将特殊词组添加到分词器中以使分词器不会将特殊词组拆分成多个词组。

根据本发明的一个实施例,还包括判断模块,判断模块配置为:

定期巡检知识库中的标题和内容,并计算相邻词组组合成特定词组的词频;

响应于词频达到预设阈值,判断特定词组是否在词典中;

响应于特定词组不在词典中,将特定词组反馈给管理员以判断是否需要添加到词典中。

本发明具有以下有益技术效果:本发明实施例提供的云管理平台知识库的搜索的方法,通过将用于对自然语言分词的分词器集成到搜索组件中,并将搜索组件集成到云管理平台知识库中;响应于接收到用户使用自然语言在知识库中搜索的指令,将用户输入的自然语言发送到搜索组件,经由搜索组件的分词器进行分词后得到关键字;将关键字在知识库中的词典中进行匹配,并将词典中与关键字匹配度最高的内容展示给用户的技术方案,能够提高云管理平台的分词准确度,提高分词器的可扩展性,提高了用户的易用性,提高了自然语言搜索知识库的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为根据本发明一个实施例的云管理平台知识库的搜索的方法的示意性流程图;

图2为根据本发明一个实施例的云管理平台知识库的搜索的设备的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

基于上述目的,本发明的实施例的第一个方面,提出了一种云管理平台知识库的搜索的方法的一个实施例。图1示出的是该方法的示意性流程图。

如图1中所示,该方法可以包括以下步骤:

s1将用于对自然语言分词的分词器集成到搜索组件中,并将搜索组件集成到云管理平台知识库中,知识库中搜索通常是采用关键的搜索方式,而不能对自然语言进行搜索和分词,需要使用第三方分词器以达到对自然语言分词,并且提高分词的效率和准确度;

s2响应于接收到用户使用自然语言在知识库中搜索的指令,将用户输入的自然语言发送到搜索组件,经由搜索组件的分词器进行分词后得到关键字;

s3将关键字在知识库中的词典中进行匹配,并将词典中与关键字匹配度最高的内容展示给用户。

通过本发明的技术方案,能够提高云管理平台的分词准确度,提高分词器的可扩展性,提高了用户的易用性,提高了自然语言搜索知识库的准确率。

在本发明的一个优选实施例中,还包括:

在词典中添加由多个词组组成的特殊词组作为匹配关键词;

将特殊词组添加到分词器中以使分词器不会将特殊词组拆分成多个词组。词典是分词的基础,分词器的分词算法大部分是通过词典进行匹配的,词典的词汇容量和准确率,直接影响了中文分词的效果。将云管平台中的常用词汇扩充到的词典库中,比如:vpc、虚拟控制中心、虚拟数据中心、可用域、弹性伸缩等。如果不加入这些词汇,分词器就会识别错误,比如:“虚拟数据中心”可能会被识别成“虚拟”、“控制”、“中心”三个词,这样就会搜索出很多不匹配的结果,直接影响用户的搜索效果。

在本发明的一个优选实施例中,还包括:

定期巡检知识库中的标题和内容,并计算相邻词组组合成特定词组的词频;

响应于词频达到预设阈值,判断特定词组是否在词典中;

响应于特定词组不在词典中,将特定词组反馈给管理员以判断是否需要添加到词典中。知识库中会不断的添加各种文章内容,而新加入的内容中有些特定的词语在原知识库中可能是不存在的,这样通过将常见的词语进行两个或三个组合,然后判断组合成的新词出现的频次,如果频次很高则可能为一个不常见的专业词语,需要将出现频次高的组合词语提供为管理人员判断是否需要加入到词典中。

在本发明的一个优选实施例中,还包括:

响应于特定词组在词典中,将特定词组进行标记以不再对上述特定词组进行词频统计。该特定词语加入到词典中后将该词语进行标记,在下个周期统计新词出现频次时会将标记的词语进行过滤,可以避免相同词语的重复判断。

在本发明的一个优选实施例中,还包括:响应于将特定词组添加到词典中,将特定词组添加到分词器中以使分词器不会将特定词组拆分成多个词组。

在本发明的一个优选实施例中,用于对自然语言分词的分词器包括jieba分词器。jieba分词器是基于python编写的开源中文分词组件,支持中文简体,繁体分词,还支持自定义词库。

在本发明的一个优选实施例中,搜索组件包括elasticsearch搜索引擎。elasticsearch搜索引擎是一个基于lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于restfulweb接口。elasticsearch是用java语言开发的,并作为apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

通过本发明的技术方案,能够提高云管理平台的分词准确度,提高分词器的可扩展性,提高了用户的易用性,提高了自然语言搜索知识库的准确率。

需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(read-onlymemory,rom)或随机存取存储器(randomaccessmemory,ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

此外,根据本发明实施例公开的方法还可以被实现为由cpu执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu执行时,执行本发明实施例公开的方法中限定的上述功能。

基于上述目的,本发明的实施例的第二个方面,提出了一种云管理平台知识库的搜索的设备,如图2所示,设备200包括:

集成模块,集成模块配置为将用于对自然语言分词的分词器集成到搜索组件中,并将搜索组件集成到云管理平台知识库中;

分词模块,分词模块配置为响应于接收到用户使用自然语言在知识库中搜索的指令,将用户输入的自然语言发送到搜索组件,经由搜索组件的分词器进行分词后得到关键字;

匹配模块,匹配模块配置为将关键字在知识库中的词典中进行匹配,并将词典中与关键字匹配度最高的内容展示给用户。

在本发明的一个优选实施例中,还包括添加模块,添加模块配置为:

在词典中添加由多个词组组成的特殊词组作为匹配关键词;

将特殊词组添加到分词器中以使分词器不会将特殊词组拆分成多个词组。

在本发明的一个优选实施例中,还包括判断模块,判断模块配置为:

定期巡检知识库中的标题和内容,并计算相邻词组组合成特定词组的词频;

响应于词频达到预设阈值,判断特定词组是否在词典中;

响应于特定词组不在词典中,将特定词组反馈给管理员以判断是否需要添加到词典中。

需要特别指出的是,上述系统的实施例采用了上述方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到上述方法的其他实施例中。

上述实施例,特别是任何“优选”实施例是实现的可能示例,并且仅为了清楚地理解本发明的原理而提出。可以在不脱离本文所描述的技术的精神和原理的情况下对上述实施例进行许多变化和修改。所有修改旨在被包括在本公开的范围内并且由所附权利要求保护。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1