智能问答方法及其知识图谱系统构建方法、装置、设备与流程

文档序号:16532860发布日期:2019-01-05 10:54阅读:190来源:国知局
智能问答方法及其知识图谱系统构建方法、装置、设备与流程

本发明涉及人工智能领域,特别涉及一种基于智能问答方法及其知识图谱系统构建方法、装置、设备。



背景技术:

近年来,随着科技的快速发展,互联网应用广泛深入各类领域,大数据呈现爆炸式增长,海量的知识和信息分散于网络空间,当用户需要获取需要的信息时,通过搜索引擎可以找到相关的信息,但是由于知识信息的范围广,且存在一定的深度,通常导致无法系统、效率、准确的获得知识和信息,大部分用户甚至一些行内人士在处理一些事件或查找信息时都可能会遇到问题。



技术实现要素:

有鉴于此,本发明的目的在于提供一种智能问答方法及其知识图谱系统构建方法、装置、设备,能够实现准确、高效的获取知识信息。其具体方案如下:

第一方面,本发明公开了一种基于信息安全领域知识图谱系统的智能问答方法,包括:

获取问题语句;

提取所述问题语句的关键词;

利用所述关键词搜索所述知识图谱系统,得到与所述问题语句相关的知识信息;其中,所述知识图谱系统为基于人工智能创建的知识图谱系统;

利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果。

可选的,所述提取所述问题语句的关键词,包括:

利用自然语言处理技术对所述问题语句进行分析,并从所述问题语句中提取关键词;

其中,所述自然语言处理技术包括:

问句解析技术和文本关键词提取技术。

可选的,所述利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果,包括:

根据与所述问题语句的相关程度,从所述与所述问题语句相关的知识信息中选择出符合预设相关程度的知识信息;

根据预设语序,对所述符合预设相关程度的知识信息进行排序,以获得所述问题语句对应的问题结果。

可选的,所述根据预设语序,对所述符合预设相关程度的知识信息进行排序,包括:

当获取到多个所述问题语句时,根据相同的所述预设语序,对每个所述问题语句对应的所述符合预设相关程度的知识信息进行排序。

第二方面,本申请公开了一种基于信息安全领域知识图谱系统的知识图谱系统构建方法,包括:

从预设的各类安全网站中进行数据爬取,得到目标数据;

利用人工智能技术对所述目标数据进行分析提取,获取相应的知识信息;

将所述知识信息按照预设格式进行存储,构建生成知识图谱系统。

可选的,所述利用人工智能技术对所述目标数据进行分析提取,包括:

利用自然语言处理技术和图像处理技术对所述目标数据进行分析提取;

其中,所述自然语言处理技术包括文本分类技术、信息抽取技术和文本关键词提取技术;

所述图像处理技术包括图像内文本识别技术。

可选的,所述预设格式为资源描述框架格式。

第三方面,本发明公开了一种基于信息安全领域知识图谱系统的智能问答装置,包括:

问题获取模块,用于获取问题语句;

关键词提取模块,用于提取所述问题语句的关键词;

信息搜索模块,用于利用所述关键词搜索所述知识图谱系统,得到与所述问题语句相关的知识信息;其中,所述知识图谱系统为基于人工智能创建的知识图谱系统;

结果生成模块,用于利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果。

第四方面,本发明公开了一种知识图谱系统构建装置,包括:

数据爬取模块,用于从预设的各类安全网站中进行数据爬取,得到目标数据;

信息提取模块,用于利用自然语言处理技术和图像处理技术对所述目标数据进行分析提取,获取相应的知识信息;

图谱生成模块,用于将所述知识信息按照预设格式进行存储,构建生成知识图谱系统。

第五方面,本发明公开了一种基于信息安全领域知识图谱系统的智能问答设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现上述任一种所述智能问答方法的步骤。

可见,本发明通过获取问题语句,提取问题语句的关键词,利用关键词搜索知识图谱系统,得到与问题语句相关的知识信息,利用与问题语句相关的知识信息生成问题语句对应的问题结果,其中,知识图谱系统为基于人工智能创建的知识图谱系统。由此可见,本发明获取到用户的问题语句后,提取出问题语句内的关键词,可以了解到用户需要获取的信息,进一步利用关键词搜索基于人工智能创建的知识图谱系统,由于所述知识图谱系统为基于人工智能创建的知识图谱系统,可以实现自动化信息提取,因此具备高效性;另外,还可以避免人工处理时的主观性,得到更加准确的搜索结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明公开的一种基于信息安全领域知识图谱系统的智能问答方法流程图;

图2为本发明公开的一种知识图谱系统构建方法流程图;

图3为本发明公开的一种基于信息安全领域知识图谱系统的智能问答装置结构示意图;

图4为本发明公开的一种知识图谱系统构建装置结构示意图;

图5为本发明公开的一种具体的基于信息安全领域知识图谱系统的智能问答设备硬件结构图;

图6为本发明公开的一种具体的知识图谱系统构建设备硬件结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

现有技术中,当用户需要获取需要的信息时,通过搜索引擎可以找到相关的信息,但由于知识信息的范围广,且存在一定的深度,通常导致无法系统、效率、准确的获得知识和信息,本发明通过获取问题语句并提取关键词,利用关键词搜索基于人工智能创建的知识图谱系统,获取所需的知识信息,实现准确、快速的获取所需知识信息。

如图1所示,本发明实施例公开了一种基于信息安全领域知识图谱系统的智能问答方法,该方法包括:

步骤s101:获取问题语句;

本实施例中,所示获取问题语句可以具体获取消息采集接口采集到的问题语句;其中,所述消息采集接口为语音采集接口、图像采集接口或文本采集接口。可以理解的是,用户的问题语句可以由用户下发语音提出,可以由图片承载,也可以直接以文本形式输入问题语句。

步骤s102:提取所述问题语句的关键词;

需要指出的是,所述提取所述问题语句的关键词,具体由问句解析子模块实现:利用自然语言处理技术对所述问题语句进行分析,提取出其中的关键词;所述自然语言处理技术包括:问句解析技术和文本关键词提取技术。

可以理解的是,在获取到用户的问题语句后,首先需要分析出所述问题语句的形式,也即获取到问题语句的类型,另外,利用问句解析技术获取问句中的实体,如事件、关系、专有名词等。进一步地,利用文本关键词提取技术获取问题语句内的关键词,所述关键词可以为出现频率较高的词或短语,或先提取出出现频率较高的词之后,通过总结这些词的共同特性得到关键词。

步骤s103:利用所述关键词搜索所述知识图谱系统,得到与所述问题语句相关的知识信息;其中,所述知识图谱系统为基于人工智能创建的知识图谱系统;

具体地,所述利用所述关键词搜索所述知识图谱系统,得到与所述问题语句相关的知识信息由信息检索子模块实现,所述信息检索子模块用于利用上述步骤提取出的关键词,对基于人工智能创建的知识图谱系统进行检索,获取到与所述关键词相关的准确知识信息,及其发散知识信息。

步骤s104:利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果。

需要说明的是,所述利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果具体由语序对话与信息管理子模块和回答生成子模块实现。在一种具体实施方式中,利用步骤s103获取到的与所述关键词相关的准确知识信息及其发散知识信息,根据这些知识信息与用户问题语句的相关程度进行筛选,将与问题语句相关性较小的知识信息进行剔除,选择出与问题语句相关性较强或相关性适中的知识信息;进一步地,根据预设的语序,利用语序对话与信息管理子模块和回答生成子模块将选择出来的知识信息进行排序,生成问题结果。具体地,所述预设的语序可以是预先在系统中设置好的语序,也可以为在提取到用户的问题语句之后,获取该用户问题语句的语序,可将该用户偏好的语序作为预设语序,可以更好地提升用户的体验度。

在另一种具体实施方式中,当获取到用户的多个问题语句,需要作出多个回答时,利用语序对话与信息管理子模块和回答生成子模块根据相同的预设语序,对每个预设问题对应的选择出来的知识信息进行排序,生成问题结果,从而保证用户获得的多个问题结果均采用同样的语序习惯,使用户获得良好的阅读体验。

可见,本发明实施例通过获取问题语句,提取问题语句的关键词,利用关键词搜索知识图谱系统,得到与问题语句相关的知识信息,利用与问题语句相关的知识信息生成问题语句对应的问题结果,其中,知识图谱系统为基于人工智能创建的知识图谱系统。由此可见,本发明获取到用户的问题语句后,提取出问题语句内的关键词,可以了解到用户需要获取的信息,进一步利用关键词搜索基于人工智能创建的知识图谱系统,由于所述知识图谱系统为基于人工智能创建的知识图谱系统,可以实现自动化信息提取,因此具备高效性;另外,还可以避免人工处理时的主观性,得到更加准确的搜索结果。

如图2所示,本发明实施例公开了一种知识图谱系统构建方法,该方法包括:

步骤s201:从预设的各类安全网站中进行数据爬取,得到目标数据;

具体地,由网络爬取模块实现从预设的各类安全网站中进行数据爬取。可以理解的是,所述预设的各类安全网站包括但不限于:信息科技论文网站、各类cve(commonvulnerabilitiesexposures,公共漏洞和暴露)漏洞网站、安全资讯网站、漏洞利用分析网站、安全人员博客。另外,可以采用实时爬取的方式达到信息实时更新的目的,也可以根据预设的爬取周期进行数据爬取,预设爬取周期可以在具体实施时根据实际情况进行设置,这均不影响本发明的实现。

另外,对网站进行数据爬取得到目标数据后,可以将目标数据临时存储在数据库内,方便后续对数据的处理。例如,可以采用分布式elasticsearch数据库进行临时保存,该数据库能够保证数据缓存的容量。

步骤s202:利用人工智能技术对所述目标数据进行分析提取,获取相应的知识信息;

本实施例中,由信息提取模块实现对爬取得到的目标数据进行分析和提取。其中,所述知识信息包括但不限于:漏洞定义与特征、漏洞影响范围、漏洞利用与解决方案、信息安全基础知识、信息安全最新态势、信息安全相关论文等。

具体地,信息提取模块对目标数据进行分析提取,在一种具体实施方式中,若目标数据为文本信息,则采用人工智能领域的自然语言处理技术对文本数据进行分析提取,所述自然语言处理技术包括:文本分类技术、信息抽取技术和文本关键词提取技术。

在另一种具体实施方式中,若目标数据为图像,则采用图像处理技术识别图像,具体地,可以采用传统的图像处理技术识别图像内文本或获取图像信息,优选的,若想获得更准确的图像处理结果,可以采用人工智能领域中基于深度学习的图像处理技术识别图像信息。

在另一种具体实施方式中,若目标数据既包含文本信息,同时包含图像,则利用自然语言处理技术和图像处理技术对目标进行分析处理,提取关键知识信息。

步骤s203:将所述知识信息按照预设格式进行存储,构建生成知识图谱系统。

本实施例中,利用知识图谱模块实现将所述知识信息按照预设格式进行存储,最终生成知识图谱系统。具体地,所述知识图谱模块采用分布式elasticsearch数据库与neo4j图数据库相结合的方式存储知识信息,所述知识信息以rdf(resourcedescriptionframework,资源描述框架)格式进行存储。可以理解的是,当结构化的知识信息按照标准的rdf格式存储后,数据共享性增强;且rdf数据本身符合图的结构,并具有一定的推理能力,因此,本发明实施例在对具有关系的数据进行查询时可以实现高效,省时,同时,在基于图数据库的基础上更好的展现实体间的关系连接,提高数据搜索时的发散性。

可见,本发明实施例获取到用户的问题语句后,提取出问题语句内的关键词,可以了解到用户需要获取的信息,进一步利用关键词搜索基于人工智能创建的知识图谱系统,由于所述知识图谱系统为基于人工智能创建的知识图谱系统,可以实现自动化信息提取,因此具备高效性;另外,还可以避免人工处理时的主观性,得到更加准确的搜索结果。

此外,本实施例还提供了一种基于信息安全领域知识图谱系统的智能问答装置,参见图3所示,装置包括:

问题获取模块100,用于获取问题语句;

关键词提取模块200,用于提取所述问题语句的关键词;

信息搜索模块300,用于利用所述关键词搜索所述知识图谱系统,得到与所述问题语句相关的知识信息;其中,所述知识图谱系统为基于人工智能创建的知识图谱系统;

结果生成模块400,用于利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果。

本实施例的基于信息安全领域知识图谱系统的智能问答装置用于实现前述的基于信息安全领域知识图谱系统的智能问答方法,因此基于信息安全领域知识图谱系统的智能问答装置中的具体实施方式可参见前文中的基于信息安全领域知识图谱系统的智能问答方法的各个部分实施例的描述,在此不再赘述。

此外,本实施例还提供了一种知识图谱系统构建装置,参见图4所示,装置包括:

数据爬取模块500,用于从预设的各类安全网站中进行数据爬取,得到目标数据;

信息提取模块600,用于利用自然语言处理技术和图像处理技术对所述目标数据进行分析提取,获取相应的知识信息;

图谱生成模块700,用于将所述知识信息按照预设格式进行存储,构建生成知识图谱系统。

本实施例的知识图谱系统构建装置用于实现前述的知识图谱系统构建方法,因此知识图谱系统构建装置中的具体实施方式可参见前文中的知识图谱系统构建方法的各个部分实施例的描述,在此不再赘述。

此外,本发明还提供了一种基于信息安全领域知识图谱系统的智能问答设备,设备包括处理器11和存储器12,其中,所述处理器11执行所述存储器12中保存的计算机程序时实现以下步骤:

获取问题语句;提取所述问题语句的关键词;利用所述关键词搜索所述知识图谱系统,得到与所述问题语句相关的知识信息,其中,所述知识图谱系统为基于人工智能创建的知识图谱系统;利用所述与所述问题语句相关的知识信息生成所述问题语句对应的问题结果。

本实施例中,所述处理器11执行所述存储器12中保存的计算机程序时,可以具体实现以下步骤:利用自然语言处理技术对所述问题语句进行分析,并从所述问题语句中提取关键词;其中,所述自然语言处理技术包括:问句形式解析技术、问句实体解析技术和文本关键词提取技术。

本实施例中,所述处理器11执行所述存储器12中保存的计算机程序时,可以具体实现以下步骤:根据与所述问题语句的相关程度,从所述与所述问题语句相关的知识信息中选择出符合预设相关程度的知识信息;根据预设语序,对所述符合预设相关程度的知识信息进行排序,以获得所述问题语句对应的问题结果。

本实施例中,所述处理器11执行所述存储器12中保存的计算机程序时,可以具体实现以下步骤:当获取到多个所述问题语句时,根据相同的所述预设语序,对每个所述问题语句对应的所述符合预设相关程度的知识信息进行排序。

进一步地,参见图5所示,本实施例中的基于信息安全领域知识图谱系统的智能问答设备,还可以包括:

输入接口13,用于获取外界导入的计算机程序,并将获取到的计算机程序保存至所述存储器12中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器11中,以便处理器11利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口13具体可以包括但不限于usb接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。

输出接口14,用于将处理器11产生的各种数据输出至与其相连的终端设备,以便于与输出接口14相连的其他终端设备能够获取到处理器11产生的各种数据。本实施例中,所述输出接口14具体可以包括但不限于usb接口、串行接口等。

采集声音单元15,用于获取用户的语音信息.

通讯单元16,用于和外部服务器之间建立远程通讯连接,获取外界终端发送的数据,然后发送至处理器11进行处理分析,另外,处理器11还可以将处理后得到的各种结果通过通讯单元15发送至预设的各种数据接收端。

显示单元17,用于对处理器11发送过来的数据进行显示。

音频播放单元18,用于对处理器11发送过来的数据进行播放。

此外,本发明还提供了一种知识图谱系统构建设备,设备包括处理器21和存储器22,其中,所述处理器21执行所述存储器22中保存的计算机程序时实现以下步骤:

从预设的各类安全网站中进行数据爬取,得到目标数据;利用人工智能技术对所述目标数据进行分析提取,获取相应的知识信息;将所述知识信息按照预设格式进行存储,构建生成知识图谱系统。

本实施例中,所述处理器21执行所述存储器22中保存的计算机程序时,可以具体实现以下步骤:利用自然语言处理技术和图像处理技术对所述目标数据进行分析提取;其中,所述自然语言处理技术包括文本分类技术、信息抽取技术和文本关键词提取技术;所述图像处理技术包括图像内文本识别技术。

进一步地,参见图6所示,本实施例中的知识图谱系统构建设备,还可以包括:

输入接口23,用于获取外界导入的计算机程序,并将获取到的计算机程序保存至所述存储器22中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器21中,以便处理器21利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口23具体可以包括但不限于usb接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。

输出接口24,用于将处理器21产生的各种数据输出至与其相连的终端设备,以便于与输出接口24相连的其他终端设备能够获取到处理器21产生的各种数据。本实施例中,所述输出接口24具体可以包括但不限于usb接口、串行接口等。

通讯单元25,用于和外部服务器之间建立远程通讯连接,获取外界终端发送的数据,然后发送至处理器21进行处理分析,另外,处理器21还可以将处理后得到的各种结果通过通讯单元25发送至预设的各种数据接收端。

显示单元26,用于对处理器21发送过来的数据进行显示。

此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种基于信息安全领域知识图谱系统的智能问答方法的步骤。关于该方法的步骤可以参考前述实施例中公开的相关内容,在此不再赘述。

此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种知识图谱系统构建方法的步骤。关于该方法的步骤可以参考前述实施例中公开的相关内容,在此不再赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上对本发明所提供的智能问答方法及其知识图谱系统构建方法、装置、设备及可读介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1