一种人工智能对话的知识检索方法及知识库自动完善方法与流程

文档序号:12666577阅读:2028来源:国知局

本发明涉及计算机应用领域,具体涉及一种人工智能对话的知识检索方法及知识库自动完善方法。



背景技术:

自然语言中大量存在对人类生活中各类事件的描述(小到一个动作,大到一个历史事件),同时也包括事件产生的时间、地点、参与的角色、状态以及事件之间的关系等内容与特征的描述。随着互联网相关技术的兴起,人们越来越多的依赖于网络来获取信息,而互联网的信息呈现出海量、剧增和冗余等特性,为了能更好的监控和运用其中的信息,让机器能够分析文本中的事件,面向事件的语句分析研究显得越来越重要,这关系到目前慢慢兴起的人工智能对话过程的互动性。

含知识图谱的人工智能对话系统,比传统语料检索的对话系统的优势在于其多具备了知识和常识方面的回答能力。人在与这类人工智能对话系统聊天时能感受到机器人和人一样能记忆知识,懂知识,聊知识。其中,知识图谱,也称为科学知识图谱,它通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。为学科研究提供切实的、有价值的参考。

这类人工智能对话系统的知识类问答质量受限于其知识图谱的实体涵盖量,知识挖掘与发现的更新频率。

(1)知识图谱的实体涵盖量不够,导致人机对话时,用户问的相关知识机器人无法给出答案;

(2)知识挖掘与发现的更新频率不够,导致新兴知识在人机对话时,机器人也无法给出答案。



技术实现要素:

针对现有技术中的缺陷,本发明提供一种人工智能对话的知识检索方法及知识库自动完善方法,以使人工智能对话变得更高效,同时提高知识库的知识量。

一种人工智能对话的知识检索方法,其关键在于,包括以下步骤:

步骤1:获取用户的问题语句;

步骤2:对所述问题语句进行语意和意图分析,得到问题标识;

步骤3:根据所述问题标识,在本地知识库中搜索本地答案;

步骤4:得到本地答案,将本地答案数据整合并回复给用户;

步骤5:当本地知识库中未搜索到本地答案时,根据所述问题标识,在数据源中搜索异地答案;

步骤6:得到异地答案,将所述异地答案整合并回复给用户。

为更好实现本发明,可进一步为:所述数据源包括文件、第三方知识库和网络资源。

可选的:所述步骤6具体为,得到异地答案后,对异地答案进行语意和意图分析,当所述异地答案的属性为陈述句,或者为知识性答案时,将所述异地答案整合并回复给用户。

可选的:所述语意和意图分析用于判断语句的言语行为属性和意图属性。

基于人工智能对话的实时知识检索方法的知识库自动完善方法,其关键在于,

步骤11:当在所述本地知识库中未搜索到本地答案时,以所述问题语句作为种子信息;

步骤12:将所述种子信息传给爬虫引擎;

步骤13:获取所述爬虫引擎在所述数据源中抓取的数据;

步骤14:把所述数据存入所述本地知识库中。

可选的,所述步骤14还包括,对所述数据进行语意和意图分析,当所述数据的属性为陈述句,或者为知识性答案时,将所述数据存入所述本地知识库中;否,则将所述数据删除。

基于一种人工智能对话的知识检索方法的知识库自动完善方法,其关键在于,包括以下步骤,

步骤11:当在所述本地知识库中未搜索到本地答案时,以所述问题语句作为种子信息;

步骤12:将所述种子信息传给爬虫引擎;

步骤13:获取所述爬虫引擎在所述数据源中抓取的数据;

步骤14:把所述数据存入所述本地知识库中。

为更好实现本发明,可进一步为,对所述数据进行语意和意图分析,当所述数据的属性为陈述句,或者为知识性答案时,将所述数据存入所述本地知识库中;否,则将所述数据删除,即所述数据不作为答案返回给用户,也不存入本地数据库。

本发明的有益效果:当本地知识库没有资源时,在数据源中搜索异地答案,避免因知识图谱的实体涵盖量不够,在人机对话时,机器人无法给出答案情况的发生;另外,在数据源中抓取和问题相关的资源,并保存在本地知识库中,避免因知识挖掘与发现的更新频率不够,新兴知识在人机对话时,机器人也无法给出答案情况的发生。

附图说明

图1示出了本发明的流程图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。

如图1所示,为一种人工智能对话的知识检索方法及知识库自动完善方法的流程图,本发明的核心分为两部分,一是实时知识检索,二是对知识图谱库的自动完善处理的更新系统。当用户与机器人聊天时,先将用户问题通过语意意图分析,而后去本地知识库中进行查询,对话系统可以回答本来知识图谱库中缺少的知识实体词条,同时也能将此用户提问的知识入库储存,用户以后再询问相关的问题,就可以直接从知识库中检索到结果,也完善了知识库的储备量。其中,一种人工智能对话的知识检索方法包括以下步骤:

步骤1:获取用户的问题语句;

步骤2:对所述问题语句进行语意和意图分析,得到问题标识;

步骤3:根据所述问题标识,在本地知识库中搜索本地答案;

步骤4:得到本地答案,将本地答案数据整合并回复给用户;

步骤5:当本地知识库中未搜索到本地答案时,根据所述问题标识,在数据源中搜索异地答案;

步骤6:得到异地答案,将所述异地答案整合并回复给用户。

以上,所述数据源包括文件、第三方知识库和网络资源;所述步骤6具体为,得到异地答案后,对异地答案进行语意和意图分析,当所述异地答案的属性为陈述句,或者为知识性答案时,将所述异地答案整合并回复给用户。这里的语意和意图分析用于判断语句的言语行为属性和意图属性。

基于一种人工智能对话的知识检索方法的知识库自动完善方法包括以下步骤,步骤11:当在所述本地知识库中未搜索到本地答案时,以所述问题语句作为种子信息;

步骤12:将所述种子信息传给爬虫引擎;

步骤13:获取所述爬虫引擎在所述数据源中抓取的数据;

步骤14:把所述数据存入所述本地知识库中。

以上,所述步骤14还包括,对所述数据进行语意和意图分析,当所述数据的属性为陈述句,或者为知识性答案时,将所述数据存入所述本地知识库中;否,则将所述数据删除,即所述数据不作为答案返回给用户,也不存入本地数据库。这里当我们获得一个或多个备选回答时,需要做“语意,意图分析”即分析它们各自的“言语行为,意图”,流程图中由于需要备选回答作为用户问题的答案返回,故在此处需要是陈述句类的“知识答”这样的标准才行。

关于以上两个发明,在人工智能聊天系统中,语意和意图分析主要包含两个分类器,言语行为分类器和意图分类器。

言语行为分类器是指判断一句话是否为“问信息的问句”,比如“可以介绍下姚明吗”;“问意见的问句”,比如“今天打伞好不好呢”;“表达愿望类陈述句”,“表达喜好类陈述句”,“表达意见类陈述句”,“普通陈述句”,“肯定回答”,“否定回答”,“不清楚的回答”,“反问句”,“抱怨批评指责类”,“道歉”,“感谢”,“赞美”,“对话开场”,“终止对话”等。

意图分类器是指判断一句话是否为“闲聊”,比如“今天天气不错”;“知识问”,比如“周杰伦的主要代表作品有哪些呢”;“知识答”,比如“周杰伦的代表作品有《双截棍》,《超人不会飞》”;“功能性音乐类问”,比如“给我放一首音乐吧”;“功能性订票问”,比如“帮我订明天早上去北京的高铁票”等。

含知识图谱的人工智能对话系统,比传统语料检索的对话系统的优势在于其多具备了知识和常识方面的回答能力。人在与这类人工智能对话系统聊天时能感受到机器人和人一样能记忆知识,懂知识,聊知识。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1