一种基于知识图谱的问答方法、系统、装置、设备及介质与流程

文档序号:22929638发布日期:2020-11-13 16:27阅读:121来源:国知局
一种基于知识图谱的问答方法、系统、装置、设备及介质与流程

本申请涉及语音交互领域,特别是涉及一种基于知识图谱的问答方法、系统、装置、设备及介质。



背景技术:

在智能问答模块中,一般是通过人工收集或爬虫爬取问题和答案,然后由人工配置到智能问答模块中,再通过语音相似度算法匹配到对应的答案,将该答案返回给用户,如在用户询问的问题为“今天天气很好吗”的情况下,智能终端通过相似度模型到知识库中寻找与该问题匹配分数最高的问题,若匹配分数最高的问题为“今天天气怎么样”,然后智能终端返回与“今天天气怎么样”相对应的答案,然后将该答案返回到用户。

相关技术中,智能终端需要通过相似度算法去匹配知识库模块的所有问题,然后寻找到相似度分数最高的问题,需要消耗较多的计算资源,且因为相似度计算无法准确地获取用户意图,以及所返回的答案都是人工配置的,答案比较单一,所以也导致人机交互体验较差。

目前相关技术中在智能问答模块中,需要消耗较多的计算资源的问题以及在智能问答模块中,所配置的答案较为单一,从而造成人机交互体验差的问题,尚未提出有效地解决方案。



技术实现要素:

本申请实施例提供了一种基于知识图谱的问答方法、系统、装置、设备及介质,以至少解决了相关技术中在智能问答模块中,需要消耗较多的计算资源的问题以及所配置的答案较为单一,从而造成人机交互体验差的问题。

第一方面,本发明提供了一种基于知识图谱的问答方法,包括:

获取与用户语音信息相对应的第一实体、第一关系以及第二实体,其中,所述第一实体与所述第二实体之间具有所述第一关系;

生成实体检索指令,其中,所述实体检索指令包括所述第一实体、所述第一关系以及所述第二实体;

检索获取知识图谱中与所述实体检索指令相对应的第二子实体,其中,所述第二子实体为所述第二实体的子集;

生成语义模板,其中,所述语义模板包括所述第一实体、所述第一关系、以及所述第二子实体;

生成与所述语义模板相对应的应答语音信息。

进一步地,在获取与用户语音信息相对应的第一实体、第一关系以及第二实体之前,所述方法还包括:

收集若干第一实体、若干第一关系以及若干第二实体;

根据每一所述第一实体与每一所述第二实体之间的所述第一关系构建若干三元组数据;

根据若干所述三元组数据构建知识图谱。

进一步地,在获取与用户语音信息相对应的第一实体、第一关系以及第二实体之前,所述方法还包括:

获取用户语音信息;

识别所述用户语音信息,以抽取第一实体、第一关系以及第二实体。

第二个方面,本发明提供了一种基于知识图谱的问答系统,包括:

自然语言理解服务器,用于获取与用户语音信息相对应的第一实体、第一关系以及第二实体,生成实体检索指令,获取语义模板,生成与所述语义模板相对应的应答语音信息,其中,所述第一实体与所述第二实体之间具有所述第一关系,所述实体检索指令包括所述第一实体、所述第一关系以及所述第二实体,所述语义模板包括所述第一实体、所述第一关系以及第二子实体;

知识图谱管理服务器,用于检索获取知识图谱中与所述实体检索指令相对应的所述第二子实体,生成所述语义模板,其中,所述第二子实体为所述第二实体的子集;

自然语言处理服务器,用于识别用户语音信息并抽取所述第一实体、所述第一关系以及所述第二实体。

进一步地,所述知识图谱管理服务器包括:

收集单元,用于收集若干所述第一实体、若干所述第一关系以及若干所述第二实体;

构建单元,用于根据所述第一实体与所述第二实体之间的第一关系,构建与所述第一实体、所述第二实体以及所述第一关系相对应的三元组数据,并根据所述三元组数据构建所述知识图谱。

存储单元,用于存储所述知识图谱。

进一步地,所述自然语言处理服务器包括:

识别单元,用于识别所述用户语音信息,并抽取所述第一实体、所述第一关系以及所述第二实体。

进一步地,所述知识图谱管理服务器还包括:

消息生成单元,用于在生成所述语义模板的情况下,生成语义模板消息;

推送单元,用于将所述语义模板消息以及所述语义模板推送到第一消息队列;

所述自然语言理解服务器还包括:

第一监听单元,用于监听所述第一消息队列,用于在监听到所述语义模板消息的情况下,所述自然语言理解服务器获取所述语义模板。

进一步地,所述消息生成单元还用于在所述知识图谱管理服务器生成实体数据的情况下,生成实体数据信息,其中,所述实体数据包括若干所述第一实体、若干所述第二实体;

所述推送单元还用于将所述实体数据以及所述实体数据信息推送到第二消息队列;

所述自然语言处理服务器还包括:

第二监听单元,用于监听所述第二消息队列,且在监听到所述实体数据消息的情况下,所述自然语言处理服务器获取所述实体数据。

第三方面,本发明提供了一种基于知识图谱的问答装置,包括:

自然语言理解模块,用于获取与用户语音信息相对应的第一实体、第一关系以及第二实体,生成实体检索指令,获取语义模板,生成与所述语义模板相对应的应答语音信息,其中,所述第一实体与所述第二实体之间具有所述第一关系,所述实体检索指令包括所述第一实体、所述第一关系以及所述第二实体,所述语义模板包括所述第一实体、所述第一关系以及第二子实体;

知识图谱管理模块,用于检索获取知识图谱中与所述实体检索指令相对应的所述第二子实体,生成所述语义模板,其中,所述第二子实体为所述第二实体的子集;

自然语言处理模块,用于识别用户语音信息并抽取所述第一实体、所述第一关系以及所述第二实体。

第四方面,本发明提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任一项所述的基于知识图谱的问答方法。

第五方面,一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一项所述的基于知识图谱的问答方法。

相比于相关技术,本申请实施例提供的一种基于知识图谱的问答方法、系统、装置、设备及介质,通过获取与用户语音信息相对应的第一实体、第一关系以及第二实体,其中,第一实体与第二实体之间具有第一关系;生成实体检索指令,其中,实体检索指令包括第一实体、第一关系以及第二实体;检索获取知识图谱中与实体检索指令相对应的第二子实体,其中,第二子实体为第二实体的子集;生成语义模板,其中,语义模板包括第一实体、第一关系、以及第二子实体;生成与语义模板相对应的应答语音信息,解决了相关技术中在智能问答模块中,需要消耗较多的计算资源的问题以及所配置的答案较为单一,从而造成人机交互体验差的问题,提升了检索效率和答案的相关性,并提高了人机交互体验。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本发明实施例的一种基于知识图谱的问答方法的流程图一;

图2是根据本发明实施例的一种基于知识图谱的问答方法的流程图二;

图3是根据本发明实施例的一种基于知识图谱的问答方法的流程图三;

图4是根据本发明实施例的一种基于知识图谱的问答系统的结构框图一;

图5是根据本发明实施例的一种基于知识图谱的问答系统的结构框图二;

图6是根据本发明实施例的一种基于知识图谱的问答系统的结构框图三;

图7是根据本发明实施例的一种基于知识图谱的问答系统的结构框图四;

图8是根据本发明实施例的一种基于知识图谱的问答系统的结构框图五;

图9是根据本发明实施例的一种基于知识图谱的问答系统的应用场景图;

图10是根据本发明实施例的一种基于知识图谱的问答装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。

除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、模块、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。

本发明提供的一种基于知识图谱的问答方法,可以应用于语音交互领域,通过获取用户语音信息中的第一实体、第一关系以及第二实体,以生成实体检索指令,并根据实体检索指令获取与用户语音信息相关的第二子实体,进而生成语义模板,其中,语义模板包括第一实体、第一关系以及第二子实体,然后根据语义模板生成与用户语音信息相对应的对话应答信息,解决了相关技术中在进行智能问答的情况下,智能终端需要消耗大量的计算资源才能获取与用户问题相对应的答案的问题,提升了检索效率和答案的相关性,且提高了人机交互体验。

图1是根据本发明实施例的一种基于知识图谱的问答方法的流程图一,请参见图1,该方法包括:

步骤s102,获取与用户语音信息相对应的第一实体、第一关系以及第二实体、其中,第一实体与第二实体之间具有第一关系;

步骤s104,生成实体检索指令,其中,实体检索指令包括第一实体、第一关系以及第二实体;

步骤s106,检索获取知识图谱中与实体检索指令相对应的第二子实体,其中,第二子实体为第二实体的子集;

步骤s108,生成语义模板,其中,语义模板包括第一实体、第一关系、以及第二子实体;

步骤s110,生成与语义模板相对应的应答语音信息。

其中,第一实体、第一关系以及第二实体均为用户语音信息中所包括的实体以及关系。例如,在用户语音数据为“上海火车站拥有哪些基础设施”的情况下,此时第一实体为“上海火车站”,第一关系为“拥有”,第二实体为“基础设施”,第一关系“拥有”为第一实体“上海火车站”和第二实体“基础设施”之间的关系。

其中,检索获取知识图谱中与实体检索指令相对应的第二子实体,第二子实体为第二实体的子集。例如,在用户语音信息为“上海火车站有哪些基础设施”的情况下,此时第一实体为“上海火车站”,第一关系为“拥有”,第二实体为“基础设施”,然后生成与第一实体、第一关系以及第二实体相对应的实体检索指令,且从知识图谱中获取与实体检索指令相对应的第二子实体,此时第二子实体可以为“便利店”、“超市”、“饭店”等。

在一些实施例中,在检索获取知识图谱中与实体检索指令相对应的第二子实体的情况下,可以只获取一个第二子实体,并根据该第二子实体生成一语义模板,以提升检索效率。

例如,在用户语音信息为“上海火车站拥有哪些进站口”的情况下,此时可以获取第一实体为“上海火车站”、第一关系为“拥有”以及第二实体为“进站口”,此时生成实体检索指令,并根据实体检索指令从知识图谱中检索获取一第二子实体,即“南进站口”,然后根据该第二子实体生成一语义模板,其中,该语义模板包括第一实体、第一关系以及第二实体,然后根据该语义模板生成应答语音信息,即“上海火车站有南进站口”。

在一些实施例中,在检索获取知识图谱中与实体检索指令相对应的第二子实体的情况下,可以获取若干个第二子实体,并根据该若干第二子实体生成一语义模板,以提升检索效率和答案相关性。

例如,在用户语音信息为“上海火车站拥有哪些基础设施”的情况下,此时第一实体为“上海火车站”,第一关系为“拥有”,第二实体为“基础设施”,然后生成实体检索指令,且实体检索指令包括第一实体、第一关系以及第二实体,根据实体检索指令获取若干第二子实体,若干第二子实体可以分别为“便利店”、“超市”、“饭店”等,此时可以根据若干第二子实体生成一语义模板,该语义模板包括第一实体、第一关系以及若干第二子实体,然后根据该语义模板生成应答语音信息,即“上海火车站拥有便利店、超市、饭店等基础设施”。

在一些实施例中,在检索获取知识图谱中与实体检索指令相对应的第二子实体的情况下,可以获取若干个第二子实体,并根据该若干第二子实体生成若干语义模板,其中,一第二子实体与一语义模板相对应,以对第二子实体进行详细说明。

例如,在用户语音信息为“上海火车站拥有哪些基础设施”的情况下,此时第一实体为“上海火车站”、第一关系为“拥有”、第二实体为“基础设施”,此时根据第一实体、第一关系以及第二实体生成实体检索指令,若根据实体检索指令获取两个第二子实体,两个第二子实体可以分别为“便利店”、“卫生间”,此时可以根据两个第二子实体生成两个语义模板,两个语义模板可以分别为第一语义模板、第二语义模板,其中,一第二子实体“便利店”可以与第一语义模板相对应,另一第二子实体“卫生间”可以与第二语义模板相对应,此时根据第一语义模板可以生成应答语音数据为“上海火车站拥有8个便利店,有5个便利店分别位于上海火车站一楼,有3个便利店位于上海火车站二楼”,然后根据第二语义模板生成应答语音数据可以为“上海火车站还拥有4个卫生间,其中,有3个卫生间位于上海火车站一楼,有1个卫生间位于上海火车站二楼”,从而实现对第二子实体“卫生间”、“便利店”进行详细说明。

在一些实施例中,在检索获取第二子实体的情况下,可以判断第二子实体与第一实体是否匹配,若第二子实体与第一实体匹配,那么继续获取语义模板,以提升答案的相关性。例如,在用户语音信息为“上海火车站有哪些基础设施”的情况下,此时第一实体为“上海火车站”,第二实体为“基础设施”,第一关系为“拥有”,然后生成实体检索指令,并根据实体检索指令获取第二子实体,若第二子实体为“便利店”,此时第二子实体与第一实体匹配,此时可以继续获取语义模板,以生成应答语音信息。

在一些实施例中,在第二子实体与第一实体不匹配的情况下,重新获取第二子实体以提升答案的相关性。例如,在用户语音信息为“上海火车站有哪些基础设施”的情况下,此时第一实体为“上海火车站”,第一关系为“拥有”,第二实体为“基础设施”,此时生成实体检索指令,实体检索指令包括第一实体、第一关系以及第二实体,根据实体检索指令获取第二子实体,若第二子实体为“菜市场”,此时判断第二子实体与第一实体不匹配,此时就重新获取第二子实体,以获取与第一实体相匹配的第二子实体。

其中,在根据语义模板生成与应答语音信息的情况下,可以继续获取用户语音信息,也可以不再获取用户语音信息,关闭对话流程。

通过步骤s102至步骤s110,解决了相关技术中在智能问答模块中,需要消耗较多的计算资源的问题以及所配置的答案较为单一,从而造成人机交互体验差的问题,提升了检索效率和答案的相关性。

图2是本发明实施例的一种基于知识图谱的问答方法的流程图二,请参见图2,在获取与用户语音信息相对应的第一实体、第一关系以及第二实体之前,该方法还包括:

步骤s202,收集若干第一实体、若干第一关系以及若干第二实体;

步骤s204,根据每一第一实体与每一第二实体之间的第一关系构建若干三元组数据;

步骤s206,根据若干三元组数据构建知识图谱。

其中,收集若干第一实体、第一关系以及若干第二实体,并根据每一第一实体与每一第二实体之间的第一关系构建若干三元组数据。例如,在收集到的第一实体为“便利店”,第二实体为“面包”,第一关系为“拥有”的情况下,可以根据第一关系构建三元组数据,即“便利店-拥有-面包”。

其中,在根据若干三元组数据构建知识图谱的情况下,可以将知识图谱存储到图形数据库内部,以便于随时调用知识图谱。

其中,在构建知识图谱的情况下,可以根据第二子实体,生成语义模板,其中,该语义模板包括第一实体、第一关系以及第二子实体,然后将该语义模板推送到第一消息队列,以便于及时获取到语义模板,并根据该语义模板生成应答语音数据。

其中,构建知识图谱的情况下,可以将知识图谱转换为实体数据,并将该实体数据发送到第二消息队列,根据第二消息队列中的实体数据获取用户语音信息中的第一实体、第二实体,以便于获取用户语音信息中与知识图谱相关的第一实体、第二实体。例如,在实体数据中包括“火车站”、“便利店”、“基础设施”、“面包”等实体的情况下,将该实体数据发送到第二消息队列,若用户语音信息为“火车站拥有什么基础设施”,此时可以根据第二消息队列的实体数据抽取第一实体“火车站”、第二实体“基础设施”以及第一关系“拥有”。

通过步骤s202至步骤s206建立知识图谱,且能够在知识图谱中动态检索与用户语音信息相对应的应答语音信息,从而提高了应答语音信息的相关性和检索效率。

图3是根据本发明实施例的一种基于知识图谱的问答方法的流程图三,请参见图3,在获取与用户语音信息相对应的第一实体、第一关系以及第二实体之前,所述方法还包括:

步骤s302,获取用户语音信息;

步骤s304,识别用户语音信息,以抽取第一实体、第一关系以及第二实体。

例如,在用户语音信息为“上海火车站有哪些基础设施”的情况下,此时可以抽取第一实体“上海火车站”,第二实体“基础设施”以及第一关系“拥有”。

在一些实施例中,可以根据用户语音信息中的关键字获取第一关系,以提升应答语音信息的相关性。例如,在用户语音信息为“上海火车站有哪些基础设施”的情况下,可以按照关键字“有”推测第一关系为“拥有”。

其中,在抽取与用户语音信息相对应的第一实体、第一关系以及第二实体的情况下,若用户语音信息中仅包含第一实体、第一关系,则只抽取第一实体和第一关系,并根据用户信息自动补充第二实体,以提升答案的相关性和检索效率。例如,在用户语音数据为“距离上海火车站有多远”情况下,此时可以获取用户语音数据中的第一实体“上海火车站”,第一关系“距离···有多远”,此时按照用户的位置信息,自动获取用户的位置信息作为第二实体,然后根据第一实体、第二实体以及第一关系获取上海火车站与用户所处的位置之间的距离,从而提升了检索效率和答案相关性。

通过步骤s302至步骤s304,解决了相关技术中需要消耗大量的计算资源才能够获取用户问题的问题,提高了人机交互体验。

对应于上述一种基于知识图谱的问答方法,本发明还提供了一种基于知识图谱的问答系统,以实现上述实施例以及优选实施例,已经进行过说明的不在进行赘述。

图4是根据本发明实施例的一种基于知识图谱的问答系统的结构框图一,请参见图4,包括:

自然语言理解服务器410,用于获取与用户语音信息相对应的第一实体、第一关系以及第二实体,生成实体检索指令,获取语义模板,生成与语义模板相对应的应答语音信息,其中,第一实体与第二实体之间具有第一关系,实体检索指令包括第一实体、第一关系以及第二实体,语义模板包括第一实体、第一关系以及第二子实体;

知识图谱管理服务器420,与自然语言服务器410通信连接,用于检索获取知识图谱中与实体检索指令相对应的第二子实体,生成语义模板,其中,第二子实体为第二实体的子集;

自然语言处理服务器430,分别与自然语言服务器410、知识图谱管理服务器420通信连接,用于识别用户语音信息并抽取第一实体、第一关系以及第二实体。

其中,自然语言理解服务器410获取并发送用户语音信息到自然语言处理服务器430;自然语言处理服务器430识别该用户语音信息,然后抽取与用户语音信息相对应的第一实体、第一关系以及第二实体,并将该第一实体、第一关系以及第二实体发送到自然语言理解服务器410;自然语言理解服务器410生成实体检索指令,其中,实体检索指令包括第一实体、第一关系以及第二实体;知识图谱管理服务器420接收该实体检索指令,并根据该实体检索指令检索获取第二子实体,且生成语义模板,其中,语义模板包括第一实体、第一关系以及第二子实体,知识图谱管理服务器420将语义模板发送到自然语言理解服务器410;自然语言理解服务器410生成与该语义模板相对应的应答语音信息。

其中,自然语言处理服务器420可以通过内部的命名实体识别模块识别并抽取用户语音信息中的第一实体、第一关系以及第二实体。

其中,知识图谱管理服务器420将该语义模板发送到第一消息队列,其中,语义模板包括第一实体、第一关系以及第二实体。

其中,在知识图谱管理服务器420将知识图谱转换为实体数据的情况下,知识图谱管理服务器420将该实体数据发送到第二消息队列,自然语言处理服务器430监听该第二消息队列,以获取用户语音信息中与实体数据相关的第一实体、第二实体。

其中,语义模板可以为json(javascriptobjectnotation,js对象简谱)格式。

其中,自然语言理解服务器410可以监听第一消息队列,以及时获取与实体检索指令相对应的语义模板,从而及时生成与语义模板相对应的应答语音信息。

其中,通信连接通过网络440进行连接,可以是有线网络连接,也可以是无线网络连接。在其中的一些实施例中,网络440可以包括公共网络(例如,因特网)、专用网络(例如,局域网(lan)、广域网(wan)等)、无线网络(例如,802.11网络、wi-fi网络等)、蜂窝网络(例如,4g网络、5g网络等)、帧中继网络、虚拟专用网络(vpn)、卫星网络、路由器、集线器、交换机、服务器等或者其任意组合。仅作为示例,网络440可包括电缆网络、有线网络、光纤网络、电信网络、内联网、无线局域网(wlan)、城域网(man)、公共电话交换网(pstn)等或者其任意组合。在一些实施例中,网络440可包括一个或多个网络接入点。例如,网络440可包括有线和/或无线网络接入点,诸如基站和/或因特网交换点,上述装置可通过这些接入点连接到网络以交换信息和/或数据。

通过自然语言理解服务器410、知识图谱管理服务器420以及自然语言处理服务器430组成的系统,解决了相关技术中在进行智能问答的情况下,需要消耗较多的计算资源才能获取用户问题的问题以及所配置的答案较为单一,从而造成人机交互体验差的问题。

图5是根据本发明实施例的一种基于知识图谱的问答系统的结构框图二,请参见图5,知识图谱管理服务器420包括:

收集单元421,用于收集若干第一实体、若干第一关系以及若干第二实体;

构建单元422,用于根据第一实体与第二实体之间的第一关系,构建与第一实体、第二实体以及第一关系相对应的三元组数据,并根据三元组数据构建知识图谱;

存储单元423,用于存储知识图谱。

其中,存储单元423可以为neo4j图形数据库。

通过收集单元421收集若干第一实体、若干第一关系以及若干第二实体,构建单元422根据第一实体与第二实体之间的第一关系以及第一实体、第二实体构建三元组数据,并根据三元组数据构建知识图谱,解决了现有的只能人工配置用户问题答案的问题,实现了能够动态检索知识图谱以获取与用户语音信息相对应的应答语音信息的效果。

图6是根据本发明实施例的一种基于知识图谱的问答系统的结构框图三,请参见图6,自然语言处理服务器430包括:

识别单元431,用于识别用户语音信息,并抽取第一实体、第一关系以及第二实体。

通过识别单元431识别用户语音信息中的第一实体、第一关系以及第二实体,并将第一实体、第一关系以及第二实体发送到自然语言理解服务器410,从而使自然语言理解服务器410能够根据第一实体、第一关系以及第二实体生成实体检索指令,并根据实体检索指令从知识图谱中获取语义模板,然后根据语义模板生成应答语音信息,解决了相关技术中需要消耗大量的计算资源才能获取用户问题和答案的问题,极大的提升了检索效率。

图7是根据本发明实施例的一种基于知识图谱的问答系统的结构框图四,请参见图7,知识图谱管理服务器420还包括:

消息生成单元424,用于在生成语义模板的情况下,生成语义模板消息;

推送单元425,用于将语义模板消息以及语义模板推送到第一消息队列;

自然语言理解服务器410还包括:

第一监听单元411,用于监听第一消息队列,在监听到语义模板消息的情况下,自然语言理解服务器410获取语义模板。

其中,知识图谱管理服务器420在根据第一实体、第一关系以及第二子实体生成语义模块的情况下,生成语义模板消息,然后将该语义模板消息以及语义模板推送到第一消息队列,在自然语言理解服务器410监听到语义模板消息的情况下,获取语义模板,从而使自然语言理解服务器410能够及时获取语义模板。

通过消息生成单元424、推送单元425以及第一监听单元411,使自然语言理解服务器410能够及时获取语义模板消息以及语义模板,进而及时生成与语义模板相对应的应答语音信息,进而提高了人机交互体验。

图8是根据本发明实施例的一种基于知识图谱的问答系统的结构框图五,请参见图8,消息生成单元424还用于在知识图谱管理服务器420生成实体数据的情况下,生成实体数据信息,其中,实体数据包括若干第一实体、若干第二实体;

推送单元425还用于将实体数据以及实体数据信息推送到第二消息队列;

自然语言处理服务器430还包括:

第二监听单元432,用于监听第二消息队列,且在监听到实体数据消息的情况下,自然语言处理服务器430获取实体数据。

在知识图谱服务器生成实体数据的情况下,消息生成单元424生成实体数据信息,推送单元425将实体数据信息和实体数据推送到第二消息队列,自然语言处理服务器430通过第二监听单元432监听第二消息队列,在监听到实体数据消息的情况下,获取实体数据,从而使自然语言处理服务器430能够及时获取知识图谱管理服务器420所生成的实体数据,进而在自然语言处理服务器430获取到用户语音信息的情况下,可以根据该实体数据抽取用户语音信息中的第一实体、第二实体,其中,第一实体、第二实体均为实体数据的一个子集。

例如,如图9所示,知识图谱管理服务器420可以通过收集单元421收集若干第一实体、若干第一关系以及若干第二实体,根据每一第一实体与每一第二实体之间的第一关系构建三元组数据,构建单元422根据该三元组数据构建知识图谱,然后将该知识图谱存储到存储单元423。然后自然语言理解服务器410接收用户语音信息,然后将该用户语音信息发送到自然语言处理服务器430,自然语言处理服务器430根据知识图谱管理服务器420发送的实体数据以获取第一实体、第二实体以及第一关系,然后将该第一实体、第一关系以及第二实体发送到自然语言理解服务器410,自然语言理解服务器410生成实体检索指令,知识图谱管理服务器420根据该实体检索指令获取第二子实体,并生成语义模板信息,自然语言理解服务器410根据该语义模板信息获取语义模板,其中,语义模板包括第一实体、第一关系以及第二子实体,然后自然语言理解服务器410根据语义模板生成应答语音信息,进入下一轮对话,自然语言理解服务器410继续获取用户语音信息。

图10是根据本发明实施例的一种基于知识图谱的问答装置的结构框图,请参见图10,该装置包括:

自然语言理解模块101,用于获取与用户语音信息相对应的第一实体、第一关系以及第二实体,生成实体检索指令,获取语义模板,生成与语义模板相对应的应答语音信息,其中,第一实体与第二实体之间具有第一关系,实体检索指令包括第一实体、第一关系以及第二实体,语义模板包括第一实体、第一关系以及第二子实体;

知识图谱管理模块102,与自然语言理解模块101通信连接,用于检索获取知识图谱中与实体检索指令相对应的第二子实体,生成语以模板,其中,第二子实体为第二实体的子集;

自然语言处理模块103,分别与自然语言理解模块101、知识图谱管理模块102通信连接,用于识别用户语音信息并抽取第一实体、第一关系以及第二实体。

其中,通信连接通过网络104进行连接,可以是有线网络连接,也可以是无线网络连接。

其中,通信连接还可以通过网络104进行连接,可以是有线网络连接,也可以是无线网络连接。在其中的一些实施例中,网络104可以包括公共网络(例如,因特网)、专用网络(例如,局域网(lan)、广域网(wan)等)、无线网络(例如,802.11网络、wi-fi网络等)、蜂窝网络(例如,4g网络、5g网络等)、帧中继网络、虚拟专用网络(vpn)、卫星网络、路由器、集线器、交换机、服务器等或者其任意组合。仅作为示例,网络104可包括电缆网络、有线网络、光纤网络、电信网络、内联网、无线局域网(wlan)、城域网(man)、公共电话交换网(pstn)等或者其任意组合。在一些实施例中,网络104可包括一个或多个网络接入点。例如,网络104可包括有线和/或无线网络接入点,诸如基站和/或因特网交换点,上述装置可通过这些接入点连接到网络以交换信息和/或数据。

通过自然语言理解模块101、知识图谱管理模块102以及自然语言处理模块103解决了相关技术中在智能问答模块中,需要消耗较多的计算资源的问题以及所配置的答案较为单一,从而造成人机交互体验差的问题。

另外,本申请实施例的一种基于知识图谱的问答方法可以由计算机设备来实现。计算机设备的组件可以包括但不限于处理器以及存储有计算机程序指令的存储器。

在一些实施例中,处理器可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,简称为asic),或者可以被配置成实施本申请实施例的一个或多个集成电路。

在一些实施例中,存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器可包括硬盘驱动器(harddiskdrive,简称为hdd)、软盘驱动器、固态驱动器(solidstatedrive,简称为ssd)、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,简称为usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器可在数据处理装置的内部或外部。在特定实施例中,存储器是非易失性(non-volatile)存储器。在特定实施例中,存储器包括只读存储器(read-onlymemory,简称为rom)和随机存取存储器(randomaccessmemory,简称为ram)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(programmableread-onlymemory,简称为prom)、可擦除prom(erasableprogrammableread-onlymemory,简称为eprom)、电可擦除prom(electricallyerasableprogrammableread-onlymemory,简称为eeprom)、电可改写rom(electricallyalterableread-onlymemory,简称为earom)或闪存(flash)或者两个或更多个以上这些的组合。在合适的情况下,该ram可以是静态随机存取存储器(staticrandom-accessmemory,简称为sram)或动态随机存取存储器(dynamicrandomaccessmemory,简称为dram),其中,dram可以是快速页模式动态随机存取存储器(fastpagemodedynamicrandomaccessmemory,简称为fpmdram)、扩展数据输出动态随机存取存储器(extendeddateoutdynamicrandomaccessmemory,简称为edodram)、同步动态随机存取内存(synchronousdynamicrandom-accessmemory,简称sdram)等。

存储器可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器所执行的可能的计算机程序指令。

处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种基于知识图谱的问答方法。

在其中一些实施例中,计算机设备还可包括通信接口和总线。其中,处理器、存储器、通信接口通过总线连接并完成相互间的通信。

通信接口用于实现本申请实施例中各模块、装置、单元和、或设备之间的通信。通信接口还可以实现与其他部件例如:外接设备、图像、数据采集设备、数据库、外部存储以及图像、数据处理工作站等之间进行数据通信。

总线包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线包括但不限于以下至少之一:数据总线(databus)、地址总线(addressbus)、控制总线(controlbus)、扩展总线(expansionbus)、局部总线(localbus)。举例来说而非限制,总线可包括图形加速接口(acceleratedgraphicsport,简称为agp)或其他图形总线、增强工业标准架构(extendedindustrystandardarchitecture,简称为eisa)总线、前端总线(frontsidebus,简称为fsb)、超传输(hypertransport,简称为ht)互连、工业标准架构(industrystandardarchitecture,简称为isa)总线、无线带宽(infiniband)互连、低引脚数(lowpincount,简称为lpc)总线、存储器总线、微信道架构(microchannelarchitecture,简称为mca)总线、外围组件互连(peripheralcomponentinterconnect,简称为pci)总线、pci-express(pci-x)总线、串行高级技术附件(serialadvancedtechnologyattachment,简称为sata)总线、视频电子标准协会局部(videoelectronicsstandardsassociationlocalbus,简称为vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。

另外,结合上述实施例中的基于知识图谱的问答方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于知识图谱的问答方法。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1