智能客服知识图谱的构建方法与系统与流程

文档序号:15347525发布日期:2018-09-04 22:56阅读:593来源:国知局

本发明涉及人工智能领域,尤其涉及智能客服知识图谱的构建方法与系统。



背景技术:

目前,智能客服系统存在服务时间长,智能化程度低,为客户提供的服务内容无法满足客户真正需求,因此,现有技术无法为智能客服系统提供更好的解决方案,客服服务仍依赖于人工。



技术实现要素:

本发明实施例提出智能客服知识图谱的构建方法与系统,能够更快速地构建智能客服知识图谱,提高客服服务质量。

本发明一方面提供一种智能客服知识图谱的构建方法,所述方法包括:

提取至少一个数据源的实体及关系;

采用预设的智能客服匹配模板对所述至少一个数据源的实体及关系进行特征匹配,以筛选目标领域的实体及关系;其中,所述智能客服匹配模板为通过神经网络算法对目标领域的语料库中的每一实体及关系进行模型训练所生成;

对筛选到的目标领域的实体执行实体对齐操作,以根据已对齐的实体形成已对齐实体集;

采用路径推理算法对所述已对齐实体集中的不同实体进行实体链接,及对所述已对齐实体集的实体与所述知识图谱中的实体进行实体链接,以补全实体间的关系;

将所述已对齐实体集集成到知识图谱中,以构建智能客服知识图谱。

在一种可选的实施方式中,所述提取至少一个数据源的实体和关系,包括:

对每一所述数据源,确定所述数据源的类型并判断所述数据源的类型是否为结构化数据类型;

当判定所述数据源的类型为结构化数据类型时,采用预设的结构化数据与实体及关系的映射规则,提取所述数据源的实体和关系;

当判定所述数据源的类型为半结构化数据类型时,采用预设模板对所述数据源进行匹配,以提取所述数据源的实体和关系;

当判定所述数据源的类型为非结构化数据类型时,将所述数据源转化为文本数据,及基于自然语义理解从所述文本数据中提取出实体和关系。

在一种可选的实施方式中,所述对筛选到的目标领域的实体执行实体对齐操作,以根据已对齐的实体形成已对齐实体集,包括:

将筛选到的目标领域的实体中指向同一概念且名称不同的实体合并为同一实体;

根据指向不同概念且名称不同的实体生成已对齐实体集。

在一种可选的实施方式中,所述采用路径推理算法对所述已对齐实体集中的不同实体进行实体链接,及对所述已对齐实体集的实体与所述知识图谱中的实体进行实体链接,以补全实体间的关系,包括:

采用预设的路径推理算法,确定所述已对齐实体集中的不同实体间的链接关系,及确定所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系;

根据所述已对齐实体集中的不同实体间的链接关系,及所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系,补全实体间的关系。

在一种可选的实施方式中,所述方法还包括:

响应于所述智能客服知识图谱的更新指令,获取目标知识;

判断所述智能客服知识图谱中是否具有所述目标知识;

当判定所述智能客服知识图谱中没有所述目标知识时,将所述目标知识增加至所述智能客服知识图谱中。

本发明另一方面还提供一种智能客服知识图谱的构建系统,所述系统包括:

提取模块,用于提取至少一个数据源的实体及关系;

匹配模块,用于采用预设的智能客服匹配模板对所述至少一个数据源的实体及关系进行特征匹配,以筛选目标领域的实体及关系;其中,所述智能客服匹配模板为通过神经网络算法对目标领域的语料库中的每一实体及关系进行模型训练所生成;

对齐模块,用于对筛选到的目标领域的实体执行实体对齐操作,以根据已对齐的实体形成已对齐实体集;

链接模块,用于采用路径推理算法对所述已对齐实体集中的不同实体进行实体链接,及对所述已对齐实体集的实体与所述知识图谱中的实体进行实体链接,以补全实体间的关系;

构建模块,用于将所述已对齐实体集集成到知识图谱中,以构建智能客服知识图谱。

在一种可选的实施方式中,所述提取模块包括:

判断单元,用于对每一所述数据源,确定所述数据源的类型并判断所述数据源的类型是否为结构化数据类型;

第一判定单元,用于当判定所述数据源的类型为结构化数据类型时,采用预设的结构化数据与实体及关系的映射规则,提取所述数据源的实体和关系;

第二判定单元,用于当判定所述数据源的类型为半结构化数据类型时,采用预设模板对所述数据源进行匹配,以提取所述数据源的实体和关系;

第三判定单元,用于当判定所述数据源的类型为非结构化数据类型时,将所述数据源转化为文本数据,及基于自然语义理解从所述文本数据中提取出实体和关系。

在一种可选的实施方式中,所述对齐模块包括:

合并单元,用于将筛选到的目标领域的实体中指向同一概念且名称不同的实体合并为同一实体;

生成单元,用于根据指向不同概念且名称不同的实体生成已对齐实体集。

在一种可选的实施方式中,所述链接模块,包括:

确定单元,用于采用预设的路径推理算法,确定所述已对齐实体集中的不同实体间的链接关系,及确定所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系;

补全单元,用于根据所述已对齐实体集中的不同实体间的链接关系,及所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系,补全实体间的关系。

在一种可选的实施方式中,所述系统还包括:

获取模块,用于响应于所述智能客服知识图谱的更新指令,获取目标知识;

判断模块,用于判断所述智能客服知识图谱中是否具有所述目标知识;

判定模块,用于当判定所述智能客服知识图谱中没有所述目标知识时,将所述目标知识增加至所述智能客服知识图谱中。

相对于现有技术,本发明具有如下突出的有益效果:本发明提供了一种智能客服知识图谱的构建方法与系统,其中,所述方法能够结合神经网络算法筛选目标领域的实体和关系,有助于更准确更快速地建立起智能客服知识图谱;通过先进行实体对齐再通过路径推理算法将所述已对齐实体集的每一实体链接到所述知识图谱框架中,不但将重复的实体去除,而且将确实的关系进行链接,以提高智能客服知识图谱的可靠性和智能化,有助于提高智能客服服务的服务质量。

附图说明

图1是本发明提供的智能客服知识图谱的构建方法的第一实施例的流程示意图;

图2是本发明提供的智能客服知识图谱的构建系统的第一实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,其是本发明提供的智能客服知识图谱的构建方法的第一实施例的流程示意图,如图1所示,所述方法包括:

步骤s101、提取至少一个数据源的实体及关系;

步骤s102、采用预设的智能客服匹配模板对所述至少一个数据源的实体及关系进行特征匹配,以筛选目标领域的实体及关系;其中,所述智能客服匹配模板为通过神经网络算法对目标领域的语料库中的每一实体及关系进行模型训练所生成;

步骤s103、对筛选到的目标领域的实体执行实体对齐操作,以根据已对齐的实体形成已对齐实体集;具体地,所述实体对齐操作包括目标领域的实体之间的实体对齐操作,及目标领域的实体与知识图谱中的实体的实体对齐操作;

步骤s104、采用路径推理算法对所述已对齐实体集中的不同实体进行实体链接,及对所述已对齐实体集的实体与所述知识图谱中的实体进行实体链接,以补全实体间的关系;

步骤s105、将上述已对齐实体集集成到知识图谱中,以构建智能客服知识图谱。

需要说明的是,知识图谱是结构化的语义知识库,是一个具有属性的实体通过关系链接而成的网状知识库。实体之间通过关系相互联结,构成网状的知识结构。所述标准文本对应的实体和属性为所述标准文本中根据人工制定的标准所确定。所述语料库包括大量文本数据。实体对齐是对提取的海量实体中相同本质的实体进行合并,实体链接是将提取的实体链接到知识图谱中的实体对象。

即能够结合神经网络算法筛选目标领域的实体和关系,有助于更准确更快速地建立起智能客服知识图谱;通过先进行实体对齐再通过路径推理算法将所述已对齐实体集的每一实体链接到所述知识图谱框架中,不但将重复的实体去除,而且将确实的关系进行链接,以提高智能客服知识图谱的可靠性和智能化,有助于提高智能客服服务的服务质量。

本发明还提供了一种智能客服知识图谱的构建方法的第二实施例,所述方法包括上述智能客服知识图谱的构建方法的第一实施例中的步骤s101 ̄s104,还进一步限定了:所述提取至少一个数据源的实体和关系,包括:

对每一所述数据源,确定所述数据源的类型并判断所述数据源的类型是否为结构化数据类型;

当判定所述数据源的类型为结构化数据类型时,采用预设的结构化数据与实体及关系的映射规则,提取所述数据源的实体和关系;

当判定所述数据源的类型为半结构化数据类型时,采用预设模板对所述数据源进行匹配,以提取所述数据源的实体和关系;

当判定所述数据源的类型为非结构化数据类型时,将所述数据源转化为文本数据,及基于自然语义理解从所述文本数据中提取出实体和关系。

需要说明的是,结构化数据类型是指数据以数据模型的方式,存储在关系数据库中,主要包含表和字段。通过映射规则将关系数据库中的数据与实体和关系进行对应。其中映射规则为,表中的数据对应本体的实体,表与表之间的关系对应着实体与关系。

半结构化数据是指没有严格数据模型的数据,主要包含网页数据、xml和json等数据。

无结构化数据是指无数据模型的数据,主要包含纯文本、图像、音频等数据。

自然语义理解(nlu,naturallanguageunderstanding)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

即针对不同结构化数据采用不同方法提取出实体和关系,进一步提高智能客服知识图谱的构建的效率和准确性。

本发明还提供了一种智能客服知识图谱的构建方法的第三实施例,所述方法包括上述智能客服知识图谱的构建方法的第一实施例中的步骤s101~s104,还进一步限定了:所述对筛选到的目标领域的实体执行实体对齐操作,以根据已对齐的实体形成已对齐实体集,包括:

将筛选到的目标领域的实体中指向同一概念且名称不同的实体合并为同一实体;

根据指向不同概念且名称不同的实体生成已对齐实体集。

即通过将指向同一概念且名称不同的实体合并为同一实体,去除冗余的实体,提高智能客服知识图谱的可靠性。

在一种可选的实施方式中,所述将筛选到的目标领域的实体中指向同一概念且名称不同的实体合并为同一实体,包括:

确定筛选到的目标领域的实体指向的概念;

对于确定的每一概念,匹配指向所述概念的实体;

将匹配到的实体合并为同一实体。

本发明还提供了一种智能客服知识图谱的构建方法的第四实施例,所述方法包括上述智能客服知识图谱的构建方法的第一实施例中的步骤s101~s104,还进一步限定了:所述采用路径推理算法对所述已对齐实体集中的不同实体进行实体链接,及对所述已对齐实体集的实体与所述知识图谱中的实体进行实体链接,以补全实体间的关系,包括:

采用预设的路径推理算法,确定所述已对齐实体集中的不同实体间的链接关系,及确定所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系;

根据所述已对齐实体集中的不同实体间的链接关系,及所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系,补全实体间的关系。

即根据筛选到的目标领域的关系及预设的路径推理算法,将所述实体的数据源集成到所述实体在所述知识图谱框架中的位置,以预测余下的实体与知识图谱中的实体的关系,对缺失的关系进行连接,提高智能客服知识图谱的可靠性。

本发明还提供了一种智能客服知识图谱的构建方法的第五实施例,所述方法包括上述智能客服知识图谱的构建方法的第四实施例中的步骤s101~s104,还进一步限定了:所述方法还包括:

响应于所述智能客服知识图谱的更新指令,获取目标知识;

判断所述智能客服知识图谱中是否具有所述目标知识;

当判定所述智能客服知识图谱中没有所述目标知识时,将所述目标知识增加至所述智能客服知识图谱中。

即通过对目标知识进行验证,避免出现实体重复等问题,提高智能客服知识图谱的可靠性和效率。

参见图2,其是本发明提供的智能客服知识图谱的构建系统的第一实施例的结构示意图,如图2所示,所述系统包括:

提取模块201,用于提取至少一个数据源的实体及关系;

匹配模块202,用于采用预设的智能客服匹配模板对所述至少一个数据源的实体及关系进行特征匹配,以筛选目标领域的实体及关系;其中,所述智能客服匹配模板为通过神经网络算法对目标领域的语料库中的每一实体及关系进行模型训练所生成;

对齐模块203,用于对筛选到的目标领域的实体执行实体对齐操作,以根据已对齐的实体形成已对齐实体集;

链接模块204,用于采用路径推理算法对所述已对齐实体集中的不同实体进行实体链接,及对所述已对齐实体集的实体与所述知识图谱中的实体进行实体链接,以补全实体间的关系;

构建模块205,用于将所述已对齐实体集集成到知识图谱中,以构建智能客服知识图谱。

在一种可选的实施方式中,所述提取模块包括:

判断单元,用于对每一所述数据源,确定所述数据源的类型并判断所述数据源的类型是否为结构化数据类型;

第一判定单元,用于当判定所述数据源的类型为结构化数据类型时,采用预设的结构化数据与实体及关系的映射规则,提取所述数据源的实体和关系;

第二判定单元,用于当判定所述数据源的类型为半结构化数据类型时,采用预设模板对所述数据源进行匹配,以提取所述数据源的实体和关系;

第三判定单元,用于当判定所述数据源的类型为非结构化数据类型时,将所述数据源转化为文本数据,及采用自然语义理解算法从所述文本数据中提取出实体和关系。

在一种可选的实施方式中,所述对齐模块包括:

合并单元,用于将筛选到的目标领域的实体中指向同一概念且名称不同的实体合并为同一实体;

生成单元,用于根据指向不同概念且名称不同的实体生成已对齐实体集。

在一种可选的实施方式中,所述链接模块,包括:

确定单元,用于采用预设的路径推理算法,确定所述已对齐实体集中的不同实体间的链接关系,及确定所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系;

补全单元,用于根据所述已对齐实体集中的不同实体间的链接关系,及所述已对齐实体集的实体与所述知识图谱框架中的实体间的链接关系,补全实体间的关系。

在一种可选的实施方式中,所述系统还包括:

获取模块,用于响应于所述智能客服知识图谱的更新指令,获取目标知识;

判断模块,用于判断所述智能客服知识图谱中是否具有所述目标知识;

判定模块,用于当判定所述智能客服知识图谱中没有所述目标知识时,将所述目标知识增加至所述智能客服知识图谱中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

需说明的是,以上所描述的装置或系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1