一种基于知识图谱的全媒体坐席检索方法与流程

文档序号:37656960发布日期:2024-04-18 20:30阅读:9来源:国知局
一种基于知识图谱的全媒体坐席检索方法与流程

本发明涉及通信,尤其涉及一种基于知识图谱的全媒体坐席检索方法。


背景技术:

1、目前,大部分公司的呼叫中心运营过程中,坐席使用的知识库存在以下问题:知识结构单一,以非结构化知识为主,知识搜索不准确,响应慢,需要使用者对于搜索的知识有一定了解,搜索缺乏知识相关性关联,知识展现形式单一等特点,客服无法在知识库中快速找到知识,以及通过知识库快速学习掌握知识。因此,现有搜索技术无法准确定位知识,并且需要使用者对于搜索的知识有一定了解,具有知识搜索效率低、知识积累无体系、知识关联少等弊端。


技术实现思路

1、本发明的目的在于提供一种基于知识图谱的全媒体坐席检索方法。

2、本发明采用的技术方案是:

3、一种基于知识图谱的全媒体坐席检索方法,其包括以下步骤:

4、步骤1,知识收集:获取结构化的数据,并从结构化数据中提取客户名、工号名、产品名、特定时间的实体数据,得到知识单元要素,以形成第一知识数据;知识单元要素包括实体、关系、属性三元组,凭借规则和约束条件来规范实体、关系以及实体的类型和属性等对象之间的联系;

5、步骤2,知识抽取:利用nlp自然语言技术从非结构化和半结构化数据中抽取实体、关系、属性,以形成第二知识数据。其中实体抽取的质量对后续的知识获取效率和质量影响重大,是知识抽取中最为基础和关键的部分。文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关语料中提取出实体之间的关联关系,通过关系将实体联系起来,才能够形成网状的知识结构。主要针对规则条件方面去进行人工或者自动抽取。然后从不同信息源中采集特定实体的属性信息,例如针对某个客户,可以从公开信息中得到其性别、生日、国籍、教育背景等信息。从多种数据源中汇集这些信息,实现对实体属性的完整描述;

6、步骤3,知识融合:为了消除概念的歧义,剔除几余和错误概念,确保知识的质量,将来自不同知识源的第一知识数据和第二知识数据在同一框架规范下进行实体消歧形和共指消解,形成高质量的知识库并合并存储;

7、步骤4,知识加工:进行本体构建和质量评估共两方面的知识加工。即先确定本体的领域和范围(比如本体包括查询类知识、故障类知识、办理类知识),然后列举出知识中的一些重要术语、词典,再定义好这些知识的类、属性、约束条件的层次结构,最后构建树状结构的本体模型类继承实例。可以通过人工编辑的方式来手动构建,也可以采用算法评估和人工审核相结合的方式自动构建。自动构建本体的过程包含3步:实体并列关系相似度计算、实体上下位关系抽取,以及本体的生成。针对知识图谱的质量评估,可以对知识图谱中知识的质量进行量化。根据量化评估的结果,保留置信度评分较高的知识,舍弃置信度评分较低的知识,以便确保知识图谱中知识的可靠性。本系统采用人工抽样检测法和一致性检测法。其中对于准确度要求高的场景,采用人工抽样检测,对知识图谱进行逐条检测,具体包括均匀采样和不均匀采样。对于准确度要求较低或知识点较多的场景,采用一致性检测法,检测知识的定义、类型等质量问题;

8、步骤5,知识更新:从数据层面和结构层面更新知识本体中元素,更新的元素包括概念的增加修改和删除、概念属性的更新以及概念间上下位关系的更新。分为全量更新和增量更新;

9、步骤6,知识表达:前端用vue.js+d3.js实现知识图谱的2d/3d可视化信息图。可提取数据特征自动优化分层布局。

10、进一步地,步骤2中基于远监督学习从客服代表坐席信息抽取多元关系信息,形成结构化的多元关系,多元关系包括多个二元子关系。

11、进一步地,步骤2包括以下步骤:

12、步骤2-1,获取各种非结构化的文本数据并进行预处理;预处理包括清洗、过滤和筛选;

13、步骤2-2,对预处理后的文本进行分词、词性标注、语法解析和依存分析;

14、步骤2-3,对分词后的各个文本片段进行ner命名实体识别,并进行实体链接entity linking;

15、步骤2-4,从文本数据中提取实体之间的关系,并提取对应的事件;

16、步骤2-5,最终形成kr用的三元组、多元关系、模态知识作为第二知识数据,以构成知识图谱。

17、进一步地,步骤3中通过异构数据整合、消歧、推理验证、更新步骤,实现数据、信息、方法、经验的融合。

18、进一步地,步骤3中利用二维的数据表对知识图谱中的数据进行存储,存储的内容包括三元组表、类型表、关系数据库;三元组表:知识图谱中的事实是一个个的三元组;类型表:每种类型构建一张表,同一类型的实例存放在相同的表中,表的每一列表示该类实体的一个属性,每一行存储对应类实体的一个实例;关系数据库以二维表结构对数据进行组织和存储。

19、进一步地,步骤4中通过人工编辑的方式来手动构建或采用算法评估和人工审核相结合的方式自动构建。

20、进一步地,步骤4中自动构建本体的过程包含:实体并列关系相似度计算、实体上下位关系抽取,以及本体的生成。

21、进一步地,步骤4中质量评估时采用人工抽样检测法和一致性检测法;对于准确度要求高于设定值的场景采用人工抽样检测对知识图谱进行逐条检测,具体包括均匀采样和不均匀采样;对于准确度要求低于设定值或知识点大于设定阈值的场景,采用一致性检测法检测知识的定义、类型质量问题。

22、进一步地,步骤6中2d/3d图谱的基础交互事件依次如下:

23、步骤6-1、d3初始化:包括数据解析、数据渲染及响应式数据初始化;

24、步骤6-2、图查询更新视图:向后台请求数据的功能,获取新的数据后,更新图展示部分,重新渲染视图;

25、步骤6-3、平移与缩放:通过缩放、拖拽和平移来调整图谱布局,使展示结果更加清晰;

26、步骤6-4、文字显示:文字基于节点居中显示,支持自动换行排版,根据文本字数分1-3行进行展示;

27、步骤6-5、拖拽:通过按住鼠标调整选中节点的位置及相对布局;

28、步骤6-6、鼠标浮动事件:鼠标悬浮在节点上触发,并通过粗边框标记选中节点,细边框标记关联的节点,同时在右侧展示该节点的详细信息;

29、步骤6-7、鼠标单击事件:单击当前节点进入聚焦模式,隐藏无关节点并标记当前选中节点及邻居节点和关系;点击画布即取消聚焦模式;

30、步骤6-8、鼠标右键菜单:鼠标右击目标节点触发实现隐藏节点、显示节点关联图、显示所有关联查询节点的菜单功能;

31、步骤6-9、图例交互事件:通过点击图例隐藏对应类型的节点和关系。

32、步骤6-10、文字搜索:图数据量过大时,通过左侧的关键字搜索,找到符合条件的节点及关联节点;

33、步骤6-11、关系文字和箭头的绘制与调整:根据关系直线的坐标位置对文字进行调整;

34、步骤6-12、节点编辑:可编辑节点名称、节点备注信息。

35、步骤6-13、图谱渲染:使用d3完成2d渲染,使用three完成3d渲染。

36、本发明采用以上技术方案,采用自底向上的方式构建知识库,并以2d/3d图谱的方式进行可视化展示。在ims网络中,基于实体抽取、关系抽取和属性抽取等关键技术,抽取结构化数据、半结构化数据、非结构化数据,提取出资源模式,选择置信度较高的关键属性和关系组,加入到知识库中。然后进行知识融合,包括实体链接、知识合并。最后进行知识加工,主要包括:本体抽取、知识推理和质量评估。如果需要更新知识库中的实体、关系、属性值,则需要考虑数据源的可靠性、数据的一致性(是否存在矛盾或冗杂等问题)等可靠数据源,并选择在各数据源中出现频率高的事实和属性加入知识库。本发明客服的实时调度提供坐席视图的快速检索。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1