一种知识追踪方法及系统与流程

文档序号:36240786发布日期:2023-12-02 01:09阅读:33来源:国知局
一种知识追踪方法及系统与流程

本发明涉及文本信息处理,特别是指一种知识追踪方法及系统。


背景技术:

1、知识管理在当今信息爆炸的时代变得至关重要。在知识学习过程中,比如学生学习过程以及企业生产学习过程中,会衍生出大量的文本、图像或者其他类型的知识素材,这些知识素材中蕴含丰富且现有资源中不曾出现的宝贵知识,具有较大的知识价值,尤其是技术知识、技术经验等。若是将这些知识素材更好地进行知识管理、加以提取利用,则可以为用户或者企业带来更多的价值。

2、知识追踪,在知识管理中起到主要的作用。旨在追踪在学习和生产过程中产生的技术素材,并构建对应的知识库,将知识库投入后续的学习或者生产运营。

3、现有的知识库,通过采用知识库管理工具/助手,对企业或者用户的知识资产进行管理。现有通用的知识库,主要是一种用于知识管理的数据库,用于相关应用领域知识的收集、重新整理以及抽取。知识库中的知识来源于专家或是专业人士的经验和教训,虽然构建简单,但是也存在一些问题:

4、现有知识库中管理的知识数据,来源主要是相关应用领域知识的收集,并加以形式上的整理和应用,因此缺乏知识要素的实体识别,缺乏知识要素之间的关联关系,关联信息比较模糊,无法直观为企业或者用户提供可视化的关联数据,不便于知识信息的管理、检索和追踪;

5、现有知识库中知识数据,为用户提供的知识库文档,较为直接,直接为用户展示整理的经验和教训,缺乏知识数据的关键信息提取和知识要素的分析,缺乏深度知识分析应用。


技术实现思路

1、本发明实施例提供了一种知识追踪方法及系统,能够依托知识实体的关联关系,进行有序、可视化的知识数据管理和应用,通过融合生成的知识图谱,能够快速地让用户了解到对应的知识点位置和关联性,并提供知识点的关联性和知识文本的情感/内容倾向以及态度分析,供用户更好地了解知识的内容、深度分析和应用知识图谱,最大化利用知识价值,从而实现智能地管理、检索和追踪知识。所述技术方案如下:

2、一方面,提供了一种知识追踪方法,该方法应用于电子设备,该方法包括:

3、s1、提取知识文本数据并缓存至分布式文件系统;

4、s2、通过预先部署的ai实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系t,并将所述关联关系t映射保存至数据库;

5、s3、定时通知知识库构建模块抽取所述关联关系t,在所述知识库构建模块上,基于所述关联关系t执行知识图谱构建活动g,以融合实体要素的文本摘要、情感/内容倾向以及态度,生成知识图谱,并将所述知识图谱实时推荐至知识管理平台;

6、s4、通过所述知识管理平台管理所述知识图谱,供用户通过应用端访问,开展对所述知识图谱的检索应用。

7、进一步地,所述提取知识文本数据并缓存至分布式文件系统包括:

8、s11、提取知识文本数据,批量对提取的所述知识文本数据进行预处理和清洗;

9、s12、对批量处理后的所述知识文本数据,按照文本类型进行数据分类,得到由若干不同文本类型的知识文本数据块组成的数据集m,其中,

10、m={知识文本数据块1,知识文本数据块2,知识文本数据块3......};

11、s13、对所述数据集m中的各项知识文本数据块,按照预设的知识文本优先级进行有序编号,并进行序列优先重排,得到知识文本优排数据集n;

12、s14、遍历分布式文件系统的各个存储节点,查看可用的所述存储节点,并将所述知识文本优排数据集n中的各项知识文本数据块,按照优先重排顺序分布储存于所述分布式文件系统的所述存储节点;

13、s15、将各项知识文本数据块的储存地址,发送至后台服务器。

14、进一步地,所述通过预先部署的ai实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系t,并将所述关联关系t映射保存至数据库包括:

15、s21、后台服务器接收到所述储存地址之时,通知预先部署的ai实体识别模型调用储存在所述储存地址的知识文本数据块;

16、s22、通过所述ai实体识别模型对所述知识文本数据块进行实体识别,自动识别得到所述知识文本数据块中的实体要素m,同时根据所述实体要素m的上下文文本信息,关联识别得到所述实体要素之间的关联关系t:m1→m2;其中,m1和m2都表示实体要素;

17、s23、将所述实体要素m和所述关联关系t进行关联绑定,并将所述关联关系t映射保存至数据库;

18、s24、按照步骤s21- s23,依次对所述知识文本优排数据集n中的各项知识文本数据块进行实体识别和关联绑定、保存。

19、进一步地,所述基于所述关联关系t执行知识图谱构建活动g,以融合实体要素的文本摘要、情感/内容倾向以及态度,生成知识图谱包括:

20、s31、在知识管理平台的创建页面上,为各个所述实体要素分配对应的实体代表节点;

21、s32、根据所述实体要素之间的关联关系t,将具有关联性的所述实体代表节点进行关联;

22、s33、对所述实体代表节点进行配置,将对应所述实体要素的文本摘要信息和所述情感/内容倾向以及态度,绑定至所述实体代表节点;

23、s34、绑定完毕,对所述实体代表节点进行元数据配置,在创建页面上生成对应的所述知识图谱。

24、进一步地,所述活动g表示为:

25、g=∏x k l,

26、其中,

27、x表示实体要素关联,将具有关联性的所述实体要素进行关联绑定;

28、k表示文本摘要提取,使用文本摘要算法,提取得到有关所述实体要素的文本摘要信息;

29、l表示文本内容分析,使用语义分析算法,对关联绑定的所述实体要素的文本摘要信息进行文本情感/内容分析,提取得到所述实体要素的情感/内容倾向以及态度;

30、g表示利用x、k和l的活动结果,构建生成对应的知识图谱。

31、进一步地,所述将所述知识图谱实时推荐至知识管理平台包括:

32、向所述知识管理平台发送入库通知,通知所述知识管理平台按照知识库入库条件,及时审核本次所构建的所述知识图谱:

33、若所述知识图谱符合所述知识库入库条件,则将本次所构建的所述知识图谱保存至数据库;

34、若所述知识图谱不符合所述知识库入库条件,则输出对应的入库失败结果,并向后台管理员下发对应的入库警告通知,同时将相应的入库要求发送至后台管理员。

35、进一步地,所述通过所述知识管理平台管理所述知识图谱,供用户通过应用端访问,开展对所述知识图谱的检索应用包括:

36、s41、知识管理平台接收并保存所述知识图谱至数据库,同时通知管理员,由管理员向用户所在的应用端发出知识共享通知;

37、s42、用户通过应用端,访问所述知识管理平台,由所述知识管理平台对本次访问进行知识授权;

38、s43、当授权之后,进入所述知识管理平台的数据库,进行元数据检索,检索并访问所述知识图谱。

39、一方面,提供了一种知识追踪系统,包括:

40、知识提取模块,用于提取知识文本数据并缓存至分布式文件系统;

41、后台服务模块,用于通过预先部署的ai实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系t,将所述关联关系t映射保存至数据库,并定时通知知识库构建模块抽取所述关联关系t;

42、知识库构建模块,用于基于所述关联关系t执行知识图谱构建活动g,以融合实体要素的文本摘要、情感/内容倾向以及态度,生成知识图谱,并将所述知识图谱实时推荐至知识管理平台;

43、知识管理平台,用于管理所述知识图谱,供用户通过应用端访问,开展对所述知识图谱的检索应用。

44、本发明还提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的知识追踪方法。

45、本发明还提供了一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的知识追踪方法。

46、本发明实施例提供的技术方案带来的有益效果至少包括:

47、本发明实施例中,通过ai实体识别模型,对分布储存的知识文本数据,进行知识要素的实体以及实体之间的关联关系的识别,并基于所述关联关系执行知识图谱构建活动g,以融合实体要素的文本摘要、情感/内容倾向以及态度,生成知识图谱,再将知识图谱实时推荐至知识管理平台,供用户通过应用端访问,开展对所述知识图谱的检索应用;这样,能够依托知识实体的关联关系,进行有序、可视化的知识数据管理和应用,通过融合生成的知识图谱,能够快速地让用户了解到对应的知识点位置和关联性,并提供知识点的关联性和知识文本的情感/内容倾向以及态度分析,供用户更好地了解知识的内容、深度分析和应用知识图谱,最大化利用知识价值,从而实现智能地管理、检索和追踪知识。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1