名人知识分析方法、装置、设备及存储介质与流程

文档序号:34614066发布日期:2023-06-29 09:51阅读:32来源:国知局
名人知识分析方法、装置、设备及存储介质与流程

本发明涉及大数据,提供一种名人知识分析方法、装置、设备及存储介质。


背景技术:

1、互联网的发展为知识工程提供了新的机遇,在一定程度上,是互联网的出现帮助突破了传统知识工程在知识获取方面的瓶颈。从1998年tim berners lee提出语义网至今,涌现出大量以互联网资源为基础的新一代知识库,这类知识库的构建方法可以分为三类:互联网众包、专家协作和互联网挖掘。

2、互联网全面挖掘多渠道聚合的海量名人内容,面向融媒体运营构建知识库,致力于打造出名家人物库提供融媒体详尽的参考资料。目前,一些纸媒网站将珍贵声像、图片、文字资料进行数据库处理,建立特色“媒资库”,通过重新整合利用,实现将杂乱的名人信息有次序的组织在一起形成传播,不仅将可视化信息流顺畅地表达,还能保障信息层次的丰富性。

3、然而,现有的媒资库向用户推荐名人信息是通过人工编辑的方式,需要人工在媒资库中查询相关报道内容,向用户推荐名人,这种方法不但需要耗费大量人力成本,效率低下,而且数据会重复采集、利用程度低。因此,如何提供一种应用于融媒体的名人知识库系统,自动提供数据分析服务是本领域技术人员亟需解决的问题。


技术实现思路

1、本发明实施例提供一种名人知识分析方法、装置、设备及存储介质,以实现构造名人知识库,形成自动的名家数据服务。

2、第一方面,本发明实施例公开了一种名人知识分析方法方法,所述方法包括:

3、基于预设的大数据平台,获取包括名人信息的数据内容;

4、对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像;

5、根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库。

6、可选的,所述对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像,包括:

7、解析所述相关数据内容的文本信息,抽取内容关键字生成内容标签,根据所述内容标签,对名人信息进行分类处理;

8、根据评论舆情及预设算法,对分类后的所述名人信息进行情感分析;

9、根据预处理后的所述名人信息,得到名人信息关联的多维度指标,生成名人画像,其中,所述多维度指标包括基本信息、作品成果、关键词、影响力、相关报道、评论舆情、相关名人。

10、可选的,根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:

11、根据预先设置的关键词提取算法,提取名人信息的关键词,将所述关键词设置为名人信息展示页面的词云展示,从所述关键词中选取部分词,生成名人标签;

12、根据所述关键词及所述名人标签,确定名人间的相似度,对所述相似度结果进行排序,得到与所述名人信息关联的名人进行展示,构建名人知识库。

13、可选的,所述名人信息的数据类型包括文字、图片、音视频,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:

14、对所述文字进行字符解析,确定文字标签;

15、将所述名人知识库中的图片处理为文字,提取文本标签并生成图片内容的多维标签,根据所述多维标签的向量处理,确定图片标签;

16、对所述名人知识库中的音视频进行分类,识别所述音视频的图像语义信息,提取描述音视频内容的标签信息,确定音视频标签;

17、将所述文字标签、图片标签及音视频标签存储在标签库。

18、可选的,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:

19、根据所述名人画像,对所述文字标签、图片标签及音视频标签进行分类,提取名人的标志特征,生成描述名人的特征标签;

20、更新所述标签库中的名人的特征标签,将更新的名人的特征标签在名人信息展示页面词云展示。

21、可选的,所述基于预设的大数据平台,获取包括名人信息的数据内容,包括:

22、过滤包括名人信息的数据内容中的重复内容及无效信息,其中,所述无效信息是与所述名人信息无关的数据内容;

23、根据敏感词和标签库,筛选数据内容的文字、图片和音视频,将敏感内容置于待审查区域中,供运维人员二次处理。

24、可选的,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库之后,还包括:

25、提供人工维护界面,供运维人员对待审查区域中的名人信息进行信息确认与信息补录;

26、响应于名人信息展示页面的检索操作,显示名人分析内容,包括:基本信息、作品成果、关键词、影响力、相关报道、评论舆情、相关名人。

27、第二方面,本发明实施例还公开了一种名人知识分析装置,所述装置包括:

28、第一获取模块,用于基于预设的大数据平台,获取包括名人信息的数据内容;

29、数据处理模块,用于对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像;

30、构建知识库模块,用于根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库。

31、在本发明实施的第三方面,还提供了一种电子设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;

32、所述处理器,用于读取存储器中的程序实现执行上述第一方面任一所述的名人知识分析方法;

33、在本发明实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的名人知识分析方法。

34、本发明实施例包括以下优点:

35、本发明提供的名人知识分析方法,基于预设的大数据平台,获取包括名人信息的数据内容,对名人信息进行数据预处理,得到名人信息的多维度指标,生成名人画像,根据预处理后的名人信息及名人画像,提取数据标签,构建名人知识库。本发明利用大数据分析技术,全面挖掘多渠道聚合的海量名人内容,经过数据内容处理、分析后,实现名人信息内容的结构化、知识化,构建大容量、多维度、自学习、可交互的名人知识库。通过大数据平台名人信息的收集、清洗,能够自动进行名人数据沉淀、标签标注、热度趋势计算、相关名人计算等分析。同时根据数据的分析、挖掘,形成自动的名家数据服务,满足面向融媒体运营辅助选题、辅助写稿、辅助发布的需求。



技术特征:

1.一种名人知识分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:

4.根据权利要求1所述的方法,其特征在于,所述名人信息的数据类型包括文字、图片、音视频,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于预设的大数据平台,获取包括名人信息的数据内容,包括:

7.根据权利要求1所述的方法,其特征在于,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库之后,还包括:

8.一种名人知识分析装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

10.一种可读存储介质,其特征在于,所述可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的名人知识分析方法的步骤。


技术总结
本发明实施例提供了一种名人知识分析方法、装置、设备及存储介质,所述方法包括:基于预设的大数据平台,获取包括名人信息的数据内容,对名人信息进行数据预处理,得到名人信息的多维度指标,生成名人画像,根据预处理后的名人信息及名人画像,提取数据标签,构建名人知识库。本发明利用大数据分析技术,全面挖掘多渠道聚合的海量名人内容,经过数据内容处理、分析后,实现名人信息内容的结构化、知识化,构建大容量、多维度、自学习、可交互的名人知识库,形成自动的名家数据服务,满足面向融媒体运营辅助选题、辅助写稿、辅助发布的需求。

技术研发人员:赵显臣,罗贵旭,曹浩文
受保护的技术使用者:新奥特(北京)视频技术有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1