本发明涉及数据处理,具体涉及一种电力科研信息数据处理方法及系统。
背景技术:
1、现有的电力科研信息数据处理方法和技术面临着诸多困境。一方面,由于多源异构数据的复杂性和多样性,传统的数据处理方法难以有效地对这些数据进行整合和管理,导致数据之间存在信息孤岛现象,无法充分发挥数据的整体价值。另一方面,在数据分析和挖掘方面,缺乏有效的手段来深入理解数据背后的语义和关联关系,难以从海量的数据中提取出有价值的信息和知识,从而影响了电力科研的创新和发展。
技术实现思路
1、本申请提供了一种电力科研信息数据处理方法及系统,解决了现有技术中电力科研数据处理效率低、信息整合困难的技术问题。
2、本申请的第一个方面,提供了一种电力科研信息数据处理方法,所述方法包括:
3、采集多源异构电力科研数据,基于所述多源异构电力科研数据构建原始语料库;对所述原始语料库进行自然语言处理,生成语义标注数据集,根据所述语义标注数据集构建动态电力技术知识图谱;基于所述动态电力技术知识图谱进行数据分析,生成数据创新评估报告;根据所述数据创新评估报告进行技术可视化,绘制技术路线图,按照所述技术路线图进行交互反馈,对电力科研数据进行数据优化处理。
4、本申请的第二个方面,提供了一种电力科研信息数据处理系统,所述系统包括:
5、数据采集模块:采集多源异构电力科研数据,基于所述多源异构电力科研数据构建原始语料库;图谱构建模块:对所述原始语料库进行自然语言处理,生成语义标注数据集,根据所述语义标注数据集构建动态电力技术知识图谱;数据分析模块:基于所述动态电力技术知识图谱进行数据分析,生成数据创新评估报告;数据处理模块:根据所述数据创新评估报告进行技术可视化,绘制技术路线图,按照所述技术路线图进行交互反馈,对电力科研数据进行数据优化处理。
6、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
7、首先,采集多源异构电力科研数据,基于多源异构电力科研数据构建原始语料库。接着,对原始语料库进行自然语言处理,生成语义标注数据集,根据语义标注数据集构建动态电力技术知识图谱。然后,基于动态电力技术知识图谱进行数据分析,生成数据创新评估报告。最后,根据数据创新评估报告进行技术可视化,绘制技术路线图,按照技术路线图进行交互反馈,对电力科研数据进行数据优化处理。解决了现有技术中电力科研数据处理效率低、信息整合困难的技术问题,达到了通过构建动态电力技术知识图谱,整合多源异构电力科研数据,提高电力科研数据处理效率的技术效果。
1.一种电力科研信息数据处理方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种电力科研信息数据处理方法,其特征在于,采集多源异构电力科研数据,基于所述多源异构电力科研数据构建原始语料库,方法包括:
3.如权利要求1所述的一种电力科研信息数据处理方法,其特征在于,对所述原始语料库进行自然语言处理,生成语义标注数据集,方法包括:
4.如权利要求3所述的一种电力科研信息数据处理方法,其特征在于,根据所述语义标注数据集构建动态电力技术知识图谱,方法包括:
5.如权利要求1所述的一种电力科研信息数据处理方法,其特征在于,基于所述动态电力技术知识图谱进行数据分析,生成数据创新评估报告,方法包括:
6.如权利要求5所述的一种电力科研信息数据处理方法,其特征在于,基于所述动态电力技术知识图谱执行图谱拓扑结构分析,确定技术组合新颖度指标与技术演化成熟度指标,方法包括:
7.如权利要求1所述的一种电力科研信息数据处理方法,其特征在于,根据所述数据创新评估报告进行技术可视化,绘制技术路线图,方法包括:
8.一种电力科研信息数据处理系统,其特征在于,用于实施权利要求1-7任意一项所述的一种电力科研信息数据处理方法,所述系统包括: