本发明涉及文本数据处理,尤其涉及一种基于文本分析的双碳知识图谱数据分析方法及系统。
背景技术:
1、随着绿色城市和绿色排放意识的提高,以及双碳政策的推行,越来越多的企业开始关注如何有效监控双碳政策的更新以及控制排放的合规。现有技术在解决这一问题时,一般只采用人工的政策解读和排放统计来执行,没有考虑到结合语言模型和文本分析算法来提高效率和效果。可见,现有技术存在缺陷,亟需解决。
技术实现思路
1、本发明所要解决的技术问题在于,提供一种基于文本分析的双碳知识图谱数据分析方法及系统,能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
2、为了解决上述技术问题,本发明第一方面公开了一种基于文本分析的双碳知识图谱数据分析方法,所述方法包括:
3、获取多个信息源的双碳相关文本数据和数据获取参数;
4、根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
5、根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
6、根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
7、作为一种可选的实施方式,在本发明第一方面中,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
8、作为一种可选的实施方式,在本发明第一方面中,所述根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据,包括:
9、根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;
10、根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。
11、作为一种可选的实施方式,在本发明第一方面中,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据,包括:
12、对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
13、将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
14、根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。
15、作为一种可选的实施方式,在本发明第一方面中,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;
16、所述根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据,包括:
17、对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
18、将该双碳相关文本数据的所述数值数据输入至所述数据类型对应的所述排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
19、根据所述排放相关度从大到小对所有所述双碳相关文本数据进行排序得到第二数据序列,将所述第二数据序列的前第二数量个所述双碳相关文本数据的所述数值数据确定为排放数据。
20、作为一种可选的实施方式,在本发明第一方面中,所述根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求,包括:
21、根据预设的知识图谱算法模型,对所述双碳政策要求数据进行分析以得到数据逻辑推导结果;
22、将所述数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;所述用户端基于所述相似度最低的部分修改所述现有政策数据以得到新的双碳政策要求。
23、作为一种可选的实施方式,在本发明第一方面中,所述根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求,包括:
24、根据所述排放数据对应的所述数据获取参数,确定所述排放数据对应的区域;
25、对于任一所述区域对应的任一所述排放数据,将该排放数据对应的所述数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
26、计算该排放数据与所述双碳政策要求中的对应指标阈值的差值,以及所述差值和所述数据可信度权重的乘积;
27、计算该区域中所有所述排放数据对应的所述乘积的求和平均值,得到该区域对应的排放参数;
28、判断所述排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
29、本发明第二方面公开了一种基于文本分析的双碳知识图谱数据分析系统,所述系统包括:
30、获取模块,用于获取多个信息源的双碳相关文本数据和数据获取参数;
31、筛选模块,用于根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
32、第一确定模块,用于根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
33、第二确定模块,用于根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
34、作为一种可选的实施方式,在本发明第二方面中,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
35、作为一种可选的实施方式,在本发明第二方面中,所述筛选模块根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据的具体方式,包括:
36、根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;
37、根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。
38、作为一种可选的实施方式,在本发明第二方面中,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述筛选模块根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据的具体方式,包括:
39、对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
40、将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
41、根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。
42、作为一种可选的实施方式,在本发明第二方面中,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;
43、所述筛选模块根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据的具体方式,包括:
44、对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
45、将该双碳相关文本数据的所述数值数据输入至所述数据类型对应的所述排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
46、根据所述排放相关度从大到小对所有所述双碳相关文本数据进行排序得到第二数据序列,将所述第二数据序列的前第二数量个所述双碳相关文本数据的所述数值数据确定为排放数据。
47、作为一种可选的实施方式,在本发明第二方面中,所述第一确定模块根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求的具体方式,包括:
48、根据预设的知识图谱算法模型,对所述双碳政策要求数据进行分析以得到数据逻辑推导结果;
49、将所述数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;所述用户端基于所述相似度最低的部分修改所述现有政策数据以得到新的双碳政策要求。
50、作为一种可选的实施方式,在本发明第二方面中,所述第二确定模块根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求的具体方式,包括:
51、根据所述排放数据对应的所述数据获取参数,确定所述排放数据对应的区域;
52、对于任一所述区域对应的任一所述排放数据,将该排放数据对应的所述数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
53、计算该排放数据与所述双碳政策要求中的对应指标阈值的差值,以及所述差值和所述数据可信度权重的乘积;
54、计算该区域中所有所述排放数据对应的所述乘积的求和平均值,得到该区域对应的排放参数;
55、判断所述排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
56、本发明第三方面公开了另一种基于文本分析的双碳知识图谱数据分析系统,所述系统包括:
57、存储有可执行程序代码的存储器;
58、与所述存储器耦合的处理器;
59、所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于文本分析的双碳知识图谱数据分析方法中的部分或全部步骤。
60、本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于文本分析的双碳知识图谱数据分析方法中的部分或全部步骤。
61、与现有技术相比,本发明具有以下有益效果:
62、本发明基于多个信息源的数据直接筛选出政策数据和排放数据,并基于知识图谱算法来判断特定区域的排放是否满足更新后的政策要求,从而能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。