基于舆情数据的景气分析方法及装置、设备、存储介质与流程

文档序号:37098767发布日期:2024-02-22 20:56阅读:18来源:国知局
基于舆情数据的景气分析方法及装置、设备、存储介质与流程

本技术实施例涉及数据处理,涉及但不限于一种基于舆情数据的景气分析方法及装置、设备、存储介质。


背景技术:

1、景气分析中的预警信号灯分析法,是指选择一组能够敏感反映行业发展景气程度的评价指标,利用相关数据处理方法确定阈值区间得到综合指标,然后采用信号灯亮灯机制对这组评价指标和综合指标对当时的周期波动状况发出预警信号。其中,红灯表示过热,黄灯表示偏热,绿灯表示正常平稳,浅蓝灯表示偏冷,蓝灯表示过冷,能够用于对目标行业的景气情况进行分析。

2、在相关行业景气分析技术中,常使用专家打分法等主观赋值法会造成预警信息不准确,而使用客观赋值法,强依赖样本情况,容易发生权重失真,与业务实际情况不符的情况。例如,在存才多个评价指标分析行业景气的情况下,各评价指标对于行业景气的影响程度可能并不相同,若不对各评价指标赋予不同的权重,会致使得到的行业景气分析结果不准确。

3、因此,在行业景气分析过程中,合理地对不同的评价指标赋予相应的权重,是一个亟待解决的问题。


技术实现思路

1、有鉴于此,本技术实施例提供的基于舆情数据的景气分析方法及装置、设备、存储介质,能够对获取到的舆情数据进行处理,得到用于行业景气分析的多个指标维度分别对应的至少一个指标的指标权重,提高了对数据的行业景气分析结果的准确性。本技术实施例提供的基于舆情数据的景气分析方法及装置、设备、存储介质是这样实现的:

2、本技术实施例提供的基于舆情数据的景气分析方法,包括:

3、根据预设的知识图谱,获取舆情数据,所述知识图谱包括用于目标行业的景气分析处理的多个指标维度、各指标维度对应的至少一个指标、以及各指标维度对应的舆情关键词;

4、根据预设的评价项目对各指标维度对应的舆情数据进行处理,得到各指标维度的统计数据,所述评价项目包括各指标维度对应的舆情数据的发布量、阅读量、分享次数、评论次数以及点赞次数;

5、对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述各指标维度对应的舆情关注度得到各指标维度对应的至少一个指标的指标权重,各指标维度对应的至少一个指标的指标权重与各指标维度对应的舆情关注度为正相关关系;

6、根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率与增长率期望值,得到各指标对应的评价分值;

7、将各指标对应的评价分值和指标权重相乘并求和,得到目标行业景气评分,所述目标行业景气评分用于指示所述目标行业的发展趋势,所述目标行业景气评分越高,所述目标行业的发展趋势越好。

8、在一些实施例中,所述对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述各指标维度对应的舆情关注度得到各指标维度对应的至少一个指标的指标权重,包括:

9、根据所述统计数据,计算各指标维度对应的维度信息熵;

10、根据所述各指标维度对应的维度信息熵,计算各指标维度对应的舆情权重;

11、将所述各指标维度对应的舆情权重与各指标维度对应的多个评价项目的平均数据量相乘,得到各指标维度对应的舆情关注度;

12、分别计算各指标维度对应的舆情关注度在所有舆情关注度总和的占比,得到各指标维度对应的维度权重;

13、根据各指标维度对应的维度权重,获取各指标维度对应的至少一个指标的指标权重,各指标维度对应的维度权重为对应的指标维度的所有指标的指标权重之和。

14、在一些实施例中,所述根据所述统计数据,计算各指标维度对应的维度信息熵,包括:

15、根据归一化公式对所述统计数据进行归一化处理,得到各指标维度对应的不同评价项目的归一化数值;

16、计算各指标维度中,各评价项目的归一化数值在所有评价项目的归一化数值总和的占比,得到各指标维度中各评价项目的项目权重;

17、根据维度信息熵计算公式,得到各指标维度对应的维度信息熵,所述维度信息熵计算公式为:

18、

19、其中,ej为所述多个指标维度中的任意一个指标维度j对应的维度信息熵,m为所述评价项目的项目数目,pij为所述指标维度j的任意一个评价项目i对应的项目权重;

20、所述归一化公式为:

21、

22、其中,yij为所述多个指标维度中的任意一个指标维度j的任意一个评价项目i对应的归一化数值,xij为所述指标维度j的任意一个评价项目i对应的项目数值,min(xj)为所述指标维度j对应的各评价项目中最小的项目数值,max(xj)为所述指标维度j对应的各评价项目中最大的项目数值。

23、在一些实施例中,所述根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率与增长率期望值,得到各指标对应的评价分值,包括:

24、获取预设时间段内各指标对应的历史采集数据;

25、根据所述时间间隔,对所述历史采集数据进行同比的增长率计算,得到各指标对应的多个历史增长率;

26、计算各指标对应的多个历史增长率的均值,获取各指标的增长率期望值;

27、根据所述时间间隔,获取各指标对应的当前采集数据;

28、根据所述时间间隔,计算所述当前采集数据与所述历史采集数据在相同时期的各指标的实际增长率;

29、计算各指标的实际增长率与对应的指标的增长率期望值的差值,根据各指标对应的差值获取各指标的评价分值。

30、在一些实施例中,所述计算各指标的实际增长率与对应的指标的增长率期望值的差值,根据各指标对应的差值获取各指标的评价分值,包括:

31、计算各指标的实际增长率与对应的指标的增长率期望值的差值;

32、根据各指标对应的多个历史增长率,得到各指标对应的多个差值范围;

33、根据预警信号灯方法以及所述各指标对应的多个差值范围,得到各指标对应的信号灯颜色,不同的信号灯颜色对应的差值范围不同,根据预设的信号灯颜色与评价分值的对应关系,获取各指标的评价分值。

34、在一些实施例中,所述根据各指标对应的多个历史增长率,得到各指标对应的多个差值范围,包括:

35、根据各指标对应的多个历史增长率,计算各指标对应的多个历史增长率的标准差;

36、根据各指标对应的不同目标倍数的标准差,得到各指标对应的多个差值范围,所述目标倍数的标准差包括一倍标准差和两倍标准差。

37、在一些实施例中,所述根据各指标维度对应的维度权重,获取各指标维度对应的至少一个指标的指标权重,包括:

38、分别将各指标维度对应的维度权重除以各指标维度对应的所有指标的总数目,得到各指标维度对应的至少一个指标的指标权重。

39、本技术实施例提供的基于舆情数据的景气分析装置,包括:

40、数据获取模块,用于根据预设的知识图谱,获取舆情数据,所述知识图谱包括用于目标行业的景气分析处理的多个指标维度、各指标维度对应的至少一个指标、以及各指标维度对应的舆情关键词;根据预设的评价项目对各指标维度对应的舆情数据进行处理,得到各指标维度的统计数据,所述评价项目包括各指标维度对应的舆情数据的发布量、阅读量、分享次数、评论次数以及点赞次数;

41、权重处理模块,用于对所述各指标维度的统计数据进行处理,得到各指标维度对应的舆情关注度,并根据所述舆情关注度得到各指标维度对应的至少一个指标的指标权重,各指标维度对应的至少一个指标的指标权重与各指标维度对应的舆情关注度为正相关关系;

42、景气分析模块,用于根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,根据各指标对应的实际增长率和增长率期望值,得到各指标对应的评价分值;将各指标对应的评价分值和指标权重相乘并求和,得到目标行业景气评分,所述目标行业景气评分用于指示所述目标行业的发展趋势,所述目标行业景气评分越高,所述目标行业的发展趋势越好。

43、本技术实施例提供的计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本技术实施例所述的方法。

44、本技术实施例提供的计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本技术实施例提供的所述的方法。

45、本技术实施例所提供的基于舆情数据的景气分析方法、装置、计算机设备和计算机可读存储介质,通过预设的知识图谱,获取舆情数据,其中知识图谱包括用于目标行业的景气分析处理的多个指标维度、各指标维度对应的至少一个指标、以及各指标维度对应的舆情关键词,通过知识图谱能够获取多维度且与目标行业分析相关的舆情数据,并以此确定各个指标对最终分析结果的影响程度。根据预设的包括发布量、阅读量、分享次数、评论次数以及点赞次数的评价像对各指标维度对应的舆情数据进行处理,得到给指标维度对应的不同评价项目的统计数据。接下来对各指标维度的统计数据进行分析处理,得到各指标维度对应的舆情关注度和各指标维度对应的至少一个指标的指标权重,其中,各指标维度对应的至少一个指标的指标权重与各指标维度对应的舆情关注度是正相关关系。根据预设的时间间隔,获取所有指标对应的实际增长率与增长率期望值,并以此得到各指标对应的评价分值,得到的评价分数需要与上述得到的各指标对应的指标权重相乘,并将结果相加得到最终的目标行业景气评分,该目标行业景气评分表示的是目标行业的发展趋势,也就是说目标行业景气评分越高,预计目标行业的发展趋势越好。

46、这样,根据获取的舆情数据,对行业景气进行分析的不同指标维度进行了重要性估计,得到了该指标维度下各指标的指标权重,提高了对数据的行业景气分析结果的准确性,解决背景技术中所提出的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1