指标配置方法、装置、电子设备和计算机可读介质与流程

文档序号:36320637发布日期:2023-12-08 20:04阅读:42来源:国知局
指标配置方法与流程

本发明涉及大数据分析与挖掘,尤其涉及一种指标配置方法、装置、电子设备和计算机可读介质。


背景技术:

1、我们在描述事务的特性时,通常包含一系列的指标来量化对象的特性。当一个指标变量增大,另一个指标也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。

2、例如,在描述一辆汽车的品质时,包含的指标包括:汽车级别、最大马力、最大扭矩、百公里加速、是否包含定速巡航、车身重量、轴距、车身长度、车身强度等指标。假如我们从中选择3个指标:a、b、c通过加权计算公式a*0.3+b*0.3+c*0.4来评判汽车品质。众所周知,汽车的马力越大,往往扭矩越大,动力强,而车身的质量越大,往往车身强度越大,空间大,安全性高。如果对一辆动力弱车身重(通俗称为“小马拉大车”)的车进行评估,分别选择最大马力,最大扭矩,百公里加速来评估和选择车身质量,轴距,车身长度三个指标来进行评估,会得到前者得分低,后者得分高的两个完全不同的结论。

3、究其原因,以上选择的各组指标存在强相关,无法反映评估对象的真实的特性。所以,当我们对某个对象进行评估时,应该尽可能选择不相关或者弱相关的指标进行评估,得到的结果往往更客观。

4、在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

5、在指标的选取过程中,多半凭借的是管理者的经验,主观性强,缺乏数据基础,人工筛选效率也比较低,而且选取的指标容易存在同向或反向相关性,导致计算得到的评估值被放大或者缩小。


技术实现思路

1、有鉴于此,本发明实施例提供一种指标配置方法、装置、电子设备和计算机可读介质,以解决主观性强、缺乏数据基础和选取的指标容易存在同向或反向相关性的技术问题。

2、为实现上述目的,根据本发明实施例的一个方面,提供了一种指标配置方法,包括:

3、计算指标集合中任意两个指标之间的相关系数;

4、根据所述任意两个指标之间的相关系数,从所述指标集合中筛选出质心指标,并将所述指标集合中其他指标分别划分到对应的质心指标所在的分组中;

5、对于每个分组,根据所述分组中任意两个指标之间的相关系数更新所述分组的质心指标;

6、分别获取每个分组更新后的质心指标,将所述每个分组更新后的质心指标作为默认指标进行配置。

7、可选地,根据所述任意两个指标之间的相关系数,从所述指标集合中筛选出质心指标,并将所述指标集合中其他指标分别划分到对应的质心指标所在的分组中,包括:

8、根据预设的k个分组数量,从所述指标集合中获取任意k个指标,根据所述k个指标中任意两个指标之间的相关系数,计算所述k个指标的相关性合计值;

9、对各个所述k个指标的相关性合计值进行排序,筛选出相关性合计值最小的k个指标并分别作为k个分组的质心指标;

10、将所述指标集合中其他指标分别划分到对应的k个质心指标所在的分组中。

11、可选地,将所述指标集合中其他指标分别划分到对应的k个质心指标所在的分组中,包括:

12、所述指标集合中其他指标中的每个指标,分别获取所述指标与k个质心指标的相关系数;

13、对k个所述指标与所述质心指标的相关系数进行排序,筛选出与所述指标的相关系数最小的质心指标,将所述指标划分到所述质心指标所在的分组中。

14、可选地,根据所述k个指标中任意两个指标之间的相关系数,计算所述k个指标的相关性合计值,包括:

15、计算所述k个指标中任意两个指标之间的相关系数的平方和,从而得到所述k个指标的相关性合计值。

16、可选地,对于每个分组,根据所述分组中任意两个指标之间的相关系数更新所述分组的质心指标,包括:

17、对于每个分组中的每个指标,根据所述指标与所述分组内其他各个指标之间的相关系数,计算所述指标的相关性合计值;

18、对各个所述指标的相关性合计值进行排序,筛选出相关性合计值最大的指标并作为所述分组新的质心指标,从而更新所述分组的质心指标。

19、可选地,更新所述分组的质心指标之后,还包括:

20、将每个分组的质心指标的相关性合计值相加,从而得到分组相关性合计值;

21、判断迭代次数是否大于等于次数阈值并且本次迭代的分组相关性合计值是否大于上一次迭代的分组相关性合计值;

22、若均为是,则结束;反之,则更新所述每个分组中的指标。

23、可选地,继续更新所述每个分组中的指标,包括:

24、将所述指标集合中其他指标分别划分到对应的更新后的质心指标所在的分组中;

25、对于每个分组,根据所述分组中任意两个指标之间的相关系数更新所述分组的质心指标。

26、另外,根据本发明实施例的另一个方面,提供了一种指标配置装置,包括:

27、计算模块,用于计算指标集合中任意两个指标之间的相关系数;

28、分组模块,用于根据所述任意两个指标之间的相关系数,从所述指标集合中筛选出质心指标,并将所述指标集合中其他指标分别划分到对应的质心指标所在的分组中;

29、更新模块,用于对于每个分组,根据所述分组中任意两个指标之间的相关系数更新所述分组的质心指标;

30、配置模块,用于分别获取每个分组更新后的质心指标,将所述每个分组更新后的质心指标作为默认指标进行配置。

31、可选地,所述分组模块还用于:

32、根据预设的k个分组数量,从所述指标集合中获取任意k个指标,根据所述k个指标中任意两个指标之间的相关系数,计算所述k个指标的相关性合计值;

33、对各个所述k个指标的相关性合计值进行排序,筛选出相关性合计值最小的k个指标并分别作为k个分组的质心指标;

34、将所述指标集合中其他指标分别划分到对应的k个质心指标所在的分组中。

35、可选地,所述分组模块还用于:

36、所述指标集合中其他指标中的每个指标,分别获取所述指标与k个质心指标的相关系数;

37、对k个所述指标与所述质心指标的相关系数进行排序,筛选出与所述指标的相关系数最小的质心指标,将所述指标划分到所述质心指标所在的分组中。

38、可选地,所述分组模块还用于:

39、计算所述k个指标中任意两个指标之间的相关系数的平方和,从而得到所述k个指标的相关性合计值。

40、可选地,所述更新模块还用于:

41、对于每个分组中的每个指标,根据所述指标与所述分组内其他各个指标之间的相关系数,计算所述指标的相关性合计值;

42、对各个所述指标的相关性合计值进行排序,筛选出相关性合计值最大的指标并作为所述分组新的质心指标,从而更新所述分组的质心指标。

43、可选地,所述更新模块还用于:

44、更新所述分组的质心指标之后,将每个分组的质心指标的相关性合计值相加,从而得到分组相关性合计值;

45、判断迭代次数是否大于等于次数阈值并且本次迭代的分组相关性合计值是否大于上一次迭代的分组相关性合计值;

46、若均为是,则结束;反之,则更新所述每个分组中的指标。

47、可选地,所述更新模块还用于:

48、将所述指标集合中其他指标分别划分到对应的更新后的质心指标所在的分组中;

49、对于每个分组,根据所述分组中任意两个指标之间的相关系数更新所述分组的质心指标。

50、根据本发明实施例的另一个方面,还提供了一种电子设备,包括:

51、一个或多个处理器;

52、存储装置,用于存储一个或多个程序,

53、当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。

54、根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。

55、根据本发明实施例的另一个方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。

56、上述发明中的一个实施例具有如下优点或有益效果:因为采用根据任意两个指标之间的相关系数,从指标集合中筛选出质心指标并将指标集合中其他指标分别划分到对应的质心指标所在的分组中,然后根据分组中任意两个指标之间的相关系数更新分组的质心指标,再将每个分组更新后的质心指标作为默认指标进行配置的技术手段,所以克服了现有技术中主观性强、缺乏数据基础和选取的指标容易存在同向或反向相关性的技术问题。本发明实施例通过指标之间的相关系数对指标进行分组,辅助用户进行指标配置,不但可以提高评估结果的客观性、全面性,还可以提高决策效率,减少人工耗时。

57、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1