本技术涉及大数据,可用于金融或其他相关领域,特别是涉及一种需求方分类方法、装置、设备和存储介质。
背景技术:
1、随着信息时代的快速发展,信息量越来越多,各行各业的产品推荐方式也发生了转变。示例性地,在金融机构中,可以对用户(需求方)进行聚类,进而将与目标用户所在类匹配的产品推荐给目标用户,能够提高产品推荐效率与准确率。
2、但是,由于目前的聚类算法在确定聚类总数的过程中存在随机性,会出现聚类总数过多或过少的情况,影响聚类结果的准确性,进而影响产品推荐效果。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种需求方分类方法、装置、设备和存储介质,能够准确地确定出聚类总数,保证聚类结果的准确性,从而提高产品推荐效果。
2、第一方面,本技术提供了一种需求方分类方法,包括:
3、获取不同需求方的分类参考数据;其中,分类参考数据包括需求方的基础属性数据和相应需求方与候选物品之间的交互行为数据;
4、以簇数量为自 变量,以基于自变量对各分类参考数据进行聚类分析的聚类程度为因变量,构建第一目标函数;
5、在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量;
6、基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类。
7、在其中一个实施例中,在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量,包括:基于第一目标函数,确定通过各已确定的参考簇数量进行聚类分析的聚类结果所对应的参考聚类程度;根据待确定的参考簇数量与已确定的各参考簇数量之间的数据差异情况,以及各参考聚类程度,构建第二目标函数;将第二目标函数最大时对应的簇数量,作为新的参考簇数量,迭代执行参考聚类程度的确定操作,直至满足预设迭代终止条件;将满足预设迭代终止条件时所确定的参考簇数量,作为目标簇数量。
8、在其中一个实施例中,根据待确定的参考簇数量与已确定的各参考簇数量之间的数据差异情况,以及各参考聚类程度,构建第二目标函数,包括:基于预设高斯分布的协方差函数,确定待确定的参考簇数量与已确定的各参考簇数量之间的参考差异数据;将已确定的各参考簇数量的参考聚类程度与已确定的各参考簇数量对应参考聚类程度的均值之间的差值,作为差异调整数据;根据参考差异数据与差异调整数据的乘积,构建第二目标函数。
9、在其中一个实施例中,根据参考差异数据与差异调整数据的乘积,构建第二目标函数,包括:根据已确定的各参考簇数量之间的数据差异情况,确定差异权重数据;根据差异权重数据,对差异调整数据进行加权,以更新差异调整数据;根据参考差异数据与更新后的差异调整数据的乘积,构建第二目标函数。
10、在其中一个实施例中,根据已确定的各参考簇数量之间的数据差异情况,确定差异权重数据,包括:基于预设高斯分布的协方差函数,确定已确定的各参考簇数量之间的差异权重数据。
11、在其中一个实施例中,若仅存在一个已确定的参考簇数量,则基于预设高斯分布的协方差函数,确定已确定的各参考簇数量之间的差异权重数据,包括:基于预设高斯分布的协方差函数,确定已确定的参考簇数量与自身的差异权重数据。
12、在其中一个实施例中,基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类,包括:从各分类参考数据中选取初始聚类中心;根据未被选取为聚类中心的分类参考数据与各已有聚类中心之间的曼哈顿距离,确定相应分类参考数据作为聚类中心的参考概率;其中,已有聚类中心包括初始聚类中心;基于轮盘法,根据各参考概率,选取下一个聚类中心,直至已有聚类中心的数量达到目标簇数量;根据未被选取为聚类中心的分类参考数据与各聚类中心之间的曼哈顿距离,对相应分类参考数据进行聚类分析,以对不同需求方进行分类。
13、第二方面,本技术还提供了一种需求方分类装置,包括:
14、数据获取模块,用于获取不同需求方的分类参考数据;其中,分类参考数据包括需求方的基础属性数据和相应需求方与候选物品之间的交互行为数据;
15、函数构建模块,用于以簇数量为自变量,以基于自变量对各分类参考数据进行聚类分析的聚类程度为因变量,构建第一目标函数;
16、数量确定模块,用于在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量;
17、分类模块,用于基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类。
18、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现以下步骤:
19、获取不同需求方的分类参考数据;其中,分类参考数据包括需求方的基础属性数据和相应需求方与候选物品之间的交互行为数据;
20、以簇数量为自变量,以基于自变量对各分类参考数据进行聚类分析的聚类程度为因变量,构建第一目标函数;
21、在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量;
22、基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类。
23、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
24、获取不同需求方的分类参考数据;其中,分类参考数据包括需求方的基础属性数据和相应需求方与候选物品之间的交互行为数据;
25、以簇数量为自变量,以基于自变量对各分类参考数据进行聚类分析的聚类程度为因变量,构建第一目标函数;
26、在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量;
27、基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类。
28、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
29、获取不同需求方的分类参考数据;其中,分类参考数据包括需求方的基础属性数据和相应需求方与候选物品之间的交互行为数据;
30、以簇数量为自变量,以基于自变量对各分类参考数据进行聚类分析的聚类程度为因变量,构建第一目标函数;
31、在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量;
32、基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类。
33、上述需求方分类方法、装置、设备和存储介质,根据获取到的不同需求方的分类参考数据,以簇数量为自变量,以基于自变量对各分类参考数据进行聚类分析的聚类程度为因变量,构建第一目标函数,并在第一目标函数符合预设高斯分布的情况下,将高斯均值所对应的簇数量作为目标簇数量,进而基于目标簇数量,对各分类参考数据进行聚类分析,以对不同需求方进行分类。由于第一目标函数能够表征各分类参考数据的聚类程度随着簇数量的变化而产生的变化,且符合预设高斯分布,因此,本实施例将各分类参考数据的聚类程度相对普遍时所对应的簇数量(即高斯均值对应的簇数量)作为目标簇数量。进一步根据目标簇数量对各分类参考数据进行聚类分析,能够更好地对各分类参考数据进行聚类分析,即,对各分类参考数据的聚类分析效果更好,因此,整个过程可以提高对需求方进行分类的准确性,从而能够提高后续产品推荐的效果。