客户群体分群方法及装置与流程

文档序号:37444545发布日期:2024-03-28 18:27阅读:10来源:国知局
客户群体分群方法及装置与流程

本技术涉及大数据及人工智能,可用于金融领域,具体涉及一种客户群体分群方法及装置。


背景技术:

1、在大数据背景下,往往需要针对适合的客户群体制定对应的销售策略,现有技术中的分群方法是根据业务逻辑对客户特征和需求的理解,通过人工设定规则或标准来将客户分成不同的群组。由于根据业务逻辑分群通常需要事先定义好客户特征和规则,并收集相应的数据。其分群结果受到人为规则和主观判断的影响,极有可能存在个人偏见或局限性。并且当数据量很大时,手动设定规则和标准变得困难且耗时。

2、目前,业界人员一般是通过k-means(k-means clustering algorithm)聚类算法对用户进行分群,该聚类算法是一种自动化聚类的方法,可以根据数据的变化自动更新聚类结果,具有较高的灵活性和可扩展性。k-means聚类算法的特点便是自动化和高效、适用于大规模数据、无监督学习。但k-means聚类算法对初始聚类中心的选择非常敏感,这可能会导致不同的初始值得到不同的聚类结果,会影响聚类结果的准确性。


技术实现思路

1、本发明可用于大数据及人工智能技术在金融方面应用的技术领域,也可用于除金融领域之外的任意领域。

2、本发明的一个目的在于提供一种客户群体分群方法,该方法首先基于密度的dbscan(density-based spatial clustering of applications with noise)算法根据业务需求和数据特点,设置一个密度阈值,筛选出密度高于该阈值的簇作为初始的聚类中心候选。这样选出来的初始中心能够确保具有一定的代表性,再通过k-means聚类算法进行二次迭代聚类,从而保证最后的聚类结果既去除了分群主观性,并具有代表性。

3、本发明的另一个目的在于提供一种客户群体分群装置。本发明的另一个目的在于提供一种电子设备,该电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述客户群体分群方法的步骤。本发明的还一个目的在于提供一种可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述客户群体分群方法的步骤。

4、为解决本技术背景技术中的技术问题,本发明提供以下技术方案:

5、第一方面,本发明提供一种客户群体分群方法包括:

6、对所述客户群体的特征数据注入噪音,以生成含有噪音的特征数据;

7、根据预先生成的密度聚类模型对所述含有噪音的特征数据进行一次聚类,以生成一次聚类结果;

8、根据预先生成的k-均值聚类模型对所述一次聚类结果进行二次聚类。

9、在本发明的一实施例中,对所述客户群体的特征数据注入噪音,以生成含有噪音的特征数据,包括:

10、根据所述特征数据确定所述含有噪音的特征数据的敏感性参数;

11、根据预先确定的针对所述特征数据的隐私保护程度参数确定隐私预算;

12、根据所述敏感性参数以及所述隐私预算对所述特征数据注入噪音,以生成所述含有噪音的特征数据。

13、在本发明的一实施例中,根据所述敏感性参数以及所述隐私预算对所述特征数据注入噪音,以生成所述含有噪音的特征数据,包括:

14、根据所述敏感性参数以及所述隐私预算生成拉普拉斯噪音;

15、将所述拉普拉斯噪音注入至所述特征数据中,以生成所述含有噪音的特征数据。

16、在本发明的一实施例中,根据所述敏感性参数以及所述隐私预算生成拉普拉斯噪音,包括:

17、根据所述敏感性参数以及所述隐私预算生成尺度参数;

18、根据所述尺度参数以及随机变量生成具有拉普拉斯分布的概率密度函数;

19、根据所述概率密度函数生成所述拉普拉斯噪音。

20、在本发明的一实施例中,生成所述密度聚类模型的步骤包括:

21、进行以下迭代操作,直至所有训练数据满足预设的客户群体的第一分群目标,以生成所述密度聚类模型:

22、计算训练数据在数据空间上的点与预设点的第一距离;

23、根据所述第一距离以及预设的领域半径将对应的训练数据划分至对应预设点的空间域内;其中,所述预设点的初始值以及所述领域半径的初始值是由所述第一分群目标所确定的;

24、根据当前所述训练数据的划分结果以及所述第一分群目标对所述预设点进行更新。

25、在本发明的一实施例中,生成所述的k-均值聚类模型的步骤包括:

26、进行以下迭代操作,直至所述训练数据的划分结果满足预设的客户群体的第一分群目标,以生成所述k-均值聚类模型:

27、在划分结果中的每个簇中选出聚类中心;

28、在所述每个簇中,计算每个点与所述聚类中心的第二距离;

29、根据所述第二距离将所述每个点划分至距离所述每个点最近的簇中;

30、计算每个簇内所述点的距离均值,以更新所述聚类中心。

31、在本发明的一实施例中,在所述根据预先生成的k-均值聚类模型对所述一次聚类结果进行二次聚类之前,还包括:

32、根据所述特征数据以及所述客户群体的分群需求确定密度阈值;

33、根据所述密度阈值对所述一次聚类结果进行筛选。

34、第二方面,本发明提供一种客户群体分群装置,该装置包括:

35、噪音注入模块,用于对所述客户群体的特征数据注入噪音,以生成含有噪音的特征数据;

36、一次聚类模块,用于根据预先生成的密度聚类模型对所述含有噪音的特征数据进行一次聚类,以生成一次聚类结果;

37、二次聚类模块,用于根据预先生成的k-均值聚类模型对所述一次聚类结果进行二次聚类。

38、在本发明的一实施例中,噪音注入模块包括:

39、敏感性参数确定单元,用于根据所述特征数据确定所述含有噪音的特征数据的敏感性参数;

40、隐私预算确定单元,用于根据预先确定的针对所述特征数据的隐私保护程度参数确定隐私预算;

41、噪音注入单元,用于根据所述敏感性参数以及所述隐私预算对所述特征数据注入噪音,以生成所述含有噪音的特征数据。

42、在本发明的一实施例中,噪音注入单元包括:

43、拉普拉斯噪音生成单元,用于根据所述敏感性参数以及所述隐私预算生成拉普拉斯噪音;

44、噪音特征数据生成单元,用于将所述拉普拉斯噪音注入至所述特征数据中,以生成所述含有噪音的特征数据。

45、在本发明的一实施例中,拉普拉斯噪音生成单元包括:

46、尺度参数生成单元,用于根据所述敏感性参数以及所述隐私预算生成尺度参数;

47、概率密度函数生成单元,用于根据所述尺度参数以及随机变量生成具有拉普拉斯分布的概率密度函数;

48、拉普拉斯噪音生成子单元,用于根据所述概率密度函数生成所述拉普拉斯噪音。

49、在本发明的一实施例中,客户群体分群装置还包括:

50、密度聚类模型生成模块,用于生成所述密度聚类模型,密度聚类模型生成模块包括:

51、迭代操作第一单元,用于进行以下迭代操作,直至所有训练数据满足预设的客户群体的第一分群目标,以生成所述密度聚类模型:

52、第一距离确定单元,用于计算训练数据在数据空间上的点与预设点的第一距离;

53、训练数据划分单元,用于根据所述第一距离以及预设的领域半径将对应的训练数据划分至对应预设点的空间域内;其中,所述预设点的初始值以及所述领域半径的初始值是由所述第一分群目标所确定的;

54、预设点更新单元,用于根据当前所述训练数据的划分结果以及所述第一分群目标对所述预设点进行更新。

55、在本发明的一实施例中,客户群体分群装置还包括:

56、k-均值聚类模型生成模块,用于生成所述的k-均值聚类模型,k-均值聚类模型生成模块包括:

57、迭代操作第二单元,用于进行以下迭代操作,直至所述训练数据的划分结果满足预设的客户群体的第一分群目标,以生成所述k-均值聚类模型:

58、聚类中心选出单元,用于在划分结果中的每个簇中选出聚类中心;

59、第二距离计算单元,用于在所述每个簇中,计算每个点与所述聚类中心的第二距离;

60、点划分单元,用于根据所述第二距离将所述每个点划分至距离所述每个点最近的簇中;

61、聚类中心更新单元,用于计算每个簇内所述点的距离均值,以更新所述聚类中心。

62、在本发明的一实施例中,客户群体分群装置还包括:

63、密度阈值确定模块,用于根据所述特征数据以及所述客户群体的分群需求确定密度阈值;

64、一次聚类结果筛选模块,用于根据所述密度阈值对所述一次聚类结果进行筛选。

65、第三方面,本发明提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现一种客户群体分群方法的步骤。

66、第四方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现客户群体分群方法的步骤。

67、第五方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现客户群体分群方法的步骤。

68、从上述描述可知,本发明实施例提供一种客户群体分群方法及装置,对应的方法包括:首先对客户群体的特征数据注入噪音,以生成含有噪音的特征数据;接着,根据预先生成的密度聚类模型对含有噪音的特征数据进行一次聚类,以生成一次聚类结果;最后根据预先生成的k-均值聚类模型对一次聚类结果进行二次聚类。

69、本发明结合个人客户织网补网的需要,将“大客群”进一步切分为“小客群”,找到最有价值、最有空间的客户,实现重点客群“一群一策”的精细化运营。通过基于密度的dbscan聚类算法与k-means聚类算法的结合使用,可以将大量的客户数据分成多个具有代表性的类别,从而帮助本行更好地理解客户需求和行为,并制定相应的营销策略和服务方案,提高经济效益和客户满意度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1