基于计算机的用户分类方法与流程

文档序号:37152777发布日期:2024-02-26 17:09阅读:15来源:国知局
基于计算机的用户分类方法与流程

本发明涉及数据分析领域,尤其涉及一种基于计算机的用户分类方法。


背景技术:

1、客户分类通常也就是我们所说的客户画像分类,客户画像是b2b数字化营销中非常重要的概念,贯穿整个客户生命周期管理及运营。客户画像是基于客户数据和行为的综合描述,可以帮助营销人员更好地了解客户。包括客户的年龄、性别、教育程度、职业、兴趣爱好、行为轨迹等信息。通过这些数据,营销人员可以更好地理解客户的需求和采购行为,并提供更加精准的产品和服务。

2、中国专利公开号为cn114022712a的专利文献公开了一种用户分类方法,该方法包括:获取待分类用户的画像信息,所述画像信息包括用户属性信息以及用户交易信息;将所述待分类用户的画像信息输入至分类模型中,得到所述待分类用户的用户类别,所述分类模型是根据逻辑回归模型以及接受者操作特征roc曲线获得的,所述用户类别包括第一类用户和第二类用户,所述roc曲线用于表征所述分类模型的预测精度,所述第一类用户为催收难度大于预设阈值的用户,所述第二类用户为催收难度小于预设阈值的用户。

3、现有技术中对客户分群的方法主要依赖于标签,一个客群包含多种标签,组成客群所选用的标签不准确,造成客户分类不准确。


技术实现思路

1、为此,本发明提供一种基于计算机的用户分类方法,通过获取待分类用户的年龄信息和他们在预设时长内的用户事件发生行为数据并根据上述数据进行用户簇的分类可以解决客户分类不准确问题。

2、为实现上述目的,本发明提供一种基于计算机的用户分类方法,该方法包括:

3、获取若干待分类用户的年龄信息以及所述待分类用户在预设时长内的用户事件发生行为数据,所述用户事件发生行为数据包括待分类用户在所述预设时长内的目标事件发生频率、目标事件发生时间间隔以及目标事件发生金额;

4、构建所述待分类用户的用户事件发生评价标准,基于所述用户事件发生评价标准确定每个所述待分类用户的事件发生行为数据对应的第一评分集;

5、基于事件发生场景下的目标年龄用户标准对每个所述待分类用户的年龄信息进行评分,以得到第二评分;

6、将所述第一评分集和所述第二评分进行数据处理以使所述第一评分集中的评分和所述第二评分能够体现对应的实际数值;

7、将待分类用户根据所述第一评分集中的评分和第二评分分为若干用户簇,并分别确定每个所述用户簇的群中心;

8、调整所述每个用户簇内的待分类用户以及所述群中心,直至每个用户簇内的待分类用户与所述群中心的距离相同;

9、将所述待分类用户确定相应的目标用户簇,在所述目标用户簇中任意待分类用户与群中心的距离都相同。

10、进一步地,获取若干待分类用户的年龄信息以及所述待分类用户在预设时长内的用户事件发生行为数据包括:

11、统计用户在所述预设时长内若干事件的发生次数,获取用户的目标事件发生次数、最小发生次数和最大发生次数,根据所述目标事件发生次数、所述最小发生次数和所述最大发生次数计算所述目标事件发生频率;

12、统计用户在所述预设时长内相邻目标事件的若干时间间隔,计算若干所述时间间隔的均值,将均值计算结果作为所述目标事件发生时间间隔;

13、统计用户在所述预设时长内目标事件的若干事件发生金额,计算若干所述事件发生金额的均值,将均值计算结果作为所述目标事件发生金额。

14、进一步地,根据所述目标事件发生次数、所述最小发生次数和所述最大发生次数计算所述目标事件发生频率包括:

15、目标事件发生频率 = (目标事件发生次数 - 最小发生次数)/(最大发生次数 -最小发生次数)。

16、进一步地,基于所述用户事件发生评价标准确定每个所述待分类用户的事件发生行为数据对应的第一评分集包括:

17、将所述事件发生频率与所述事件标准发生频率进行计算,获取频率评价值;

18、将所述事件发生时间间隔与事件标准发生时间间隔进行计算,获取时间间隔评价值;

19、将所述事件发生金额与事件标准发生金额进行计算,获取金额评价值;

20、根据预设权重值对所述频率评价值、所述时间间隔评价值和所述金额评价值进行加权计算,获取第一评分值;

21、统计每个所述待分类用户的事件发生行为数据对应的第一评分值,基于若干所述第一评分值构建所述第一评分集。

22、进一步地,将所述事件发生频率与所述事件预设发生频率进行计算,获取频率评价值包括:

23、式中,s频率为频率评价值,p频率为事件发生频率,p预设频率为事件预设发生频率;

24、所述时间间隔评价值和所述金额评价值与所述频率评价值计算过程相同。

25、进一步地,根据所述预设权重值对所述频率评价值、所述时间间隔评价值和所述金额评价值进行加权计算,获取第一评分值包括:

26、s1=5×s频率+3×s时间+2×s金额,

27、式中,s1为第一评分值、s频率为频率评价值、s时间为时间间隔评价值、s金额为金额评价值。

28、进一步地,基于所述事件发生场景下的目标年龄用户标准对每个所述待分类用户的年龄信息进行评分,以得到第二评分包括:

29、通过公式:s2=10-0.8×|y实-y标|计算所述第二评分;

30、式中,s2为所述第二评分,y实为所述待分类用户的实际年龄信息,y标为所述事件发生场景下的目标年龄用户的标准年龄信息。

31、进一步地,将待分类用户根据所述第一评分集中的评分和第二评分分为若干用户簇,并分别确定每个所述用户簇的群中心包括:

32、将每个所述待分类用户的所述第一评分集的均值和所述第二评分作为初始簇中心,并获取若干簇;

33、通过欧几里得距离算法计算所述待分类用户的所述第一评分集中的评分和第二评分与若干所述初始簇中心之间的距离,获取若干距离值;

34、将若干所述距离值根据由小到大进行排序,选择排序第一的所述初始簇中心对应的簇为所述待分类用户的目标簇;

35、将所述目标簇的所述第一评分集的均值和所述第二评分的均值作为所述目标簇的群中心。

36、进一步地,调整所述每个用户簇内的待分类用户以及所述群中心包括:

37、计算所述目标簇内每个所述待分类用户与所述目标簇的群中心的距离;

38、将计算获取的若干距离中最大距离值对应的所述待分类用户进行标记作为标记用户;

39、重新计算所述标记用户与所述若干簇的群中心的若干距离,选择距离最小值对应的簇作为所述标记用户的更新簇。

40、对所述标记用户进行重新分配后,更新所述目标簇和所述更新簇的群中心。

41、进一步地,计算所述目标簇内每个所述待分类用户与所述目标簇的群中心的距离包括:

42、式中,s1为所述待分类用户的第一评分,s2为所述待分类用户的第二评分,c1为所述目标簇内所述第一评分集的均值,c2为所述目标簇内所述第二评分的均值。

43、与现有技术相比,本发明的有益效果在于,通过采集用户的年龄信息以及用户事件发生行为数据为后续分类用户提供了数据基础,避免了主观臆断,从而提高了用户分类的客观性和准确性,该方法考虑了每个待分类用户的年龄信息以及用户事件发生行为数据,能够更精细化地反映用户的个性和行为特点,进而实现用户的个性化分类,通过获取用户在预设时长内的目标事件发生频率、目标事件发生时间间隔以及目标事件发生金额等多维度的数据,更全面地了解用户的行为模式和消费习惯,使得后续用户分类结果准确且全面,该方法提供调整每个用户簇内的待分类用户以及群中心的步骤,使得分类结果可以随着用户行为的变化而动态调整,保持分类的时效性和准确性,通过调整使得每个用户簇内的待分类用户与群中心的距离相同,这样简化了用户分类的操作,并提高了分类的效率,在所有待分类用户都被确定到相应的目标用户簇后,每个目标用户簇中的用户与群中心的距离都相同,这样进一步强化了目标用户簇的确定性和内聚性,提高用户体验和满意度,有助于提高用户分类的准确性。

44、尤其,通过统计用户在预设时长内的目标事件发生次数,并计算目标事件发生频率,更加精细地了解用户的行为模式和习惯,同时,获取最小发生次数和最大发生次数,全面地掌握用户行为的范围和变化情况,使得后续用户分类结果准确,统计用户在预设时长内相邻目标事件的时间间隔,并计算其均值作为目标事件发生时间间隔,深入了解用户行为的时间分布和规律性,有助于了解用户的需求和偏好,并对用户行为进行合理的预测和规划,使得后续用户分类结果准确,通过统计用户在预设时长内目标事件的若干事件发生金额,并计算其均值作为目标事件发生金额,全面地了解用户在金额方面的行为和消费水平,为后续用户分类提供准确的数据基础,综合考虑用户的年龄信息以及目标事件发生频率、目标事件发生时间间隔、目标事件发生金额等多个维度的数据,形成更全面、个性化的用户画像,更准确地反映用户的需求和特点,为后续的用户分类提供了丰富且准确的数据基础,有助于提高分类的准确性和针对性。

45、尤其,通过该公式对目标事件发生次数进行了标准化处理,通过减去最小发生次数并除以最大与最小发生次数之差,将原始的次数值转换到0和1之间的比例,消除不同用户或不同事件在发生次数上的绝对差异,使得不同用户的目标事件发生频率具有可比性,若某个用户的目标事件发生频率接近1,说明该用户在该事件上非常活跃,相反,若接近0则说明该用户在该事件上不太活跃,有助于在后续分析中更准确地识别出对这些目标事件表现活跃的用户,从而针对这些用户采取更精准的措施,为后续的数据处理提供了方便。

46、尤其,通过事件发生频率、事件发生时间间隔和事件发生金额的计算,保证了对用户分类数据的全面,确保对用户的事件发生行为进行全面评价,避免了主观偏见,根据预设权重值对频率评价值、时间间隔评价值和金额评价值进行加权计算,使得评价方法具有极大的灵活性,针对不同的待分类用户,其事件发生行为数据会有所不同,通过统计每个待分类用户的事件发生行为数据对应的第一评分值,实现对用户的个性化的评价,更准确地反映每个用户的真实行为模式,基于若干第一评分值构建第一评分集,这为后续的用户分类提供了坚实的数据基础,提高了后续处理的效率。

47、尤其,通过具体的数值计算,将事件发生频率转化为频率评价值,使得对不同事件的发生频率进行量化评估,进而能够更准确地衡量待分类用户在该事件上的活跃程度,通过将事件发生频率与事件预设发生频率进行计算,充分利用预设发生频率的参考价值,有助于待分类用户进行更客观、准确的评估,通过计算公式中的差值与和值的商,得到一个介于0和1之间的频率评价值,归一化的处理方式有助于将不同事件发生频率的评价值调整到相同的范围内,便于后续的数据处理和比较分析。

48、尤其,通过使用第一评分集中的评分和第二评分作为分类依据,确保分类结果基于客观、全面的数据,减少主观因素的影响,从而提高分类的准确性,将每个待分类用户的第一评分集的均值和第二评分作为初始簇中心,能够充分利用现有数据,为后续的聚类分析提供合理的起点,使得初始簇中心更具有代表性,通过欧几里得距离算法计算待分类用户与初始簇中心之间的距离,量化用户与簇中心之间的相似度,为后续的用户归类提供准确依据,将距离值按照由小到大的顺序进行排序,并选择排序第一的初始簇中心对应的簇作为待分类用户的目标簇,确保了目标簇是与待分类用户最为相似的簇,提高了分类的精确性和针对性,通过将目标簇的第一评分集的均值和第二评分的均值作为目标簇的群中心,准确地反映目标簇用户的整体特征和行为模式,有助于削弱异常值对群中心的影响,提高群中心的稳定性和代表性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1