一种查找价值用户的数据处理方法和系统与流程

文档序号:11234136阅读:705来源:国知局
一种查找价值用户的数据处理方法和系统与流程
本发明主要涉及数据分析
技术领域
,具体涉及一种查找价值用户的数据处理方法和系统。
背景技术
:传统划分用户价值的方法是基于个人主观将不同维度的数据划分范围,然后加以组合,形成新的维度;传统划分方法有其自身的局限性:1.在分析过程中,遇到划分数据范围的问题时,往往凭借其中一个维度进行筛选,而不能多个维度同时考虑,影响结论准确;2.当数据量大,数据较复杂时,用传统的划分方法,会增加分析人员的负担,增加执行成本。技术实现要素:本发明所要解决的技术问题是针对现有技术的不足,提供一种查找价值用户的数据处理方法和系统。本发明解决上述技术问题的技术方案如下:一种查找价值用户的数据处理方法,包括如下步骤:步骤s1:以用户名为行、rfm业务指标为列来构建数据分析列表;步骤s2:根据每个用户的rfm业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据三部分;步骤s3:将高价值用户数据和异常用户数据滤除,保留主体用户数据;步骤s4:根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中心;步骤s5:根据ahp层次分析法对聚类中心进行量化价值计算,根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。本发明的有益效果是:采用rfm业务指标来从全局上考虑数据维度,并采用kmeans聚类方法,使数据自行成簇,避免了维度考虑单一的问题及人为造成的误差影响,从而提高工作效率。在上述技术方案的基础上,本发明还可以做如下改进。进一步,所述数据分析列表为n*3的列表,其中n行分别为n个用户名,3列为每个用户名对应r指标、f指标和m指标;所述rfm业务指标包括r指标、f指标和m指标,r指标为用户最近充值日期至设定日期之间的间隔天数,f指标为用户在充值天数内成功充值的次数,m指标为用户在充值天数内成功充值的金额。采用上述进一步方案的有益效果是:进行多维度的数据挖掘和分析,避免考虑单一而影响数据的准确性。进一步,所述设定的划分阈值包括第一划分阈值和第二划分阈值,第一划分阈值为主体用户与高价值用户间的划分阈值,第二划分阈值为高价值用户与异常用户间的划分阈值。阈值的确立可以根据具体业务要求来决定,比如业务目的要求很严格,那么阈值就取得保守些,如果业务目的是贪婪型的,那么阈值就取得偏大些。采用上述进一步方案的有益效果是:通过阈值将数据分类,有利于分清哪部分数据是主体用户数据。进一步,所述步骤s5具体包括:步骤s501:根据ahp层次分析法分别对聚类中心进行加权计算处理,得到各聚类簇的量化价值;步骤s502:根据预设的业务分类数值和各聚类簇的量化价值的高低将各聚类簇归类处理,得到主体用户数据的高价值聚类簇和低价值聚类簇。采用上述进一步方案的有益效果是:为方便各聚类簇之间的比较,对每个聚类簇进行加权计算,确立权重,既考虑到了数据内部的关系,也用到了业务方面的经验,使准确性提高。进一步,所述步骤s5还包括步骤s503:将得到的高价值聚类簇和低价值聚类簇重复执行步骤s501加权计算处理和步骤s502归类处理,得到主体用户数据最终的高价值聚类簇和低价值聚类簇。采用上述进一步方案的有益效果是:将已聚类过的聚类簇再次聚类,使聚类簇逐渐变少,便于理解。本发明解决上述技术问题的另一技术方案如下:一种查找价值用户的数据处理系统,包括:列表构建模块,用于以用户名为行、rfm业务指标为列来构建数据分析列表;划分模块,用于根据每个用户的rfm业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据三部分;滤除模块,用于将高价值用户数据和异常用户数据滤除,保留主体用户数据;聚类模块,用于根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中心;归类模块,用于根据ahp层次分析法对各聚类中心进行量化价值计算,并根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。在上述技术方案的基础上,本发明还可以做如下改进。进一步,列表构建模块中,所述数据分析列表为n*3的列表,n行分别为n个用户名,3列为每个用户名对应r指标、f指标和m指标;所述rfm业务指标包括r指标、f指标和m指标,r指标为用户最近充值日期至设定日期之间的间隔天数,f指标为用户在充值天数内成功充值的次数,m指标为用户在充值天数内成功充值的金额。进一步,所述设定的划分阈值包括第一划分阈值和第二划分阈值,第一划分阈值为主体用户与高价值用户间的划分阈值,第二划分阈值为高价值用户与异常用户间的划分阈值。进一步,所述归类模块包括:计算单元,用于根据ahp层次分析法分别对聚类中心进行加权计算处理,得到各聚类簇的量化价值;归类单元,用于根据预设的业务分类数值和各聚类簇的量化价值的高低将各聚类簇归类处理,得到主体用户数据的高价值聚类簇和低价值聚类簇。进一步,所述归类模块还包括调用单元,所述调用单元用于依次调用计算单元和归类单元将得到的高价值聚类簇和低价值聚类簇再次进行加权计算处理和归类处理,得到主体用户数据最终的高价值聚类簇和低价值聚类簇。附图说明图1为本发明实施例提供的数据处理方法的方法流程图;图2为本发明实施例提供的数据处理系统的模块框图。具体实施方式以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。图1为本发明实施例提供的数据处理方法的方法流程图;如图1所示,一种查找价值用户的数据处理方法,包括如下步骤:步骤s1:以用户名为行、rfm业务指标为列来构建数据分析列表;步骤s2:根据每个用户的rfm业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据三部分;步骤s3:将高价值用户数据和异常用户数据滤除,保留主体用户数据;步骤s4:根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中心;步骤s5:根据ahp层次分析法对聚类中心进行量化价值计算,根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。上述实施例中,应理解的,主体用户数据一般为97%占比以上的用户量、高价值用户数据一般为3%以下的用户量和异常用户数据一般为0.1%以下的用户量。步骤s2中,阈值的确立可以根据具体业务要求来决定,比如业务目的要求很严格,那么阈值就取得保守些,如果业务目的是贪婪型的,那么阈值就取得偏大些。上述实施例中,由于每聚类簇的聚类中心与总体均值比较后,只能大于或者小于,所以rfm共有2^3个类别,即kmeans聚类簇数等于8。上述实施例中,所述步骤s3将主体用户数据归一化,来将高价值用户数据和异常用户数据滤除,保留主体用户数据;上述实施例中,采用rfm业务指标来从全局上考虑数据维度,并采用kmeans聚类方法,使数据自行成簇,避免了维度考虑单一的问题及人为造成的误差影响,从而提高工作效率。可选地,作为本发明的一个实施例,所述数据分析列表为n*3的列表,其中n行分别为n个用户名,3列为每个用户名对应r指标、f指标和m指标;所述rfm业务指标包括r指标、f指标和m指标,r指标为用户最近充值日期至设定日期之间的间隔天数,f指标为用户在充值天数内成功充值的次数,m指标为用户在充值天数内成功充值的金额;上述实施例中,具体的,r指标为用户在时间范围内的最后充值日期距离2016年9月1日的间隔天数;f指标为用户在充值天数内成功充值的次数;m指标为用户在充值天数内成功充值的金额;上述实施例中,进行多维度的数据挖掘和分析,避免考虑单一而影响数据的准确性。可选地,作为本发明的一个实施例,所述设定的划分阈值包括第一划分阈值和第二划分阈值,第一划分阈值为主体用户与高价值用户间的划分阈值,第二划分阈值为高价值用户与异常用户间的划分阈值。具体的,第一划分阈值小于第二划分阈值。上述实施例中,通过阈值将数据分箱,有利于分清哪部分数据是主体用户数据。可选地,作为本发明的一个实施例,所述步骤s5具体包括:步骤s501:根据ahp层次分析法分别对聚类中心进行加权计算处理,得到各聚类簇的量化价值;例如,聚类簇a的聚类中心为r=x1,f=x2,m=x3,ahp层次分析法得到的r,f,m权重为a,b,c,经过加权,聚类簇a的中心价值为ax1+bx2+cx3;步骤s502:根据预设的业务分类数值和各聚类簇的量化价值的高低将各聚类簇归类处理,得到主体用户数据的高价值聚类簇和低价值聚类簇。主体用户数据的高价值聚类簇对应极高价值用户,低价值聚类簇对应低价值用户。具体的,上述实施例中,高价值聚类簇和低价值聚类簇是相对于主体用户内部的水平来说的,可以根据加权后的价值度来判断,至于价值度的阈值,根据历史数据来判断,一般加权价值x<=0.2为低价值,0.2<x<=0.4为中价值用户,0.4以上为高价值。上述实施例中,例如:ahp层次分析法中,利用表1,表1rfmrr/rr/fr/mff/rf/ff/mmm/rm/fm/mn阶为3,ri为0.58,mi为每行乘积,r为0.635904,f为1.05984,m为1.483776,w为特征向量,w为3.179519,权重wr为0.2,权重wr为0.333333,权重wm为0.466667,经计算后,改写表1得到表2:表2rfmr10.600.43f1.6710.71m2.331.401上述实施例中,为方便各聚类簇之间的比较,对每个聚类簇进行加权计算,确立权重,既考虑到了数据内部的关系,也用到了业务方面的经验,使准确性提高。可选地,作为本发明的一个实施例,所述步骤s5还包括步骤s503:将得到的高价值聚类簇和低价值聚类簇重复执行步骤s501加权计算处理和步骤s502归类处理,得到主体用户数据最终的高价值聚类簇和低价值聚类簇。上述实施例中,步骤s502中得到的8个kmeans聚类簇,聚类簇数目过多,不宜对聚类簇进行分析,则继续将8个kmeans聚类簇数进行归类为3个kmeans聚类簇。上述实施例中,将已聚类过的聚类簇再次聚类,使聚类簇逐渐变少,便于理解。图2为本发明实施例提供的数据处理系统的模块框图;可选地,作为本发明的另一个实施例,如图2所示,一种查找价值用户的数据处理系统,包括:列表构建模块,用于以用户名为行、rfm业务指标为列来构建数据分析列表;划分模块,用于根据每个用户的rfm业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据三部分;滤除模块,用于将高价值用户数据和异常用户数据滤除,保留主体用户数据;聚类模块,用于根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中心;归类模块,用于根据ahp层次分析法对各聚类中心进行量化价值计算,并根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。可选地,作为本发明的一个实施例,列表构建模块中,所述数据分析列表为n*3的列表,其中n行分别为n个用户名,3列为每个用户名对应r指标、f指标和m指标;所述rfm业务指标包括r指标、f指标和m指标,r指标为用户最近充值日期至设定日期之间的间隔天数,f指标为用户在充值天数内成功充值的次数,m指标为用户在充值天数内成功充值的金额。可选地,作为本发明的一个实施例,所述设定的划分阈值包括第一划分阈值和第二划分阈值,第一划分阈值为主体用户与高价值用户间的划分阈值,第二划分阈值为高价值用户与异常用户间的划分阈值。可选地,作为本发明的一个实施例,所述归类模块包括:计算单元,用于根据ahp层次分析法分别对聚类中心进行加权计算处理,得到各聚类簇的量化价值;归类单元,用于根据预设的业务分类数值和各聚类簇的量化价值的高低将各聚类簇归类处理,得到主体用户数据的高价值聚类簇和低价值聚类簇。可选地,作为本发明的一个实施例,所述归类模块还包括调用单元,所述调用单元用于依次调用计算单元和归类单元将得到的高价值聚类簇和低价值聚类簇再次进行加权计算处理和归类处理,得到主体用户数据最终的高价值聚类簇和低价值聚类簇。上述的查找价值用户的数据处理方法和系统还可对低价值用户分类与高(极高)价值用户分类进行归类,得到该分类中价值用户的种类,再分别制定营销计划。本发明采用rfm业务指标来从全局上考虑数据维度,并采用kmeans聚类方法,使数据自行成簇,避免了维度考虑单一的问题及人为造成的误差影响,从而提高工作效率。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1