一种基于加权RFM模型的电商平台客户细分方法与流程

文档序号:23656641发布日期:2021-01-15 13:53阅读:260来源:国知局
一种基于加权RFM模型的电商平台客户细分方法与流程

本发明涉及数据挖掘与数据分析领域,具体是一种基于加权rfm模型的电商平台客户细分方法。



背景技术:

随着我国电子商务行业的飞速发展,网络购物越来越受大众青睐,中小型电商企业间的竞争也愈发激烈,现代企业的营销理念已经从“以产品为中心”演变为“以客户为中心”,对于企业而言客户成为极具价值的资源。面对庞大的不同行为模式的客户群体,科学评价客户价值并进行精准客户细分,从而制定相应客户服务策略,提供差异化营销策略,是电商企业将有限资源利益最大化、高效提升客户忠诚度的重要途径,有助于电商企业在激烈的市场竞争中占据优势地位。

目前rfm模型在客户细分领域被广泛应用,但是传统rfm模型的客户细分主要是根据r、f、m三个指标的均值直接将客户划分为8类,导致客户分类常常存在分类模糊问题。k-means聚类分析算法作为一种经典的迭代求解的划分聚类算法,常与rfm模型结合使用以提高客户分类精度,然而传统k-means聚类分析算法存在一定局限性,k值需要预先人工经验设定,且k值的估计非常困难;初始聚类中心随机选取而成,易造成聚类结果不准确;孤立点的存在容易造成聚类迭代次数增加,且聚类陷入局部最优;当数据属性值种类多且重要性不一致时,所使用的欧氏距离对待每个属性的重要性权重相同,导致聚类精度产生偏差。

其次,在rfm模型中,各指标权重的选取是客户价值评估模型的关键,但是在大多数rfm模型应用中,识别客户价值时使用的各指标权重相同,对客户价值评价的准确性产生了负面影响。



技术实现要素:

针对现有技术中存在的技术问题,本发明提供了一种基于加权rfm模型的电商平台客户细分方法,以高效精确地对电商平台进行客户分类。

为了解决上述技术问题,本发明通过以下技术方案予以实现:

一种基于加权rfm模型的电商平台客户细分方法,包括以下步骤:

步骤1、从电商平台客户数据库中提取客户消费数据,并对客户消费数据进行数据清理,对数据清理后的客户消费数据集进行向量化处理,获得客户集x={x1,x2,…xi,…xn},1≤i≤n,n为客户个数;所述客户消费数据包括客户编号、订单编号、购买时间和消费金额;

步骤2、根据数据清理后的电商平台客户消费数据,计算每位客户最近一次消费的时间间隔r指标、规定时间段的消费频率f指标和规定时间段的消费总金额m指标;对r、f和m指标分别进行z分数标准化变换得到xir、xif和xim,记为客户xi的三个属性值;

步骤3、将步骤2得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集x中所有孤立点,得到客户集x'={x1',x2',…xi',…xm'},1≤i≤m≤n;

步骤4、使用canopy算法对步骤3得到的客户集x'进行粗聚类得到中心点集合;

步骤5、利用步骤4得到的中心点集合作为k-means算法的初始聚类中心进行聚类,得到k类电商平台客户群;

步骤6、计算聚类后每类电商平台客户群的r、f和m指标的平均值,将每类电商平台客户群的r、f和m指标的平均值与全体电商平台客户的r、f和m指标的平均值进行比较,得到每类电商平台客户群的rfm类型。

进一步地,还包括以下步骤:

步骤7、采用层次分析法计算r、f和m各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式,根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。

进一步地,还包括以下步骤:

步骤8、计算每类电商平台客户群的综合价值平均值,并将k类电商平台客户群按照综合价值平均值由高到低进行排序。

进一步地,步骤3具体包括:

步骤3.1、确定加权欧式距离公式,如公式(1)所示,计算任意两个客户点之间的加权欧式距离;

其中,ωir、ωif和ωim为客户xi的三个属性值的权值,ωir、ωif和ωim的表达式分别为公式(2)、公式(3)和公式(4),如下:

使用公式(5)计算所有客户点之间的平均加权欧式距离:

使用公式(6)计算任何一个客户点xi的密度参数:

即以客户集x中任一客户点xi为圆心,平均加权欧式距离meandist(x)为半径,圆内客户点的个数即为xi的密度参数;其中,当z>0时,u(z)=1;当z≤0,u(z)=0;

使用公式(7)计算客户点密度的平均值:

步骤3.2、若客户点xi满足公式(8),则该客户点为孤立点,从客户集x中删除该点;

dens(xi)≤a×mdens(x)(8)

步骤3.3、删除客户集x中所有孤立点后,得到客户数据分布相对集中不包含孤立点的客户集x'={x1',x2',…xi',…xm'},1≤i≤m≤n。

进一步地,步骤4具体包括:

步骤4.1、通过交叉验证法调参,设定初始距离阈值t1和t2,且t1>t2;

步骤4.2、初始化q=1;从客户集x'中随机选取一个客户点,作为第一个中心点c1,并将该客户点从客户集x'中删除;

步骤4.3、从客户集x'中再次随机抽取一个客户点xi,利用公式(1)计算客户点xi分别到所有中心点的加权欧式距离,记为di={d1,d2,…,dq},找出相距最近中心点所在的canopy集合,并记最近加权欧式距离为dmin;

步骤4.4、如果t2<dmin≤t1,则将客户点xi加入该canopy集合;

如果dmin≤t2,则将客户点xi加入该canopy集合;给客户点xi一个强标记,计算该canopy集合中所有强标记客户点的均值,将与该均值点加权欧式距离最近的客户点设为该canopy集合的新中心点;将客户点xi从客户集x'中删除;

如果dmin>t1,则将q+1赋值给q,客户点xi作为第q+1个中心点cq+1,并将客户点xi从客户集x'中删除;

步骤4.5、判断客户集x'是否为空,若为空,则表示获得中心点集合c={c1,c2,…,cq,…,ck},k表示中心点的个数;否则,返回步骤4.3执行。

进一步地,步骤5具体包括:

步骤5.1、将步骤4所得k个中心点作为初始聚类中心;

步骤5.2、根据公式(1)计算每个客户点xi分别到k个聚类中心的加权欧式距离,将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;

则k个聚类中心形成k个簇s,s={s1,s2,…sj,…sk};

步骤5.3、计算每一个簇中所有客户点的均值,将与该均值点加权欧式距离最近的客户点设为新的聚类中心;

步骤5.4、迭代步骤5.2和步骤5.3,直至聚类中心不再变化,得到的k个簇即为k类电商平台客户群。

进一步地,步骤7中,所述每个客户的综合价值的加权计算公式如公式(9)所示:

xirfm=μr×xir+μf×xif+μm×xim(9)。

与现有技术相比,本发明至少具有以下有益效果:

1.本发明面对客户数据属性值种类多且重要性不一致的情况,使用加权欧氏距离代替传统欧氏距离客观确定各属性权重,使聚类效果更显著且更精确。

2.本发明在聚类前去除了客户集中所有孤立点,可以有效避免孤立点或噪音点对聚类效果的负面影响,提升了聚类结果准确度。

3.本发明先使用canopy算法对电商平台客户进行粗聚类得到k个初始聚类中心,再结合k-means算法进一步聚类,得到k类电商平台客户群;有效避免了k-means算法需要人工预估k值和初始聚类中心点的局限性,节省人力资源的同时提高了聚类精度和效率,为电商平台的客户分类提供了更高效准确的方法。

4.本发明将聚类后每类电商平台客户群的各个指标的平均值,与全体电商平台客户的各个指标的平均值进行比较,得到每类电商平台客户群的rfm类型,使得客户分类更加细致,有利于电商平台针对不同行为模式的客户群体,制定相应客户服务策略,提供差异化营销策略,高效提升客户忠诚度。

5.本发明利用层次分析法确定r、f和m指标权重,加权计算出每个电商平台客户的综合价值,相比于传统rfm模型能够更客观准确地测算出客户综合价值;将k类电商平台客户群按照综合价值的平均值由高到低进行排序,可以为电商平台提供进一步地决策支持,面对综合价值更高的电商平台客户群投入更多资源,将有限资源利益最大化。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式中的技术方案,下面将对具体实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一种基于加权rfm模型的电商平台客户细分方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本实施例所提供的一种基于加权rfm模型的农村电商平台客户细分方法,具体包括以下步骤:

步骤1、从农村电商平台客户数据库中提取客户消费数据,客户消费数据包括客户编号、订单编号、购买时间和消费金额,对客户消费数据进行数据清理;对数据清理后的客户消费数据集进行向量化处理,获得客户集x={x1,x2,…xi,…xn},1≤i≤n,客户个数为n;

步骤2、根据数据清理后的农村电商平台客户消费数据,计算每位客户最近一次消费的时间间隔r指标、规定时间段的消费频率f指标和规定时间段的消费总金额m指标;对r、f和m指标分别进行z分数标准化变换得到xir、xif和xim,记为客户xi的三个属性值;

步骤3、将步骤2得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离计算公式,去除客户集x中所有孤立点,得到客户集x'={x1',x2',…xi',…xm'},1≤i≤m≤n;具体如下:

步骤3.1、确定加权欧式距离公式,如公式(1)所示,计算任意两个客户点之间的加权欧式距离;

其中ωir、ωif和ωim为客户xi的三个属性值的权值,公式为(2)、(3)、(4):

使用公式(5)计算所有客户点之间的平均加权欧式距离:

使用公式(6)计算任何一个客户点xi的密度参数:

即以客户集x中任一客户点xi为圆心,平均加权欧式距离meandist(x)为半径,圆内客户点的个数即为xi的密度参数。其中,当z>0时,u(z)=1;当z≤0,u(z)=0。

使用公式(7)计算客户点密度的平均值:

步骤3.2、若客户点xi满足公式(8),则该客户点为孤立点,从客户集x中删除该点;

dens(xi)≤a×mdens(x)(8)

步骤3.3、删除客户集x中所有孤立点后,得到客户数据分布相对集中不包含孤立点的客户集x'={x1',x2',…xi',…xm'},1≤i≤m≤n。

步骤4、使用canopy算法对步骤3得到的客户集x'进行粗聚类得到中心点集合;具体如下:

步骤4.1、通过交叉验证法调参,设定初始距离阈值t1和t2,且t1>t2;

步骤4.2、初始化q=1;从客户集x'中随机选取一个客户点,作为第一个中心点c1,并将该客户点从客户集x'中删除;

步骤4.3、从客户集x'中再次随机抽取一个客户点xi,利用公式(1)计算客户点xi分别到所有中心点的加权欧式距离,记为di={d1,d2,…,dq},找出相距最近中心点所在的canopy集合,并记最近加权欧式距离为dmin;

步骤4.4、如果t2<dmin≤t1,则将客户点xi加入该canopy集合;

如果dmin≤t2,则将客户点xi加入该canopy集合;给客户点xi一个强标记,计算该canopy集合中所有强标记客户点的均值,将与该均值点加权欧式距离最近的客户点设为该canopy集合的新中心点;将客户点xi从客户集x'中删除;

如果dmin>t1,则将q+1赋值给q,客户点xi作为第q+1个中心点cq+1,并将客户点xi从客户集x'中删除;

步骤4.5、判断客户集x'是否为空,若为空,则表示获得中心点集合c={c1,c2,…,cq,…,ck},k表示中心点的个数;否则,返回步骤4.3执行;

步骤5、利用步骤4得到的中心点集合作为k-means算法初始聚类中心进行聚类,得到k类电商平台客户群;

步骤5.1、将步骤4所得k个中心点作为初始聚类中心;

步骤5.2、根据公式(1)计算每个客户点xi分别到k个聚类中心的加权欧式距离,将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;则k个聚类中心形成k个簇s,s={s1,s2,…sj,…sk};

步骤5.3、计算每一个簇中所有客户点的均值,将与该均值点加权欧式距离最近的客户点设为新的聚类中心;

步骤5.4、迭代步骤5.2和步骤5.3,直至聚类中心不再变化,得到的k个簇即为k类电商平台客户群;

步骤6、计算聚类后每类农村电商平台客户群的各个指标的平均值,与全体农村电商平台客户的各个指标的平均值进行比较,得到每类农村电商平台客户群的rfm类型;

步骤7、采用层次分析法计算r、f和m各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式:

xirfm=μr×xir+μf×xif+μm×xim(9)

根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值;

步骤8、计算每类农村电商平台客户群的综合价值平均值,并将k类农村电商平台客户群按照综合价值平均值由高到低进行排序。

在步骤1中,所述数据清理,具体指删除重复和无效数据、推导计算缺失值数据、校正错误数据。

在步骤2中,农村电商平台客户的r、f和m指标选取基于rfm模型;在众多客户关系管理的分析模式中,rfm模型是一种较为流行的客户价值模型,模型包括三种指标:r、f和m;r指标表示最近一次购买时间,最近一次购买时间越近的客户越有可能再次购买,因此r值越小越好;f指标表示消费者在某个规定时间中的购买次数,经常购买的客户越有意向再次购买,客户忠诚度高,因此f值越大越好;m指标表示消费者在某个时间段中客户购买的总金额,购买金额越大,带给企业的价值越大,因此m值越大越好。

在步骤2中,具体计算r指标、f指标和m指标的方法为,按照用户编号对各属性分组,分别计算每位客户最近一次消费时间点距离分析时间点的间隔天数,记为r指标;规定时间段中的订单编号个数,记为f指标;规定时间段中的全部订单金额总和,记为m指标。

在步骤2中,对rfm模型中r、f、m指标分别进行z分数标准化变换的计算公式如式(10)-式(12)所示:

其中,xir,xif和xim分别表示客户点xi标准化后的r、f和m指标值;分别指r、f和m的平均数;δr、δf和δm分别指r、f和m的标准差。

在步骤4.4中,当t2<dmin≤t1时,该客户点不会从客户集中被删除,而是继续参加下一轮迭代,直到成为新的中心点或某个canopy集合的强标记成员。

在步骤6中,所述利用rfm模型对每类农村电商平台客户群进行rfm类型划分的具体方法为,计算聚类后每类农村电商平台客户群的各个指标的平均值,与全体农村电商平台客户的各个指标的平均值进行比较,每类农村电商平台客户群的rfm各指标平均值分别存在大于(等于)、小于全体农村电商平台客户的rfm各指标平均值两种情况,则三个指标一共有2×2×2=8种情况,因此每类农村电商平台客户群的rfm类型有8种可能,即重要保持客户(r↓f↑m↑)、重要发展客户(r↓f↓m↑)、重要挽留客户(r↑f↑m↑)、一般价值客户(r↑f↓m↑)、一般保持客户(r↓f↑m↓)、一般发展客户(r↓f↓m↓)、一般挽留客户(r↑f↑m↓)、无价值客户(r↑f↓m↓)。

在步骤7中,采用层次分析法确定r、f和m指标权重的具体做法为,邀请多名专家依据santy的1-9标度法将r、f及m这三项指标的重要程度两两进行比较,构建多个判断矩阵,对每个判断矩阵计算最大特征值及其对应的特征向量,并对特征向量归一化处理;若判断矩阵通过一致性检验,则归一化后的特征向量作为各指标权重;赋予各专家相同权重,计算各专家三项指标权重的算术平均数,作为最终三项指标的权重。

本发明采用加权欧氏距离代替传统欧氏距离,去除数据孤立点,使用canopy算法结合传统k-means算法优化客户聚类结果,提升了电商平台客户细分的精准度和效率;运用层次分析法对rfm模型加权,得到客户价值并进行排序,可以为电商平台提供进一步地决策支持,面对综合价值更高的电商平台客户群投入更多资源,将有限资源利益最大化。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1