一种用于药店会员分析的H‑RFM用户建模方法及系统与流程

文档序号:12125270阅读:1419来源:国知局
一种用于药店会员分析的H‑RFM用户建模方法及系统与流程
本发明涉及医疗健康数据分析与挖掘领域,具体涉及一种用于药店会员分析的H-RFM用户建模方法;此外,本发明还涉及一种用于药店会员分析的H-RFM用户建模系统。
背景技术
:会员是连锁药店最核心的资源,药店通过多年积累下来的会员资料“堆积如山”,然而真正识得数据价值的药店却少之又少。一些药店管理者对数据的认识还停留在会员档案、销售额等层次,对数据的深入挖掘、全面利用意识尚未形成。大部分药店对会员管理采取的还是“胡子眉毛一把抓”的粗放式管理方法,在实际情况中体现在“会员日送鸡蛋”和“群发短信”等活动上。“会员日送鸡蛋”等活动刺激了会员的短期冲动消费,但是会降低药店在会员心中的品牌价值,“群发短信”则会招致非合适受众的反感。这些粗放的会员管理方法从长远来看都会导致会员流失,所以并不可取。实际上,会员管理中存在所谓的“二八定律”,即百分之二十的会员贡献了百分之八十的利润。因此利用大数据分析做用户建模,对会员进行精细化分类,从而实现精准而高效的会员管理。本发明将提出一种用于药店会员管理的大数据用户建模方法。技术实现要素:本发明要解决的技术问题在于提供一种用于药店会员分析的H-RFM用户建模方法,克服了现有技术的上述缺陷,利用大数据分析做用户建模,对会员进行精细化分类和分析,从而实现精准而高效的会员管理。为此,本发明还提供一种用于药店会员分析的H-RFM用户建模系统。零售数据中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency,简称R)、消费频率(Frequency,简称F)、消费金额(Monetary,简称M)。最近一次消费R意指上一次购买的时间,消费频率F是顾客在限定期内购买的次数,消费金额M是顾客在限定期内购买的金额或平均客单价。而在药店这样一个健康场景下,有别于其它零售行业的特点是会员的健康(Health,简称H)水平,因为从会员的角度来看,购买药品的目的是为了改善健康。健康水平H是依据药店会员的健康数据得到的一个量化指标,用于定量的描述会员的健康状况,可以是单个的健康指标也可以是多个健康指标的加权和。基于药店的购药记录大数据和会员的健康大数据构建用户模型,本发明从以上四个维度健康水平H,最近一次消费R,消费频率F,消费金额M完整地显示一个药店会员的轮廓,提供一种用于药店会员分析的H-RFM用户建模方法,这为个性化的沟通和服务提供了依据。同时,随着时间的发展和数据的积累,四项指标能够越来越精确地判断该会员的长期价值(甚至是终身价值)。所以,对于连锁药店来说,大数据用户建模是一个不断成长、贴近会员真实价值,并不断助力会员管理的过程。为解决上述技术问题,本发明提供一种用于药店会员分析的H-RFM用户建模方法,采用基于健康水平H、消费近度R、消费频度F和消费额度M的K均值K-means聚类方法进行聚类,并计算每个聚类会员的加权平均HRFM得分用来确定它们的会员终身价值CLV大小顺序,以实现会员分类。作为本发明优选的技术方案,该方法具体包括如下步骤:第一步,数据清洗:针对购药记录的特点,以天为单位整合每个会员的购药信息,把同一天购药信息整合并作为单次购药信息,删除干扰信息;第二步,特征提取:提取会员的健康水平H、消费近度R、消费频度F和消费额度M特征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内的持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是会员在研究时间段的购药单价或购药总费用;第三步,加权处理:初步确定HRFM四者权重的初步比例关系;对特征进行两两比较得到相应的评价矩阵,并进行相应的调整以使其通过一致性检验;利用层次分析法求得HRFM四个特征的权重;第四步,聚类分析:利用K-means聚类算法对加权后的HRFM作聚类分析;第五步,类型定义:对每类会员标准化后的HRFM取平均,将平均值加权求和,得到相应的加权后的会员终身价值CLV得分,并在此基础上确定每类会员的终身价值大小排序;将每类会员的HRFM平均值和全部会员的HRFM平均值比较,得到每类会员的HRFM的变动情况用来分析该会员类别的性质,并结合每类会员的终身价值大小排序和药店自身的运营经验定义会员类型。作为本发明优选的技术方案,第一步中,所述干扰信息包括:有退药记录的会员;单次购药金额很小的记录;单次消费金额最大的5%的会员的记录或者单次消费金额在一定金额以上的会员的记录;数据重复记录。作为本发明优选的技术方案,第二步中,所述健康水平H是会员的BMI值、血压级别和血糖级别的加权和,其计算如公式(1)所示:H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS(1)其中,LevelBMI、LevelBP和LevelBS分别是BMI值、血压值和血糖值在系统中定义的级别,WBMI、WBP和WBS是BMI值、血压值和血糖值的相应权重。作为本发明优选的技术方案,第二步中,对提取的所述健康水平H、消费近度R、消费频度F和消费额度M特征进行标准化处理。所述标准化处理可以采用每个特征的标准分数来代替原来相应特征的具体值。作为本发明优选的技术方案,第四步中,所述K-means聚类算法,包括如下步骤:步骤1:随机选取K个点作为K个聚类的初始中心点;步骤2:将每个样本分配给与其距离最近的聚类;步骤3:更新每个聚类的中心点位置;步骤4:满足终止条件则终止,否则回到步骤2;终止条件可以设置为每个聚类中心点位置几乎不变动,即小于设定的阈值。作为本发明优选的技术方案,第五步中,所述将平均值加权求和,按照公式(2)加权求和:CLVscore=NH*WH+NR*WR+NF*WF+NM*WM(2)其中,NH、NR、NF和NM分别代表标准化后的H、R、F、M值,WH、WR、WF和WM是对应的权重。此外,本发明还提供一种实现上述方法的用于药店会员分析的H-RFM用户建模系统,包括数据清洗模块、特征提取模块、加权处理模块、聚类分析模块以及类型定义模块;所述数据清洗模块用于整合每个会员每天购药信息作为单次购药信息,并删除干扰信息;所述特征提取模块用于提取会员的健康水平H、消费近度R、消费频度F和消费额度M特征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内的持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是会员在研究时间段的购药单价或购药总费用;所述加权处理模块用于确定初步确定健康水平H、消费近度R、消费频度F和消费额度M四个特征的权重;所述聚类分析模块用于利用K-means聚类算法对加权后的HRFM作聚类分析;所述类型定义模块用于计算每个聚类会员的加权平均HRFM得分用来确定其会员终身价值CLV大小顺序,以实现会员分类。根据以上提供的技术方案,与现有技术相比,本发明具有以下有益效果:1、本发明将RFM模型引入药店行业,并根据药店行业的特点引入会员的健康水平H,帮助药店进行更加精确的会员分析;2、本发明考虑H-RFM四个指标的权重,帮助药店进行更加个性化的会员分析;3、本发明运用加权处理以及聚类分析方法来分析会员类别的性质,并在此基础上定义会员类型,经过多次实验分析,得到了健康水平H以及会员终身价值CLV的经验公式,有利于更合理地、更准确地对会员进行精细化分类。附图说明下面结合附图和实施例对本发明进一步说明。图1是本发明的整体流程图及系统模块图。图2是本发明中K-means聚类算法流程图。具体实施方式现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。本发明一种用于药店会员分析的H-RFM用户建模方法,采用基于健康水平H(Health)、消费近度R(Recency)、消费频度F(Frequency)和消费额度M(Monetary)的K均值K-means聚类方法进行聚类,并计算每个聚类会员的加权平均HRFM得分用来确定它们的会员终身价值CLV(CustomerLifetimeValue)大小顺序,以实现会员分类。该方法的整体流程如图1所示,具体实现步骤如下:1)数据清洗针对购药记录的特点,以天为单位整合每个会员的购药信息,把同一天购药信息整合并作为单次购药信息;删除有退药记录的会员;删除单次购药金额很小的记录;删除单次消费金额最大的5%的会员的记录或者删除单次消费金额在一定金额以上的会员的记录(这两种情况一般为团体性而非个人购药行为,此删除处理,主要是想把团体性购药行为与个人购药行为分开讨论,团体性购药主要表现就是单次购药金额很大),如发现有数据重复问题,去除重复记录仅保留一条记录即可。2)特征提取从会员基本信息表、血压测量表和血糖测量表中分别提取会员的最新BMI值(体质指数BMI=体重(kg)÷身高2(m))、血压级别和血糖级别。本发明中BMI、血压和血糖分级标准,分别如表1、2和3所示。表1BMI分级标准BMI分级偏瘦-1<18.5正常-018.5-23.9偏胖-124-27.9肥胖-2>28表2血压分级标准表3血糖分级标准H(Health)代表会员(顾客)健康水平,可以是单个的健康指标也可以是多个健康指标的加权和,在本方法中,H是会员的BMI值、血压级别和血糖级别的加权和,如公式(1)所示。H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS(1)其中,LevelBMI、LevelBP和LevelBS分别是BMI值、血压值(BP)和血糖值(BS)在系统中定义的级别,WBMI、WBP和WBS是相应的BMI值、血压值和血糖值的权重。比如可以将BMI值、血压值和血糖值的权重比例关系确定为2:4:4,那么一个偏胖、二级高血压但血糖正常的会员,他或她的H指标值就是14。H=1*2+3*4+0*4=14R(Recency)是会员(顾客)最近一次购药时间距当前研究时间的天数或该研究时间段内的持续购药天数。F(Frequency)是会员(顾客)在研究时间段内总的购药次数。M(Monetary)是会员(顾客)在研究时间段的购药单价或购药总费用。由于不同特征的量纲不同,需要进行标准化处理,比如可以用每个特征的标准分数standardscore来代替原来相应特征的具体值。标准分数(standardscore)也叫z分数(z-score),是一个分数与平均数的差再除以标准差的过程。用公式表示为:z=(x-μ)/σ。其中x为某一具体分数,μ为平均数,σ为标准差。3)加权处理考虑到药店对HRFM各类特征的重视程度可能不同,因此可以对这四个不同特征赋予相应的权重。在本方法中,采用专家咨询的方式,结合药店运营一线的调研反馈,初步确定HRFM四者权重的初步比例关系。比如对于某家药店,它所采用的HRFM的权重比例关系为2:3:3:2。如果需要调整权值,可以对特征进行两两比较得到相应的评价矩阵,并进行相应的调整以使其通过一致性检验,然后利用层次分析法求得HRFM四个特征的权重。假设某家药店所采用的HRFM评价矩阵如表4所示,该表对应的一致性比例为0.055,小于0.1表明该矩阵的一致性可以接受,计算得到HRFM各指标相对权重为(0.232,0.402,0.061,0.305)。表4示例评价矩阵HRFMH11/351R3151F1/51/511/5M11514)聚类分析利用K-means聚类算法对加权后的HRFM作聚类分析。在本方法中,依据药店运营的经验和建议,来确定聚类的数目K值。K-means是非常经典的聚类算法,其主要计算过程如图2所示,包括如下步骤:步骤1:随机选取K个点作为K个聚类的初始中心点;步骤2:将每个样本分配给与其距离最近的聚类;步骤3:更新每个聚类的中心点位置;步骤4:满足终止条件则终止,否则回到步骤2;终止条件可以设置为每个聚类中心点位置几乎不变动,即小于设定的阈值。5)类型定义对每类会员标准化后的HRFM取平均,将平均值按照公式(2)加权求和,得到相应的加权后的CLV得分,并在此基础上确定每类会员的终身价值大小排序。CLVscore=NH*WH+NR*WR+NF*WF+NM*WM(2)其中,NH、NR、NF和NM分别代表标准化后的H、R、F、M值,WH、WR、WF和WM是对应的权重。假设某家药店的HRFM对应的权重依次为0.2、-0.3、0.3和0.2,有两个会员聚类,它们标准化后的HRFM平均值依次为(0.21,0.09,0.32,0.12)和(0.28,0.31,0.11,0.14)。前一个会员聚类的加权CLV得分为0.135大于后一个会员聚类的0.024,所以前一个会员聚类的会员终身价值CLVscore1大于后一个会员的CLVscore2。具体计算过程如下:CLVscore1=0.21*0.2-0.09*0.3+0.32*0.3+0.12*0.2=0.135CLVscore2=0.28*0.2-0.31*0.3+0.11*0.3+0.14*0.2=0.024将每类会员的HRFM平均值和全部会员的HRFM平均值比较,得到每类会员的HRFM的变动情况用来分析该会员类别的性质,并结合每类会员的终身价值大小排序和药店自身的运营经验定义会员类型。例如某家药店的重要挽留型会员的典型特征是R很大明显高于平均水平表明距上次购药有很长的一段时间了,M很大远高于平均水平或H明显高于平均水平。该家药店全部会员的HRFM平均值依次为2.31、93.71、7.97和46.61,其中一个会员聚类的HRFM平均值依次为3.28、145.11、2.26和151.11。它的R值明显大于全部会员的平均水平,有近5个月没有来过药店,但它的M值是全部会员的平均水平的3倍多,可以将此类会员定义为重要挽留会员。如图1所示,本发明一种用于药店会员分析的H-RFM用户建模系统,包括数据清洗模块、特征提取模块、加权处理模块、聚类分析模块以及类型定义;所述数据清洗模块用于整合每个会员每天购药信息作为单次购药信息,并删除干扰信息;所述特征提取模块用于提取会员的健康水平H、消费近度R、消费频度F和消费额度M特征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内的持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是会员在研究时间段的购药单价或购药总费用;所述加权处理模块用于确定初步确定健康水平H、消费近度R、消费频度F和消费额度M四个特征的权重;所述聚类分析模块用于利用K-means聚类算法对加权后的HRFM作聚类分析;所述类型定义模块用于计算每个聚类会员的加权平均HRFM得分用来确定其会员终身价值CLV大小顺序,以实现会员分类。以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1