一种基于客户域的零售客户需求信息样本选取方法及装置与流程

文档序号:29804368发布日期:2022-04-23 21:12阅读:163来源:国知局
一种基于客户域的零售客户需求信息样本选取方法及装置与流程

1.本发明涉及一种基于客户域的零售客户需求信息样本选取方法及装置,属于大数据挖掘和客户分类管理技术领域。


背景技术:

2.随着科学技术的高速发展,移动网络的不断扩展和普及,信息化浪潮迅速席卷全球。以此同时,各行各业出现了海量的存储数据。人们在认识到信息重要性的同时,对信息分析与使用的要求也越来越高,如何在大数据中,采用有效的方法,挖掘数据背后深层次的有用信息,已经成为相关行业关注的重点和焦点。目前,一系列数据挖掘相关的技术和产业都已经出现并在飞速发展。
3.对于零售行业的企业来说,例如烟草商业企业,市场需求信息的深度挖掘非常重要,一方面企业可以根据市场需求信息有效组织货源,调整投放策略,实现精准投放,有效满足客户需求并提高企业经济运行质量;另一方面,为基层营销人员分析客户潜在需求,有目标的提供差异化服务,有效满足客户的个性化需求,进一步增强客户盈利能力,有利于改善客户关系,增强客户黏性,对营销链条的延伸具有重要意义。目前市场需求信息的深度挖掘都是基于零售客户的需求信息而来,在零售客户的需求信息样本数量众多的情况下,如何进行样本有效选取非常重要,而目前大多数的样本选取都是基于样本的概率分布得到,没有考虑到零售客户本身市场特征和经营特征,选取的样本覆盖率不高。


技术实现要素:

4.本发明的目的是提供一种基于客户域的零售客户需求信息样本选取方法,以解决目前样本选取方法存在的没有考虑客户市场特征和经营特征,样本覆盖率低的问题。
5.本发明为解决上述技术问题而提供一种基于客户域的零售客户需求信息样本选取方法,该选取方法包括以下步骤:
6.1)获取研究区域内各零售客户需求信息样本,该样本包括零售客户的基础特征和经营特征,其中经营特征包括月均销量和单条值,基础特征包括市场特征,市场特征包括市场类型、业态和商圈;
7.2)对零售客户按照其经营特征和市场特征划分,产生具有共同经营特征和消费群体的零售客户域;
8.3)以经营的连续性特征、平稳性特征和诚信经营特征中的至少一种特征对每个零售客户域内的零售客户进行筛选,得到各零售客户域内的有效零售客户数据;
9.4)在每个零售客户域内以月均购进量、月均单条值和品牌宽度为特征计算其样本综合值,计算每个零售客户域内样本综合指数的均值,以每个零售客户域内样本综合指数的均值为中心按照设定比例选取对应零售客户域内的有效零售客户数据样本;其中品牌宽度是指零售客户前n个月历史购进数据所包含的商品规格个数。
10.本发明还提供了一种基于客户域的零售客户需求信息样本选取装置,该装置包
括:处理器;存储器,用于存储所述处理器的可执行指令;其中所述处理器配置为经由执行所述可执行指令来执行本发明所述的基于客户域的零售客户需求信息采集样本选取方法。
11.本发明按照经营特征和市场特征划分,产生具有共同经营特征和消费群体的零售客户域,保证了零售客户域的经营特征和消费群体特征的同质性;同时利用连续性特征、平稳性特征和诚信经营特征对零售客户筛选,并以月均购进量、月均单条值和品牌宽度为特征计算其样本综合值,保证了所选取样本的代表性。因此,本发明的样本选取方法能够兼顾样本的同质性和代表性,保证了筛选出的样本的覆盖率和全面性,为后续的数据分析提供了准确的数据源。
12.进一步地,为了保证产生的零售客户域能够全面覆盖经营特征和市场特征,所述步骤2)的划分过程如下:分别按经营特征中的两个指标进行分段划分,得到初始域;将市场类型、业态和商圈三个指标交叉对初始域进行划分,得到具有共同经营特征和消费群体的零售客户域。
13.进一步地,为了实现经营特征的准确分类,按照市场类型分为城镇、农村两类,按照业态分为食杂店、烟酒便利店、其他三类,按照商圈分为居民区、商务政务区、其他三类。
14.进一步地,所述步骤3)中的连续性特征是指该零售客户连续经营超过设定时间,校验标准为从当前时间回溯设定时间,每个月的购进量不为0;平稳性特征是指零售客户的经营平稳度指数小于等于设定阈值;诚信经营特征为零售客户的诚信经营等级达到设定要求。
15.进一步地,为了保证筛选出的零售客户数据能够有效,所述的有效零售客户数据是指同时符合连续性特征、平稳性特征、诚信经营特征要求的标本。
16.进一步地,为了准确计算样本综合指数,所述步骤4)中样本综合指数的计算过程如下:
17.对每个客户域内各零售客户的月均购进量、月均单条值、品牌宽度进行归一化处理,得到对应的月均购进量指数、月均单条值指数、品牌宽度指数;
18.将月均购进量指数、月均单条值指数、品牌宽度指数进行加权求和,结果即为该零售客户的样本综合指数。
19.进一步地,为了保证所选取样本的覆盖率,该方法还包括对步骤4)中选取的样本进行验证的步骤,验证条件为:所选取的样本覆盖域所代表的客户与总客户数的比率大于设定值,所选取样本覆盖的域成员的月均购进份额与所有客户的月购进量的比率大于设定值。
20.进一步地,为了保证所选取样本的覆盖率,若步骤4)中选取的样本不满足所述验证条件时,对步骤4)中的设定比例进行调整,直至满足所述验证条件。
附图说明
21.图1是本发明基于客户域的零售客户需求信息样本选取方法的流程图。
具体实施方式
22.下面结合附图对本发明的具体实施方式作进一步地说明。
23.方法实施例
24.本发明以客户经营特征、市场特征两个维度的数据特征为依据,对零售客户进行同质化划分,产生具有共同经营特征和消费群体的零售客户域;通过经营的连续性特征、平稳性特征、诚信经营特征精选标本;以月均购进量、月均单条值、品牌宽度为特征复合计算样本综合指数,以域内成员样本综合指数的均值为中心,按比例选取样本;通过历史数据对样本的覆盖率进行验证,递归校验,选取最优样本。该方法的实现流程如图1所示,具体实现过程。
25.1.获取获取研究区域内各零售客户需求信息样本。
26.本发明获取样本中包括零售客户的基础特征和经营特征,经营特征包括月均销量和单条值,基础特征包括市场特征,市场特征包括市场类型、业态和商圈。月均销量、单条值),选取的时间跨度是距离当前n个月的完整历史数据,单条值以批发价(客户购进价)核算,公式如下:单条值=n个月的购进金额(元)/n个月的购进总量(条),n的大小可根据实际情况设置,例如n可以为12;市场类型为:城镇、农村两类,业态为食杂店、烟酒便利店、其他三类,商圈为居民区、商务政务区、其他三类。
27.2.对究区域内各零售客户需求信息样本进行同质化划分,产生具有共同经营特征和消费群体的零售客户域。
28.运用k-means算法按月均销量将零售客户分为x类,运用k-means算法按单条值将零售客户分为y类,将零售客户划分成xy个初始域;在此基础上,再根据市场类型、业态类型和商圈类型进行交叉式划分,将初始域分成多个零售客户域,每个客户域内客户都是同样类别月均销量、同样类别的单条值、相同的市场类型、相同商圈和相同业态类型。作为其他实施方式,这里的k-means算法也可采用其他聚类算法。
29.3.对每个零售客户域内的零售客户进行筛选,得到各零售客户域内的有效零售客户数据。
30.本发明通过经营的连续性特征、平稳性特征、诚信经营特征选取有效样本,连续性特征指该卷烟零客户连续经营超过a个月(a≤n),校验标准为从当前时间回溯a个月,每个月的购进量不为0;平稳性特征是指客户的经营平稳度指数小于等于b,诚信经营特征为(aaa、aa、a、b、c、d)b类以上(含b类);有效标本是指同时符合连续性特征、平稳性特征、诚信经营特征要求的标本。平稳性特征指数的计算方法为:客户前n个月历史购进数据与月购进总量的比率的离散度放大c倍,本实施例通过k值段聚类,认定平稳性特征指数小于等于b为符合平稳性特征要求。在进行有效样本选取时,也可以按照经营的连续性特征、平稳性特征、诚信经营特征中任意一个或者两个特征进行筛选。
31.4.以每个零售客户域内样本综合指数的均值为中心按照设定比例选取对应零售客户域内的有效零售客户数据样本。
32.本发明在每个零售客户域内以月均购进量、月均单条值和品牌宽度为特征计算其样本综合值,计算每个零售客户域内样本综合指数的均值,以每个零售客户域内样本综合指数的均值为中心按照设定比例选取对应零售客户域内的有效零售客户数据样本。
33.其中品牌宽度是指零售客户前n个月历史购进数据所包含的商品规格个数。在进行样本综合值计算时,对月均购进量、月均单条值、品牌宽度归一化处理后得出月均购进量指数、月均单条值指数、品牌宽度指数,对月均购进量、月均单条值、品牌宽度进行权重设置,按照月均购进量指数p1%,月均单条值指数p2%,品牌宽度指数p3%赋权(p1+p2+p3=
100),三个指数的加权和值为样本综合指数,各指数权重的大小可根据实际需求进行设置,如果认为月购进量指数比较重要的话,可将将其权重设的大一点。通过上述加权求和可以计算出每个零售客户的样本综合指数,对每一个零售客户域而言,其筛选出的有效客户有多个,为了实现对每一个零售客户域内有效客户进行选取,需要计算出每一个零售客户域内所有有效客户的样本综合指数,并计算出均值,以零售客户域内的样本综合指数的均值为中心,按比例选取离中心最新的客户。其中比例可以根据经验来设置,对零售客户域内客户数少的,选取的比例相对高一点,对零售客户域内客户数多的,选取的比例相对低一点,例如,可在3%-15%之间选取,选取样本比例是按照客户未进行有效客户筛选的客户数计算的。
34.为了保证所选取的样本的覆盖率,本发明通过历史数据对样本覆盖率进行递归校验,样本覆盖率指样本覆盖的域所代表的客户与总客户数的比率大于p4%认定为合格,有样本覆盖的域成员的月均购进份额与所有客户的月均购进量的比率大于p4%认定为合格;若递归校验指如果样本覆盖率达不到要求时,通过微调所述样本选取比例,重复所述样本覆盖率验证,直至样本覆盖率合格。
35.为了更好说明本发明效果,以卷烟零售客户为例对本发明的过程进行说明。如图1所示,以某市区域零售客户需求信息采集样本选取为例,选取中国某市2020年5月至2021年4月共12个月,该市18016名卷烟零售客户的基础数据和经营数据,包括客户经营特征两个指标为月均销量、单条值,选取的时间跨度是距离当前12个月的完整历史数据,单条值以批发价(客户购进价)核算,公式如下:单条值=12个月的购进金额(元)/12个月的购进总量(条)。对卷烟零售客户进行同质性划分,产生具有共同经营特征和消费群体的卷烟零售客户域,其划分方法是:运用k-means算法按月均销量将客户分为10段,运用k-means算法按单条值将客户分为7段,将客户划分为70个域,详见表1。
36.表1
[0037][0038]
按照市场类型2类,业态3类,商圈3类,在以上70个域的基础上,三个指标交叉,将客户划分为1260个域,详见表2;其中有客户存在的域为618个。
[0039]
表2
[0040]
[0041][0042]
通过经营的连续性特征、平稳性特征、诚信经营特征选取有效标本,连续性特征指该卷烟零客户连续经营超过8个月,校验标准为从当前时间回溯8个月,每个月的购进量不为0;平稳性特征是指客户的经营平稳度指数小于等于0.5,诚信经营特征为(aaa、aa、a、b、c、d)b类以上(含b类);有效标本是指同时符合连续性特征、平稳性特征、诚信经营特征要求的标本;
[0043]
稳性特征是指客户的经营平稳度指数小于等于0.5,平稳性特征指数的计算方法为:客户前12个月历史购进数据与月购进总量的比率的离散度放大10000倍,本模型通过k值9段聚类,认定平稳性特征指数小于等于0.5为符合平稳性特征要求;
[0044]
以月均购进量、月均单条值、品牌宽度为特征赋权复合计算样本综合指数,以域内成员样本指数的均值为中心,按比例选取样本;品牌宽度:指客户前12个月历史购进数据所包含的卷烟规格个数;
[0045]
赋权复合计算样本指数:对月均购进量、月均单条值、品牌宽度归一化处理后得出
月均购进量指数、月均单条值指数、品牌宽度指数,按照月均购进量指数20%,月均单条值指数45%,品牌宽度指数35%赋权,三个指数的加权和值为样本综合指数。按比例选取样本:按照域内成员个数,按比例选取样本,本区域依据上述方法选取样本1342个,样本选取比例如下表3所示:
[0046]
表3
[0047][0048]
通过历史数据对样本覆盖率进行验证,递归校验,本实例中样本覆盖率指样本覆盖的域所代表的客户与总客户数的比率大于95%认定为合格,有样本覆盖的域成员的月均购进份额与所有客户的月均购进量的比率大于95%认定为合格。如果样本覆盖率达不到要求时,通过微调样本选取比例,重复所述样本覆盖率验证,直至样本覆盖率合格。通过递归校验,本实例最终选定样本1342个,覆盖客户17600户,客户覆盖率达到96.58%,样本所覆盖的域客户总销量占该区域总销量的97.73%。
[0049]
装置实施例
[0050]
本发明的基于客户域的零售客户需求信息样本选取装置,包括处理器和存储器,所述处理器执行由所述存储器存储的计算机程序,以实现本发明实现上述方法实施例的方法。也就是说,以上方法实施例中的方法应理解可由计算机程序指令实现基于客户域的零售客户需求信息样本选取方法的流程。可提供这些计算机程序指令到处理器,使得通过处理器执行这些指令产生用于实现上述方法流程所指定的功能。
[0051]
本实施例所指的处理器是指微处理器mcu或可编程逻辑器件fpga等的处理装置;本实施例所指的存储器包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。例如:利用电能方式存储信息的各式存储器,ram、rom等;利用磁能方式存储信息的的各式存储器,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、u盘;利用光学方式存储信息的各式存储器,cd或dvd。当然,还有其他方式的存储器,例如量子存储器、石墨烯存储器等等。
[0052]
通过上述存储器、处理器以及计算机程序构成的装置,在计算机中由处理器执行相应的程序指令来实现,处理器可以搭载各种操作系统,如windows操作系统、linux系统、android、ios系统等。
[0053]
作为其他实施方式,装置还可以包括显示器,显示器用于将选取结果展示出来,以供工作人员参考。
[0054]
以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,在不脱离本发明的范围的情况下,可以进行许多改变和修改。因此,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化
和修饰同样落入本发明权利要求所限定的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1