优化高速公路服务区业态的方法与流程

文档序号:20955638发布日期:2020-06-02 20:23阅读:769来源:国知局
优化高速公路服务区业态的方法与流程

本发明涉及服务优化领域,尤其涉及一种优化高速公路服务区业态的方法。



背景技术:

我们生活的“大数据时代”,是在信息化时代基础上升级衍变而来的智能化时代。“大数据时代”不再局限于信息共享,而是更加关注于信息的智能化应用,数据已经不是社会生产中无价值的“副产物”了;相反,数据已经成为一种可再生,并且价值巨大的生产资料。海量的数据蕴含了海量的信息,隐藏着巨大的价值,通过对数据的分析挖掘,不仅可以对现存现象进行描述和深度解释,还能对服务进行优化,现有的高速公路服务区一般仅为客户提供加油、零售等业务,难以满足客户的个性化需求,存在服务业态单一、结构不完善、匹配服务水平较低等问题。

因此,亟需一种根据客户消费数据优化高速公路服务区业态的方法。



技术实现要素:

有鉴于此,本发明提供一种根据高速公路服务区客户的消费数据来优化高速公路服务区业态的方法。

本发明提供一种优化高速公路服务区业态的方法,其特征在于:所述方法包括以下步骤:

s1:获取n天的目标高速公路服务区用户的消费数据,所述消费数据至少包括商品名称、采购时间和采购金额,所述n为大于1的整数;

s2:对所述消费数据进行预处理获得近度r、频率f和强度m;

s3:根据步骤s2所述的近度r、频率f和强度m,采用k-means聚类算法对用户进行分类;

s4:挖掘各个类别的用户的消费行为,获得用户消费偏好的集合。

进一步,所述近度r、频率f和强度m采用如下方法确定:

所述近度r表示用户最后一次在目标服务区消费距离观测时间结束日期的天数;

r=a-b,其中,r表示近度,a表示观测时间结束日期,b表示用户最后一次在目标服务区消费的日期;

所述频率f表示在观测时间内用户在目标服务区消费的次数;

所述强度m表示在观测时间内用户消费金额的总和;

其中,m表示强度,si表示用户一次消费的总额,f表示观测时间内用户在目标服务区消费的次数。

进一步,所述步骤s3包括:

s31:从近度r、频率f和强度m中随机选取三个数据作为初始的聚类中心;

s32:计算每个数据到所述初始聚类中心的距离,并将数据归类到距离初始聚类中心距离最小的初始聚类中心的类;

s33:重复步骤s302,直至所有的数据均被归类;

s34:计算各个步骤s302获得的各个类的聚类中心;

s35:判断步骤s304计算的聚类中心与初始聚类中心是否相等,若是,则分类结束;若否,则进入步骤s302。

进一步,所述步骤s302中计算每个数据到初始聚类中心的距离采用欧氏距离确定,

其中,d12表示两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离,其中,x1k表示n维向量a的元素,x2k表示n维向量b的元素,k表示变量,n表示n维向量a或n维向量b的元素的个数。

进一步,所述k-means算法中k的取值为4,即将服务区用户根据价值依次划分为高价值保留客户、一般价值发展客户、低价值挽留客户和无价值其他客户4个类别。

进一步,所述步骤s4采用fp-growth算法对用户的消费行为偏好进行挖掘,所述步骤s4具体为:

s41:构建fp-tree;

s42:挖掘频繁项集。

进一步,所述步骤s41具体包括:

s411:构建消费数据中用户id为特征项的事物集,获得用户id为特征项对应的n个事物集;

s412:扫描所述n个事物集,确定每个特征项在所述n个事物集出现的总次数,并将所述总次数标记为每个特征项的支持度;

s413:获取预先设置的最小支持度,删除支持度小于所述预先设置的最小支持度的特征项,并按支持度降序的顺序重新排列剩余的特征项;

s414:构造项头表和节点链表,最终得到fp-tree。

进一步,所述步骤s42具体包括:

s421:对fp-tree从底部依次向上挖掘频繁项,首先挖掘支持度计数低的项,然后逐渐挖掘支持度计数高的项;

s422:挖掘某节点的前缀路径,则得到符合该条件下的某元素的频繁项集合,即用户消费偏好的集合。

本发明的有益技术效果:本发明提供的优化高速公路服务区业态的方法,通过聚类分析、消费行为规则挖掘算法对服务区的用户进行划分,动态调整服务及营销策略,有针对性地提供个性化服务,不仅满足服务区用户加油、休憩等基本需求,还更好地提供其他服务,提高服务区的服务水平,增加服务区的利润。

附图说明

下面结合附图和实施例对本发明作进一步描述:

图1为本发明的k-means聚类算法的工作流程图。

图2为本发明构建fp-tree的工作流程图。

具体实施方式

以下结合说明书附图对本发明做出进一步的说明:

本发明提供的一种优化高速公路服务区业态的方法,其特征在于:所述方法包括以下步骤:

s1:获取n天的目标高速公路服务区用户的消费数据,所述消费数据至少包括商品名称、采购时间和采购金额,所述n为大于1的整数;在本实施例中,n的取值为365天;

s2:对所述消费数据进行预处理获得近度r、频率f和强度m;

s3:根据步骤s2所述的近度r、频率f和强度m,采用k-means聚类算法对用户进行分类;

s4:挖掘各个类别的用户的消费行为,获得用户消费偏好的集合。

本发明提供的优化高速公路服务区业态的方法,获取高速公路服务区预设天数内的客户的购物数据,利用聚类算法对客户进行分类,随后根据不同类别的客户,以购物数据中客户购买的产品为事务集,然后基于fp-growth算法确定该类客户的购物产品的频繁项集,从而得知各类客户购买频次最多的产品,为高速公路服务提供数据参考。

所述近度r、频率f和强度m采用如下方法确定:

所述近度r表示用户最后一次在目标服务区消费距离观测时间结束日期的天数;

r=a-b,其中,r表示近度,a表示观测时间结束日期,b表示用户最后一次在目标服务区消费的日期;

所述频率f表示在观测时间内用户在目标服务区消费的次数;

所述强度m表示在观测时间内用户消费金额的总和;

其中,m表示强度,si表示用户一次消费的总额,f表示观测时间内用户在目标服务区消费的次数。

所述步骤s3包括:

s31:从近度r、频率f和强度m中随机选取三个数据作为初始的聚类中心;

s32:计算每个数据到所述初始聚类中心的距离,并将数据归类到距离初始聚类中心距离最小的初始聚类中心的类;

s33:重复步骤s302,直至所有的数据均被归类;

s34:计算各个步骤s302获得的各个类的聚类中心;

s35:判断步骤s304计算的聚类中心与初始聚类中心是否相等,若是,则分类结束;若否,则进入步骤s302。

所述步骤s302中计算每个数据到初始聚类中心的距离采用欧氏距离确定,

其中,d12表示两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离,其中,x1k表示n维向量a的元素,x2k表示n维向量b的元素,k表示变量,n表示n维向量a或n维向量b的元素的个数。

所述k-means算法中k的取值为4,即将服务区用户根据价值依次划分为高价值保留客户、一般价值发展客户、低价值挽留客户和无价值其他客户4个类别。通过k-means算法,实现对目标高速公路的用户的分类,为后续针对用户的消费行为对用户的消费偏好进行挖掘提供基础数据。

所述步骤s4采用fp-growth算法对用户的消费行为偏好进行挖掘,所述步骤s4具体为:

s41:构建fp-tree;

s42:挖掘频繁项集。

所述步骤s41具体包括:

s411:构建消费数据中用户id为特征项的事物集,获得用户id为特征项对应的n个事物集;

s412:扫描所述n个事物集,确定每个特征项在所述n个事物集出现的总次数,并将所述总次数标记为每个特征项的支持度;

s413:获取预先设置的最小支持度,删除支持度小于所述预先设置的最小支持度的特征项,并按支持度降序的顺序重新排列剩余的特征项;最小支持度计数需要结合具体的业务场景和实际的数据分布来确定,在本实施例中,一般设定最小阈值为特征项数量的5%,即minsup=0.05*n,n为特征项数量;

s414:构造项头表和节点链表,最终得到fp-tree。若某项特征项数据为首次出现,则建立该节点,同时在项头表中增加一个指向该节点的指针;否则继续按路径需求对应的节点,更改各节点数据,将不同节点的相同数据用连线连接,表示二者的连接关系。即,将所述n个事物集中的所有特征项中属于频繁项的特征项中插入以空集null为根的初始频繁模式树fp-tree中,如插入时该频繁项节点已经存在,将该频繁项节点在所述初始频繁模式树fp-tree中的支持度加1,如插入时该频繁项节点不存在,在所述初始频繁模式树fp-tree中创建支持度为1的频繁项节点,得到所述n个事物集的fp-tree。

s421:对fp-tree从底部依次向上挖掘频繁项,首先挖掘支持度计数低的项,然后逐渐挖掘支持度计数高的项;

s422:挖掘某节点的前缀路径,则得到符合该条件下的某元素的频繁项集合,即用户消费偏好的集合。根据不同类别的客户其消费偏好的不同,服务区可调整营销策略与业态结构,对其提供个性化服务,以满足不同类型用户的服务需求。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1