一种购物篮分析方法及系统的制作方法

文档序号:9866432阅读:344来源:国知局
一种购物篮分析方法及系统的制作方法
【技术领域】
[0001 ]本发明设及数据挖掘领域,尤其设及一种购物篮分析方法及系统。
【背景技术】
[0002] 在市场竞争日趋激烈的今天,充分了解顾客已成为商家成功经营至关重要的因 素。大多数零售企业已经认识到运一点,在运方面做了不少努力,如各种顾客登记分析、计 算机辅助销售、人口统计分析等方法的运用,但仍有不少零售企业并未真正了解他们的顾 客。
[0003] 购物篮指的是超级市场内供顾客购物时使用的装商品的篮子,当顾客付款时,运 些购物篮内的商品被营业人员通过收款机一一登记结算并记录。
[0004] 在购物篮组成方面,由于传统购物篮分析并不考虑商品的层次结构,通常我们得 出的购物篮很多是同一小类产品的组合,此时得出的购物篮对企业的价值不大。同时使得 真正有用的购物篮被大量运些重复、没有价值的购物篮所掩盖,企业很难找到自己需要的 信息,运是影响购物篮分析在零售业应用的一个重要的因素。
[0005] 因此,亟需需要一种购物篮分析方法W提高对商品交易数据的价值挖掘能力。

【发明内容】

[0006] 有鉴于此,本发明实施例的目的在于提供一种购物篮分析方法及系统,旨在解决 现有技术中对商品交易数据的使用价值较低的问题。
[0007] 本发明实施例是运样实现的,一种购物篮分析方法,包括:
[000引从零售企业数据库中读取交易数据;
[0009] 对所述交易数据按交易号进行分组聚集W及对商品名称进行编码;
[0010] 利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选集Ck; W及
[0011] 对含有k个商品的购物篮候选集Ck进行评估,得到含有k个商品的购物篮频繁集Lk。
[0012] 优选的,所述交易数据包括交易号、商品名称W及销售额。
[0013] 优选的,所述对所述交易数据按交易号进行分组聚集W及对商品名称进行编码的 步骤具体包括:
[0014] 根据所述交易号对所述交易数据进行分组,其中,每条交易记录形成如T=[TID, < il,i2 . . .,in> ]的形式,其中T为一次交易,TID为交易号,in为某个商品,< il,i2 . . .,in> 为此次交易中购买的商品集合;
[0015] 对所述交易数据中的所有商品名称按数字从1开始从小到大依次进行编码。
[0016] 优选的,所述利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选集Ck 的步骤具体包括:
[0017] 输入含有化-1)个商品的购物篮集合Lk-iW及输入所有商品的层次结构树化ee,其 中,k为整数且不小于2;
[001 引对任意两个购物篮A,BeLk-i,令A= {日1,日2,. . .,ak-i},B= {bi,b2, . . .,bk-i},如果aj = bj(j = l,2, . . .,k-2),则根据所有商品的层次结构树化ee找出ak-1和bk-1的父类,并检查 各自的父类是否相等,若不相等,则将购物篮A,B的并集AUB添加到所述购物篮候选集Ck 中,重复本步骤直到遍历所述购物篮集合Lk-i中所有的购物篮;
[0019] 输出含有k个商品的购物篮候选集Ck。
[0020] 优选的,所述对含有k个商品的购物篮候选集Ck进行评估,得到含有k个商品的购 物篮频繁集Lk的步骤具体包括:
[0021] 对任意一个购物篮BeCk,计算该购物篮B的支持
廷中支持度Ρβ=Στε Df(T,B,w),当Β中存在任意W个商品i
,且I综T时,f(T,B,w) = l,否则 为0;
[0022] 计算该购物篮B的销售额占比
痒中Sb= 11却^1',8,巧)*3(1'),函数3(1') 为T对应的销售额,Sd为所有商品销售额之和;
[0023] 如果Pb大于用户设定的最小支持度阔值,并且Rb大于用户设定的最小销售额占比 阔值,则将购物篮B加入到Lk中。
[0024] 另一方面,本发明还提供一种购物篮分析系统,包括:
[0025] 数据采集模块,用于从零售企业数据库中读取交易数据;
[0026] 数据预处理模块,用于对所述交易数据按交易号进行分组聚集W及对商品名称进 行编码;
[0027] 购物篮生成模块,用于利用所述分组聚集和所述编码并通过迭代方式产生购物篮 候选集Ck;W及
[0028] 购物篮评估模块,用于对含有k个商品的购物篮候选集Ck进行评估,得到含有k个 商品的购物篮频繁集Lk。
[0029] 优选的,所述交易数据包括交易号、商品名称W及销售额。
[0030] 优选的,所述数据预处理模块具体包括:
[0031] 分组子模块,用于根据所述交易号对所述交易数据进行分组,其中,每条交易记录 形成如Τ= [TID,< il,i2 . . .,in> ]的形式,其中T为一次交易,TID为交易号,in为某个商品, <il,i2. . .,in>为此次交易中购买的商品集合;
[0032] 编码子模块,用于对所述交易数据中的所有商品名称按数字从1开始从小到大依 次进行编码。
[0033] 优选的,所述购物篮生成模块具体包括:
[0034] 输入子模块,用于输入含有化-1)个商品的购物篮集合Lk-iW及输入所有商品的层 次结构树Tree,其中,k为整数且不小于2;
[0035] 遍历子模块,用于对任意两个购物篮A,Be Lk-i,令A = {ai,日2,. . .,ak-i},B = {bi, b2,. . . ,bk-i},如果aj二bj(j = 1,2, . . . ,k-2),则根据所有商品的层次结构树化ee找出ak-i和 bk-i的父类,并检查各自的父类是否相等,若不相等,则将购物篮A,B的并集AUB添加到所述 购物篮候选集Ck中,重复本步骤直到遍历所述购物篮集合Lk-i中所有的购物篮;
[0036] 输出子模块,用于输出含有k个商品的购物篮候选集Ck。
[0037] 优选的,所述购物篮评估模块具体包括:
[003引第一计算子模块,用于对任意一个购物篮Be Ck,计算该购物篮B的支持度
,其中支持度FBΣτ却f(T,B,w),当B中存在任意w个商品集
,且 I 鑑;T时,f (T,B,w) = 1,否则为0;
[0039] 第二计算子模块,用于计算该购物篮B的销售额占比
其中Sb= ΣτΕ〇?·(Τ, 8,巧)*3(1'),函数5(1')为1'对应的销售额,細为所有商品销售额之和;
[0040] 添加子模块,用于如果Ρβ大于用户设定的最小支持度阔值,并且化大于用户设定的 最小销售额占比阔值,则将购物篮Β加入到Lk中。
[0041] 本发明根据零售业的交易数据,结合支持度和销售额的阔值产生一些购物篮,使 得其中的商品都来自不同父类。本发明可W找出重要而且有价值的购物篮,从零售记录中 分析出顾客经常同时购买的商品的组合,能极大提高商品交易数据的应用价值,从而有利 于商品的促销、摆架、物流等,同时在购物篮的评估方法中,通过加入销售额的维度,提升购 物篮所占销售额比例,运样一来也方便零售企业聚焦高价值商品。
【附图说明】
[0042] 图1为本发明一实施方式中购物篮分析方法流程图;
[0043] 图2为本发明一实施方式中购物篮分析系统结构示意图;
[0044] 图3为本发明一实施方式中图2所示数据预处理模块12的内部结构示意图;
[0045] 图4为本发明一实施方式中图2所示购物篮生成模块13的内部结构示意图;
[0046] 图5为本发明一实施方式中图2所示购物篮评估模块14的内部结构示意图。
【具体实施方式】
[0047] 为了使本发明的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并 不用于限定本发明。
[004引本发明【具体实施方式】提供了一种购物篮分析方法,主要包括如下步骤:
[0049] S11、从零售企业数据库中读取交易数据;
[0050] S12、对所述交易数据按交易号进行分组聚集W及对商品名称进行编码;
[0051 ] S13、利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选集Ck; W及
[0052] S14、对含有k个商品的购物篮候选集Ck进行评估,得到含有k个商品的购物篮频繁 集Lk。
[0053] 本发明所提供的一种购物篮分析方法,根据零售业的交易数据,结合支持度和销 售额的阔值产生一些购物篮,使得其中的商品都来自不同父类。本发明可W找出重要而且 有价值的购物篮,从零售记录中分析出顾客经常同时购买的商品的组合,能极大提高商品 交易数据的应用价值,从而有利于商品的促销、摆架、物流等,同时在购物篮的评估方法中, 通过加入销售额的维
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1