一种购物篮分析方法及系统的制作方法_3

文档序号:9866432阅读:来源:国知局
-2),则根据所有商品的层次结构树Tree找出 ak-i和bk-i的父类,并检查各自的父类是否相等,若不相等,则将购物篮A,B的并集AUB添加 到所述购物篮候选集Ck中,重复本步骤直到遍历所述购物篮集合Lk-i中所有的购物篮。
[00M]输出子模块133,用于输出含有k个商品的购物篮候选集Ck。
[0096] 在本实施方式中,通过迭代产生购物篮,其中含有1个商品的购物篮是通过扫描数 据集得到的所有商品的集合,含有k化含2)个商品的购物篮由含有化-1)个商品的购物篮生 成。在本实施方式中,当k=l时,输入为数据采集模块11得到的数据集。在本实施方式中,当 k= 1时,Ck为扫描输入数据集得到的所有商品的集合。
[0097] 请继续参阅图2,购物篮评估模块14,用于对含有k个商品的购物篮候选集Ck进行 评估,得到含有k个商品的购物篮频繁集Lk。
[0098] 在本实施方式中,购物篮评估模块14具体包括第一计算子模块141、第二计算子模 块142 W及添加子模块143,如图5所示。
[0099] 请参阅图5,所示为本发明一实施方式中图2所示购物篮评估模块14的内部结构示 意图。
[0100] 第一计算子模块141,用于对任意一个购物篮BeCk,计算该购物篮B的支持度
痒中支持度Fb= Στεο?·(T,B,w),当B中存在任意W个商品集
且I篡T时,f(T,B,w) = l,否则为0。
[0101] 第二计算子模块142,用于计算该购物篮B的销售额占比
痒中Sb= Στ却f (1',8,巧)*3(1'),函数3(1')为1'对应的销售额,細为所有商品销售额之和。
[0102] 添加子模块143,用于如果Pb大于用户设定的最小支持度阔值,并且化大于用户设 定的最小销售额占比阔值,则将购物篮B加入到Lk中。
[0103] 本发明所提供的一种购物篮分析系统10,根据零售业的交易数据,结合支持度和 销售额的阔值产生一些购物篮,使得其中的商品都来自不同父类。本发明可W找出重要而 且有价值的购物篮,从零售记录中分析出顾客经常同时购买的商品的组合,能极大提高商 品交易数据的应用价值,从而有利于商品的促销、摆架、物流等,同时在购物篮的评估方法 中,通过加入销售额的维度,提升购物篮所占销售额比例,运样一来也方便零售企业聚焦高 价值商品。
[0104] 值得注意的是,上述实施例中,所包括的各个单元只是按照功能逻辑进行划分的, 但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也 只是为了便于相互区分,并不用于限制本发明的保护范围。
[0105] 另外,本领域普通技术人员可W理解实现上述各实施例方法中的全部或部分步骤 是可W通过程序来指令相关的硬件来完成,相应的程序可W存储于一计算机可读取存储介 质中,所述的存储介质,如R0M/RAM、磁盘或光盘等。
[0106] W上所述仅为本发明的较佳实施例而已,并不用W限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种购物篮分析方法,其特征在于,所述方法包括: 从零售企业数据库中读取交易数据; 对所述交易数据按交易号进行分组聚集以及对商品名称进行编码; 利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选集以及 对含有k个商品的购物篮候选集&进行评估,得到含有k个商品的购物篮频繁集Lk。2. 如权利要求1所述的购物篮分析方法,其特征在于,所述交易数据包括交易号、商品 名称以及销售额。3. 如权利要求2所述的购物篮分析方法,其特征在于,所述对所述交易数据按交易号进 行分组聚集以及对商品名称进行编码的步骤具体包括: 根据所述交易号对所述交易数据进行分组,其中,每条交易记录形成如 i2. . .,in>]的形式,其中T为一次交易,TID为交易号,in为某个商品,<il,i2. · .,in>为此 次交易中购买的商品集合; 对所述交易数据中的所有商品名称按数字从1开始从小到大依次进行编码。4. 如权利要求1所述的购物篮分析方法,其特征在于,所述利用所述分组聚集和所述编 码并通过迭代方式产生购物篮候选集&的步骤具体包括: 输入含有(k-Ι)个商品的购物篮集合Lk-i以及输入所有商品的层次结构树Tree,其中,k 为整数且不小于2; 对任意两个购物篮A,BELk-1,令A= {ai,a2, · · ·,ak-1),B= {bi,b2, · · ·,bk-1},如果aj = bj (j = l,,2, . . .,k_2),则根据所有商品的层次结构树Tree找出ak-1和bk-1的父类,并检查各自 的父类是否相等,若不相等,则将购物篮A,B的并集AUB添加到所述购物篮候选集&中,重 复本步骤直到遍历所述购物篮集合Lh中所有的购物篮; 输出含有k个商品的购物篮候选集&。5. 如权利要求1所述的购物篮分析方法,其特征在于,所述对含有k个商品的购物篮候 选集&进行评估,得到含有k个商品的购物篮频繁集L k的步骤具体包括: 对任意一个购物篮Beck,计算该购物篮B的支持度·^ 其中支持度FB= 2TeDf(T, B,w),当Β中存在任意w个商品集it = …且i實时,f (T,B,w) = 1,否则为0; 计算该购物篮B的销售额占比琴^ 其中Sb= Στ〇)?·(T,B,w)*s(T),函数s(T)为T 对应的销售额,SD为所有商品销售额之和; 如果Pb大于用户设定的最小支持度阈值,并且Rb大于用户设定的最小销售额占比阈值, 贝1J将购物篮B加入到Lk中。6. -种购物篮分析系统,其特征在于,所述购物篮分析系统包括: 数据采集模块,用于从零售企业数据库中读取交易数据; 数据预处理模块,用于对所述交易数据按交易号进行分组聚集以及对商品名称进行编 码; 购物篮生成模块,用于利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选 集Ck;以及 购物篮评估模块,用于对含有k个商品的购物篮候选集Ck进行评估,得到含有k个商品的 购物篮频繁集Lk。7. 如权利要求6所述的购物篮分析系统,其特征在于,所述交易数据包括交易号、商品 名称以及销售额。8. 如权利要求7所述的购物篮分析系统,其特征在于,所述数据预处理模块具体包括: 分组子模块,用于根据所述交易号对所述交易数据进行分组,其中,每条交易记录形成 如THTID'H. .,in>]的形式,其中T为一次交易,TID为交易号,in为某个商品,<ii, i2. . .,in>为此次交易中购买的商品集合; 编码子模块,用于对所述交易数据中的所有商品名称按数字从1开始从小到大依次进 行编码。9. 如权利要求6所述的购物篮分析系统,其特征在于,所述购物篮生成模块具体包括: 输入子模块,用于输入含有(k-Ι)个商品的购物篮集合Lk-i以及输入所有商品的层次结 构树Tree,其中,k为整数且不小于2; 遍历子模块,用于对任意两个购物篮A,BELk-1,令A= {ai,a2, · · .ak-1},B= {bi,b2, · · ·, bk-1},如果aj = bj(j = l,2, · · ·,k_2),则根据所有商品的层次结构树Tree找出ak-1和bk-1 的父类,并检查各自的父类是否相等,若不相等,则将购物篮A,B的并集AUB添加到所述购 物篮候选集&中,重复本步骤直到遍历所述购物篮集合Lh中所有的购物篮; 输出子模块,用于输出含有k个商品的购物篮候选集Ck。10. 如权利要求6所述的购物篮分析系统,其特征在于,所述购物篮评估模块具体包括: 第一计算子模块,用于对任意一个购物篮BeCk,计算该购物篮B的支持度Pg = ,其 中支持度Fb= 2TEDf(T,B,w),当B中存在任意w个商品_,.且I时, f(T,B,w,)= l,否则为 0;第二计算子模块,用于计算该购物篮B的销售额占比J,其中SB= 2TeDf(T,B, w)*s(T),函数s(T)为T对应的销售额,SD为所有商品销售额之和; 添加子模块,用于如果Pb大于用户设定的最小支持度阈值,并且Rb大于用户设定的最小 销售额占比阈值,则将购物篮B加入到Lk中。
【专利摘要】本发明适用于数据挖掘领域,提供了一种购物篮分析方法,包括:从零售企业数据库中读取交易数据;对所述交易数据按交易号进行分组聚集以及对商品名称进行编码;利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选集Ck;以及对含有k个商品的购物篮候选集Ck进行评估,得到含有k个商品的购物篮频繁集Lk。本发明还提供了一种购物篮分析系统。本发明可以找出重要而且有价值的购物篮,从零售记录中分析出顾客经常同时购买的商品的组合,从而有利于商品的促销、摆架、物流等。
【IPC分类】G06Q30/02
【公开号】CN105631709
【申请号】CN201510991921
【发明人】陈小军, 褚维伟, 黄哲学, 张文斌
【申请人】深圳大学
【公开日】2016年6月1日
【申请日】2015年12月26日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1