一种实时客户购物行为分析系统及其方法

文档序号:6580127阅读:359来源:国知局
专利名称:一种实时客户购物行为分析系统及其方法
技术领域
本发明主要涉及数据处理领域,尤其涉及一种实时客户购物行为分析系统及其方法。
背景技术
客户购物行为的数据采集,统计和分析以往都是人工为主。可是随着,客户数据的 增多,人工已无法胜任。基于统计学的自动分析系统随着被开发出来。基于统计学的方法 在分析紊乱的现实世界的数据缺少稳定性和鲁棒性,尤其是针对上亿的移动终端用户的海 量级数据,技术效率低下。新型的针对巨型数据库的客户购物行为分析方法和系统成为必 要。最新的数据挖掘(Data Mining)技术是一个有效的方法。聚类是数据挖掘中广泛采用的技术。聚类是将相似的记录组合在一起,或者说将 整个数据库聚类有时也被用来分割“Segmentation”。通常这样做是为了给用户对在数据库 中正在发生的事情一个高度抽象概括。目前,Claritas公司的Prizm 系统和Equifax公 司的MicroVision 是市场上比较知名的集群软件系统平台。这些公司按地区分将人口信 息进行了分割,直接用于公司的直销网络和销售业务。该业务的商业软件可以根据分析的 结果,决定适当的发送方式(呼叫中心,直接邮件,Web服务器,电子邮件系统等),以便获得 合适的客户。可是,当前的聚类方法在集群间的介质均勻性和最少的集合数目上没有一个 科学的方法寻找最佳平衡点,通常由用户主观选定集合数目。在理想的情况下集群技术将 在所有记录组内对某一预测因素将有相同值的记录聚集在一起。可是这种情况在现实是很 少的。因为它要求某一预测因素对不同的聚集的知道预测值,且同类记录都有相同的值已 保持介质均勻性。我们可以不断地通过分化聚集以期实现介质均勻性,在极端的情况下,虽 然,我们可以给一个记录一个集群。可是,这将失去聚类的初衷。例如在我们的10个记录 的数据库用10个集群进行聚类可以100%保证介质均勻性,可是这一点也没有使原始数据 库更容易理解的作用。因此,尽可能控制集群的合理数量是聚类的另一个要素。可是,所谓 的“合理”当前是由用户定义,且难以量化。业界急需一种定量的方法能自动的确定合理集 群数量并保持较高的集群间的介质均勻性。

发明内容
本发明的目的在于提供一种实时客户购物行为分析系统及其方法,以克服现有数 据采集技术效率低下,当前的聚类方法在集群间的介质均勻性和最少的集合数目上没有一 个科学的方法寻找最佳平衡点的不足。本发明所述的一种实时客户购物行为分析系统,包括装置,其基于智能识别技术对客户的购物行为数据进行自动采集,形成大型用户 数据库;装置,其基于数据挖掘技术分析大型用户数据库,其中在利用数据挖掘技术分析 时,利用MDL原理进行分类标记,基于熵信息理论和编码理论将介质均勻性和集群的数量定量化,通过计算最小的信息编码长度,自动地确定合理集群数量,实现最优化聚类,建立 一个客户的行为模型,通过此模型对客户行为做出预测。本发明所述的一种实时客户购物行为分析方法,包括以下步骤基于智能识别技术对客户的购物行为数据进行自动采集,形成大型用户数据库;基于数据挖掘技术分析大型用户数据库,其中在利用数据挖掘技术分析时,利用 MDL原理进行分类标记,基于熵信息理论和编码理论将介质均勻性和集群的数量定量化,通 过计算最小的信息编码长度,自动地确定合理集群数量,实现最优化聚类,建立一个客户的 行为模型,通过此模型对客户行为做出预测; 商家选择最有可能作出反应的客户进行商业活动。本发明有益效果数据挖掘技术有更强有力的鲁棒性;自动地确定合理集群数 量,实现最优化聚类;科学地预测未来的客户购物行为,实现高效率的定点,定制销售,提高 工作效率。


图1为本发明具体实施例所述一种实时客户购物行为分析方法的流程示意图。
具体实施例方式如图1所示,本发明所述的一种实时客户购物行为分析方法,包括以下步骤1、基于智能识别技术对客户的购物行为数据进行自动采集,形成大型用户数据 库;2、基于数据挖掘技术分析大型用户数据库,其中在利用数据挖掘技术分析时,利 用MDL原理进行分类标记,MDL的集群方法是基于熵信息理论和编码理论将介质均勻性和 集群的数量(集群的复杂度)定量化,通过计算最小的信息编码长度,自动地确定合理集群 数量,实现最优化聚类,建立一个客户的行为模型,通过此模型对客户行为做出预测;3、商家选择最有可能作出反应的客户进行商业活动。数据挖掘是统计学和人工智能,机器学习理论的融合技术。数据挖掘是通过分析 大型用户数据库,以解决商业决策问题。例如,考虑商家需要决定应该给哪些用户发送某种 新产品促销的问题。数据挖掘将根据大量的客户的购物行为历史数据和特定客户的相关信 息,如年龄,邮政编码和产品促销的反应,以建立一个客户的行为模型。以此模型可以预测 出哪些客户可能会对该新产品作出积极地反应。通过使用此智能型预测技术的电子商务平 台,商家可以只选择最有可能作出反应的客户,高效率地提高广告发送。数据挖掘与统计学 在海量数据的商业应用方面有几个重要的优越性。首先,数据挖掘技术,如CART,神经网络 和聚类技术对紊乱的现实世界的数据往往有更强有力的鲁棒性,也更便于应用。另外一个 原因是,由于计算机闭环业务数据存储和与日俱增的商业用户数据的存在。正是由于这种 海量数据的存在才需要进行“挖掘”形式的分析技术。同时,计算机硬件的迅猛发展,极大 地增加了需要巨大储存空间和处理能力的数据挖掘技术得以在现在付诸实现。实施例某地区利用本发明用户查询商品,使用商品成像、条码成像或短信方式查询商品 时,自动地采集客户购物行为信息,形成以下数据库
权利要求
1.一种实时客户购物行为分析系统,其特征在于,其包括装置,其基于智能识别技术对客户的购物行为数据进行自动采集,形成大型用户数据库;装置,其基于数据挖掘技术分析大型用户数据库,其中在利用数据挖掘技术分析时, 利用MDL原理进行分类标记,基于熵信息理论和编码理论将介质均勻性和集群的数量定量 化,通过计算最小的信息编码长度,自动地确定合理集群数量,实现最优化聚类,建立一个 客户的行为模型,通过此模型对客户行为做出预测。
2.一种实时客户购物行为分析方法,其特征在于,包括以下步骤基于智能识别技术对客户的购物行为数据进行自动采集,形成大型用户数据库; 基于数据挖掘技术分析大型用户数据库,其中在利用数据挖掘技术分析时,利用MDL 原理进行分类标记,基于熵信息理论和编码理论将介质均勻性和集群的数量定量化,通过 计算最小的信息编码长度,自动地确定合理集群数量,实现最优化聚类,建立一个客户的行 为模型,通过此模型对客户行为做出预测;商家选择最有可能作出反应的客户进行商业活动。
全文摘要
一种实时客户购物行为分析系统及其方法。所述方法包括以下步骤基于智能识别技术对客户的购物行为数据进行自动采集,形成大型用户数据库;基于数据挖掘技术分析大型用户数据库,其中在利用数据挖掘技术分析时,利用MDL原理进行分类标记,基于熵信息理论和编码理论将介质均匀性和集群的数量(集群的复杂度)定量化,实现最优化聚类,建立一个客户的行为模型,通过此模型对客户行为做出预测;商家选择最有可能作出反应的客户进行商业活动。本发明有益效果数据挖掘技术有更强有力的鲁棒性;自动地确定合理集群数量,实现最优化聚类;科学地预测未来的客户购物行为,提高工作效率。
文档编号G06Q30/00GK101996213SQ200910169620
公开日2011年3月30日 申请日期2009年8月27日 优先权日2009年8月27日
发明者孙奕, 许晓冬, 金耿翀, 顾海松 申请人:顾海松;金耿翀;孙奕;许晓冬
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1