一种实时客户购物行为分析系统及其方法

文档序号：6580127阅读：359来源：国知局

专利名称：一种实时客户购物行为分析系统及其方法
技术领域：
本发明主要涉及数据处理领域，尤其涉及一种实时客户购物行为分析系统及其方法。
背景技术：
客户购物行为的数据采集，统计和分析以往都是人工为主。可是随着，客户数据的增多，人工已无法胜任。基于统计学的自动分析系统随着被开发出来。基于统计学的方法在分析紊乱的现实世界的数据缺少稳定性和鲁棒性，尤其是针对上亿的移动终端用户的海量级数据，技术效率低下。新型的针对巨型数据库的客户购物行为分析方法和系统成为必要。最新的数据挖掘(Data Mining)技术是一个有效的方法。聚类是数据挖掘中广泛采用的技术。聚类是将相似的记录组合在一起，或者说将整个数据库聚类有时也被用来分割“Segmentation”。通常这样做是为了给用户对在数据库中正在发生的事情一个高度抽象概括。目前，Claritas公司的Prizm 系统和Equifax公司的MicroVision 是市场上比较知名的集群软件系统平台。这些公司按地区分将人口信息进行了分割，直接用于公司的直销网络和销售业务。该业务的商业软件可以根据分析的结果，决定适当的发送方式(呼叫中心，直接邮件，Web服务器，电子邮件系统等)，以便获得合适的客户。可是，当前的聚类方法在集群间的介质均勻性和最少的集合数目上没有一个科学的方法寻找最佳平衡点，通常由用户主观选定集合数目。在理想的情况下集群技术将在所有记录组内对某一预测因素将有相同值的记录聚集在一起。可是这种情况在现实是很少的。因为它要求某一预测因素对不同的聚集的知道预测值，且同类记录都有相同的值已保持介质均勻性。我们可以不断地通过分化聚集以期实现介质均勻性，在极端的情况下，虽然，我们可以给一个记录一个集群。可是，这将失去聚类的初衷。例如在我们的10个记录的数据库用10个集群进行聚类可以100%保证介质均勻性，可是这一点也没有使原始数据库更容易理解的作用。因此，尽可能控制集群的合理数量是聚类的另一个要素。可是，所谓的“合理”当前是由用户定义，且难以量化。业界急需一种定量的方法能自动的确定合理集群数量并保持较高的集群间的介质均勻性。

发明内容
本发明的目的在于提供一种实时客户购物行为分析系统及其方法，以克服现有数据采集技术效率低下，当前的聚类方法在集群间的介质均勻性和最少的集合数目上没有一个科学的方法寻找最佳平衡点的不足。本发明所述的一种实时客户购物行为分析系统，包括装置，其基于智能识别技术对客户的购物行为数据进行自动采集，形成大型用户数据库；装置，其基于数据挖掘技术分析大型用户数据库，其中在利用数据挖掘技术分析时，利用MDL原理进行分类标记，基于熵信息理论和编码理论将介质均勻性和集群的数量定量化，通过计算最小的信息编码长度，自动地确定合理集群数量，实现最优化聚类，建立一个客户的行为模型，通过此模型对客户行为做出预测。本发明所述的一种实时客户购物行为分析方法，包括以下步骤基于智能识别技术对客户的购物行为数据进行自动采集，形成大型用户数据库；基于数据挖掘技术分析大型用户数据库，其中在利用数据挖掘技术分析时，利用 MDL原理进行分类标记，基于熵信息理论和编码理论将介质均勻性和集群的数量定量化，通过计算最小的信息编码长度，自动地确定合理集群数量，实现最优化聚类，建立一个客户的行为模型，通过此模型对客户行为做出预测；商家选择最有可能作出反应的客户进行商业活动。本发明有益效果数据挖掘技术有更强有力的鲁棒性；自动地确定合理集群数量，实现最优化聚类；科学地预测未来的客户购物行为，实现高效率的定点，定制销售，提高工作效率。

图1为本发明具体实施例所述一种实时客户购物行为分析方法的流程示意图。
具体实施例方式如图1所示，本发明所述的一种实时客户购物行为分析方法，包括以下步骤1、基于智能识别技术对客户的购物行为数据进行自动采集，形成大型用户数据库；2、基于数据挖掘技术分析大型用户数据库，其中在利用数据挖掘技术分析时，利用MDL原理进行分类标记，MDL的集群方法是基于熵信息理论和编码理论将介质均勻性和集群的数量(集群的复杂度)定量化，通过计算最小的信息编码长度，自动地确定合理集群数量，实现最优化聚类，建立一个客户的行为模型，通过此模型对客户行为做出预测；3、商家选择最有可能作出反应的客户进行商业活动。数据挖掘是统计学和人工智能，机器学习理论的融合技术。数据挖掘是通过分析大型用户数据库，以解决商业决策问题。例如，考虑商家需要决定应该给哪些用户发送某种新产品促销的问题。数据挖掘将根据大量的客户的购物行为历史数据和特定客户的相关信息，如年龄，邮政编码和产品促销的反应，以建立一个客户的行为模型。以此模型可以预测出哪些客户可能会对该新产品作出积极地反应。通过使用此智能型预测技术的电子商务平台，商家可以只选择最有可能作出反应的客户，高效率地提高广告发送。数据挖掘与统计学在海量数据的商业应用方面有几个重要的优越性。首先，数据挖掘技术，如CART，神经网络和聚类技术对紊乱的现实世界的数据往往有更强有力的鲁棒性，也更便于应用。另外一个原因是，由于计算机闭环业务数据存储和与日俱增的商业用户数据的存在。正是由于这种海量数据的存在才需要进行“挖掘”形式的分析技术。同时，计算机硬件的迅猛发展，极大地增加了需要巨大储存空间和处理能力的数据挖掘技术得以在现在付诸实现。实施例某地区利用本发明用户查询商品，使用商品成像、条码成像或短信方式查询商品时，自动地采集客户购物行为信息，形成以下数据库
权利要求
1.一种实时客户购物行为分析系统，其特征在于，其包括装置，其基于智能识别技术对客户的购物行为数据进行自动采集，形成大型用户数据库；装置，其基于数据挖掘技术分析大型用户数据库，其中在利用数据挖掘技术分析时，利用MDL原理进行分类标记，基于熵信息理论和编码理论将介质均勻性和集群的数量定量化，通过计算最小的信息编码长度，自动地确定合理集群数量，实现最优化聚类，建立一个客户的行为模型，通过此模型对客户行为做出预测。
2.一种实时客户购物行为分析方法，其特征在于，包括以下步骤基于智能识别技术对客户的购物行为数据进行自动采集，形成大型用户数据库；基于数据挖掘技术分析大型用户数据库，其中在利用数据挖掘技术分析时，利用MDL 原理进行分类标记，基于熵信息理论和编码理论将介质均勻性和集群的数量定量化，通过计算最小的信息编码长度，自动地确定合理集群数量，实现最优化聚类，建立一个客户的行为模型，通过此模型对客户行为做出预测；商家选择最有可能作出反应的客户进行商业活动。
全文摘要
一种实时客户购物行为分析系统及其方法。所述方法包括以下步骤基于智能识别技术对客户的购物行为数据进行自动采集，形成大型用户数据库；基于数据挖掘技术分析大型用户数据库，其中在利用数据挖掘技术分析时，利用MDL原理进行分类标记，基于熵信息理论和编码理论将介质均匀性和集群的数量(集群的复杂度)定量化，实现最优化聚类，建立一个客户的行为模型，通过此模型对客户行为做出预测；商家选择最有可能作出反应的客户进行商业活动。本发明有益效果数据挖掘技术有更强有力的鲁棒性；自动地确定合理集群数量，实现最优化聚类；科学地预测未来的客户购物行为，提高工作效率。
文档编号G06Q30/00GK101996213SQ200910169620
公开日2011年3月30日申请日期2009年8月27日优先权日2009年8月27日
发明者孙奕, 许晓冬, 金耿翀, 顾海松申请人:顾海松;金耿翀;孙奕;许晓冬

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾海松;金耿翀;孙奕;许晓冬
技术所有人：顾海松;金耿翀;孙奕;许晓冬
我是此专利的发明人

上一篇：无线外围装置及其出厂配对系统的制作方法
上一篇：一种io调度方法及调度装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。