基于平台技术的用户消费数据采集分析系统及方法与流程

文档序号:15463259发布日期:2018-09-18 18:41阅读:750来源:国知局

本发明涉及网络技术领域,尤其是一种基于平台技术的用户消费数据采集分析系统及方法。



背景技术:

随着大数据技术的蓬勃发展,商业消费领域应用大数据平台技术对用户消费数据进行分析已经普及开来,从而便于商家时刻掌握消费者的消费动态,从而适时调整营销策略。但是,现有的数据分析方式是直接对海量数据进行直接分析,数据处理量大,速度较慢。



技术实现要素:

本发明要解决的技术问题是提供一种基于平台技术的用户消费数据采集分析系统及方法,能够解决现有技术的不足,提高了数据分离处理的速度。

为解决上述技术问题,本发明所采取的技术方案如下。

一种基于平台技术的用户消费数据采集分析系统,包括,

用户消费数据模型建立模块,用于建立用户消费数据模型,对用户消费数据进行筛选;

用户消费数据分类模块,用于对采集的用户消费数据进行分类;

用户消费数据加工模块,对每类用户消费数据进行再加工;

用户消费数据存储缓冲模块,用于对加工后的数据进行缓存;

用户消费数据分析模块,用于对加工后的数据进行分析,得到分析结果。

一种上述的基于平台技术的用户消费数据采集分析系统的采集分析方法,包括以下步骤:

A、用户消费数据模型建立模块根据用户消费数据特点和数据分析要求建立用户消费数据模型,对符合用户消费数据模型的数据进行采集;

B、用户消费数据分类模块对采集的用户消费数据进行分类;

C、用户消费数据加工模块针对每一类用户消费数据进行独立的加工整合,并将加工整合后的数据包存入用户消费数据存储缓冲模块;

D、用户消费数据分析模块调用用户消费数据存储缓冲模块中的数据包,对数据进行分析,得到分析结果。

作为优选,步骤B中,对用户消费数据进行分类包括以下步骤,

B1、提取用户消费数据的浏览路径特征、地域分布特征、消费种类关联性特征和消费金额分布特征;

B2、计算每个用户消费数据中各特征与数据库中各特征均值的偏离度,以偏离度最大的特征作为用户消费数据的分类参考值进行分类。

作为优选,步骤C中,对用户消费数据进行加工整合包括以下步骤,

C1、将用户消费数据中未作为分类参考值的特征进行归一化处理;

C2、得到每一种归一化数据的拟合曲线,截取所有拟合曲线之间相似度均大于50%的线段区间为分析区间;

C3、对分析区间的拟合曲线进行还原,得到待分析的用户消费数据。

作为优选,步骤D中,用户消费数据分析模块首先根据作为分类参考值的特征作为主特征,使用特征数据库进行比对,得到预分析结果;然后用户消费数据分析模块使用用户消费数据存储缓冲模块的一级缓存区域内的存储数据对预分析结果进行二次比对,得到最终分析结果;最后用户消费数据分析模块将最终分析结果与用户消费数据存储缓冲模块的二级缓存区域内的存储数据进行校验,判断最终分析结果是否符合用户消费数据存储缓冲模块的二级缓存区域内的存储数据的行为特征,若符合则输出最终分析结果,否则,对调整比对灵敏度,重新进行步骤D的分析比对过程。

采用上述技术方案所带来的有益效果在于:本发明通过优化对于数据分析前的预处理过程,提高了数据特征的集中度,降低了数据中的干扰信息量,可以有效降低分析运算量,从而快速得到分析结果。

附图说明

图1是本发明一个具体实施方式的原理图。

图中:1、用户消费数据模型建立模块;2、用户消费数据分类模块;3、用户消费数据加工模块;4、用户消费数据存储缓冲模块;5、用户消费数据分析模块。

具体实施方式

参照图1,本发明一个具体实施方式包括,

用户消费数据模型建立模块1,用于建立用户消费数据模型,对用户消费数据进行筛选;

用户消费数据分类模块2,用于对采集的用户消费数据进行分类;

用户消费数据加工模块3,对每类用户消费数据进行再加工;

用户消费数据存储缓冲模块4,用于对加工后的数据进行缓存;

用户消费数据分析模块5,用于对加工后的数据进行分析,得到分析结果。

一种上述的基于平台技术的用户消费数据采集分析系统的采集分析方法,包括以下步骤:

A、用户消费数据模型建立模块1根据用户消费数据特点和数据分析要求建立用户消费数据模型,对符合用户消费数据模型的数据进行采集;

B、用户消费数据分类模块2对采集的用户消费数据进行分类;

C、用户消费数据加工模块3针对每一类用户消费数据进行独立的加工整合,并将加工整合后的数据包存入用户消费数据存储缓冲模块4;

D、用户消费数据分析模块5调用用户消费数据存储缓冲模块4中的数据包,对数据进行分析,得到分析结果。

步骤B中,对用户消费数据进行分类包括以下步骤,

B1、提取用户消费数据的浏览路径特征、地域分布特征、消费种类关联性特征和消费金额分布特征;

B2、计算每个用户消费数据中各特征与数据库中各特征均值的偏离度,以偏离度最大的特征作为用户消费数据的分类参考值进行分类。

步骤C中,对用户消费数据进行加工整合包括以下步骤,

C1、将用户消费数据中未作为分类参考值的特征进行归一化处理;

C2、得到每一种归一化数据的拟合曲线,截取所有拟合曲线之间相似度均大于50%的线段区间为分析区间;

C3、对分析区间的拟合曲线进行还原,得到待分析的用户消费数据。

步骤C中,将待分析的用户消费数据存入用户消费数据存储缓冲模块4的一级缓存区域,将其余拟合曲线段存入用户消费数据存储缓冲模块4的二级缓存区域。

步骤D中,用户消费数据分析模块5首先根据作为分类参考值的特征作为主特征,使用特征数据库进行比对,得到预分析结果;然后用户消费数据分析模块5使用用户消费数据存储缓冲模块4的一级缓存区域内的存储数据对预分析结果进行二次比对,得到最终分析结果;最后用户消费数据分析模块5将最终分析结果与用户消费数据存储缓冲模块4的二级缓存区域内的存储数据进行校验,判断最终分析结果是否符合用户消费数据存储缓冲模块4的二级缓存区域内的存储数据的行为特征,若符合则输出最终分析结果,否则,对调整比对灵敏度,重新进行步骤D的分析比对过程。

另外,步骤A中,在对数据进行采集时,对于步骤B中所述各数据特征,若其与数据模型中对应特征的相似度大于60%则认定为通过,其余数据特征,若其与数据模型中对应特征的相似度大于85%则认定为通过,在步骤B中所述各数据特征均通过且其余数据特征通过数量大于总量的50%时,对此数据进行采集。通过对不同数据特征进行区分,可以有效减少后续步骤中对于数据特征采集处理的有效信息丢失率。

在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1