本发明涉及电子商务技术领域,具体涉及一种数据分析处理方法及系统。
背景技术:
目前,电子商务类网站大数据商品推送给在线购买者,通过分析用户点击行为、购买行为、产品相关性、偏好及使用时间规律推送相应的商品及促销信息。目前,电商的数据分析,仅限于各大电商网站内部,对自身数据本身的分析,现有技术中,无法做到对于全网全部电商数据的横向挖掘,更没有结合全网用户访问行为,进行相关分析。对于全网电商数据的抓取,涉及数据量巨大,而且需要将不同电商网站的非结构化数据,解析成结构化数据,无论从数据量本身、数据的抓取还是解析都有着极大的难度。
技术实现要素:
本发明所要解决的技术问题是提供一种数据分析处理方法及系统,能够挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。
本发明解决上述技术问题的技术方案如下:
依据本发明的一个方面,提供了一种数据分析处理方法,所述方法包括:
S101、获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;
S102、将所述抽样数据进行分割并行处理,得到分割处理结果;
S103、将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。
依据本发明的另一个方面,提供了一种数据分析处理系统,所述系统包括:
抽样处理单元,用于获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;
分割处理单元,用于将所述抽样数据进行分割并行处理,得到分割处理结果;
合并处理单元,用于将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。
本发明提供的一种数据分析处理方法及系统,能够获取用户行为数据以及网站的产品公开数据,并按照设定的数学模型对待分析数据进行高效并行处理,挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。
附图说明
图1为本发明实施例一的一种数据分析处理方法流程图;
图2为本发明实施例二的一种数据分析处理系统示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例一、一种数据分析处理方法。下面结合图1对本实施例提供的方法进行详细说明。
参见图1,S101、获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据。
具体的,获取待分析处理数据,并对所述待分析处理数据进行抽样处理,将分布的异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载,得到抽样数据。其中,所述待分析处理数据具体包括用户行为数据以及电子网站的公开数据;所述用户行为数据至少包括用户浏览历史数据以及购买产品的行为数据;所述电子网站的公开数据至少包括产品评论数据、产品排名数据以及产品访问数据。
S102、将所述抽样数据进行分割并行处理,得到分割处理结果。
具体的,将所述抽样数据进行分割,按照预置的数学模型并行计算处理分割后的抽样数据,得到分割处理结果。分割并行处理能够提高数据的处理速度。
具体根据根据业务规则和算法规则建立预置数学模型。其中,所述算法规则包括聚类、分类算法、关联规则以及时间序列;所述业务规则,包括通过产品评论数据、产品排名数据和产品访问量数据分别统计出产品的销量,对产品评论数据、产品排名数据和产品访问量数据取中位数,作为置信度最高的销量值。
S103、将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。
具体的,将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果,将其作为电商平台的产品销量数据分析结果。
实施例二、一种数据分析处理系统。下面结合图2对本实施例提供的系统进行详细说明。
图2中,本实施例提供的系统包括抽样处理单元201、分割处理单元202、合并处理单元203以及模型建立单元204。
所述抽样处理单元201,用于获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据。
具体的,所述抽样处理单元201获取待分析处理数据,并对所述待分析处理数据进行抽样处理,将分布的异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载,得到抽样数据。其中,所述待分析处理数据具体包括用户行为数据以及电子网站的公开数据;所述用户行为数据至少包括用户浏览历史数据以及购买产品的行为数据;所述电子网站的公开数据至少包括产品评论数据、产品排名数据以及产品访问数据。
所述分割处理单元202,用于将所述抽样数据进行分割并行处理,得到分割处理结果。
所述模型建立单元204,用于具体的,所述分割处理单元202将所述抽样数据进行分割,按照预置的数学模型并行计算处理分割后的抽样数据,得到分割处理结果,分割并行处理能够提高数据的处理速度。
所述模型建立单元204根据根据业务规则和算法规则建立预置数学模型。其中,所述算法规则包括聚类、分类算法、关联规则以及时间序列;所述业务规则,包括通过产品评论数据、产品排名数据和产品访问量数据分别统计出产品的销量,对产品评论数据、产品排名数据和产品访问量数据取中位数,作为置信度最高的销量值。
所述合并处理单元203,用于将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。
具体的,所述合并处理单元203将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果,将其作为电商平台的产品销量数据分析结果。
具体的,所述抽样处理单元201获取待分析处理数据,并对所述待分析处理数据进行抽样处理,得到抽样数据;所述分割处理单元202将所述抽样数据进行分割并行处理,得到分割处理结果;所述合并处理单元203将所述分割处理结果进行合并处理,得到合并处理后的产品数据分析结果。
本发明提供的一种数据分析处理方法及系统,能够获取用户行为数据以及网站的产品公开数据,并按照设定的数学模型对待分析数据进行高效并行处理,挖掘出有价值的产品信息和知识,获得高准确度的电商平台的产品销量数据分析结果。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。