一种基于大数据多标记的电子商务商品推荐方法与流程

文档序号:11953060阅读:298来源:国知局

本发明是一种基于大数据多标记的电子商务商品推荐方法,涉及计算机数据处理技术领域。



背景技术:

近年来,随着信息技术和互联网的不断迅速发展,电子商务在社会和生活中的地位越来越显著,电子商务系统为用户提供越来越多的选择。与此同时,电子商务规模的急剧扩大使得用户耗费大量的时间浏览无关商品,对于销售商而言,以最合适的方式将商品推荐给用户是他们迫切希望的。随着大数据时代的到来,电子商务网站的商品以指数速度增长,不论其数量上还是种类上都是人们难以想象的,这更增大了迅速准确获取自己想要商品的难度。互联网犹如一把双刃剑,虽然很大程度上它推动了电子商务的迅猛发展,使商家能够通过电子商务平台将自己的商品展示给消费者,消费者足不出户便可对商品信息完全掌握,并与商家达成交易,双方各取所需。但是,网络用户在得到便利消费的同时一定程度上也陷入了前所未有的尴尬境地。所以商品的推荐功能是极为必要的,它能模拟实体店中的销售员向客户推荐他们感兴趣的商品,使消费者对商品有一定的认知,从而提高商家的销售额。

多标记学习问题是国际机器学习领域的一个研究热点,它最初来源于文档分类问题中所遇到的歧义性问题。在传统监督学习框架下,真实世界的对象与其概念标记之间是一一对应的关系,一般认为,这样的学习问题是没有歧义性的,称这类问题为单标记分类问题,即一个样例仅具有单一的标记。然而,在真实世界的问题中,歧义性对象却是广泛存在的。由于歧义性问题的存在,一个样例可能与多个标记相关联,这类问题为多标记分类问题。多标记学习在现实生活中具有广泛的应用,像视频自动标注、生物信息学、Web 挖掘、信息检索、个性化推荐等现实应用中。

关联规则 (Association rule) 是知识发现领域中最活跃的研究方法之一,是Agrawal 等在 1993 年首先提出的,用于挖掘顾客交易数据库中不同商品 ( 项 ) 之间的关联关系,这些规则反映了用户购买行为模式。关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。



技术实现要素:

针对现有技术存在的不足,本发明目的是提供一种基于大数据多标记的电子商务商品推荐方法,以解决上述背景技术中提出的问题。

为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于大数据多标记的电子商务商品推荐方法,包括以下步骤:

步骤1,用户数据采集:用于采集用户的浏览行为,集合所有的用户浏览数据;

步骤2,购买行为模型构建:通过大数据云计算平台,根据用户以往历史浏览、购买记录和不同页面的浏览时间之间的对应关系,建立不同用户特征信息的购买行为模型训练样本,根据所购买行为模型训练样本,建立用户和购买行为模型之间的回归模型,作为购买行为模型;

步骤3,通过数据分析用户的购买倾向:通过大数据云计算平台,根据用户以往历史浏览、购买记录和不同页面的浏览时间之间的对应关系,分析用户的潜在购买倾向;

步骤4,推送商品,根据步骤3中,分析出的购买倾向,向用户推送相应的商品;

步骤5,二次采集用户数据,通过大数据云计算平台,记录用户关于推送后的商品点击、购买信息以及不同商品页面的浏览时间,对这些数据进行特征采集和数据采集;

步骤6,二次推送商品,根据用户在推送后的商品点击、购买信息以及不同商品页面的浏览时间信息,判断用户的购买倾向,根据用户的购买倾向,向用户推送相应的商品。

进一步地,在步骤1中,所述用户的浏览行为包括在用户以往历史浏览、购买记录和不同页面的浏览时间,对这些数据进行特征采集和数据采集。

进一步地,在步骤2中,所述大数据云计算平台包括 Hbase、Cassandra、Dremel、Impala、基于内存计算引擎Spark 的数据仓库 Shark、GreenPlum、Vertica 中的一种或者多种的组合。

进一步地,在步骤3中,大数据云计算平台根据用户以往历史浏览、购买记录和不同页面的浏览时间之间的对应关系,提取用户购买的特征信息,这个特征信息为产品的分类、用途、颜色以及价格。

进一步地,在步骤4中,根据步骤3中大数据云计算平台提取的用户特征信息,利用购买行为模型,选择与该用户特征信息适合指数高于预设门限的产品,即向用户推送和特征信息相似的产品。

进一步地,在步骤5中,大数据云计算平台根据用户之前的特征信息以及推送产品的浏览和购买信息,建立新的购买特征信息,新的购买特征信息为二次特征信息,同时将这个购买特征信息储存在云服务器中。

进一步地,在步骤6中,大数据云计算平台根据二次特征信息,向用户推送和二次特征信息相似的产品。

本发明的有益效果:本发明的一种基于大数据多标记的电子商务商品推荐方法,在一次提取特征信息之后,根据用户之前的特征信息以及推送产品的浏览和购买信息,建立新的购买特征信息,新的购买特征信息为二次特征信息,大数据云计算平台根据二次特征信息,向用户推送和二次特征信息相似的产品,能够更有效的引导用户购物,满足用户购物体验,在提高电子商务网站的点击率和知名度方面具有非常重要的作用。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

本发明提供一种技术方案:一种基于大数据多标记的电子商务商品推荐方法,包括以下步骤:

步骤1,用户数据采集:用于采集用户的浏览行为,集合所有的用户浏览数据;

步骤2,购买行为模型构建:通过大数据云计算平台,根据用户以往历史浏览、购买记录和不同页面的浏览时间之间的对应关系,建立不同用户特征信息的购买行为模型训练样本,根据所购买行为模型训练样本,建立用户和购买行为模型之间的回归模型,作为购买行为模型;

步骤3,通过数据分析用户的购买倾向:通过大数据云计算平台,根据用户以往历史浏览、购买记录和不同页面的浏览时间之间的对应关系,分析用户的潜在购买倾向;

步骤4,推送商品,根据步骤3中,分析出的购买倾向,向用户推送相应的商品;

步骤5,二次采集用户数据,通过大数据云计算平台,记录用户关于推送后的商品点击、购买信息以及不同商品页面的浏览时间,对这些数据进行特征采集和数据采集;

步骤6,二次推送商品,根据用户在推送后的商品点击、购买信息以及不同商品页面的浏览时间信息,判断用户的购买倾向,根据用户的购买倾向,向用户推送相应的商品。

在步骤1中,所述用户的浏览行为包括在用户以往历史浏览、购买记录和不同页面的浏览时间,对这些数据进行特征采集和数据采集。

在步骤2中,所述大数据云计算平台包括 Hbase、Cassandra、Dremel、Impala、基于内存计算引擎Spark 的数据仓库 Shark、GreenPlum、Vertica 中的一种或者多种的组合。

在步骤3中,大数据云计算平台根据用户以往历史浏览、购买记录和不同页面的浏览时间之间的对应关系,提取用户购买的特征信息,这个特征信息为产品的分类、用途、颜色以及价格。

在步骤4中,根据步骤3中大数据云计算平台提取的用户特征信息,利用购买行为模型,选择与该用户特征信息适合指数高于预设门限的产品,即向用户推送和特征信息相似的产品。

在步骤5中,大数据云计算平台根据用户之前的特征信息以及推送产品的浏览和购买信息,建立新的购买特征信息,新的购买特征信息为二次特征信息,同时将这个购买特征信息储存在云服务器中。

在步骤6中,大数据云计算平台根据二次特征信息,向用户推送和二次特征信息相似的产品。

做为本发明的一个实施例:本发明的一种基于大数据多标记的电子商务商品推荐方法,在一次提取特征信息之后,根据用户之前的特征信息以及推送产品的浏览和购买信息,建立新的购买特征信息,新的购买特征信息为二次特征信息,大数据云计算平台根据二次特征信息,向用户推送和二次特征信息相似的产品,能够更有效的引导用户购物,满足用户购物体验,在提高电子商务网站的点击率和知名度方面具有非常重要的作用。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1