电子商务推荐模型的用户特征提取方法及系统的制作方法

文档序号:6632255阅读:201来源:国知局
电子商务推荐模型的用户特征提取方法及系统的制作方法
【专利摘要】本发明涉及一种电子商务推荐模型的用户特征提取方法,包括:将用户对品牌的行为数据进行时间分片,构造不同时间片的用户行为特征序列;根据上述构造的不同时间片的用户行为特征序列,对用户的整体行为数据进行分析,提取用户特征。本发明还涉及一种电子商务推荐模型的用户特征提取系统。本发明依据基本的用户日志信息和品牌操作信息进行维度扩建,提取新的特征集合,构建推荐模型的用户特征体系。
【专利说明】电子商务推荐模型的用户特征提取方法及系统

【技术领域】
[0001] 本发明涉及一种电子商务推荐模型的用户特征提取方法及系统。

【背景技术】
[0002] 互联网和信息技术的发展引发了思维方法、生活方式和商业模式的巨大变革。在 全球商业语境下,"大数据时代"要求电商品牌运用海量数据处理系统对消费者从信息搜索 到产品购买甚至购买后行为的跟踪和搜索,针对消费者的需求做出更加实时和精细化的决 策。常规的个性化推荐技术都需要从网站行为的日志信息中提取出用户和品牌的特征信 息,并通过特征选择,消除无关和冗余特征,才能得到令人满意的推荐效果。然而网站日志 信息事无巨细地包含了每个请求的详细信息,冗余的信息中真正可以进行数据特征提取的 只有用户行为数据,包括点击、购买、收藏、购物车等操作信息。
[0003] 数据特征提取在数据管理和机器学习领域发挥着重要的作用,但是现有的数据特 征化是指在保留数据特征的情况下减小原始数据的规模。数据特征化的工业背景随着数据 大规模增长,产生隐含大量有效信息的高维海量数据,若要在这些高价值总量,低价值密度 的数据中发现有价值的知识,需要通过数据特征提取保留复杂数据中的有效信息,将低价 值密度的信息转化为高价值密度的信息。
[0004] 目前的特征提取方法可以在已知丰富的基础信息上提取得到所需的隐性特征,或 者通过专业人事获取业务相关的专业知识为背景。然而,在实际面临的数据挖掘工程中,希 望通过最稀少的信息构造出高维度且正交的数据特征是上述特征构建方案所不能实现的。


【发明内容】

[0005] 有鉴于此,有必要提供一种电子商务推荐模型的用户特征提取方法及系统。
[0006] 本发明提供一种电子商务推荐模型的用户特征提取方法,该方法包括如下步骤: 将用户对品牌的行为数据进行时间分片,构造不同时间片的用户行为特征序列;根据上述 构造的不同时间片的用户行为特征序列,对用户的整体行为数据进行分析,提取用户特征。
[0007] 其中,该方法还包括:对上述提取的用户特征进行数值修正。
[0008] 所述的时间分片包括:常规的时间分片和基于购买行为的时间分片,其中所述常 规的时间分片包括:按照自然日期分片、根据用户每天的行为及时间惩罚因子分片、按照日 期从近至远间隔由短变长分片,所述基于购买行为的时间分片方式指把用户对品牌的时间 行为序列以购买日期为切分点。
[0009] 所述的用户特征包括:用户的行为转化比、用户的购买力、用户的购买周期、用户 的涉猎广度。
[0010] 所述的数值修正指通过log函数的进行数值修正。
[0011] 本发明还提供一种电子商务推荐模型的用户特征提取系统,包括时间分片模块、 特征提取模块,其中:所述时间分片模块用于将用户对品牌的行为数据进行时间分片,构造 不同时间片的用户行为特征序列;所述特征提取模块用于根据上述构造的不同时间片的用 户行为特征序列,对用户的整体行为数据进行分析,提取用户特征。
[0012] 其中,该系统还包括数值修正模块,所述数值修正模块用于对上述提取的用户特 征进行数值修正。
[0013] 所述的时间分片包括:常规的时间分片和基于购买行为的时间分片,其中所述常 规的时间分片包括:按照自然日期分片、根据用户每天的行为及时间惩罚因子分片、按照日 期从近至远间隔由短变长分片,所述基于购买行为的时间分片方式指把用户对品牌的时间 行为序列以购买日期为切分点。
[0014] 所述的用户特征包括:用户的行为转化比、用户的购买力、用户的购买周期、用户 的涉猎广度。
[0015] 所述的数值修正指通过log函数的进行数值修正。
[0016] 本发明电子商务推荐模型的用户特征提取方法及系统,能够使电子商务网站在海 量数据基础上,依据基本的用户日志信息和品牌操作信息进行维度扩建,提取新的特征集 合,构建推荐模型的用户特征体系。本发明提取的数据价值高,提取效果好。

【专利附图】

【附图说明】
[0017] 图1为本发明电子商务推荐模型的用户特征提取方法的流程图;
[0018] 图2为基于购买行为的时间分片方式示意图;
[0019] 图3为本发明电子商务推荐模型的用户特征提取系统的硬件架构图。

【具体实施方式】
[0020] 下面结合附图及具体实施例对本发明作进一步详细的说明。
[0021] 参阅图1所示,是本发明电子商务推荐模型的用户特征提取方法较佳实施例的作 业流程图。
[0022] 步骤S401,将用户对品牌的行为数据进行时间分片,构造不同时间片的用户行为 特征序列。具体如下:
[0023] 本实施例以天猫商城为例进行说明。在天猫商城,每天都会有数千万的用户通过 品牌发现自己喜欢的商品,品牌是连接消费者和商品的最重要的纽带。在已有的历史记录 中,如何建立用户的品牌偏好,第一个关键特征的提取就在于用户对品牌行为的时间序列 的计算。
[0024] 根据德国心理学家艾宾浩斯的研究发现,人体大脑对新事物遗忘的循序渐进的直 观描述,即遗忘曲线。所以用户对某个品牌的行为时间序列也有必要进行分片处理,时间越 为久远的操作对用户未来影响的可能越小,时间越近的行为对用户消费决策的影响越大。 [0025] 常规的时间分片有三种方式:
[0026] (1)按照自然日期分割,按周、半月、月分割,直接计算用户对品牌的不同时间跨度 内的行为。以四个月总记录,若按周可以分割为16片,每片的点击、购买、收藏、购物车为7 天内点击、购买、收藏、购物车之和;若按半月可以分割为8片,每片的点击、购买、收藏、购 物车为14天内点击、购买、收藏、购物车之和;若按月可以分割为4片,每片的点击、购买、收 藏、购物车为30天内点击、购买、收藏、购物车之和。
[0027] (2)直接将用户每天的行为乘以一个时间惩罚因子K,用户最近的行为比前一个 月的行为更为重要,所以时间惩罚与时间成反比,时间越近惩罚值越小,时间越远惩罚值越 大。
[0028]

【权利要求】
1. 一种电子商务推荐模型的用户特征提取方法,其特征在于,该方法包括如下步骤: 将用户对品牌的行为数据进行时间分片,构造不同时间片的用户行为特征序列; 根据上述构造的不同时间片的用户行为特征序列,对用户的整体行为进行分析,提取 用户特征。
2. 如权利要求1所述的方法,其特征在于,该方法还包括:对上述提取的用户特征进行 数值修正。
3. 如权利要求1所述的方法,其特征在于,所述的时间分片包括:常规的时间分片和基 于购买行为的时间分片,其中所述常规的时间分片包括:按照自然日期分片、根据用户每天 的行为及时间惩罚因子分片、按照日期从近至远间隔由短变长分片,所述基于购买行为的 时间分片方式指把用户对品牌的时间行为序列以购买日期为切分点。
4. 如权利要求1所述的方法,其特征在于,所述的用户特征包括:用户的行为转化比、 用户的购买力、用户的购买周期、用户的涉猎广度。
5. 如权利要求2所述的方法,其特征在于,所述的数值修正指通过log函数的进行数值 修正。
6. -种电子商务推荐模型的用户特征提取系统,其特征在于,该系统包括时间分片模 块、特征提取模块,其中: 所述时间分片模块用于将用户对品牌的行为数据进行时间分片,构造不同时间片的用 户行为特征序列; 所述特征提取模块用于根据上述构造的不同时间片的用户行为特征序列,对用户的整 体行为进行分析,提取用户特征。
7. 如权利要求6所述的系统,其特征在于,该系统还包括数值修正模块,所述数值修正 模块用于对上述提取的用户特征进行数值修正。
8. 如权利要求6所述的系统,其特征在于,所述的时间分片包括:常规的时间分片和基 于购买行为的时间分片,其中所述常规的时间分片包括:按照自然日期分片、根据用户每天 的行为及时间惩罚因子分片、按照日期从近至远间隔由短变长分片,所述基于购买行为的 时间分片方式指把用户对品牌的时间行为序列以购买日期为切分点。
9. 如权利要求6所述的系统,其特征在于,所述的用户特征包括:用户的行为转化比、 用户的购买力、用户的购买周期、用户的涉猎广度。
10. 如权利要求7所述的系统,其特征在于,所述的数值修正指通过log函数的进行数 值修正。
【文档编号】G06Q30/02GK104331817SQ201410594664
【公开日】2015年2月4日 申请日期:2014年10月29日 优先权日:2014年10月29日
【发明者】沈慧, 范小朋, 赵东辉, 须成忠 申请人:深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1