基于用户购买行为来识别不良商品的方法和系统的制作方法

文档序号:6383798阅读:452来源:国知局
专利名称:基于用户购买行为来识别不良商品的方法和系统的制作方法
技术领域
本发明涉及一种识别不良商品的方法和系统,更具体地,涉及一种基于用户购买行为来识别不良商品的方法和系统。
背景技术
在电子商务领域,尤其是大型电商具有品类众多,商品数量庞大的特征。普通消费者在购买商品后,会对商品有一个全面的评价,比如销售者满意度、客户体验等。然而,对于电商来说如何收集消费者对商品的感受则是难点。从另外一个角度,如果消费者对一件(一组)商品满意度非常差,则消费者将不再回到电商网络再次购物。这样的结果是商家极为不希望发生的事情,而造成客户流失的源头是因为出现了不良商品,这些商品需要商家进行优化(比如配送、商品质量、商品价格等)。不良商品的检测有几种常见的方法,比如通过对用户投诉数据或评论数据进行分析,进而获得投诉倾向明显或差评比较多的商品。一般的步骤如下a)获取商品评论数据;b)将获取的评论数据分成词组以便进行比对;c)获得发生频数最高的几个单词;d)如果这几个单词属于否定性质,则判断该商品为不良商品。现有技术存在以下缺点(I)对于评论数据,用户在对商品存在极大抱怨时,会存在再也不回到网站上发生任何行为,这是实际上是没有评论数据可获取的;(2)用户对于评论的偏好也是不同的,有的用户对于所有购买的产品都呈现出攻击性的态度,表现为全部购买的商品均为差评,但是这些差评并不影响这位用户后续的购买行为。也就是说,实际上这位客户对于商品依然是“满意”的,只是在言论上有不满,而非行动上的不满;(3)投诉的数据同样存在评论一样的问题,并且投诉数据是集中在客服系统,其语音数据并不能利用,商品投诉仅仅是客服投诉中的一个小的分类,反映不良商品的数据密集型较差。虽然现阶段一般电子商务网站并没有如此大量(日销售的唯一商品数量在50000件以上)的商品,但是随着互联网技术的快速发展仍然需要一种能够在海量商品中迅速地搜索到不良商品,并提醒采销人员进行人工干预的方法和系统,从而减少不良商品对消费者的负面营销。

发明内容
根据本发明的一方面,提供了一种基于用户购买行为识别不良商品的方法,所述方法包括由用户筛选模块从客户交易系统中选取特定时间段内仅单次购物行为的用户集;由所述用户筛选模块基于全部客户购买的商品明细特征和所述用户集来构建用户商品购买关系矩阵;由识别模块基于所述用户商品购买关系矩阵来计算商品的不良概率以识别出不良商品;由所述识别模块根据所识别出的不良商品来生成不良商品清单;以及由推送模块将所生成的不良商品清单提供给商品干预系统。根据本发明的一个实施例,所述用户集包括第一用户子集,所述第一用户子集是在所述特定时间段中仅单次购物行为并且在所述特定时间段之前的先前特定时间段内没有购物行为的用户子集。根据本发明的一个实施例,在构建所述用户商品购买关系矩阵之前,由所述行为标记模块基于所述第一用户子集来对所述第一用户子集在所述特定时间段之后的未来特定时间段内是否发生了特定行为进行标记以生成相应用户的行为数据。根据本发明的另一个实施例,所述第一用户子集包括第二用户子集,所述第二用户子集是在所述特定时间段中仅单次购物行为、在所述特定时间段之前的先前特定时间段内没有购物行为并且在所述特定时间段之后的未来特定时间段没有发生特定行为的用户子集。根据本发明的一个实施例,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第一用户子集被构建。根据本发明的另一个实施例,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第二用户子集被构建。根据本发明的另一个实施例,商品的不良概率的计算还基于所述行为数据。根据本发明的一个实施例,所述特定行为是购物行为、登录行为或收藏行为中的一个。根据本发明的一个实施例,所述识别模块采用适用于稀疏矩阵环境的算法来对商品的不良概率进行求解。根据本发明的另一个实施例,所述识别模块采用二项分布假设检验的方式来识别出不良商品。根据本发明的另一个方面,提供了一种基于用户购买行为识别不良商品的系统,所述系统包括用户筛选模块,所述筛选模块被配置成从客户交易系统中选取特定时间段内仅单次购物行为的用户集,并且基于全部客户购买的商品明细特征和所述用户集来构建用户商品购买关系矩阵;识别模块,所述识别模块被配置成基于所述用户商品购买关系矩阵来计算商品的不良概率以识别出不良商品,并且根据所识别出的不良商品来生成不良商品清单;以及推送模块,所述推送模块被配置成将所生成的不良商品清单提供给商品干预系统。根据本发明的一个实施例,所述用户集包括第一用户子集,所述第一用户子集是在所述特定时间段中仅单次购物行为并且在所述特定时间段之前的先前特定时间段内没有购物行为的用户子集。根据本发明的一个实施例,进一步包括标记模块,所述标记模块被配置成在所述用户筛选模块构建所述用户商品购买关系矩阵之前,基于所述第一用户子集来对所述第一用户子集在所述特定时间段之后的未来特定时间段内是否发生了特定行为进行标记以生成相应用户的行为数据。根据本发明的一个实施例,所述第一用户子集包括第二用户子集,所述第二用户子集是在所述特定时间段中仅单次购物行为、在所述特定时间段之前的先前特定时间段内没有购物行为并且在所述特定时间段之后的未来特定时间段没有发生特定行为的用户子集。根据本发明的一个实施例,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第一用户子集被构建。根据本发明的一个实施例,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第二用户子集被构建。根据本发明的一个实施例,商品的不良概率的计算还基于所述行为数据。根据本发明的一个实施例,所述特定行为是购物行为、登录行为或收藏行为中的一个。根据本发明的一个实施例,所述识别模块采用适用于稀疏矩阵环境的算法来对商品的不良概率进行求解。根据本发明的另一个实施例,所述识别模块采用二项分布假设检验的方式来识别出不良商品。


附示了本发明的实施例,并与说明书一起用于解释本发明的原理。在附图中图1图示了根据本发明的一个实施例的基于用户购买行为来识别不良商品的系统的框图。图2图示了根据本发明的一个实施例的基于用户购买行为来识别不良商品的处理的概视图。图3图示了根据本发明的一个实施例的基于用户购买行为来识别不良商品的方法的流程图。图4图示了根据本发明的另一个实施例的基于用户购买行为来识别不良商品的方法的流程图。图5图示了根据本发明的又一个实施例的基于用户购买行为来识别不良商品的方法的流程图。
具体实施例方式本发明涉及使用客户购买行为来有效识别不良商品的一种用户行为统计系统的方法。此方法的最重要的特征在于,仅仅依赖客户购买行为数据(即,实际交易),即可识别用户购买的商品中存在的不良商品。该方法与用户主观评价和交易金额无关,避免了用户主观评价标准不一致和因交易金额不同而造成的不对等判断。在以天为单位的运算周期下,每天可识别约20-30个需要关注的商品。从而替代了传统上通过人为关注来识别不良商品的识别效率非常低下的方式。如本领域技术人员已知的,商品可以根据例如周转速度而被分为不同的级别,按照级别对商品进行管理可以有效优化商品布局和提升效益。例如,根据周转速度商品可以被划分成优异、良好、正常、较差和不良五个等级。如在此使用的术语“不良商品”指的是销售差并且库存周转慢的商品。剔除“不良商品”不仅可以降低对客户的负面影响,而且使得商家可以更有效地利用资金合理配置资源,从而有助于实现盈利指标最大化。针对不良商品,从用户购买行为的角度来看,用户通常因为事先不了解而购买了不良商品。也就是说,在用户实际购买不良商品的时间之前,用户往往没有购买过该商品,而在实际购买了该不良商品之后,由于该商品是不良商品,而通常不会再次购买该商品。也就是说,用户购买不良商品的行为往往是单次购买行为。因此,如果想要筛选出不良商品,需要从用户的单次购买行为中进行筛选。当然,由于并不是所有的单次购买行为都是针对不良商品,所以需要对该商品是不良商品的不良概率进行分析计算,以判断认为商品是否确实是不良商品。本发明的基于用户购买行为来识别不良商品的方法和系统能够准确地筛选出不良商品,在实践应用中取得了良好效果。下面结合说明书附图详细描述本发明的实施例。图1图示了根据本发明的一个实施例的基于用户购买行为来识别不良商品的系统100的框图。如图1所示,系统100包括用户筛选模块102、行为标记模块104、数据支撑模块106、识别模块108以及推送模块110。用户筛选模块102用于根据全部客户购买的商品明细特征来筛选出满足预定条件的用户集NI。例如,用户筛选模块102可以选取在特定时间段发生单次购物行为的用户集。然后,用户筛选模块102可以基于全部客户购买的商品明细特征和由用户筛选模块102筛选出来的用户集NI来生成用户商品购买关系矩阵M,并且将所生成的用户商品购买关系矩阵M发送到识别模块108。优选地,用户筛选模块102可以从已选取的用户集NI再次选取第一用户子集N2,该第一用户子集N2是在所述特定时间段中仅单次购物行为并且在所述特定时间段之前的先前特定时间段内没有购物行为的用户子集。在这种情况下,用户筛选模块102可以基于全部客户购买的商品明细特征和该第一用户子集N2来生成用户商品购买关系矩阵M。更优选地,用户筛选模块102可以从第一用户子集N2选取第二用户子集N3,该第二用户子集N3是在所述特定时间段中仅单次购物行为、在所述特定时间段之前的先前特定时间段内没有购物行为并且在所述特定时间段之后的未来特定时间段没有发生特定行为的用户子集。在这种情况下,用户筛选模块102可以基于全部客户购买的商品明细特征和该第二用户子集N3来生成用户商品购买关系矩阵M。优选地,在选取第一用户子集N2的情况下,行为标记模块104基于由用户筛选模块102筛选出的第一用户子集N2的信息来对所述用户在所述特定时间段之后的未来特定时间段是否发生了特定行为进行标记。例如,如果在未来特定时间段发生了特定行为,则标记为1,反之则标记为O。例如,所述特定行为指的是由用户筛选模块102筛选出的用户在未来特定时间段中是否有购买行为。替代地,所述特定行为可以指的是由用户筛选模块102筛选出的用户在未来特定时间段中是否有登录行为、收藏行为等与用户进行购买有关的行为。用户筛选模块102和购买行为标记模块104的执行依赖于数据支撑模块106。数据支撑模块106用于向用户筛选模块102和购买行为标记模块104提供稳定的数据和模型支持,从而保障系统正常运转和应用的实现。识别模块108用于基于从用户筛选模块102接收到的用户商品购买关系矩阵和/或从行为标记模块104接收到的对应行为数据来计算商品的不良概率。识别模块108在识别出不良商品之后生成不良商品清单。然后,推送模块110将所生成的不良商品清单推送至商品干预系统,由企业的采销、质检部门人员进行进一步的
人工干预。
图2图示了根据本发明的一个实施例的基于用户购买行为来识别不良商品的处理的概视图。例如,如图2所示,用户筛选模块102首先从客户交易系统中选取特定时间段(图2中示出为t2时间段)内单次购物行为的用户集NI,这些用户的购买行为是识别商品异常的主要依据。然后,用户筛选模块102在用户集NI中选取满足在先前特定时间段(图2中示出为tl时间段)内没有购物行为的用户子集N2。行为标记模块104可以基于由用户筛选模块102筛选出的用户子集N2来对所述用户子集N2在所述特定时间段之后的未来特定时间段(图2中示出为t3时间段)内是否发生了特定行为进行标记,并生成行为数据作为识别模块108的输入。在图2的示例中,所述特定行为指的是由用户筛选模块102筛选出的用户在未来特定时间段t3内是否发生了购买行为。如果发生了购买行为,则标记为I ;如有没有发生购买行为,则标记为O。
接着,用户筛选模块102根据行为标记模块104标记的行为数据和/或系统运算能力,从用户子集N2中提取用户子集N3(—般为一天,滚动计算)。然后,用户筛选模块102基于全部客户购买的商品明细特征和由用户筛选模块102筛选出来的用户子集N3来构建用户子集N3的用户商品购买关系矩阵M (对于40000客户、50000件商品的矩阵在64位操作系统中大概占用内存空间为15Gb),作为识别模块108的输入。用户商品购买关系矩阵M的结构例如可以如下面的矩阵所示。
pl p2 p3 p4 p5 p6 p7 p8 p9 plO i o O-O-O-O
~o-o-00~~~0
~o- 00~~~0
οoO-O-O-O
0IO-O-O-O
00~~~0
00~~~
US-^o-O-O-^O-O-O-O-0 u9~~~~T~ 0 0 ~~~0
ο~~~~ 0 0 ~~~ 对于本矩阵行代表了用户,列代表了商品。如果用户购买了某种商品,则在这个矩阵上对应的位置标记为I,反之为O。以第一条记录为例,ul用户购买了 p4、p5两件商品。在完整收集作为识别模块108的输入的以上两部分数据(即,用户商品购买关系矩阵M和行为数据)之后,识别模块108需要对商品的不良概率进行计算以生成不良商品清单,从而可以根据概率来判断该商品的不良性的程度。由于在表示用户商品购买关系矩阵M中,只有很少的一部分系数非零(S卩,大部分系数严格等于零),所以可以使用适用于稀疏矩阵环境的算法来对商品的不良概率进行求解。然而,如本领域技术人员已知的,可以采用能够计算商品的不良概率的任何适当的算法。在一个实施例中,识别模块108可以采用LARS算法来对所输入的用户商品购买关系矩阵M和行为数据进行处理,以协同计算得出商品的不良概率,从而实现不良商品的识别目的。优选地,识别模块108可以采用适用于稀疏矩阵环境的LASSO (Least AbsoluteShrinkage andSelection operator)算法来计算出商品的不良概率。
在采用LASSO算法来计算商品的不良概率的情况下,所计算的商品的系数均为负数,其绝对值的大小代表了商品不良性的重要程度。如下表I所示,商品条目二明显要比商品条目一的不良性高很多,是需要优先干预的商品。
权利要求
1.一种基于用户购买行为识别不良商品的方法,所述方法包括由用户筛选模块从客户交易系统中选取特定时间段内仅单次购物行为的用户集;由所述用户筛选模块基于全部客户购买的商品明细特征和所述用户集来构建用户商品购买关系矩阵;由识别模块基于所述用户商品购买关系矩阵来计算商品的不良概率以识别出不良商品;由所述识别模块根据所识别出的不良商品来生成不良商品清单;以及由推送模块将所生成的不良商品清单推送到商品干预系统。
2.根据权利要求1所述的方法,其中,所述用户集包括第一用户子集,所述第一用户子集是在所述特定时间段中仅单次购物行为并且在所述特定时间段之前的先前特定时间段内没有购物行为的用户子集。
3.根据权利要求2所述的方法,其中,在构建所述用户商品购买关系矩阵之前,由所述行为标记模块基于所述第一用户子集来对所述第一用户子集在所述特定时间段之后的未来特定时间段内是否发生了特定行为进行标记以生成相应用户的行为数据。
4.根据权利要求2所述的方法,其中,所述第一用户子集包括第二用户子集,所述第二用户子集是在所述特定时间段中仅单次购物行为、在所述特定时间段之前的先前特定时间段内没有购物行为并且在所述特定时间段之后的未来特定时间段没有发生特定行为的用户子集。
5.根据权利要求2所述的方法,其中,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第一用户子集被构建。
6.根据权利要求4所述的方法,其中,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第二用户子集被构建。
7.根据权利要求3或4所述的方法,其中,商品的不良概率的计算还基于所述行为数据。
8.根据权利要求3或4所述的方法,其中,所述特定行为是购物行为、登录行为或收藏行为中的一个。
9.根据权利要求1所述的方法,其中,所述识别模块采用适用于稀疏矩阵环境的算法来对商品的不良概率进行求解。
10.根据权利要求1所述的方法,其中,所述识别模块采用二项分布假设检验的方式来识别出不良商品。
11.一种基于用户购买行为识别不良商品的系统,所述系统包括用户筛选模块,所述筛选模块被配置成从客户交易系统中选取特定时间段内仅单次购物行为的用户集,并且基于全部客户购买的商品明细特征和所述用户集来构建用户商品购买关系矩阵;识别模块,所述识别模块被配置成基于所述用户商品购买关系矩阵来计算商品的不良概率以识别出不良商品,并且根据所识别出的不良商品来生成不良商品清单;以及推送模块,所述推送模块被配置成将所生成的不良商品清单推送到商品干预系统。
12.根据权利要求11所述的系统,其中,所述用户集包括第一用户子集,所述第一用户子集是在所述特定时间段中仅单次购物行为并且在所述特定时间段之前的先前特定时间段内没有购物行为的用户子集。
13.根据权利要求12所述的系统,进一步包括标记模块,所述标记模块被配置成在所述用户筛选模块构建所述用户商品购买关系矩阵之前,基于所述第一用户子集来对所述第一用户子集在所述特定时间段之后的未来特定时间段内是否发生了特定行为进行标记以生成相应用户的行为数据。
14.根据权利要求12所述的系统,其中,所述第一用户子集包括第二用户子集,所述第二用户子集是在所述特定时间段中仅单次购物行为、在所述特定时间段之前的先前特定时间段内没有购物行为并且在所述特定时间段之后的未来特定时间段没有发生特定行为的用户子集。
15.根据权利要求12所述的系统,其中,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第一用户子集被构建。
16.根据权利要求14所述的系统,其中,所述用户商品购买关系矩阵基于全部客户购买的商品明细特征和所述第二用户子集被构建。
17.根据权利要求13或14所述的系统,其中,商品的不良概率的计算还基于所述行为数据。
18.根据权利要求13或14所述的系统,其中,所述特定行为是购物行为、登录行为或收藏行为中的一个。
19.根据权利要求11所述的系统,其中,所述识别模块采用适用于稀疏矩阵环境的算法来对商品的不良概率进行求解。
20.根据权利要求11所述的系统,其中,所述识别模块采用二项分布假设检验的方式来识别出不良商品。
全文摘要
本发明提供一种基于用户购买行为来识别不良商品的方法和系统。所述方法包括由用户筛选模块从客户交易系统中选取特定时间段内仅单次购物行为的用户集;由所述用户筛选模块基于全部客户购买的商品明细特征和所述用户集来构建用户商品购买关系矩阵;由识别模块基于所述用户商品购买关系矩阵来计算商品的不良概率以识别出不良商品;由所述识别模块根据所识别出的不良商品来生成不良商品清单;以及由推送模块将所生成的不良商品清单提供给商品干预系统。
文档编号G06Q30/06GK103020855SQ20121053212
公开日2013年4月3日 申请日期2012年12月11日 优先权日2012年12月11日
发明者刘思喆, 贺志 申请人:北京京东世纪贸易有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1