处理用户行为数据的方法和装置的制造方法

文档序号:8282342阅读:473来源:国知局
处理用户行为数据的方法和装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,特别地涉及一种处理用户行为数据的方法和装置。
【背景技术】
[0002]在电子商务平台中,采销人员常常要对商品的需求进行量化,从而确定商品的库存和补货策略。商品需求的量化通常是计算商品的需求用户量。目前的一种方式是采用商品的下单用户量近似替代商品需求量。在该方式中,根据商品标识来统计该商品在一个时段例如一周的下单量,以该下单量作为该商品每周的需求量。这种方式没有考虑未下单用户的需求,容易导致需求量预测的数据偏小。
[0003]目前采用的另一种方式是考虑用户的浏览量,对于指定的商品,统计在一个历史时段例如一周的下单量,另外还统计对该商品的浏览量达到预设值的用户数量,将该用户数量加上该下单量,作为该商品的需求量。这种方式仍不够准确,因为在用户浏览某个商品时,如发现该商品显示为无库存,则不再浏览,导致浏览量达不到上述的预设值,使需求量的统计仍偏小。
[0004]因此需要一种方法来确定用户对商品的需求,以此为基础可以确定该商品的需求量。

【发明内容】

[0005]有鉴于此,本发明提供一种处理用户行为数据的方法和装置,有助于判断未下单用户是否存在需求,以此为基础可以确定商品需求量。
[0006]为实现上述目的,根据本发明的一个方面,提供了一种处理用户行为数据的方法。
[0007]本发明的处理用户行为数据的方法包括:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量,并且记录各用户在所述预选时间段之后是否购买了该商品;根据所述多个用户的数据建立训练集,在该训练集对应的模型中,输入量为用户对所述指定商品的行为的数量,输出量为该用户是否购买该指定商品;对所述训练集进行线性回归训练以确定所述训练集的多个参数,从而得到所述模型;统计目标未下单用户在预设时间段内的行为的数量,将该数量作为输入量输入到所述模型中,得出所述模型的输出量。
[0008]可选地,所述模型为如下等式:Y= βο+βΑ+β^+^ + βΛ+ε ;其中Y的取值对应于用户是否购买商品,ε表示预设常数,β P β P......β η表示权重系数,对于X 1、X2、…
Xn,当自然数下标η的值对应于所述用户对商品的行为的次数时,Xn取第一预设值,否则取第二预设值。
[0009]可选地,所述线性回归训练采用梯度下降法。
[0010]可选地,在得到所述模型之后,还包括:统计多个目标用户在预设时间段内的行为的数量,将这些数量分别作为输入量输入到所述模型中,得出所述模型的多个输出量;根据所述多个输出量确定所述多个目标用户中购买所述指定商品的用户的数量。
[0011]根据本发明的另一方面,提供了一种处理用户行为数据的装置。
[0012]本发明的处理用户行为数据的装置包括:统计模块,用于对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量;记录模块,用于记录所述各用户在所述预选时间段之后是否购买了所述指定商品;训练模块,用于对训练集进行线性回归训练以确定所述训练集的多个参数,从而得到该训练集对应的模型;该训练集是根据所述多个用户的数据建立,在所述模型中,输入量为用户对商品的行为的数量,输出量为该用户是否购买所述指定商品;计算模块,用于统计目标用户在预设时间段内的行为的数量,将该数量作为输入量输入到所述模型中,得出所述模型的输出量。
[0013]可选地,所述模型为如下等式:Y= βο+βΑ+β^+^ + βΛ+ε ;其中Y的取值对应于用户是否购买所述指定商品,ε表示预设常数,β0, ……βη表示权重系数,对于X1, \、…Xn,当自然数下标η的值对应于所述用户对该商品的行为的次数时,乂?取第一预设值,否则取第二预设值。
[0014]可选地,所述线性回归训练采用梯度下降法。
[0015]可选地,所述计算模块还用于:统计多个目标未下单用户在预设时间段内对所述指定商品的行为的数量,将这些数量分别作为输入量输入到所述模型中,得出所述模型的多个输出量;根据所述多个输出量确定所述多个目标用户中购买所述指定商品的用户的数量。
[0016]根据本发明的技术方案,采用历史数据进行模型训练得到模型,再用该模型来预测未下单用户是否在后期下单,在训练集比较大的情况下能够收到相当准确的预测效果,有助于准确确定商品的需求量。
【附图说明】
[0017]附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
[0018]图1是根据本发明实施例的处理用户行为数据的方法的主要步骤的示意图;
[0019]图2是根据本发明实施例的处理用户行为数据的装置的主要模块的示意图。
【具体实施方式】
[0020]以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]在本发明实施例中,对于用户的针对商品的行为进行建模来预测用户对于未下单但浏览的商品是否有需求。以下结合图1进行说明。图1是根据本发明实施例的处理用户行为数据的方法的主要步骤的示意图。
[0022]步骤Sll:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量。上述用户对商品的行为可以是一种行为,例如对该商品的直接浏览;最好是综合统计用户的多种行为,例如直接浏览该商品、通过搜索弓I擎搜索该商品、通过搜索入口访问该商品等。
[0023]步骤S12:记录各用户在所述预选时间段之后是否购买了上述指定商品。上述两个步骤是数据准备阶段,根据历史数据得到训练集的数据。这里的预选时间段可以是一天、几天或者更长时间,根据实际情况选择。
[0024]步骤S13:建立训练集。训练集是根据上述步骤得到的数据而得出。训练集对应的模型的输出量表示用户是否购买上述指定的商品。例如设置输出量为O表示用户未下单,I表示已下单。当然也可以采用其他数值。该模型的输入量是用户对该商品的行为的数量。例如采用浏览量,则可以设置浏览量上限为300,如某一用户的浏览量为20,则对应于该用户的向量[X1, X2,…Xn]为[0,0,…1,...()],其中只有第20个元素的值为1,其他元素值为Oo这里第20个元素是根据浏览量为20确定。又如采用直接浏览该商品、通过搜索引擎搜索该商品、通过搜索入口访问该商品这三种行为,则可以分别设置三种行为的上限是300,将各行为对应的向量连接成维度为900的向量并设定其中不为O的元素的位置与行为数量一致,例如用户直接浏览量是10,搜索引擎搜索该商品5次,通过搜索入口访问该商品3次,则上述的维度为900的向量中只有第10、305、603个元素为1,其他元素为O。
[0025]训练集对应的模型可采用如下等式:Y=;其中Y为上述的输出量,其取值对应于用户是否购买商品,例如Y为O表示用户未下单,为I表示已下单。ε表示预设
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1