一种向目标用户推荐商品的方法和系统的制作方法_2

文档序号：9826544阅读：来源：国知局

商品类别集合。聚类的输出包括用户数据聚类中心集合Cen和各个聚类类别的用户类别集合Uset= {Uu U2, U3，…，UK}。每次聚类过程可以根据具体情况采用不同数值的k。
[0032] 可以选取损失值最小的聚类作为最后聚类结果。损失值L的计算过程如下：
其中，Uall表示所有训练数据中的用户集合，u i表示第i位用户的行为数据，Cent (u J 表示用户1^所属的聚类类别，dis〇函数表示两者的距离，k为聚类个数参数，λ为预设的权重参数。
[0033] 如上所述，在步骤102中，计算商品对于第一批用户的区分度。这里，商品X的区分度In⑴可以根据用户类别的可预测性H(U)、根据第一批用户的反馈计算的用户类别的可预测性H (U | X)、商品的流行度来计算Pop (X)。
[0034] 信息熵H(U)表示用户类别的可预测性，可以通过以下过程计算：
其中，Ρ(ιυ是用户属于类别A的先验概率，该值可以是训练数据中的用户属于类别h 比例。如果H(U)数值低，表示用户类别的可预测性强，反之亦然。
[0035] 信息熵H(U|X)表示获得用户对商品X的反馈以后，用户类别的可预测性，可以通过以下过程计算：
其中，\表示用户对商品X的第j个反馈结果。商品的反馈动作可以包括"已浏览"和 "未浏览"两种动作。H(U|X=X])表示在对商品X的反馈行为为X]的情况下的用户类别的信息熵，计算方式如上所示。其中，计算Η (υ」Χ=χ_ρ等于在符合X=x_j情况下，训练数据中的用户属于类别1^的比例。p(X=Xl)是用户对商品X的反馈结果为 Xl的先验概率，该值可以通过计算训练数据中用户对商品X的反馈结果为^的比例来获取。
[0036] 由此，商品X的区分度In(X)可以通过以下过程计算：
其中，Pop(X)表示商品X的流行度，可以通过计算该商品被购买的次数或者其页面被浏览的次数来计算，α为预设值的参数。Ιη(Χ)数值越高，表示商品对用户的区分度越强，反之亦然。
[0037] 如上所述，在步骤103中，将区分度高的商品推荐给目标用户。可以根据Ιη(Χ)指数，对商品降序排序，并且取出指数最高的商品，作为初次推荐商品，传送至目标用户的UI 页面。
[0038] 在本发明的一个或多个实施例中，向目标用户推荐商品的方法还可以包括：步骤201 :从目标用户获取反馈，并且根据该反馈向目标用户推荐商品，其中，将与该反馈一致的第一批用户中的第二批用户的浏览日志作为训练数据，分析第二批用户的浏览日志，并对第二批用户进行聚类，得到多个用户类别。
[0039] 步骤202:计算商品对于第二批用户的区分度，并将区分度高的商品推荐给目标用户。
[0040] 可以从目标用户的UI页面收集反馈结果，即目标用户看到推荐商品后做出的反馈(例如点击、无操作等)。在获取该目标用户对商品的反馈后，可以在原始训练数据(第一批用户中的浏览日志)中，查找符合该反馈的第二批用户的浏览日志作为新的训练数据。可以如上所述，基于新的训练数据来向目标用户推荐商品。
[0041] 在本发明的一个或多个实施例中，向目标用户推荐商品的方法还可以包括：步骤301 :从目标用户获取反馈，并且根据该反馈查找与目标用户相似度高的用户。相似度计算方法可以是目标用户和训练数据中的用户对于相同商品反馈结果的比例。
[0042] 步骤302:根据所述与目标用户相似度高的用户的用户类别判断目标用户的用户类别。
[0043] 步骤303 :根据确定的目标用户的用户类别来向目标用户推荐商品。例如，将该用户类别的所有用户的购买比例最高的商品推荐给目标用户。
[0044] 图2是根据本发明实施例的一种反馈交互式的商品推荐引导方法示意图。如图所示，一种反馈交互式的商品推荐引导方法，包括步骤A、分析历史用户行为信息形成多个用户类别，步骤B、挑选出区分性强的商品推荐给新用户，步骤C、收集新用户对该推荐商品的反馈信息，引导下一轮商品推荐，其中，步骤A包括： al、从用户行为数据库中，抽取部分用户行为数据作为训练数据， a2、对训练数据进行聚类，形成多个用户类别；步骤B包括： bl、分析各个商品对所述多个用户类别的区分度， b2、计算商品的区分度指数In(X)， b3、将区分度指数高的商品传送至页面UI进行显示；步骤C包括： cl、通过页面UI收集新用户反馈， c2、分析新用户反馈，再次计算符合反馈结果情况下的商品的区分度指数， c3、将区分度指数最高的商品传送至页面UI，收集新用户对该推荐商品的反馈信息。
[0045] 图3是根据本发明实施例的一种反馈交互式的商品推荐引导的总体流程示意图。如图3所示， 1)系统从用户行为数据库中，抽取部分用户行为数据作为训练数据(见方框1)。
[0046] 2)对用户数据进行聚类，形成多个用户类别，将聚类结果传送至商品分析模块(见方框2)。
[0047] 3)商品分析模块分析各个商品对预测用户类别的区分度和重要程度，计算商品的区分度指数In(X)，将区分度指数高的商品传送至页面UI (见方框3. 1 )。
[0048] 4)页面UI显示推荐商品，收集用户反馈。反馈的方式很多，例如，点击链接、置之不理、或者点击叉图标表示不感兴趣等。最后将反馈结果传回商品分析模块(见方框3. 2、 3. 3 和 3. 4)。
[0049] 5)商品分析模块分析收到用户的反馈结果，再次计算符合反馈结果情况下剩余商品的区分度指数(见方框4)，将区分度指数最高的商品传送至页面UI，征询用户意见。
[0050] 6)在持续了多轮用户交互反馈以后，用户分析模块收集用户的商品反馈信息，加以分析。将分析结果(包括用户人群类别、以及类似用户行为记录等）存储至数据库中。
[0051] 在一个实施例中，对训练数据进行聚类，形成多个用户类别的过程如下：从用户行为数据库中，获取用户历史浏览日志作为训练数据。根据用户历史浏览日志，对用户进行聚类。该阶段的具体步骤可以包括： 1)获取用户历史浏览日志。日志的字段包括：IP地址、URL地址、时间和用户ID。然后，合并相同IP地址值的记录，并过滤距离当前时间超过时间段T的历史浏览日志。参数变量Τ可以预先设置，Τ越小，则过滤的历史浏览日志距离当前时间越近，符合条件的记录数量越是少。
[0052] 2)将浏览的商品页URL转换为对应商品的类别，例如家电、服装等。
[0053] 3)建立用户-商品类别的倒排表，表中前项为ID用户ID，后项为浏览商品类别的有序列表。例如，用户u的浏览商品类别列表N(u)为{a，b，b，…}。
[0054] 4)计数倒排表列表中各个成员（商品类别)个数，并作余弦归一化，使数据映射到0 至1的范围内。例如，N(u) = {a, b, b, c}，首先为各个单独的成员计数，得到{a=l, b=2, c=l}，然后，进行归一化得到
[0055] 5)建立用户矩阵C。其中矩阵C中成员C[u][v] = |N(u) · N(v) |，C[u][v]表示用户 u和v (即ID为u和v的用户)所浏览页面集合之间的类别相似度，C[u] [v]值域为0至1。 C[u][v]越大，表示用户u和v浏览相同类别的页面越多。如果C[u][v]等于0,表示N(u) 和N(v)在向量空间内垂直，即用户u和v没有浏览过同一类别的商品。如果C[u][v]等于 1，表示用户u和v浏览商品类别完全相同。
[0056] 6)对用户采用K-Means方法进行多次聚类，用户之间的相似度为用户矩阵C中对应成员的数值。K-Means的参数包括聚类的个数K，输入包括用户的浏览商品类别集合，输出包括用户数据聚

完整全部详细技术资料下载

当前第2页1 2 3