一种对对象进行排序的方法及装置的制造方法_2

文档序号：9235418阅读：来源：国知局

为关键词的出现标识序列。所述出现标识序列可W通过数字序列的方式表示。所述出现标识序列包括一个或多个标识位，每一标识位分别与用户的每个行为对应，每一标识位分别用于标识该关键词在对应的一次行为涉及的对象中是否出现。
[0034] 例如，按照上述每个关键词(去重后）在每次点击行为涉及的对象中是否出现，女口出现，则在该关键词的出现标识序列中对应该次点击行为的标识位W数字"1"进行标识，女口未出现，则在该关键词的出现标识序列中对应该次点击行为的标识位W数字"0"进行标识。该样，可W得到上述各关键词的出现标识序列：
[00巧]甜美；"11100"
[0036]欧美；"10011"
[0037]纯棉；"10101"
[0038]卡通；"11000"
[0039]欧洲站；"10010"
[0040]骼潑；"00111"
[00川蝴蝶结；"01000"
[0042] 在步骤102,根据所述关键词、关键词出现标识序列和关键词所对应的行为类型，使用预先建立的与用户行为涉及的对象特征有关的用户当前偏好预测模型，确定用户当前偏好的对象的特征。
[0043]具体来说，对用户行为涉及的对象的特征可W是预先设定的该对象在某一属性上的标签。例如，在对商品对象进行特征描述时，可W使用风格类型来表示该商品对象的一种抽象特征。该里的风格类型是代表对象特色的一种抽象性描述，如电子商务平台中的女装下的欧美风格、日韩风格等，家居类目中的欧式风格、田园风格等。可W将通过根据用户历史日志获取的用户历史行为涉及的关键词、与关键词对应的行为类型和关键词出现标识序列等参数组合作为特征，将用户历史行为所针对涉及的对象的特征作为目标，建立与用户行为涉及的对象特征有关的用户当前偏好预测模型，如利用最大赌分类模型训练得到的概率模型。所述用户当前偏好预测模型在用户使用的关键词、关键词在最近行为中的出现标识序列和关键词所对应的行为类型等关键词特征与用户行为涉及的对象的特征之间建立关联关系。
[0044] 根据用户近期使用的关键词的特征，使用所述用户当前偏好预测模型可W得到用户当前的偏好。
[0045] 在步骤103,根据确定的用户当前偏好，调整与用户当前偏好相关的待排序对象的排序因子，W影响待排序对象的排序。
[0046]具体来说，在得到用户当前的偏好的特征后，可W对用户当前偏好的特征与待排序对象的特征分别进行相似性或相关性判断，根据判断结果，对待排序对象的与用户当前偏好的特征相关的排序因子进行调整，从而影响待排序对象的排序。
[0047] 根据本申请的一个实施例，可W将具有用户当前偏好的特征的待排序对象的排序进行提升。
[0048] 至此，描述了根据本申请一个实施例的对对象进行排序的方法100的流程图。本实施例的方法100通过结合用户在当前时间点之前的近期行为的特征数据来确定用户当前偏好的特征，并且根据确定的用户当前的偏好来调整与该当前偏好相关的待排序对象的排序因子。与现有技术相比，本申请实施例可W更准确地对用户当前的偏好进行预判，并用用户当前的偏好来指导用户当前行为对应的搜索结果的排序，向用户提供更个性化、人性化的对象排序结果。
[0049] 此外，步骤102中所使用的用户当前偏好预测模型可W预先设定，也可W通过机器学习模型的训练得到。
[0050] 根据本申请的一个实施例，所述的用户当前偏好预测模型通过W下步骤建立；获取数据库中的用户历史行为涉及的对象的特征；W及根据预设的一段时间内的用户历史行为获取关键词、关键词出现标识序列、关键词所对应的行为类型和对象的风格类型，进行机器学习的模型训练，建立用户当前偏好的偏好预测模型。
[0051] 用户当前偏好预测模型的建立过程将在下文中详细描述。
[0052] 图2是根据本申请实施例的建立用户当前偏好预测模型的方法200的流程图。如图2所示，方法200开始于步骤201。
[0053] 首先，在步骤201，根据过去某一时间段内的用户历史行为涉及的关键词建立用户-关键词矩阵。
[0054] 具体而言，通过用户日志文件可W获取过去一段时间内的用户的历史行为记录，根据该时间段内的历史行为记录中每个行为所涉及的对象包含的关键词或风格标签，可W形成用户-关键词矩阵。
[00巧]例如，在电子商务平台，通过用户历史日志获取从当前时间到过去一个月内的行为记录，W此挖掘用户-关键词的点击行为，形成用户-关键词的矩阵A，如下所示：
[0056]矩阵A:
[0057]
[0058]由矩阵A可知，从当前到当前一个月内，共有3个用户发生点击行为，共涉及到4 个关键词，W11代表用户1点击关键词1的次数，W12代表用户1点击关键词2的次数，W此类推。该样，就建立了用户-关键词的矩阵A。
[0059] 通过该种方法，可W建立过去任一时间段内的用户-关键词矩阵。
[0060] 然后，进入步骤202,根据用户-关键词矩阵，通过对关键词进行聚类形成一个或多个聚类，每一聚类对应一种主题，计算每一关键词属于各主题的概率。
[0061] 在该个步骤中，可W通过化SA(概率潜语义分析）方法对步骤201获取的关键词进行聚类，也就是说，把用户和关键词都映射到一个隐含的主题空间上，该隐含的主题空间就是风格，从而可W得到每个关键词属于各个主题的概率矩阵。
[0062] 例如，在电子商务平台，W商品的风格类型作为所述的主题。W存在两个风格类型为例，通过化SA方法可W通过用户-关键词矩阵得到如下的每个关键词属于各个风格类型 (即主题）的概率矩阵：
[0063]风格1:
[0064]抹胸 0. 200316
[0065]裹胸 0. 118473
[0066]挂脖 0. 109674
[0067]抹胸裙 0. 0668498
[0068]吊带 0. 0580471
[0069]露背 0. 0502866
[0070]交叉 0. 04443:34
[0071]派对 0.03258：34
[0072] 吊带裙 0. 032397
[0073]裹胸裙 0. 0302184
[0074]风格 2:
[00 巧]森女 0. 128117
[0076] 文艺 0. 0967896
[0077] 森林 0. 0865181
[0078] 森林系 0. 0780099
[0079] 棉麻 0. 0725525
[0080]日系 0.0412643
[0081]森系 0. 0333173
[0082]文艺范 0. 0331822
[0083]碎花 0. 0215523
[0084] 在步骤203,获取每一关键词及其出现频率，W得到对象的关键词向量。
[0085] 在该个步骤中，首先，可W通过各对象的标题和属性等抽取关键词，由获取的关键词和其出现的频率形成该对象关键词向量。
[0086] 在步骤204,根据每一个对象涉及的各关键词属于各主题的概率和该关键词出现频率，计算该对象涉及的关键词向量与各主题对应聚类中的关键词向量的相似度。
[0087] 下面，对步骤203至204举例说明。
[0088] 例如，在电子商务平台，假设某商品标题和属性的关键词向量A=[吊带裙：1，文艺：1，森林：1，森女：1]，风格1、风格2的关键词向量B1，B2如上例中风格1和风格2所示，则二者的相似度可W使用公式（1)计算：
[0089]
[0090] 通过公式（1 )，可W得出该商品的关键词与风格1的关键词的相似度 similarity (A, B1)和该商品的关键词与风格2的关键词的相似度similarity (A, B2)。
[0091] 之后，在步骤205,取相似度最大值所对应的主题作为该对象的特征标签。
[0092] 通过使用步骤201至205的方法，可W得到数据库中涉及的所有对象的特征标签。
[0093] 至此，完成了线下对对象的风格类型的挖掘，即，确定了每一个对象的特征标签。

完整全部详细技术资料下载

当前第2页1 2 3 4 5