一种对对象进行排序的方法及装置的制造方法_4

文档序号:9235418阅读:来源:国知局
欧美,纯棉,骼潑}
[0149] 根据W上行为序列,W关键词、关键词出现标识序列和关键词所对应的行为类型 的组合作为特征,可W得到如下特征F1至F10 :
[0150]F1:甜美 #11100# 点击
[0151]F2:欧美 #10011# 点击
[0152]F3:纯棉 #10101# 点击
[0巧3] F4:卡通#11000#点击
[0154]F5:欧洲站 #10010# 点击
[0155]F6:骼潑 #00111# 点击
[0156]F7:蝴蝶结 #01000# 点击
[0157]F8:韩版 #01# 收藏
[015引 F9:欧美#10#收藏
[0159]F10:长款 #11# 收藏
[0160] 假设特征标签分类目标;Sl=甜美风格,S2=欧美风格,将上述特征作为特征,通过 使用预先建立的用户当前偏好预测模型,可W得出如下矩阵B,该矩阵显示了每一条特征属 于各特征标签的概率:
[0161]矩阵B:
[0162]
[0163] 之后,可W使用最大赌概率预测公式计算各个特征标签的分数,并且取得分最高 的特征标签作为用户当前偏好的对象的特征标签。
[0164] 最大赌概率预测公式为:
[01 巧]scorej=e-EfiMij(公式 2)
[0166]在公式2中,fi为特征集合{fl,f3,......,fk}中的特征(i=l~k),Mij=第i个 特征在第j个目标上的权重。
[0167] 本例中,预测当前点击S1甜美风格的对象的概率为:
[016引P(SI) =2. 7'(0. 2-0. 5+0. 05+0. 01-0. 2-0. 7+1. 0+0. 01-0. 6+0. 01) =0. 49
[0169] 预测当前点击S2欧美风格的对象的概率为:
[0170] P(S2) =2. 7'(-0. 7+0. 5+0. 0化0. 01+0. 6+1. 0-0. 9-0. 1+0. 5+0. 01) =2. 54
[0171] 因此,可预测(确定)出用户当前偏好的对象的特征为欧美风格。
[0172] 在步骤306,根据确定的用户当前偏好,判断待排序对象是否具有用户当前偏好的 特征。
[0173]当待排序对象具有用户当前偏好的特征时,执行步307,提升待排序对象的排序。
[0174] 当待排序对象不具有用户当前偏好的特征时,执行步骤308,不提升待排序对象的 排序。
[0175] 根据本申请的一个实施例,与用户当前偏好相关的排序因子可W通过线性加权的 方式与其他排序因子共同作用,从而决定待排序对象最终的排序结果。
[0176] 至此,描述了根据本申请更详细实施例的对对象进行排序的方法300的流程图。 与方法100相比,该方法300提供了线上实时预测风格类型的详细步骤,该方法300同样 可W准确地对用户当前偏好的对象的特征进行确定,并用该特征来指导用户行为结果的排 序,向用户提供更个性化的对象排序结果。
[0177] 图4是根据本申请一个实施例的对对象进行排序的装置的框图。
[0178] 如图4所示,装置400可W包括;获取模块401,获取用户的近期行为涉及的关 键词、关键词出现标识序列和关键词所对应的行为类型;确定模块402,用于根据所述关 键词、关键词出现标识序列和关键词所对应的行为类型,使用预先建立的用户当前偏好预 测模型,确定用户当前偏好的对象的特征;W及调整模块403,用于根据确定的用户当前偏 好,调整与所述用户当前偏好相关的待排序对象的排序因子,W影响待排序对象的排序。
[0179] 根据本申请的一个实施例,所述用户当前偏好预测模型可W通过W下模块建立: 标注模块,用于标注对象的特征标签;W及建立模块,用于根据过去某一时间段内的用户历 史行为获取关键词、关键词出现标识序列、关键词所对应的行为类型,进行机器学习的模型 训练,建立用户当前偏好预测模型。
[0180] 根据本申请的一个实施例,所述确定模块402可W包括;建立子模块,用于根据过 去某一时间段内的用户历史行为涉及的关键词建立用户-关键词矩阵;第一计算子模块, 用于根据所述用户-关键词矩阵,通过对关键词进行聚类形成一个或多个聚类,每一聚类 对应一种主题,计算每一关键词属于各主题的概率;获得子模块,用于获取每一关键词及其 出现频率,W得到对象的关键词向量;第二计算子模块,用于根据每一个对象涉及的各关键 词属于各主题的概率和该关键词出现频率,计算所述对象涉及的关键词向量与各主题对应 聚类中的关键词向量的相似度;W及取值子模块,用于取相似度最大值所对应的主题作为 所述对象的特征标签。
[0181] 根据本申请的一个实施例,所述建立模块可W包括(未示出);选取子模块,用于从 过去某一时间段内的用户历史行为中,根据预定行为次数选取样本;提取子模块,用于从提 取的每一条样本中获取关键词、关键词的出现标识序列和关键词所对应的行为类型;W及 训练子模块,用于W上述关键词、关键词的出现标识序列和关键词所对应的行为类型的组 合作为样本特征,W与样本特征相对应的对象的特征作为目标,进行机器学习模型的训练, W得到用户当前偏好预测模型。
[0182] 根据本申请的一个实施例,所述获取模块401可W包括:获取子模块,用于从所述 近期行为中获取关键词、关键词所对应的行为类型;W及得到子模块,用于按照关键词在所 述近期行为中的每个行为是否出现,得到关键词的出现标识序列。
[0183] 根据本申请的一个实施例,所述确定模块402可W包括;使用子模块,用于W所述 关键词、关键词出现标识序列和关键词所对应的行为类型的组合作为特征,W用户当前偏 好的对象的特征作为目标,使用预先建立的用户当前偏好预测模型,得到各特征属于各对 象的特征的概率;第H计算子模块,用于根据各特征属于各对象的特征的概率计算用户当 前偏好的对象的特征属于各特征标签的概率;W及标签确定子模块,用于取概率最大值所 对应的特征标签作为用户当前偏好的对象的特征标签。
[0184] 根据本申请的一个实施例,所述调整模块403可W包括;判断模块,用于根据确定 的用户当前偏好,判断待排序对象是否具有用户当前偏好的特征;第一处理模块,用于当待 排序对象具有用户当前偏好的特征时,提升所述待排序对象排序;W及第二处理模块,用于 当待排序对象不具有用户当前偏好的特征时,不提升所述待排序对象的排序。
[0185] 由于本实施例的装置所实现的功能基本相应于前述图1至图3所示的方法实施 例,故本实施例的描述中未详尽之处,可W参见前述实施例中的相关说明,在此不做费述。
[0186] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、 网络接口和内存。
[0187] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/ 或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质 的示例。
[018引计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可W由任何方法 或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模块或其他数据。 计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、 动态随机存取存储器值RAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电 可擦除可编程只读存储器巧EPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁 性存储设备或任何其他非传输介质,可用于存储可W被计算设备访问的信息。按照本文中 的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信 号和载波。
[0189] 还需要说明的是,术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的 包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包 括没有明确列出的其他要素,或者是还包括为该种过程、方法、商品或者设备所固有的要 素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1