一种对对象进行排序的方法及装置的制造方法_3

文档序号:9235418阅读:来源:国知局
[0094] 在步骤206,从过去某一时间段内的用户历史行为中,根据预定行为次数选取样 本。具体来说,可W将过去某一时间段内的用户历史行为中的行为序列作为样本数据,按照 预定行为次数选取样本。具体来说,可W按照每次取一定数量行为次数的规则进行样本提 取。例如,在电子商务平台,选取过去某一时间点之前的48小时内的行为序列,从中选取样 本特征。具体来说,例如,提取特征的窗口可W从该时间段内的第一个行为开始,每一次提 取8次行为作为一条训练样本,从其中前7次行为中抽取特征,把第8次行为所涉及的对象 的特征作为训练目标。对本次行为序列的特征提取完成后,窗口向后滑动一位(行为),继续 提取下一条样本,直到提取完所有样本。
[0095] 之后,在步骤207,从提取的每一条样本中获取关键词、关键词的出现标识序列和 关键词所对应的行为类型。
[0096] 例如,每次提取8个行为作为一条训练样本,在每一条样本中,从前7次行为中提 取关键词、关键词的出现标识序列和关键词所对应的行为类型,将第8次行为所涉及的对 象的特征(风格偏好)作为目标。在该里,行为类型是在用户行为历史日志中用户对所涉及 的对象的行为方式类型,例如,点击、搜索等。
[0097] 下面,举例说明特征提取的方法。
[0098] 例如,在电子商务平台,在过去某一时间点之前的48小时内进行样本选取,假设 每一次选取8个行为作为一条样本。如在选取的一条样本中,用户发生了 8次行为,其中前 7次行为的关键词分别为:
[0099] 第一次点击的对象包含的关键词;{甜美,欧美,纯棉,卡通,欧洲站}
[0100] 第二次收藏的对象包含的关键词;{欧美,长款}
[0101] 第H次点击的对象包含的关键词;{甜美,卡通,蝴蝶结}
[0102] 第四次点击的对象包含的关键词;{甜美,纯棉,骼潑}
[0103] 第五次点击的对象包含的关键词;{欧美,欧洲站,骼潑}
[0104] 第六次收藏的对象包含的关键词;{韩版,长款}
[0105] 第走次点击的对象包含的关键词;{欧美,纯棉,骼潑}
[0106] 其中,可得到点击的对象包含的关键词如下:
[0107] 第一次点击的对象包含的关键词;{甜美,欧美,纯棉,卡通,欧洲站}
[010引第H次点击的对象包含的关键词;{甜美,卡通,蝴蝶结}
[0109] 第四次点击的对象包含的关键词;{甜美,纯棉,骼潑}
[0110] 第五次点击的对象包含的关键词;{欧美,欧洲站,骼潑}
[0111] 第走次点击的对象包含的关键词:{欧美,纯棉,骼潑}
[0112] 例如,按照上述每个关键词(去重后)在每次点击行为涉及的对象中是否出现,女口 出现,则在该关键词的出现标识序列中对应该次点击行为的标识位W数字"1"进行标识,女口 未出现,则在该关键词的出现标识序列中对应该次点击行为的标识位W数字"0"进行标识。 该样,可W得到上述各关键词的出现标识序列:
[011引 甜美;"11100"
[0114] 欧美;"10011"
[0115] 纯棉;"10101"
[0116] 卡通;"11000"
[0117] 欧洲站;"10010"
[011引骼潑;"00111"
[0119] 蝴蝶结;"01000"
[0120] 同理可得收藏的对象包含的关键词如下:
[0121] 第二次收藏的对象包含的关键词;{欧美,长款}
[0122] 第六次收藏的对象包含的关键词;{韩版,长款}
[0123] 按照上述每个关键词(去重后)在每次点击行为涉及的对象中是否出现,如出现, 则在该关键词的出现标识序列中对应该次点击行为的标识位W数字"1"进行标识,如未出 现,则在该关键词的出现标识序列中对应该次点击行为的标识位W数字"0"进行标识。该 样,可W得到上述收藏对象的各关键词的出现标识序列:
[0124] 欧美;"10"
[0125] 长款;"11"
[0126] 韩版;"01"
[0127] 在步骤208,W上述关键词、关键词的出现标识序列和关键词所对应的行为类型 的组合作为样本特征,W与样本特征相对应的对象的特征作为目标,进行机器学习模型的 训练,例如,利用最大赌分类模型进行机器学习模型的训练,可W得到用户当前偏好预测模 型。
[0128] 每个关键词本身、该关键词的出现标识序列、W及该关键词所对应的行为类型组 合后作为模型训练样本的一个特征。例如,在上例中,关键词"骼潑"的出现标识序列为 "00111",则"骼潑#00111#点击"作为该样本的一个特征,"韩版#01#收藏"作为一个样本 特征。W与上述7个行为相对应的下一个行为的对象的特征(风格类型)为目标。通过该种 方法可W学习出不同的行为类型对后序偏好风格的影响。
[0129] 在行为序列样本中依次选取样本特征,直到窗口移动到最后一个行为,该样,可得 到特征集合为{f1,f2,f3,……,化},与样本特征相对应的对象的特征作为目标,可得到目 标集合为{si,s2,s3,......,sm}。
[0130] 根据本申请的一个实施例,可W将关键词本身、该关键词的出现标识序列和该关 键词所对应的行为类型的组合作为样本特征,将样本特征所对应的对象的特征作为目标, 训练最大赌分类模型。
[0131] 假设特征集合为{f1,f2,f3,……,化},目标集合为{sl,s2,s3,……,sm},则模型 可得到每个特征在各个目标上的权重。设模型为矩阵M,则Mi j=第i个特征在第j个目标 上的权重。
[0132] 至此,完成了模型训练的过程。该模型训练的过程通过线下用户行为记录模拟线 上用户行为操作,W关键词、关键词出现标识序列、关键词所对应的行为类型等组合作为样 本特征,将样本特征所对应的对象的特征作为目标,通过模型训练,获取各特征权重。
[0133] 图3是根据本申请的更详细实施例的对对象进行排序的方法300的流程图。方法 300开始于步骤301。
[0134] 首先,在步骤301,从近期行为中获取关键词、关键词所对应的行为类型。
[0135]用户在当前时间点之前的预设次数的行为为近期行为。可W从实时日志中获取该 些行为的行为记录,从中抽取关键词和关键词对应的行为类型作为特征,特征的提取方法 与训练用户当前偏好模型时提取特征的方法类似。具体来说,将训练用户当前偏好预测模 型时,每一条训练样本的特征提取的行为次数作为实时在线预测用户当前偏好时需要选取 的当前时间点之前的行为次数。例如,选取当前时间点之前该用户的走次行为的行为序列, 从中提取关键词、关键词所对应的行为类型,作为特征。
[0136] 然后,在步骤302,按照关键词在近期行为的每个行为中是否出现,得到关键词的 出现标识序列。对本步骤的描述与步骤206类似,在此不再费述。
[0137] 之后,在步骤303,W关键词、关键词出现标识序列和关键词所对应的行为类型的 组合作为特征,W当前偏好的对象的特征作为目标,使用用户当前偏好预测模型,得到各特 征属于各对象的特征的概率。
[013引在步骤304,根据各特征属于各对象的特征的概率计算用户当前偏好的对象属于 各特征标签的概率。
[0139] 在步骤305,取概率最大值所对应的特征标签作为用户当前偏好的对象的特征标 签。
[0140] 下面,对步骤301至305举例说明。
[0141] 例如,在电子商务平台,通过在线实时日志分析系统得到用户的实时行为,假设选 取用户在当前时间点之前的7次行为中的关键词分别为:
[0142] 第一次点击的对象包含的关键词;{甜美,欧美,纯棉,卡通,欧洲站}
[0143] 第二次收藏的对象包含的关键词;{欧美,长款}
[0144] 第H次点击的对象包含的关键词;{甜美,卡通,蝴蝶结}
[0145] 第四次点击的对象包含的关键词;{甜美,纯棉,骼潑}
[0146] 第五次点击的对象包含的关键词;{欧美,欧洲站,骼潑}
[0147] 第六次收藏的对象包含的关键词;{韩版,长款}
[0148] 第走次点击的对象包含的关键词;{
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1