个性化趋势图像搜索建议的制作方法_4

文档序号:9769194阅读:来源:国知局
r>[0071 ] Uj = % + - u[qy)qy + ;!u,), 仍
[0072] qy = qj-+4-Wy(R,^-urq;)q; + ^q;), (8)
[0073] 其中a是学习率而A是归一化项。在训练阶段,对的部分被从训练数据分离 W形成验证集,其中当对于验证集中的C次连续迭代等式(3)不减小时宣布收敛。W下算法 概述了优化过程。
[0074]
[0075] 表格 I
[0076] 刚刚描述的TA-WRMF功能性是用于个性化趋势图像捜索查询310的一种方法。个性 化的趋势图像捜索查询随后可被呈现给所标识用户。更具体而言,他针对每个个性化趋势 图像捜索查询将图像呈现给该用户。在一些实现中,该查询的文本描述也可与该图像一起 呈现。选择(例如点击)该图像和/或伴随的文本将为该用户执行该捜索查询。
[0077] 在312,架构300可标识与个性化趋势图像捜索查询中的每一个相对应的一个或多 个图像。在314,那些图像中的每一个被选为代表性图像,例如,W作为趋势图像捜索查询的 代表呈现给用户,且在316构造该代表性图像的显示。
[0078] 在一些实施例中,候选图像可W是捜索引擎响应于查询返回的所有图像,可W是 从一个或多个社交图像收集挖掘的图像,或可来自某个其它图像源。代表性图像可基于某 种准则来选择,所述准则可与捜索查询有关(例如,点击的数量或最近期被点击)、与图像本 身有关(例如,上传日期、图像源或图像的视觉属性)、与用户与图像的交互有关(例如,喜欢 的数量或共享的数量)、或某种其它准则或准则组合。
[0079] 在一些实施例中,代表性图像可为其促进用户对个性化趋势图像捜索查询的趋势 性质的原因的能力而被选择。即,该代表性图像可因为其最好地讲述了它所代表的查询为 何正成为趋势的故事而被选择。尽管可使用任何数量的准则来选择该代表性图像,然而在 示例实现中,代表性图像314是基于图像的相关性、图像的新鲜度、图像的视觉一致性、W及 关于图像的点击信息而从所有候选图像中选择的。点击信息可包括点击计数、点击频率的 增加(在本文中称为图像的突发率或"突发性或其它。
[0080] 如此处使用的,假定相关性与和趋势捜索(qj)相关联的图像(IkEI)的点击计数 (CM)有关。在此构造下,CM越高,Ik越相关。从而,相关性&(4:,gf)由根据公式(9)给定 情况下Ik的可能性决定: (9)
[0082]图像的视觉一致性可通过假定具有更类似邻居的图像具有更高的被选择的机会 来确定。各实现可在尺度不变特征变换特征上应用视觉字袋(Bag-Of-Visual-Word)模型来 测量任一对图像(Ik, Ii)的相似性Sim化,1)。随机行走过程随后可被用来得出视觉一致性。 对于每个趋势捜索9:1,每个图像使得Cl, j〉0是节点nk且形成图像集如果Ii是Ik. 的K-最近邻居(K-NN,K = 5),则nk具有到ni的有向边。边权重ek, 1被定义为
>相应地,Ik的视觉一致性Pu(4,gp可根据等式(10)来公式化:
(10)
[0084] 其中E是由ei,调成的过渡矩阵且1是向量1。应当领会,最优值是具有最 大特征值的特征向量。
[0085] 在确定图像的突发性时,具有极具大量的增加的点击的图像被假定为更好地描述 捜索查询。在此实现中,每个趋势捜索听;的图像IkEI的突发性与(4, gp根据等式(11)来 公式化:
(1巧
[0087] 其中P(/fc|gf,c〇是在曰期d给定趋势捜索省的情况下图像Ik被点击的概率。
[0088] 还可考虑该图像的新鲜度。具体而言,更旧的图像极少是当前事件的最佳表示。最 常见地,与趋势捜索相关联的趋势图像将是在近期更新的,即,在该趋势的时间附近。新鲜 度可根据等式(12)来确定;
[0089] Pf(LJq), d) ^d- (12)
[0090] 其中趋势查询是在日期d检测到的趋势查询,而与趋势查询q相关联的图像Ik在时 间T(Ik)由图像捜索引擎来获取。
[0091] 在一些实现中,蜂(茄>皆),巧,托,与})和中的每一个可被 确定,且针对集合I中的每个图像计算复合得分或排名。在至少一个实现中,具有最高复合 得分或排名的图像是代表性图像。在一些实现中,不同图像可被选择为代表性图像。例如, 最高排名的图像可能不可用,例如因为其是权限受限的。本领域技术人员受益于本公开将 领会其它场景和修改。
[0092] 在316,架构300在客户端设备120上构造代表性图像的显示。在一个实现中,多个 个性化趋势图像捜索查询被标识,每个个性化趋势图像捜索查询的代表性图像被确定,且 那些代表性图像在用户打开web浏览器之际在阵列中显示给该用户。该查询的文本描述也 可与该图像一起被显示。因为该架构的目标是建议图像查询,所W图像的显示可在不存在 该用户的同期捜索查询的情况下进行。在一些实现中,用户仅需要访问浏览器W被呈现个 性化趋势图像捜索查询。在其它实现中,可向用户提示选择一链接或其它特征来指示代表 性图像的呈现。
[0093] 在示例实验中,在两周内收集图像捜索日志且日志中的每个条目包括5个元素,即 用户、查询、11化、时间和国籍。数据集包含2100万唯一用户、4100万唯一查询、W及6100万唯 一URL。仅美国的捜索日志被使用且控制被使用来减少目标是提升特定捜索的垃圾用户的 数量。(具体而言,在单一会话中发出超过50个捜索查询的任何用户被标记为垃圾用户,且 其查询日志被从考虑中移除)。类似地,具有低于特定阔值(在一些实验中为3)的频率的任 何查询被移除。在该移除垃圾用户和低频率捜索之后,在最终的数据集中有1500万唯一用 户、900万唯一查询、W及6100万唯一 URL。
[0094] 在实验中,使用等式(1)和(2)(其中s = 3)来确定趋势捜索。为了评估,前100个趋 势查询被标识为趋势图像捜索查询。TA-WRMF模型随后被应用到趋势查询W确定个性化趋 势图像捜索查询。上面描述的TA-WRMF模型被连同5个基线一起考虑:最流行候选(MPC)模 型、个人频率(PF)加上MPC模型、基于项的写作过滤(IBCF)方法、单向量分解(SVD)模型、W 及加权归一化矩阵因子分解(WRMF)方法。为了进一步分析,WRMF方法被在两个数据集上运 行,即,所有查询和仅趋势查询。为了确定趋势查询的个性化的效用,采用平均准确率均值 (MP)作为度量。图4解说了各个技术的比较。如图所示,TA-WRMF模型提供了比运5个基线中 的每一个都更好的结果。
[00巧]示例语句
[0096] A: -种方法,包括:从多个用户图像捜索查询中标识趋势图像捜索查询;将所述趋 势图像捜索查询的子集标识为个性化趋势图像捜索查询,其中所述个性化趋势图像捜索查 询是针对多个用户中的所标识用户个性化的且是至少部分基于所述所标识用户和所述趋 势图像捜索查询之间的关系来标识的;对于所述个性化趋势图像捜索查询中的个体查询, 确定代表所述个性化趋势图像捜索查询中的相应查询的一个或多个候选图像;W及针对所 述个性化趋势图像捜索查询中的个体查询,从代表所述个性化趋势图像捜索查询中的相应 查询的所述候选图像中标识至少一个代表性图像。
[0097] B:如段落A所述的方法,其中所述多个用户图像捜索查询是由多个用户做出的和/ 或其中标识趋势图像捜索查询包括确定多个图像捜索查询的得分且标识所述趋势图像捜 索查询是至少基于所述得分的。
[0098] C:如段落A或B所述的方法,进一步包括至少部分基于所述趋势图像捜索查询、所 述趋势图像捜索查询之外的多个用户图像捜索查询、W及与对所述用户图像捜索查询的响 应相关联的点击信息来标识所述所标识用户和所述趋势图像捜索查询之间的关系。
[0099] D:如段落A-C中任一段所述的方法,其中确定所述所标识用户和所述趋势图像捜 索查询之间的关系包括将所述所标识用户的捜索日志数据与多个第二用户的捜索日志数 据相比较。
[0100] E:如段落A-D中任一段所述的方法,其中所述多个用户图像捜索查询包括来自所 述所标识用户之外的用户的用户图像捜索查询。
[0101] F:如段落A-E中任一段所述的方法,进一步包括指示在与所述所标识用户相关联 的设备上向所述所标识用户显示所述代表性图像。
[0102] G:如段落A-F中任一段所述的方法,其中指示显示所述代表性图像是在不存在所 述所标识用户的同期捜索的情况下执行的。
[0103] H:如段落A-G中任一段所述的方法,其中从所述候选图像中标识所述代表性图像 包括对所述候选图像中的个体图像打分并至少部分基于得分来选择所述代表性图像。
[0104] I:如段落A-G中任一段所述的方法,其中打分至少基于所述候选图像的相关性、所 述候选图像的视觉一致性、所述候选图像的新鲜度、或所述候选图像的突发性中的至少一 者。
[0105] J:如段落A-I中任一段所述的方法,其中所述打分至少部分基于所述候选图像的 突发性,且所述突发性是作为相应图像的点击的增加来测量的。
[0106] K:如段落A-J中任一段所述的方法,其中确定所述一个或多个代表性图像包括调 查与和所述所标识用户不同的多个用户相关联的图像捜索查询的点击数据
[0107] L: -种其上具有计算机可执行指令的计算机可读介质,所述计算机可执行指令将 计算机配置成执行如段落A-K中任一段所述的方法。
[0108] M: -种设备,包括:其上具有计算机可执行指令的计算机可读介质,所述计算机可 执行指令将计算机配置成执行如段落A-L中任一段所述的方法,处理单元,其适于执行所述 指令W执行如段落A-L中任一段所述的方法。
[0109] N: -种设备,包括:其上具有多个模块和查询日志的一个或多个计算机可读介质; 禪合于所述计算机可读介质的处理单元,所述处理单元适于执行多个模块中的模块,所述 多个模块包括:个性化趋势图像捜索模块,其被配置成至少部分基于所述所标识用户的偏 好来从所述查询日志中的多个图像捜索查询中标识个性化趋势图像捜索查询;W及代表性 图像标识模块,其被配置成标识与所述个性化趋势图像捜索模块所标
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1