用于搜索结果的动画摘录的制作方法

文档序号:14554853阅读:282来源:国知局
用于搜索结果的动画摘录的制作方法

本申请涉及用于搜索结果的动画摘录。



背景技术:

互联网提供对各种信息的访问。例如,可通过互联网访问如数字图像文件、视频和/或音频文件、以及用于特定主题或特定新闻文章的网页这样的资源。这些资源由搜索引擎系统进行爬取(crawl)和索引。搜索引擎系统接收来自用户的查询,并搜索索引资源来查找与用户信息需求相关的信息。然后,搜索引擎系统按照响应顺序对资源进行排序,并根据资源的排名提供识别资源的搜索结果。

对于网页,搜索结果可包括网页标题、从网页提取的文本摘录、网页的url,以及在某些情况下,网页的图像。对于图像,搜索结果可以是图像的缩略图。

用户审查搜索结果,并且可根据搜索结果中包括的信息选择一个或多个搜索结果,以使得用户装置导航到底层资源。但是,搜索结果仅提供它所链接的资源的文本和/或视觉摘要。因此,当搜索结果可能是底层资源的信息化时,用户在导航到资源之后可能会发现资源不满足用户的信息需求。然后,用户可以在找到满足用户信息需求的资源之前,返回搜索结果页面并选择另一个资源或其他资源。因此,搜索系统可能处理额外的分析流量,如果用户首先选择对于用户的信息需求而言最满意的资源,那么该额外的分析流量将不是必需的。同样,网络服务器也可能响应被请求用户快速忽略的资源请求,这又浪费了web服务资源。



技术实现要素:

本说明书所述技术与响应于搜索查询提供动画摘录有关。

通常,本说明书所述主题的一个创造性方案可以在包括以下动作的方法中具体实施:确定各自包括多个持久可视资源的页面资源,每个持久可视资源是每次在用户装置上显示页面资源时显示的可视资源;对于所确定的页面资源的每一个,从多个持久可视资源生成一个或多个动画摘录,对于一个或多个动画摘录的每一个,包括:选择持久可视资源的子集;从所选择的持久可视资源的每一个生成图像帧;以及为页面资源生成动画摘录,其中所述动画摘录包括从所选择的持久可视资源生成的每个图像帧,且按照特定顺序显示图像帧;对于已经为其生成一个或多个动画摘录的页面资源,选择动画摘录中的一个作为将页面资源识别为响应于搜索查询的搜索结果进行显示;以及向从其提交查询的用户装置提供动画摘录。该方案的其他实施例包括被配置为进行在计算机存储装置上编码的方法的动作的对应系统、设备和计算机程序。

可以实现本说明书所述主题的特定实施例,从而实现以下优点的一个或多个。本文公开的系统和方法描述了组合来自页面资源的多个图像并从页面资源内的图像创建动画摘录。确定不具有持久图像的页面资源有助于为页面资源提供一致的动画摘录。此外,至少部分地基于图像在页面资源内的位置创建动画摘录可以帮助创建代表页面资源主旨的动画摘录。

更具体而言,动画摘录是从另一个资源(例如网页)中托管的可视资源(例如图像或视频)收集的两个或更多个图像或视频帧的集合。动画摘录提供了用于资源的信息的可视摘要,与搜索结果中单个图像提供的信息摘要相比更加详细。动画摘录解决以下技术问题:在精选满足用户信息需求的资源的努力中,减少因用户选择多个搜索结果所致的无关网页流量。动画摘录解决以下的另外的技术问题:通过在单个显示空间中提供多个不同的图像作为一系列帧,以有限的显示空间提供来自搜索结果中的资源的多个不同的图像。这样为在搜索结果中提供任意数量的图像提供了灵活的格式,因为每个图像在同一空间中以动画序列显示。

在资源上操作的选择过程实现了最有可能向用户提供有用信息的可视资源的选择。选择过程减少了动画摘录中包括并非资源所述信息的信息化的无关图像的可能性。这种无关图像的示例为格式化图像,例如条、按钮等,以及会随着资源的每次派发而变化的非持久图像,例如广告图像。这样解决了尺寸管理的技术问题,因此所生成的动画摘录的尺寸并非带宽密集性的。

本说明书所述主题的一个或多个实施例的细节在附图和以下描述中给出。根据描述、附图和权利要求,主题的其它特征、方案和优点将变得显而易见。

附图说明

图1a是用于生成动画摘录以在搜索结果内呈现的示例性环境的方框图。

图1b是包括具有动画摘录的搜索结果的示例性搜索结果页面的方框图。

图1c是包括图像搜索结果的示例性图像搜索结果页面的方框图,其中一些是动画摘录。

图2是描述用于生成和提供动画摘录的过程的流程图。

图3是描述用于确定动画摘录的主题类别的过程的流程图。

图4是描述页面资源内的可视资源的主题类别并响应于搜索查询选择动画摘录的流程图。

不同附图中的相同附图标记和标号表示相同元件。

具体实施方式

概述

本文所述系统和方法创建动画摘录,该动画摘录描绘页面资源中包括的可视资源。页面资源可以是可在浏览器中被渲染的网页,或者例如是本地应用中显示环境的实例。动画摘录包含多个帧,其中每个帧对应于来自特定页面资源的可视资源。动画摘录可以是单个文件,例如动画gif或视频文件。在其他实施方式中,动画摘录可以是按序列选择性显示的图像的集合,其中每个图像显示为一个帧。帧按照特定顺序呈现为动画。动画摘录可以在一组搜索结果中呈现。

例如,给定的搜索结果可通过用于特定页面资源的动画摘录呈现并显示在搜索结果的集合中。动画摘录显示为静态图像,直到用户与图像进行交互。例如,当用户与动画摘录进行交互(例如,将鼠标指针放在动画摘录上,将手指放在动画摘录上,用力触摸向图像施加压力,点亮动画攫取器(snapper)等)时,图像将播放动画,所述动画包括从显示于特定页面资源中的所选择的可视资源生成的帧。可以提供动画摘录作为图像搜索结果,或者也可以提供来自资源的文本和其他信息。

为搜索结果创建动画摘录可以通过将页面资源中显示的相关内容的概述给予用户来帮助用户确定请求哪个页面资源。为用户提供页面资源中包含的图像的动画摘录可以更多地指示网页的主旨,并因此帮助用户确定页面资源是否响应于搜索查询所指示的用户的信息需求。

示例性操作环境

图1是用于生成动画摘录以在搜索结果内呈现的示例性环境100的方框图。计算机网络102(例如局域网(lan)、广域网(wan)、因特网或其组合)连接发布者网站104、用户装置106和搜索引擎110。在线环境100可包括数千个网站104和用户装置106。

网站104包括与域名相关联并由一个或多个服务器托管的一个或多个资源105。示例性网站104是按照超文本标记语言(html)格式化的网页的集合,可包含文本、图像、多媒体内容以及编程元素(例如脚本)。每个这样的页面被称为资源105。其他类型的页面资源也可通过搜索引擎110被处理,包括视频文件、音频文件等。

资源是可以由发布者通过网络102提供并且与资源地址相关联的任何数据。仅举几例,资源包括html页面、文字处理文档和便携式文档格式(pdf)文档、图像、视频和馈入源(feedsource)。资源可包括例如单词、短语、图片等等的内容,并且可包括嵌入信息(例如元信息和超链接)和/或嵌入指令(例如脚本)。

用户装置106是能够通过网络102请求和接收资源的电子装置。示例性用户装置106包括可通过网络102发送和接收数据的个人计算机、移动通信装置和其他装置。用户装置106通常包括用户应用程序(例如网络浏览器),以帮助通过网络102发送和接收数据。网络浏览器可使得用户能够显示文本、图像、视频、音乐以及通常位于万维网或局域网的网站的网页上的其他信息,并与其交互。

为了帮助搜索这些页面资源105,搜索引擎110通过爬取页面资源105并对网站104提供的资源进行索引来识别资源。索引的以及任选地缓存的资源的副本存储在页面资源索引112中。

用户装置106向搜索引擎110提交搜索查询122。搜索查询122以包括搜索请求的搜索请求的形式提交。响应于搜索请求,搜索引擎110使用页面资源索引112来识别与查询相关的资源。搜索引擎110以搜索结果124的形式识别资源,并在包括多个搜索结果的搜索结果页面中将搜索结果返回用户装置106。搜索结果是搜索引擎110产生的识别满足特定搜索查询的资源的数据,且所述搜索结果包括资源的资源定位符。示例性搜索结果是可包括网页标题、从网页提取的文本摘录以及网页的url的页面搜索结果。另一种类型的搜索结果是包括图像作为搜索结果的图像搜索结果。如下更详细所述,页面搜索结果和图像搜索结果都可包括动画摘录。

动画摘录包含来自用于特定页面资源的可视资源的多个帧。动画摘录可以是信号图像文件的形式。动画摘录也可以是多个图像文件和脚本的形式,脚本指示浏览器在同一显示空间内以特定顺序显示图像文件。可视资源可包括静态图像、动态图像、整个视频或来自特定视频的经过选择的帧。动画摘录136按照特定顺序逐一呈现帧,以传送重复的动画。

用户装置106接收搜索结果页面并渲染页面以呈现给用户。响应于用户在用户装置106选择搜索结果,用户装置106请求由所选择的搜索结果中包括的资源定位符识别的资源。托管资源的页面资源104的发布者从用户装置106接收对于资源的请求,并将资源提供给请求的用户装置106。

动画摘录生成

动画摘录生成器130生成用于包括搜索结果的动画摘录。动画摘录生成器130识别持久可视资源用于包含在动画摘录中。持久可视资源是每次加载页面资源时都不会改变的图像和/或视频。例如,包含关于狩猎主旨的页面资源可包括狮子的图像以及具有特定图像的网幅广告。每次加载狩猎页面资源时,始终呈现相同的狮子图像,除非图像被页面资源创建者修改。但是,网幅广告中呈现的图像可能会在每次使用特定网幅广告加载页面时改变。因此,狮子的图像是持久可视资源,网幅广告中呈现的图像是非持久图像。

动画摘录生成器130可通过各种方法来确定持久可视资源。一种方法是重复加载页面资源,并从文档对象模型(或渲染的页面资源的其他结构数据)来确定对于每次页面加载而言相同的可视资源以及对于每次页面加载而言不同的可视资源。另一种方法是处理页面资源的指令,并根据指令确定可视资源是否持久。例如,为每次页面加载调用相同图像的指令,例如img=www.example.com/images/image001.jpg将image001.jpg识别为持久可视资源。可以确定例如广告请求、天气请求、股票行情请求等其他指令来指定非持久可视资源。可将这样的请求类型指定给动画摘录生成器130,或者可通过重复地加载页面资源并从文档对象模型(或者呈现的页面资源的其他结构数据)确定对于每次页面加载而言不同的可视资源。

动画摘录生成器130从搜索引擎(或从网站104)接收页面资源信息,以响应于搜索查询创建动画摘录。动画摘录生成器130确定为哪些页面资源创建动画摘录。通常,动画摘录生成器130可选择包括两个或更多个持久可视图像的任何资源来创建动画摘录。例如,动画摘录生成器130确定要从包括持久可视资源132a、132b、132c和132d的页面资源105a来生成动画摘录。动画摘录生成器130选择持久可视资源的子集134,从该持久可视资源的子集134生成包括在动画摘录136中的帧。如结合图3更详细所述,动画生成器130可至少部分地基于位置和/或长宽比,为动画摘录选择用于帧生成的图像。

在一些实施方式中,动画摘录生成器130将创建的动画摘录136存储在摘录索引114中。独立于接收搜索查询122进行动画摘录的生成,且用页面资源105对页面资源生成的一个或多个动画摘录136进行索引,以将一个或多个动画摘录136与页面资源105相关联。然后,搜索引擎110可以检索存储的动画摘录136,并提供先前生成的动画摘录136,以包括在一组搜索结果124中。在其他实施方式中,动画摘录生成器130可以在查询时生成动画摘录136。

为了说明动画摘录怎样向用户提供信息,假设用户需要关于狩猎的信息。特定页面资源105a可包括关于狩猎的主旨,包括吉普车的图像132a、狮子的图像132b和狩猎者的图像132c。动画摘录生成器130可以在查询时间之前或在查询时间处理页面资源105a,以识别吉普的图像132a、狮子的图像132b和狩猎者的图像132c的子集134。动画摘录生成器130例如生成包括吉普车的图像132a作为第一帧以及用于动画摘录的代表性可视资源的动画摘录。一个代表性可视资源是作为动画摘录的第一帧呈现的静态可视资源。

第二帧可以是狮子的图像132b,而第三帧可以是狩猎者的图像132c。动画摘录生成器130将来自132a-c的帧收集到动画摘录136中。然后,响应于查询提供动画摘录136,作为识别资源105a的搜索结果的一部分。当用户与动画摘录136交互时,用户将首先看到吉普的图像132a持续一个设定时间,然后用户看到狮子的图像132b持续一个设定时间,最后用户看到狩猎者的图像132c持续一个设定时间。之后,动画摘录136再次从吉普的图像132a开始,启动动画。

示例性动画摘录

图1b是包括具有动画摘录136的搜索结果152的示例性搜索结果页面150的方框图。在一些实施方式中,动画摘录136以如下的方式被显示,其中从所述页面资源提取的至少一种其他数据集合与所述动画摘录分开显示。动画摘录136被识别为具有标识符(例如,动画式gif、jpeg、avi等的“as”或“gif”)的动画摘录,其叠加在作为动画摘录136的第一帧呈现的静态可视资源上。

然后,可将至少一个其它数据集合包括在搜索结果152中。例如,搜索结果152可包括标题154、统一资源定位符(url)156、文本摘录158以及动画摘录136。标题154可包括页面资源的名称或标题,其宽泛地描述页面资源的主旨。url156是在页面资源搜索结果150中呈现的特定页面资源的引用地址。文本摘录154是来自页面资源的文本的一部分,为用户提供页面资源的主旨的小样本。动画摘录136包括在特定搜索结果实体152内呈现的持久可视资源的动画。

例如,搜索结果152可以链接到上述特定狩猎页面资源105a。显示标题“safarisunlimited(狩猎无极限)”,通知用户该特定页面资源105a包括关于狩猎的主旨。例如,动画摘录136可以是包括吉普车的图像132a、狮子的图像132b和狩猎者的图像132c的动画摘录136。示例性文本摘录包括狩猎者页面资源105a的可能包括关于狩猎旅程信息的部分。

动画摘录可按照各种格式呈现。在一些实施方式中,动画摘录136呈现为当用户与动画摘录136交互时呈现动画的静态图像。在其他实施方式中,动画摘录136可按照自动播放格式呈现,其中在没有用户交互的页面资源内播放动画。动画摘录也可以在交互后下载,并在动画摘录下载后开始播放。

图1c是包括图像搜索结果的示例性图像搜索结果页面175的方框图,其中一些是动画摘录。图像搜索结果176a-176f是单个图像,而图像搜索结果136a-136c是动画摘录。例如,图像搜索结果176a-f可包含用于狩猎相关内容的多个图像缩略图,且动画摘录136a-c也可用于狩猎相关内容。如先前结合图1b所述,动画摘录通过叠加在代表性可视资源上的标识符(例如“as”)与静态图像区别开来。

每个动画摘录136a-136c被呈现为图像搜索结果页面175内的静态图像。当用户分别与动画摘录136a-136c中的每一个交互时,动画摘录开始在图像搜索结果页面175内播放动画。用户可以点击动画摘录136a-136c,就像图像一样,并被带到包括动画摘录136a-136c中的可视资源的页面资源105。

示例性过程流程

图2至图4是几个动画摘录生成和处理算法的示例性过程流程。图2至图4的过程在被编程为进行下述操作的一个或多个计算机装置中实现。

图2是描述用于生成和提供动画摘录的过程200的流程图。动画摘录生成器130确定各自包括多个持久可视资源的页面资源,其中每个持久可视资源是每次在用户装置上显示页面资源105时显示的可视资源(202)。如上所述的,动画摘录生成器130可通过多次加载页面资源来检测持久可视资源,并检测可视资源的匹配度,或者通过处理页面指令来进行。

动画摘录也可以从用于包括在动画摘录中的候选者丢弃一些持久可视资源。这种资源可包括高频内容,例如按钮、条等。高频内容可能是在特定网站上的多个页面中出现的可视资源。通过跨越网站的多个页面资源使用图像的格式化和加标记来检测这种高频内容,对于具有独特“界面外观”的网站尤其有用。

动画摘录生成器130还可包括“停止图像”的列表,其非常类似于“停止词”。这些可以是在多个不同网站上使用的非常常用的图像的库。当通过将来自页面资源的图像与停止图像库中的图像相匹配来检测时,将这种“停止图像”排除而不将其用于生成动画摘录,即使它们是其他持久可视资源。可以使用适当的图像匹配算法。

动画摘录生成器130从用于页面资源的多个持久可视资源生成一个或多个动画摘录(204)。动画生成器130可以为特定页面资源105创建多个动画摘录136。创建多个动画摘录136的确定可以部分地基于可视资源的数量、可视资源的类型、可视资源的大小、可视资源的主题、页面资源的主题等。针对为特定页面资源生成的每个特定动画摘录进行步骤206、208和210。

继续狩猎页面资源105a的示例,页面资源的一般主题可以是狩猎,而动画摘录生成器130可以创建包括吉普的图像132a、狮子的图像132b、狩猎者的图像132c的动画摘录136,以代表狩猎的一般主题。但是,狩猎页面资源105a还可包括长颈鹿、斑马和瞪羚的图像。动画摘录生成器130可以创建狮子132b、长颈鹿、斑马和瞪羚的动画摘录136,以代表非洲动物的一般主题。下面结合图3和图4讨论关于确定资源主题和动画摘录主题的进一步讨论。

对于每个动画,动画摘录生成器选择持久可视资源的子集(206)。动画摘录生成器130不一定选择所有持久可视资源。选择可以是基于主题的,并且参考图3和图4描述基于主题的选择。

选择也可以基于“停止图像”,以排除如上所述的低信息图像。

选择也可以基于持久可视资源的位置。例如,动画摘录生成器130为每个持久可视资源确定当页面资源被渲染用于显示时持久可视资源在页面资源上的位置以及持久可视资源的位置分数。位置分数表示可视资源的位置在页面资源内有多么突出。该分数与可视资源到被渲染资源的中心的距离、和/或其与被渲染资源的边缘的接近度、或者它是否位于由另一个域所有的帧中成比例。可以使用各种评分算法和公式。例如,与位于页面资源底部角落的图像相比,在资源中心呈现的可视资源具有更高的位置分数。

在一些实施方式中,位置分数可以是二进制的,例如,页面资源的某个边界内的图像资源可以接收“1”,否则接收“0”。动画摘录生成器130可以检测在页面资源的特定边界内的持久可视资源,并将持久可视资源评分为在边界之内或边界之外。选择边界内的持久可视资源,以包括在动画摘录136中。

位置分数也可以是指示可视资源到页面资源的中心区域的距离的实数。持久可视资源越靠近页面的中心区域,位置分数越高。在该实施方式中,动画摘录生成器130可以具有用于持久可视资源的位置分数的位置分数阈值。动画摘录生成器130基于位置分数选择持久可视资源。例如,选择具有高于位置分数阈值的位置分数的持久可视资源,以包括在动画摘录136中。

在一些实施方式中,基于持久可视资源的长宽比选择持久可视资源,以包括在动画摘录中。动画摘录生成器对于每个持久可视资源确定持久可视资源的长宽比,分配长宽比分数,并且当长宽比满足一个或多个长宽比尺寸标准时选择该持久可视资源,以包括在持久可视资源的子集中。

例如,长宽比尺寸标准可包括持久可视资源必须满足的特定长宽比,且位置分数可具有二进制值。如果可视资源满足特定的长宽比阈值,那么持久可视资源被分配长宽比分数1,否则如果持久可视资源低于特定的长宽比阈值,那么持久可视资源被分配长宽比分数0。动画摘录生成器130对于长宽比分数为1的所有持久可视资源生成动画摘录。

在一些实施方式中,长宽比分数可以是随着虚拟资源的长宽比增加而增加的实数。例如,长宽比越大,长宽比分数越高。动画摘录生成器130选择具有高于特定长宽比分数阈值的长宽比分数的可视资源,以包括在动画摘录136中。

动画摘录生成器130可以使用位置分数、长宽比分数或两者的组合来选择图像子集,以包括在动画摘录136中。也可以使用其他评分和选择过程,例如配色方案、图像格式类型等。

动画摘录生成器130为所选择的持久可视资源中的每一个生成图像帧(208)。对于所选择的每个图像,帧可以是图像或图像的缩略图。帧也可以是图像的裁切部分。

对于视频资源而言,动画摘录生成器生成图像帧,并且可以取得视频的每第n帧,以包括在动画摘录136中。因此,对于为其选择三个图像和一个视频来生成动画摘录的页面资源而言,动画摘录包括分别对应于三个图像的三个帧以及对应于视频的至少一个或多个帧。

动画摘录生成器130为页面资源生成动画摘录(210)。在某些情况下,动画摘录包括从所选择的持久可视资源生成的每个图像帧,并按照特定顺序显示图像帧。动画摘录生成器130聚类所有图像帧以创建动画摘录,使得按照特定顺序使每个帧呈现一设定的持续时间。顺序可以随机选择,或基于图像主题,或根据任何适当的排序标准。

响应于搜索查询,搜索系统选择动画摘录中的一个作为将页面资源识别为响应于搜索查询的搜索结果进行显示(212)。如前所述,可以在页面资源搜索结果中或者作为图像搜索结果提供动画摘录。搜索引擎将动画摘录136提供给从其提交查询的用户装置(214)。搜索引擎110将动画摘录136合并到搜索结果集合中,用于在用户装置呈现,并将包括动画摘录的搜索结果页面提供给用户装置。

图3是描述用于确定动画摘录的主题类别的过程300的流程图。如先前结合图2所述,动画摘录生成器130选择持久可视资源的子集,以生成页面资源的动画摘录。在图3中,过程300确定页面资源的一个主要主题(或多个主要主题),并生成包括用于所选择的持久可视资源的每一个的帧的“信息化”动画摘录。然后,将动画摘录与一般主题相关联,并提供映射到一般主题的信息化搜索查询。

对于每个页面资源,动画摘录生成器130确定页面资源的主旨所描述的资源主题(302)。再参考狩猎示例,动画摘录生成器130可以确定狩猎页面资源105a包括关于狩猎的一般主旨。

基于页面资源的主题的确定,动画摘录生成器将动画摘录136归类为属于资源主题(304)。动画摘录136包括吉普车的图像132a、狮子的图像132b和狩猎者的图像132c,它们被归类为狩猎的动画摘录。

搜索引擎110选择动画摘录136中的一个作为将页面资源识别为响应于搜索查询的搜索结果进行显示(306)。选择动画摘录136作为搜索结果进行显示包括确定查询的主题。例如,一些搜索查询术语可以是一般性的,且包括宽泛描述搜索查询的主题的一组通用术语(例如“safari(狩猎者)”)。

搜索引擎110确定资源主题是否与查询的主题匹配,且响应于确定资源主题与查询的主题相匹配,选择被归类为属于资源主题的动画摘录。因此,用于狩猎的一般搜索查询将使得搜索引擎110返回包括如下动画摘录136的搜索结果,所述动画摘录136包括吉普的图像132a、狮子的图像132b和狩猎者的图像132c。

图4是描述页面资源内的可视资源的主题类别并响应于搜索查询选择动画摘录的流程图。回想一下,图3描述生成信息动画摘录的过程。图4涉及生成指向特定资源的子主题的动画摘录的过程。例如,用户可以输入例如“whattypeoftransportationisusedonasafari(狩猎时使用什么类型的交通工具)”或者“whatanimalscaniseeonasafari(狩猎时可以看到什么动物)”等这样的查询,而不是“safari(狩猎)”这样的查询。图4帮助生成对于指向较窄主题的查询可能更加信息化的动画摘录。

对于每个持久可视资源,动画摘录生成器130确定可视资源描绘的主旨所描述的主题(402)。例如,可以确定示例性狩猎页面资源内的吉普车的图像132a包含吉普车的主旨。同样,狮子的图像132b和狩猎者的图像132c可以被确定为分别包含狮子和狩猎者的主旨。可通过处理描述图像标签(是图像内容的描述)、通过计算机视觉过程、或其他适当的图像分类技术来进行主题检测。

动画摘录生成器130基于所确定的主题将持久可视资源聚类为两个或更多个集群(404)。可以使用各种聚类技术,例如k均值聚类、成团聚类(agglomerativeclustering)等。在狩猎页面资源105a的示例中,第一集群可以仅包括狩猎者的吉普车的图像,并且属于“狩猎/交通”的主题类别;第二集群可以仅包括狩猎时看到的动物的图像,并且属于“狩猎/动物”等的主题。

对于持久可视资源的每个集群,动画摘录生成器130根据属于集群的持久可视资源生成动画摘录,并将动画摘录与所确定的集群的主题相关联(406)。例如,可以从第一集群创建第一动画摘录,第一集群仅包括狩猎者的吉普车的图像,并被归类为属于“狩猎/交通”的主题类别。同样,可以从第二集群生成第二动画摘录,第二集群仅包括在狩猎时看到的动物的图像,并且被归类为属于“狩猎/动物”等的主题。

搜索系统110选择页面资源以通过搜索结果进行识别,并且对于页面资源的每个动画摘录,确定相关性度量,相关性度量是查询与所确定的动画摘录的主题的相关性的度量(408)。可以使用任何适当的相关性过程,例如用户选择率分析、主题相关性算法、术语匹配、向量积等。动画摘录136的主题与查询越相关,相关性分数越高。

例如,搜索引擎110可以确定查询的主题,并将查询主题与动画摘录的主题进行比较。例如,搜索查询“whatanimalscaniseeonasafari(狩猎时可以看到什么动物)”的主题可以确定为“safaris(狩猎)”和“animals(动物)”。然后可将这些主题与为动画摘录标识的主题进行比较。可以使用任何适当的查询主题识别过程。

在一些实施方式中,相关性度量可以部分地基于响应于查询的动画摘录中的一个或多个图像的用户选择率。例如,如果响应于搜索查询提供了动画摘录中的图像,那么可以使用响应于查询的图像的选择率来驱动相关性度量。在其他实施方式中,相关性度量可以部分地基于响应于查询的动画摘录的先前选择(或响应于与查询的主题相似的主题有关的其他查询)。

在一些实施方式中,相关性度量还可以基于动画摘录的质量分数。动画摘录的质量分数由动画摘录内可视资源的特征决定。例如,质量分数可以基于可视资源的大小、亮度、对比度、颜色、清晰度、压缩等级等。动画摘录中可视资源的特征越好,动画摘录的质量分数越高。在确定动画摘录与查询的相关性时,搜索系统110在某些情况下可将质量分数与相关性分数组合。

还可以使用其他相关性确定算法。

搜索系统110基于相关性度量从多个动画摘录中选择动画摘录(410)。搜索系统110可以基于满足相关性分数阈值的相关性分数来选择动画摘录;例如,如果没有一个动画摘录具有满足最小阈值的相关性分数,那么不显示动画摘录。否则,选择具有满足或超过相关性分数阈值的相关性分数最高的动画摘录。

例如,响应于搜索查询“whatanimalscaniseeonasafari(狩猎时可以看到什么动物)”,搜索系统可以确定,属于狩猎/动物主题的动画摘录相对于属于“狩猎”和“狩猎/交通”主题的动画摘录具有最高的相关性分数。搜索系统110响应于搜索查询“whatanimalscaniseeonasafari(狩猎时可以看到什么动物)”提供所选择的包括狮子、长颈鹿、斑马和瞪羚图像的动画摘录136。

在本文所述系统收集关于用户的个人信息或者可以使用个人信息的情况下,可向用户提供机会来控制应用程序或特征是否收集用户信息(例如关于用户社交网络、社交动作或活动、专业、用户的偏好、或用户的当前位置的信息)、或者控制是否和/或怎样接收与用户更相关的信息。此外,某些数据可以在存储或使用之前以一种或多种方式处理,从而消除个人身份信息。例如,可以对用户的身份进行处理,从而不能对用户确定个人身份信息,或者在获得位置信息(例如城市、邮政编码或地域等级)的情况下可将用户的地理位置一般化,从而不能确定用户的具体位置。因此,用户可以控制关于用户如何收集信息、通过内容服务器怎样使用信息。

本说明书所述主题和操作的实施例可以在数字电子电路中或在计算机软件、固件或硬件中实现,包括本说明书所公开的结构及其结构等同物,或者在它们的一个或更多个的组合中实现。本说明书所述主题的实施例可以实现为一个或多个计算机程序,即计算机程序指令的一个或多个模块,所述计算机程序指令在计算机存储介质上编码,用于通过数据处理设备执行,或控制数据处理设备的操作。

计算机存储介质可以是计算机可读存储装置、计算机可读存储基板、随机或串行访问存储器阵列或装置、或者其中的一个或多个的组合。此外,当计算机存储介质不是传播信号时,计算机存储介质可以是在人工生成的传播信号中编码的计算机程序指令的源或目的地。计算机存储介质也可以是一个或多个单独的物理组件或介质(例如多个cd、磁盘或其他存储装置)或包括在一个或多个单独的物理组件或介质(例如多个cd、磁盘或其他存储装置)中。

本说明书所述操作可以实现为通过数据处理设备对存储在一个或多个计算机可读存储装置上或从其他源接收的数据进行的操作。

术语“数据处理设备”包括用于处理数据的所有种类的设备、装置和机器,作为示例,包括可编程处理器、计算机、芯片上的系统,或前述的多个,或前述的组合。该设备可包括专用逻辑电路,例如fpga(现场可编程门阵列)或asic(专用集成电路)。除了硬件之外,该装置还可包括为所考虑的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或它们的一个或多个的组合的代码。设备和执行环境可以实现多种不同的计算模型基础设施,如web服务、分布式计算和网格计算基础设施。

计算机程序(也称为程序、软件、软件应用程序、脚本或代码)可以按照任何形式的编程语言编写,包括编译或解释语言,声明性或程序性语言,并且可以按照任何形式部署,包括作为独立程序或模块、组件、子程序、对象或适用于计算环境的其他单元。计算机程序可以但不一定对应于文件系统中的文件。程序可以存储在文件的保存其他程序或数据(例如存储在标记语言文档中的一个或多个脚本)的部分中、存储在专用于所考虑的程序的单个文件中、或者存储在多个协同文件中(例如存储一个或多个模块、子程序或部分代码的文件)。可将计算机程序部署为在一个计算机上或多个计算机上执行,多个计算机位于一个站点,或者分布在多个站点上并由通信网络互连。

本说明书所述过程和逻辑流程可通过执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并产生输出来进行动作。所述过程和逻辑流程也可通过专用逻辑电路(例如fpga(现场可编程门阵列)或asic(专用集成电路))进行,并且设备也可以实现为专用逻辑电路。

作为示例,适用于执行计算机程序的处理器包括通用和专用微处理器,以及任何种类的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于根据指令进行动作的处理器和用于存储指令和数据的一个或多个存储器装置。通常,计算机还包括用于存储数据的一个或多个大容量存储装置(例如磁盘、磁光盘或光盘),或者可操作地与其连接,从其接收数据,或向其传送数据,或两者皆有。但是,计算机不需要有这样的装置。此外,计算机可以嵌入另一个装置中,仅举几例,例如移动电话、个人数字助理(pda)、移动音频或视频播放器、游戏控制台、全球定位系统(gps)接收器或便携式存储装置(例如通用串行总线(usb)闪存驱动器)。适用于存储计算机程序指令和数据的装置包括所有形式的非易失性存储器、介质和存储器件,作为示例,包括半导体存储装置,例如eprom、eeprom和闪存装置;磁盘,例如内部硬盘或可移动盘;磁光盘;以及cd-rom和dvd-rom磁盘。处理器和存储器可通过专用逻辑电路补充或并入其中。

为了提供与用户的交互,可以在具有显示装置(例如crt(阴极射线管)或lcd(液晶显示器)监视器,用于向用户显示信息)、键盘和指示装置(例如鼠标或轨迹球,用户可以由其向计算机提供输入)的计算机上实现本说明书所述主旨的实施例。其他类型的装置也可用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感觉反馈,例如视觉反馈、听觉反馈或触觉反馈;并且能够以任何形式接收来自用户的输入,包括声音、语音或触觉输入。此外,计算机可通过向用户使用的装置发送文档并从其接收文档来与用户进行交互;例如,通过响应于从网络浏览器接收到的请求,将网页发送到用户装置上的网络浏览器。

本文所述主题的实施例可以在包括后端组件(例如作为数据服务器)或包括中间件组件(例如应用服务器)或包括前端组件(例如具有图形用户界面或web浏览器,用户可以通过其与本文所述主旨的实施方式交互的客户端计算机),或包括这些后端组件、中间件组件、前端组件的任意组合的计算系统中实现。系统的组件可通过数字数据通信的任何形式或介质(例如通信网络)互连。通信网络的示例包括局域网(lan)和广域网(wan)、网络间(例如因特网)、以及对等网络(例如adhoc对等网络)。

计算系统可以包括用户和服务器。用户和服务器一般相互远离,通常通过通信网络进行交互。用户和服务器的关系凭借在各个计算机上运行并相互具有用户-服务器关系的计算机程序而产生。在一些实施例中,服务器向用户装置传输数据(例如html页面)(例如,为了向与用户装置交互的用户显示数据并从用户接收用户输入的目的)。可以在服务器从用户装置接收在用户装置生成的数据(例如,用户交互的结果)。

虽然本说明书包含许多具体实现细节,但是这些细节不应视为对任何特征或可要求保护的范围的限制,其仅仅是对具体实施例特有特征的描述。本说明书所述的在单独实施例的情境中的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的情境中所述的各种特征也可以独立地或以任何合适的子组合在多个实施例中实现。此外,虽然上文可将多个特征描述为按照某些组合起作用,甚至一开始这样要求保护,但是在某些情况下,可以从组合中去除要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。

类似地,虽然在附图中按照特定顺序描述操作,但是这不应理解为要求按照所示特定顺序或按照连续顺序进行这些操作,或者进行所有所示操作以实现期望结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中多种系统组件的分离不应理解为在所有实施例中都需要这种分离,并且应当理解,所述程序组件和系统一般可以集成在单个软件产品中或打包成多个软件产品。

因此,已经描述了主题的特定实施例。其他实施例均落入所附权利要求的范围。例如,权利要求中列举的动作可以按照不同的顺序进行,并且仍然实现期望结果。另外,附图中所示的过程不一定需要所示的特定顺序或连续顺序来获得期望的结果。在某些情况下,多任务和并行处理可能是有利的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1