用于提取和生成用于显示内容的图像的系统和方法

文档序号:10517845阅读:741来源:国知局
用于提取和生成用于显示内容的图像的系统和方法
【专利摘要】提供了用于自动地生成显示内容的系统和方法。从第三方内容提供者接收识别着陆资源的统一资源定位符。从所述着陆资源提取一个或多个图像。分析所提取的图像以检测其视觉内容和语义内容。基于所检测的视觉内容和所检测的语义内容中的至少一个对所提取的图像进行评分。从包括从所述着陆资源提取的所述图像的一组图像中选择最高评分图像。生成包括所选择的图像的第三方内容项目,并且将其派发给用户设备。所述第三方内容项目被配置成将所述用户设备指向所述着陆资源。
【专利说明】用于提取和生成用于显示内容的图像的系统和方法
【背景技术】
[0001] 在计算机化内容传递网络中,第三方内容提供者通常设计并提供用于经由电子资 源的一个或多个内容时隙来传递到用户设备的显示内容(例如显示广告)。显示内容可以包 括例如图像、视频、图形、文本和/或其它视觉图像。第三方内容提供者创建有效且吸引人的 显示内容可能是困难且有挑战性的。
[0002] 各种模板和库存元件已被用来部分地使创建显示内容的过程自动化。然而,从刚 性模板和库存元件创建的显示内容常常是过时的、不吸引人的且不很好地适合于在显示内 容中展示的特定企业、产品或服务。

【发明内容】

[0003] 本公开的一个实施方式是用于自动地生成显示内容的计算机化方法。该方法由处 理电路执行。该方法包括在处理电路处从第三方内容提供者接收统一资源定位符。该统一 资源定位符识别着陆(landing)资源。该方法还包括从着陆资源提取图像,分析提取的图像 以检测图像的视觉内容和图像的语义内容,基于所检测的视觉内容和所检测的语义内容中 的至少一个对图像进行评分,从包括从着陆资源提取的图像的一组图像中选择最高评分图 像,以及生成包括所选择的图像的第三方内容项目。该第三方内容项目被配置成指向着陆 资源。
[0004]在某些实施方式中,该方法还包括基于分析的结果来确定图像是否需要处理;以 及响应于需要处理的确定而处理该图像以增强图像的所检测的视觉内容和图像的所检测 的语义内容中的至少一个。
[0005] 在某些实施方式中,从着陆资源提取图像包括确定用于图像的显著性分值。该显 著性分值指示用来在着陆资源上显示所提取的图像的突出性。
[0006] 在某些实施方式中,该方法还包括从多个不同的位置收集多个图像,所述多个不 同的位置包括着陆资源、与该着陆资源在同一域或子域下的资源以及先前在与第三方内容 提供者相关联的内容项目中使用的图像的储存库中的至少一个。
[0007]在某些实施方式中,分析所提取的图像以检测视觉内容包括确定图像中的显著对 象的位置。在某些实施方式中,确定图像中的显著对象的位置包括检测图像的色彩分布和 检测图像中的显著对象的边缘中的至少一个。在某些实施方式中,分析所提取的图像以检 测视觉内容包括确定图像中的文本的位置。在某些实施方式中,分析所提取的图像以检测 视觉内容包括生成用于图像的显著性地图。该显著性地图包括图像中的显著对象的位置和 图像中的任何文本的位置。
[0008]在某些实施方式中,分析所提取的图像以检测语义内容包括生成描述图像的语义 内容的一个或多个标签并将生成的标签存储为图像的属性。
[0009]在某些实施方式中,分析所提取的图像以检测视觉内容包括基于在图像中表示的 显著对象的位置来确定是否要对图像进行裁剪。在某些实施方式中,处理图像包括响应于 要对图像进行裁剪的确定而对图像进行裁剪以增强显著对象的视觉冲击。
[0010] 在某些实施方式中,该方法还包括识别图像的一个或多个审美特征并将该一个或 多个审美特征作为输入应用于针对人类所标记的图像偏好而被训练的算法排名过程。该算 法排名过程被配置成使用审美特征来基于人类所标记的图像偏好而生成用于图像的质量 分值。
[0011] 本公开的另一实施方式是一种用于自动地生成显示内容的系统。该系统包括被配 置成从第三方内容提供者接收统一资源定位符的处理电路。该统一资源定位符识别着陆资 源。该处理电路进一步被配置成从着陆资源提取图像,分析提取的图像以检测图像的视觉 内容和图像的语义内容,基于所检测的视觉内容和所检测的语义内容中的至少一个对图像 进行评分,从包括从着陆资源提取的图像的一组图像中选择最高评分图像,并且生成包括 所选择的图像的第三方内容项目。该第三方内容项目被配置成指向着陆资源。
[0012] 在某些实施方式中,所述处理电路被配置成基于分析的结果来确定图像是否需要 处理;以及响应于需要处理的确定而处理该图像以增强图像的所检测的视觉内容和图像的 所检测的语义内容中的至少一个。
[0013] 在某些实施方式中,从着陆资源提取图像包括确定用于图像的显著性分值。该显 著性分值指示用来在着陆资源上显示所提取的图像的突出性。
[0014] 在某些实施方式中,所述处理电路被配置成从多个不同的位置收集多个图像,所 述多个不同的位置包括着陆资源、与该着陆资源在同一域或子域下的资源以及先前在与第 三方内容提供者相关联的内容项目中使用的图像的储存库中的至少一个。
[0015] 在某些实施方式中,分析所提取的图像以检测视觉内容包括确定图像中的显著对 象和图像中的文本中的至少一个的位置。在某些实施方式中,分析所提取的图像以检测视 觉内容包括生成用于图像的显著性地图。该显著性地图识别图像中的显著对象和图像中的 文本中的至少一个的位置。
[0016] 在某些实施方式中,分析所提取的图像以检测语义内容包括生成描述图像的语义 内容的一个或多个标签并将生成的标签存储为图像的属性。
[0017] 在某些实施方式中,分析所提取的图像以检测视觉内容包括基于在图像中表示的 显著对象的位置来确定是否要对图像进行裁剪。在某些实施方式中,处理图像包括响应于 要对图像进行裁剪的确定而对图像进行裁剪以增强显著对象的视觉冲击。
[0018] 本公开的另一实施方式是一种用于提取并生成用于显示内容的图像的系统。该系 统包括处理电路,其被配置成从包括着陆资源和至少一个其它数据源的多个数据源提取图 像。处理电路进一步被配置成检测每个所提取的图像中的内容分布。该内容分布包括显著 对象的位置和文本的位置中的至少一个。该处理电路进一步被配置成基于内容分布检测的 结果来处理所提取的图像。处理所提取的图像包括响应于在图像中检测到的显著对象占用 小于图像中的阈值面积的确定而对所提取的图像进行裁剪。该处理电路进一步被配置成至 少部分地基于内容分布检测的结果而对提取的图像进行排名。
[0019] 在某些实施方式中,所述处理电路被配置成计算用于从着陆资源提取的每个图像 的页面上显著性分值。该显著性分值指示用来在着陆资源上显示所提取的图像的突出性。 在某些实施方式中,对所提取的图像进行排名至少部分地基于用于从着陆资源提取的每个 图像的页面上显著性分值。
[0020] 本领域的技术人员将认识到
【发明内容】
仅仅是说明性的,并且不旨在以任何方式是 限制性的。在已在本文中阐述并结合附图进行的以下描述中,如仅由权利要求限定的本文 所述的设备和/或过程的其它方面、发明特征以及优点将变得显而易见。
【附图说明】
[0021] 图1是根据所述实施方式的包括网络、内容请求者、着陆资源、资源渲染器以及内 容生成系统的计算机系统的框图。
[0022] 图2是根据所述实施方式的更详细地图示出图1的内容生成系统的框图,示出了图 像模块、色彩模块、文本模块、字体模块以及布局模块。
[0023] 图3是根据所述实施方式的更详细地图示出图2的图像模块的框图,示出了图像提 取模块、内容检测模块、图像处理模块以及图像排名模块。
[0024] 图4是根据所述实施方式的更详细地图示出图2的色彩模块的框图,示出了色彩提 取器和色彩方案选择器。
[0025] 图5是根据所述实施方式的更详细地图示出图2的文本模块的框图,示出了评论定 位器、情绪检测器以及文本选择器。
[0026] 图6是根据所述实施例的更详细地图示出图2的布局模块的框图,示出了布局生成 器和布局评分器。
[0027] 图7是根据所述实施方式的可由图6的布局生成器生成的"半对半布局"的图。
[0028] 图8是根据所述实施方式的可由图6的布局生成器生成的"文本覆盖"布局的图。
[0029] 图9是根据所述实施方式的可由图6的布局生成器生成的"倾斜文本"布局的图。
[0030] 图10是根据所述实施方式的可由图6的布局生成器生成的"模糊图像"布局的图。
[0031] 图11A是根据所述实施方式的可由图6的布局生成器生成的灵活布局的图,示出了 高评分图像和未使用空间。
[0032] 图11B是根据所述实施方式的图11A中所示的灵活布局的图,未使用空间被划分成 多个矩形。
[0033] 图11C是根据所述实施方式的在将某些矩形组合成较大的"横向风格"矩形之后的 图11B中所示的灵活布局的图。
[0034] 图11D是根据所述实施方式的在将某些矩形组合成较大的"竖向风格"矩形之后的 图11B中所示的灵活布局的图。
[0035] 图12A是根据所述实施方式的应用于包括图像、标题文本以及未使用空间的"横幅 风格"内容项目的可由图6的布局生成器生成的灵活布局的图。
[0036]图12B是根据所述实施方式的应用于图12A中所示的"横幅风格"内容项目的灵活 布局的图,未使用空间被划分成多个矩形。
[0037]图13是根据所述实施方式的用于自动地生成显示内容的过程的流程图。
[0038] 图14是根据所述实施方式的用于自动地生成显示内容项目的文本部分或纯文本 内容项目的过程的流程图。
[0039] 图15是根据所述实施方式的用于基于从着陆资源提取的图像、文本、色彩以及字 体来生成用于内容项目的看起来独特的布局的过程的流程图。
[0040] 图16是根据所述实施方式的用于提取并生成用于显示内容的图像的过程的流程 图。
【具体实施方式】
[0041] -般地参考附图,示出了根据所述实施方式的用于提取和生成用于显示内容的图 像的系统和方法。本文所述的系统和方法可用来自动地生成适合于特定第三方内容提供者 和/或特定着陆资源的第三方内容项目。从着陆资源提取图像及其它视觉信息(例如色彩、 文本、图形、字体、风格等)并将其用来生成与着陆资源相关联的第三方内容项目。例如,该 图像及其它视觉信息可以用来在与第三方内容项目的用户交互(例如,点击内容项目、在内 容项目上悬停等)时生成指向着陆资源(例如,经由嵌入式超链接)的第三方内容项目。 [0042]在操作中,根据本公开的内容生成系统从第三方内容提供者接收统一资源定位符 (URL)。该URL识别在这里称为着陆资源的特定电子资源(例如,网页)。第三方内容提供者可 将URL提交给内容生成系统作为请求生成指向着陆资源的第三方内容项目(例如,显示广 告)的请求的一部分。该内容生成系统使用URL来导航到着陆资源并从那里提取图像及其它 视觉信息。
[0043]在某些实施方式中,内容生成系统分析从着陆资源提取的图像以检测图像的视觉 内容。检测视觉内容可包括例如确定在图像中表示的显著对象的位置,确定图像中的文本 的位置,和/或确定图像是否可以被裁剪或处理以改善图像的视觉冲击。在某些实施方式 中,内容生成系统分析从着陆资源提取的图像以检测图像的语义内容。检测语义内容可包 括例如识别图像中所描绘的对象或图像所传达的含义。可以使描述图像的语义内容的标签 或关键字与图像相关联,其用来确定图像与特定第三方内容项目的相关性。
[0044]在某些实施方式中,内容生成系统处理图像。图像处理可以包括对图像进行裁剪 以强调显著对象或去除文本,将图像重新确定尺寸,将图像格式化,或者另外使图像准备好 包括在第三方内容项目中。在某些实施方式中,图像处理包括增强徽标图像。
[0045] 内容生成系统可基于图像的各种属性对图像进行过滤和排名。例如,可过滤具有 小于阈值显示尺寸的显示尺寸或小于阈值质量分值的质量分值的图像。可以基于与每个图 像相关联的显著性分值将图像排名。该显著性分值可指示用来在着陆资源上显示所提取图 像的突出性。内容生成系统可选择一个或多个最高排名的图像以包括在显示内容项目中。
[0046] 在某些实施方式中,由内容生成系统创建的内容项目是广告。该广告可以是显示 广告,诸如图像广告、flash广告、视频广告、基于文本的广告或其任何组合。在其它实施方 式中,内容生成系统可用来生成服务于各种非广告目的的其它类型的内容(例如,文本内 容、显不内容等)。
[0047] 现在参考图1,示出了根据所述实施方式的计算机系统100的框图。计算机系统100 被示为包括网络102、内容请求者104、着陆资源106、用户设备108、资源渲染器110、数据存 储设备112以及内容生成系统114。计算机系统100可促进内容生成系统114与内容请求者 104之间的通信。例如,内容生成系统114可经由网络102从内容请求者104接收内容生成请 求。内容生成系统114可响应于该请求而创建内容项目并向内容请求者104提供生成的内容 项目以供评论或批准。
[0048] 计算机系统100还可促进内容生成系统114、着陆资源106与资源渲染器110之间的 通信。例如,内容生成系统114可从着陆资源106和/或资源渲染器110接收视觉信息。例如, 在接收到用于内容生成的请求时,内容生成系统114可调用资源渲染器110以从着陆资源 106获得(例如下载)并渲染数据。资源渲染器110可经由网络102从着陆资源106接收数据, 并将这样的数据渲染为快照图像(例如,着陆资源106的视觉表示)和/或文本对象模型 (DOM)树。可将渲染的数据经由网络102从资源渲染器110传送到内容生成系统114。
[0049] 网络102可包括任何类型的计算机网络,诸如局域网(LAN)、广域网(WAN)、蜂窝式 网络、卫星网络、无线电网络、因特网或任何其它类型的数据网络。网络102可包括被配置成 传送、接收或中继数据的任何数目的计算设备(例如,计算机、服务器、路由器、网络交换机 等)。网络102还可包括任何数目的硬连线和/或无线连接。例如,内容请求者104可与被硬连 线(例如,经由光纤电缆、CAT5电缆等)至网络102的计算设备的收发机进行无线通信(例如, 经由WiFi、蜂窝、无线电等)。
[0050] 仍参考图1,计算机系统100被示为包括内容请求者104。内容请求者104可包括从 其接收到用以生成内容项目的请求的一个或多个实体。例如,内容请求者104可包括广告 主、广告代理、第三方内容提供者、发布者、网站提供者或者可以从其接收到用以生成内容 项目的请求的任何其它实体。
[0051] 在某些实施方式中,内容请求者104包括能够提交用于内容生成的请求的一个或 多个电子设备(例如,计算机、计算机系统、服务器等)。内容请求者104可包括用户可通过其 输入内容生成请求的用户输入设备(例如,键盘、鼠标、麦克风、触摸屏、平板电脑、智能电话 等)。内容请求者104可经由网络102向内容生成系统114提交内容生成请求。在某些实施方 式中,内容生成请求包括统一资源定位符(URL) WRL可指定特定着陆资源(例如,着陆资源 106中的一个)的位置。
[0052] 在某些实施方式中,内容请求者104向内容生成系统114提交活动参数。该活动参 数可用来控制由内容生成系统114产生的第三方内容项目的分发。该活动参数可包括与第 三方内容项目相关联的关键字、对应于关键字的出价、内容分发预算、地理限制器或者被内 容生成系统114或分立内容服务器用来确定何时可向用户设备呈现第三方内容项目的其它 准则相关联。
[0053]内容请求者104可访问内容生成系统114以监视根据建立的活动参数分发的第三 方内容项目的性能。例如,内容请求者104可访问内容生成系统114以评论与第三方内容项 目或第三方内容项目集合相关联的一个或多个行为度量。行为度量可描述用户设备108之 间的相对于分布式第三方内容项目或第三方内容项目集合的交互(例如,闪现 (impression)数目、点击数目、转换数目、花费数额等)。该行为度量可基于与账户系统或日 志文件处理系统记录并处理的用户动作。
[0054] 仍参考图1,计算机系统100被示为包括着陆资源106。着陆资源106可包括可以通 过网络102提供的任何类型的信息或数据结构。在某些实施方式中,可通过与着陆资源106 相关联的资源地址(例如,URL)来识别着陆资源106。着陆资源106可包括网页(例如,HTML网 页、PHP网页等)、文字处理文档、可移植文档格式(PDF)文档、图像、视频、编程元件、交互式 内容、流送视频/音频源或其它类型的电子信息。
[0055] 着陆资源106可以是网页、本地资源、内部网资源、因特网资源或其它网络资源。在 某些实施方式中,着陆资源106包括当设备108与由内容生成系统114生成的内容项目相交 互时用户设备108被指引到(例如,经由嵌入式超链接)的一个或多个网页。在某些实施方式 中,着陆资源106提供关于在生成的内容项目中展示的产品、服务或企业的附加信息。例如, 着陆资源106可以是可通过其购买在生成的内容项目中展示的产品或服务的网站。
[0056] 在某些实施方式中,着陆资源106可被内容请求者104指定为用以生成内容项目的 请求的一部分。可将着陆资源106指定为指向着陆资源106中的一个或者另外指定着陆资源 106的位置的URL。可将该URL包括为内容生成请求的一部分。在某些实施方式中,可将着陆 资源106与内容请求者104组合。例如,着陆资源106可包括存储在一个或多个电子设备(例 如,计算机、服务器等)上的由内容请求者104维护的数据。在其它实施方式中,着陆资源106 可与内容请求者104分离。例如,着陆资源106可包括存储在远程服务器(例如,FTP服务器、 文件共享服务器、web服务器)、服务器的组合(例如,数据中心、云计算平台等)或与内容请 求者104分开的其它数据存储设备上的数据。
[0057] 仍参考图1,计算机系统100被示为包括用户设备108。用户设备108可包括任何数 目和/或类型的用户可操作电子设备。例如,用户设备108可包括台式计算机、膝上型计算 机、智能电话、平板电脑、移动通信设备、远程工作站、客户端终端、娱乐控制台或者能够与 计算机系统100的其它部件相交互(例如,经由通信接口)的任何其它设备。用户设备108可 能能够接收来自着陆资源106的资源内容和/或由内容生成系统114生成的第三方内容项 目。用户设备108可包括移动设备或非移动设备。
[0058]在某些实施方式中,用户设备108包括用于将电子内容转换成用户可理解格式(例 如,视觉、听觉、图形等)的应用(例如,web浏览器、资源渲染器等)。用户设备108可包括用于 向用户呈现内容、接收用户输入或促进与电子内容的用户交互(例如,点击内容项目、在内 容项目上悬停等)的用户接口元件(例如,电子显示器、扬声器、键盘、鼠标、麦克风、打印机 等)。用户设备108可充当用于允许用户观看HTML编码内容的用户代理。
[0059] 用户设备108可包括能够处理嵌入信息(例如,嵌入在超链接中的元信息等)并执 行嵌入指令的处理器。嵌入指令可包括与在其内呈现第三方内容项目的内容时隙相关联的 计算机可读指令(例如,软件代码、·丨avaScript?、ECM A Script?等)。
[0060] 在某些实施方式中,用户设备108能够检测与分布式内容项目的交互。与内容项目 的交互可包括显示内容项目、在内容项目上悬停、点击内容项目、观看用于内容项目的源信 息或者用户设备108与内容项目之间的任何其它类型的交互。与内容项目的交互不要求用 户相对于特定内容项目的明确动作。在某些实施方式中,闪现(例如,显示或呈现内容项目) 可有资格作为交互。用于定义哪些用户动作(例如,主动的或被动的)有资格作为交互的准 则可由内容请求者104或由内容生成系统114单独地(例如,针对每个内容项目)确定。
[0061] 用户设备108可生成多种用户动作。例如,用户设备108可响应于检测到的与内容 项目的交互而生成用户动作。该用户动作可包括多个属性,包括内容标识符(例如内容ID或 签名元素)、设备标识符、引用URL标识符、时间戳和描述交互的任何其它属性。用户设备108 可在由用户设备执行特定动作(例如,资源观看、在线购买、搜索查询提交等)时生成用户动 作。由用户设备108生成的用户动作可被传送到内容生成系统114或单独账户系统。
[0062] 对于其中在这里讨论的系统收集关于用户的个人信息或者可利用个人信息的情 况而言,可为用户提供控制程序或特征是否可收集用户信息(例如,关于用户的社交网络、 社交动作或活动、职业、用户的偏好或用户的当前位置的信息)或控制是否和/或如何从内 容服务器接收可能与用户更有关的内容的机会。另外,可在某些数据被存储或使用之前以 一个或多个方式对其进行处理(例如,由内容生成系统114),使得个人可识别信息被去除。 例如,可处理用户的身份,使得对于用户而言不能确定个人可识别信息,或者可在获得位置 信息的情况下将用户的地理位置广义化(诸如到城市、ZIP代码或州层级),使得不能确定用 户的特定位置。因此,用户可控制信息如何被收集(例如,由应用、由用户设备108等)并被内 容生成系统114使用。
[0063] 仍参考图1,系统100被示为包括资源渲染器110。资源渲染器110可以是能够解释 着陆资源106并创建其视觉表示(例如图像、显示等)的硬件或软件部件。例如,着陆资源106 可包括标记内容(例如,HTML、XML、图像URL等)以及格式化信息(例如,CSS、XSL等)。资源渲 染器110可下载标记内容和格式化信息并根据万维网联盟(W3C)标准渲染着陆资源106。资 源渲染器110可创建着陆资源106的"快照图像"和/或构造表示着陆资源106的文档对象模 型(D0M)树。
[0064] 快照图像可以是特定着陆资源106的视觉表示。快照图像可图示出在渲染着陆资 源106之后在用户接口设备(例如,电子显示屏、计算机监视器、触敏显示器等)上呈现的着 陆资源106的视觉外观。快照图像可包括用于着陆资源106的色彩信息(例如,像素色彩、亮 度、饱和度等)和风格信息(例如,方角、圆边、现代、乡村等)。在某些实施方式中,快照图像 可以是具有任何可行文件扩展(例如,jpg、. png、. bmp等)的图片文件。
[0065] D0M树可以是特定着陆资源106的分级模型。D0M树可包括用于着陆资源106的图像 信息(例如,图像URL、显示位置、显示尺寸、alt文本等)、字体信息(例如,字体名、大小、效果 等)、色彩信息(例如,RGB色值、十六进制色彩代码等)和文本信息。
[0066] 在各种实施方式中,资源渲染器110可以是内容生成系统114或单独部件的一部 分。资源渲染器110可响应于来自内容生成系统114的渲染请求而准备快照图像和/或D0M 树。资源渲染器110可响应于渲染请求而向内容生成系统114传送快照图像和/或D0M树。
[0067] 仍参考图1,计算机系统100被示为包括数据存储设备112。数据存储设备112可以 是能够存储简档数据、内容项目数据、账户数据或者被内容生成系统114或计算机系统110 的另一部件使用的任何其它类型的数据的任何类型的存储器设备。数据存储设备112可包 括任何类型的非易失性存储器、介质或存储器设备。例如,数据存储设备112可包括半导体 存储器设备(例如,EPROM、EEPR0M、闪存设备等)磁盘(例如,内部硬盘、可移动磁盘等)、磁光 盘和/或CD ROM和DVD-ROM盘。
[0068] 在某些实施方式中,数据存储设备112在内容生成系统114、着陆资源106或内容请 求者104本地。在其它实施方式中,数据存储设备112是经由网络102与内容生成系统114和/ 或内容请求者104相连的远程数据存储设备。在某些实施方式中,数据存储设备112是能够 接收来自内容生成系统114和/或内容请求者104的查询并对其进行响应的数据存储服务器 或系统的一部分。
[0069] 在某些实施方式中,数据存储设备112被配置成存储从着陆资源106提取的视觉信 息。例如,数据存储设备112可存储用于在着陆资源106上显示的各种图像的图像数据。图像 数据可包括实际图像(例如,图像文件)、图像的URL位置、图像属性、图像元数据或在着陆资 源106上显示的图像的其它质量。
[0070] 数据存储设备112可被配置成存储已结合内容请求者104使用的先前内容项目。先 前内容项目可包括由内容请求者104提供的内容项目、由内容生成系统114针对内容请求者 104创建的内容项目、先前被内容请求者104使用或批准的图像和/或先前生成的内容项目 的其它组成部分。数据存储设备112可以是用于从着陆资源106提取的页面上图像、先前被 内容请求者104使用或批准的图像和/或未从着陆资源106提取或被内容请求者104批准的 其它图像的图像储存库。
[0071] 仍参考图1,计算机系统100被示为包括内容生成系统114。内容生成系统114可被 配置成从着陆资源106提取视觉信息(例如,图像、色彩、文本、字体、风格等)。内容生成系统 114可分析提取的图像以检测其视觉内容和语义内容。例如,内容生成系统114可确定提取 图像中的内容分布(例如,显著对象的位置、文本的位置等)并用图像表示什么的定性描述 (例如,汽车类型、鞋的品牌等)来标记所提取的图像。内容生成系统114可处理提取的图像 (例如,裁剪、增强、优化、格式化等)并选择图像以便在第三方内容项目中使用。内容生成系 统114可创建包括所选择的图像的第三方内容项目并将所创建的第三方内容项目派发给用 户设备108。参考图2来更详细地描述内容生成系统114。
[0072] 现在参考图2,根据所述实施方式,示出了更详细地图示出内容生成系统114的框 图。内容生成系统114被示为包括通信接口 202和处理电路204。通信接口 202可包括用于与 本地或远程设备或系统执行数据通信的有线或无线接口(例如,插孔、天线、发射机、接收 机、收发机、导线端子、以太网端口、WiFi收发机等)。例如,通信接口 202可允许内容生成系 统114与内容请求者104、资源106、用户设备108、资源渲染器110以及计算机系统100的其它 部件通?目。
[0073] 处理电路204被示为包括处理器206和存储器208。可将处理器206实现为通用处理 器、专用集成电路(ASIC)、一个或多个现场可编程门阵列$?6六)、0?1]、6?1]、处理部件组或其 它适当的电子处理部件。
[0074]存储器208可包括用于存储数据和/或计算机代码以便完成和/或促进在本公开中 描述的各种过程、层以及模块的一个或多个设备(例如,RAM、ROM、闪存、硬盘存储等)。存储 器208可包括易失性存储器或非易失性存储器。存储器208可包括数据库部件、目标代码部 件、脚本部件或者用于支持在本公开中描述的各种活动和信息结构的任何其它类型的信息 结构。在某些实施方式中,存储器208经由处理电路204通信连接到处理器206并包括用于执 行本文所述的一个或多个过程的计算机代码(例如,存储在存储器208中的数据模块)。简而 言之,存储器208被示为包括资源渲染器模块210、图像模块212、色彩模块214、文本模块 216、字体模块218以及布局模块220。
[0075]仍参考图2,存储器208被示为包括资源渲染器模块210。在某些实施方式中,由资 源渲染器模块210而不是外部资源渲染服务(例如,资源渲染器110)来执行资源渲染。资源 渲染器模块210可包括如参考图1所述的资源渲染器110的功能。例如,资源渲染器模块210 可能能够解释着陆资源106并创建其视觉表示(例如,图像、显示等)。
[0076]资源渲染器模块210可使用URL或由内容请求者104提供的其它指示符来识别特定 着陆资源作为用以生成内容项目的请求的一部分。资源渲染器模块210可从着陆资源106读 取并解释标记内容(例如,HTML、XML、图像URL等)和格式化信息(例如,CSS、XSL等)并渲染着 陆资源1〇6(例如,根据W3C标准)。资源渲染器模块210可创建着陆资源106的快照图像和/或 构造表示着陆资源106的D0M树。
[0077]快照图像可以是所识别的着陆资源106的视觉表示。快照图像可图示出在渲染着 陆资源106之后在用户接口设备(例如,电子显示屏、计算机监视器、触敏显示器等)上呈现 的着陆资源106的视觉外观。快照图像可包括用于着陆资源106的色彩信息(例如,像素色 彩、亮度、饱和度等)和风格信息(例如,方角、圆边、现代、乡村等)。在某些实施方式中,快照 图像可以是具有任何可行文件扩展(例如,jpg、. png、. bmp等)的图片文件。
[0078] D0M树可以是已识别的着陆资源106的分级模型。D0M树可包括用于着陆资源106的 图像信息(例如,图像URL、显示位置、显示尺寸、alt文本等)、字体信息(例如,字体名、大小、 效果等)、色彩信息(例如,RGB色值、十六进制色彩代码等)和文本信息。资源渲染器模块210 可将快照图像和/或D0M树存储在存储器208中以供内容生成系统114的其它模块随后使用。 [0079]仍参考图2,存储器208被示为包括图像模块212。图像模块212可被配置成从着陆 资源106提取图像。例如,图像模块212可解析用于着陆资源106的D0M树以识别并提取图像 和图像元数据(例如,图像URL、显示位置、显示尺寸、alt文本等)。该图像元数据可用来确定 用于在着陆资源106上显示的每个图像的页面上显著性。在某些实施方式中,图像模块212 从其它数据源(例如,先前使用或批准的图像的储存库、库存图像的储存库等)提取图像和 图像元数据。
[0080] 图像模块212可分析所提取的图像以检测图像的视觉内容。检测视觉内容可包括 例如确定在图像中表示的显著对象的位置,确定图像中的文本的位置和/或确定图像是否 可以被裁剪或处理以改善图像的视觉冲击。在某些实施方式中,图像模块212分析提取的图 像以检测图像的语义内容。检测语义内容可包括例如识别图像中所描绘的对象或图像所传 达的含义。图像模块212可向图像分配描述其语义内容的一个或多个标签或关键字。该标签 和/或关键字可以用来确定图像与特定第三方内容项目的相关性。
[0081] 图像模块212可处理图像以使图像准备好在第三方内容项目中使用。图像处理可 包括对图像进行裁剪以强调显著对象或去除文本、将图像重新确定尺寸、将图像格式化或 者另外调整图像。在某些实施方式中,图像模块212识别并增强徽标图像。
[0082] 图像模块212可基于图像的各种属性对图像进行过滤和排名。图像模块212可确定 用于每个图像的质量分值和/或页面上显著性分值。用于图像的质量分值可基于各种图像 属性来指示图像的审美外观。显著性分值可指示用来在着陆资源106上显示所提取的图像 的突出性。图像模块212可将具有小于阈值显示尺寸的显示尺寸或小于阈值质量分值的质 量分值的图像丢弃或过滤。在某些实施方式中,图像模块212可基于与图像相关联的显著性 分值将图像排名。图像模块212可选择最高排名的一个或多个图像以便包括在显示内容项 目中。参考图3来更详细地描述图像模块212。
[0083]仍参考图2,存储器208被示为包括色彩模块214。色彩模块214可生成用于显示内 容的色彩方案。例如,色彩模块214可选择用于内容项目的背景、标题、描述、按钮背景和/或 按钮文本的色彩。色彩方案可包括对应于在着陆资源106上显示的色彩的一个或多个色彩。
[0084]色彩模块214可使用着陆资源106的快照图像和/或D0M树来选择用于内容项目的 色彩。在某些实施方式中,色彩模块214可使用集群技术(例如,k-means集群)从快照图像提 取多个色彩集群。参考图4来更详细地描述色彩模块214。
[0085]仍参考图2,存储器208被示为包括文本模块216。文本模块216可被配置成自动地 创建第三方内容项目的文本部分(例如,文本描述、标题等)。在各种实施方式中,文本模块 216可用来创建显示内容项目的文本部分或纯文本内容项目。在某些实施方式中,文本模块 216使用着陆资源106的D0M树或快照图像来创建在着陆资源106上显示的文本的概要。在某 些实施方式中,文本模块216从除着陆资源106之外或作为其替代的其它数据源检索文本数 据。例如,文本模块216可从企业、产品或服务的用户创建评论接收文本数据。可从允许用户 在其上面张贴或提交意见、评论或与特定企业、产品或服务有关的其它文本的因特网资源 (例如,网站)检索该评论。可使用着陆资源106的URL来指定此类评论的位置和/或使文本模 块216指向特定资源。
[0086]文本模块216可包括情绪检测系统,其能够在有或没有数字表示评级(例如,"5中 的1"、"4星"等)的情况下确定评论是正面的还是负面的。情绪检测系统可解析评论的语言, 寻找指示正面的形容词(例如,极好、好、很好、奇妙等)。情绪检测系统然后可选择或提取包 括此类正面短语的评论的相对短的片断以便包括在生成的内容项目中。参考图5来更详细 地描述文本模块216。
[0087]仍参考图2,存储器208被示为包括字体模块218。字体模块218可选择字体或字体 系列以便在生成的内容项目中使用。在某些实施方式中,着陆资源106可包括诸如HTML、CSS 或XML字体标签之类的字体信息。字体模块218可使用用于着陆资源106的渲染DOM树来提取 一个或多个字体(例如,字体面、字体系列等)。字体模块218可从着陆资源106的渲染D0M树 或者直接地从着陆资源1〇6(例如,使用光学字符识别等)提取字体信息。
[0088]在某些实施方式中,字体模块218基于字体大小将提取的字体分离成多个种类。例 如,字体模块218可创建用于大字体(例如,大于20pt、大于16pt等)的第一种类和用于相对 较小的字体的第二种类。可从渲染的D0M树或者直接地从着陆资源106提取字体大小。在某 些实施方式中,字体模块218选择多个字体或字体系列以便在第三方内容项目中使用。例 如,字体模块218可选择第一字体以用作用于生成的内容项目的标题字体并选择第二字体 以用作用于内容项目的描述性部分或按钮文本的字体。
[0089]仍参考图2,存储器208被示为包括部件模块220。布局模块220可被配置成使用所 选择的文本、图像、色彩以及字体来生成用于内容项目的布局。布局模块220可从一组预定 义布局选项(例如,模板布局)中选择布局或者生成新的布局(例如,不基于模板)。布局模块 220可基于由图像模块212选择的图像的显示尺寸和/或由文本模块216选择的文本的长度 来生成布局。布局模块220可将图像重新确定尺寸和/或调整文本以适合于所选择的布局或 调整布局以适合于所选择的图像和/或文本。
[0090]在某些实施方式中,布局模块220使用从着陆资源106提取的视觉信息来确定风 格、企业种类或用于内容项目的外观。例如,布局模块220可确定着陆资源106的企业种类 (例如,快餐、汽车零部件等)、着陆资源106的风格(例如,现代或乡村)以及在着陆资源106 上显示的形状的使用(例如,90度角、圆角等)。布局模块220可调用外部数据库以基于着陆 资源106的URL来检索企业种类信息。参考图6来更详细地描述布局模块220。
[0091]现在参考图3,示出了根据所述实施方式的更详细地图示出图像模块212的框图。 图像模块212被示为包括图像提取模块302、内容检测模块304、图像处理模块306以及图像 排名模块308。
[0092]图像提取模块302可被配置成从着陆资源106和/或其它数据源提取图像。例如,图 像提取模块302可从资源渲染器110接收用于着陆资源106的D0M树。图像提取模块302可解 析D0M树以识别并提取图像和图像元数据(例如,图像URL、显示位置、显示尺寸、alt文本 等)。在某些实施方式中,图像模块212从其它数据源提取图像和图像元数据。
[0093]图像提取模块302可以从其提取图像的其它数据源被示为包括已使用图像数据库 310和库存图像数据库312。已使用图像数据库310可以是用于在指向与当前生成的内容项 目相同的着陆资源1〇6(例如,同一 URL、同一域等)的先前内容项目中使用的所有图像的储 存库。已使用图像数据库310可包括由内容请求者104提供的图像和/或先前已被内容请求 者104批准的图像。可将已使用图像数据库310中的图像与附加数据(例如,图像元数据)一 起存储,该附加数据诸如与其中包括图像的先前第三方内容项目相关联的关键字及其它数 据。
[0094]库存图像数据库312可以是用于不一定与内容请求者104相关联或者从着陆资源 106提取的多种图像的储存库。库存图像数据库312可包括已从其它资源提取或者另外提供 给内容生成系统114的图像。在某些实施方式中,图像提取模块302确定数据库310-312中的 图像与当前生成的内容项目的相关性分值(例如,通过比较关键字等)。在某些实施方式中, 图像提取模块302仅从数据库310-312提取具有超过相关性分值阈值的相关性分值的图像。 从已使用图像数据库310和/或库存图像数据库312提取的图像可包括例如企业徽标(例如, 商标、服务标志等)、特色产品的图片或其它突出图像。
[0095] 在某些实施方式中,图像提取模块302使用图像元数据来确定用于在着陆资源106 上显示的每个图像的页面上显著性。用于图像的页面上显著性可指示用来在着陆资源106 上显示图像的相关重要性或突出性。图像提取模块302可提取图像的各种属性,诸如图像的 垂直放置(例如,页面的顶部、页面的中间、页面的底部等)、图像的显示尺寸(例如,显示高 度、显示宽度等)、图像是否在着陆资源106上居于中心、图像周围的视觉杂乱和/或可与页 面上显著性有关的其它属性。
[0096] 在某些实施方式中,图像提取模块302提取徽标图像。徽标图像可以是商标、企业 徽标、产品徽标、公司徽标或者与特定产品、服务或组织相关联的任何其它图像。在某些实 施方式中,图像提取模块302查询数据库310-312以识别先前由内容请求者104提交或批准 的徽标图像。在某些实施方式中,可用URL或域名来组织数据库310-312,使得可容易地通过 指定URL来检索徽标信息。例如,图像提取模块302可使用着陆资源106的URL来搜索数据库 310-312。在各种实施方式中,图像提取模块302可从已从着陆资源106提取(例如,用URL)的 图像集合或者从存储在数据库310-312中的图像识别徽标图像。
[0097] 在某些实施方式中,数据库310-312可不包含用于着陆资源106或与着陆资源106 相关联的域的徽标信息。当没有徽标信息可用时,图像提取模块302可尝试使用其它技术来 识别徽标图像。在某些实施方式中,图像提取模块302对着陆资源106或与提取的图像相关 联的元数据搜索特殊徽标标记标签。特殊徽标标记标签的一个示例是:
[0098] 〈link rel = 〃example-log〇-markup〃href = 〃somepath/image.png〃>
[0099]其中,使用文本串'example-logo-markup'作为识别徽标图像的关键字。在其它实 施方式中,可使用不同的文本串或关键字。可基于着陆资源106的URL、与着陆资源106相关 联的域、与着陆资源106相关联的企业实体或任何其它准则来选择特定文本串或关键字。可 使用任何数目的徽标标记关键字来识别潜在徽标图像。图像提取模块302可提取'href'属 性值(例如,somepath/image.png)作为指定潜在徽标图像的位置的URL。
[0100]在某些实施方式中,图像提取模块302搜索图像元数据(例如,HTML标签、URL、显示 位置、显示尺寸、alt文本、文件名、文件尺寸)以识别徽标图像。例如,图像提取模块302可搜 索图像文件名、alt文本或标题属性中的指示徽标图像的文本串或关键字(例如,"徽标")。 [0101]图像提取模块302可生成从着陆资源106、已使用图像数据库310和/或库存图像数 据库312提取的图像的列表、集合或编译。在某些实施方式中,可将从着陆资源106提取的图 像存储在图像数据库(例如,数据存储设备112、存储器208等)中。可与用于每个图像的元数 据和显著性准则(例如,作为图像URL、显示位置、显示尺寸、alt文本、文件名、文件尺寸等) 相结合地存储所提取的图像。可使用由图像提取器252生成的图像的列表和与每个提取的 图像相关联的信息来选择一个或多个图像以便包括在生成的内容项目中。
[0102] 仍参考图3,图像模块212被示为包括内容检测模块304。内容检测模块304可被配 置成分析由图像提取模块302提取的图像以检测图像中的各种类型的内容分布(例如,文 本、显著对象、人脸等)、图像的语义内容和/或图像的审美质量。
[0103] 在某些实施方式中,内容检测模块304识别每个提取的图像的显示尺寸。如果用于 图像的显示尺寸小于阈值显示尺寸(例如,阈值高度、阈值宽度、阈值面积等),则内容检测 模块304可丢弃图像。在某些实施方式中,内容检测模块304识别用于每个已提取的图像的 纵横比。如果用于图像的纵横比不在预定义纵横比范围(例如,0.2-5、0.33-3、0.5-2等)内, 则内容检测模块304可丢弃图像。
[0104] 内容检测模块304被示为包括内容分布检测器314、语义内容检测器316以及质量 检测器318。内容分布检测器314可被配置成检测由图像提取模块302提取的图像中的内容 的位置、尺寸和/或分布。内容分布检测器314可检测各种类型的图像内容的分布,诸如色 彩、边缘、人脸以及文本。
[0105] 在某些实施方式中,内容分布检测器314被配置成对所提取的图像中的显著对象 进行定位。显著对象可以是前景对象、特征对象或者在所提取的图像中突出地显示的其它 对象。在某些实施方式中,内容分布检测器314分析图像中的色彩的分布以将前景对象与背 景色彩区别开。内容分布检测器314可识别所提取的图像中的边缘以检测对象(例如,前景 对象、背景对象、并排对象等)之间的边界。将显著对象与其它对象区别开可对识别图像的 最有意义或重要区域有用。
[0106] 在某些实施方式中,内容分布检测器314被配置成检测所提取的图像中的文本。内 容分布检测器314可对所提取的图像执行光学字符识别(OCR)以检测各种类型的文本(例 如,标题文本、创意文本、唤起行动文本、广告文本等)。某些提取的图像其本身可以是包括 其自己的创意文本的广告。内容分布检测器314可识别包括文本的图像区域,使得该文本可 以被裁剪或从图像去除。
[0107] 在某些实施方式中,内容分布检测器314生成用于每个提取的图像的显著性地图。 该显著性地图可标记图像中的文本、人脸和/或前景对象的位置。例如,可用矩形列表来识 别具有文本或人脸的区域。可用二进制位图、线或边界标记来表示前景区域。内容分布检测 器314可确定图像中的显著对象相对于整个图像的尺寸。如果图像中所表示的显著对象与 整个图像的显示尺寸相比是相对小的(例如,小于阈值、小于总显示尺寸的一定百分比等), 内容分布检测器314可丢弃该图像或者将该图像从用于包括在生成的内容项目的候选的图 像列表中去除。
[0108] 仍参考图3,内容检测模块304被示为包括语义内容检测器316。语义内容检测器 316可被配置成分析由图像提取模块302提取的图像以检测图像的语义内容。检测语义内容 可包括例如识别图像中所描绘的对象或图像所传达的含义。语义内容检测器316可使用视 觉搜索服务(VSS)、图像内容注释前端(ICAFE)和/或图像内容注释服务(ICAS)来确定图像 的语义内容。此类服务可被配置成接收图像(例如,图像URL、图像文件等)、分析图像以及输 出描述图像中描绘的内容的各种标签(例如,标题、关键字、短语等)。语义内容检测器316可 将图像注释和搜索服务配置成使用不同模块(例如,徽标模块、产品模块等)来精化针对输 入图像生成的关键字和标签。
[0109] 语义内容检测器316可向图像分配标签或关键字作为其属性或标签。例如,针对奥 迪牌汽车的图像,语义内容检测器316可向图像分配关键字"汽车"、"跑车"、"奥迪"、"Audi R8VI 0"或者定性地描述图像的内容的其它关键字。在某些实施方式中,语义内容检测器 316可使每个关键字或标签与指示关键字或标签对图像的估计准确度或相关性的分值相关 联。该标签和/或关键字可以被图像排名模块308用来确定图像与特定第三方内容项目、搜 索查询和/或电子资源的相关性。
[0110] 仍参考图3,内容检测模块304被示为包括质量检测器318。质量检测器318可被配 置成确定由图像提取模块302提取的图像的视觉质量(例如,审美质量)。用于图像的视觉质 量可基于图像的视觉特征来表示用于图像的人类视觉偏好,所述视觉特征诸如图像的曝光 度、锐度、对比度、色彩方案、色彩密度和/或其它审美质量。
[0111] 质量检测器318可通过利用计算机视觉、聚类以及用于图像的元数据来以算法方 式确定视觉质量。例如,质量检测器318可使用图像或图像特征作为到针对人类所标记的图 像偏好而被训练的排名模型的输入。在某些实施方式中,质量检测器318将图像的特征与先 前已被人类评分以识别图像的审美或视觉质量的图像特征相比较。具有与被人类评高分的 图像特征更紧密地匹配的特征的图像可被质量检测器318分配较高的质量分值。具有与被 人类评高分的图像特征不同的特征的图像可被质量检测器318分配较低的质量分值。
[0112]仍参考图3,图像模块212被示为包括图像处理模块306。图像处理模块306可被配 置成处理由图像提取模块302提取的图像以使图像准备好在内容项目中使用。图像处理模 块306可接收由内容检测模块304生成的内容检测结果作为输入,并且可输出已处理的图 像。在各种实施例中,处理图像可包括对图像进行裁剪,将图像格式化,增强图像,将文本从 图像去除,或者另外调整图像以便在自动生成的内容项目中使用。图像处理模块306被示为 包括图像裁剪器320和图像增强器322。
[0113]图像裁剪器320可被配置成基于由内容分布检测器314检测到的图像内容的分布 来确定是否要对每个提取的图像进行裁剪。例如,图像裁剪器320可使用由内容分布检测器 314生成的显著性地图来确定包含显著对象(例如,前景对象)、文本、人脸和/或其它类型的 所检测的内容的每个图像的面积。可将包含显著对象、文本以及人脸的图像部分在显著性 地图中表示为矩形。图像裁剪器320可使用显著性地图所指示的内容分布来识别要保持的 每个图像的一部分和要丢弃的每个图像的一部分。
[0114]在某些实施方式中,图像裁剪器320被配置成识别包含显著对象的每个图像的一 部分。图像中的显著对象的位置可被内容分布检测器314表示为显著性地图中的一对矢量。 例如,可用定义图像中的矩形的垂直矢量和水平矢量来指示显著对象的位置。图像裁剪器 320可确定每个图像内的包含显著对象的一个或多个矩形的尺寸和位置。对于包含多个显 著对象的图像而言,图像裁剪器320可选择要保持的显著对象中的一个或多个和要丢弃的 显著对象中的一个或多个。在某些实施方式中,图像裁剪器320生成包含多个显著对象的矩 形。由图像裁剪器320生成的矩形可以是包括多个显著对象的最小可能矩形。
[0115]在某些实施方式中,图像裁剪器320确定包含显著对象的矩形相对于图像的总显 示尺寸的尺寸(例如,作为总显示尺寸的百分比、作为图像的总面积的比例等)。在某些实施 方式中,图像裁剪器320确定包含显著对象的矩形的边缘(例如,顶边、底边、侧边等)与图像 的边缘之间的空间的量。例如,图像裁剪器320可识别包含显著对象的矩形的边缘与图像边 缘之间的距离(例如,像素数等)。图像裁剪器320可确定矩形的每个边缘与图像的相应边缘 之间的距离(例如,矩形的顶边与图像的顶边之间的距离、矩形的底边与图像的底边之间的 距离等)。
[0116] 图像裁剪器320可基于图像内的显著对象的尺寸和位置来确定是否要对图像进行 裁剪。针对每个图像,图像裁剪器320可基于图像的显示尺寸(例如,显示尺寸的80%、显示 尺寸的60%等)来计算面积阈值。如果包含显著对象的矩形具有超过面积阈值的面积,则图 像裁剪器320可确定不应对图像进行裁剪。如果包含显著对象的矩形具有小于面积阈值的 面积,则图像裁剪器320可确定应对图像进行裁剪。在某些实施方式中,如果显著对象占用 小于图像的约三分之一的面积,则图像裁剪器320确定应对图像进行裁剪。
[0117] 图像裁剪器320可对图像进行裁剪以去除不包含显著对象的某些或所有图像内 容。例如,图像裁剪器320可对图像进行裁剪,使得只有包含显著对象的矩形留下。在某些实 施方式中,图像裁剪器320将图像裁剪成包括显著对象矩形和该显著对象矩形周围的边界。
[0118] 在某些实施方式中,图像裁剪器320被配置成从图像裁剪文本。图像裁剪器320可 使用由内容分布检测器314生成的显著性地图来识别包括文本的每个图像的一部分。例如, 图像裁剪器320可识别指示图像中的文本的位置的一个或多个矩形。在某些实施方式中,图 像裁剪器320基于包含显著对象的图像面积和包含文本的图像面积来确定要保持的图像的 一部分。例如,图像裁剪器320可将包含文本的图像部分丢弃,同时保持包含显著对象的图 像部分。图像裁剪器320可通过生成矩形来从图像裁剪文本,该矩形包括包含显著对象的一 个或多个矩形且没有包含文本的矩形。在某些实施方式中,图像裁剪器320将图像裁剪成仅 包括在由图像裁剪器320生成的矩形内的图像内容(例如,显著对象、人脸等)。
[0119] 在某些实施方式中,图像裁剪器320被配置成从图像画面裁剪徽标图像。例如,由 图像提取模块302提取的某些图像可以是单独按钮或徽标图像的组合或编译(例如,在网格 中包含多个徽标的拼接帆布)。图像裁剪器320可被配置成确定图像画面内的徽标图像的位 置并裁剪图像画面,使得只有徽标图像留下。
[0120]仍参考图3,图像处理模块306被示为包括图像增强器322。图像增强器322可被配 置成增强或优化由图像提取模块302提取的图像以便在生成的内容项目中使用。增强或优 化图像可包括例如使图像的边缘成圆形,向图像添加照明效果,向图像添加纹理或深度和/ 或应用其它效果来增强图像的视觉冲击。
[0121]在某些实施方式中,图像增强器322使用由内容检测模块304产生的内容检测结果 来识别徽标图像。某些徽标图像可被图像提取模块302作为平直且简单的徽标提取。例如, 当徽标被用户设备108渲染时,着陆资源106可依赖于CSS或另一内容标记方案来改变平直/ 简单徽标的外观。图像增强器322可处理徽标图像以通过促使徽标看起来是三维的、添加深 度或照明效果、使拐角成圆形、促使徽标表现为按钮、优化徽标以便在移动设备上显示或者 另外调整徽标以改善其视觉冲击来将平直/简单的徽标转换成优化徽标。图像处理模块306 可将已处理图像存储在数据存储设备中。
[0122] 仍参考图3,图像模块212被示为包括图像排名模块308。图像排名模块308可被配 置成将各种图像排名以确定图像中的哪些将包括在生成的内容项目中。图像排名模块308 被示为包括页面上显著性计算器324和图像内容评估器326。
[0123] 页面上显著性计算器324可被配置成基于用来在着陆资源106上显示图像的相对 重要性或突出性来向由图像提取模块302提取的每个图像分配显著性分值。例如,用于图像 的显著性分值可取决于图像的垂直放置(例如,页面的顶部、页面的中间、页面的底部等)、 图像的显示尺寸(例如,显示高度、显示宽度等)、图像是否在着陆资源106上居于中心和/或 其它图像显著性评分准则。
[0124] 可以被页面上显著性计算器324使用的图像显著性评分算法的一个示例是:
[0125] Salience = a*sigmoidi(positiOny,yo,dy )+0*sigmoi d2( width,wo,dsize)
[0126] *sigmoid2(height ,ho,dsize)+5*central_alignment
[0127] 在某些实施方式中,α、β和δ全部是正的且总计为1 .(LSigmoidUpositiony,}^, (15〇可以是范围从位置口〇8;[1:;[01^ = 0处的1.0(例如,着陆资源106的类型)至口08;[1:;[01^=00 处的0.0(例如,着陆资源106的底部,明显远离着陆资源106的顶部等)的S形函数。yo可以是 在该处Sigmoidl = 0.5的点,并且dy可控制围绕y0的S形函数的斜率。可将Sigmoid〗定义为 (1-Sigmoidi),并且central_alignment可以是图像是否在着陆资源106上在中心对准(例 如,水平地居于中心)的度量。如果图像完美地居于中心,贝ljcentral_alignment可以是1.0, 并且其可基于图像的中心与着陆资源106的水平中心之间的距离减小。
[0128] 图像内容评估器326可将由图像提取模块302提取的图像排名。在某些实施方式 中,该排名是基于分配给每个图像的显著性分值。显著性分值可指示用于每个提取的图像 的内容请求者104的偏好,并且可以是确定哪些图像最有可能被内容请求者104批准的重要 度量。显著性分值还可指示图像有多好地对应于在着陆资源106上展示的内容。
[0129] 在某些实施方式中,图像内容评估器326基于与图像相关联的各种相关性准则对 图像进行排名。例如,图像内容评估器326可使用相关性准则来向每个图像分配相关性分 值。图像内容评估器326可通过基于着陆资源106的URL或自动生成的内容项目将图像(例 如,图像元数据、图像内容等)与关键字列表相比较来确定用于图像的相关性分值。例如,关 键字列表可基于企业分类、企业类型、企业种类或与着陆资源106相关联的企业或实体相关 联的其它属性。在某些实施方式中,关键字列表可基于生成的内容项目的标题或内容项目 的其它属性(例如,活动、广告组、特征产品等)。相关性分值可指示特定图像表示在自动生 成的内容项目中展示的企业、产品或服务的可能性。
[0130] 在某些实施方式中,内容评估器326在对图像进行排名之前执行一个或多个阈值 测试。例如,内容评估器326可将由质量检测器318分配给每个图像的质量分值与阈值质量 分值相比较。如果用于图像的质量分值小于阈值质量分值,则图像排名模块308可丢弃图 像。内容评估器326可将每个提取且已处理的图像的显示尺寸与阈值显示尺寸相比较。如果 用于图像的显示尺寸小于阈值显示尺寸,则图像排名模块308可丢弃图像。
[0131] 在某些实施方式中,图像内容评估器326生成多个图像列表。由图像内容评估器 326生成的一个列表可以是徽标图像列表。由图像内容评估器326生成的另一列表可以是从 着陆资源106提取的产品和/或突出图像的列表。由图像内容评估器326生成的另一列表可 以是先前已被内容请求者104使用和/或批准的图像列表(例如,从已使用图像数据库310提 取的图像)。图像列表可包括与每个图像相关联的属性,诸如图像宽度、图像高度、显著性分 值、相关性分值或其它图像信息。图像内容评估器326可根据分配给图像的显著性分值和/ 或相关性分值来布置列表中的图像。图像列表可被布局模块220用来选择用于包括在自动 生成的内容项目中的图像。
[0132] 现在参考图4,示出了根据所述实施方式的色彩模块214的框图。色彩模块214可生 成用于自动生成的内容项目的色彩方案。色彩模块214可选择用于内容项目的背景、标题、 描述、按钮背景和/或按钮文本的色彩。有利地,色彩方案可包括对应于着陆资源106上所显 示的色彩的一个或多个色彩。色彩模块214被示为包括色彩提取器402和色彩方案选择器 404 〇
[0133] 在某些实施方式中,色彩提取器402从资源渲染器110接收着陆资源106的渲染D0M 树。D0M树可为色彩提取器402提供图像、背景色(例如,十六进制色彩代码、色彩名等)、文本 色彩和/或在着陆资源106上显示的其它项目。色彩提取器402可基于由D0M树提供的信息来 估计着陆资源106的主色。
[0134] 在某些实施方式中,色彩提取器402从资源渲染器110接收着陆资源106的快照图 像。可除渲染的D0M树之外或作为其替代而接收该快照图像。有利地,该快照图像可为色彩 提取器402提供从分析D0M树不容易显而易见的补充色彩信息。例如,快照图像可准确地图 示出着陆资源106的视觉外观,包括HTML元素的实际显示尺寸和由JAVASCRIPT渲染的风格 信息。快照图像可被作为图示出着陆资源106的渲染外观的图像文件(例如,.png、.bmp、 .jpg等)接收。
[0135] 色彩提取器402可从快照图像提取主色。在某些实施方式中,色彩提取器402使用 诸如k-means聚类之类的聚类技术来从快照图像提取主色。例如,色彩提取器402可将快照 图像的每个像素视为独立色彩测量(例如,独立的k-means观察)。可针对光的每个原色(例 如,红色、绿色以及蓝色)使用范围从零饱和(例如,0)至完全饱和(例如,255)的RGB色值来 表示每个像素的色彩。色彩提取器402可使用一组预定义色彩(例如,RGB(0,0,0)、RGB(225, 0,0)、RGB(0,255,0)、RGB(0,0,225)、RGB(255,255,0)、RGB(255,0,255)、RGB(0,255,255)、 RGB(255,255,255)等)作为初始聚类平均值并将每个像素分配给具有最接近于像素的RGB 色值的平均值的聚类。
[0136] 例如,可使用以下公式将每个像素的RGB色彩与每个聚类平均值相比较:|1_-Rpixei | + | Gmean-Gpixei | + | Bmean-Bpixei | =差。在某些实施方式中,如果用于像素的RGB色值与最 近聚类平均值之间的差超过阈值值(例如,I Rmean-Rpixel | + | G mean_Gpixel | + | Bmean _Bpixel I〉阐 值),则可创建新的平均值。在将每个像素分配给最近聚类(例如,具有最接近于用于像素的 色值的平均值的聚类)之后,可基于每个聚类中的像素的RGB色值来重新计算每个平均聚类 值。在某些实施方式中,可通过向最近聚类重新分配像素、直至像素在稳定的平均值上收敛 为止或者直至已执行阈值次数的迭代为止来执行连续迭代。
[0137] 色彩提取器402可基于每个聚类中的像素的数目对精化色彩聚类进行排名。例如, 可将具有最多像素的色彩聚类排名为表示最主要色彩,可将具有第二多像素的色彩聚类排 名为表示第二最主要色彩等。在某些实施方式中,色彩提取器402可基于相对于快照图像中 的像素的总数而言的相应色彩聚类中的像素数目来向每个色彩分配权值。色彩提取器402 可生成提取的色彩的列表(例如,RGB值)以及每个色彩的权值或主导性排名。
[0138] 有利地,k-means聚类可提供色彩提取技术,其在时间复杂性方面不会作为快照图 像中的像素的数目的平方的函数而增加(例如,-Λ:)。替代地,k-means聚类具有与像素的数目乘以聚类迭代的次数成比例的时间复杂性(例如,time_ complexity = K*nPixeis*iterations)。用k-means聚类的像素数目与时间复杂性之间的线性 关系可导致相比于其它色彩提取技术的改善的计算时间,尤其是当从相对大的快照图像提 取色彩时。
[0139] 在某些实施方式中,色彩提取器402在从快照图像提取主色之前对广告和/或其它 第三方内容进行过滤。例如,色彩提取器402可保持或接收第三方内容提供者的列表。色彩 提取器402可针对源自于第三方内容提供者的内容项目解析渲染的D0M树并从渲染的D0M树 消除此类第三方内容以及任何从属内容。色彩提取器402还可基于第三方内容项目的运行 时位置和显示尺寸来从快照图像去除此类内容。
[0140]仍参考图4,色彩模块214被进一步示为包括色彩方案选择器404。色彩方案选择器 404可使用由色彩提取器402确定的色彩来生成用于自动生成的内容项目的色彩方案。色彩 方案选择器404可选择用于生成的内容项目的背景色、按钮色彩、标题色彩、描述色彩、按钮 文字色彩或其它部分的色彩。色彩方案选择器404可确定每个提取的色彩的饱和度、亮度、 值得注意性和/或其他属性以及每个提取的色彩之间的对比度。
[0141] 在某些实施方式中,色彩方案选择器404可选择由色彩提取器402提取的最主要色 彩(例如,最重加权、最高主导性排名等)作为用于内容项目的背景色。色彩方案选择器404 可选择具有最高相乘饱和度和权值(例如,max(饱和度*权值))的提取色彩作为用于内容项 目的按钮色彩。色彩方案选择器404可选择与所选择的背景色具有最高对比度和/或亮度差 的色彩作为用于标题和描述文本的色彩。如果超过两个色彩可用,则色彩方案选择器404可 选择更值得注意的色彩作为标题色彩。
[0142] 在其它实施方式中,色彩方案选择器404可选择用于内容项目的预定义色彩方案。 该预定义色彩方案可用来选择背景色、按钮色彩、标题色彩、描述色彩、按钮文本色彩或生 成的内容项目的其它部分而不是直接地应用由色彩提取器402提取的色彩。该预定义色彩 方案可以是先前被组合成色彩模板或色彩组的色彩的组合。在某些实施方式中,可基于由 色彩提取器402提取的色彩从一组预定义色彩方案中选择预定义色彩方案。例如,色彩方案 选择器404可将由色彩提取器402提取的色彩与包括在多个预定义色彩方案中的色彩相比 较。色彩方案选择器404可基于由色彩提取器402提取的色彩中的一个或多个与包括在预定 义色彩方案中的色彩中的一个或多个之间的差(例如,RGB值、饱和度、亮度、对比度等)将预 定义色彩方案排名。来自预定义色彩方案的色彩可补充或替换自动生成的内容项目中的由 色彩提取器402识别的色彩。
[0143] 现在参考图5,示出了根据所述实施方式的文本模块216的框图。在某些实施方式 中,文本模块216可用来自动地创建由内容生成系统114生成的显示内容的文本部分(例如, 文本描述、标题等)。在其它实施方式中,文本模块216可用来独立地生成纯文本内容项目。 有利地,文本模块216可自动地生成内容项目的"创意"部分(例如,基于文本的描述、说服性 文本、正面的情绪等),从而消除内容提供者将时间花费在编写创意或雇用撰稿广告人来开 发创意上的需要。文本模块216被示为包括评论定位器502、情绪检测器504以及文本选择器 506 〇
[0144] 在某些实施方式中,文本模块216使用着陆资源106的D0M树或快照图像来创建在 着陆资源106上显示的文本的概要。例如,文本模块216可从资源渲染器110接收渲染的D0M 树并提取在着陆资源106上显示的文本信息。在其它实施方式中,文本模块216从除着陆资 源106之外的源获得文本数据。例如,文本模块216可从企业、产品或服务的用户创建评论接 收文本数据。
[0145] 仍参考图5,文本模块216被示为包括评论定位器502。评论定位器502可对评论数 据库508搜索用户创建的评论。在某些实施方式中,评论可总体上应用于企业。在其它实施 方式中,评论可应用于与着陆资源106相关联的特定产品或服务(例如,在着陆资源106上展 示、显示、呈现等)。评论数据库508可以是允许用户在其上面张贴意见、提交评论、评估产品 和/或服务或者另外传达关于特定企业的其观点的因特网资源(例如,网站)。例如,评论数 据库508可以是通过其获得用户创建的评论的网站,诸如G 〇〇gle+L〇Cal、ZAGAT、YELP、 URBANSP00N或其它资源。
[0146] 在某些实施方式中,评论定位器502可使用着陆资源106的URL来对此类评论进行 定位和/或将文本模块216引导至专用于特定企业的评论的特定资源或资源的部分。例如, 着陆资源106的URL可用来指定可在其上面获得关于与着陆资源106相关联的企业实体相关 的评论的评论数据库508的一部分。在某些实施方式中,评论定位器502可对多个资源搜索 关于由着陆资源106识别的企业的用户创建的评论。在某些实施方式中,评论定位器502可 转录基于音频或基于视频的评论以生成文本评论以用于进一步分析。
[0147] 仍参考图5,文本模块216被进一步示为包括情绪检测器504。情绪检测器504可被 配置成在有或没有数字表示评级(例如,"5中的Γ、"4星"等)的情况下确定评论是正面的还 是负面的。情绪检测器504可解析评论的语言,寻找指示一般地正面的情绪的形容词(例如, 极好、好、很好、奇妙等)。情绪检测器504可分析评论的一部分、评论的整个文本或与数字表 示的评级相结合的评论的文本以识别表达一般地正面的情绪的评论。
[0148] 文本选择器506可对评论搜索"片断"(例如,短语、文本串、部分等),其在被单独地 读取时有效地传达为什么提交评论的用户对所评论的企业、产品或服务具有正面的体验。 "片断"可包括被情绪检测器504在识别与评论相关联的情绪时使用的正面的形容词中的一 个或多个。例如,文本选择器506可从意大利饭店的相对冗长的评论中选择片断"极好的意 大利面食且服务快速"。在某些实施方式中,可将由文本选择器506识别的文本片断作为潜 在的"创意"(例如,描述性文本)呈现给内容请求者104以便在纯文本内容项目中使用。在其 它实施方式中,可使用文本片断作为由内容生成系统114生成的一个或多个显示内容项目 的文本部分。
[0149] 现在参考图6,示出了根据所述实施方式的布局模块220的框图。布局模块220可生 成用于自动生成的内容项目的布局。布局模块220可从图像模块212接收徽标图像的列表和 产品/突出图像的列表。每个图像列表可识别多个图像并将每个图像排名(例如,用显著性 分值、相关性分值等)。布局模块220还可从色彩模块214接收一个或多个所选择的色彩方案 并从字体模块218接收一个或多个所选择的字体系列。可在向每个分配分值的情况下接收 所选择的色彩方案和所选择的字体系列。布局模块220还可从文本模块216接收对文本片断 的选择。所选择的文本片断可具有任何长度且可包括任何数目的片断。
[0150] 在某些实施方式中,布局模块220可从资源渲染器110接收着陆资源106的快照图 像。布局模块220可使用快照图像来确定着陆资源106的风格(例如,现在、乡村等)和/或视 觉外观(例如,形状的使用、方角、圆角等)。布局模块220可调用企业数据库606以获得用于 着陆资源106的企业信息。企业信息可指定与着陆资源106相关联的企业的种类(例如,快 餐、汽车零部件等)以及相关联的企业的其它属性。
[0151] 仍参考图6,布局模块220被示为包括布局生成器602。布局生成器602可基于所识 别的图像、文本片断、色彩方案以及字体系列来生成用于内容项目的布局。例如,布局生成 器602可使用图像模块212所识别的图像的显示尺寸(例如,高度、宽度等)以及文本模块216 所识别的文本片断的长度来创建用于内容项目的布局。
[0152] 在某些实施方式中,布局生成器602从一组预定义布局选项(例如,模板布局)中选 择布局。模板布局可包括用于内容项目的文本、图像、动作按钮和/或其它特征的预定义位 置和显示尺寸。布局生成器602可将图像重新确定尺寸和/或调整文本以适合于所选择的布 局。在其它实施方式中,布局生成器602创建用于内容项目的新布局。有利地,新布局可不基 于模板或预定义设计,从而导致看起来独特的内容项目。参考图7-12来更详细地描述非模 板布局设计。
[0153] 仍参考图6,布局模块220被进一步不为包括布局评分器604。布局评分器604可向 由布局生成器602生成的各种布局分配数字分值。用于内容项目的总分值可基于在内容项 目中所使用的所选图像、文本片断、色彩以及字体的单独分值(例如,图像显著性、色彩聚类 权值等)。在某些实施方式中,分配的分值可基于在内容项目中有多高效地使用空间(例如, 空白处与已利用空间的比)、所选图像和所选文本有多好地适合于生成的布局(例如,应用 于图像的裁剪或拉伸的程度)、所选图像中的色彩有多好地与内容项目中所显示的其它色 彩匹配、文本的易读性(例如,文本色彩与背景色之间的对比度、无衬线字体的使用等)和/ 或其它审美准则(例如,"黄金比例"的使用、内容项目的外周界周围的填补、内容项目的图 像、文本及其它组成部分之间的间距等)。评分准则还可包括内容项目中的图像、文本以及 动作按钮的相对位置。例如,可向具有被从内容项目的右上角向内容项目的左下角按递减 顺序布置的图像、文本以及动作按钮的内容项目分配较高分值。
[0154] 现在参考图7-12,示出了根据所述实施方式的多个非模板布局设计。非模板布局 设计可基于一组灵活的布局生成准则。有利地,灵活的布局生成准则可导致适配于由内容 生成系统114的模块212-220选择的图像、文本片断、字体以及色彩的属性的布局。此适应性 布局准则可导致适合于特定着陆资源的看起来独特的内容项目(例如,不基于模板)。
[0155] 例如,具体地参考图7,布局生成器602可在由图像模块212提供特别高评分的图像 (例如,具有超过阈值的显著性分值或相关性分值的图像)时创建"半对半"布局700。布局 700被示为包括第一半710和第二半720。一半710可专用于显示高评分图像712,而一半720 可用来显示标题文本(例如,文本框722)、描述性文本(例如,文本框724)和/或动作按钮 726。可从着陆资源106或从用户创建的企业、产品或服务评论提取标题文本722和描述性文 本724。动作按钮726可包括怂恿用户点击生成的内容项目的"呼唤行动"文本(例如,"点击 这里"、"现在购买"、"读取更多"等)。
[0156] 在某些实施方式中,可基于由文本模块216选择的文本片断的长度和/或由字体模 块218选择的字体来调整文本框722、724和动作按钮726的相对尺寸。可将在一半710上显示 的图像重新确定尺寸(例如,裁剪、拉伸、压缩等)以适合一半710的尺寸。在某些实施方式 中,可将一半710定位成在一半720的左侧。在其它实施方式中,可将一半710定位到一半720 的右侧(例如,针对横向内容项目)或在一半720的上/下(例如,针对竖向内容项目)。
[0157] 现在参考图8,布局生成器602可在由图像模块212提供具有大显示尺寸的图像时 创建"文本覆盖"布局800。布局800被示为包括标题文本810、描述性文本820、动作按钮830 以及背景图像840。可将标题文本810和描述性文本820包含在透明或半透明文本框812和 822内,使得背景图像840在呈现的文本后面可见。在某些实施方式中,可将文本框812、822 半透明地遮蔽以提供文本810、820与背景图像840的色彩之间的对比度。半透明遮蔽可改善 呈现的文本810、820在被覆盖到背景图像840上时的易读性。针对其中标题文本810或描述 性文本820的色彩很暗(例如,黑色、褐色、深蓝色等)的布局,文本框812和/或822可被遮蔽 成白色或另一浅色。动作按钮830可被不透明、透明或半透明地遮蔽。布局800可允许在没有 基本上对背景图像840重新确定尺寸或裁剪的情况下显示大的背景图像840。可基于由文本 模块216选择的文本片断的长度和由字体模块218选择的字体系列来调整标题文本810、描 述性文本820以及动作按钮840的显示尺寸和显示位置。
[0158] 现在参考图9,布局生成器602可在由图像模块212提供高评分图像时创建"倾斜文 本"布局900,并且由文本模块216选择的文本片断是相对短的。布局900被示为包括标题文 本910、描述性文本920以及背景图像930。背景图像930可填充内容项目的整个空间,从而提 供在内容项目中展示的产品、服务或企业的相对大的描述。可将标题文本910和描述性文本 920覆盖到背景图像930上。文本910、920可相对于内容项目的边缘是倾斜的。可将标题文本 910和描述性文本920包含在透明或半透明文本框912和922内以提供文本910、920与背景图 像940的色彩之间的对比度。半透明遮蔽可改善呈现的文本910、920在被覆盖到背景图像 940上时的易读性。
[0159] 现在参考图10,布局生成器602可创建"模糊背景"布局1000。布局1000被示为包括 标题文本1010、描述性文本1020以及模糊背景图像1030。标题文本1010被示为包括词"标题 的示例"。在某些实施方式中,布局生成器602可搜索由文本模块216提供的用于过单词的文 本片断。过渡词可以是将文本片断的两个部分链接的短词,诸如"在...中"、"在...上"、"用 于"、的"、"和"等。布局生成器602可以将过渡单词风格化(例如,用斜体字、粗体、增强 等)和/或将过渡词放置在内容项目中的单独行上。可使背景图像1030模糊、褪色或者另外 朦胧。有利地,使背景图像1030模糊可使读者的注意力集中在内容项目的文本部分上。可由 字体模块218基于从着陆资源106提取的字体来指定用于标题文本1010和描述性文本1020 的字体。
[0160] 现在参考图图11A-11D,布局生成器602可以在所选图像和文本片断的显示尺寸未 填充整个内容项目时创建灵活的布局1100。例如,布局生成器602可将最高评分徽标或产 品/突出图像1110放置在内容项目的拐角(例如,左上、右上、左下、右下)中。布局生成器602 可将其余的未使用空间1120划分成一个或多个矩形(例如,如图11B中所示的矩形1122、 1124、1126)。在某些实施方式中,布局生成器602可将矩形中的一个或多个组合成较大矩 形。具体地参考图11C,矩形1124和1126被示为组合成较大矩形1127。具体地参考图11D,矩 形1122和1126被示为组合成较大矩形1129。
[0161] 布局生成器602可基于由文本模块216选择的其余未使用文本片断和/或由图像模 块212选择的图像的显示尺寸或纵横比来将一个或多个矩形组合。例如,如果未使用图像具 有超过未使用图像的显示宽度属性(例如,200像素、10像素等)的显示高度属性(例如,400 像素、200像素等),则布局生成器602可将矩形1122和1126组合以创建"竖向风格"矩形1129 (例如,具有超过矩形的显示宽度的显示高度的矩形)。有利地,可根据需要来分配未使用空 间以适应其余未使用图像和/或文本片断的纵横比、显示尺寸以及显示长度。
[0162] 现在参考图12A和12B,示出了根据所述实施方式的用于横幅风格内容项目的灵活 布局1200。具体地参考图12A,灵活布局1200被示为包括图像1210、标题文本1220以及未使 用空间1230。布局生成器602可通过最初将高评分图像1210和标题文本1220放置在内容项 目内来创建布局1200。可将图像1210沿着内容项目的顶部、底部、侧面、中间或拐角放置。可 将标题文本1220放置在内容项目内的适当位置上,使得标题文本1220不覆盖图像1210。可 将标题文本1220放置在图像1210下面、图像1210上面、图像1210旁边或者内容项目内的别 处。有利地,图像1210和标题文本1220的位置是灵活的,因为布局1200不基于预配置的模板 设计。在放置图像1210和文本1220之后,布局生成器602可确定仍留在内容项目内的未使用 空间1230的量。
[0163] 现在具体地参考图12B,布局生成器602可将未使用空间1230划分成一个或多个矩 形(例如,矩形1240、1250以及1260)。在某些实施方式中,矩形的显示尺寸或纵横比可基于 由文本模块216选择的其余未使用文本片断或由图像模块212选择的未使用图像的显示尺 寸和/或纵横比。布局1200被示为包括放置在第一矩形1240中的第二图像1242、放置在第二 矩形1250中的描述性文本片断1252以及放置在第三矩形1260中的动作按钮1262。
[0164] 现在参考图13,示出了根据所述实施方式的用于自动地生成显示内容的过程1300 的流程图。过程1300被示为包括指定着陆资源的位置的统一资源定位符(URL)(步骤1302)。 可从内容请求者接收URL作为用以生成内容项目的请求的一部分。URL可指定生成的内容项 目被"点击"时用户设备被指引到的着陆资源的位置。可响应于用户点击(例如,用鼠标)或 者另外激活生成的内容项目而在用户接口设备(例如,监视器、触摸屏或其它电子显示器) 上显示着陆资源。着陆资源可以是网页、本地资源、内联网网资源、因特网资源或其它网络 资源。在某些实施方式中,着陆资源可提供关于在自动生成的内容项目中展示的产品、服务 或企业的附加信息。例如,着陆资源可以是可通过其购买在生成的内容项目中展示的产品 或服务的网站。
[0165] 仍参考图13,过程1300进一步被示为包括从着陆资源提取定义一个或多个图像、 文本以及色彩的视觉信息(步骤1304)。在某些实施方式中,视觉信息包括当着陆资源被渲 染时实际上在着陆资源上显示的图像、色彩以及文本。步骤1304可涉及使用资源渲染器(例 如,web浏览器或其它具备渲染能力的硬件或软件部件)来渲染着陆资源并生成渲染的着陆 资源的D0M树或快照图像。在其它实施方式中,视觉信息包括不是从着陆资源的快照图像直 接可见的元数据及其它代码(例如,HTML代码、CSS代码等)。隐藏代码和元数据可定义在着 陆资源上显示的图像的位置(例如,URL)、显示尺寸、显示位置(例如,着陆资源的顶部、着陆 资源的中间等)及其它相关属性(例如,alt文本、特殊徽标标记等)。隐藏代码和元数据还可 定义在着陆资源上显示的字体名称、字体系列、色彩以及文本。视觉信息可定义在着陆资源 上显示的特定企业、产品或服务。
[0166] 仍参考图13,过程1300进一步被示为包括基于从着陆资源提取的视觉信息来选择 一个或多个图像、文本片断以及色彩(步骤1306)。在某些实施方式中,步骤1306包括选择实 际上在着陆资源上显示的一个或多个图像、文本片断和色彩。选择所显示的图像可包括对 从着陆资源提取的图像进行评分或排名并基于分配的分值来选择图像。可基于与图像相关 联的元数据(例如,URL、显示位置、显示尺寸、alt文本等)对图像分配分值。在某些实施方式 中,可基于与图像相关联的元数据是否包含针对徽标图像进行选择的指定关键字来向图像 分配分值。例如,关键字可以是特殊徽标标记,诸如链接re 1 = "example-logo-markup"。
[0167] 在某些实施方式中,选择显示色彩可包括从着陆资源的快照图像提取一个或多个 色彩。可将快照图像的每个像素视为独立色彩测量,并且可使用诸如k-means聚类之类的聚 类技术来提取主色。例如,可确立并用初始色值(例如,RGB色值、十六进制色彩代码等)标记 多个初始色彩聚类。可向具有最接近于像素色值的色值的色彩聚类分配快照图像中的每个 像素。在向最近聚类分配每个像素之后,可基于聚类中的像素的色值来重新计算每个聚类 的平均色值。在某些实施方式中,可通过向具有最近平均色值的聚类重新分配像素、直至聚 类在稳定的平均值上收敛为止或者直至已执行阈值次数的迭代为止来执行连续迭代。步骤 1306可涉及基于相对于快照图像中的像素的总数而言的相应色彩聚类中的像素数目来向 每个色彩分配权值。可选择具有最大权值的色彩以便包括在自动生成的内容项目中。
[0168] 在某些实施方式中,选择在着陆资源上显示的文本可涉及针对文本解析HTML D0M 树并生成在着陆资源上显示的文本的概要。在其它实施方式中,可分析快照图像,并且可使 用光学字符识别(OCR)或其它文本识别技术从渲染的图像提取文本。概要文本可以是在着 陆资源上显示的连续文本串或者从在着陆资源上的各种位置上显示的文本片段组合而成 的概要。
[0169] 在某些实施方式中,步骤1306包括选择实际上不是在着陆资源上显示的一个或多 个图像、文本片断和/或色彩。例如,从着陆资源提取的视觉信息可识别特定企业、产品或服 务。可基于所显示的企业、产品或服务的身份从一组先前存储的徽标图像中选择图像(例 如,企业徽标、商标、服务商标等),无论该徽标图像实际上是否在着陆资源上显示。可基于 从着陆资源提取的色彩从一组先前组合(例如,自动地、手动地等)的色彩方案中选择色彩 方案。在某些实施方式中,无论包括在色彩方案中的任何色彩是否实际上在着陆资源上显 示都可选择色彩方案。在某些实施方式中,可从实际上不是在着陆资源上显示的隐藏元数 据、HTML代码或其它文本中选择文本片断。例如,从着陆资源提取的视觉信息可识别特定企 业、产品或服务。此身份可用来定位关于特定企业、产品或服务的用户创建的评论的全集, 并且可从用户创建的评论中的一个或多个中选择文本片断。
[0170] 仍参考图13,过程1300进一步被示为包括基于所选图像或所选文本片断中的一个 或多个来生成用于内容项目的布局(步骤1308)。步骤1308可涉及将高评分徽标或产品/突 出图像放置在内容项目的拐角(例如,左上、右上、左下、右下)、边缘(例如,上、下、左、右)或 中间(例如,不是边缘或拐角)并将其余未使用空间划分成一个或多个矩形。剩余空间的量 可基于放置在内容项目中的图像的显示尺寸。在某些实施方式中,可基于其余文本片断和 图像的显示尺寸或纵横比将矩形中的一个或多个组合成较大矩形。例如,如果未使用图像 具有显示高度属性(例如,像素、英寸等),其超过未使用图像的显示宽度属性(例如,"竖向 风格"图像),则可将矩形组合以创建可向其中放置图像的"竖向风格"空间。有利地,可根据 需要来分配未使用空间以适应其余未使用图像的纵横比或显示尺寸以及任何未使用文本 片断的长度。
[0171] 在某些实施方式中,步骤1308可涉及接收着陆资源的快照图像以及使用快照图像 来确定着陆资源的风格(例如,现代、乡村等)和/或视觉外观(例如,形状的使用、方角、圆角 等)。步骤1308可涉及调用企业数据库以获得用于着陆资源的企业信息。企业信息可指定与 着陆资源相关联的企业的种类(例如,快餐、汽车零部件等)以及相关联的企业的其它属性。 由步骤1308生成的布局可基于风格信息和/或企业信息。
[0172] 仍参考图13,过程1300被进一步示为包括通过对生成的布局应用所选图像、所选 文本片断以及所选色彩来将内容项目组合(步骤1310)。在某些实施方式中,可将所选图像 和文本片断裁剪或重新确定尺寸以落在生成的布局中的指定占位符内。在其它实施方式 中,可将占位符重新确定尺寸、移动或重新布置以适应所选图像和/或文本。可将所选色彩 作为背景色、文本色彩、按钮色彩、半透明文本框遮蔽色彩、边界色彩或在生成的内容项目 中可见的任何其它色彩来应用于内容项目。
[0173] 在某些实施方式中,过程1300还可包括对组合的内容项目评分(步骤1312)并将组 合的内容项目呈现给内容请求者(步骤1314)。用于内容项目的总分值可基于在内容项目中 所使用的所选图像、文本片断、色彩以及字体的单独分值(例如,图像显著性、色彩聚类权值 等)。在某些实施方式中,分配的分值可基于在内容项目中有多高效地使用空间(例如,空白 处与已利用空间的比)、所选图像和所选文本有多好地适合于生成的布局(例如,应用于图 像的裁剪或拉伸的程度)、所选图像中的色彩有多好地与内容项目中所显示的其它色彩匹 配、文本的易读性(例如,文本色彩与背景色之间的对比度、无衬线字体的使用等)和/或其 它审美准则(例如,"黄金比例"的使用、内容项目的外周界周围的填补、内容项目的图像、文 本及其它组成部分之间的间距等)。评分准则还可包括内容项目中的图像、文本以及动作按 钮的相对位置。例如,可向具有被从内容项目的右上角向内容项目的左下角按递减顺序布 置的图像、文本以及动作按钮的内容项目分配较高分值。
[0174] 可将完成的内容项目连同其它自动生成的内容项目一起呈现给内容请求者。内容 请求者可批准或拒绝自动生成的内容项目。如果被批准,则可与内容请求者的确立内容显 示偏好相结合地使用内容项目并经由一个或多个电子呈现资源上的内容时隙传送给用户 接口设备。在某些实施方式中,可记录批准的内容项目的图像、文本片断、色彩和/或布局。 可使用记录的数据来生成用于同一内容请求者或不同内容请求者的后续内容项目。例如, 可在针对同一内容请求者生成的后续内容项目中使用批准的徽标图像(例如,企业徽标、产 品徽标等)。可在生成用于其它内容请求者的内容项目时使用批准的布局作为灵活模板。有 利地,从内容请求者接收到的输入(例如,批准或拒绝内容项目)可完成用于适应性地设计、 配置或生成内容项目的反馈环路。
[0175] 现在参考图14,示出了根据所述实施方式的用于自动地生成内容项目的文本部分 的过程1400的流程图。在某些实施方式中,可使用过程1400来自动地创建还包括图像、色彩 或其它非文本元素的内容项目的文本部分(例如,文本描述、标题等)。在其它实施方式中, 过程1400可用来独立地创建纯文本内容项目。有利地,过程1400可自动地生成内容项目的 "创意"部分(例如,基于文本的描述、说服性文本、正面的情绪等),从而消除内容提供者将 时间花费在编写创意或雇用撰稿广告人来开发创意上的需要。
[0176] 过程1400被示为包括接收指定着陆资源的位置的统一资源定位符(URL)(步骤 1402)。可从内容请求者接收URL作为用以生成内容项目的请求的一部分。URL可指定生成的 内容项目被"点击"时用户设备被指引到的着陆资源的位置。可响应于用户点击(例如,用鼠 标)或者另外激活生成的内容项目而在用户接口设备(例如,监视器、触摸屏或其它电子显 示器)上显示着陆资源。着陆资源可以是网页、本地资源、内联网网资源、因特网资源或其它 网络资源。在某些实施方式中,着陆资源可提供关于在自动生成的内容项目中展示的产品、 服务或企业的附加信息。例如,着陆资源可以是可通过其购买在生成的内容项目中展示的 产品或服务的网站。
[0177] 仍参考图14,过程1400被示为进一步包括获得一个或多个用户评论,其包括关于 在着陆资源上显示的企业、产品或服务的用户提供的评论(步骤1404)。在某些实施方式中, 评论可总体上适用于企业。在其它实施方式中,评论可应用于与着陆资源106相关联的特定 产品或服务(例如,在着陆资源106上展示、显示、呈现等)。可从评论数据库获得用户提供的 评论。评论数据库可以是允许用户在其上面张贴意见、提交评论、评估产品和/或服务或者 另外传达关于特定企业的其观点的因特网资源(例如,网站)。例如,评论数据库508可以是 可通过其获得用户创建的评论的网站,诸如Google+Local、ZAGAT、YELP、URBANSPOON或其它 资源。
[0178] 在某些实施方式中,步骤1404可涉及使用着陆资源的URL来定位此类评论或者识 别专用于特定企业的评论的特定资源或资源的部分。例如,着陆资源106的URL可用来指定 可在其上面获得关于与着陆资源106相关联的企业实体的评论的评论数据库的一部分。步 骤1404可涉及对多个资源搜索关于由着陆资源识别的企业的用户创建的评论。在某些实施 方式中,步骤1404可涉及转录基于音频或基于视频的评论以生成文本评论以用于进一步分 析。
[0179] 仍参考图14,过程1400进一步被示为包括识别评论中的一个或多个中的正面短 语,其包括指示正面情绪的关键字(步骤1406)。可执行步骤1406以在有或没有数字表示评 级(例如,"5中的1"、"4星"等)的情况下确定评论是正面的还是负面的。步骤1406可涉及解 析评论的语言,寻找指示正面的情绪的形容词(例如,极好、好、很好、奇妙等)。步骤1406可 涉及分析评论的一部分、评论的整个文本或与数字表示的评级相结合的评论的文本以识别 表达正面的情绪的评论。可在表示正面情绪的评论中识别包括指定关键字中的一个的正面 短语。
[0180] 仍参考图14,过程1400进一步被示为包括提取评论的一个或多个部分,其包括所 识别的正面短语中的一个或多个(步骤1408)。步骤1408可涉及对评论搜索"片断"(例如,短 语、文本串、部分等),其在被单独地读取时有效地传达为什么提交评论的用户对所评论的 企业、产品或服务具有正面的体验。该片断可包括在步骤1406中识别的正面短语中的一个 或多个。
[0181] 在某些实施方式中,过程1400还包括向内容请求者呈现评论的提取部分并从内容 请求者接收选择所提取的部分中的一个或多个的输入(步骤1410)。内容请求者可批准或拒 绝所提取的文本片断。有利地,从内容请求者接收到的输入(例如,批准或拒绝内容项目)可 完成用于适应性地设计、配置或生成内容项目的反馈环路。如果被批准,则可将提取的文本 组合成内容项目(步骤1412)。在某些实施方式中,可使用提取的文本作为还包括图像、色彩 或其它非文本元素(例如,显示内容元素)的内容项目的文本部分(例如,文本描述、标题 等)。在其它实施方式中,提取的文本可以是纯文本内容项目的一部分(例如,文本"创意")。
[0182]现在参考图15,示出了根据所述实施方式的用于自动地生成用于内容项目的看起 来独特的布局的过程1600的流程图。过程1500可用来实现过程1300的步骤1308和1310。例 如,一旦已从着陆资源提取一组图像、文本片断、字体以及色彩,则可使用过程1500来将图 像、文本片断、色彩以及字体组合成完整内容项目。
[0183]过程1500被示为接收一个或多个图像和一个或多个文本片断(步骤1502)。在某些 实施方式中,除接收到的图像和文本片断之外,步骤1502还可包括接收一个或多个字体和 一个或多个色彩。可与分类标签一起接收图像,该分类标签指定图像是否是徽标图像、产 品/突出图像或者图像是否属于图像的任何其它种类。每个接收的图像可包括属性信息(例 如,显示高度、显示宽度、图像中的主色的列表等)。每个接收的文本片断可包括长度属性。 长度属性可指定用于文本片断的显示尺寸,并且可取决于与文本片断相结合地使用的字体 (例如,字体尺寸、字体系列等)。在某些实施方式中,可连同分值、排名、权值或其它评分度 量来接收图像、文本片断、色彩以及字体。可使用与每个元素相关联的分值来确定选择元素 以便包括在生成的内容项目中的优先级或顺序。
[0184] 仍参考图15,过程1500被示为还包括创建用于内容项目的框架(步骤1504)。用于 内容项目的框架可以是对应于内容项目的尺寸(例如,显示高度、显示宽度等)的矩形或非 矩形框架。在某些实施方式中,步骤1504可涉及创建对应于用于完整内容项目的多个潜在 显示尺寸或尺度的多个框架。例如,可使用多个不同尺寸的框架生成多个不同尺寸的内容 项目。
[0185] 过程1500还被示为包括将接收的图像中的一个放置在框架内的起始位置上(步骤 1506)。可基于分配给图像的分值(例如,最高评分图像)、图像的显示尺寸、图像的分类(例 如,徽标、产品、其它突出图像)或者基于图像与也潜在地包括在内容项目中的文本片断、色 彩和/或字体有多好地协调的预测分值来选择针对初始放置选择的图像。可将初始图像放 置在框架的拐角(例如,左上、右上、左下、右下)、边缘(例如,上、下、左、右)或中间(例如,不 沿着边缘或拐角)。
[0186] 仍参考图15,过程1500被示为还包括将框架内的任何其余未使用空间划分成一个 或多个矩形(步骤1508)。剩余空间的量可基于在步骤1506中放置在框架内的初始图像的显 示尺寸和/或位置。在某些实施方式中,可基于其余未使用文本片断和图像的显示尺寸或纵 横比将矩形中的一个或多个组合成较大矩形。例如,如果未使用图像具有显示高度属性(例 如,像素、英寸等),其超过未使用图像的显示宽度属性(例如,"竖向风格"图像),则可将矩 形组合以创建可向其中放置图像的"竖向风格"空间。有利地,可根据需要来分配未使用空 间以适应其余未使用图像的纵横比或显示尺寸以及任何未使用文本片断的长度。
[0187] 过程1500被示为还包括将未放置的文本片断或图像中的一个或多个放置到一个 或多个矩形中(步骤1510)。在某些实施方式中,可将所选图像和文本片断裁剪或重新确定 尺寸以落在生成的布局的指定占位符内。在其它实施方式中,可将占位符重新确定尺寸、移 动或重新布置以适应所选择的图像和/或文本。选择用于放置到一个或多个矩形中的图像 和文本片断可基于图像的显示尺寸、文本片断的显示长度和/或分配给未使用图像和文本 片断中的每一个的分值。
[0188] 在某些实施方式中,步骤1510可包括对生成的布局应用接收到的色彩和字体。可 将接收的色彩作为背景色、文本色彩、按钮色彩、半透明文本框遮蔽色彩、边界色彩或在生 成内容项目中可见的任何其它色彩应用于布局。可将接收到的字体应用于放置在框架内的 文本片断、标题文本、按钮文本或在生成的内容项目中显示的任何其它文本。
[0189] 现在参考图16,示出了根据所述实施方式的用于自动地生成显示内容的过程1600 的流程图。过程1600可由如参考图2-6所述的内容生成系统114使用其一个或多个存储器模 块(例如,图像模块212、色彩模块214、文本模块216、字体模块218、布局模块220等)来执行。 在某些实施方式中,过程16000可基本上由图像模块212执行以从着陆资源106提取图像,分 析并处理提取的图像,并将图像排名以便在自动生成的显示内容项目中使用。
[0190]过程1600被示为包括接收识别着陆资源的统一资源定位符(URL)(步骤1602)。可 从内容请求者(例如,内容请求者104)接收URL作为用以生成内容项目的请求的一部分。URL 可指定当用户设备108与生成的内容项目相交互时用户设备108被指引到的着陆资源(例 如,着陆资源106)的位置。着陆资源可以是网页、本地资源、内联网网资源、因特网资源或其 它网络资源。在某些实施方式中,着陆资源可提供关于在自动生成的内容项目中展示的产 品、服务或企业的附加信息。例如,着陆资源可以是可通过其购买在生成的内容项目中展示 的产品或服务的网站。
[0191] 仍参考图16,过程1600被示为包括从着陆资源提取图像(步骤1604)。步骤1604可 由图像提取模块302如先前参考图3所述地执行。例如,步骤1604可包括从资源渲染器(例 如,资源渲染器110、资源渲染器模块210等)接收用于着陆资源的D0M树。步骤1604可包括解 析D0M树以识别并提取图像和图像元数据(例如,图像URL、显示位置、显示尺寸、alt文本 等)。
[0192] 在某些实施方式中,步骤1604包括除着陆资源之外还从其它数据源提取图像和图 像元数据。可以从其提取图像的其它数据源可包括已使用图像数据库(例如,数据库310) 和/或库存图像数据库(例如,数据库312)。已使用图像数据库310可以是用于在指向与当前 生成的内容项目相同的着陆资源1〇6(例如,同一 URL、同一域等)的先前内容项目中使用的 所有图像的储存库。已使用图像数据库可包括由内容请求者提供的图像和/或先前已被内 容请求者批准的图像。可将在图像数据库中使用的图像与附加数据(例如,图像元数据)一 起存储,该附加数据诸如与图像被包括在其中的先前第三方内容项目相关联的关键字及其 它数据。
[0193] 库存图像数据库可以是用于不一定与内容请求者相关联或者从着陆资源提取的 多种图像的储存库。库存图像数据库可包括已从其它资源提取或者另外提供给内容生成系 统的图像。从已使用图像数据库和库存图像数据库提取的图像可包括例如企业徽标(例如, 商标、服务标志等)、特色产品的图片或其它突出图像。
[0194] 仍参考图16,过程1600被示为包括分析提取的图像以检测图像的视觉内容和图像 的意义内容(步骤1606)。在某些实施方式中,步骤1606可由内容检测模块304如先前参考图 3所述地执行。在某些实施方式中,步骤1606包括确定每个提取的图像的显示尺寸。如果用 于图像的显示尺寸小于阈值显示尺寸(例如,阈值高度、阈值宽度、阈值面积等),则步骤 1606可包括丢弃图像。在某些实施方式中,步骤1606包括确定用于每个提取的图像的纵横 比。如果用于图像的纵横比不在预定义纵横比范围(例如,0.2-5、0.33-3、0.5-2等)内,则步 骤1606可包括丢弃图像。
[0195] 分析提取的图像以检测视觉内容可包括检测每个提取的图像的位置、尺寸和/或 其中的内容分布。在某些实施方式中,步骤1606包括对提取的图像中的显著对象进行定位。 显著对象可以是前景图像、特征对象或者在所提取的图像中突出地显示的其它对象。在某 些实施方式中,步骤1606包括分析图像中的色彩的分布以将前景对象与背景色彩区别开。 步骤1606可包括识别所提取的图像中的边缘以检测对象之间的边界(例如,前景对象、背景 对象、并排对象等)。将显著对象与其它对象区别开可对识别图像的最有意义或重要区域有 用。
[0196] 在某些实施方式中,检测提取的图像的视觉内容包括检测文本。步骤1606可包括 对所提取的图像执行光学字符识别(OCR)以检测各种类型的文本(例如,标题文本、创意文 本、唤起行动文本、广告文本等)。某些提取的图像其本身可以是包括其自己的创意文本的 广告。步骤1606可包括识别包括文本的图像面积,使得可以对文本进行裁剪或从图像去除。
[0197] 在某些实施方式中,步骤1606包括生成用于每个提取的图像的显著性地图。该显 著性地图可标记图像中的文本、人脸和/或前景对象的位置。例如,可用矩形列表来识别具 有文本或人脸的区域。可用二进制位图、线或边界标记来表示前景区域。步骤1606可包括确 定图像中的显著对象相对于整个图像的尺寸。如果图像中所表示的显著对象与整个图像的 显示尺寸相比是相对小的(例如,小于阈值、小于总显示尺寸的一定百分比等),步骤1606可 包括丢弃该图像或者将该图像从用于包括在生成的内容项目的候选的图像列表中去除。
[0198] 分析提取的图像以检测语义内容可包括识别在图像中描绘的对象或由图像传达 的意义。步骤1606可包括使用视觉搜索服务(VSS)、图像内容注释前端(ICAFE)和/或图像内 容注释服务(ICAS)来确定图像的语义内容。此类服务可被配置成接收图像(例如,图像URL、 图像文件等)、分析图像以及输出描述图像中描绘的内容的各种标签(例如,标题、关键字、 短语等)。步骤1606可将图像注释和搜索服务配置成使用不同模块(例如,徽标模块、产品模 块等)来精化针对输入图像生成的关键字和标签。
[0199] 步骤1606可包括向图像分配标签或关键字作为其属性或标签。例如,针对奥迪牌 汽车的图像,步骤1606可包括向图像分配关键字"汽车"、"跑车"、"奥迪"、"Audi R8VI 0"或 者定性地描述图像的内容的其它关键字。在某些实施方式中,包括使每个关键字或标签与 指示关键字或标签对图像的估计准确度或相关性的分值相关联。该标签和/或关键字可用 来确定图像与特定第三方内容项目、搜索查询和/或电子资源的相关性。
[0200] 在某些实施方式中,步骤1606包括确定提取的图像的视觉质量(例如,审美质量)。 用于图像的视觉质量可基于图像的视觉特征来表示用于图像的人类视觉偏好,所述视觉特 征诸如图像的曝光度、锐度、对比度、色彩方案、色彩密度和/或其它审美质量。步骤1606可 包括通过利用计算机视觉、聚类以及用于图像的元数据来以算法方式确定视觉质量。例如, 步骤1606可包括使用图像或图像特征作为到针对人类所标记的图像偏好而被训练的排名 模型的输入。在某些实施方式中,步骤1606包括将图像的特征与先前已被人类评分以识别 图像的审美或视觉质量的图像特征相比较。具有与被人类评高分的图像特征更紧密地匹配 的特征的图像可在步骤1606中被分配较高的质量分值。具有与被人类评高分的图像特征不 同的特征的图像可在步骤1606中被分配较低的质量分值。
[0201] 仍参考图16,过程1600被示为包括基于分析的结果来确定图像是否需要处理,并 且响应于需要处理的确定而处理图像(步骤1608)。在某些实施方式中,步骤1608可由图像 处理模块306如先前参考图3所述地执行。步骤1608可处理在步骤1604中提取的图像以使图 像准备好在内容项目中使用。在各种实施方式中,步骤1608包括对图像进行裁剪,将图像格 式化,增强图像,将文本从图像去除,或者另外调整图像以便在自动生成的内容项目中使 用。
[0202]步骤1608可包括基于在步骤1606中检测到的图像内容的分布对每个提取的图像 进行裁剪。例如,步骤1608可包括使用在步骤1606中生成的显著性地图来确定包含显著对 象(例如,前景对象)、文本、人脸和/或其它类型的所检测的内容的每个图像的区域。可将包 含显著对象、文本以及人脸的图像部分在显著性地图中表示为矩形。步骤1608可包括使用 显著性地图所指示的内容分布来识别要保持的每个图像的一部分和要丢弃的每个图像的 一部分。
[0203]在某些实施方式中,步骤1608包括识别包含显著对象的每个图像的一部分。图像 中的显著对象的位置可被表示为显著性地图中的一对矢量。例如,可用定义图像中的矩形 的垂直矢量和水平矢量来指示显著对象的位置。步骤1608可包括确定每个图像内的包含显 著对象的一个或多个矩形的尺寸和位置。对于包含多个显著对象的图像而言,步骤1608可 包括选择要保持的显著对象中的一个或多个和要丢弃的显著对象中的一个或多个。在某些 实施方式中,步骤1608包括生成包含多个显著对象的矩形。在步骤1608中生成的矩形可以 是包括多个显著对象的最小可能矩形。
[0204]在某些实施方式中,步骤1608包括确定包含显著对象的矩形相对于图像的总显示 尺寸的尺寸(例如,作为总显示尺寸的百分比、作为图像的总面积的比例等)。在某些实施方 式中,步骤1608包括确定包含显著对象的矩形的边缘(例如,顶边、底边、侧边等)与图像的 边缘之间的空间的量。例如,步骤1608可包括识别包含显著对象的矩形的边缘与图像边缘 之间的距离(例如,像素数等)。步骤1608可包括确定矩形的每个边缘与图像的相应边缘之 间的距离(例如,矩形的顶边与图像的顶边之间的距离、矩形的底边与图像的底边之间的距 离等)。
[0205]步骤1608可包括基于图像内的显著对象的尺寸和位置来确定是否要对图像进行 裁剪。针对每个图像,步骤1608可包括基于图像的显示尺寸(例如,显示尺寸的80%、显示尺 寸的60%等)来计算面积阈值。如果包含显著对象的矩形具有超过面积阈值的面积,则步骤 1608可包括确定不应对图像进行裁剪。如果包含显著对象的矩形具有小于面积阈值的面 积,则步骤1608可包括确定应对图像进行裁剪。在某些实施方式中,如果显著对象占用小于 图像的约三分之一的面积,则步骤1608包括确定应对图像进行裁剪。
[0206]步骤1608可包括对图像进行裁剪以去除不包含显著对象的某些或所有图像内容。 例如,步骤1608可包括对图像进行裁剪,使得只有包含显著对象的矩形留下。在某些实施方 式中,步骤1608包括将图像裁剪成包括显著对象矩形和该显著对象矩形周围的边界。
[0207]在某些实施方式中,步骤1608包括来自图像的文本。步骤1608可包括使用在步骤 1606中生成的显著性地图来识别包括文本的每个图像的一部分。例如,步骤1608可包括识 别指示图像中的文本的位置的一个或多个矩形。在某些实施方式中,步骤1608包括基于包 含显著对象的图像面积和包含文本的图像面积来确定要保持的图像的一部分。例如,步骤 1608可包括将包含文本的图像部分丢弃,而保持包含显著对象的图像部分。步骤1608可包 括通过生成矩形而从图像裁剪文本,该矩形包括包含显著对象的一个或多个矩形且没有包 含文本的矩形。在某些实施方式中,步骤1608包括将图像裁剪成仅包括在步骤1608中生成 的矩形内的图像内容(例如,显著对象、人脸等)。
[0208]在某些实施方式中,步骤1608包括从图像画面裁剪徽标图像。例如,在步骤1604中 提取的某些图像可以是单独按钮或徽标图像的组合或编译(例如,在网格中包含多个徽标 的拼接帆布)。步骤1608可包括确定图像画面内的徽标图像的位置并裁剪图像画面,使得只 有徽标图像留下。
[0209] 在某些实施方式中,步骤1608包括增强或优化在步骤1604中提取的图像以便在生 成的内容项目中使用。增强或优化图像可包括例如使图像的边缘成圆形,向图像添加照明 效果,向图像添加纹理或深度和/或应用其它效果来增强图像的视觉冲击。
[0210] 在某些实施方式中,步骤1608包括在步骤1606中产生用于识别徽标图像的内容检 测结果。某些徽标图像可在步骤1604中被作为平直且简单的徽标提取。例如,当徽标被用户 设备108渲染时,着陆资源可依赖于CSS或另一内容标记方案来改变平直/简单徽标的外观。 步骤1608可包括处理徽标图像以通过促使徽标看起来是三维的、添加深度或照明效果、使 拐角成圆形、促使徽标表现为按钮、优化徽标以便在移动设备上显示或者另外调整徽标以 改善其视觉冲击来将平直/简单的徽标转换成优化徽标。步骤1608可包括将已处理图像存 储在数据存储设备中。
[0211] 仍参考图16,过程1600被示为包括基于所检测的视觉内容和所检测的语义内容中 的至少一个对图像进行评分(步骤1610)。在某些实施方式中,步骤1610可由图像排名模块 308如先前参考图3所述地执行。步骤1610可包括将各种图像排名以确定图像中的哪些将包 括在生成的内容项目中。
[0212] 在某些实施方式中,步骤1610包括向在步骤1604中从着陆资源提取的每个图像分 配显著性分值。用于图像的显著性分值可指示用来在着陆资源上显示图像的相关重要性或 突出性。例如,用于图像的显著性分值可取决于图像的垂直放置(例如,页面的顶部、页面的 中间、页面的底部等)、图像的显示尺寸(例如,显示高度、显示宽度等)、图像是否在着陆资 源106上居于中心和/或其它图像显著性评分准则。
[0213] 在步骤1610中可以用来分配显著性分值的图像显著性评分算法的一个示例是:
[0214] Salience = a*sigmoidi(positiony,yo,dy )+0*sigmoid2( width,wo,dsize)
[0215] *sigmoid2(height ,ho,dsize)+5*central_alignment
[0216] 在某些实施方式中,α、β和δ全部是正的且和为1 ?0<^8111〇1(11(口〇8;[1:;[0%,7(),(^)可 以是范围从位置口08;11:;[01^ = 0处的1.0(例如,着陆资源106的顶部)至。08;[1:;[01^=00处的 0.0(例如,着陆资源106的底部,明显远离着陆资源106的顶部等)的S形函数。yo可以是在该 处Sigmoid2 = 0 · 5的点,并且dy可控制围绕yo的S形函数的斜率。可将Sigmoid〗定义为(1-SigmoicU),并且中央对准可以是图像是否在着陆资源上在中心对准(例如,水平地居于中 心)的度量。如果图像完美地居于中心,则中央对准可以是1.0,并且其可基于图像的中心与 着陆资源的水平中心之间的距离减小。
[0217]步骤1610可包括将在步骤1604中提取的图像排名。在某些实施方式中,该排名是 基于分配给每个图像的显著性分值。显著性分值可指示用于图像的内容请求者的偏好,并 且可以是确定哪些图像最有可能被内容请求者批准的重要度量。显著性分值还可指示图像 有多好地对应于在着陆资源上展示的内容。
[0218] 在某些实施方式中,步骤1610包括基于与图像相关联的各种相关性准则对图像进 行排名。例如,步骤1610可包括使用相关性准则来向每个图像分配相关性分值。步骤1610可 包括通过基于着陆资源106的URL或自动生成的内容项目将图像(例如,图像元数据、图像内 容等)与关键字列表相比较来确定用于图像的相关性分值。例如,关键字列表可基于企业分 类、企业类型、企业种类或与着陆资源106相关联的企业或实体相关联的其它属性。在某些 实施方式中,关键字列表可基于生成的内容项目的标题或内容项目的其它属性(例如,活 动、广告组、特征产品等)。相关性分值可指示特定图像表示在自动生成的内容项目中展示 的企业、产品或服务的可能性。
[0219] 在某些实施方式中,步骤1610包括在对图像进行排名之前执行一个或多个阈值测 试。例如,步骤1610可包括将在步骤1606中分配给每个图像的质量分值与阈值质量分值相 比较。如果用于图像的质量分值小于阈值质量分值,则步骤1610可包括丢弃图像。步骤1610 可包括将每个提取且已处理的图像的显示尺寸与阈值显示尺寸相比较。如果用于图像的显 示尺寸小于阈值显示尺寸,则步骤1610可包括丢弃图像。
[0220] 在某些实施方式中,图像内容步骤1610包括生成多个图像列表。在步骤1610中生 成的一个列表可以是徽标图像的列表。在步骤1610中生成的另一列表可以是从着陆资源提 取的产品和/或显著图像列表。在步骤1610中生成的另一列表可以是先前已被内容请求者 使用和/或批准的图像列表(例如,从所使用的图像数据库提取的图像)。图像列表可包括与 每个图像相关联的属性,诸如图像宽度、图像高度、显著性分值、相关性分值或其它图像信 息。步骤1610可包括根据分配给图像的显著性分值和/或相关性分值来布置列表中的图像。
[0221] 仍参考图16,过程1600被示为包括从包括从着陆资源提取的图像的一组图像中选 择最高评分图像(步骤1612)。该组图像可包括从着陆资源提取的一个或多个图像和从其它 数据源(例如,所使用的图像数据库310、库存图像数据库312等)提取的一个或多个图像。最 高评分图像可以是具有满足所有阈值准则(例如,显示尺寸准则、质量分值准则等)的最高 显著性分值的图像。
[0222] 在某些实施方式中,步骤1612包括选择与特定内容项目、搜索查询、着陆资源或用 户设备最相关的图像。步骤1612可包括识别与其中将包括所选图像的内容项目相关联的关 键字。例如,步骤1612可包括识别内容项目的标题、名称、话题或其它属性。步骤1612可包括 确定与相关内容项目(例如,在同一广告组中、同一活动的一部分、与同一内容提供者相关 联等的内容项目)相关联的一个或多个关键字。可分别地从着陆资源和搜索查询的内容提 取用于着陆资源和/或搜索查询的关键字。用于特定用户设备的关键字可基于用户兴趣简 档、最近浏览历史、搜索查询历史、地理限制器或用户设备的其它属性。步骤1612可包括将 与每个图像相关联的关键字跟与着陆资源、搜索查询或用户设备相关联的关键字相比较。 步骤1612可包括基于关键字比较来确定图像中的哪个是最相关的,并选择最相关图像以便 在生成的内容项目中使用。
[0223] 仍参考图16,过程1600被示为包括生成包括所选图像的第三方内容项目(步骤 1614)并将第三方内容项目派发给用户设备(步骤1616)。生成包括所选图像的第三方内容 项目可包括将所选图像与先前从着陆资源提取并被选择(例如,通过执行过程1300-1500的 一个或多个步骤)供在生成的内容项目中使用的文本片断、字体系列、色彩方案和/或布局 相组合。将内容项目派发给用户设备可包括将内容项目传递到用户设备或第一方资源。用 户设备可与第一方资源内容相结合地渲染和显示第三方内容项目。
[0224] 第三方内容项目可被配置成在由用户设备与第三方内容项目相交互时将用户设 备指引到着陆资源。与内容项目的交互可包括显示内容项目、在内容项目上悬停、点击内容 项目、观看用于内容项目的源信息或者用户设备与内容项目之间的任何其它类型的交互。 与内容项目的交互不要求用户相对于特定内容项目的明确动作。在某些实施方式中,闪现 (例如,显示或呈现内容项目)可有资格作为交互。用于定义哪些用户动作(例如,主动的或 被动的)有资格作为交互的准则可由内容请求者或由内容生成系统114单独地(例如,针对 每个内容项目)确定。
[0225] 仍参考图16,过程1600被示为包括收集派发统计并对着陆资源监视改变以确定是 否更新第三方内容项目(步骤1618)。收集派发统计可包括确定生成的内容项目被派发给用 户设备的次数、生成的内容项目被用户设备观看或点击的次数和/或检测生成的内容项目 与用户设备之间的其它交互。在某些实施方式中,步骤1618包括评估与生成的内容项目相 关联的性能统计(例如,预测点击率、实际点击率、转换次数、利益率等)。性能统计可指示生 成的内容项目是否是有效的且因此应被再使用或者生成的内容项目是否是无效的且因此 应该用新的内容项目来替换(即,更新)。
[0226] 对着陆资源监视改变可包括将提取图像时的着陆资源的版本与着陆资源的当前 版本相比较。如果自从图像被提取的时间以来着陆资源已改变(例如,新的或不同图像、新 的或不同内容等),则步骤1618可包括确定生成的内容项目应被更新以反映着陆资源的已 改变内容。如果在步骤1618中确定生成的内容项目应被更新,可重复过程1600 (例如,从步 骤1604开始)以从着陆资源提取新图像,对新提取的信息进行分析、处理以及排名,并使用 新提取的图像来生成新内容项目。
[0227] 可用数字电子电路或者用计算机软件、固件或硬件来实现本主题的实施方式和在 本说明书中描述的操作,包括在本说明书及其等价物中以及在其中的一个或多个的组合中 公开的结构。可以将在本说明书中描述的本主题的实施方式实现为一个或多个计算机程 序,即在一个或多个计算机存储介质上编码以便由数据处理装置执行或控制其操作的计算 机程序指令的一个或多个模块。替选地或另外,可以在人工生成的传播信号(例如机器生成 电、光或电磁信号)上对程序指令进行编码,该人工生成的传播信号被生成为将信息编码以 便发射到适当的接收装置以便由数据处理装置执行。计算机存储介质可以是计算机可读存 储设备、计算机可读存储基板、随机或串行存取存储器阵列或设备或其中的一个或多个的 组合,或者被包括在其中。此外,虽然计算机存储介质不是传播信号,但计算机存储介质可 以是在人工生成的传播信号中编码的计算机程序指令的源或目的地。计算机存储介质还可 以是一个或多个分立的部件或介质(例如,多个CD、盘或其它存储设备)或者被包括在其中。 因此,计算机存储介质是有形的且非临时的。
[0228] 可将本公开中描述的操作实现为由数据处理装置对存储在一个或多个计算机可 读存储设备上或从其它源接收到的数据执行的操作。
[0229] 术语"客户端"或"服务器"包括用于处理数据的所有种类的装置、设备以及机器, 举例来说包括可编程处理器、计算机、片上系统或前述各项的多个或组合。所述装置可包括 专用逻辑电路,例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。除硬件之外,该装置 还可以包括创建用于正在讨论中的计算机程序的执行环境的代码(例如组成处理器固件、 协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或其中的一个或多个的组 合的代码)。该装置和执行环境可实现各种不同的计算模型基础设施,诸如web服务、分布式 计算和网格计算基础设施。
[0230] 本公开的系统和方法可以由任何计算机程序完成。可用任何形式的编程语言(包 括编译或解释语言或者声明或过程语言)来编写计算机程序(也称为程序、软件、软件应用、 脚本或代码),并且可将其以任何形式部署,包括作为独立程序或作为模块、部件、子例程、 对象或适合于在计算环境中使用的其它单元。计算机程序可以但不需要对应于文件系统中 的文件。可以将程序存储在保持其它程序或数据(例如,存储在标记语言文档中的一个或多 个脚本)的文件的一部分中、专用于正在讨论中的程序的单个文件中或者在多个协调文件 (例如,存储一个或多个模块、子程序或代码部分的文件)中。可将计算机程序部署成在一个 计算机上或者在位于一个地点处或跨多个地点分布并被通信网络互连的多个计算机上。
[0231] 在本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序以通过 对输入数据进行操作并生成输出来执行动作的一个或多个可编程处理器执行。该过程和逻 辑流程还可以由专用逻辑电路执行,并且还可以将装置实现为专用逻辑电路(例如,FPGA或 ASIC)〇
[0232] 适合于计算机程序执行的处理器举例来说包括通用和专用微处理器以及任何种 类的数字计算机的任何一个或多个处理器。一般地,处理器将从只读存储器或随机存取存 储器或两者接收指令和数据。计算机的必要元件是用于根据指令执行动作的处理器和用于 存储指令和数据的一个或多个存储器设备。一般地,计算机还将包括或者被操作耦合到从 其接收数据或向其传输数据或两者的用于存储数据的一个或多个大容量存储设备(例如 磁、磁光盘盘或光盘)。然而,计算机不需要具有此类设备。此外,可以将计算机嵌入另一设 备中(例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位 系统(GPS)接收机或便携式存储设备(例如,通用串行总线(USB)闪速驱动等)。适合于存储 计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质或存储器 设备,举例来说包括半导体存储器设备(例如,EPR0M、EEPR0M以及闪速存储器设备;磁盘,例 如内部硬盘或可移动盘;磁光盘;以及⑶-ROM和DVD-ROM盘)。可用专用逻辑电路来补充处理 器和存储器或者结合在其中。
[0233] 为了允许与用户的交互,可在计算机上实现在本说明书中描述的本主题的实施方 式,所述计算机具有用户可用来向计算机提供输入的显示设备(例如,CRT(阴极射线管)、 LCD(液晶显示器)、0LED(有机发光二极管)、TFT(薄膜晶体管)或其它柔性配置,或者用于向 用户显示信息的任何其它监视器和键盘、定点设备,例如鼠标、轨迹球等或者触摸屏、触控 板等)。也可使用其它种类的设备来提供与用户的交互;例如,提供给用户的反馈可以是任 何形式的感知反馈(例如,视觉反馈、听觉反馈或触觉反馈);并且可以以任何形式接收来自 用户的输入,包括声学、话音或触觉输入。另外,计算机可以通过向和从用户所使用的设备 发送文档和接收文档来与用户相交互;例如,通过响应于从web浏览器接收到的请求而向用 户的客户端设备上的web浏览器发送网页。
[0234] 可在计算系统中实现本公开中描述的本主题的实施方式,该计算系统包括后端部 件(例如,作为数据服务器),或者其包括中间件部件(例如,应用服务器),或者包括具有用 户可通过其与本公开中描述的主题的实施方式相交互的图形用户界面或web浏览器的前端 部件(例如,客户端计算机),或者一个或多个此类后端、中间件或前端部件的任何组合。可 以用数字数据通信的任何形式或介质(例如,通信网络)将系统的部件互连。通信网络的示 例包括LAN和WAN、互联网(例如,因特网)以及端对端网络(例如,自组式端对端网络)。
[0235] 虽然本说明书包含许多特定实施方式细节,但不应将这些细节认为对任何公开或 可要求保护的范围的限制,而是作为特定于特定公开的特定实施方式的特征的描述。在本 公开中在分立实施方式的背景下描述的某些特征也可以组合地在单个实施方式中实现。相 反地,在单个实施方式的背景下描述的各种特征也可以单独地或以任何适当的子组合在多 个实施方式中实现。此外,虽然上文将特征描述为以某些组合的方式作用甚至最初这样要 求保护,但在某些情况下可以从该组合去除来自要求保护的组合的一个或多个特征,并且 要求保护的组合可以是针对子组合或子组合的变化。
[0236] 同样地,虽然在图中按照特定顺序描绘了各操作,但不应将其理解为要求按照所 示的特定顺序或按照连续顺序来执行此类操作,或者执行所有的所示操作以实现期望的结 果。在某些情况下,多任务和并行处理可以是有利的。此外,不应将上述实施方式中的各种 系统部件的分离理解为在所有实施方式中都要求此类分离,并且应理解的是所述程序部件 和系统一般地可以在单个软件产品中被集成在一起或者封装到在一个或多个有形介质上 体现的多个软件产品。
[0237] 可在智能电视模块(或连接的电视模块、混合电视模块等)上实现本文公开的特 征,该智能电视模块可包括被配置成将因特网连接与更多传统电视节目源(例如,经由有 线、卫星、广播或其它信号接收)集成的处理电路。智能电视模块可在物理上合并到电视机 中,或者可包括分立设备,诸如机顶盒、蓝光或其它数字媒体播放器、游戏控制台、旅馆电视 系统及其它伴随设备。可将智能电视模块配置成允许观看者搜索并找到在web上、本地有线 TV频道上、卫星TV频道上或者存储在本地硬驱上的视频、电影、照片及其它内容。机顶盒 (STB)或机顶单元(STU)可包括信息器械设备,其可包含调谐器并连接到电视机或信号的外 部源,将信号调谐成然后在电视屏幕或其它显示设备上显示的内容。智能电视模块可被配 置成提供主屏幕或顶层屏幕,包括用于多个不同应用的图标,该应用诸如web浏览器和多个 流媒体服务(例如,此丨丨]^、¥11(111、!111111等)、连接有线或卫星媒体源、其它¥613"频道"等。智 能电视模块还可被配置成向用户提供电子节目指南。智能电视模块的伴随应用可以可在移 动计算设备上操作以向用户提供关于可用节目的附加信息,以允许用户控制智能电视模块 等。在替选实施例中,可在膝上型计算机或其它个人计算机、智能电话、其它移动电话、手持 式计算机、平板PC或其它计算设备上实现特征。
[0238] 因此,已描述了本主题的特定实施方式。其它实施方式在所附权利要求的范围内。 在某些情况下,在权利要求中记载的动作可以按照不同的顺序执行且仍实现期望的结果。 另外,在附图中描绘的过程不一定要求所示的特定顺序或连续顺序以实现期望的结果。在 某些实施方式中,多任务和并行处理可以是有利的。
【主权项】
1. 一种用于自动地生成显示内容的计算机化的方法,所述方法包括: 在处理电路处从第三方内容提供者接收统一资源定位符,所述统一资源定位符识别着 陆资源; 由所述处理电路从所述着陆资源提取图像; 由所述处理电路分析所提取的图像以检测所述图像的视觉内容和所述图像的语义内 容; 由所述处理电路基于所检测的视觉内容和所检测的语义内容中的至少一个对所述图 像进彳丁评分; 由所述处理电路从包括从所述着陆资源提取的所述图像的一组图像中选择最高评分 图像;以及 由所述处理电路生成包括所选择的图像的第三方内容项目,其中所述第三方内容项目 被配置成指向所述着陆资源。2. 如权利要求1所述的方法,进一步包括: 基于所述分析的结果来确定所述图像是否需要处理;以及 响应于需要处理的确定而处理所述图像以增强所述图像的所检测的视觉内容和所述 图像的所检测的语义内容中的至少一个。3. 如权利要求1所述的方法,其中,从所述着陆资源提取所述图像包括: 确定用于所述图像的显著性分值,所述显著性分值指示用来在所述着陆资源上显示所 提取的图像的突出性。4. 如权利要求1所述的方法,进一步包括: 从多个不同的位置收集多个图像,所述多个不同的位置包括以下至少一个:所述着陆 资源、与所述着陆资源在同一域或子域下的资源、以及先前在与第三方内容提供者相关联 的内容项目中使用的图像的储存库。5. 如权利要求1所述的方法,其中,分析所提取的图像以检测视觉内容包括确定所述图 像中的显著对象的位置。6. 如权利要求5所述的方法,其中,确定所述图像中的显著对象的位置包括检测所述图 像的色彩分布和检测所述图像中的所述显著对象的边缘中的至少一个。7. 如权利要求1所述的方法,其中,分析所提取的图像以检测视觉内容包括确定所述图 像中的文本的位置。8. 如权利要求1所述的方法,其中,分析所提取的图像以检测视觉内容包括: 生成用于所述图像的显著性地图,所述显著性地图识别所述图像中的显著对象的位置 和所述图像中的任何文本的位置。9. 如权利要求1所述的方法,其中,分析所提取的图像以检测语义内容包括: 生成描述所述图像的所述语义内容的一个或多个标签;以及 将所生成的标签存储为所述图像的属性。10. 如权利要求1所述的方法,其中,分析所提取的图像以检测视觉内容包括基于在所 述图像中表示的显著对象的位置来确定是否对所述图像进行裁剪;以及 其中,处理所述图像包括响应于要对所述图像进行裁剪的确定而对所述图像进行裁剪 以增强所述显著对象的视觉冲击。11. 如权利要求1的所述方法,进一步包括: 识别所述图像的一个或多个审美特征; 将所述一个或多个审美特征作为输入应用于针对人类所标记的图像偏好而被训练的 算法排名过程,其中,所述算法排名过程被配置成使用所述审美特征来基于所述人类所标 记的图像偏好而生成用于所述图像的质量分值。12. -种用于自动地生成显示内容的系统,所述系统包括: 处理电路,所述处理电路被配置成: 从第三方内容提供者接收统一资源定位符,所述统一资源定位符识别着陆资源; 从所述着陆资源提取图像; 分析所提取的图像以检测所述图像的视觉内容和所述图像的语义内容; 基于所检测的视觉内容和所检测的语义内容中的至少一个对所述图像进行评分; 从包括从所述着陆资源提取的所述图像的一组图像中选择最高评分图像;以及 生成包括所选择的图像的第三方内容项目,其中所述第三方内容项目被配置成指向所 述着陆资源。13. 如权利要求12所述的系统,其中,所述处理电路被配置成: 基于所述分析的结果来确定所述图像是否需要处理;以及 响应于需要处理的确定而处理所述图像以增强所述图像的所检测的视觉内容和所述 图像的所检测的语义内容中的至少一个。14. 如权利要求12所述的系统,其中,从所述着陆资源提取所述图像包括: 确定用于所述图像的显著性分值,所述显著性分值指示用来在所述着陆资源上显示所 提取的图像的突出性。15. 如权利要求12所述的系统,其中,所述处理电路被配置成: 从多个不同的位置收集多个图像,所述多个不同的位置包括以下至少一个:所述着陆 资源、与所述着陆资源在同一域或子域下的资源、以及先前在与所述第三方内容提供者相 关联的内容项目中使用的图像的储存库。16. 如权利要求12所述的系统,其中,分析所提取的图像以检测视觉内容包括: 确定以下至少一个的位置:所述图像中的显著对象、和所述图像中的文本;以及 生成用于所述图像的显著性地图,所述显著性地图识别以下至少一个的位置:所述图 像中的所述显著对象、和所述图像中的所述文本。17. 如权利要求12所述的系统,其中,分析所提取的图像以检测语义内容包括: 生成描述所述图像的所述语义内容的一个或多个标签;以及 将所生成的标签存储为所述图像的属性。18. 如权利要求12所述的系统,其中,分析所提取的图像以检测视觉内容包括基于在所 述图像中表示的显著对象的位置来确定是否对所述图像进行裁剪;以及 其中,处理所述图像包括响应于要对所述图像进行裁剪的确定而对所述图像进行裁剪 以增强所述显著对象的视觉冲击。19. 一种用于提取并生成用于显示内容的图像的系统,所述系统包括: 处理电路,所述处理电路被配置成从包括着陆资源和至少一个其它数据源的多个数据 源提取图像; 其中,所述处理电路被配置成检测每个所提取的图像中的内容分布,所述内容分布包 括显著对象的位置和文本的位置中的至少一个; 其中,所述处理电路被配置成基于内容分布检测的结果来处理所提取的图像,其中,处 理所提取的图像包括响应于在图像中检测到的所述显著对象占用小于所述图像中的阈值 面积的确定而对所提取的图像进行裁剪;以及 其中,所述处理电路被配置成至少部分地基于内容分布检测的结果来对所提取的图像 进行排名。20.如权利要求19所述的系统,其中,所述处理电路被配置成计算用于从所述着陆资源 提取的每个图像的页面上显著性分值,所述显著性分值指示用来在所述着陆资源上显示所 提取的图像的突出性; 其中,对所提取的图像进行排名至少部分地基于用于从所述着陆资源提取的每个图像 的所述页面上显著性分值。
【文档编号】G06F17/30GK105874449SQ201380081946
【公开日】2016年8月17日
【申请日】2013年11月8日
【发明人】叶恺, 张冠男
【申请人】谷歌公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1