通过处理搜索日志来识别具有不适当内容的视频的制作方法

文档序号:19734668发布日期:2020-01-18 04:19阅读:158来源:国知局
通过处理搜索日志来识别具有不适当内容的视频的制作方法

本公开一般涉及内容共享平台的领域,并且尤其涉及通过处理与媒体项有关的搜索日志来将内容标签指配给媒体项的任务。在一个示例中,本公开适用于识别具有不适当内容的视频。



背景技术:

内容共享平台允许用户上传、查看和共享内容,诸如视频内容、图像内容、音频内容等(可以统称为“媒体项”、“媒体内容”、“内容项”或“内容”)。这些媒体项可包括音频剪辑、电影剪辑、电视剪辑和音乐视频,以及业余内容,诸如视频博客、简短的原始视频、图片、照片、其它多媒体内容等。用户可以使用计算设备(诸如智能电话、蜂窝电话、膝上型计算机、台式计算机、上网本、平板计算机)来使用、播放和/或消费媒体项(例如,观看数字视频、收听数字音乐、阅读文章等)。一些内容可能具有指配的内容分级,其用作关于内容的年龄适当性的指示。



技术实现要素:

下面是本公开的简化发明内容,以便提供对本公开的一些方面的基本理解。本发明内容不是本公开的广泛概述。既无意确认本公开的关键或重要元素,也无意描绘本公开的特定实现方式的任何范围或权利要求的任何范围。唯一目的在于以简化形式呈现本公开的一些概念,作为稍后呈现的更详细描述的序言。

在一种实施方式中,公开了一种用于对媒体内容进行分类的方法。该方法可包括:由处理设备识别与搜索查询相对应的多个搜索结果,该多个搜索结果与多个媒体项相对应;由处理设备识别多个媒体项中的至少一个第一媒体项和第二媒体项,第一媒体项与第一内容标签相关联,第二媒体项与第二内容标签相关联;至少部分地基于与第一媒体项的第一用户交互,确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求;以及响应于确定搜索查询表示对与第一内容标签相关联的媒体内容的请求,由处理设备将第二媒体项与第一内容标签相关联。

在一些实施方式中,确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求包括:识别与第二媒体项的至少一个第二用户交互;和至少部分地基于第一用户交互和第二用户交互,确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求。

在一些实施方式中,确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求包括:确定与至少一个第一媒体项的用户交互的第一数量;确定与第二媒体项的用户交互的第二数量;以及至少部分地基于第一数量和第二数量,确定第一搜索查询是否表示对与第一分类器相关联的媒体内容的请求。

在一些实施方式中,该方法还包括:确定表示第一数量与第一数量和第二数量之和的比率的权重因子;和将权重因子与第一阈值进行比较。

在一些实施方式中,确定搜索查询是否表示对与第一内容标签有关的媒体内容的请求包括:从与搜索查询相对应的多个媒体项中识别与第一内容标签相关联的媒体项的第三数量;和确定第三数量是否大于第二阈值。

在一些实施方式中,该方法还可包括响应于确定搜索查询不表示对与第一内容标签相关联的媒体内容的请求,将第一媒体项与第二内容标签相关联。

在一些实施方式中,第一内容标签指示第一内容分级(例如,与显式内容或任何其它不适当内容相关联的内容分级),第二内容标签指示第二内容分级(例如,与适合普通观众或儿童的内容相关联的内容分级)。

在一种实施方式中,公开了一种用于对媒体内容进行分类的系统。该系统可包括:存储器;和通信地耦合到存储器的处理设备,其中存储器存储程序指令,这些程序指令在由处理设备执行时可操作以使处理设备:识别与搜索查询相对应的多个搜索结果,该多个搜索结果与多个媒体项相对应;识别多个媒体项中的第一媒体项和第二媒体项,第一媒体项与第一内容标签相关联,第二媒体项与第二内容标签相关联;至少部分地基于与第一媒体项的第一多个用户交互,确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求;以及响应于确定搜索查询表示对与第一内容标签相关联的媒体内容的请求,将第二媒体项与第一内容标签相关联。

在所公开的一个或多个实施方式中,还公开了用于执行上述实施方式的操作的计算设备。另外,在本公开的实施方式中,一种机器可读存储介质存储用于执行上述实施方式的操作的指令。

附图说明

在附图的各图中通过示例而非限制的方式示出了本公开,其中:

图1a示出了根据本公开的实施方式的示例系统架构;

图1b是示出根据本公开的实施方式的内容分级组件的方框图;

图1c和图1d示出了根据本公开的实施方式的呈现搜索结果的示例用户界面;

图2是示出根据本公开的实施方式的一种媒体内容分级方法的流程图;

图3是示出根据本公开的实施方式的一种修改媒体项分级的方法的流程图;以及

图4是示出根据本公开的实施方式的示例性计算机系统的方框图。

具体实施方式

本文描述了用于基于搜索日志来识别具有不适当内容的媒体项的实现方式。内容共享平台上的媒体项(例如,视频)可以与表示媒体项的分级(例如,年龄适当性分级)的各种内容标签相关联。例如,可以为媒体项指配内容标签,该内容标签指示特定观众的适用性,诸如“y”(年轻人)、“g”(一般)、“pg”(父母引导)、“teen”(青少年)、“ma”(成年观众)和“x”(成人/x分级)。搜索服务器或内容服务器可以通过基于内容标签限制搜索结果来为特定用户(例如,儿童)提供内容搜索。例如,“y”分级(例如,面向年轻人)和“g”分级(例如,一般观众)内容通常都被认为对儿童是安全的。搜索服务器和/或内容服务器能够响应于接收到针对适合儿童的媒体内容的搜索查询来提供与“y”分级内容和“g”分级内容相关联的搜索结果。尽管下面的解释是在基于年龄适当性的分级方面,但是在其它示例中,内容标签可以根据其它标准来标记媒体项,例如根据媒体项是否包含某种自然语言的内容,或者这些媒体项是否有意针对学术或大众观众。

用于确定媒体项的分级的常规解决方案通常使用经训练的模型来基于关于媒体项的元数据(例如,标题、描述、关键字等)对媒体项进行分级。常规解决方案还可以基于媒体项的视频帧的特征来对媒体项进行分级。然而,如果内容创建者提供有关媒体项的虚假或误导性信息,则常规解决方案可能无法创建准确的分级。例如,当将包括显式内容的视频上传到内容共享平台时,内容创建者可能有意地提供与“安全”(适合儿童)内容相关联的关键字。内容创建者还可能有意地将包含“安全”内容的视频帧插入到要上传的视频中。因此,包含显式内容的视频可能被常规解决方案错误地分类为“安全”视频。

本公开的各方面通过提供能够基于搜索查询数据确定媒体项的分级的内容分级组件来解决上述缺陷。内容分级组件能够对搜索查询数据自动地执行自动化分析,以对与搜索查询数据相关的媒体项进行分级。例如,内容分级组件能够分析与针对媒体内容的搜索查询相关联的搜索查询数据(例如,在预定时间段内提交给搜索服务器或内容服务器的搜索查询),以识别与每个搜索查询相对应的搜索结果、与搜索结果相关联的媒体项,以及与媒体项相关联的内容标签。

然后,内容分级组件能够基于该分析来确定每个搜索查询是否表示对特定内容(例如,“x”分级内容)的请求。例如,内容分级组件能够确定特定搜索查询的搜索结果包括与第一内容标签相关联的特定数量的视频(例如,“x”分级视频)和与一个或多个其它内容标签相关联的特定数量的视频(例如,“y”分级视频、“g”分级视频和/或其它被视为“安全”分级内容的视频)。内容分级组件能够进一步确定具有“x”分级视频(例如,的选择)的第一多个用户交互以及具有“安全”分级视频(例如,的选择)的第二多个用户交互。在一些实施例中,内容分级组件能够确定权重因子,该权重因子指示与“x”分级视频的用户交互的数量和与“x”分级视频以及“安全”分级视频的用户交互的数量的比率。在一些实施例中,响应于确定权重因子大于第一阈值和/或“x”分级视频的数量大于第二阈值,内容分级组件能够确定搜索查询表示对“x”分级内容的请求。在一些实施例中,响应于确定搜索查询表示对“x”分级内容的请求,内容分级组件能够将视频的“安全”分级改变为“x”分级。可替选地,响应于确定搜索查询不表示对“x”分级内容的请求,内容分级组件能够将视频的“x”分级改变为“安全”分级。

因而,本公开的各方面提供了以准确且高效的方式对媒体项进行分级的技术解决方案。在平台提供对大量媒体项(包括各种各样的相应内容)的访问的情况下,将内容标签自动指配给内容共享平台的媒体项是一项重大的技术挑战。特别地,本文公开的技术可以与媒体项的创建者提供的误导性数据无关地准确地对媒体项进行分级,并且还可以校正可能被常规内容分级技术误分类的媒体项的分级。这样可以提高内容共享平台的可靠性,使系统更安全地抵御攻击(例如,能够更好地抵抗对内容加标签的恶意企图),并减少或消除对其它操作的需要,以检查此类技术的结果并在结果不准确时采取纠正措施。因此,本文公开的技术使得更高效地使用计算(处理)资源并产生更好的用户体验。

图1a示出了根据本公开的实施方式的,用于选择性地修改面向年轻人的内容搜索结果的得分的示例系统架构100。系统架构100包括客户端设备110a-110z、数据存储库106、内容服务器120、搜索服务器130以及内容处理服务器140,系统架构100的每个设备都经由网络105通信地耦合。在一种实施方式中,网络105可以包括公共网络(例如,互联网)、专用网络(例如,局域网(lan)或广域网(wan))、有线网络(例如,以太网网络)、无线网络(例如,802.11网络或wi-fi网络)、蜂窝网络(例如,长期演进(lte)网络)、路由器、集线器、交换机、服务器计算机和/或其组合。

在一种实施方式中,数据存储库106可以是存储器(例如,随机存取存储器)、高速缓存、驱动器(例如,硬盘驱动器)、闪存驱动器、数据库系统或另一类型的组件或能够存储数据的设备。数据存储库106还可以包括也可能跨越多个计算设备(例如,多个服务器计算机)的多个存储组件(例如,多个驱动器或多个数据库)。在一些实施方式中,数据存储库106可以是基于云的。系统架构100的一个或多个设备可以利用数据存储库106来存储公共和私有数据,并且数据存储库106可被配置成为私有数据提供安全存储。

内容服务器120可以表示内容共享平台,内容共享平台还可以可选地包括搜索服务器130、内容处理服务器140、数据存储库106或以上组件的任何组合。内容共享平台可以允许用户消费、上传、搜索、同意(“喜欢”)、不同意(“不喜欢”)或评论媒体项。内容共享平台120还可包括可用于向用户提供对媒体项的访问的网站(例如,网页)或应用程序后端软件。

客户端设备110a-110z每个都可包括诸如个人计算机(pc)、膝上型计算机、移动电话、智能电话、平板计算机、上网本计算机等的计算设备。客户端设备110a-110z也可被称为“用户设备”或“移动设备”。单个用户可以与客户端设备110a-110z中的一个或多个相关联(例如,拥有和/或使用)。客户端设备110a-110z可以每个都由位于不同位置的不同用户拥有和使用。本文使用的“用户”可以被表示为单个个体(例如,成人或儿童)。然而,本公开的其它实施方式包括“用户”是由一组用户和/或自动源控制的实体。例如,在社交网络中联合为社区的一组个人用户可被视为一个“用户”。

客户端设备110a-110z可以各自包括媒体查看器114a-114z。在一种实施方式中,媒体查看器114a-114z可以是允许用户回放、观看或上传诸如图像、视频项、网页、文档、音频项等内容的应用程序。例如,媒体查看器114a-114z可以是能够访问、检索、呈现或导航由web服务器服务的内容(例如,诸如超文本标记语言(html)页面的网页、数字媒体项等的网页)的web浏览器。媒体查看器114a-114z可以向用户渲染、显示或呈现内容(例如,网页、媒体查看器)。媒体查看器114a-114z还可以包括嵌入在网页(例如,可以提供有关在线商家出售的产品的信息的网页)中的嵌入式媒体播放器(例如,播放器或html5播放器)。在另一个示例中,媒体查看器114a-114z可以是允许用户播放数字媒体项(例如,数字视频项、数字图像、电子书等)的独立应用程序(例如,移动应用程序或本机应用程序)。根据本公开的各方面,媒体查看器114a-114z可以是内容共享平台应用程序,供用户记录、编辑和/或上传内容以在内容共享平台上共享。因此,可以通过内容共享平台120将媒体查看器114a-114z提供给客户端设备110a-110z。例如,媒体查看器114a-114z可以是嵌入在由内容共享平台120提供的网页中的嵌入式媒体播放器。在另一示例中,媒体查看器114a-114z可以是从内容共享平台120下载的应用程序。

媒体查看器114a-114z还可以提供用户界面(例如,web浏览器用户界面或移动应用程序用户界面),以允许相应客户端设备110a-110z的用户提交搜索查询(例如,文本的字符串)到搜索服务器130,搜索服务器130又可以向相应的客户端设备110a-110z提供多个搜索结果。例如,如果客户端设备110a的用户向搜索服务器130提交搜索查询,则搜索服务器130可返回一组已得分的搜索结果,这组已得分的搜索结果可被呈现为用于在用户界面中显示为排名列表。用户可以选择搜索结果之一以便从内容服务器120(或者搜索服务器130可以代表客户端设备110a促进从内容服务器120检索内容)检索相关联的内容(例如,文档、网站、视频内容、图像、音乐等)。下文进一步讨论的图1c和图1d提供了呈现搜索结果的用户界面的示例。

在一种实施方式中,内容服务器120可以是一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储库(例如,硬盘、存储器、数据库)、网络、软件组件和/或硬件组件,其可用于为用户提供对媒体项的访问,和/或向用户提供媒体项。内容服务器120可以是由客户端设备110a-110z或搜索服务器130中的任何一个用于检索/访问内容或与内容有关的信息(例如,包括标题、类型、内容标签等的内容元数据)的服务器。

在一些实施方式中,可以利用超过一个内容服务器120,其中一些内容服务器120专门用于特定类型的内容(例如,第一内容服务器托管视频内容,另一内容服务器托管音乐等)。内容服务器120可以托管共享内容、私有内容(例如,仅限于单个用户或一组用户使用的内容)、可商业分发内容(例如,按需内容、可购买内容等)。在一种实施方式中,内容服务器120保留内容数据库122,其包括可用媒体项的记录,包括其标题、描述、分级(例如,包括诸如“面向年轻人”和“一般观众”之类的内容标签)、有关内容或相关联内容的交叉引用、版权信息、许可信息等。在一些实施方式中,内容服务器120可以与搜索服务器130和/或数据存储库106组合。

在一种实施方式中,搜索服务器130可以是一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储库(例如,硬盘、存储器、数据库)、网络、软件组件和/或硬件组件,其可用于处理从客户端设备110a-110z接收的搜索查询,基于搜索查询生成搜索结果的列表,并将搜索结果提供给请求客户端设备110a-110z。搜索服务器130包括搜索引擎系统132。

在一种实施方式中,搜索引擎系统132可以接收搜索查询(例如,从客户端设备110a-110z中的一个),并生成与搜索查询相关的媒体项的搜索结果集合,该搜索结果集合随后可以传回查询所源自的客户端设备。搜索引擎系统132可以例如使用任何合适的搜索算法,搜索与搜索查询有关的媒体项(例如,通过从内容数据库122搜索内容的描述,在内容服务器120或数据存储库106上搜索web文档的主体等)。搜索引擎系统132可以通过识别与搜索查询有关的媒体项并对媒体项进行排名来生成搜索结果集合。

在一些实施方式中,搜索引擎系统132可以限制搜索以查找与一个或多个特定内容标签相关联的内容。在说明性实施方式中,搜索引擎系统132执行“联合”搜索,其中搜索限于面向年轻人的内容和一般观众内容。在另一说明性实施方式中,搜索引擎系统132基于搜索查询执行两个单独的搜索:第一搜索限于面向年轻人的内容,第二搜索限于一般观众内容。在这些说明性实施方式中的每一个中(例如,在识别搜索结果之后进行筛选,“联合”搜索或单独搜索),内容处理服务器140接收与面向年轻人的内容标签(例如,“y”分级内容,由集合y表示)和/或一般观众内容标签(例如,“g”分级内容,由集合g表示)相关联的搜索结果。

在一种实施方式中,内容处理服务器140可以是一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储库(例如,硬盘、存储器、数据库)、网络、软件组件和/或硬件组件,其可用于处理从搜索服务器130和/或内容服务器140接收到的数据搜索查询和/或内容。内容处理服务器140可包括内容分级组件150。在一些实施例中,内容分级组件150能够包括图1b中所示的一个或多个模块。

内容分级组件150能够使用一个或多个分级来对媒体项进行分级。分级可以表示或被称为内容标签。每个内容标签都可以指示特定类型的内容和/或适合特定观众的内容。内容元素可以是从预定的内容标签集合中选择的元素。该集合的一个或多个内容标签可以是互斥的,使得如果某个媒体项与该集合的第一内容标签相关联,则该媒体项不能与该集合的其它内容标签中的至少一个相关联,或者可选地不能与该集合中的任何其它内容标签相关联。内容分级组件150能够将每个媒体项都与一个或多个内容标签(或分级)相关联。内容标签的示例可包括指示面向年轻人的内容的内容标签(例如,“y”分级标签)、指示适合一般观众的内容的内容标签(例如“g”分级标签)、指示某些观众在父母指导下消费的内容的内容标签(例如,“pg”分级标签)、指示适合青少年观众的内容的内容标签(例如,“teen”分级标签)以及指示“x”分级(成人/x分级)内容的内容标签。与一个或多个特定内容标签相关联的媒体项可被视为对特定观众“安全”。例如,“y”分级(例如,面向年轻人)和“g”分级(例如,一般观众)内容两者通常被认为对儿童安全。分别指示“x”分级的内容、“y”分级的内容和“g”分级的内容的三个内容标签可以互斥,使得与任何一个内容标签相关联的媒体项都使得该媒体项与其它两个内容标签的任一个的任何关联无效。

在一些实施例中,内容分级组件150可以从内容服务器120、搜索服务器130、数据存储库106和/或用于媒体内容分级的任何其它设备中的一个或多个接收搜索查询数据。搜索查询数据可以包括与被一个或多个用户提交给内容服务器120和搜索服务器130中的一个或多个的一个或多个搜索查询有关的任何合适的数据。例如,搜索查询数据能够包括搜索查询(例如,字符串、图像和/或每个搜索查询中包括的任何其它内容)。作为另一示例,搜索查询数据能够包括关于与每个搜索查询相对应的一个或多个搜索结果的数据。每个搜索结果都可以对应一个或多个媒体项(例如,视频、图像等)。搜索查询数据还可以包括关于每个媒体项的数据,诸如与每个媒体项相关联的内容标签(或分级)(也称为“初始内容标签”)、指向每个媒体项的链接、与媒体项的一个或多个用户交互等。在一种实施方式中,搜索查询数据可以包括有关在特定时间段(例如,前一天、最近几小时、最近几天等)内提交的一个或多个搜索查询的数据。在另一种实施方式中,搜索查询数据可以包括关于一个或多个特定搜索查询(即,满足至少一个标准的搜索查询)的数据,诸如由用户指定的一个或多个搜索查询、包含特定关键字的一个或多个搜索查询、具有阈值数量的搜索结果的搜索查询等。

内容分级组件150能够基于搜索查询数据执行媒体内容分级。例如,内容分级组件150能够针对与搜索查询数据有关的每个搜索查询,确定一个或多个媒体项是否被错误地分级,并改变媒体项的内容标签(或分级)。例如,对于特定搜索查询,内容分级组件150能够确定搜索查询是否表示对特定媒体内容(例如,与诸如“x”分级标签的特定内容标签相关联的媒体内容)的请求。即,搜索查询确定输入该搜索查询的用户希望访问其特定内容标签准确的媒体项的可能性大于阈值。然后,内容分级组件150能够基于该确定来改变与搜索查询的搜索结果相关联的媒体项的内容标签。例如,响应于确定搜索查询表示对特定媒体内容(例如,“x”分级视频)的请求,内容分级组件150能够将特定内容标签指配给先前与另一内容标签(例如,“y”分级标签、“g”分级标签)相关联的一个或多个媒体项。作为另一示例,响应于确定搜索查询不表示对特定媒体内容的请求,内容分级组件150可以指配新内容标签(例如,“y”分级标签、“g”分级标签)给先前与特定内容标签相关联的一个或多个媒体项。

与搜索查询数据有关的每个搜索查询都可以例如通过执行下面结合图2至图3所述的一个或多个操作来分类。作为示例,内容分级组件150能够分析与搜索查询数据有关的每个搜索查询,对从每次任何用户提交该搜索查询开始选择(例如,通过点击或敲击)相应搜索查询的搜索结果中的“安全”分级和“x”分级视频的总数计数。然后,对于每个搜索查询,内容分级组件150能够将不安全选择权重因子计算为(x视频选择)/(安全视频选择+x视频选择)。内容分级组件150还能够跟踪为每个搜索查询选择的x分级视频的总数。例如,可能在一段时间期间根据搜索查询数据提交搜索查询“sex”100次。内容分级组件150可以基于搜索查询数据确定下列用户交互(例如,选择计数):

x_video1-点击了30次

x_video2-点击了50次

x_video3-点击了15次

safe_video1-点击5次。

内容分级组件150能够确定对于搜索查询“sex”,不安全选择权重因子是0.95(95次x点击/(5次安全点击+95次x点击))。内容分级组件150还可以确定与搜索查询“sex”相关的x视频的数量为3。内容分级组件150还可以确定表示最小不安全选择权重因子(即,使得相应搜索查询被视为是对x分级内容的请求的不安全选择权重因子的最小值)的第一阈值,和表示最小x视频计数(即,在视频被标记为x分级之前,给定视频被请求x分级视频内容的用户选择的最小次数)的第二阈值。在该示例中,如果最小不安全选择权重因子是0.9,则系统可能确定搜索查询“sex”是对x分级视频的请求,并且最小x视频计数是1,因此safe_video1可被重新标记为x视频。

虽然在图1a中作为单个、完全不同的组件示出了内容服务器120、搜索服务器130、内容处理服务器140以及数据存储库106中的每一个,但是这些组件可以在单个设备中一起实现,或者可以以一起运行的多个不同设备的各种组合联网。这些设备的示例可以包括但不限于服务器、大型计算机、联网计算机、基于过程的设备以及相似类型的系统和设备。本公开的一些实施方式可以在单个服务器设备内或在多个服务器设备上操作。本公开的其它实施方式可以在独立系统中操作。在一些实施方式中,内容服务器120、搜索服务器130或内容处理服务器140中的一个或多个由单个实体管理。在一些实施方式中,内容服务器120、搜索服务器130和内容处理服务器140中的一个或多个由不同实体管理。

通常,在一种实施方式中被描述为由内容服务器120、搜索服务器130和/或内容处理服务器140执行的功能还能够在适当情况下,在其它实施方式中由任何客户端设备110a-110z来执行。例如,客户端设备110a可以实现执行内容分级组件150的功能的软件应用程序。另外,归因于特定组件的功能能够由一起操作的不同或多个组件来执行。内容服务器120、搜索服务器130和/或内容处理服务器140也能够作为通过适当的应用程序编程界面提供给其它系统或设备的服务被访问,因而不限于在网站中使用。

图1b是示出根据本公开的实施方式的内容分级组件150的方框图。在一种实施方式中,内容分级组件150可以包括搜索查询分析模块152和分级模块154。在不失一般性的情况下,可以在内容分级组件150中包括更多或更少的组件。例如,两个或多个个模块可以被组合成单个模块,或者模块之一可以被分成两个或多个个模块。在一种实施方式中,一个或多个模块可以驻留在不同的计算设备上(例如,不同的服务器计算机、在单个客户端设备上、分布在多个客户端设备之中等)。

在一种实施方式中,内容分级组件150通信地耦合到数据存储库106。例如,内容分级组件150可以经由网络(例如,经由图1a和图1b中所示的网络105)耦合到数据存储库106。在另一示例中,内容分级组件150可以直接耦合到搜索引擎系统132所驻留的服务器(例如,可以直接耦合到搜索服务器130)。如关于图1a所述的,数据存储库106可以是存储器(例如,随机存取存储器)、高速缓存、驱动器(例如,硬盘驱动器)、闪存驱动器、数据库系统,或是能够存储数据的另一类型的组件或设备。数据存储库106还可以包括多个存储组件(例如,多个驱动器或多个数据库),其也可以跨越多个计算设备(例如,多个服务器计算机),并且可以是基于云的。数据存储库106可以是客户端设备110a-110z、内容服务器120、搜索服务器130以及内容处理服务器140中的任何一个的一部分或分布在它们之间,如关于图1a所述。

在一种实施方式中,数据存储库106包括与被识别(例如,被搜索引擎系统132)为驻留在内容服务器120上或任何其它内容源上的可检索媒体项相对应的内容搜索结果160a-160z。内容搜索结果160a-160z中的每一个可能已由搜索引擎系统132生成,每个搜索结果分别包括内容标签162a-162z(例如,可能先前已指配给它们相应的媒体项并存储在内容数据库122中)和用户交互数据164a-164z。在一种实施方式中,内容搜索结果160a-160z可被存储在搜索服务器(例如,搜索服务器130)和/或内容服务器(例如,内容服务器120)上。在一些实施例中,内容搜索结果160a-160z可以是根据本公开所述的搜索查询数据的一部分。

用户交互数据164a-164z可以是和/或包括关于与内容搜索结果160a-160z相关联的媒体项的用户交互的数据。例如,每个用户交互数据164a-164z都可以包括指示相应的搜索结果160a-160a是否被任何用户交互(例如“选择的”)的数据(例如,标记)。作为另一示例,用户交互数据164a-164z可以包括关于一个或多个用户与搜索结果160a-160z和/或与搜索结果160a-160z相关联的媒体项的一个或多个用户交互的数据。用户可以是和/或包括提交与搜索结果160a-160z有关的搜索查询的用户。与媒体项和/或搜索结果的用户交互的示例可以是例如对媒体项和/或与媒体项相关的搜索结果和/或搜索结果的选择(例如,通过“点击”、“敲击”等)、消费媒体项的一个或多个部分、对媒体项进行评论、推荐(例如“点赞”)媒体项、共享媒体项等。

搜索查询分析模块152能够分析内容搜索结果160a-160z以进行媒体内容分级。例如,搜索查询分析模块152能够确定与第一内容标签(例如,“x”分级内容标签)相关联的一个或多个第一媒体项以及与第一媒体项的一个或多个第一用户交互。第一用户交互可以包括例如与第一媒体项有关的一个或多个搜索结果160a-160z的用户选择。搜索查询分析模块152还能够分析内容搜索结果160a-160z,以确定不与第一内容标签相关联的一个或多个第二媒体项(例如,具有指示“g”分级内容的第二内容标签的媒体项,指示“y”分级内容的第三内容标签,等等),以及与第二媒体项的一个或多个第二用户交互。第二用户交互可以包括例如与第二媒体项有关的一个或多个搜索结果160a-160z的用户选择。

分级模块154能够基于第一用户交互和/或第二用户交互来确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求。例如,分级模块154能够确定权重因子,其表示与搜索查询相关联的媒体项的用户交互中的第一用户交互的百分比。在一些实施例中,可以通过计算第一用户交互的次数和与第一媒体项和第二媒体项的用户交互的次数之比来确定权重因子。然后,分级模块154能够将权重因子与第一阈值进行比较。分级模块154还能够将第一媒体项的数量与第二阈值进行比较。在一些实施例中,响应于确定权重因子大于第一阈值和/或第一媒体项的数量大于第二阈值,分级模块154能够确定搜索查询代表对与特定标签相关联的媒体内容的请求。然后,分级模块154能够通过将第二媒体项与第一内容标签相关联来改变第二媒体项的分级。分级模块154还能够响应于确定搜索查询不表示对与第一内容标签相关联的媒体内容的请求而改变第一媒体项的分级。例如,分级模块154能够将第一媒体项与第二内容标签相关联。在一些实施例中,可以基于上述改变来更新内容标签162a-162z。

在一些实施例中,分级模块154能够确定第一阈值和/或第二阈值的值。例如,分级模块154能够生成已知内容的多个媒体项的训练集(即,训练集的每个媒体项都与被认为是准确的内容标签相关联),并确定训练集中与第一内容标签相关联的媒体项的百分比。分级模块154能够基于所确定的百分比来确定第一阈值的值。作为另一示例,分级模块154能够基于与训练集中的第一内容标签相关联的媒体项的数量来确定第二阈值的值。在一些实施例中,可以基于用户输入(例如,指示特定媒体项为与第一内容标签有关的内容的用户输入)确定训练集中与第一内容标签相关联的媒体项的百分比和/或与第一内容标签相关联的媒体项的数量。

内容分级组件150被描述为由内容处理服务器140实现,但是可以由客户端设备110a-110z、内容服务器120和/或搜索服务器130中的任何一个实现。例如,客户端设备(例如,客户端设备110a)可以被编程为执行内容分级组件150的所有功能。当内容分级组件150在客户端设备上实现时,本领域技术人员应明白,应将关于“接收”、“发送”、“检索”、“识别”、“确定”、“分析”、“处理”等的内容分级组件150所述的任何功能都理解为是由在客户端设备内,而非跨网络(例如,网络105)的子系统或子模块执行的功能。

图1c示出了根据本公开的实施方式的,呈现与特定内容标签有关的搜索结果的示例用户界面170。例如,用户界面170可以对应于由客户端设备110a-110z的相应媒体查看器114a-114z之一提供的用户界面。用户界面170包括用于输入搜索字符串(例如,“蓝色”)的搜索框171,以及使对“蓝色”的搜索请求被发送到搜索引擎(例如,搜索引擎系统132)的搜索按钮172。显示搜索结果173-175,并且滚动条176指示下面的附加搜索结果的可用性。如图所示,“蓝色”的搜索结果包括面向年轻人的内容和一般观众内容。例如,搜索结果173和174是专门为年轻观众设计的视频,而搜索结果175对应于对于一般观众来说是安全的内容。基于应用于它们各自得分的一个或多个提升,搜索结果173和174可能已经被提升到搜索结果173-175的顶部。

图1d示出了根据本公开的一些实施方式的呈现搜索结果的示例用户界面180。用户界面180包括搜索框181、搜索按钮182、滚动条186以及搜索结果183-185。所示搜索结果183-185对应于如果未应用面向年轻人或普通观众的限制并且未选择性地修改面向年轻人的搜索结果得分,则可能产生的潜在搜索结果。例如,顶部搜索结果183虽然相关,但是由于其内容的性质而可能不适合儿童。搜索结果184可以被认为是成人内容,并且可以取决于是否使用成人内容过滤器而存在或不存在。除了在本示例中其得分相对低于搜索结果183和184之外,搜索结果185都可以对应于与搜索结果173相同的内容。

图2是示出根据本公开的实施方式的一种媒体内容分级方法200的流程图。图3是示出根据本公开的实施方式的一种修改媒体项分级的方法300的流程图。方法200和300可以由包括硬件(例如,电路、专用逻辑、可编程逻辑、微代码等)、软件(例如,在处理设备上运行以执行硬件模拟的指令)或其组合的处理逻辑执行。在一种实施方式中,方法200和300可以每个都由执行关于图1a和图1b所述的内容分级组件150的处理设备执行。

参考图2,当处理设备可以识别与搜索查询相对应的多个搜索结果时,方法200开始于方框210。每个搜索结果都可以对应于一个或多个媒体项。每个媒体项和/或搜索结果都可以与预定的相应内容标签相关联。搜索查询可以由一个或多个用户在一个或多个搜索服务器、内容服务器和/或任何其它平台上发布。可以例如基于与在搜索服务器和/或内容服务器上发布的一个或多个搜索查询有关的搜索查询数据来识别搜索结果。搜索查询数据可以包括关于结合图1a-1b所述的搜索结果的数据。

在方框220,处理设备能够从与搜索查询相关联的媒体项中识别与第一内容标签相关联的一个或多个媒体项(也称为“第一多个媒体项”)。例如,处理设备能够基于搜索查询数据确定与“x”分级标签相关联的一个或多个媒体项。

在方框230,处理设备能够识别与第一内容标签相关联的媒体项的一个或多个用户交互。例如,处理设备能够确定与第一多个媒体项中的每一个的特定用户交互(例如,用户对第一媒体项或与第一媒体项有关的搜索结果的选择)。作为另一示例,处理设备能够确定与第一多个媒体项中的每一个的用户交互的数量(例如,“点击”数量)。

在方框240,处理设备能够至少部分地基于第一用户交互来确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求。例如,处理设备能够确定第一用户交互的数量以及与搜索查询相关联的媒体项的总体用户交互的数量。然后,处理设备能够确定权重因子,该权重因子表示第一用户交互和与搜索查询相关联的媒体项的用户交互的比率。响应于确定权重因子大于第一阈值,处理设备能够确定搜索查询表示对与第一内容标签相关联的媒体内容的请求。类似地,响应于确定权重因子不大于第一阈值,处理设备能够确定搜索查询不表示对与第一内容标签相关联的媒体内容的请求。

作为另一示例,处理设备能够确定第一多个媒体项的数量是否大于第二阈值。在一些实施例中,响应于确定第一多个媒体项的数量大于第二阈值,处理设备能够确定搜索查询表示对与第一内容标签相关联的媒体内容的请求。类似地,响应于确定第一多个媒体项的数量不大于第二阈值,处理设备能够确定搜索查询不表示对与第一内容标签相关联的媒体内容的请求。

作为又另一示例,响应于确定权重因子大于第一阈值并且第一多个媒体项的数量大于第二阈值,处理设备能够确定搜索查询表示对与第一内容标签相关联的媒体内容的请求。在一些实施例中,处理设备能够通过执行下面结合图3所述的一个或多个操作来确定搜索查询是否表示对与第一内容标签相关联的媒体内容的请求。

在一些实施例中,在方框250,处理设备能够基于该确定来改变多个媒体项中的一个或多个的标签。例如,响应于确定搜索查询表示对与第一内容标签相关联的媒体内容的请求,处理设备能够重新分级与第二内容标签相关联的第二媒体项(例如,“y”分级内容标签、“g”分级内容标签)。更具体地,例如,处理设备能够将第二媒体项与第一内容标签相关联。可替选地,响应于确定搜索查询不表示对与第一内容标签相关联的媒体内容的请求,处理设备能够对第一多个媒体项进行重新分级。更特别地,例如,处理设备能够将第一多个媒体项与一个或多个其它内容标签相关联,该其它内容标签与第一内容标签不同(例如,第二内容标签)。

参考图3,当处理设备可以从与搜索查询相关联的多个媒体项识别与第一内容标签相关联的一个或多个媒体项(也称为“第一多个媒体项”)时,方法300在方框310开始。第一内容标签可以是例如指示成人内容、显式内容等的“x”内容分级。如关于图2所述的,可以以与方框220基本类似的方式执行方框310。

在方框320,处理设备能够从与搜索查询相关联的媒体项识别与一个或多个其它内容标签相关联的一个或多个媒体项(也称为“第二多个媒体项”)。第二媒体项可以与不同于第一内容标识符的任何内容标识符相关联。例如,第二媒体项可包括与面向年轻人内容的第二内容标签(例如,“y”分级)相关联的一个或多个媒体项。作为另一示例,第二媒体项可以包括与第三内容标签相关联的一个或多个媒体项,第三内容标签与针对普通观众的内容相关联(例如,“g”分级)。在一些实施例中,第二媒体项可以被视为是对于特定用户(例如,儿童)“安全”的内容。

在方框330,处理设备能够确定与第一多个媒体项的一个或多个用户交互(也称为“第一用户交互”)。例如,处理设备能够确定一个或多个用户与第一媒体项的交互的特定类型,诸如用户选择第一媒体项中的一个、在特定时间段内用户消费第一媒体项中的一个、共享第一媒体项之一等。

在方框340,处理设备能够确定与第二多个媒体项的一个或多个用户交互(也称为“第二用户交互”)。例如,处理设备能够确定一个或多个用户与第二多个媒体项的一个或多个的交互的特定类型,诸如用户选择第二多个媒体项中的一个、在特定时间段内用户消费第二多个媒体项中的一个、共享第二多个媒体项之一等。

在方框350,处理设备能够基于第一用户交互和第二用户交互确定权重因子。例如,处理设备能够确定第一用户交互的数量(也称为“第一数量”)和第二用户交互的数量(也称为“第二数量”)。处理设备能够通过计算第一数量与第一数量和第二数量之和的比率来确定权重因子。

在方框360,处理设备能够确定权重因子是否大于第一阈值。在一些实施例中,响应于确定权重因子大于第一阈值,处理设备能够进行到370并且能够确定第一多个媒体项的数量是否大于第二阈值。第二阈值的值可以是1、2或任何其它合适的值。响应于确定第一多个媒体项的数量大于第二阈值,在方框380,处理设备能够确定搜索查询表示对与第一内容标识符相关联的媒体内容的请求。可替选地,响应于确定第一数量不大于第二阈值和/或权重因子不大于第一阈值,处理设备能够在方框390确定搜索查询不表示对与第一内容标识符相关联的媒体内容的请求。

为了便于解释,将本公开的方法示出和描述为一系列动作。然而,根据本公开的动作能够以各种顺序和/或同时发生,并且具有本文未呈现和描述的其它动作。此外,可能不需要所有示出的动作来实现根据所公开的主题的方法。另外,本领域技术人员应理解并明白,所述方法能够可替选地经由状态图或事件表示为一系列相互关联的状态。另外,应理解,在本说明书中公开的方法能够被存储在制品上,以便于将这些方法传输和转移到计算设备。本文中使用的术语“制品”旨在涵盖可从任何计算机可读设备或存储介质访问的计算机程序。

虽然就选择性地修改内容搜索结果的得分讨论了本公开的实施方式,但是这些实施方式通常还可以应用于其中较大数据集内的数据集将被选择性地调整/修改的任何系统。因而,本公开的实施方式不限于内容搜索结果。

图4示出了计算机系统400的示例性形式的机器的图解表示图,可在计算机系统400中执行指令集,以引起机器执行本文所讨论的一种或多种方法。在可替选实施方式中,该机器可以连接(例如,联网)到lan、内联网、外联网或互联网中的其它机器。该机器可以在客户端-服务器网络环境中以服务器或客户端机器的能力运行,或者在对等(或分布式)网络环境中作为对等机器运行。该机器可以是个人计算机(pc)、平板计算机、机顶盒(stb)、个人数字助理(pda)、蜂窝电话、web设备、服务器、网络路由器、交换机或网桥,或能够执行指令集(顺序指令或其它指令)的任何机器,这些指令指定该机器要执行的操作。此外,虽然仅示出了单个机器,但是术语“机器”也应被理解为包括机器的任何集合,这些机器单独地或共同地执行一组(或多组)指令以执行本文讨论的任何一种或多种方法。客户端设备110a-110z、数据存储库106、内容服务器120、搜索服务器130以及内容处理服务器140中的任何一个都可以利用或说明计算机系统400的一些或全部组件。

示例性计算机系统400包括经由总线410彼此通信的处理设备(处理器)402、主存储器404(例如,只读存储器(rom)、闪存、动态随机存取存储器(dram),诸如同步dram(sdram)或rambusdram(rdram)等)、静态存储器406(例如,闪存、静态随机存取存储器(sram)等)以及数据存储设备418。

处理器402表示一个或多个通用处理设备,诸如微处理器、中央处理单元等。更具体地,处理器402可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器,或者是实现其它指令集的处理器或实现指令集的组合的处理器。处理器402还可以是一个或多个专用处理设备,诸如应用程序专用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器等。处理器402被配置成执行指令426以执行本文中讨论的操作和步骤。

计算机系统400还可包括网络接口设备408。计算机系统400也可包括视频显示单元412(例如,液晶显示器(lcd)、阴极射线管(crt)或触摸屏)、字母数字输入设备414(例如键盘)、光标控制设备416(例如鼠标)以及信号生成设备420(例如扬声器)。

数据存储设备418可包括计算机可读存储介质424,其上存储了具体实施本文所述的方法或功能中的任何一个或多个的一组或多组指令426(例如,软件)。在计算机系统400执行指令期间,指令426还可以全部或至少部分地驻留在主存储器404内和/或处理器402内,主存储器404和处理器402也构成计算机可读存储介质。指令426还可经由网络接口设备408在网络430(例如,网络105)上发送或接收。

在一种实施方式中,指令426包括用于一个或多个内容分级组件150的指令,内容分级组件150可以对应于关于图1a和图1b所述的相同名称的对应组件。虽然在示例性实施方式中将计算机可读存储介质424示出为单个介质,但是术语“计算机可读存储介质”或“机器可读存储介质”应被认为包括单个介质或多个介质(例如,集中式或分布式数据库和/或关联的高速缓存和服务器),用于存储一个或多个指令集。术语“计算机可读存储介质”或“机器可读存储介质”也应被认为包括能够存储、编码或承载指令集以供机器执行,并且使机器执行本公开的任何一种或多种方法的任何暂时性或非暂时性介质。因而,术语“计算机可读存储介质”应被认为包括但不限于固态存储器、光学介质和磁性介质。

在前面的描述中,阐述了许多细节。然而,对于受益于本公开的本领域技术人员显而易见的是,可以在没有这些具体细节的情况下实践本公开。在一些实例中,以方框图的形式而非详细地示出公知的结构和设备,以避免使本公开不清楚。

可能已经根据对计算机存储器内的数据位的操作的算法和符号表示来呈现详细描述的一些部分。这些算法描述和表示是数据处理领域的技术人员用来最有效地向本领域其它技术人员传达其工作实质的手段。算法在本文中并且通常被构想为是导致期望结果的步骤的自洽序列。这些步骤是需要对物理量进行物理操纵的步骤。通常,虽然不是必须的,但是这些量采取能够被存储、传输、组合、比较和以其它方式操纵的电或磁信号的形式。主要出于通用目的,已经证明有时将这些信号称为位、值、元素、符号、字符、项、数字等是方便的。

然而,应当牢记,所有这些和类似术语都均应与适当的物理量相关联,并且仅仅是应用于这些量的适当的标签。除非从前面的讨论中另外明确指出,否则都应明白,在整个描述中,利用诸如“接收”、“发送”、“生成”、“添加”、“处理”、“分类”、“重新分类”、“搜索”、“关联”、“指配”、“分析”、“确定”、“启用”、“识别”、“分级”、“重新分级”、“修改”等术语的讨论指的是计算机系统或类似电子计算设备的动作和过程,其将表示为计算机系统的寄存器和存储器内的物理(例如,电子)量的数据操纵并转换为类似地表示为计算机系统存储器或寄存器或其它此类信息存储、传输或显示设备内的物理量的其它数据。

本公开还涉及用于执行本文中的操作的装置、设备或系统。该装置、设备或系统可以为所需目的而专门构造,或者可以包括由存储在计算机中的计算机程序选择性地激活或重新配置的通用计算机。这种计算机程序可以存储在计算机或机器可读存储介质中,诸如但不限于任何类型的磁盘,包括软盘、光盘、光盘只读存储器(cd-rom)和磁光盘、只读存储器(rom)、随机存取存储器(ram)、eprom、eeprom、磁卡或光卡,或适合存储电子指令的任何类型的介质。

词语“示例”或“示例性”在本文中用来表示充当示例、实例或说明。本文中被描述为“示例”或“示例性”的任何方面或设计都不必被解释为比其它方面或设计更优选或有利。相反,词语“示例”或“示例性”的使用旨在以具体方式呈现概念。本申请中使用的术语“或”旨在表示包括性的“或”而不是排它性的“或”。即,除非另有说明或从上下文可以清楚地看出,否则“x包括a或b”都有意表示任何自然的包含性排列。也就是说,如果x包括a;x包括b;或x包括a和b两者,则在任何上述情况下均满足“x包括a或b”。另外,在本申请和所附权利要求书中使用的冠词“一”和“一个”通常应被解释为意指“一个或多个”,除非另有说明或从上下文中清楚地指向单数形式。在整个说明书中,对“实施方式”或“一个实施方式”的引用意指结合该实施方式描述的特定特征、结构或特性被包括在至少一个实施方式中。因而,在整个说明书中各处出现的短语“实施方式”或“一个实施方式”不一定都指的是同一实施方式。

除了以上描述之外,还可以向用户提供控件,该控件允许用户做出下列选择:本文所述的系统、程序或功能是否以及何时可以收集用户的信息(例如,关于用户的社交网络、社会动作或活动、职业、用户偏好或用户的当前位置的信息);和用户是否从服务器发送内容或通信。另外,在存储或使用某些数据之前,可能会以一种或多种方式处理某些数据,以便删除个人身份信息。例如,可以处理用户身份,以便无法为该用户确定任何个人身份信息,或者可以在获得位置信息的情况下将用户的地理位置概括化(例如,概括到城市、邮政编码或州级别),因此无法确定用户的特定位置。因而,用户可以对收集了用户的哪些信息,如何使用该信息以及向用户提供哪些信息进行控制。

应理解,以上描述意图是说明性的而不是限制性的。在阅读和理解以上描述之后,许多其它实施方式对于本领域技术人员将是显而易见的。因此,本公开的范围应参考所附权利要求书以及这些权利要求书所赋予的等效物的全部范围来确定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1