基于评论的媒体内容项的语言识别的方法、系统和介质与流程

文档序号：15307394发布日期：2018-08-31 21:13阅读：140来源：国知局

本申请要求于2016年6月6日提交的美国专利申请no.15/174,668的权益，其要求于2016年4月14日提交的美国临时专利申请no.62/322,685的权益，因此其中的每一个通过引用被整体合并在此。

所公开的主题涉及用于基于评论的媒体内容项的语言识别的方法、系统和介质。

背景技术：

许多用户从具有视频内容项的大集合中服务访问视频内容。通常，这些集合包括来自不同国家的用户已经上传并且包含各种语言的音频内容和/或文本内容的视频内容。这样，可以将视频内容供应给不太可能理解内容的用户。对于一些视频内容，重要的是，这些服务向用户呈现包含以用户能够理解的语言的音频和/或文本内容的视频内容。

然而，这些服务通常依赖于可能或不可能正确识别视频内容中使用的语言的信息，诸如元数据中的信息或上传视频内容的用户提供的信息。此外，在许多情况下，与视频内容相关联的语言尚未由上传视频内容的用户指示。诸如自动语音识别(asr)的技术有时可以被用于确定视频内容的语言。但是，这种识别技术并不支持所有的语言，并且对视频内容中的背景音乐、噪音和多方对话等存在问题。因此，很难识别视频内容的语言。

因此，期望提供用于基于评论的媒体内容项的语言识别的新方法、系统和介质。

技术实现要素：

根据所公开的主题的一些实施方式，提供用于基于评论的媒体内容项的语言识别的机制。

根据所公开的主题的一些实施方式，提供一种用于媒体内容的语言识别的方法，该方法包括：获得与媒体内容项相关联的多个评论；基于一个或多个判据选择多个评论的子集；为多个评论的子集中的每个评论指配语言概率的向量，其中该向量的每个分量被指配语言概率，该语言概率指示该评论包括来自多个语言中的语言的内容的可能性；组合用于所述多个评论的所述子集中的每个评论的语言概率的向量以生成组合的语言向量；基于该组合的语言向量识别与媒体内容项相关联的语言；以及基于所识别的语言执行动作。

在一些实施例中，基于一个或多个判据选择多个评论的子集包括移除未达到预定单词数量或预定字符数量的评论。

在一些实施例中，该方法进一步包括，确定所述多个评论的所述子集中的每个评论的长度，其中所述组合的语言表示是基于每个评论的所确定的长度加权的、针对所述多个语言中的每个语言和跨所述多个评论的所述子集的所述语言概率的加权平均。

在一些实施例中，该方法进一步包括确定与所述多个评论的所述子集中的每个评论相关联的投票指示，其中所述组合的语言表示是基于所确定的投票指示加权的、针对所述多个语言中的每个语言和跨所述多个评论的所述子集的所述语言概率的加权平均。

在一些实施例中，基于所述组合的语言向量识别与媒体内容项相关联的语言还包括用对应于与媒体内容项相关联的元数据的语言概率的附加向量扩充所述组合的语言向量。

在一些实施例中，基于所述组合的语言向量识别与媒体内容项相关联的语言还包括，用媒体内容项信息扩充所述组合的语言向量。在一些实施例中，媒体内容项信息包括媒体内容项的类别。

在一些实施例中，执行所述动作还包括响应于呈现媒体内容项，以所识别的语言呈现一个或多个相关媒体内容项。

在一些实施例中，执行所述动作还包括：将与所识别的语言相对应的信息发送到广告服务器；从广告服务器接收与识别的语言相对应的广告；以及使广告呈现。

在一些实施例中，执行所述动作还包括：确定要呈现的第二媒体内容项具有与所识别的语言不同的语言标识符；以及在呈现第二媒体内容项期间呈现字幕信息，其中该字幕信息使用所识别的语言。

根据所公开的主题的一些实施方式，提供一种用于媒体内容的语言识别的系统，该系统包括硬件处理器，该硬件处理器被配置成：获得与媒体内容项相关联的多个评论；基于一个或多个判据选择多个评论的子集；为所述多个评论的所述子集中的每个评论指配语言概率的向量，其中该向量的每个分量被指配语言概率，该语言概率指示该评论包括来自多个语言中的语言的内容的可能性；组合用于所述多个评论的所述子集中的每个评论的语言概率的向量以生成组合的语言向量；基于所述组合的语言向量识别与媒体内容项相关联的语言；以及基于所识别的语言执行动作。

根据所公开的主题的一些实施方式，提供一种包含计算机可执行指令的非暂时性计算机可读介质，当由处理器执行该计算机可执行指令时，使处理器执行用于媒体内容的语言标识的方法，该方法包括：获得与媒体内容项相关联的多个评论；基于一个或多个判据选择多个评论的子集；为所述多个评论的所述子集中的每个评论指配语言概率的向量，其中该向量的每个分量被指配语言概率，该语言概率指示该评论包括来自多个语言中的语言的内容的可能性；组合用于所述多个评论的所述子集中的每个评论的语言概率的向量以生成组合的语言向量；基于所述组合的语言向量识别与媒体内容项相关联的语言；并且基于所识别的语言执行动作。

根据所公开的主题的一些实施方式，提供一种用于媒体内容的语言识别的系统，该系统包括：用于获得与媒体内容项相关联的多个评论的装置；用于基于一个或多个判据选择多个评论的子集的装置；用于为所述多个评论的所述子集中的每个评论指配语言概率的向量的装置，其中该向量的每个分量被指配语言概率，该语言概率指示评论包括来自多个语言中的语言的内容的可能性；用于组合多个评论的子集中的每个评论的语言概率的向量以生成组合的语言向量的装置；用于基于组合的语言向量识别与媒体内容项相关联的语言的装置；以及用于基于所识别的语言来执行动作的装置。

附图说明

当结合下述附图进行考虑时，参考下述对所公开的主题的详细描述能够更全面地理解所公开的主题的各种目的、特征和优点，其中相似的附图标记识别相似的元件。

图1示出根据所公开的主题的一些实施例的用于呈现视频内容和与所呈现的视频内容相关联的评论的用户界面的说明性示例。

图2示出根据所公开的主题的一些实施例的适用于实现用于基于评论的媒体内容项的语言标识的在此描述的机制的说明性系统的示意图。

图3示出根据所公开的主题的一些实施例的可以在图2的服务器和/或用户设备中使用的硬件的详细示例。

图4示出根据所公开的主题的一些实施例的用于基于评论确定媒体内容项的语言的过程的说明性示例。

具体实施方式

根据所公开的主题的各种实施例，提供用于基于评论对媒体内容项进行语言识别的机制(能够包括方法、系统和介质)。

在所公开的主题的一些实施例中，本文描述的机制能够检索与媒体内容项相关联的评论。这些评论能够以任何合适的方式(例如，按照长度、按照人气、按照用户参与、通过任何其它合适的方式或其任何适当的组合)进行排序和/或过滤。例如，这能够包括过滤掉长度小于5个单词或少于20个字符的评论(例如，移除简短的无意义的评论)、过滤掉自动生成的评论(例如，“sharedonthisservice(在此服务上共享)”评论)、过滤掉长度超过一万个字符的评论(例如，移除机器生成的评论)、和/或过滤掉包括url且没有文本内容的评论。

应注意的是，检索到的评论能够包括可公开访问的评论。还应注意的是，评论能够在一些情况下被删除，使得评论不再与媒体内容项相关联。这里描述的语言识别机制能够检索被更新的评论的集合(例如，从与媒体服务相关联的评论数据库)，使得删除的评论被排除在考虑之外。

在选择评论的子集时，所述机制能够为每个评论生成多个语言中的每一种的概率向量。例如，对于所选评论的子集中的每个评论，所述机制能够生成概率向量，其中向量的每个分量是给定评论以特定语言的概率(例如，向量的一个分量能够包括该评论以西班牙语的0.5概率得分)。

在一些实施例中，评论子集中的每个评论的向量能够被组合以生成评论子集中的多个语言中的每一个的概率的单个向量。组合语言概率的向量能够包括，例如，针对每个评论对跨向量的特定语言的语言概率得分进行平均以获得用于被放置在跨评论子集的用于媒体内容项的语言得分的单个向量中的特定语言的语言得分。应注意的是，在一些实施例中，当组合语言概率的向量时，能够将一个或多个权重应用于每个向量中的语言概率得分。例如，当组合每个评论的概率向量时，能够应用考虑评论长度的权重。在更具体的示例中，当为评论的集合确定加权平均语言得分时，每个评论的得分的权重能够与评论的长度成比例。这样，能够使用权重以强调较长的评论能够在确定媒体内容项的语言中承载更多的权重。

响应于生成与媒体内容项相关联的评论的子集的语言概率的组合向量，所述机制能够确定与媒体内容项相关联的语言。例如，这能够包括在对评论子集中的所有评论进行平均之后，选择与组合向量语言概率中的最大得分相关联的语言。

例如，音乐视频能够由说英语的用户上传到社交媒体平台、视频供应服务或者任何其他合适的服务，并且因此具有还用英语的标题和/或其他输入的元数据，但包含用西班牙语的音频内容和文本内容。响应于生成针对与音乐视频相关联的每个评论的语言概率的向量，将用于每个评论的向量组合以生成跨评论的单个向量，并且确定单个向量的哪个分量具有最高得分(例如，对应于西班牙语的分量)，这些机制能够将音乐视频的语言标识符设置为西班牙语。

应注意的是，在一些实施例中，从与媒体内容项相关联的评论导出的语言信息能够用附加信息(例如，描述元数据、标题元数据、与媒体内容项相关联的支持(upvote)、用户信息等)增强或者补充以确定与媒体内容项相关联的语言。

在一些实施例中，在将语言标识符与媒体内容项相关联(例如，音乐视频包含使用西班牙语言的内容)时，所述机制能够使用所确定的语言标识符执行附加动作。例如，所述机制能够呈现包括也具有相同语言标识符的附加媒体内容项(例如，具有西班牙语言标识符的其他音乐视频)的推荐界面。在另一示例中，所述机制能够呈现响应于搜索查询的搜索结果，其中搜索结果具有相同的语言标识符(例如，具有西班牙语言标识符的视频内容)。在又一示例中，所述机制能够将语言标识符发送到其他源以获得诸如广告内容(例如，西班牙语的广告)的附加内容。在又一示例中，能够使用所述机制以确定的语言(例如，用于不是西班牙语的视频内容的西班牙语字幕)提供字幕信息或其他补充信息。

在一些实施例中，在对多个媒体内容项(例如，视频数据库中的每个视频)执行基于评论的语言标识时，所述机制能够使用与每个媒体内容项相关联的语言标识符以及与用户有关的信息以向与用户账户相关联的用户呈现媒体内容推荐。例如，响应于接收到媒体应用的用户偏好特定语言(例如，来自语言偏好指示符)的媒体内容的指示，所述机制能够使用与每个媒体内容项相关联的语言标识符以推荐和/或促进具有与用户的语言偏好指示符匹配的语言标识符的媒体内容。在另一示例中，所述机制能够确定关于用户的信息(例如，用户讲西班牙语)。能够通过例如检测用户已经使用用户账户访问媒体服务并且响应于接收到对评估用户账户信息的肯定同意来访问用户账户信息(例如，用户语言偏好)，确定关于用户的这样的信息。响应于确定关于用户的这个信息，所述机制能够向用户推荐特定的媒体内容项。例如，响应于确定用户已经将搜索词项输入到媒体搜索界面中，所述机制能够获得响应于搜索词项的搜索结果并且使用关联的语言标识符对搜索结果重新排序。在继续本示例中，具有与关于用户的信息相对应的语言标识符的搜索结果(例如，具有用于讲西班牙语的用户的西班牙语标识符的视频)能够被提升到推荐媒体内容项列表的顶部。

应注意的是，虽然这里描述的机制通常涉及基于已经关于该视频内容项提供的评论的视频内容项的语言识别，但是该机制能够识别以任何合适类型的媒体内容的内容，诸如音频内容(例如，音乐、无线电节目、有声读物和/或任何其它合适类型的音频内容)、电视节目、电影、实时流媒体内容、电子书和/或任何其他合适类型的媒体内容中的内容的语言。

转到图1，根据所公开的主题的一些实施例图示用于呈现媒体内容项和评论的用户界面的示例100。如所图示的，在一些实施例中，用户界面100能够包括视频显示元件110、视频内容项112、搜索元件114、与用户表示标识符116、118和120相关联的评论122、124和126、以及一条或多条元数据128。

视频显示元件110能够是任何合适的视频显示元件。在一些实施例中，视频显示元件可以被配置成显示任何合适的视频格式，诸如flash、avi、mp4和/或任何其它合适的视频格式。在一些实施例中，视频显示元件110能够在视频播放器窗口中呈现视频内容项112，该视频播放器窗口能够包括任何合适的控件，诸如暂停控件、音量控件、倒回和/或快进控件、和/或任何其他合适的控件。

附加地或替选地，在一些实施例中，用户界面100能够被配置成包括任何适当类型的媒体播放器。例如，用户界面100能够包括适用于播放音频文件、图像文件、任何其他合适的媒体内容项、和/或其任何合适的组合的媒体播放器。

视频内容项112能够是任何合适的视频内容项。在一些实施例中，视频内容项112能够包括以任何合适语言的口头内容和/或文本内容。例如，视频内容项112能够是包括英语的口头内容和/或文本内容的视频。在另一示例中，视频内容项112能够是包括多个语言的内容的视频，诸如西班牙语的口头内容和英语的文本内容。应注意的是，在一些实施例中，视频内容项112可以不包括口头内容和/或文本内容(诸如无声视频)。

评论122、124和126能够是任何合适的评论。例如，评论能够包括提供对媒体内容项的内容或媒体内容项的一部分的观点或以其他方式对其进行附注的文本、音频数据、视频数据和/或图像数据。在更具体的示例中，如图1所示，评论122、124和126中的每一个能够包括由用户张贴的关于媒体内容项112或媒体内容项112的一部分的文本内容。在另一更具体的示例中，评论能够包括由与社交媒体平台相关联的用户书写和提交的一个或多个帖子，其经由社交媒体平台由与用户具有建立关系的一个或多个用户可查看。在这样的示例中，社交媒体平台上的帖子能够包括参考或包括媒体内容项112的评论。在又一更具体的示例中，评论能够被合计或以其他方式从多个来源获得，诸如经由与安装在客户端设备上的浏览应用相关联的评论功能从用户接收到的与媒体内容项112有关的评论、从与社交媒体平台相关联的用户接收到的与媒体内容项112相关的评论或任何其他合适的共享服务等。

在一些实施例中，评论122、124和126中的每一个能够与特定用户账户相关联。例如，如图1中所图示，评论122、124和126能够与由表示116、118和120标识的用户账户相关联。在这样的示例中，表示116、118和120能够与社交媒体平台的用户账户、媒体内容平台的用户账户、电子邮件服务器的用户账户或任何其他合适的服务的用户相关联。可替选地，在一些实施例中，评论122、124、126中的每一个能够与非特定或匿名用户相关联。在一些实施例中，评论122、124和126中的每一个能够不与用户账户相关联。

在更具体的示例中，用于评论数据库中的这些评论中的每一个的记录能够包括标识评论本身的评论标识符、标识与用户或用户组相关联的用户账户的作者标识符、创建、修改和/或张贴评论的作者的表示(例如，均与用户账户关联的表示116、118和120)、指示评论被创建的时间的时间戳、评论的内容、识别与评论有关的媒体内容项或者媒体内容项的一部分的媒体内容标识符等等。注意，尽管在图1中示出并且在本文中描述三个评论，能够包括任何合适的数量(例如，一个、两个、四个、十个和/或任何其他合适的数量)的评论。

应注意的是，诸如评论122、124和126的评论能够用任何合适的语言。例如，如图1中所示，评论122和124包括用西班牙语的文本内容，而评论126包括用英语的文本内容。在另一示例中，评论能够包括用多个语言的文本内容(例如，用英语和西班牙语书写的文本帖子)。在又一示例中，评论能够包括用一种语言的文本内容和包括用另一种语言的内容的图像数据。

在一些实施例中，本文描述的机制能够确定与媒体内容项相关联的评论的语言概率得分，并且基于评论的语言概率得分使媒体内容项与语言标识符相关联。例如，如图1中所图示，该机制能够为评论122、124和126生成语言概率的向量，其中评论122和124的向量的西班牙语语言分量具有比向量126的评论的西班牙语语言分量更大的得分，并且评论126的向量的英语语言分量具有比评论122和124的向量的英语语言分量更大的得分。在这样的示例中，因为组合用于评论122、124以及126的向量的单个向量的西班牙语语言分量具有单个向量的其他分量当中的最大值，所述机制能够使媒体内容项112与将媒体内容项的语言标识为西班牙语的语言标识符相关联。应注意的是，从单个向量得出的语言信息还能够与附加指示符(例如，标题元数据、描述元数据、用户账户信息等)一起使用以确定与媒体内容项112相关联的语言。

继续本示例，在将媒体内容项与将媒体内容项的语言标识为西班牙语的语言标识符相关联时，该机制能够执行任何合适的动作，诸如呈现具有相同的语言标识符的其他媒体内容项(例如，响应于请求对附加媒体内容项的推荐，响应于将搜索查询输入图1的搜索元件114中等)，以与关联于媒体内容项的语言标识符相同的语言呈现广告(例如，在呈现媒体内容项112之前、期间或之后在视频显示元件110中呈现的视频广告)等等。

转到图2，示出用于基于评论的媒体内容项的语言识别的根据所公开的主题的一些实施例能够使用的硬件的示例200。如所图示的，硬件200能够包括一个或多个服务器，诸如内容服务器202和数据服务器204，以及通信网络210，和/或一个或多个用户设备212，诸如用户设备214和216。

在一些实施例中，内容服务器202能够是用于存储媒体内容并将内容递送给用户设备212的任何合适的服务器。例如，内容服务器202能够是经由通信网络210将媒体内容流放到用户设备212的服务器。由内容服务器202提供的媒体内容能够是任何合适的内容，诸如视频内容、音频内容、电子书、文档、图像和/或任何其他合适类型的媒体内容。作为更具体的示例，媒体内容能够包括电视节目、电影、漫画、声音效果、流式直播内容(例如，流式无线电节目、现场音乐会、和/或任何其它合适类型的流式直播内容)和/或任何其他合适类型的媒体内容。媒体内容能够由任何合适的实体创建并上传到内容服务器202。在一些实施例中，内容服务器202能够被省略。

在一些实施例中，数据服务器204能够是用于存储和/或发送与一个或多个媒体内容项有关的信息的任何合适的服务器。作为更具体的示例，在一些实施例中，数据服务器204能够存储和/或发送与媒体内容项相关联的元数据。作为另一更具体的示例，在一些实施例中，数据服务器204能够包括存储与评论有关的信息的评论数据库。例如，如上所述，评论数据库中的评论记录能够包括识别评论本身的评论标识符、识别与用户或用户组相关联的用户账户的作者标识符、创建、修改和/或张贴评论的作者的表示、指示当评论被创建时的时间的时间戳、评论的内容、识别与评论有关的媒体内容项或媒体内容项的一部分的媒体内容标识符等。在一些实施例中，数据服务器204能够被省略。

在一些实施例中，通信网络210能够是一个或多个有线和/或无线网络的任何合适的组合。例如，通信网络210能够包括互联网、内联网、广域网(wan)、局域网(lan)、无线网络、数字订户线(dsl)网络、帧中继网络、异步传输模式(atm)网络、虚拟专用网络(vpn)和/或任何其他合适的通信网络中的任何一个或多个。用户设备212能够通过一个或多个通信链路218连接到通信网络210，该通信网络210能够经由一个或多个通信链路(例如，通信链路220和/或222)链接到内容服务器202、应用和数据服务器204、广告服务器206和支付服务器208。通信链路218、220和/或222能够是适合于在用户设备212和服务器202和/或204之间通信数据的任何通信链路，诸如网络链路、拨号链路、无线链路、硬连线链路、任何其他合适的通信链路或这些链路的任何适当组合。

用户设备212能够包括适合于请求媒体内容、搜寻媒体内容、呈现媒体内容、呈现广告、接收用于播放媒体内容的输入和/或任何其他合适的功能的任何一个或多个用户设备。例如，在一些实施例中，用户设备212能够被实现为移动设备，诸如移动电话、平板电脑、膝上型计算机、车辆(例如，汽车、船、飞机或任何其他合适的车辆)娱乐系统、便携式媒体播放器和/或任何其他合适的移动设备。作为另一示例，在一些实施例中，用户设备212能够被实现为非移动设备，诸如台式计算机、机顶盒、电视机、流式媒体播放器、游戏控制台和/或任何其他合适的非移动设备。

虽然内容服务器202和数据服务器204被图示为单独的设备，但是在一些实施例中，能够使用任何合适数量的设备来执行由内容服务器202和数据服务器204执行的功能。例如，在一些实施例中，由内容服务器202或数据服务器204执行的功能能够在单个服务器上执行。作为另一示例，在一些实施例中，能够使用多个设备以实现由内容服务器202和数据服务器204执行的功能。

尽管在图2中示出两个用户设备214和216以避免使图过于复杂，在一些实施例中能够使用任何合适数量的用户设备和/或任何合适类型的用户设备。

在一些实施例中，能够使用任何合适的硬件来实现内容服务器202、数据服务器204和用户设备212。例如，在一些实施例中，能够使用任何合适的通用计算机或专用计算机来实现设备202、204和212。作为另一示例，可以使用专用计算机来实现移动电话。任何这样的通用计算机或专用计算机能够包括任何合适的硬件。例如，转到图3，如示例硬件300所图示的，这种硬件能够包括硬件处理器302、存储器和/或存储装置304、输入设备控制器306、输入设备308、显示器/音频驱动器310、显示器/音频输出电路312、通信接口314、天线316和总线318。

在一些实施例中，硬件处理器302能够包括用于控制通用计算机或者专用计算机的功能的任何合适的硬件处理器，诸如微处理器、微控制器、数字信号处理器、专用逻辑、和/或任何其他合适的电路。在一些实施例中，硬件处理器302能够由存储在服务器的存储器和/或存储装置器304(例如，诸如服务器202或204中的一个)中的服务器程序来控制。例如，服务器程序能够使硬件处理器302执行这里描述的用于基于评论的媒体内容项的语言识别的机制和/或者执行任何其他合适的动作。在一些实施例中，硬件处理器302能够由存储在用户设备212的存储器和/或存储装置304中的计算机程序来控制。例如，计算机程序能够使硬件处理器302呈现媒体内容项，请求媒体内容项，和/或者执行本文所述的用于基于评论的媒体内容项的语言识别的机制。

在一些实施例中，存储器和/或存储装置304能够是用于存储应用信息、程序、数据、媒体内容和/或任何其他合适信息的任何合适的存储器和/或存储装置。例如，存储器和/或存储装置304能够包括随机存取存储器、只读存储器、闪存、硬盘存储、光学介质和/或任何其他合适的存储器。

在一些实施例中，输入设备控制器306能够是用于控制和接收来自一个或多个输入设备308的输入的任何合适的电路。例如，输入设备控制器306能够是用于接收来自触摸屏、来自键盘、来自鼠标、来自一个或多个按钮、来自语音识别电路、来自麦克风、来自相机、来自光学传感器、来自加速计、来自温度传感器、来自近场传感器、和/或来自任何其他类型的输入设备的输入的电路。

在一些实施例中，显示器/音频驱动器310能够是用于控制和驱动输出到一个或多个显示器/音频输出设备312的任何合适的电路。例如，显示器/音频驱动器310能够是用于驱动触摸屏、平板显示器、阴极射线管显示器、投影仪、扬声器或多个扬声器和/或任何其他合适的显示器和/或呈现设备的电路。

通信接口314能够是用于与一个或多个通信网络，诸如如图2中所示的网络210进行对接的任何合适的电路。例如，接口314能够包括网络接口卡电路、无线通信电路和/或任何其它合适类型的通信网络电路。

在一些实施例中，天线316能够是用于与通信网络(例如，通信网络210)进行无线通信的一个或多个合适天线中的任何一个。在一些实施例中，天线316能够被省略。

在一些实施例中，总线318能够是用于在两个或更多个组件302、304、306、310和314之间通信的任何合适的机制。

根据一些实施例，任何其他合适的组件能够被包括在硬件300中。

转到图4，根据所公开的主题的一些实施例示出用于基于评论的媒体内容项的语言识别的过程的示例400。在一些实施例中，过程400能够由任何设备或设备的组合来执行。例如，参照图2，过程400能够由内容服务器202、数据服务器204和/或用户设备212执行。

在一些实施例中，过程400能够在402处通过使用任何合适的技术或技术的组合来检索与媒体内容项相关联的评论开始。例如，与媒体内容项(例如，图1中的视频112)相关联的评论在由用户设备(例如，如上面结合图2所描述的用户设备204)的用户提交时能够在服务器设备(例如，如上面结合图2所描述的服务器设备202)处被接收。在这样的示例中，过程400能够访问、请求和/或检索来自服务器设备的评论。在更具体的示例中，响应于发送包括识别媒体内容项或媒体内容项的一部分的媒体内容标识符的请求，服务器设备能够从评论数据库中访问评论和相关联的评论信息。来自评论数据库的评论信息能够包括识别评论的评论标识符、识别与用户或用户组相关联的用户账户的作者标识符、创建、修改和/或张贴评论的作者的表示(例如，均与用户账户相关联的表示116、118和120)、指示当评论被创建时的时间的时间戳、评论的内容、识别与评论有关的媒体内容项或媒体内容项的一部分的媒体内容标识符等。作为另一示例，评论能够被包括在与媒体内容项相关联的元数据中。在这样的示例中，过程400能够与被关联媒体内容项(例如，媒体内容项的标题、媒体内容项的描述、媒体内容项的内容创建者等)的元数据同时访问、请求和/或检索与媒体内容项相关联的评论。

应注意的是，检索到的评论能够包括可公开访问的用户生成的评论。例如，隐私指示符能够表示评论被公开张贴，使得与提供评论的用户没有特定关系的用户可访问评论。还应注意的是，在一些情况下评论能够被删除，使得评论不再与媒体内容项相关联。这里描述的语言标识机制能够发送(例如，从评论数据库)检索更新的评论集合的请求，使得删除的评论被排除在考虑之外。

应注意的是，媒体内容项能够是可公开访问的媒体内容项。例如，隐私指示符能够指示视频内容项被上传到其中与上传视频内容项的用户没有特定关系的用户可访问视频内容项的视频共享服务。在另一示例中，过程400能够确定由用户上传的视频内容项不与特定访问控制相关联(例如，仅由特定社交圈中的用户可查看、仅由特定用户可查看等)。

在一些实施例中，过程400能够在404处使用任何合适的技术或技术的组合并且使用任何合适的信息或信息的组合从检索到的评论中选择评论的子集。

在一些实施例中，过程400能够通过基于特定判据过滤掉评论来选择评论的子集。例如，过程400能够从小于特定阈值长度——例如，小于特定数量的单词(例如，五个单词)或小于特定数量的字符(例如，20个字符)的所检索到的评论集合中过滤掉评论。在本示例中，像“ok”或“merci”的评论能够被移除，因为不太可能提供相关媒体内容项的语言指示符，其中像“ok”的评论通常用于许多语言中，并且评论“merci”不一定指示评论员能讲西班牙语。这样，按照评论的长度进行过滤能够例如在考虑中移除短的、并且在某些情况下无意义的评论。在更具体的示例中，再次参考图1，过程400能够确定评论122包含二十四个字符，评论124包含三十二个字符，并且评论126包含七个字符，并且在应用至少二十个字符的阈值时，过程400能够通过移除评论126并将评论122和124放入用于分析的选择的评论的子集中来过滤评论。

类似地，过程400能够通过从检索的评论集合中过滤掉大于特定阈值长度——例如，长度超过一万个字符的评论——来获得用户生成的评论。例如，这种类型的过滤判据能够移除趋向于冗长的机器生成的评论。在另一示例中，过程400能够过滤掉已经被视为滥用或缓和的评论。在又一示例中，过程400能够通过过滤掉自动生成的评论(例如，“sharedonthisservice”评论或“sentbymydevice(由我的设备发送)”评论)来获得用户生成的评论。在又一示例中，过程400能够过滤掉实质上包括或仅包括url并且几乎没有文本内容的评论。

应注意的是，能够使用用于从考虑中移除评论的任何合适的过滤判据或过滤规则。

附加地或替选地，在一些实施例中，过程400能够至少部分地基于与每个评论相关联的用户信息选择用于放置在评论子集中的评论。例如，过程400能够基于包含在与每个评论相关联的用户简档或用户账户中的信息来选择评论。在更具体的示例中，过程400能够基于由用户账户做出或与用户账户相关联的其他评论的数量、与做出评论的用户账户相关联的关注者的数量、用户账户是否被验证、用户账户是否是与媒体内容项相关联的用户组的成员(例如，如果媒体内容项已经被组的成员张贴或上传并且与评论对应的用户账户也是组的成员)、用户账户是否与视频源相关联(例如，如果媒体内容项已经被作为与评论相关联的用户账户的关注者或订阅者的用户账户张贴或上传)、与用户账户相关联的任何其他信息、和/或其任何适当的组合，从检索到的评论集中选择评论。

应注意的是，在检索与媒体内容项相关联的评论之前并且在访问用户账户信息之前，所述机制能够向用户提供机会以提供肯定同意和/或授权以访问和分析评论信息和用户账户信息，诸如接收用户历史信息(例如，浏览历史、评论历史等)和/或用户偏好。例如，在加载用于在诸如移动设备的计算设备上播放媒体内容的应用时，这样的应用能够提示用户提供同意和/或授权。在更具体的示例中，响应于下载用于播放媒体内容的应用并将该应用加载到计算设备上，用户能够被提示有请求(或要求)用户提供对于机制访问和/或分析用户账户信息的同意和/或授权的消息。

附加地或替选地，在一些实施例中，过程400能够至少部分地基于与每个评论相关联的流行性信息来选择用于放置在评论子集中的评论。例如，过程400能够基于支持(例如，竖起大拇指)、喜欢和/或任何其他接收到的赞成的指示的数量(例如，基于支持的数量的前十个评论)选择评论。作为另一示例，过程400能够基于每个评论的总观看次数(例如，基于观看次数的前十个评论)来选择评论。作为又一示例，过程400能够基于结合每个评论张贴的子评论的数量选择评论。

再次参考图1，过程400能够在406处通过为评论子集中的每个评论指配语言概率向量来继续。每个评论的语言概率的每个向量能够包括多个向量分量，其中每个分量包括概率得分，该概率得分指示评论包括从多个语言中选择的特定语言的内容的可能性。应注意的是，分量的数量能够至少部分基于语言的数量(例如，五个语言分量、一百个语言分量等)。

例如，用于评论c1的语言概率的向量能够被表示为(l1,l2,…,li)，其中每个li是评论c1包括语言i中的内容的概率得分。能够为所选评论的子集中的每个评论生成这样的向量。

在更具体的示例中，过程400能够使用诸如朴素贝叶斯分类器、最大熵分类器、随机森林分类器、任何其他语言识别技术以及/或其任何合适的组合的机器语言分类器对评论子集中的每个评论进行分类。使用这样的机器语言分类器，过程400能够分析每个评论并返回对于机器语言分类器被训练以检测的每种语言的概率得分(例如，五种语言、一百种语言等)。

结合图1，对于被排序的评论的子集(例如，基于长度和流行度的排名前n的评论)，过程400能够使用机器学习语言分类器以为已知语言集合中的每一个确定语言概率得分。例如，过程400能够为评论122确定西班牙语概率得分为0.8，英语概率得分为0.1，并且法语概率得分为0.05，并且日语概率得分为0.05。在这样的示例中，过程500能够生成[0.8,0.1,0.05,0.05]的语言概率向量l。

应注意的是，响应于机器语言分类器未能识别评论的语言，过程400能够通过移除针对语言识别和/或在训练数据集中的使用的评论来进一步过滤评论的子集。例如，这能够过滤掉包含稀有语言内容的评论和/或包含非文本内容(诸如表情符号)的评论。

再次参考图4，在为每个评论子集获得语言概率的向量之后，过程400能够在408处通过组合语言概率的向量以生成媒体内容项的单个向量(例如，图1中所示的视频)继续。组合语言概率的向量能够包括例如对跨每个评论的向量的特定语言的语言概率得分进行平均以获得跨评论子集的位于媒体内容项的语言得分的单个向量中的特定语言的语言得分。

在一些实施例中，这种向量组合能够基于应用于每个评论的语言概率向量的任何合适的权重。例如，如果评论c1被表示为(l11,l12,…,l1n)并且评论c2被表示为(l21,l22,…,l2n)，其中n是语言的数量，则能够使用权重w来组合评论c1和评论c2的向量。此加权平均能够被表示为(w1/(w1+w2))*l11+(w2/(w1+w2))*l21,(w1/(w1+w2))*l12+(w2/(w1+w2))*l22等等，其中w1是评论c1的权重，w2是评论c2的权重。如本文所描述的，权重能够是任何合适的权重，诸如每个评论的长度、与每个评论相关联的支持的数量等。

在一些实施例中，权重能够基于每个评论的长度，诸如评论中的单词的数量或评论中的字符的数量。在本示例中，可以为用于具有更多数量的单词或更多数量的字符的较长评论的向量中的语言概率得分比用于较短评论的向量中的语言概率得分加权更高。例如，能够确定每个评论的长度m并将其用于组合语言概率的向量，其能够被表示为(m1/(m1+m2))*l11+(m2/(m1+m2))*l21,(m1/(m1+m2))*l12+(m2/(m1+m2))*l22等，其中m1是评论c1的长度，并且m2是评论c2的长度。在更具体的示例中，再次参考图1，响应于确定在与媒体内容项112相关联的所选评论的子集中评论122具有五个单词的长度、评论124具有六个单词的长度、并且评论126具有一个单词的长度，能够将表示评论124的向量中的语言概率得分比表示评论122的向量中的语言概率得分加权更高，表示评论122的向量中的语言概率得分能够比表示评论126的向量中的语言概率得分加权更高。

因此，在根据该评论的长度对每个评论的语言概率得分加权时，过程400能够生成跨媒体内容项的所选评论的子集的加权平均语言得分的向量。也就是说，当平均语言概率得分时，用于每个评论的语言概率得分的权重与该评论的长度成正比。例如，这能够生成稀疏连续特征向量，该稀疏连续特征表示跨媒体内容项的所选评论的子集的被加权的平均得分。

在一些实施例中，权重能够基于与每个评论有关的其他信息，诸如与每个评论相关联的流行度信息。流行度信息能够包括例如支持(例如，竖起大拇指)、喜欢、和/或任何其他接收到的赞成的指示的数量。在本示例中，接收到更多支持的评论向量中的语言概率得分能够被加权，比较短评论的向量中的语言概率得分更高。例如，能够确定用于每个评论的支持v的数量并且被用于组合语言概率的向量，其能够表示为(v1/(v1+v2))*l11+(v2/(v1+v2))*l21,(v1/(v1+v2))*l12+(v2/(v1+v2))*l22等等，其中v1是针对评论c1接收到的支持的数量，并且v2是针对评论c2接收到的支持的数量。

在一些实施例中，能够使用与每个评论相关的附加信息以对与每个评论相关联的向量中的语言概率得分进行加权。例如，能够基于每个评论的总观看次数对每个评论的向量中的语言概率得分进行加权。在另一示例中，能够基于与每个评论相关的张贴的子评论的数量来加权每个评论的向量中的语言概率得分。

过程400能够通过至少部分地基于语言概率得分的组合向量来确定与媒体内容项相关联的语言来继续。在一些实施例中，过程400能够通过确定语言概率得分的组合向量中的语言具有最大或最高语言概率得分来确定与媒体内容项相关联的语言。在继续上面描述的其中每个评论的语言概率得分通过该评论的长度被加权的示例时，过程400能够确定当跨与媒体内容项相关联的所选评论的子集进行平均时组合向量中的哪种语言接收最大语言得分。

在更具体的示例中，过程400能够将媒体内容项与语言标识符相关联，该语言标识符识别在语言概率得分的组合向量中具有最大语言得分的语言。

在一些实施例中，在确定与媒体内容项相关联的语言之前，过程400能够使用最大语言得分、全语言概率向量和/或来自跨与媒体内容项相关联的所选评论的子集的语言概率得分的组合向量的附加特征以及附加的指示符以确定媒体内容项的语言。

在一些实施例中，这些附加指示符能够包括分析与媒体内容项相关联的元数据。例如，过程400能够生成用于与媒体内容项相关联的信息的向量，诸如与媒体内容项相关联的标题元数据和与媒体内容项相关联的描述元数据。在更具体的示例中，标题元数据中的文本内容和与媒体内容项相关联的描述元数据能够被过滤以移除特定单词(例如，被认为是机器生成的、自动生成的或其他无意义的单词)或特定的字符(例如，不可识别的字符)。接下来，标题元数据和/或描述元数据的所选部分能够通过上述机器语言分类器之一被分类，以返回标题元数据的语言概率的向量和/或描述元数据的语言概率的向量。这些附加向量能够结合用于组合或以其他方式与所选评论的子集的语言概率的向量一起使用以确定与媒体内容项相关联的语言。

在一些实施例中，这些附加指示符还能够包括与媒体内容项相关联的类别。例如，过程400能够确定媒体内容项与诸如新闻类别、体育类别、电影类别、游戏类别等的特定类别相关联。作为响应，过程400能够使用类别信息作为媒体内容项是否可能包括使用一种语言的内容或者可能包括使用多个语言的内容的指示符。在本示例中，这能够允许过程400预测电影类别中的视频内容项可能仅具有一种语言与所述视频内容项相关联，而游戏类别中的视频内容项可能包括使用多个语言的音频内容。此类别指示符连同上述向量一起能够被用于确定与媒体内容项相关联的语言。

在一些实施例中，这些附加指示符能够包括与媒体内容项有关的信息，诸如流行度信息。例如，与媒体内容项相关联的评论的总数(例如，响应于发送媒体内容标识符而从评论数据库中检索的)能够被用作附加特征，用针对上述评论的子集的语言概率得分的组合向量扩充该附加特征。在另一示例中，诸如用于媒体内容项的视图总数的流行度信息能够被用作附加特征，用针对上述评论子集的语言概率得分的组合向量扩充该附加特征。

在一些实施例中，这些附加信息能够包括与媒体内容项有关的统计信息。例如，针对与媒体内容项相关联的评论的支持的数量的均值和标准差能够被用作附加特征，用针对上述评论的子集的语言概率得分的组合向量扩充该附加特征。在本示例中，针对与媒体内容项相关联的评论的支持的数量的高标准差能够指示在基于评论的语言识别中较低的置信度，因为存在几乎没有接收到支持的很多嘈杂的评论，而针对与媒体内容项相关联的评论的支持的数量的小标准差和高均值能够被用作用于语言概率得分的组合向量的置信度指示符。在另一示例中，与媒体内容项相关联的评论的长度的均值和标准差能够被用作附加特征，用针对上述评论子集的语言概率得分的组合向量扩充该附加特征。在本示例中，如果与媒体内容项相关联的评论的平均长度相对较小(因此，仅遇到具有少于特定数量的单词或字符的短评论)，则这能够被用作用于语言概率得分的组合向量的置信度指示符，因为可能难以向媒体内容项指配语言。

因此，能够使用语言相关特征和媒体内容相关特征的任何适当组合以确定媒体内容项的语言。

再次参考图4，过程400能够在412处通过基于已经为媒体内容项确定的语言执行任何合适的动作，诸如推荐相关视频或具有与媒体内容项相同的语言标识符的附加媒体内容项、呈现具有与媒体内容项相同的语言标识符的广告、响应于搜索查询确定搜索结果——其中搜索结果具有与媒体内容项相同的语言标识符、任何其他合适的动作、和/或其任何合适的组合来继续。例如，参照图1，响应于过程400将媒体内容项112与西班牙语言标识符相关联并且响应于确定用户将搜索查询输入到搜索元件114中，过程400能够呈现包括也使用西班牙语的媒体内容项的搜索结果(例如，与西班牙语言标识符相关联的媒体内容项)。在另一示例中，过程400能够在用户界面中推荐具有相同西班牙语标识符的其他媒体内容项(例如，在呈现媒体内容项112之前、当呈现媒体内容项112时、在完成媒体内容项112时等)。

在更具体的示例中，过程400能够基于与媒体内容项相关联的语言标识符向推荐引擎发送针对附加媒体内容项的请求。响应于该请求，过程400能够向正在消费媒体内容项的用户提供具有与媒体内容项相同的语言标识符的相关媒体内容项或附加媒体内容项，响应于搜索查询的搜索结果等，搜索结果具有与媒体内容项相同的语言标识符。

在另一更具体的示例中，过程400能够基于与媒体内容项相关联的语言标识符向广告服务器或用于广告内容的任何其他合适的源发送请求。响应于该请求，过程400能够向正在消费该媒体内容项或其他媒体内容项的用户呈现与该媒体内容项相同的语言相关联的广告。这种广告能够在呈现媒体内容项之前、期间或之后被呈现。结合图1，响应于将媒体内容项112与西班牙语言标识符相关联的过程400，过程400能够在完成回放媒体内容项112时检索并呈现也是西班牙语或在视频显示元件110中具有西班牙语言标识符的广告。

在又一更具体的示例中，过程400能够使用语言标识符以设置媒体播放器的语言以对应于确定的语言。作为响应，媒体播放器能够确定媒体内容项没有使用所确定的语言(例如，具有对应于不同语言的语言标识符)，并且能够在回放媒体内容项时呈现对应于所确定的语言的字幕信息。

在一些实施例中，过程400能够对多个媒体内容项诸如视频数据库中的每个视频执行上述基于评论的语言识别。结果，数据库中的一些或全部视频能够分别与语言标识符或媒体内容项中的内容的语言指示相关联。

在一些实施例中，与每个媒体内容项相关联的语言标识符能够与关于用户的信息一起使用以向用户呈现媒体内容推荐。例如，响应于接收到媒体应用的用户偏好特定语言(例如，来自语言偏好指示符)的媒体内容的指示，与每个媒体内容项相关联的语言标识符能够被用于推荐和/或推进具有与用户的语言偏好指示符匹配的语言标识符的媒体内容。在另一示例中，能够确定关于用户的信息(例如，用户讲西班牙语)。能够通过例如检测用户已经使用用户账户访问媒体服务并且响应于接收到对评估用户账户信息的肯定同意来访问用户账户信息(例如，用户语言偏好)来确定这样的关于用户的信息。在又一示例中，能够根据用户行为信息(例如，用户已经访问的媒体内容项、用户已经输入的搜索词项等等)来预测关于用户的信息。响应于接收和/或确定这样的关于用户的信息，能够向用户推荐特定的媒体内容项。例如，响应于确定用户已经将搜索词项输入到媒体搜索界面中，能够获得包括响应于搜索词项的媒体内容项的搜索结果，并使用相关联的语言标识符对其进行重新排序。继续本示例，具有与关于用户的信息相对应的语言标识符的搜索结果(例如，针对讲西班牙语的用户，具有西班牙语标识符的视频)能够被推进到推荐媒体内容项列表的顶部。

应注意的是，在访问用户账户信息或与用户有关的任何其他信息之前，过程400能够向用户提供用于提供肯定同意或授权以执行动作的机会，诸如访问用户简档或获取用户语言偏好。例如，一旦在用户设备上加载媒体回放应用，媒体回放应用能够提示用户提供用于访问与在用户设备上认证的用户账户相关联的语言偏好信息的授权。在更具体的示例中，响应于下载媒体回放应用和/或在用户设备上加载媒体回放应用，能够在执行这些动作之前用请求(或要求)用户提供同意的消息提示用户。附加地或替选地，响应于安装媒体回放应用，能够在执行这些动作之前用请求(或者要求)用户提供同意的许可消息提示用户。

在一些实施例中，图4的过程的上述块中的至少一些能够以不限于在附图中示出并且结合附图描述的顺序和次序的任何顺序或者次序实行或执行。如适合，能够基本上同时或者并行地实行或执行图4的上述块中的一些，以减少时延和处理时间。附加地或替选地，图4的过程的上述块中的一些能够被省略。

尽管这里公开的实施例已经涉及视频内容的呈现，但应理解的是，这里描述的机制能够被应用于仅视频内容、仅音频内容、具有视频和音频元素的组合的内容、三维内容、和/或任何其他合适的媒体内容。

在一些实施例中，任何合适的计算机可读介质能够被用于存储用于执行本文中的功能和/或过程的指令。例如，在一些实施例中，计算机可读介质能够是暂时性的或非暂时性的。例如，非暂时性计算机可读介质能够包括诸如磁介质(例如，硬盘、软盘和/或任何其他合适的磁介质)、光介质(例如，光盘、数字视频盘、蓝光和/或任何其他合适的光介质、半导体介质(例如，闪存、电可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)、以及/或者任何其它的合适的半导体介质)、任何在传输期间不是稍纵即逝或者缺乏长期实体的合适介质、和/或任何合适的有形介质。作为另一示例，暂时性计算机可读介质能够包括网络上的、在导线、导体、光纤、电路、任何在传输期间稍纵即逝或者缺乏长期实体的合适介质、和/或任何合适的无形介质中的信号。

因此，提供用于基于评论的媒体内容项的语言识别的方法、系统和介质。

尽管在前述的说明性实施例中已经描述和图示本发明，但是要理解的是，仅通过示例的方式已经进行本公开，并且能够在不脱离仅由随附权利要求限定的本发明的精神和范围的情况下对本发明的实施细节进行许多改变。所公开的实施例的特征能够以各种方式组合和重新排列。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：艾谢·塞扎·多鲁厄兹;纳塔利亚·波诺马雷瓦;克里斯托夫·乌尔斯·厄勒;迪米特里·卡涅夫斯基
技术所有人：谷歌有限责任公司
我是此专利的发明人

上一篇：高炉淬渣蒸汽发电装置的制作方法
上一篇：一种纺织用高效自动化梳棉机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。