对通过通信网络的视频内容搜索的辅助的制作方法

文档序号：6495250阅读：249来源：国知局

对通过通信网络的视频内容搜索的辅助的制作方法
【专利摘要】一种用于辅助用户通过通信网络搜索视频内容的方法，包括：由所述用户确定第一内容项目(CZ)的步骤；从这个第一内容项目自动提取语义数据的步骤；根据语义数据针对至少一个服务自动生成查询、使得能够在这个服务或这些服务上检索一个视频集合的步骤；将该视频内容的集合呈现给用户的步骤。
【专利说明】对通过通信网络的视频内容搜索的辅助
【技术领域】
[0001]本发明涉及通过互联网来访问视频内容提供服务。这些服务是诸如“YouTube”、“Vimeo”、以及“DailyMotion”的多面手平台，或者更专业的平台(教育部门、医疗部门等)。
【背景技术】
[0002]这两种类型的服务共有一个共同的特性:使得用户能够将他们自己的内容上传到平台。结果是，在所有这些服务上，有非常大量的视频内容可供使用。当前，每分钟大约有355小时的视频上传到“YouTube”服务上。
[0003]可用内容上的这个激增的对应事物是，大多数的内容没有接收到足够的可见性。因此，只有40%的可用视频内容将被观看多于300次。
[0004]这个低比率主要归因于如下事实:对于用户，在如此大量的内容中识别使他们感兴趣的视频已经变得极其困难。
[0005]视频内容与描述相关联，描述最经常是文本的，这些描述通过自由文本字段或一组标签，使得能够基于关键词搜索。因此每个希望上传一个新视频的用户被要求提供一个描述，该描述使得其他用户能够使用并入到服务中的搜索引擎或者外部的搜索引擎(诸如“谷歌”、“必应”，或“雅虎”)来找到他或她的视频。
[0006]然而，这种解决方案是不够的，因为这些描述由用户提供，并且因此是完全主观的。特别是，它们可能以各种语言说明了个人用户的兴趣，并且在一个给定的语言内，这些描述包含的关键词的选择包括若干可能的同义词。为了找到一个视频，用户必须因此选择合适的关键词，而没有工具用其来确定这些关键词。一个人如何能知道上传了该视频的用户所选择的标签和词汇呢？
[0007]由此产生的问题是双重的:
[0008]_搜索不一定提供最相关的视频内容；
[0009]-一个视频可能对进行搜索的用户不是足够可见的。

【发明内容】

[0010]本发明的目的是改善这种情形。
[0011]为了这样做，本发明的第一个目标是用于辅助用户通过通信网络搜索视频内容的方法，包括:
[0012]?由所述用户确定第一内容项目的步骤；
[0013]?从这个第一内容项目自动提取语义数据的步骤；
[0014]?根据所述语义数据针对至少一个服务自动生成查询、使得能够在所述至少一个服务上检索视频集合的步骤；
[0015]?将所述视频集合呈现给所述用户的步骤。
[0016]根据本发明的一个实施例，该方法还可以包括:根据第一内容项目与关联于这个集合中的视频内容的描述之间的语义接近度的标准，从所述集合中选择视频子集的步骤。[0017]至少一个服务可以被确定为语义数据的函数。
[0018]这些步骤可以由在人机界面(WB)中选择第一内容项目(CZ)而触发，以及由选择通过所述人机界面可访问的软件功能而触发。
[0019]自动提取语义数据的步骤可以包括提取“主语-动词-宾语”关系。可以基于所述关系构建所生成的查询。
[0020]本发明还具有如下目标:装备有处理装置的通信终端来实施如先前所描述的方法，以及装备有编码装置的计算机程序来实施这个方法。
[0021]本发明还具有用于通信终端的人机界面的目标，该通信终端装备有使得用户能够选择第一内容项目的装置，以及使得能够触发以下步骤的装置:
[0022]?从该第一内容项目自动提取语义数据的步骤；
[0023]?根据这些语义数据针对至少一个服务自动生成查询、使得能够在所述至少一个服务上检索视频集合的步骤；
[0024]?将该视频内容的集合呈现给用户的步骤。
[0025]以这种方式，基于第一内容项目，一般是文本的内容项目，本发明使得有可能消除或者至少减少用户主观性，以便提高视频内容的可见性和搜索的相关性。它使得有可能减少视频内容与搜索主题之间的语义差距。
【专利附图】

【附图说明】
[0026]参考所附的附图，在以下描述中，本发明和它的益处将变得更加清楚地明显。
[0027]图1描绘了实施本发明的人机界面。
[0028]图2是示意性地描绘根据本发明的方法的可能步骤链的流程图。
[0029]图3描绘了文本内容的示例以及所提取的语义数据。
【具体实施方式】
[0030]图1描绘了一个web浏览器，web浏览器使得用户能够从网页的URL (统一资源定位符)访问网页。这个浏览器为用户呈现人机界面或者“窗口"WB。这个窗口示出了若干部分，包括浏览器空间WP和菜单区域MZ，页面被显示在浏览器空间WP中(包括视频内容)。
[0031]这个菜单区域本身可以包括下拉菜单SM和图标頂。通过这个菜单区域MZ，浏览器为用户提供对它的各种功能的访问。一个给定的功能通过下拉菜单、图标、或者它们两者也可以是可访问的。这是由浏览器的开发者所做出的人机工程选择。
[0032]此外，这些和/或其他的功能通过上下文菜单CM，对用户也是可访问的。典型地，在来自微软公司的Windows (TM)操作系统下，这样的上下文菜单用鼠标上的右菜单按钮打开，并且它的元素取决于鼠标指针的位置和浏览器的状态。
[0033]在图1中的示例中，浏览器空间WP显示文本内容。人机界面WB使得有可能选择这个文本内容的全部或部分。这个选择可以通过已知的方法，使用鼠标或者任何其他定点设备，或者键盘等来做出。在所描述的示例中，只有CZ区域被选择。
[0034]一旦这个第一内容CZ被选择，用户能够从人机接口 WB中的菜单选择对应于本发明的功能。这个功能可以从下拉菜单SM、图标IM或者上下文菜单CM来选择。这种选择可以包括点击图标IM,或者从下拉菜单SM或上下文菜单CM选择元素。[0035]本发明也可以应用到不同于浏览器的软件应用程序。特别是，它可以应用到文件显示应用程序。阅读电子书籍(或“电子书”)或者阅读来自Adobe公司的“PDF”格式的文件的用户可以，如上面所描述的，选择一个内容区域以及基于所选择的内容从考虑中的软件应用程序中的菜单触发该功能。
[0036]软件应用程序也可以是文字处理器，如来自微软公司的“Word”软件。
[0037]类似地，本发明可以应用到不同于文本内容的内容。因此，有可能选择图像，声音、或者视频。
[0038]不同于用户的选择的机制来确定初始内容可以是可能的。例如，确定(determination)可以作为所显示的网页、正在播放的视频、正在阅读的电子邮件的内容等的函数而是自动的。
[0039]图2中的步骤El描绘了这个确定第一内容项目CZ的步骤。
[0040]对第一内容项目CZ的选择以及该适当的函数，触发了从这个第一内容项目自动提取语义数据的第一算法步骤。
[0041]这个步骤被描绘为步骤E2。
[0042]这个步骤可以被细分成为若干子步骤。
[0043]第一子步骤E2a包括确定内容的类型，这也就是说，该内容是否是文本、视频、图
像、音频等。
[0044]作为内容类型的函数，各种算法然后可以被用来提取语义数据。这些算法可以由分离的软件模块实施。
[0045]提取步骤E2之后的子步骤可以取决于内容类型。
[0046]在文本内容的情况下，第二子步骤E2b可以包括从内容项目CZ提取原始语义数据。
[0047]这些原始语义数据可以逐句地提取或者逐个句子集团(sentence bloc)地提取。
[0048]句子集团的提取以人称代词的存在为条件，人称代词引用之前被识别的实体。一个人然后可以能够说，每个句子的主语是相同的，并且因此识别了关于相同主题的、连贯的句子集团。
[0049]并非所有的词语可以被提取。一些词语可以被省略，因为它们对于理解文本是没有用的。
[0050]该提取可在若干步骤中被执行:
[0051]-删除所谓的“停止词”:并列连词等。
[0052]-使用统计和自然的语言算法，来分析剩余的信息并且提取一组具有判别词(discriminant)意义的关键词。例如，在对一个人的描述中，词语“眼睛”不是判别词，因为每个人都具有眼睛。另一方面，词语“独眼的”是判别词。为了这样做，一个人能够使用语料库，语料库给出了关于一组文档中的词语频率的信息:频率越低，词语的先验重要性越大。
[0053]基于这些原始语义数据，第三子步骤E2c使得有可能确定精炼的语义数据。这些精炼的语义数据可以是“概念”；人、公司、地点(城市、国家、地区，等等)的名称；日期；等
坐寸o
[0054]“概念”可以视为来自该组原始语义数据的基本语义数据。它们可以以各种方法来确定。例如，每个原始语义数据可以关联于跨所有文本内容CZ的出现计数器(occurrencecounter)。然后，这些概念是对应于最高出现率的语义数据。
[0055]还有可能使用一种本体论，以便考虑同义词和来自各种语义层次的原始数据，并且特别是上位词(这也就是说，更一般的原始语义数据涵盖一个或多个更具体的语义数据项目)。
[0056]概念然后可以由原始语义数据的出现数量来确定，原始语义数据的出现数量基于同义词和上位词而被合计。例如，包含原始数据“橙子”、“葡萄”、“香蕉”等的出现的文本内容，可以带出概念“水果”。
[0057]有可能带出最重要的概念，例如，与最强烈的出现(strongest occurrence)相关联的概念，以便确定文本内容CZ所属的类别。考虑到先前所确定的概念的连续上位词，这个类别可以被搜索。
[0058]可以从词典确定人、公司、地点等的名称。这个词典对发明的软件装置可以是内部的，或者它可以以web服务的形式或者任何其他技术设备(数据库等)的形式远程地位于互联网上。
[0059]图3示出了文本内容CZ的示例与所提取的语义数据之间的对应关系。在这个示例中，文本内容CZ是由用户在浏览器空间WP上所显示的网页中选择的区域。在该图中，它被示出在灰色的背景上。
[0060]在触发了本发明的功能后，一个“弹出”窗口 PW与最相关的视频内容VC以及其他相关的视频内容RVC—起被显示。这个窗口 PW还显示了“类别”、概念、人和地点(“州或国家”)的名称以及原始语义数据(“标签”)。如果这个信息对用户没有多大的意义并且在内部更有用，则它可以不被显示。然而，在这里它被显示，以使该解释清楚易懂。
[0061]在这个示例中，类别“商业”(交易，贸易)基于所提取的概念来确定。因此，概念“广告”和“销售”具有上位词“商业”。原始数据，诸如“低价”、“市场”、“证券经纪业务”、“先令”等的存在，进一步加强了这个推断。
[0062]通过这个语义域中若干概念的出现，发明的方法然后可以自动地确定该文本内容CZ涉及商业。
[0063]子步骤E2d包括对语义数据加权。作为每个语义数据及其同义词和上位词的出现数量的函数，权重可以被指派以识别语义数据的重要性并且表现文本内容CZ。
[0064]还可以指派更高的权重。
[0065]在实践中，这个子步骤可以与子步骤E2c同时执行。
[0066]它还可以包括对语义数据的过滤，来仅保存权重超过某个阈值的语义数据，或者根据基于这些权重的排序的有限数量的语义数据，这些语义数据将被使用在随后的步骤中。
[0067]在本发明的一个实施例中，有可能对文本内容CZ执行语法分析，以便确定该语义数据的语法功能并且在它们之间构建逻辑链接。
[0068]这种链接可以通过“主语-动词-宾语”关系来形式化。
[0069]本发明的方法寻求在句子或词组中识别“主语”、“动词”、以及“宾语”功能，并且通过语义分析，在三个所提取的元素之间建立这样的链接。自然地，各种方法都是可能的。
[0070]一种可能的方法可以包括:
[0071]?从句子或词组提取主语。这个主语，动作的作者，可以被识别为个人、知名组织、真实位置等。词典可以用于这样的识别。
[0072]?检测接近于所提取的主语的动词。再次地，这里可以使用词典来识别动词形式。还可以规划考虑给定动词的变化形式和各种形式。取决于该形式，一个人可以提取附加语义信息来知道其是否涉及一个动作(动作动词)或一种状态(被动式、过去分词)。
[0073]?提取接近于该动词的关键词和概念以识别该动作的“宾语”。
[0074]为了提高这个过程的效率，可以规划仅考虑及物动词。这些使得有可能构建更贴近的“主语-动词-宾语”关系。为了这样做，用来提取动词形式的词典可以仅包含及物动
o
[0075]还可以规划把对“主语-动词-宾语”关系的创建从属于对宾语的确定，宾语也属于语料库，而语料库属于词典。接着“主语”的该示例，这个“宾语”可以是个人、知名组织、
真实位置等。
[0076]然后，步骤E3可以包括基于该语义数据来确定至少一个服务。
[0077]事实上，一些视频内容提供服务专业于一个主题(体育、新闻、艺术短片、教育等)，并且取决于从文本内容CZ所提取的语义数据，其可能有关于把最相关的服务作为目标。
[0078]多面手服务，例如DailyMotion或YouTube也可被查询，或者系统地被查询，另外，或者如果没有专业于所提取主题的服务，或者如果它们是不足的，而偶尔地被查询。
[0079]可替换地，这些服务可以通过配置而被静态地识别。
[0080]步骤E4包括基于语义数据，为所识别的服务或多个服务自动生成查询。
[0081]典型地，这可以包括构建HTTP (超文本传输协议)查询，HTTP查询包含全部或部分的所提取语义数据作为参数。
[0082]这些数据可以用来构建单个查询或多个查询。因此，有可能构建与具有超出某个阈值的权重的语义数据一样多的查询。
[0083]同样，在包括提取“主语-动词-宾语”关系的实施方式中，可以有可能为每个关系构建不同的查询。
[0084]可以逐句地或者逐个词语集团地浏览所有的文本内容CZ。对于每个句子或词语集团，如果存在“主语-动词-宾语”关系，则它们可以被用来构建查询；否则，查询可以从原始语义数据来构建。
[0085]这些查询使得有可能检索在所识别的服务或多个服务上可用的一组视频。
[0086]这些视频然后可以在人机界面WB中，并且更具体地，在浏览器空间WP中，被呈现给用户。
[0087]在本发明的一个实施例中，有可能实施文本内容CZ与检索到的视频之间的语义接近度的标准。
[0088]可以基于在先前的步骤中从文本内容CZ所提取的语义数据，以及与检索到的视频相关联的语义内容，来计算语义接近度。这些数据可以是由用户:“标签”、域:“标题”、“描述”等所保存的原始数据。
[0089]还有可能实施对检索到的视频的分析。
[0090]因此，有可能相当容易地确定质地(海、砂、冰等)和/或颜色。
[0091]还有可能实施形状辨识算法。这些算法寻求从恒量(也就是说，不依赖于视角而改变的形状的部分)来确定已知的外形。
[0092]各种方法可以一起使用以获得协同效果:
[0093]-例如，通过形状分析对海豹的确定，可能使得有可能确认所检测的质地实际上是冰。一个人然后能够减少误差并且提高结果的可靠性。
[0094]-在另一个示例中，与对形状的确定相关的对颜色的确定能够使得有可能增加含义。一个人能够因此确定“黑马”的存在，比对马的简单确定更加有判别性的概念。
[0095]有可能对来自视频的图像(或一系列图像)执行全局分析。因此，一个人能够分析环境光水平并且从它抽取语义信息。例如，如果一个人还已经检测到该屏幕是户外，他可以确定是否是白天或者夜晚。
[0096]通过比较这个信息，特别是通过使用本体，有可能确定距离。
[0097]各种方法也有可能用于建立这样的距离。
[0098]特别是:
[0099]-在给定的本体中的概念之间的启发式度量(heuristicmetrics),基于图形中将被覆盖的距离。这个距离可以是图形上节点的数量，其中节点是关键词或概念。某些配对通过链接直接连接。链接可以是定向的或者对称的。如果两个词语之间的链接是对称的，则这两个词语之间的关系更强。例如，这个距离可以有可能量化两个概念的相似性。它还可用于消除歧义的目的。
[0100]-TF-1DF(术语频率-反向文档频率)方法是在彳目息搜索中以及特别是在文本比较中经常使用的加权方法。这个统计测量使得有可能评价文档中所包含的术语相对于集合或语料库的重要性。该权重与该词语在文档中的出现次数成比例地增加。它还基于语料库中的该词语的频率而变化。原始公式的替代公式经常被使用在搜索引擎中，来评估一个文档关于用户的搜索标准的相关性。
[0101]例如，如果词语“恐龙”在IDF语料库中具有低出现率，这可能意味着它更重要，因为它比普通的词语更有判别性；如果词语出现在所提取的词语的每个“TF”列表中(链接到从上下文提取的语料库的列表以及链接到从视频描述提取的语料库的列表)，基于它的出现数量，一个人可以给予它较高或较低的权重。在两个列表上都发现该词语的事实，使得有可能基于IDF值来定义一个或强或弱的链接。
[0102]一个人还可以组合这两种方法。例如，在从上下文提取的词语的第一列表中，一个人发现了词语“恐龙”，词语“恐龙”在IDF语料库中具有相对高的权重。在从视频描述提取的第二列表中，一个人发现词语“暴龙”。该图形示出，存在具有两跳(该图形中的节点数量)的对称链接。因此，一个人能够考虑，这个视频的上下文示出了与“IDF值/跳数”的相似性。
[0103]通过将这种算法应用到每个词语，一个人能够因此计算出总体的相似性。
[0104]基于每个检索到的视频的距离，有可能对它们排序，以便于以最相关的方式将它们呈现给用户:因此，具有与文本内容CZ最接近的接近度的视频，将在检索到的其他相关视频之前被呈现。
[0105]还有可能基于接近度标准，来选择检索到的视频的子集。
[0106]这可以包括:根据排序，仅选择预定数量的视频，该排序基于它们与文本内容CZ的语义距离。[0107]它还可以包括仅选择对应于预定阈值之下的语义距离的视频。如果没有一个检索到的视频是足够接近的，这个实施例可以因此不将任何视频内容示出给用户。
[0108]对本领域的技术人员，其他替代方案和实施例也是可能的以及可得到的。本发明因此不能被理解为被限制于上面所描述的这些实施方式。
【权利要求】
1.一种用于辅助用户通过通信网络搜索视频内容的方法，包括: ?由所述用户确定第一内容项目(CZ)的步骤； ?从这个第一内容项目自动提取语义数据的步骤； ?根据所述语义数据针对至少一个服务自动生成查询、使得能够在所述至少一个服务上检索一个视频集合的步骤； ?将所述视频集合呈现给所述用户的步骤。
2.根据前一个权利要求所述的方法，还包括:基于所述第一内容与关联于所述集合中的视频的描述之间的语义接近度的标准，从所述集合中选择视频子集的步骤。
3.根据前一个权利要求所述的方法，其中基于所述语义数据来确定所述至少一个服务。
4.根据前述权利要求之一所述的方法，其中所述步骤可以由在人机界面(WB)中选择第一内容项目(CZ)以及由选择通过所述人机界面可访问的软件功能而被触发。
5.根据前述权利要求之一所述的方法，其中所述自动提取语义数据的步骤包括提取“主语-动词-宾语”关系。
6.根据前一个权利要求所述的方法，其中基于所述关系来构建所生成的所述查询。
7.一种通信终端，装备有处理装置以实施根据前述权利要求之一所述的方法。
8.一种计算机程序，装备`有处理装置以实施根据权利要求1-7之一所述的方法。
9.一种用于通信终端的人机界面(WB)，装备有使得用户能够选择第一内容项目(CZ)的装置，以及使得能够触发以下步骤的装置: ?从所述第一内容项目自动提取语义数据的步骤； ?根据所述语义数据针对至少一个服务自动生成查询、使得能够在所述至少一个服务上检索一个视频集合的步骤； ?将所述视频集合呈现给所述用户的步骤。
【文档编号】G06F17/30GK103562912SQ201280023863
【公开日】2014年2月5日申请日期:2012年4月27日优先权日:2011年5月17日
【发明者】S·斯奎汀, A·范贝尔申请人:阿尔卡特朗讯

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S·斯奎汀;A·范贝尔
技术所有人：阿尔卡特朗讯
我是此专利的发明人

上一篇：特别用于射频电路的有线电容器和包括所述有线电容器的设备的制作方法
上一篇：混合互连技术的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。