自适应视频变焦的制作方法

文档序号：7693585阅读：175来源：国知局

专利名称：自适应视频变焦的制作方法
技术领域：
本发明涉及视频内容的变焦显示。
背景技术：
不同的显示设备可以被配置为以不同的显示分辨率显示视频内容。此外，视频本身可以是各种可能的分辨率中的任一种。因而，可能难以在诸如移动通信设备的显示器等的较小的显示器上显示较高分辨率的视频(例如，高清晰度视频)。因而，一种方法是将视频的分辨率降低到能够通过移动通信设备显示的分辨率；然而，给定显示器的较低的分辨率和小的尺寸的情况下，观众可能不再能够清楚地看到视频中的各项。另一方法是以变焦视图查看视频的一部分。然而，屏幕上感兴趣的项通常在帧内不是停滞的，因而，对于观众来说，不断调节视频中他们期望查看哪个部分可能是麻烦的。此外，在观看非常高的分辨率视频时，观众可能希望即使在具有大的屏幕的输出设备时也聚焦于视频流的具体的子区域。

发明内容
提供本概述以便以简化形式介绍下面在详细描述中进一步描述的概念的选集。本概述不旨在标识所要求保护的本主题的关键特征或必要特征，也不旨在被用来限制所要求保护的本主题的范围。此外，所要求保护的本主题不限于解决本公开内容的任何部分中提到的任何或所有缺点的实现。根据本公开内容的一个方面，提供了一种提供视频内容项以供一个或多个观众查看的方法。该方法包括标识视频内容项内的一个或多个对象。该方法还包括，对于每一个所标识的对象，为该对象指派可搜索的描述符、创建指示视频内容项内的、该对象在此期间发生的一个或多个时间段的时间戳、以及创建界定该对象在其内发生的视频内容项的区域的边界窗口。然后，将可搜索的描述符、时间戳和边界窗口封装成与视频内容项相关联的元数据。该方法还包括将视频内容项和与视频内容项相关联的元数据递送给客户机计算设备。

图1示意性地示出根据本公开内容的各实施方式的用于提供和查看视频内容项的示例计算环境。图2示出阐释根据本公开内容的各实施方式的提供和查看视频内容项的示例方法的示例流程图。图3示意性地示出根据本公开内容的一个实施方式的创建边界窗口的示例。图4示意性地示出根据本公开内容的一个实施方式的与视频内容项相关联的元数据的一个示例。图5示出根据本公开内容的一个实施方式的与视频内容项相关联的元数据的另
一示例。
图6示意性地示出根据本公开内容的一个实施方式的显示可选择的对象的镶嵌视图的一个示例。图7示意性地示出根据本公开内容的一个实施方式的显示可选择的对象的镶嵌视图的另一示例。图8示意性地示出根据本公开内容的一个实施方式的显示可选择的对象的镶嵌视图的又一示例。图9示意性地示出根据本公开内容的一个实施方式的示例使用场景。图10示意性地示出根据本公开内容的一个实施方式的另一示例使用场景。图11示出根据本公开内容的各实施方式的示例计算设备。
具体实施例方式可以在计算设备上显示视频内容，以便提供内容的变焦视图，这允许用户(例如观众)查看视频内的感兴趣的对象(例如，人、体育比赛、汽车等等)，而不受诸如被配置为用相对地小的数量的像素显示内容的较小的显示器等的显示器的约束。因而，观众可以与计算设备交互以选择所给定的流的优选的焦点。然而，这样的感兴趣的对象通常在帧内不是停滞的，或屏幕上焦点的项可以从一个点移动到另一点。因而，观众可以用身体与播放设备交互以改变焦点窗口，这对于观众来说可能是麻烦的，并且会中断查看体验。因而，在此描述的自适应视频变焦应用视觉和/或听觉场景分析技术来自动地从流本身提取感兴趣的点。因而，可以在视频内容项内标识诸如移动的汽车、人脸等等的对象。使用这些技术，可以界定自动变焦和平移窗口，且可以向视频内容项提供。然后，回放设备可以基于这样的信息显示变焦视图，如在下文中更详细地描述。图1示出用于提供和查看视频内容项的示例计算环境20。示例客户机计算设备 (例如，客户机)22和M被配置为回放视频内容项。这样的客户机计算设备的示例可以包括但不限于电视机、个人计算机、机顶盒、游戏控制台、移动通信设备等等。视频内容项可以被本地存储在客户机和/或可以被远程存储。作为示例，客户机可以从诸如客户机的数据保持子系统等的本地存储接收内容。作为另一示例，客户机可以经由诸如网络沈等的网络从诸如远程存储位置30和/或网络可访问的计算设备(例如，服务器)32等的远程存储接收诸如视频内容项28a和/或28b等的内容。作为又一个示例，可以从远程存储接收内容且然后可以将其上传到客户机以供随后从内容项的客户机副本回放。作为又一个示例，可以在客户机计算设备本地存储和访问内容。此外，网络沈可以是任何合适的网络，包括但不限于因特网、有线电视网络、卫星电视网络、蜂窝式网络等等。在所叙述的示例中，被存储在服务器32上的示例视频内容项28c可以被递送给诸如客户机22和/或客户机M等的一个或多个客户机。此外，如将参考图2更详细地描述，服务器32可以被配置为标识在视频内容项^c内出现的对象，并在与视频内容项28c —起被提供给客户机的元数据内提供关于这样的对象的信息。因而，然后，客户机可以基于此信息以变焦视图显示视频内容项观(3。以此方式，每一客户机可以被配置为根据设备的显示器参数和/或观众的变焦偏好来变焦视频内容项^c。作为一个示例，在所叙述的场景中，视频内容项28c是篮球比赛的视频。示例客户机22 (例如，电视)可以显示视频内容项^c内的选手36的变焦视图34。然而，诸如客户机M(例如，移动通信设备)等的另一客户机计算设备可以显示相同的视频内容项^c的不同的变焦视图38，其显示选手40。因而，具有不同设备的不同观众可以查看相同的视频内容项的不同变焦视图，这允许每一观众查看感兴趣的视频内的特定对象。以此方式，服务器32不需要封装为每一观众和/或设备分别处理的内容。相反，服务器32可以将相同的内容项和相同的关联元数据提供给所有客户机，且客户机本身可以利用元数据来提供为该客户机的观众分别处理的变焦视图。在一些实施方式中，客户机可以确定视频内容项内的哪个对象是将以变焦视图显示的感兴趣的对象。然而，在一些实施方式中，这样的对象的列表可以被提供给观众，这允许观众选择感兴趣的对象。此外，在一些实施方式中，计算环境20可以是家庭环境，其中网络沈是家庭网络，且服务器32是被配置为将视频内容项提供给客户机22和/或客户机M的家庭服务器、机顶盒等等。另外，在一些实施方式中，客户机可以被配置为标识在本地存储的视频内容项内出现的对象。在这样的情况中，客户机本身可以在元数据内创建关于这样的对象的信息，并且然后使用此信息来提供变焦视图。因而，客户机不需要从远程服务器接收关于视频内容项的信息。此外，如果变焦偏好也被本地存储在客户机，则客户机完全不需要访问网络。现在转到图2，图2阐释提供和查看变焦视频内容的方法的流程图50。应明白，尽管流程图50阐释服务器和客户机的操作，但在一些实施方式中，单个计算设备可以被配置为执行服务器和客户机两者的操作。在52，服务器可以标识视频内容项内的一个或多个对象。视频内容项可以是任何合适的视频内容项，包括但不限于电视节目、电影、点播节目、因特网视频等等。在一些实施方式中，服务器可以可选地从客户机接收对视频内容项的请求，如M所指示。然而，在其他实施方式中，服务器可以在不接收这样的请求的情况下就准备和提供视频内容项(例如，将视频内容项推送给客户机)。视频内容项内所标识的对象可以是感兴趣的任何合适的对象，诸如演员、运动员、物体、产品安插、徽标等等。服务器可以被配置为以任何合适的方式标识这样的对象。例如，服务器可以被配置为对被提供给观众以供查看的视频流执行计算场景分析。这样的场景分析可以利用诸如对象识别、面部识别、语音/视频分析等的任何合适的技术来标识会话中的发言者等等。例如，面部识别算法可以被应用到视频内容项的场景以标识每一场景内的人，例如演员、运动员、名人、政治家等等。作为另一个示例，对象识别算法可以被应用到视频内容项的场景以标识每一场景内的物体，例如篮球、狗、吉他、一盒麦片等等。作为又一个示例，徽标识别算法可以被应用到视频内容项的场景以标识在每一场景内徽标，例如企业徽标、产品品牌徽标、运动队徽标等等。应理解，可以在不偏离本公开内容的范围的前提下使用任何合适的对象识别算法。此外，在一些实施方式中，代替通过自动的算法检测和标记对象或除此之外，还可以手动地检测、验证和/或标记对象。—旦标识视频内容项内的对象，服务器可以存储关于对象的信息，例如每一对象在帧内出现的位置、对象在流内的所指定的位置出现的时刻等等。因此，在56，服务器可以为对象指派可搜索的描述符。可搜索的描述符可以包括诸如可搜索的名称等的用于标识对象的任何合适的信息。例如，公众人物的可搜索的描述符可以包括此人的固有名称、昵称等等。作为另一个示例，可以使用全局唯一标识符或其他标
6识符来将一个对象与其他对象区分开来。在58，服务器可以创建指示视频内容项内的对象在此期间出现的时间段的时间戳。时间戳可以是以任何合适的格式。例如，如果感兴趣的演员在视频内容项的三个场景中出现，则时间戳可以包括指示这三个相关的场景中的每一个的开始时刻和结束时刻的数据。在60，服务器可以创建界定视频内容项中对象在其内出现的区域的边界窗口，诸如视频内容项的帧的区域等。边界窗口可以具有任何合适的形状。例如，边界窗口的形状可以取决于对象的形状。作为一个示例，边界窗口可以是以由质心和半径界定的圆的形状。作为另一个示例，边界窗口可以是以由诸如左上坐标和右下坐标等的两个或更多个直角坐标界定的矩形的形状。作为另一个示例，边界窗口可以是以大致遵循感兴趣的对象的轮廓的不规则形状。此外，形状可以取决于所编码的视频的分辨率和对象在视频内出现的时间。因而，边界窗口的形状可以随时间而改变。以此方式，边界窗口可以指示用于显示对象的变焦级别。换句话说，客户机可以利用边界窗口信息提供对象的变焦视图，如在下文中更详细地描述。图3阐释创建诸如图1的视频内容项28c等的边界窗口的示例。在所叙述的帧中，标识了六个篮球选手并为每一个选手创建边界窗口，包括对应于选手36的边界窗口 80和对应于选手40的边界窗口 82。在所叙述的帧内还标识了球篮以及篮球两者。在客户机被配置为也执行服务器的职责的情况，关于所标识的对象和边界窗口的元数据的封装可以在带外进行(例如，在递送视频之前)，或者可以在观看视频的同时进行。在后一种情况中，在传入的视频正被观看的同时，本地的服务将连续地处理传入的视频，使得可以本地存储所提取的特征。以此方式，可以发生其中用户在场景期间可以选择查看放大的面部表情的“智能变焦倒带”场景。作为另一个示例，客户机可以缓冲视频并引入轻微的延时，以便在所标识的对象在视频中出现之前，向用户呈现所标识的对象。返回到图2，在62，服务器可以将可搜索的描述符、时间戳和边界窗口封装到与视频内容项相关联的元数据中。以此方式，对于流中的每一个场景，服务器可以存储感兴趣的潜在的项的列表。如在下文中更详细地描述，客户机可从服务器获得的每一个经处理的视频流可以使此元数据可用。以此方式，元数据可以促进视频内容项内的所选择的对象的变焦观看。例如，如果可能，感兴趣的项可以与主身份/对象列表匹配以标识诸如人们或位置等的唯一对象。作为一个示例，图4阐释表示与图1的视频内容项28c相关联的元数据84的示意图。元数据84可以包括关于视频内容项^c内的每一个所标识的对象的信息，例如选手、篮球、篮等等。应明白，这样的示意图是非限制性的。可以使用任何适当的数据结构以任何合适的方式来格式化元数据本身。作为另一示例，元数据可以被封装为可扩展标记语言(XML)数据。图5阐释与示例视频内容项电影A相关联的元数据90的示例部分。如在92所叙述，“videolnfo (视频信息)”可以被用来描述视频内容项，且可以包括，例如，标题、导演、发行日期等等。如在94所叙述，"extractedObjects (所提取的对象)”节点可以被用来描述视频流中所标识的对象的列表。对于每一个所标识的对象，可以存在贯穿流中标识此对象的ID。此外，类属性可以告诉计算设备它是什么类型的对象。每一个对象的有效的类型可以是任意的，这取决于内容。例如，在电影的情况中，对象类型可以包括面部和对象。然而，在旅游视频的情况中，对象类型可以包括位置、教堂、运输和其他这样的类。类的域可以不是固定的，而是可以由用来标识与变焦技术对域的应用程序耦合的对象的技术本体论地驱动。此外，诸如示例referenceld(参考ID)字段95等的“referenceld”字段(例如，可搜索的描述符)可以被用来将在此流中所标识的对象链接到在其他流中所标识的对象。例如，另一流可以包括“Bob Smith”，在该情况中，具有他的脸的对象可以由相同的 referenceld 值(例如，7AF81752-2EB9-4FCD-A053-7E76A9D4573C)来标识。属性图标和displayName (显示名称)可以被用来在用户界面中向观众呈现选择。应明白，尽管在 extractedObjects节点中示出几个对象，但是可以在这里描述视频内容项内所标识的所有对象，如由在96处的“等等”注释所指示。如在98所叙述，“objectRegistrations (对象注册)”节点可以被用来跟踪流内所标识的对象的所有实例以及它们的变焦信息。每一注册可以是指单个对象，且可以具有指示此注册何时在视频流内存在的关联的时间跨度。最终，每一注册还可以提供所标识的对象的边界窗口，使得客户机可以对注册中所标识的对象自动地变焦。在时间跨度过去时，客户机可以被配置为变焦到另一个所注册的对象，或如果没有选择任何一个，则退出变焦模式且然后显示完全的视频。应明白，尽管在objectRegistrations节点中示出几个对象记录，但是可以在这里描述与视频内容项内所标识的对象相关联的所有实例，如由在99处的“等等”注释所指示。返回到图2，在64，服务器判断视频内容项内是否存在要标识和分类的更多对象。如果是这样，则流进行到52。如果视频内容项内没有要分类的其他对象，则流进行到66。在66，服务器可以将视频内容项和与视频内容项相关联的元数据递送给客户机计算设备。如上面介绍，在一些实施方式中，可以响应于来自客户机的请求而递送视频内容项，诸如在讨所指示。然而，在其他实施方式中，服务器可以在不接收这样的请求的情况下就准备和提供视频内容项(例如，将视频推送给客户机)。可以以任何合适的方式与视频内容项一起递送元数据。例如，在一些实施方式中，元数据可以被编码为视频内容项的一部分。然而，在其他实施方式中，元数据可以是不同于视频内容项的伴随文件或与视频数据一起封装的首部数据。由于除视频内容项以外还提供元数据，所以可使得如由服务器所确定的来自视频流的所标识的对象的列表在接收时对于客户机是可用的。以此方式，视频内容项可以被配置为由一个或多个观众查看。服务器可以将相同的内容项和相同的关联的元数据提供给所有客户机，且客户机本身可以利用元数据来提供为该客户机的观众分别处理的变焦视图。在68，客户机可以从服务器接收视频内容项和与视频内容项相关联的元数据。如上面所介绍，对于视频内容项内的所标识的每一个对象，元数据包括可搜索的描述符、时间戳和边界窗口。然后，客户机可以流传送视频内容项和/或保存视频内容项以供稍后回放。为了确定视频内容项内的哪个对象可能是观众感兴趣的，在70，客户机可以访问指示在视频回放期间要变焦的对象的观众的变焦偏好。变焦偏好可以包括以任何合适的方式确定的变焦偏好。例如，在一些实施方式中，变焦偏好可以包括由观众标识的变焦偏好。例如，对吉他独奏曲感兴趣的观众可以在她的变焦偏好内指示在吉他在视频内容项(例如，音乐视频、音乐会等等)内出现时提供吉他的变焦视图。作为另一个示例，有喜欢的运动员的观众可以在他的变焦偏好内指示在该运动员在视频内容项(例如，体育比赛、访谈、商业节目、在电影内的客串演出等等)内出现时提供该运动员的变焦视图。另外或替代地，变焦偏好可以包括从以往的观看习惯导出的习得的变焦偏好。例如，计算设备可以跟踪观众行为(例如，观看习惯、媒体消费等等)以判断观众倾向于频繁地和/或在延长的持续时间内观看哪个对象。然后，计算设备可以分析此行为以判断观众的变焦偏好。例如，如果观众倾向于观看带有特定的演员的电影，则计算设备可以确定此演员可能是观众感兴趣的对象。此外，变焦偏好可以被存储在任何合适的位置，例如本地地存储在客户机和/或存储在网络可访问的数据存储中。因此，对于前一种情况，访问变焦偏好可以包括访问客户机的本地存储(例如，数据保持子系统)。在这样的情况中，在基于被提供给不同的客户机设备的一般元数据来本地实现观众偏好的场合，观众可以通过不与服务器共享变焦偏好而能够维持隐私。然而，对于后一种情况，访问变焦偏好可以包括经由网络连接访问服务器的存储(例如，数据保持子系统)。被存储在网络可访问的存储的变焦偏好可以向观众提供更多灵活性，因为他们的偏好可以通过他们当前利用的任何客户机设备来访问，而不是使偏好束缚于特定的客户机设备。在72，客户机可以从所标识的对象选择所选择的对象。在一些实施方式中，这可以包括搜索由变焦偏好指示的对象的元数据，如在74所指示。例如，客户机可以将元数据中的所标识的对象与观众的变焦偏好的所标识的对象进行比较，以判断元数据中是否有所标识的对象中是观众感兴趣的。然而，在一些实施方式中，客户机可以使得观众可获得视频内容项的对象信息，例如，在观众浏览视频以观看时和/或在观众发起视频流时。通过向观众提供这样的对象的列表，观众然后可以选择感兴趣的对象。作为一个示例，客户机可以显示视觉上呈现在视频播放期间可以变焦的候选对象的镶嵌视图。在这样的情况中，选择所选择的对象可以包括接收指示这样的选择的用户输入，如在76所指示。图6示出镶嵌视图100的示例，呈现在图1的视频内容项^c内所标识的可选择的对象的列表。此外，在一些实施方式中，观众可能已经从另一个流选择在当前的流中呈现的项，在该情况中，客户机可以简单地选择此项。返回到图2，在78，客户机可以在客户机计算设备的显示器上显示所选择的对象的变焦视图。换句话说，一旦对象被选择，客户机就可以将显示窗口聚焦于所给定的对象。例如，可以在流中用对象的标识符、屏幕位置和相对大小来注释对象，使得客户机可以连续地中心聚焦于该对象。此外，如果多个对象被观众选择且一个焦点对象离开流，则焦点然后可以转移到流中呈现的下一个对象。此外，变焦视图可以基于与所选择的对象相关联的边界窗口来可视地呈现视频内容项的所选择的对象。例如，边界窗口的尺寸可以指示如何在变焦视图内显示所选择的项。在一些实施方式中，一旦对象被观众选择，它们就可以被存储在观众的变焦偏好中。以此方式，客户机可以基于来自观众的播放历史的感兴趣的对象来给观众呈现诸如新的推荐等的信息。此外，感兴趣的对象的优先化/分级(例如，电影中的演员、乐队的成员等等)可以被保留(例如，经由观众偏好)以便用于随后的查看情况。
另外，自适应视频变焦可以从受约束设备上的查看延伸到扩充的多屏幕体验。例如，观众可以具有一组屏幕或屏幕区域，在该组屏幕或屏幕区域上，一个屏幕显示变焦的或未变焦的流而其他区域显示观众已经选择的前N个所标识的对象的变焦实例。作为一个示例，图7阐释显示镶嵌视图的另一个示例。在此示例，除在显示器的另一部分显示图1的内容项28c的变焦视图39之外，客户机在显示器的第一部分显示镶嵌视图110。以此方式，观众可以在贯穿查看体验中为变焦视图选择其他项，以便改变哪个对象是他们的感兴趣的对象。作为另一个示例，图8阐释一个示例，其中镶嵌视图120被显示在客户机42 (例如，移动通信设备)的显示器41上，客户机42不同于在显示器44上显示内容项^c的变焦视图39的客户机43 (例如，电视)。以此方式，用户可以例如利用一个客户机来选择在其他客户机上查看哪个对象。作为又一个示例，不同的屏幕可以被用来呈现相同的视频内容项的不同的变焦视图。换句话说，作为可能的使用场景，可以基于计算设备上的变焦偏好而显示所选择的对象的第一变焦视图，且可以基于伴随计算设备上的变焦偏好而显示视频内容项的第二变焦视图。因而，观众可以选择在另一个设备上显示相同内容项的不同的变焦视图。由于客户机从随视频内容项接收的元数据确定变焦视图，所以每一个设备可以接收相同的视频内容项和元数据，然而显示不同的变焦视图。因而，在一些实施方式中，每一客户机可以显示相同的视频内容项的相同对象的不同变焦视图。作为另一个示例，每一个客户机可以从视频内容项选择不同的所选择的对象用于变焦视图，以使得每一个客户机显示不同的对象的不同的变焦视图。例如，如以上参考图1 所述，客户机22可以显示视频内容项^c的选手36的变焦视图34，而客户机M可以显示相同的视频内容项^c的不同的变焦视图38，然而显示不同的选手，即选手40。以此方式，两个客户机的单个观众可以追随该观众的两个喜欢选手的比赛。替代地，每一个客户机的不同的观众各自可以能够追随他们的喜欢的选手的比赛。在一些实施方式中，两个或更多个客户机设备可以彼此通信和合作，以便呈现两个或更多个不同的变焦视图。在此描述的技术提供可视的场景内的对象的标识，以便自动地调节视频流内的变焦窗口。此外，可以在镶嵌视图中将可能感兴趣的点呈现给观众，这可以在作为主要视频的相同的屏幕上或在伴随设备上实现。在此描述的技术还跨越特定的视频流中的不同的场景和/或跨越不同的视频流而保存观众变焦偏好。现在转到图9，图9阐释可能的使用场景。在此示例中，客户机130上的视频播放器具有屏幕132。在时间、开始视频体验时，在视频开始播放之前，可以向观众呈现从视频标识的对象的列表，如在134所示出。在所阐释的示例中，该列表包括对象(例如，狗和滑雪者)的图像。对象的列表可以另外或替代地包括除图像之外的信息，例如文本描述等等。一旦选择感兴趣的项，例如滑雪者，视频就可以开始播放，如在随后的时间、所指示，直到所选择的项中的一个出现，如通过视频元数据所描述。一旦系统遇到具有注册的窗口的所选择的项(例如，滑雪者)，客户机130就可以自动地将关看帧变焦到所注册的感兴趣的点，如在随后的时间、所叙述。图10阐释另一个可能的使用场景。在此示例中，代替使用分离的对话来显示用于变焦的选择，客户机140可以缩小显示器142内的播放视频，如在144所叙述，并使用屏幕界面的剩余部分来标识可用于变焦的感兴趣的对象，如在146所叙述。在这样的情况，观众可以轻击或选择所标识的对象中的一个以便自动地放大且然后返回正常视图(例如，经由双击输入、选择“全屏”按钮，等等)。作为又一个可能的使用场景，可以使用用于回放的多个设备来实现用于变焦的用户界面。在这样的场景中，一群观众可以同时在客户机计算设备的大屏幕上观看电影。具有较小的屏幕的客户机伴随设备也可以同时地播放相同的视频和实现如在此所描述的变焦视图。以此方式，每一个较小的设备可以显示观众具有兴趣的对象的变焦视图，同时在大视频设备上以全屏继续显示常规的视频。在一些实施方式中，上面所描述的方法和过程可以被束缚于计算系统。作为一个示例，图11示意性地示出可以执行上面所描述的方法和过程中的一个或多个的计算系统 150。例如计算系统150可以表示服务器32、客户机22、客户机M、客户机130、客户机140 等等。此外，在被配置为标识视频内容项的对象和封装元数据以及提供视频内容项的变焦视图的单个计算设备的情况中，计算系统150可以表示包括服务器32和客户机22的计算设备、包括服务器32和客户机M的计算设备等等。计算系统150包括逻辑子系统152和数据保持子系统154。计算系统150可以可选地包括图11中未示出的显示子系统和/或其他组件。逻辑子系统152可以包括被配置为执行一个或多个指令的一个或多个物理设备。例如，逻辑子系统可以被配置为执行是一个或多个程序、例程、对象、组件、数据结构或其他逻辑构造的一部分的一个或多个指令。这样的指令可以被实现为执行任务、实现数据类型、变换一个或多个设备的状态或以另外方式达到所期望的结果。逻辑子系统可以包括被配置为执行软件指令的一个或多个处理器。另外或替代地，逻辑子系统可以包括被配置为执行硬件或固件指令的一个或多个硬件或固件逻辑机器。逻辑子系统可以可选地包括贯穿两个或更多个设备而分布的个体组件，在一些实施方式中这些设备可以位于远处。数据保持子系统IM可以包括被配置为保持可由逻辑子系统执行以实现在此所描述的方法和过程的数据和/或指令的一个或多个物理的非暂态设备。在实现这样的方法和过程时，可以变换数据保持子系统154的状态(例如，以保持不同的数据)。数据保持子系统IM可以包括可移动介质和/或内置式设备。数据保持子系统IM可以包括光学存储器设备、半导体存储器设备和/或磁存储器设备以及其他。数据保持子系统1 可以包括具有下列的特性中的一个或多个的设备易失性、非易失性、动态、静态、读/写、只读、随机存取、连续访问、位置可寻址、文件可寻址和内容可寻址。在一些实施方式中，逻辑子系统 152和数据保持子系统巧4可以被集成到诸如专用集成电路或片上系统等的一个或多个普通设备中。图11也示出以计算机可读的可移动介质156的形式的数据保持子系统的一个方面，该数据保持子系统可以被用来存储和/或传递可执行为实现在此所描述的方法和过程的数据和/或指令。显示子系统158可以被用来呈现由数据保持子系统IM保持的数据的可视的表示。当在此所描述的方法和过程改变由数据保持子系统1 保持的数据，且因而变换数据保持子系统的状态时，显示子系统158的状态同样地可以被变换为可视地表示底层数据中的改变。显示子系统158可以包括实际上利用任何类型的技术的一个或多个显示设备。这样的显示设备可以与逻辑子系统152和/或数据保持子系统IM —起组合在共享的外壳内，或这样的显示设备可以是外围显示设备。应理解，在此描述的配置和/或方法在本质上是示例的，且不应以限制的意义来考虑这些具体的实施方式或示例，因为众多变更是可能的。在此描述的具体的例程或方法可以表示任何数量的处理策略中的一个或多个。因而，所阐释的各种动作可以以所阐释的顺序、以其他顺序、并行地执行，或在一些情况中被忽略。同样地，可以改变以上所描述的过程的次序。本公开内容的主题包括在此公开的各种过程、系统和配置以及其他特征、功能、动作和/或性质的所有新颖的和不明显的组合和子组合，以及其任何和所有的等效物。
权利要求
1.一种在计算设备上提供视频内容项以供一个或多个观众观看的方法，所述方法包括标识(5 所述视频内容项内的一个或多个对象；对于所述视频内容项内标识的每一个对象，为所述对象指派(56)可搜索的描述符；对于所述视频内容项内标识的每一个对象，创建(58)指示所述视频内容项内的所述对象在此期间出现的一个或多个时间段的时间戳；对于所述视频内容项内标识的每一个对象，创建(60)界定所述视频内容项中所述对象在其内出现的区域的边界窗口；对于所述视频内容项内标识的每一个对象，将所述可搜索的描述符、所述时间戳和所述边界窗口封装(6 到与所述视频内容项相关联的元数据中，所述元数据促进所述视频内容项内的一个或多个对象中的所选择的对象的变焦观看；以及将所述视频内容项和与所述视频内容项相关联的所述元数据递送(66)到客户机计算设备。
2.如权利要求1所述的方法，其中所述元数据被编码为所述视频内容项的部分。
3.如权利要求1所述的方法，其中所述元数据是不同于所述视频内容项的伴随文件。
4.如权利要求1所述的方法，其中每一个对象的所述边界窗口指示用于显示所述对象的变焦级别。
5.如权利要求1所述的方法，其中每一个对象的所述边界窗口的形状取决于所述对象的形状。
6.如权利要求1所述的方法，其中所述可搜索的描述符包括可搜索的名称。
7.如权利要求1所述的方法，其中标识所述一个或多个对象包括应用面部识别算法。
8.如权利要求1所述的方法，其中标识所述一个或多个对象包括应用对象识别算法。
9.如权利要求1所述的方法，其特征在于，所述计算设备和所述客户机计算设备是相同的计算设备。
10.一种客户机计算设备(150)上保持指令的数据保持子系统(巧4)，所述指令可由逻辑子系统(152)执行，以便接收(68)视频内容项和与所述视频内容项相关联的元数据，所述元数据对于所述视频内容项内的一个或多个对象中的每一个包括所述对象的可搜索的描述符、指示所述视频内容项中所述对象在此期间出现的一个或多个时间段的时间戳、以及界定所述视频内容项中所述对象在其内出现的区域的边界窗口；访问(70)观众的变焦偏好，所述变焦偏好指示在视频回放期间要变焦的一个或多个对象；通过搜索由所述变焦偏好指示的对象的所述元数据，从所述一个或多个对象选择(72) 所选择的对象；以及在所述客户机计算设备(150)的显示器(158)上显示(78)所选择的对象的变焦视图。
11.如权利要求10所述的数据保持子系统，其中所述变焦偏好包括由所述观众标识的变焦偏好和从以往的观看习惯导出的习得变焦偏好中的一个或多个。
12.如权利要求10所述的数据保持子系统，其中所述变焦偏好被本地存储在所述客户机计算设备处。
13.如权利要求10所述的数据保持子系统，其中所述变焦偏好被存储在网络可访问的计算设备处。
14.如权利要求10所述的数据保持子系统，其中所述指令还可执行以显示在视觉上呈现在视频回放期间要变焦的一个或多个候选对象的镶嵌视图，且其中所述指令可执行以通过接收来自所述镶嵌视图的候选对象的选择来选择所选择的对象。
15.如权利要求14所述的数据保持子系统，其中所述镶嵌视图被显示在伴随计算设备的显示器上。
全文摘要
通过提供视频内容项以供一个或多个观众观看的方法来提供自适应视频变焦。该方法包括标识视频内容项内的一个或多个对象。该方法还包括，对于每一个所标识的对象，为该对象指派可搜索的描述符、创建指示视频内容项内的该对象在此期间出现的一个或多个时间段的时间戳、以及创建界定视频内容项中该对象在其内出现的区域的边界窗口。然后，将可搜索的描述符、时间戳和边界窗口封装到与视频内容项相关联的元数据中。该方法还包括将视频内容项和与视频内容项相关联的元数据递送给客户机计算设备。
文档编号H04N21/235GK102244807SQ20111015908
公开日2011年11月16日申请日期2011年6月1日优先权日2010年6月2日
发明者T·布彻申请人:微软公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：T·布彻
技术所有人：微软公司
我是此专利的发明人

上一篇：一种呼叫处理方法、装置及系统的制作方法
上一篇：用于网络软件部署评估的书签和性能历史的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。