高效的基于内容的视频检索的制作方法_3

文档序号:9848285阅读:来源:国知局
如,指引,诸如指针,可以被交换)。在所描绘的实施例中,从最大块编号到最小 块编号执行分类作为部分排序。在一些实施方式中,可以基于打破均势的标准来处理关系。 例如,as(f)415a的块M8和M9共享值10,并且可以基于其在帧中的位置对其进行排序。
[0052]然后可以应用排列度量,其可以,例如,识别两个分类向量as(f)415a_b中不一致 的块的位置。例如,在各分类向量as(f)415a-b中,各块M3、M5和Ml可以占用相同的位置。然 而,如对应关系420所指出的,其他各块可以位于两个向量中不同的位置。由于六个块占据 不同的位置,可以将排列距离D 425计为6(在一些实施方式中,块的数量可以超过9,并且距 离的范围会相应地更大)。
[0053]然后,该系统可以通过使用所确定的距离执行后置处理430,诸如镜头检测。上述 度量可以是有力地平滑摄像机运动,并对各种镜头转换较为敏感。
[0054] 镜头转换分类和检测
[0055] 图5是时间序列曲线图,描绘了可以由各个公开的实施方式检测到的视频序列中 的各个镜头转换。该图表示在视频中帧515上有切屏510的概率。如图所表示的,在少数帧或 单一帧之上迅速发生转换的硬切效果525b可以在镜头边界530c处产生极高的概率。此概率 可以,例如,从各帧之间的排列距离得到。起始于帧530a终止于530b的溶解效果525a可能更 加难以检测,因为其概率可能不超过阈值520。擦除效果525c可能相对易于检测,因为虽然 该转换是渐进的,但是两个场景在多帧中的帧中保持独立地描绘。基于从排列距离所得到 的概率,上文描述的图3的操作可以检测四个镜头的三个介于中间的转换525a-c。
[0056] 图6是流程图,描绘了用于检测可以在一些实施方式中实现的不同转换类型的方 法的各个步骤。在框605中,该方法开始一个新的镜头。在框610中,该方法可以对要考虑的 下一帧执行分析,例如,包括来自图3的框的分析。
[0057]在框615中,例如,通过查阅时间序列,系统可以确定过去的帧是否提供硬切镜头 转换。在框620中,例如,再次通过查阅时间序列,系统可以确定过去的帧是否在提供溶解效 果的镜头转换。在框625中,例如,再次通过查阅时间序列,系统可以确定过去的帧是否提供 擦除效果的镜头转换。虽然本实施例中仅描绘了三个转换类型,但是将认识到的是可以由 系统测量任何数量和阶段的转换。该过程方法继续,直到要考虑的最后一帧已经被考虑。从 框650开始,该方法可能会在框655结束当前镜头。
[0058]当检测到镜头转换时,该方法可以在框630、635和640(在本文中称为帧N)执行相 应的边界帧检测。例如,参考图5,边界帧N可以在帧4、10和15中找到。一些实施方式可以比 一个帧级别更精细,并且可以包括两个镜头中的相同帧,在每个镜头中具有存在指示(例 如,在溶解效果的转换中,各帧可能具有对一个镜头正在减少的相关性,同时具有对后续镜 头增加的相关性)。
[0059]在框645中,该方法可以采取步骤在帧N或在帧N之前结束先前镜头,并在在帧N或 帧N之后开始一个新的镜头。
[0060] 上文描述的转换检测操作可以在一些实施方案中以各种方式加以改进。例如,非 常短的镜头(例如,包括最多3帧)不太可行,可能归因于原始镜头内的突然的照明、运动或 其它物理变化。因此,如果上述算法检测到该等短镜头,那么可以通过这些帧继续使用先前 镜头。
[0061] 相反,非常长的镜头的检测(相对于其它镜头)可能归因于各帧之间的柔性转换 (溶解,衰落或擦拭)而不是突然切屏。柔性转换可能难以检测到。可以用不同的启发法来解 决该问题。例如,可以应用基于滑动窗口统计的自适应距离阈值,这可以实现对镜头边界的 更高的检测分辨率。
[0062] 在一些实施方案中,该系统可以识别镜头,如具有开始帧、结束帧和中点帧,而不 是寻找唯一的边界帧(帧N)。可以在开始和结束帧执行后置处理以更精细地确定柔性转换 的效果。
[0063] 计算机系统概述
[0064] 各种实施方式包括已在上文描述的各种步骤和操作。硬件部件可以执行多种这些 步骤和操作,或者在机器可执行指令中可以体现,其可以用于使编入指令程序的通用或专 用处理器执行步骤。或者,可以通过硬件、软件和/或固件的组合来执行各步骤。因此,图7是 可以被用于实现一些实施方式的特征的计算机系统700的框图。各种所公开的特征可以位 于计算机系统700上。根据本实施例,该计算机系统包括总线705、至少一个处理器710、至少 一个通信端口 715、主存储器720、可移动存储介质725、只读存储器730和大容量存储735。
[0065] 处理器710可以是任何已知的处理器,比如,但不限于,英-特尔?安腾或安腾2? 处理器,或AMD?皓龙?或速龙MP?处理器,或Motorola?处理器系列。通信端口 715 可以是任何RS-232端口,用于与基于拨号连接的调制解调器、10/100以太网端口或使用铜 缆或光纤的千兆端口共同使用。可以根据网络如局域网(LAN),广域网(WAN)或该计算机系 统700连接的任何网络,包括无线网络,选择通信端口 715。
[0066] 主存储器720可以是随机存取存储器(RAM),或者在本领域中公知的任何其他动态 存储设备。只读存储器730可以是任何静态存储设备,诸如可编程只读存储器(PR0M)芯片, 用于存储诸如用于处理器710的指令的静态信息。
[0067] 可以使用大容量存储器7 35存储信息和指令。例如,可以使用诸如Adapicc?的 SCSI驱动器家族的硬盘、光盘、诸如RAID的磁盘阵列,诸如Adaptec的RAID驱动器家族或任 何其他大容量存储设备的阵列。
[0068]总线705将处理器710与其他存储器、存储和通信模块在通信上连接。根据所使用 的存储设备,总线705可以是PCI/PCI-X或基于SCSI的系统总线。
[0069] 可移动存储介质725可以是任何类型的外部硬盘驱动器、软盘驱动器, IOMEGA? zip驱动器、只读存储器光盘(CD-ROM)、可重写光盘(CD-RW)、只读存储器数字 视频盘(DVD-ROM)。
[0070] 上文所描述的部件意在列举某些可能性的类型。上述实施例决不会限制本发明的 范围,因为它们只是适合的实施方式。
[0071] 遞
[0072]虽然本主题已经通过特定于结构特征和/或方法动作的语言进行了描述,但是应 当理解所附权利要求书中定义的主题并不限于上述具体特征或动作。相反,上文描述的具 体特征和动作被公开作为实现权利要求的实施例形式。因此,本发明并不局限于所附权利 要求书。
[0073] 虽然实施方式中示出计算机可读介质是单个介质,但是术语"计算机可读介质"应 被理解为包括单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的缓存和服 务器),其存储一组或多组指令。术语"计算机可读介质"也可以被理解为包括能够存储、编 码或携带由计算机执行的一组指令的任何介质,该等介质使计算机执行目前公开的技术和 创新的任何一个或多个方法。
[0074] -般情况下,执行以实现本公开的实施方式的例程,可以被实现作为操作系统或 被称为"程序"的具体应用、部件、程序、对象、模块或指令序列的一部分。该等程序通常包括 设置在计算机中各种存储器和存储设备在不同时间的一个或多个指令,并且,当计算机的 一个或多个处理单元或处理器读取或执行该等程序时,其使得该计算机执行操作以执行涉 及本公开的各个方面的元素。
[0075] 此外,虽然在计算机和计算机系统充分运作的情况下,实施方式已经被描述,但是 各种实施方式能够被分发为各种形式的程序产品,并且不考虑用于实际上影响分发的计算 机可读介质的特定类型,该公开内容同等地适用。
[0076] 除非上下文清楚地要求,否则遍及说明书和权利要求书,词语"包括"、"包含"和其 他类似词将被以包括的含义来解释,而不是排他或穷举的含义;也就是说,是指"包括但不 限于"。如本文中所使用的,术语"连接"、"连结"或其任何变体是指两个或更多元件之间的 任何连接或连结,无论是直接或间接的;元件之间的连接可以是物理的、逻辑的或其组合 的。另外,词语"这里"、"以上"、"以下",以及类似含义的词语,在本申请中使用时,应指本申 请的整体而不是本申请的任何特定部分。如果上下文允许,在上述发明详述中使用单数或 复数也可以分别包括复数或单数。关于两个或更多项目的列表,词语"或"覆盖该词语以下 所有的解释:列表中的任何项目、列表中的所有的项目、以及列表中该等项目的任意组合。
[0077] 本公开的实施方式的以上详细描述并不旨在穷尽或将教导限制于上文公开的
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1