用于通过基于约束的转动平滑的数字视频稳定的系统和方法

文档序号：9264915阅读：333来源：国知局

用于通过基于约束的转动平滑的数字视频稳定的系统和方法
【技术领域】
[0001] 本公开的主题涉及信号处理。更尤其地，本公开涉及用于图像和视频处理的系统和方法。
【背景技术】
[0002] 近年来，广泛流行能够捕捉视频的数码相机。虽然这些用户装置的分辨率和图像质量提高为在某些设置中比得上数码单反相机OSLR)，但是其视频质量依然可能明显比胶片相机的视频质量更差。这个质量差距的原因可以是双重的。首先，与胶片相机相比，手机可以明显更轻。结果，在这种装置上的手持式视频捕捉可以显示更大量的相机抖动。其次，手机摄像头可能具有利用滚动快门（RS)的传感器。在RS相机内，每个图像行可能在略微不同的时间曝光，这会与未抑制的相机运动一起在输出视频内造成"摇晃"。
[0003] 视频稳定是用于减少由摄像机抖动产生的高频帧到帧跳动的一类技术。在专业照相机中，通常使用机械图像稳定（MIS)系统。例如，在MIS系统中，操作人员可以佩戴分开相机的运动和操作人员的身体运动的安全带。其他MIS系统使相机的光学部件（而非照相机机体本身）稳定。这些系统可以移动透镜或传感器，以补偿小幅俯仰与偏航运动。这些技术实时运行，并且不需要在相机上计算。然而，由于这些系统的价格和尺寸，所以这些系统不适合于移动装置和便宜的相机。数字视频稳定系统可以使用特征跟踪器来稳定拍摄后的视频。然而，这些系统可以对噪音（例如，快速移动的前景目标）敏感并且需要不同的特征来跟踪。结果，基于特征跟踪的数字稳定通常中断，尤其在不利的照明条件和过量的前景运动中。此外，在帧之上提取和匹配视觉提示，可以在计算上昂贵。而且，费用随着视频的分辨率增大。在某些情况下，这可以太昂贵，以至于不能实时进行视频稳定。结果，这种方法很少用于当前的数码相机内。制造商可以反而给高端DSLR选择更稳健的（并且昂贵的）机械稳定解决方案。

【发明内容】

[0004] 尤其在所附权利要求中公开了根据本发明的实施方式，涉及一种方法、储存介质以及系统，其中，还可以在另一个权利要求范畴（例如，系统）内要求在一个权利要求范畴 (例如，方法）内提及的任何特征。
[0005] 为了稳定数字视频，在一个实施方式中，计算机实现的方法、系统以及计算机可读介质可以提供数字视频数据，其包括具有相关联的时间戳的一组图像帧以及具有相关联的时间戳的一组相机方向数据。通过最小化在连续的图像帧之间的转动速率可以生成一组平滑的相机方向数据，同时最小化根据一组平滑的相机方向数据重新定向所产生的一组平滑的图像帧内的空白区域的量。
[0006] 在一个实施方式中，在所产生的一组平滑的图像帧内的空白区域的量可以被最小化为0。
[0007] 在一个实施方式中，在所产生的一组平滑的图像帧内的空白区域的量可以被最小化为低于阈值。
[0008] 在一个实施方式中，可以根据这组图像帧相关联的时间戳和这组平滑的相机方向数据，翘曲这组图像帧，以形成一组校正的图像帧。
[0009] 在一个实施方式中，根据这组图像帧相关联的时间戳和这组平滑的相机方向数据翘曲这组图像帧以形成一组校正的图像帧可以包括将单独的图像帧分成多个子部分。每个子部分可以具有相关联的时间戳和相机方向。根据这组图像帧相关联的时间戳和这组平滑的相机方向数据翘曲这组图像帧以形成一组校正的图像帧可以包括根据相关联的时间戳和相机方向，重新排列每个子部分，以形成单独的校正的图像帧。
[0010] 在一个实施方式中，可以显示这组校正的图像帧，作为视频。
[0011] 在一个实施方式中，在所产生的一组平滑的图像帧内的空白区域的量可以被最小化为低于阈值。
[0012] 在一个实施方式中，低于阈值的空白区域的量可以进行图像修补。
[0013] 在一个实施方式中，可以从手持式装置的陀螺仪提供具有相关联的时间戳的这组相机方向数据。
[0014] 在一个实施方式中，可以从手持式装置的相机提供这组图像帧。
[0015] 在一个实施方式中，可以从包括移动电话和数码相机的手持式装置的陀螺仪提供具有相关联的时间戳的这组相机方向数据。可以从数码相机提供这组图像帧。
[0016] 在一个实施方式中，生成这组平滑的相机方向数据，包括基于梯度下降的迭代优化。
[0017] 在一个实施方式中，生成这组平滑的相机方向数据，可以包括基于高斯滤波器的滤波。
[0018] 在一个实施方式中，生成这组平滑的相机方向数据，可以包括基于时间导数的滤波。
[0019] 在一个实施方式中，这组相机方向数据可以包括没有任何平移的转动。
[0020] 在一个实施方式中，这组相机方向数据可以包括具有转动和平移的向量。
[0021] 在一个实施方式中，由社交网络系统进行这组平滑的相机方向数据的生成。
[0022] 在一个实施方式中，具有相关联的时间戳的这组图像帧和具有相关联的时间戳的这组相机方向数据可以由社交网络系统的用户上传到社交网络系统中。
[0023] 在本发明的进一步实施方式中，一个或多个计算机可读暂时性储存介质体现软件，在执行时，其可操作，以执行根据本发明或任何上述实施方式所述的方法。
[0024] 在本发明的进一步实施方式中，一种系统包括：一个或多个处理器；以及存储器，其耦接至所述处理器，包括由所述处理器可执行的指令，在执行所述指令时，所述处理器可操作，以执行根据本发明或任何上述实施方式所述的方法。
[0025] 从附图中并且从以下详细描述中，本发明的很多其他特征和实施方式显而易见。
【附图说明】
[0026] 图1示出了根据一个实施方式的一个实例针孔照相机模型；
[0027] 图2示出了根据一个实施方式的两个实例相机方向及其相应的图像平面的描述；
[0028] 图3示出了根据一个实施方式的由RS相机捕捉的一个实例翘曲图像以及用于校正图像的转换的描述；
[0029] 图4示出了根据一个实施方式的一个实例数字视频稳定模块；图5示出了根据一个实施方式的输入数据以及在平滑之后产生的数据的示图；
[0030] 图6示出了根据一个实施方式的用于基于约束的平滑的一个实例方法；
[0031] 图7示出了根据一个实施方式的系统的一个实例网络图，用于从数字视频中修改一组图像帧，以在社交网络系统内产生稳定的数字视频；
[0032] 图8示出了根据一个实施方式的可用于实现在本文中描述的一个或多个实施方式的一个实例计算机系统；
[0033] 示图描述了本发明的各种实施方式，仅仅用于说明的目的，其中，示图使用相似的参考数字，来表示相似的部件。本领域的技术人员从以下讨论中容易认识到，在不背离在本文中描述的原理的情况下，可以使用在图中说明的结构和方法的替换的实施方式。
【具体实施方式】
[0034] 伸用陀螺仪的数字视频稳宙和滚动怏门柃|H
[0035] 滚动快门校正是一种用于去除由帧内相机移动产生的图像翘曲的技术。高端相机使用电荷耦接装置（CCD)传感器，其具有全局快门（GS)。在GS相机（包括很多DSLR)内，可以同时读出和重置在CCD传感器上的所有像素。因此，在相同的时间间隔内，所有像素收集光。因此，在曝光期间的相机运动在这些装置上造成某种程度的图像模糊。相反，低端相机通常利用互补金属氧化物半导体（CMOS)传感器。尤其地，这些传感器使用滚动快门，其中，依次读出和重置图像行。与CCD传感器相比，这种方法可以需要更少的电路，并且可以使CMOS传感器制造更便宜。因此，CMOS传感器常常用于手机、音乐播放器以及一些低端摄影放像机内。然而，依次读出表示在略微不同的时间窗口期间曝光每行。结果，在行读出期间的相机运动产生翘曲的图像。快速移动的目标也失真。
[0036] 在RS相机内的图像读出通常在毫秒范围内。因此，RS失真主要由高频相机运动造成。因此，MIS系统可以用于稳定相机。虽然这种方法去除了滚动快门翘曲，但是实际上， MIS系统的价格范围和尺寸使其不适合于RS相机。一些数字滚动快门调整技术可以校正在单个图像内的RS伪影，但是需要用户输入。相反，本公开的一些实施方式可以校正单个图像的RS伪影，而不需要用户输入。
[0037] 对于视频，使用特征跟踪来估计视频的相机运动，调整在帧序列内的RS，可以具有问题。一旦在RS曝光期间已知相机运动，该运动就可以用于调整帧。由于这种方法依赖于特征跟踪器，所以具有先前在视频稳定的情况下讨论的相同缺点。
[0038] 数字视频稳定技术可以包括修剪或缩放输入视频帧。这可以允许平移、转动或翘曲单独帧，以抵消握手造成的不想要的变形。修剪的量可以决定可用于去除这些变形的余地（或"摇摆空间")。例如，如果帧平移太远，那么空白区域（例如，没有像素数据的区域）可能可见。本公开的一些实施方式不仅通过抵消握手消除了相机运动，而且也在防止空白区域出现的同时如上消除了相机运动。应理解的是，还可以实现用于给稳定提供余地的 (而非修剪或缩放）其他方法。例如，可以实现图像修补技术，以填充由稳定造成的空白区域。代替修剪或缩放或者除了修剪或缩放以外，可以使用图像修补。例如，在一个实施方式中，可以实现用于确定规定的变形是否令人满意地通过所有像素组产生帧（无论通过图像修补、缩放、修剪等）的功能。
[0039] 通过计算满足空白区域防止约束条件的平滑相机转动，给数字上稳定的视频提供系统和方法。这可以给规定的修剪或缩放因素产生最大限度的平滑的相机转动。
[0040] 例如，数字视频稳定工艺可以通过由相机或包括相机的装置捕捉的视频开始，例如，移动电话、平板电脑、手表、可穿戴式设备等。视频可以包括所捕捉的多个连续的图像帧。由于装置的尺寸和重量，所以视频可以摇晃。在相机内的传感器使用的滚动快门可以在输出的图像帧内产生翘曲。陀螺仪可以用于在视频捕捉期间测量相机的运动（例如，转动）。所测量的相机运动可以用于稳定视频并且调整滚动快门，以产生校正了图像的具有输出帧的稳定视频。
[0041] 本公开的技术可以提高RS相机的视频质量。在一个实施方式中，实现微机电系统 (MEMS)陀螺仪，以测量相机转动。还可以实现其他陀螺仪和运动传感装置。陀螺仪测量可以用于执行视频稳定（例如，帧间运动补偿）和滚动快门校正（例如，帧内运动补偿）。这种方法可以在计算上便宜并且稳健，这就使其特别适合于在（例如）移动平台上的实时实现方式。
[0042] 基于转动摄像机和滚动快门的统一模型的系统和方法可以使用该模型来计算同时进行滚动快门校正和视频稳定的翘曲。可以提供优化技术，这些技术自动校准陀螺仪和相机。这可以允许从单个视频和陀螺仪捕捉中恢复未知的参数（例如，陀螺仪漂移和延迟）以及相机的焦距和滚动快门速度。结果，可以校准陀螺仪和相机硬件的任何组合，无需特殊的实验室设置。包括相机的装置还可以包括运动传感装置，例如，陀螺仪。例如，很多智能电话具有相机和运动传感装置，例如，陀螺仪和加速计。通过这种方式，可以提供实时视频稳定和滚动快门校正，无需使用特征跟踪器或MIS系统。而且，可以实现便宜的MEMS陀螺仪，以直接测量相机运动。惯性测量单元（MU)可以用于图像去模糊并且用于帮助KLT特征跟踪器。
[0043] 使用运动传感装置（例如，陀螺仪）允许通过高计算效率进行数字视频稳定和RS调整。甚至在照明不足或大量前景运动之下，这种方法可以稳健，这是因为视频的内容用于运动估计。而且，如上所述，很多具有相机功能的移动电话已经装有陀螺仪或其他运动传感装置。与MIS系统相比，MEMS陀螺仪可以明显更便宜、更通用并且体积更小。
[0044] 在一个实施方式中，视频稳定可以分三个阶段进行：相机运动估计、运动平滑以及图像翘曲。滚动快门调整可以通过相似的方式进行，除了实际相机运动（而非平滑运动）可以用于翘曲计算以外。如在本文中进一步详细地讨论的，可以在统一框架下在一个翘曲计算中进行视频稳定和滚动快门校正。
[0045] 在一个实施方式中，可以仅仅在转动方面模制相机运动。应理解的是，在其他实施方式中，除了或者代替转动，可以测量平移。在某些情况下，例如，平移可以难以使用MU来精确地测量。而且，加速计需要整合两次，以获得平移。相反，陀螺仪测量转动速率。因此，陀螺仪数据可以仅仅需要单

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：亚历山大·卡尔彭科;
技术所有人：脸谱公司;
我是此专利的发明人

上一篇：对sma致动装置的控制的制作方法
上一篇：用于使技能集合添加自动化的系统和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。