唇形同步系统和方法

文档序号：7676659阅读：750来源：国知局

专利名称：唇形同步系统和方法
技术领域：
本发明一般涉及唇形同步领域，具体地讲，涉及一种用于测量并校正音频信号和
视频信号之间的时间差的系统。
背景技术：
当广播信号被再现，被从源格式转换成输出格式，或者以其它方式被处理时，除非注意保持音频和视频的同步，否则信号的视频部分的定时就会偏离音频信号的定时。由于当广播信号包含人说话的表现时广播信号的观看者经常会发觉时间差(time differential)，所得到的差经常被称作"lip sync (唇形同步)"误差；所说词语的声音与说话者的唇动作不再"同步"。这个问题不但在消费设备中会遇到，而且在商业广播信号处理设备中也会遇到。通常，因为唇形同步误差损害观看者的体验，所以期望减少(如果消除不了的话)唇形同步误差。当视频信号落后于音频信号时，通常通过将音频信号延迟预定量来实现唇形同步误差的减少。在特定处理条件下，音频可能落后于视频信号，所以随后将不得不延迟视频信号。以前，用来减少信号的音频部分和视频部分之间的定时误差的方法包括基于由操作者的观察而确定的延迟因素的手动调节，或者基于先前确定的延迟因素的自动调节。手动测量和调节的缺点在于它是基于人所感觉的延迟；因为相对于唇形同步误差，各人会具有不同的感觉阈值，所以手动确定的校正可能不适当。现有技术的按照预定因素来自动延迟音频的方法通常基于在处理过程中视频信号的预期延迟而采用任意延迟因素。这是一个不适当的方案，因为音频信号和视频信号可能会路经多个装置，或者可能经过在确定该任意因素时未知的多个处理步骤。每个附加装置或步骤都会对最终的唇形同步误差产生影响。具体地讲，当使用可以提供在多种广播信号格式之间的多个信号路径和转换的多功能装置来处理广播信号时，延迟因素是不可预测的。其它现有技术的检测唇形同步误差的方法包括插入与音频"pip"(机器可察觉的信号)同步的视频信号，并检测视频信号和音频信号；然而，这些现有技术的方法需要专门的设备，此外，唇形同步检测信号不能满足数字广播信号处理的需求。因此，期望提供一种不需要专门设备的用来测量信号路径中的唇形同步误差的系统和方法。还期望提供一种足够鲁棒(robust)从而能够经受住数字广播环境的困难情况的唇形同步误差测试信号，该数字广播环境包括格式之间的上变换、下变换和交叉变换、模数变换、数模变换以及压縮。

发明内容
因此，提供了一种同步测试信号，包括视频信号，包括被消隐期中断的非黑信号；和音频信号，包括被与所述消隐期同步的静音期中断的音调(tone)。还提供了一种同步测试信号，包括视频信号，包括被消隐期周期性地中断的非黑信号；和音频信号，包括被与所述消隐期同步的静音期周期性地中断的音调。
在另一方面，还提供了一种用来测量视频信号和音频信号之间的感生时间差的系统，该系统包括同步测试信号发生器，用来产生上面描述的同步测试信号；输出部，用来将所述同步测试信号发送到广播系统或网络；和检测模块，用来从所述广播系统或网络接收所述同步测试信号，检测所述非黑信号和所述音调，并测量所述非黑信号和所述音调之间的感生时间差。还提供了一种用来测量视频信号和音频信号之间的感生时间差的系统，在该系统中，检测模块被配置成从所述广播系统或网络接收所述同步测试信号，检测所述消隐期和所述静音期，并测量所述消隐期和所述静音期之间的感生时间差。
还提供了一种用来测量视频信号和音频信号之间的感生时间差的方法，该方法包括以下步骤产生上面描述的同步测试信号；通过传输系统传递所述同步测试信号；接收所述同步测试信号；将接收到的同步测试信号中的消隐期和静音期的相对定时进行比较，以确定感生时间差。在另一实施例中，该比较步骤是这样的步骤将接收到的同步测试信号中的非黑信号和音调的相对定时进行比较，以确定所述感生时间差。

根据本发明的优选实施例图la是实现唇形同步测试信号发生器和检测器的多径、多功能广播信号处理器的高级框图。图lb是包括两个图la的处理器的唇形同步误差校正系统的高级框图。图2是唇形同步测试信号的时基示意图。图3是用来校正所谓的唇形同步误差的方法的框图。图4是利用对唇形同步测试信号的记录来测量所谓的唇形同步误差的系统的示意表示。图5是用于测量传输系统中的所谓的唇形同步误差的系统的示意表示。
具体实施例方式
虽然本发明是在提供针对模拟和数字广播信号的处理功能的多功能广播信号处理器的上下文中描述的，但是本领域的技术人员应该明白，本发明可以在许多可操作的环境下实施，这些环境包括数字和模拟电视工作室、混合设施及诸如纯高清电视(HDTV)环境或串行数字接口 (SDI)环境的单一格式视频制作环境。如下所述的本发明可以同等在单独的处理装置中实施。参照图la，广播信号源通过分别代表视频输入和音频输入的一个或多个输入部 101和102将音频和视频信息馈送给实现了唇形同步测试信号发生器和检测器的处理器 50，其中该广播信号源可以包括相机和/或麦克风、直播馈源或者诸如录像带、盘或其它数据存储单元的其它音频/视频源。处理器50优选地提供标准清晰度广播信号处理和HDTV转换，具有上变换、下变换和从多数输入视频格式到多数输出视频格式的交叉变换的能力。优选地，处理器50设置有多个输入连接101和102及多个输出连接103和104，这些连接与诸如光纤HDTV、同轴线缆 HDTV、 SDI、模拟视频(Betacam(R)) 、 S-视频和RGB-S、 NTSC、 PAL-M、 PAL-B和SECAM复合输入、用于流传输縮略图的以太网、DVI-D等的视频格式兼容，以及与模拟和数字音频信号兼
4容。处理器50优选地被配置成将上述输入格式中的任何一种与输出格式中的任何一种桥接。用户接口 60可以设置在处理器单元50本身上或者优选地通过有线或无线网络连接而设置到个人计算机或其它输入装置70，该用户接口 60提供对处理器50的功能的手动和自动控制，例如用来配置任一输入格式和任一输出格式之间的桥接，该用户接口 60还提供对由处理器50执行的本领域公知和实施的标准视频和音频处理和编辑功能的用户控制，所述标准视频和音频处理和编辑功能包括颜色和色调控制、噪声降低、模数转换、数模转换、帧同步、时基校正、上/下变换、交叉变换、解压縮和对诸如Dolby E 和AC-3 的嵌入式音频信号的处理、配音以及通常在广播信号处理中需要的其它功能。优选地，处理器50 还能够在任何上变换/下变换/交叉变换处理期间按照需要对任何嵌入的元数据(诸如隐藏式字幕)进行变换。可以在软件或硬件中适当地实现这些功能，被配置成提供这种功能的组件通常是本领域所公知的，如变换/编解码模块130所示。由于对音频信号和视频信号的变换、编码和解码处理不同，所以音频信号和视频信号通常被模块130来分别处理。
在优选的实施例中，处理器50包括唇形同步测试信号发生器IOO，该唇形同步测试信号发生器100包括视频测试信号发生器110和音频测试信号发生器120。根据运动图像和电视工程协会(SMPTE)以及其它标准和用户定制的测试图案，视频测试信号发生器IIO 被配置成在将包括级别为100%和更低级别(诸如75%)的彩条的视频测试图案注入到处理器50内的视频信号路径中。音频测试信号发生器120被配置成沿着处理器50内的音频信号路径以预定的或用户定制的频率产生恒定音调或周期音调。处理器50还设置有使用本领域公知的技术将延迟引入到音频信号中的装置。一个优选的装置包括音频数据缓冲器140，该音频数据缓冲器140用于存储音频数据并且响应于定时信号再现要通过音频输出部104输出的音频数据。在又一优选的实施例中，处理器50还包括视频数据缓冲器135，视频数据缓冲器135用于存储视频数据并响应于定时信号再现要通过视频输出部103输出的该数据。处理器50还包括定时源，该定时源可以是内部源150或外部源(未示出)。这些缓冲器135、 140可以包括在通过输出部103和104 输出之前将延迟引入到视频信号或音频信号中的其它功能块或装置，但是在优选的实施例中，数字视频和音频信息被缓冲。如果在视频和/或音频信号中不需要延迟，则可以将信号从下面描述(未示出连接)的检测模块160直接传送到输出部103、 104。
检测模块160被插入在输入部101、102与输出部103、104之间，(优选地为输入部101、 102与缓冲器135、 140之间)的视频和音频信号路径中，检测模块160优选地从输入部101U02接收视频和音频信号。检测模块160包括视频信号检测块162和音频信号检测块164，它们分别在视频信号和音频信号中扫描下面所描述的唇形同步测试信号，并确定应当将什么延迟因素引入到音频信号或视频信号中以校正定时误差。在优选的实施例中，视频测试信号发生器110可被配置，最优选地可通过用户接口60来配置，以提供由被消隐期(blackout period)周期性中断的恒定非黑信号组成的视频信号，所述消隐期包括至少一个消隐帧或一系列的连续消隐帧。优选实施例中的消隐帧是一视频帧，该视频帧包括有效视频中的至少一行，该有效视频由在检测模块160处被定义为"黑色"的足够黑的信号组成。例如，除了从这行的有效部分的开始和结束起的5%之外，这行的剩余有效部分优选地由容限在5%内的黑信号组成，从而允许在检测模块160接收信号之前噪声被引入到信号中。虽然一帧内的单个限定的黑行足以用于消隐帧，但是在其它实施例中，可以将几行设置为黑；例如，消隐帧可以被定义为在5%的容限内视频信号的有效部分中的每行的至少75%可以为黑色的帧。相反，非黑信号是在信号的有效部分中不包含限定的黑行的视频信号。更优选地，非黑信号包括这样的视频信号，其中信号的有效部分中的每行不超过50%为黑色，并且有效部分中的每行的剩余部分由强度为信号的全幅的至少75%的彩色信号组成。在最优选的实施例中，由视频测试信号发生器110提供的非黑信号为全(100%)强度SMPTE彩条测试信号。在优选实施例中，视频测试信号发生器110 生成对一系列非黑信号帧与一系列连续消隐帧进行周期性排序而得到的信号。更优选地，以三秒的间隔将消隐期插入到非黑信号中，消隐期具有至少两帧的持续时间。因此，消隐期由一系列的至少两个连续消隐帧组成。图2中的视频信号的示意性表示描绘了在3Hz的插入频率下的三个连续帧的消隐期。然而，更优选地，使用一系列的六个连续消隐帧。唇形同步测试信号的视频部分可以包括较长的视频消隐期，只要在一个间隔内的至少一个视频帧 (更优选地为至少两个视频帧)包括非黑信号即可。音频测试信号发生器120可被配置成提供在20Hz至20000Hz的范围内的固定频率的音调，所述音调具有与插入到由视频测试信号发生器产生的信号中的消隐帧同步的周期性静音期。因此，例如，如果这一系列的连续消隐帧每3秒被插入到非黑视频信号中，则同样每3秒插入静音期。更优选地，虽然众所周知不必规定静音期和消隐帧之间的时间相关性，但是音频静音期的插入被定时为对应于针对视频信号进行的消隐帧的插入，如图2 的示例中所示。在图2中可以看出，音频静音期与该一系列连续消隐帧(图2中的阴影帧) 中的第一帧同时开始。更优选地，使用与单个视频帧的持续时间相同的静音期。因而，例如，在大多数数字电视环境下，音频静音期将具有大约30毫秒至45毫秒的持续时间。假如在每一间隔内的音调的时长至少是单个视频帧的持续时间，静音期就可以是更长的持续时间。视频测试信号发生器110和音频测试信号发生器120的定时优选地通过诸如内部定时源150的单个定时源来控制。这个视频信号和音频信号一起提供唇形同步测试信号。更优选地，测试信号发生器110U20被配置成以模拟格式和数字格式输出测试信号。由于唇形同步测试信号能够经得起在通常的网络或广播分布配置中对视频或音频数据的编码、解码、压縮、解压縮或变换，因而唇形同步测试信号是鲁棒的，并且唇形同步测试信号不会被现代压縮技术剪除或消除，现代压縮技术通常会剥除多余数据或阈下信号。这里提供的唇形同步测试信号例如提供优于水印或消隐间隔技术的优点，在这些技术中，将额外的数据插入到垂直消隐间隔中。当利用MPEG标准对视频编码时经常去除这样的额外数据，所以不能使用这些额外数据来测量由MPEG编码引入的唇形同步误差。参照图lb和图3，为了在处理来自源20的广播信号之前，测量在给定的网络配置或传输系统500中的定时或"唇形同步"误差，在步骤310，用户将配置网络配置或传输系统500来处理广播信号。该网络或系统可以包括从SDTV到HDTV的上变换、杜比E编码和 MPEG压縮。另选地，该路径可以包括数模压縮或模数压縮，或者能让模拟视频和音频信号通过而不将它们转换成数字格式。然后，用户将第一处理器50a配置为进入测试模式来测量唇形同步误差。在这种测试模式下，第一处理器50a中的视频测试信号发生器110(未示出)和音频测试信号发生器120 (未示出)将被配置成产生如上所述的唇形同步测试信号，并在步骤320通过系统或网络500发送该信号。在步骤325由第二处理器50b来接收唇形同步测试信号，从而由第二处理器50b的检测模块160(未示出)来检测该信号。在被第二处理器50b接收时，唇形同步测试信号中的视频信号可能落后于音频信号(典型的唇形同步误差)，这可以通过音频无声期和视频中的消隐期的检测值之间的时间差来确定。在步骤 330，测量这个包括唇形同步误差的时间差。检测器160在音频信号中扫描静音期，并识别该静音期的时间索引；检测器160还在视频信号中扫描消隐帧，并识别与该消隐帧相关的时间索引。时间差是由此识别的时间索引的差。可能有音频信号落后于视频信号的情况；第二处理器50b的检测器160同样可以被配置成测量该时间差。优选地，检测器160提供音频信号是落后于还是领先于视频信号的时间差测量。如果在唇形同步测试信号中，静音期和消隐期的开始被同步成在发生器100处既不落后又不领先于另一方，那么由检测模块160测量的时间差将优选地是在检测模块160 检测到的静音期和消隐期的开始之间的时间差。如果静音期和消隐期以另外的方式被同步为使得这些时段的开始并不一致而是以另外的方式在时间上相关(例如，静音期可能被配置成落后于消隐期固定数目的帧)，那么优选地，由检测模块160测量的时间差将是由检测模块160测量的静音期和消隐期之间的时间相关性与在发生器IOO处的静音期和消隐期之间的原始时间相关性之间的时间差。如果静音期和消隐期是以使这些时段的开始不一致的方式进行同步的，那么优选地，检测模块160将配置有用于存储关于静音期和消隐期之间的原始时间相关性的信息的装置，例如存储在集成电路存储器元件中，从而该信息可供检测模块160用来确定时间差。在一另选实施例中，优选地通过将代码或信号插入到视频或音频信号的有效部分中，或者通过变更非黑信号或音调，唇形同步测试信号可以被编程有关于静音期和消隐期之间的落后的数据，或者被编程有关于静音期和消隐期之间的领先的数据；然后，检测模块160将被配置成进一步检测该代码或信号，并将该代码或信号与定时信息相关以确定时间差。由于该实施例增加了唇形同步测试信号的复杂性，所以该实施例并不是非常期望的。假如检测器160接收到一个完整周期(在优选的实施例中为3秒)的唇形同步测试信号，就可以相当快地完成时间差测量。因此，在步骤320，可以在视频测试信号处理器 IIO和音频测试信号处理器120接合的大约五秒内测量唇形同步误差。因此，在一个实施例中，唇形同步测试信号可以包括被一个消隐期中断的非黑视频信号和被一个静音期中断的音频音调，而不是被周期性的消隐期中断的视频信号和被周期性的静音期中断的音频信号。在一另选实施例中，检测器160可以对唇形同步测试信号进行几次测量，以确定平均唇形同步误差，。在又一实施例中，检测器160可以在视频信号中扫描非黑信号，并在音频信号中
扫描音调。如果发生器ioo被配置成产生具有在相同的时间索引开始的非黑信号和音调的
信号，那么由检测模块160测量的时间差优选地是检测到的音调的开始和非黑信号的开始之间的时间差。否则，由检测模块160测量的时间差将优选地是由检测模块160测量的音调的开始和非黑信号的开始之间的时间相关性与在发生器100处的音频音调和非黑信号之间的原始时间相关性之间的时间差。类似地，在又一实施例中，在对这些时段和信号之间的时间相关性给予类似考虑的情况下，检测器160可以在视频信号中扫描非黑信号并在音频信号中扫描静音期，或者在视频信号中扫描消隐期并在音频信号中扫描音调。
在最优选的实施例中，已确定了时间差的检测器160将该数据提供给第二处理器 50b的音频数据缓冲器140(未示出)或视频数据缓冲器135(未示出)。然后，在步骤340，缓冲器140或135被配置成引入等于该时间差的延迟，以使视频信号和音频信号的定时相等。如果确定视频信号落后于音频信号，那么音频缓冲器140将被配置成延迟音频信号。一旦配置了缓冲器140或135，就可以去除第一处理器50a，并且在步骤350，来自源20的广播信号可以被直接提供给接收处理器50b ;另选地，可以留下第一处理器50a以与源20和网络500通信，但是第一处理器50a仅作为通道而工作。参照图4，可以利用单个处理器50测量并校正唇形同步误差。将唇形同步测试信号从处理器50中的测试信号发生器110、120直接输出到服务器或传送器400。然后，记录的唇形同步测试信号被带入到网络连接或传输系统，并通过该连接或系统进行回放以被另一或同一处理器50接收，在该处理器中检测并测量唇形同步测试信号的音频部分和视频部分之间的任何时间差。另选地，上面描述的唇形同步测试信号和系统可以用来评估存储装置或记录/回放传送器(例如文件服务器或带传送器)的相对的视频对音频的定时。
类似地，参照图5，单个处理器50可以利用唇形同步测试信号来评估外部传输系统500的相对的视频对音频的定时，外部传输系统500可以包括外部处理器、网络连接和另外的发射机和接收机。传输系统500回接到处理器50的输入，该处理器50被配置成将接收到的信号直接传递回检测模块160。唇形同步测试信号被发送到传输系统500，并最终被检测模块160接收，然后检测模块160可以确定由传输系统500造成的唇形同步测试信号的音频部分和视频部分之间的任何时间差。应该理解，信号处理电路或软件的一些或全部可以包含在包括测试信号发生器 110、 120和检测模块160的同一模块130内，或者另选地，处理器50可以不包括用来编码/ 解码、变换或压縮的模块130，而是可以只用作具有信号发生器110、120、检测模块160和缓冲器135、 140的唇形同步测试信号发生器和唇形同步误差检测和校正单元。在又一实施例中，本领域技术人员应该理解，唇形同步误差校正处理器单元可以只包括具有合适的输入部、输出部和定时块的检测模块160和缓冲器135、 140，以用作唇形同步误差检测和校正单元，同时单独的唇形同步信号发生器单元可以包括合适的输入部、输出部和唇形同步信号发生器IOO，而没有检测模块160。
权利要求
一种同步测试信号，包括视频信号，包括被消隐期中断的非黑信号；和音频信号，包括被与所述消隐期同步的静音期中断的音调。
2. —种同步测试信号，包括视频信号，包括被消隐期周期性地中断的非黑信号；禾口音频信号，包括被与所述消隐期同步的静音期周期性地中断的音调。
3. —种用来测量视频信号和音频信号之间的感生时间差的系统，该系统包括同步测试信号发生器，用于产生如权利要求1或权利要求2之一所述的同步测试信号；输出部，用于将所述同步测试信号发送到广播系统或网络；禾口检测模块，用于从所述广播系统或网络接收所述同步测试信号，检测所述非黑信号和所述音调，并测量所述非黑信号和所述音调之间的感生时间差。
4. 一种用来测量视频信号和音频信号之间的感生时间差的系统，该系统包括同步测试信号发生器，用于产生如权利要求1或权利要求2之一所述的同步测试信号；输出部，用于将所述同步测试信号发送到广播系统或网络；禾口检测模块，用于从所述广播系统或网络接收所述同步测试信号，检测所述消隐期和所述静音期，并测量所述消隐期和所述静音期之间的感生时间差。
5. —种用来测量视频信号和音频信号之间的感生时间差的方法，该方法包括以下步骤产生如权利要求1或权利要求2之一所述的同步测试信号；通过传输系统传递所述同步测试信号；接收所述同步测试信号；以及将接收到的同步测试信号中的所述消隐期和所述静音期的相对定时进行比较，以确定所述感生时间差。
6. —种用来测量视频信号和音频信号之间的感生时间差的方法，该方法包括以下步骤产生如权利要求1或权利要求2之一所述的同步测试信号；通过传输系统传递所述同步测试信号；接收所述同步测试信号；以及将接收到的同步测试信号中的所述非黑信号和所述音调的相对定时进行比较，以确定所述感生时间差。
全文摘要
本发明涉及唇形同步系统和方法。提供了一种利用包括视频信号和音频信号的同步测试信号来校正所谓的“唇形同步”误差的系统和方法，其中，视频信号包括被一系列连续定义的黑帧周期性地中断的彩条信号，音频信号包括被与这一系列的连续定义的黑帧中的第一帧同时开始的静音期周期性地中断的音调。同步测试信号被配置成经受得住在典型的数字广播系统环境下使用的编码、解码、变换和压缩处理，因而提供了一种测量处理后的信号的相对的音频和视频定时的装置。提供了一种用来校正唇形同步误差的方法，包括接收同步测试信号，将同步测试信号的视频部分和音频部分的相对定时与它们的原始相对定时进行比较，根据从接收到的测试信号得出的定时比较结果来延迟广播信号的音频部分或视频部分。
文档编号H04N17/00GK101796812SQ200780015616
公开日2010年8月4日申请日期2007年3月23日优先权日2006年3月31日
发明者C·伊普, D·王, S·拉姆申请人:莱切技术国际公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｄ.王;Ｃ.伊普;Ｓ.拉姆
技术所有人：莱切技术国际公司
我是此专利的发明人

上一篇：照明光通信装置的制作方法
上一篇：接入网络中网络层处的接入终端的越区切换的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。