一种音视频同步测试的系统及方法与流程

文档序号:21083877发布日期:2020-06-12 16:45阅读:280来源:国知局
一种音视频同步测试的系统及方法与流程

本发明涉及一种音视频设备测试技术,尤其涉及一种音视频同步测试的系统及方法。



背景技术:

在新技术高速发展的今天,音视频传输是很常用的一件工具,在音视频同步传输的系统中,采用无标准接口或传输协议非标准或采取加密技术的数字端对端设备非常多,但由于当前的数字端对端设备中对于音视频数据传输所产生的延时不同,进而会出现诸如视频通话过程中唇音不同步等缺陷的产生,尤其是诸如实时远程音视频通讯等对于音视频同步性能要求较高的应用中,会大大降低音视频设备的用户体验;例如,在当前的住宅安全技术防范产品楼寓对讲系统中,当访客在楼栋门口访客呼叫机端按下房号,室内接收机端的主人在听到呼叫声音并回答时,最好能及时观看到访客的实时图像,进而以便于主人较为准确的辨别来者为谁,而为了能使室内收机端听到呼叫者声音的同时观看到呼叫者的容貌,就需要使得设备能够实现唇音同步,而一旦唇音不同步,不但会降低用户体验,同时还会使得主人无法辨别访客身份,进而带来安全隐患。

目前,为了提升所研发或测试即将推广应用的远程音视频通讯设备的音视频同步的性能,一般是采用电信号-图像信号测试方法进行测试(如唇音同步测试等),但由于其采用的诸如接口、视频设备等均可能为非标准的,所以只能采用诸如端对端的全程图像信号测试,进而会使得测试效果不甚理想,即无法准确的获取当前待测设备的音视频同步性能,从而也无法对研发的或待推广应用的产品的性能进行准备的评估。

而且,随着人对图像质量和语音质量提高,要求图像和语音的同步的同时,也希望人通过视频聊天或视频通话时的主观感受接近人与人面对面讲话,这就要就对音视频的同步做相应测试。



技术实现要素:

针对现有技术的不足,本发明提供了一种可应用于无标准接口或传输协议非标准或采取加密技术的数字端对端设备的音视频同步测试的系统及方法,该技术方案具体如下。

一种音视频同步测试的系统,其特征在于:

计算设备,分别与一视频信号发生装置、一音频发生采集仪、一相机电性连接;

所述视频信号发生装置电性连接所述相机,所述音频发生采集仪还与一麦克风和喇叭电性连接;

所述喇叭和所述视频信号发生装置临近一第一待测设备;

所述相机和所述麦克风临近一第二待测设备;

所述第一待测设备和所述第二待测设备通过网络连接;

其中,所述计算设备用于产生图形命令信号,将所述图形命令信号发送给视频信号发生装置;

所述视频信号发生装置用于根据所述图形命令信号并产生图形测试信号,同时输出一个同步触发信号给所述相机;

所述第一待测设备采集所述图形测试信号,并通过网络发送给所述第二待测设备;

所述第二待测设备用于接收所述第一待测设备发送的所述图形测试信号并显示;

所述相机用于接收同步触发信号,对所述第二待测设备进行拍摄,将拍摄获取的图像流发送给所述计算设备;

所述计算设备还用于根据所述图像流计算从所述第一待测设备采集所述图形测试信号到所述第二待测设备显示所述图形测试信号的视频延迟时间。

其特征在于:所述计算设备还用于产生一个与所述图形命令信号同步的声音命令信号发送给所述音频发生采集仪;

所示音频发生采集仪用于接收所述声音命令信号产生声音测试信号,该声音测试信号经由所述喇叭外放;

所述第一待测设备采集所述声音测试信号,并通过网络发送给所述第二待测设备;

所述第二待测设备用于接收所述第一待测设备发送的所述声音测试信号并进行播放;

所示音频发生采集仪还用于经由麦克风获取所述第二待测设备播放的声音测试信号的音频流并转发给所述计算设备;

所述计算设备还用于所述音频流计算出从所述第一待测设备采集所述声音测试信号到所述第二待测设备播放所述声音测试信号的音频延迟时间。

其特征在于:所述计算设备还用于根据所述视频延迟时间和所述音频延迟时间计算出所述第二待测设备播放所述声音测试信号的时间与播放的所述图形测试信号的时间之间的音视频时间差。

其特征在于:所述计算设备包括:

第一处理模块,分别与一第三处理模块和所述视频信号发生装置电性连接,用于产生同步的所述图形命令信号发送给所述视频信号发生装置和第三处理模块;

第二处理模块,分别与一第四处理模块、所述音频发生采集仪以及所述第一处理模块电性连接,用于产生与所述图形命令信号同步的所述声音命令信号发送给所述音频发生采集仪和第四处理模块;

所述第三处理模块,与所述相机电性连接,用于接收所述相机发送的所述图像流,根据所述图像流以及所述图形命令信号计算所述视频延迟时间,将所述视频延迟时间发送给第五处理模块;

所述第四处理模块,还与所述音频发生采集仪电性连接,用于接收所述音频发生采集仪发送的所述音频流,根据所述音频流和所述声音命令信号计算所述音频时间差,将所述音频延迟时间发送给第五处理模块;

所述第五处理模块分别连接所述第三处理模块和所述第四处理模块,根据所述视频延迟时间和所述音频延迟时间计算计算出所述第二待测设备播放所述声音测试信号的时间与播放的所述图形测试信号的时间之间的音视频时间差。

其特征在于,所述视频信号发生装置是led阵列,所述led阵列由n*m个led灯组成,其中n和m均为正整数,n表示有n行,m表示有m列,所述led灯用于根据所述图形命令信号经一预设时间间隔依次被点亮;

所述led阵列通过ttl模块产生一个同步触发信号并输出至所述相机,当所述led灯被点亮时,触发所述相机开始拍摄,当led灯被灭时,触发所述相机停止拍摄。

其特征在于,所述第一处理模块用于预先设置好图形命令信号的脉冲个数w,控制被点亮led灯的个数为w,以该w个灯依次全部被点亮为一次测试周期ts;

其中w的取值范围是2~n*m;

所述第三处理模块用于提取出最后一帧图像,对所述最后一帧图像的被点亮的led灯进行定位,假设所述最后一帧图像的被点亮的led灯是第n个,则所述视频延迟时间δta计算公式如下:

δta=(w-n)ts/(w)。

其特征在于,所述第四处理模块用于根据ts时间内已经发送的频率为fb的声音命令信号的脉冲个数与和接收的声音测试信号的脉冲个数之间个数之差假设为p,来计算所述音频延迟时间δtb,公式如下:

δtb=p/fb。

其特征在于,所述第五处理模块用于根据所述视频延迟时间δta和所述音频延迟时间δtb计算所述音视频时间差δtab,计算公式如下:

δtab=δta-δtb。

一种音视频同步测试的方法,其特征在于,使用如权利要求1所述的一种音视频同步测试的系统,该方法的步骤如下:

步骤s11,所述计算设备产生图形命令信号,将所述图形命令信号发送给视频信号发生装置;

步骤s21,所述视频信号发生装置根据所述图形命令信号并产生图形测试信号,同时输出一个同步触发信号给所述相机;

步骤s31,所述第一待测设备采集所述图形测试信号,并通过网络发送给所述第二待测设备;

步骤s41,所述第二待测设备接收所述第一待测设备发送的所述图形测试信号并显示;

步骤s51,所述相机接收同步触发信号,对所述第二待测设备进行拍摄,将拍摄获取的图像流发送给所述计算设备;

步骤s61,所述计算设备根据所述图像流计算从所述第一待测设备采集所述图形测试信号到所述第二待测设备显示所述图形测试信号的视频延迟时间。

其特征在于:步骤s12:所述计算设备产生一个与所述图形命令信号同步的声音命令信号发送给所述音频发生采集仪;

步骤s22,所示音频发生采集仪接收所述声音命令信号产生声音测试信号,该声音测试信号经由所述喇叭外放;

步骤s32,所述第一待测设备同时还采集所述声音测试信号,并通过网络发送给所述第二待测设备;

所步骤s42,所述第二待测设备接收所述第一待测设备发送的所述声音测试信号并进行播放;

步骤s52,所示音频发生采集仪经由麦克风获取所述第二待测设备播放的声音测试信号的音频流并转发给所述计算设备;

步骤s62:所述计算设备所述音频流计算出从所述第一待测设备采集所述声音测试信号到所述第二待测设备播放所述声音测试信号的音频延迟时间;

其中所述步骤s12~s62与所述步骤s11~s61同时进行。

其特征在于:包括步骤s7:所述计算设备根据所述视频延迟时间和所述音频延迟时间计算出所述第二待测设备播放所述声音测试信号的时间与播放的所述图形测试信号的时间之间的音视频时间差。

其特征在于:所述步骤s11具体为:所述计算设备的第一处理模块产生所述图形命令信号并发送给所述视频信号发生装置和第三处理模块;所述步骤s12具体为:所述计算设备的第二处理模块还产生一与所述图形命令信号同步的所述声音命令信号并发送给所述音频发生采集仪和所述计算设备的第四处理模块;

所述步骤s61具体为:所述第三处理模块接收所述相机发送的所述图像流,根据所述图像流以及所述图形命令信号计算所述视频延迟时间,将所述视频延迟时间发送给所述计算设备的第五处理模块;

所述步骤s62具体为:所述第四处理模块,接收所述音频发生采集仪发送的所述音频流,根据所述音频流和所述声音命令信号计算所述音频时间差,将所述音频延迟时间发送给第五处理模块;

所述步骤s7具体为:所述第五处理模块根据所述视频延迟时间和所述音频延迟时间计算出所述第二待测设备播放所述声音测试信号的时间与播放的所述图形测试信号的时间之间的音视频时间差。

其特征在于,所述步骤s21具体为:所述视频信号发生装置是led阵列,所述led阵列由n*m个led灯组成,其中n和m均为正整数,n表示有n行,m表示有m列,所述led灯根据所述图形命令信号经一预设时间间隔依次被点亮,并且所述led阵列通过ttl模块产生一个同步触发信号并输出至所述相机,当所述led灯被点亮时,触发所述相机开始拍摄,当led灯被灭时,触发所述相机停止拍摄。

其特征在于,所述步骤s11具体为:所述第一处理模块预先设置好图形命令信号的脉冲个数w,控制被点亮led灯的个数为w,以该w个灯依次全部被点亮为一次测试周期ts;

其中w的取值范围是2~n*m;

所述步骤s61具体为:所述第三处理模块提取出最后一帧图像,对所述最后一帧图像的被点亮的led灯进行定位,假设所述最后一帧图像的被点亮的led灯是第n个,则所述视频延迟时间δta计算公式如下:

δta=(w-n)ts/(w)。

其特征在于,所述步骤s62具体包括:所述第四处理模块根据ts时间内已经发送的频率为fb的声音命令信号的脉冲个数与和接收的声音测试信号的脉冲个数之间个数之差假设为p,来计算所述音频延迟时间δtb,公式如下:

δtb=p/fb。

其特征在于,所述步骤s7具体包括:所述第五处理模块根据所述视频延迟时间δta和所述音频延迟时间δtb计算所述音视频时间差δtab,计算公式如下:

δtab=δta-δtb。

附图说明

图1-3为本发明实施例的中音视频同步测试的系统的结构示意图。

图4为本发明的相关信号形状示意图。

图5-7为本发明的实施例的中音视频同步测试的方法流程图。

其中,1、第一待测设备,2、喇叭,3、视频信号发生装置,4、第二待测设备,5、麦克风,6、相机,7、计算设备,8、音频发生采集仪,71、第一处理模块,71、第二处理模块,73、第三处理模块,74、第四处理模块,75、第五处理模块。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。

图1-3为本发明实施例中音视频同步测试的系统的结构示意图。如图1-2所示,本实施例提供了一种音视频同步测试的系统,可应用于对传输播放音视频的待测设备(如影音设备等)的性能测试中,尤其可针对实时远程音视频通讯(例如居家安防设备中的楼宇可视对讲设备)等对于音视频同步性能要求较高的设备中进行的音视频同步性能测试,该系统可包括如下特征。

如图2所示的一种音视频同步测试的系统,包括第一待测设备1、喇叭2、视频信号发生装置3、第二待测设备4、麦克风5、相机6、计算设备7、音频发生采集仪8。其中,视频信号发生装置3分别与相机6和计算设备7电性连接,音频发生采集仪8分别与计算设备7、喇叭2和麦克风5电性连接,计算设备8还与第二待测设备4电性连接,第一待测设备1与第二待测设备2通过网络进行连接。具体的,计算设备7与音频发生采集仪8、视频信号发生装置3、相机6、第二待测设备4分别可采用usb接口进行电性连接。

具体的所述计算设备7包括至少一个处理模块,所述处理模块用于处理相关信息。

视频信号发生装置3,可临近第一待测设备1设置,以便于第一待测设备1获取该视频信号发生装置3的图形测试信号;该视频信号发生装置3可产生图形测试信号(一般可通过显示动态的光影显示信息),如可通过显示屏或led灯矩阵等来产生上述的图形测试信号。作为优选的实施方式,采用视频信号发生装置3采用led灯矩阵。视频信号发生装置3分别与相机6和计算设备7电性连接,视频信号发生装置3受控于计算设备7中的处理器,接收计算设备7的数据收发模块发出的图形命令信号从而产生图形测试信号,并且能输出一个同步触发信号发送给相机6。可以采用ttl(晶体管-晶体管逻辑电平)信号系统产生这个同步触发信号。使得视频信号发生装置3在显示图形测试信号的同时让计算机开始进行拍摄。

音频发生采集仪8连接喇叭2,从计算设备7的数据接收模块处处接收声音命令信号,并根据声音命令信号产生声音测试信号(一般可为利用喇叭模仿人的声音进行声音测试信号的生成),控制喇叭2进行播放,喇叭2同样可临近第一待测设备1,以便于该第一待测设备1采集音频信息。

第一待测设备1将获取的图形测试信号和声音测试信号通过网络发送给第二待测设备4,第二待测设备4接收图形测试信号和声音测试信号并进行播放。

具体的,由计算设备7的处理器同步产生图形命令信号和声音命令信号,经由数据收发模块分别给发送给视频信号发生装置3和音频发生采集仪8,确保视频信号发生装置3产生图形测试信号以及喇叭2播放的声音测试信号同时进行。相机6临近第二待测设备4便于对第二待测设备4进行拍照处理,视频信号发生装置3产生图形测试信号的同时输出一个同步触发信号来启动相机6进行拍摄,相机6对第二待测设备4的显示的视频信息进行拍摄,将获取的图像传输给计算设备7。具体的,相机6高速相机,相比普通相机连拍速度要快,每秒可以达到数十帧,甚至数千帧。

具体的,临近第二待测设备4的还具有一麦克风5,音频发生采集仪8经由麦克风5实时采集第二待测设备4输出的声音图形信号并传输给计算设备7的数据收发模块,数据收发模块转送给处理器。

具体的,音频发生采集仪8包括音频发生器和音频采集器,音频发生器用于根据计算设备7发送的声音命令信号来产生声音测试信号,音频采集器用于收集声音测试信号。

计算设备7的处理器控制同时产生图形命令信号和声音命令信号,并将上述信号通过接口分别发送给视频信号发生装置3以及音频发生采集仪8,并且接收相机获取的图像以及音频发生采集仪8采集的声音测试信息,从而分析计算出音频和视频的延迟信息。计算设备7的数据收发模块还用于从第二被测设备4处实时接收图形测试信号以及声音测试信号,在计算设备7中安装有音视频训练模型,计算设备根据延迟信息、图形测试信号以及声音测试信号对音视频训练模型进行训练,将训练的模型发送给被测设备例如第二待测设备灯,运用于待测设备上,使得第一待测设备1、第二待测设备2进行音频和音频的同步,视频和视频的同步,音频和视频的同步。做到接近人与人面对面讲话的主观感受,当用于楼宇等场合时,还能及时了解楼外人的肢体信息和语音信息,并能将楼内人的回应信息及时反馈给楼外人。

计算设备7包含至少一个处理模块来进行各种操作。

图2构成了一个图像声音环比系统,对音视频延迟达到测试效果。

具体的,第一待测设备1采集该图形测试信号并进行传输后输送给远程的第二待测设备4需要一段时间。所以,当楼外人做了一个动作,或者唇形发生变化时,楼内人,不能及时看见,需要搁一段时间才能看到,如果楼内人作出的回应也需要搁差不多同样的时间才能被楼外人看见。声音的传输也是如此。此外,由于声音和视频传输会存在时间上的差别,这样更加导致唇音等音视频信息不同步。当上述各个延迟时间差比较大时严重影响远程交流,体验非常差。

具体的,计算设备7包括第一处理模块71、第二处理模块72、第三处理模块73、第四处理模块74和第五处理模块75。

第一处理模块71,分别与一第三处理模块73和视频信号发生装置3电性连接,用于产生同步的图形命令信号发送给视频信号发生装置3和第三处理模块73;

第二处理模块72,分别与一第四处理模块74、音频发生采集仪8以及第一处理模块71电性连接,用于产生与图形命令信号同步的声音命令信号发送给音频发生采集仪8和第四处理模块74;

第三处理模块73,与相机6电性连接,用于接收相机6发送的图像流,根据图像流以及图形命令信号计算视频延迟时间,将视频延迟时间发送给第五处理模块75;

第四处理模块74,还与音频发生采集仪8电性连接,用于接收音频发生采集仪8发送的音频流,根据音频流和声音命令信号计算音频延迟时间,将音频延迟时间发送给第五处理模块75;

第五处理模块75分别连接第三处理模块73和第四处理模块74,根据视频延迟时间和音频延迟时间计算出第二待测设备4播放声音测试信号的时间与播放的图形测试信号的时间之间的音视频时间差。

参考图3,因此,在本发明中,作为本发明的一个实施例,计算设备7在t0时同时发出两个命令信号即图形命令信号和声音命令信号,分别控制在临近第一待测物设备1附近同时产生图形测试信号和声音测试信号,图形测试信号和声音测试信号的产生时刻可以标记为t0。

图形测试信号产生的同时触发相机6对第二待测设备4进行拍摄,相机6获取到第二待测设备4上的图形测试信号的时间时ta,那么第二待测设备4显示的图形测试信号的时间和第一待测设备1采集图形测试信号的时间相差δa=ta-t0,即延迟了ta-t0的时间。音频发生采集仪8采集的第二待测设备播放的声音测试信号的时间为tb,那么那么第二待测设备4显示的声音测试信号的时间和所述第一待测设备1开始采集声音测试信号的时间相差δb=tb-t0。进一步的,图形测试信号和声音测试信号开始播放的延迟时间为δab=ta-tb。也就是说通过将第二待测设备4获取的图形测试信号与第一待测设备实时采集图形测试信号进行比较而获取的差异信号,以及通过将第二待测设备4获取的声音测试信号与第一待测设备实时采集声音测试信号进行比较而获取的差异信号,以及第二待测设备4播放图形测试信号与播放声音测试信号进行比较而获取的差异信号,利用相关规则就能获取该音视频延时时间。可以采取t0作为基准进行时间差计算。ta、tb、t0时间单位均相同。若δa、δb、δab的值为零,表示音视频、音音频、视视频同步。相应的,就会判定输出的音视频同步性能参数为音视频、音音频、视视频同步性能最优参数。如果δa、δb、δab不为零,则表示视频延迟δa的时间到达,音频延迟δb的时间到达,就需要进行同步性能参数的优化。

根据上述时间差异进行音视频同步性能判断,进一步的进行音视频同步模型训练便可以达到音频和音频、视频和视频、音频和视频的同步,让楼内人和楼外人等人与人之间的交流可以面对面的交流体验。

作为本发明的一种实施例,请参阅图3,计算设备7包括第一处理模块71、第二处理模块72、第三处理模块73和第四处理模块74。

第一处理模块71,用于产生同步的图形命令信号和声音命令信号,并将图形命令信号发送给视频信号发生装置3和第二处理模块72,将声音命令信号发送给音频发生采集仪8和第三处理模块73;

所述第二处理模块72,分别与第一处理模块71和所述相机6电性连接,用于接收相机6发送的图像流,根据图像流以及图形命令信号计算视频延迟时间,将视频延迟时间发送给第四处理模块74。

第三处理模块73,分别与第一处理模块71和所述音频发生采集仪8电性连接,用于接收音频发生采集仪8发送的音频流,根据音频流和声音命令信号计算音频时间差,将音频延迟时间发送给第四处理模块74;

第四处理模块74分别电性连接所述第二处理模块72和所述第三处理模块73,根据视频延迟时间和音频延迟时间计算计算出第二待测设备4播放声音测试信号的时间与播放的图形测试信号的时间之间的音视频时间差。

进一步的,第一待测设备包含用于采集图形测试信号的图像采集单元例如以及用于采集声音测试信号的音频采集单元。

作为本发明的其中一个实施例,优选的,上述led图形发生器可包括至少一行沿直线排列的n个led灯(如n*n的led灯阵列,可选一行led灯作为测试使用);且n个led灯沿其延伸的同一方向上以频率f依次点亮每个led灯,且每个led灯的点亮时间可为1/(n*f),或者可以以频率f从左到右从上到下的顺序依次点亮n*m个led灯,每个灯点亮的时间为1/(n*n*f),每一个灯都受控于计算设备7中的处理装置。

相机6优选采用高速相机,高速相机,相比起普通相机,高速相机具有高图像稳定性、高传输能力和高抗干扰能力。

作为本发明的更加简单的一个实施例,假设选取一个n*m的led灯阵列作为测试,灯被点亮是一半是处理装置发送的一个高电平指令,灯灭的表示低电平,同步触发信号采用ttl电平对相机6进行触发。处理装置在一个周期ts发送一串具有高低电平(例如高电平是5v,低电平是0)的第一方波指令信号给视频信号发生装置3,按顺序依次点亮led灯,在此过程中需要合理设置一个高电平和低电平的持续时间,即通过设置确保每一个被点亮的led灯有一个肉眼可见的保持亮度的时间,适当降低低电平的持续时间确保在人眼看来led灯在视频信号发生装置3上呈现连续滚动的图形。当发送n*m方波信号之后即n*m个led灯一次被点亮,处理装置停止发送图形命令信号,此时相机6停止拍摄,且相机6在拍摄过程中已经将拍摄图像传输给计算设备7。计算设备7中的处理装置提取最后一张拍摄图像并对图像中的被点亮的led灯进行定位,定位方式例如可以通过按灯被点亮的顺序查找计数等常用方式来进行,只要能够准确计算出第几个灯被点亮即可。

设处理装置定位出是第n个led灯被点亮,则根据如下公式计算视频之间的延迟时间:

δta=(n*m-n)ts/(n*m);

其中ts表示点亮完n*m个led灯的一个周期时间。该时间可以由计算设备7提前设定。

以上是视频从发送到接收的延迟时间,即视频与视频之间的延迟时间。

作为本发明的一个具体实施方式,下面是本发明计算声音的延迟时间的方式。

处理装置在产生图形命令信号的同时也产生声音命令信号,声音命令信号以fb频率的第二方波命令信号的形式发送给音频发生采集仪8,同时处理装置接收被采集回来的声音测试信号,将二者进行比较,计算出发出的命令信号和接收的测试信号之间方波个数之差,例如为p个,则发送的音频与接收的音频延迟时间用如下公式计算:

δtb=p/fb。

由于声音命令信号和图形命令信号同时发出,二者共同具有一个时间基础。所以音频和视频之间的时间差为:

δtab=δta-δtb。

需要注意的是,没完成一次音视频同步测试之间预留足够的时间再启动下一次测试确保不被信号干扰。进行多次测试不断优化参数进行模型训练将各个延迟时间控制在一个可以接受的范围之内。第一方波信号和第二脉冲信号其实就是脉冲信号。

具体的,优选的,相邻的led灯之间点亮的频率f的值应大于或等于人眼所能分辨的帧率的值,且图像采集单元的采集图形的帧率的值也要大于频率f的值,否则就无法采集图形了。

进一步的喇叭2是仿真嘴,以对音频信号发生器生成的声音测试信号进行均衡,且声音采集单元采集均衡后的声音测试信号。

结合图1,若以楼宇之间的对话通讯为例,故在待测楼宇可视对讲设备两个安装在挡板上的免提终端分别作为第一待测设备1和第二待测设备4。

仿真嘴和第一待测设备1之间的距离大于或等于10cm且小于50cm(以避免距离近而导致干扰,距离远又使得第一待测设备1无法收集足够的声音进行测试,具体的值可依据实际设备的性能参数及测试需求而设定)。

为了阐述简便,下面就以一路音频延时测试进行说明,即控制利用音频发生采集仪生成包括多组(如四组)css(compositesourcesignal,合成源信号)信号的测试单元信号,其中前几组(如前三组)css信号可用于训练以使得信道传输到达正常状态,测试信号之后发送一组css信号的持续高电平信号部分用于延时测量;优选的,每组css信号的脉宽为248.62ms,相邻的css信号间隔101.38ms,这样每个测试单元信号长度为1298.62ms(上述具体的数值可依据实际测试需求而适应性的调整,在此仅作为示例进行说明)。

在对楼宇可视对讲设备进行上述音视频同步性能测试时,进行音频延时测试时测试境噪声不应超过40db,而在进行视频延时测试,eut(equipmentundertest,受试设备)即可视对讲设备应处于正常图像传输状态,且当eut的音频通讯不能切断需要进行音视频同步测试时则必须保证其相互之间不会引起视频特性参数和/或音频特性参数的改变。例如,在进行视频帧率、视频延时、唇音同步测试可使用led图像发生器作为信号源,而led图像信号发生器则应置于视频捕捉设备的正前方,并可通过调整led矩阵与视频接受设备之间的距离使得视频接受设备屏幕上。上的led矩阵图像在横轴或纵轴上充满屏幕,且视频接受设备屏幕上的图像还需应能聚焦。优选的,上述led图形发生器可由10×10的led阵列和编程控制器组成,该led阵列可被用于产生测量用的图形图案,即可以单个led为基本单元,在纵向或横向通过依次点亮每个led灯以使得呈现的图像做连续滚动,led灯受计算设备7发射的脉冲指令一次被点亮。

在实施本发明的计数方案时,应当尽量调试参数设备,使得图形测试信号和声音测试信号尽量同时发出。

作为本发明中的一个实施例,视频信号发生装置3除了时led阵列之外,还可以是一个显示器,该显示器显示一个a*b阵列图形元素例如圆形、矩形等不等,根据图形命令信号依次标记图形元素,特别的,用颜色来标记图形元素使之与未被标记的图形元素颜色明显不同。相机拍摄a*b阵列图形元素之后发送给计算设备7,计算设备对被标记的图形元素进行定位。即将上述方案中的led阵列替换为带有阵列图形元素的显示器,同样能分析计算出延迟时间。

此外,采用上述音视频同步测试系统,本发明还提供了一种音视频同步测试方法,具体步骤如下。

请参阅图1-6,具体参阅图5-7。一种音视频同步测试的方法,该方法的步骤如下。

步骤s11,计算设备7产生图形命令信号,将图形命令信号发送给视频信号发生装置3。

步骤s21,视频信号发生装置3根据图形命令信号并产生图形测试信号,同时输出一个同步触发信号给相机6。

步骤s31,第一待测设备1采集图形测试信号,并通过网络发送给第二待测设备4。

步骤s41,第二待测设备4接收第一待测设备1发送的图形测试信号并显示。

步骤s51,相机6接收同步触发信号,对第二待测设备4进行拍摄,将拍摄获取的图像流发送给计算设备7。

步骤s61,计算设备7根据图像流计算从第一待测设备1采集图形测试信号到第二待测设备4显示图形测试信号的视频延迟时间。

进一步的,作为本发明的另一个实施例,还包括如下步骤。

步骤s12:计算设备7产生一个图形命令信号同步的声音命令信号发送给音频发生采集仪8。

步骤s22,音频发生采集仪8接收声音命令信号产生声音测试信号,声音测试信号经由喇叭2外放;

步骤s32,第一待测设备1同时还采集声音测试信号,并通过网络发送给第二待测设备4;

所步骤s42,第二待测设备4接收第一待测设备1发送的声音测试信号并进行播放;

步骤s52,音频发生采集仪8经由麦克风5获取第二待测设备4播放的声音测试信号的音频流并转发给计算设备7;

步骤s62:计算设备7根据音频流计算出从第一待测设备1采集声音测试信号到第二待测设备4播放声音测试信号的音频延迟时间;

其中步骤s12~s62与步骤s11~s61同时进行。

进一步的,本发明的另一种实施方式,还包括步骤s7,计算设备7根据视频延迟时间和音频延迟时间计算出第二待测设备4播放声音测试信号的时间与播放的图形测试信号的时间之间的音视频时间差。

进一步的,步骤s11具体为:计算设备7的第一处理模块71产生图形命令信号并发送给所述视频信号发生装置3和第三处理模块73。

进一步的,步骤s12具体为:计算设备7的第二处理模块72还产生一与图形命令信号同步的声音命令信号并发送给音频发生采集仪8和计算设备的第四处理模块74;

进一步的,步骤s61具体为:第三处理模块73接收相机6发送的图像流,根据图像流以及图形命令信号计算视频延迟时间,将视频延迟时间发送给计算设备的第五处理模块75;

进一步的,步骤s62具体为:第四处理模块74,接收音频发生采集仪8发送的音频流,根据音频流和声音命令信号计算音频延迟时间,将音频延迟时间发送给第五处理模块75;

步骤s7具体为:第五处理模块75根据视频延迟时间和音频延迟时间计算出第二待测设备4播放声音测试信号的时间与播放的图形测试信号的时间之间的音视频时间差。

步骤s21具体为:视频信号发生装置3是led阵列,led阵列由n*m个led灯组成,其中n和m均为正整数,n表示有n行,m表示有m列,led灯根据图形命令信号经一预设时间间隔依次被点亮,并且led阵列通过ttl模块产生一个同步触发信号并输出至相机,当led灯被点亮时,触发相机6开始拍摄,当led灯被灭时,触发相机6停止拍摄。

进一步的,步骤s11具体为:第一处理模块71预先设置好图形命令信号的脉冲个数w,控制被点亮led灯的个数为w,以该w个灯依次全部被点亮为一次测试周期ts;

其中w的取值范围是2~n*m;

进一步的,步骤s61具体为:第三处理模块73提取出最后一帧图像,对最后一帧图像的被点亮的led灯进行定位,假设最后一帧图像的被点亮的led灯是第n个,则视频延迟时间δta计算公式如下:

δta=(w-n)ts/(w)。

进一步的,步骤s62具体包括:第四处理模块74根据ts时间内已经发送的频率为fb的声音命令信号的脉冲个数与和接收的声音测试信号的脉冲个数之间个数之差假设为p,来计算音频延迟时间δtb,公式如下:

δtb=p/fb。

进一步的,步骤s7具体包括:第五处理模块75根据视频延迟时间δta和音频延迟时间δtb计算音视频时间差δtab,计算公式如下:

δtab=δta-δtb。

在本发明中,计算设备7可以多次发送同步的图形命令信号和声音命令信号多次测量数据,但是,每一次之间需要保证足够的时间间隔避免相互之间的干扰影响测量效果。

以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1