一种视频处理方法、视频处理装置与流程

文档序号:28739158发布日期:2022-02-07 21:21阅读:75来源:国知局
一种视频处理方法、视频处理装置与流程

1.本发明涉及视频处理技术领域,具体涉及一种视频处理方法、视频处理装置。


背景技术:

2.视频(video)泛指将一系列静态影像以电信号的方式加以捕捉、记录、处理、储存、传送与重现的各种技术,连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面;看上去是平滑连续的视觉效果,这样连续的画面叫做视频,视频技术最早是为了电视系统而发展,但现在已经发展为各种不同的格式以利消费者将视频记录下来,网络技术的发达也促使视频的纪录片段以串流媒体的形式存在于因特网之上并可被电脑接收与播放,视频与电影属于不同的技术,后者是利用照相术将动态的影像捕捉为一系列的静态照片。
3.针对于现有技术中人们通过人工手段对视频进行后期的处理为视频添加字幕,其添加字幕的软件、程序较为复杂且多元化,这使得一些日常工作中有类似的部分需求的用户无法操作又或是操作困难耗时较长,从而因此影响到了相关用户的工作效率。


技术实现要素:

4.解决的技术问题针对现有技术所存在的上述缺点,本发明提供了一种视频处理方法、视频处理装置,解决了现有技术中没有一种简单的方便操作的系统、方法用于视频的后期字幕添加,其相关技术所需软件多元化、具有较强的专业性,无法被人们普遍使用的问题。
5.技术方案为实现以上目的,本发明通过以下技术方案予以实现:第一方面,一种视频处理方法,包括以下步骤:step1:获取视频文件,分析视频文件属性,从视频文件属性中判断视频文件格式,选择默认视频转化格式;step2:将获取到的视频文件以默认视频格式转化,获取视频文件属性,分析视频文件特征;step3:根据视频文件特征捕捉视频文件中声频文件内容,在未捕捉到声频文件后结束;step4:根据视频文件特征捕捉视频文件中声频文件内容;step5:分析视频文件帧率,获取视频文件帧率下单帧画面图片;step6:将声频文件中声频起始时间与获取到的单帧画面图片对应;step7:捕捉视频文件中虚拟活体开口动画所在的单帧画面图片;step8:提取相应视频文件中虚拟活体开口动画所有单帧画面图面,将声频文件与所有单帧画面图片相对应;step9:建立语言数据库,将声频文件内容传输至语言数据库中进行翻译,获取翻
译出的声频内容并生成字幕,将翻译出的声频内容及字幕与视频文件中声频起始时间或视频文件中虚拟活体开口动画对应匹配。
6.更进一步地,所述步骤step1中视频转化格式包括:avi、wmv、mpeg、quicktime、realvideo、flash、mpeg-4、其中设置avi、flash、mpeg-4三种格式为优先选择项目。
7.更进一步地,所述步骤step2中分析视频文件特征的区分特征设置为目标视频文件是否包含声频文件。
8.更进一步地,所述步骤step6中声频起始时间中设置有子节点声频起始时间,所述子节点声频起始时间与对应单帧画面图片对应原理参考步骤step6执行。
9.更进一步地,所述步骤step9中翻译出的声频内容根据使用情景或使用需求选择相应的翻译语种字幕。
10.第二方面,一种视频处理装置包括:控制终端,是系统的总控制端,用于发出控制命令供下级模块执行;接收模块,用于接收视频文件;捕捉模块,用于捕捉接收模块所接收的视频文件中的音频文件内容;协调模块,用于协调视频文件中各帧画面与声频文件中同步播放的延时;数据库,用于存储语言数据,提供翻译模块对音频文件进行翻译的翻译基础;翻译模块,用于翻译视频文件中音频文件的内容,并在内部完成翻译内容与文字的转化;匹配模块,用于将视频文件与翻译模块所转化的翻译内容的文字进行比对匹配形成新的视频文件;校验模块,用于将合成的视频文件进行播放,对视频文件播放内容与音频文件进行对比校验;输出模块,用于输出合成的视频文件。
11.更进一步地,所述接收模块中设置有识别单元,用于识别接收模块接收视频文件的格式,所述识别单元在接收模块触发运行开始时同步运行对接收的视频文件进行格式识别。
12.更进一步地,所述捕捉模块包括:分析模块,用于分析接收模块所接收到的视频文件中是否存在音频文件,用于分析接收模块所接收到的视频文件中是否存在具有语言特征的音频文件;处理模块,用于处理音频文件中杂质音频,所述处理模块在分析模块分析接收模块所接收到的视频文件中存在具有语言特征的音频文件时运行;场景判定单元,用于辅助处理模块对分析模块进行判定,判断视频文件中内容场景;判断视频文件中内容场景是否存在具有语言特征的音频文件。
13.更进一步地,所述匹配模块中包含有选择单元,用于选择翻译模块对于音频文件所要转化的文字种类,以供匹配模块进行对视频文件与音频文件所转化的文字匹配。
14.更进一步地,视频文件大小计算公式,如下:(x+y)/8
·
qt=d式中:x为视频编码率,kbps为单位;y为音频编码率,kbps为单位;
qt为视频总长度,秒为单位;d为视频文件大小,mb为单位。
15.有益效果采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:1、本发明提供一种对于视频后期添加字幕处理方法,通过该方法能够对视频进行处理添加字幕,从而使得对于视频后期添加字幕的这一处理过程更加便利。
16.2、本发明提供一种对于后期视频添加字幕的处理系统,通过该系统配套本发明中所描述的方法所使用,使得对于后期视频添加字幕的这一操作更加智能,且操作难度大大降低,从而降低了对于后期视频添加字幕这一操作的专业性,以便于更多的人能够轻松的完成后期视频添加字幕的这一工作,为人们带来了更多的便利,且高效。
附图说明
17.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1为一种视频处理方法的流程示意图;图2为一种视频处理装置的结构示意图;图中的标号分别代表:1、控制终端;2、接收模块;21、识别单元;3、捕捉模块;31、分析模块;32、处理模块;321、场景判定单元;4、协调模块;5、数据库;6、翻译模块;7、匹配模块;71、选择单元;8、校验模块;9、输出模块。
具体实施方式
19.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.下面结合实施例对本发明作进一步的描述。
21.实施例1本实施例的一种视频处理方法,如图1所示,包括以下步骤:step1:获取视频文件,分析视频文件属性,从视频文件属性中判断视频文件格式,选择默认视频转化格式;step2:将获取到的视频文件以默认视频格式转化,获取视频文件属性,分析视频文件特征;step3:根据视频文件特征捕捉视频文件中声频文件内容,在未捕捉到声频文件后结束;step4:根据视频文件特征捕捉视频文件中声频文件内容;step5:分析视频文件帧率,获取视频文件帧率下单帧画面图片;step6:将声频文件中声频起始时间与获取到的单帧画面图片对应;
step7:捕捉视频文件中虚拟活体开口动画所在的单帧画面图片;step8:提取相应视频文件中虚拟活体开口动画所有单帧画面图面,将声频文件与所有单帧画面图片相对应;step9:建立语言数据库,将声频文件内容传输至语言数据库中进行翻译,获取翻译出的声频内容并生成字幕,将翻译出的声频内容及字幕与视频文件中声频起始时间或视频文件中虚拟活体开口动画对应匹配。
22.如图1所示,步骤step1中视频转化格式包括:avi、wmv、mpeg、quicktime、realvideo、flash、mpeg-4、其中设置avi、flash、mpeg-4三种格式为优先选择项目。
23.通过该设置能够有效地提升该方法在使用的过程的适应性,以此提供用户更多的选择。
24.如图1所示,步骤step2中分析视频文件特征的区分特征设置为目标视频文件是否包含声频文件。
25.如图1所示,步骤step6中声频起始时间中设置有子节点声频起始时间,子节点声频起始时间与对应单帧画面图片对应原理参考步骤step6执行。
26.通过子节点声频起始时间的设置,能够有效地提升视频整体在播放过程中,其视频与声频相匹配的准确度,从而达到提升视频治疗的效果。
27.如图1所示,步骤step9中翻译出的声频内容根据使用情景或使用需求选择相应的翻译语种字幕。
28.实施例2在具体实时层面,本发明中一种视频处理装置,如图2所示,包括:控制终端1,是系统的总控制端,用于发出控制命令供下级模块执行;接收模块2,用于接收视频文件;捕捉模块3,用于捕捉接收模块2所接收的视频文件中的音频文件内容;协调模块4,用于协调视频文件中各帧画面与声频文件中同步播放的延时;数据库5,用于存储语言数据,提供翻译模块6对音频文件进行翻译的翻译基础;翻译模块6,用于翻译视频文件中音频文件的内容,并在内部完成翻译内容与文字的转化;匹配模块7,用于将视频文件与翻译模块6所转化的翻译内容的文字进行比对匹配形成新的视频文件;校验模块8,用于将合成的视频文件进行播放,对视频文件播放内容与音频文件进行对比校验;输出模块9,用于输出合成的视频文件。
29.在该系统运行过程中,控制终端1控制接收模块2运行接收视频文件,进一步由捕捉模块3捕捉接收模块2所接收的视频文件中的音频文件内容,接着控制协调模块4运行对捕捉到的视频文件中的音频文件内容进行二者的匹配协调,然后使用数据库5辅助翻译模块6对音频文件内容中语言内容进行翻译,随后再通过匹配模块7将翻译出的语言文字形成字幕匹配至视频文件中相应位置,最终通过校验模块8核验后使用传输模块9将处理过的合成视频导出。
30.如图2所示,接收模块2中设置有识别单元21,用于识别接收模块2接收视频文件的
格式,识别单元21在接收模块触发运行开始时同步运行对接收的视频文件进行格式识别。
31.通过该设置一定程度的提升了系统处理视频的效率,达到节省处理视频所需时间的目的。
32.实施例3如图2所示,捕捉模块3包括:分析模块31,用于分析接收模块2所接收到的视频文件中是否存在音频文件,用于分析接收模块2所接收到的视频文件中是否存在具有语言特征的音频文件;处理模块32,用于处理音频文件中杂质音频,处理模块32在分析模块31分析接收模块2所接收到的视频文件中存在具有语言特征的音频文件时运行;场景判定单元321,用于辅助处理模块32对分析模块31进行判定,判断视频文件中内容场景;判断视频文件中内容场景是否存在具有语言特征的音频文件。
33.当捕捉模块3捕捉到视频文件中音频文件时,即可通过分析模块31对音频文件进行检测进一步判断音频文件中是否存在语言音频,在此过程中可同步的使用处理模块32对音频文件进行杂音的处理,从而辅助分析模块31更好的辨别音频文件中是否存在语言音频,其中搭载的场景判定单元321进一步的辅助处理模块32对分析模块31进行判定,判断视频文件中内容场景并判断视频文件中内容场景是否存在语言音频。
34.如图2所示,匹配模块7中包含有选择单元71,用于选择翻译模块6对于音频文件所要转化的文字种类,以供匹配模块7进行对视频文件与音频文件所转化的文字匹配。
35.通过该设置能够有效地提升系统对视频文件进行字幕添加这一过程的智能性,且以此可以使视频文件同步添加多重翻译字幕,以便于后续合成的视频文件供人们所使用。
36.如图2所示,校验模块8对视频文件播放内容与音频文件进行对比校验的结果捕捉到视频与音频发生延迟或不匹配时,通过介质传输信号触发协调模块4再次运行,对合成的新的视频文件进行处理后再控制输出模块9对视频文件进行导出。
37.其中,视频文件大小计算公式,如下:(x+y)/8
·
qt=d式中:x为视频编码率,kbps为单位;y为音频编码率,kbps为单位;qt为视频总长度,秒为单位;d为视频文件大小,mb为单位。
38.综上而言,本发明提供一种对于视频后期添加字幕处理方法,通过该方法能够对视频进行处理添加字幕,从而使得对于视频后期添加字幕的这一处理过程更加便利;同时发明提供一种对于后期视频添加字幕的处理系统,通过该系统配套本发明中所描述的方法所使用,使得对于后期视频添加字幕的这一操作更加智能,且操作难度大大降低,从而降低了对于后期视频添加字幕这一操作的专业性,以便于更多的人能够轻松的完成后期视频添加字幕的这一工作,为人们带来了更多的便利,且高效。
39.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1