视频自适应优化的方法及装置的制作方法

文档序号：7851342阅读：218来源：国知局

专利名称：视频自适应优化的方法及装置的制作方法
技术领域：
本发明属于视频优化领域，尤其涉及视频自适应优化的方法及装置。
背景技术：
目前，人们可以很方便的从互联网上找到自己喜欢的视频文件，但是视频文件的清晰度和色彩却不尽如人意，随着多媒体技术的发展，人们对视频质量和形式的要求越来越尚。现有技术中，通过调整视频数据的亮度或色阶来优化输入的视频数据，由于现有的视频优化方法调整的參数过于单一，且为了方便，通常是设置ー个固定值统ー调整所有输入的视频数据，因此采用现有视频优化方法难以获取清晰、色彩艳丽的图像。

发明内容
本发明实施例提供了一种视频自适应优化的方法，g在解决现有方法难以获取清晰、色彩艳丽的图像的问题。本发明实施例是这样实现的，一种视频自适应优化的方法，所述方法包括下述步骤步骤a，读取多媒体文件，并分离所述多媒体文件的音频文件和视频文件；步骤b，解码分离的视频文件，并读取解码后的视频文件的ー帧图像数据；步骤c，分别抽取所述帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值；步骤d，将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据；步骤e，将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量；步骤f·，将经过处理的高频分量和低频分量重新合成ー帧图像数据；步骤g，计算所述重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整所述重新合成的一帧图像数据的伽玛值，所述预设的伽玛值表存储了直方图与伽玛值的对应关系；步骤h，将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出；重复执行步骤b至步骤h，直到多媒体文件的视频文件全部处理结束。本发明实施例的另ー目的在于提供一种视频自适应优化的装置，所述装置包括音视频文件分离单元，用于读取多媒体文件，井分离所述多媒体文件的音频文件和视频文件；图像数据帧读取単元，用于解码分离的视频文件，并读取解码后的视频文件的一帧图像数据；高低阈值设置単元，用于分别抽取所述帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值；图像数据重置単元，用于将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据；高低频分量处理单元，用于将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量；图像帧重新合成単元，用于将经过处理的高频分量和低频分量重新合成一帧图像数据；伽玛值调整単元，用于计算所述重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整所述重新合成的一帧图像数据的伽玛值，所述预设的伽玛值表存储了直方图与伽玛值的对应关系；音视频数据输出単元，用于将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出；重复执行图像数据帧读取单元至音视频数据输出单元，直到多媒体文件的视频文件全部处理结束。在本发明实施例中，能够使图像以最佳观赏方式展现给用户，实现视频的最佳优化，对整部影片实现自适应的最佳视频优化，改善视频的观赏效果。

图I是本发明第一实施例提供的一种视频自适应优化的方法的流程示意图；图2是本发明第二实施例提供的一种视频自适应优化的装置的结构示意图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进ー步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。本发明实施例中，根据每ー帧图像数据的特征，调整适合本帧图像的最佳对比度、饱和度、锐度和伽马值。本发明实施例提供了ー种视频自适应优化的方法及装置。所述方法包括步骤a，读取多媒体文件，并分离所述多媒体文件的音频文件和视频文件；步骤b，解码分离的视频文件，并读取解码后的视频文件的ー帧图像数据；步骤C，分别抽取所述帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值；步骤d，将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据；步骤e，将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量；步骤f，将经过处理的高频分量和低频分量重新合成ー帧图像数据；步骤g，计算所述重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整所述重新合成的一帧图像数据的伽玛值，所述预设的伽玛值表存储了直方图与伽玛值的对应关系；步骤h，将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出；重复执行步骤b至步骤h，直到多媒体文件的视频文件全部处理结束。所述装置包括音视频文件分离单元，用于读取多媒体文件，井分离所述多媒体文件的音频文件和视频文件；图像数据帧读取単元，用于解码分离的视频文件，并读取解码后的视频文件的一帧图像数据；
高低阈值设置単元，用于分别抽取所述帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值；图像数据重置単元，用于将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据；高低频分量处理单元，用于将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量；图像帧重新合成単元，用于将经过处理的高频分量和低频分量重新合成一帧图像数据；伽玛值调整単元，用于计算所述重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整所述重新合成的一帧图像数据的伽玛值，所述预设的伽玛值表存储了直方图与伽玛值的对应关系；音视频数据输出単元，用于将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出；重复执行图像数据帧读取单元至音视频数据输出单元，直到多媒体文件的视频文件全部处理结束。在本发明实施例中，能够使图像以最佳观赏方式展现给用户，实现视频的最佳优化，对整部影片实现自适应的最佳视频优化，改善视频的观赏效果。为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。实施例一:图I示出了本发明第一实施例提供的一种视频自适应优化的方法的流程，为了便于说明，仅示出了与本实施例相关的部分步骤SI I，读取多媒体文件，并分离该多媒体文件的音频文件和视频文件。本实施例的多媒体文件可以为音频视频交错格式(Audio Video Interleaved,AVI)、视窗媒体播放音乐(Windows Media Audio,WMA)等多种格式，ー个多媒体文件同时包括音频文件和视频文件。进ー步地，分离多媒体文件的音频文件和视频文件之后，分别将音频文件放入音频缓存以便从音频文件中解码出对应的音频数据，将视频文件放入视频缓存。步骤S12，解码分离的视频文件，并读取解码后的视频文件的一帧图像数据。本实施例中，对多媒体文件分离出来的视频文件进行解码，并从解码后的视频文件中读取ー帧图像数据，以便后续的处理。步骤S13，分别抽取该帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值。本实施例中，每ー帧图像数据都是由R、G、B三种通道的通道数据组成的。分别统计三种通道的通道数据可获知未经过处理的通道数据所在的数据域，进而据此设置三种通道的低设置阈值和高设置阈值。步骤S14，将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据。本实施例中，由于未经过处理的通道数据所在的数据域通常较窄，因此通过重新设置，通道数据可获得较宽的数据域。比如，假设ー帧图像数据的R、G、B三种通道的通道数据在30 200之间，则该帧图像数据的低设置阈值可设置为40，高设置阈值可设置为190。将R通道的所有数据分别与40和190比较，小于40的通道数据设置为0，大于190的通道数据设置为255，这样R、G、B三种通道的通道数据的数据域从30 200变为O 255，延展了通道数据的数据域，从而调整了 RGB通道的色阶，提升了图像的对比度和色彩饱和度，使图像看起来更加艳丽和通透。步骤S15，将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量。本实施例中，通过高斯滤波，将图像数据的三种通道数据分离为高频分量和低频分量，井根据高频分量和低频分量在整帧图像所起作用的不同，分别执行不同的处理。步骤S16，将经过处理的高频分量和低频分量重新合成一帧图像数据。本实施例中，当分别对图像数据的高频分量和低频分量处理后，根据处理后的高频分量和低频分量重构新的一帧图像数据。步骤S17，计算该重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整该重新合成的一帧图像数据的伽玛值，该预设的伽玛值表存储了直方图与伽玛值的对应关系。本实施例中，计算重构的图像数据的直方图，并将获得的直方图中的各个数据与预设的伽玛值表进行比较，进而根据比较结果自动调整图像数据的伽玛值，使得图像太明亮的区域(或影像过曝的区域)能够稍微调暗，而太黑暗的部分能够调亮，増加影片的宽容度。其中，预设的伽玛值表存储了直方图中的至少2个数据与伽玛值的对应关系，以便保证不同直方图的图像数据尽量对应不同的伽玛值，使得伽玛值调整后的图像更加清晰、艳丽。步骤S18，将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出。本实施例中，同步伽玛值调整后的图像数据与其对应的音频数据，并输出同步后的音视频数据。步骤S19，重复执行步骤S12至步骤S18，直到多媒体文件的视频文件全部处理结束。本实施例中，对每ー帧图像数据都执行步骤S12至步骤S18，直到多媒体文件播放结束。在本发明实施例中，根据每ー帧图像数据的特征，调整适合本帧图像的最佳对比度、饱和度、锐度和伽马值，从而能够使本帧图像以最佳观赏方式展现给用户，实现视频的最佳优化。又因为对每ー帧图像实现最佳优化，因此能够对整部影片实现自适应的最佳视频优化，解决视频文件在播放的过程中不通透，灰蒙，锐度不佳、色彩不够艳丽的现象，改善视频的观赏效果。作为本发明一优选实施例，将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量的步骤具体包括Al、通过高斯滤波将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量。本实施例中，图像f(x，y)的空间低频部分可以通过高斯低通滤波器获取，公式如下
权利要求
1.一种视频自适应优化的方法，其特征在于，所述方法包括下述步骤步骤a，读取多媒体文件，井分离所述多媒体文件的音频文件和视频文件；步骤b，解码分离的视频文件，并读取解码后的视频文件的ー帧图像数据；步骤c，分别抽取所述帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值；步骤d，将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据；步骤e，将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量；步骤f，将经过处理的高频分量和低频分量重新合成ー帧图像数据；步骤g，计算所述重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整所述重新合成的一帧图像数据的伽玛值，所述预设的伽玛值表存储了直方图与伽玛值的对应关系；步骤h，将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出；重复执行步骤b至步骤h，直到多媒体文件的视频文件全部处理结束。
2.如权利要求I所述的方法，其特征在于，所述将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量的步骤具体包括通过高斯滤波将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量；结合灰度形态学运算和人眼的亮度调制方式对高频分量进行增強；对低频分量的顔色、饱和度等參数进行调整。
3.如权利要求2所述的方法，其特征在干，所述结合灰度形态学运算和人眼的亮度调制方式对高频分量进行增强的步骤具体包括将原始图像的高频分量进行形态学的开运算，再减去原始图像的高频分量，得到相对峰值；用原始图像的高频分量减去形态学的闭运算后的原始图像的高频分量，得到相对谷值；原始图像的高频分量加上相对峰值，再减去相对谷值。
4.如权利要求I所述的方法，其特征在于，在将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出的步骤之前，进ー步包括下述步骤计算伽玛值调整后的图像数据的视频分辨率，判断计算的视频分辨率是否小于720P，并根据判断结果选择是否执行视频插值操作。
5.如权利要求4所述的方法，其特征在干，所述根据判断结果选择是否执行视频插值操作的步骤具体包括在计算的视频分辨率小于720P时，采用立方卷积插值运算将图像数据插值到720P，否贝1J，输出图像数据。
6.一种视频自适应优化的装置，其特征在于，所述装置包括音视频文件分离单元，用于读取多媒体文件，井分离所述多媒体文件的音频文件和视频文件；图像数据帧读取単元，用于解码分离的视频文件，并读取解码后的视频文件的ー帧图像数据；高低阈值设置単元，用于分别抽取所述帧图像数据的R、G、B通道的通道数据，根据每个通道的通道数据来设置每个通道的低设置阈值和高设置阈值；图像数据重置単元，用于将图像数据的R、G、B三种通道的通道数据分别与其对应的低设置阈值和高设置阈值比较，井根据比较结果设置相应通道的通道数据；高低频分量处理单元，用于将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量，井分别处理分离的高频分量和低频分量；图像帧重新合成単元，用于将经过处理的高频分量和低频分量重新合成一帧图像数据；伽玛值调整単元，用于计算所述重新合成的一帧图像数据的直方图，井根据计算结果与预设的伽玛值表调整所述重新合成的一帧图像数据的伽玛值，所述预设的伽玛值表存储了直方图与伽玛值的对应关系；音视频数据输出単元，用于将伽玛值调整后的图像数据与其对应的音频数据重新组合并输出；重复执行图像数据帧读取単元至音视频数据输出単元，直到多媒体文件的视频文件全部处理结束。
7.如权利要求6所述的装置，其特征在于，所述高低频分量处理单元包括高低频分量分离模块，用于通过高斯滤波将经过低设置阈值和高设置阈值重新设置的通道数据分离为高频分量和低频分量；高频分量处理模块，用于结合灰度形态学运算和人眼的亮度调制方式对高频分量进行增强；低频分量处理模块，用于对低频分量的顔色、饱和度进行调整。
8.如权利要求7所述的装置，其特征在于，所述高频分量处理模块包括相对峰值确定模块，用于将原始图像的高频分量进行形态学的开运算，再减去原始图像的高频分量，得到相对峰值；相对谷值确定模块，用于使用原始图像的高频分量减去形态学的闭运算后的原始图像的高频分量，得到相对谷值；高频分量处理结果获取模块，用于将原始图像的高频分量加上相对峰值，再减去相对谷值。
9.如权利要求6所述的装置，其特征在于，所述装置包括视频分辨率判断単元，用于计算伽玛值调整后的图像数据的视频分辨率，判断计算的视频分辨率是否小于720P ；插值操作选择单元，用于根据判断结果选择是否执行视频插值操作。
10.如权利要求9所述的装置，其特征在于，所述插值操作选择单元包括插值模块，用于在计算的视频分辨率小于720P时，采用立方卷积插值运算将图像数据插值到720P ；数据输出模块，用于在视频分辨率大于或等于720P吋，输出图像数据。
全文摘要
本发明适用于视频优化领域，提供了视频自适应优化的方法及装置。所述方法包括a，分离音频文件和视频文件；b，读取视频文件的一帧图像数据；c，抽取帧图像数据的通道数据，根据通道数据来设置低设置阈值和高设置阈值；d，将通道数据分别与其对应的低设置阈值和高设置阈值比较，根据比较结果设置相应通道的通道数据；e，将通道数据分离为高频分量和低频分量并处理；f，合成一帧图像数据；g，调整新的帧图像数据的伽玛值；h，将图像数据与其对应的音频数据重新组合并输出；重复执行b至h，直到视频文件全部处理结束。本发明实施例能够改善视频的观赏效果。
文档编号H04N9/64GK102695062SQ201210151359
公开日2012年9月26日申请日期2012年5月15日优先权日2012年5月15日
发明者严帅领, 余潘虎, 王慧婧申请人:Tcl集团股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：严帅领;王慧婧;余潘虎
技术所有人：TCL集团股份有限公司
我是此专利的发明人

上一篇：一种基于flash播放器的3D视频播放方法及装置的制作方法
上一篇：一种网络用户验证方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。