影像压缩方法

文档序号：7626985阅读：145来源：国知局

专利名称：影像压缩方法
技术领域：
本发明是有关于一种影像压缩方法，尤指一种将各式影音媒体转换为3GP影像时，能够确保影像转换品质、正确的显示比例以及达到影像容量大小、占用频宽的监控的影像压缩方法。
背景技术：
在目前主力为2G(代)行动电话的市场中，行动电话的影音传输受限于传输频宽及技术瓶颈，制作3GP影像的环节尚未受到重视，在3G行动电话即将崛起取代传统2G通信之后，Nokia和Apple公司针对行动电话的使用环境、播放平台制订出适合手机播放的影像规格3GP，但是到目前为止，规格制订出来了，却没有一套较为妥善、标准的制作流程，传统的使用技巧仅仅单纯的将来源影像、声音直接的汇入3GP的压缩软件内。不进行任何的前置处理，因此压缩出来的3GP常会面临比例不正确、画质不佳、播放不流畅、无法正确播放的问题，诚属美中不足之处。

发明内容
为解决上述现有技术的缺点，本发明的主要目的是提供一种影像压缩方法，以期在将各式影音媒体转换为3GP影像时，能够确保影像转换品质、正确的显示比例以及达到影像容量大小、占用频宽的监控。
为达上述的目的，本发明的影像压缩方法，其是应用于可携式装置的影像压缩及传输，包括下列步骤素材分离，将素材中的影音数据进行影像、音频及字幕的分离；裁切及尺寸变更，将该影像数据进行裁切及尺寸变更，以得到每像素长宽正确显示比例；帧速率变更，降低该影像数据的帧播放速率；素材重整，将裁切及变更后的影像数据与音频及字幕予以重整；以及压缩及传输，将重整后的影音数据压缩后予以传输出去。

图1为一示意图，其绘示本发明一较佳实施例的影像压缩方法的流程示意图。
具体实施例方式
请参照图1，其绘示本发明一较佳实施例的影像压缩方法的流程示意图。如图所示，本发明的影像压缩方法，其是应用于可携式装置的影像压缩及传输，例如但不限于第三代手机，且其传输速率是为128Kbps，其包括下列步骤素材分离，将素材中的影音数据进行影像、音频及字幕的分离(步骤1)；裁切及尺寸变更，将该影像数据进行裁切及尺寸变更，以得到每像素长宽正确显示比例(步骤2)；帧速率变更，降低该影像数据的帧播放速率(步骤3)；素材重整，将裁切及变更后的影像数据与音频及字幕予以重整(步骤4)；以及压缩及传输，将重整后的影音数据压缩后予以传输出去(步骤5)。
于该步骤1中，该素材可为DVD、VCD或Flash等，其中包括影像、音频及字幕数据，在本步骤中将影像、音频及字幕予以分离，以方便后续步骤的处理于该步骤2中，将分离出的该影像数据进行裁切及尺寸变更，以得到每像素长宽正确显示比例；其中，每像素长宽的正确显示比例是为1∶1。在本实施例中是以目前最易取得的素材『DVD』为例加以说明，但若变更其它不同类型媒体(比方说VCD、Flash.....etc)，其操作方式雷同于本说明，但需依其显示比例作适当的裁切及尺寸变更即可。以目前台湾电视播放的NTSC规格来说，虽然一般的电视都是以4∶3的方式呈现，其所使用的影像解析为720*480，并非标准640*480，这是因为每像素的显示比例并非以标准的1∶1的方式显示。所以若要正确地在手机上显示，应当先还原回正确的显示比例。
以一般D1画质(720*480)要还原回VGA(640*480)显示，首先需裁切左右两侧的8个像素(Pixel)的同步信号，以得到702*480，再使用最佳的尺寸变更(ReSize)的方式，将702*480变更尺寸为640*480，如此，便可得到每像素长宽1∶1的正确显示比例。其中，该尺寸变更是使用Lanczos算法执行尺寸变更。
此外，于该步骤2中进一步包括将640*480影像分辨率变更为587*480影像分辨率的步骤，以一般手机(图未示)所制订的显示比例176*144而言，其长宽的比例是为1.222∶1，因此，适合压缩手机影像的正确尺寸应该为587*480，然要将640*480的尺寸变更为587*480，则左右两侧必须减去53个像素(Pixel)，得到481*480影像分辨率，再将裁切完成的影像重新透过Lanczos算法变更尺寸成176*144，以得到最适合压缩手机传输影像的比例及尺寸。其中，该Lanczos算法是为现有技术，故在此不拟赘述。
于该步骤3中，一般电视可显示连续动画的原理是以每秒钟连续播放约20帧(frame)以上的单张图片，人类的视觉就会误认为是动态的影像，而以目前电视NTSC的规格，播放的帧速率(Frame Rate)为每秒钟30帧(30 Frames Per Sec.)，但依据3GP的制订规格，3GP的帧速率是为15FPS以下，因此，要将30FPS的速率变换为适合3GP影像的播放速率，就必须降低播放的帧速率，但若变更帧速率的方式不当，则影片播放速度会变得时快时慢，因此等比例地降低影像的播放帧速率才能维持影片播放的流畅度。
以3GP制订的规格而言，将压缩的播放率转换为15FPS或是10FPS是较理想的播放速率。将30FPS的NTSC影片，以每两帧抽除一帧方式进行帧转换，可以得到15FPS的播放率，或以每三帧抽取两帧的方式获得10FPS的播放率。在本实施例中，是以每三帧抽取两帧的方式获得10FPS的播放率为例加以说明，但并非用以限制本发明的范畴。
于该步骤4中，将裁切及变更后的影像数据与音频及字幕予以重整，以便进行后续步骤的压缩。
于该步骤5中，将重整后的影音数据压缩后予以传输出去；其中，影像的比特率(Bit Rate)一向都是决定影像品质的主要关键，行动电话受限于传输频宽，因此影像的比特率无法像DVD般高达将近10Mbps的比特率，甚至连VCD的1152Kbps的标准也无法达到。以3G行动电话移动中的传输速率而言，仅限定最高比特率128Kbps，但是若想在传输中能够更顺利的播放以及降低影像在手机储存卡中所占用的容量，那么就必须降低影像的比特率；然而，若贸然的降低影像比特率而不进行其它项目的调整，虽然仍可达成上述两个目的，但画质会产生严重的衰退，甚至到无法观赏的程度。
因此，理想的调整手段有以下几项1.帧播放速率的改变，依据本发明步骤3中的方式，降低帧播放速率，例如将15FPS降低至10FPS，则在相同的画质条件下，约可节省约1/3的比特率及影像占用空间；2.压缩前的前置调整，在进入3GP压缩程序前，调整原始画质的亮度、对比、色相、饱和度，透过些微程度的调整，可在肉眼无法察觉的情况下减少因比特率降低而产生的马赛克毛边现象；3.二次通道压缩(Two-Pass Encode)，将影像的压缩进行两次，第一次对影像的动态数据进行分析，第二次执行正式压缩，因为有第一步骤针对画质的分析，因此在第二次压缩时，可对画质的维持及容量进行更有效率的掌握；以及4.降低音频的取样频率、压缩比特率，除了影像之外，影响整体比特率和容量的还有声音，以目前手机的播放品质及扬声设备而言，降低声音的取样及压缩比特率并不会对观赏产生影响。
为达到上述降低影像的比特率且不会影响影音数据的播放品质，本发明的压缩及传输步骤(步骤5)进一步包括下列次步骤一压缩前的前置调整步骤(步骤51)；第一次通道压缩分析(步骤52)；降低音频的取样频率、压缩比特率步骤(步骤53)；以及第二次通道压缩(步骤54)。
其中于步骤51中，在进入压缩前，先调整影像数据的亮度、对比、色相、饱和度，透过些微程度的调整，可在肉眼无法察觉的情况下减少因比特率降低而产生的马赛克毛边现象。
于步骤52中，通过由执行第一次通道压缩分析以第一次取得影像动态数据的分析。
于步骤53中，通过由降低音频的取样频率、压缩比特率以降低影音数据中的音频的取样及压缩比特率并不会对影像观赏产生影响。
于步骤54中，该第二次通道压缩步骤依据步骤52中第一次信道压缩分析的数据结果进行实质的压缩。
通过由上述次步骤，以达到降低影像的比特率且不会影响影音数据的播放品质的目的。其中，于该二次通道压缩步骤中可使用压缩工具进行压缩，例如但不限于Apple公司的QuickTime程序或Nokia公司的Multimedia Converter程序执行数据的压缩。
此外，本发明的影像压缩方法其于该帧速率变更步骤(步骤3)之前进一步包括一去交错的步骤(步骤21)，其可将NTSC系统的交错式影像信号变更为循序式扫描。在电视规格制订时，因为技术瓶颈及制作成本的考量，所以采用交错式的方法，每秒以60个图场(field)组合成30个帧(Frame)(Non DropFrame)。因为每个图场只有半个完整的画面，因此在物体移动时，会出现抽丝的现象，而一般行动电话主要是以循序式扫瞄(Progressive)，因此要先将电视播放的影像由交错式变更为循序式扫瞄，这样在压缩成行动电话使用的影像时画面才不会出现抽丝的现象，而图场交错的方式依各原始媒体于去交错的图场选择，需针对不同的交错方式来处理图场，若图场的处理方式选择错误，会产生播放跳顿的现象，以一般DVD而言，几乎都是奇图场优先。
所以，经由本发明的实施，其将各式影音媒体转换为3GP影像时，能够确保影像转换品质、正确的显示比例以及达到影像容量大小、占用频宽的监控，因此，确可改进现有影像压缩方法的缺点。
本发明所揭示的，乃较佳实施例，举凡局部的变更或修饰而于本发明的技术思想而为熟习该项技艺的人所易于推知的，俱不脱本发明的专利权范畴。
权利要求
1.一种影像压缩方法，其是应用于可携式装置的影像压缩及传输，其特征在于，包括下列步骤素材分离，将素材中的影音数据进行影像、音频及字幕的分离；裁切及尺寸变更，将该影像数据进行裁切及尺寸变更，以得到每像素长宽正确显示比例；帧速率变更，降低该影像数据的帧播放速率；素材重整，将裁切及变更后的影像数据与音频及字幕予以重整；以及压缩及传输，将重整后的影音数据压缩后予以传输出去。
2.如权利要求1所述的影像压缩方法，其特征在于，所述该素材是为DVD、VCD或Flash；而该可携式装置是为一第三代手机，且其传输速率是为128Kbps。
3.如权利要求1所述的影像压缩方法，其特征在于，所述该裁切及尺寸变更步骤中，每像素长宽的正确显示比例是为1∶1。
4.如权利要求1所述的影像压缩方法，其特征在于，所述该裁切及尺寸变更的步骤中，其是将NTSC的720*480影像分辨率裁切左右两边各8个像素后得到702*480影像分辨率，再使用最佳的尺寸变更方式将702*480尺寸变更为640*480影像分辨率，以得到长宽1∶1的正确显示比例。
5.如权利要求4所述的影像压缩方法，其特征在于，进一步包括将640*480影像分辨率变更为587*480影像分辨率的步骤。
6.如权利要求5所述的影像压缩方法，其特征在于，进一步包括将587*480影像分辨率裁切左右两边各53个像素后得到481*480影像分辨率，再使用最佳的尺寸变更方式将481*480尺寸变更为176*144影像分辨率的步骤。
7.如权利要求1所述的影像压缩方法，其特征在于，所述该裁切及尺寸变更步骤中，该尺寸变更是使用Lanczos算法执行尺寸变更。
8.如权利要求1所述的影像压缩方法，其特征在于，所述该帧播放速率是为每秒钟播放10个帧，其是将每秒30个帧的播放速度等比例的降低影像的播放帧速率以维持影像数据播放的流畅度。
9.如权利要求1所述的影像压缩方法，其特征在于，所述该压缩及传输步骤中进一步包括一压缩前的前置调整步骤；一第一次通道压缩分析步骤；一降低音频的取样频率、压缩比特率步骤；以及一第二次通道压缩步骤；其中，在该压缩前的前置调整步骤中，在进入压缩步骤前，调整影像数据的亮度、对比、色相、饱和度，透过些微程度的调整，可在肉眼无法察觉的情况下减少因比特率降低而产生的马赛克毛边现象；在该第一次通道压缩分析步骤中，可将影像数据执行第一次信道压缩分析以第一次取得影像动态数据的分析；在该降低音频的取样频率、压缩比特率步骤中，可降低影音数据中的音频的取样及压缩比特率并不会对影像观赏产生影响；而在该第二次通道压缩步骤中，其可依据该第一次通道压缩分析步骤中分析所得的数据结果进行实质的压缩。
10.如权利要求1所述的影像压缩方法，其特征在于，所述该帧速率变更步骤的前进一步包括一去交错的步骤，其可将NTSC系统的交错式影像信号变更为循序式扫描，且其中该去交错的步骤中是以奇图场为优先。
全文摘要
本发明是关于一种影像压缩方法，其是应用于可携式装置的影像压缩及传输，包括下列步骤素材分离，将素材中的影音数据进行影像、音频及字幕的分离；裁切及尺寸变更，将该影像数据进行裁切及尺寸变更，以得到每像素长宽正确显示比例；帧速率变更，降低该影像数据的帧播放速率；素材重整，将裁切及变更后的影像数据与音频及字幕予以重整；以及压缩及传输，将重整后的影音数据压缩后予以传输出去。
文档编号H04N7/26GK1956541SQ20051011806
公开日2007年5月2日申请日期2005年10月25日优先权日2005年10月25日
发明者黄翊证申请人:影腾媒体科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄翊证
技术所有人：影腾媒体科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。