一种媒体文件的压缩方法和系统的制作方法

文档序号:7717494阅读:124来源:国知局
专利名称:一种媒体文件的压缩方法和系统的制作方法
技术领域
本发明涉及媒体文件的压缩技术,尤其涉及一种媒体文件的压缩方法和系统。
背景技术
随着当今数码产品的普及,越来越多的用户通过数码摄像机(DV,Digital Video)、带摄影功能的照相机等设备来拍摄视频,但通过这种方式生成的媒体文件有一个 明显的缺点,就是文件通常很大,占用磁盘空间较多,例如用普通DV拍摄1小时保存的文 件大小可能达到2G以上。因此,为了方便用户存储这类较大的视频文件,需要有一款实用 工具来帮助用户压缩文件大小,并能保持视频的主观质量。在生成媒体文件的过程中,音、视频编码是最关键的操作。音、视频编码标准种类 繁多,不同的编码标准往往面向不同的业务需求。例如针对视频电话和视频会议业务提出 的H. 263标准,针对数字视频广播(DVB, Digital Video Broadcasting)、高清电视(HDTV, High Definition Television)和数字视频光盘(DVD, Digital Video Disc)提出的活动 图像专家组(MPEG2,Moving Picture Experts Group2)标准,针对网络中流媒体服务开发 的MPEG4标准,以及能够提供高视频压缩性能的H. 264标准等。由于多种编码标准的存在,用户所拥有的媒体文件,其文件格式和音、视频编码格 式各不相同。要压缩文件大小,首先需要进行文件解析和音、视频解码,在获得原始的音、视 频流之后,要选择合适的音、视频转码器和转码参数来生成新的文件大小更小的媒体文件。 因此,要压缩媒体文件大小,首先必须对媒体文件的格式信息进行分析,根据源文件所采用 的编解码器的效率和编码参数来确定转码参数。而现有的视频压缩工具往往需要用户对媒 体的专业知识有深入的了解,并设置合适的转码参数,才能够得到较好的压缩效果。对于普 通的大众用户而言,这种视频压缩工具的使用门槛太高,因此需要提供一种简单快捷的实 用工具来满足这类压缩需求。

发明内容
有鉴于此,本发明的主要目的在于提供一种媒体文件的压缩方法和系统,以实现 对各种不同格式的媒体文件的简单快捷压缩。为达到上述目的,本发明的技术方案是这样实现的本发明提供了一种媒体文件的压缩方法,该方法包括从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和 解码,提取出原始音频流和原始视频流;根据所述编码参数计算压缩所需的转码参数;根据所述转码参数对所述原始音频流编码输出新的压缩音频流,对所述原始视频 流编码输出新的压缩视频流;将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。所述编码参数包括视频编码参数和音频编码参数,其中,所述视频编码参数包括原始视频编码器类型、原始视频编码码率、原始视频编码帧率、原始视频分辨率;所述音频 编码参数包括原始音频编码器类型、原始音频编码码率、原始音频通道数、原始音频采样 率;所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括 目标视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频 转码参数包括目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。该方法进一步包括计算压缩所需的目标视频编码帧率,按照以下原则进行将原始视频编码帧率与15fps进行比较,如果原始视频编码帧率大于15fps,则确 定所述目标视频编码帧率为15fps ;如果原始视频编码帧率小于15fps,则确定所述目标视 频编码帧率与原始视频编码帧率相同。该方法进一步包括计算压缩所需的目标视频分辨率,按照以下原则进行将原始视频分辨率与640 X 480进行比较,如果原始视频分辨率不超过640 X 480, 则确定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640X480, 则降低分辨率,以640X480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨率。该方法进一步包括计算压缩所需的目标视频编码器类型,按照以下原则进行如果原始视频编码器类型为RM、或VC1、或H.沈4,则确定所述目标视频编码器类 型为H. 264 ;否则,确定所述目标视频编码器类型为活动图像专家组MPEG4。该方法进一步包括计算压缩所需的目标视频编码码率,按照以下原则进行计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率 与原始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率K_fps · K_ Pix · K_br ·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将 选取的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者 之间相对较小的码率作为压缩所需的目标视频编码码率。该方法进一步包括计算压缩所需的音频转码参数,按照以下原则进行确定所述目标音频采样率与原始音频采样率相同,目标音频通道数与原始音频通 道数相同;确定所述目标音频编码器类型为高级音频编码AAC ;计算原始音频编码码率与原始视频编码码率的比值,并判断该比值是否大于1/3, 如果大于1/3,则将所述目标音频编码码率下调一或两个级别;否则,确定所述目标音频编 码码率与原始音频编码码率相同。本发明还提供了一种媒体文件的压缩系统,该系统包括媒体信息提取模块,用于从输入的媒体文件中提取所述编码参数;转码参数计算模块,用于根据所述编码参数计算压缩所需的转码参数;音、视频流分离模块,用于对输入的媒体文件进行音、视频流分离,得到音频压缩 流和视频压缩流;音频解码模块,用于对分离出的音频压缩流进行解码提取出原始音频流;
视频解码模块,用于对分离出的视频压缩流进行解码提取出原始视频流;
音频编码模块,用于根据所述转码参数对所述原始音频流编码输出新的压缩音频 流;视频编码模块,用于根据所述转码参数对所述原始视频流编码输出新的压缩视频 流;音、视频流合成模块,用于将所述新的压缩音频流和压缩视频流合并生成新的媒 体文件。所述编码参数包括视频编码参数和音频编码参数,其中,所述视频编码参数包括 原始视频编码器类型、原始视频编码码率、原始视频编码帧率、原始视频分辨率;所述音频 编码参数包括原始音频编码器类型、原始音频编码码率、原始音频通道数、原始音频采样 率;所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括 目标视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频 转码参数包括目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码 帧率将原始视频编码帧率与15fps进行比较,如果原始视频编码帧率大于15fps,则确 定所述目标视频编码帧率为15fps ;如果原始视频编码帧率小于15fps,则确定所述目标视 频编码帧率与原始视频编码帧率相同。所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频分辨 率将原始视频分辨率与640 X 480进行比较,如果原始视频分辨率不超过640 X 480, 则确定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640X480, 则降低分辨率,以640X480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨率。所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码 码率计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率 与原始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率K_fps · K_ Pix · K_br ·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将 选取的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者 之间相对较小的码率作为压缩所需的目标视频编码码率。本发明所提供的一种媒体文件的压缩方法和系统,通过从输入的媒体文件中提取 编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频 流;根据编码参数计算压缩所需的转码参数;根据转码参数对原始音频流编码输出新的压 缩音频流,对原始视频流编码输出新的压缩视频流;将新的压缩音频流和压缩视频流合并 生成新的媒体文件。通过本发明,无需用户了解媒体专业知识就能够实现对各种不同格式 的媒体文件的简单快捷压缩,节省存储空间,便于媒体文件的携带、传输和分享。此外,通过7本发明的压缩也能够保持源媒体文件的主观质量。


图1为本发明一种媒体文件的压缩方法的流程图;图2为本发明一种媒体文件的压缩系统的组成结构示意图。
具体实施例方式下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。本发明所提供的一种媒体文件的压缩方法,由本发明的一种媒体文件的压缩系统 实现,下面首先对本发明的压缩方法进行详细说明。如图1所示,该压缩方法主要包括以下 步骤步骤101,从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频 流分离和解码,得到原始音频流和原始视频流。用户指定一个媒体文件,输入到本发明的压缩系统中,输入媒体文件通常可以采 用以下方式(本发明并不仅限于这种方式,还可以进行扩展)在媒体播放器中播放某个媒 体文件,用于通过点击鼠标右键调用菜单并发起媒体文件的压缩指令,媒体文件随之输入 到本发明的压缩系统。本发明所指的编码参数包括视频编码参数和音频编码参数,其中,视频编码参数 包括原始视频编码器类型(Src_VideoCodec)、原始视频编码码率(Src_VideoBitrate)、 原始视频编码帧率(Src_Vide0Fps)、原始视频分辨率(Src_ReS0luti0n);音频编码参数包 括原始音频编码器类型(Src_Audi0C0dec)、原始音频编码码率(Src_Audi0Bitrate)、原 始音频通道数(Src_AudioChannel)、原始音频采样率(Src_AudioSamplerate)。另外,还需要对输入的媒体文件进行音、视频流分离和解码操作。首先,通过音、视 频流分离操作得到原始的音频压缩流和视频压缩流,即,根据媒体文件中的文件描述信息 可以分辨出音频压缩流和视频压缩流,进而将媒体文件分离得到原始的音频压缩流和视频 压缩流;然后,对原始音频压缩流和视频压缩流分别进行解码(或解压缩),得到解码后的 原始音频流和原始视频流。步骤102,根据编码参数计算压缩所需的转码参数。本发明所指的转码参数包括视频转码参数和音频转码参数,其中,视频转码参数 包括目标视频编码器类型(Dst_VideoCodec)、目标视频编码码率(Dst_VideoBitrate)、 目标视频编码帧率(DstJideoFps)、目标视频分辨率(DSt_ReS0luti0n);音频转码参数包 括目标音频编码器类型(Dst_AudioCodec)、目标音频编码码率(Dst_AudioBitrate)、目 标音频通道数(Dst_AudioChannel)、目标音频采样率(Dst_AudioSamplerate)。计算压缩所需的目标视频编码码率,需按照以下原则进行A、计算目标视频编码帧率与原始视频编码帧率的比值,即K_fps =目标视频编码 帧率/原始视频编码帧率;B、计算目标视频分辨率与原始视频分辨率的比值,即K_pix =目标视频分辨率/ 原始视频分辨率;C、预定目标码率降低系数1(_131·,该系数可以根据实际测试结果进行调整,如预定8K_br = 0. 7 ;D、根据下式得到备选的目标视频编码码率,即备选的目标视频编码码率=K_ fps · K_pix · K_br ·原始视频编码码率,其中,K_fps表示目标视频编码帧率与原始视频编 码帧率的比值,K_pix表示目标视频分辨率与原始视频分辨率的比值,K_br表示预定的目 标码率降低系数,“ · ”表示相乘;E、根据目标视频分辨率从预设的参考对应表(如下表1所示)中选取最接近的 参考分辨率,并将选取的参考分辨率所对应的参考码率与备选的目标视频编码码率进行比 较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。
权利要求
1.一种媒体文件的压缩方法,其特征在于,该方法包括从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码, 提取出原始音频流和原始视频流;根据所述编码参数计算压缩所需的转码参数;根据所述转码参数对所述原始音频流编码输出新的压缩音频流,对所述原始视频流编 码输出新的压缩视频流;将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。
2.根据权利要求1所述媒体文件的压缩方法,其特征在于,所述编码参数包括视频编 码参数和音频编码参数,其中,所述视频编码参数包括原始视频编码器类型、原始视频编 码码率、原始视频编码帧率、原始视频分辨率;所述音频编码参数包括原始音频编码器类 型、原始音频编码码率、原始音频通道数、原始音频采样率;所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括目标 视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频转码 参数包括目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。
3.根据权利要求2所述媒体文件的压缩方法,其特征在于,该方法进一步包括计算压 缩所需的目标视频编码帧率,按照以下原则进行将原始视频编码帧率与15dps进行比较,如果原始视频编码帧率大于15dps,则确定所 述目标视频编码帧率为15dps ;如果原始视频编码帧率小于15dps,则确定所述目标视频编 码帧率与原始视频编码帧率相同。
4.根据权利要求2所述媒体文件的压缩方法,其特征在于,该方法进一步包括计算压 缩所需的目标视频分辨率,按照以下原则进行将原始视频分辨率与640 X 480进行比较,如果原始视频分辨率不超过640 X 480,则确 定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640 X 480,则降 低分辨率,以640X480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨 率。
5.根据权利要求2所述媒体文件的压缩方法,其特征在于,该方法进一步包括计算压 缩所需的目标视频编码器类型,按照以下原则进行如果原始视频编码器类型为RM、或VCl、或H.沈4,则确定所述目标视频编码器类型为 H. 264 ;否则,确定所述目标视频编码器类型为活动图像专家组MPEG4。
6.根据权利要求2至5中任一项所述媒体文件的压缩方法,其特征在于,该方法进一步 包括计算压缩所需的目标视频编码码率,按照以下原则进行计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率与原 始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率K_fps · K_pix · K_ br ·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将选取 的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者之间 相对较小的码率作为压缩所需的目标视频编码码率。
7.根据权利要求2至5中任一项所述媒体文件的压缩方法,其特征在于,该方法进一步 包括计算压缩所需的音频转码参数,按照以下原则进行确定所述目标音频采样率与原始音频采样率相同,目标音频通道数与原始音频通道数 相同;确定所述目标音频编码器类型为高级音频编码AAC ;计算原始音频编码码率与原始视频编码码率的比值,并判断该比值是否大于1/3,如果 大于1/3,则将所述目标音频编码码率下调一或两个级别;否则,确定所述目标音频编码码 率与原始音频编码码率相同。
8.一种媒体文件的压缩系统,其特征在于,该系统包括媒体信息提取模块,用于从输入的媒体文件中提取所述编码参数; 转码参数计算模块,用于根据所述编码参数计算压缩所需的转码参数; 音、视频流分离模块,用于对输入的媒体文件进行音、视频流分离,得到音频压缩流和 视频压缩流;音频解码模块,用于对分离出的音频压缩流进行解码提取出原始音频流; 视频解码模块,用于对分离出的视频压缩流进行解码提取出原始视频流; 音频编码模块,用于根据所述转码参数对所述原始音频流编码输出新的压缩音频流; 视频编码模块,用于根据所述转码参数对所述原始视频流编码输出新的压缩视频流; 音、视频流合成模块,用于将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。
9.根据权利要求8所述媒体文件的压缩系统,其特征在于,所述编码参数包括视频编 码参数和音频编码参数,其中,所述视频编码参数包括原始视频编码器类型、原始视频编 码码率、原始视频编码帧率、原始视频分辨率;所述音频编码参数包括原始音频编码器类 型、原始音频编码码率、原始音频通道数、原始音频采样率;所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括目标 视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频转码 参数包括目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。
10.根据权利要求9所述媒体文件的压缩系统,其特征在于,所述转码参数计算模块进 一步用于,按照如下原则计算压缩所需的目标视频编码帧率将原始视频编码帧率与15fps进行比较,如果原始视频编码帧率大于15fps,则确定所 述目标视频编码帧率为15fps ;如果原始视频编码帧率小于15fps,则确定所述目标视频编 码帧率与原始视频编码帧率相同。
11.根据权利要求9所述媒体文件的压缩系统,其特征在于,所述转码参数计算模块进 一步用于,按照如下原则计算压缩所需的目标视频分辨率将原始视频分辨率与640 X 480进行比较,如果原始视频分辨率不超过640 X 480,则确 定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640X480,则降 低分辨率,以640X480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨 率。
12.根据权利要求9至11中任一项所述媒体文件的压缩系统,其特征在于,所述转码参 数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码码率计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率与原 始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率K_fps · K_pix · K_ br ·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将选取 的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者之间 相对较小的码率作为压缩所需的目标视频编码码率。
全文摘要
本发明公开了一种媒体文件的压缩方法,包括从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流;根据编码参数计算压缩所需的转码参数;根据转码参数对原始音频流编码输出新的压缩音频流,对原始视频流编码输出新的压缩视频流;将新的压缩音频流和压缩视频流合并生成新的媒体文件。本发明还提供了一种媒体文件的压缩系统。通过本发明的方法和系统,无需用户了解媒体专业知识就能够实现对各种不同格式的媒体文件的简单快捷压缩,节省存储空间,便于媒体文件的携带、传输和分享。
文档编号H04N7/26GK102055966SQ20091020949
公开日2011年5月11日 申请日期2009年11月4日 优先权日2009年11月4日
发明者刘俊, 王新亮, 陈敬昌 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1