高清晰度视频节目存储方法

文档序号：7939543阅读：618来源：国知局

专利名称：高清晰度视频节目存储方法
技术领域：
本发明涉及一种高清晰度视频节目存储方法，特别涉及一种把高分辨率、高清晰度视频节目存储在现有的DVD光盘上的方法。
背景技术：
目前，用于播放视频的DVD(Digital Versatile Disc，数字多功能光盘)技术只能达到标准清晰度质量，其分辨率只能是720×576或720×480或更小。为了适应高清晰度数字电视的发展和需求，于是希望把高分辨率(例如1280×720)、高清晰度的视频存储在现有普通DVD盘，即以单面单层、采用红光波长(635纳米或650纳米)的激光技术为核心的，从而实现在DVD上播放高清晰度视频。
目前，采用红光波长的激光、单面单层的DVD盘，其容量只有4.7GB(GByte，吉字节)。对于存储视频节目的DVD技术而言，现在是采用MPEG-2(Motion Picture Expert Group，运动图像专家组)压缩技术，其压缩倍数最多只能达到30倍，采用这种技术后，这样一张普通的DVD盘的视频分辨率格式最高只能达到720×576。
在上述的现有技术条件下，对高清晰视频(例如分辨率为1280×720格式，YUV之比为4∶2∶0，帧率为30帧/秒，8比特/像素)则其最小码率为10.55兆比特/秒，若视频持续时间为2小时，则总的容量为9.27GB，因此加上音频和其他数据，至少需要10GB的存储空间。
国际标准MPEG-4是针对一定比特率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性。与MPEG-1和MPEG-2相比，MPEG-4更适于交互AV服务以及远程监控，它的设计目标使其具有更广的适应性和可扩展性；MPEG-4传输速率在4800-6400bps之间，分辨率为176×144，可以利用很窄的带宽通过帧重建技术压缩和传输数据，从而能以最少的数据获得最佳的图像质量。
在实际使用MPEG技术中，现在的MPEG-4可以在编码中提供最高的效率，这可以将整部视频电影以完全PAL或者NTSC的分辨率与立体声(16位，48kHz)存储在单个CD-ROM上。具体而言700MB的容量对多数110分钟的非高清晰电影来说绰绰有余了。另一方面，MPEG-2格式的电影在相同的分辨率下需要约11倍以上的储存空间(8GB的DVD)。当MPEG-2的数据率加倍至接近真正的特性时，MPEG-4可以在声频与视频流上在广泛的领域上升级。当视频在5Kbit/s与10Mbit/s之间变化时，声频信号可以在2Kbit/s与24Kbit/s之间进行处理。由于这种可升级性，声频与视频数据可以经专门调整适应真正的环境。
现有DVD规范中的存储格式已经是成熟的行业标准，如果对其修改，相应的硬件设备也要做改进，这样使得整个生产成本过高，且兼容性不好。另一方面，现有的MPEG-2的节目流结构预留了某些字段，这些字段为我们实现MPEG-4视频数据的存储提供可能，这样能完全兼容现有的采用MPEG-2压缩技术的DVD系统。

发明内容
因此，本发明所要解决的技术问题是在最小限度地更改现有DVD标准存储格式而又保持高兼容性的前提下，在DVD盘上存储高清晰视频节目。
本发明的技术方案如下一种高清晰度视频节目存储方法，其视频数据存储包括如下步骤A.采用MPEG-4对数据包压缩编码，生成MPEG-4基本视频流；B.采用MPEG-2私有数据封装格式对上述MPEG-4基本视频流封装打包，生成打包基本流PES；C.对上述PES进行节目流PS数据格式封装；D.上述PS数据通过DVD逻辑数据转换后，存储在DVD盘上。
所述MPEG-2私有数据封装格式选择stream_id字段值为10111101和/或10111111。
对经所述步骤C后的PS数据进行帧内数据分割组装成一定大小的数据包。
在所述步骤A前，将大尺寸的图像先分成小图像；在所述步骤A后，进行帧内数据复用，形成完整的一帧数据。分割的小图像同时采用MPEG-4编码压缩，做并行处理。
本发明能在现有的普通DVD盘上存储高清晰度的视频内容，而不修改现有的DVD系统结构，完全兼容现有的采用MPEG-2压缩技术的DVD系统。其主要优点是实施简单、生产成本低且兼容性好。

图1是本发明音频和视频的节目数据包结构图2是DVD逻辑数据结构图3是DVD的视频对象单元的一般数据包结构图4是把MPEG-4压缩后的视频节目数据包和音频节目数据包封装到DVD的视频对象单元中的视频数据包和音频数据包图5是本发明的DVD存储系统图6是本发明的支持高清晰节目的DVD编码框7是本发明的支持高清晰节目的DVD解码框图具体实施方式
为了更好地理解本发明的特点、功能和效果，现运用以下较佳实施例并结合附图，进行详细说明。
现有的MPEG-2节目流结构中的stream_id字段是用来说明流的类型，它有以下的定义方式，如下表所示Stream_id分配表

表中有两种数据流类型private stream 1(私有数据流-1)和privatestream 2(私有数据流-2)，最初目的是用来说明用户的私有数据，我们为了能够兼容MPEG-1和MPEG-2，使用这两种数据格式作为MPEG-4的数据包打包方式。为此我们重新定义其stream_id字段中值为1011 1101或1011 1111的数据包为MPEG-4系统流数据包。本发明的创新点之一也体现在利用原有的MPEG-2系统流结构的基础上，重新定义其中私有数据流的结构，实现MPEG-4的数据打包，此系统对MPEG-2系统流基本没有发生改变，所以本发明可以完全兼容MPEG-1和MPEG-2。
上述两种流的封装结构与系统标准(IOS/IEC 13818-1)中的视音频打包后的基本流结构相同。其中private_stream_2的数据结构比private_stream_1数据结构简单，即去掉了可选字段。本发明就是把MPEG-4视频流数据包作为私有数据流，按照private_stream_1或private_stream_2的结构，最终组织成的PS(Program Stream，节目流)数据格式；音频仍采用系统标准IOS/IEC 13818-1的音频包组织方式，不需要做其他调整。子图象的编码打包方式与上述打包方式相同。这样就完成对整个MPEG-4视频、音频与子图像数据的封装。
这种封装方法主要优点是在现有技术设备不做大调整的基础上，实现了对MPEG-4音视频数据的封装，进而便于存储在普通的DVD光盘上。
下面是上述数据封装方法的具体描述视频数据经过MPEG-4压缩编码之后，生成的是MPEG-4的基本视频流，为了能够封装在MPEG-2的节目流中，本发明首先要把MPEG-4基本视频流封装成MPEG-2的PES(Packetized Element Stream，打包基本流)数据格式。封装方式采用的是MPEG-2的私有数据封装方式，其结构如图1。PS流头部字段101主要包括开始码(0×000001BA)102、固定字段(‘01’)103、SCR(系统参考时间)104、节目复合率(program muxrate)105、保留字段(reserve bit)106、填充字节的长度(pack stuffinglength)107与系统头部(system header)108，其中各个字段的定义将在下面分别介绍。先介绍一下MPEG-4的基本流数据的PES封装，本发明把MPEG-4的基本流数据放在MPEG-2的PES的数据部分404，计算其PES数据长度，然后在头部加上PES开始前缀(0×000001)401、流ID(10111111)402以及PES的长度信息403。完成PES封装后，本发明又要对视频PES进行PS(节目流)数据格式封装，其结构如图1，在PS的头部信息中，包开始码(0×000001BA)102，SCR(系统参考时间)104将根据以下公式计算得到SCR_base(i)＝((system_clock_frequency×t(i)DIV 300)％233SCR_ext(i)＝((system_clock_frequency×t(i))DIV1)％300SCR(i)＝SCR_base(i)×300+SCR_ext(i)其中系统时钟频率(system_clock_frequency)为27MHz，t(i)是当前的时间值。节目复合率(program mux rate)105将根据最终的复合码率计算得到。其中填充字节(pack stuffing byte)在本发明中不被使用，因此其填充字节的长度(pack stuffing length)107设置为0。
在系统头部(system header)108，系统头部开始码(0×000001BB)；系统头部长度字段表示的是其字段后面的系统头长度，根据其系统头结构和本发明所采用的结构可以算出其大小为8字节；由于本发明封装的是私有数据，所以流标识字段的值为1011 1111或1011 1101；其它字段还有码流范围(rate bound)、音频范围(audio bound)、固定标志(fixed flag)、CSPS标志(CSPS_flag)、系统音频锁定标志(system_audio_lock_flag)、系统视频锁定标志(system_video_lock_flag)、视频范围(video bound)、保留字段、P-STD缓存范围升级位(P-STD_buffer_bound_scale)和P-STD缓存大小范围(P-STD_buffer_size_bound)。这些字段主要是用来说明MPEG-2的编解码模型，由于本发明采用的是MPEG-4的编解码模型，不再采用MPEG-2的编码模型的缘故，其相应的字段已经失去其原有的意义，为此该部分字段的定义可为任意值。
经过PS数据格式封装后的数据，数据包的长度很长，为了能够满足DVD存储的逻辑数据格式，本发明还要对其PS流数据包进行进一步的切割划分，使其组装成2048(bytes)Pack包，后面将对此做详细描述。
每个Pack包有一个Pack头和Packet头。其中Pack的头部主要存放系统参考时间(SCR)，这个字段是通过前面PS封装时所计算出的SCR值。Packet头部主要存放流标识(stream_id)、展现时间戳(PTS)和解码时间戳(DTS)。如果封装的是MPEG-4的视频数据时，采用的是私有流数据封装方式，其stream_id值为1011 1111或1011 1101，而如果封装的是MPEG-2的视频数据时，其值为1110 xxxx，其它的数据对应关系请参考Stream_id分配表。展现时间戳和解码时间戳就是用来解决MPEG-4视频与音频的同步播放问题，这两个字段的值就是MPEG-4编码时的展现时间戳和解码时间戳的值。
下面将描述DVD的逻辑数据结构如图2所示，专门用于存储视频、音频等多媒体数据的DVD逻辑数据结构可分为导入数据区(Lead in area)、卷空间(Volume Space)和导出数据区(Lead out area)。卷空间包含卷和文件系统数据，管理和媒体数据，进一步有视频管理器(Video Manager，VMG)和若干个视频节目集(Video Title Sets)，即VTS#1到VTS#k，这k视具体的存储内容而定的，通常对应电影节目的数目。其中VMG存放有关后面VTS的控制信息，比如DVD视频规范的版本号码、节目提供者的唯一标识号(ProviderUnique ID)、VTS的数目、视频数据的压缩方法、音频压缩方法和子图像显示类型，以及节目选择菜单等等。
进一步，VTS包括控制数据(VTS Information，VTSI)，菜单视频对象(VTSM_VOBS)，节目视频对象(VTSTT_VOBS)和VTSI的备份。进一步，VTSTT_VOBS由若干视频对象(VOB)构成，进一步，包含若干单元(CELL)，进一步，包含若干视频对象单元(VOBU)，其由具体的视频Pack包(V_PACK)，音频Pack包(A_PACK)，子图像Pack包(SP_PACK)和NV(Navigator，浏览)Pack包(NV_PACK)组成，下面将详细描述这些Pack包的构成。其中NV Pack包主要用于快速搜索功能，比如快进和快退，其由PCI(Playback Control Information，回放控制信息)和DSI(Data Search Information，数据搜索信息)组成。
VOBU中的各种Pack包结构如图3所示，其大小为2048字节，由Pack头和Packet包组成，进一步，Packet包由Packet头和数据构成。其中数据部分可以是NV Packet的数据包或视频Packet数据包或音频Packet数据包或子图像Packet数据包。后面三种Packet数据包就是通过压缩编码后，封装成PS结构的数据包。这种处理过程将在后面的编码系统中详细描述。
例如，图4所示，MPEG-4压缩后的视频节目数据包和音频节目数据包交错构成VOBU单元。
如图5所示，这是一个DVD的视频存储系统，主要包括数据压缩部分10，文件格式转换模块70，卷格式转换模块71，和后处理模块72。文件格式转换模块70主要把压缩部分10送来的节目数据包和相关的控制信息(如PTS和DTS信息，编码方法，码流数目等)按照前面描述的DVD的逻辑数据结构打包，其中的控制信息是在编码压缩过程中存储在系统控制模块中的。卷格式转换模块71主要是从节目VTS中提出管理信息生成VMG，并转换成逻辑数据。后处理模块72主要是对前面的逻辑数据进行纠错编码，把逻辑数据转换成物理数据，通过数据调制把物理数据转换成记录数据，最后通过刻录系统存储在DVD光盘中。
如图6所示，这是能支持高清晰节目的DVD编码器结构图，主要分成三大部分数据流视频、音频和子图像数据。
视频处理过程在原始视频数据输入之后，首先通过数据分割11对图像(分辨率可为1280×720及其以上)进行帧内数据分割，接着把分割后的分块图象块同时送入MPEG-4编码器组12中进行编码压缩，做并行处理，然后通过帧内数据复用13完成对编码后的分块图像数据复用，形成完整的一帧数据，再通过PES打包14和PS打包15，这是按照本发明前面所定义的PS结构进行处理的，最后输出视频节目流供后面的文件格式转换模块70处理。
音频处理过程对输入的原始音频数据，本系统的音频编码器16可以采用现有的各种音频压缩算法，比如MPEG-1音频压缩算法、MPEG-2音频压缩算法、LPCM(Linear Pulse Code Modulation，线性脉冲编码调制)、杜比AC-3等压缩算法，对压缩后的音频数据按照现有的IOS/IEC13818-1标准进行封装，通过PES打包17和PS打包18完成，最后输出音频节目流到文件格式转换模块70。
子图像处理过程对输入的原始子图像数据，通过子图像编码器19进行压缩处理，然后对压缩后的子图像数据按照现有的IOS/IEC 13818-1标准进行封装，这是通过PES打包20和PS打包21完成，最后输出子图像节目流到文件格式转换模块70。
图7是能支持高清晰节目的DVD解码器结构图。
此系统对来自DVD光盘上的数据通过预处理模块31先进行反调制，纠错等处理，之后的数据仍是复用的数据流，然后通过数据解复用32提取视频、音频以及子图像数据。三部分数据的处理过程如下所述视频数据的处理过程视频数据根据上述新的视频存储方式，通过流解包器34解包。接着通过帧内数据解复用36对数据进行帧内数据解复用，然后通过MPEG-4解码器组37对于各个分块图像数据同时进行解码，得到解码后的各个分块图像数据。为了正确显示，对于解码后的分块图像数据还需通过帧内数据合成39进行数据合成，然后与子图像数据通过显示数据合成40，完成可视数据的有效合成，最后送入显示模块41进行显示。
音频处理过程对于音频数据而言，本系统根据编码过程中的具体编码算法在音频解码器38中进行解码处理，其实现可以参考标准的音频解码算法，然后送入播放模块42中进行播放。
权利要求
1.一种高清晰度视频节目存储方法，其视频数据存储包括如下步骤A.采用MPEG-4对数据包压缩编码，生成MPEG-4基本视频流；B.采用MPEG-2私有数据封装格式对上述MPEG-4基本视频流封装打包，生成打包基本流PES；C.对上述PES进行节目流PS数据格式封装；D.上述PS数据通过DVD逻辑数据转换后，存储在DVD盘上。
2.根据权利要求1所述的高清晰度视频节目存储方法，其特征在于，所述MPEG-2私有数据封装格式选择stream_id字段值为10111101和/或10111111。
3.根据权利要求2所述的高清晰度视频节目存储方法，其特征在于，所述选择作为私有数据封装格式的数据去除了可选字段。
4.根据权利要求1所述的高清晰度视频节目存储方法，其特征在于，所述PES包括数据部分、开始前缀、流ID以及PES长度信息。
5.根据权利要求4所述的高清晰度视频节目存储方法，其特征在于，所述数据部分存放MPEG-4基本流数据。
6.根据权利要求1所述的高清晰度视频节目存储方法，其特征在于，所述PS包括包开始码、系统参考时间、节目复合率、填充字节以及系统头部。
7.根据权利要求6所述的高清晰度视频节目存储方法，其特征在于，所述系统参考时间根据以下公式计算得到SCR_base(i)＝((system_clock_frequency×t(i))DIV300)％233SCR_ext(i)＝((system_clock_frequency×t(i)DIV1)％300SCR(i)＝SCR_base(i)×300+SCR_ext(i)其中的system_clock_frequency为27MHz，t(i)是当前的时间值。
8.根据权利要求6所述的高清晰度视频节目存储方法，其特征在于，所述填充字节长度设为0。
9.根据权利要求6所述的高清晰度视频节目存储方法，其特征在于，所述系统头部字段长度为8字节。
10.根据权利要求6所述的高清晰度视频节目存储方法，其特征在于，所述节目复合率根据最终复合码率计算得到。
11.根据权利要求1所述的高清晰度视频节目存储方法，其特征在于，对经所述步骤C后的PS数据进行数据分割组装成一定大小的数据包。
12.根据权利要求11所述的高清晰度视频节目存储方法，其特征在于，所述经数据分割后组装的数据包大小为2048字节。
13.根据权利要求1所述的高清晰度视频节目存储方法，其特征在于，在所述步骤A前，将大尺寸的图像先分成小图像；在所述步骤A后，进行帧内数据复用，形成完整的一帧数据。
14.根据权利要求13所述的高清晰度视频节目存储方法，其特征在于，分割的小图像同时采用MPEG-4编码压缩，做并行处理。
15.根据权利要求1所述的高清晰度视频节目存储方法，其特征在于，采用MPEG-4解码器对图像数据进行解码。
全文摘要
本发明涉及一种高清晰度视频节目存储方法。其视频数据存储包括如下步骤A.采用MPEG－4对数据包压缩编码，生成MPEG－4基本视频流；B.采用MPEG－2私有数据封装格式对上述MPEG－4基本视频流封装打包，生成打包基本流PES；C.对上述PES进行节目流PS数据格式封装；D.上述PS数据通过DVD逻辑数据转换后，存储在DVD盘上。所述MPEG－2私有数据封装格式选择stream_id字段值为10111101和/或10111111。本发明不修改现有的DVD系统结构，完全兼容现有的采用MPEG－2压缩技术的DVD系统，实施简单、生产成本低且兼容性好。
文档编号H04N5/84GK1507273SQ0215111
公开日2004年6月23日申请日期2002年12月6日优先权日2002年12月6日
发明者王洪燕, 胡敏, 郭礼华申请人:上海汉唐科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王洪燕;胡敏;郭礼华
技术所有人：上海汉唐科技有限公司
我是此专利的发明人

上一篇：一种接入用户强制访问认证服务器的方法
上一篇：自动调谐智能化光上下路复用系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。