用于对数字视频数据进行编码和解码的设备和方法

文档序号：7569537阅读：275来源：国知局

专利名称：用于对数字视频数据进行编码和解码的设备和方法
技术领域：
本发明涉及用于对数字视频数据进行编码和解码的设备和方法，尤其是涉及能够低速率和高速率地再现可变速率编码的数字视频数据的数字视频数据编码和解码的设备和方法，本发明还涉及其上存储有可变速率编码的数字视频数据尤其是能够低速率和高速率再现特定数据结构的记录介质。
正如公知的，MPEG压缩数字视频数据包括帧内编码数字视频数据(“I帧”)和帧间编码数字视频数据，后者包括正向预测编码数据(“P帧”)和双向预测编码数据(“B帧”)。通常，I帧不采用其它帧的数据解码，而P和B帧要采用其它帧解码。
MPEG压缩数字视频数据的位流一般分为多个图象组(GOP)，每一GOP以I帧开始。当数字视频数据是按固定的速率进行MPEG压缩时，例如，当GOP的帧图象(pattem)是固定的时，I帧在位流中的已知位置上周期性地产生，因此通过仅再现I帧而高速率地再现视频数据是可能的，因为每一I帧的总体位置是已知的。但是，当数字视频数据是按可变速率进行MPEG压缩时(例如，GOP的帧图象是可变的)，I帧在位流中不是按已知间隔产生的，因此仅通过再现I帧难以高速率地再现视频数据。
为了以比正常速率更高的速率再现MPEG压缩数字视频数据，一种技术是在包括位于GOP的起始部分的I帧的每一区段中记录一个标记，此标记指示I帧的存在，并且在此区段(sector)中记录包括I帧的相邻区段的区段地址(即位置)。因此，通过再现位流中的相邻的I图象可以实现较低的搜索速率。
与上述技术相关的一个问题是不能在高速搜索模式下从记录介质上再现视频数据，而在高速搜索模式下极希望连续地再现按较高的时间间隔(例如1、2、4秒等)在位流中产生的I帧。
因此，本发明的一个目的是提供用于对数字视频数据进行编码和解码的设备和方法，该设备和方法克服了上述的再现技术的缺点。
本发明的另一目的是提供用于对数字视频数据进行编码的和解码的设备和方法，该设备和方法能实现压缩数字视频数据的低速率和高速率的再现。
本发明的再一目的是提供一种记录和再现技术，该技术能实现可变速率的压缩数字视频数据的高速率和低速率再现。
本发明的又一目的是提供这样一种技术，它允许再现按预定的固定时间间隔瞬时产生的I帧。
本发明的进一步的目的是要提供一种记录介质，其上存储有可以按低速率和高速率再现的压缩数字视频数据。
本发明的另外一个目的是要低速率和高速率地再现压缩的数字静止图象和音频数据。
根据本发明的一个实施例，本发明的设备和方法能按可变速率对数字视频数据进行编码(即，帧内编码和帧间编码)；标识选择的编码视频数据的多个入口点，这些入口点代表产生于视频图象中的预定时间间隔(例如1、2和4秒)的视频帧的相应位置；产生标识入口点的位置的入口点数据；将入口点数据加至编码视频数据；将具有附加的入口点数据的编码视频数据记录至记录介质上。
作为本发明的一个方面，入口点数据标识在视频图象的预定时间间隔产生的帧内编码的帧的入口点。
作为这一方面的一特征，入口点数据标识了帧内编码的帧的入口点，即，在时间上位于最靠近一个预定时间间隔产生的帧但其不是一帧内编码的帧。
作为本发明的另一方面，相应的入口点数据加至每一帧内编码的帧，它标识在相应入口点数据加至帧内编码帧之前和之后在预定时间间隔中产生的帧内编码的帧的入口点。
根据本发明的另一实施例，本发明的设备和方法能从记录介质上再现可变速率编码的数字视频数据，此数据代表多个连续的视频帧并包括标识编码视频数据的入口点的位置的入口点数据，这些入口点位置代表产生于视频图象中的预定时间间隔的视频帧的相应位置；从再现数据中拾取入口点数据；将所拾取的入口点数据存储于存储器中；根据存储在存储装置中的入口点数据控制编码数据的再现，以再现特定的视频帧；对再现的数据进行可变速率解码，以产生解码的视频数据。
作为这个实施例的一个方面，再现的数据包括帧内编码帧和帧间编码帧，每一再现的帧内编码帧包括标识帧内编码帧的入口点的相应入口点数据，这些帧内编码帧产生于从包括相应入口点数据的帧内编码帧起的预定时间间隔中。在一个帧内编码帧再现之后，再现由包含在再现的帧内编码帧中的入口点数据标识的帧内编码帧之一。
根据本发明的再一个方面，本发明的记录介质包括多个长度可变的视频数据区，在这些区中存储可变编码数字视频数据，其中编码数字视频数据包括多个帧内编码帧和帧间编码帧，其中每一个存储于相应的一个视频数据区中；多个入口点数据区，在这些区中存储入口点数据，其中入口点数据标识所述编码数字视频数据的入口点位置，这些入口点位置代表存储帧内编码帧的视频数据区的相应位置，这些帧内编码帧产生于视频图象中的预定时间间隔中。
根据本发明的又一个实施例，本发明的设备和方法能可变速率编码数字静止图象和音频数据；标识代表静止图象在编码数据中的相应位置的入口点；产生确定所标识的入口点在编码数据中的位置的入口点数据；将入口点数据加至编码数据；将具有附加的入口点数据的编码数据记录至记录介质上。
根据本发明的另外一个方面，本发明的设备和方法能从记录介质上再现可变速率编码的数字静止图象数据，它包括标识编码数据的入口点的位置的入口点数据，这些入口点代表静止图象在编码数据中的相应位置；从再现的编码数据中拾取入口点数据；将所拾取的入口点数据存储于存储器中；根据存储在存储装置中的入口点数据控制再现编码数据，以再现编码的静止图象；和可变速率解码再现的编码的静止图象，以产生解码的静止图象。
通过以下的详细说明并结合附图，可以最好地理解本发明，这种说明是借助于实施例给出的，但本发明并不局限于这些实施例，附图中相同的参考数字代表相同的组件和部分。
附图简要说明

图1是根据本发明的用于对数字视频数据进行编码的设备的方框图；图2示出根据本发明的数据包的数据结构；图3示出根据本发明的入口包的数据结构；图4示意性地示出I帧及选择的入口点在按不同时间间隔瞬时产生的数据流中的位置；
图5是一个根据本发明的用于检测和记录选择的标识帧的位置的流程图；图6示出根据本发明的数据包的另一种数据结构；图7是入口区段的程序流目录表；图8是入口区段的程序流映象表；图9是根据本发明的另一实施例的用于对数字视频数据进行编码的设备的方框图；图10是根据本发明的用于对数字视频数据进行解码的设备的方框图；图11示出入口点数据的数据结构；图12是根据本发明用于对从记录介质上再现的数字视频数据进行解码的设备的方框图；图13示意性地示出根据本发明的由入口点数据标识的静止图象和音频数据在数据流中位置的优选实施例的详细说明图14示意性地示出根据本发明的由入口点数据标识的音频数据位置的另一实施例。
参照附图，尤其是图1，图1中示出了根据本发明的用于对数字视频数据进行编码的设备(以下称编码设备)的方框图。所示的编码设备包括视频编码器1、音频编码器2、多路复用电路3和数字存储器(DSM)10。施加于视频输入端子的数字视频信号供给视频编码器1，视频编码器1以本领域公知的方法对视频信号进行压缩编码(即，帧内编码和帧间编码)，并将编码的视频数据供给多路复用电路3中的视频入口点(entry point)检测电路。施加于音频输入端子的数字音频信号供给音频编码器2，音频编码器2以本领域公知的方法对音频数据进行编码而形成音频数据包，并将音频数据包供给多路复用电路3中的编码缓冲器5。
根据本发明，视频编码器1在每次输出视频数据的I帧(帧内编码帧)时向控制器8提供入口点ID(识别)信号。
多路复用电路3由编码缓冲器4和5、开关电路6、首标附加电路7、控制器8、多路复用系统时钟发生器9、视频入口点检测电路31(以下称入口点检测器31)、入口区段(sector)产生电路32和入口点存储器33组成。入口点检测器31检测所施加的比特流中的I帧的产生并将指示I帧产生的另一入口点ID信号供给控制器8。虽然从视频编码器1和入口点检测器31供给控制器8的入口点ID信号是冗余信号，但在一定条件下，视频编码器1将不能产生入口点ID信号，例如，当施加预先编码的视频数据时，或者，视频编码器1不能向控制器8提供入口点ID信号。在每一种情况下，在从入口点检测器31输出并供给编码缓冲器4的比特流中的每一I帧的产生是已知的。
编码缓冲器4存储所供给的位流数据并将存储的数据输出至开关6的端子E1。相应地，编码缓冲器5存储其中的音频数据包并将存储的音频数据输出至开关6的端子E2。控制器8的功能是控制开关6在端子E1和E2之间转换，以便按时分方式多路复用视频和音频数据的包。此外，响应于由入口点ID信号指示的I帧从电路1或者31的产生，控制器8控制入口区段产生电路32产生入口包数据(后面将要讨论)，并且控制开关6转换至端子E3，以便有效地将所产生的入口包数据紧靠在I帧之前插入位流中。系统时钟发生器9产生系统时钟信号，此信号供给控制器8，控制器8采用所供给的信号控制开关6在其输入端子E1-E3之间转换。
开关6向首标附加电路7提供时分多路复用数据，首标附加电路7响应于来自于控制器8的控制信号，将视频包首标加至每一视频数据包的开始部分，将音频包首标加至每一音频数据包的开始部分，并将包(pack)首标加至每一数据包。首标附加电路7还将一个后首标(back header)加至每一数据包，这样每一数据包为2048字节长，首标附加电路7将之后形成的信号供给其中存储数字数据的数字存储器DSM。
入口点存储器33存储与所检测的入口点相关的位置数据，即，所选择的从编码缓冲器4输出的I帧的位置。入口存储器33还要在下面讨论。
图2示出存储于DSM10中的数据包的数据结构。如图中所示，数据包包括顺序排列的包首标、视频包首标、视频数据、入口包、另一视频包首标、视频数据、音频包首标和音频数据。包首标包括各种信息，包括包起始码、SCR数据、多路复用速率数据等。紧位于包首标之后的第一视频包首标和视频数据代表其中不包括I帧的视频数据的包，因为入口包没有插入第一视频包首标之前。不过，入口包(也称为入口数据包)位于下一个视频包首标之前，因此下一视频数据包括I帧。
图3示出入口包的数据结构。此入口包包括顺序排列的包起始码前缀、Oxbf(十六进制)的位流ID数据、标识连续包的长度(即数据量)的长度数据、标识入口包确定于特定专用(person)的“****”ID数据(缺省为FFh)、标识分类类型的“****”包类型(如果入口包为特定入口专用的话)、标识在下一入口区段之前产生的数据区段数的“当前#数据流”数据、标识在下一入口区段之前产生的视频区段数的“当前#视频流”数据、以及标识在下一入口区段之前产生的音频区段数的“当前#音频流”数据。
入口包还包括“-3”、“-2”、“-1”、“+1”、“+2”和“+3”入口包数据，这些数据标识与数据流中的6个不同的I帧的开始位置相应的6个不同“入口点”的位置。参照图4，此图示出了在编码的比特流中的连续的I帧(为方便起见未示出P帧和B帧)，其中与每一I帧一起(紧位于其前面)存储的入口包标识6个不同的I帧的位置。根据本发明，“-3”、“-2”、和“-1”入口包数据标识在存储入口包的I帧之前产生在3个不同的预定时间间隔中的3个I帧的开始位置。此外，“+1”、“+2”、和“+3”入口包数据标识在存储入口包的I帧之后产生在3个不同的预定时间间隔中的3个I帧的开始位置。如果这3个不同的预定时间间隔例如分别是1秒、2秒和4秒，那么由I帧109存储的入口包标识I帧100、103、106、112、114和117的相对位置(相对于I帧109)，如图4所示。如图中所看到的，帧100产生于I帧109之前4秒，帧103产生于I帧109之前2秒，帧106产生于I帧109之前1秒，帧112产生于I帧109之后1秒，帧114产生于I帧109之后2秒，帧117产生于I帧109之后4秒。相似地，由I帧110存储的入口包标识分别产生于I帧110之前1、2和4秒的I帧108、105和101，还标识分别产生于I帧110之后1、2和4秒的I帧113、116和119。每一入口包数据“-3”、“-2”、……、“+3”标识当前I帧与各标识I帧的入口点(见图2)之间的区段数。预定的不同时间间隔可以与图4中所示的情况不同。例如，可以采用1、3和9秒的时间间隔。另外，时间间隔可以根据视频图象的各种特性而变化并可在视频图象内改变。例如，对于活动性强的图象组时间间隔可以较短，而对于活动性弱的图象组时间间隔可以较大。
可以看出，通过标识代表位于一个给定的I帧(之前和之后)的3个不同时间间隔的I帧的入口点，可以实现，低速搜索和高速搜索(以及中速搜索)，正如下面将要讨论的。此外，随着再现速度按指数增加，例如，再现速度从10x至100x，最好采用这样的入口点(即I帧)，它位于距给定的I帧按指数增加的时间间隔中。例如，在100x的再现模式中，选择约4秒的预定时间间隔。在每秒30帧的帧速率下，4秒中有120帧，它足够接近所希望的100x的再现速度。但是，若要求更高的精确性，可以采用3.3秒的时间间隔。另一方面，对于很低的再现搜索速度，例如，在2x再现模式下，I帧的顺序解码是可行的，因此不必采用入口点。
返回来参照图1，正如前面所讨论的，包括图3中所示的数据的入口区段(即入口包)是由入口区段发生器32响应于I帧(即当前I帧)的产生而产生的。在产生入口包时，可以产生入口包数据-3、-2和-1，因为位于当前帧之前的I帧的位置是已知的(即它们已经产生在位流中)。入口点存储器33在位流中存储每一入口点的绝对位置(即每一I帧的开始部分)，而入口区段发生器32采用存储在存储器33中的I帧的绝对位置和已知的当前帧的位置产生相对位置数据，此数据标识在当前帧之前产生的3个I帧。
但是，在当前帧供给开关6时(即当它在位流中产生时)，与在当前帧之后产生的I帧的开始位置相应的入口点的位置是不知道的。因此，在入口区段发生器32中随入口包数据+1、+2和+3建立了虚数据，包括-视频和音频数据的位流以及每一入口包(其中具有虚数据)被存储在DSM10中。在位流的末端(即在所有的视频、音频和入口包存储在DSM10中之后)，控制器8采用存储在存储器33中的每一入口点(即I帧)的位置确认对应于每一入口包的入口包数据+1、+2和+3的值，并将每一入口包的入口包数据+1、+2和+3存储在DSM10中的适当位置中。
如上所述，数字视频数据可以是可变比特(Variable-bit)编码的(例如，GOP的帧图形是可变的)。在这种情况下，I帧在位流中可以不按恒定间隔产生，因此，如果所希望的时间间隔是例如1秒，本发明的编码设备不能这样假定在相隔约1秒的I帧之间产生相同数量的帧(I、P和B帧)。因此必须确保当前帧的入口包数据参照的每一I帧尽可能地接近所希望的时间间隔。
图5是控制器8的工作原理流程图，控制器8用于根据本发明标识每一入口包数据参照的合适的I帧。应当指出的是，控制器8工作时两次执行图5的流程图，第一次是在位流从视频编码器1中输出并接着存储于DSM10中时，以确认位于当前帧之前的I帧的入口点的位置，第二次是在完全存储于DSM10中之后，以确认每一当前帧之后的I帧的入口点的位置。
现在说明第一次执行图5的流程图时的情况。当一个I帧(即当前帧)产生时，步骤S101中确认所选帧的位置(PCT)，此帧比当前帧超前30帧，它对应于在当前帧之前1秒产生的一帧。由于入口点仅参照I帧，询问步骤S102确定所选帧是否是I帧。如果所选帧是I帧，在步骤S104中，所选帧相对于当前帧的开始位置(即入口点)被存储为入口包的入口包数据-1，它与当前帧一起(即紧位于其前面)被存储，不过，如果所选帧不是I帧，在步骤S103中，在位流中与所选帧相邻(位于其前面或后面)的帧的位置被选作新的所选帧，而后在询问步骤S102中确定新的所选帧是否是I帧。步骤102和103的结果是选择在时间上距当前帧最接近所希望的1秒时间间隔的I帧。
下一步，在步骤S105中确认所选的第二帧的位置(PCT)，此帧比当前帧超前60帧，它对应于在当前帧之前2秒产生的一个帧。与询问步骤102和步骤103相似，询问步骤S106确定所选的第二帧是否是I帧，并且在步骤S107中在比特流中与所选的第二帧相邻的帧的位置被选作新的所选的第二帧。当所选的第二帧是I帧时，在步骤S108中，所选的第二帧相对于当前帧的开始位置被存储为当前帧的入口包的入口包数据-2。
步骤S109-S112的工作方式与步骤S101-S104和步骤S105-S108相似，不同的是初始地所选的I帧比当前帧超前120帧，它对应于在当前帧之前约4秒产生的一个帧。在步骤S112中，所选的第三帧相对于当前帧的开始位置被存储为当前帧的入口包的入口包数据-3。
在位流完全存储于DSM10中之后重复图5的流程图的工作过程，以确认在当前帧之后产生的I帧的入口点的位置。
虽然图5的流程图在询问步骤S103、S107和S111中提供了帧的重复选择过程，但如果I帧仍未选出，本发明认为，在距当前帧一定的时间间隔(此间隔明显不同于所希望的时间间隔)产生的I帧的最终选择是不希望的。因此，在本发明的一个实施例中，比当前I帧超前或者滞后一定时间(此时间与所希望的时间间隔的差异大于10％)产生的I帧不能参照当前I帧的入口点数据。例如，对于所希望的1、3和9秒的时间间隔，在距当前I帧少于900毫秒(ms)、2700毫秒和9000毫秒的时间产生的I帧不能参照当前帧的入口包数据。
如果下一个入口点是一个GOP(图象组)的第一I图象，此GOP的开始部分由包含于此GOP中的组起始码检测。最先出现的I帧变为下一入口点。
图6示出根据本发明的另一实施例的入口区段即包含I帧的数据包的数据结构。如图所示，入口区段包括一个包首标，后者包括包起始码、SCR数据和MUX速率数据。包首标之后为程序流(stream)目录、程序流映象(map)、包(非视频包)、视频包首标、包括I帧的视频数据、音频包首标和音频数据。在此实施例中，数据是按从区段的开始部分起预设的顺序产生的，因此便于数据处理。
程序流目录具有按MPEG标准确定的数据结构，并用于在数据流中规定可存取的位置。程序流目录如图7所示。在此流中的环“A”要反复7次，以记录3个“正向”I帧和3个“反向”I帧以及“反向”I帧的入口点。“正向”I帧和“反向”I帧是指在当前帧的数据包中标识的I帧。程序流映象如图8所示，其中环B和C包括用于容纳多种信息数据的说明符“()”。信息数据包含在说明符中，例如流的数目或基本单元流的信息。
图9是根据本发明的另一实施例的用于对数字视频数据进行编码的设备的方框图，其中在多路复用电路3中包括一映象信息存储装置35，多路复用电路3从外部入口装置(未示出)接收信息。除装置35之外，图9的设备中的所有部件均包含在图1的编码设备中，因此在此省略其说明。存储在装置35中的信息被阅读并作为入口区段存储，每一次它构成一个入口区段。如果该信息使用未来的入口区段位置，在全部比特流存储在DSM10中后该入口区段位置从装置33中读出。
图10是根据本发明的用于对数字视频数据进行解码的设备的方框图。图10的解码设备对存储在DSM10中的具有图2所示的数据结构的数据进行解码。该解码设备包括分离装置21、视频解码器25和音频解码器26。响应于由控制器24供给的控制信号，编码的数字数据从DSM10中读出并供给首标分离电路22，首标分离电路22从读出的数据中分离出每一包首标、每一分包首标和每一入口包，并将分离的数据供给控制器24。首标分离电路22还将时分多路复用数据供给开关电路23的输入端子G，开关电路23通过向端子H1提供视频数据和向端子H2提供音频数据而多路分解此数据(响应于来自于控制器24的控制信号)。视频数据供给视频解码器25，音频数据供给音频解码器26，解码器25和26以本领域公知的方法对相应数据进行解码。
控制器24向入口点存储器41提供入口包数据，存储器41存储所提供的数据。DSM10向控制器24提供读出的位置信息，此信息在位流中标识提供给首标分离电路24的数据的位置。
现在说明图10的解码设备在搜索模式下的工作原理。主控制器(未示出)向控制器24、视频解码器25和音频解码器26提供合适的控制信号，以便它们工作于特定的搜索模式。当在搜索模式下再现时，如果可能的话，控制器24控制DSM10读出由存储在装置41中的数据标识的最接近的I帧。在搜索模式下再现之前，所有入口点可以预先存储(例如通过上电(upon power-up))在装置41中(通过再现整个位流)。如前面所讨论的，入口包紧位于每一I帧之前，因此I帧容易得到。
DSM10读出包括刚存储的入口包的I帧。分离装置2I和视频解码器25对I帧进行解码并在视频输出端提供解码的图象数据。在该解码设备处于搜索模式时，音频解码器26的输出是静噪的。在对读出的I帧进行解码时，控制器24确认要读出的下一I帧在DSM10中的位置。如前面所讨论的，入口包相对于当前读出的I帧位置包含6个不同的I帧的位置，根据所选择的搜索模式，在控制器24中确认这6个不同的I帧中的一个位置。
在低速正向搜索模式中，要再现的下一I帧的位置存储在入口包数据+1中。在高速正向搜索模式中，要再现的下一I帧的位置存储在入口包数据+3中。此外，可以实现低、中和高速反向搜索，因为要再现的下一I帧的位置分别存储在入口包数据-1、-2和-3中。图11示出根据本发明的另一实施例从DSM10中再现入口包的数据结构。
下面参照图12，其中示出了根据本发明的另一实施例的用于对从光盘上再现的数字视频数据进行解码的设备的方框图。响应于由跟踪伺服装置70提供的控制信号，拾取装置61从光盘60拾取数字数据。控制器67向驱动控制电路69提供控制命令，驱动控制电路69产生驱动信号并将驱动信号供给跟踪伺服装置70。数据包从光盘上读出并被供给解调电路62，解调电路62对该信号进行解调并将解调的信号供给ECC电路63，后者检测和校正所供给的信号中的错误。此信号随后供给多路分解器64，多路分解器64将视频数据供给视频解码器65、将音频数据供给音频解码器66并将TOC信息供给控制器67。TOC信息通常存储在第一再现区段中。控制器67将TOC信息提供给TOC存储装置68，存储装置68存储TOC信息。另外，控制器67使显示器(未示出)向用户指示TOC数据加载。
当图12中所示的再现设备(响应于合适的控制信号)开始再现视频数据时，驱动控制器69通过跟踪伺服电路70驱动拾取装置61从光盘60再现由用户指定的位置上的数据。同时，控制器67控制视频解码器65和音频解码器66作解码准备。
数据以本领域公知的方法从光盘60再现，再现的数据在电路62中解调，并供给ECC电路63，以在此校正错误。经过错误校正的数据供给多路分解器64，正如前面所述的，多路分解器64分解数据并将其中的视频和音频数据提供给视频和音频解码器65和66，解码器65和66对相应的数据进行解码并输出。
此外，解调电路62向入口点检测电路90提供解调的再现数据，检测电路90提取入口点数据例如一入口包并将所提取的数据供给子码CRC电路91，后者校正数据中的错误。在入口点数据中标识的I帧的入口点位置存储在入口点缓冲器92中。
控制器67从入口点缓冲器92中读出下一入口点的数据，并将读出的信息供给入口点存储装置93，入口点存储装置93存储数据。控制器92从驱动控制器69接收当前读出位置上的信息，因此下一入口点的位置和内容可以相关联地存储在装置93中。
现在说明图12的再现和解码设备在搜索模式下的工作原理。控制器67控制视频解码器65和音频解码器66，使它们工作于特定的搜索模式。在搜索模式下再现时，控制器67控制驱动控制器69，使拾取装置61靠近当前读出位置的入口点读出，正如装置93在所标识的那样。拾取装置61再现来自于入口点的数据并通过各种电路将再现的数据供给多路分解器64。多路分解器64将视频数据供给视频解码器65，后者对所供给的数据进行解码并输出。当图12的再现和解码设备处于搜索模式时，音频解码器66的输出是静噪的。
入口点位置由入口点检测电路90的数据中分离出来并被存储于入口点缓冲器92中，以便由控制器67检索。正如前面所述的，由于再现开始于入口点，确保视频信号是I帧，它很快地被解码和输出。
正如前面所讨论的，入口包相对于当前读出的帧的位置包括6个不同I帧的位置，并且取决于搜索模式，在控制器24中确认这6个帧之一的位置。这个过程与前面参照图10描述的情况相似。
在上面讨论的实施例中，活动图象和音频数据均包含在位流中。但是，本发明并不局限于活动图象和音频数据，本发明也包括包含静止图象和音频数据的位流或者仅包含音频数据的位流。图13示出根据本发明由入口点数据标识的静止图象和音频数据在数据流中的位置。两个不同的入口点A和B分别标识静止图象数据和音频数据开始位置。入口包(A)紧靠在每一静止图象之前存储，而入口包(B)在预定的音频数据的时间间隔之前存储于位流中。例如，入口区段B插在位流中代表450-550ms的音频时间间隔。另外，如果入口区段A是与入口区段B等间隔的，入口区段B可以省略。
入口区段A具有由3个入口组成的程序流目录数据，这些入口分别表示最近的在前静止图象、最近的在后静止图象和下一在后静止图象。如果最近的在前静止图象和下一在后静止图象不存在，则在程序流目录数据中记录为零。最近的在后静止图象是不能缺少的，这样就必需记录偏移(offset)。另一方面，入口区段B具有由2个入口组成的程序流目录数据，这两个入口表示最近的在前静止图象和下一在后静图象。
在上述的实施例中，视频静止图象和音频数据在位流中传输，并可由前面所述图1所示的编码设备进行编码，正如前面所讨论的。但是，在此实施例中每一静止图象在图1的设备中是作为I帧处理的。
返回来参照图1，控制器8接收来自于视频编码器1或者来自于视频入口点检测电路31的入口点产生信号，并促使对应于静止图象的类型的入口区段A产生并且直接存储在位流中静止图象的前面。
如果已经过450-550ms而没有由区段产生电路32产生入口点，与静止图象不相关的入口区段B则会产生并多路复用至位流中。此时，在程序流目录数据中包含的入口的数目变为不同的。
入口区段A包括3个入口区段的位置，它们分别紧位于3个静止图象的数据之前。这些位置对应于当前图象前的一个静止图象和两个在后的静止图象。但是，与静止图象不对应的该类型的入口区段A包括位于两个静止图象之前的两个入口区段的位置，这两个静止图象中的一个是在当前图象之前，另一个是在当前图象之后。此数据作为程序流目录数据存储。
与前面讨论的I帧的位置相似，在前入口区段的位置是已知的，因此可以存储在存储装置33中。然而，在后的入口区段位置是知道的。因此，全部入口点位置均存储在存储装置33中，并且在位流完全存储于DSM10中之后，直接位于每一入口区段的前面和后面的下一入口点的入口区段的位置被读出并供给DSM10，以记录于其上。
由于有几个静止图象记录在记录介质上，再现设备必需能够清楚地标识图象记录的位置。例如，如果再现开始于图13中的位置P2，而与存储在位置P2的音频数据相关的视频数据处在位置P1，再现设备就需进入位置P1，以便读出静止图象数据并且随后为再现音频数据而返回位置P2。
此时，再现设备工作在这样的状态，即，它从为开始再现指定的位置起搜索最接近的入口区段。入口区段以包首标开始，随后为程序流目录数据，如图6所示。再现设备从指定的再现位置起检测数据内容，当发现特性一致的入口区段时，它读出入口区段的内容。尔后再现设备停止工作。
如果存在3个PSD入口，紧接着会有一个静止图象，再现继续。如果有两个PSD入口，此前会有相关的静止图象，这样必需对此相关的静止图象进行阅读和解码。再现设备采用来自于读出的PSD的紧位于前面的静止图象接入。在图13的实施例中，再现设备从位置P2跳至位置P1。在为开始进行音频解码而返回位置P2之前，再现设备对相应的静止图象进行读出、解码和存储。按此方式，可以在包含静止图象和音频数据的位流中实现正确关联的再现。
采用记录在每一入口区段中的在前静止图象和在后静止图象的位置，可实现静止图象的特定再现。即，在特定的正向再现模式中，再现设备跳至由记录在每一入口区段中的PSD数据标识的紧随在后的静止图象的位置。在特定的反向再现模式中，再现设备跳至紧接在前的静止图象的位置。
图14示出仅包含音频数据的位流。音频入口区段B在此音频位流中以450-550ms的间隔存储。入口区段包括程序流目录数据，但其中未给定视频数据。因此，程序流目录数据的存在仅表明这样的事实，即，此区段是一个入口区段。再现开始允许点实质上存在于每一区段中。因此，这不意味着记录入口点，因而也就没有PSD入口。但是，为理解流状态，需要程序流映象数据的信息。所以，再现一般开始于入口区段，并且再现是在询问程序流映象数据的信息之后开始。
尽管已结合优选实施例对本发明作了具体地显示和说明，但本领域的技术人员将能容易地理解，在不超出本发明的构思和范围的情况下可以作出各种改变。例如，这里公开的时间间隔是1、2和4秒以及1、3和9秒，但本发明中也可采用其它时间间隔和其它时间间隔数，例如，4个不同的时间间隔。
因此，应将所附权利要求理解为包含这里描述的实施例、上述改变和所有等同情况。
权利要求
1.一种对数字视频数据进行编码的设备，包括可变速率编码装置，用于对数字视频数据进行编码，以产生可变速率的编码视频数据；标识装置，用于标识选择的所述编码视频数据的多个入口点，这些入口点代表所述数字视频数据的视频帧的相应位置，所述视频帧产生于由所述数字视频数据代表的视频图象中的预定时间间隔；产生装置，用于产生确定所标识的入口点在所述数字视频数据中的位置的入口点数据；附加装置，用于将所产生的入口点数据加至所述的编码视频数据；和记录装置，用于将具有附加了产生的入口点数据的编码视频数据记录至记录介质上。
2.根据权利要求1的设备，其中，所述可变速率编码装置对数字视频数据进行帧内编码和帧间编码，以产生包括帧内编码帧和帧间编码帧的所述可变速率编码视频数据；和所述标识装置标识产生于视频图象中的预定时间间隔的帧内编码帧的入口点。
3.根据权利要求2的设备，其中，所述标识装置标识帧内编码帧的入口点此帧在编码的视频数据中就时间而言最靠近在所述的视频图象中的预定时间间隔之一上产生的一帧，并且产生于所述的预定时间间隔的所述帧不是帧内编码帧。
4.根据权利要求2的设备，其中，所述附加装置将相应的入口点数据加至每一帧内编码帧，所述的相应的入口点数据标识从所述的相应入口点数据加至相应帧内编码帧起在多个预定时间间隔中产生的帧内编码帧的入口点。
5.根据权利要求4的设备，其中，所述附加装置将所述入口点数据加至每一帧内编码帧的起始部分。
6.根据权利要求4的设备，其中，相应的入口点数据标识位于附加相应入口点数据的帧内编码帧之前的一个帧内编码帧的入口点和之后的一个帧内编码帧的入口点。
7.根据权利要求4的设备，其中，相应的入口点数据标识在所述的相应入口点数据附加的相应帧内编码帧之后在所述的多个预定的不同时间间隔中产生的帧内编码帧的入口点。
8.根据权利要求7的设备，其中，相应的入口点数据还标识在所述的相应入口点数据附加的相应帧内编码帧之前在所述的多个预定的不同时间间隔中产生的帧内编码帧的入口点。
9.根据权利要求4的设备，其中，所述的多个不同的预定时间间隔对应于1、2和4秒的时间间隔。
10.根据权利要求4的设备，其中，所述的多个不同的预定时间间隔对应于1、3和9秒的时间间隔。
11.根据权利要求4的设备，其中，所述附加装置将相应的入口点数据加至选择的帧内编码帧，所述的相应的入口点数据标识从所述的相应入口点数据附加的相应帧内编码帧起在多个第一预定时间间隔中产生的帧内编码帧的入口点，并且将相应的入口点数据加至其它帧内编码帧，所述的相应的入口点数据标识从所述的相应入口点数据附加的相应帧内编码帧起在多个第二预定时间间隔中产生的帧内编码帧的入口点。
12.根据权利要求1的设备，其中，所述标识装置标识多个入口点，这些入口点代表视频图象中在按指数变化的时间间隔上产生的视频帧的相应起始部分。
13.一种对数字视频数据进行编码的方法，包括以下步骤可变速率编码数字视频数据，以产生可变速率的编码视频数据；标识选择的所述编码视频数据的多个入口点，这些入口点代表所述数字视频数据的视频帧的相应位置，所述视频帧产生于由所述数字视频数据代表的视频图象中的预定时间间隔；产生确定所标识的入口点在所述数字视频数据中的位置的入口点数据；将所产生的入口点数据附加至所述的编码视频数据；和将具有附加产生的入口点数据的编码视频数据记录至记录介质上。
14.根据权利要求13的方法，其中，所述可变速率编码步骤是通过对数字视频数据进行帧内编码和帧间编码实现的，以产生包括帧内编码帧和帧间编码帧的所述可变速率编码视频数据；和所述标识步骤是通过标识产生于视频图象中的预定时间间隔的帧内编码帧的入口点实现的。
15.根据权利要求14的方法，其中，所述标识步骤是通过标识帧内编码帧的入口点实现的，此帧在编码的视频数据中就时间而言最靠近在所述的视频图象中的预定时间间隔之一上产生的一帧，并且产生于所述的预定时间间隔的所述帧不是帧内编码帧。
16.根据权利要求14的方法，其中，所述附加步骤是通过将相应的入口点数据加至每一帧内编码帧实现的，所述的相应的入口点数据标识从所述附加相应入口点数据的相应帧内编码帧起在多个预定时间间隔中产生的帧内编码帧的入口点。
17.根据权利要求16的方法，其中，所述附加步骤是通过将所述入口点数据加至每一帧内编码帧的起始部分实现的。
18.根据权利要求16的方法，其中，相应的入口点数据标识位于附加相应入口点数据的帧内编码帧之前的一个帧内编码帧的入口点和之后的一个帧内编码帧的入口点。
19.根据权利要求16的方法，其中，相应的入口点数据标识在所述的附加相应入口点数据的相应帧内编码帧之后在所述的多个预定的不同时间间隔中产生的帧内编码帧的入口点。
20.根据权利要求19的方法，其中，相应的入口点数据还标识在所述的附加相应入口点数据的相应帧内编码帧之前在所述的多个预定的不同时间间隔中产生的帧内编码帧的入口点。
21.根据权利要求16的方法，其中，所述的多个不同的预定时间间隔对应于1、2和4秒的时间间隔。
22.根据权利要求16的方法，其中，所述的多个不同的预定时间间隔对应于1、3和9秒的时间间隔。
23.根据权利要求16的方法，其中，所述附加步骤是这样实现的将相应的入口点数据加至选择的帧内编码帧，所述的相应的入口点数据标识从所述的附加相应入口点数据的相应帧内编码帧起在多个第一预定时间间隔中产生的帧内编码帧的入口点，并且将相应的入口点数据加至其它帧内编码帧，所述的相应的入口点数据标识从所述的附加相应入口点数据的相应帧内编码帧起在多个第二预定时间间隔中产生的帧内编码帧的入口点。
24.根据权利要求13的方法，其中，所述标识步骤是通过标识多个入口点实现的，这些入口点代表视频图象中在按指数变化的时间间隔上产生的视频帧的相应起始部分。
25.一种用于对从记录介质上再现的可变速率编码的数字视频数据进行解码的设备，包括再现装置，用于从记录介质上再现可变速率编码的数字视频数据，此数据代表多个连续的视频帧并包括标识所述编码视频数据的入口点位置的入口点数据，这些入口点数据代表产生于由所述编码数字视频数据代表的视频图象中的预定时间间隔产生的视频帧的相应位置；拾取装置，用于从再现的编码数字视频数据中拾取入口点数据；存储装置，用于存储所拾取的入口点数据；控制装置，用于控制所述再现装置，以根据存储在存储装置中的入口点数据再现视频帧；可变速率解码装置，用于对再现的可变速率编码数字视频数据进行可变速率解码，以产生解码的视频数据；
26.根据权利要求25的设备，其中，所述控制装置控制所述再现装置，以连续地再现视频帧，这些视频帧产生于所述视频图象中的预定时间间隔中，正如由存储在存储装置中的入口点数据所标识的。
27.根据权利要求25的设备，其中，所述的从所述记录介质上再现的可变速率编码数字视频数据包括帧内编码帧和帧间编码帧，每一帧内编码帧包括标识帧内编码帧的入口点的相应入口点数据，这些帧内编码帧产生于从包括所述的相应入口点数据的相应帧内编码帧起的多个预定时间间隔中；并且所述控制装置控制所述再现装置，以再现所述帧内编码帧之一，并随后再现由包括在再现的第一帧内编码帧中的入口点数据标识的所述帧内编码帧之一。
28.一种用于对从记录介质上再现的可变速率编码的数字视频数据进行解码的方法，包括以下步骤从记录介质上再现可变速率编码的数字视频数据，此数据代表多个连续的视频帧并包括标识所述编码视频数据的入口点位置的入口点数据，这些入口点数据代表产生于由所述编码数字视频数据代表的视频图象中的预定时间间隔的视频帧的相应位置；从再现的编码数字视频数据中拾取入口点数据；将所拾取的入口点数据存储于存储器中；根据存储在存储装置中的入口点数据控制所述的可变速率编码数字视频数据的再现，以再现特定的视频帧；和对再现的可变速率编码数字视频数据进行可变速率解码，以产生解码的视频数据；
29.根据权利要求28的方法，其中，所述再现步骤是通过连续地再现视频帧实现的，这此视频帧产生于所述视频图象中的预定时间间隔中，正如由存储在存储装置中的入口点数据所标识的。
30.根据权利要求28的方法，其中，所述从所述记录介质上再现的可变速率编码数字视频数据包括帧内编码帧和帧间编码帧，每一帧内编码帧包括标识帧内编码帧的入口点的相应入口点数据，这些帧内编码帧产生于从包括所述的相应入口点数据的相应帧内编码帧起的多个预定时间间隔中；并且所述再现步骤是这样实现的，再现所述帧内编码帧之一，并随后再现由包括在再现的第一帧内编码帧中的入口点数据标识的所述帧内编码帧之一。
31.一种记录介质，包括多个长度可变的视频数据区，在这些区中存储可变的编码数字视频数据，所述编码数字视频数据包括多个帧内编码帧和帧间编码帧，其中每一个存储于相应的一个视频数据区中；和多个入口点数据区，在这些区中存储入口点数据，所述入口点数据标识所述编码数字视频数据的入口点位置，这些入口点位置代表存储帧内编码帧的视频数据区的相应位置，所述帧内编码帧产生于由所述编码数字视频数据代表的视频图象中的预定时间间隔中。
32.根据权利要求31的记录介质，其中，在记录介质上，各个所述的入口点数据区紧位于存储帧内编码帧的每一所述视频数据区之前；所述入口点数据标识帧内编码帧的入口点，这些帧内编码帧产生于从位于所述相应各入口点数据之前的帧内编码帧起的预定时间间隔中。
33.根据权利要求32的记录介质，其中，相应入口点数据标识视频数据区的位置，这些视频数据区已存储了位于紧随存储相应入口点数据的入口点数据区的视频数据区之前的一个帧内编码帧和之后的一个帧内编码帧。
34.根据权利要求32的记录介质，其中，相应入口点数据标识视频数据区的位置，这些视频数据区已存储了位于紧随存储相应入口点数据的入口点数据区的视频数据区中的帧内编码帧之后产生于所述的多个不同预定时间间隔中的帧内编码帧。
35.根据权利要求34的记录介质，其中，相应入口点数据还标识视频数据区的位置，这些视频数据区已存储了紧随存储相应入口点数据的入口点数据区的视频数据区中的帧内编码帧之前产生于所述的多个不同预定时间间隔中的帧内编码帧。
36.一种用于对数字静止图象和音频数据进行编码的设备，包括可变速率编码装置，用于对数字静止图象和音频数据进行编码，以产生可变速率的编码视频数据；标识装置，用于标识代表静止图象在所述编码数据中的相应位置的入口点；产生装置，用于产生确定所标识的入口点在所述编码数据中的位置的入口点数据；附加装置，用于将所产生的入口点数据加至所述的编码数据；和记录装置，用于将具有附加了产生的入口点数据的编码数据记录至记录介质上。
37.根据权利要求36的设备，其中，所述标识装置在所述编码数据中标识音频入口点，这些入口点代表在预定时间间隔中产生的音频数据的位置；所述产生装置产生音频入口点数据，此数据代表所标识的音频入口点在所述编码数据中的位置；和所述附加装置将所产生的音频入口点数据加至所述编码数据。
38.一种用于对数字静止图象和音频数据进行编码的方法，包括以下步骤可变速率编码数字静止图象和音频数据，以产生可变速率的编码数据；标识代表静止图象在所述编码数据中的相应位置的入口点；产生确定所标识的入口点在所述编码数据中的位置的入口点数据；将所产生的入口点数据加至所述的编码数据；和将具有附加了产生的产生的入口点数据的编码数据记录至记录介质上。
39.根据权利要求38的方法，其中，所述标识步骤是通过在所述编码数据中标识音频入口点实现的，这些入口点代表在预定时间间隔中产生的音频数据的位置；所述产生步骤是通过产生音频入口点数据实现的，此数据代表所标识的音频入口点在所述编码数据中的位置；和所述附加步骤是通过将所产生的音频入口点数据加至所述编码数据实现的。
40.一种用于对可变速率编码的数字静止图象数据进行解码的设备，包括再现装置，用于从记录介质上再现可变速率编码的数字静止图象数据，并包括标识编码数据的入口点的位置的入口点数据，这些入口点代表静止图象在编码数据中的相应位置；拾取装置，用于从再现的编码数据中拾取入口点数据；存储装置，用于存储所拾取的入口点数据；控制装置，用于控制所述再现装置，以根据存储在存储装置中的入口点数据再现编码的静止图象；和可变速率解码装置，用于对再现的编码静止图象进行解码，以产生解码的静止图象。
41.一种用于对可变速率编码的数字静止图象数据进行解码的方法，包括以下步骤从记录介质上再现可变速率编码的数字静止图象数据，并包括标识编码数据的入口点的位置的入口点数据，这些入口点数据代表静止图象在编码数据中的相应位置；从再现的编码数据中拾取入口点数据；将所拾取的入口点数据存储于存储器中；控制再现编码数据根据存储在存储装置中的入口点数据再现编码的静止图象；和可变速率解码再现的编码静止图象，以产生解码的静止图象。
全文摘要
数字视频数据编码器和解码器能够以低和高速率地再现可变速率编码数字视频数据，在编码器中，数字视频数据是可变速率编码的，选择的编码视频数据的入口点(即起始部分)被标识，其代表在视频图象中按预定时间间隔产生的视频帧，标识这些位置的入口点数据产生并在视频数据记录在记录介质之前附加至编码视频数据中，当编码数据从记录介质上再现时，入口点数据被拾取和存储，由所拾取的入口点数据标识的连续的帧内编码帧被再现和解码。
文档编号H04N7/24GK1152243SQ96112178
公开日1997年6月18日申请日期1996年8月2日优先权日1995年8月2日
发明者藤波靖, 米满润, 河村真, 矢ク崎阳一申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：藤波靖;米满润;河村真;矢**崎阳一
技术所有人：索尼公司
我是此专利的发明人

上一篇：数据编码/译码方法和设备及编码数据的记录介质的制作方法
上一篇：交互式电视系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。