信息记录和再现的设备和方法

文档序号：6746356阅读：142来源：国知局

专利名称：信息记录和再现的设备和方法
技术领域：
本发明总体上涉及信息记录和再现，更具体地涉及记录音频和视频信号等等连同与这些信号相关的附加信息，并且基于该附加信息有选择地再现音频/视频信号。
目前，模拟型录像机(VTRs)通常用于记录和再现电视广播的模拟音频和视频信号。打算将相应于这样模拟音频和视频信号的数字数据通用地记录在诸如光盘和硬磁盘的数字存储介质上。
传统的录像机(VTRs)在记录过程中，通过引入不同的标识信号而使再现更方便。例如，使用一种标识信号来识别电视广播是否是一种双语言广播或是一种立体声广播，因此，电视接收器可在这两种广播之间进行鉴别，并且相应地控制音频信号输出方式。
当代的光盘和硬盘与模拟磁带相比，具有优良的可存取性，即随机存取能力。例如，现在正在考虑各种对这些盘的快速视听方法，例如语言速度的变换和有选择地跳过歌曲内容。相反，传统的录像机VTRs缺乏这样的能力。现有技术的VTRs有些具有自动音频选择功能等，而其他一些则具有语速变换特点，但是该语速变换特点的缺点是视频和音频是独立处理的。这就产生了输出音频和视频会不同步的问题，导致视听不自然输出，例如，在音频产生前或后嘴唇在动。
传统的激光盘播放机(LDPs)具有起头处眉头词检索能力用于卡拉OK(也就是在跟唱歌曲机中使用)。但是，至于平常广播，在许多情况下使用者要求观看音乐节目之间的交谈型节目。在这种情况下，传统的只具有起头处眉头词检索功能的激光播放机LDP就不适用了。
因此，本发明的一个目的是提供一种能够在数字存储介质上记录音频或视听信号的记录设备，并且伴随着在全部时间对具体音频类型分析其特征，以及把代表这样特征的信息存储在存储介质上。
本发明的另一个目的是提供一种再现设备，该设备基于使用者对具体音频类型的选择，允许选择性地再现这样录制的音频或视听信号。
本发明的再一个目的是提供具有增强特性的记录和再现设备。
在本发明一个示范性实施例中，提供了一种用于至少将一个音频信号记录到记录介质上的信息记录设备，该设备包括用于检测音频信号特征的检测电路，和用于记录连同音频信号一起，对应于所检测特征的附加信息的记录电路。优选以时间段方式检测音频信号特征，使得将音频信号的段或帧各自特征化。例如，可由检测电路检测的特征可包括给出的信号段是否是由无声音的音频构成的；该给出段是否是由音乐构成的；或该给出段是否是由交谈构成的。
采用存储在记录介质上的特征信息有利于在再现时具有多方面的适用性，由此给使用者提供了一个在重放时高度适用的工具。例如，使用者可以跳过已录制的一个或多个不需要的音频类型内容部分，或者借助于对音频类型有选择地略过而快速定位于所录制内容的所需部分。
在另一个示范性实施例中，提供了一种用于再现至少一个相应于录制在记录介质上音频数据的音频信号的信息再现设备，在该记录介质上也录制了至少相关于音频信号的附加信息。该设备包括用于在任何音频信号相应部分再现前读出附加信息部分的阅读装置；用于根据该附加信息的读出部分和一当前的操作方式，确定是否再现相应音频信号部分的决策装置；以及用于根据决策装置的决定来控制相应音频信号部分再现的控制装置。
下文详细说明是作为本发明的例子给出的，并不由此对本发明进行限定，将结合附图更好地领会，在附图中同一参考标号表示同一元件或部件，其中

图1是一根据本发明实施例的信息记录设备的说明布局的方框图；图2展示盘上存储区域的示范性配置；图3是展示图1的信息记录设备的操作流程图；图4和图5是展示产生表示音频特征的子码过程的流程图；图6和图7是展示在图1的相应处理系统中信号流输出时间安排的时间安排图；图8是展示根据发明一实施例的信息再现设备的说明布局的方框图；图9是展示图8的信息再现设备操作的流程图；图10是展示在图8的相应处理系统中信号流输出时间安排的时间安排图11是展示根据发明另一实施例的信息再现设备的说明布局的方框图；图12是说明图11的信息再现设备操作的流程图；图13是展示在图11的相应处理系统中信号流输出时间安排的时间安排图。
图1是标志为记录设备100的本发明第一个示范性实施例的方框图。其详细说明如下，记录设备100构造成可有选择地接收不同类型的模拟输入信号，例如电视广播信号或摄像机系统输出信号。该设备将选择的输入信号转换成数字信号，并且压缩它并将它记录在诸如光盘或磁盘的数字存储介质上。当已接收和记录音频和视频信号时，在全部时间内分析音频信号的特征，以便以时间段方式分类其内容。具体地讲，分析该音频信号的单独帧以便确定哪个或哪些帧序列对应于，例如，音乐、交谈或无声音频。借此对记录的音频节目的每一段进行分类。然后相应于音频信号分类情况产生一个用户内容表。将该内容表记录于数字存储介质上，或者记录于记录介质的特定区域，或者以子码形式分布在象记录音频/视频数据一样的同一区域中。该内容表允许用户重放所选择的音频类型和相关的视频数据而跳过其他类型，或者通过选择跳过某些音频类型而快速进入所记录的视听节目的所需部分，等等。
现在将详细说明记录设备100。视频信号处理系统1构造成接收外界输入视频信号，例如录像机VTR视频输出，和对例如自动增益控制(AGC)的信号进行不同类型的处理。摄像机信号处理系统2用于接收来自电荷耦合器(CCD)摄像机或类似物的视频信号，并且将其转换成标准协议信号，例如国家电视系统委员会(NTSC)视频信号。调谐器系统3通过天线系统(未示出)接收电视广播信号，并且通过视频检测、视频放大和音频检测将所选择频道的电视信号转换成视频和音频信号。
音频信号处理系统7适于接收和放大外界的音频信号，例如来自将视频信号提供给系统1的VTR的音频输出。话筒输入音频处理系统8放大通过话筒输入的音频信号并在其上进行自动增益控制AGC处理。
将来自系统1、2和3中的各自的视频输出信号作为输入加到视频信号切换系统4中，该系统根据来自系统控制器14的选择控制信号切换出所选择的一个视频信号作为它的输出。同样地，音频信号切换系统9根据来自系统控制器14的控制信号，将所选择的来自系统3、7和8的一个音频信号发送成它的输出。
在视频路径中，将切换系统4的模拟视频输出加到视频信号A/D转换系统5，在那里将它转换成数字视频信号，然后量化该数字视频信号。其后，根据诸如联合图片专家组规范(JPEG)或运动图像专家组规范(MPEG)方案的标准压缩协议，通过视频压缩和处理系统6将量化的数字视频信号进行压缩。将该压缩的视频信号加到记录数据处理系统17，并且记录在记录介质18中，下文将对该记录介质更充分地讨论。
在记录设备100的音频路径中，通过音频信号A/D转换系统(A/D转换器)10将音频切换系统9的模拟音频输出转换成数字音频信号。将来自A/D转换器10的数字化音频输出加到音频特征提取系统12(检测装置)和加到音频信号带压缩系统11，后者将根据诸如MPEG的标准协议在必要时压缩音频信号。
音频特征提取系统12包括处理电路，用于分析来自系统10加到其上的数字音频的某些特征，以便由此提取信号的音频特征。在提取系统12中根据来自系统控制器14加在其上的操作参数对量化的音频信号进行正交变换，然后再根据系统控制器14提供的操作指令对其进行确定的操作。在提取系统12中，以逐块为基础对该音频信号进行分析，其中每块对应于要记录的音频信号的一个具体时间段(例如帧或帧组)。举个例子来说，为了确定音频信号的哪一部分对应于无声音情况，可以0.02秒时间段对音频信号进行分析，以便确定包含无声音或低强度音频的块。以更长的时间块对音频信号进行分析，以便确定包含对应于例如器乐，人说话或声乐的音频的大块，根据由提取系统12进行分析的结果，由子码产生系统13产生子码，以便将音频信号的每一个这样的块特征化。暂时将某些子码存储在存储器16中。
具体地，对于每个持续时间“D1”(例如，0.02秒持续时间)的音频数据块，产生子码“A”以表示该块是否对应于无声音的音频。对于每个较长持续时间“D2”的数据块，产生子码“B”以表示在该块中包含诸如交谈、器乐或声乐类型的音频信号。将子码A直接传输到记录数据处理系统17，反之，将子码B传输到存储电路16以便暂时在其中存储。通常，当音频/视频数据记录完毕时，根据系统控制器14的控制，将所有子码B作为一块从存储器16输送到记录数据处理系统17(通过子码产生系统13)。
不管怎样，当记录设备100接收模拟音频信号时，将其数字化、压缩，并且一般来说实时地作为数据将其记录在记录介质18的预定部分。当产生子码A和B时，产生用户内容表(U-TOC)，以便使存储在记录介质18上的音频数据与表征该音频数据的相应段的子码相关连。U-TOC存储在记录介质18上。如图2所示，数字化的音频数据可记录在盘的最外区域上，而U-TOC数据可记录在盘的在记录有内容表(TOC)的最内区域的外侧区域的预定区域上。
系统控制器14根据由记录控制信号输入系统15，例如键盘或类似物输入的用户指令，通过对相应的处理系统提供控制信号实现对该相应处理系统进行控制。
记录数据处理系统17(记录装置)的作用是多路传输来自视频信号压缩系统6、音频信号压缩系统11和子码产生系统13所提供的位(bit)序列，并且将多路传输的数据传送到记录介质18和将该数据记录在其上。(注意某些或者全部子码可以不与音频和视频数据一起多路传输，而可选作为一个数据块传输，在这种情况下记录系统17不用多路传输仅将该子码数据块记录在记录介质上)。记录介质18可以是光盘、硬盘、存储卡或类似器具。
图3是说明在系统控制器14中，为了控制记录设备100的记录过程的各方面，执行的过程步骤的流程图。在开始(步骤S1)系统控制器14根据输入给输入系统15的用户指令，例如，检测按下的特定方式键，确定操作方式。在步骤S2，确定在步骤S1所确定的操作方式是否是常规记录方式，也就是说，在该方式中记录了视频和音频两种信号。如果是这样，则程序前进到步骤S3，在该步骤，系统控制器14在音频特征提取系统12中设置操作参数A、B、C和D。由于下述明显原因，根据用户选择的音频信号的类型，例如来自于电视信号、VTR输出或话筒的音频信号，设置参数A-D的值。这样，该参数A-D的值就相对应于由系统控制器14控制的音频切换系统9的切换状态。
在按图3进一步前进前，先参见图4，图4展示了说明在音频特征提取系统12和子码产生系统13中程序的流程图。对于当前所描述的实施例，假设一个数据块包括音频数据的N位或N个字节，这里N是一个预先确定的整数。举例来说，一个数据块可包含对应于0.02秒长度段的输入模拟音频信号的数字化音频数据。进一步假设子码A是以逐块为基础计算的，而子码B是以M块为基础计算的，这里M是一个特定的整数。在步骤S21，音频特征提取系统12接收来自系统控制器14的操作参数A、B、C和D，如前文所讨论的，该系统控制器根据所选择的音频信号类型已设置了这些参数。如果在步骤S22，确定还没有处理M个数据块，那么就执行步骤S27的单数据块处理(“1-数据块处理”)。
图5是1-数据块处理流程图。在步骤S31，对单个音频信号块进行快速傅立叶变换(FFT)，以便确定相应于该音频信号块信号部分的频谱成分。下一步在步骤S32，从由系统控制器14提供的操作参数B确定的Nb个频率成分计算出音频信号功率。这样，由参数B确定了用于计算信号功率的输入音频信号带的部分。例如，来自摄像机系统的音频信号含有大量低频成分，例如嘘嘘声，而电视广播的音频信号含有大量帧频的谐波频率成分。因此，对于信号功率的计算，采用按照所分析的音频信号类型适当滤去不需要的频率的方法，可降低由噪音产生的误差。
在下一步骤S33中，确定信号是否是无声的。这就是，如果计算的功率值小于参数C，那么就确定在相应的块中信号是无声的。可选择地，如果计算功率大于参数C，那么就可进一步确定关于信号功率是否处在n个预先确定的范围的一个之内。不管怎样，在步骤S34，根据步骤S33的确定情况产生子码A，并且将其提供给记录数据处理系统17。子码A或者是作为无声情况的第一个预先确定的值，或者是作为各自对应于不同信号功率量级范围的若干其他预先确定值中的一个。一般来说，电视广播和摄像机系统(如，摄像机录像机组合装置(camcorders))的信号由于话筒性能方面的不同而具有不同的信噪比(S/N)。因此，根据音频切换系统9所选择的切换位置(和由系统控制器14对其进行控制)，通过适当地选择参数C的值可减小错误检测的可能性。
在1-数据块处理中的下一步骤S35中，确定频谱的峰值P(f)，也就是，特定的Nd个频率中的任何一个的最大幅度，其中Nd是一个整数。然后，将这样确定的频谱峰值暂时存储在存储电路16中。该Nd个频率是根据由系统控制器14提供的参数D确定的。如上所讨论的，给音频信号加噪音的频谱成分是音频信号类型的函数。因此，可以通过从主题频率成分中消除那些噪音成分，以更高精度计算出最大频谱功率。
一旦对单数据块计算出频谱峰值P(f)，并且已暂时存储，那么软件流程就返回到图4的步骤S21和S22。该处理过程继续到步骤S27执行M次，由此，对M块音频信号算出了频谱峰值P(f)，并且存储在存储器中。
一旦在步骤S22确定音频数据的M块都已处理了，那么在步骤S23，软件计算平均持续长度“CLAVG”，在其中确定频谱峰值P(f)相互具有同样的值。CLAVG的计算需要将一系列数据块的频谱峰值相互比较，并且确定区段的长度，在该区段连续块的峰值保持在相互预定的范围内。然后，在步骤S24，确定对连续的M个数据块计算的CLAVG值是否大于由系统控制器14提供的参数A。一般来说，在声音的强度比较稳定如音乐的场合，为计算CLAVG，块的平均数就大。相反，在音频信号为人的说话或交谈的场合，块的平均数就小。如果是音乐，可以确定某个CLAVG值对应于由乐器产生的音乐，而另一个值对应于声乐。
无论何种情况，在步骤S25，对每一M块音频信号段建立一个子码B以便对应于特定的音频信号类型。在本例中，根据值CLAVG是否大于由系统控制器14提供的参数A，来判定信号是否为音乐，并且相应地产生子码B。在步骤S26，该子码B存储于存储电路16，并且只要操作方式保持常规记录方式的情况，该处理过程就重复下一M个数据块。一般而言，电视广播和摄像机系统(如摄像机录像机组合装置)的信号具有不同的非音乐节目，如会话的出现率。因此，根据所选择的输入音频信号的类型，通过适当选择参数A的值，可减小错误检测的可能性。
回到图3，在步骤S3，根据上述控制正处理音频信号时，视频信号也连续不断地被处理和数字化记录。也即，在步骤S4，根据来自系统控制器14的控制指令，通过记录数据处理系统17，将出自视频处理系统6的压缩视频输出信号传输到记录介质18。在步骤S5，系统控制器14也控制音频处理系统11，以便通过记录处理系统17将压缩的音频信号传输到记录介质18。在步骤S6，系统控制器14控制记录处理系统17，以便将前面讨论的由子码产生系统13产生的子码“A”提供给记录处理系统17并且传输到记录盘18。然后，在步骤S7，如果已产生一个或多个子码B，那么指令子码产生系统13将其传输到存储电路16。
其后，程序返回到步骤S1和S2。如果操作方式还是常规操作方式，那么上面所描述的程序将重复。如果，在另一方面，已通过诸如用户按下“停止记录”键或类似方式改变了操作方式，那么程序处理到达步骤S8，在那里，判定先前产生的子码B是否已经记录在记录介质18上。如果没有，系统控制器14控制子码产生系统13(步骤S9)，以便读出在存储电路16中存储的子码B并且通过记录数据处理系统17将它们传输到记录介质18上。
在上述方式中，如果是从常规记录方式向一些其他的方式转换，那么将子码B作为一个数据块记录在记录介质18的预定区域上，如在上面讨论的U-TOC区域上。
如果在步骤S8子码B已经记录在记录介质18上了，那么下一步(步骤S10)确定当前操作方式是否是停止方式。如果是，则在步骤S12执行停止处理。否则，在步骤S11判定操作方式是否是删除方式，如果是，则在步骤S13执行删除方式处理，程序返回到步骤S1。
图6和图7是展示对相应的音频和视频处理系统信号输出时间安排的时间安排图。图6展示在常规记录方式中的输出时间安排。如从图的最底下的时间安排栏显示易见，当常规操作方式时，音频、视频和无声数据(子码A)以逐帧为基础连续地记录在记录介质上。在当前描述的实施例中，首先记录第N-1帧的压缩视频数据，接着是第N-1帧的压缩音频数据，然后是作为N-1帧的子码A，其后接着的是第N帧的视频数据等等。当然不同的数据存储次序可以另外方案实现。图6的其他时间安排栏描述了所说明的记录次序是如何实施的。任何给定的帧，例如第N帧的压缩视频数据是视频压缩系统6的输出，并且正好先于由音频压缩系统11输出的压缩音频数据。需要有足够的时间用于对当前帧数据执行前文所说的“1-数据块处理”，也就是对压缩的音频数据进行正交变换(如，快速傅立叶变换(FFT))，以便确定象上面对帧所描述的子码A和频谱峰值P(f)，其中在本例中一帧对应于一个单独数据块。这样，对第N帧进行的正交变换先于第N帧的压缩的音频数据输出，而第N帧的子码A的产生在压缩的音频数据输出后立刻完成。而且，每一帧的P(f)存储在存储电路16中。然后，当处理完M帧后，例如在图6例子中是4帧(以帧N-1至N+2表示)，针对该M帧数据块产生子码B，并写入存储电路16。
图7展示当常规记录方式到停止方式再到删除方式过渡时，说明从相应处理系统输出的信号输出时间安排的时间安排图。在这个例子中，假设捕获到第N帧时，实现向停止方式转换。在压缩视频和音频信号以及对应于帧N-1和N的子码A记录到记录介质18上后，所有的存储在存储电路16中的子码B由子码产生系统13读出并且借助于记录数据处理系统17记录到记录介质18上。
用于子码A和B的具体扇区配置和格式对于本发明并不是决定性的。下面是以举例方式说明的。子码A的扇区配置的例子同步模式 8字节子码 9字节奇偶性8字节用户数据 2,048字节ECC(误差校正码) 256字节总计 2,329字节子码A的格式的例子扇区数4字节音频强度 5字节总计 9字节音频强度级的例子000无声001 0级010 1级011 2级1×× N级包括子码B的用户内容表(U-TOC)配置的例子同步模式 8字节奇偶性8字节用户数据 2,048字节子码B 8,192字节ECC(误差校正码) 256字节总计 10,512字节子码B的格式例子0秒型 1字节
1秒型 1字节8,191秒型 1字节总计 8,192字节在上面例子中，“0秒型”表示从再现开始计起，0到1秒时间段里再现的例如音频类型，比如声音、音乐等；“1秒型”表示从再现开始计起，1至2秒时间段里再现的音频类型，等等。“8191秒型”表示从再现开始计起，8191至8192秒时间段里再现的音频类型。例如，音频类型可按如下定义n秒型的例子000无声001音乐-0(例如，器乐)010音乐-1(例如，声乐)011人的声音(例如，交谈)1×× 其他类型因此，可明显地看出，诸如刚才所描述的记录设备100的本发明实施例能便利地接收诸如广播的模拟音频或视听节目，数字地记录它，并同时分析正在记录的音频内容，产生将记录的音频节目的不同部分特征化的用户内容表(U-TOC)。当重放时，用户能便利地使用U-TOC(用诸如已描述的适当的电子设备)，以便找到记录内容的某一部分，跳过不需要的音频类型部分等等。从而，向用户提供了重放时的高效工具。
现在将举例说明再现音频和视频信息的设备，该音频和视频信息已用上面讨论的方式与附加音频特征信息一起存储在数字存储介质上。
图8是展示根据本发明的一个实施例的信息再现设备200举例性说明配置的方框图。记录介质18是类似图1所示的，例如光盘、存储卡或磁硬盘。音频和视频数据和相应于表征音频不同时间段的子码A和B都记录在记录介质18上。如果记录介质是一光盘，数据可按如下格式记录扇区配置的例子同步模式8字节子码9字节奇偶性 8字节用户数据 2,048字节ECC(误差校正码) 256字节总计 2,329字节子码格式的例子扇区段 4字节音频ID(标识符) 5字节总计 9字节作为例子，存储的5字节音频IDs可以以最低一个字节表示音频强度级，如下所示× × × × 00级× × × × 11级× × × × 22级× × × × AN级并且在这个例子中，以最低第二个字节表示音频内容× × × 0 ×无声× × × 1 ×音乐(流行)× × × 2 ×音乐(古典)× × × A ×说话声在以上例子中，×代表一个0至255中的任意值。
尽管上面例子是子码和视频和音频数据置于同一扇区的情况，但是，作为替代形式，可将一给定的扇区只含子码。更进一步，在微型盘(MD)场合，子码可以成批安排在诸如U-TOC区域的指定区域。对于这种情况，设备可以通过与上面例子相同的配置和方法实施。
在下面讨论中，将以假设记录介质18为一光盘的前提下描述再现设备200。驱动电路21(在本场合，是光盘驱动电路)配置为伺服控制光盘18，以便能响应于外控制信号访问特定的光盘扇区。一个光读出装置(未示出)，其可以是再现处理系统22的部件，从盘18读出信号，并且放大和解调它。再现数据处理系统22操作从记录介质18读出的数据中分离出视频数据、音频数据和子码，并且将子码提供给子码检测系统A28。
视频信号带展开处理系统23操作展开由处理系统22提供的压缩的视频数据，并且将展开的数据转换成诸如13.5MHz，YUV的基带信号，或类似物。视频信号D/A转换系统24将接收的数字视频数据转换成模拟视频信号。音频信号带展开处理系统25展开已根据MPEG方案或类似方案压缩的音频数据。音频信号D/A转换系统26将接收的数字音频数据转换成模拟音频信号。
读出区域计算系统27(控制装置)根据由系统控制器29或者子码检测系统A 28(检测装置)送出的控制信号计算记录介质18的扇区号。检测系统28配置成判定从记录介质18读出的子码(和相关的帧)是否对应于当前再现方式的音频类型。检测系统28根据该判定向计算系统27提供控制信号。检测系统28还向视频展开系统23和音频展开系统25提供作为抑制从要跳过的帧来的输出数据指令的控制信号。系统控制器29根据通过输入系统30，例如可压下选择键用户板，由用户输入的数据，操作控制整个记录设备200。设备200的不同系统，如系统22、23、25和27至29可以装备为分立的固件或为具有适当软件在其中运行的公共处理器的部件，以便实现各相应系统的功能。
现在参照图9的流程描述上述图8设备的操作运行。在步骤41，系统控制器29根据用户按压的输入系统30的一个或n个按钮，确定操作方式。操作方式可以从音频和视频数据连续输出的常规再现方式，或者一种或n种在再现时跳过特定音频类型的“跳跃”再现方式中选择。在步骤42，读出区域计算系统27计算要读出的下一个子码的扇区号。接着在步骤S43，将算出的扇区号提供给驱动电路21，并且根据驱动电路21的控制从记录介质18中读出对应于算出扇区号的子码。通过处理系统22将算出的扇区号和相关的子码提供给检测系统28。
在下一步骤S44，确定当前的操作方式是否是常规再现方式，如果是，则程序流向步骤S45，在那里，计算系统27计算出下一帧的扇区号，并且将其提供给驱动电路21。在步骤S46，根据驱动电路21的控制从记录介质18中读出相应于下一帧的压缩音频和视频数据。通过处理系统22(步骤S47，S48)将该压缩视频和音频数据分别传输到视频展开系统23和音频展开系统25。传输到视频展开系统23的压缩的视频数据在那里展开，然后由视频D/A转换器24转换成模拟视频信号，并且最后输出。传输到音频展开系统25的压缩的音频数据在那里展开，由音频D/A转换器26转换成模拟音频信号，然后输出。其后，程序返回到步骤S41重复上面进行的过程。
如果在步骤S44系统控制器29判定当前操作不同于常规再现方式，例如该方式是再现方式A(步骤S49)，或者再现方式B(步骤S51)，那么设备200就根据选择的再现方式控制输出音频和视频数据。例如，在重放时按用户要求所选择的再现方式使设备200跳过一个特定的音频类型。在这种情况下，如果与帧相关的子码对应于要躲避的音频类型，就跳过了该帧。然后，检测系统28指示展开系统23和25不要输出相应于该帧的数据。相伴随，指示计算系统27立刻跳过该帧的扇区，并且移到后继帧扇区上，直到找到具有不同于要避开的子码的帧。
同样地，另一个再现方式也可包括进来，它在重放时只允许一种类型的音频而跳过所有其他类型。在这种情况下，如当前帧的子码没有相应于选择要重放的音频类型时，就象上面描述的那样，检测系统27提供“跳跃”指令给计算系统27和展开系统23、25。然而，再一种再现方式也可包括进来，它执行用户输入的特定的视和/或听速度，在这种情况下，通过计算要再现的帧和要跳过的帧之间的比例，使得能相互同步地跳过视频和音频的信号。
在图9的例子中，假设再现方式A相应于这样一种方式，在该方式中要跳过具有无声或低强度级音频信号的帧。如果在步骤S50判定因为一帧的子码对应于低音频强度级，而要跳过这一帧，那么，程序回到步骤S42和S43，在那里计算后继帧的扇区，读出子码并重复此处理过程。如果该帧不是要跳过的，那么程序就从查询步骤S50返回到步骤S45，以便开始对该帧的音频/视频数据的重放过程。
如上所描述的，通过响应于来自系统控制器29的指令判定主题子码的内容，能执行各种再现操作，然后基于该判定计算读出扇区。使用该技术，由于总是相互同步地跳过或再现视频信号和音频信号，它们两者之间不会出现时间安排上的偏差。
图10是展示在常规再现方式中和在说明的再现方式A中从各自处理系统输出的信号的输出时间安排的时间安排图。在常规的再现方式中，读出的每一帧与子码值无关。在再现方式A中，根据读出子码值可跳过某些帧。在图10的例子中，跳过具有0级和1级的音频强度级的帧，也就是跳过其子码的例证性5字节音频ID的最低位字节是“0”或“1”的帧。这样跳过帧N+1、N+2和N+4，并且根据读出区域计算系统27的控制从记录介质18中读出帧N+3、N+5和N+6。在这个例子中，相互同步地再现非跳过帧，也就是帧N+3、N+5和N+6的视频和音频信号。
图11是展示另一个信息再现设备300的举例性说明配置的方框图，该设备是本发明的另一实施例。再现设备300不同于上述图8设备200的是，用图11中的子码检测系统B 41代替图8中的系统A 28，并且在图11中设有一个存储电路42(存储装置)。由于设备300的其他部件及其操作都与设备200的相应部件是一样的，故在此省略了对其的说明。
子码检测系统B 41配置成能读出在记录介质18上记录的子码，并且其后将这些子码存储在存储电路42中。优选的方案是，这些子码在指定的时间间隔作为一数据块从记录介质18中读出。系统41还操作接收来自系统控制器29以指令其是再现(或跳过)的音频数据的“再现方式”控制信号。作为响应，系统41读出存储在存储器42中的子码，并且根据将该帧的相关子码与选择的再现方式相比较来判断是否再现所给帧的音频/视频数据。然后，系统41根据比较结果控制读出区域计算系统27。
存储电路42是一种半导体存储装置或类似装置，例如随机存取存储器，并且，举例来说，可以按下列子码存储。
地址数据0000 第0帧子码0001 第一帧子码×××× 第N帧子码现在参照图12的流程图阐述再现设备300的操作。在开始(步骤S61)，子码检测系统B 41读出所有存储在记录介质18上的子码，并且将这些子码传输到存储器42存储。子码读出过程是由提供给计算系统27控制指令的系统41完成，该系统41也向驱动电路21提供控制信号，以便访问盘的适当区域。
接着，在步骤S62，根据用户借助于输入系统30按下键的数据输入判定操作方式。在步骤S63，检测系统41从存储器42读出特定帧的子码，也就是在再现序列中选出来作为候选能重放音频/视频数据的下一帧的子码。如果在步骤S64，判定当前操作方式是常规再现方式，那么由于不跳过任何帧，所以子码也就不相干了。在这种情况下，计算系统27计算下一帧的扇区号并且相应地控制驱动电路21(步骤S65)。其后，从记录介质18将下一帧的音频/视频数据读出并提供给再现数据处理系统22(步骤S66)。然后，处理系统22将音频数据和视频数据分离，将音频数据传输给展开系统25和将视频数据传输给展开系统23(步骤S67，S68)。这些信号在各自的展开系统23，25中展开，并由各自的D/A转换器24、26转换成模拟信号，然后输出。其后，为后续帧重复该过程。
如果在步骤S64，系统控制器29判定当前操作方式是不同于常规再现方式的，例如，再现方式A(步骤S69)或再现方式B(步骤S71)，那么按照所选择的再现方式控制设备300输出音频和视频数据。例如，象记录设备200的情况一样，可设计一些可选择的再现方式以使设备300在重放时跳过特定类型的音频。在这种情况下，如果与帧相关的子码对应于要避开的音频类型，那么这些帧就被跳过。另一种再现方式也可包括进来，它只允许重放一种类型的音频而跳过所有其它类型的音频。然而，象前面所述的那样，再一种再现方式也可包括进来，它执行由用户输入的特定视和/或听速度。
在图12的例子中，如果在步骤S70判定由于一帧的子码和再现方式A正相关而跳过该帧的话，(例如无声情况跳过或声乐跳过等)，那么程序返回到步骤S63，在那里读出后续帧的子码并重复该过程。如果该帧不会跳过，则程序返回到步骤S65，如前面描述的，开始对该帧的音频/视频的重放过程。
图13是说明在进行从常规方式向再现方式A转换中从相应处理系统输出的信号的时间安排的时间安排图。当开始打开设备电源或插入一个新的光盘等时，用子码读出方式最初将子码作为一块读出。按常规再现方式，从存储电路42读出相应于当前要重放帧的子码，和从记录介质18中读出该帧的视频和音频数据。将视频数据提供给视频展开系统23并由该系统将其展开，然后由视频D/A转换器系统24将其转换成模拟视频信号，并最后输出。将音频数据提供给音频展开系统25并且由该系统将其展开，然后由音频D/A转换器26将其转换成模拟音频信号以便输出。
按再现方式A，具有表明音频强度级低于一特定级的子码的帧，在重放时将被跳过。在这个例子中，跳过那些音频强度级低于2级的帧而再现那些音频强度高于1级的帧。由于相互同步地跳过视频数据和音频数据，所以再现的视频和音频信号也是相互同步的。
应该懂得，上述记录和再现设备的实施例能够以不超出本发明的思路和范围的各种各样的方式修改。例如，上面实施例特定地说明两级音频-低强度音频和音乐之间的区别，而实施例也能修改成允许区别三种或多种类型的音频信号。再则，替代在为区别音乐和非音乐的计算中对每块检测一个频谱峰值P(f)，这种区别也可以通过检测多个相对于每块最高强度的频谱峰值，并且计算它们的在例如M块上的连续性来实现。作为另一种可选方案，音乐与非音乐和/或无声与非无声的音频之间的区别也可通过使用不同的最新提出的语言识别装置中的一种装置来区别，并作为子码记录区别的结果。
再者，虽然上面的实施例是针对这样情况的，在其中，跳跃是以逐帧为基础发生的，但是在音频系统中由于帧之间的转接而产生的噪声量在每次跳跃前和后可以通过交叉衰减而使其最小。可供选择的方法是，可通过检测交零点方式控制转接。
此外，在上面实施例中，重放和跳过都是根据子码内容以逐帧为基础控制的。但是，一个短的音频/视频段，例如一或两帧段的重放在许多场合也许被作为噪音识别。这问题可通过事先设置要重放的帧的最短连续序列加以解决。然后即使帧的子码表示跳过，但只要最短序列还没有到达，将会重放这些帧而不会跳过。
作为另一种改进型，可以以每两帧而不是象描述的那样以每帧产生子码A(它表示音频强度的特征)。再者，基于子码A的另一种再现方式可以包括进来，它允许用户自动地跳过音频信号的大声部分(音强度级)，例如大声的音乐，而重放低强度级的音频。
再有，虽然上面实施例直接针对使用相关于音频强度级和音乐的子码的应用方式，但是通过产生表示其它音频特征的子码，如识别演讲者的子码能实现不同形式的再现。
虽然结合本发明的优选实施例具体地展示和描述了本发明，但是本技术领域具有一般技能的人会理解，可以不超出本发明的思路和范围对揭示的实施例进行各种改变。因此，打算将所附的权利要求解释为包括在这里所描述的实施例以及其所有的等同物。
权利要求
1.一种用于将至少一个音频信号记录到记录介质上的信息记录设备，包括用于检测该音频信号的特征的检测装置；和用于将相应于所述检测特征的附加信息与该音频信号一起记录到记录介质上的记录装置。
2.根据权利要求1所述的信息记录设备，其中，所述的记录装置还将一个与该音频信号相关连的视频信号同该音频信号和所述的附加信息一起记录到所述的记录介质上。
3.根据权利要求1所述的信息记录设备，其中，所述的记录装置以一种分布方式，将该音频信号和所述的附加信息记录在所述的记录介质的一个公共区域中。
4.根据权利要求3所述的信息记录设备，其中，针对多个该音频信号块的每一块，记录所述的附加信息。
5.根据权利要求1所述的信息记录设备，其中，将所述的附加信息记录在所述的记录介质的一个预定区域中，该区域不同于在其上至少将记录该音频信号的区域。
6.根据权利要求5所述的信息记录设备，其中，在所述的音频信号不被记录的时间间隔里，将所有所述的附加信息记录在所述的预定区域中。
7.根据权利要求1所述的信息记录设备，其中，该检测装置在预定的时间间隔周期性地在该音频信号上进行正交变换，并且通过确定所得能量成分和能量分布之间的相关性检测该音频信号的特征。
8.根据权利要求7所述的信息记录设备，其中，如果相互在预定幅度范围内的频谱峰值的平均连续长度大于特定值，则所述的检测装置检测为音乐的特征。
9.根据权利要求7所述的信息记录设备，还包括一个用于接收多种类型模拟音频信号和根据选择的切换状态在其输出提供所述的音频信号的输入开关，并且其中，所述的检测装置检测作为所选模拟音频信号类型的函数的音频信号的特征。
10.一种用于将至少一个音频信号记录到记录介质上的信息记录方法，包括的步骤是检测音频信号的特征；以及将相应于检测特征的附加信息与音频信号一起记录到记录介质上。
11.一种用于再现至少一个相应于记录在记录介质上的音频数据的音频信号的信息再现设备，该记录介质上也记录有相关于至少该音频信号的附加信息，该信息再现设备包括用于在任何该音频信号的相应部分再现之前，读出该附加信息部分的阅读装置；用于根据所述的附加信息的所述读出部分和一个当前操作方式，确定是否再现所述的该音频信号的相应部分的决策装置；以及用于根据所述决策装置的决定，控制该音频信号相应部分再现的控制装置。
12.根据权利要求11所述的信息再现设备，其中相应于该音频信号的视频信号也记录在所述的记录介质上；所述的阅读装置在任何该视频信号和音频信号的相应部分再现前读出该附加信息部分；所述的决策装置根据附加信息的读出部分和当前的操作方式，确定是否再现相应于附加信息读出部分的音频信号部分和视频信号部分；所述的控制装置根据所述的决策装置的决定，控制视频信号和音频信号部分的再现。
13.根据权利要求12所述的信息再现设备，其中，所述的控制装置控制再现，因而以相互同步方式再现视频信号和音频信号。
14.根据权利要求12所述的信息再现设备，其中，以分布方式将附加信号记录在记录有视频信号和音频信号的记录介质的一个区域中。
15.根据权利要求14所述的信息再现装置，其中，所述的音频信号和相关的视频信号按块记录在记录介质上，并且为这样记录的视频信号和音频信号的每块记录附加信号。
16.根据权利要求12所述的信息再现设备，其中，将附加信号记录在所述的记录介质的一个预定区域中，该区域不同于在其上记录有视频信号和音频信号的区域。
17.根据权利要求16所述的信息再现设备，其中，所述的阅读装置在任何所述的音频和视频信号再现前，作为一块读出所有所述的附加信息。
18.根据权利要求17所述的信息再现设备，还包括用于存储已经由所述的阅读装置以一个块读出的附加信息的存储装置，其中所述的决策装置作为存储在存储装置中的附加信息部分的功能，能操作确定是否再现相应于附加信息部分的视频信号和音频信号部分。
19.根据权利要求12所述的信息再现设备，其中，附加信息表示音频信号的一个强度等级。
20.根据权利要求12所述的信息再现设备，其中，附加信息表示音频信号的一种类型。
21.根据权利要求12所述的信息再现设备，其中，所述的控制装置控制视频信号和音频信号的再现，使得再现的视频和音频信号部分和不再现的视频和音频信号部分之间的比例是一个特定的值。
22.一种用于再现至少一个相应于记录在记录介质上的音频数据的音频信号的信息再现方法，该记录介质上也记录有相关于至少该音频信号的附加信息，该信息再现方法包括的步骤是在任何该音频信号的相应部分再现前，读出该附加信息部分；根据附加信息的读出部分和一个当前的操作方式，确定是否再现相应于附加信息读出部分的该音频信号部分；以及根据判断步骤，控制所述的相应的音频信号部分的再现。
23.一种用于至少将一个音频信号数字地记录到记录介质上的记录设备，包括一个配置成检测多个时间段音频信号的每段的特征的音频特征提取系统；以及一个用于将识别每个所述音频信号时间段的所述检测特征的特征信息与相应于该音频信号的数据一起记录在记录介质上的记录处理系统。
24.根据权利要求23所述的记录设备，其中，记录处理系统还操作将相应于该音频信号的视频信号与该音频信号和所述的特征信息一起记录到记录介质上。
25.根据权利要求23所述的记录设备，其中，该记录处理系统以分布方式将所述的特征信息记录在记录介质的至少要记录该音频信号的区域中。
26.根据权利要求23所述的记录设备，其中，所述的音频特征提取系统配置成检测至少一个所述的特征，该特征是从由一个音频功率级和一个音乐特征组成的组中选取的。
27.根据权利要求23所述的记录设备，其中，将所述的特征信息记录在记录介质的预定的不同于至少记录该音频信号区域的区域中。
28.根据权利要求27所述的记录设备，其中，在所述的音频信号不被记录在所述记录介质的时间间隔里，将所有所述的检测出的特征记录在预定的区域中。
29.根据权利要求24所述的记录设备，其中，每个所述的时间段包括至少一帧的音频和视频信号。
30.根据权利要求29所述的记录设备，其中，所述的音频特征提取系统操作为对每个预定的第一组的帧检测一个音频级特征和对每个预定的第二组的帧检测一个音频类型特征，而该预定的第二组帧比所述的预定的第一组帧大。
31.根据权利要求30所述的记录设备，其中，所述的预定的第一组帧由一个单帧构成。
32.根据权利要求23所述的记录设备，与其结合在一起还包括，一个用于根据各个所述段的所述特征信息和一个与至少一个所述特征关连的选择再现方式之间的相关性，选择性地再现所述音频信号的所述时间段的再现系统。
33.根据权利要求32所述的记录设备，其中，所述的选择再现方式是一种只再现具有特定特征的音频信号而跳过其他音频信号的方式。
34.根据权利要求32所述的记录设备，其中，所述的选择再现方式是一种只再现没有特定特征的音频信号而跳过其他音频信号的方式。
35.一种用于将至少一个音频信号数字地记录到记录介质上的记录方法，包括的步骤是检测多时间段音频信号每段的特征；产生识别每个所述音频信号时间段的所述检测特征的特征信息；及将所述的特征信息与对应于该音频信号的数据一起记录在记录介质上。
36.一种用于再现至少一个相应于记录在记录介质上的音频数据的音频信号的信息再现设备，该记录介质上也记录有相对于至少该音频信号的特征信息，该信息再现设备包括配置成在任何音频信号相应部分重放前，读出特征信息部分的数据阅读系统；用于根据所述特征信息读出部分和当前的一操作方式，确定是否再现所述音频信号相关部分的处理电路；以及用于根据所述处理电路的判断，控制音频信号部分再现的控制器。
37.根据权利要求36所述的信息再现设备，其中，相应于该音频信号的视频信号也记录在记录介质上；所述数据阅读系统在任何视频信号和音频信号的相应部分重放前，读出该特征信息部分；所述的处理电路根据该特征信息的读出部分和当前操作方式，确定是否再现对应于特征信息的读出部分的音频信号部分和视频信号部分；以及所述的控制器根据所述处理电路的判断，控制音频信号和视频信号部分的再现。
38.根据权利要求37所述的信息再现设备，其中，所述的控制器是这样控制再现的，以致于视频信号和音频信号相互同步地再现。
39.根据权利要求37所述的信息再现设备，其中，所述的特征信息以分布方式记录在已记录有视频信号和音频信号的记录介质的一个区域中。
40.根据权利要求37所述的信息再现设备，其中，所述的音频信号和相关的视频信号按块记录在记录介质上，并且对这样记录的视频信号和音频信号的每块记录所述的特征信息。
41.根据权利要求37所述的信息再现设备，其中，对记录在记录介质上的多帧视频和音频信号的每一组记录所述的特征信息。
42.根据权利要求37所述的信息再现设备，其中，在记录介质的一特定区域里记录特征信息，该特定区域不同于记录视频信息和音频信息的区域。
43.根据权利要求42所述的信息再现设备，其中，该数据阅读系统配置成在一个配给的无音频信号再现的时间间隔里，读出特征信息。
44.根据权利要求43所述的信息再现设备，还包括一个用于存储由所述的数据阅读系统已读出的特征信息的存储器，其中，该处理电路根据存储在存储器中的特征信息部分，确定是否再现相应于特征信息部分的视频信号和音频信号的部分。
45.根据权利要求37所述的信息再现设备，其中，该特征信息表示该音频信号的强度。
46.根据权利要求37所述的信息再现设备，其中，该特征信息表示该音频信号的类型。
47.根据权利要求37所述的信息再现设备，其中控制器控制视频信号和音频信号的再现，使得在再现的视频和音频信号部分与不再现的视频和音频信号部分之间的比率是一特定值。
48.根据权利要求37所述的信息再现设备，还包括一个用于使用户能选择一种与至少一种音频信号特征相关的再现方式的输入系统。
49.根据权利要求48所述的信息再现设备，其中，所述的再现方式是一种只再现具有特定特征的音频信号而跳过其他音频信号的方式。
50.根据权利要求48所述的信息再现设备，其中，所述的再现方式是一种只再现没有特定特征的音频信号而跳过其他音频信号的方式。
全文摘要
一种实现接收模拟音频和视频信号,将其数字化和压缩,并将压缩的音频和视频信号记录在数字记录介质上的记录设备。当接收和记录音频和视频信号时,对音频信号的时间段作某种特征分析,如是否是对应于器乐、声乐或交谈的时间段。并对应于特征分析作一内容表,并将其数字化地存储在存储介质上。结果,在全部时间上将记录的音频信号特征化,如在逐帧基础上。再现设备能使使用者有选择地再现所记录的音频和视频段。
文档编号G11B27/11GK1197984SQ9712646
公开日1998年11月4日申请日期1997年12月13日优先权日1996年12月13日
发明者高桥孝夫, 秋叶俊哉, 荒井尚久, 富田真己, 太田正志, 村林升, 水藤太郎申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高桥孝夫;秋叶俊哉;荒井尚久;富田真己;太田正志;村林升;水藤太郎
技术所有人：索尼公司
我是此专利的发明人

上一篇：用于磁性信息存储介质的玻璃-陶瓷基片的制作方法
上一篇：双焦光学头装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。