数字信号处理装置、数字信号处理方法及数据记录媒体的制作方法

文档序号:6743744阅读:151来源:国知局
专利名称:数字信号处理装置、数字信号处理方法及数据记录媒体的制作方法
技术领域
本发明涉及对数字音频信号等进行比特压缩后的压缩数据的记录/再生、记录该压缩数据的记录媒体及压缩数据的传送系统;特别是涉及根据输入信号在时间轴上的波形幅度的变化而改变该处理块的时间长度、对数字信号进行信息压缩以后,进行记录或传送和/或把数字信号再生或接收以后,进行扩展的数字信号处理装置、数字信号处理方法及数据记录媒体。
背景技术
以前,本申请书申请人,在例如日本专利公开公报特开平4-105269号、特开平4-105270号、特开平4-105271号、特开平4-105272号中,提出了对输入的数字音频信号进行比特压缩以后,以给定的数据量作为记录单位,以脉冲串方式进行记录的技术。
这种技术利用磁光盘作为记录媒体,对所谓CD-I(交互的小型磁盘)或CD-ROM XA音频数据格式中规定的AD(自适应差分)PCM音频数据进行记录/再生,例如,以该ADPCM数据的32个段和用于交错处理连接的几个段作为记录单位,以脉冲串方式记录在磁光盘上。
在利用这种磁光盘的记录/再生装置中的ADPCM音频有几种方式可供选择,例如,与一般的CD的再生时间相比,规定了压缩率为2、取样频率为37.8KHz的A级;压缩率为4、取样频率为37.8KHz的B级;压缩率为8、取样频率为18.9KHz的C级。即,例如在上述B级的情况下,把数字音频数据压缩到 左右,以该B级方式记录的磁盘,其再生时间(重放时间)成为标准CD格式(CD-DA格式)情况下的4倍。由于能以较小的磁盘达到与标准12cm的磁盘相同的记录/再生时间,所以,可以谋求装置的小型化。
但是,因为磁盘的转速与标准CD相同,所以,例如在上述B级的情况下,在每个给定的时间内,可以得到为该再生时间4倍的压缩数据。因此,例如当以段或群等为时间单位时,能把相同的压缩数据重复读出4次,只把其中的一次压缩数据用于音频再生。具体地说,当扫描(跟踪)螺旋形记录磁迹时,进行每一周都回到原始磁迹位置上的跟踪跳跃,在把每一条磁迹都重复4次的跟踪状态下,进行再生动作。例如,在重复4次的读数中,如果至少有一次得到正常的压缩数据即可,很适用于由干扰引起的差错严重的特别是小型便携式装置。
申请人还在专利公开公报特开平5-206866号中,提出了用来实现效率高、压缩好的比特分配方法。这种技术在进行比特分配时,依赖于所谓临界频带等各小块中的信号大小的比特分配,要在根据对应于该小块的频带加权以后进行。如果采用这种技术,则在各小块内的频谱的大小不产生极端分散的情况下,可以进行良好的压缩。
但是,在各小块内的频谱大小极端分散或合有突出的峰值分量时,换言之,在要掩蔽的声音为音调型的情况下;或在表示与某一值(“某一值”指的是,把各小块中信号的大小取为各小块内的最大值、或者,取为利用各小块的总和或平均等求出的值)相同的各小块内,信号的大小并无极端分散的小块的情况下,要掩蔽的声音与噪声型的小块区别不开,形成了利用上述技术也得不到良好结果的情况。这种情况的起因在于,考虑到掩蔽效果时,这种掩蔽效果的大小随掩蔽声的性质(即,掩蔽声是噪声型的还是音调型的)而改变。
因此,在上述情况下,利用上述技术,需要较多的比特,即,必须采用使音调型信号与构成掩蔽声的小块一致的比特分配方法,结果是在以较少的比特分配完成的、掩蔽声为噪声型的那些小块上须分配另外的比特,导致压缩时效率降低。
本发明就是鉴于这样的实际情况而提出的,其目的在于提供应用与掩蔽声性质一致的比特分配方法的数字信号处理装置等。发明的公开本发明是为了达到上述目的而提出的,与本发明有关的第一数字信号处理装置的特征为,在把数字信号压缩以后进行记录或传送的信号处理装置中具有把输入信号按时间和频率细分为多个块,在每一个块中从各块内的分量中的大分量开始按顺序提取一个或多个分量的提取装置;根据把上述已提取的分量除掉以后各块分量的大小与上述已提取的分量的大小之差分,确定对上述各块的比特分配率的比特分配装置;根据上述比特分配率,把各块分量量化以后,产生压缩数据的编码装置。
与本发明有关的第二数字信号处理装置的特征为,在第一数字信号处理装置中,上述编码装置把上述各块内的分量按照该块内的代表值归一化。
与本发明有关的第三数字信号处理装置的特征为,在第一数字信号处理装置中,上述比特分配装置还根据上述各块分量的大小、并且,根据上述各块对应的频带进行加权,确定上述比特分配率。
与本发明有关的第四数字信号处理装置的特征为,在第一数字信号处理装置中,上述提取装置根据上述各块对应的频带,切换上述提取分量的个数。
与本发明有关的第一数字信号处理方法的特征为,在把数字信号压缩以后进行记录或传送的信号处理方法中,把输入信号按时间和频率细分为多个块,在每一个块中从各块内的分量中的大分量开始按顺序提取一个或多个分量;根据把上述已提取的分量除掉以后各块分量的大小与上述已提取的分量的大小之差分,确定对上述各块的比特分配率;根据上述比特分配率,把各块分量量化以后,产生压缩数据。
与本发明有关的第二数字信号处理方法的特征为,在第一数字信号处理方法中,还包括把上述各块内的分量按照该块内的代表值归一化的步骤。
与本发明有关的第三数字信号处理方法的特征为,在第一数字信号处理方法中,还包括根据上述各块分量的大小、并且,根据上述各块对应的频带进行加权,确定上述比特分配率的步骤。
与本发明有关的第四数字信号处理方法的特征为,在第一数字信号处理方法中,根据上述各块对应的频带,切换上述提取分量的个数。
与本发明有关的第一数据记录媒体的特征为,在记录了压缩数据的数据记录媒体中,把输入信号按时间和频率细分为多个块,在每一个块中从各块内的分量中的大分量开始按顺序提取一个或多个分量;根据把上述已提取的分量除掉以后各块分量的大小与上述已提取的分量的大小之差分,确定对上述各块的比特分配率;根据上述比特分配率,把各块分量量化以后,产生压缩数据;把上述压缩数据记录到记录媒体上。
与本发明有关的第二数据记录媒体的特征为,在第一数据记录媒体中,还包括把上述各块内的分量按照该块内的代表值归一化的步骤而形成记录了压缩数据的记录媒体。
与本发明有关的第三数据记录媒体的特征为,在第一数据记录媒体中,还包括根据上述各块分量的大小、并且,根据上述各块对应的频带进行加权,确定上述比特分配率的步骤而形成记录了压缩数据的记录媒体。
与本发明有关的第四数据记录媒体的特征为,在第一数据记录媒体中,还包括根据上述各块对应的频带,切换上述提取分量的个数的步骤而形成记录了压缩数据的记录媒体。
即,在本发明中,把输入信号按时间和频率细分为多个块,在每一个块中从各块内分量中大的分量开始按顺序提取一个或多个分量;根据把上述已提取的分量除掉以后各块分量的大小与上述已提取分量的大小之差分,确定对上述各块的比特分配率;根据上述比特分配率,把各块分量量化以后,产生压缩数据;因比,能够防止压缩效率的降低,能够在同一比特率下得到较好的声音质量,或者,在同一声音质量下,以较低的比特率就能够实现记录、传送等。
附图的简单说明

图1为与本发明有关的数字信号处理装置的一个实施例中的压缩数据的记录/再生装置(磁盘记录/再生装置)结构例的方框电路图;图2为本实施例中可用于比特率压缩编码的高效率压缩编码用的编码器的一个具体例的方框电路图;图3为比特压缩时正交变换块结构图;图4为确定正交变换块大小的电路结构例的方框电路图;图5为时间上相邻的正交变换块中时间长度的变化与正交变换时用的窗口形状的关系图;图6为正交变换时用的窗口形状的详细例图;图7为实现比特分配运算功能的自适应比特分配电路例子的方框电路图;图8为依赖于峰值分量的比特分配效果的图;图9为输入具有比较平坦并且为噪声型频谱的信号时的比特分配图;图10为输入具有峰值分量的信号时的比特分配图;图11为上述实施例中可用于比特率压缩编码的高效率压缩编码用的解码器的一个具体例的方框电路图。
用于实施本发明的最佳形式首先,图1为本发明数字信号处理装置(压缩数据的记录和/或再生装置9)的一个实施例的概略结构的方框电路图。
在图1所示压缩数据的记录和/或再生装置9中,首先使用由主轴马达51进行旋转驱动的磁光盘1作为记录媒体。当对磁光盘1进行数据记录时,例如,在利用光学头53以激光照射的状态下,通过磁头54加上相应于记录数据的调制磁场,进行所谓磁场调制记录,沿着磁光盘1的记录磁迹记录数据。再生时,利用光学头53以激光跟踪磁光盘1的记录磁迹,以磁光学方式进行再生。
光学头53例如由激光二极管等激光源、准直镜、物镜、偏振光分光束镜、柱面透镜等光学部件,以及具有给定特性的光接收部的光检测器等构成。光学头53隔着磁光盘1设置在与上述磁头54相对的位置上。在磁光盘1上记录数据时,利用后面所述的记录系统的磁头驱动电路66驱动磁头54,加上相应于记录数据的调制磁场,同时,利用光学头53,以激光照射到磁光盘1的目标磁迹上,利用磁场调制方式进行热磁记录。该光学头53检测照射到目标磁迹上的激光的反射光,例如,利用所谓像散法检测聚焦误差;例如,利用所谓推挽法检测跟踪误差。从磁光盘1再生数据时,光学头53检测上述聚焦误差和跟踪误差,同时,检测来自激光目标磁迹的反射光偏振角(克尔旋转角)的不同,产生再生信号。
光学头53的输出送给RF电路55。该RF电路55从光学头53的输出中抽取聚焦误差信号和跟踪误差信号,送给伺服控制电路56,同时,把再生信号二值化以后,送给后面所述的再生系统的解码器71。
伺服控制电路56例如由聚焦伺服控制电路和跟踪伺服控制电路、主轴马达伺服控制电路、滑轨伺服控制电路等构成。上述聚焦伺服控制电路对光学头53的光学系统进行聚焦控制,使上述聚焦误差信号变成零。上述跟踪伺服控制电路对光学头53的光学系统进行跟踪控制,使上述跟踪误差信号变成零。上述主轴马达伺服控制电路控制主轴马达51以给定的转速(例如,恒定的线速度)旋转驱动磁光盘1。上述滑轨伺服控制电路把光学头53和磁头54移动到由系统控制器57指定的磁光盘1的目标磁迹位置上。进行这样的各种控制动作的伺服控制电路56,把表示由该伺服控制电路56控制的各单元动作状态的信息送给系统控制器57。
键盘输入操作单元58和显示单元59连接到系统控制器57上。该系统控制器57以由键盘输入操作单元58的操作输入的信息指定的动作方式,进行记录系统和再生系统的控制。系统控制器57根据利用头部时间和子码的Q数据等从磁光盘1的记录磁迹再生的段单位的地址信息,管理光学头53和磁头54跟踪的上述记录磁迹上的记录位置和再生位置。系统控制器57根据数据压缩率和上述记录磁迹上的再生位置信息,进行将再生时间显示在显示单元59上的控制。
该再生时间显示是指把利用所谓头部时间和所谓子码的Q数据等从磁光盘1的记录磁迹再生的段单位的地址信息(绝对时间信息),乘以数据压缩率的倒数(例如, 压缩时,为4),求出实际的时间信息,在显示单元9上显示出来。记录时,例如,在磁光盘等的记录磁迹上预先记录了绝对时间信息(预定格式)的情况下,则读出该预定格式的绝对时间信息、乘以数据压缩率的倒数,也能以实际的记录时间表示现在的位置。
其次,在该磁盘记录/再生装置的记录/再生设备的记录系统中,来自输入端子60的模拟音频输入信号AIN通过低通滤波器61,送给A/D变换器62,该A/D变换器62把上述摸拟音频输入信号AIN量化。从A/D变换器62得到的数字音频信号送给ATC(自适应变换编码,Adaptive Transform Coding)PCM编码器63。来自输入端子67的数字音频输入信号DIN通过数字输入接口电路68,送给ATC编码器63。ATC编码器63对利用上述A/D变换器62将上述输入信号AIN量化了的给定传送速度的数字音频PCM数据,进行比特压缩(数据压缩)处理。这里,虽然是以该压缩率为4进行说明的,但是,本实施例的结构并不依赖于该倍率,利用应用例,可以任意地选择该倍率。
存储器64由系统控制器57控制数据的写入和读出,暂时存储从ATC编码器63送来的ATC数据,根据需要,可作为在磁盘上进行记录用的缓冲存储器。即,例如,从ATC编码器63送来的压缩音频数据,该数据传送速度为标准CD-DA格式的数据传送速度(75段/秒)的 ,即,降低到18.75段/秒,把该压缩数据连续写入存储器64。该压缩数据(ATC数据)虽然如上所述那样每4段记录1段就足够了,但因这样每4段进行1段记录实际上几乎不可能,所以,还是像后面所述那样进行段的连续记录。该记录是这样进行的,即通过停止期间,由给定的多个段(例如,32个段+n个段)构成的群为单位,用与标准CD-DA格式相同的数据传送速度(75段/秒),以脉冲串方式进行记录。即,在存储器64中,以相应于上述比特压缩率18.75 段/秒的低传送速度连续写入的ATC音频数据,作为记录数据,并用上述75段/秒的传送速度以脉冲串方式读出。有关该读出/记录的数据,包括记录停止期间的整个数据传送速度虽然是上述18.75段/秒的低速度,但是,在以脉冲串方式进行的记录动作的时间内,瞬时数据传送速度仍是上述标准的75段/秒。因此,当磁盘的旋转速度与标准CD-DA格式的速度相同(恒定的线速度)时,则进行与该CD-DA格式相同的记录密度和存储方式的记录。
以上述75段/秒的(瞬时的)传送速度、以脉冲串方式从存储器64读出的ATC音频数据(即,记录数据),送给编码器65。这里,在从存储器64送给编码器65的数据串里,在一次记录中连续记录的单位是由多个段(例如,32个段)构成的群以及用于连接在该群前后位置配置的群的n个段。把该连接各群用的段设定得长于编码器65中的交错长度,使得即使交错,对于其它群的数据也无影响。
编码器65对从存储器64以上述脉冲串的方式送来的记录数据,进行用于误码校验的编码处理(附加奇偶校验和交错处理)、和EFM编码处理等。由该编码器65进行了编码处理的记录数据送给磁头驱动电路66。该磁头驱动电路66与磁头54连接,把相应于上述记录数据的调制磁场加到磁光盘1上,驱动磁头54。
系统控制器57对存储器64进行上述那样的存储控制,同时,还利用该存储控制,进行记录位置的控制,以便把从存储器64以脉冲方式读出的上述记录数据连续地记录到磁光盘2的记录磁迹上。该记录位置的控制是这样进行的,即由系统控制器57管理从存储器64以脉冲串方式读出的上述记录数据的记录位置、并将指定在磁光盘1的记录磁迹上的记录位置的控制信号送给伺服控制电路56。
接着,说明该磁光盘记录/再生单元的再生系统。该再生系统用来再生由上述记录系统在磁光盘1的记录磁迹上连续记录的记录数据;该再生系统备有解码器71,利用光学头53用激光跟踪磁光盘1的记录磁迹,把得到的再生输出由RF电路55二值化以后,送给该解码器71。这时,不仅能从磁光盘读出,而且,还能从与小型磁盘(CD,COMPACT DISC)相同的再生专用光盘读出。
解码器71对应于上述记录系统中的编码器65,该解码器71在对由RF电路55二值化了的再生输出进行用于误码校验的如上所述的解码处理和EFM解码处理等处理以后,以此额定传送速度快的75段/秒的传送速度再生音频数据。把由该解码器71得到的再生数据送给存储器72。
存储器72中的数据的写入和读出由系统控制器57控制,从解码器71以75段/秒的传送速度送来的再生数据,以该75段/秒的传送速度以脉冲串方式写入存储器72。该存储器72把以上述75段/秒的传送速度以脉冲串方式写入的上述再生数据,以额定75段/秒的传送速度的1/4即18.75段/秒连续地读出。
系统控制器57对存储器进行控制,以75段/秒的传送速度把再生数据写入存储器72,同时,以上述18.75段/秒的传送速度从存储器72连续地读出上述再生数据。另外,系统控制器57对存储器72进行上述那样的存储控制,同时,还进行再生位置的控制以便把利用该存储控制从存储器72以脉冲串方式写入的上述再生数据,从磁光盘1的记录磁迹上连续再生。该再生位置的控制是这样进行的,即由系统控制器57管理从存储器72以脉冲串方式读出的上述再生数据的再生位置、并将指定在磁光盘1或光盘1的记录磁迹上的再生位置的控制信号送给伺服控制电路56。
把作为从存储器72以18.75段/秒的传送速度连续读出的再生数据而得到的ATC音频数据,送给ATC解码器73。该ATC解码器73通过对ATC数据进行4倍的数据扩张(比特扩张),再生16比特的数字音频数据。来自该ATC解码器73的数字音频数据送给D/A变换器74。
D/A变换器74把从ATC解码器73送来的数字音频数据变换成模拟信号,形成模拟音频输出信号AOUT。利用该D/A变换器74得到的模拟音频信号AOUT,通过低通滤波器75从输出端子76输出。
接着,详细说明ATC编码器63中的高效率压缩编码方法。即,参考图2以后的附图,说明有关利用频带分割编码(SBC)、自适应变换编码(ATC)和自适应比特分配等各种技术对音频PCM信号等输入数字信号进行高效率编码的技术。
在图2所示具体的高效率编码装置中,把输入数字信号分割成多个频带,同时,使频率最低的两个相邻频带的带宽相同,在较高的频带上,频率越高,带宽选得越宽,在每个频带内进行正交变换,对得到的频率轴上的频谱数据,在低频带,在考虑了后面所述的人的听觉特性的每一个所谓临界带宽内、在中高频带,在考虑了块浮动效率而把临界带宽细分以后的每一个频带内进行自适应的比特分配和编码。这样的块通常是产生量化噪声的块。在本发明实施例中,在正交变换之前,根据输入信号自适应地改变块的大小(块长),同时,以该块为单位进行浮动处理。
即,在图2中,例如,当取样频率为44.1KHz时,把0~22KHz的音频PCM信号送到输入端子200上。例如,利用所谓QMF滤波器等频带分割滤波器201,把该输入信号分割成0~11KHz频带和11KHz~22KHz频带;利用相同的所谓QMF滤波器等频带分割滤波器202,把0~11KHz频带分割成0~5.5KHz频带和5.5KHz~11KHz频带。把来自频带分割滤波器201的11KHz~22KHz频带的信号送给正交变换电路之一例的MDCT电路203,把来自频带分割滤波器202的5.5KHz~11KHz频带的信号送给MDCT电路204,把来自频带分割滤波器202的0~5.5KHz频带的信号送给MDCT电路205,分别进行MDCT处理。
作为把上述输入的数字信号分割成多个频带的方法,例如,有QMF滤波器,在1976年R.E.Crochiere著“Digital Coding ofSpeech In Subbznds(语言在子带中的数字编码)”,BellSgst.Tech.J.Vol.55,No.8,1976中作了描述。还有,在1983年BOSTON ICASSP会议上,Joseph H.Rothweiler发表的“Polyphase Quadrature Filters-A New Subband CodingTechnique(多极正交滤波器—一种新的子带编码技术)”中,描述了等带宽的滤波器分割方法。
作为上述正交变换,例如,有把输入音频信号以给定单位时间(帧)进行块化,通过对每一块进行高速付里叶变换(FFT)、离散余弦变换(DCT)、修改DCT变换(MDCT)等,把时间轴变换成频率轴的正交变换。有关上述MDCT,在1987年ICASSP会议上,Surrey Royal Melbourne技术学院J.P.Princen A.B.Bradley发表的“Subband/Transform Coding Using Filter Bank DesignsBased On Time Domain Aliasing Cancellatlon(利用基于时域混淆隐匿的滤波器存储体设计的子带和变换编码)”中作了描述。
图3示出了送给各MDCT电路203、204、205的有关每个频带的块的标准输入信号的具体例。在该图3的具体例中,3个滤波器的输出信号在每个频带中独立地分别具有多个大小不同的正交变换块,可以利用信号的时间特性和频率分布等,切换时间分辨力。在信号在时间上为准稳恒的情况下,正交变换块的大小较大,为11.6ms,即图3(A)中的长方式(Long Mode);在信号为非稳定的情况下,把正交变换块的大小进一步2分割和4分割。还有如图3(B)中的短方式(Short Mode),把整块4分割为2.9ms的情况;如图3(C)中的中间方式(Middle Mode A)、图3(D)中的中间方式(Middle Mode B)那样,把一部分2分割为5.8ms、把另一部分4分割为2.9ms的时间分辨力,从而成为自适应于实际的复杂输入信号了。对该正交变换块大小的分割,只要处理装置的规模允许,如果进行更复杂的分割,显然,效果就会更好。这种块大小的决定可以利用图2中的块大小决定电路206、207、208来决定,再传送给各MDCT电路203、204、205,同时,作为该块的块大小信息从输出端子216、217、218输出。
图4示出了块大小决定电路的详细结构。这里,以图2中块决定电路206为例来说明。图2中QMF 201的输出中,11KHz~22KHz的输出通过图4中的输入端子401送给功率计算电路404。图2中QMF 202的输出中,5.5KHz~11KHz的输出通过图4中的输出端子402送往功率计算电路405;0~5.5KHz的输出通过图4中的输入端子403送往功率计算电路406。另外,图2中块大小决定电路207、208除了送入图4中输入端子401、402、403的输入信号与块大小决定电路206的情况不同以外,动作是相同的。在各块大小决定电路206、207、208上的各个输入端子401、402、403构成矩阵结构,即,块大小决定电路207的输入端子401连接着图2中的QMF 202的5.5KHz~11KHz的输出端;同样,输入端子402上连接着0~5.5KHz的输出端。有关块大小决定电路208的结构,也是同样的。
图4中,各功率计算电路404、405、406,把输入的时间波形在恒定的时间内积分,从而求出各频带的功率。这时,积分的时间范围必须短于上述正交变换块大小中最小时间块的时间。另外,除了上述计算方法以外,例如,用正交变换块大小中最小时间范围内最大幅度的绝对值或幅度的平均值来代表功率,也能得到同样的效果。功率计算电路404的输出送给变化成分抽取电路408和功率比较电路409,功率计算电路405、406的输出分别送给功率比较电路409。在变化成分抽取电路408中,求出从功率计算电路404送来的功率差分系数,把它作为功率变化信息送往块大小的一次决定电路410和存储器407。在存储器407中,存储从变化成分抽取电路408送来的功率变化信息的时间长于上述正交变换块大小的最大时间。这是因为在时间上相邻的正交变换块通过正交变换时的窗口处理互相产生影响,所以,块大小一次决定电路410中需要在时间上相邻的前1个块的功率变化信息。在块大小一次决定电路410中,以从变化成分抽取电路408送来的该块的功率变化信息、和从存储器407送来的时间上相邻的该块前1个块的功率变化信息为基础,根据在该频率带内功率随时间的移动,来确定该频带正交变换块的大小。这时,在确认大于某一移动的情况下,当然应该选择时间较短的正交变换块的大小;但是,即使该移动点是固定的时,也能得到效果。另外,在采用与频率成比例关系的值时,即在频率高的场合下,因移动大,选用时间短的块大小;在频率低的场合下,与频率高的场合相比移动小,如果确定用时间短的块大小,效果就更好。虽然平稳变化的值是合乎理想的,但是,即使是多个阶梯那样的阶梯形变化,也没有关系。把如上那样确定的块大小传送给块大小修正电路411。
另一方面,在功率比较电路409中,在同一瞬间和在时间轴上产生掩蔽效果的时间范围内,对从各功率计算电路404、405、406送来的各频带功率信息进行比较,求出其它频带在功率计算电路404的输出频带内产生的影响,并传送给块大小修正电路411。在块大小修正电路411中,根据从功率比较电路409送来的掩蔽信息、和从延时器组412、413、414各抽头送来的过去的块大小信息,对从块大小一次决定电路410送来的块大小进行选择时间较长的块大小那样的修正,输出给延时器412和窗口形状决定电路415。块大小修正电路411的作用是利用这样的特性,即在该频带中即使前回波成问题的情况下,在其它频带、特别是在比该频带低的频带中,存在着具有大振幅信号的情况。由于掩蔽效果,在听觉上前回波也不成问题,或者使问题减轻了。上述所谓掩蔽是利用人的听觉上的特性,借助某一信号把其它信号掩蔽掉,使后者听不到的现象,这种掩蔽效果有由时间轴上的音频信号产生的时间轴掩蔽效果和由频率轴上的信号产生的同一瞬间的掩蔽效果。利用这些掩蔽效果,即使被掩蔽的部分上有噪声,该噪声也听不到了。因此,在实际的音频信号中,这种在掩蔽范围内的噪声被作为可以允许的噪声。
在延时器组412、413、414中,把过去正交变换的块大小顺序地记录下来,从各抽头,即从延时器组412、413、414的输出端输出给块大小修正电路411。同时,延时器412的输出连接到输出端子417上。延时器组412、413的输出连接到窗口形状决定电路415上。来自该延时器组412、413、414的输出在块大小修正电路411里把在较长时间范围内块大小的变化用于该块的块大小决定中,例如,在由于过去频繁地选择时间较短的块大小的情况下,能够判断出时间短的块大小的选择增多了;在没有选择时间短的块大小的情况下,能够判断出时间长的块大小的选择增多了。还有这样的情况,该延时器组在窗口决定电路415和输出端子417中除了必要的延时器412、413以外,其抽头个数可以根据装置的实际结构和规模而增、减使用。在窗口形状决定电路415中,根据块大小修正电路411的输出(即,该块在时间上相邻的后一个块大小)、延时器412的输出(即,该块的块大小)、延时器413的输出(即,该块在时间上相邻的前一个块大小),确定上述图2中各MDCT电路203、204、205中使用的窗口形状,输出给输出端子416。图4中的输出端子417(即,块大小信息)和输出端子416(即,窗口形状信息),作为图2中块大小决定电路206、207、208的输出连接到各单元上。
现在,说明窗口形状决定电路415中决定的窗口的形状。图5示出了相邻的块和窗口形状的样子。从图5a~c可知,如图中的虚线和实线所示,在正交变换中使用的窗口与在时间上相邻的块之间有重迭部分,在本实施例中,因为采用了一直到相邻块的中心都重迭着的形状,所以,窗口的形状随相邻块的正交变换的大小而改变。
图6示出了上述窗口形状的详细情况。图6中,窗口函数f(n)、g(n+N)作为满足下列(1)式的函数给出。
f(n)·f(L-1-n)=g(n)·g(L-1-n)(1)f(n)·f(n)+g(n)·g(n)=10≤n≤L-1如果相邻变换块的长度相同,则该(1)式中的L就是变换块的长度;但是,在相邻的变换块的长度不同的情况下,假定较短变换块的长度为L,较长变换块的长度为K,则在不重迭区域内的窗口由下列(2)式给出。
f(n)=g(n)=1k≤n≤3k/2-L/2f(n)=g(n)=03k/2+L≤n≤2k(2)这样,借助把窗口的重迭部分尽可能取宽,使正交变换时频谱的频率分辨力良好。从以上说明可知,在时间上连续的3块正交变换的大小确定以后,决定正交变换中使用的窗口形状。因此,从图4中的输入端子401、402、403输入的信号块、与从输出端子416、417输出的信号块,在本实施例中产生了一块之差。
图4中,即使把功率计算电路405、406和功率比较电路409省略掉,也能够构成图2中的块大小决定电路206、207、208。通过把窗口的形状固定在正交变换块中能够取的在时间上为最小的块大小,从而将该种类作为一类,则把图4中的延时器组412、413、414,块大小修正电路411,以及窗口形状决定电路415都省略掉,也能够构成。特别是在处理时间延时不合乎理想的那种应用例中,因上述的省略而使延时减少了,所以效果好。
再一次看图2,把在各MDCT电路203、204、205中进行MDCT处理以后得到的频率轴上的频谱数据或MDCT的系数数据,对于低频带,在频率轴方向上,以所谓临界频带为单位、在时间轴方向上,以上述块大小为单位,将每个块浮动单位汇总起来;对于中高频带,考虑到块浮动的有效性,在频率轴方向上,以把临界带宽细分以后为单位、在时间轴方向上,以上述块大小为单位,将每个块浮动单位汇总起来,送给自适应比特分配编码电路210、211、213和比特分配计算电路209。该所谓临界频带是考虑到人的听觉特性分割而成的频带,即,因某一纯音频率附近相同强度的窄频带噪声把该纯音掩蔽掉时,该噪声所占据的频带。当频率越高时,这种临界频带的带宽就越宽,所以,可以把上述0~22KHz的整个频带例如分割成25个临界频带。
比特分配计算电路209根据分割成为上述块浮动单位的频谱数据,考虑到所谓掩蔽效果以后,求出块浮动单位的掩蔽量,根据该掩蔽量和块浮动单位的能量或峰值等,求出分配给每个块浮动单位的比特分配率,向自适应的比特分配编码电路210、211、212传送。在自适应比特分配编码电路210、211、212中,利用比例因子(例如,块浮动单位内各分量绝对值的最大值)对每个块浮动单位进行归一,同时,根据分配给每个块浮动单位的比特分配率和可以使用的总比特数,计算实际上能够分配给每个块浮动单位的比特数,根据这个比特数把各频谱数据(或者,MDCT的系数数据)量化。这样编码的数据通过输出端子213、214、215取出。上述比例因子和表示量化比特数的字长也通过上述输出端子213、214、215输出。
这里,利用图7说明本发明的要点,即比特分配计算电路209的动作。把图2中的MDCT电路203、204、205的各个输出端连接到图7中的输入端子700上,输入到峰值分量抽取电路701和每个频带的能量计算电路702中。在峰值抽取电路701中,把各块浮动单位内的MDCT系数以绝对值大的顺序重新排列,根据该块浮动单位的带宽从绝对值大的开始顺序抽取多个(也包括1个)峰值分量,用块浮动单位内全部频率分量的个数除抽取的分量的平方和,把结果(峰值分量的能量)输出给减法器703和差分计算器704。
在每个频带的能量计算电路702中,通过求出的每块浮动单位的MDCT系数的平方平均值,算出块浮动单位内的能量,输出给减法器703。这时,不仅是平方平均值,求出单纯的平均值也能得到同样的效果(但是,这时,峰值分量抽取电路701的输出也必须是用块浮动单位内全部频率分量的个数除抽取的分量之和的结果)。
在减法器703中,从每个频带的能量计算电路702的输出中减掉峰值分量抽取电路701的输出,把结果输出给差分计算电路704。即,借助这一运算,算出了把各块浮动单位的峰值分量除掉以后的能量。
在差分计算电路704中,算出把峰值分量除掉以后的能量与峰值分量的能量之差分,输出给依赖于峰值分量的比特分配决定电路705。在本实施例中,虽然差分运算是先利用对数轴进行整数化/ID化,变换成十进制整数),再运算按ID进行的差分;但是,即使用实数进行运算,显然,也能得到同样的效果。
在依赖于峰值分量的比特分配判定电路705中,根据从差分计算电路704输出的差分数据,确定依赖于峰值分量的比特分配率。在本实施例中,准备了依赖于频率、块浮动单位的频率范围、以及峰值能量的多个方式(例如,对较大的信号分配较多的比特那样的结构),按表格确定比特分配率。
这里,利用图8说明与峰值分量有关的比特分配效果。
当考虑与块浮动单位内的功率乃至能量有关的比特分配时,在重视块浮动单位内的功率乃至能量的情况下,断定图8(a)和(b)具有相同的功率乃至能量,分配给它们大体相同的比特。另一方面,如果重视块浮动单位内的总能量或平均能量,则分配给图8(a)的比特较多。与图8(b)的情况相比,图8(a)的情况显然是噪声型的,可以认为,在(a)的情况下掩蔽效果较强。因此,在图8中,宁可分配给图8(b)的比特较多,倒会产生良好的结果。在本实施例中,通过把图8中的ΔP(相当于差分计算电路704的输出)算出、加到比特分配中去,得到良好的结果。这是基于这样的听觉特性,例如,R.H.Ehmer著“Masking by tones vs noise bands(音调对噪声频带的掩蔽)”,J.Acoust.Soc.Am.,31,1253(1959)中所描述,在进行掩蔽的声音为纯音和噪声的情况下,掩蔽效果所达到的范围几乎不变,但是,因为在噪声情况下不产生两个纯音所引起的差拍,所以,在噪声情况下掩蔽的效果较强。
再一次看图7,在固定比特分配决定电路707中,由每个频带的能量计算电路702的输出和固定比特分配方式表706确定固定比特分配率。准备了多个用于确定固定比特分配率的固定比特分配方式表706,能够根据信号的性质进行各种选择。在实施例中,根据按各种频率分布的、具有各种方式的、每个频带的能量计算电路702的输出,选择与处理块对应的短时间块的比特量。特别是在本实施例中,对于遍及全频带能量的单一总和值,准备了多个改变中低带和高带比特分配率的方式。而且,每个频带的能量计算电路702输出遍及全频带的总和值的大小越小,选择向高频带分配的比特量越少的方式。于是产生了信号越小时,高频带的灵敏度越降低的响度效果,得到良好的结果。另外,在本实施例中,虽然是在算出每个频带的能量以后,进行固定比特分配方式表706的选择的,但是,也可以利用滤波器等非截止频率分割电路的输出、或者利用MDCT的输出,进行上述的选择。
以上那样求出的固定的比特分配率和依赖于峰值的比特分配率利用加法器708相加,从输出端子709输出到图2中自适应比特分配编码电路210、211、212。
把上述比特分配的情况示于图9(b)、图10(b)。与其对应的输入信号MDCT系数的情况示于图9(a)、图10(a)。图9和图10中,为了说明方便起见,把全频带分成12个块浮动单位,用来表示比特分配。图9所示的信号频谱比较平坦,并且表示为噪声型情况,由大量的固定比特分配进行的比特分配有助于在全频带范围内得到大的信息比。在本实施例中,在依赖于各块浮动单位的功率的情况下进行比特分配,而且,在向低频带倾斜的分配中,把较多的比特分配给低频带。因此,高频带的信号杂音特性虽有劣化,但是,低频带的信号杂音特性改善了。从人耳灵敏度对频率的依赖性来讲,与低频带杂音相比,所产生的高频带杂音本来就难以听到,由于低频带信号的掩蔽作用,所以,在听觉上没有大问题。
图10(b)示出了在输入具有图10(a)所示频谱的信号的情况下,比特分配的情况。白色矩形表示根据固定方式分配给各块的比特数,画有斜线的矩形表示根据各块浮动单位信号分量的大小分配的比特数,把相当于这两种比特数之和的比特数分配给块浮动单位。虽然这些数值并不是整数值,而是取实线值来表示的,但是,所表示的是计算进行过程中的数值,最终把这些数值例如利用四合五入求出对各块浮动单位分配的比特数即可。与图9的情况相同,固定的比特分配按照各块浮动单位的功率和频率的倾斜分配来进行。另外,从第5到第10个频带,因为各块浮动单位内具有大峰值分量,所以,大多进行依赖于峰值分量的比特分配。在实际信号中,在人工信号矩形波中、如乐曲中的管乐器等发出的信息分量一直到较高频带都不衰减的情况下,观察到像上述那样的频谱。
这里,应该注意之点是,在采用本发明方法的情况下,例如,第9个块浮动单位中虽然分配的比特数比第4个块浮动单位少,但是,分配给它的比特数例如比第8个块浮动单位等多。这样的比特分配即使是进行根据各块浮动单位中信号大小、而且利用相应于频率的加权等方法的比特分配也实现不了,通过重视各块浮动单位内的峰值分量和其它分量来确定比特分配才能够实现。
在本实施例中,假定,从MDCT结果得到的频谱在100Hz以下的低频带内最多只得到几个分量。在这样的情况下,通过计算得到的低频带各频谱中,混有很多相当于比该低频带频率高的高频带频率信号,因此,必须对低频带分配非常多的比特数。为此,近似地讲,根据各块浮动单位中信号分量大小分配的比特数,越是低频带,越多分配一些即可。但是,把求频谱的区间取得较宽(例如,如果是能使100Hz以下的频谱非常密集的高效率编码装置的话),则对人耳灵敏度低的、例如,相当于50Hz以下的频谱的根据信号大小的比特分配比对50Hz以上的频带中信号的比特分配得较少也行。
在以上说明的系统中,作为主信息得到把正交变换输出频谱按照付信息处理(归一化和量化)了的数据;作为付信息得到表示块浮动状态的比例因子和表示字长的字长;把这两种信息从编码器送给解码器。
图11示出了图1中的ATC解码器73(即,对上述那样的已高效率编码的信号进行再一次解码的解码电路)。把各频带已量化的MDCT系数(即,与图2中的输出端子213、214、215的输出信号等效的数据)送到解码电路输入端子107上,把使用了的块大小信息(即,与图2中输出端子216、217、218的输出信号等效的数据)送到输入端子108上。在自适应比特分配解码电路106中,利用比例因子和字长进行反量化和归一化。接着,在反正交变换(IMDCT)电路103、104、105中,把频率轴上的信号变换成时间轴上的信号。这些部分频带的时间轴上的信号利用频带合成滤波(IQMF)电路102、101,解码成全频带信号。
本发明并不局限于上述实施例,例如,上述记录/再生媒体和信号压缩装置或扩张装置、以及信号压缩装置与扩张装置都没有必要一体化;也可以不通过记录媒体,而是用数据传送用的线路和光缆,即,用依靠光或电波的通信等方法把它们之间连接起来。例如,不只是能应用于音频PCM信号的、而且也能应用于数字声音(语言)信号和数字视频信号等的信号处理装置中。
另外,本发明的数据记录媒体记录利用上述数字信号处理装置压缩了的数据,从而可以谋求有效地利用记录容量。作为本发明的记录媒体不只是上述光盘,还可以是磁盘、IC存储器和内装了这种存储器的卡、磁带等各种记录媒体。
产业上利用的可能性从以上说明可知,在本发明中,把输入信号按时间和频率细分为多个块,在每一个块中从各块内分量中大的分量开始按顺序抽取一个或多个分量;根据把上述已抽取的分量除掉以后各块分量的大小与上述已抽取分量的大小之差分,确定对上述各块的比特分配率;根据上述比特分配率,把各块分量量化以后,产生压缩数据,从而对例如含有大量倍音的输入信号,能够实现听觉上也合乎理想的比特分配的方法,因此,能够进行在听感上音质优异的高效率压缩和扩张。另外,记录利用本发明的数字信号处理装置压缩了的数据的数据记录媒体,可以比过去的媒体进一步谋求存储容量的有效利用。
权利要求
1.一种数字信号处理装置,在这种装置中,把数字信号压缩以后进行记录或传送,其特征为,具有把输入信号按时间和频率细分为多个块,在每一个块中从各块内分量中大的分量开始按顺序提取一个或多个分量的提取装置;根据把所述已提取的分量除掉以后,各块分量的大小与所述已提取分量的大小之差分,确定对所述各块的比特分配率的比特分配装置;以及根据所述比特分配率,把各块分量量化以后,产生压缩数据的编码装置。
2.根据权利要求1中所述数字信号处理装置,其特征为,所述编码装置把所述各块内的分量按照该块内的代表值归一化。
3.根据权利要求1中所述数字信号处理装置,其特征为,所述比特分配装置再根据所述各块分量的大小、并且根据所述各块对应的频带进行加权,确定所述比特分配率。
4.根据权利要求1中所述数字信号处理装置,其特征为,所述抽取装置根据所述各块对应的频带,切换所述抽取分量的个数。
5.一种数字信号处理方法,在这种方法中,把数字信号压缩以后进行记录或传送,其特征为把输入信号按时间和频率细分为多个块,在每一个块中从各块内分量中大的分量开始按顺序抽取一个或多个分量;根据把所述已抽取的分量除掉以后各块分量的大小与所述已抽取分量的大小之差分,确定对所述各块的比特分配率;根据所述比特分配率,把各块分量量化以后,产生压缩数据。
6.根据权利要求5中所述数字信号处理方法,其特征为,还包括把所述各块内的分量按照该块内的代表值归一化的步骤。
7.根据权利要求5中所述数字信号处理方法,其特征为,包括根据所述各块分量的大小、并且,根据所述各块对应的频带进行加权,确定所述比特分配率的步骤。
8.根据权利要求5中所述数字信号处理方法,其特征为,根据所述各块对应的频带,切换所述抽取分量的个数。
9.一种数据记录媒体,在这种媒体中,记录了压缩数据,其特征为把输入信号按时间和频率细分为多个块,在每一个块中从各块内分量中大的分量开始按顺序抽取一个或多个分量;根据把所述已抽取的分量除掉以后各块分量的大小与所述已抽取分量的大小之差分,确定对所述各块的比特分配率;根据所述比特分配率,把各块分量量化以后,产生压缩数据;把所述压缩数据记录到记录媒体上。
10.根据权利要求9中所述数据记录媒体,其特征为,还包括把所述各块内的分量按照该块内的代表值归一化的步骤而形成记录了压缩数据的记录媒体。
11.根据权利要求9中所述数据记录媒体,其特征为,还包括根据所述各块分量的大小、并且根据所述各块对应的频带进行加权,确定所述比特分配率的步骤而形成记录了压缩数据的记录媒体。
12.根据权利要求9中所述数据记录媒体,其特征为,还包括根据所述各块对应的频带,切换所述提取分量的个数的步骤而形成记录了压缩数据的记录媒体。
全文摘要
一种对数字信号进行信息压缩以后,记录或传送、和/或把数字信号再生或接收以后,进行扩张的数字信号处理装置;利用频带分割滤波器201、202及MDCT电路203~205,把输入信号按时间和频率细分;把已细分的小块内的信号,按大小的顺序抽取一个或多个信号;具有进行比特分配的比特分配计算电路209,该比特分配用来根据把该已抽取的部分除掉以后那部分的大小、与该已抽取部分的大小之差分进行压缩。对含有大量倍音的输入信号,能够实现听觉上也合乎理想的比特分配,能够进行在听感上音质优异的高效率压缩和扩张。
文档编号G11B20/00GK1116467SQ9419091
公开日1996年2月7日 申请日期1994年10月11日 优先权日1993年10月8日
发明者铃木浩之 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1