声源数据产生方法，记录介质和声源数据处理设备的制作方法

文档序号：7566833阅读：147来源：国知局

专利名称：声源数据产生方法，记录介质和声源数据处理设备的制作方法
技术领域：
本发明涉及一种用于产生音效和背景音乐(BGM)的声源数据的产生方法，用于记录这种声源数据信息的记录介质，以及利用声源数据产生声音的声源数据处理装置。
通常，电子乐器、游戏设备和信息处理装置(如个人计算机)产生音乐声和声音效果。
为了产生音乐声和声音效果，需将诸如方波信号、三角波信号和正弦波信号加到多个预设的具有不同的频率划分比和负载比的分频器上，然后按所需的音量将这些分频器输出的单个声源信号(即所谓的声音)合成。
对于诸如钢琴和鼓之类的乐器而言，一种声音的整个音域被分为四部分，即增高、衰减、维持和释放部分，因而每一部分的幅值或电平在特性上是变化的。为了处理这种变化，人们利用一种所谓的ADSR控制来产生每种声音信号电平的类似变化。
此外，就电子乐器而言，还有一种用于对带有低频正弦波信号的正弦波信号进行频率调制的所谓FM声源。因而，利用作为临时函数的调制因数可通过较少的声源数据来产生各种声音信号。
噪音也可用作声音效果的声源。
同时，为利用游戏设备或信息处理装置(如个人计算机)运行游戏程序，根据用户对游戏程序的处理或对游戏设备或信息处理装置的操作可实时改变所产生的音效或背景音乐(BGM)的开始、停止和音量。
用于音效或BGM的声音信息是自适应差分PCM(称为ADPCM)数据，是通过对数字化记录的各种16位数字数据进行压缩，然后进行4位位率缩减或BRR编码并对得到的数据分块而产生的。ADPCM数据是基波的声音数据。即，游戏设备和信息处理装置提供有利用声源数据产生具有对应于所指的音乐片断的声源数据的读出周期的音乐片断的所谓的PCM声源。
下面将参考图6详细介绍利用4位ADPCM数据用作声源信息的情况下的声源数据。
这种声源数据是以具有由8位电平位和9位垂直位组成的9个字节的块为基础构成的。此块由声源数据的附加信息组成的1字节的字头信息区HA和由声源数据的16个采样或所谓的声音数据组成的8字节声音数据区SA构成。
字头信息区HA由1位块结束信息ED、1位循环信息LP、解码时用的滤波器信息FL和4位的偏移量RA构成。
块结束信息ED指示该块是否为声源数据的最后块。循环信息LP指示该块声音数据是否要循环。当循环信息LP为1时声音数据循环，而当环信息LP为0时数据不循环。
当每块声源数据产生后进行BRR编码。滤波器信息FL指示用来执行与BRR编码对应的BRR解码的滤波器的信息。利用该滤波器信息FL，可从多个固定预测滤波器(fixedpredictive filter)中选出对每块最优的固定预测滤波器(也就是具有最少的错误的滤波器)。
偏移量RA是在BRR解码中用于将4位值扩充为16位值的参数。
声音数据区SA包括声音数据从SA0L到SB3H的16个采样。
同时，由于在通常的声源数据中一块包括9个字节，因而它需要复杂的BRR解码。
还有，在用于以光的形式记录和再生数据的光盘中，利用为只读光盘的致密盘(CD)作为只读存储器的CD-ROM近来被用作记录声源数据的记录介质。因而，声源数据以CD-ROM图象和声源数据标准，即CD-ROM XA为基础是最理想的。
尽管一块包括9个字节的声源数据具有包括16个声音数据采样的块长度，但该块长度并不是基于CD-ROM XA标准的。因此，用来产生传统声源数据的进行BRR编码的预测滤波器不同于用来产生基于CD-ROM XA标准的声源数据的进行BRR编码的预测滤波器。此外，由于声源数据BRR解码时采用的预测滤波器是于BRR编码时相对应的，因而用于基于CD-ROMXA标准的声源数据的预测滤波器不能用于对传统声源数据进行解码。
进而，由于声源数据字头信息区里的循环信息只简单地指示声音数据是否要被循环，因而对声源数据的循环控制变得复杂化。
鉴于前面所述，本发明的一个目的就是提供一种产生基于通过简单处理即可满足产生声音要求的CD-ROMXA标准的声源数据的声源数据产生方法、用于记录利用该声源数据产生方法产生的声源数据的记录介质、以及用于利用由该声源数据产生方法产生的声源数据来产生声音的的声源数据处理装置。
同时，当由传统的PCM声源合成的声音输出被用于游戏程序的音效时，在绝大多数情况下声音输出与音乐曲调(如BGM)相重叠。在这种情况下，必须将用作音效的声音输出与诸如BGM的音乐曲调相混合进行输出。由于要对非PCM声源的由其它处理回路输出的声音信号进行混合，因而这种将声音输出与声音信号进行混合是复杂的。同时，电路结构也因而增大。
所以，鉴于上面所述，本发明的一个目的是提供一种能够容易地将由声源数据合成的声音输出与声音信号进行混合的声音数据处理装置。
根据本发明，提供一种声源数据产生方法，包括以下步骤产生由28个4位自适应差分PCM数据采样组成的14字节的声音信息；产生由循环部分的起始信息和结束信息、描述自适应差分PCM预测滤波器类型的预测滤波器信息、和用于将4位自适应差分PCM数据扩充为16位数据的范围信息所组成的2字节的声源参数；从而产生基于由14字节声音信息和2字节声源参数的完整块的16字节的声源数据。
根据本发明，还提供一种将基于完整块的16字节声源数据记录其上的记录介质，该16字节声源数据由28个4位自适应差分PCM数据采样组成的14字节声音信息和由循环部分的起始信息和结束信息、描述自适应差分PCM预测滤波器类型的预测滤波器信息、和用于将4位自适应差分PCM数据扩充为16位数据的范围信息所组成的2字节的声源参数构成。
根据本发明，还提供一种声源数据处理装置，包括用于存储其基于由由28个4位自适应差分PCM数据采样组成的14字节声音信息和由循环部分的起始信息和结束信息、描述自适应差分PCM预测滤波器类型的预测滤波器信息、和用于将4位自适应差分PCM数据扩充为16位数据的范围信息所组成的2字节的声源参数构成的完整块的16字节声源数据的存储器装置；以及用来利用基于存储在存储器装置内的块的声源数据的预测滤波器信息和比率信息将块中的4位自适应差分PCM数据解码为16位数据的解码装置。
循环部分的起始信息和结束信息为分别指示由一个或多个块组成的循环部分的起始块和结束块的信息。
根据本发明，提供一种声源数据处理装置包括用于提供用来封装由4位自适应差分PCM数据组成的声源数据和不同于声源数据的16位PCM数据的包封(envelope)的包封装置；用于对从包封装置读出的声源数据解码以执行间距转换(pitch conversion)并输出受控的信号电平的声音的声音输出装置；以及将声音输出装置的声音输出与从包封装置读出的实际声音数据进行混合的混音装置。
根据本发明的声源数据处理装置还包括用于将实际声音数据与声音输出装置的声音输出混合的第二混音装置；以及对来自第二混音装置的声音数据临时向前或向后偏移后再与来自混音装置的声音数据进行混音的混响声音数据混音装置。
在本发明中，声源数据和实际声音数据被封装在一个包封内，由4位自适应差分PCM数据的声源数据产生的16位声音输出与不同于声源数据的实际声音数据的16位PCM数据被任意混合。
还有，在本发明中，提供有第二混音装置，因而由此第二混音装置混音后的声音数据被临时偏移并与来自混音装置的声音数据混合以产生混响声音数据。
在本发明中，由于声音数据具有类似于CD-ROM XA的28个采样结构，因而CD-ROM XA编码装置所用的预测滤波器可被用于对该声音信息进行编码。还有，由于块被定为16字节，因而易于实现解码。
此外，由于表示循环部分的起始块和结束块的信息在每块中均提供，因而可实现多块循环。

图1为表示采用根据本发明的声源数据处理装置的声音输出单元的一个实施例的原理图。
图2表示声源数据的结构。
图3为表示数字声源信号发生器结构的原理图。
图4解释滤波器信息。
图5为表示家用游戏设备结构的原理图。
图6为表示传统声源数据结构的原理图。
图7为表示根据本发明记录声源数据设备的一实施例结构的原理图。
图8解释存储盘上的一个记录扇区的格式。
图9解释根据本发明的数个记录扇区的格式。
下面参考附图对本发明的最佳实施例进行介绍。图1为表示具有用来利用根据本发明的声源数据产生方法产生的声源数据来产生声音的声源数据处理装置的声音输出单元结构的原理图。
图1中的CD-ROM驱动器93利用CD-ROM作为记录介质。在以光的形式记录和重现数据的光盘中，CD-ROM利用为只读光盘的致密盘(CD)作为只读存储器。
在图1中，由微处理器组成的中央处理单元(CPU)90与总线92相连。CPU90使用的用于将数据装入其中的主存储器91、对从CD-ROM驱动器93内的CD-ROM上读出的数据进行解码的CD-ROM解码器80、利用从CD-ROM读出的声音数据产生声音的声源数据处理装置49也与总线92相连。声源数据处理装置49由用于处理声源数据的数字声音信号发生器50和用于装入声源数据的声音缓冲器51构成。数字声音信号发生器50与音箱单元95相连以向外输出声音。
根据CPU90发出的控制指令声音数据被从CD-ROM驱动器93读出，并被装入CD-ROM解码器80上的CD-ROM缓冲区82内。装在CD-ROM缓冲区82内的声音数据被送至错误校正单元81内。错误校正单元81对送来的数据进行错误校正。
错误校正单元81的输出连接至字头检测器100。字头检测器100检测数据块的字头，并相应动作一开关102。开关102将错误校正单元81的输出供给主I/F单元85或者ADPCM解码器83。如果字头检测器100检测出的字头是用于音效的，开关102就将输出接至主I/F单元85。而如果检测出的字头是用于音乐曲调的，开关102就向另一方向动作，将其输出接至解码器83。
声音数据中包括可输出为音乐曲调(象背景音乐BGM这样的音乐声连续不断)的声音数据，以及用于产生象音效这样的声音的声音数据。具体地说，在经过错误校正后的声音数据中输出为音乐曲调的声音数据为基于用于CD-ROM声音数据的CD-ROMXA标准的4位ADPCM数据，以及基于用于音乐CD的声音数据的CD-DA标准的16位PCM数据。用于产生象音效这样的声音的声源数据为4位ADPCM数据。
CPU90检测声音数据是可输出为音乐曲调的声音数据还是用于产生象音效这样的声音的声音数据。CPU90执行象把可输出为音乐曲调的声音数据送至解码器83这样的控制。解码器83仅对ADPCM数据解码，并输出16位PCM数据至混音器84。混音器84对左右立体声声道的PCM数据进行混音，有数字改变的衰减量。由混音器84输出的声音数据进入数字声音信号发生器50。
在另一方面，用于产生象音效这样的声音的声音数据通过总线92从主I/F单元85进入数字声音信号发生器50。然后，声音数据被数字声音信号发生器50存储在声音缓冲器51内。
图2表示存储在声音缓冲器51内的声音数据。
该声音数据以由16电平位和8垂直位的16字节组成的块为基础构成。该块由作为声源数据的声音信息的字头信息的2字节声音参数区PA和由28个声音信息(声音数据)采样组成的14字节声音数据区SA构成。
声音参数区PA由4位偏移量RA、4位滤波器信息FL、3位循环信息LP和5位保留区RS组成。
偏移量RA是用于在BRR解码时将4位量扩充为16位量的参数。该偏移量RA取值0-12，并由下述公式(1)表示。
16位数据＝2(12－RA)·(4位数据)……(1)当基于块的声音数据产生后进行BRR编码，滤波器信息FL指示用于进行与BRR编码相对应的BRR解码的滤波器的信息。利用该滤波器信息FL，可从多个固定预测滤波器中选出对每块最优的固定预测滤波器(也就是具有最少的错误的滤波器)。
循环信息LP从最小位一侧依次具有1位循环结束标志EF、循环标志LF及循环起始标志LSF。循环起始标志LSF为1时表明该块为循环的起点。循环标志LF指示声源数据是否具有循环。循环标志LF为1时表示声源数据有循环。在有循环的声源数据中，所有块中的循环标志LF的位均被置为1。循环结束标志EF表示该块为声源数据的最后块。
声音数据区SA包括声音数据的28个采样SD0至SD27。
数字声音信号发生器50利用输入的声音数据和声音缓冲器51内的声源数据从扬声器单元95输出音乐曲调和音效。
图3表示数字声源信号发生器结构的原理。下面对其进行详细介绍。
如本实施例所示的数字声音信号发生器具有BRR解码器53，该解码器从声音缓冲器51中读出图2所示的为4位ADPCM数据的所谓声源数据并执行与ADPCM数据中实现的减少位率的编码相对应的解码以将ADPCM数据转换为PCM数据。数字声音信号发生器还有用来转换已转换后的PCM数据的间距的间距转换单元54、用来产生时钟信号的时钟信号发生器55、用来产生基于得到的时钟的噪声的噪声发生器56、用来切换由间距转换单元54的输出和噪音发生器56的输出的信号切换单元57、用来调整信号切换单元57的信号输出电平以转换其具有波形可变的幅值的所产生的声音的包封的包封发生器58、用来关闭为静音状态的静音开关59、以及用来调整音量及左右声道平衡的左右音量控制单元60L和60R。利用该数字声音信号发生器根据声源数据就可输出声音。
图3仅表示出用来输出一种声音(一种语音)的回路结构。但是该实施例的数字声音信号发生器也可以输出有24种语音的声音，并具有从间距转换单元54至左右音量控制单元60L和60R分别于24种语音对应的电路结构。因而，利用这种数字声音信号发生器，每种语音的左右声道被合成以输出两个声道的声音，即左声道和右声道。
还有，声音缓冲器51内存储的声源数据、包封、音量和左右声道平衡均可对每种语音分别设定。
利用该数字声音信号发生器，就可以将从图1所示的CD-ROM解码器80中输入的声音信号与声音输出进行混音，并执行将声音输出与临时前移或后移的声音输出进行混音的声音输出的所谓混响处理。
为了将出现在端点63的声音信号与所产生的声音输出进行混合，数字声音信号发生器具有一信号切换单元64用以选择声音信号是否被输入并与声音输出合成，以及用来调整所混音的声音信号的音量的混音音量控制单元65。因此，当声音信号要与声音输出混合时，来自图1的CD-ROM解码器80的混音器84的PCM数据被输入到信号输入端63并通过信号切换单元64被输入到混音音量控制单元65。混音音量控制单元65调节输入其中的声音信号的音量。音量调整后的声音信号被输入累加器62，然后与来自音量控制单元60L的声音输出进行混合。
图3仅表示了用来混合从音量控制单元60L输出的的24种语音的声音输出合成后的左声道声音输出与来自混音音量控制单元65的左声道的声音信号的回路结构。但还提供有与左声道所用的回路结构类似用于右声道的回路结构，混音是对于两个声道，即左声道和右声道来实现的。
利用这种数字声音信号发生器，可以对声音输出实现将声音输出与临时前移或后移的声音输出进行混音的所谓的混响处理。
为了执行混响处理，数字声音信号发生器具有一信号切换单元66用以选择声音信号是否被用来进行混响处理、一累加器67用来将从信号切换单元66来的声音信号与通过信号切换单元61L来的声音输出相加、混响处理器68用来对来自累加器67的声音信号进行混响、混响音量控制单元69用来调整混响后的声音信号的音量、累加器70用来混合经混响音量控制单元69调节后的输出以及从累加器62输出的临时前移或后移的声音信号、以及主音量控制单元71用来调整累加器70输出的声音信号的音量。因此，来自混音音量控制单元65的声音信号被用作与声音输出混合的声音。
由累加器67输出的声音信号进入混响处理器68，在此被临时前移或后移并被送至混响音量控制单元69。混响音量控制单元69调节输入其中的声音信号的音量。音量被调整后的声音信号被送入累加器70，在此被与来自累加器62的声音信号合成。
现在介绍图2所示的声源数据在数字声音信号发生器中的处理操作。
图1中的CPU90从主存储器91中拾取表示要被输出的声音的声源数据的选择信息、声音的长度信息、声音的间隔信息、用来确定声音音色的包封信息、以及声音的音量信息，并将这些信息输入给数字声音信号发生器50。数字声音信号发生器根据输入其中的选择信息从声音缓冲器51中读出声源数据，并从声源数据输入端52输入声源数据。数字声音信号发生器还根据从CPU90来的声音的长度信息控制从声音缓冲器51的声源数据的输入。
这样输入的声源数据被送入BRR解码器53并在此被解码，然后被转换为16位PCM数据。BRR解码器53的解码是根据相对于每种语音的4次1Ts最大采样进行的。解码结果被临时存储在内部存储器中(未表示出)。所存储的数据被间距转换单元54用来进行代数运算以进行间距转换，BRR解码率按照所消耗的数据量确定。具体地说，间距转换时消耗的数据越少，BRR解码就执行得越少。
现在参考图4介绍图2的声源数据的声音参数区PA内的滤波器信息FL。
如图4所示，按照滤波器信息FL表示的值可从4种预测滤波器(即直线、一次、二次〔B级〕和三次〔C级〕)中选出一种。由滤波器信息FL的值可确定系数a和b。
按照滤波器信息FL的值为2和3选出的预测滤波器用来对基于CD-ROM XA标准的4位ADPCM数据解码。当图2所示的声音数据为4位ADPCM数据时可采用这些预测滤波器。
电流采样的解码结果Xn(16位数据)用下述公式(2)表示。
Xn＝2(12－RA)Dn＋aXn－1＋bXn－2……(2)其中Dn表示4位声源数据，Xn－1(16位数据)表示前一次采样的解码结果，而Xn－2(16位数据)表示再前一次采样的解码结果。
从BRR解码器53输出的PCM数据被输入间距转换单元54。间距转换单元54根据来自CPU90的声音间断信息进行间距转换的代数运算以转换间断，也即输入的PCM数据产生的声音的间距。间距转换后的声音数据被送至信号切换单元57的端点57a。
另外，时钟信号发生器55产生的时钟信号被送入噪声发生器56以产生一噪声。该噪声发生器56用来产生一基于M序列的伪随机数字(举例)的噪声。所得到的噪声被送至信号切换单元57的端点57b。
数字声音信号发生器根据图1的CPU90的控制指令将信号切换单元57切换到端点57a或57b，因而来自间距转换单元54的声音数据或来自噪声发生器56的噪声被选择并被送至包封发生器58。
包封发生器58根据CPU90的包封信息进行所谓的ADSR控制，以确定要输出的声音的音色。
来自包封发生器58的输出的左声道声音数据和右声道声音数据通过信号切换单元59分别被被输入到左音量控制单元60L和右音量控制单元60R。音量控制单元60L和60R根据来自CPU90的音量信息调节音量，以将声音输出向外输出。
因而，声音的24种语音被分别产生和输出。每种语音的左声道和右声道被合成，从而产生两个声道，即左声道和右声道的声音输出。
两个声道(左声道和右声道)的声音输出与输出自混音音量控制单元65的声音信号被累加器62混合，然后被累加器70与输出自混响音量控制单元69的声音信号在此混合，如上面所介绍的。这一混音后的声音输出的音量由主音量控制单元71调节后从声音信号输出端72输出。这样，从图1的扬声器单元95就产生了声音。
上面介绍的数字声音信号处理装置用于家用游戏设备之类是非常理想的。现在参考图5介绍采用该数字声音信号处理装置的家用游戏设备的一实施例，图5表示了该设备的结构原理。
家用游戏设备是通过将用来实现各种功能的多种处理器和装置，包括CPU11和外部装置12、图形系统、声音系统、CD-ROM系统和通讯系统的一个主系统连接到一总线31上来构成的。
主系统基本部分的CPU11是一32位精简指令集计算机(RISC)CPU。外部装置12包括多个控制器，诸如DMA、计时器和中断。总线31上还连接有容量为2兆字节的主存储器13、容量为512千字节且已装入用来控制CPU11和外部装置12的运行以控制家用游戏设备的操作系统(OS)程序的ROM14、作为并行通讯的输入输出(I/O)部分的PIO29、以及作为串行通讯的输入输出(I/O)部分的SIO30。
当打开家用游戏设备的电源时，CPU11执行ROM14内的OS使整个设备初始化。按照CPU11的控制指令，应用程序，也就是装在CD-ROM系统的CD-ROM驱动器25内的游戏程序或图象或声音数据被读出。
具体地说，记录在CD-ROM内的图象数据包括已通过离散余弦变换(DCT)进行了正交变换和压缩的移动图象和静止图象数据，以及用来修正多边形的织构图象的图象数据。就移动图象和静止图象而言，分别根据作为静止图象数据压缩的国际标准的静止图象专家组(JPEG)标准和仅通过帧内编码根据作为移动图象数据压缩的国际标准的移动图象专家组(MPEG)标准进行数据压缩。CD-ROM上的游戏程序包括画多边形指令以绘制微小的多边区域即多边形。
记录在CD-ROM内的声音数据包括基于音乐CD声音数据的CD-DA标准的16位PCM数据和基于CD-ROM图象和声音数据的CD-ROM XA标准的自适应差分PCM(称为ADPCM)数据。
从CD-ROM读出的数据被存放在CD-ROM缓冲区24内，然后由CD-ROM解码器23进行解码。所得到的数据根据数据的内容被送入主系统、图形系统或声音系统。
图形系统由作为图形数据发生处理器的几何变换引擎(geome trytransfer engine)(GTE)15、作为图形绘制处理器的图形处理单元(GPU)、具有1兆字节容量被GPU16用来产生图象的帧缓冲区17、作为图形数据扩充引擎的移动解码器(MDEC)19、以及视频输出单元18(如CRT显示单元或液晶显示(LCD)单元)构成。
GTE15作为CPU11的协处理器，利用并行处理机制在CPU11产生绘图指令或控制指令时，以高速实现用于在图象中描述三维目标的多边形的协同转换或光源计算，例如计算以固定的十进制模式计算矩阵或向量。
GPU16根据CPU11的多边形绘制指令运行，在映射在独立于CPU11的二维地址空间上的帧缓冲区17内绘制多边形。GPU16执行以同一颜色绘制多边形的平滑着色(flat shading)、给多边形的每一顶点定义一种随机颜色以发现多边形内的颜色的哥劳德(Couraud)着色、以及将作为二维图象数据的织构加至多边形的织构映射。
具体地说，当实现以一种颜色画多边形或三角形的平滑着色时，GTE15每秒钟最多可执行大约一百五十万个多边形的协同运算。当实现哥劳德着色或织构映射时，GTE15每秒钟最多可执行大约五十万个多边形的协同运算。因此，可以减少CPU11的负载并实现高速协同运算。
帧缓冲区17由所谓的16位双端口RAM构成，它是一个512个垂直象素和1024个电平象素的长方形区域。帧缓冲区17被GPU16用来绘制图象和装入来自主存储器13的数据。GPU16的绘图或从主存储器13的数据传送，与图象数据的读出是同时进行的。在帧缓冲区17内，装有存有一种织构模型的织构区和将颜色查找表(CLUT)用作调色板的的CLUT区。织构模型和CLUT数据在CPU11的控制下被从CD-ROM驱动器25中读出，然后通过GPU16传送到帧缓冲区17，并被存入其中。CLUT数据还可以由GPU16产生。
相应地，GPU16利用GTE15发现的协同信息和颜色信息绘制多边形，并将织构加入多边形以产生三维(3D)图象。所得到的图象数据作为图象信号输出到视频输出单元18，因而就显示出了三维(3D)图象。
当要显示移动图象时，帧缓冲区17提供两个长方形区域，该两区域被轮流用作绘图和图象显示，因而在一个长方形区域内进行帧图象绘制时在另一长方形区域内的前面绘制出的帧图象数据被输出到视频输出单元18上以显示图象。因此，避免了在视频输出单元18上显示重写图象的状态。
用来再现从CD-ROM25内读出的图象数据的MDEC19，进行与CPU11共用主存储器13的并行计算。从CD-ROM驱动器25读出的移动图象数据被CD-ROM解码器23进行错误校正并被送至MDEC19。MDEC19对送来的数据进行解码。解码后的数据作为移动图象数据被送入主存储器13。被送入主存储器13的移动图象数据通过GPU16被装入帧缓冲区17，然后作为图象信号被输出到视频输出单元18，从而显示出移动图象。
声音系统由作为声音再现处理器的声音处理单元或所谓的SPU20、用于SPU20以再现声音信号的512千字节声音缓冲区21、以及声音输出单元22(如扬声器单元)构成。
SPU20具有通过对4位差分信号执行16位ADPCM所产生的声音数据进行再现的ADPCM解码功能、能再现存储在声音缓冲区21内的声源数据以产生音效的再现功能、以及对用于再现的声源数据进行调制的调制功能。
用于背景音乐(BGM)的声音数据和用于音效的声音数据被记录在CD-ROM中。这些数据在CPU11的控制下被CD-ROM解码器23从CD-ROM驱动器25内读出并进行错误校正。
从CD-ROM解码器23读出的用作BGM的声音数据在CPU11的控制下被送至SPU20，然后由SPU20从声音输出单元22中输出为音乐曲调。用作音效的声源数据在CPU11的控制下被装入声音缓冲区21。SPU20根据存储在声音缓冲区21内的声源数据产生音乐声和音效。因而，SPU20是所谓的采样声源。
通讯系统由作为输入装置或输入板的控制器27、1兆字节的存储器卡28、以及作为同步串行口的通讯装置26构成。
控制器27有用于输入指令以控制游戏进程或游戏内显示的目标的移动的键。由控制器27输入的操作信息被送入通讯装置26。送入通讯装置26的信息由CPU11在大约每1/60秒读入。CPU11发出用以控制外部装置12、主存储器13、图形系统、声音系统、以及CD-ROM系统的运行的控制指令，以控制这些系统的运行。因而，就显示出对应于输入的操作信息的图象并输出声音。
存储器卡28由非易失性存储器如快擦写(flush)存储器构成，被用来装入和保存多个游戏的设定、进程状态和结果。由于存储器卡28与总线31分离，因而存储器卡28可在电源打开时接入或退出。因而，在家用游戏设备运行时就可以接入和退出多个存储器卡以存储数据。
游戏设备可通过PIO29与外部装置相连。游戏设备还可以通过SIO30与其它游戏设备通讯。
在家用游戏设备中，在进行读游戏程序、显示图象数据或绘制图象数据时，必需在主存储器13、GPU16、MDEC19和CD-ROM解码器23间高速传送大量图象数据。在这种情况下，采用所谓的DMA传送来进行，即图象数据在外部装置12的控制下直接传送，而不通过CPU11。因此，由于数据传送给CPU11造成的的负载就可降低，并可实现高速数据传送。
如上面的明确描述，根据本发明的声源数据产生方法包括以下步骤产生由28个4位自适应差分PCM数据采样组成的14字节的声音信息；产生由循环部分的起始信息和结束信息、描述自适应差分PCM预测滤波器类型的预测滤波器信息、和用于将4位自适应差分PCM数据扩充为16位数据的范围信息所组成的2字节的声源参数，从而产生基于由14字节声音信息和2字节声源参数的完整块的16字节的声源数据。因而，可以容易地实现利用声源数据的声音的解码和产生。还有，在产生声源数据时利用预测滤波器进行BRR编码时，可采用产生基于CD-ROM XA标准的数据进行BRR编码时所采用的同样的滤波器作为预测滤波器。也就是说，在产生声源数据时，可利用用于基于CD-ROM XA标准的数据的编码器进行编码。
根据本发明的记录介质可将基于完整块的16字节声源数据记录其中，该16字节声源数据由由28个4位自适应差分PCM数据组成的14字节声音信息和由循环部分的起始信息和结束信息、描述自适应差分PCM预测滤波器类型的预测滤波器信息、和用于将4位自适应差分PCM数据扩充为16位数据的范围信息所组成的2字节的声源参数构成。因而，如果在产生基于CD-ROMXA标准的数据进行BRR编码时被用作预测滤波器的同样的滤波器在产生声源数据进行BRR编码时可被用作预测滤波器，那么在对基于CD-ROM XA标准的数据进行BRR解码时被用作预测滤波器的同样的滤波器在进行BRR解码和利用声源数据产生声音时也可被用作预测滤波器。
根据本发明的声源数据处理装置包括用于将基于由28个4位自适应差分PCM数据采样组成的14字节声音信息和由循环部分的起始信息和结束信息、描述自适应差分PCM预测滤波器类型的预测滤波器信息、和用于将4位自适应差分PCM数据扩充为16位数据的范围信息所组成的2字节的声源参数构成的完整块的16字节声源数据存储其上的存储器装置；以及用来利用基于存储在存储器装置内的块的声源数据的预测滤波器信息和比率信息将块中的4位自适应差分PCM数据解码为16位数据的解码装置。因而，如果在产生基于CD-ROM XA标准的数据进行BRR编码时被用作预测滤波器的同样的滤波器在产生声源数据进行BRR编码时可被用作预测滤波器，那么在对基于CD-ROM XA标准的数据进行BRR解码时被用作预测滤波器的同样的滤波器在进行BRR解码和利用声源数据产生声音时也可被用作预测滤波器。
循环部分的起始信息和结束信息是分别表示由一块或多块组成的循环部分的起始块和结束块的信息。因而，可以使多块声源数据进行循环以产生更自然的声音。
如上面的明确描述，根据本发明的声音数据处理装置包括用于提供用来装入由4位自适应差分PCM数据组成的声源数据和不同于声源数据的16位PCM数据的包封的包封装置；用于对从包封装置读出的声源数据解码以执行间距转换并输出受控的信号电平的声音的声音输出装置；以及将声音输出装置的声音输出与从包封装置读出的实际声音数据进行混合的混音装置。因而，从声源数据产生的的声音输出和16位PCM数据的声音数据可被容易地混合。还有，用于混合从声源数据的声音输出与16位PCM数据的声音数据的回路结构也可缩小。
除了上述结构外，根据本发明的声音数据处理装置还包括用于将实际声音数据与声音输出装置的声音输出混合的第二混音装置；以及对来自第二混音装置的声音数据临时向前或向后偏移后再与来自混音装置的声音数据进行混音的混响声音数据混音装置。因而，由第二混音装置混音后的声音数据被临时偏移并与来自混音装置的声音数据进行混音，因而可容易地产生混响声音数据。
图7解释了利用根据本发明的得到的信息来记录存储盘的设备。
图8解释了记录在存储盘上的一个典型扇区。该扇区从12字节的同步信息开始，接着是表示扇区类型的12字节的字头。后面接着是2,048字节的用户数据，其后的4个字节供EDC用，还有276字节用于错误校正ECC。
图9解释了如何将用户数据或者表示音乐数据或者表示其它图形和/或音效或其它数据的多个扇区成功地记录在存储盘上。图9表示了5个扇区，其中第一和第五扇区为音乐数据，其它扇区为其它类型的数据。
图7解释了用来排列与记录图9所示的扇区内的数据的设备。模拟输入被加到输入端103，并被模数转换器104转换为数字形式。模数转换器的输出连接至输入装置105，以及BRR编码器106。该BRR编码器106将声效数据和音乐数据编码成相同的格式，其由每个均由28个4位自适应差分PCM数据采样组成的14字节的声音数据块组成，BRR编码器106将其输出加至两组开关108和110。每组具有用于滤波器信息、范围信息、及其它数据的开关，而如果开关108闭合，该数据就被加至字头发生器112和数据块发生器114。
输入设备105根据数据是否为音乐数据或音效数据决定开关108和110中哪个动作。如果选中108开关，输入装置105还将循环信息加至字头发生器112。字头发生器112和数据块发生器114两者均将输出加至SPU有效的声音打包器SPU(sound packer)116，它将其输出加至扇区处理器118以在主盘126上记录。同步发生器120也与扇区处理器118相连，一提供必要的同步信号。
扇区处理器118的另一输入来自开关122，它用来选择来自输入设备105的声音信息或来自图形数据源124的图形数据。
当选择开关110时，开关110的输出被加至数据块发生器128和字头发生器130上，这些单元产生与XA型音乐打包器132相连的信号。其输出被接至扇区处理器118。扇区处理器118还有一输入来自EDC/ECC发生器134，它提供用于错误校正之类的所需的ECC和EDC信号。
利用图7所示的设备，主盘126上的扇区就可按图9所示的格式被记录。很明显，对本发明的设备和方法可进行各种修正和附加，而不会背离其新颖性的中心特性，这将在后面的权利要求中进行限定和保护。
权利要求
1.一种声音数据处理设备，包括用于存储基于由28个4位自适应差分PCM数据的采样组成的14字节声音信息和由循环信息、预测滤波器信息、以及范围信息所组成的2字节的声源参数构成的完整块的16字节声源数据的存储器装置；和用来对应于所述声源数据信息将所述4位自适应差分PCM数据进行解码的解码装置。
2.根据权利要求1的设备，其中所述循环信息表示循环起始块和循环结束块。
3.一种声源数据再生设备，包括用于解码真实声音数据的第一解码装置；用于解码以4位自适应差分PCM数据编码的声源数据的第二解码装置；和用于将所述解码后的实际声音数据与所述解码后的4位自适应差分PCM数据进行混合的混音装置。
4.根据权利要求3的设备，其中所述4位自适应差分PCM数据由基于由28个4位自适应差分PCM数据组成的14字节声音信息和由循环信息、预测滤波器信息、以及范围信息所组成的2字节的声源参数构成的完整块的16字节声源数据组成。
5.根据权利要求3的设备，还包括用来将所述解码后的实际声音数据与所述解码后的4位自适应差分PCM数据进行混合的第二混音装置；用来使所述第二混音装置的输出数据延迟的延迟装置；以及用来将所述第二混音装置的输出与所述第三混音装置的输出进行混音的第三混音装置。
6.一种用来处理声音数据的方法，包括以下步骤存储基于由28个4位自适应差分PCM数据的采样组成的14字节声音信息和由循环信息、预测滤波器信息、以及范围信息所组成的2字节的声源参数构成的完整块的16字节声源数据；和对应于所述声音参数将所述4位自适应差分PCM数据进行解码。
7.根据权利要求6的方法，其中所述循环信息表示循环起始块和循环结束块。
8.用来处理声音数据的方法，包括以下步骤对实际声音数据进行解码；对编码成4位自适应差分PCM数据的声源数据进行解码；以及将所述解码后的实际声音数据与所述解码后的4位自适应差分PCM数据进行混音。
9.根据权利要求8的方法，其中所述4位自适应差分PCM数据由基于由28个4位自适应差分PCM数据组成的14字节声音信息和由循环信息、预测滤波器信息、以及范围信息所组成的2字节的声源参数构成的完整块的16字节声源数据组成。
10.根据权利要求8的方法，进一步包括以下步骤将所述解码后的实际声音数据与所述解码后的4位自适应差分PCM数据进行混音；使所述第二混音装置的输出数据延迟；以及将所述第二混音装置的输出与所述第三混音装置的输出进行混音。
11.用来在存储盘上记录声音数据的设备，包括用来提供音效数据的装置、用来提供音乐数据的装置、用于将所述音乐代表数据和所述声效数据编码成为4位自适应差分PCM码的编码装置以及用来有选择地将所述编码后的音乐数据和所述音效数据记录在存储盘的扇区上的装置，包括用来对每一扇区产生区分所记录的数据是音效数据或者音乐数据的字头的装置。
12.用来在存储盘上记录声音数据的方法，包括音乐代表数据、及音效代表数据、以及有选择地将所述音乐数据或所述音效数据记录在存储盘的扇区上，以及记录用来在每一扇区记录区分在所述扇区内所记录的数据是音效数据或者音乐数据的扇区字头。
全文摘要
声源数据由28个声音信息采样组成的14字节声音数据区SA和由循环信息LP、滤波器信息FL及偏移量RA组成的声音参数区PA构成。在声源数据编码时，可采用CD-ROMXA编码器。4位ADPCM数据由BRR解码器53解码，由间距转换单元54进行间距转换，然后由包封发生器58进行包封变换处理。此后，累加器62对由音量单元60L和60R进行了音量调节的左右声道输出和音量由混音音量控制单元65调节后的16位PCM数据进行累加。
文档编号H04N5/765GK1154521SQ95120038
公开日1997年7月16日申请日期1995年12月1日优先权日1994年12月2日
发明者古桥真申请人:索尼株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古桥真
技术所有人：索尼计算机娱乐公司
我是此专利的发明人

上一篇：直接变频接收机的制作方法
上一篇：陆地移动无线电基本现场的无线电信号扫描和瞄准系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。