用于卡拉ok、游戏机之类的声音重放装置和方法

文档序号：2820296阅读：223来源：国知局

专利名称：用于卡拉ok、游戏机之类的声音重放装置和方法
技术领域：
本发明一般涉及声音重放装置和声音重放方法，用此方法传递压缩的声音波形数据，在接收端对其解码并重放为音响。本发明特别涉及一种声音重放装置和声音重放方法，其中在需要它时产生声音的情况和不需要它时产生声音的情况之间使用不同的声音波形数据压缩技术。
本发明还涉及一种用于卡拉OK之类的声音重放技术，其特征在于利用改进的数据压缩技术压缩采样的声音或声音波形数据用于随后的存储。
本发明还涉及一种用于卡拉OK之类的声音压缩技术，当采样的声音或声音波形数据以压缩数据形式被使用时，这种技术允许选择地使用一种或几种不同的数据压缩技术。
本发明还涉及一种游戏装置，该装置能够以压缩数据的形式提供声音数据或波形数据，并随着游戏节目的进展被可听地重放。
“卡拉OK”装置是一种熟知的音乐重放装置。卡拉OK装置以其最简单的形式用于重放从磁带中选出的音乐片段，在磁带上预先以模拟信号的形式录有音乐片段。然而，随着电子技术的发展，磁带几乎被CD(光盘)或LD(激光盘)所取代，从而使要被记录在上面的模拟信号已被数字信号取代，并且要和数字信号一起记录的数据也已包括各种附加信息，例如伴随着基本的音乐片段数据的图象数据和抒情歌词数据。
近来，代替CD或LD，通信型的卡拉OK装置已快速地得到广泛的应用。这种通信型卡拉OK装置一般可分成两类非累积型(non-accumulating type)，其中要被重放的音乐片段的一组数据(即音乐片段数据)在每次选择重放的音乐片段时通过通信线路被接收；以及累积型，其中通过通信线路接收的每组音乐片段数据被累积存储在卡拉OK装置的内部存储装置(硬盘装置)中，用这种方式，每当选择累积的一组特定的音乐片段数据时，所选数据便从存储装置中被读出。目前，由于通信费用，累积型卡拉OK装置比非累积型卡拉OK装置更为流行。
在大多数通信型卡拉OK装置中，使用了最近的或最新的数据压缩与通信技术，以便减少每个音乐片段的音乐片段数据的总的数据量，从而实现最小的通信时间(因而最小的通信费用)和最小的所需存储空间。换句话说，通信型卡拉OK装置，如果它们完全和在CD或LD上记录的方式一样使用常规的PCM数据(即通过采样全部音乐片段而获得的数据)，根据所需的通信费用和通信时间看来是不满意的。因而，在常规的通信型卡拉OK装置中，包含在音乐片段数据中的和演奏相关的数据被转换或编码成符合MIDI(音乐设备数字接口)标准的数据(以后称为“MIDI数据”)，并且难于编码成MIDI数据的作为背景合唱的声音被进行PCM编码，以便被表示为数据压缩编码的形式。ADPCM(自适应差分脉冲编码调制)(Adaptive Differential Pulse CodeModulation)形式一般已被经常用作数据压缩编码形式。这可以减少每个音乐片段的音乐片段数据的总数据量，借以有效地节省通信时间和存储容量。
ADPCM数据虽然呈压缩数据形式，但它仍然在数据总量上远大于MIDI数据，因而占用卡拉OK装置中可利用的存储容量的大部分(大约三分之二)，这已经成为限制在卡拉OK装置的存储装置中可存储的音乐片段数据数量的主要因素。这也相当地限制了减少用于音乐片段数据通信所需的时间和费用。
此外，常规的电子游戏装置可以进行游戏和演奏音乐，通过按顺序执行用于游戏主体的程序并按顺序读出附加数据，例如和游戏有关的BGM(背景音乐)数据，图象数据和声音数据，按照游戏的进展可视地显示图象和可听地产生声音(例如人声和效果声)。
然而，未配备CD-ROM的游戏装置即可拆地安装ROM盒的那类游戏装置，游戏程序和极少需要的附加数据必须被预先写入ROM中，这对游戏的进行是绝对重要的并且永远不能被省略。由符合MIDI标准的数据构成的BGM数据不需要大的存储空间，因而省略BGM数据基本上不能节省存储容量。与此相反，在进行游戏时不经常使用声音数据，并且可以用作为字符图象进行视觉显示的字符数据代替，尽管它们的数据总量比BGM数据大；因而，声音数据可以经常被部分地省略而不会给游戏的进行带来不利影响。
因此，在现在的游戏装置以及使用这种ROM盒的装置中，极少需要的声音数据在基本游戏程序、图象数据和BGM数据已被写入ROM盒之后被存储在盒的有限的区域中。因而，在声音数据被存储在这种ROM盒的这种游戏装置中，使用ADPCM技术作为压缩声音数据的方法，以便使存储声音数据所需的存储空间最小。这种数据压缩技术可以显著地减少声音数据的总数据量，使得声音数据可以以足够的数量存储在ROM盒中，以便在游戏进行期间较大地增强音乐效果。
然而，对于近期的游戏软件，用于游戏主体的程序和图象数据越来越大，这必然限制了在ROM盒中用于BGM数据和声音数据的存储区。因而，尽管ADPCM数据呈压缩数据形式，其数据总量也远大于MIDI数据，它必须通过转换成字符数据被进一步减少，结果只有极小地需要的声音数据可以存储在ROM盒中。这带来的问题是，即使声音数据利用ADPCM压缩技术压缩，其可在ROM盒中存储的数据总量也不能显著地增加。
因此，本发明的目的在于提供一种声音重放装置和声音重放方法，所述装置和方法能够用较高的压缩率压缩采样的声音或声音波形数据，从而有效地节省存储容量与/或通信时间。
本发明的另一个目的在于提供一种音乐重放装置，例如卡拉OK装置，它能够完成上述的目的。
虽然一般希望进一步提高数据压缩率，但用较高的压缩率压缩的数据将用较长的解码时间，因而必须在处理时适当考虑必须响应声音发生请求实时地重放声音的情况。
因此，本发明的另一个目的在于提供一种声音重放装置和声音重放方法，其中使用在需要快速地实时地产生声音的情况和不需要快速地实时产生声音的情况之间的不同的声音波形数据压缩技术。
本发明的另一个目的在于提供一种音乐重放装置和音乐重放方法，它允许任何一种或几种不同的数据压缩技术被选择地用于压缩采样的声音或声音波形数据。
本发明的另一个目的在于提供一种实现上述目的电子游戏装置，特别是提供一种这样的电子游戏装置，借助于在游戏装置的主体中设置用于把索引信息转换成声音频谱的代码手册，即使利用具有有限存储容量的存储介质，例如ROM盒，该装置也能够处理足够数量的声音数据。
应该说明，这里出现的术语“声音”用来广义地不仅指人的声音，而且指任何其它选择的声音，例如效果声或模拟声。此外，这里使用的术语“声音数据”或“声音波形数据”指MIDI数据之外的数据，特别是根据采样波形数据的数据。即采样波形数据(PCM数据)基本上叫作“声音数据”或“声音波形数据”，并且在需要时通过压缩采样的波形数据而获得的数据也叫作“声音数据”或“声音波形数据”。
为实现上述目的，本发明提供一种声音重放装置，所述装置包括接收装置，用来从声音重放装置的外部接收用预定的第一数据压缩技术压缩的声音数据；第一解码装置，解码通过接收装置接收的声音数据；数据压缩装置，用来利用预定的第二数据压缩技术、第一数据压缩技术压缩由第一解码装置解码的声音数据，所述第一数据压缩技术使用的数据压缩率比由第二数据压缩技术使用的数据压缩率高；第二解码装置，用于解码由第二数据压缩技术压缩的声音数据；以及根据由第二解码装置解码的声音数据产生声音信号的装置。
在这种声音重放装置中，从外部接收的声音数据是利用采用高压缩率的第一数据压缩技术压缩的数据。这样，当通过通信线路接收利用第一数据压缩技术压缩的数据时，便能有效地节省通信时间和费用。接收的声音数据用第一解码装置解码，然后由数据压缩装置利用第二数据压缩技术压缩。此后，用第二数据压缩技术被这样压缩的声音数据由第二解码装置解码，从而根据解码的声音数据产生音乐声音。因为第二数据压缩技术使用比第一数据压缩技术低的压缩率，所以解码压缩的声音数据不占用长的时间，这样，可以利用快速响应满足实时地发声要求。因此，通过在需要实时地发声的情况和不需要实时地发声的情况之间使用不同的声音波形压缩技术，可以实现彼此兼容的节省通信时间和实时响应。
作为一个例子，利用第一数据压缩技术压缩的声音数据用利用矢量量化技术规定声音数据的频谱和频谱包络的信息组合表示，第二数据压缩技术根据自适应差分脉冲编码调制(ADPCM)技术。例如，矢量量化技术使用的压缩率大约为由ADPCM技术使用的压缩率的3倍。
在通常的卡拉OK装置中，对于采样的背景合唱之类的声音数据，用ADPCM数据压缩技术压缩的声音数据(ADPCM声音数据)被存储，从而通过解码并重放存储的声音数据执行背景合唱之类的附加的演奏。这样，通过使用ADPCM数据压缩技术作为上述的第二数据压缩技术，在常规卡拉OK装置中的重放机制可以直接地用于本发明中。这就是说通过沿传输频道发送使用较高的压缩率利用矢量量化技术压缩的声音数据，和发送常规的ADPCM声音数据相比，能够显著地减少所需的数据传输时间。然而，尽管当前使用的卡拉OK装置的大多数可以处理ADPCM声音数据，但是它们不能处理矢量量化的声音数据。因此，按照本发明，卡拉OK装置解码矢量量化的声音数据成为原始的声音数据，并也用ADPCM数据压缩技术压缩解码的声音数据。这一方案允许矢量量化的声音数据被传送到只能处理ADPCM声音数据的卡拉OK装置中。
矢量量化的声音数据对噪声不敏感(具有高的强度)。因而，在用于存储于存储器中的声音数据的非实时传送中，声音数据可用高强度的高压缩率的压缩技术压缩，但是，在实时地传送声音的声音数据时，低强度低压缩率的常规的(ADPCM)压缩技术可以直接地用来压缩声音数据。
本发明还提供一种音乐重放装置，该装置包括存储装置，用于存储给定的音乐片段的要被用于重放音乐的音乐演奏数据和随着音乐要被重放的声音数据，其中的声音数据通过利用矢量量化技术组合规定频谱图形的和频谱包络的信息，以压缩的数据形式表示；读出装置，用于响应重放地演奏音乐片段的指令从存储装置中读出音乐演奏数据和声音数据；音调产生装置，用来根据从存储装置中读出的音乐演奏数据产生音乐声音；解码装置，用来解码从存储装置中读出的声音数据，从而产生声音波形信号；以及用来可听地产生由解码装置解码的声音数据的声音和由音调产生装置产生的音乐声音的装置。
在这种音乐重放装置中，背景合唱之类的采样的声音数据使用比ADPCM数据压缩技术的压缩率高的压缩率压缩并被存储在存储装置中。这些数据在传统上是用ADPCM数据压缩技术压缩的。这可以大大节省存储容量。此外，如果利用矢量量化技术压缩的声音数据通过通信线路被接收，则可以有效地节省通信时间和通信费用。
本发明还提供一种音乐重放装置，该装置包括数据供给装置，用于提供被用于重放音乐的音乐演奏数据和随音乐要被重放的声音数据，所述声音数据是用几种不同的数据压缩技术之一压缩过的；识别装置，用来识别由数据提供装置提供的压缩的声音数据所使用的数据压缩技术，解码装置，按照由识别装置识别的数据在压缩技术，解码声音数据；音调产生装置，根据由数据提供装置供给的音乐演奏数据产生音乐声；以及用于可听地产生解码的声音数据的声音和由音调产生装置产生的音乐声的声音的装置。
利用这种方案，其中识别装置识别由数据供给装置供给的声音数据是由哪一种不同的压缩技术压缩的，解码装置按照识别装置识别的数据压缩技术解码声音数据，便可以在使用压缩数据形式的采样的声音或声音波形数据的情况下，可以选用任意一种或几种不同的数据压缩技术。例如，能够处理利用矢量量化技术压缩的声音数据和利用ADPCM技术压缩的声音数据。这样，便可以象过去一样处理ADPCM数据，并且还能够正确地处理这样的应用，其中要求通过使用利用矢量量化技术压缩的声音数据节省存储容量和通信时间。
本发明还提供一种电子游戏机，它包括用于按照游戏节目的进展产生声音数据的装置，声音数据是以按照矢量量化技术压缩的数据形式表示的；对产生的声音数据解码的解码装置；以及可听地产生解码的声音数据的声音的装置。
在这种电子游戏装置中，传统上用ADPCM数据压缩技术压缩的人声、效果声之类的采样的声音数据利用压缩率比ADPCM数据压缩技术高的压缩率压缩并被存储在存储装置中。这大大节省了存储容量。也就是说，用矢量量化技术压缩的声音数据(矢量量化声音数据)被存储在存储着程序的有限的存储容量的存储介质例如ROM盒中，并且在游戏装置本体内还设置有包括用于解码压缩数据的转换表的解码装置。利用这种方案，和如同过去那样存储ADPCM声音数据相比，可以在预定容量的给定存储区域中存储较大量的声音数据。这样，本发明的游戏装置能够按照游戏的进展产生正确的多样化的高质量的声音，借以显著地增加游戏的娱乐效果。
为了更好地理解本发明的上述的和其它的特点，下面结合

本发明的最佳实施例，其中图1是使用按照本发明的声音重放装置的卡拉OK装置的第一实施例的全部硬件结构方块图；图2a至2c是要被用于图1的卡拉OK装置中的音乐片段数据的格式的例图；图3是说明图1的代码手册的表的内容的例图；图4是简要说明通过矢量量化技术把声音数据量化成索引信息和辅助信息的方式图；图5是简要说明根据用矢量量化技术压缩的矢量量化声音数据解码成原始声音数据的方式的图；图6是本发明第二实施例的整个硬件结构的方块图；图7是本发明第三实施例的整个硬件结构的方块图；图8是在图7的第三实施例中使用的音乐片段数据的示例的格式图；图9是按照本发明第四实施例的游戏装置的整个硬件结构的方块图；以及图10是在图9的第四实施例中使用的游戏相关信息的数据存储格式的例图。
图1是作为按照本发明的声音重放装置的一个例子的卡拉OK装置70的第一实施例的整个硬件结构方块图。
本实施例将按照关于所谓“累积型”卡拉OK装置70说明如下，它是一个通过通信接口6和通信网络80和中央主计算机90相连的终端装置，用来接收从主计算机90发送的一个或几个音乐片段数据并把接收的数据存储在内部硬盘中。
按照第一实施例，中央主计算机90使用矢量量化技术以相当高的压缩率压缩音乐片段的数据声音数据D1-Dn，并把压缩的数字声音数据(以后称作“矢量量化声音数据”)加到音乐片段数据的首标和MIDI数据部分，借以形成图2A所示的音乐片段数据。中央主计算机90通过通信线路80按照预定的通信方法把这样形成的音乐片段数据发送给卡拉OK装置70。卡拉OK装置70在从主计算机90收到音乐片段数据之后，则使用比矢量量化技术的压缩率低的ADPCM技术把音乐片段数据的矢量量化的声音数据转换成ADPCM数据(自适应差分脉冲编码调制的数据)。然后把得到的ADPCM数据存储在卡拉OK装置70的硬盘装置(HDD)5中。上述的“矢量量化的声音数据”后面将结合图4详细说明。
卡拉OK装置70包括微处理器单元(CPU)1，存储器2例如其中具有预先存储的操作程序的ROM(只读存储器)和工作与数据存储器3例如RAM(随机存取存储器)，并且在微机系统的控制下进行各种操作。
CPU1控制卡拉OK装置70的全部操作。CPU1通过数据和地址总线21和下列单元相连程序存储器2，工作和数据存储器3，面板接口4，硬盘装置(HDD)5，ADPCM编码装置9，音调发生器电路1 0，ADPCM数据解码装置11，效果赋予电路14，图象产生电路16和背景图象重放电路18。一个或几个附属装置，例如包括MIDI接口电路和用于激光盘(LD)或光盘(CD)的自动转换器的背景图象重放装置也可以和CPU1相连，虽然这里略去这种附件的说明。
作为只读存储器(ROM)的程序存储器2中已预先存储有用于CPU1的系统相关程序，用于在硬盘装置5中加载存储的系统相关程序的程序，以及各种参数、数据等。
用于暂时存储从硬盘装置5加载的系统程序以及在CPU1执行程序时产生的各种数据的工作与数据存储器3在预定的地址区被提供用作寄存器和标记。
面板接口(I/F)4把各操作员在卡拉OK操作板(未示出)或遥控器上发出的指令转换成可被CPU1处理的信号并把转换的信号送到数据和地址总线21上。
硬盘装置5具有例如几百兆到几千兆字节范围内的存储容量，并存储用于卡拉OK装置70的卡拉OK操作系统程序。按照本发明，存储在硬盘装置5中的音乐片段的声音数据(例如背景合唱的人的声音数据)即采样的声音波形数据被压缩成ADPCM数据。当然，可以表示为MIDI标准数据的音乐片段中的注释数据和其它数据以MIDI的形式存储。显然，可以存储在硬盘装置5中的音乐片段数据不仅可以通过通信网络80被提供，而且可以通过软盘驱动器、CD-ROM驱动器(未示出)或其它装置读出而提供。
通信接口6按照其通信方案重放通过通信网络80发送的作为原始的首标、MIDI数据部和声音数据部(矢量量化声音数据)的数据的音乐片段数据，并把该数据送到矢量量化数据解码装置7。
矢量量化解码装置7把通过通信接口6接收的含在矢量量化声音数据中的索引信息34根据代码手册8转换成频谱图形，并根据转换的频谱图形与辅助信息重放原始的数字声音数据。然后，矢量量化数据解码装置7和首标与MIDI数据部分的数据一道把再现的或解码的数据送给ADPCM编码装置9。
代码手册8是一种用于把索引信息转换成声音数据的特定图形的转换表，并且可以是一个专用存储器或可以以硬盘装置5内的合适的区域被提供。要被存储在代码手册8中的数据可以通过通信网络80被提供或从软盘驱动器或CD-ROM驱动器读入。
ADPCM编码装置9把由矢量量化数据解码装置7解码的数字声音数据编码成为ADPCM数据。含有由ADPCM编码装置9编码成为ADPCM数据的声音数据的音乐片段数据被存储在硬盘装置5中。
也就是说，按照上述实施例的卡拉OK装置70接收含有声音数据的音乐片段数据，所述声音数据是以能以比ADPCM数据压缩技术高的压缩率压缩数据的矢量量化技术压缩过的，然后使用矢量量化技术解码接收的音乐片段数据中的声音数据。此后，卡拉OK装置70再使用ADPCM数据压缩技术压缩解码的声音数据，以便把再次压缩过的声音数据插入音乐片段数据中，供随后存储在硬盘驱动器5或直接传递到ADPCM数据解码装置11中。
能够在几个频道中同时产生音调信号的音调发生器电路10接收符合MIDI标准的由数据和地址总线2 1提供的音调磁道的音调数据，根据接收的音调数据产生音调信号，然后把产生的音调信号送到混合器电路12。
在音调发生器电路10中的用于同时产生多个音调信号的音调产生通道可以根据时分使用一个电路或对于每一通道提供一个电路来实现。
在音调发生器电路10中可以根据不同的应用使用任何音调信号产生方法。例如，可以使用的已知音调信号产生方法有存储器读出方法，其中在波形存储器中存储的音调波形采样值数据按照相应于要被产生的音调的音高(pitch)而变化的地址数据被相继地读出；FM方法，其中音调波形采样值数据通过使用上边的地址数据作为相角参数进行预定的频率调制操作而被获得；或AM方法，其中音调波形采样值数据通过使用上述的地址数据作为相角参数数据进行预定的幅值调制而被获得。此外，音调发生器电路10也可以使用物理模型方法，其中音调波形通过模拟自然乐器的音调产生原理的算法而被合成；谐波合成法，其中音调波形通过在基波上增加多个谐波而被合成；峰段(formant)合成法，其中音调波形通过使用具有特定频谱分布的峰段波形而被合成；或使用VCO、VCF或VCA的模拟合成器法。此外，音调发生器电路10可以不用专用硬件而通过组合使用DSP和微程序或组合使用CPU与软件程序来实现。
ADPCM数据解码装置11通过对ADPCM数据进行位转换和频率转换处理扩展包含在来自硬盘装置5的音乐片段数据中的或包含在来自ADPCM编码装置9的音乐数片段数据中的ADPCM数据，从而重现原始的声音信号(PCM信号)。注意ADPCM数据解码装置11有时可以按照预定的节距信息产生节距移动的声音信号。
混合器电路12混合来自音调发生器电路10的音调信号、来自ADPCM数据解码装置11的声音信号以及来自麦克风13的声音信号，然后把混合的结果送给效果赋予电路14。
效果赋予电路14对从混合器电路12送出的混合结果赋予音乐效果，例如回声与/或交混回响，然把得到的被赋予效果的信号送到声音输出装置15。效果赋予电路14按照存储在音乐片段数据的效果控制磁道上的控制数据决定要被赋予的每个效果的种类和程度。
声音输出装置15通过包括放大器和扬声器的音响系统可听地重放所述音调和声音信号。当然，在适当位置提供有D/A转换器，尽管在图中没有专门示出。根据D/A转换器所处的位置，混合器电路12可以作为数字混合器或作为模拟混合器，并且效果赋予电路14可以作为数字效果器或模拟效果器。
图象产生电路16根据从在歌词磁道上记录的MIDI数据而产生的字符代码、表示图象要被显示的特定位置的字符数据、表示图象要被显示的特定时间长度的显示时间数据、以及按照音乐片段的进展用于按顺序改变画面的显示色彩的扫描顺序数据产生要被可见地显示的歌词的图象。
背景图象重现电路18从CD-ROM17中选择地重现相应于要被演奏的音乐片段风格或类型的预定的背景图象，并把重现的背景图象送到图象混合电路19中。
图象混合电路19把从图象产生电路16输出的歌词图象迭加到从背景图象重现电路18输出的背景图象上，并把所得的迭加的图象送到图象输出电路20。
图象输出电路20可见地显示由图象混合电路19输出的背景图象和歌词图象的合成或混合图象。
图2表示图1的卡拉OK装置70通过通信网络接收的一个音乐片段的音乐片段数据的格式的例子。
如图2A所示，该音乐片段数据包括首标31、MIDI数据部分32和声音数据部分33。
首标31含有和该音乐片段数据有关的各种数据，例如，表示音乐片段的名称、音乐片段的风格的数据，表示音乐片段数据的发行日期的数据以及根据音乐片段数据表示音乐片段演奏时间的数据等。在某些情况下，首标31可能含有各种附加信息，例如通信日期和访问该音乐片段数据的次数和日期。
MIDI数据部分32包括音调磁道、歌词磁道、声音磁道和效果控制磁道。在音调磁道上记录着相应于音乐片段的主调部分、伴奏部分、节拍部分等的演奏数据。作为一组符合MIDI标准的演奏数据，包括表示事件之间的时间间隔的持续时间数据Δt，表示事件的种类的(例如发声开始指令或发声结束指令)状态数据，用来对要被产生的或要被消失的每个音调分配音高的音高分配数据，以及用来对要产生的每个音调分配音量的音量分配数据。当状态数据表示发声开始指令时最后所述的音调音量分配数据被记录。
在歌词磁道上以MIDI系统专用的信息格式记录着关于要在监视器屏幕(未示出)上显示的歌词的数据。即在这歌词磁道上记录的MIDI数据包括相应于要被显示的歌词的字符代码、在要被显示歌词的特定位置上的字符数据、代表歌词要被显示的特定时间长度的显示时间数据以及随着音乐片段的进展用于按顺序改变歌词的颜色的扫描顺序数据。
在声音磁道上以如图2B所示的MIDI系统专用的信息格式，记录着指令可听地重放或发声在声音数据部分33记录的声音数据的数据。即在声音磁道上记录的MIDI数据包括分配发声定时的数据，在分配的发声定时指定要被发声的特定声音数据的数据，表示声音数据的发声音量的数据，和分配声音数据的音高的数据。
在效果控制磁道上记录着关于效果赋予电路14的控制的MIDI数据。
在歌词磁道和效果控制磁道上的数据作为如图2B所示的符合MIDI标准的数据被发送并被存储在硬盘装置5中。
因为在MIDI数据部分22的数据符合MIDI标准，它们根本不用压缩便被传输，而在声音根据33中的数据在利用矢量量化技术压缩之后才被传输。
卡拉OK装置70解码通过通信网络80和通信接口6接收的音乐片段数据中的矢量量化的声音数据。然后，在卡拉OK装置70中，解码的数字声音数据通过ADPCM编码装置9被转换成ADPCM数据并被写入硬盘装置5中。
结果，被写在硬盘装置5中的音乐片段数据将和常规的卡拉OK装置一样含有ADPCM数据。即按照本实施例的卡拉OK装置可以通过增加矢量量化数据解码装置7、代码手册8和ADPCM装置9来实现。
图2C示意地表示由矢量量化技术量化的并被存储在声音数据部分33中的数据格式。被存储在声音数据部分33的数据D1-Dn包括要随音乐片段发声的关于背景合唱、模拟声、二重奏等的声音数据的频谱包络的辅助信息37至39，和规定声音数据的各个频谱图形的索引信息34至36。对于每帧的开头和结尾附加有开始与结束数据S和E。虽然只有三帧，每一帧包括索引和辅助信息，如图2C所示，但是实际上，声音数据部分33包括大量的这种帧。
图3是说明代码手册8的内容的例图。例如，当索引信息为“1”时，则从代码手册8中读出频谱图形1作为相应帧的频谱，当索引信息值为“2”时，则从代码手册8中读出频谱图形工作为相应帧的频谱，并依此类推。
图4是如前所述声音数据被压缩成矢量量化的声音数据时所用的方式的例子。
当存在如图4(A)所示的声音数据时，则声音数据的例如由矩形方块40表示的一个局部区域被提取，如图4(B)所示。在图4(B)所示的所得提取的波形数据被送到MDCT(修正的离散余弦变换)部分41，进行离散余弦变换、离散付氏变换或类似处理，从而把数据变成频域信号即如图4(C)所示的频谱信号。
提取的波形数据还被送到线性预测编码(LPC)部分42，把输入的数据转换成频谱包络信息如图4(D)所示。量化部分43量化频谱包络信息和相应的声音功率信息作为辅助信息。
如图4(C)所示的频域信号(频谱信号)通过归一化部分44被转换成如图4(E)所示的归一化的频谱图形。虽然图4(E)所示的频域信号在此为了提供归一化的频谱图形而除以图4(D)所示的频谱包络信息，但该信号可以用其它方式归一化。
归一化的频谱图形被送入另一个量化部分45，把输入的频谱图形量化为相应于存储在代码手册8中的最接近输入的频谱图形的一个频谱图形的索引信息。
然后被量化部分43和量化部分45分别量化的辅助信息和索引信息将如图2C所示被排列，并作为表示声音数据部分的数据D1-Dn的矢量量化的声音数据被传输。
一旦卡拉OK装置70通过通信网络80和通信接口6接收到含有作为声音数据部分的数据的矢量量化的声音数据时，卡拉OK装置70便通过矢量量化数据解码装置7把接收的数据解码成原来的数字声音数据(PCM数据)。
图5表示由矢量量化数据解码装置7执行的用于把矢量量化的声音数据解码成为相应的原始数字声音数据的操作。其中图5的(B)、(C)、(D)和(E)相应于图4的(B)、(C)、(D)和(E)。
在矢量量化解码装置7中，归一化频谱重现部分51根据索引信息34-36从图3的代码手册中读出频谱图形，如图5(E)所示。频谱包络重现部分52根据索引信息37-39重现频谱包络信息，如图5(D)所示。频谱重现部分53用来自频谱包络重现部分52的频谱包络信息乘以来自归一化频谱重现部分51的频谱图形，从而重现频谱信号如图5(C)所示。反MDCT部分54对来自频谱重现部分53的频谱信号进行相反的MDCT处理，从而重现原来的数字声音数据部分，如图5(D)所示。
然后，把重现的数字声音数据(PCM数据)通过ADPCM解码装置9转换成ADPCM数据，该数据然后被存储在硬盘装置5中或和首标与MIDI数据部分31和32中的数据一道被送到ADPCM数据解码装置11。应该说明，要被解码的矢量量化数据可以被直接地编码成为ADPCM数据。
虽然本实施例已在上面参照使用压缩率比ADPCM数据压缩技术高的矢量量化技术作为数据压缩技术的情况进行了说明，但也可以说明任何其它的合适的数据压缩技术。
此外，虽然本实施例在上面已对于声音数据在被矢量量化技术压缩之后进行传输的情况作了说明，其它数据例如背景图象数据也可以在被矢量量化技术压缩之后进行传输。
而且，虽然本实施例在上面已对于主计算机90通过通信线路80向一个卡拉OK装置70发送数据的情况进行了说明，但本发明当然也适用于主计算机90向包括矢量量化数据解码装置、代码手册以及ADPCM编码装置的子主计算机发送数据，从而使得被在主计算机中的ADPM编码装置编码成为ADPM数据的音乐片段数据被分配给多个间隔内的各个卡拉OK装置的情况。
至此说明的本发明的第一实施例能够通过传输路径传输由使用高压缩率的声音数据压缩技术压缩的声音数据，同时又高效率地利用使用低压缩率的声音数据解码装置，所述解码装置是在作为常规的声音重放装置的卡拉OK装置中使用的。这一方案的最大优点在于，用于数据传递的所需时间可大大缩短。
下面参照图6说明本发明的第二实施例。虽然上述第一实施例在解码矢量量化数据之后执行把数据编码成ADPCM数据的“中间”处理，但第二实施例不执行这一中间处理，而是直接地把矢量量化数据解码成PCM数据。
图6的第二实施例和第一实施例的不同之处主要在于，它不包括第一实施例的ADPCM编码装置9和ADPCM解码装置11，并且矢量量化数据解码装置71和代码手册81被提供在混合器12之前；第二实施例中的其它部分和第一实施例类似，因而下面的说明将集中围绕不同的部分进行。
在图6的第二实施例中，类似于上述的第一实施例，通过通信网络80由主计算机90发送的音乐片段数据包括首标部分31、MIDI数据部分32和声音数据部分33，如图2A到2C所示，并已由矢量量化技术压缩过。由卡拉OK装置70通过通信接口6接收的音乐片段数据被存储在硬盘装置5中。这样，在第二实施例中，在声音数据部分33中的矢量量化数据被直接地存储在硬盘装置5中而根本不进行解码。
为了演奏所需的音乐片段，按照在声音磁道上记录的指令从硬盘装置5中读出的矢量量化数据经数据与地址总线21送到矢量量化数据解码装置71，通过使用代码手册81被解码成原来的数字声音波形数据被送到混合器12。
第二实施例的特征在于，卡拉OK声音数据被转换为矢量量化波形数据并且转换的矢量量化波形数据根据在终端卡拉OK装置中提供的代码手册被合成可听的声音。由于这一特点，第二实施例实现了一种优异的卡拉OK装置，它能够有效地减少传输音乐片段数据所需的时间并减轻在终端存储装置上的负载。
下面参照图7和图8说明本发明的第三实施例。按照第三实施例，不能表示为MIDI数据的音乐片段数据、声音数据(在图8的声音数据部分33中的)被以这种方式表示，使得不管它是ADPCM数据或矢量量化数据部能被正确地重现。在图7中，和图1或图6相同的部分用相同的标号表示，因而不再详述以免不必要的重复。
从主计算机90通过通信线路80发送的音乐片段数据以图8所示的格式排列，它一般类似于图2A，其微小的区别在于首标31的数据格式和声音数据部分33的数据表示(即数据压缩)根据音乐片段的性质或者用ADPCM或者用矢量量化。在图8中，首标31包括除去图2A的代表音乐片段的名称、日期、风格等的数据之外还包括在声音数据部分33中使用的数据压缩类型的数据(即ADPCM或矢量量化)。即声音数据部分33可以包括用于一个音乐片段的ADPCM数据和用于另一音乐片段的矢量量化数据。
在图7的第三实施例中，和上述第一与第二实施例类似，从主计算机90通过通信网络80提供的音乐片段数据被存储在硬盘装置5中。然后，响应要被演奏的音乐片段的选择，所选的音乐片段的音乐片段数据从硬盘装置中被顺序地读出。更具体地说，各个磁道的MIDI数据(在图8的MIDI数据部分中的)被按顺序重现，并按照声音磁道上的声音分配信息(图2B)从声音数据部分33读出给定声音的声音数据。读出的声音数据被送到数据识别电路22以便识别它是由ADPCM还是由矢量量化技术压缩的。按照识别的结果，声音数据被送到矢量量化数据解码装置71或被送到ADPCM数据解码装置11。作为一个例子，在首标31中包含的代表声音数据的压缩类型的数据被送到数据识别电路22，按照识别的结果再被送到矢量量化数据解码装置71或ADPCM解码装置11。更具体地说，如果声音数据被识别出是矢量量化数据，就被送到矢量量化数据解码装置71，而如果被识别为ADPM数据，就被送到ADPM数据解码装置11。
如上所述，矢量量化数据解码装置71把包含在提供的矢量量化声音数据中的索引信息(图2C)根据代码手册81转换成频谱图形，并根据转换的频谱图形和辅助信息(图2C)重现原来的数字声音波形数据(PCM数据)。然后，矢量量化数据解码装置71向混合器12输入重现的或解码的原来的数字声音波形数据。ADPCM数据解码装置1对提供的ADPCM数据进行位变换和频率变换处理，借以重现原来的PCM声音数据。然后，ADPCM数据解码装置11向混合器12输入重现的或解码的原来的PCM声音数据。注意ADPCM数据解码装置11也具有按照预定音高变化信息例如传送数据改变解码的PCM声音数据的功能。类似地，矢量量化数据解码装置71具有改变音高指定信息(图2B)从而使重现的声音的音高改变的功能(虽然上面没有专门说明，但其它实施例也具有这个附加功能)。
在上述实施例中，声音数据的压缩形式在一个整个的音乐片段中是不变的，并且代表声音数据的压缩形式的类型的数据被包括在首标31中。不过，这仅是为了说明而已，声音数据的压缩形式可在一个音乐片段的声音数据部分33中的数据组D1、D2、D3、…(图8)当中被设定为不同的形式。在这种情况下，代表被用于一个事件的声音数据的压缩形式的类型的数据可被预先存储在声音磁道上的事件数据部分(图2B)，以便使从该部分读出的数据被用于数据识别电路22中进行数据类型确定。即使在声音数据的压缩形式在整个音乐片段被设置为不改变的情况下，代表声音数据压缩形式类型的数据也可以预先存储在除首标31之外(图8)的合适的存储装置中，例如存储在用于检索所需音乐片段的索引表(未示出)中。
虽然上述的每个实施例都是按照用于卡拉OK装置说明的，但本发明也可应用于其它任何声音重放装置。本发明也可以应用于重放不是人声的任何其它声音的重现。
下面参照图9和图10说明本发明的第四实施例。第四实施例的特征在于，以上说明的有关其它实施例的矢量量化技术被用于电子游戏装置中。
图9是实施本发明第四实施例的电子游戏装置25的方块图。
在该实施例中，ROM盒27已预先以图10所示的数据格式存储游戏程序和附加数据，例如BGM数据、图象数据和相关的声音数据。电子游戏装置25读出游戏程序和各种数据，从而使游戏进展，演奏音乐，可见地显示图象并产生声音。
ROM盒27已经按这样的方式预先存储用矢量量化技术压缩的声音数据，使得游戏装置25通过按顺序读出矢量量化的声音数据产生声音。
游戏装置25在一般包括微处理器单元(CPU)1、程序存储器(ROM)2和工作与数据存储器(RAM)3的微机系统的控制下执行各种处理。CPU1控制游戏装置25的全部操作。在图9中，由和图1或图6的实施例相同标号表示的元件具有和图中对应部分相同的功能，在此不再说明以免不必要的重复。
控制接口(I/F)28把来自游戏操作器例如游戏杆(未示出)的指令信号转换成可由CPU1处理的信号并把所得转换信号送到数据与地址总线21。盒槽26是用于把ROM盒27连接到数据与地址总线21的端子。如前所述，ROM盒27中预先存储有游戏程序和BGM数据，图象数据和与其相关的声音数据。
CPU1按顺序从ROM盒27中读出游戏程序数据、BGM数据、图象数据和声音数据，并按照通过控制接口4接收的控制信号控制游戏的进展。在图10中，BGM数据是符合MIDI标准的自动演奏数据。图象数据被送到图象发生电路16中，其中包括图文数据以及代表背景图象、字符图形、坐标顶点之类的数据。和文字的声音或和叙述的声音相关的数据即声音数据被预先由矢量量化技术压缩并被送到矢量量化数据解码装置71中。如同图2A的声音数据部分33一样，声音数据包括多个声音数据组D1，D2，D3…。
更详细地说，BGM(背景音乐)数据包括相应于自动演奏部分的多个自动演奏MIDI数据磁道，例如主调部分、合音部分、节拍部分以及声音磁道。从自动演奏MIDI数据磁道读出的各个自动演奏部分的MIDI数据被送到音调发生器电路10，它接着产生由MIDI数据指定的数字音调信号。在声音磁道上的数据类似于图2B所示的数据，并且包括用于对每个事件发声的声音数据组D1、D2、D3，…。在每个声音数据组中的矢量量化的声音数据的数据格式类似于图2C所示，并被设置包括用于多个帧中的每个帧的索引信息和辅助信息。在给定的发声定时读出的矢量量化声音数据被送到矢量量化解码装置71，在此参照代码手册被解码成为PCM声音波形数据。混合器12把解码的PCM声音波形数据和来自音调发生器电路10的数字音调信号加在一起，并把混合结果送到效果赋予装置14。
虽然上面对于在ROM盒中存储由矢量量化技术压缩的声音波形数据的情况说明了第四实施例，但是当然声音波形数据也可以存储在任何其它存储介质例如CD中。
此外，在使用具有相当大容量的存储介质例如CD-ROM的情况下，当最新的代码手册信息被存储大CD-ROM中时，第四实施例的代码手册81和矢量量化数据解码装置71可以使用游戏装置25内的RAM3来实现。
按照本发明的游戏装置的优点在于可以用小的存储容量产生高质量的声音。
权利要求
1.一种声音重放装置，包括接收装置，用来从所述声音重放装置的外部接收利用预定的第一数据压缩技术压缩的声音数据；第一解码装置，用来解码通过所述接收装置接收的声音数据；数据压缩装置，用于利用预定的第二数据压缩技术压缩由所述第一解码装置解码的声音数据，所述第一数据压缩技术使用的数据压缩率比所述第二数据压缩技术使用的数据压缩率高；第二解码装置，用于解码利用的所述第二数据压缩技术压缩的声音数据；以及用来根据由所述第二解码装置解码的声音数据产生声音信号的装置。
2.如权利要求1所述的声音重放装置，其中利用所述第一数据压缩技术压缩的声音数据利用规定声音数据的频谱图形和频谱包络的信息和矢量量化技术相结合表示，所述第二数据压缩技术根据自适应差分脉冲编码调制技术。
3.一种声音重放装置，包括接收装置，用来从所述声音重放装置的外部接收利用给定的第一数据压缩技术压缩的声音数据；第一解码装置，用来解码通过所述接收装置接收的声音数据；数据压缩装置，用于利用预定的第二数据压缩技术压缩由所述第一解码装置解码的声音数据，所述第一数据压缩技术使用的数据压缩率比所述第二数据压缩技术使用的数据压缩率高；存储装置，用来在其中存储利用所述数据压缩装置通过利用所述第二数据压缩技术压缩的声音数据；读出装置，用来响应声音产生指令从所述存储装置中读出声音数据；第二解码装置，用于解码由所述读出装置读出的声音数据；以及用于根据由所述第二解码装置解码的声音数据产生声音信号。
4.一种用于在压缩声音数据之后发送声音数据并响应实时发声的请求重放声音数据的方法，所述方法包括下列步骤通过网络发送利用预定的第一数据压缩技术压缩的声音数据；接收通过网络发送的声音数据；抵消接收的声音数据的压缩状态，借以解码声音数据；利用使用数据压缩率低于所述第一数据压缩技术的数据压缩率的第二数据压缩技术压缩解码的声音数据；在存储器中存储用所述第二数据压缩技术压缩的声音数据；响应实时发声请求，从所述存储器中读出利用所述第二数据压缩技术压缩的声音数据；解码从所述存储器中读出的声音数据；以及根据在从所述存储装置读出之后被解码的所述声音数据产生声音信号。
5.一种音乐重放装置，包括存储装置，用来在其中存储用于顺序演奏音乐的自动演奏数据和随音乐要被重放的声音数据，所述声音数据是根据预定的数据压缩技术以第一编码形式对附加声音的波形数据编码而获得的；接收装置，用来从所述声音重放装置外部接收以预定的第二编码形式编码的声音数据；所述第二编码形式根据一种使用的数据压缩率比所述第一编码形式使用的数据压缩率高的数据压缩技术；第一解码装置，用来解码通过所述接收装置接收的声音数据；数据编码装置，用来以所述第一编码形式编码由所述第一解码装置解码的声音数据；用于使由所述数据编码装置编码的声音数据存储在所述存储装置中的装置；读出装置，用来按照音乐重放指令从所述存储装置中读出自动演奏数据和声音数据；音调产生装置，用来根据从所述存储装置中读出的自动演奏数据产生音乐声音；第二解码装置，用于解码由所述数据编码装置以所述第一编码的形式编码的声音数据；以及用于混合根据由所述第二解码装置解码的声音数据的附加声音和由所述音调产生装置产生的音乐声音以便使附加声音和音乐声音混合发声的装置。
6.如权利要求5所述的音乐重放装置，该装置重放卡拉OK音乐。
7.一种音乐重放装置，包括存储装置，用于在其中存储给定的音乐片段的被用于和音乐的音乐演奏数据和要随音乐重放的声音数据，所述声音数据利用规定频谱图形与频谱包络的信息和失量量化技术相结合以压缩数据的形式表示；读出装置，用于响应重放所述音乐片段的指令从所述存储装置中读出音乐演奏数据和声音数据；音调产生装置，用于根据从所述存储装置读出的音乐演奏数据产生音乐声音；解码装置，用来解码从所述存储装置读出的声音数据，从而产生声音波形信号；以及用于可听地产生由所述解码装置解码的声音数据的声音和由所述音调产生装置产生的音乐声音。
8.如权利要求7所述的音乐重放装置，其中还包括接收装置，用于从所述音乐重放装置的外部接收给定音乐片段的音乐演奏数据和声音数据，并且其中接收的音乐演奏数据和声音数据被存储在所述存储装置中。
9.如权利要求7所述的音乐重放装置，其中所述解码装置包括一个表，所述表中具有以这种方式预先存储的多个频谱图形，使得响应频谱图形指定信息从所述表中读出一个特定的频谱图形，以及一个装置，用于设定相应于按照频谱图形指定信息从所述表中读出的特定频谱图形的各个频谱分量波形的各自的值，并相加地合成设定值的频谱分量波形，借以重现所述声音波形信号。
10.如权利要求7所述的音乐重放装置，该装置重放卡拉OK音乐。
11.一种音乐重放方法，包括以下步骤通过网络发送给定音乐片段的音乐演奏数据和声音数据，所述声音数据利用使规定频谱图形和频谱包络的信息的矢量量化技术相结合以压缩数据的形式表示；接收通过网络发送的音乐演奏数据和声音数据，并把它们存储在存储器中；响应音乐重放指令从所述存储器中读出音乐演奏数据和声音数据；解码从所述存储器中读出的声音数据，从而产生声音波形信号；以及根据从所述存储器读出的音乐演奏数据产生音乐声音。
12.一种音乐重放装置，包括数据供给装置，用于供给用于重放音乐的音乐演奏数据和随音乐被重放的声音数据，所述声音数据利用几种不同的数据压缩技术之一进行过压缩；识别装置，用来识别由所述数据供给装置提供的声音数据是由哪一种数据压缩技术压缩的；解码装置，用于按照由所述识别装置识别的数据压缩技术解码声音数据；音调产生装置，用于根据由所述数据供给装置供给的音乐演奏数据产生音乐声音；以及用于可听地产生解码的声音数据的声音和由所述音调产生装置产生的音乐声音的装置。
13.如权利要求12所述的音乐重放装置，其中所述不同的数据压缩技术包括的一个是根据矢量量化技术另一个是根据自适应差分脉冲编码调制技术。
14.如权利要求12所述的音乐重放装置，其中由所述数据供给装置供给的声音数据对于每一音乐片段使用不同的数据压缩技术进行压缩。
15.如权利要求12所述的音乐重放装置，其中由所述数据供给装置供给的声音数据对于一个音乐片段的每个预定的部分利用不同的数据压缩技术压缩。
16.如权利要求12所述的音乐重放装置，该装置重放卡拉OK音乐。
17.一种音乐重放方法，包括以下步骤提供用于音乐重放的音乐演奏数据和随着音乐而重放的声音数据，该声音数据利用几种不同的数据压缩技术之一被压缩；识别所提供的声音数据是用哪一种数据压缩技术压缩的；按照所识别的数据压缩技术解码声音数据；根据提供的音乐演奏数据产生音乐声音；以及可听地产生解码的声音数据的声音和产生的音乐声音的声音。
18.一种电子游戏装置，包括按照游戏程序的进展产生声音数据的装置；该声音数据按照矢量量化技术以压缩数据的形式表示；解码所产生的声音数据的解码装置；以及可听地产生解码的声音数据的声音的装置。
19.如权利要求18所述的电子游戏装置，其中用矢量量化技术压缩的声音数据包括规定频谱图形和频谱包络的信息，其中所述解码装置包括一个表，所述表中具有以这样的方式预先存储的多个频谱图形，使得响应频谱图形指定信息从所述表中读出一个特定的频谱图形，以及一个装置，用于设定相应于按照频谱图形指定信息从所述表中读出的特定频谱图形的各个频谱分量波形的值，并相加地合成设定值的频谱分量波形，借以重现一个声音波形信号。
全文摘要
采样的声音数据利用矢量量化技术被压缩,然后通过通信线路发送。接收的声音数据被解码,利用ADPCM技术压缩,然后存储在存储器中。响应重放请求,ADPCM数据被读出、解码然后产生声音。作为另一个例子,在卡拉OK装置中,除去MIDI形式的音乐演奏数据之外,采样声音数据在利用矢量量化技术压缩之后被提供。根据MIDI形式的音乐演奏数据音乐声被重放,与此同时,通过解码矢量量化的声音数据使声音重放。
文档编号G10H7/12GK1170924SQ9711380
公开日1998年1月21日申请日期1997年6月18日优先权日1996年6月19日
发明者荫山保夫, 肥真二, 仙场祐二申请人:雅马哈株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：荫山保夫;肥塚真二;仙场祐二
技术所有人：雅马哈株式会社
我是此专利的发明人

上一篇：用于编码读音前缀树的方法及系统的制作方法
上一篇：波包络加重处理的装置的制作方法