将信息插入音频信号以及再现该信息的方法及装置的制作方法

文档序号:2831304阅读:137来源:国知局
专利名称:将信息插入音频信号以及再现该信息的方法及装置的制作方法
技术领域
本发明的方法和装置涉及根据存储在音频CD中的信息来使用卡拉OK以及使用卡拉OK的方法,特别涉及一种将卡拉OK信息插入音频数据的方法,以及再现插入有卡拉OK信息的音频数据的方法。
背景技术
在过去的20年里,卡拉OK系统和设备取得了很大的进步。在20世纪80年代早期,通过使用模拟磁带来实现卡拉OK。使用模拟磁带存在的问题是不能立即定位一首歌曲的起点。随着CD技术的发展,这一问题得到了解决,其能够提供视频屏幕来设置适合于每一首歌曲的背景。应用技术上的革新,例如视频光盘、雷射光盘以及CD图形唱片(graphics),使得卡拉OK已经成为一项主要的娱乐产业。
用于卡拉OK的最常见的格式是CD+G格式。CD+G格式是一种标准的音频CD,在该音频CD通常不被使用的子代码区中存有图形命令。当音频被播放时,播放器解释该图形,以便显示并且高亮显示歌词或显示简单的图标或图像。但是,上述方法的缺点是需要一个特殊的装置来解码CD+G。基于计算机的卡拉OK的最流行的文件格式是卡拉OK式MIDI格式(KMF)。这种格式包括MIDI(音乐设备数字接口)文件和歌词,从而使得在计算机上唱歌成为可能。另外,一种相似的CD+MIDI计算机光盘格式使用CD+G方法。
紧致盘从1982年开始得以应用。光盘即为一种紧致盘,它不仅可以被可靠地应用于音乐,也可以做其它用途。即使DVD的使用已经非常普及,CD仍然广泛应用于音频。早期设计的音频CD可存储长度为一小时的高音质的立体声音频。但是近来的CD可以存储总计80分钟的高音质立体声音频。音频存储为数字格式,从而由乙烯(vinyl)和磁带盒(cassettes)引起的噪声实质上是不存在的。另外,如果仅仅是普通应用,CD也是不容易磨损的。
在1984年,制定了一种用于计算机数据存储的CD-ROM标准紧致之后,又提出了包括CD-ROM XA、CD-1、改进的CD以及视频CD在内的各种格式。这些紧致盘在物理结构上与音频CD是相同的。但是其中存储了种类不同的数据,例如文本、图像以及视频数据。上述多媒体光盘具有一种特殊的光盘格式,使它可以被某些硬件读取,如个人计算机和视频游戏机。上述光盘的应用包括视频游戏、视频CD、教育程序以及有关百科全书的程序。
图1表示音频CD数据存储格式。
参照图1,介绍一种在音频CD中存储数据的方法。
当在光盘中以凹坑的形式记录音频数据时,该音频数据被分成每信道6次采样,即192比特(6×2×16)或24字节的组。然后,4字节的子代码信道和8字节的交叉里德-所罗门编码(CIRC)的奇偶校验数据被加在分配好的音频数据上(如图1所示),形成一36字节的帧。已记录的音频数据的一个块(block)包括98个音频帧。图1表示上述音频CD的数据存储格式。
每一个块包括2352字节,按照通常的速度,每秒可以从CD中读取75个块。因此,存储相当于74分钟的数据的光盘包括333,000个块(74×60×75)。
一个36字节的帧包括3字节的同步数据,1字节的子代码数据,24字节的音频信号以及8字节的用于CIRC纠错的奇偶校验位,其中24字节的音频信号指示各个立体声信道的6个采样。在块内这些数据和音频数据交织在一起。
在CIRC方法中,为了纠错,会附带二维(two dimensional)的奇偶校验信息,将这些数据存储在光盘中以防止数据出现突发错误。在CIRC方法中,可纠错最大达3500比特(2.4mm)的突发错误。为了防止数据出现由轻微划痕产生的达12,000比特的8.5mm突发错误,CIRC方法是一种很合适的方法。CD-ROM盘通常应用另一种纠错方法。
例如,8到14调制(EFM)方法将每一8比特的符号调制为14比特+3合并比特,即17比特。EFM数据用于限制光盘上凹坑的长度和所占空间。包含合并比特的凹坑(pit)和台面(land)的长度应该多于3信道比特、少于11信道比特。这降低了由抖动引起的其它失真和错误率。普通的音频播放器使用对应于每一个轨道的起始和结束的P信道,而不是对Q信道整体进行解码。Q信道包括涉及分钟、秒钟和帧的时间码,导入区的内容表(TOC),轨道类型以及目录数。R信道到W信道是子代码区,用于由已知为CD-G的图形伴随的CD文本以及主要的音频数据。
当CD最早开始开发时,子代码用于保持光盘上的控制数据。主信道仅仅用于音频数据,而非其它类型的数据。之后,主信道开始应用于其它类型的数据,然后一个全新的省略子代码信道的DVD标准开始应用于CD中。
CD图形是CD音频的延伸,它包括图形数据和文本数据。这使得极简单的CD-ROM的特征可以被附加至典型的CD音频盘。
下面将介绍音频CD的数据存储机理。当R到W子代码信道的附加数据仅占典型的CD-ROM的存储容量的3%时,图形和文本可以在再现音频时被显示。每一条R到W子信道的可应用的最大数据率是5.4KB/S。R到W子信道中的数据和主信道中的音频数据一样由里德—所罗门错误纠正码(Reed-Solomon error correction code)进行纠错。
卡拉OK是采用CD-G的一种应用。也可以采用带有CD高保真的CD-G。上述设备需要附加三台电视机来显示文本,也就是歌曲的歌词。但是,为了重放CD-ROM上经过编码的CD-G,需要一个特殊的子代码区。CD-G分为两种附加的模式音乐设备数字接口(MIDI)模式和用户模式。
根据国际MIDI协会的规定,MIDI模式为MIDI数据提供一3.125kb/s的最大数据信道。用户模式用于专门的应用。但是,为了实现卡拉OK功能,需要一个特殊的播放器来重放上述卡拉OK格式。

发明内容
本发明提供一种自适应地将卡拉OK信息插入音频信号的装置和方法,从而可以在现有的播放器上实现卡拉OK功能,同时还可以保持音频信号的音质处于一定的范围内,使听众不会感觉失真。
本发明还提供一种根据音频CD所记录的信息获得卡拉OK的装置和方法。
根据本发明的优选实施例,本发明提供了一种自适应地将卡拉OK信息插入输入音频数据的方法,其中包括将卡拉OK信息插入具有预定长度的子音频块单元中的输入音频数据内,该卡拉OK信息由持续时间信息(durationinformation)和卡拉OK数据组成,该持续时间信息对应于插入有卡拉OK信息的子音频块的范围(range)。
根据本发明的另一优选实施例,本发明提供了一种计算机可读记录介质,该记录介质存储的程序用来实现将卡拉OK信息插入输入音频数据,该程序包括将卡拉OK信息插入具有预定长度的子音频块单元中的输入音频数据内,该卡拉OK信息由持续时间信息和卡拉OK数据组成,该持续时间信息对应插入有卡拉OK信息的子音频块的范围。
根据本发明的另一优选实施例,本发明提供一种将卡拉OK信息插入输入音频数据的装置,该装置包括用于将卡拉OK信息插入具有预定长度的子音频块单元中的输入音频数据内的卡拉OK信息插入单元,其中卡拉OK信息包括持续时间信息和卡拉OK数据,该持续时间信息对应插入有卡拉OK信息的子音频块的范围。
根据本发明的另一优选实施例,本发明提供一种从输入音频数据中再现卡拉OK信息的方法,该方法包括从输入音频数据中检测同步信息,若检测到的同步信息是有效,则从具有预定长度的子音频块单元中提取持续时间信息,然后根据已提取的持续时间信息从子音频块中提取卡拉OK数据,其中该卡拉OK信息由持续时间信息和卡拉OK数据组成,该持续时间信息对应插入有卡拉OK信息的子音频块的范围。
根据本发明的另一优选实施例,本发明提供了一种计算机可读的记录介质,该记录介质存储的程序用来再现插入输入音频数据中的卡拉OK信息,该程序包括从输入音频数据中提取同步信息,若提取的同步信息是有效,则从具有预定长度的子音频块单元中提取持续时间信息,然后根据已提取的持续时间信息从子音频块中提取卡拉OK数据,其中该卡拉OK信息由持续时间信息和卡拉OK数据组成,该持续时间信息对应插入有卡拉OK信息的子音频块的范围。
根据本发明的另一优选实施例,本发明提供一种再现插入输入音频数据中的卡拉OK信息的装置,该装置包括用于从输入音频数据中检测同步信息的同步信号检测单元,以及卡拉OK信息检测单元,该单元用于当检测到的同步信息有效时,从具有预定长度的子音频块单元中提取持续时间信息,然后根据提取的持续时间信息从子音频块中提取卡拉OK数据,其中该卡拉OK信息由持续时间信息和卡拉OK数据组成,该持续时间信息对应插入有卡拉OK信息的子音频块的范围。


通过参照相关的附图详细描述本发明的优选实施例,本发明的上述特征和优点将会更为清楚,其中图1表示音频CD的数据存储格式;图2表示根据优选实施例截取比特的方法;图3是表示优选实施例中用于自适应地插入卡拉OK信息的装置的方框图;图4表示由图3中的卡拉OK信息数据包生成单元所生成的歌词数据包的结构;图5表示由图3中的卡拉OK信息数据包生成单元所生成的MIDI数据的结构;图6是表示图3中的卡拉OK数据包随机单元的扰码器的方框图;图7是按照优选实施例自适应地插入卡拉OK信息的方法的流程图;图8是表示优选实施例中卡拉OK信息再现装置的方框图;图9是表示图8中的同步信息检测单元的解扰器的方框图;图10是表示优选实施例中再现卡拉OK信息的方法的流程图;图11是表示另一优选实施例中的卡拉OK信息再现装置的方框图;图12是表示另一优选实施例中的再现卡拉OK信息的方法的流程图。
具体实施例方式
优选地,参照相关附图详细地说明非限制性的实施例。
图2表示根据本发明的优选实施例截取比特的方法。
该实施例的比特截取方法用于将MIDI信息,例如,歌词和/或卡拉OK信息插入音频CD的音频数据PCM采样信号中。也就是说,在以脉码调制(PCM)的方式进行编码的音频中,音频采样信号的最低有效位(LSB)对音质的影响可忽略不计。因此,即使PCM采样信号的最低有效位中的1个或2个比特发生变化(如图2所示),也不会感到由修改的PCM采样信号所引起的音质失真。
图3是表示本发明的优选实施例中用于将卡拉OK信息插入输入音频信号的编码器的方框图。参照图3,该编码器包括能级判定单元320、卡拉OK信息数据包生成单元340和卡拉OK信息插入单元380。卡拉OK信息数据包生成单元340包括歌词数据包生成单元342和MIDI数据包生成单元344。当已知编码器和解码器之间的卡拉OK信息的插入模式时,能级判定单元320可以被略去。
能级判定单元320计算具有预定长度的音频块单元中输入音频信号的能量。根据本发明的实施例,音频块的长度为30-50兆秒。为了自适应地判定音频块的长度,可以根据输入音频信号的特点设置一标准块长度判定单元(未显示)。
将经过计算的能量与预定参考值进行比较,然后判定输入音频信号的能级。在本发明的实施例中,预定的音频帧的能级根据第一参考值和第二参考值分为低级、中级和高级三个等级。
在本发明的优选实施例中,根据能级判定单元320计算出的输入音频信号的能级来确定将被插入的卡拉OK信息的比特数。
例如,当输入音频信号的能量低于第一参考值时,即能级为低级时,信号不能屏蔽由插入比特(即截取的比特)所引起的噪声。因此,卡拉OK信息不能被插入数据流中。换句话说,当用户能够感觉到由插入的比特引起的噪声时,卡拉OK信息不能被插入数据流中。
在当前音频块的能量高于第一参考值,而低于第二参考值,即能级为中级时,如果用一个最低有效位(LSB)来插入卡拉OK信息,则由截取的比特所引起的噪声可以被屏蔽。也就是说,听众不会发现由插入的比特所引起的噪声,从而可以被用作隐藏的信息信道。因此,在本实施例中,当能级是中级时,卡拉OK信息被插入PCM采样信号的最低有效位,如图2所示。
在当前音频块的能量高于第二参考值,即能级为高级时,基于与中级能级时相同的原因,卡拉OK信息以每PCM采样信号2比特的最低有效位被插入,如图2所示。
作为一种选择,如参照图4所述,持续时间信息对应于卡拉OK信息被插入时的持续时间,利用该信息,可以省略在编码器和解码器中计算当前音频块能量的步骤。
由于自适应地确定截取比特的位置和数目是比较重要的,所以在比特截取方法上进行了改进的PCM采样信号和初始信号是相似的。
至于中级能级和高级能级,即使在有效范围内相应地减少1或2比特,听众也几乎不会发现由上述减少所引起的噪声失真。这是因为卡拉OK信息数据包只使用了普通音频比特流的5%-10%。
例如,假定截取1比特需要时间的5%,截取2比特需要时间的3%,那么比特截取的有效比特数是每秒9702比特,即(5×1×44100×2+3×2×44100×2)/100。该比特率的应用范围很广。
卡拉OK数据以数据包的形式被插入,它可以分为两种类型。一种是针对歌词数据,另一种是针对卡拉OK的MIDI格式(KMF)包。卡拉OK信息数据包生成单元340生成了可插入音频信号的歌词数据包和MIDI数据包。
图4表示由卡拉OK信息数据包生成单元340生成的歌词数据包的结构。歌词数据包包括16比特的歌词同步字、16比特的持续时间信息、长度可变的歌词数据以及16比特的结束同步字。
头16比特的数据包包括16比特的歌词同步字。对于初始编码来说16比特的长度已经足够,缺陷检测概率很低。歌词同步字表示当信号的能量是中级或高级时,歌词数据将被插入PCM采样信号1或2比特的最低有效位。在本实施例中,即使是高能级,歌词同步字也被插入PCM采样信号1比特的最低有效位。
持续时间信息数据包括在歌词同步字之后的16比特之内。比特截取的采样数和当前的歌词数据对应于有效持续时间,即实际的时间。
如果是中级能级或高能级,当预定的卡拉OK信息被插入后,关于持续时间信息中的比特截取采样数的信息考虑比特截取在采样中是否被执行。本优选实施例中,持续时间信息数据被插入至PCM采样信号1比特的最低有效位。
通过有选择地从持续时间信息以及从子音频块单元中选择比特(例如,最低有效位)来插入卡拉OK信息即可插入并且再现卡拉OK信息,而无需在编码器和解码器中判定能级。此外,包含在持续时间信息中的当前歌词数据的有效持续时间,可以使当前重放位置的歌词高亮显示在卡拉OK屏幕上。
当能级为中级能级或高能级时,歌词数据被插入PCM采样信号的1或2比特的最低有效位。在本优选实施例中,当能级为高能级时,歌词数据被插入2比特的最低有效位。但是,可选地,可以仅仅应用1比特的最低有效位。16比特的结束同步字表示所有的歌词数据包已被插入。
根据本实施例,应用比特截取的信息插入方法的一个优点是音频数据的同步性可以得到保证。通过将歌词数据插入比特截取的比特中,即将歌词信息加至音频数据本身,歌词即被插入音频数据流,其优势就在于无需考虑当歌词被显示时涉及音频同步性的问题。
如果为了保持音频的同步性而必须设置一独立的数据信道,则需要使用大量的比特数来传送时间信息。因此,本实施例的信息插入方法具有有效利用信道的优点。
图5表示卡拉OK信息数据包生成单元340所生成的MIDI数据包的结构。MIDI数据包的格式除了不包括持续时间信息数据以外,与歌词数据包大致相同。因为当使用MIDI格式时,持续时间信息已经包含在不同的MIDI轨道数据中,所以它不在MIDI数据中单独出现。因为MIDI数据包与音频数据同时被再现,所以音频数据的同步性就不那么重要了。但是,该时刻之前出现的MIDI数据需要被预先插入音频数据中。
可选地,可以将卡拉OK信息数据包生成单元340所生成的歌词数据包和/或MIDI数据包随机化,然后输出随机化的歌词数据包和/或MIDI数据包至卡拉OK信息插入单元380。插入PCM采样信号中的随机卡拉OK信息数据包可以起到最高有效位(MSB)的抖动信号的作用。
图6是表示图3所示的数据包随机化单元360中使用反馈移位寄存器将数据包随机化的扰码器的方框图。
卡拉OK信息插入单元380将从卡拉OK信息数据包生成单元340接收的卡拉OK信息插入子音频块的音频信号中,如PCM采样单元。例如,能级判定单元320判定当前音频块的能级为低能级时,跳过卡拉OK信息的插入步骤。
当能级判定单元320判定为当前音频块的能级中级能级时,根据第一插入模式将卡拉OK信息插入子音频块中。例如,第一插入模式涉及图4和图5所示的歌词和MIDI数据包的数据插入方法,该方法使用当前音频块PCM采样信号的最低有效位。
此外,当音频块的能级为高能级时,根据第二插入模式将卡拉OK信息插入子音频块中。例如,第二插入模式涉及图4和图5所示的歌词和MIDI数据包的数据插入方法,该方法应用当前音频块PCM采样信号的最低有效位。
当音频块的低能级持续一段时间时,根据第三插入模式插入卡拉OK信息。例如,第三插入模式应用当前音频块的偶数位的PCM采样的最低有效位。然后,插入有卡拉OK信息数据包的音频数据记录在音频CD的轨道上。
图7是表示图3中的编码器根据输入音频信号的能级自适应地将卡拉OK信息插入而执行的操作的流程图。在步骤710中,输入音频信号的能级由预定的帧间隔确定。根据本发明的实施例,音频帧的能级被分为低级、中级和高级。
在步骤720中,生成将被插入音频信号中的卡拉OK信息数据包。根据本实施例生成如图4和图5所示的歌词数据包和MIDI数据包。
在步骤730中,根据在步骤710中确定的能级,步骤720中生成的卡拉OK信息数据包被插入子音频块单元中的音频信号中。例如,在步骤732中,若当前音频块的能级为低级,跳过卡拉OK信息的插入步骤。若当前音频块的能级为中级,根据步骤734中的第一插入模式将卡拉OK信息插入音频信号。若当前音频块的能级为高能级,根据步骤736中的第二插入模式将卡拉OK信息插入音频信号。
在本优选实施例中,生成的卡拉OK信息无需随机化过程即可插入音频信号中,但是可以在随机化过程之后,将选择性地生成的卡拉OK信息数据包插入音频信号中。若音频块的能级将低能级状态保持一预定的时间,则卡拉OK信息以第三插入模式插入音频信号。然后,插入有卡拉OK信息的音频数据被记录在音频CD的轨道上。
用于卡拉OK的CD类型的解码器可以以两种模式工作。在模式1中,初始音频轨道的重放和已同步化的歌词的显示是同时进行的。在模式2中,卡拉OK的MIDI文件的重放和歌词的显示是同时进行的。
图8是表示本发明的优选实施例的解码器的方框图。卡拉OKCD解码器衡量输入信号的能级,并执行与编码器同样的操作,从而确定哪些比特是由编码器从PCM采样信号中截取的比特。本优选实施例中的解码器以模式1工作。
本优选实施例中的解码器包括能级判定单元820、卡拉OK信息提取单元840以及歌词数据恢复和重放单元860。卡拉OK信息提取单元840包括同步信息检测单元842和卡拉OK信息提取单元844。若预定一卡拉OK的插入模式,则能级判定单元820可以省略。
能级判定单元820按照图3所示编码器中的能级判定单元320相同的工作方式计算音频块单元中的输入音频信号的能级。计算出的能级从同步信号检测单元842中输出。
若当前音频块的能级为中级或高级,则同步信号检测器842判定从当前音频块的PCM采样信号中检测出的同步字与在编码器中插入的同步字是否匹配。当同步字相匹配时,结果被输出至卡拉OK信息提取器。
当预定数目的音频块的能级为持续低级时,同步信号检测单元842判定从当前音频块的PCM采样信号中检测出的同步字与在编码器中插入的同步字是否相同。当同步字相同时,结果被输出至卡拉OK信息提取单元844。
图9是表示同步信息检测单元820包括的反馈移位寄存器的解扰器的方框图。从PCM采样信号中所提取的比特的反馈移位寄存器保持延迟,解扰延迟的数据,并检验同步字的有效性。
卡拉OK信息提取单元844从能级判定单元820和同步信息检测单元842的输入信息中提取持续时间信息(duration information)和歌词信息(lyricsinformation)。例如,当音频块能级为中级或高级时,图4所示的16比特的持续时间信息被从PCM采样信号的最低有效位中提取出来。
此外,当输入的音频信号的能级为中级并且已经将同步字提取出来时,在由持续时间信息所选定的周期内根据第一插入模式来提取歌词信息。例如,按照第一插入模式从PCM采样信号的一位最低有效位提取歌词信息。
当输入的音频信号的能级为高级并且已经检测出同步模式时,在由持续时间信息所选定的周期内根据第二插入模式来提取歌词信息。例如,按照第二插入模式从PCM采样信号的两个最低有效位提取歌词信息。
当预定数目的音频块的能级为连续低级并且各同步字相同时,从PCM采样信号的一位最低有效位提取持续时间信息,并按照第三插入模式提取歌词信息。例如,按照第三插入模式,从音频块偶数PCM采样信号中的最低有效位提取歌词信息。
卡拉OK信息恢复和重放单元860使用卡拉OK信息提取单元844提取的持续时间信息和歌词信息,并在一预定周期内播放歌词。卡拉OK信息恢复和重放单元860包括一缓冲存储器(未示出)用以缓存从卡拉OK信息提取单元844中提取的歌词信息。
图10是用以说明图8所示的解码器操作过程的流程图。在步骤1010中,由预定长度的音频块单元判定输入的音频信号的能级。
在步骤1020中,根据步骤1010中判定的能级提取同步信息。一个优选实施例是当判定能级为中级或高级时,确定同步信息是否与输入解码器的同步字匹配。
当预定数目的音频块的能级为连续低级时,从当前音频块的PCM采样信号中提取同步字,并确定该同步字是否与输入解码器的同步字匹配。在步骤1030中,当各同步字相同时,根据步骤1010中判定的能级提取持续时间信息和歌词信息。例如,在当前音频块电流的能级为中级或高级时,图4所示的16比特的持续信息被从PCM采样信号的最低有效位提取出来。
再者,在当前音频块的能级为中级时,在由持续时间信息所选定的周期内根据第一插入模式(步骤1032)提取歌词信息。在当前音频块的能级为高级时,在由持续时间信息选定的周期内根据第二插入模式(步骤1034)提取歌词信息。当预定数目的音频块的能级在一预定周期内为连续低能级并且各同步模式相同时,从PCM采样信号的一位最低有效位提取持续时间信息,并按照第三插入模式提取歌词信息。
在步骤1040中,利用提取的持续时间信息和歌词信息在一预定周期内播放歌词。歌词被从带有初始音频的音频CD中重放。
图11是本发明另一个实施例所述的解码器的方块图。此实施例所述的解码器包括能级判定单元1120,卡拉OK信息检测单元1140,以及卡拉OK信息恢复和重放单元1160。卡拉OK信息检测单元1140包括同步信息检测单元1142和卡拉OK信息提取单元1144。当卡拉OK信息的插入模式被预先确定后,能级判定单元1120可以被省略。此实施例所述的解码器以模式2操作。
图11所示的各组成模块与图8所示的各组成模块基本执行相同的操作,所不同的是卡拉OK信息提取单元1144提取歌词信息和MIDI数据,附加的数据恢复和重放单元1160同时重放歌词信息和MIDI数据。所以,为了节省篇幅,此处省略有关相同模块的详细描述。
图12是用以说明图11所示的解码器操作过程的流程图。附图12中描述的步骤1210和1220与附图11中的相应步骤类似,其不同之处在于步骤1230、1232以及1234中提取的是歌词信息和MIDI数据,并且在步骤1240中歌词数据和MIDI数据被同时重放。所以,此处省略其详细描述。
本发明能够实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是一种用以存储计算机系统可读数据的数据存储装置。例如只读存储器(ROM),随机存取存储器(RAM),CD-ROM,磁带,硬盘,软盘,闪存以及光数据存储装置均属于计算机可读记录介质。这种记录介质也可以是载波信号的形式(例如,通过因特网传送)。计算机可读记录介质能够通过计算机系统连接的网络传播从而使计算机可读代码被存储和以分布方式被执行。
由于本优选实施例所述的卡拉OK信息插入方法使用根据输入音频信号的能级截取的比特自适应性地将卡拉OK信息插入音频数据中,所以卡拉OK信息的插入不会损失音频质量。此外,由于不需要单独的信道,从而使各信道被有效利用,并且由于不需要对信道单独的信息进行解码,因此也使解码器的结构得以简化并具有普通CD播放器的功能。
尽管已经参照其优选实施例特别表示和描述了本发明的内容,但本领域普通技术人员应当了解在不背离所附权利要求书限定的发明宗旨和范围的前提下,可以对本发明进行各种形式和细节上的修改。
权利要求
1.一种自适应性地将卡拉OK信息插入输入的音频数据的方法,该方法包括将卡拉OK信息插入子音频块单元中的输入音频数据内,其中,各段卡拉OK信息包括持续时间信息和卡拉OK数据,持续时间信息指示插入有卡拉OK信息的子音频块单元的范围。
2.如权利要求1所述的方法,其中卡拉OK信息由包括同步信息的歌词数据包、持续时间信息以及歌词数据包组成,卡拉OK数据是和音频数据相关的歌词数据。
3.如权利要求1所述的方法,进一步包括通过计算各音频块单元中的音频数据的能量判定各音频块单元的能级,每一个音频块单元包括预定数目的子音频块单元;和根据判定的能级确定将卡拉OK信息插入子音频块单元的插入模式。
4.如权利要求3所述的方法,其中插入模式是与用于插入卡拉OK信息的子音频块单元的位数和/或位置比特相关的信息。
5.如权利要求3所述的方法,进一步包括在当前音频块能量大于第一参考值而小于第二参考值时,根据第一插入模式插入卡拉OK信息;和在当前音频块能量大于第二参考值时,根据第二插入模式插入卡拉OK信息,其中根据第二插入模式插入的卡拉OK信息的数量大于根据第一插入模式插入的卡拉OK信息的数量,并且第二参考值大于第一参考值。
6.如权利要求3所述的方法,还包括根据输入的音频数据确定音频块单元的长度。
7.如权利要求3所述的方法,其中子音频块单元是脉冲码的调制采样信号。
8.如权利要求1所述的方法,其中插入音频数据的卡拉OK信息还包括包含同步信息和MIDI数据的音乐设备数字接口数据包。
9.如权利要求3所述的方法,其中,当各音频块单元的能级持续低于第一参考值时,利用所述子音频块单元的最低有效位插入卡拉OK信息。
10.一种用于将卡拉OK信息插入输入的音频数据的装置,该装置包括将卡拉OK信息插入子音频块单元中的输入音频数据内的卡拉OK信息插入单元;和其中卡拉OK信息包括持续时间信息和卡拉OK数据,所述持续时间信息对应于插入有卡拉OK信息的子音频块单元的范围。
11.如权利要求10所述的装置,其中卡拉OK信息由包含同步信息的歌词数据包、持续时间信息以及卡拉OK数据组成,所述卡拉OK数据是和音频数据相关的歌词数据。
12.如权利要求10所述的装置,还包括一能级判定单元,该单元利用音频数据的音频块单元计算音频数据的能量,每一个音频块单元包括预定数目的子音频块单元,该能级判定单元将计算出的能量与预定标准值进行比较,确定将卡拉OK信息插入子音频块单元的插入模式。
13.如权利要求12所述的装置,其中插入模式是用于插入卡拉OK信息的子音频块单元的多个数据位中的至少一位以及比特位置相关的信息。
14.如权利要求12所述的装置,其中,在当前音频块能量大于第一参考值而小于第二参考值时,卡拉OK插入单元根据第一插入模式插入卡拉OK信息,在当前音频块能量大于第二参考值时,卡拉OK插入单元根据第二插入模式插入卡拉OK信息,根据第二插入模式插入的卡拉OK信息的数量大于根据第一插入模式插入的卡拉OK信息的数量,并且第二参考值大于第一参考值。
15.如权利要求12所述的装置,还包括标准块长度判定单元,该单元根据输入的音频数据确定音频块单元的长度。
16.如权利要求12所述的装置,其中子音频块单元是脉冲码的调制采样信号。
17.如权利要求10所述的装置,其中插入音频数据的卡拉OK信息还包括包含同步信息和MIDI数据的MIDI数据包。
18.如权利要求12所述的装置,当各音频块单元的能级持续低于第一参考值时,卡拉OK信息插入单元根据所述子音频块单元的最低有效位插入卡拉OK信息。
19.一种再现插入到输入的音频数据信息中的卡拉OK信息的方法,该方法包括从输入音频数据中检测同步信息;当检测到的同步信息有效时提取子音频块单元的持续时间信息;和根据提取的持续时间信息从子音频块单元中提取卡拉OK数据,其中卡拉OK信息包括持续时间信息和卡拉OK数据,持续时间信息对应于插入有卡拉OK信息的子音频块单元的范围。
20.如权利要求19所述的方法,其中卡拉OK信息包括包含同步信息的歌词数据包、持续时间信息以及卡拉OK数据,其中卡拉OK信息是和音频数据相关的歌词数据。
21.如权利要求19所述的方法,进一步包括通过计算音频块单元中的音频数据的能量判定音频块单元的能级,每一个音频块单元包括预定数目的子音频块单元,并将计算出的能量与预定标准值进行比较;和根据判定的能级确定将卡拉OK信息插入子音频块单元的插入模式。
22.如权利要求21所述的方法,其中插入模式是与用于插入卡拉OK信息的子音频块单元的多个数据位中的至少一位以及比特位置相关的信息。
23.如权利要求21所述的方法,进一步包括在当前音频块的能量大于第一参考值而小于第二参考值时,根据第一插入模式提取卡拉OK信息;和在当前音频块能量大于第二参考值时,根据第二插入模式提取卡拉OK信息,其中根据第二插入模式提取的卡拉OK信息的数量大于根据第一插入模式提取的卡拉OK信息的数量,并且第二参考值大于第一参考值。
24.如权利要求21所述的方法,还包括根据输入的音频数据判定音频块单元的长度。
25.如权利要求21所述的方法,其中子音频块单元是脉冲码的调制采样信号。
26.如权利要求19所述的方法,其中从音频数据中提取卡拉OK信息,该信息包括包含同步信息及MIDI数据的MIDI数据包。
27.如权利要求21所述的方法,其中,当预定数目的音频块的能级持续低于第一参考值时,利用所述子音频块单元的最低有效位提取卡拉OK信息。
28.一种再现插入到输入音频数据中的卡拉OK信息的装置,该装置包括用于从输入音频数据中检测同步信息的同步检测单元;和卡拉OK信息检测单元,用于从子音频块单元中提取持续时间信息以及基于提取的持续时间信息从子音频块单元中提取卡拉OK数据,其中卡拉OK信息包括持续时间信息和卡拉OK数据,持续时间信息对应于插入有卡拉OK信息的子音频块单元的范围。
29.如权利要求28所述的装置,所述卡拉OK信息包括包含同步信息的歌词数据包、持续时间信息以及卡拉OK数据,卡拉OK信息是和音频数据相关的歌词数据。
30.如权利要求28所述的装置,进一步包括能级判定单元,通过计算各音频块单元中的音频数据的能量判定各音频块单元的能级,每一个音频块单元包括预定数目的子音频块单元;以及插入模式判定单元,基于判定的能级确定将卡拉OK信息插入子音频块单元的插入模式。
31.如权利要求30所述的装置,其中插入模式是与用于插入卡拉OK信息的子音频块单元的多个数据位中的至少一位以及比特位置相关的信息。
32.如权利要求30所述的装置,还包括卡拉OK信息提取单元,当音频块单元的音频块的能量大于第一参考值而小于第二参考值时,卡拉OK信息提取单元根据第一插入模式提取卡拉OK信息,当音频块能量大于第二参考值时,根据第二插入模式提取卡拉OK信息,其中根据第二插入模式提取的卡拉OK信息的尺寸大于根据第一插入模式提取的卡拉OK信息的尺寸,并且第二参考值大于第一参考值。
33.如权利要求30所述的装置,还包括标准块长度判定单元,该单元根据输入的音频数据确定音频块单元的长度。
34.如权利要求33所述的装置,其中子音频块单元是脉冲南的调制采样信号。
35.如权利要求28所述的装置,其中从音频数据中提取卡拉OK信息,该信息包括包含同步信息和MIDI数据的MIDI数据包。
36.一种在其上存储了程序的计算机可读记录介质,所述程序包括将卡拉OK信息插入子音频块单元中的输入音频数据中,其中卡拉OK信息包括持续时间信息和卡拉OK数据,持续时间信息对应于插入有卡拉OK信息的子音频块单元的范围。
37.如权利要求36所述的计算机可读记录介质,其中卡拉OK信息包括同步信息、持续时间信息及卡拉OK数据,所述卡拉OK数据是和音频数据相关的歌词数据包。
38.如权利要求36所述的计算机可读记录介质,其中程序还包括通过计算各音频块单元中的音频数据的能量判定各音频块单元的能级,每一个音频块单元包括预定数目的子音频块单元,并将计算出的能量与预定标准值进行比较;和根据判定的能级确定将卡拉OK信息插入子音频块单元的插入模式。
39.如权利要求38所述的计算机可读记录介质,其中插入模式是与用于插入卡拉OK信息的子音频块单元的多个数据位和/或比特位置相关的信息。
40.如权利要求38所述的计算机可读记录介质,所述程序还包括在当前音频块单元中的音频块的能量大于第一参考值而小于第二参考值时,根据第一插入模式插入卡拉OK信息;和在当前音频块能量大于第二参考值时,根据第二插入模式插入卡拉OK信息,其中根据第二插入模式插入的卡拉OK信息的数量大于根据第一插入模式插入的卡拉OK信息的数量,并且第二参考值大于第一参考值。
41.如权利要求38所述的计算机可读记录介质,其中,当预定数目的音频块的能级持续低于第一参考值时,根据子音频块单元的最低有效位提取卡拉OK信息。
42.一种在其上存储了程序的计算机可读记录介质,所述程序用以再现插入音频数据中的卡拉OK信息,该程序包括从输入音频数据中提取同步信息;当提取的同步信息有效时从具有预定长度的子音频块单元中提取持续时间信息;和根据提取的持续时间信息从子音频块单元中提取卡拉OK数据,其中卡拉OK信息包括持续时间信息和卡拉OK数据,持续时间信息对应于插入有卡拉OK信息的子音频块单元的范围。
43.如权利要求42所述的计算机可读记录介质,其中卡拉OK信息包括由同步信息、持续时间信息及卡拉OK数据组成的数据包,所述卡拉OK数据是和音频数据相关的歌词数据。
44.如权利要求42所述的计算机可读记录介质,所述程序还包括通过计算各音频块单元中的音频数据的能量判定各音频块单元的能级,每一个音频块单元包括预定数目的子音频块单元,并将计算出的能量与预定标准值进行比较;和根据判定的能级确定将卡拉OK信息插入子音频块单元的插入模式。
45.如权利要求44所述的计算机可读记录介质,其中插入模式是与用于插入卡拉OK信息的子音频块单元的多个数据位和/或比特位置相关的信息。
46.如权利要求44所述的计算机可读记录介质,所述程序还包括在当前音频块单元中的音频块的能量大于第一参考值而小于第二参考值时,根据第一插入模式提取卡拉OK信息;和在当前音频块能量大于第二参考值时,根据第二插入模式提取卡拉OK信息,其中根据第二插入模式提取的卡拉OK信息的数量大于根据第一插入模式提取的卡拉OK信息的数量,并且第二参考值大于第一参考值。
47.如权利要求44所述的计算机可读记录介质,其中当预定数目的音频块单元的能级持续低于第一参考值时,根据子音频块单元的最低有效位提取卡拉OK信息。
全文摘要
一种自适应性地将卡拉OK信息插入音频信号中的方法,一种再现所述插入信息的方法及装置,以及一种在其上记录了用以实现上述方法的程序的记录介质。该自适应性地将附加信息插入音频数据的方法包括将卡拉OK信息插入具有预定长度的子音频块单元中的输入音频数据内,其中卡拉OK信息包括持续时间信息和卡拉OK数据,持续时间信息对应于插入有卡拉OK信息的子音频块的范围。
文档编号G10K15/04GK1609993SQ20041009596
公开日2005年4月27日 申请日期2004年9月9日 优先权日2003年9月9日
发明者阿罗拉·马尼什 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1