图象/音频编码装置与解码装置的制作方法

文档序号:7569587阅读:183来源:国知局
专利名称:图象/音频编码装置与解码装置的制作方法
技术领域
本发明涉及一种图象/音频编码装置和解码装置,特别是一种用于将字符数据和被压缩和编码的图象/音频数据进行多路复用,以显示字符信息,例如在电视屏幕上包括移动图象歌曲的文本和声音的诸如卡拉OK装置的装置,和一种用来将上述经多路复用的图象/音频/字符数据再生的装置。
作为一种图象/音频数据的编码和解码国际的标准,由MPEG(移动图象专家组)推荐的MPEG1和MPEG2两个标准早已为人们所熟知。为了便于理解起见本发明将借助例子加以解释,该例子为将字符数据与按照MPEG1或MPEG2标准压缩和编码的图象/音频数据进行多路复用,虽然本发明并不仅局限于此。
关于MPEG标准,参见由多媒体研究组编辑,而由ASCII出版社1994年8月1日出版的“Newest MPEG Textbook by pointIllustration”。
本发明特别适用于卡拉OK装置。此处的卡拉OK装置指的是一种装置,它在电视屏幕上显示相应背景图象和歌曲文本的同时演奏该歌曲的旋律,并与旋律同步顺序改变显示文本中相应字符的颜色。对由卡拉OK装置放送的大量歌曲中的每一支歌曲,记录媒质如CD-ROM中存储有相应的背景图象,歌曲文本和相庆的旋律数据,用户利用卡拉OK装置从CD-ROM中选择其希望播放的歌曲。
代表着背景图象和旋律的被压缩和编码的图象/音频数据与歌曲文本的字符数据经多路复用写入CD-ROM中。过去,压缩和编码施加到包括图象/音频数据和字符数据的合成数据上而不管该压缩与编码是否采用符合MPEG标准的编码技术。
采用先有技术的装置中,歌曲文本的字符数据被转换为图象模式,而且与背景图象信号相组合并被压缩,作为图象信号的一部分。被压缩的图象数据被写入CD-ROM或送入通讯线。在被压缩的图象数据的接收机或CD-ROM放送器中,被压缩的图象数据被简单地解码和解压(expand)以再生图象信号。
但是在采用将字符数据作为图象信号的一部分进行压缩编码的先有技术的系统中,可能在添加的字符周围产生明显的字符变形和颜色缺陷使得字符难以阅读。
换句话,因为在背景图象中很少有颜色的突然变化,由于对图象信号进行压缩而导致的图象质量的下降不很明显。另一方面,因为卡拉OK歌曲的文本字符必须在背景图象上显示得十分清晰,因此不包括在背景图象中的单色(如白色)常被采用。结果,在背景图象和文本的边缘处颜色的变化十分突然,而假如在边界处发生变形,整个文本就显得褪色。
不仅如此,为了标明相应于当前播放的旋律的显示文本的位置,该文本字符的颜色随旋律同步变化。此时,先有技术就存在一个问题,即颜色的缺陷变得明显且使得字符阅读十分困难。
为了减少字符失真,曾经有人建议文本区域采用与其他区域不同的压缩因子。即文本区域采用低压缩因子而其他区域采用高压缩因子。但采用这种办法在除了字符周边区域外的区域中的图象质量变坏。
也曾经建议利用MPEG推荐的多路复用系统中定义的专用数据来分别对图象信号和字符信息进行编码。但在卡拉OK装置中,重要的是文本字符颜色的变化要与旋律完全同步,而专用数据却与被编码的图象数据同步。结果,在利用专用数据编码的方法中,代表播放的歌曲旋律的音频信号与代表歌曲文本的字符的同步变得过于复杂,在实际中难以应用。
本发明的一个目的是提供一种图象/音频压缩和解码装置,用来将字符数据与压缩和编码后的图象/音频数据进行多路复用,和提供一种解码装置,其中当经多路复用的图象/音频/字符数据被再生和在电视屏幕上显示时,再生的字符和声音相互间完全同步,且字符显示的质量非常高。
本发明的图象/音频压缩和编码装置包括图象编码装置,用以将代表要显示的图象的图象数据进行压缩与编码,并输出压缩和编码后的图象数据,音频编码装置,用于将代表欲与图象数据一起再生的声音的音频数据进行压缩与编码,字符数据编码装置,用于将代表与再生的声音同步和图象一起显示的字符的字符数据进行编码并输出编码后的字符数据,第一多路复用装置,用于在保持编码的字符数据与声音同步的同时将其和编码的音频数据进行多路复用,并输出经多路复用后的音频数据,和第二多路复用装置,用于将编码后的图象数据与多路复用后的音频数据进行多路复用,并输出多路复用的图象数据。
本发明的一个最佳实施例中,在第一多路复用装置中,编码的字符数据在与编码的音频数据一起被多路复用,作为符合MPEG标准的被编码的音频数据祯中的辅助数据。
本发明的图象/音频解码装置包括多路分解装置,用于接收与编码的音频数据多路复用的编码的图象数据,该编码的音频数据与字符数据多路复用,并将其分离为编码的图象数据和多路复用编码的音频数据,图象解码装置,用于将分离出的编码的图象数据进行解码和解压,并输出一图象信号,分离装置,用于将分离出的多路复用的编码的音频数据分离为编码的音频数据和字符数据,图象组合装置,用于将分离出的字符数据和图象信号进行组合,和音频解码装置,用于对分离出的被编码的音频信号进行解码和解压,并输出音频信号。
根据本发明的图象/音频压缩编码装置,因为字符数据与编码的音频数据一起被多路复用以输出一多路复用的音频数据,而多路复用的音频数据与编码的图象数据一起被多路复用,字符数据和图象数据互相独立地被压缩,从而即便图象数据的压缩因子很高,字符数据也不会产生大的失真。进一步,因为字符数据与编码的音频数据一起被多路复用,当再生时,显示的字符和声音(在卡拉OK中的旋律)间将维持正确地同步。


图1是本发明的图象/音频压缩和编码装置与图象/音频解码装置的框图;以及图2是根据MPEG标准的编码的音频数据帧的结构。
参见图1,编码装置7包括一个图象编码单元1,一个包括压缩/编码部分3和数据多路复用部分4的音频编码单元2,字符/颜色信息发生部分5和一个多路复用单元6,下面进行描述。
解码装置15包括一个多路分解单元8,一个图象解码单元9,一个包括数据分离部分11和一个解码/解压部分12的音频解码单元10,一个字符/颜色信息再生部分13和一个图象组合部分14。上述单元或部分在图1中已以各自的方块注明,因此这里略去了对结构的解释。
图1的系统中编码装置7和解码装置15是经传输线相连,尽管编码装置7和解码装置15可以通过任何其他介质,例如CD-ROM这样的存储介质相连接。
下面对各个方块加以解释。
在编码装置7中,图象编码单元1根据一种已知的编码规则,例如MPEG编码规则,对图象信号进行压缩和编码。音频编码单元2根据同一编码规则对音频信号进行压缩与编码。音频编码单元2对此后将加以说明的字符/颜色数据进行多路复用。下面的说明中,假定采用MPEG编码规则作为编码规则,虽然本发明并不限于采用此。
包括在音频编码单元2中的压缩/编码部分3如上所述对音频信号进行压缩与编码,而数据多路复用部分4对由字符/颜色信息发生部分5输出的编码的字符/颜色数据与由压缩编码部分3编码的音频数据进行多路复用。当采用MPEG编码规则时,通过将字符/颜色信息写入代表MPEG编码的音频数据的数据帧中的辅助数据区,多路复用编码的音频数据和字符/颜色信息。
此处所使用的颜色信息指的是在显示器屏幕上显示字符中的某部分字符颜色需变化的信息。
字符/颜色信息发生部分5从输入的卡拉OK的文本信息生成编码的字符/颜色数据。多路复用单元6根据MPEG编码规则将由图象编码单元1输出的编码的图象数据和音频编码单元2输出的字符/颜色数据进行多路复用。
另一方面,在解码装置15中,多路分解单元8将由编码装置7中输出的经多路复和的数据分离为编码的图象数据和编码的音频数据。图象解码单元9对由多路分解单元8分离出的编码的图象数据进行解码和解压。音频解码单元10则对由多路分解单元8分离出的编码的音频信号进行解码和解压。
提供在音频解码单元10上的数据分离部分11,将与从多路分解单元8输出的编码的音频数据多路复用的字符/颜色数据分离为编码的字符/颜色数据和编码的音频数据。解码/解压部分12对由数据分离部分11分离出的编码的音频数据进行解码和解压。
字符/颜色信息再生部分13对经数据分离部分11分离出的编码的字符/颜色数据再生字符/颜色数据。图象组合成部分14则将由图象解码单元9输出的图象信号与字符/颜色信息再生部分13输出的字符/颜色数据进行组合。
接着,将对上述系统的操作作具体的说明。
图象信号,音频信号和文本信息分别输入编码装置7。图象信号输入图象编码单元1。该信号按预先确定的编码规则例如MPEG编码规则进行压缩与编码,并送到多路复用单元6,作为编码的图象数据。
音频信号被输入音频编码单元2。它在音频编码单元2中按照MPEG编码规则被压缩/编码部分3进行压缩与编码,并输出到下一级的数据多路复用部分4。
此外,文本信息被输入字符/颜色信息发生部分5,并被转换为编码后的字符/颜色数据,并输出到数据多路复用部分4。
如图2所示,数据多路复用部分4产生的信息在采用MPEG编码规则时,被写入MPEG音频数据帧的首部,还有,在数据多路复用部分4中,由压缩/编码部分3输出的编码的音频数据被写入帧的中随后的音频数据区,而字符/颜色信息发生部分5输出的编码的字符/颜色数据被写入随后的辅助数据区。
写入辅助数据区的编码的字符/颜色数据包括表示卡拉OK歌曲文本的字符码和表示字符颜色变化的文本位置的颜色数据。表示文本旋律的编码的音频信号和相应于该旋律、其颜色变化的文本位置的数据,利用将它们写入同一帧中,被进行多路复用。
如图2所示由数据多路复用部分4产生的编码的音频数据被送入多路复用单元6。在多路复用单元6中,由图象编码单元1输出的编码的图象数据和由音频编码单元2输出的编码的音频数据,按照MPEG编码规则,进行多路复用。
编码装置7输出的多路复用的图象和音频数据通过通讯线路或如CD-ROM记录媒介的被输入解码装置15。在解码装置15中,输入的被多路复用的数据被分离为编码的图象数据,编码的字符/颜色数据和编码的音频数据。
经多路分解单元8分离出的编码的图象数据输入到图象解码单元9,而分离出的编码的音频数据输入到音频解码单元10。在图象解码单元9中,输入的编码的图象数据被解码和解压,还原为图象信号。
在音频解码单元10中,输入的被多路复用的编码的音频数据被数据分离部分11分离为编码的音频数据和编码的字符/颜色数据。被分离的编码的音频数据经解码/解压部分被解码和解压,还原为音频信号。而编码的字符/颜色数据经字符/颜色信息再生部分13解码,还原为与旋律同步的歌曲文本。
字符/颜色图象再生部分13产生基于再生字符码的字符模式且控制该字符模式,从而根据颜色信息确定字符颜色变化的位置。该颜色的变化与表示再生的歌曲旋律的声音是同步的。
由图象解码装置9输出的图象信号和由字符/颜色信息再生部分13输出的文本信息在图象组合部分14中被组合,且被输出,作为卡拉OK屏幕显示的图象信号。
根据本发明,因为图象信号和字符信息是分别编码的,且它们是分别再生和组合的,在将图象信息与字符信息一起压缩时可能产生的字符变形和字符颜色缺陷被避免了,从而显示易于阅读的字符。还有,由于编码的字符/颜色信息是与编码的音频数据进行多路复用,十分容易得到声音和字符颜色变化的完全同步。
权利要求
1.一种图象/音频压缩和编码装置,包括图象编码装置,用于压缩和编码表示要显示图象的图象数据,并输出该压缩和编码图象数据;音频编码装置,用于压缩和编码表示要与图象数据一起播放的声音的音频数据;字符数据编码装置,用于编码与声音同步的表示要与图象一起显示的字符的字符数据,并输出该编码的字符数据;第一多路复用装置,保持与声音同步的同时,多路复用编码的字符数据和编码的音频数据,并输出该多路复用的音频数据;以及第二多路复用装置,多路复用编码的图象数据与被多路复用的音频数据,并输出该多路复用的图象数据。
2.根据权利要求1所述的图象/音频压缩和编码装置,其特征在于,上述图象数据和上述音频数据是按MPEG标准编码的。
3.根据权利要求1所述的图象/音频压缩和编码装置,其特征在于,编码的字符数据在上述第一多路复用装置中和编码的音频数据一起,被多路复用,作为MPEG标准定义的编码的音频帧中的辅助数据。
4.根据权利要求1所述的图象/音频压缩和编码装置,其特征在于,它与一个具有显示器和扬声器的卡拉OK装置一起应用,从而当上述编码的音频数据经扬声器输出时,上述编码的图象数据和上述编码的字符数据显示在屏幕上。
5.一种图象/音频解码装置,包括多路分解装置,用于接收与编码的音频数据多路复用的编码图象数据,并将其多路分解为编码的图象数据和多路复用的编码音频数据,其中编码的音频数据与字符数据一起多路复用;图象解码装置,用解码和解压该多路分解的编码图象数据,并输出一图象信号;分离装置,用于将多路复用的编码音频数据分离为编码的音频数据和字符数据;图象组合装置,用于组合分离的字符数据与图象信号;以及音频解码装置,用于解码和解压该多路分解的编码音频数据,并输出一音频信号。
6.根据权利要求5所述的图象/音频解码装置,其特征在于,多路复用后的编码的音频数据中的音频数据和字符数据,借助MPEG标准定义的一编码的音频数据帧中的辅助数据区进行多路复用。
7.根据权利要求5所述的图象/音频解码装置,其特征在于,上述编码的图象数据和上述编码的音频数据是按照MPEG标准解码的。
8.根据权利要求5所述的图象/音频解码装置,其特征在于,它和具有显示器与扬声器的卡拉OK装置一起应用,从而,上述图象组合装置所组合的上述图象信号和上述字符数据显示在显示器上,同时从扬声器输出上述分离装置所分离的上述音频信号。
全文摘要
一种图象/音频压缩和编码装置,包括一图象编码单元,一音频编码单元,一字符编码单元,一第一多路复用单元,和第二多路复用单元。一种图象/音频解码装置,接收由图象/音频编码装置多路复用图象和音频数据,并将其解码为具有字符信号适于在TV屏幕上显示的一组合的图象信号和一音频信号。
文档编号H04N7/26GK1152843SQ9611285
公开日1997年6月25日 申请日期1996年9月19日 优先权日1995年9月19日
发明者知念彻, 铃木浩 申请人:新日本制铁株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1