具有字幕显示功能的字幕mp3播放器、字幕mp3数据格式以及再现字幕mp3数据的方法

文档序号:2822015阅读:445来源:国知局
专利名称:具有字幕显示功能的字幕mp3播放器、字幕mp3数据格式以及再现字幕mp3数据的方法
技术领域
本发明涉及具有字幕显示功能的字幕MP3播放器,字幕MP3数据格式和再现字幕MP3数据的方法,具体地说,涉及这样一种字幕MP3播放器,其具有在输出立体声音频信息的同时,能够与对应的音频信息同步在显示器上显示字幕信息的功能,并且涉及MP3播放器数据格式和再现字幕MP3数据的方法。
常规的MP3播放器安装有液晶显示器,在其上可以显示除了音频信息之外的简单的字符数据(例如,歌曲的歌名之类的单纯的参考内容)。但是该字符数据不能同步显示字符,即,与音频信息对应的字幕信息。
在利用卡带的常规的字幕带方式中,在音频专用带的2个磁轨分别存储字幕信息和音频信息。利用字幕卡带播放器用扬声器输出音频信息和用液晶显示器输出字幕信息。
但是,上述的字幕带方式是将数字信号的字符数据变换成为模拟信号然后存储在磁带上,再现数据时产生一些问题,这些问题是字符信号干扰音频信号因而产生噪音;和音频信号会干扰字符信号因而产生字符的错误;另外,因为将字符数据存储在磁带的一个磁轨上,所以不能输出立体声音频信息,只能输出单声道。
为了解决字幕卡带的单声道输出的问题,将磁带分成四个磁轨,通过信号合成来实现立体声输出。但是在使用四个磁轨时,播放器必须包括四个磁轨磁头用来处理各个磁轨上的数据。在利用信号合成以实现立体声输出时,因为不可能完全分离合成信号,所以在分析信号时会发生信号的损。而且,由于两个信号互相干扰,在音频信号的再现时,两个信号都会产生噪音。
本发明的MP3文件由标准MP3音频信息和字幕信息构成,该字幕信息具有以字符形式显示该音频信息的数据,在本说明书中以下称为字幕MP3数据或字幕MP3文件。
在再现字幕MP3文件时,必需使要再现的音频信息和对应的字幕信息同步输出。为了使音频信息和字幕信息的同步,可以利用位置数据和时间数据。可以同时使用位置数据和时间数据,也可以只使用位置数据和时间数据中的任何一种。位置数据可以是应该与字幕信息同步的音频信息的位置数据,也可以是应该与音频信息同步的字幕信息的位置数据。时间数据表示应该由显示器输出的字幕数据的显示时间。
本发明的字幕MP3播放器再现字幕MP3数据,该字幕MP3数据包括音频信息和对应的字幕信息,音频信息具有包括标题、音频数据和辅助数据的标准MP3文件格式,字幕信息包括位置数据和/或时间数据;该播放器包括存储装置,用于存储被输入到其中的音频信息和对应的字幕信息;信号分离装置,用于分离从存储装置输入的音频信息和字幕信息;控制装置,用于控制存储装置所进行的数据的存储和输出,和用来控制信号分离装置所分离的音频信号和对应的字幕信号使其互相同步;和字幕输出装置,用于通过输入来自信号分离装置的输出,输出与音频信号同步的字幕信号,上述音频信号对应于字幕信号,并被从音频输出装置输出。
本发明第一实施例的字幕MP3数据格式包括音频信息和对应的字幕信息,所述音频信息具有包括标题、音频数据和辅助数据的标准MP3文件格式;其中字幕信息包括位置数据和/或时间数据,在再现音频信息时,利用位置数据和/或时间数据,输出与该再现音频信息同步的字幕信息。
本发明第二实施例的字幕MP3数据格式,包括多个字幕MP3文件,各个字幕MP3文件包括音频信息和对应的字幕信息,该音频信息具有包括标题、音频数据和辅助数据的标准MP3文件格式;其中,在上述的各个字幕MP3文件中,音频信息位于字幕信息之前,该字幕信息具有字幕显示时间数据,当再现字幕信息时,用来表示被显示在显示器的时间。
根据本发明,存储有音频信息的标准MP3数据格式包括字幕信息,利用位置数据和/或时间数据用来使字幕信息与音频信息同步输出,可以一起提供字幕信息和音频信息。
因为使字幕信息和音频信息分离,所以本发明具有不会因为字幕信息和音频信息的互相干扰而产生的噪音的优点。
因为以数字信号形式存储字幕信息,所以本发明具有可以以图像、超文本、文本等多样格式的文件存储字幕信息,可以防止因为重复再现而造成的音质降低的优点。
另外,因为采用音频和字幕同步的文件结构,所以本发明具有内容的检索和区间的移动可以迅速而且容易地进行的优点。


图1是方块图,用来表示本发明的具有字幕显示功能的MP3播放器。本发明的字幕MP3播放器包括输入部11;存储部12,用于存储音频信息和/或字幕信息;信号分离部13,用于分离音频信息和字幕信息;控制部10;音频输出部16;字幕输出部14和显示部15。
从记录有字幕MP3文件的记录媒体18由输入部11输入音频信息和字幕信息。输入部11最好是包括连接端口的电子电路。存储部12最好为存储单元,用来存储经由输入部11输入的音频信息和字幕信息。信号分离部13用于分离被存储在存储部12中的音频信息和字幕信息。
控制部10控制将信息存储在存储部12或是从存储部12输出信息,使信号分离部13中分离的音频信号和字幕信号同步。并且,控制部10在再现音频信息时对播放时间计数。控制部10最好是具有信号处理功能的微型计算机或是包括微型计算机的控制电路,构建成可以由使用者控制。
音频输出部16接收被输入有由信号分离部13分离的信息中的音频信息的对应的音频信号,并将该信号发送到左扬声器(L SPK)和右扬声器(R SPK),使得输出人耳可听见的音频信号。字幕输出部14以与音频输出部16输出的音频信号同步的方式,输出对应于来自信号分离部13的信息中的字幕信息的字幕信号。显示部15以可视形式将从字幕输出部14输出的字幕信号的对应的字幕,显示在屏幕上,该显示部15最好为液晶显示器(LCD)。
具有上述构造的本发明的字幕MP3播放器,在由输入部11输入有来自记录媒体18所记录的字幕MP3文件的音频信息和字幕信息时,利用控制部10的控制将该音频信息和字幕信息存储在上述的存储部12。被存储在存储部12的各个信息,当有该数据的输出要求时,就由使用者所控制的控制部10的控制,从存储部12输出。被输出的信息经由信号分离部13分离成为音频信息和字幕信息,分离后的音频信号由音频输出部16用单声道或立体声扬声器(spk)输出。分离后的字幕信息,与上述的音频信号同步,由字幕输出部14从显示部15输出成为字幕。第一实施例下面将说明本发明第一实施例的字幕MP3数据格式。
图2表示本发明一实施例的字幕MP3数据格式。本发明的字幕MP3信息由音频信息20和字幕信息22构成。音频信息20具有包括标题、CRC、音频数据和辅助数据的标准MP3文件格式。标题位于32位的固定区段,在该区段存储有层次和抽样频率,和其余帧的信息。作为选项,有没有CRC取决于标题。音频数据是压缩数据,其长度随由数据的种类决定。辅助数据作为使用者定义区域,包括附加信息,并且大小也不一定。
各个字幕信息22包括开始同步码1、再现号码数据2、信息数据8。图2所示者只是一实例,不一定要依照图2所示顺序排列。
字幕信息22的开始同步码1用来表示字幕信息的开始。再现号码数据2位于开始同步码1之后,以号码表示字幕信息是对应到多个音频信息20中的第几号音频信息帧。利用该再现号码可以了解应该与字幕信息同步的音频信息的位置数据,或应该与音频信息同步的字幕信息的位置数据。再现号码数据例如由四位构成,用来表示音频信息20和字幕信息22再现时所参照的号码。
信息数据8包括被存储的数据的地址,种类等的相关信息,例如包括再现地址数据3,数据识别码4,选择码5和字幕数据6。
再现地址数据3是在多个字幕信息是一个单词或图片的形式的情况时,用来表示使各个字幕信息互相组合的再现地址,例如由四位构成。字幕信息因为利用单词或图像用来构成大容量的文段,所以需要有至少为一个以上的字幕信息。数据识别码4用来表示被存储的数据的文件类型。文件可以是符合显示器的,例如可以使用图像文件,超文本文件(HTHL)或文本格式的文件。
选择码5表示被存储的信息所使用的语言种类,操作时间和显示部15的显示模式的任何一个。语言的种类用来表示例如韩语(KOR)、日语(JP)、英语(USA)等的语言,操作时间表示输出字幕信息的时间。利用该操作时间,用来使字幕信息与音频信息同步。另外,显示方式表示从显示部15输出的字幕为单词或单句时,是顺序输出或是一起输出,以此决定以何种形式(例如,4列20行或2列24行)显示字符。
通过利用选择码5的操作时间,可以与音频信息同步输出字幕信息。此种同步化,操作可以一起利用操作时间数据和再现号码数据2,也可以分开地利用该数据。
字幕数据6表示从MP3记录媒体输出的字幕数据。这时所存储的字符可以具有例如图像、超文本、文本等的形式。
包含有依此方式构成的多个字幕信息22的字幕信息群组22a附加在经由包括多个音频解码单位的音频信息20所形成的MP3数据格式20a,并且当MP3的音频信息20从其被存储的记录媒体输出时,与从多个音频信息20抽取的各个音频信号同步输出字幕字符。MP3数据群组20a构成一个MP3文件,例如构成一首歌曲。字幕信息群组22a包括与一个MP3数据格式20a对应的字幕内容,该多个字幕信息22的每一个对应于构成该字幕内容之一个单词或一个单句。
该记录媒体包括诸如光盘之类的光记录设备、录音磁带、诸如硬碟之类的磁记录设备和存储器。
MP3音频信息20a所包含的多个音频信息20分别具有32位的标题和16位循环冗余校验和音频数据,和附加数据。
下面将根据图3的流程图用来说明再现具有此种字幕MP3数据的信息的方式。
当将记录媒体插入到用以再现被存储在记录媒体的信号的装置,例如图1所示的MP3播放器时,就利用再现装置的包含有微型计算机的控制电路的控制操作,用来使所记录和存储的数据进行再现。
在记录媒体中至少存储音频信号20和字幕信息22中的一个,以使输出同步的音频信息20和字幕信息22用于再现(步骤30)。控制电路判断在被存储在存储媒体的信息中是否只存在有音频信息20(步骤32)。
当在判断步骤32判断为在记录媒体不存在字幕信息22,只存在有音频信息20时,因为未存在有被输出的字幕信息22,所以从该记录媒体只输出音频信息20(步骤34)。
但是,当在该判断步骤32判断为在记录媒体中存在有字幕信息22时,就根据在记录媒体中是否存在有音频信息20,用来再现与该字幕信息同步的字幕信号和音频信号,重复再现其下一个的字幕信号或音频信号(步骤36至步骤48)。
也就是,在第一判断步骤,为了在进行上述的重复时再现使所有希望的字幕信息22和音频信息20,所以首先判断在记录媒体中是否一起存在有字幕信息22和音频信息20(步骤36)。
当在该第一判断步骤36判断为存在有字幕信息22但是不存在有音频信息20时,就只输出字幕信息22(步骤38)。同时,当在第一判断步骤36判断为同时存在有字幕信息22和音频信息20时,就解码压缩音频信息20以进行再现(步骤40)。
然后,在第二判断步骤,当从该再现装置输出音频时,以输出与对应的字幕的方式,判断是否存在有与在该解码步骤40解码的音频信息20对应的字幕信息22(步骤42)。假如没有对应的字幕信息时,就通过继续输出以前被输出过的字幕信息用来维持该数据的输出,或是输出具有空白的字符的字幕信息(步骤44)。
但是,当有与音频信息20对应的字幕信息22时,就根据字幕信息的文件格式,例如,图像、超文本、文本等的文件格式,用来解码字幕信息22(步骤46)。
然后,与在该解码步骤40解码出的音频信息对应的字幕信息,在再现装置互相同步的进行输出(步骤48),然后回到该第一判断步骤36以输出下一个字幕信息。
例如,利用附加在音频信息20的字幕信息22,从各个输出装置分别输出声音“beau-”和与声音“beau-”同步的字符“beau-”,上述各个设备例如是输出音频信息20的扬声器和在同时输出字幕信息22的显示器。同时,音频信息20和字幕信息22所具有的容量能够存储成为“beau-”的音频信号和字幕信号的至少一部份,要存储“beautiful”等单词时,要有音频信息20和与其对应的字幕信息22。
利用此种方式,被存储在字幕MP3记录媒体的音频信息20和与其对应的同步的字幕信息22由不同的输出装置同时以再现音频和字幕。第二实施例本发明第二实施例的字幕MP3数据格式50如图4所示,包括多个字幕MP3文件50a,50b,……。各个字幕MP3文件具有音频信息52和字幕信息54。音频信息52包括与第一实施例同样的标准MPEG音频文件。
在图4中,字幕信息54附加在音频信息52之后。与此不同的,也可以使字幕信息54位于音频信息52之前,但是当考虑到MP3文件再现用软体的通用性时,最好使用图4所示的结构。
在图4中,一个字幕MP3文件(例如50a)包括一个音频信息52a和一个字幕信息54a。但是,该表示只是为了使图面简化,实际上大部份的字幕MP3文件包括多个音频信息和与其对应的多个字幕信息,具有本说明所属的技术领域的通常知识者当可容易了解。一个字幕MP3文件,例如一首歌曲,相当于以指定的基准(例如,歌名)区域的一文段的声音数据。
字幕信息1,54a,字幕信息2,54b,分别包括字幕开始同步信号56,字幕数据1,2,……,N,58a,58b,……58n,文本类型67,字幕标识码82。字幕开始同步信号56用来表示例如4位数据的字幕信息的输入的开始位置。字幕数据58具有实际被显示在屏幕的字符信息,其大小依照字符数据变化。字幕数据58如后面所述。
文本类型60用来决定输出文本的形式,也即形态,例如字幕数据58的字符信号是以40列20行或2列24行输出。字幕标识码62是用以标识数据格式是否为字幕MP3文件的码。字幕数据1,2,……,N(58a,58b,……,58n)的各个的构成包含有字幕显示时间64,单句开始标识66,字幕68,附加数据70,任选72,数据的大小74。
字幕显示时间64是字幕被显示的时刻的时间数据,例如为7位大小。单句开始标识66是在不同屏幕上显示一个单句时,用以寻找单句的开始的码。字幕68是被显示在屏幕的字符数据,附加数据70用在需要任选以外的数据的情况,用来表示字幕信息的文件种类(图像文件,超文本文件,文本文件),输入用以显示字幕信息的语言的数据。选项72是所谓的任选事项的存储空间,用来存储屏幕移动(scroll)形态(例如,被显示在屏幕上的字符流动式的显示,或是先前的单句逐渐消失后在该位置逐渐出现下一个单句的形态)或闪亮(flash;例如字符的闪亮)等的数据,在数据的大小74输入有字幕数据的长度的数据。
在具有此种信息格式的字幕MP3文件中,利用字幕显示时间64数据用来使音频信息和字幕信息同步。利用时间数据的同步化比利用位置数据的同步化有利,并且具有更低的同步化失败率。
同时,如前所述,标准MP3文件具有包括标题、循环冗余校验、音频数据和附加数据的格式,但是也可以在该标准MP3文件的附加数据包括字幕信息。但是,因为由音频数据量决定压缩率,所以经由在附加数据加入字幕信息,如本发明第一实施例或第二实施例的方式,添加字幕信息成为另外的文件格式可以很容易程式规划,具有可以防止由于字幕信息和音频信息的互相干扰所造成的噪音等的优点。
图5是流程图,用来表示本发明第二实施例的字幕MP3文件的字幕信息的再现方法。
打开被存储在记录媒体的文件,利用字幕信息54的字幕标识码62识别在要被再现的文件中是否有字幕信息,在没有字幕信息的情况时,只再现音频信息52,当包含有字幕信息的情况时,在将字幕信息存储在字幕MP3的播放器的存储部12之后,开始字幕信息的再现。当开始字幕信息的再现时,使字幕信息初始化(步骤80)。在字幕信息初始化步骤80,判断是要删除已被显示在显示器的字幕,或是要将字幕信息附加在那一个文件。在字幕MP3文件再现(步骤82)后,判断再现是否结束(步骤84)。当再现结束时,就在结束步骤85结束再现,否则就以1/1000秒为单位计数再现的播放时间(步骤86)。该播放时间是再现装置,例如图1的字幕MP3播放器的控制部10的计数值。使该播放时间和字幕时间进行比较(步骤88)。字幕时间是字幕数据58的字幕显示时间54a,也即字幕被显示的时刻的时间数据值。在计数下一个的字幕时间数据(步骤90)之后,输出字幕信息(步骤92)。再度的回到再现结束判断步骤84(步骤94),重复进行步骤86~步骤92。
以上参照附图描述了本发明,应该理解,上述说明的目的并不在于将本发明限制到附图所示的实施例,仅仅为了解释本发明。本领域技术人员应该理解,能够对本说明书所公开的实施例进行多种的变化和修改。因此,本发明的范围由所附权利要求决定。
权利要求
1.一种字幕MP3播放器,用于再现字幕MP3信息,上述字幕MP3信息包括音频信息和对应的字幕信息,所述音频信息具有包括标题、音频数据和辅助数据的标准MP3文件格式,所述字幕信息具有字幕信息的位置数据和/或时间数据,该字幕MP3播放器包括存储装置,用于存储输入的音频信息和对应的字幕信息;信号分离装置,用于分离从存储装置提供的音频信息和字幕信息;控制装置,用于控制存储装置所进行的信息的存储和输出,和控制信号分离装置所分离的音频信号和字幕信号的同步;和字幕输出装置,用于接收信号分离装置的输出,并输出与音频信息同步的字幕信息,所述音频信息对应于字幕信号并从音频输出装置输出。
2.如权利要求1的字幕MP3播放器,其中上述的字幕输出装置为液晶显示器。
3.一种字幕MP3数据格式,其包括音频信息,具有包括标题、音频数据和辅助数据的标准MP3文件格式;和对应的字幕信息,其特征在于字幕信息包括位置数据和/或时间数据,并且当再现音频信息时,利用该位置数据和/或时间数据,输出与该再现的音频信息同步的字幕信息。
4.如权利要求3的字幕MP3数据格式,其中该字幕信息包括用以表示字幕信息的开始的开始部分和信息部分,位置数据是表示字幕信息与再现的音频信息的那一帧对应的再现号码数据,该再现号码数据包括在信息部分。
5.如权利要求3的字幕MP3数据格式,其中信息部分包括再现地址数据,用于表示如果多个字幕信息构成一个单词或图片,使各个字幕信息互相组合的再现地址;信息标识码,用来表示所存储的信息的文件形式;选择码,用来表示所存储的信息的语言种类,操作时间或显示模式中的至少一个;和字幕数据,包括字幕字符。
6.一种MP3数据再现方法,用于控制从记录媒体输出音频信息和/或字幕信息,该方法包括以下步骤判断步骤,用来判断该记录媒体所存储的信息中是否只存在有音频信息;输出步骤,如果判断只存在有音频信息,那么就从记录媒体将该音频信息输出;和再现步骤,如果判断存在有音频信息和字幕信息,那么再现与字幕信息同步的音频信息,重复进行再现下一音频或字幕信息。
7.如权利要求6的MP3数据再现方法,其中上述的再现步骤所包括以下步骤第一判断步骤,判断在该记录媒体是否一起存在有字幕信息和音频信息;输出步骤,如果在第一判断步骤判断为存在有字幕信息,但是没有音频信息时,那么就输出该字幕信息;解码步骤,如果在第一判断步骤判断为一起存在有字幕信息和音频信息,那么就解码该音频信息;第二判断步骤,用来判断是否存在有与该音频信息对应的字幕信息;输出步骤,如果在第二判断步骤判断为没有对应的字幕信息,那么就输出以前的字幕信息或空白的字幕信息;翻译步骤,如果在该第二判断步骤判断为存在有对应的字幕信息,那么就根据包括字幕信息的文件形式来翻译数据;和重新启动第一判断步骤,通过使字幕信息与解码的音频信息同步来输出对应的字幕信息,并输出下一字幕信息。
8.一种字幕MP3数据格式,包括多个字幕MP3文件,其特征在于各个字幕MP3文件包括音频信息和对应的字幕信息,所述音频信息具有包括标题、音频数据和辅助数据的标准MP3文件格式;在各个字幕MP3文件中,音频信息位于字幕信息之前,字幕信息具有字幕显示时间数据,当再现字幕信息时,用来表示在显示器上的字幕显示时间。
9.如权利要求8的字幕MP3数据格式,其中字幕信息包括字幕开始同步信号,用于表示字幕信息位置的开始位置;多个字幕信息,具有要显示在该显示器上的字符信息;文本类型,用来决定该字符信息的输出类型;和字幕标识码;其中,字幕显示时间数据被包括在该各个字幕数据中,当再现字幕MP3文件时,与所计数的播放时间进行比较。
10.如权利要求9的字幕MP3数据格式,其中各个字幕数据包括单句开始标识码,用来表示字幕数据所表示的字符的开始;字幕部,包括要在显示器上显示的字符数据;附加数据,包括屏幕移动类型和显示信息;和包括字幕数据的长度信息的数据大小。
11.一种字幕MP3数据的再现方法,该字幕MP3数据包括音频信息,具有包括标题、音频数据和辅助数据的标准MP3文件格式;和对应于音频信息的字幕信息,该方法包括以下步骤字幕信息识别步骤,用来识别在要再现的字幕MP3数据中是否存在有字幕信息;再现步骤,如果在该字幕信息识别步骤判断为没有字幕信息,那么就再现该音频信息;初始化步骤,如果在该字幕信息识别步骤判断为有字幕信息,那么就初始化该字幕信息;计数步骤,在再现字幕MP3文件的同时计数播放时间;比较步骤,比较播放时间和该字幕信息的显示时间;计数步骤,计数下一个字幕信息的显示时间;和显示步骤,显示字幕信息。
12.如权利要求11的字幕MP3数据的再现方法,进一步包括以下步骤在音频信息再现步骤之后的判断步骤,判断再现是否结束;和在该字幕信息显示步骤之后的返回步骤,回到用以判断再现是否结束的判断步骤。
全文摘要
提供了一种具有字幕显示功能的字幕MP3播放器、一种字幕MP3数据格式和一种再现字幕MP3数据的方法,当音频数据从立体声系统中输出时,上述字幕MP3播放器与对应的音频信息同步显示字幕信息。上述字幕MP3播放器包括:存储部,用于存储输入其中的音频信息和对应的字幕信息;信号分离部,用于分离从存储部提供的音频信息和字幕信息;控制部,用于控制存储部所进行的信息的存储和输出,和控制信号分离部所分离的音频信号和字幕信号的互相同步;和字幕输出部,用于输出与音频信息同步的字幕信息,所述音频信息对应于字幕信号并从音频输出部输出。
文档编号G10K15/04GK1348588SQ99815518
公开日2002年5月8日 申请日期1999年12月30日 优先权日1999年1月8日
发明者鲁英薰 申请人:易学软体技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1