用于索引和汇总音乐视频的系统和方法

文档序号:6752854阅读:242来源:国知局
专利名称:用于索引和汇总音乐视频的系统和方法
技术领域
本发明通常涉及通信系统,具体的涉及在视频显示系统中用于索引和汇总音乐视频的系统和方法。
在市场中可以买到非常多的视频回放装置。许多人拥有或熟悉录像机(VCR)。磁带录像机(VTR)是另一类型的视频回放装置。最近,使用计算机磁性硬盘而不是磁性盒式磁带来存储视频节目的录像机已经在市场中出现。例如,ReplayTVj记录器和TiVOJ记录器使用例如MPEG-2压缩在硬盘驱动器上数字地记录电视节目。可选择地,一些视频回放装置可以在可读/可写入数字通用盘(DVD)上记录,而不是在磁盘上记录。
许多人在视频回放装置上记录音乐视频。能够记录几个小时的视频节目,这些视频节目来自于播放音乐视频的电视频道。众所周知的这种电视频道的例子是MTV。然而,一些音乐视频频道耗费大量的时间做广告和谈论许多不相关的话题。这减少了用于播放音乐视频的时间量。
如果观众记录了整个节目,那么该记录会包括所有的非音乐视频部分,例如广告或谈话。为了观看音乐视频,观众必须快速向前移动记录,跳过非音乐视频部分,停止该记录,播放音乐视频,随后再次快速向前移动该记录到下一个音乐视频,播放下一个音乐视频,等等。这样的作业是费时费力的。另外,视频回放装置的大量记录容量用来记录了不期望的内容,例如广告和谈话。
因此,技术上需要一种方法或系统,能够索引和汇总音乐视频。技术上需要一种方法或系统,在多媒体数据流中识别音乐视频,并准备每个音乐视频的汇总,该汇总包括相关的音乐视频信息。
为了克服现有技术中的上述不足,本发明的首要目标是提供一种用于索引和汇总音乐视频的系统和方法,在视频回放装置中使用。
本发明包括在视频回放装置中的音乐视频汇总控制器和音乐视频汇总计算机系统。该音乐视频汇总控制器接收包括有多个音乐视频的多媒体数据流。该音乐视频汇总控制器(1)分割和识别音乐视频,并且(2)对于每个音乐视频创建音乐视频汇总文件。音乐视频汇总文件包括有信息,例如歌曲名称和歌手姓名。音乐视频汇总文件还包括歌曲的识别音频片段和视频片段。音乐视频汇总控制器编译并显示音乐视频汇总文件的列表。对于在多媒体数据流中检测到的每个音乐视频,创建音乐视频汇总文件。用户能够访问音乐视频汇总文件的列表,并通过选择其相应的音乐视频汇总文件,来选择要在视频回放装置上播放的音乐视频。
根据本发明的一个优选实施例,音乐视频汇总控制器分割和识别多个音乐视频中的每个音乐视频。
根据本发明的另一个优选实施例,音乐视频汇总控制器为每个音乐视频创建音乐视频汇总块。音乐视频汇总块包括有信息,例如歌曲名称、包括该歌曲的唱片名称、录制该歌曲的歌手或组合的名称、录音棚和歌曲的发布日期。
根据本发明的一个优选实施例,音乐视频汇总控制器为每个音乐视频创建音乐视频汇总文件。音乐视频汇总文件包括有存储在音乐视频汇总块中的信息、歌曲的音频片段和歌曲的视频片段。
根据本发明的一个优选实施例,音乐视频汇总控制器通过在音乐视频的开头和结尾设置视频文本块,能够识别音乐视频。
根据本发明的另一个优选实施例,音乐视频汇总控制器通过创建一个搜索字符串并将该搜索字符串与歌词文本相匹配,能够识别音乐视频,该搜索字符串包括一个或多个要在歌曲歌词中搜索的字符。
上述内容非常广泛的概述了本发明的特征和技术优点,使得本领域技术人员可以很好的理解下面的本发明的详细描述。下面将描述本发明其它的特征和优点,它们构成了本发明权利要求的主体。本领域技术人员应当理解,他们可以容易的应用所披露的理论和具体实施例做为基础,来修改或设计其它的结构,用于实现与本发明的相同目的。本领域技术人员还应当认识到,在本发明最广的形式中,等效的结构不脱离本发明的精神和范围。
在进行详细描述之前,对本专利文献中使用的某些词和词组进行限定是有利的术语“包含(comprise)”和“包括(include)”及它们的衍生词,意思是不限制的包含;术语“或(or)”是可兼的,意思是和/或;词组“与……有关(associated with)”和“与之有关(associatedtherewith)”及它们的衍生词意思是包括、被包括在……中、与……相互连接、包含、被包含在……中、连接到或与……连接、耦合到或与……耦合、与……可通讯的、与……合作、交错、并列、近似于、绑定到或与……绑定、有……特性等等;和术语“控制器(controller)”意思是任一装置、系统或其中控制至少一个操作的部分,这样的装置可以以硬件、固件或软件、或它们中的至少两个的组合来实现。应当注意,与任意特定的控制器相关的功能性可以是集中的或分散的,不管是本地的还是远程的。具体的,控制器可以包括一个或多个数据处理器,以及相关的输入/输出装置和存储器,控制器执行一个或多个应用程序和/或一个操作系统程序。对这些本专利文献中的词和词组的定义的提出,本领域技术人员应当理解,如果不是在大多数情况下,在许多情况下,这些限定的词和词组的定义可应用到现有技术中使用,也可应用到未来技术中使用。
为了更为完整的理解本发明及其优点,现在结合附图做出下面的描述,附图中相同的附图标记表示相同的部件,其中

图1根据本发明的一个优选实施例,示出了一个示例性的视频显示系统;图2根据本发明的一个优选实施例,示出了一个系统,用于在图1中所示的示例性的视频显示系统中索引和汇总音乐视频;图3示出了与本发明的一个优选实施例一起使用的音乐视频汇总计算机软件;图4示出了与本发明的一个优选实施例一起使用的音乐视频汇总块;图5示出了用于索引和汇总音乐视频的、本发明的一个优选实施例的方法操作的流程图;图6示出了用于索引和汇总音乐视频的、本发明的一个优选实施例的方法的第一部分操作的流程图;图7示出了用于索引和汇总音乐视频的、本发明的一个优选实施例的方法的第二部分操作的流程图;图8示出了用于索引和汇总音乐视频的、本发明的一个优选实施例的方法的第三部分操作的流程图;在本专利文献中下面讨论的图1到图8和用于说明本发明原理的不同实施例仅是以说明为目的的,而不能够解释为限制本发明的范围。在下面的示例性实施例的描述中,本发明结合到电视接收器中,或与电视接收器结合使用。然而,这个实施例仅是为了举例,而不能够解释为将本发明的范围限制到电视接收器。实际上,本领域技术人员能够认识到,可以容易的修改本发明的示例性实施例,用于任一类型的视频显示系统。
图1根据本发明的一个优选实施例,示出了示例性视频回放系统150和电视机105。视频回放系统150从外部信源接收输入的电视信号,外部信源例如是有线电视服务提供者(Cable公司)、本地天线、Internet服务提供者(ISP)、或DVD或VHS磁带播放装置。视频回放装置150从观众选择的频道到电视机105传输电视信号。用户可以人工选择频道,或通过用户预先编程的记录装置自动选择频道。可选择地,通过基于来自于用户个人观看历史的节目简档中的信息的记录装置,可以自动的选择频道和视频节目。
在记录模式中,视频回放装置150可以解调输入的射频(RF)电视信号,以产生记录并存储在存储介质上的基带视频信号,该存储介质在视频回放装置150中或与视频回放装置150相连接。在播放模式中,视频回放装置1 50读取用户从存储介质中选择的、存储的基带视频信号(即,一个节目),并将其传输到电视机105。视频回放装置150可以包括某种类型的录影机,该录影机能够接收、记录、交互和播放数字信号。
视频回放装置150可以包括某种类型的录影机,该录影机使用记录带、或使用硬盘、或使用固态存储器、或使用任何其它类型的记录装置。如果视频回放装置150是录像机(VCR),那么视频回放装置150将输入的电视信号存储到磁性盒式磁带中,和从磁性盒式磁带中取回输入的电视信号。如果视频回放装置150是基于磁盘驱动的装置,如ReplayTVj记录器和TiVOJ记录器,那么视频回放装置150将输入的电视信号存储到计算机磁性硬盘中,而不是磁性盒式磁带,和从计算机磁性硬盘中取回输入的电视信号,并从硬盘中取回存储的电视信号。在另一个实施例中,视频回放装置150可以存储并从本地读/写(R/W)数字通用盘(DVD)或读/写(R/W)光盘(CD-RW)中取回。本地存储介质可以是固定的(如硬盘驱动器)或可以是可移动的(如DVD、CD-RW)。
视频回放装置150包括红外(IR)传感器160,传感器160从用户操作的遥控装置125中接收命令(例如,频道升、频道降、声音升、声音降、记录、播放、快速向前、倒退等等)。电视机105是一种常用的电视,包括屏幕110、红外(IR)传感器115和一个或多个手动控制键120(用虚线表示)。IR传感器115还从用户操作的遥控装置125中接收命令(例如,声音升、声音降、通电、断电)。
应当注意,视频回放装置150不限于从特定类型的信源接收特定类型的输入电视信号。如上所述,外部信源可以是有线服务提供者、通用RF广播天线、卫星电视天线、Internet连接、或另一个本地存储装置,如DVD播放器或VHS磁带播放装置。在一些实施例中,视频回放装置150即使可以不能够记录,但是可以被限制于回放从可移动DVD或CD-RW中取回的电视信号。从而,输入信号可以是数字信号、模拟信号或Internet协议(IP)包。
然而,在解释本发明原理的过程中,为了清楚和简明的目的,下面的描述将通常涉及一个实施例,在这个实施例中,视频回放装置150从有线服务提供者处接收输入的电视信号(模拟和/或数字)。尽管如此,本领域技术人员将会理解,本发明的原理可以容易的适用于无线广播电视信号、本地存储系统、包括MPEG数据的IP包的输入流,等等。
图2根据本发明的一个优选实施例,更详细的示出了示例性的视频回放装置150。视频回放装置150包括IR传感器160、视频处理器210、MPEG2编码器220、硬盘驱动器230、MPEG2解码器/NTSC编码器240、和录影机(VR)控制器250。视频回放装置150还包括具有帧拾取器265的视频单元260、具有封闭字幕探测器275的音乐视频汇总控制器270、和存储器280。帧拾取器265从MPEG2解码器/NTSC编码器240的输出中捕捉并存储视频帧。封闭字幕探测器275在MPEG2解码器/NTSC编码器240的NTSC输出信号中探测封闭字幕。
虽然所示的封闭字幕探测器275设置在图2中的音乐视频汇总控制器270中,但是将封闭字幕探测器275设置音乐视频汇总控制器270中不是必须的。封闭字幕探测器275可以设置音乐视频汇总控制器270之外。
VR控制器250控制视频回放装置250的全部操作,包括观看模式、记录模式、播放模式、快速向前模式、倒退模式及其它类似功能。音乐视频汇总控制器270根据本发明的理论,控制音乐视频汇总的产生、存储和播放。
在观看模式中,VR控制器250使来自于有线服务提供者的输入的电视信号由视频处理器210来解调并处理,并传送到电视机105,伴随或不伴随在硬盘驱动器230上存储视频信号(或从硬盘驱动器230上取回视频信号)。视频处理器210包括射频(RF)前置电路,用于接收来自于有线服务提供者的输入电视信号,转换到用户选择的频道,和将选择的RF信号转换为适于在电视机105上显示的基带电视信号(例如,超级视频信号)。视频处理器210还能够在播放模式期间从MPEG2解码器/NTSC编码器240中接收的通用NTSC信号,并传输基带电视信号到电视机105。
在记录模式中,VR控制器250使输入的电视信号存储在硬盘驱动器230上。在VR控制器250的控制下,MPEG2编码器220从有线服务提供者处接收输入的模拟电视信号,并将接收到的RF信号转换成MPEG2格式,以存储在硬盘驱动器230上。可选择的,如果视频回放装置150连接到正在传输MPEG2数据的信源,那么输入的MPEG2数据可以绕过MPEG2编码器220,并直接存储在硬盘驱动器230上。
在播放模式中,VR控制器250控制硬盘驱动器230,使存储的电视信号(即,节目)流到MPEG2解码器/NTSC编码器240,MPEG2解码器/NTSC编码器240将来自于硬盘驱动器230的MPEG2数据,转换为例如视频处理器210传输到电视机105的超级视频(S-Video)信号。
应当注意的是,用于MPEG2编码器220和MPEG2解码器/NTSC编码器240的MPEG2标准的选择仅用作说明。在本发明的可替换实施例中,MPEG编码器和解码器遵守一个或多个MPEG-1、MPEG-2和MPEG-4标准,或遵守一个或多个其它类型的标准。
为了本申请和所附权利要求的目的,硬盘驱动器230限定为包括可读取和可写入的任一大容量存储装置,包括但不限于通用磁盘驱动器和光盘驱动器,用于可读/写数字通用盘(DVD-RW)、可重写CD-ROM、VCR磁带等等。实际上,硬盘驱动器230不需要常规意义上的固定,即不需要永久的绑定到视频回放装置150中。相反,硬盘驱动器230包括任一大容量存储装置,该装置以存储记录视频节目为目的而专用于视频回放系统150。从而,硬盘驱动器230可以包括附加的外围驱动器或(绑定的或附加的)可移动磁盘驱动器,例如容纳多张可读/写DVD或可重写CD-ROM的自动光盘机装置(未示出)。如图2中的示意性的描述,这种类型的可移动磁盘能够接收和读取可重写CD-ROM盘235。
此外,在本发明的一个优选实施例中,硬盘驱动器230可以包括外部大容量存储装置,视频回放装置150可以通过网络连接(例如Internet协议(IP)连接)来访问和控制该外部大容量存储装置,外部大容量存储装置包括,例如在用户家中的个人计算机(PC)中的磁盘驱动器或在用户的Internet服务提供者(ISP)处的服务器上的磁盘驱动器。
VR控制器250获得的来自于视频处理器210的信息,包括由视频处理器210接收到的视频信号。当VR控制器250确定视频回放装置150正在接收视频节目时,VR控制器250确定该视频节目是否已经被选择为要记录。如果要记录该视频节目,那么VR控制器250以前述形式将该视频节目记录在硬盘驱动器230上。如果不要记录该视频节目,那么VR控制器250以前述形式使视频处理器210处理该视频节目,并传输到电视机105。
在本发明的一个示例性实施例中,存储器280可以包括随机访问存储器(RAM)或随机访问存储器(RAM)与只读存储器(ROM)的组合。存储器280可以包括非易失性随机访问存储器(RAM),例如快速存储器。在电视机105的可替换优选实施例中,存储器280可以包括大容量数据装置,例如硬盘驱动器(未示出)。存储器280还可以包括附加的外围驱动器或(绑定的或附加的)可移动磁盘驱动器,由它们读取可读/写DVD或可重写CD-ROM。如图2中的示意性的描述,这种类型的可移动磁盘能够接收和读取可重写CD-ROM盘285。
图3示出了存储器280的所选择的部分,包括本发明的音乐视频汇总计算机软件300。存储器280包括操作系统接口程序310、音乐视频分段应用程序320、音乐视频识别应用程序330、音乐视频汇总应用程序340、音乐视频汇总块350和音乐视频汇总文件360。音乐视频汇总控制器270与音乐视频汇总计算机软件300一起包括能够实现本发明的音乐视频汇总控制系统。操作系统接口程序310使用VR控制器250和音乐视频汇总控制器270的操作系统,调整音乐视频汇总计算机软件300的操作。
图4示出了一组音乐视频汇总块350,作为本发明优选实施例的一部分。本发明的音乐视频汇总控制器270在音乐视频汇总块(例如,音乐视频汇总块410)中存储它获取的关于音乐视频的信息。该组音乐视频汇总块350包括N个音乐视频汇总块(410、470、…、480),其中N是一个整数。图4所示的音乐视频汇总块410示出了每个音乐视频汇总块可以包括的信息的类型。
歌曲名称存储在块420中。包括该歌曲的唱片名称存储在块430中。演唱该歌曲的歌手或组合的名称存储在块440中。录制该歌曲的录音棚名称存储在块450中。最后,该歌曲的发布日期存储在块460中。这些分类是说明性的,而不是穷举的。即,其它类型的信息(未示出)也可以存储在本发明的一个音乐视频汇总块中。
假设音乐视频汇总控制器270接收了一个包括音乐视频的多媒体数据流。如下面详细描述的,音乐视频汇总控制器270能够(1)分割多媒体数据流中的多个音乐视频,并将它们与该多媒体数据流的剩余部分分开,(2)识别每个分割的音乐视频,并获取包含歌曲的信息,这是每个音乐视频的主体,(3)为每个音乐视频创建音乐视频汇总文件,包括文本、音频和视频片段,(4)存储音乐视频汇总文件,并且(5)应用户的要求,以用户选择的顺序显示音乐视频汇总文件。
在本发明的一个优选的实施例中,音乐视频汇总控制器270通过查找每个音乐视频的开头和结尾,在该多媒体数据流中分割多个音乐视频。当一个音乐视频显示在电视机105的屏幕110上时,该音乐视频的开头通常在该视频图像的下部显示文本字幕180。文本字幕180通常包括歌曲名称、唱片名称、歌手或组合的名称、发布日期和其它类似信息。文本字幕180通常还显示在该音乐视频的结尾。文本字幕180还将称为视频文本块180。
音乐视频汇总控制器270执行在音乐视频分段应用程序320中的计算机指令,来在音乐视频的开头和结尾查找视频文本块180。当两个视频文本块180相同时,那么在它们之间的视频部分说明是由两个视频文本块180识别的音乐视频。音乐视频汇总控制器270查找和定位视频文本块180的方法,将在下面参照图6更为详细的描述。
当音乐视频汇总控制器270找到两个相同的视频文本块180时,随后音乐视频汇总控制器270执行在音乐视频识别应用程序330中的计算机指令,来从视频文本块180中提取识别音乐视频的信息。音乐视频汇总控制器270可以包括视频文本块180的文本,使用由Lalitha Agnihotri、Nevenka Dimitrova和Herman Elenbass于1999年11月17日提交的标题为“Video Stream Classifiable Symbol Isolation Method and System”的美国专利申请No.09/44194 3中所披露的方法。
音乐视频汇总控制器270可以访问存储器280中的数据库(未示出)(或可以访问设置在Internet上的数据库),来找到歌曲、唱片、歌手、唱片公司等的详细列表,与音乐视频汇总控制器270从视频文本块180中获得的信息相比较。音乐视频汇总控制器270将它获取的包括音乐视频的信息存储在存储器280的音乐视频汇总块350一个块中。对应于每个单独的音乐视频的音乐视频信息存储在单独的音乐视频汇总块(例如,音乐视频汇总块410)中。
在某些情况下,音乐视频汇总控制器270可能不能定位或识别一些视频文本块180。在这样的情况下,音乐视频汇总控制器270可以将歌曲的前几行文本与歌词文本数据库进行比较,查找文本匹配。音乐视频汇总控制器270选择表示歌曲的前几行文本的“搜索字符串”。在本发明的一个实施例中,从封闭字幕探测器275中获取“搜索字符串”文本。音乐视频汇总控制器270随后访问在存储器280中的歌词数据库(未示出)(或访问设置在Internet,如www.lyrics.com上的歌词数据库),以找到歌词的详细列表。音乐视频汇总控制器270随后将“搜索字符串”文本与歌词数据库中的文本进行比较,以发现该歌曲的标识。在确定了该歌曲的标识后,歌手名称及其它信息能够容易的从数据库中读取。音乐视频汇总控制器270通过将“搜索字符串”文本与歌词数据库进行比较以查找并定位音乐视频信息的方法,将在下面参照图7更为详细的描述。
如先前所述,音乐视频汇总控制器270获取音乐视频信息,并将该音乐视频信息存储在音乐视频汇总块350中。随后对于每个音乐视频汇总块(例如,音乐视频汇总块410),音乐视频汇总控制器270读取该歌词,并从歌词中识别歌曲的“合唱句(chorus)”。一首歌曲的合唱句通常识别为歌词数据库中的合唱句。可选择的,也可以选择重复多次的歌词部分作为该首歌曲的合唱句。通过使用封闭字幕探测器275或比较音道来查找相似的音频模式,可以完成这个工作。
歌曲的合唱句为大多数听众识别了歌曲的类别,优于歌曲前几行识别的类别。音乐视频汇总控制器270随后将歌词文本中的该合唱句与对应于该合唱句的多媒体文件的音频和视频部分相匹配。音乐视频汇总控制器270随后将对应于该合唱句的多媒体文件的音频和视频部分的一个拷贝放到音乐视频汇总文件360中。
音乐视频汇总控制器270在存储器280中为每个音乐视频存储音乐视频汇总文件360。根据接收到的用户要求,音乐视频汇总控制器270能够访问特定的音乐视频汇总文件360,并通过电视105播放该音乐视频汇总文件360(包括音频和视频部分)。可选择的,音乐视频汇总控制器270能够访问所有存储的音乐视频汇总文件360的列表190,并在电视105的屏幕110上播放该列表190。即,列表190显示(1)在多媒体数据流中探测到的所有音乐视频的音乐视频汇总文件,并(2)显示录制每个音乐视频的歌手或组合的识别。使用遥控装置125和IR传感器160,用户发送“播放音乐视频汇总”控制信号给音乐视频汇总控制器270,来选择列表190中下面播放的音乐视频汇总文件。在这种情况下,用户选择音乐视频汇总文件播放的顺序。
图5示出了用于索引和汇总音乐视频的、说明本发明的一个优选实施例的方法操作的流程图。在该方法的第一步中,音乐视频汇总控制器270接收包括有音乐视频的多媒体数据流(步骤510)。音乐视频汇总控制器270使用音乐视频分段应用程序320,分割该音乐视频(步骤520)。音乐视频汇总控制器270随后使用音乐视频识别应用程序330,识别该音乐视频(步骤530)。音乐视频汇总控制器270随后使用音乐视频汇总应用程序340,为每个音乐视频创建音乐视频汇总文件360(步骤540)。音乐视频汇总控制器270随后在存储器280中存储每个音乐视频汇总文件360(步骤550)。根据接收的用户要求显示一个音乐汇总文件,音乐视频汇总控制器270显示要求的音乐视频汇总文件(步骤560)。
图6示出了用于索引和汇总音乐视频的、说明本发明的一个优选实施例的方法的第一部分操作的流程图600。在该方法的第一部分的第一步中,音乐视频汇总控制器270清空第一音乐视频汇总块(步骤610)。这可以通过在该第一音乐视频汇总块的每个块中写入“0”值来完成。音乐视频汇总控制器270随后在该多媒体数据流中查找音乐视频文本块180(步骤620)。音乐视频汇总控制器270确认它是否检测到音乐视频文本块180(步骤630)。如果搜索过程持续到该多媒体数据流的结尾,而没有检测到音乐视频文本块180,那么操作随后转到图7的步骤710。
如果检测到音乐视频文本块180,那么随后音乐视频汇总控制器270确认该音乐视频汇总块是否为空(判断步骤640)。如果音乐视频汇总块为空,这意味着该视频文本块180是(一对可能的视频文本块中的)一个第一视频文本块180。因此,音乐视频汇总控制器270标记该音乐视频分段的开头,并在该音乐视频汇总块中存储该音乐视频文本块信息(步骤660)。随后操作返回到步骤620,并且音乐视频汇总控制器270查找下一个视频文本块180。
当音乐视频汇总控制器270找到下一个视频文本块180时,在判定步骤640中的确认是,该音乐视频汇总块非空。随后音乐视频汇总控制器270确认,刚刚设置的视频文本块是否与在音乐视频汇总块中存储的文本块相同(判断步骤650)。如果该视频文本块先前存储的视频文本块相同,那么随后音乐视频汇总控制器270认为它已经找到了表示一个音乐视频结尾的第二视频文本块。因此,音乐视频汇总控制器270标记该音乐视频分段的结尾,并得到下一个空音乐视频汇总块(步骤670)。操作随后返回到步骤620,并且音乐视频汇总控制器270继续查找其它的视频文本块(步骤620)。
如果在判断步骤650中的视频文本块与先前存储的视频文本块不同,那么随后这两个视频文本块不是一对中的部分。即,每个视频文本块对应于不同的音乐视频。音乐视频汇总控制器270随后将当前的视频文本块当作一个新的文本块,并在该音乐视频汇总块中存储它的信息(步骤660)。操作随后返回到步骤620,并且音乐视频汇总控制器270继续查找其它的视频文本块(步骤620)。当在多媒体数据流中没有再检测到其它的视频文本块时,操作转到图7的步骤710。
图7示出了用于索引和汇总音乐视频的、说明本发明的一个优选实施例的方法的第二部分操作的流程图700。在该方法的第二部分的第一步中,音乐视频汇总控制器270确定,使用图6所示的方法是否找到一些音乐视频(判断步骤710)。如果找到了音乐视频,那么不需要执行图7的文本比较方法,并且操作转到图8的步骤810。
在该方法的第二部分的第二步中,音乐视频汇总控制器270选择要查找的、包括有歌曲前几行字符的搜索字符串(步骤720)。通过使用封闭字幕探测器275可以选择该搜索字符串,获得在音乐开始播放后立即说出的字符的文本。为了完成这步工作,可以使用一个音频分类器,例如在2001年4月在Pattern Recognition Letters出版的Dongge Li、IshwatK.Sethi、Nevenka Dimitrova和Tom McGee的文章“Classification ofGerneral Audio Data for Content-Based Retrieval”的第22卷,No.5,第533-544页中描述的音频分类器。该篇文章中所述的音频分类器将音频轨迹分为讲话、音乐、无声、噪音、讲话掺杂音乐、讲话掺杂讲话、和讲话掺杂噪声。
在音乐开始播放后立即说出的字符很可能表示了该歌曲歌词的前几行。音乐视频汇总控制器270随后访问歌词数据库,以得到下面可用于比较的歌曲的歌词(步骤730)。如前所述,该歌曲数据库可以在存储器280中,或者也可以设置在Internet上的远端。
音乐视频汇总控制器270随后确定搜索字符串的字符是否与来自于歌词数据库中的歌曲的歌词相匹配(判断步骤740)。如果不匹配,那么音乐视频汇总控制器270确认是否到达数据库的结尾(判断步骤750)。如果没有到数据库的结尾,那么操作返回到步骤730,并且访问数据库中用于与搜索字符串比较的下一首歌曲(步骤730)。如果到达数据库的结尾,那么决定一个新的搜索字符串是否可用(判断步骤770)。
如果在搜索过程中,该搜索字符串与来自于数据库的一首歌曲的歌词相匹配,那么音乐视频汇总控制器270在音乐视频汇总块中存储与识别的歌曲相关的信息(步骤760)。随后操作转到判断步骤770,在这里决定一个新的搜索字符串是否可用。
如果没有新的字符串可用,那么图7的文本对比方法结束。操作随后转到图8的步骤810。如果有新的字符串可用,音乐视频汇总控制器270选择表示一首要搜索的新歌曲的新字符串(步骤780)。随后操作返回到步骤730,并访问数据库中的下一首歌曲,用于与新搜索字符串比较(步骤730)。
图8示出了用于索引和汇总音乐视频的、说明本发明的一个优选实施例的第一部分方法操作的流程图800。在该方法的第三部分的第一步中,音乐视频汇总控制器270确定,使用图6和图7中所示的方法是否找到一些音乐视频(判断步骤810)。如果没有找到了音乐视频,那么不需要执行图8的音乐视频汇总方法,并且该方法结束。
如果找到了音乐视频并存储在音乐视频汇总块中,那么音乐视频汇总控制器270开始通过选择一个音乐视频汇总块来汇总该音乐视频(步骤820)。音乐视频汇总控制器270随后访问在该音乐视频汇总块中识别的歌曲的歌词(步骤830)。音乐视频汇总控制器270随后使用该歌词识别该歌曲的合唱句(步骤840)。如上所述,如果因为歌词没在数据库中而没有找到歌词,那么合唱句识别为歌曲中重复的一些词句。
音乐视频汇总控制器270随后将在该歌曲文本中的歌曲的合唱句与多媒体数据文件中的相应音频和视频片段相匹配(步骤850)。音乐视频汇总控制器270随后将该音频和视频片段放置在音乐视频汇总文件360中,并在存储器280中存储该音乐视频汇总文件360(步骤860)。
音乐视频汇总控制器270随后确认下一个音乐视频汇总块是否为空(判断步骤870)。如果下一个音乐视频汇总块为空,那么已经汇总了所有的音乐视频,该方法结束。如果下一个音乐视频汇总块不为空,那么操作返回到步骤820,并且音乐视频汇总控制器270如上所述继续汇总音乐视频。
用户能够发送控制信号给音乐视频汇总控制器270,以使音乐视频汇总控制器270仅记录满足至少一个用户选择说明的音乐视频。例如,用户可以指定只录制由特定歌手(或特定组合)表演的音乐视频。可选择的,用户可以指定只录制由特定录音棚发布的音乐视频。用户说明也可以结合。例如,用户可以指定只录制由特定歌手为特定录音棚表演的录制音乐视频。在这种情况下,用户能够提供一个或多个用户说明来选择录制特定类型的音乐视频。将不会录制不满足用户说明的所有音乐视频。
虽然对本发明进行了详细的描述,但是本领域技术人员应当知道,他们能够进行不同的改变、替换和修改,而不脱离本发明最广的形式的精神和范围。
权利要求
1.在视频回放装置(150)中的装置(270),所述装置(270)包括音乐视频汇总控制器(270),能够接收包括多个音乐视频的多媒体数据流;其中所述音乐视频汇总控制器(270)能够分割来自于所述多媒体数据流的所述多个音乐视频的至少一个音乐视频;其中音乐视频汇总控制器(270)能够识别所述多个音乐视频的至少一个音乐视频。
2.如权利要求1所述的装置(270),其中所述音乐视频汇总控制器(270)能够为所述多个音乐视频的所述至少一个音乐视频创建音乐视频汇总块(410),所述音乐视频汇总块(410)包括与所述至少一个音乐视频相关的一个信息项,所述信息项包括下列信息之一歌曲名称(420)、包括该歌曲的唱片名称(430)、演出该歌曲的歌手名称(440)、演出该歌曲的组合的名称(440)、发布该歌曲的录音棚名称(450)和歌曲的发布日期(460)。
3.如权利要求2所述的装置(270),其中所述音乐视频汇总控制器(270)能够为所述至少一个音乐视频创建音乐视频汇总文件(360),所述音乐视频汇总文件(360)包括包括在所述音乐视频汇总块(410)中的关于所述至少一个音乐视频的信息;所述至少一个音乐视频的音频片段;和所述至少一个音乐视频的视频片段。
4.如权利要求1所述的装置(270),其中所述音乐视频汇总控制器(270)通过识别所述至少一个音乐视频的第一视频文本块(180)和通过识别所述至少一个音乐视频的第二视频文本块(180),能够识别所述至少一个音乐视频。
5.如权利要求1所述的装置(270),其中所述音乐视频汇总控制器(270)通过创建包括要查找的歌曲的至少一个字符的搜索字符串,和通过将所述字符串与所述要查找的歌曲的歌词文本相匹配,能够识别所述至少一个音乐视频。
6.如权利要求2所述的装置(270),其中所述音乐视频汇总控制器(270)通过识别在所述至少一个音乐视频中的歌曲的合唱句,和通过将所述合唱句与在所述至少一个音乐视频中的所述歌曲的相应音频片段和相应视频片段相匹配,能够为所述至少一个音乐视频创建所述音乐视频汇总文件(360);和其中所述音乐视频汇总控制器(270)能够将相应的音频片段和相应的视频片段放置到所述音乐视频汇总文件(360)中。
7.如权利要求3所述的装置(270),其中所述音乐视频汇总控制器(270)能够创建包括多个音乐视频汇总块(410,470,480)的音乐视频汇总文件(360),其中每个音乐视频汇总块(410,470,480)包括与符合至少一个用户说明的音乐视频相关的信息。
8.视频回放装置(150),所述视频回放装置(150)包括音乐视频汇总控制器(270),能够接收包括多个音乐视频的多媒体数据流;其中所述音乐视频汇总控制器(270)能够分割来自于所述多媒体数据流的所述多个音乐视频的至少一个音乐视频;其中音乐视频汇总控制器(270)能够识别所述多个音乐视频的至少一个音乐视频。
9.如权利要求8所述的视频回放装置(150),其中所述音乐视频汇总控制器(270)能够为所述多个音乐视频的所述至少一个音乐视频创建音乐视频汇总块(410),所述音乐视频汇总块(410)包括与所述至少一个音乐视频相关的一个信息项,所述信息项包括下列信息之一歌曲名称(420)、包括该歌曲的唱片名称(430)、演出该歌曲的歌手名称(440)、演出该歌曲的组合的名称(440)、发布该歌曲的录音棚名称(450)和歌曲的发布日期(460)。
10.如权利要求9所述的视频回放装置(150),其中所述音乐视频汇总控制器(270)能够为所述至少一个音乐视频创建音乐视频汇总文件(360),所述音乐视频汇总文件(360)包括包括在所述音乐视频汇总块(410)中的关于所述至少一个音乐视频的信息;所述至少一个音乐视频的音频片段;和所述至少一个音乐视频的视频片段。
11.如权利要求8所述的视频回放装置(150),其中所述音乐视频汇总控制器(270)通过识别所述至少一个音乐视频的第一视频文本块(180)和通过识别所述至少一个音乐视频的第二视频文本块(180),能够识别所述至少一个音乐视频。
12.如权利要求8所述的视频回放装置(150),其中所述音乐视频汇总控制器(270)通过创建包括要查找的歌曲的至少一个字符的搜索字符串,和通过将所述字符串与所述要查找的歌曲的歌词文本相匹配,能够识别所述至少一个音乐视频。
13.如权利要求9所述的视频回放装置(150),其中所述音乐视频汇总控制器(270)通过识别在所述至少一个音乐视频中的歌曲的合唱句,和通过将所述合唱句与在所述至少一个音乐视频中的所述歌曲的相应音频片段和相应视频片段相匹配,能够为所述至少一个音乐视频创建音乐视频汇总文件(360);和其中所述音乐视频汇总控制器(270)能够将相应的音频片段和相应的视频片段放置到所述音乐视频汇总文件(360)中。
14.如权利要求10所述的视频回放装置(150),其中所述音乐视频汇总控制器(270)能够创建包括多个音乐视频汇总块(410,470,480)的音乐视频汇总文件(360),其中每个音乐视频汇总块(410,470,480)包括与符合至少一个用户说明的音乐视频相关的信息。
15.用于索引多媒体数据流中的音乐视频的方法,该多媒体数据流在视频回放装置(150)中接收,所述方法包括步骤在音乐视频汇总控制器(270)中接收在多媒体数据流中的多个音乐视频;分割来自于所述多媒体数据流的所述多个音乐视频的至少一个音乐视频;识别所述多个音乐视频的至少一个音乐视频。
16.如权利要求15所述的方法,进一步包括步骤为所述多个音乐视频的所述至少一个音乐视频创建音乐视频汇总块(410),所述音乐视频汇总块(410)包括与所述至少一个音乐视频相关的一个信息项,所述信息项包括下列信息之一歌曲名称(420)、包括该歌曲的唱片名称(4 30)、演出该歌曲的歌手名称(440)、演出该歌曲的组合的名称(440)、发布该歌曲的录音棚名称(450)和歌曲的发布日期(460)。
17.如权利要求16所述的方法,进一步包括步骤为所述至少一个音乐视频创建音乐视频汇总文件(360),所述音乐视频汇总文件(360)包括包括在所述音乐视频汇总块(410)中的关于所述至少一个音乐视频的信息;所述至少一个音乐视频的音频片段;和所述至少一个音乐视频的视频片段。
18.如权利要求15所述的方法,进一步包括步骤通过识别所述至少一个音乐视频的第一视频文本块(180),和通过识别所述至少一个音乐视频的第二视频文本块(180),识别所述至少一个音乐视频。
19.如权利要求15所述的方法,进一步包括步骤通过创建包括要查找的歌曲的至少一个字符的搜索字符串,和通过将所述字符串与所述要查找的歌曲的歌词文本相匹配,识别所述至少一个音乐视频。
20.如权利要求16所述的方法,进一步包括步骤通过识别在所述至少一个音乐视频中的歌曲的合唱句,为所述至少一个音乐视频创建音乐视频汇总文件(360);将所述合唱句与在所述至少一个音乐视频中的所述歌曲的相应音频片段和相应视频片段相匹配;和将所述相应的音频片段和相应的视频片段放置到所述音乐视频汇总文件(360)中。
21.如权利要求17所述的方法,进一步包括步骤创建包括多个音乐视频汇总块(410,470,480)的音乐视频汇总文件(360),其中每个音乐视频汇总块(410,470,480)包括与符合至少一个用户说明的音乐视频相关的信息。
22.存储在计算机可读存储介质(285)上的计算机可执行指令,用于索引多媒体数据流中的音乐视频,该多媒体数据流在视频回放装置(150)中接收,所述计算机可执行指令包括步骤在音乐视频汇总控制器(270)中接收在多媒体数据流中的多个音乐视频;分割来自于所述多媒体数据流的所述多个音乐视频的至少一个音乐视频;识别所述多个音乐视频的至少一个音乐视频。
23.如权利要求22所述的存储在计算机可读存储介质(285)上的计算机可执行指令,所述计算机可执行指令进一步包括步骤为所述多个音乐视频的所述至少一个音乐视频创建音乐视频汇总块(410),所述音乐视频汇总块(410)包括与所述至少一个音乐视频相关的一个信息项,所述信息项包括下列信息之一歌曲名称(420)、包括该歌曲的唱片名称(430)、演出该歌曲的歌手名称(440)、演出该歌曲的组合的名称(440)、发布该歌曲的录音棚名称(450)和歌曲的发布日期(460)。
24.如权利要求22所述的存储在计算机可读存储介质(285)上的计算机可执行指令,所述计算机可执行指令进一步包括步骤为所述至少一个音乐视频创建音乐视频汇总文件(360),所述音乐视频汇总文件(360)包括包括在所述音乐视频汇总块(410)中的关于所述至少一个音乐视频的信息;所述至少一个音乐视频的音频片段;和所述至少一个音乐视频的视频片段。
25.如权利要求22所述的存储在计算机可读存储介质(285)上的计算机可执行指令,所述计算机可执行指令进一步包括步骤通过识别所述至少一个音乐视频的第一视频文本块(180),和通过识别所述至少一个音乐视频的第二视频文本块(180),识别所述至少一个音乐视频。
26.如权利要求22所述的存储在计算机可读存储介质(285)上的计算机可执行指令,所述计算机可执行指令进一步包括步骤通过创建包括要查找的歌曲的至少一个字符的搜索字符串,和通过将所述字符串与所述要查找的歌曲的歌词文本相匹配,识别所述至少一个音乐视频。
27.如权利要求23所述的存储在计算机可读存储介质(285)上的计算机可执行指令,所述计算机可执行指令进一步包括步骤通过识别在所述至少一个音乐视频中的歌曲的合唱句,为所述至少一个音乐视频创建音乐视频汇总文件(360);将所述合唱句与在所述至少一个音乐视频中的所述歌曲的相应音频片段和相应视频片段相匹配;和将所述相应的音频片段和相应的视频片段放置到所述音乐视频汇总文件(360)中。
28.如权利要求24所述的存储在计算机可读存储介质(285)上的计算机可执行指令,所述计算机可执行指令进一步包括步骤创建包括多个音乐视频汇总块(410,470,480)的音乐视频汇总文件(360),其中每个音乐视频汇总块(410,470,480)包括与符合至少一个用户说明的音乐视频相关的信息。
全文摘要
本发明披露了一种用于索引和汇总音乐视频的系统和方法。在视频回放装置中的音乐视频汇总控制器接收包括有多个音乐视频的多媒体数据流。该音乐视频汇总控制器(1)分割和识别音乐视频,并且(2)对于每个音乐视频创建音乐视频汇总文件。音乐视频汇总文件包括有信息,例如歌曲名称和艺术家姓名。音乐视频汇总文件还包括歌曲的识别音频片段和视频片段。用户能够访问音乐视频汇总文件的列表,并通过选择相应的音乐视频汇总文件,来选择要在视频回放装置上播放的音乐视频。
文档编号G11B27/10GK1662907SQ03814295
公开日2005年8月31日 申请日期2003年6月10日 优先权日2002年6月20日
发明者L·阿尼霍特里 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1