识别多首乐曲的方法

文档序号：2830639阅读：438来源：国知局

专利名称：识别多首乐曲的方法
发明的领域本发明涉及一种识别多首乐曲的方法，以及执行该方法的分析装置。
发明的简述本发明的目的是提供一种自动识别多首乐曲的方法和执行该方法的适当的装置。该目的通过分别由权利要求1和13限定的本发明来实现。
按照本发明，至少把要识别的一首乐曲的旋律和/或歌词的片段，例如第一小节或副歌输入到分析装置。在该分析装置中，根据是分析装置所知晓的乐曲确定旋律和/或歌词片段与其它多首乐曲或乐曲的一部分之间的不同的一致性。在这种意义上说，分析装置知晓所有的歌曲，该装置具有到多首歌曲的链接并且能够获得歌曲的相关数据比如曲名、演唱者、创作者等。这些歌曲可以存储在一个或多个数据库中。例如，可能涉及各个唱片公司的不同数据库，这些数据库可以由分析装置经网络，例如互联网获得。
通过将旋律和/或歌词片段与已知的多首歌曲(或它的一部分)相比较确定与哪首歌一致，例如，使用一种或多种不同的样本分类运算法则。在最简单的情况下，这是旋律和/或歌词片段与已知的多首歌曲之间简单的相互关系。至少当提供待识别的一首乐曲原始的片段时，能够从与分析装置知晓的“正确的”那首歌的速度相一致的固定速度开始。
基于确定的一致性，无论如何只要找到一首歌就至少选定多首歌曲中的一首，这首歌与输入的旋律和/或歌词片段之间具有规定的最低限度的符合程度。
随后，提供确认的例如曲名、演唱者、作者或其他信息这些数据。同时提供选择的这首乐曲本身。例如，这样的音响输出会起到核实这首歌曲的作用。当用户听到播出的这首歌时，他可以再次验证是否是他寻找的那首并只在确定是他要找的那首乐曲后提供识别数据。当因为没有确定输入的数据与任何一首乐曲之间有最低限度的一致性而没有选择歌曲时，则依据该信息提供文字“没有识别存在”。
最好，不仅提供一首乐曲而且提供多首歌曲和/或它们的识别数据以确定最符合的那首或要求提供这些首歌曲和/或它们的识别数据。这意味着不仅提供最一致的曲名而且提供第n(n＝1，2，3，…)类似的曲名，为了证实的目的用户能够连续地收听这些曲目或者向用户提供所有n首歌曲的识别数据。
在典型的最佳实施例中，为了确认一致性，提取给定的旋律和/或歌词片段的典型特征。然后一组以旋律和/或歌词片段为特征的典型特征从这些指定的典型特征中确定。这样的一组典型特征基本对应于每首乐曲的“指纹”。该组典型特征再与分析装置已知的表征多首乐曲作品的多组典型特征相比较。这带来待处理的数据量大大减小的优势，这也提高了整个方法的速度。而且，既然这样数据库就不再需要保存多首完整的乐曲或具有所有信息的多首乐曲的一部分，而只保存特定的多组典型特征，从而要求的存储区域将大大减小。
有利的是，旋律和歌词片段输入被提供给语音识别系统。相应的歌词也可以被提取并单独提供给语音识别系统。在该语音识别系统中，识别的字和/或句子与多首不同的乐曲的歌词相比较。最终，歌词当然也应当作为典型特征保存在数据库中。为了加快语音识别的速度，歌词片段的语言被预先指定从而语音识别系统只需要接入相关语言要求的库而不需要搜索其它语言库。
旋律和歌词片段也可以提供给乐曲识别系统，在该系统中将识别的节拍和/或音程与典型的保存的多首乐曲的节拍和/或音程相比较，以这种方式找到该旋律对应的那首乐曲。
例如，通过两种方式单独分析旋律和歌词以及单独搜索给定的一首乐曲也是可能的。随后，比较用旋律找到的多首乐曲与用歌词找到的多首乐曲是否对应。另外，从用不同的方式找到的多首乐曲中选定最一致的一首或多首乐曲。在这种情况下，可以执行加权，在此加权中，用此概率检测经给定方式找到的一首乐曲是正确地选定的一首乐曲。
也可以只提供没有歌词的一段旋律或旋律片断或者没有相应的旋律的一首乐曲的歌词或歌词片段。
按照本发明，用于执行这样的方法的分析装置应当包括用于提供待识别的一首乐曲作品的旋律和/或歌词的片段的装置。而且，还应当包括带有包含若干首乐曲或它们的一部分的数据库的存储器，或至少用于接入这样的存储器的装置，比如用于接入其他互联网存储器的互联网连接。而且，该分析装置需要一个比较装置，用于确定旋律和/或歌词片段与多首不同的乐曲或它们的一部分之间的一致性，还需要一个选择装置，用于参照确定的一致性从多首乐曲中至少选出一首。最后，分析装置包括提供选定的那首乐曲和/或选定的那首乐曲本身的识别数据的装置。
这样的用于执行该方法的装置可以被形成为一个自支持系统，该系统包括例如作为提供旋律和/或歌词片段装置的话筒，用户能够向该话筒说或唱他所知道的歌词片段，也可以吹口哨或哼出相应的旋律。当然一首乐曲也可以在话筒前被弹奏出。这种情况下，输出装置最好包括声音输出装置，例如扬声器，为了验证的目的使用该扬声器可以将选出的一首乐曲或多首乐曲完整地或部分地再现出来。识别数据也可以通过该声音输出装置提供。另外，分析装置也还可以包括光学输出装置，例如在该装置上可以显示出识别数据。分析装置最好也包括相应的操作装置，以验证多首乐曲的输出用于选择输出提供的多首乐曲或提供对识别有帮助的附加信息，例如歌词的语言等。这样的自支持系统可以出现在例如能够用它来向顾客做广告的媒体商店中。
在典型的最佳实施例中，用于提供旋律和/或歌词片段的分析装置包括从终端设备接收相应数据的接口。同样，提供识别数据和/或选择的一首乐曲的装置借助于向终端设备发送相应数据的接口来实现。在这种情况下，分析装置可以在任意位置。用户能够向通信终端设备提供旋律或歌词片段并由此经通信网络将它发送到分析装置。
最好，被提供旋律和/或歌词片段的通信终端装置是移动的通信终端装置例如移动电话。这样的移动电话有话筒和用于经通信网络向任意个其它装置发送记录的声音信号的必要的装置，在这里通信网络是移动无线网络。该方法的优点是当用户在迪斯科舞厅或在百货公司的背景乐曲听到一首乐曲时，他能够通过他的移动电话立即与分析装置建立连接，并能够经移动电话向分析装置“播放”当前这首乐曲。用这样的原始乐曲的片段，与由用户自己唱或说出的被相当程度地变形的乐曲和/或歌词片段相比能很大程度地提早识别出这首歌。
选择的该首乐曲或该首乐曲的一部分的识别数据和声音输出的提供也可以通过相应的接口来实现，经过该接口相关的数据被发送到用户终端。该终端可以是相同的终端装置，例如，用户的移动电话，旋律和/或歌词片段被提供给该移动电话。这可以在线或离线完成。用于确认的选择的一首乐曲或选择的多首乐曲或乐曲的一部分经终端装置的扬声器被提供。也可以发送曲名或表演者这些识别数据以及可能选择输出的其他项目，例如，借助于终端装置的显示上的SMS。
提供的一首乐曲的选择，以及对分析装置的其他控制命令或附加信息能够由传统的操作控制，例如，由终端装置的键盘控制。
然而，数据也可以由自然的语音对话提供，这要求相应的语音接口，即分析装置中的语音识别和语音输出系统。
另外，也可以离线作出搜索，即输入旋律和/或歌词片段后和输入其它命令或信息后，用户或分析装置中断与分析装置的连接。分析装置已经找到结果后发送该结果，例如，由SMS或由通过语音信道回叫用户的通信终端装置。
在这样的离线方法中，为用户指明另一个通信终端装置也是有可能的，例如，将结果发送到他家中的计算机或e-mail地址。该结果也能够以HTML文件的形式或类似的形式发送。发送地址的指示，即结果被发送到的通信终端装置可以在输入乐曲和/或歌词片段之前或之后由相应的命令提供和指明。然而，也有可能为相应用户预先在操作存储所需数据的分析装置的服务提供者那里明确地登记。
在典型的优选实施例中，有可能除了选择的一首乐曲或相关的识别数据之外还提供与与选择的一首乐曲相关的多首乐曲或它们的识别数据。这意味着，例如，指明乐曲的曲目作为与记得的乐曲曲目相似风格的附加的信息，从而使用户能够知道符合他自己的口味的其他曲目，这些曲目他可能会想购买。
在心理声学范畴的基础上可以确定两首不同的乐曲之间的相似性，例如，非常强或弱的低音、旋律中给出的频率变化等。确定两首乐曲之间的相似性的另一种可能是使用通过收听试验和/或市场分析建立的音域矩阵，例如用户行为分析。
参照下文中描述的实施例，本发明的这些和其他方面变得明显并将被说明。
原则上，可以使用商业上可获得的移动电话2，它可以被修改以获得更好的传输质量。通过移动电话2对分析装置1的控制可以由移动电话2上的按键(未示出)通过相应的菜单控制实现。或者也可使用语音控制的菜单。
给定的典型特征由分析装置1从得到的旋律和/或歌词片段MA中提取。一组代表旋律和/或歌词片段MA的特点的典型特征再从这些确定的典型特征中指定。分析装置1与包含数据库的存储器4通信联络，该数据库包括每一个都表示不同的乐曲特点的相应的多组典型特征MS。该数据库也包括请求的识别数据，例如，对应的相关联的多首乐曲的曲名和表演者。为了把表示旋律和/或歌词片段的特点的一组典型特征与保存在存储器4的数据库中的多组典型特征MS相比较，待比较的多组典型特征之间的相关性系数由分析装置1确定。这些相关性系数的值表示相应的多组典型特征之间的一致性。这意味着，保存在存储器4中的一组典型特征MS的最大的相关性系数与提供给移动电话2的旋律和/或歌词片段有最大的一致性的一首乐曲相关联。该首乐曲则被选为相关联的识别出的一首乐曲，相关联的识别数据ID由分析装置1在线传送到移动电话2，并在移动电话的显示屏上示出。
在所述的方法中，旋律和/或歌词片段MA直接由乐曲源5提供，识别过程被简化到以下这个程度，与普通的语音或取样识别相反，假定多首乐曲总是以几乎相同的速度播放从而能够假定用于识别的乐曲和/或歌词片段和待选择的相应正确的一首乐曲之间至少固定的共同时间段。
图2表示与上述方法稍有不同的离线状态进行识别的方法。
待识别的一首乐曲或该首乐曲的一段旋律和/或歌词片段MA也通过外部的乐曲源5提供到用户的移动电话2，信息也随后发送到分析装置1。而且通过以旋律和/或歌词片段为特点的一组典型特征的确定来进行分析的种类和第一实施例一样。
然而，与

图1的第一实施例相反，识别的结果不回送到用户的移动电话2。代替这种方式，该结果用e-mail经互联网或作为HTML页向用户的PC3或由用户指定的PC或e-mail地址。
除了识别数据，相应的这首乐曲MT本身或者至少这首乐曲的一个片断也发送到PC，从而用户能够为了识别的目的收听这首乐曲。这些乐曲MT(或这些乐曲的片段)与代表多首乐曲的特点的多组典型特征一起也保存在存储器4中。
也可发送索取带有搜索到的这首乐曲的CD、商业资料或附加的信息的命令。附加信息可以被发送给用户，例如，与识别的乐曲曲目类似的其他乐曲曲目。
通过图3所示的音域矩阵AM可确定相似性。该音域矩阵AM的元素M是相似性系数，即表示两首乐曲之间的相似性的测量值。多首乐曲当然总是百分之百与自己本身相似因此在对应的区域中填入1.0这个值。在相应的例子中，带有曲名1的乐曲与曲目3和曲目5基本上相似。相反，具有曲名4或6的乐曲与具有曲名1的乐曲完全不相似。因此，向被识别的乐曲曲名为1的用户另外提供曲名3和5。
这样的音域矩阵AM也可以保存在存储器4中。这样的矩阵可通过，例如在相当多的测试听众主观收听试验或顾客行为分析的基础上来确定。
分析装置1可以被放置在任意位置。分析装置应当只有与传统的移动电话连接的接口或只有互联网连接。分析装置1在图中以相关的装置示出。分析装置1的不同功能当然也可以分布在与互联网连接在一起的不同的装置中。分析装置的功能可以很大部分或全部以软件的形式在有足够的计算和存储能力的适当的计算机或服务器上实现。使用包括相关数据库的单个中央存储器是不必要的，而可以使用放在不同位置并能由分析装置1经互联网或其他的网络存取的多个存储器。在这种情况下，有可能不同的乐曲生产和/或销售公司把他们的多首乐曲保存在他们自己的数据库中并允许分析装置接入到这些不同的数据库。当减少不同的多首乐曲的特征信息为多组典型特征时，应当有效地确保从多首乐曲中通过相同的方法提取典型特征，并且多组典型特征用相同的方式构成从而以这种方式获得兼容性。
按照本发明的方法能够使用户容易地获得所需的数据以购买想要的乐曲，并快速地识别当前播放的乐曲。而且，该方法使用户能够被告知也与他的个人口味相应的其它多首乐曲的信息。该方法对乐曲销售公司是有利的，因为潜在的用户能够被确切地提供他们感兴趣的乐曲从而吸引想得到的目标组。
权利要求
1.一种识别多首乐曲的方法，该方法包括如下步骤向分析装置(1)提供待识别的一首乐曲的旋律和/或歌词的至少一个片段(MA)；确定该旋律和/或歌词片段(MA)与分析装置(1)已知的多首乐曲(MT)或乐曲的一部分之间的一致性；在定义的最小程度的一致性的范围内，参照此确定的一致性，至少从已知的多首乐曲(MT)中选出一首乐曲；提供选定的这首乐曲(MT)的识别数据(ID)和/或提供选定的这首乐曲(MT)本身的至少一部分，或在没有选出一首乐曲(MT)的情况下提供相应的信息。
2.如权利要求1所述的方法，其特征在于提供和/或建议提供具有确定的最大一致性的多首乐曲和/或它们的识别数据。
3.如权利要求1或2所述的方法，其特征在于为了确定一致性，提取旋律和/或歌词片段(MA)的给定典型特征，再从确定的典型特征中确定代表旋律和/或歌词片段(MA)特征的一组典型特征，并将该组典型特征与表示已知的多首乐曲(MT)特征的多组典型特征(MS)相比较。
4.如权利要求3所述的方法，其特征在于为了将旋律和/或歌词片段(MA)的一组典型特征与保存在数据库中的多组典型特征(MS)相比较，确定待比较的多组典型特征之间的相关性系数，所述的相关性系数的值表示相应的多组典型特征之间的一致性。
5.如权利要求1到4中任何一个所述的方法，其特征在于提供的旋律和/或歌词片段或从中提取出的歌词被提供给语音识别系统，并且将语音识别系统识别出的词和/或句子与不同的多首乐曲的歌词比较。
6.如权利要求5所述的方法，其特征在于为了语音识别的目的，指定提供的歌词片段使用的语言。
7.如权利要求1到6中任何一个所述的方法，其特征在于用户向通信终端装置(2)提供旋律和/或歌词片段(MA)，旋律和/或歌词片段(MA)经通信网络发送到分析装置(1)，选择的一首乐曲(MT)和/或它的识别数据(ID)被发送，用来提供给用户指定的通信终端装置(2，3)。
8.如权利要求7所述的方法，其特征在于旋律和/或歌词片段(MA)提供给的终端装置(2)是移动通信终端装置(2)。
9.如权利要求7或8所述的方法，其特征在于选择的一首乐曲(MT)和/或它的识别数据(ID)被回送到接收旋律和/或歌词片段(MA)的通信终端装置(2)中。
10.如权利要求1到9中任何一个所述的方法，其特征在于除选择的一首或多首乐曲和/或相关联的识别数据之外，至少提供和/或建议提供近似于选择乐曲的另外一首乐曲和/或它的识别数据。
11.如权利要求10所述的方法，其特征在于在心理声学领域的基础上确定两首乐曲之间的相似性。
12.如权利要求10或11所述的方法，其特征在于在音域矩阵(AM)的基础上确定两首乐曲之间的相似性，该矩阵是借助于收听体验和/或市场分析(顾客行为分析)而建立的。
13.一种用于执行权利要求1到12中任何一种方法的分析装置(1)，该装置包括用于提供待识别的一首乐曲的旋律和/或歌词的至少一个片段(MA)的装置，包括不同的多首乐曲或乐曲的一部分的数据库的存储器(4)，或接入至少一个这样的存储器的装置，用于确定旋律和/或歌词的片段(MA)和不同的多首乐曲(MT)或乐曲的一部分之间的一致性的比较装置，在定义的最小程度的一致性的范围内，参照确定的一致性选择多首乐曲(MT)中的至少一首的选择装置，以及用于提供选择的一首乐曲(MT)的识别数据(ID)和/或选择的一首乐曲(MT)本身的装置。
14.如权利要求13所述的分析装置，其特征在于该分析装置包括用于提取旋律和/或歌词片段(MA)的给定典型特征的装置和用于从确定的典型特征中确定一组代表旋律和/或歌词片段(MA)特点的典型特征的装置，并且其中存储器(4)的数据库包括代表每首乐曲(MT)特点的对应的多组典型特征。
15.如权利要求13或14所述的分析装置，其特征在于用于提供旋律和/或歌词片段的装置包括一个话筒，用于提供数别数据和/或选择的一首乐曲的装置包括声音输出单元和/或光学输出单元。
16.如权利要求13到15中任一个所述的分析装置，其特征在于用于提供旋律和/或歌词片段(MA)的装置包括从终端装置(2)接收相应数据的接口，用于提供数别数据(ID)和/或选择的一首乐曲(MT)的装置包括向终端装置(2，3)发送相应数据的接口。
17.如权利要求13到16中任一个所述的分析装置，其特征在于还包括用于选择与选定的一首乐曲类似的另外多首乐曲的装置。
全文摘要
一种识别多首乐曲的方法。按照本发明,至少将待识别的一首乐曲的旋律和/或歌词片段(MA)提供给分析装置(1),由它确定旋律和/或歌词片段(MA)与分析装置(1)已知的多首乐曲(MT)之间的一致性。该分析装置(1)再参照确定的一致性选择已知的多首乐曲(MT)中的至少一首并提供识别数据(ID),例如,选择的一首乐曲(MT)的曲名或表演者和/或选择的一首乐曲(MT)本身的至少一部分。
文档编号G10H1/00GK1356689SQ01145609
公开日2002年7月3日申请日期2001年11月23日优先权日2000年11月27日
发明者V·施塔尔申请人:皇家菲利浦电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：V.施塔尔
技术所有人：皇家菲利浦电子有限公司
我是此专利的发明人