自动乐曲分类设备与方法

文档序号:2831297阅读:240来源:国知局
专利名称:自动乐曲分类设备与方法
技术领域
本发明涉及用于对多首乐曲进行自动分类的一种自动乐曲分类设备与方法。
背景技术
由于最近几年压缩音乐数据的日趋流行,以及存储设备容量的不断增长,个人已能够存储和欣赏大量的音乐。另一方面,对于用户来说,拣选大量的乐曲以及寻找他们喜欢收听的乐曲,已变得极其困难。因此,存在着对某种能够解决这一问题的有效的乐曲分类和选择方法的需求。
传统的乐曲分类方法包括这样的一些方法使用出现在参考信息中的信息,例如歌曲标题;歌手;音乐所属的流派的名称,例如摇滚或流行音乐;以及速度,以按具体的音乐种类对大量存储的乐曲进行分类,如公开号为2001-297093的日本专利中所公开的。
这些方法还包括一种分类与选择中所使用的方法,该方法针对从一个乐曲信号中抽取的某些特征量,例如节拍和频率波动,分配一个诸如“振奋”的字或表达式,这一字或表达式可以在多首收听音乐的对象之间共享,如公开号为2002-278547的日本专利所公开的。
另外,还提出过这样一种方法从一个诸如摇滚或‘enka’(现代日本民谣)的乐曲信号的某一部分中抽取3个音乐元素(旋律、节奏以及谐声),并且把这3个元素与一个流派标识符相关联,以使当此后提供混合有多个流派和目标流派名称的音乐源时,仅把与该流派名称相匹配的音乐源记录在一个独立的设备上,如公开号为2000-268541的日本专利申请所公开的。
另外,一种已知的传统的乐曲分类方法,通过把速度、大调或小调、以及高音部和基本声平用作音乐特征量,以矩阵的形式进行自动分类,因而,有利于对乐曲的选择,如公开号为2003-58147的日本专利所公开的。
还有这样一些方法抽取用户曾经选择的音乐的声音参数(倒谱和能量高次时刻),然后根据类似的声音参数相继地提交音乐,如公开号为2002-41059的日本专利所公开的。
然而,使用公开号为2001-297093的日本专利中所说明的显示在参考信息中的诸如歌曲标题、流派等信息的方法,已遇到的许多问题,即,这一方法要求在个人方进行工作,不允许网络连接,而且当难以获得分类信息时无法正常运作。
在使用公开号为2002-278547的日本专利的分类方法的情况下,音乐的收听者的图像是受个人感情支配的,由于这一图像是模糊的,甚至对同一收听者来说也是变化的,所以当使用不同于所涉及方的图像的一图像进行分类时,不能期望产生连续的结果。因此,为了保持主观图像语言的效力,需要针对分类操作从收听者那里连续地获得反馈,这产生了这样的一个问题把一种十分费力的操作强加给收听者。而且还存在着这样一个问题对节拍或其它节奏信息的分类,受到目标音乐的限制。
根据公开号为2000-268541的日本专利所公开的分类方法,使用从乐曲信号中所抽取的3个音乐元素中的至少一个元素进行分类。然而,根据这一公开的技术,每一特征量和流派标识符之间的具体的关联是困难的。另外,为了在仅使用与这3个音乐元素的相当的少数几个小节的分类过程中确定流派,难以考察一个大的分类调。
公开号为2003-58147的日本专利所公开的分类方法的所建议的速度和调性等的组合,允许基本实现音乐的清晰和流畅,并且可期望地表达旋律。此处,以及以下我们所引用的单词“旋律”不代表诸如音乐的声乐部或器乐部的具体元素。而旨在用这些单词表示音乐的一个粗调,例如音乐的伴奏或编排(arrangement)的相似性。然而,在以上所描述的这一分类中,存在着这样一个问题实际的乐曲的速度、调性等几乎没有多大的连贯性,而且,对于允许按乐曲单元进行分类的特征量来说,精度很低。
另外,对于公开号为2001-297093、2002-278547、2000-268541、2003-58147的日本专利所公开的方法,需使用静态定义的语言,例如使用图像字、流派、以及大调和小调,进行音乐选择,而且乐曲的印象随情绪而变化,所以存在着不能进行适当的乐曲分类的问题。
尽管公开号为2002-41059的日本专利描述了这样一种情况当选择了乐曲时提供与收听者的偏好相匹配的乐曲,因为实际使用的特征量是通过把从全部或部分音乐信号中所抽取的结果转换成数字值而被提交的,不能表示乐曲中旋律方面的变化,因此存在着这样一个问题不能确保根据偏好对乐曲进行分类适当的精度。

发明内容
作为本发明将加以解决的这些问题的一个例子,列举了上述的缺陷,本发明的一个目的是,提供一种能够根据旋律相似性对多首乐曲自动分类的自动乐曲分类设备与方法。
根据本发明的一个第一方面的自动乐曲分类设备,是一种对多首乐曲进行自动分类的自动乐曲分类设备,包括一个和弦进行模式数据存储装置,为多首乐曲中的每一首乐曲保存代表一个和弦进行序列的和弦进行模式数据;一个特征量抽取装置,根据和弦进行模式数据,为该多首乐曲中的每一首乐曲抽取和弦进行变化特征量;以及一个群创建装置,根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列,并使用和弦进行变化特征量,对该多首乐曲进行分组。
根据本发明的自动乐曲分类方法,是一种用于对多首乐曲自动分类的自动分类乐曲的方法,包括如下步骤存储代表该多首乐曲中的每一首乐曲的一个和弦进行序列的和弦进行模式数据;根据和弦进行模式数据抽取该多首乐曲中的每一首乐曲的一个和弦进行变化特征量;以及根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列,并使用和弦进行变化特征量,对该多首乐曲进行分组。
根据本发明的另一个方面的一个程序,是一个执行对多首乐曲进行自动分类的自动乐曲分类方法的计算机可读程序,该方法包括一个和弦进行模式数据存储步骤,保存代表多首乐曲中的每一首乐曲的一个和弦进行序列的和弦进行模式数据;一个特征量抽取步骤,根据和弦进行模式数据,抽取该多首乐曲中的每一首乐曲的一个和弦进行变化特征量;以及一个群创建步骤,根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列,并使用和弦进行变化特征量,对该多首乐曲进行分组。


图1是一个方框图,描述了本发明的一个实施例;图2是一个流程图,描述了和弦特征量抽取处理过程;图3描述了12个音调中每一个音调的频率比以及在A的音调为1.0的情况下一个双八度音栓(superoctave)A的音调;图4是一个流程图,描述了一个和弦分析操作的主处理过程;图5描述了从由4个音调构成的和弦向由3个音调构成的和弦的转换;
图6描述了记录格式;图7A~7C描述了一种代表基本音调与和弦属性的方法以及一种代表和弦候选对象的方法;图8是一个流程图,描述了跟随和弦分析操作的处理过程;图9描述了在平滑之前第一和第二和弦候选对象的时间变化;图10描述了在平滑之后第一和第二和弦候选对象的时间变化;图11描述了在转换之后第一和第二和弦候选对象的时间变化;图12A~12D描述了一种创建和弦进行模式数据的方法以及这一数据的格式;图13A和13B描述了一个乐曲中的和弦的直方图;图14描述了保存和弦进行变化特征量时的格式;图15是一个流程图,描述了相对和弦进行频率计算;图16描述了寻找相对和弦进行数据的方法;图17描述了存在3次和弦变化的情况下的多个和弦变化模式;图18是一个流程图,描述了和弦进行特征向量创建处理过程;图19描述了针对一个频率调整加权系数G(i)的一条特征曲线;图20描述了和弦进行特征向量创建处理过程的结果;图21是一个流程图,描述了音乐分类处理过程和分类结果显示处理过程;图22描述了音乐分类结果和一个群显示实例;图23描述了可选群显示图像;图24描述了其它的可选群显示图像;图25是一个流程图,描述了音乐群选择和回放处理过程;图26描述了一个乐曲列表显示图像;图27是一个方框图,描述了本发明的另一个实施例;图28是一个流程图,描述了图27中的设备的操作的一个实例;
图29是一个流程图,描述了图27中的设备的操作的另一个实例;图30是一个流程图,描述了图27中的设备的操作的另一个实例;以及图31是一个流程图,描述了图27中的设备的操作的另一个实例;具体实施方式
以下将参考附图,详细描述本发明的实施例。
图1描述了根据本发明的自动乐曲分类设备。自动乐曲分类设备包括一个音乐信息输入设备1、一个和弦进行模式抽取部分2、一个和弦直方图偏差与和弦变化率处理器3、一个和弦特征量存储设备4、一个乐曲存储设备5、一个相对和弦进行频率处理器6、一个和弦进行特征向量创建部分7、一个乐曲群创建部分8、一个分类群存储设备9、一个音乐群单元显示设备10、一个音乐群选择设备11、一个模型乐曲抽取部分12、一个乐曲列表抽取部分13、一个乐曲列表显示设备14、一个乐曲列表选择设备15、以及一个音乐回放设备16。
音乐信息输入设备1预输入将加以分类的多首乐曲的数字乐曲信号(音频信号)作为音乐声音数据,并且,例如,从一个CD-ROM驱动器、CD播放机等输入回放乐曲信号,或者通过对压缩乐曲声音数据进行解码所提交的信号。由于可以输入一个乐曲信号,所以可以通过对使用外部输入等的模拟记录的音频信号进行数字化,提交乐曲信号。另外,还可以随乐曲声音数据一起输入乐曲标识信息。例如,乐曲标识信息可以包括歌曲标题、歌手的名字、流派的名字以及一个文件名。然而,能够通过一个单一的项或多种类型的项指定一个乐曲的信息是可以接受的。
把音乐信息输入设备1的输出连接至和弦进行模式抽取部分2、和弦特征量存储设备4、以及乐曲存储设备5。
和弦进行模式抽取部分2从已通过音乐信息输入设备1输入的一个音乐信号中抽取和弦数据,从而生成一个用于该乐曲的和弦进行序列(和弦进行模式)。
和弦直方图偏差与和弦变化率处理器3根据和弦进行模式抽取部分2所生成的和弦进行模式,自所使用的和弦的类型及其频率,生成一个直方图,然后计算偏差作为旋律的变化程度。和弦直方图偏差与和弦变化率处理器3还计算每分钟和弦变化率,每分钟和弦变化率用于对音乐速度的分类。
和弦特征量存储设备4保存用于每一首乐曲的由和弦进行模式抽取部分2所获得的和弦进行、和弦直方图偏差与和弦变化率处理器3所获得的和弦直方图偏差和和弦变化率、音乐信息输入设备1所获得的乐曲标识信息作为和弦进行变化特征量。在这一保存过程中,把乐曲标识信息用作为标识信息,从而能够标识已经被分类的多首乐曲中的每一首乐曲。
乐曲存储设备5把音乐信息输入设备1已经输入的乐曲声音数据与乐曲标识信息加以关联,并且加以保存。
相对和弦进行频率处理器6对公共于其乐曲声音数据已经被存储在乐曲存储设备5中的乐曲的和弦进行模式的频率进行计算,然后,抽取分类中使用的特征和弦进行模式。
作为一个多维向量,和弦进行特征向量创建部分7生成一个比率,该比率包括作为对多首乐曲的结果加以提交的一个特征和弦进行模式,与由相对和弦进行频率处理器6加以分类的乐曲之比。
乐曲群创建部分8根据和弦进行特征向量创建部分7所生成的用于分类的多首乐曲的一个和弦进行特征向量,创建一群相似的乐曲。
分类群存储设备9把乐曲群创建部分8所生成的群和相应于属于这些群的乐曲标识信息相关联,并且保存它们。音乐群单元显示设备10按旋律相似性的次序显示存储在分类群存储设备9中的乐曲群中的每一首乐曲群,以致属于乐曲群的乐曲的数量十分清晰。
音乐群选择设备11用于对音乐群单元显示设备10所显示的音乐群进行选择。模型乐曲抽取部分12从属于音乐群选择设备11所选择的群的乐曲中抽取包含该群的最多特征的乐曲。
乐曲列表抽取部分13从分类群存储设备9中抽取关于属于音乐群选择设备11所选择的群的每一首乐曲的乐曲标识信息。乐曲列表显示设备14把乐曲列表抽取部分13所抽取的乐曲标识信息的内容作为一个列表加以显示。
乐曲列表选择设备15根据用户的操作,从乐曲列表显示设备14所显示的乐曲列表中选择任一乐曲。音乐回放设备16从乐曲存储设备5中选择实际乐曲声音数据,并且根据通过模型乐曲抽取部分12或乐曲列表选择设备15分别加以抽取或选择的乐曲的乐曲标识信息,回放这一声音数据作为一个声音输出。
具有这一结构的本发明的自动乐曲分类设备执行和弦特征量抽取处理过程。和弦特征量抽取处理过程是这样的一个过程其中,用于多首旨在进行分类的乐曲,把经由音乐信息输入设备1所输入的乐曲声音数据和乐曲标识信息保存在乐曲存储设备5中,与此同时,抽取由乐曲声音数据所代表的乐曲声音中的和弦进行变化特征量作为数据,然后将它们保存在和弦特征量存储设备4中。
当具体描述和弦特征量抽取处理过程时,让我们假设将加以处理的乐曲的数量为Q,用于计数乐曲的数量的计数器值为N。在和弦进行特征量抽取处理过程开始时,把计数器值N预设置为0。
在和弦特征量抽取处理过程中,如图2中所示,首先,开始经由音乐信息输入设备1输入第N个音乐数据和乐曲标识信息(步骤S1)。接下来,把第N个音乐数据提供至和弦进行模式抽取部分2,及把第N个乐曲声音数据与乐曲标识信息相关联,并且将它们保存在乐曲存储设备5中(步骤S2)。继续步骤S2的对第N个音乐数据的保存,直至在下一个步骤S3中断定第N个音乐数据的输入已经结束。
如果第N个音乐数据的输入已经结束,则从和弦进行模式抽取部分2中获得和弦进行模式抽取结果(步骤S4)。
此处,为相应于5个八度音阶的一个等程音阶(equally-temperedscale)的12个音调抽取和弦。等程音阶的12个音调为A、A#、B、C、C#、D、D#、E、F、F#、G以及G#。图3描述了12个音调中每一个音调的频率比以及在A的音调为1.0的情况下一个双八度音栓音调A。
在和弦进行模式抽取部分2的和弦进行模式抽取处理过程中,通过傅立叶变换按0.2秒的间隔对一个数字输入信号进行频率转换,获得频率信息f(T)(步骤S21),如图4中所示。另外,使用当前f(T)、先前f(T-1)以及在f(T-1)之前的f(T-2)进行迁移平均(步骤S22)。在这一迁移平均中,根据在0.6秒的间隔中几乎不存在变化这样一个假设,使用用于两个先前时机(occasion)的频率信息。使用下列方程计算迁移平均f(T)=(f(T)+f(T-1)/2.0+f(T-2)/3.0)/3.0......(1)在执行步骤S22之后,从已经历了迁移平均f(T)的频率信息中分别抽取频率分量f1(T)~f5(T)(步骤S23~S27)。对于以上所描述的每一个步骤S6~S10,频率分量f1(T)~f5(T)为等程音阶的12个音调A、A#、B、C、C#、D、D#、E、F、F#、G以及G#,它们相应于5个八度音阶,其中基本频率为(110.0+2×N)Hz,对于步骤S23的f1(T),A的音调为(110.0+2×N)Hz,对于步骤S24的f2(T),A的音调为2×(110.0+2×N)Hz,对于步骤S25的f3(T),A的音调为4×(110.0+2×N)Hz,对于步骤S26的f4(T),A的音调为8×(110.0+2×N)Hz,对于步骤S27的f5(T),A的音调为16×(110.0+2×N)Hz。此处,N为等程音阶的频率的差分值,将其设置为-3和3之间的一个值,但如果能被忽略,可将其设置为0。
在执行的步骤S23~S27之后,把频率分量f1(T)~f5(T)转换成一个相当于区域数据F′(T)的八度音阶(步骤S28)。可以把区域数据F′(T)表示为F′(T)=f1(T)×5+f2(T)×4+f3(T)×3+f4(T)×2+f5(T)......(2)即,在已经单独地对频率分量f1(T)~f5(T)加权之后,将它们相加在一起。则区域数据F′(T)包含每一声音分量。
在执行了步骤S28之后,区域数据F′(T)中的每一声音分量中的强度级较高,因此,把6个音调选择为候选对象(步骤S29),并且从这6个声音候选对象创建两个和弦M1和M2(步骤S30)。使用6个用作和弦的根音的候选对象音调中的一个候选对象音调,创建由3个音调组成的和弦。即可以考虑6C3个不同组合的和弦。添加构成每一和弦的3个音调的水平,因这一添加使其值成为最大的那一和弦为第一和弦候选对象M1。因这一添加使其值成为次大的那一和弦为第二和弦候选对象M2。
构成这些和弦的音调不局限于3个。如在七度音程或减七音度的情况下,4个音调也是可行的。可以把由4个音调组成的和弦分类成两或两个以上的由3个音调组成的和弦,如图5中所示。因此,正如由4个音调构成的和弦可以为由3个音调组成的和弦,也可以根据区域数据F′(T)的每一个声音分量的强度级设置两个和弦候选对象。
在执行步骤S30之后,判断是否存在步骤S30中所设置的和弦候选对象的个数(步骤S31)。由于在步骤S30中通过仅选择至少3个音调所提交的强度级中不存在差别时不设置和弦候选对象,所以要进行步骤S31的这一判断。在和弦候选对象的个数>0时,还判断和弦候选对象的个数是否大于1(步骤S32)。
当在步骤S31中断定和弦候选对象的个数=0时,把在T-1(在大约在0.2秒之前)主处理过程中所设置的和弦候选对象M1和M2设置成当前和弦候选对象M1和M2(步骤S33)。当在步骤S32中判定和弦候选对象的个数=1时,在步骤S30的当前执行过程中,仅设置第一和弦候选对象M1。因此,第二和弦候选对象M2设置为与第一和弦候选对象M1相同的和弦(步骤S34)。
当在步骤S32中断定和弦候选对象的个数>1时,在步骤S30的当前执行过程中既设置第一和弦候选对象M1,也设置第二和弦候选对象M2,然后分别把时间以及第一和第二和弦候选对象M1和M2存储在和弦进行模式抽取部分2中的存储器(未在图中加以显示)中(步骤S35)。分别把时间以及第一和第二和弦候选对象M1和M2存储在存储器中作为一组信息。时间体现为执行主处理过程的次数,将其表示为T,每隔0.2秒增大。按T的次序分别存储第一和第二和弦候选对象M1和M2。
更具体地讲,可以通过一个字节,可以使用基本音调和属性的一个组合,以把和弦候选对象中的每一个和弦候选对象存储于存储器中,如图6中所示。把一个等程音阶的12个音调用作基本音调,可以把大调{4,3}、小调{3,4}、七度音程候选对象{4,6}以及减七音度(dim7)候选对象{3,3}用作属性。{ }中的数字表示当半音调为1时,这三个音调中的差异。最初,七度音程候选对象为{4,3,3},减七音度(dim7)候选对象为{3,3,3}。然而,如以上所描述的,将这显示为使用3个音调的表示。
通过16个比特(十六进制形式)提交12个基本音调,如图7A中所示,并且通过16个比特(十六进制)提交属性和弦类型,如图7B中所示。按如此顺序链接基本音调的低4个比特和属性的低4个比持,并且将它们用作8个比持(1个字节)的和弦候选对象,如图7C中所示。
当执行了步骤S33或S34时,接着马上执行步骤S35。
在执行了步骤S35之后,判断是否已结束了乐曲(步骤S36)。例如,当没有输入一个模拟音频输入信号时,或在操作输入表明来自操作输入设备4的乐曲结束的情况下,断定乐曲已经结束。
把值1添加于变量T,直至断定乐曲已经结束(步骤S37),并且再次执行步骤S21。如以上所提到的,按0.2秒的间隔执行步骤S21,并在距上一次执行的时间已逝去0.2秒时,再次执行步骤S21。
如图8中所示,在断定乐曲已经结束之后,作为M1(0)~M1(R)和M2(0)~M2(R),把所有的第一和第二和弦候选对象从存储器中读出。0为开始时间,因此,在开始时第一和第二和弦候选对象分别为M1(0)和M2(0)。R为结束时间,因此,在结束时,第一和第二和弦候选对象分别为M1(R)和M2(R)。然后,对如此读出的第一和弦候选对象M1(0)~M1(R)和第二和弦候选对象M2(0)~M2(R)进行平滑处理(步骤S42)。进行平滑处理是为了去除因包含在和弦候选对象中的噪音所造成的任何错误,噪音的产生是因为在不管和弦变化时间的情况下,按0.2秒的间隔对和弦候选对象进行检测所致。对于这一具体的平滑方法而言,将判断3个连续的第一和弦候选对象M1(t-1)、M1(t)以及M1(t+1)是否满足关系M1(t-1)≠M1(t)和M1(t)≠M1(t+1)。在满足这些关系的情况下,使M1(t)等于M1(t+1)。针对第一和弦候选对象中的每一第一和弦候选对象进行这一判断。使用相同的方法,对第二和弦候选对象进行平滑处理。另外,也可以使M1(t+1)等于M1(t),而不是使M1(t)等于M1(t+1)。
在进行了平滑处理之后,处理过程转向对第一和第二和弦候选对象进行转换(步骤S43)。通常情况下,在一个短间隔中,例如在0.6秒内,和弦变化的可能性很低。然而,有些时候,由于因信号输入阶段频率特性和信号输入期间的噪音导致的区域数据F′(T)中每一声音分量的频率中的波动,在0.6秒内会发生第一和第二和弦候选对象的转换。执行步骤S43是为了对这一转换进行计数。对于转换第一和第二和弦候选对象的这一具体的方法而言,将针对5个连续的第一和弦候选对象M1(t-2)、M1(t-1)、M1(t)、M1(t+1)以及M1(t+2)和5个相应于这些第一和弦候选对象的连续的第二和弦候选对象M2(t-2)、M2(t-1)、M2(t)、M2(t+1)以及M2(t+2),进行判断(如以下所描述的)。即,判断是否满足关系M1(t-2)=M1(t+2)、M2(t-2)=M2(t+1)、M1(t-1)=M1(t)=M1(t+1)=M2(t-2)以及M2(t-1)=M2(t)=M2(t+1)=M1(t-2)。当满足这些关系时,M1(t-1)=M1(t)=M1(t+1)=M2(t-2)以及M2(t-1)=M2(t)=M2(t+1)=M1(t-2)成立,从而实现了M1(t-2)和M2(t-2)之间的和弦转换。另外,可以取代M1(t-2)和M2(t-2)之间的和弦转换,进行M1(t+2)和M2(t+2)之间的和弦转换。也将判断是否满足关系M1(t-2)=M1(t+2)、M2(t-2)=M2(t+1)、M1(t-1)=M1(t)=M1(t+1)=M2(t-2)以及M2(t-1)=M2(t)=M2(t+1)=M1(t-2)。如果满足这些关系,则M1(t-1)=M1(t)=M1(t-2)以及M2(t-1)=M2(t)=M2(t-2)成立,并执行M1(t-2)和M2(t-2)之间的和弦转换,而且可替换M1(t-2)和M2(t-2)之间的和弦转换而在M1(t+1)和M2(t+1)之间执行和弦转换。
当在步骤S41读取的第一和弦候选对象M1(0)~M1(R)和第二和弦候选对象M2(0)~M2(R)的和弦中的每一个和弦随时间的流逝而变化时,如图9中所示,例如,通过步骤S42所进行的平均处理,对和弦进行校正,如图10中所示。另外,还通过执行步骤S43的和弦转换,对第一和第二和弦候选对象的和弦变化进行校正,如图11中所示。图9~11按直线图描述了和弦随时间的变化,其中,把相应于和弦类型的位置描绘在纵轴上。
时间t处的和弦M1(t)被检测,其中时间t为经历步骤S43的和弦变换的第一和弦候选对象M1(0)~M1(R)中的一和弦被检测的时间(步骤S44);如此检测的第一和弦候选对象的和弦变化的总次数M和构成与变化时间t的差的连续的和弦时间(4个字节)以及和弦(4个字节)被输出(步骤S45)。一个相当于步骤S45中所输出的数据的乐曲,为和弦进行模式数据。
在步骤S43的和弦转换之后,在第一和弦候选对象M1(0)~M(R)和第二和弦候选对象M2(0)~M2(R)的和弦随时间的流逝而变化的情况下,如图12A中所示,抽取变化时间的时间与和弦作为数据。图12B表示了第一和弦候选对象中变化时的数据内容,F、G、D、降B以及F为和弦,按十六进制数据,由0X08、0X0A、0X05、0X01以及0X08对它们加以表示。变化的时间t的时间为T1(0)、T1(1)、T1(2)、T1(3)以及T1(4)。另外,图12C表示了第二和弦候选对象中变化时间的数据内容,C、降B、F#m、降B以及C为和弦,按十六进制数据,将它们表示为0X03、0X01、0X29、0X01以及0X03。变化的时间t的时间为T2(0)、T2(1)、T2(2)、T2(3)以及T2(4)。步骤S45中,把图12B和12C中所示的数据内容连同乐曲标识信息一起,按图12D中所示的格式加以输出作为和弦进行模式数据。所输出的和弦进行模式数据的连续的和弦时间为T(0)=T1(1)-T1(0)和T1(1)=T1(2)-T1(1)等。
把连续的时间添加到其根音为步骤S4中所抽取的和弦进行模式数据的12个音调的大调、小调以及减半音的(diminished)和弦A~G#,通过轨一化最大值来计算直方图值以使其为100(步骤S5)。
可以通过下列方程(3)和(4),计算直方图值。
h′(i+k×12)=∑T′(j)...(3)h(i+k×12)=h′(i+k×12)×100/max(h′(i+k×12))...(4)在方程(3)和(4)中,i相应于和弦A~G#的根音,因此,按如此次序,分别为i=0~11。k分别相应于一个大调(k=0)、小调(k=1)以及减半音的(k=2)和弦。J为和弦的次序,针对j=0~M-1,执行∑计算。方程(3)中的h′(i+k×12)是实际连续和弦时间T′(j)的总时间,为h′(0)~h′(35)。方程(4)中的h(i+k×12)为直方图值,并被获得作为h(0)~h(35)。当和弦进行模式数据的第j个和弦的根音为i时,连续和弦时间T(j)为T′(j),而且属性为k。例如,如果第0个和弦为大调C和弦,由于i=3和k=0,所以把第0个连续和弦时间T(0)添加到h′(3)。即把连续和弦时间T(j)作为T′(j)添加到每一具有相同根音与属性的和弦,从而结果为h′(i+k×12)。max(h′(i+k×12))为h′(i+k×12),即为h′(0)~h′(35)之中的最大值。
图13A和13B描述了计算用于每一首乐曲的和弦的大调(A~G#)、小调(A~G#)以及减半音的(A~G#)和弦的直方图值的结果。图13A中的情况描述了一个其中和弦出现在一个宽音域上的乐曲以及一个变化丰富的旋律,在这些变化中,以极小的分散度(scatter)使用了多种和弦。图13B中的情况描述了一首乐曲,其中以宽分散度重复了显著指定的和弦音型和少量的和弦,具有一个以极小和弦变化的均匀(straight)的旋律。
在按这一方式计算了直方图值之后,计算和弦直方图偏差(步骤S6)。当计算一直方图偏差时,首先,根据方程(5)计算直方图值h(0)~h(35)的一个平均值X。
X=(∑h(i))/36 ...(5)在方程(5)中,i位于0和35之间。即,∑h(i)=h(0)+h(1)+h(2)+...+h(35)...(6)根据方程(7),计算直方图值X的偏差σ,此处,i也位于0和35之间。
σ=(∑h(i)-X)2)1/2/36 ...(7)还计算和弦变化率R(步骤S7)。
通过方程(8)计算和弦变化率R。
R=M×60×Δt/(∑T(j)) ...(8)在方程(8)中,M为和弦变化的总次数,Δt为在1秒钟的间隔上检测一个和弦的次数,并针对j=0~M-1,执行∑T(j)的计算。
把从音乐信息输入设备1所获得的乐曲标识信息、在步骤S4中所抽取的和弦进行模式数据、在步骤S6中所计算的和弦直方图偏差σ、以及在步骤S7中所计算的和弦变化率R,保存在和弦特征量存储设备4中作为和弦进行变化特征量(步骤S8)。保存变化特征量时所进行的格式,如图14中所示。
在执行了步骤S8之后,把1添加到计数器值N中(步骤S9),然后判断计数器值N是否已达到将加以处理的乐曲数量Q(步骤S10)。如果N<Q, 则重复以上的步骤S1~S10的操作。另一方面,因为,如果N=Q,用于将加以处理的整个乐曲的数量的和弦进行变化特征量的保存已结束,所以把标识符ID(i)添加到这一乐曲数量Q的每一首乐曲的乐曲标识信息中(步骤S11)。
接下来,将描述相对和弦进行频率处理器6所执行的相对和弦进行频率计算。在相对和弦进行频率计算中,计算保存于和弦特征量存储设备4中的和弦进行模式数据中所包含的一个和弦进行部分的至少变化两次的频率,并且检测包含在将加以分类的一组乐曲中的特征和弦进行模式组。
而且,和弦进行为一个绝对和弦序列,把一个相对和弦进行表示为构成和弦进行的每一和弦之间的频率差(根音差分;当其为负时,加12)与改变的大调与小调和弦的属性等的一个阵列。通过使用相对和弦进行,可以吸收调性偏移,甚至是在编排、速度等不同时,也能够很容易地计算旋律相似性。
另外,尽管针对和弦进行部分所选择的和弦变化的次数是可选的,但大约3次是合适的。因此,将描述对具有3次变化的和弦进行的使用。
在相对和弦进行频率计算中,最初把频率计数器值C(i)设置为0(步骤S51),如图15中所示。在步骤S51中,i=0~21295,因此,进行这样的设置使C(0)~C(21295)=0。最初,也把计数器值N设置为0(步骤S52),并最初把计数器值A也设置成0(步骤S53)。
计算乐曲标识信息ID(N)所指定的第N首乐曲的相对和弦进行数据HP(k)(步骤S54)。相对和弦进行数据HP(k)的k为0~M-2。将相对和弦进行数据HP(k)写为[频率差分值,迁移目的地属性],并且是代表一个和弦变化时的频率差分值和迁移目的地属性的列数据。根据第N首乐曲的和弦进行模式数据,得到频率差分值和迁移目的地属性。假设随时间的流逝,和弦进行模式数据的和弦变化为Am7,然后为Dm、C、F、Em、F以及降B调7,如图16中所示,例如,十六进制数据为0X30、0X25、0X03、0X08、0X27、0X08、0X11,...,于是,频率差分值为5、10、5、11、1、5、...,迁移目的地属性为0X02、0X00、0X00、0X02、0X00、0X00、...。另外,当在迁移目的地处半音调为1以及根音(基础音调)的值比在迁移之前更负,则通过把12添加到迁移目的地以使迁移目的地比在迁移之前更正,来寻找频率差分值。而且,忽略七度音程和减半度的音程作为和弦属性,。
在执行了步骤S54之后,把变量i最始设置为0(步骤S55),然后判断相对和弦进行数据HP(A)、HP(A+1)以及HP(A+2)是否分别与相对和弦进行模式P(i,0)、P(i,1)以及P(i,2)相匹配(步骤S56)。按照相对和弦进行数据,将相对和弦进行模式写为[频率差分值,迁移目的地属性]。作为相对和弦进行模式,通过大调与小调和弦构造和弦进行,这意味着,在3次和弦变化的情况下,存在2×22×22×22=21296个模式。即,如图17中所示,在第一和弦变化中,存在22个模式,包括一个向上朝大调和弦迁移的一个1音调、一个向上朝大调和弦迁移的一个2音调、...一个向上朝大调和弦迁移的一个11音调、一个向上朝小调和弦迁移的一个1音调、一个向上朝小调和弦迁移的一个2音调、...一个向上朝小调和弦迁移的一个11音调。还存在着相继的第二和第三和弦变化中的22个模式。相对和弦进行模式P(i,0)为第一和弦变化、相对和弦进行模式P(i,1)为第二和弦变化、以及相对和弦进行模式P(i,2)为第三和弦变化,把这些模式预先以数据表的形式提供至相对和弦进行频率处理器6的存储器(未在图中加以显示)中。
在HP(A)、HP(A+1)、HP(A+2)与P(i,0)、P(i,1)、P(i,2)分别相匹配的情况下,即当HP(A)=P(i,0)、HP(A+1)=P(i,1)以及HP(A+2)=P(i,2)时,把1添加到计数器值C(i)中(步骤S57)。接下来,判断变量i是否已达到21296(步骤S58)。如果i<21296,则把1添加于i(步骤S59),并且再次执行步骤S56。如果i=21296,则把1添加于计数器值A(步骤S60),并且判断计数器值A是否已达到M-4(步骤S61)。当HP(A)、HP(A+1)、HP(A+2)与P(i,0)、P(i,1)、P(i,2)不分别相匹配时,则跳过步骤S57,并且立即执行步骤S58。
当步骤S61的判断结果为A<M-4时,处理过程返回到步骤S55,并且重复以上的匹配判断。在A=M-4的情况下,把1添加于计数器值N(步骤S62),并且判断N是否已达到乐曲数量Q(步骤S63)。如果N<Q,处理过程返回到步骤S53,并且针对另一个乐曲进行先前的相对和弦进行频率计算。如果N=Q,则相对和弦进行频率计算结束。
作为相对和弦进行频率计算的结果,得到了包含在乐曲数量Q的一个乐曲组中的含有3次变化的21296个模式的和弦进行部分(P(i,0),P(i,1),P(i,2)i=0~21295)的频率作为计数器值C(0)~C(21295)。
通过一个依赖于x(n,i)的值,提交和弦进行特征向量创建部分7所创建的和弦进行特征向量,将加以分类的乐曲中的每一首乐曲为多维向量,这些多维向量代表了包含由C(i)、P(i,0)、P(i,1)、P(i,2)所表示的特征和弦进行模式组的测量结果。x(n,i)中的n为0~Q-1,并且表示乐曲的数量。
如图18中所示,在和弦进行特征向量创建部分7所进行的和弦进行特征向量的创建过程中,首先,从计数器值C0~C(21295)所指示的频率的最大值开始,依次抽取W计数器C(i)的各个i值(步骤S71)。即,得到TB(j)=TB(0)~TB(W-1),它们代表了i值。具有由TB(0)所指示的i值的计数器值C(TB(0))所指示的频率为最大值。具有TB(W-1)所表示的i的值的计数器值C(TB(W-1))所指示的频率为第W个计数器值的一个大的值。例如,W为80~100。
在执行了步骤S71之后,相应于将加以分类的每一首乐曲的和弦进行特征向量x(n,i)的值被清除。此处,n为0~Q-1,i为0~W+1。即,x(0,0)~x(0,W+1),...x(Q-1,0)~x(Q-1,W+1),以及x′(0,0)~x′(0,W+1),...,x′(Q-1,0)~x′(Q-1,W+1)均为0。另外,按照相对和弦进行频率计算的步骤S52~S54,把计数器值N初始设置为0(步骤S73),并且把计数器值A也初始设置为0(步骤S74)。然后,计算第N个乐曲的相对和弦进行数据HP(k)(步骤S75)。相对和弦进行数据HP(k)的k在0和M-2之间。
在执行了步骤S75之后,把计数器值B初始设置为0(步骤S76),并判断相对和弦进行数据HP(B)、HP(B+1)、HP(B+2)与相对和弦进行模式P(TB(A),0)、P(TB(A),1)、P(TB(A),2)之间是否分别相匹配(步骤S77)。按照相对和弦进行频率计算的步骤S55和S56,执行步骤S76和S77。
当相对和弦进行数据HP(B)、HP(B+1)、HP(B+2)与相对和弦进行模式P(TB(A),0)、P(TB(A),1)、P(TB(A),2)之间分别相匹配时,即,当HP(B)=P(TB(A),0)、HP(B+1)=P(TB(A),1)以及HP(B+2)=P(TA(A),2)时,将1加至向量值X(N,(TB(A))(步骤S78)。然后,把1添加于计数器值B(步骤S79),并且判断计数器值B是否已达到M-4(步骤S80)。当相对和弦进行数据HP(B)、HP(B+1)、HP(B+2)与相对和弦进行模式P(TB(A),0)、P(TB(A),1)、P(TB(A),2)之间不分别相匹配时,则跳过步骤S78,并且立即执行步骤S79。
在步骤S80的判断结果为B<M-4的情况下,处理过程返回到步骤S77,并且重复匹配判断操作。当B=M-4时,把1添加于计数器值A(步骤S81),并且判断A是否已达到一个预先确定的值W(步骤S82),如果A<W,则处理过程返回到步骤S76,并且在具有次大频率的相对和弦进行模式上执行步骤S77的匹配判断的值。如果A=W,则把第N首乐曲的直方图偏差σ被指定为向量值x(N,W)(步骤S83),并且把第N首乐曲的和弦变化率R被指定为向量值x(N,W+1)(步骤S84)。
执行了步骤S84之后,使用频率调整加权系数G(i)=G(0)~G(W-1)对和弦进行特征向量x(N,0)~x(N,W+1)进行加权,且生成校正过的和弦进行特征向量x′(N,0)~x′(N,W+1)(步骤S85)。总体上讲,追随西方音乐潮流的音乐包含较大量的乐章(以下将其称为`基本和弦进行′),其中,除了用于标识作为本发明核心的音乐旋律的和弦进行外,还组合了主音、属音以及次属音。为了防止这一基本和弦进行的频率的支配,还将进行频率调整。频率调整加权系数G(i)为G(i)=(0.5/m)bi+0.5,并且对于i=0~m-1,为一个小于1的值,如图19中所示,以及对于i=m~w-1,为1。即,通过相对具有极高频率的较高的m-1模式执行步骤S85,对频率进行调整。被认为是基本和弦进行的模式的个数m为10~20个的量级是合适的。
把1添加于计数器值N(步骤S86),并且判断N是否已经达到乐曲Q(步骤S87)。如果N<Q,则处理过程返回到S72,并且对另一个乐曲执行和弦进行特征向量创建过程。如果N=Q,则结束和弦进行特征向量创建过程。
因此,如图20中所示,当完成了和弦进行特征向量创建过程时,创建了和弦进行特征向量x(0,0)~x(0,W+1),px(Q-1,0)~x(Q-1,W+1)以及x′(0,0)~x′(0,W+1),...,x′(Q-1,0)~x′(Q-1,W+1)。另外,向量x(N,W)和x(N,W+1)以及x′(N,W)和x′(N,W+1)分别是相同的。
接下来,乐曲群创建部分8所执行的乐曲处理过程和分类结果显示过程,使用由和弦进行特征向量创建过程所生成的和弦进行特征向量组,形成一个其间具有短距离的向量群。除非预先固定最终分类结果的个数,则可以使用任何群集方法。例如,可以使用自组织映象或类似的方法。自组织映象把多维数据组转换为一个具有类似特征的一维低阶群。另外,当使用Terashima等人的`Teacherless clusteringclassification using data density histogram on self-organized characteristicmap IEEE Communications,Magazine D-II,第J79-D-11卷,第7号,1996′时,自组织映象作为一种有效检测分类群的最终个数的方法,是高效的。在这一实施例中,使用自组织映象进行群集。
如图21中所示,在音乐分类处理过程和分类结果显示处理过程中,把计数器值A初始设置为0(步骤S91),并且在Q个目标乐曲的和弦进行特征向量组x′(n,i)=x′(0,0)~x′(0,W+1),...,x′(Q-1,0)~x′(Q-1,W+1)上使用自组织映像,检测分类群(步骤S92)。在自组织映象中,使用随机值,对作为输入数据x′(n,i)的具有相同维度数的K个神经元m(n,j,t)进行初始化,这些K个神经元中输入数据x′(n,i)的距离为最小的一个神经元m(n,j,t)被发现,并且这些接近m(i,j,t)(的一预先确定的半径内)的神经元的重要性可被改变。即,通过方程(9)提交神经元m(i,j,t)。
m(i,j,t+1)=m(i,j,t)+hc(t)[x′(n,i)-m(i,j,t)] ...(9)在方程(9)中,t=0~T,n=0~Q-1,i=0~k-1,以及j=0~w+1。hc(t)为一个时间衰减系数,因此接近大小和变化的程度随时间减小。T为学习时间的次数,Q为乐曲的总个数,以及k为神经元的总个数。
执行了步骤S92之后,把1添加于计数器值A(步骤S93),并且判断计数器值A,即学习时间的次数A是否已达到学习时间的一个预先确定的次数G(步骤S94)。如果A<G,则在步骤S92中,寻找在K个神经元中输入数据x′(n,i)的距离为最小的神经元m(i,j,t),并且重复改变为接近m(i,j,t)的神经元的重要性的操作。如果A=G,则作为步骤S92的计算操作的一个结果所得到的分类的个数为U(步骤S95)。
接下来,按表示群中的核心特性的对神经元m(i,j,T)的接近程度的次序,交换相应于属于如此获得的U个群的乐曲标识信息ID(i)的x(n,i),并将其作为新的乐曲标识信息FID(i)加以保存(步骤S96)。然后,把属于U个群的乐曲标识信息FID(i)保存在分类群存储设备9中(步骤S97)。另外,把各群位置关系、一个相应于属于这些群的乐曲的个数的选择屏幕、以及选择屏幕数据输出到音乐群单元显示设备(步骤S98)。
图22描述了群显示的一个实例,其中,由音乐群单元显示设备10显示自组织映象的分类结果。在图22中,通过一个帧提交群A~I,其中,每一个帧的高度代表属于每一个群的乐曲的容量。每一个帧的高度没有绝对的含义,只要可以相对地标识出属于每一个群的乐曲的个数的差即可。在关注每一个群的位置关系的地方,邻接的群表示具有接近的旋律的乐曲组。
图23描述了群显示的一个实际的界面图像。另外,尽管图23把这一实施例的自组织映象示为一维的,但二维的自组织映象也是人们普遍熟悉的。
在通过二维自组织映象实现本发明的分类处理过程的情况下,使用图24中所示的界面图像是可行的。图23中的每一个星系代表一个群,图24中的每一个行星也代表一个群。已经成为帧的部分为所选择的群。另外,在图23和24中显示图像的右手侧,显示了包含在所选择的群中的一个乐曲列表和包括操作按钮的回放/终止装置。
作为以上相应处理过程的一个结果,针对所有将加以分类的乐曲,完成了使用和弦进行特征向量的自动分类处理过程,并且完成了允许可选群被选择的显示。
音乐群单元显示设备10和弦乐群单元选择设备11执行用于对已分类的音乐群的行选择与回放处理过程。
如图25中所示,在乐曲选择与回放的处理过程中,判断是否已执行了对已分类的音乐群(例如图22中所示的群A~I)中的一个群的选择(步骤S101)。当确定已经选择了一个群时,则判断乐曲声音回放是否当前正在进行之中(步骤S102)。当已确定乐曲声音回放正在进行中,则停止回放(步骤S103)。
在乐曲声音回放未处于进行之中的情况下,或者当在步骤S103中停止了回放时,则从乐曲群存储设备8抽取属于一个所选群的乐曲标识信息,然后把所抽取的信息保存在FID(i)=FID(0)~FID(FQ-1)中(步骤S104)。FQ为属于以上所述的一个群的乐曲标识信息,即,乐曲数量。按从FID(i)的开始处开始的顺序,把乐曲标识信息输出到乐曲列表显示设备14(步骤S105)。乐曲列表显示设备14显示包含在相应于这一所选择的群的乐曲标识信息中的每一首乐曲的名字,以使可通过一个界面图像,例如图26中所示的界面图像,获知这些名字。
模型乐曲抽取部分12自动地选择相应于FID(i)开始处的FID(0)的乐曲,然后从乐曲存储设备5中读出相应于FID(0)的乐曲声音数据,并且将其提供至音乐回放设备16。根据音乐回放设备16所提供的乐曲声音数据,回放乐曲声音(步骤S106)。
另外,根据FID(i)把多首乐曲显示在乐曲列表显示设备14上,而不是回放相应于FID(0)的乐曲声音。在经由乐曲列表选择设备15从多首乐曲中选择一个乐曲的情况下,从乐曲存储设备5中读出相应于这一乐曲的乐曲声音数据,然后将其提供至音乐回放设备16。接下来,音乐回放设备16可以回放和输出这一乐曲的乐曲声音。
图27描述了本发明的另一个实施例的自动乐曲分类设备。图27中所示的自动乐曲分类设备除包括图1中所示的自动乐曲分类设备中的装置(部件)1~16外,还包括一个传统乐曲选择设备17、一个收听历史存储设备18、一个目标乐曲选择部分19以及一个重新分类音乐群单元选择设备20。
图27中所示的自动乐曲分类设备相应于这样一种情况不仅对作为乐曲声音数据已保存在乐曲存储设备5中的所有乐曲进行分类,而且还对那些受到预先确定的条件的限制的乐曲进行分类。
传统乐曲选择设备17是一种来自现有技术的典型的设备,用于使用能够指定一个乐曲的诸如歌曲标题、歌手的名字以及流派的乐曲标识信息,选择保存在乐曲存储设备5中的乐曲。然后,音乐回放设备16回放如此选择的乐曲。
收听历史存储设备18是一种用于存储已经由音乐回放设备16回放了一次或多次的乐曲的乐曲标识信息的设备。
重新分类音乐群单元选择设备20是一种用于通过使用音乐群单元显示设备10所显示的音乐分类结果,选择所希望的分类结果的设备。
目标乐曲选择部分19是这样的一种设备把所有保存在乐曲存储设备5中的乐曲标识信息或者相应于传统乐曲选择设备17和重新分类音乐群单元选择设备20为分类目标乐曲所选择的乐曲标识信息的和弦进行变化特征量,提供至相对和弦进行频率处理器6和和弦进行特征向量创建部分7。
首先,在直至根据旋律进行分类的那一时刻之前仅有某些与用户已收听的相对偏好相匹配的乐曲的情况下,从收听历史存储设备18中读取乐曲标识信息,并且把历史中的乐曲的总个数指定为乐曲数量Q,把相应于这一历史中的乐曲的总个数的乐曲标识信息指定为ID(i)=ID(0)~ID(Q-1)(步骤S111),于是,按以上所提出的相对和弦进行频率计算、和弦进行特征向量创建处理过程、音乐分类处理过程与分类结果显示处理过程、以及音乐群选择与回放处理过程这样的次序,执行这些计算与处理过程(步骤S112),如图28中所示。
接下来,通过使用在直至那一时刻之前与用户已收听的相对偏好相匹配的多首乐曲,根据旋律对保存在乐曲存储设备5的多首乐曲进行分类的情况下,如先前的步骤S111,从收听历史存储设备18中读取乐曲标识信息,并且把历史中的乐曲的总个数赋予乐曲数量Q,把相应于这一历史中的乐曲的总个数的乐曲标识信息指定为ID(i)=ID(0)~ID(Q-1)(步骤S121),然后根据执行步骤S121的结果,进行相对和弦进行频率计算(步骤S122),如图29中所示。此后,从和弦特征量存储设备4读出乐曲标识信息,把所存储的乐曲的总个数指定为乐曲数量Q,把相应于乐曲的总个数的乐曲标识信息指定为ID(i)=ID(0)~ID(Q-1)(步骤S123)。按和弦进行特征向量创建处理过程、音乐分类处理过程与分类结果显示处理过程、以及音乐群选择与回放处理过程这样的次序,执行这些处理过程(步骤S114)。
另外,当使用指定的一组乐曲或指定的一组属于根据歌手的名字、流派等所选择的指定的一个群的乐曲时,仅根据旋律对这一组乐曲进行分类,把来自传统乐曲选择设备17或重新分类音乐群选择设备20的可选乐曲的总个数指定为相对和弦进行频率计算的Q,把乐曲标识信息组赋予ID(i)(步骤S131)。接下来,按相对和弦进行频率计算、和弦进行特征向量创建处理过程、音乐分类处理过程与分类结果显示处理过程、以及音乐群选择与回放处理过程这样的次序,执行这些计算和处理过程(步骤S132),如图30中所示。
另外,当使用根据歌手的名字、流派等所选择的指定的多首乐曲或属于某一指定的群的指定的一组乐曲,根据旋律对乐曲存储设备5的所有乐曲组进行分类时,在执行相对和弦进行频率计算之前(步骤S142),把来自传统乐曲选择设备17或重新分类音乐群单元选择设备20的可选乐曲的总个数指定为相对和弦进行频率计算的Q,并且把一个乐曲标识信息组指定为ID(i)(步骤S141),如图31中所示。此后,把保存在和弦信息量存储设备4中的乐曲标识信息项的总个数指定为和弦进行特征向量创建处理过程中的Q,把乐曲标识信息组指定为ID(i)(步骤S143)。接下来,按和弦进行特征向量创建处理过程、音乐分类处理过程与分类结果显示处理过程、以及音乐群选择与回放处理过程这样的次序,执行这些处理过程(步骤S144)。
本发明包括和弦进行数据存储装置,用于存储表示多首乐曲的一个和弦进行序列的和弦进行模式数据;特征量抽取装置,用于根据和弦进行模式数据,抽取用于多首乐曲中每一首乐曲的一个和弦进行变化特征量;以及群创建装置,用于根据该多首乐曲中每一首乐曲的和弦进行模式数据所表示的和弦进行序列以及根据和弦进行变化特征量,对该多首乐曲进行分组。因此,作为乐曲分类的一个准则,可以把旋律中的变化,即一个和弦进行,用于实现对乐曲的自动分类,其中和弦进行是表示音乐的所谓调性的一个重要的特征量。因此,可以达到下列效果。
(1)可以容易地对具有相似旋律的乐曲进行选择,而无需包含参考信息,例如歌曲标题或流派,而且不用通过静态定义的语言,例如`振奋′,限制音乐的收听者的图像,从而能够收听与感性相符的音乐。
(2)在相邻位置为显示且同时属于不同乐曲群的群,由比其它群的旋律更相似的旋律构成。因此,尽管作为这样的选择的结果,音乐的收听者的图像多少有些不同,但却可以很容易地选择具有相似旋律的乐曲。
(3)因此,不管旋律的存在和速度的差别与否,引用诸如旋律中的乐章的显著的音乐特征,而不是诸如调性和音区、编排等所有特征,从而能够对众多类型的乐曲进行分类和选择。
(4)可以根据作曲者的独特的风格、流派特定的旋律、以及每一时期流行的旋律对乐曲进行分类。当不能使用语言表达音乐时,这一分类方法可被等同为对偏好和主题的抽取,从而能够创建新的欣赏音乐的方式。
(5)本发明还适用于受到特定条件限制的音乐,并且可以针对根据歌手的名字、流派等所选择的乐曲组和针对适合于习惯收听相关偏好的乐曲组,对较复杂的旋律进行分类。因此,一旦预先把最初不感兴趣的乐曲组从分类目标中排除,则可以提供一种能够满足个人偏好的欣赏音乐的方法。
权利要求
1.一种对多首乐曲进行自动分类的自动乐曲分类设备,包括一个和弦进行模式数据存储装置,存储表示用于多首乐曲中的每一首乐曲的和弦进行序列的和弦进行模式数据;一个特征量抽取装置,根据和弦进行模式数据,抽取用于该多首乐曲中的每一首乐曲的和弦进行变化特征量;以及一个群创建装置,根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列,及该和弦进行变化特征量,对该多首乐曲进行分组。
2.根据权利要求1所述的自动乐曲分类设备,其中,特征量抽取装置包括一个和弦直方图计算装置,计算根据用于该多首乐曲中的每一首乐曲的和弦进行模式数据而存在的每一和弦的总的连续时间作为直方图值;一个直方图偏差计算装置,根据用于该多首乐曲中的每一首乐曲的各和弦的直方图值,计算直方图偏差;一个和弦变化率计算装置,根据用于该多首乐曲中的每一首乐曲的和弦进行模式数据,计算和弦变化率;以及其中,该多首乐曲中的每一首乐曲的直方图偏差与和弦变化率为变化特征量。
3.根据权利要求1所述的自动乐曲分类设备,其中,群创建装置包括一个相对和弦进行频率计算装置,从包含在一个和弦进行序列中的所有至少两个连续和弦进行部分的最大频率开始,依次对预先确定数目的类型的和弦进行部分进行检测,其中,所述和弦进行序列由所有预先确定的乐曲的和弦进行模式数据加以表示;一个和弦进行特征向量计算装置,对由用于该多首乐曲中的每一首乐曲的和弦进行模式数据代表的和弦进行序列中的预定的多个类型的和弦变化部分的频率进行检测,并且把所检测的频率与和弦进行变化特征量作为和弦进行特征向量值加以保存;一个分类装置,通过对该多首乐曲中的每一首乐曲的和弦进行特征向量值执行自组织处理过程,把该多首乐曲分类为具有相似旋律的群。
4.根据权利要求3所述的自动乐曲分类设备,其中,相对和弦进行频率计算装置包括一个相对和弦进行数据生成装置,根据该多首乐曲中的每一首乐曲的和弦进行模式数据,生成代表在改变一首乐曲中的所有和弦之前和之后的根音差分值以及所改变的和弦的类型的相对和弦进行数据;一个参考相对和弦进行数据生成装置,生成代表从该至少两个连续的和弦进行部分所获取的所有和弦变化模式的参考相对和弦进行数据;以及一个比较装置,检测由相对和弦进行数据生成装置所生成的相对和弦进行数据中该所有至少两个连续的和弦进行部分和代表所有关和弦变化模式的参考相对和弦进行数据之间的匹配,并且对至少两个连续的音进行部分的所有部分的频率进行计算。
5.根据权利要求3所述的自动乐曲分类设备,其中,和弦进行特征向量计算装置包括一个相对和弦进行数据生成装置,根据该多首乐曲中的每一首乐曲的和弦进行模式数据,生成表示在改变一个和弦之前和之后的根音差分值以及所改变的和弦的类型的相对和弦进行数据;一个参考相对和弦进行数据生成装置,生成代表该预先确定数目的类型的每一和弦变化部分的参考相对和弦进行数据;以及一个比较装置,检测由相对和弦进行数据生成装置所生成的相对和弦进行数据中所有该至少两个连续的和弦进行部分与代表该预先确定数目的类型的每一和弦变化部分的参考相对和弦进行数据之间的匹配,并且对该预先确定数目的类型的每一和弦变化部分的该多首乐曲中的每一首乐曲的频率进行计算。
6.根据权利要求5所述的自动乐曲分类设备,其中,和弦进行特征向量计算装置还包括一个加权装置,通过把比较装置所获取的预先确定数目的类型的每一和弦变化部分的该多首乐曲中的每一首乐曲的频率乘以一个加权系数,计算该多首乐曲中的每一首乐曲的最终频率。
7.根据权利要求2所述的自动乐曲分类设备,包括一个群显示装置,显示由分类装置所分类的多个群;一个选择装置,根据一个操作,选择由群显示装置所显示的多个群中的任何一个群;一个乐曲列表显示装置,显示属于某一个群的乐曲的一个列表;一个回放装置,有选择地回放属于某一个群的每一首乐曲的乐曲声音;
8.根据权利要求7所述的自动乐曲分类设备,其中回放装置包括一个乐曲存储装置,存储代表该多首乐曲的声音的乐曲声音数据。
9.根据权利要求7所述的自动乐曲分类设备,其中回放装置回放属于某一群的乐曲中的一个模型乐曲的声音。
10.根据权利要求1所述的自动乐曲分类设备,其中和弦进行数据存储装置存储与用于标识该多首乐曲中的每一首乐曲的乐曲标识信息相关联的和弦进行模式数据。
11.根据权利要求1所述的自动乐曲分类设备,还包括一个和弦进行数据创建装置,具有一个代表输入于其的该多首乐曲中的每一首乐曲的音频输入信号,从而创建和弦进行数据。
12.根据权利要求11所述的自动乐曲分类设备,其中和弦进行数据创建装置包括一个频率转换装置,按预先确定的间隔,把代表该多首乐曲中的每一首乐曲的一个音频输入信号转换成一个代表频率分量大小的频率信号;一个分量抽取装置,按预先确定的间隔,从频率转换装置所获取的频率信号中抽取相应于一个等程音阶的每一个音调的一个频率分量;一个和弦候选对象检测装置,作为第一和第二和弦候选对象检测装置,检测两个和弦,每个和弦均为由在相应于分量抽取装置所抽取的每一音调的频率分量中具有一个总体较大级别的3个频率分量所形成;以及一个平滑处理装置,通过反复对由和弦候选对象检测装置所检测的一行相应的第一和第二和弦候选对象进行平滑处理,生成和弦进行模式数据。
13.根据权利要求3所述的自动乐曲分类设备,其中预先确定的乐曲为多首乐曲。
14.根据权利要求3所述的自动乐曲分类设备,其中预先确定的乐曲为具有一个收听历史的乐曲。
15.根据权利要求3所述的自动乐曲分类设备,其中预先确定的乐曲为根据一个操作所选择的乐曲。
16.一种对多首乐曲进行自动分类的自动乐曲分类方法,包括下列步骤存储表示用于该多首乐曲中的每一首乐曲的一个和弦进行序列的和弦进行模式数据;根据该和弦进行模式数据,抽取用于该多首乐曲中的每一首乐曲的和弦进行变化特征量;以及根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列以及和弦进行变化特征量,对该多首乐曲进行分组。
17.一种执行对多首乐曲进行自动分类的自动乐曲分类方法的计算机可读的程序,该方法包括下列步骤一个和弦进行模式数据存储步骤,存储表示用于该多首乐曲中的每一首乐曲的一个和弦进行序列的和弦进行模式数据;一个特征量抽取步骤,根据和弦进行模式数据,抽取用于该多首乐曲中的每一首乐曲的和弦进行变化特征量;以及一个群创建步骤,根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列及该和弦进行变化特征量,对该多首乐曲进行分组。
全文摘要
一种允许根据旋律相似性对多首乐曲自动分类的自动乐曲分类设备与方法。保存代表用于多首乐曲中的每一首乐曲的一个和弦进行序列的和弦进行模式数据,根据和弦进行模式数据,抽取用于该多首乐曲中的每一首乐曲的和弦进行变化特征量,以及根据该多首乐曲中的每一首乐曲的和弦进行模式数据所代表的和弦进行序列及和弦进行变化特征量,对该多首乐曲进行分组。
文档编号G10H1/38GK1619640SQ200410095250
公开日2005年5月25日 申请日期2004年11月22日 优先权日2003年11月21日
发明者莪山真一 申请人:先锋株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1