信息处理装置,信息处理方法以及程序的制作方法

文档序号:2829457阅读:341来源:国知局
专利名称:信息处理装置,信息处理方法以及程序的制作方法
技术领域
本发明涉及一种信息处理装置,信息处理方法以及程序,并且更具体地,涉及一种信息处理装置,信息处理方法以及程序,其中算术运算内容数据的特征量。
背景技术
按照常规已经提出了一种用于自动生成算法的装置,其接收音乐片段数据作为输入,并输出该音乐片段数据的特征量例如音乐片段数据的速度,亮度或活泼(liveliness)。例如,在美国公开的申请No.2004/0181401A1(下文中被称为专利文献1)中披露了一种这样的装置。

发明内容
在专利文献1中公开的装置中,生成了一种特征量提取算法,用于从如图1所示的音乐片段数据以及音乐片段数据的元数据中提取出特征量。这样,根据该音乐片段,根据该算法计算出的特征量就有可能具有很明显的误差。但是,很难对计算出的特征量的误差程度进行评估。
因此,希望提供一种方法,用于当使用生成的特征量提取算法来计算特征量时对预期的误差程度进行评估。
根据本发明的一个实施例,利用了一种算法,通过该算法可以从内容数据例如音乐片段数据中提取出相应的特征量,使得能够很准确地对根据该算法计算的特征量的误差进行评估。
更具体地,根据本发明的一个实施例,提供了一种信息处理装置,其中该信息处理装置算术运算内容数据的特征量,包括第一算术运算装置,用于使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量,第二算术运算装置,用于使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收由该第一算术运算装置算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,计算装置,用于计算由第二算术运算装置算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差,生成装置,用于通过学习其中由计算装置计算的误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差,以及算术运算控制装置,用于当要获得对应于该内容数据的高级特征量时,将由第一算术运算装置算术运算的低级特征量应用于由生成装置生成的误差评估表达式,以对相应的误差进行评估,并使得该第二算术运算装置响应于该评估误差而算术运算高级特征量。
该计算装置可以计算由第二算术运算装置算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差平方。
当要获得对应于该内容数据的高级特征量时,该控制装置将由第一算术运算装置算术运算的低级特征量应用于由生成装置生成的误差评估表达式,以对相应的误差进行评估,并使得该第二算术运算装置只在评估误差低于阈值时算术运算高级特征量。
根据本发明的另一个实施例,提供了一种用于信息处理装置的信息处理方法,其中该信息处理装置算术运算内容数据的特征量,包括如下步骤使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量,使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,计算算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差,通过学习其中该误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差,以及当要获得对应于该内容数据的高级特征量时,将该算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并响应于该评估误差而算术运算高级特征量。
根据本发明的另一个实施例,提供了一种程序,用于算术运算内容数据的特征量,该程序使得计算机执行一个过程,该过程包括如下步骤使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量,使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,计算算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差,通过学习其中该误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差,以及当要获得对应于该内容数据的高级特征量时,将该算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并响应于该评估误差而算术运算高级特征量。
在该信息处理装置和方法以及程序中,低级特征量提取表达式接收内容数据或对应于内容数据的元数据作为输入并输出低级特征量,并被用于算术运算该低级特征量。进一步,高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,并被用于算术运算该高级特征量。接着,计算算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差。进一步,通过学习其中计算的误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差。之后,当要获得对应于该内容数据的高级特征量时,将算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并响应于该评估误差而算术运算高级特征量。
对于该信息处理装置和方法以及程序,通过使用一种算法,其中该算法可以从内容数据例如音乐片段数据中提取出相应的特征量,可以高度准确地根据该算法对计算的特征量的误差进行评估。


图1为说明过去的特征量提取算法的方框图;图2为说明由采用本发明的特征量提取算法生成装置生成的特征量提取算法的概要的简图;图3A和3B为说明低级特征量提取表达式的不同例子的方框图;图4A和4B为说明高级特征量提取表达式的不同例子的方框图;图5为显示采用本发明的特征量提取算法生成装置的结构例子的方框图;图6为显示图5中所示的高级特征量算术运算部分的结构例子的方框图;图7为说明特征量提取算法学习过程的流程图;图8为说明低级特征量提取表达式列表的图;图9为说明低级特征量提取表达式列表生成过程的流程图;图10为说明第一发生列表随机生成过程的流程图;图11为说明低级特征量提取表达式的描述方法的图;图12为说明输入数据的不同例子的图;图13,14和15为说明图12中所述不同输入数据的图;图16为说明低级特征量提取表达式的拥有尺寸(possessing dimension)的简图;图17为说明下一发生列表遗传(genetic)生成过程的流程图;图18为说明选择生成过程的流程图;图19为说明插入生成过程的流程图;图20为说明突然变异(mutation)生成过程的流程图;图21A和21B为说明运算符的算术运算的图;图22为说明低级特征量算术运算部分的过程的图;图23为说明教师数据的例子的图;图24为说明高级特征量提取表达式学习过程的流程图;图25至33A和33B为说明学习算法的不同例子的简图;图34为说明根据学习算法的学习过程的流程图;图35和36为说明运算符组合的不同例子的图;图37为说明新运算符生成过程的流程图;图38为说明高精度高级特征量算术运算过程的流程图;图39为说明高精度拒绝(reject)过程的流程图;以及图40为显示通用个人计算机的结构例子的方框图。
具体实施例方式
在对本发明的优选实施例进行详细描述之前,先对在所附权利要求中阐述的多个特征与下面所述的优选实施例的特定元件之间的对应关系进行说明。但是,该说明只不过是用于确认如权利要求阐述的支持本发明的特定元件在本发明实施例的描述中公开。因此,即使在实施例的描述中阐述的一些特定元件并没有作为下面说明的特征之一被阐述,这也不表示该特定元件不对应于该特征。相反,即使一些特定元件作为对应于所述特征之一的元件被阐述,这也不表示该元件不对应于除了该元件以外的任何其他特征。
根据本发明的一个实施例,提供了一种信息处理装置(例如,图5中所示的高级特征量算术运算部分26),该装置对内容数据的特征量进行算术运算,包括第一算术运算装置(例如,图6中所示的低级特征量算术运算部分41),用于使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量,第二算术运算装置(例如,图6中所示的高级特征量算术运算部分42),用于使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收由第一算术运算装置算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,计算装置(例如,图6中所示的平方误差算术运算部分43),用于计算由第二算术运算装置算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差,生成装置(例如,图6中所示的拒绝区域提取表达式学习部分44),用于通过学习其中由计算装置计算的误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差,以及算术运算控制装置(例如,图6中所示特征量提取准确性算术运算部分45),用于当要获得对应于该内容数据的高级特征量时,将由第一算术运算装置算术运算的低级特征量应用于由生成装置生成的误差评估表达式,以对相应的误差进行评估,并使得该第二算术运算装置响应于该评估误差而算术运算高级特征量。
根据本发明的另一个实施例,提供了一种用于信息处理装置的信息处理方法,其中该信息处理装置算术运算内容数据的特征量,该方法包括如下步骤使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量,使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,计算算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差,通过学习其中该计算的误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差(例如图38中所述的步骤S141),以及当要获得对应于该内容数据的高级特征量时,将算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并响应于该评估误差而算术运算高级特征量(例如,图38中所述的步骤S144和S145)。
根据本发明的另一个实施例,提供了一种程序,用于算术运算内容数据的特征量,该程序使得计算机执行一个过程,该过程包括如下步骤使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量,使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量,计算算术运算的高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差,通过学习其中该计算的误差被用作教师数据来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差(例如图38中所述的步骤S141),以及当要获得对应于该内容数据的高级特征量时,将算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并响应于该评估误差而算术运算高级特征量(例如,图38中所述的步骤S144和S145)。
下面,将参照附图对本发明的优选实施例进行详细的描述。
图2说明了由采用本发明的特征量提取算法生成装置20(图5)生成的特征量提取算法的概要。参看图2,该特征量提取算法11所示包括低级特征量提取部分12和高级特征量提取部分14。该低级特征量提取部分12接收内容数据,即音乐片段数据,以及相应的元数据,即属性数据作为它的输入,并输出低级特征量。该高级特征量提取部分14接收来自低级特征量提取部分12的低级特征量作为它的输入,并输出高级特征量。
该低级特征量提取部分12具有低级特征量提取表达式列表13,该列表中包括m个低级特征量提取表达式,其中多于一个的用于对输入数据进行预定算术运算的操作符被组合。因此,该低级特征量提取部分12将m个不同的低级特征量输出给高级特征量提取部分14。
图3A和3B说明了低级特征量提取表达式的例子。例如,图3A中所示的低级特征量提取表达式f1算术运算音乐片段的波形数据的平均值(Mean)作为不同声道(例如L(左)声道和R(右)声道)之间的输入。接着,该低级特征量提取表达式f1沿着时间轴对算术运算的平均值进行快速傅立叶变换(FFT),并接着从该FFT的结果中确定频率的标准偏差(StDev)。接着,该低级特征量提取表达式f1输出确定的结果作为低级特征量a。
同时,图3B中所示的低级特征量提取表达式f2确定音乐片段的和弦进展(chord progress)数据中次要代码(minor codes)的出现率(appearance ratio)作为沿着时间轴的输入并输出确定的结果作为低级特征量b。
需要注意的是,低级特征量提取部分12的输出,即低级特征量本身不需要是具有一定意义的值。
回来参看图2,高级特征量提取部分14具有k个高级特征量提取表达式,其中每个表达式用于对多于被输入给高级特征量提取部分14的m个不同的低级特征量中的不止一个进行相对简单的算术运算例如四则算术运算或乘方算术运算,并输出算术运算的结果作为高级特征量。因此,该高级特征量提取部分14输出k个不同的高级特征量。
图4A和4B说明了高级特征量提取表达式的不同例子。例如,图4A中所示的高级特征量提取表达式FA对低级特征量a,b,c,d和e进行四则算术运算,并输出算术运算的结果作为速度的值,其中该速度为一种高级特征量。
进一步,例如,图4B中所示的高级特征量提取表达式FB对低级特征量a,c,d和e进行四则算术运算和乘方算术运算,并输出算术运算和乘方运算的结果作为亮度的值,其中该亮度为一种高级特征量。
图5说明了采用本发明的特征量提取算法生成装置20的结构例子。该特征量提取算法生成装置20通过遗传学习生成最佳低级特征量提取表达式以及最佳高级特征量提取表达式。参看图5,所示的特征量提取算法生成装置20包括低级特征量提取表达式列表生成部分21,低级特征量算术运算部分24,高级特征量提取表达式学习部分25,高级特征量算术运算部分26,以及控制部分27。该低级特征量提取表达式列表生成部分21生成n个低级特征量提取表达式列表,其中每个列表都包括m个不同的低级特征量提取表达式。该低级特征量算术运算部分24将对于一个音乐片段的输入数据(包括内容数据和元数据)带入从低级特征量提取表达式列表生成部分21提供给它的n个低级特征量提取表达式列表,以获取n组m个不同的低级特征量,其中该m个不同的低级特征量分别对应于该输入数据。该高级特征量提取表达式学习部分25通过根据来自低级特征量算术运算部分24的n组输出以及来自低级特征量算术运算部分24的相应教师数据(对应于一个音乐片段的k个高级特征量的项)进行学习来对高级特征量提取表达式进行评估。该高级特征量算术运算部分26通过使用经过学习过程最后生成的高级特征量提取表达式算术运算高级特征量。控制部分27控制提到的部件的重复(循环)操作。
该低级特征量提取表达式列表生成部分21随机地生成第一代低级特征量提取表达式列表。另一方面,该低级特征量提取表达式列表生成部分21根据高级特征量提取表达式的准确性等生成第二以及下一代的低级特征量提取表达式列表,其中该高级特征量提取表达式是通过使用根据前一代的低级特征量提取表达式列表的低级特征量而学习的。
在低级特征量提取表达式列表生成部分21中建构一操作符组检测部分22,并检测在生成的低级特征量提取表达式中频繁出现的多个操作符的组合。操作符生成部分23将由操作符组检测部分22检测到的多个操作符的组合作为一种新的操作符记录。
该高级特征量提取表达式学习部分25生成k个不同的高级特征量提取表达式,其中每个高级特征量提取表达式都对应于n组低级特征量。进一步,该高级特征量提取表达式学习部分25还计算各个高级特征量提取表达式的评估准确性以及高级特征量提取表达式中各个低级特征量的贡献率(contribution rate)。接着,该高级特征量提取表达式学习部分25将计算后的评估准确性以及贡献率输出给低级特征量提取表达式列表生成部分21。进一步,该高级特征量提取表达式学习部分25将n组低级特征量提取表达式列表之一的m个低级特征量以及相应的k个不同的高级特征量提取表达式提供给高级特征量算术运算部分26,其中该低级特征量提取表达式列表显示了学习的最后一代合成高级特征量的最高平均准确性。
该高级特征量算术运算部分26通过使用最后从高级特征量提取表达式学习部分25提供给它的低级特征量提取表达式以及高级特征量提取表达式算术运算高级特征量。
图6示出了高级特征量算术运算部分26的详细结构例子。
参看图6,所示的高级特征量算术运算部分26包括低级特征量算术运算部分41,高级特征量算术运算部分42,平方误差算术运算部分43,拒绝区域提取表达式学习部分44,以及特征量提取准确性算术运算部分45。该低级特征量算术运算部分41将输入数据,即内容数据以及相应的元数据,带入最后的低级特征量提取表达式列表,以算术运算低级特征量。该高级特征量算术运算部分42将由低级特征量算术运算部分41算术运算的结果带入最后的高级特征量提取表达式,以算术运算高级特征量。该平方误差算术运算部分43算术运算高级特征量算术运算部分42的算术运算的结果与教师数据之间的平方误差,所述教师数据是对应于该输入数据的高级特征量。该拒绝区域提取表达式学习部分44通过学习生成拒绝区域提取表达式,其中该拒绝区域提取表达式的输入就是低级特征量,所述低级特征量是低级特征量算术运算部分41的算术运算的结果,并且它的输出为平方误差,所述平方误差是平方误差算术运算部分43的算术运算的结果。该特征量提取准确性算术运算部分45将该输入数据带入由拒绝区域提取表达式学习部分44生成的拒绝区域提取表达式,以对根据该输入数据被算术运算的高级特征量的特征提取准确性(平方误差)进行评估。接着,只有当该评估的特征提取准确性等于或高于一预定阈值时,该特征量提取准确性算术运算部分45才允许高级特征量算术运算部分42算术运算高级特征量。
现在,对特征量提取算法生成装置20的动作进行说明。
图7为说明特征量提取算法生成过程的流程图,其中该生成过程为特征量提取算法生成装置20的主要动作。
参看图7,在步骤S1,该控制部分27将学习循环参数G初始化为1并且开始学习循环。该学习循环被重复学习次数g次,其中该学习次数g是由用户等事先设置的。
在步骤S2,该低级特征量提取表达式列表生成部分21生成n个低级特征量提取表达式列表,其中每个列表都由m个不同的低级特征量提取表达式构成,这个可以从图8中看出。接着,该低级特征量提取表达式列表生成部分21将生成的n个低级特征量提取表达式列表输出给低级特征量算术运算部分24。
下面将参照图9的流程图详细的描述在步骤S2的过程,即低级特征量提取表达式列表生成过程。
在步骤S11,低级特征量提取表达式列表生成部分21确定要生成的低级特征量提取表达式列表是否是第一代的。需要注意的是,作出该决定使得当学习循环参数G为0时,就确定要生成的低级特征量提取表达式列表就是第一代的。如果确定要生成的低级特征量提取表达式列表就是第一代的,则过程进行至步骤S12。在步骤S12,该低级特征量提取表达式列表生成部分21随机地生成第一代的低级特征量提取表达式列表。
相反,如果在步骤S11确定要生成的低级特征量提取表达式列表不是第一代的,则过程进行至步骤S13。在步骤S13,该低级特征量提取表达式列表生成部分21根据前一代低级特征量提取表达式列表遗传地生成下一代低级特征量提取表达式列表。
下面参照图10来描述步骤S12的过程,即第一代列表随机生成过程。在步骤S21,控制部分27将列表循环参数N初始化为1并开始列表循环。该列表循环被重复的次数等于事先设置的列表数n。
在步骤S22,控制部分27将表达式循环参数M初始化为1并开始表达式循环。该表达式循环被重复的次数等于形成一个低级特征量提取表达式列表的低级特征量提取表达式的数量m。
这里,参照图11来描述要在表达式循环中生成的低级特征量提取表达式的描述方法。该低级特征量提取表达式包括在其左端描述的输入数据以及按照算术运算的顺序在输入数据的右侧描述的多于一个的操作符。每个操作符适当地包括一处理对象轴和一参数。
例如,在图11所示的例子中,12TonesM为输入数据,并且32#Differential,32#MaxIndex,16#LPF_1;0.861等为操作符。进一步,操作符中的32#,16#等表示处理对象轴。例如,12TonesM表示PCM(脉冲编码调制声源)波形数据,它的输入为单声道数据,为时间轴方向的数据。48#表示声道轴;32#表示频率轴和音乐间隔轴;以及16#表示时间轴。其中一个操作符中的0.861为低通滤波器过程中的参数并且表示例如要被通过的频率的阈值。
回过头来参看图10,在步骤S23,低级特征量提取表达式列表生成部分21随机地确定要被生成的列表N的低级特征量提取表达式M的输入数据。
各种输入数据例如图12中所示的Wav,12Tone,和弦以及Key等都是可行的。输入数据Wav为如图13中所示的PCM波形数据,并且使得时间轴和声道轴作为它的拥有维数(possessing dimension)。输入数据的12Tone为沿着时间轴对每个音乐间隔的PCM波形数据进行分析的结果,并且使得时间轴和音乐间隔轴作为它的拥有维数。输入数据的和弦为表示如图14中所示音乐片段的代码进展(C,C#,D,...,Bm)的数据,并且使得时间轴和音乐间隔轴作为它的拥有维数。输入数据的Key为表示音乐片段的基调(C,C#,D,...,B)的数据,并且使得时间轴和音乐间隔轴作为它的拥有维数。
回过头来参看图10,在步骤S24,该低级特征量提取表达式列表生成部分21随机地确定要被生成的列表N的低级特征量提取表达式M的一个处理对象轴和一个参数。各种参数,平均值(Mean),快速傅立叶变换(FFT),标准偏差(StDev),出现率(Ratio),低通滤波器(LPF),高通滤波器(HPF),绝对值(ABS),微分(Differential),最大值(MaxIndex),通用离散(UVariance)等都是可用的。需要注意的是,根据确定的操作符,该处理对象轴可以是固定的,并且在这种情况下,采用被固定给该参数的处理对象轴。进一步,如果确定了需要参数的操作符,则该参数也被确定为随机设置或事先设置的值。
在步骤S25,低级特征量提取表达式列表生成部分21确定在当前时间点生成的列表N的低级特征量提取表达式M的算术运算的结果是否为标量值(一维)或者算术运算结果的维数是否低于预定值,其中该预定值为低值例如1或2。如果确定结果为否,则过程返回至步骤S24,在该步骤增加一个操作符。接着,如果如图16中所看到的算术运算结果的拥有维数降低并且在步骤S25确定列表N的低级特征量提取表达式M的算术运算结果为标量值或者维数低于预定值,其中该预定值为低值例如1或2,则该过程进行至步骤S26。
在步骤S26,该控制部分27确定表达式循环参数M是否低于最大值m。如果表达式循环参数M低于最大值m,则该控制部分27将最大值m加1,并接着返回至步骤S23。相反,如果表达式循环参数M不低于最大值m,也就是说如果表达式循环参数M等于最大值m,则该控制部分27退出该表达式循环并且所述过程前进至步骤S27。通过截止到目前的过程,生成了一个低级特征量提取表达式列表。
在步骤S27,控制部分27确定该列表循环参数N是否低于最大值n。如果该列表循环参数N低于最大值n,则该控制部分27将列表循环参数N加1,并返回所述过程至步骤S22。相反,如果该列表循环参数N不低于最大值n,也就是说如果该列表循环参数N等于最大值n,则该控制部分27退出该列表循环并终止该第一代列表随机生成过程。通过截止到目前的过程,生成了n个第一代低级特征量提取表达式。
现在,参照图17来描述图9中的步骤S13的过程,即下一代列表遗传生成过程。在步骤S31,该低级特征量提取表达式列表生成部分21随机地确定选择数ns,相交数nx,以及突然变异数nm。需要注意的是,选择数ns,相交数nx,以及突然变异数nm的和为n。进一步,对于每个选择数ns,相交数nx,以及突然变异数nm也可以采用事先设定的常数。
在步骤S32,该低级特征量提取表达式列表生成部分21根据确定的选择数ns生成ns个低级特征量提取表达式列表。在步骤S33,该低级特征量提取表达式列表生成部分21根据确定的相交数nx生成nx个低级特征量提取表达式列表。在步骤S34,该低级特征量提取表达式列表生成部分21根据确定的突然变异数nm生成nm个低级特征量提取表达式列表。
下面参照图18的流程图详细的描述步骤S32的选择生成过程。通过该选择生成过程,从用于下一代的n个低级特征量提取表达式列表中生成数量为选择数ns的低级特征量提取表达式列表。
在步骤S41,该低级特征量提取表达式列表生成部分21按照从高级特征量提取表达式学习部分25输入的高级特征量提取表达式的评估准确性的平均值的降序顺序重新排列前一代,即代距为1的前代,的n个低级特征量提取表达式列表。接着,在步骤S42,该低级特征量提取表达式列表生成部分21采用前一代的重新排列的n个低级特征量提取表达式列表中靠上的ns个作为下一代的低级特征量提取表达式列表。随之结束该选择生成过程。
下面参照图19的流程图来描述图17中步骤S33的相交生成过程。通过相交生成过程,从下一代的n个低级特征量提取表达式列表中生成数量等于相交数nx的低级特征量提取表达式列表。
在步骤S51,控制部分27将相交循环参数NX初始化为1并且开始相交循环。该相交循环被重复的次数等于相交数nx。
在步骤S52,该低级特征量提取表达式列表生成部分21对前一代的低级特征量提取表达式列表进行加权,使得任何具有相对高的从高级特征量提取表达式学习部分25输入的高级特征量提取表达式的评估准确性平均值的低级特征量提取表达式列表能够被优先选择。接着,该低级特征量提取表达式列表生成部分21随机地选择两个低级特征量提取表达式列表A和B。需要注意的是,可以进行这样的选择使得由上述前一选择生成过程选择的ns个低级特征量提取表达式被从用于选择的候选中排除或被留作用于选择的候选。
在步骤S53,该控制部分27将表达式循环参数M初始化为1并且开始该表达式循环。该表达式循环被重复的次数等于包括在一个低级特征量提取表达式列表中的表达式的数量m。
在步骤S54,该该低级特征量提取表达式列表生成部分21对包括在低级特征量提取表达式列表A和B中的2m个低级特征量提取表达式进行加权,使得任何具有相对高的从高级特征量提取表达式学习部分25输入的高级特征量提取表达式中的贡献率的低级特征量提取表达式列表能够被优先选择。接着,该低级特征量提取表达式列表生成部分21随机地选择一个低级特征量提取表达式,并将选择的低级特征量提取表达式加给下一代低级特征量提取表达式列表。
在步骤S55,该控制部分27确定该表达式循环参数M是否低于最大值m。如果该表达式循环参数M低于最大值m,则该控制部分27将表达式循环参数M加1并接着返回该过程至步骤S54。相反,如果该表达式循环参数M不低于最大值m,即如果该表达式循环参数M等于最大值m,则控制部分27退出该表达式循环并进行该过程至步骤S56。通过截止到目前的过程,生成了一个低级特征量提取表达式。
在步骤S56,控制部分27确定相交循环参数NX是否低于最大值nx。如果该相交循环参数NX低于最大值nx,则该控制部分27将相交循环参数NX加1并接着返回该过程至步骤S52。相反,如果该相交循环参数NX不低于最大值nx,即如果该相交循环参数NX等于最大值nx,则退出该相交循环并终止该相交生成过程。通过截止到目前的过程,生成了在数量上等于相交数nx的多个低级特征量提取表达式列表。
现在,参照图20的流程图来描述图17中步骤S34的突然变异生成过程。通过该突然变异生成过程,从下一代的n个低级特征量提取表达式列表中生成在数量上等于突然变异数nm的多个低级特征量提取表达式列表。
在步骤S61,控制部分27将突然变异循环参数NM初始化为1并开始该突然变异循环。该突然变异循环被重复的次数等于突然变异数量nm。
在步骤S62,该低级特征量提取表达式列表生成部分21对前一代的低级特征量提取表达式列表进行加权,使得任何具有相对高的从高级特征量提取表达式学习部分25输入的高级特征量提取表达式的评估准确性平均值的低级特征量提取表达式列表能够被优先选择。接着,该低级特征量提取表达式列表生成部分21随机地选择一个低级特征量提取表达式列表A。需要注意的是,可以进行这里的选择使得由上述选择生成过程选择的ns个低级特征量提取表达式列表被从用于选择的候选中排除或被留作用于选择的候选。进一步,由上述相交生成过程在步骤S52的过程选择的低级特征量提取表达式列表可以被从用于选择的候选中排除或被留作用于选择的候选。
在步骤S63,控制部分27将表达式循环参数M初始化为1,并开始表达式循环。该表达式循环被重复的次数等于包括在一个低级特征量提取表达式列表中的表达式的数量m。
在步骤S64,该低级特征量提取表达式列表生成部分21注意包括在低级特征量提取表达式列表A中的m个低级特征量提取表达式中的第M个。该低级特征量提取表达式列表生成部分21确定第M个低级特征量提取表达式的算术运算结果的低级特征量的贡献率是否低于包括在低级特征量提取表达式列表A中的其他低级特征量提取表达式的算术运算的结果,即低级特征量的贡献率。更具体地,该低级特征量提取表达式列表生成部分21确定,例如,包括在低级特征量提取表达式列表A中的m个低级特征量提取表达式中的第M个低级特征量提取表达式的算术运算结果,即低级特征量的贡献率是否属于按照升序一直到预定数的范围。
如果在步骤S64确定第M个低级特征量提取表达式的算术运算结果的低级特征量的贡献率低于其他的,则过程进行至步骤S65。在步骤S65,该低级特征量提取表达式列表生成部分21随机地对第M个低级特征量提取表达式进行变换,并将变换后的低级特征量提取表达式加给下一代的低级特征量提取表达式列表。
相反,如果在步骤S64确定第M个低级特征量提取表达式的算术运算结果的低级特征量的贡献率并不低于其他的,则过程进行至步骤S66。在步骤S66,该低级特征量提取表达式列表生成部分21将第M个低级特征量提取表达式按照现在的样子加给下一代的低级特征量提取表达式列表。
在步骤S67,控制部分27确定该表达式循环参数M是否低于最大值m。如果该表达式循环参数M低于最大值m,则控制部分27将表达式循环参数M加1并返回该过程至步骤S64。相反,如果该表达式循环参数M不低于最大值m,即如果该表达式循环参数M等于最大值m,则控制装置27退出该表达式循环,并进行该过程至步骤S68。通过截止到目前的过程,生成了一个低级特征量提取表达式列表。
在步骤S68,控制部分27确定该突然变异循环参数NM是否低于最大值nm。如果该突然变异循环参数NM低于最大值nm,则该控制部分27将突然变异循环参数NM加1,并返回至处理步骤S62。相反,如果该突然变异循环参数NM不低于最大值nm,即如果该突然变异循环参数NM等于最大值nm,则控制部分27退出该变异循环并终止该变异生成过程。通过截止到目前的过程,生成了在数量上等于变异数nm的多个低级特征量提取表达式列表。
根据上述的下一代遗传生成过程,具有相对高的评估准确性的前一代低级特征量提取表达式列表的低级特征量提取表达式以及具有相对高的相应于低级特征量提取表达式的贡献率的低级特征量提取表达式是连续的,但是具有相对低的评估准确性或相对低的贡献率的低级特征量提取表达式并没有与下一代连续,而是被舍弃。因此,可以希望的是,随着一代一代的继续,低级特征量提取表达式的评估准确性被加强并且特征量提取表达式的贡献率都得到了加强。
回过来参看图7,在步骤S3,低级特征量算术运算部分24将用于音乐片段C1至CI中一个音乐片段的包括内容数据和元数据的输入数据带入从低级特征量提取表达式列表生成部分21输入的n个低级特征量提取表达式列表,以算术运算低级特征量。需要注意的是,对于这里输入的用于一个音乐片段的每个输入数据,事先获得k个教师数据的项,即相应的高级特征量。如果该低级特征量算术运算部分24对该输入数据进行相应于操作符#16Mean的算术运算,其中从图21A中可以看出该输入数据使得音乐间隔轴和时间轴作为它的拥有维数,接着如图21B所示,使用时间轴作为处理对象轴来计算音乐间隔值的平均值。
接着,该低级特征量算术运算部分24将m个不同的低级特征量输出给高级特征量提取表达式学习部分25,其中这m个不同的低级特征量对应于n组从图22中可以看到的输入数据,而该输入数据是作为算术运算的结果而得到的。
回过来参看图7,在步骤S4,该高级特征量提取表达式学习部分25通过学习根据从低级特征量算术运算部分24输入并算术运算的相应输入数据和相应教师数据的n组低级特征量来评估,即生成n组高级特征量提取表达式。这里的教师数据为k个相应于图23中可见的输入数据音乐片段C1到CI的高级特征量。进一步,n组高级特征量中的每一个都包括k个高级特征量提取表达式。该高级特征量提取表达式学习部分25进一步计算每个高级特征量提取表达式的评估准确性以及高级特征量提取表达式中每个低级特征量的贡献率。接着,该高级特征量提取表达式学习部分25将计算出的评估准确性以及贡献率输出给低级特征量提取表达式列表生成部分21。
下面参照图24的流程图详细地描述在步骤S4的高级特征量提取表达式学习过程。
在步骤S71,控制部分27将列表循环参数N初始化为1并开始列表循环。该列表循环被重复的次数等于事先设置的列表数n。在步骤S72,控制部分27将教师数据循环参数K初始化为1并开始教师数据循环。该教师数据循环被重复的次数等于教师数据的类型数k。
在步骤S73,控制部分27将算法循环参数A初始化为1,并开始算法循环。该算法循环被重复的次数等于学习算法的类型数a。
当要采用学习算法时,例如,Regression(回归分析),Classify(分类),SVM(支持向量机),以及GP(遗传程序设计)也都是可用的。
该Regression包括一学习算法,其中如图25所示,对参数bn进行学习,使得在假设教师数据与低级特征量具有线性关系的基础上,教师数据与Y之间的平方误差可以被最小化。该Regression还包括另一学习算法,其中如图26所示,对参数bnm进行学习,使得在假定教师数据与低级特征量具有非线性关系的基础上,教师数据与Y之间的平方误差可以被最小化。
该Classify包括一学习算法,其中如图27所示,计算从每个类(在图27中,男性元音类和女性元音类)的中心到低级特征量的Euclidean(欧几里得)距离d,并且将该低级特征量分为它的Euclidean距离d最短的类。该Classify还包括另一学习算法,其中如图28中所示,计算与每个类(在图28中,男性元音类和女性元音类)的平均向量的相关性相关(correlation correl),并且将低级特征量分为它的相关最高的类。该Classify还包括另一学习算法,其中如图29所示,计算自每个类(在图29中,男性元音类和女性元音类)的中心的Mahalanobis距离d,并且将该低级特征量分为它的Mahalanobis距离d最短的类。该Classify还包括一学习算法,其中如图30A中所示,用多个类来表示每个类组的分布,并且计算自每个类组的中心的Euclidean距离d,并接着将该低级特征量分为它的Euclidean距离d最短的类。该Classify还包括一学习算法,其中如图30B中所示,用多个类来表示每个类组(在图30B中,男性元音类和女性元音类)的分布,并且计算自每个类组的中心的Mahalanobis距离d,并接着将该低级特征量分为它的Mahalanobis距离d最短的类。
该SVM包括一学习算法,其中如图31中所示,由支持向量来表示每个类(在图31中,男性元音类和女性元音类)的边界面并学习参数bnm,使得在接近边界中分离平面与向量之间的距离(容限)可以被最大化。
该GP包括一学习算法,其中如图32所示,由GP生成一个表达式,在该表达式中低级特征量被组合在一块,另一学习方法,其中如图33A所示,表达式彼此相交,在该表达式中低级特征量被组合在一块,以及还有一学习方法,其中如图33B所示,表达式发生突然变异,在该表达式中低级特征量被组合在一块。
例如,当上述的全部学习算法都被使用时,学习算法的种类数a为11。
回过头来参看图24,在步骤S74,控制部分27对交叉验证循环参数C进行初始化,并开始交叉验证循环。该交叉验证循环被重复的次数等于事先设置的交叉验证的次数C。
在步骤S75,高级特征量提取表达式学习部分25随机地将用于k种学习数据中第K种的一个音乐片段的教师数据(高级特征量)分为用于学习的教师数据和用于评估的教师数据(交叉验证)。在下面的说明中,被分类为用于学习的教师数据被称为学习数据,并且那些被分类为用于评估的教师数据被称为评估数据。
在步骤S76,高级特征量提取表达式学习部分25将通过使用第N个低级特征量提取表达式列表算术运算的m个不同低级特征量和学习数据应用于第a个学习算法,以通过学习来评估高级特征量提取表达式。根据该学习,为了减少算术运算量以及抑制超量学习(超量适应),遗传地选择和使用m个不同的低级低级特征量中的一部分。
对于评估值,当要选择低级特征量时,使用了信息量参照AIC(Akaike信息标准)或信息量参照BIC(Bayesian信息标准),它们都是函数。该信息量参照AIC或BIC被用作学习模型的选择参照(在当前情况下,被选择的低级特征量)。当信息量的值参照AIC或BIC降低时,该学习模型就被认为是更好些(评估更高)。
可以用如下方式来表示信息量参照AICAIC=-2×最大对数似然+2×空闲参数数量例如,当采用Regression(线性)作为学习算法时(图25中的情况),该空闲参数数量=n+1,对数似然=-0.5×学习数据数量×((log2∏)+1+log(平均平方误差)),因此,AIC=学习数据数量×((log2∏)+1+log(平均平方误差))+2×(n+1)用下面表达式来表示信息量参照BICBIC=-2×最大对数似然+log(学习数据数量)×空闲参数数量例如,当采用Regression(线性)作为学习算法时(图25中的情况),BIC=学习数据数量×((log2∏)+1+log(平均平方误差))+log(学习数据数量)×(n+1)。该信息量参照BIC的特征在于,当与信息量参照AIC相比,即使该学习数据数量增加了,该信息量参照BIC的值也不容易增加。
这里,参照图34来描述根据步骤S76的学习算法的学习过程。在学习过程中,为了实现如上所述的降低算术运算量以及抑制超量学习(超量适应),遗传地选择和使用m个不同低级特征量中的一些。
在步骤S91,该高级特征量提取表达式学习部分25生成p个初始组,其中每个组通过从要被选择的,即要被用于学习的m个不同低级特征量中随机提取而形成。
在步骤S92,该高级特征量提取表达式学习部分25利用遗传算法(GA)开始特征选择循环。重复利用GA的特征选择,直到在下面所述的步骤S98满足预定条件。
在步骤S93,控制部分27将初始组循环参数P初始化为1,并开始初始组循环。该初始组循环被重复的次数等于由步骤S91的过程生成的低级特征量的初始组数p。
在步骤S94,高级特征量提取表达式学习部分25使用和应用包括在第P个初始组中的低级特征量以及来自教师数据中的学习数据于第a个学习算法,以评估通过学习的高级特征量提取表达式。
在步骤S95,高级特征量提取表达式学习部分25算术运算信息量参照AIC或BIC作为在步骤S94的过程得到的高级特征量的估计值。在步骤S96,控制部分27确定初始组循环参数P是否低于最大值p。如果该初始组循环参数P低于最大值p,则该控制部分27将初始组循环参数P加1,并返回至步骤S94。相反,如果初始组循环参数P不低于最大值p,即如果初始组循环参数P等于最大值p,则该控制部分27退出该初始组循环,并进行至步骤S97。通过该初始组循环,可以得到信息参照量作为根据初始组学习的高级特征量提取表达式的估计值。
在步骤S97,高级特征量提取表达式学习部分25根据该估计值(信息量参考)遗传地对p个初始组进行更新,其中每个初始组都是由要被用于学习的低级特征量形成。更具体地,通过类似于图17中的步骤S32至S34的选择、相交以及突然变异来对初始组进行更新。通过该更新,通过该学习,随机初始化生成的初始组增强了高级特征量提取表达式的估计值。
在步骤S98,每次利用GA的特征选择循环被重复时,每次当对应于p个初始组的高级特征量提取表达式之一的估计值显示出增强时,其中该p个初始组具有最高估计值,即具有最小信息参考量,该控制部分27就会返回该过程至步骤S93。另一方面,如果对应于p个初始组的高级特征量提取表达式之一的估计值不再显示出增强时,其中该p个初始组具有最高估计值,即使利用GA的特征选择循环被重复,即如果该信息参考量不再降低,则该控制部分27退出利用GA的特征选择循环。接着,该控制部分27将具有最高估计值的高级特征量提取表达式输出给下一阶段的过程,即图24中步骤S77的过程。接着,结束该根据学习算法的学习过程。
回过头来参看图24,在步骤S77,该高级特征量提取表达式学习部分25使用评估数据对通过在步骤S76的过程得到的高级特征量提取表达式进行评估。特别地,该高级特征量提取表达式学习部分25使用得到的高级特征量提取表达式算术运算高级特征量,并计算高级特征量与评估数据之间的平方误差。
在步骤S78,控制部分27确定交叉验证循环参数C是否低于最大值c。如果该交叉验证循环参数C低于最大值c,则该控制部分27将交叉验证循环参数C加1并返回至步骤S75。相反,如果该交叉验证循环参数C不低于最大值c,即如果该交叉验证循环参数C等于最大值c,则该控制部分27退出该交叉验证循环并进行至步骤S79。通过截止到目前的过程,得到了c个学习结果,即c个高级特征量提取表达式。由于通过交叉验证循环随机地对学习数据和评估数据进行转换,可以确认该高级特征量提取表达式没有超量学习。
在步骤S79,高级特征量提取表达式学习部分25选择通过交叉验证结果而得到的c个学习结果之一,即c个高级特征量提取表达式,其在步骤S77的过程中具有最高估计值。
在步骤S80,控制部分27确定该算法循环参数A是否低于最大值a。如果该算法循环参数A低于最大值a,则控制部分27将算法循环参数A加1,并返回至步骤S74。相反,如果算法循环参数A不低于最大值a,即如果算法循环参数A等于最大值a,则控制部分27退出该算法循环,并进行至步骤S81。通过该算法循环,通过A种学习算法学习的第k种高级特征量提取表达式。因此,在步骤S81,该高级特征量提取表达式学习部分25选择通过算法循环得到的学习结果之一,即a个高级特征量提取表达式,其在步骤S77的过程中具有最高估计值。
在步骤S82,控制部分27确定该学习数据循环参数K是否低于最大值k。如果该学习数据循环参数K低于最大值k,则控制部分27将教师数据循环参数K加1,并返回该过程至步骤S73。相反,如果该学习数据循环参数K不低于最大值k,即,如果该学习数据循环参数K等于最大值k,则控制部分27退出该教师数据循环,并进行该过程至步骤S83。通过该教师数据循环,得到了对应于第N个低级特征量提取表达式列表的k个不同的高级特征量提取表达式。
在步骤S83,控制部分27确定该列表循环参数N是否低于最大值n。如果该列表循环参数N低于最大值n,则控制部分27将列表循环参数N加1,并接着返回该过程至步骤S72。相反,如果该列表循环参数N不低于最大值n,即如果该列表循环参数N等于最大值n,则控制部分27退出该列表循环,并进行该过程至步骤S84。通过该列表循环,得到了对应于n个低级特征量提取表达式的k个不同的高级特征量提取表达式。
在步骤S84,该高级特征量提取表达式学习部分25计算k个不同高级特征量提取表达式的评估准确性以及高级特征量提取表达式中低级特征量的贡献率,所述高级特征量提取表达式对应于如上所述获得的n个低级特征量提取表达式,。接着,该高级特征量提取表达式学习部分25将计算出的评估准确性和贡献率输出给低级特征量提取表达式列表生成部分21。随之结束该高级特征量提取表达式学习过程。
回过头来参看图7,在步骤S5,控制部分27确定该学习循环参数G是否低于最大值g。如果该学习循环参数G低于最大值g,则控制部分27将学习循环参数G加1,并返回该过程至步骤S2。相反,如果该学习循环参数G不低于最大值g,即该学习循环参数G等于最大值g,则该控制部分27退出该学习循环并进行该过程至步骤S6。需要注意的是,步骤S1至S5的学习循环是特征量提取算法的学习过程,而步骤S5之后的S6是使用特征量提取算法对高级特征量进行算术运算的过程。
在步骤S6,高级特征量提取表达式学习部分25将列表的m个低级特征量提取表达式以及对应于该m个低级特征量提取表达式的k个不同高级特征量提取表达式提供给高级特征量算术运算部分26,其中该列表的m个低级特征量提取表达式具有从最后一代学习的n个低级特征量提取表达式列表中获得的高级特征量的最大平均准确性。在步骤S7,该高级特征量算术运算部分26使用从高级特征量提取表达式学习部分25最后提供的低级特征量提取表达式以及高级特征量提取表达式算术运算高级特征量。需要注意的是,在下文中参照图38等来描述步骤S7的过程。
随后结束由特征量提取算法生成装置20进行的对于特征量提取算法生成过程的说明。
现在,对新操作符的生成过程进行描述,其中当上述特征量提取算法生成过程的步骤S1至S6的学习循环被执行时才进行该新操作符生成过程,用以进展和生长低级特征量提取表达式列表的后代。换句话说,当低级特征量提取表达式的贡献率得到加强或者相应高级特征量提取表达式的评估准确性得到增强时才执行新操作符生成过程。
随着低级特征量提取表达式列表的一代的进展和生长,在低级特征量提取表达式列表中,多个操作符的排列(下文中被称为操作符的组合)频繁地出现在不同的低级特征量提取表达式中。因此,频繁地出现在不同的低级特征量提取表达式中的多个操作符的组合就被记录作为要被低级特征量提取表达式列表生成部分21使用的新操作符之一。
例如,在图35中所示的例子中,3个操作符“32#FFT”,Log,“32#FFT”的组合出现在5个低级特征量提取表达式中。其中该“32#FFT,Log,32#FFT”被记录作为一个操作符NewOperator1,该操作符NewOperator1被包括在下一和后代的低级特征量提取表达式中,例如,如图36中所示。
现在参照图37的流程图来描述新操作符生成过程。首先,在步骤S101,操作符组检测部分22生成操作符的排列(排列中操作符的组合),其数量等于或小于预定数(例如,1至5左右)。这里要生成的操作符组合的数量用og表示。
在步骤S102,控制部分27将组合循环参数OG初始化为1并开始组合循环。该组合循环被重复的次数等于操作符组合的数量og。
在步骤S103,控制部分27将第og个操作符组合的出现频率Count初始化为1。在步骤S104,控制部分27将列表循环参数N初始化为0,并开始列表循环。该列表循环被重复的次数等于事先设置的列表数n。在步骤S105,控制部分27将表达式循环参数M初始化为1,并开始表达式循环。该表达式循环被重复的次数等于形成一个低级特征量提取表达式列表的低级特征量提取表达式的数量m。
在步骤S106,操作符组检测部分22确定第og个操作符组合是否存在于构成第N个低级特征量提取表达式列表的第M个低级特征量提取表达式中。如果确定该第og个操作符组合是存在的,则操作符组检测部分22进行该过程至步骤S107,在该步骤,操作符组检测部分22将出现频率Count加1。相反,如果确定该第og个操作符组合不存在,则操作符组检测部分22跳过步骤S107并进行至步骤S108。
在步骤S108,控制部分27确定该表达式循环参数M是否高于最大值m。如果该表达式循环参数M高于最大值m,则控制部分27将表达式循环参数M加1,并返回至步骤S106。相反,如果表达式循环参数M不低于最大值m,即如果表达式循环参数M等于最大值m,则控制部分27退出表达式循环并且进行至步骤S109。
在步骤S109,控制部分27确定列表循环参数N是否低于最大值n。如果该列表循环参数N低于最大值n,则控制部分27将列表循环参数加1,并返回该过程至步骤S105。相反,如果该列表循环参数N不低于最大值n,即如果列表循环参数N等于最大值n,则控制部分27退出该列表循环并进行至步骤S110。
在步骤S110,控制部分27确定该组合循环参数OG是否低于最大值og。如果该组合循环参数OG低于最大值og,则控制部分27将组合循环参数OG加1,并返回该过程至步骤S103。相反,如果该组合循环参数OG不低于最大值og,即如果该组合循环参数OG等于最大值og,则控制部分27退出该组合循环并进行至步骤S110。通过截止到目前的过程,检测到了分别对应于所有操作符组合的出现频率Count。
在步骤S111,该操作符组检测部分22提取出其出现频率Count高于预定阈值的操作符组合,并将提取出的组合输出给操作符生成部分23。在步骤S112,操作符生成部分23将每个从操作符组检测部分22输入的操作符组合记录作为一个新的操作符。随后结束该新操作符生成过程。
如上所述,根据该新操作符生成过程,出现频率很高并且被认为在高级特征量的算术运算中很有效的操作符组合被确定为一个操作符,并被用于下一以及后代的低级特征量提取表达式。因此,增强了低级特征量提取表达式的生成速度和生长速度。进一步,有效的低级特征量提取表达式可以被找出来,作为较早的阶段。并且,由于操作符的组合能够自动被检测到,其中该操作符组合被认为是有效的并且在过去已经被人工发现,因此这也是当前新操作符生成过程的一个优点。
现在,参照图38的流程图来描述图7中步骤S7的过程。在步骤S141,高级特征量算术运算部分26执行高准确性拒绝过程,用于从自高级特征量提取表达式学习部分25提供的最后高级特征量提取表达式中选择最后的高级特征量提取表达式,从该高级特征量提取表达式中可以得到高准确性的算术运算结果。
该高准确性拒绝过程基于如下想法高级特征量的准确性与低级特征量的值具有因果关系,并且获得一拒绝区域提取表达式,其中该拒绝区域提取表达式接收低级特征量作为输入并输出经过学习的高级特征量的准确性。下面参照图39的流程图来描述该高准确性拒绝过程。
在步骤S151,高级特征量算术运算部分26的低级特征量算术运算部分41获取最后的低级特征量提取表达式列表。高级特征量算术运算部分26的高级特征量算术运算部分42获取最后的高级特征量提取表达式。
在步骤S152,控制部分27将内容循环参数L初始化为1并开始该内容循环。该内容循环被重复的次数的等于输入数据(内容数据或元数据)的数量1,其中为了执行高准确性的拒绝过程,可以提前准备好该输入数据的数量1。需要注意的是,对应于提前准备的输入数据的高级特征量也可以被提前准备作为教师数据。
在步骤S153,低级特征量算术运算部分41将第L个输入数据带入在步骤S151的过程获得的最后低级特征量提取表达式列表,并输出m个不同的低级特征量给高级特征量算术运算部分42和拒绝区域提取表达式学习部分44,其中该m个不同的低级特征量是算术运算的结果。该高级特征量算术运算部分42将从低级特征量算术运算部分41输入的m个不同的低级特征量带入在步骤S151的过程中得到的最后高级特征量提取表达式。接着,该高级特征量算术运算部分42将高级特征量输出给平方误差算术运算部分43,其中该高级特征量为算术运算的结果。
在步骤S154,该平方误差算术运算部分43算术运算从高级特征量算术运算部分42输入的高级特征量与教师数据(对应于输入数据的真正高级特征量)之间的平方误差。接着,该平方误差算术运算部分43将得到的平方误差输出给拒绝区域提取表达式学习部分44。该平方误差就是由高级特征量算术运算部分42算术运算的高级特征量的准确性(下文中被称为特征提取准确性),其中该平方误差为算术运算的结果。
在步骤S155,控制部分27确定该内容循环参数L是否低于最大值1。如果该内容循环参数L低于最大值1,则控制部分27将内容循环参数L加1,并该过程返回至步骤S153。相反,如果该内容循环参数L不低于最大值1,即如果该内容循环参数L等于最大值1,则控制部分27退出该内容循环并进行该过程至步骤S156。通过截止到目前的过程,得到了通过算术运算得到的并个别对应于输入数据的高级特征量与教师数据之间的平方误差。
在步骤S156,该拒绝区域提取表达式学习部分44通过根据从低级特征量算术运算部分41输入的低级特征量提取表达式以及从平方误差算术运算部分43输入的平方误差进行学习,而生成拒绝区域提取表达式。该拒绝区域提取表达式接收低级特征量作为它的输入,并根据该输入的低级特征量输出算术运算的高级特征量的特征提取准确性。该拒绝区域提取表达式学习部分44将由此生成的拒绝区域提取表达式提供给特征量提取准确性算术运算部分45。随后结束该高准确性拒绝过程,并进行至图38的步骤S142。
回过头来参看图38,在步骤S142,该低级特征量算术运算部分41将要确定其高级特征量的音乐片段的输入数据中的第L个输入数据带入最后低级特征量提取表达式列表,以算术运算低级特征量。接着,该低级特征量算术运算部分41将算术运算的结果输出给高级特征量算术运算部分42以及特征量提取准确性算术运算部分45。
在步骤S143,该特征量提取准确性算术运算部分45将从低级特征量算术运算部分41输入的低级特征量带入从拒绝区域提取表达式学习部分44提供的拒绝区域提取表达式,以根据从低级特征量算术运算部分41输入的低级特征量算术运算高级特征量的特征量提取准确性。换句话说,该特征量提取准确性算术运算部分45算术运算一平方误差,用于对由高级特征量算术运算部分42算术运算的高级特征量进行评估。
在步骤S144,该特征量提取准确性算术运算部分45确定由步骤S143的过程算术运算的特征量提取准确性是否等于或高于预定阈值。如果该算术运算的特征量提取准确性等于或高于预定阈值,则该处理进行至步骤S145。在步骤S145,该特征量提取准确性算术运算部分45使得高级特征量算术运算部分42执行高级特征量的算术运算。该高级特征量算术运算部分42将通过在步骤S142的过程从低级特征量算术运算部分41输入的m个不同低级特征量带入最后高级特征量提取表达式,以算术运算高级特征量。接着,这里被算术运算的高级特征量被输出,随后结束该高准确性高级特征量算术运算过程。
需要注意的是,如果在步骤S144确定算术运算的特征量提取准确性低于预定阈值,则跳过步骤S145,并结束该高准确性高级特征量算术运算过程。
因此,根据该该高准确性高级特征量算术运算过程,能够对使用高级特征量提取表达式计算的高级特征量的准确性进行评估。进一步,由于关于高准确性无法被预期的高级特征量无法被算术运算,因此可以省略无用的算术运算。
如上所述,根据由采用本发明的特征量提取算法生成装置20进行的特征量提取算法学习过程,能够迅速地生成一算法,同时保持高度的准确性,并且通过该算法能够从音乐片段数据中提取出特征量。除此以外,在通过相对少量的算术运算就能够得到高准确性的高级特征量。
需要注意的是,本发明不仅可以用于获取音乐片段的高级特征量,而且也可以用于获取任何类型的内容数据的高级特征量。
顺便提及,虽然上述的一系列过程可以通过硬件来执行,当时也可以通过软件来执行。当该一系列过程通过软件执行时,构成该软件的程序被从程序记录介质安装到与硬件组合在一块的专用计算机中,或者例如能够通过安装各种程序来执行各种功能的通用个人计算机中。
图40示出了个人计算机的结构的例子,其中该个人计算机根据程序执行上述的一系列过程。参看图40,所示的个人计算机100包括内置中央处理单元(CPU)101。输入/输出接口105通过总线104与CPU 101相连。只读存储器(ROM)102以及随机存取存储器(RAM)103与总线104相连。
输入部分106以及输出部分107与输入/输出接口105相连,其中该输入部分106包括输入装置例如键盘、鼠标等,用于通过用户的操作输入操作命令,并且该输出部分107包括显示单元,用于显示操作屏等例如阴极射线管(CRT)或液晶显示(LCD)板。还有,存储器部分108以及通信部分109与输入/输出接口105相连,其中该存储器部分108由硬盘驱动器等形成,用于存储程序,各种数据等,并且该通信部分109由调制解调器,局域网(LAN)适配器等形成,用于通过由互联网表示的网络执行通信过程。进一步,驱动器110也与输入/输出接口105相连。该驱动器110从记录介质读出数据以及向记录介质上写入数据,其中该记录介质包括例如磁盘(包括软盘),光盘(包括CD-ROM(光盘-只读存储器))和DVD(数字通用盘),磁光盘(包括MD(迷你盘)),或者半导体存储器。
使得个人计算机100执行上述一系列过程的程序在处于被存储在记录介质111中的状态下被提供给个人计算机100。接着,从驱动器110中读出该程序,并将其安装到存储器部分108的硬盘驱动器中。根据CPU 101的指令将安装在该存储器108中的程序从存储器部分108载入到RAM 103中,其中该CPU101的指令对应于由用户输入给输入部分106的命令。由CPU 101执行载入到RAM 103中的程序。
需要注意的是,在本说明书中,根据程序执行的步骤不仅包括按照上述的时间顺序执行的过程,而且还包括可以但不必须按照时间顺序而是可以不需要按照时间顺序处理并行或单独执行的过程。
该程序可以由单个计算机执行,也可以由多个计算机分散地执行。进一步,该程序可以被传输至远距离的计算机,并且由远距离的计算机来执行。
进一步,在本说明书中,术语“系统”被用于表示由多个装置或装置组成的整个装置。
虽然使用了特定术语对本发明的优选实施例进行说明,但这种说明只是说明性的,并且可以理解的是,在不脱离本发明权利要求的精神和范畴的情况下可以进行各种改变和变化。
本申请包含涉及日本专利申请的主题,该日本专利申请为2005年10月25日在日本专利局提出的JP2005-310407,其整个内容在这里被引入作为参考。
权利要求
1.一种信息处理装置,用于算术运算内容数据的特征量,包括第一算术运算装置,用于使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量;第二算术运算装置,用于使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收由所述第一算术运算装置算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量;计算装置,用于计算由所述第二算术运算装置算术运算的高级特征量与事先得到的并对应于该内容数据的高级特征量之间的误差;生成装置,用于通过由所述计算装置计算的误差被用作教师数据的学习来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出该误差;以及算术运算控制装置,用于当要获得对应于该内容数据的高级特征量时,将由所述第一算术运算装置算术运算的低级特征量应用于由所述生成装置生成的误差评估表达式,以对相应的误差进行评估,并使得所述第二算术运算装置响应于该评估误差而算术运算该高级特征量。
2.根据权利要求1的信息处理装置,其中所述计算装置计算由所述第二算术运算装置算术运算的高级特征量与事先得到的并对应于该内容数据的高级特征量之间的误差平方。
3.根据权利要求1的信息处理装置,其中所述控制装置将由所述第一算术运算装置算术运算的低级特征量应用于由所述生成装置生成的误差评估表达式,以对相应的误差进行评估,并使得所述第二算术运算装置只在评估误差低于阈值时算术运算高级特征量。
4.一种用于信息处理装置的信息处理方法,其中该信息处理装置算术运算内容数据的特征量,该方法包括如下步骤使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量;使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量;计算算术运算的高级特征量与事先得到的并对应于该内容数据的高级特征量之间的误差;通过计算的误差被用作教师数据的学习来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差;以及当要获得对应于该内容数据的高级特征量时,将算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并使得响应于该评估误差而算术运算该高级特征量。
5.一种程序,用于算术运算内容数据的特征量,该程序使得计算机执行一个过程,该过程包括如下步骤使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量;使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量;计算算术运算的高级特征量与事先得到的并对应于该内容数据的高级特征量之间的误差;通过计算的误差被用作教师数据的学习来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出误差;以及当要获得对应于该内容数据的高级特征量时,将算术运算的低级特征量应用于生成的误差评估表达式,以对相应的误差进行评估,并使得响应于该评估误差而算术运算该高级特征量。
6.一种信息处理装置,其算术运算内容数据的特征量,包括第一算术运算部分,被配置为使用低级特征量提取表达式算术运算低级特征量,其中该低级特征量提取表达式接收内容数据或者对应于该内容数据的元数据作为输入并输出低级特征量;第二算术运算部分,被配置为使用高级特征量提取表达式算术运算高级特征量,其中该高级特征量提取表达式接收由所述第一算术运算部分算术运算的低级特征量作为输入并输出表示内容数据的特征的高级特征量;计算部分,被配置为计算由所述第二算术运算部分算术运算的高级特征量与事先得到的并对应于该内容数据的高级特征量之间的误差;生成部分,被配置为通过由所述计算部分计算的误差被用作教师数据的学习来生成误差评估表达式,其中该误差评估表达式接收低级特征量作为输入并输出该误差;以及算术运算控制部分,被配置为当要获得对应于该内容数据的高级特征量时,将由所述第一算术运算部分算术运算的低级特征量应用于由所述生成部分生成的误差评估表达式,以对相应的误差进行评估,并使得所述第二算术运算部分响应于该评估误差而算术运算高级特征量。
全文摘要
这里公开了一种信息处理装置,其算术运算内容数据的特征量,包括第一算术运算装置,用于使用低级特征量提取表达式算术运算低级特征量;第二算术运算装置,用于使用高级特征量提取表达式算术运算高级特征量;计算装置,用于计算高级特征量与事先得到的对应于该内容数据的高级特征量之间的误差;生成装置,用于通过学习其中由所述计算装置计算的误差被用作教师数据来生成误差评估表达式;以及算术运算控制装置,用于当要获得对应于该内容数据的高级特征量时,将低级特征量应用于误差评估表达式。
文档编号G10L11/00GK101030366SQ20061006434
公开日2007年9月5日 申请日期2006年10月25日 优先权日2005年10月25日
发明者小林由幸, 高塚进 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1