特征量提取装置的制作方法

文档序号:2822045阅读:207来源:国知局
专利名称:特征量提取装置的制作方法
技术领域
本发明涉及特征量提取装置,尤其涉及提取音频信号所含特征量的装置。
背景技术
近年来,作为识别音频信号的技术,声印技术受到关注。声印是指能从音频信号提取的固有特征量,如人的指纹那样,能识别音频信号。声印技术从音频信号提取声印,与数据库预先存储的声印对照,以识别音频信号。作为采用声印技术的例子,有互联网上进行文件交换的软件中根据声印核对收发文件内容并进行筛选的技术。此外,还可考虑把声印用于乐曲检索等中。
下面参考图28和图29说明声印技术。图28是说明已有声印技术中存储声印信息的过程的框图。图28中,乐曲信息数据库282预先存放乐曲标题、作曲者、作词者、歌手名等目录信息和管理信息。特征量提取部281输入音频信号,并从音频信号计算声印(FP)。使计算出的声印与乐曲信息数据库282存放的音频信号形成对应关系,并将其存入声印信息数据库283作为声印信息。
图29是说明用声印进行音频信号识别的过程的框图。下面说明从未知音频信号提取声印,并且用声印识别音频信号的过程。首先,把未知音频信号输入到特征量提取部291,由该部提取音频信号的声印。提取的声印输入到声印比较部293。声印比较部293把输入的音频信号与声印信息数据库292存储的声印比较。然后,从存储的声印中检测出与输入的声印一致或在某基准范围内类似的声印。通过输出以上那样检测出的声印相关的乐曲信息,能得到未知音频信号的乐曲信息。
作为识别音频信号用的其他方法,还可考虑采用电子水印的方法。采用电子水印的方法预先将乐曲信息作为电子水印埋入音频信号,并且利用埋入的乐曲信息识别音频信号。这种电子水印技术需要音频信号本身埋入信息,因而音频信号的音质可能变坏。与此相反,采用声印的技术由于不使音频信号本身变化,具有音频信号音质不变坏的优点。
历来作为声印提取的特征量,采用信号振幅、频带宽度、音高数、基频倒谱系数等物理量。而且,计算这些物理量各自的平均值和标准偏差等的统计特性,作为特征量,以进行音频信号识别。
声印技术中,要求能明确识别一音频信号与其他音频信号。然而,已有技术中,作为声印提取的特征量是音频信号的基本物理量。因此,把音频信号的基本物理量作为声印时,有可能不能明确识别具有类似特征的音频信号。该物理量不能起声印的作用。

发明内容
因此,本发明的目的是提供能较明确识别某音频信号与其他音频信号的特征量提取装置。
为了达到上述目的,本发明的特征量提取装置具有以下特征。第1方面是具有频率变换部、频带提取部和特征量运算部的特征量提取装置。频率变换部通过对输入音频信号包含的规定时间长度的信号部分进行频率变换导出该信号部分的频谱。频带提取部从频率变换部导出的频谱提取多个频带并且输出作为提取的各频带的频谱的频带频谱。特征量运算部对各频带频谱运算规定的特征量并把算出的各规定特征量作为音频信号的特征量。
频带提取部可从频率变换部导出的频带提取按照频率轴上的线性刻度等间隔划分的多个频带。频带提取部还可从所述频率变换部导出的频带提取按照频率轴上的对数刻度等间隔划分的多个频带。
频带提取部可从频率变换部导出的频带仅提取频率在规定范围的频带。
频带提取部可提取有关频带,使应提取的各频带间产生规定的间隔。
特征量运算部通常对各频带运算作为频谱成为峰值的频率的波峰频率,并且把算出的波峰频率的值作为规定的特征量。特征量运算部还可算出某频带的波峰频率与其他频带波峰频率的差值,作为规定的特征量。特征量运算部也可用表示差值符号的二进制值表现该差值。
频率变换部可按规定的时间间隔从所述音频信号提取规定时间长度的信号部分。这时,特征量运算部包含对各频带频谱运算作为频谱成为峰值的频率的波峰频率的波峰频率运算部、以及运算波峰频率运算部运算出的各波峰频率时间变化量有关的数值作为规定特征量的波峰频率时间变化运算部。
波峰频率时间变化运算部可把表示各波峰频率时间变化量的符号的二进制值作为规定特征量。波峰频率时间变化运算部可把表示各波峰频率时间变化量是否多于规定量的二进制值作为所述规定特征量。
特征量运算部可对各频带频谱运算有关频带的频谱的有效值作为规定特征量。
频率变换部可按规定的时间间隔可从音频信号提取规定时间长度的信号部分。这时,特征量运算部包含对各频带频谱运算有关频带的频谱有效值的有效值运算部、以及运算有效值运算部运算出的各有效值的时间变化量有关的数值作为规定特征量的有效值时间变化运算部。
有效值时间变化运算部可把表示各有效值时间变化量的符号的二进制值作为规定特征量。有效值时间变化运算部还可把各有效值的时间变化量是否多于规定量的二进制值作为规定特征量。
频率变换部还可按规定时间间隔从音频信号提取规定时间长度的信号部分。这时,特征量运算部对所述频带提取部提取的各频带分别运算频带提取部提取的频带的频谱与频带同于该频带且信号部分不同于导出该频谱的信号部分的频谱的相关值,并且运算所求出的各相关值有关的数值作为规定特征量。
特征量运算部可把表示求出的各相关值的符号的二进制值作为规定特征量。
特征量运算部也可把求出的各相关值的时间变化量有关的数值作为规定特征量。
其次,第2方面是具有信号提取部和特征量运算部的特征量提取装置。信号提取部从输入的音频信号提取多个规定时间长度的信号部分。特征量运算部运算信号提取部提取的多个信号部分中某信号部分与不同于该信号部分的信号部分的相关值并且运算所求出的相关值有关的值作为音频信号的特征量。
特征量运算部通常可把相关值作为音频信号的特征量。特征量运算部也可把表示相关值的符号的二进制值作为音频信号的特征量。
信号提取部可按规定的时间间隔提取信号部分。这时,特征量运算部包含按规定时间间隔运算相关值的相关值运算部、以及运算相关值的时间变化量作为音频信号的特征量的相关值时间变化运算部。
再次,第3方面是具有频率变换部、包络线导出部和特征量运算部的特征量提取装置。频率变换部通过对输入的音频信号包含的规定时间长度的信号部分进行频率变换导出该信号部分的频谱。包络线导出部导出表示频率变换部求出的频谱的包络线的包络线信号。特征量运算部运算包络线导出部导出的包络线信号的极值有关的数值作为音频信号的特征量。
特征量运算部可把作为取包络线导出部导出的包络线信号的极值的频率的极值频率当作音频信号的特征量。
特征量运算部可包含运算取作为包络线导出部导出的包络线信号的极值的频率的极值频率的极值频率运算部、以及运算相邻极值频率的间隔作为音频信号的特征量的间隔运算部。间隔运算部可把根据对规定的基准值的比率表现间隔的数值作为音频信号的特征量。
上文中,间隔运算部还可把极值频率内最低的频率作为规定的基准值。间隔运算部又可把极值频率中最低的频率与第2低的频率的差值作为规定的基准值。
本发明也可提供含第1至第3方面所涉及的特征量提取装置作为节目记录装置,又可提供含第1至第3方面所涉及的特征量提取装置作为节目重放控制装置。
如上文所述,根据第1方面,把频谱划分成多个频带,对每一频带提取特征量。由此,与不划分频率时相比,能容易得到较多的特征量。由于能得到较多的特征量能较明确地进行音频信号的识别。
又,频带提取部提取有关频带,使应提取的各频带间产生规定的间隔时,能提高对音频信号加工和外部噪声的稳健性。
特征量为时间变化量(例如波峰频率的时间变化量、有效值的时间变化量)时,可对音频信号在时间轴上的变化,提高稳健性。
有关划分频带间的变化的量为特征量时,可对音频信号在时间轴上的变化,提高稳健性。
此外,根据第2方面,由于将有关时间变化的量作为特征量,可对音频信号在时间轴上的变化,提高稳健性。
又,根据第3方面,由于将频谱包络线的极值作为特征量,能方便地计算特征量。而且,将极值频率的间隔比作为特征量时,能提高对音频信号作变速等加工时的稳健性。
又,由于用二进制值表现特征量,能减少特征量的数据量。因此,在将特征量用作声印进行音频信号检索的装置中,能减少必须存储的数据量。而且,将一声印与其他声印比较的处理简便。
参照附图,从以下的详细说明会进一步明白本发明的这些和其他目的、特征、发明点、效果。


图1是示出实施形态1所涉及特征量提取装置的组成的框图;图2是说明一例把频谱划分成多个频带的图;图3是示出一例频带提取部12提取的频带频谱的图;图4是示出一例以离散的方式划分频谱的图;
图5是峰值计算法说明图。
图6是示出计算波峰频率变化量时的特征量运算部13的组成的框图;图7是示出计算频带间波峰频率差值时的特征量运算部13的组成的框图;图8是示出计算有效值时间变化量时的特征量运算部13的组成的框图;图9是示出计算相关值时的特征量运算部13的组成的框图;图10是示出计算相关值时间变化量时的特征量运算部13的组成的框图;图11是示出实施形态1的特征量提取装置的组成的框图;图12是实施形态2的特征量计算方法说明图;图13是示出计算相关值时间变化量作为特征量时的特征量运算部113的组成的框图;图14是示出实施形态3的特征量提取装置的组成的框图;图15是从包络线信号计算极值频率的方法的说明图;图16是从包络线信号计算极值频率的方法的说明图;图17是示出特征量计算极值频率间隔比时的特征量运算部143的组成的框图;图18是极值频率间隔计算法说明图;图19是示出采用实施形态4的节目记录装置的系统的组成的图;图20是示出实施形态4的节目记录装置的详细组成的框图;图21是示出采用实施形态5的节目记录装置的系统的组成的图;图22是示出一例预约信息的图;图23是示出实施形态4的节目记录装置的详细组成的框图;图24是示出实施形态5的节目记录装置的处理流程的流程图;图25是示出采用实施形态6的节目记录装置的系统的组成的图;图26是示出采用实施形态7的节目重放控制装置的系统的组成的图;图27是示出采用实施形态8的节目编辑装置的系统的组成的图;图28是说明已有声印技术中存储声印信息的过程的框图;图29是说明用声印进行音频信号识别的过程的框图。
具体实施形态实施形态1首先说明本发明实施形态1的特征量提取装置。实施形态1中,从音频信号提取多个频带的频谱,并根据提取的各频带的频谱计算特征量。
图1是示出实施形态1的特征量提取装置的组成的框图。图1中,特征量提取装置具有频率变换部11、频带提取部12和特征量运算部13。在频率变换部11输入应提取特征量的音频信号。频率变换部11通过对所输入音频信号包含的规定时间长度的信号部分进行频率变换,导出该信号部分的频谱。即,频率变换部11按时间划分音频信号,并对划分后的信号部分导出频谱。频带提取部12从频率变换部11导出的频谱提取多个频带。也就是说,频带提取部12按频率划分一部分时分音频信号的频谱,并提取划分所得的多个频带的一部分或全部。特征量运算部13对频带提取部12提取的各频带的频谱计算特征量,并且把算出的各特征量作为音频信号的特征量。下面说明实施形态1的特征量提取装置的动作。
图1中,在频率变换部11输入应提取特征量的音频信号时,频率变换部11通过对音频信号进行频率变换,导出频谱。利用例如快速傅里叶变换进行频率变换。快速傅里叶变换采用从音频信号提取的有限个样本进行运算,因而频率变换部11在进行运算处理前从音频信号切出与快速傅里叶变换所需采样点数相当的时间长度的信号。频率变换部11切出的信号部分可以是一个,也可以是多个。切出多个信号部分时,各信号部分可切成在时间轴上重复,也可不重复。通过对切出的各信号部分分别进行频率变换,导出各信号部分的频谱。将频率变换部11导出的频谱输出到频带提取部12。切出多个信号部分时,从音频信号中先前包含的信号部分的频谱依次输出各频谱。
频带提取部12将频率变换部11输出的频谱划分成多个频带。图2是说明一例将频谱划分成多个频带的图。图2所示的例子中,该图示出的4条虚线把频谱划分成5个频带。频带提取装置12在划分后的频谱中提取多个频带的频谱。这里,把划分成频带的频谱称为频带频谱。频带提取部12从频率变换部11依次输出的各信号部分的频谱分别提取相同的频带。提取的多个频带输出到特征量运算部13。切出多个信号部分时,频带提取部12以一个频谱为单位,输出频带频谱。即,频带提取装置12每次输入一个频谱,就输出从输入的频谱提取的多个频带频谱。
作为在频带提取部12进行划分的方法,最简单且有效的是按照线性刻度等间隔划分频率。考虑音阶和谐等特性时,也可考虑按照对数刻度等间隔划分频率。此外,划分方法也可以是任何方法。
如图2所示,频带提取部12可用于在以任意方法划分的频带中选择特定频带,并计算特征量。图3是示出一例频带提取部12提取的频带频谱的图。图3所示的例子中,仅提取高于频率f1、低于频率f2的频带包含的频带频谱。这时,对图3所示斜线部分的频带频谱,即低于频率f1的频带包含的频带频谱和高于频率f2的频带包含的频带频谱,不计算特征量。例如,用MP3那样的压缩技术进行编码的音频信号中,可执行操作,删除人类听觉特性上不能听到的高频带的信息。因此,对执行这种操作的音频信号提取特征量时,删除信息的高频带的特征量不能起作为声印的作用。于是,如图3所示,通过从特征量运算对象中去除可删除特征量的高频段的频带频谱,能免去无用特征量的处理。即,能用不多的运算仅提取对识别音频信号有效的特征量。还可减少特征量的数据量。
频带提取部12也可按离散方式划分应划分的各频带使其无相互连接的部分和重复的部分。图4示出以离散方式划分频谱的一个例子。如图4所示,以离散方式划分频谱时,频带提取部12提取的各频带频谱之间存在间隔。因此,音频信号由于某些原因而变化时(例如对音频信号进行加工时、音频信号含有外部噪声时),也能正确识别该音频信号。即,能提高对音频信号加工和外部噪声的稳健性。下文说明其详况。
音频信号因噪声而变化时,从频率变换部11输出的频谱也产生失真或偏差。结果,作为特征量算出的值有可能大变化。这里,例如图2所示的划分方法(非离散划分法)中,在划分的边界附近存在作为特征量计算的信息时,频谱产生的失真或偏差不仅影响产生失真或偏差的频带,而且可能影响其相邻的频带。具体而言,将取频带频谱的峰值的频率(下文称为“波峰频率”)用作特征量时,考虑因音频信号变化而波峰频率变化的情况。这时,音频信号变化,使波峰频率从某频带移动到相邻的频带。因此,两个频带中,特征量都变化。即,提取的特征量大变化。与此相反,如图4所示,离散划分时,假设波峰频率变化,该变化也不影响两个频带。因此,利用离散划分,能吸收音频信号变化造成的一些特征量变动,可谋求提高特征量提取稳健性。
以上那样将频谱划分成多个频带频率,与不划分时相比,能用较少的运算量提取许多特征量。因此,可用较多的特征量产生精度较高的声印。通过用多个频带频谱计算特征量,还可将新的特征量用作声印。
下面详细说明特征量运算部13的动作。下文中,作为应计算的特征量的具体例,说明运算波峰频率、波峰频率时间变化量、波峰频率的频带间差值、有效值、有效值时间变化量、相关值和相关值时间变化量的情况。
首先说明特征量是波峰频率的情况。图5是峰值算法说明图。如上文所述,波峰频率是指频带频谱中取峰值的频率。图5中,波峰频率是fp1~fp4,共4个。该图内,作为频带频谱,不提取低于f3的频带和高于f4的频带。特征量运算部13对各频带频谱运算波峰频率,作为特征量。具体而言,将频带提取部12提取的各频带频谱输入到特征量运算部13,则特征量运算部13每一划分频带查找频谱幅度示出最大值的频率。然后,将各频带内频谱值最大的频率作为波峰频率。这样,就能方便地检测波峰频率。通过将波峰频率用作特征量,能提取可在与不同的音频信号比较中完全识别的特征量。
其次说明特征量为波峰频率时间变化量的情况。图6是示出运算波峰频率时间变化量时特征量运算部13的组成的框图。图6中,该运算部13具有波峰频率运算部61、波峰频率保持部62和波峰频率时间变化运算部63。波峰频率运算部61从输入的频带频谱计算波峰频率。波峰频率算法如上文所述。对输入的各频带频谱进行波峰频率的运算。算出的各波峰频率输出到波峰频率保持部62和波峰频率时间变化运算部63。
波峰频率保持部62将波峰频率运算部61输出的波峰频率保持规定的时间。该规定时间是从频率提取部12输出由某信号部分的频谱提取的各频带频谱到输出由下一信号部分的频谱提取的各频带频谱为止的时间。经过规定时间后,波峰频率保持部62把保持的波峰频率输出到波峰频率时间变化运算部63。
波峰频率时间变化运算部63计算波峰频率运算部61输出的波峰频率与波峰频率保持部62输出的波峰频率的差值。对从相同频带的频带频谱算出的2个波峰频率进行该差值运算。还对各频带频谱运算该差值。对各频带频谱算出的差值为特征量。
特征量是波峰频率时间变化量时,波峰频率保持部62也可保持上述规定时间的整数倍时间、波峰频率。
波峰频率时间变化运算部63可用二进制值表现上述差值。例如可用差值的符号正时为0、负时为1的二进制值表示。这时,用二进制值表现的特征量表示波峰频率在时间轴上的增减。例如可用差值的绝对值超过某规定门限值,则为1,否则为0的二进制值表现。这时,用二进制值表现的特征量表示波峰频率在时间轴上变化或几乎不变。作为特征量的差值用二进制值表现,能减少特征量的数据量。实施形态1中,用于划分频带,特征量的数量比不划分频带时多,因而通过用二进制值表现特征量,能有效减少数据量。
以上那样,特征量为波峰频率时间变化量,能方便地计算特征量。而且,通过将有关时间变化的量作为特征量,能对音频信号在时间轴上的变化,提高稳健性。
接着说明特征量为波峰频率的频带间差值的情况。图7是示出运算波峰频率的频带间差值时的特征量运算部13的组成的框图。图7中,特征量运算部13具有第1波峰频率运算部71。第2波峰频率运算部72和波峰频率差运算部73。第1波峰频率运算部71从输入的频谱计算波峰频率。波峰频率算法如上文所述。对输入的各频带频谱进行波峰频率运算。算出的各波峰频率输出到波峰频率差运算部73。
第2波峰频率运算部72进行与第1波峰频率运算部71相同的处理。波峰频率差运算部73运算从第1波峰频率运算部71输出的波峰频率与第2波峰频率运算部72输出的波峰频率的差值。对分别从相邻2个频带的频带频谱算出的2个波峰频率进行该差值运算。例如计算某波峰频率与根据在高频侧和算出该波峰频率的频带频谱相邻的频带频谱算得的波峰频率的差值。对各频带频谱计算此差值,将其作为特征量。
以上那样,特征量为波峰频率的频带间差值,能方便地计算特征量。而且,通过将有关频带间变化的量作为特征量,能对音频信号在时间轴上的变化,提高稳健性。
与时间变化量时相同,频带间的差值也可用二进制值表现。作为特征量的差值用二进制值表现,能减少特征量的数据量。
本实施形态中,计算波峰频率的差值的2个频带不限于相邻的2个频带,也可以是从频带提取部12提取的多个频带中选择的任意2个频带。
接着说明特征量为有效值的情况。这时,特征量运算部13运算所输入各频带频谱的有效值,即运算频谱的均方根,作为特征量输出。因此,特征量的计算方便,能提取与不同的音频信号比较中可充分识别的特征量。
下面说明特征量为有效值时间变化量的情况。图8是示出计算有效值时间变化量时特征量运算部13的组成的框图。图8中,特征量运算部13具有有效值运算部81、有效值保持部82和有效值时间变化运算部83。有效值运算部81从输入的频带频谱计算有效值。除计算有效值代替波峰频率这点外,有效值运算部81的处理与波峰频率运算部61的处理相同。算出的各有效值输出到有效值保持部82和有效值时间变化运算部83。除计算有效值代替波峰频率这点外,有效值保持部82和有效值时间变化运算部83的处理与波峰频率保持部62和波峰频率时间变化运算部63的处理相同。而且,与波峰频率差值作为特征量时相同,其差值也可用二进制表现。
以上那样,特征量为有效值时间变化量,能方便地计算特征量。而且,通过将有关时间变化的量作为特征量,能对音频信号在时间轴上的变化,提高稳健性。
接着说明特征量为相关值的情况。图9是示出计算相关值时的特征量运算部13的组成的框图。图9中,特征量运算部13具有频谱保持部91和相关值运算部92。
频谱保持部91将频带提取部12输出的各频带频谱保持规定时间。规定时间是从频带提取部12输出由某信号部分频谱提取的各频带频谱到输出由下一信号部分的频谱提取的各频带频谱为止的时间。经过规定时间后,频谱保持部91把保持的频带频谱输出到相关值运算部92。
相关值运算部92运算频带提取部12输出的频带频谱与频谱保持部91输出的频带频谱的相关值。该相关值的计算对相同频带的频带频谱进行。又,该相关值的计算对各频带频谱进行。对各频带算出的相关值为特征量。
相关值运算部92可用二进制值表现所述相关值。例如可用相关值的符号正时为1、负时为0的二进制值表示。因此,能减少特征量的数据量。
以上那样,特征量为相关值,能方便地计算特征量。而且,通过将有关时间变化的量作为特征量,能对音频信号在时间轴上的变化,提高稳健性。
接着说明特征量为相关值时间变化量的情况。图10是示出计算相关值时间变化量时的特征量运算部13的组成的框图。图10中,特征量运算部13具有频谱保持部101、相关值运算部102、相关值保持部103和相关值时间变化运算部104。
频谱保持部101和相关值运算部102的处理与图9所示的频谱保持部91和相关值运算部92相同。算出的各相关值输出到相关值保持部103和相关值时间变化运算部104。除保持相关值代替波峰频率这点外,相关值保持部103的处理与波峰频率保持部62的处理相同。相关值运算部104的处理除计算相关值代替波峰频率外,其余与波峰频率时间变化运算部63的处理相同。而且,与波峰频率差值为特征量时相同,也可用二进制值表现差值。
以上那样,特征量为相关值时间变化量,能方便地计算特征量。而且,通过将有关时间变化的量作为特征量,能对音频信号在时间轴上的变化,提高稳健性。
实施形态2下面说明本发明实施形态2的特征量提取装置。实施形态2从音频信号提取时间不同的多个信号部分,将有关提取的信号部分间的相关值的数值作为特征量。将这种数值作为特征量,能提高特征量提取稳健性。
图11是示出实施形态1所涉及特征量提取装置的组成的框图。图1中,特征量提取装置具有信号提取部111、信号保持部112和特征量运算部113。信号提取部111输入应提取特征量的音频信号。信号提取部111从输入的音频信号提取各个规定时间长度的信号部分。信号保持部112将信号提取部11提取的信号部分保持规定时间后,将其输出到特征量运算部113。特征量运算部113运算信号提取部111提取的信号部分与信号保持部112输出的信号部分的相关值。下面详细说明实施形态2的特征量提取装置的动作。
图11中,信号提取部111输入音频信号,就从该音频信号提取多个规定时间长度的信号部分。图12是实施形态2的特征量计算方法的说明图。图12中,用斜线表示的部分是信号提取部111提取的信号部分。该图中提取多个规定时间长度T1的信号部分。在信号提取部111预先决定规定时间长度。以音频信号时间轴上的时间T2的间隔提取各信号部分。这并不意味着从时间T2进行提取信号部分的处理。提取的信号部分从音频信号中先前包含的信号部分开始,依次输出到信号保持部112和特征量运算部113。信号部分的提取方法只要是提取相同时间长度(图12中为T1)的方法,任何方法均可。例如图12中,将提取的各信号部分提取得不相互重复,但也可提取得产生重复。图12中还在各信号部分之间空开间隔,以提取各信号部分,但提取信号部分也可不在各信号部分之间空开间隔。
信号保持部112将信号提取部111输出的信号部分保持规定时间。该规定时间是从信号提取部111输出某信号部分到输出下一信号部分为止的时间。经过规定时间后,信号保持部112将保持的信号部分输出到特征量运算部113。因此,信号保持部112在该时刻输出时间T1前信号提取部111输出的信号部分。取图12为例进行说明,则在信号提取部111输出信号部分122的时刻,信号保持部112输出信号部分121。在信号提取部111输出信号部分123的时刻,信号保持部112输出信号部分122。
特征量运算部113运算信号提取部111输出的信号部分与信号保持部112输出的信号部分的相关值。取图12为例进行说明,则例如特征量运算部113计算信号部分121与信号部分122的相关值和信号部分122与信号部分123的相关值。实施形态2中,有关此相关值的数值为特征量。例如特征量可以是相关值本身,也可以是相关值的时间变化量。下面详细说明特征量是相关值的情况和特征量是相关值时间变化量的情况。
首先说明特征量是相关值的情况。这时,特征量提取部113将所述相关值本身作为特征量。图12中,对信号提取部111提取的各信号部分计算有关信号部分与下一信号部分(音频信号的时间T2后的信号部分)的相关值作为特征量。特征量运算部113可将表示相关值的符号的二进制值作为特征量。
其次说明特征量为相关值时间变化量的情况。图13是示出算出相关值时间变化量作为特征量时的特征量运算部113的组成的框图。图13中,特征量运算部113具有相关值运算部131、相关值保持部132和相关值时间变化运算部133。
相关值运算部131输入信号提取部111和信号保持部112输出的信号部分,运算输入的2个信号部分的相关值。算出的相关值输出到相关值保持部132和相关值时间变化运算部133。
相关值保持部132将相关值运算部131输出的相关值保持规定时间。该规定时间是从相关值运算部131输出某相关值到输出下一相关值为止的时间。经过规定时间后,相关值保持部132将保持的相关值输出到相关值时间变化运算部133。因此,相关值保持部132不输出在该时刻从相关值运算部131的相关值而输出1次前相关值运算部131输出的相关值。
相关值时间变化运算部133运算从相关值保持部132输出的相关值减去相关值运算部131输出的相关值所得的差值,作为特征量。该差值表示相关值的时间变化量。相关值时间变化运算部133可将表示相关值时间变化量的符号的二进制值作为特征量。
如以上那样,实施形态2把时间不同的2个信号部分的相关值有关的数值用作特征量。这样把特征量取为有关相关值的数值,能方便地计算特征量。而且,将有关时间变化的量作为特征量,对音频信号时间轴上的变化能提高稳健性。
实施形态2中,相关值的计算过程计算某信号部分与其相邻信号部分的相关值。具体如图12所示,计算信号部分121与其后的信号部分122的相关值。这里,在其他实施例中,相关值未必计算相邻2个信号部分的相关值。例如也可计算某信号部分与该信号部分后的第2个信号部分的相关值。取图12为例进行说明,则可计算信号部分121与信号部分123的相关值。
实施形态3下面说明本发明实施形态3的特征量提取装置。实施形态3还导出从音频信号导出的频谱的包络线信号,并将取包络线信号的极值的频率及其有关数值作为特征量。将这种数值作为特征量,能提高特征量提取稳健性。
图14是示出实施形态3的特征量提取装置的组成的框图。图1中,特征量提取装置具有频率变换部141、包络线导出部142和特征量运算部143。频率变换部141与图1所示的频率变换部1相同。包络线导出部142导出表示频率变换部141输出的频谱的包络线的包络线信号。特征量运算部143运算取包络线导出部142导出的包络线信号的极值的频率(下文称为“极值频率”),将有关极值频率的数值作为特征量。下面详细说明实施形态3的特征量提取装置。
图14所示的频率变换部141与图1所示的频率变换部1相同,因而省略详细说明。从频率变换部141输出音频信号的频谱时,包络线导出部142检测频谱的包络线。通过取得频谱包络线,能发现音频信号频率范围的缓慢变动。将表示包络线导出部142检测出的包络线的包络线信号输出到特征量运算部143。
特征量运算部143从包络线导出部142输出的包络线信号算出极值频率。进而,将有关极值频率的数值作为音频信号的特征量。作为有关极值频率的数值,除极值频率本身外,例如还可考虑极值频率的间隔比。下面详细说明作为特征量运算的极值频率有关的数值。
图15和图16是从包络线信号计算极值频率的方法的说明图。将极值频率作为特征量时,也可以不把取包络线信号极值的全部频率作为特征量。例如,如图15所示,可仅把取包络线信号极大值的频率(下文称为“极大值频率”)作为特征量。或者,如图16所示,仅把取包络线信号极小值的频率(下文称为“极小值频率”)作为特征量。
实施形态3中,特征量也可以是极值频率间隔比。图17是示出特征量运算极值频率间隔比时的特征量运算部143的组成的框图。图17中,特征量运算部43具有极值频率运算部171和间隔运算部172。
极值频率运算部171从包络线导出部142输出的包络线信号运算极值频率。极值频率可仅为极大值频率或极小值频率,也可为极大值和极小值两者。算出的极值频率输出到间隔运算部172。
间隔运算部172运算极值频率的间隔。图18是极值频率间隔算法说明图。在极值频率间隔运算处理中,间隔运算部172首先对各极值频率求与其相邻极值频率的差值。取图18为例进行说明则求差值d1~d5。图18中,极值频率运算部171仅运算极大值频率作为极值频率。还可将该差值用作特征量。实施形态3中,间隔运算部172进一步运算求出的各差值与预定的基准值的比。算出的比是极值频率间隔比,为音乐信号的特征量。基准值可为任何值。例如可将极值频率中最低频率的值、最低频率与第2低频率的差值等作为基准值。如以上那样,实施形态3将频谱包络线的极值作为特征量,因而能方便地计算特征量。而且,将极值频率间隔比作为特征量时,能提高对音频信号作变速加工时的稳健性。
实施形态4下面说明使用实施形态1~3中说明的特征量提取装置的应用例。实施形态4是将实施形态1~3的特征量提取装置用于对电视节目录像的节目记录装置的形态。此节目记录装置通过从节目中流动的乐曲识别节目,对希望的节目进行自动录像。
图19是示出使用实施形态4的节目记录装置的系统的组成的图。图19所示的系统具有接收装置191、节目记录装置192和记录媒体193。接收装置191例如由天线等组成,以接收广播信号。该广播信号除由广播台(台中未示出)利用无线广播外,还可经诸如电缆、光缆有线广播。接收装置191接收的广播信号输出到节目记录装置192。节目记录装置192根据有关节目中流动的乐曲识别广播信号中包含的应录像的节目,将该节目记录到记录媒体193。记录节目的记录媒体193例如可为磁带、CD-R或DVD-RAM那样的记录型光盘、硬盘驱动器或者半导体存储器。下面说明节目记录装置192的详细动作。
图20是示出实施形态4的节目记录装置的详细组成的框图。图20中,节目记录装置192具有特征量提取部201、特征量比较部202、特征量存储部203和记录控制装置204。记录控制部204和特征量提取部201输入从接收装置191输出的广播信号。该信号至少包含视频信号和音频信号。在记录控制部204输入视频信号和音频信号。另一方面,特征量提取部201仅输入广播信号包含的音频信号。或者,特征量提取部201本身可具有从广播信号提取音频信号的功能。特征量提取部201提取音频信号的特征量。特征量提取部201是实施形态1~3所涉及特征量提取部中的任一个。因此,特征量是实施形态1~3中说明的数值(波峰频率或相关值等)。特征量的提取方法也与实施形态1~3相同,因而这里不说明其详况。提取的特征量输出到特征量比较部202。
另一方面,特征量存储部203预先存储应录像的节目中流动的音乐的音频信号的特征量。例如存储应记录的节目的主题曲、插入曲或结束曲等应记录的节目中流动的乐曲的特征量。特征量存储部203保持的特征量,其取得方法可任意。特征量取得方法任何方法均可,具体方法在后文的实施形态5和6阐述。
特征量存储部203除上述特征量外,还存储表示控制指示的信息(下文称为“控制指示信息”),使其与特征量存在对应关系。控制指示是指控制记录控制部204的动作用的指示。控制指示信息的内容通常是“记录开始”、“记录结束”。记录控制部204收到表示记录开始的控制指示信息时,开始进行节目记录。收到表示节目结束的控制指示信息,则结束节目记录。特征量存储部203存储1组以上的特征量和控制指示信息。
例如特征量存储部203中,预先使“记录开始”的控制指示信息与节目开始时流动的主题曲的特征量有对应关系,而“节目结束”的控制指示信息与节目结束曲的特征量有对应关系。据此,能可靠地检测出节目的开始和结束。此外,还可考虑节目中进入CM时,预先使“节目结束”的控制指示信息进入CM前流动的乐曲的特征量有对应关系,而“节目结束”的控制指示信息与CM结束且节目重新开始时的乐曲的特征量有对应关系。因此,具有可以不使CM录像的优点。
特征量比较部202对特征量提取部201提取的特征量和特征量存储部203存储的特征量进行比较。然后,判断2个特征量是否一致。此判断对特征量存储部203存储的全部特征量进行。判断的结果为2个特征量一致时,特征量比较部202对记录控制部204输出控制指示信息。输出到记录控制部204的控制指示信息,其内容根据特征量存储部203存储的内容决定。具体而言,将特征量存储部203中与判断为一致的特征量有对应关系的控制指出信息的内容输出到记录控制部204。反之,判断为不一致时,不输出控制指示信息。
上述特征量比较也可识别2个特征量是否类似,以代替判断2个特征量是否一致。
记录控制部204按照特征量比较部202输出的控制指示信息进行动作。例如从特征量比较部202收到“记录开始”的控制指示信息时,随之开始进行节目记录。从特征量比较部202收到“记录结束”的控制指示信息,则随之结束节目记录。
如以上那样,可将实施形态1~3的特征量提取装置用作节目记录装置。此节目记录装置在特征量存储部预先存储特征量即可,不需要预先存储节目中流动乐曲数据本身。因此,该节目记录装置与乐曲数据本身被预先存储时相比,能减少预先存储的数据量。
以上说明的节目记录装置即使在节目广播开始时刻突然变化或节目广播突然延长的情况下,也能可靠地记录节目。而且,如上文所述,记录节目,可去除CM。此外,如果在特征量存储部存储用户中意的乐曲的特征量,则可仅记录节目中流动用户中意的乐曲的场面(例如能仅记录歌曲节目中用户中意的歌曲)。
实施形态5下面说明实施形态5。与实施形态4相同,实施形态5也是将实施形态1~3的特征量提取装置用于节目记录装置的形态。实施形态5详细说明取得节目记录装置中需要的含特征量与控制指示信息的对应关系的数据(后文所述的预约信息)的方法。
图21示出采用实施形态5的节目记录装置的系统的组成。图21所示的系统具有接收装置211、节目记录装置212、记录媒体213、预约信息取得部214、预约信息数据库215和特征量数据库216。接收装置211与图19所示的接收装置191相同,记录媒体213与图19所示的记录媒体193相同。
实施形态5的节目记录装置中,通过预约信息取得装置214从预约信息数据库215取得进行节目记录处理时需要的预约信息。预约信息是指包含特征量与控制指示信息的对应关系的信息。除该信息外,预约信息还可包含有关节目的信息。
预约信息取得装置214例如是连接网络的个人计算机。用户利用预约信息取得装置214从预约信息数据库215取得想要记录节目的预约信息。具体而言,预约信息取得装置214按照用户的输入,通过网络将识别用户要记录节目的信息和取得有关节目的预约信息的要求发送给预约信息数据库215。预约信息数据库215接收来自预约信息取得装置214的要求,把相当的节目的预约信息送到预约信息取得装置214。据此,预约信息取得装置214能取得应记录的节目的预约信息。预约信息取得装置214将取得的预约信息输出到节目记录装置212。以此在节目记录装置212设定预约信息。
图22所示为一例预约信息。以1个节目为单位产生预约信息,其中包含有关节目的信息。图22所示的例子中,作为有关节目的信息,包含节目ID、节目名、播放日期、开始时间、结束时间、频道和录像信息。作为预约信息,除取得这些信息外,用户还可在节目记录装置212或预约信息取得装置214进行输入。预约信息还包含附加信息。附加信息是有关节目内容的信息,具体包含表演者、节目内容、乐曲信息。该乐曲信息包含节目记录装置212的节目记录处理中需要的特征量和控制指示信息的组。此外,乐曲信息包含乐曲类型、乐曲ID、乐曲名和乐曲部分数据。乐曲类型是表示在节目中如何使用的信息。作为乐曲类型,例如可考虑节目开始时流动主题曲、节目结束时流动的结束曲、进入CM前流动的CM前插入曲和CM结束且节目重新开始时流动的CM后插入曲。可根据乐曲类型判断节目记录开始或结束。据此,其他实施形态中,也可将乐曲类型用作控制指示信息。乐曲部分数据是指该乐曲的部分音频数据。
图21所示的特征量数据库216存放所述预约信息包含的乐曲名、乐曲ID和特征量。因此,预约信息取得装置214取预约信息时,可从特征量数据库216取得乐曲名、乐曲ID和特征量。
图21所示的系统组成中,预约信息数据库215和特征量数据库216设为分开的独立体,但在其他实施形态中,也可用单一的装置构成。图21所示的系统组成中,预约信息数据库215和特征量数据库216通过网络连接预约信息取得装置214,但也可直接连接预约信息取得装置214。
下面说明实施形态5的节目记录装置212的详细组成。图23是示出实施形态4的节目记录装置的详细组成的框图。图23中,节目记录装置212具有特征量提取部212、特征量比较部232、特征量存储部233、记录控制部234、预约信息管理部235和预备记录部236。下面详细说明节目记录装置212的动作。
图24是示出实施形态5的节目记录装置的处理流程的流程图。图24中示出节目记录装置212输入预约信息,并开始进行节目记录前的处理。实施形态5中,特征量提取部231、特征量比较部232、特征量存储部233和记录控制部234进行与图20所示的特征量提取部201、特征量比较部202、特征量存储部203和记录控制部204同样的动作。
图24中,首先,预约信息管理部235从预约信息取得装置214取得预约信息(步骤S1)。其次,预约信息管理部235监视预约信息包含的节目开始时刻(步骤S2),根据开始时刻判断是否开始记录节目用的处理(步骤S3),根据当前的时刻是否是开始时刻进行此判断处理。即,当前的时刻是开始时刻,在通过进行步骤S4及其后的处理,开始进行记录节目用的处理。反之,当前的时刻不是开始时刻,在预约信息管理部235返回步骤S2的处理。即,预约信息管理部235等待到当前的时刻是开始时刻。
记录节目用的处理中,预约信息管理部235首先启动广播信号的监视(步骤S4)。即,开始对记录控制部234输入广播信号。步骤S4中,预约信息管理部235把在步骤S1取得的预约信息所含的特征量和控制指示信息的组存储到特征量存储部233。
步骤S4后,特征量提取部231提取广播信号包含的音频信号的特征量(步骤S5)。接着,特征量比较部232对步骤S5中由特征量提取部231提取的特征量与特征量存储部233在步骤S4存储的特征量进行比较。然后,判断这2个特征量是否一致(步骤S6)。2个特征量一致时,进行S7的处理。反之,不一致,则进行步骤S5的处理,并且重复步骤S5和步骤S6的处理,直到这2个特征量一致。
步骤S6的判断为肯定时,记录控制部234开始进行节目记录(步骤S7)。图24的说明假设步骤S6这判断为特征量一致的音乐信号是控制指示信息指示“节目开始”的信号。至此,图24所示的处理结束。此后,结束节目记录,但结束节目记录的处理与实施形态4时相同。
实施形态5中,节目记录装置212在节目记录开始前,可预先把广播信号暂时记录到预备记录部236。例如可考虑将节目开始起10分钟后流动应记录的节目的主题曲作为预约信息提供,而使其为已知的情况。这时,记录控制部234在预备记录部236记录规定时间的广播信号,不管有无特征量比较部232输出的控制指示信息。所述例子中,记录10分钟广播信号就足够。预备记录部236可记录从当前时刻到规定时间前的广播信号,也可放弃规定时间以上之前的广播信号。此状态下,特征量比较部232输出控制指示信息时,记录控制部234将预备记录部236记录的广播信号与其后接收的广播信号一起记录到记录媒体213。由此,即使在节目广播开始的时刻无流动开始节目记录用的主题曲,也能从始端记录节目。
如以上那样,实施形态5中,也能得到应实施形态4相同的效果。而且,根据实施形态5,节目记录装置能方便地从预约信息数据库取得预约信息,因而不需要用户又输入预约信息,又在节目记录装置进行特征量运算处理。
实施形态5中,可做成用户能利用预约信息取得装置编辑从预约信息数据库取得的预约信息。例如用户可独自设定开始时刻和结束时刻等信息。用户也可输入部分预约信息。用户进行输入的状态包括用G码进行输入的状态。预约信息数据库存放的预约信息可包括数字广播中用的EPG。也可做成预约信息包含广播信号,并且通过接收广播信号能取得预约信息的形态。
实施形态5中,预约信息也可包含记录节目时设定图像质量和声音质量的信息或记录位速率信息。预约信息管理部235可根据这些信息控制记录控制部234。
实施形态6
下面说明实施形态6。与实施形态4相同,实施形态6是实施形态1~3的特征量提取装置用于节目记录装置的形态。实施形态6的不同点是从记录媒体过去记录的信息取得预约信息。
图25示出实施形态6的节目记录装置用的系统的组成。图25所示的系统具有接收装置251、节目记录装置252、记录媒体253和预约信息取得装置254。图25所示的系统中,预约信息取得装置254以外的各装置的动作与实施形态4或5相同。
实施形态6的广播信号包含成为预约信息的信息,并且记录节目时,也将该信息包含在内,记录到记录媒体253中。预约信息取得装置254取预约信息时,根据用户的输入从记录媒体253取得预约信息。预约信息包含的特征量在记录媒体253记录广播信号时,可与广播信号一起得到记录,也可在预约信息取得装置254取预约信息时,由节目记录装置252内的特征量提取部提取。
如以上那样,实施形态6即使不通过网络从预约信息数据库取得,也能取得预约信息。实施形态6所示的系统能再次利用过去记录的节目数据,因而不需要反复取相同的预约信息,具有开头取一次,就能使第2次及其后的获取处理简化的优点。具体而言,有利于对每天广播的新闻节目、每周广播的连续戏剧等定期广播节目进行录像的场合。
实施形态7下面说明实施形态7。实施形态7是实施形态1~3的特征量提取装置用于节目重放控制装置的形态。
图26示出采用实施形态7的节目重放控制装置的系统。图27所示的系统具有节目重放控制装置261和重放装置262。图中虽未示出,但本系统包含接收装置。该接收装置功能与图19所示的接收装置相同。
节目重放控制装置261具有特征量提取部263、特征量比较部264、特征量存储部265和重放控制部266。重放控制部266以外的组成要素进行与图19所示组成要素相同的动作。重放控制部266按照特征量比较部264输出的控制指示信息,进行启动重放和结束重放的动作。实施形态7中,控制指示信息是指示有关广播信号重放动作的信息(“重放开始”、“重放结束”)。在重放开始前和重放结束后,重放装置262不进行重放动作。
利用上述组成,重放装置262仅重放用户期望的节目。可去除CM,进行重放。在广播信号已得到接收,并且保持在节目重放控制装置261或接收装置中时,可跳过CM,连续重放广播信号,而不在CM期间停止广播信号的重放。
实施形态8下面说明实施形态8。与实施形态7相同,实施形态8也是实施形态1~3的特征量提取装置用于节目编辑装置的形态。
图27示出采用实施形态8的节目编辑装置的系统的组成。图27所示的系统具有节目编辑装置271、重放装置272和记录媒体277。
实施形态8与实施形态7的不同点是具有记录媒体277,以代替接收装置。而且,节目编辑装置271还具有编辑部278,这点也不同。除这些以外,与实施形态7相同。记录媒体277存放的节目中,仅重放用户期望的节目,这点也与实施形态7相同。用户能一面试听这样重放的节目,一面利用编辑部278编辑该节目。在记录媒体277记录编辑部278编辑的节目数据。这时,可在编辑前的节目数据上进行盖写记录,也可作为另外的数据进行记录。
如以上那样,实施形态8的节目编辑装置可从记录媒体记录的多个节目数据中正确提取要进行编辑的节目,并使其重放。
以上所示的特征量提取装置能以较明确地识别一音频信号与另一音频信号为目的,加以利用。
以上详细说明了本发明,但上述说明的一切,只不过是本发明的示例,并非限定其范围。当然能进行各种改进和变换,而不脱离本发明的范围。
权利要求
1.一种特征量提取装置,其特征在于,具有通过对输入音频信号包含的规定时间长度信号部分进行频率变换导出该信号部分的频谱的频率变换部、从所述频率变换部导出的频谱提取多个频带并且输出作为提取的各频带的频谱的频带频谱的频带提取部、以及对各所述频带频谱运算规定的特征量并把算出的各规定特征量作为所述音频信号的特征量的特征量运算部。
2.如权利要求1中所述的特征量提取装置,其特征在于,所述频带提取部从所述频率变换部导出的频带提取按照频率轴上的线性刻度等间隔划分的多个频带。
3.如权利要求1中所述的特征量提取装置,其特征在于,所述频带提取部从所述频率变换部导出的频带提取按照频率轴上的对数刻度等间隔划分的多个频带。
4.如权利要求1中所述的特征量提取装置,其特征在于,所述频带提取部从所述频率变换部导出的频带仅提取频率在规定范围的频带。
5.如权利要求1中所述的特征量提取装置,其特征在于,所述频带提取部提取有关频带,使应提取的各频带间产生规定的间隔。
6.如权利要求1中所述的特征量提取装置,其特征在于,所述的特征量运算部对各所述频带频谱计算频谱为峰值的值即峰值,把某一频带的峰值与其他频带的峰值的差值作为所述规定的特征量。
7.所述特征量运算部利用表示其符号的二进制的值表达某频带的峰值与其他频带的峰值的差值。
8.如权利要求1中所述的特征量提取装置,其特征在于,所述的特征量运算部对各所述频带频谱计算频谱作为峰值的频率即波峰频率,并且把算出的波峰频率的值作为所述规定的特征量。
9.如权利要求8中所述的特征量提取装置,其特征在于,所述特征量运算部算出某频带的波峰频率与其他频带的波峰频率的差值,作为所述规定的特征量。
10.如权利要求9中所述的特征量提取装置,其特征在于,所述特征量运算部用表示该差值是否多于规定量的二进制值表现某频带的波峰频率与其他频带的波峰频率的差值。
11.如权利要求1中所述的特征量提取装置,其特征在于,所述频率变换部按规定的时间间隔从所述音频信号提取所述规定时间长度的信号部分,所述特征量运算部包含对各所述频带频谱运算作为频谱成为峰值的频率的波峰频率的波峰频率运算部、以及运算所述波峰频率运算部运算出的各波峰频率的时间变化量有关的数值作为所述规定特征量的波峰频率时间变化运算部。
12.如权利要求11中所述的特征量提取装置,其特征在于,所述波峰频率时间变化运算部把表示所述各波峰频率时间变化量的符号的二进制值作为所述规定特征量。
13.如权利要求11中所述的特征量提取装置,其特征在于,所述波峰频率时间变化运算部把表示所述各波峰频率时间变化量是否多于规定量的二进制值作为所述规定特征量。
14.如权利要求1中所述的特征量提取装置,其特征在于,所述特征量运算部对各所述频带频谱运算有关频带的频谱的有效值作为所述规定特征量。
15.如权利要求1中所述的特征量提取装置,其特征在于,所述频率变换部按规定的时间间隔从所述音频信号提取所述规定时间长度的信号部分,所述特征量运算部包含对各所述频带频谱运算有关频带的频谱有效值的有效值运算部、以及运算所述有效值运算部运算出的各有效值的时间变化量有关的数值作为所述规定特征量的有效值时间变化运算部。
16.如权利要求15中所述的特征量提取装置,其特征在于,所述有效值时间变化运算部把表示所述各有效值时间变化量的符号的二进制值作为所述规定特征量。
17.如权利要求15中所述的特征量提取装置,其特征在于,所述有效值时间变化运算部把表示所述各有效值的时间变化量是否多于规定量的二进制值作为所述规定特征量。
18.如权利要求1中所述的特征量提取装置,其特征在于,所述频率变换部按规定时间间隔从所述音频信号提取所述规定时间长度的信号部分,所述特征量运算部对所述频带提取部提取的各频带分别运算所述频带提取部提取的频带的频谱与频带同于该频带且信号部分不同于导出该频谱的信号部分的频谱的相关值,并且运算所求出的各相关值有关的数值作为所述规定特征量。
19.如权利要求18中所述的特征量提取装置,其特征在于,所述特征量运算部把表示求出的各相关值的符号的二进制值作为所述规定特征量。
20.如权利要求18中所述的特征量提取装置,其特征在于,所述特征量运算部把求出的各相关值的时间变化量有关的数值作为所述规定特征量。
21.一种特征量提取装置,其特征在于,具有从输入的音频信号提取多个规定时间长度的信号部分的信号提取部、以及运算所述信号提取部提取的多个信号部分中某信号部分与不同于该信号部分的信号部分的相关值并且运算所求出的相关值有关的值作为所述音频信号的特征量的特征量运算部。
22.如权利要求21中所述的特征量提取装置,其特征在于,所述特征量运算部把所述相关值作为所述音频信号的特征量。
23.如权利要求21中所述的特征量提取装置,其特征在于,所述特征量运算部把表示所述相关值的符号的二进制值作为所述音频信号的特征量。
24.如权利要求21中所述的特征量提取装置,其特征在于,所述信号提取部按规定的时间间隔提取所述信号部分,所述特征量运算部包含按所述规定时间间隔运算所述相关值的相关值运算部、以及运算所述相关值的时间变化量作为所述音频信号的特征量的相关值时间变化运算部。
25.一种特征量提取装置,其特征在于,具有通过对输入的音频信号包含的规定时间长度的信号部分进行频率变换导出该信号部分的频谱的频率变换部、导出表示所述频率变换部导出的频谱的包络线的包络线信号的包络线导出部、以及运算所述包络线导出部导出的包络线信号的极值有关的数值作为所述音频信号的特征量的特征量运算部。
26.如权利要求25中所述的特征量提取装置,其特征在于,所述特征量运算部把作为取包络线导出部导出的包络线信号的极值的频率的极值频率当作所述音频信号的特征量。
27.如权利要求25中所述的特征量提取装置,其特征在于,所述特征量运算部包含运算取作为所述包络线导出部导出的包络线信号的极值的频率的极值频率的极值频率运算部、以及运算相邻极值频率的间隔作为所述音频信号的特征量的间隔运算部。
28.如权利要27中所述的特征量提取装置,其特征在于,所述间隔运算部把根据对规定的基准值的比率表现所述间隔的数值作为所述音频信号的特征量。
29.如权利要求28中所述的特征量提取装置,其特征在于,所述间隔运算部把所述极值频率中最低的频率作为所述规定的基准值。
30.如权利要求28中所述的特征量提取装置,其特征在于,所述间隔运算部把所述极值频率中最低的频率与第2低的频率的差值作为所述规定的基准值。
31.一种节目记录装置,其特征在于,包含权利要求1中所述的特征量提取装置,输入含音频信号和视频信号的节目数据,同时可在记录媒体记录该节目数据;所述特征量提取装置计算所述节目数据包含的音频信号的特征量,并且具有对所述记录媒体记录所述节目数据进行控制的记录控制部、存储至少一组在应记录的节目中流动的音乐的音频信号的特征量和对所述记录控制部发出进行该节目的记录或停止该记录的控制指示信息对应组成的组的特征量存储部、以及根据所述特征量提取装置导出的特征量和所述特征量存储部存储的特征量判断所述节目数据包含的音频信号是否与所述的应记录的节目中流动的音乐的音频信号一致的特征量比较部;所述记录控制部在所述特征量比较部判断为一致时,按照与判断为一致的音频信号的特征量在所述特征量存储部组成对应关系的控制指示信息表示的指示进行所述控制。
32.如权利要求31中所述的节目记录装置,其特征在于,还具有对输入的节目数据仅记录规定的量的预备记录部;所述特征量存储部除了存储特征量与控制指示信息的对应关系外,还对应存储表示从所述应记录节目开始到具有有关特征量的音频信号的音乐在该节目中流动为止的经过时间的信息;所述记录控制部在所述特征量比较部判断为一致时,且与判断为一致的音频信号的特征量在所述特征量存储部组成对应关系的控制指示信息发出的指示表明记录节目的情况下,开始把输入的节目数据记录到所述记录媒体,同时把所述预备记录部记录的节目中与该控制指示信息对应的信息指示的经过时间份额的节目数据记录到所述记录媒体。
33.一种节目重放控制装置,其特征在于,包含权利要求1中所述的特征量提取装置,输入含音频信号和视频信号的节目数据,同时连接可重放该节目数据的重放装置;所述特征量提取装置计算所述节目数据包含的音频信号的特征量,并且具有对所述重放装置重放所述节目数据进行控制的重放控制部、存储至少一组在应记录的节目中流动的音乐的音频信号的特征量和对所述重放控制部发出进行该节目的重放或停止该重放的控制指示信息对应组成的组的特征量存储部、以及根据所述特征量提取装置导出的特征量和所述特征量存储部存储的特征量判断所述节目数据包含的音频信号是否与所述的应重放的节目中流动的音乐的音频信号一致的特征量比较部;所述重放控制部在所述特征量比较部判断为一致时,按照与判断为一致的音频信号的特征量在所述特征量存储部组成对应关系的控制指示信息表示的指示进行所述控制。
34.如权利要求33中所述的节目重放控制装置,其特征在于,在所述记录媒体记录所述节目数据,并且还具有可对所述记录媒体记录的节目数据进行编辑的编辑部。
全文摘要
本发明提供能较明确进行一音频信号与其他音频信号的识别的特征量提取装置。频率变换部(11)通过对所输入音频信号包含的规定时间长度的信号部分进行频率变换,导出该信号部分的频谱。频带提取部(12)从频率变换部(11)导出的频谱提取多个频带,输出作为各提取频带的频谱的频带频谱。特征量运算部(13)对各频带频谱运算规定的特征量,并且把算出的各规定特征量作为音频信号的特征量。
文档编号G10L25/48GK1494054SQ03125500
公开日2004年5月5日 申请日期2003年9月24日 优先权日2002年9月24日
发明者持永和宽, 小川智辉, 辉, 森美裕 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1