乐曲提取装置及乐曲录音装置的制作方法

文档序号:6773167阅读:167来源:国知局
专利名称:乐曲提取装置及乐曲录音装置的制作方法
技术领域
本发明涉及一种提取仅无线电广播的乐曲部分的乐曲提取装置及对乐曲进行录 音的乐曲录音装置。
背景技术
具有从接收到的无线电广播中自动地提取音乐部分、加以保存的数字再生装置。 例如有由广播数据的左声道(channel)数据和右声道数据中判定立体声数据或非立体 声数据,通过使立体声部分为乐曲、非立体声部分为非乐曲,来提取乐曲部分的数字再生装
置。 但是,在该数字再生装置中,由于在无线电广播的接收电场强度低的时候,左右声 道数据的分离度变小,所以会将作为原来立体声部分的声音信号也判定为非立体声信号, 存在不能正确地提取乐曲部分这样的问题。并且,在该数字再生装置中,如果不是至少传送 左右声道数据的广播(例如FM(Frequency Modulation)调频广播),就会存在不能提取乐 曲部分这样的问题。具体地,例如在传送仅非立体声数据的AM(Amplitude Modulation,调 幅)广播中,不能提取乐曲部分。

发明内容
本发明的乐曲提取装置,包括以下结构声音功率计算部,其由声音信号计算声音功率;以及判定部,其基于声音功率的状态进行乐曲部分或非乐曲部分的判定。本发明的乐曲录音装置,包括以下结构上述乐曲提取装置;以及录音部,其对上述乐曲提取装置判定为是乐曲的区间的声音信号进行录音。


图1是第一实施例的录音再生装置100的硬件结构图。图2是第一实施例的录音再生装置100的录音处理的流程图。图3是声音信号的波形、声音功率、声音功率的变化量的图像。图4是LR差分的图像。图5是表示电场强度高时和低时的LR差分信号和声音功率的图。图6是第一实施例的录音再生装置100的播放列表(乐曲位置信息)生成流程图。图7是第一实施例的录音再生装置100的再生流程图。图8是第二实施例的录音再生装置IOOa的硬件结构图。
图9是第 二实施例的录音再生装置IOOa的主要部位的功能方框图。图10是声音信号的波形、第二变化点的频率的图像。图11是第二实施例的录音再生装置IOOa的录音处理的流程图。图12是第一时间、第二时间的图像。图13是第二实施例(另一例)的录音再生装置IOOa的主要部位的功能方框图。
具体实施例方式通过以下所示的实施例的说明,本发明的意义及效果将更加明确。但是,下文的实 施方式只不过是本发明的实施方式之一,本发明及各构成要件的用语的意义不限于以下的 实施方式中所记载的内容。<第一实施例>首先,基于附图详细说明本发明的第一实施方式即第一实施例的录音再生装置 100。图1中示出了本发明的一实施方式即第一实施例的录音再生装置100的硬件结构 图。本实施例的录音再生装置100包括FM调谐器1、A/D部2、DSP3、D/A部4、CPTO、存储 器6、记录介质7。FM调谐器1解调FM广播波、输出模拟声音信号。A/D部2将模拟声音信号转换成 数字声音信号。DSP3包括乐曲提取部(从声音信号中提取、输出仅乐曲部分的部分);和 声音Codec部(将非压缩数字声音信号编码为压缩声音数据的编码器、将压缩声音数据复 合成非压缩数字声音信号的解码器)。D/A部4将数字声音信号转换成模拟声音信号并输 出。在声音信号是立体声信号的时候,分别输出左右2声道的信号。CPTO是运算处理装置。 存储器6是所谓CPTO的工作存储器。记录介质7记录压缩声音数据(经过录音的乐曲数 据)和付带在其上的设定信息。图2中示出第一实施例的录音再生装置100的录音处理的流程图。首先,启动FM调谐器1和DSP3内的编码器,一边对声音信号进行编码,一边记录 在记录介质7(例如HDD)中的录音文件中(S1、S2)。基于经过编码的声音波形,开始声音功 率值的计算、声音功率值的变化量的计算、左右2声道间的差分信号(LR差分)的计算(S3、 S4、S5)。在此,使用图3,示出声音信号的波形、声音功率、声音功率的变化量的图像。左侧 上段的图表是表示声音信号的单方(例如Lch)的图表。左侧中段的图表是表示由声音信 号计算出的声音功率的图表。左侧下段的图表是表示声音功率的变化量的图表。此外,使用图4示出LR差分的图像。左侧上段的图表是表示立体声声音的左声道 声音信号的波形的图表。左侧中段的图表是表示右声道声音信号的波形的图表。左侧下段 的图表是表示左右2声道的声音信号的差分(LR差分)信号的波形的图表。右侧的图表是 表示LR差分值的固定时间的平均值的图表。当检测出在声音功率的变化量成为规定值(例如在图3的左侧下段的图表中用虚 线示出的)以上的变化点时(S6中“是”),就计算此变化点前后固定时间中的声音功率的平 均值(例如图3右侧的图表)和LR差分的平均值(图4右侧的图表)(S7、S8)。在声音功 率的平均值超过阈值(例如,在图3右侧的图表中用虚线示出的)的情况下、或者在LR差分的平均值超过阈值(在图4的右侧中段的图表中用虚线示出的)的情况下(S9中“是”), 判定此变化点是乐曲部分,再次返回S6。然后,关于此变化点同样地进行S7 S9的判定。另一方面,在功率的平均值和LR差分的平均值双方未超过阈值的时候,记录此变 化点的位置(距录音开始的相对时刻)作为非乐曲点(TA(i)) (SlO)。一直到有录音停止指 示为止,都进行重复(S11、S12)。在有录音停止指示的情况下(S12中“是”),停止编码,保存非乐曲点(TA⑴),关 闭录音文件(S13)。非乐曲点(TA(i))既可以与压缩声音数据相区别地保存在录音文件中, 也可以作为与录音文件不同的文件加以保存。再有,在上述记载中,仅记录非乐曲点、不记录乐曲点是因为在本实施例的录音再 生装置100中,将满足如下条件的区间判定为乐曲区间(关于此,参照后述的图6的流程图 进行说明)(1)是非乐曲点和下一非乐曲点之间的区间、⑵并且此区间的长度是规定时 间以上(例如90秒以上)。申请人实验的结果发现,在谈话等非乐曲部中,与乐曲部比较, 变化点产生得相当多。因此,如上所述,即使将非乐曲点和下一非乐曲点之间的区间看作乐 曲区间,在实用上也没有问题。此外,在上述中,设功率的平均值和LR差分的平均值双方不超过阈值的情况为非 乐曲点,在声音功率的平均值或LR差分的平均值超过阈值的情况下作为乐曲点是根据, (1)声音功率的平均值处于乐曲部分比非乐曲部分变高的倾向中,(2)声音功率的平均值, 即使电场强度下降,声音功率的平均值也没那么地下降。参照图5对此进行说明。图5的上段的图表是电场强度高时的LR差分信号的示意图。电场强度高的时候, 由于乐曲部分的LR差分值变大(超过同图的用虚线表示的阈值),谈话部分(非乐曲部分) 的LR差分值变小(没有超过阈值),所以能够正确地提取乐曲部分。图5的中段的图表是电场强度低时的LR差分信号的示意图。电场强度低的时候, 乐曲部和非乐曲部的LR差分值的差变小。在此例中,由于第一曲和第三曲的乐曲部分的LC 差分值没有超过阈值,所以会误判定为此部分为非乐曲部分。图5的下段的图表是重合表示电场强度低时的LR差分信号和功率值的示意图。相 对于第一曲和第三曲的乐曲部分的LR差分值变低,关于第一曲和第三曲的乐曲部分的功 率值,没那么地下降。如此,可知即使电场强度下降,关于功率值也很难受到影响。此外,可 知关于谈话部分,功率值低。但是,关于第二曲的乐曲部分,由于功率值不太大,所以假设仅 用功率值判定时也会存在产生误判定的情形。基于以上,在电场强度低的情况下,通过利用 LR差分信号和功率值双方,就能提高乐曲部分的提取精度。在图6中示出第一实施例的录音再生装置100的播放列表(乐曲位置信息)生成 流程图。播放列表是表示在录音文件的何处记录有乐曲的列表。首先,从录音文件等中读出非乐曲点TA(i)(S21)。然后,计算相邻的TA(i)的间 隔(例如(TAd) -TA (0)) (S22)。如果是TM秒以上(例如90秒以上)的话,则记录TA (0) 作为乐曲的始点、记录TA(I)作为乐曲的终点(S23)。如果不到TM秒,则(在i上加1)再 次返回S22,计算TA(2)-TA(1),与TM秒比较。直到不存在乐曲的候补点数据为止(直到在 S26中判定为“是”为止)都对此进行重复。在图7中示出第一实施例的录音再生装置100的再生流程图。从播放列表中读出 记录在录音文件中的第一曲的乐曲的起点的时刻(S31),从此处开始再生(S32)。一旦再生到第一曲的乐曲的终点(S33中“是”),就停止再生。读出第二曲的乐曲的起点的时刻,开 始再生。直到在播放列表中不存在乐曲的起点/终点数据为止(在S34中变为“是”),都 对此进行重复。<第 二实施例>最初,基于附图详细地说明作为本发明实施的一方式的第二实施例的录音再生装 置100a。再有,第二实施例是利用申请人发现的上述特征(在谈话等非乐曲部中,与乐曲部 比较变化点发生较多),进行乐曲部分或非乐曲部分的判定的具体例。在图8中示出了作为本发明的一实施方式的第二实施例的录音再生装置IOOa的 硬件结构图。再有,图8相当于表示第一实施例的录音再生装置100的图1,在本图中,对于 与图1相同的结构赋予相同的符号,省略其详细的说明。本实施例的录音再生装置IOOa包括FM调谐器1、AM调谐器la、A/D部2,DSP3a、 D/A部4,CPTO、存储器6、记录介质7。AM调谐器Ia解调AM广播波、输出模拟声音信号。A/D部2将从FM调谐器1及AM 调谐器Ia输出的模拟声音信号转换成数字声音信号。DSP3a虽然包括乐曲提取部和声音 Codec部,但乐曲提取部的结构及工作与第一实施例的录音再生装置100的DSP3不同(详 情后述)。D/A部4将数字声音信号转换成模拟声音信号并输出。CPTO、存储器6及记录介 质7与第一实施例的录音再生装置100相同。再有,在图8中,虽然例示出AM调谐器Ia将通过解调得到的非立体声信号作为Ml 及M2的2声道的信号进行输出的结构,但也可以是输出1声道的非立体声信号的结构。同 样地,A/D部2a和D/A部4也可以是输出1声道的非立体声信号的结构。此外,虽然例示 出包括与处理对象的广播波相应的不同的调谐器(FM调谐器1及AM调谐器la),其它的部 分(特别是A/D部2a和D/A部4)为共通的结构,但使哪个结构共通、使哪个结构不同是可 以任意地变更的。此外,FM调谐器1及AM调谐器Ia既可以是可同时启动的结构,也可以 是可启动任意一个调谐器的结构。接着,基于附图详细说明第二实施例的录音再生装置IOOa的DSP3a中所包含的乐 曲提取部。图9中示出了第二实施例的录音再生装置IOOa的主要部位的功能方框图。图9 表示与DSP3a的乐曲提取部的工作相关联的部分。本实施例的录音再生装置IOOa的DSP3a中所包含的乐曲提取部包括声音功率计 算部301、第二变化量计算部302、第二变化点检测部303、第二变化点频率计算部304、声音 功率平均计算部305、差分信号计算部306、差分信号平均计算部307、乐曲区间判定部308。声音功率计算部301与第一实施例的录音再生装置100同样,由声音信号计算声 音功率(参照图3)。例如,通过求声音信号的一个声道的信号值的平方,就能计算出声音功 率。再有,声音功率计算部301也可以使用声音信号的多个声道的信号值来计算声音功率。 例如,可以在通过平均化和公知的非立体声化处理等将声音信号的多个声道汇集在一个声 道后,计算声音功率。此外,第一实施例的录音再生装置100也可以用相同的方法计算声音 功率。第二变化量计算部302与第一实施例的录音再生装置100同样,计算由声音功率 计算部301计算出的声音功率的第二变化量(本实施例中,为了能与第一实施例的变化量区别,表现为第二变化量。以下相同。)(参照图3)。例如,能够计算出第二变化量作为后 述的第一时间中的声音功率的变化的大小(例如正的值)。再有,第一实施例的录音再生装 置100虽然可以用同样的方法计算变化量,但进行计算的时间不限于第一时间。第二变化点检测部303与第一实施例的录音再生装置100相同,检测由第二变化 量计算部302计算出的第二变化量成为第二规定值(本实施例中,为了能与第一实施例的 规定值区别,表现为第二规定值。以下相同。)以上的第二变化点(本实施例中,为了能与 第一实施例的变化点区别,表现为第二变化点。以下相同。)(参照图3)。第二变化点频率计算部304计算由第二变化点检测部303检测出的第二变化点的 频率。例如,对后述的第二时间中所含的第二变化点的数目进行计数,就能计算出该数目作 为第二变化点的频率。

声音功率平均计算部305与第一实施例的录音再生装置100相同,通过在规定的 时间中平均化由声音功率计算部301计算出的声音功率,来计算声音功率的平均值(参照 图3)。例如,通过平均化后述的第一时间中的声音功率,计算声音功率的平均值。再有,第 一实施例的录音再生装置100虽然可以用同样的方法计算声音功率的平均值,但进行计算 的时间不限于第一时间。差分信号计算部306与第一实施例的录音再生装置100相同,通过求声音信号的 多个声道的信号值的差分(例如正的值)来计算差分信号(参照图4)。差分信号平均计算部307与第一实施例的录音再生装置100相同,通过在规定的 时间内平均化由差分信号计算部306计算出的差分信号来计算差分信号的平均值(参照图 3)。例如,通过平均化后述的第一时间中的差分信号来计算差分信号的平均值。再有,第一 实施例的录音再生装置100虽然可以用同样的方法计算差分信号的平均值,但进行计算的 时间不限于第一时间。乐曲区间判定部308与第一实施例的录音再生装置100相同,基于声音功率的大 小(上述功率值)和差分信号的大小(上述差分值)进行乐曲部分或非乐曲部分的判定。 具体地,乐曲区间判定部308在确认出由声音功率平均计算部305计算出的声音功率的平 均值变为阈值以上(参照图3及图5)、和由差分信号平均计算部307计算出的差分信号的 平均值变为阈值以上(参照图4及图5)中的至少一种情形的情况下,将确认过的时间的至 少一部分判定为乐曲部分。相反,乐曲区间判定部308在确认出由声音功率平均计算部305 计算出的声音功率的平均值不足阈值(参照图3及图5)、和由差分信号平均计算部307计 算出的差分信号的平均值不足阈值(参照图4及图5)双方的情况下,将确认过的时间的至 少一部分判定为非乐曲部分。并且,在本实施例的录音再生装置IOOa中,乐曲区间判定部308基于声音功率的 变化量成为规定的大小以上的频率,进行乐曲部分或非乐曲部分的判定。基于附图详述此 判定方法的概况。在图10中示出声音信号的波形、第二变化点的频率的图像。如上所述,并且如图 10所示,声音功率的变化量成为规定的大小以上(由第二变化点检测部303作为第二变化 点进行检测)的频率在非乐曲部分(例如谈话部分)变大(变密)、在乐曲部分变小(变
疏)ο为此,乐曲区间判定部308在确认出由第二变化点频率计算部304计算出的第二变化点的频率成为阈值以下的情况下,将确认过的时间的至少一部分判定为乐曲部分。此 夕卜,乐曲区间判定部308在确认出由第二变化点频率计算部304计算出的第二变化点的频 率比阈值大的情况下,将确认过的时间的至少一部分判定为非乐曲部分。S卩,乐曲区间判定部308在确认出声音功率的平均值变为阈值以上、差分信号的 平均值变为阈值以上、第二变化点的频率变为阈值以下中的至少一种情形的情况下,将确 认过的时间的至少一部分判定为乐曲部分。相反,乐曲区间判定部308在确认出声音功率 的平均值不足阈值、差分信号的平均值不足阈值、第二变化点的频率变为阈值以下的全部 情形的情况下,将确认过的时间的至少一部分判定为非乐曲部分。如果为以上的结构,就基于声音功率的状态来判定声音信号的乐曲部分或非乐曲 部分。为此,即使设接收电场强度低的情况、接收的广播传送仅非立体声数据,也能精度 良好地判定声音信号的乐曲部分或非乐曲部分。这不仅仅限于本实施例的录音再生装置 100a,即使第一实施例的录音再生装置100也是一样的。再有,在本实施例的录音再生装置IOOa中,虽然乐曲区间判定部308基于声音功 率的大小、差分信号的大小、声音功率的变化量变大的频率这3方面判定声音信号的乐曲 部分或非乐曲部分,但也可以不进行基于声音功率的大小及差分信号的大小中的至少一个 的判定。即,也可以构成为不包括声音功率平均计算部305、差分信号计算部306、以及差分 信号平均值计算部307中的至少一个。此外,即使第一实施例的录音再生装置100也是同 样地,可以不进行基于差分信号的大小的判定。但是,使用各种判定方法进行声音信号的乐曲部分或非乐曲部分的判定时,即便 第一实施例也如所述的,由于能精度良好地进行判定,所以优选。此外,如上所述,如果即使 用多个判定方法中的任意一个判定方法也能将判定为乐曲部分的部分判定为乐曲部分,就 可能成为无遗漏地判定声音信号的乐曲部分。接着,基于附图详述图8及图9所示的第二实施例的录音再生装置IOOa的具体的 工作例。在图11中示出第二实施例的录音再生装置IOOa的录音处理的流程图。此外,图 11相当于表示第一实施例的录音再生装置100的录音处理的流程图的图2。如图11所示,本实施例的录音再生装置IOOa首先启动FM调谐器1及AM调谐器 Ia的至少一个调谐器,开始声音信号的获取(S41)。此外,启动DSP3a内的编码器,开始记 录在记录介质7中的录音文件中的声音信号的编码(S42)。此外,初始化用于识别进行判定 的计时(后述第一时间及第二时间)的变量η (例如设定为1)。例如,该变量η由CPTO或 DSP3a等管理。接着,将从A/D部2a输出的声音信号顺序读入到音频FIF0(First In First 0ut)61中(S43)。然后,DSP3a的乐曲提取部对从音频FIF061中顺序读出的声音信号进行 上述判定。再有,音频FIF061可解释成存储器6的一部分。首先,声音功率计算部301如上所述计算声音功率(S44)。此外,差分信号计算部 306如上所述计算差分信号(S45)。声音功率的计算及差分信号的计算一直进行到第一时 间Tl (η)的声音信号的处理结束(S46中直到变为“是”)。第一时间Tl (η)是用于在规定的时间中分割声音信号进行处理(判定)的单位时 间。1个第一时间例如是几十ms (毫秒)的时间。—旦 计算出第一时间Tl (η)的声音信号的声音功率及差分信号,声音功率平均计算部305就如上所述计算第一时间Tl (η)的声音功率的平均值(S47)。此外,差分信号平均 计算部307如上所述计算出第一时间Tl (η)的差分信号的平均值(S48)。并且,第二变化量 计算部302如上所述计算第一时间Tl (η)的声音功率的第二变化量c (n) (S49)。如果第二变化量c (η)是阈值以上(S50的“是”),就在变化点FIF062中记录表 示第二变化点存在的数据“1”(S51)。另一方面,如果第二变化量C(ri)不足阈值(S50的 “否”),就在变化点FIF062中记录表示第二变化点不存在的数据“0” (S52)。再有,变化点 FIF062可解释成存储器6的一部分。此外,第二变化点频率计算部304通过参照记录在变化点FIF062中的数据,来计 算第二变化点的频率(S53)。此时,在变化点FIF062中至少记录有从第二时间T2(n)的音 乐信号中检测出的第二变化点的数据。第二变化点频率计算部304通过对从变化点FIF062 中读出的第二时间Τ2(η)的数据中的、表示第二变化点存在的数据“1”的数目进行计数,来 计算第二变化点的频率(S53)。第二时间Τ2(η)也与第一时间Tl (η) —样,是用于在规定的时间中分割声音信号 进行处理(判定)的单位时间。1个第二时间Τ2(η)例如是几s(秒)的时间。再有,由于 第二时间Τ2(η)是计算第二变化点的频率的时间,所以至少优选其是比第一时间Tl (η)长 的时间。基于附图详述第一时间Tl (η)及第二时间Τ2 (η)。在图12中示出第一时间、第二时 间的 图像。如图12所示,第二时间Τ2 (η)包含k+1个第一时间Tl(n-k) Tl (η) (k为自然 数)。此外,在S50 S52中,由于在变化点FIF062中顺序记录(更新)数据,所以第二时 间T2(n)的下一第二时间Τ2(η+1)成为第一时间仅偏移1个的时间。S卩,第二时间Τ2 (η+1) 成为包含k+Ι个第一时间Tl (η-k-l) Tl (n+1)的时间。此外,如上所述,乐曲区间判定部308基于声音功率的大小、差分信号的大小、声 音功率的变化量变大的频率这3方面判定声音信号的乐曲部分或非乐曲部分(S54)。再有, 乐曲区间判定部308也可以与第一实施例的录音再生装置100相同,输出非乐曲点TA(i) 作为判定结果。乐曲区间判定部308基于声音功率的大小及差分信号的大小判定的声音信号的 时间成为第一时间Tl (η)的至少一部分(例如第一时间Tl (η)的大致中央的时刻)。另一方 面,基于声音功率的变化量变大的频率判定的时间成为第二时间Τ2 (η)的至少一部分(例 如第二时间Τ2 (η)的大致中央的时刻)。如此,在本实施例的录音再生装置IOOa中,存在乐曲区间判定部308进行判定的 声音信号的时间在每一判断方法中偏移的情形。为此,可以例如,在判定结果保持部63中 保持顺序得到的判定结果(例如,基于声音功率的大小及差分信号的大小的各个判定结 果,在由上述三个方法求出的判定结果一致后,输出最终的判定结果。再有,判定结果保持 部63可解释为存储器6的一部分。 如果S54中进行声音信号的判定,就会通过例如CPTO、DSP3a等在变量η上加 1 (S55)。然后,直到有录音停止指示(直到S56中变为“是”)都重复上述判定(S43 S55)。
在有录音停止指示的时候(S56中“是”),停止编码,保存判定结果(例如非乐曲 点TA(i)),关闭录音文件(S57)。判定结果既可以与压缩声音数据相区别地保存在录音文 件内,也可以作为与录音文件不同的文件加以保存。
根据这样的结构,就能圆满地配合进行分别基于声音功率的大小、差分信号的大 小、声音功率的变化量变大的频率的判定方法。再有, 在判定的开始时和结束时,可能产生在变化点FIF062中没有记录充分的数 据(判定所需的第二时间T2 (η)的数据)的情形。此种情况下,例如既可以采用通过其它 的判定方法(基于声音功率的大小、差分信号的大小的判定)的判定结果,也可以参照比记 录在变化点FIF062中的第二时间Τ2 (η)短的时间的数据进行判定,还可以用伪数据补充不 足的数据进行判定。此外,也可以使根据判定精度高的判定方法的判定结果优先于根据其它的判定方 法的判定结果。此情况下,可以给予(加权)根据各个判定方法的判定结果以优先度,通过 使根据各个判定方法的判定结果合并,来进行最终的判定。此夕卜,乐曲区间判定部308在输出非乐曲点TA⑴作为判定结果的时候,也能在本 实施例的录音再生装置IOOa中应用第一实施例的录音再生装置100的播放列表的生成方 法(参照图6)和再生方法(参照图7)。<第二实施例的其它例子>在第二实施例的录音再生装置IOOa的、通过乐曲区间判定部380的基于声音功率 的大小及差分信号的大小的各个判定中,可以采用与第一实施例的录音再生装置100相同 的判定方法。基于附图详述此时的结构。图13中示出了第二实施例(另一例)的录音再生装置IOOa的主要部位的功能方 框图。再有,图13相当于表示常规的第二实施例的录音再生装置IOOa的图9,在本图中,对 于与图9相同的结构赋予相同的符号,省略其详细的说明。本例的录音再生装置IOOa的DSP3a中所含的乐曲提取部包括声音功率计算部 301、第二变化量计算部302、第二变化点检测部303、第二变化点频率计算部304、声音功率 平均计算部305b、差分信号计算部306、差分信号平均计算部307b、乐曲区间判定部308b、 第一变化量计算部309b、第一变化点检测部310b。第一变化量计算部309b计算与第一实施例的录音再生装置100相同的变化量 (以下设为第一变化量)(参照图3)。此外,第一变化点检测部310b计算与第一实施例的 录音再生装置100相同的变化点(以下设为第一变化点)(参照图3)。然后,声音功率平均计算部305b与第一实施例的录音再生装置100相同,计算由 第一变化点检测部310b检测出的第一变化点前后固定时间中的声音功率的平均值(参照 图3)。此外,差分信号平均计算部307b与第一实施例的录音再生装置100相同,计算由 第一变化点检测部310b检测出的第一变化点前后固定时间中的差分信号的平均值(参照 图4)。乐曲区间判定部308b与第一实施例的录音再生装置100相同,基于声音功率的 大小及差分信号的大小进行声音信号的第一变化点的时刻的判定。此外,乐曲区间判定部 308b与常规的第二实施例的录音再生装置IOOa相同,基于声音功率的第二变化量变大的 频率(第二时间T2(n)中的第二变化点的数目)进行第二时间Τ2 (η)的至少一部分的时间 (例如第二时间Τ2(η)的大致中央的时刻)的判定。即便这样的结构,也能配合进行分别基于声音功率的大小、差分信号的大小、声音功率的变化量变大的频率的判定方法。再有,也可以 将第二变化点检测部303用于检测第二变化点的第二规定值设定得 比第一变化点检测部310b用于检测第一变化点的规定值(参照图3,以下设为第一规定 值。)更小。这样构成时,由于能检测适于各个判定方法的第一变化点及第二变化点,所以能 提高根据各个判定方法的判定精度。具体地,例如,在基于声音功率的大小及差分信号的大 小的判定方法中,直到能较高确定性地判定是乐曲部分和非乐曲部分的边界的程度之前, 如果增大第一规定值,就能提高判定精度。此外,例如,在基于声音功率的变化量变大的频 率的判定方法中,直到能明确地区别疏及密的状态(各个状态中第二变化点的数目的差变 大)的程度之前,如果减小第二规定值,就能提高判定精度。此外,在本例中,可以使第二变化量计算部302及第一变化量计算部309b共通化。 并且,可以使第二变化点检测部303及第一变化点检测部310b共通化。根据这样的结构, 就能降低DSP3a的处理量。<变化例>对作为本发明的实施一方式的录音再生装置IOOUOOa而言,也可以是微机等控 制装置进行DSP3、3a等的一部分或全部工作。并且,将由这种控制装置实现功能的全部或 一部分记载为程序,也可以通过在程序执行装置(例如计算机)中执行该程序来实现其功 能的全部或一部分。此外,不限于上述情形,图1、图8、图9及图13所示的录音再生装置100、IOOa可 以通过硬件、或硬件和软件的组合来实现。此外,在使用软件构成录音再生装置IOOUOOa 的一部分的时候,由软件实现的部位的块表示此部位的功能块。上述各实施例的说明用于说明本发明,不应理解为限定权利要求的范围中所述的 发明、或缩减范围。再有,本发明的各部结构不限于上述实施例,毫无疑问可在权利要求的 范围中所述的技术的范围内进行各种变形。
权利要求
1.一种乐曲提取装置,包括以下结构声音功率计算部,其由声音信号计算声音功率;以及判定部,其基于声音功率的状态进行乐曲部分或非乐曲部分的判定。
2.根据权利要求1所述的乐曲提取装置,其特征在于, 该乐曲提取装置还包括以下结构差分信号计算部,其计算声音信号的多个声道间的差分信号,上述判定部基于声音功率和差分信号,进行乐曲部分或非乐曲部分的判定。
3.根据权利要求2所述的乐曲提取装置,其特征在于, 上述判定部,在差分信号及声音功率中的任意一个的大小在各自的阈值以上的情况下,判定为乐曲,在差分信号及声音功率双方的大小不足各自的阈值的情况下,判定为非乐曲。
4.根据权利要求2所述的乐曲提取装置,其特征在于, 该乐曲提取装置还包括以下结构第一变化量计算部,其计算声音功率的变化量,上述判定部基于上述第一变化量计算部所计算的变化量成为第一规定值以上的第一 变化点前后的声音功率和差分信号,进行判定。
5.根据权利要求4所述的乐曲提取装置,其特征在于,上述判定部将判定为非乐曲的第一变化点间成为规定的时间以上的声音信号的区间 判定为乐曲区间。
6.根据权利要求1所述的乐曲提取装置,其特征在于, 该乐曲提取装置还包括以下结构第二变化量计算部,其计算声音功率的变化量,上述判定部基于上述第二变化量计算部所计算的变化量成为第二规定值以上的频率, 进行判定。
7.根据权利要求1所述的乐曲提取装置,其特征在于, 该乐曲提取装置还包括以下结构第二变化量计算部,其计算声音功率的变化量;以及 差分信号计算部,其计算声音信号的多个声道间的差分信号,上述判定部基于第一时间中的声音功率的大小、第一时间中的差分信号的大小、以及 第二时间中上述第二变化量计算部所计算的变化量成为第二规定值以上的频率,进行判定。
8.根据权利要求7所述的乐曲提取装置,其特征在于, 上述判定部,在第一时间的差分信号及声音功率中的任意一个的大小在各自的阈值以上的情况下, 将该第一时间的至少一部分判定为乐曲,在第一时间的差分信号及声音功率双方的大小不足各自的阈值的情况下,将该第一时 间的至少一部分判定为非乐曲。
9.根据权利要求6所述的乐曲提取装置,其特征在于,上述判定部,对上述第二变化量计算部所计算的变化量成为第二规定值以上的第二变化点进行计数,在第二时间中的第二变化点的数目在阈值以下时,将该第二时间的至少一部分判定为 乐曲,在第二时间中的第二变化点的数目比阈值更大时,将该第二时间的至少一部分判定为 非乐曲。
10.根据权利要求9所述的乐曲提取装置,其特征在于,上述判定部通过对第二时间中的第二变化点进行计数,来进行该第二时间的大致中央 的时刻的判定。
11.一种乐曲录音装置,包括以下结构 权利要求1所述的乐曲提取装置;以及录音部,其对上述乐曲提取装置判定为是乐曲的区间的声音信号进行录音。
全文摘要
本发明提供一种乐曲提取装置及乐曲录音装置。本发明的乐曲提取装置包括由声音信号计算声音功率的声音功率计算部;和基于声音功率的状态进行乐曲部分或非乐曲部分的判定的判定部。
文档编号G11C7/16GK102034471SQ20101029437
公开日2011年4月27日 申请日期2010年9月21日 优先权日2009年9月28日
发明者古贺达雄, 大前寿敏, 山本友二, 岛冈秀人, 松本悟 申请人:三洋电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1