声音分析装置、声音分析方法、声音分析程序及系统集成电路的制作方法

文档序号:2831739阅读:186来源:国知局
专利名称:声音分析装置、声音分析方法、声音分析程序及系统集成电路的制作方法
技术领域
本发明涉及在便携式终端上根据声音信号判定周围的环境的声音分析 装置,特别涉及提高环境判定时的精度的改良技术。
背景技术
以往,作为声音分析技术,已知在以下专利文件1中公开的移动通信 终端装置。该移动通信终端装置将由麦克风收音的环境噪音与预先登录在 终端内部的环境噪音样本进行比较,判定如持有终端的用户正在电车上移 动,或正在汽车上移动,并且在电话接收时,通知与判定结果对应的响应 消息。
另外,在以下专利文献2中公开的移动机终端的收发信限制控制系统 预先在终端内部登录交通噪音,在收录音与登录的交通噪音相符合的情况 下,自动执行收发信限制。
进而,在以下非专利文献1中公开了这样的技术,分析由可佩戴式装 置收音的声音,进行行动的建模,根据对每个音的识别(键盘的按键音或 翻纸音的判别、声音的判别)结果,判定是伏案工作还是会议。
这些技术以生活环境音为对象,识别或者分类每个特定音,进行响应 消息或收发信限制等应用的利用、或特定的状况判别。
而且,作为其他现有技术,还有在以下专利文献3到专利文献8中示 出的技术。
专利文献l:(日本)特开2000—209143号公报 专利文献2:(日本)特开2004—15571号公报 专利文献3:(日本)特许第3607450号 专利文献4:(日本)特许第3565228号 专利文献5:(日本)特开2002 — 142189号公报 专利文献6:(日本)特开2000—66691号公报专利文献7:(日本)特开2004—258659号公报 专利文献8:(日本)特许第4000171号
非专利文献1:信息处理学会全国大会2006. 3号《可由行动状况检索 的体验映象提示技巧的研究》
这样,将上述现有技术应用在便携式终端的技术领域,实现了按照环 境来改变响应消息或者执行收发信限制的功能。
但是,根据便携式终端的使用状况,存在如下问题,g卩因混入到所 收音的声音中的杂音的影响不能正确地判定环境,发生无法实现上述功能 的情况。例如存在这样的情况,考虑在汽车内或公共设施内等应该实现收 发信限制的场所利用便携式终端的情况,本来在这些场所需要限制,但是 当在此所收音的声音中混入了会话音时,所收音的声音和规定的模式的匹 配没有很好进行,不能正确地判定环境。其结果,即使在乘坐汽车中,呼 出音也响起。另外,也可以想到由于不能将确切的状况传递给发信者,因 此发信者反复重拨,使其越来越着急,或者由于在驾驶中反复被重拨,分 散驾驶者的注意力而引起事故。

发明内容
本发明的目的在于提供一种声音分析装置,提高环境判定的精度。
本发明是一种声音分析装置,包括音响参数计算单元,对声音信号 进行收音,计算每单位时间的音响参数;类别决定单元,根据计算的音响 参数,决定单位时间的部分声音信号属于多个环境音类别之中的哪个环境 音类别;区间设定单元,随着时间经过,沿时间轴上随时设定判定对象区 间,该判定对象区间构成为包括多个连续的单位时间;以及环境判定单元, 根据至少最近的判定对象区间中包含的环境音类别数,判定该判定对象区 间中的本装置的周围的环境。
本发明由于具备上述结构,在决定单位时间的部分声音信号属于多个 环境音类别之中的哪个环境音类别后,能够根据在含有多个连续的单位时 间的判定对象区间中所包含的环境音类别数,来判定该判定对象区间中的 本装置的周围的环境。因此,即使单位时间的部分声音信号是会话等的杂 音的情况,也能够根据判定对象区间中的环境音类别数确切地判定环境。即,即使有在判定对象区间内混入会话等杂音的部分,也可以根据该判定 对象区间内其他部分中的环境音类别数来进行环境的判定,因此,其结果, 能够提高对环境判定的健壮性。
在此,也可以上述环境判定单元包括计算单元,根据包含在上述最近 的判定对象区间中的环境音类别数,计算表示各环境音类别占整个该判定 对象区间的比例的类别占有率,通过决定上述类别占有率之中的占有比例 最高的环境音类别,来进行根据上述环境音类别数的环境判定。
由此,能够判定在上述最近的判定对象区间中在类别占有率之中占有 比例最高的环境音类别为该判定对象区间的环境。因此,即使有在判定对 象区间内混入会话等杂音的部分,也能够判定该判定对象区间中占有比例 相对最高的环境音类别为该判定对象区间的环境,因此能够提高环境判定 的精度。
在此,也可以上述环境判定单元包括计算单元,对于每个判定对象区 间计算表示各环境音类别占整个该判定对象区间的比例的类别占有率,根 据对于最近的判定对象区间的类别占有率与先前的判定对象区间的类别占 有率的变化的比例是否大于预先设定的域值的判定,来进行根据上述环境 音类别数的环境的判定。
由此,能够按照最近的判定对象区间和先前的判定对象区间中的类别 占有率的变化的比例,判定上述最近的判定对象区间中的环境。
因此,例如,在上述先前的判定对象区间中,作为环境类别,"公共汽 车"的占有比例最高,在上述最近的判定对象区间中,由于公共汽车内的 空调音的影响,作为环境类别,"室内"的占有比例变得最高。即使在这种 情况下,当类别占有率的变化的比例小于域值时,能够判定上述最近的判 定对象区间的环境是"公共汽车",因此能够提高环境判定的精度。其中, 空调音作为环境类别被分类为"室内"。
在此,也可以上述声音分析装置还包括功率谱计算单元,计算上述 声音信号的功率谱;以及位移判定单元,检测由上述功率谱计算单元计算 的功率谱的时间位移,判定被检测的位移是否超过预先设定的域值;上述 区间设定单元设定判定对象区间,以使由上述位移判定单元作出肯定判定 的时刻作为先前的判定对象区间的结束点并且作为上述最近的判定对象区
8间的开始点,使接着作出肯定判定的时刻作为上述最近的判定对象区间的 结束点并且作为其后续的判定对象区间的开始点。
由此,能够根据声音信号的功率谱的时间位移来设定判定对象区间的 开始点以及结束点。因此,在预先设定了环境应为单一的判定对象区间的 基础上,根据环境音类别数判定该判定对象区间中的环境,因此能够提高 环境判定的精度。
在此,也可以由上述区间设定单元前后设定的两个判定对象区间具有 相互重叠的部分,上述环境判定单元还在上述变化的比例大于上述域值的 情况下,检测上述最近的判定对象区间或者上述先前的判定对象区间的规 定时刻来作为上述环境的变化时刻。
在上述两个判定对象区间不具有相互重叠的部分的情况下,实际上即 使环境在上述先前的判定对象区间的过程中变化了,也只能在上述先前的 判定对象区间和上述最近的判定对象区间的边界判定环境。与此相对,本 发明通过上述两个判定对象区间具有相互重叠的部分,即使是上述最近的 判定对象区间或者上述先前的判定对象区间内的规定时刻,也能够作为环 境的变化时刻来检测,因此能够更准确地检测出环境的变化时刻。
另外,因为上述两个判定对象区间具有相互重叠的部分,所以能够提 高关于环境判定的实时性。
进而,因为与环境判定一起检测出在环境变化时环境的变化时刻,所 以能够实现与环境对应的应用的利用。
在此,也可以上述声音分析装置还包括动作检测单元,检测与本装 置有关的用户的动作信息;动作判定单元,根据检测的动作信息判定上述 用户是否为动作中;以及控制单元,在上述动作判定单元的判定是否定的 情况下,制止由上述环境判定单元对环境的判定,在上述动作判定单元的 判定是肯定的情况下,允许由上述环境判定单元对环境的判定。
由此,在由上述动作判定单元判定为用户动作中的区间内,允许由上 述环境判定单元对环境的判定。若以没有用户的动作就不能发生环境的变 化为前提,则在由上述动作判定单元判定为不是用户动作中的区间内,制 止对环境的判定,因此能够提高环境的判定精度,进而也能够提高运算效 率。在此,也可以上述多个环境音类别的各个类别是与交通手段有关的环 境音类别,上述声音分析装置还包括选出单元,根据由上述动作检测单 元检测出的动作信息,选出一个以上的环境音类别作为上述用户的交通手 段的候选,上述环境判定单元还在上述最近的判定对象区间和上述先前的 判定对象区间内,由上述选出单元选出的上述一个以上的环境音类别发生 变化的情况下,检测上述规定时刻来作为上述环境的变化时刻。
另外,也可以上述多个环境音类别的各个类别是与交通手段有关的环 境音类别,上述声音分析装置还包括位置信息检测单元,检测与本装置 有关的用户位置信息;存储单元,存储地图信息;以及选出单元,根据由 上述位置信息检测单元检测的位置信息以及上述地图信息,选出一个以上 的环境音类别作为上述用户的交通手段的候选;上述环境判定单元还在上 述最近的判定对象区间和上述先前的判定对象区间内,由上述选出单元选 出的上述一个以上的环境音类别发生变化的情况下,检测上述规定时刻来 作为上述环境的变化时刻。
另外,也可以上述多个环境音类别的各个类别是与交通手段有关的环 境音类别,上述声音分析装置还包括位置信息检测单元,检测出与本装 置有关的用户的位置信息;速度推测单元,通过以规定间隔获取位置信息 并计算各相邻时间的2点间的距离,来推测速度;以及选出单元,根据由 上述速度推测单元推测的速度,选出一个以上的环境音类别作为上述用户 的交通手段的候选;上述环境判定单元还在上述最近的判定对象区间和上 述先前的判定对象区间内,由上述选出单元选出的上述一个以上的环境音 类别发生变化的情况下,检测出上述规定时刻来作为上述环境的变化时刻。
由此,上述环境判定单元在上述最近的判定对象区间和上述先前的判 定对象区间,在由上述选出单元选出的上述一个以上的环境音类别发生变 化的情况下,检测上述规定时刻来作为上述环境的变化时刻,因此能够提 高环境的变化时刻的检测精度。
在此,也可以上述多个环境音类别的各个类别是与交通手段有关的环 境音类别,由上述环境判定单元检测出的环境变化时刻是交通手段变化的 时刻。
由此,仅通过声音信号就能够进行所利用的交通的判定。


图1是便携式电话机1的功能框图。
图2是实施方式1的声音分析装置100的功能框图。 图3是示出分类结果的蓄积的图。 图4是示出声音分析装置100的处理步骤的流程图。 图5是示出关于便携式电话机1自动转移到礼貌模式的处理步骤的流 程图。
图6是在时间序列上示出实施方式1中的每个环境音类别的分类结果、
以及时间区间单位中的类别占有率的变化的图。
图7是示出每个时间区间的类别占有率的详情的图。
图8是示出每个时间区间的类别占有率的详情的图。
图9是示出实施方式2中的声音分析装置100a的功能框图。
图10是与声音分析装置100a的段决定有关的处理步骤的流程图。
图11是在时间序列上示出实施方式2中的每个环境音类别的分类结
果、以及时间区间单位中的类别占有率的变化的图。
图12是示出实施方式3中的声音分析装置100b的功能框图。
图13是示出声音分析装置100b的处理步骤的流程图。
图14是在时间序列上示出实施方式3中的每个环境音类别的分类结
果、以及时间区间单位中的类别占有率的变化的图。
图15是示出实施方式4中的声音分析装置100c的功能框图。
图16是示出实施方式5中的声音分析装置100d的功能框图。
图17是示出交通手段候选选择处理的流程图。
图18是示出声音分析装置100d的处理步骤的流程图。
图19是示出实施方式6中的声音分析装置100e的功能框图。
图20是示出实施方式7中的声音分析装置100f的功能框图。
图21是关于不使用比例值的情况下的环境判别的流程图。
符号说明
1便携式电话机
10声音信号收音部20记录部
30来信音需要与否判定部 40模式设定部 100 100f声音分析装置 110环境音分类部 111音响参数计算部 112类别分类部 113事前学习数据保持部 120事件分割点判定部 121蓄积部
122 、 122b时间区间设定保持部
123、 123a、 123b i卖入部
124类别占有率计算部
125环境判定部
126段决定部
127用户动作判定部
128、 128d、 128f交通手段判定部
129、 129e利用交通手段候选推测部 130功率谱计算部
140动作检测部 150位置信息检测部 160地图信息保持部 170速度推测部
具体实施例方式
以下,参照

本发明涉及的声音分析装置的实施方式。 (实施方式l) 〈便携式电话机1的构成〉 本发明涉及的声音分析装置100例如配备在便携式电话机1中。图1 是示出便携式电话机1的构成的功能框图。如图1所示,便携式电话机1具备声音信号收音部10、声音分析装置100、记录部20、来信音需要与 否判定部30、以及模式设定部40。
声音信号收音部10具体构成为包括麦克风,并且将由麦克风获取的声 音信号发送到声音分析装置100中。
声音分析装置100根据从声音信号收音部IO输入的声音信号,判定便 携式电话机1的周围的环境,将判定结果作为环境信息发送到记录部20以 及来信音需要与否判定部30。
记录部20记录从声音分析装置100输入的环境信息。
来信音需要与否判定部30根据从声音分析装置100输入的环境信息, 判定是否需要来信音,将判定结果发送到模式设定部40。
模式设定部40根据从来信音需要与否判定部30输入的判定结果设定 便携式电话机l的模式。
〈声音分析装置100的构成〉
接着,对声音分析装置100的内部结构进行说明。图2是示出声音分 析装置100的功能框图。声音分析装置100构成为包括环境音分类部110 以及事件分割点判定部120。
声音分析装置100具体是由DSP、微处理器、ROM、 RAM等构成的计算 机系统。在ROM中存储着计算机程序。通过DSP以及微处理器按照计算机 程序进行操作,声音分析装置100完成其功能。
环境音分类部110具体由DSP等来实现,构成为包括音响参数计算部 111、类别分类部U2、以及事前学习数据保持部113。
音响参数计算部lll按照单位时间(例如l秒)从声音信号收音部IO
获取声音信号,计算每单位时间的声音信号(以下,称为「部分声音信号」) 的音响参数。将计算的各音响参数发送到类别分类部112。
音响参数例如是音响谱、谱重心、倒谱、倒谱区域的特征量MFCC (唛 步贞但'J谱系数Mel Frequency C印strum Coefficient)等。
类别分类部112 —边参照保持在事前学习数据保持部113中的事前学 习数据, 一边决定与从音响参数计算部111输入的各音响参数对应的单位 时间的部位声音信号属于哪个环境音类别。
在此,环境音类别例如是室内、室外、BGM、语音、徒步、汽车、公共汽车内、以及电车内等。室内进一步分类为暗噪音、非固定音、人群音、 其他声音。暗噪音如风扇噪音、空调音等。非固定音如摩擦音、衣服摩擦 音、敲打等。人群音如咿咿呀呀的声音、餐厅内的声音等。其他声音例如 室内的杂乱音等除了上述声音以外的室内音。
室外进一步分类为自然杂音、交通杂音、其他声音。自然杂音如风的 声音、河流动的声音、鸟的鸣叫声等。交通杂音如车、摩托车、以及电车 等的交通音。其他声音如室外的杂乱音等除了上述声音以外的室外音。语
音不限于会话,包含可判定为语音的声音。BGM是作为背景音以音乐为主的 声音。徒步是以行走音为主的声音。汽车是语音以外的声音,是汽车内的 移动时的声音,如引擎声。公共汽车内是语音以外的声音,是公共汽车内 的移动时的声音,如引擎声。电车内是语音以外的声音,是电车内的移动 时的声音,如马达音。
对环境音类别的分类进行详细说明。环境音类别的分类可以使用高斯 混合模型(G薩Gaussian Mixture Model)或熵一先验隐马尔可夫模型 (EP-H丽)等机械学习方法。在这些机械学习方法中,事前预备各环境音类 别的声音信号的音响参数作为事前学习数据。然后,将从音响参数计算部 111输入的各音响参数与保持在事前学习数据保持部113中的每个环境音 类别的音响参数(事前学习数据)比较,并且决定是不是与该事前学习数 据相似的声音。类别分类部112将类别分类对象的部分声音信号分类成与 被决定为相似的音响参数对应的环境音类别,并且将分类结果发送到蓄积 部121。
事前学习数据保持部113将各环境音类别的声音信号的音响参数保持 作为事前学习数据。
事件分割点判定部120由微处理器等实现,构成为包括蓄积部121、时 间区间设定部122、读入部123、类别占有率计算部124、以及环境判定部 125。
蓄积部121具体由缓冲器等构成,蓄积从类别分类部112输入的各部 分声音信号的分类结果。以OOl、 010、 011、 100…这样的位来定义各环境 音类别,蓄积部121按照单位时间以位来蓄积所分类的分类结果。图3是 示出分类结果的蓄积的图。如本图所示,将时刻与该时刻的环境音类别相对应地蓄积。
时间区间设定部122根据预先存储的设定信息,在时间轴上随着时间
经过随时设定判定对象区间的开始点以及结束点。具体地,判定对象区间
是包含多个(例如3个以上)连续的单位时间的区间(例如30秒)。而且, 蓄积部121具备为了至少蓄积判定对象区间量的分类结果所需的容量。
读入部123判定是否在蓄积部121中蓄积着由时间区间设定部122设 定的判定对象区间量的分类结果,在判定为蓄积着的情况下,从蓄积部121 读取分类结果,将读取的分类结果发送到类别占有率计算部124。
类别占有率计算部124根据从读入部123输入的各部分声音信息的分 类结果,计算判定对象区间中的类别占有率。而后,将计算的类别占有率 发送到环境判定部125中。类别占有率是各环境音类别占整个判定对象区 间的比例。
环境判定部125根据从类别占有率计算部124输入的类别占有率,判 定便携式电话机1的周围的环境。将示出被判定的环境的环境信息发送到 记录部20以及来信音需要与否判定部30。接着,在环境变化的情况下检测 其变化时刻,发送到记录部20。
〈声音分析装置IOO的动作〉
图4是示出声音分析装置100的处理步骤的流程图。在本流程图中,i 是确定一个环境音类别的变量,类别数为n。音响参数计算部111依次接收 由声音信号收音部10收音的部分声音信号(步骤SIOI)。若接收部分声音 信号,则计算该部分声音信号的音响参数(步骤S102)。若计算音响参数, 则初始化i (步骤S103),与该环境音类别中的音响参数比较(步骤S104)。 存储比较结果(步骤S105),判断是否i = n (步骤S106)。还存在其他环境 音类别存在的情况下(在步骤S106中为否),对i加l (步骤S107),转移 到步骤S104。若与全部的环境音类别中的音响参数比较结束(在步骤S106 中为是),则决定部分声音信号属于哪个环境音类别(步骤S108)。具体地,
决定该部分声音信号的音响参数最接近哪个环境音类别中的音响参数。 读入部123判定在蓄积部121中是否蓄积着需要的蓄积量(步骤S109)。
在达到需要的蓄积量的情况下(在步骤S109中为是),读入分类结果,并 且将读入的分类结果发送到类别占有率计算部124 (步骤SllO)。类别占有率计算部124根据分类结果计算判定对象区间中的类别占有率(步骤 Slll),判定是否存在已经存储的类别占有率(步骤S112)。在没有被存储 的类别占有率的情况下(在步骤S112中为否),存储该类别占有率,并且 根据该类别占有率判定环境(步骤S113)。具体地,在判定对象区间中,通 过决定在各环境音类别的占有率之中占有率最高的环境音类别来判定环 境。若判定了环境,则将环境信息发送到记录部20以及来信音需要与否判 定部30 (步骤S117)。由此,能够实现与环境对应的应用的动作。
在有已经存储的类别占有率的情况下(在步骤S112中为是),计算示 出相对于该类别占有率的变化的比例的比例值(步骤S114)。按照环境音类 别计算比例值,环境判定部125对于各比例值,与预先设定的域值相比较, 判断比例值是否大于域值(步骤S115)。在全部的比例值为域值以下的情况 下(在步骤S115中为否),存储所计算的类别占有率,转移到步骤S109。 在存在大于域值的比例值的情况下(在步骤S115中为是),检测出与所计 算的类别占有率相对应的判定对象区间的开始点作为环境变化时刻,并且 进行环境的判定(步骤S116)。具体地,在超过域值且占有率增加的环境音 类别存在的情况下,将该环境音类别作为变化后的环境,在超过域值且占 有率减少的环境音类别存在的情况下,将各环境音类别之中的占有率最高 的环境音类别作为变化后的环境。而后,将存储部20中环境信息和环境的 变化时刻发送到来信音需要与否判定部30 (步骤S117)。
这样,环境判定部125若新接收到类别占有率,则通过判定相对于先 前的判定对象区间的类别占有率的变化的比例是否超过域值来判定环境, 并且在环境变化的情况下检测环境的变化时刻。 〈便携式电话机1的动作〉
图5是示出有关便携式电话机1向礼貌模式的自动转移功能的处理步 骤的流程图。来信音需要与否判定部30接收从声音分析装置100输入的环 境信息(步骤S201)。若接收到环境信息,则判定该环境信息是否示出公共 汽车或电车(步骤S202)。
在除去环境信息示出公共汽车或电车以外的情况下(在步骤S202中为 否),转移到步骤S201。在环境信息示出公共汽车或电车的情况下(在步骤 S202中为是),模式设定部40判定来信状态是否是礼貌模式(步骤S203)。
16在来信状态是礼貌模式的情况下(在步骤S203中为是),转移到步骤 S201。在来信状态不是礼貌模式的情况下(在步骤S203中为否),将来信 状态设定为礼貌模式(步骤S204)。 〈具体例〉
图6是示意地示出实施方式1特征的图。本图上部是示出每个环境音 类别的分类结果的图。本图下部是在时间序列上示出时间区间单位中的类 别占有率的变化的图。本图中的横轴是时间轴。图中的公共汽车、电车、 语音、室内、以及室外示出环境音类别。
图7、 8是示出图6所示的包含在各时间区间中的环境音类别的详情的 图。如图7、 8所示,各时间区间是30秒,分别在时间轴方向上各偏离IO 秒。
时间区间设定部122如图6上部所示,例如在时间轴方向上使判定对 象区间重叠地依次设定(时间区间l、时间区间2、时间区间3、时间区间 4、时间区间5、…)。这是为了提高环境变化的检测精度。判定对象区间的 设定根据预先保持在时间区间设定部122中的、示出时间区间的长度的时 间区间信息或示出使其重叠到什么程度的重叠信息等来进行。
类别占有率计算部124按照时间区间计算各环境音类别的占有率。如 图7所示,在时间区间l中,判定为"公共汽车"的时间是合计24秒,判 定为"语音"的时间是合计3秒,判定为"室内"的时间是合计3秒,因 此计算为"公共汽车"的占有率80%、"语音"以及"室内"的占有率10 %。因为"公共汽车"占有率最高,所以环境判定部125判定在时间区间1 内环境是"公共汽车"。
以下相同,在时间区间2中,判定为"公共汽车"的时间是合计21秒, 判定为"语音"的时间是合计6秒,判定为"室内"的时间是合计3秒, 因此计算为"公共汽车"的占有率70%、"语音"的占有率20。%、"室内" 的占有率10%。
在时间区间3中,判定为"公共汽车"的时间是合计20秒,判定为"语 音"的时间是合计3秒,判定为"室内"的时间是合计3秒,判定为"电 车"的时间是合计4秒,因此计算为"公共汽车"的占有率675^、"语音" 以及"室内"的占有率10%、"电车"的占有率13%。在时间区间4中,判定为"公共汽车"的时间是合计13秒,判定为"语 音"的时间是合计6秒,判定为"电车"的时间是合计ll秒,因此计算为 "公共汽车"的占有率43%、"语音"的占有率20%、"电车"的占有率37 %。
在时间区间5中,判定为"电车"的时间是合计21秒,判定为"语音" 的时间是合计3秒,判定为"公共汽车"的时间是合计6秒,因此计算为 "电车"的占有率70%、"语音"的占有率10%、"公共汽车"的占有率20 %。
在此,若用于与类别占有率的变化的比例相比较的域值是0.3 (类别 占有率30%),则当分别从时间区间l转移到时间区间2、从时间区间2转 移到时间区间3、从时间区间3转移到时间区间4时,各类别占有率未超过 域值。
因此,环境判定部125判定在这些时间区间中环境是"公共汽车"。但 是,可知在从时间区间4转移到时间区间5中,"电车"的占有率从35%位 移到70%,这是超过域值的变化。
因此,环境判定部125判定在时间区间5中环境是"电车",同时如本 图下部的圆圈标记(时刻Tl),检测出时间区间5的开始点作为环境的变化 时刻。
这样,通过计算每个判定对象区间的类别占有率,判定类别占有率是 否超过域值地变化,从而在混入了语音等杂音的情况下,也能够确切地判 定环境。
如上所述根据本实施方式,在某判定对象区间中,即使因杂音的影响 而各环境音类别的占有率下降,也能够通过与其他环境音类别的比较来决 定占有率相对高的环境音类别,从而判定环境,因此能够提高对环境判定 的健壮性。另外,因为便携式电话机1记录了环境的变化时刻,所以能够 据此进行用户的行为模式的分析等。 (实施方式2)
在实施方式1中,由时间区间设定部122设定的判定对象区间是30秒 的固定值,但是本实施方式根据声音信号的功率谱的时间位移来设定判定 对象区间(以下,称为「段」)。〈声音分析装置100a的构成〉
图9是本实施方式中的声音分析装置100a的功能框图。如图9所示, 声音分析装置100a除了实施方式1中的声音分析装置100的构成要素以外, 还包含功率谱计算部130。另外,事件分割点判定部120a构成为包括段决 定部126以代替实施方式1中的时间区间设定部122。
功率谱计算部130计算从声音信号收音部10输入的声音信号的功率 谱,将计算的功率谱发送到段决定部126。具体地,将从声音信号收音部 10输入的声音信号以规定的时间单位划分,使用FFT (快速傅里叶变换 Fast Fourier Transform),计算每规定时间的声音信号的功率谱。
段决定部126根据从功率谱计算部130输入的每规定时间的声音信号 的功率谱来决定段的开始点以及结束点。具体地,使相邻的规定时间区间 的功率谱重合,检测出特定频率的位移量,判定检测出的位移量是否超过 预先设定的域值。而后,在检测出的位移量超过预先设定的域值的情况下, 将与检测的位移量对应的相邻的规定时间区间的边界点判定为段的边界 点。该边界点是新段的开始点,同时也是先前段的结束点。在段决定部126 接下来判定位移量超过域值时,将与该位移量对应的、相邻的规定时间区 间的边界点作为新的段的结束点。
这样,段决定部126决定段的开始点以及结束点,并且将决定的段的 开始点以及结束点发送到读入部123a。
读入部123a接收由段决定部126发送的段的开始点以及结束点,从蓄 积部121读取所接收的段区间量的类别分类结果,并且将读取的分类结果 发送到类别占有率计算部124。
〈声音分析装置100a的工作〉
接着,图10是示出与声音分析装置100a的段决定有关的处理步骤的 流程图。在本流程图中,i是确定一个规定时间区间的变量。功率谱计算部 130依次接收由声音信号收音部10收音的声音信号(步骤S301)。若接收 了声音信号,则计算每个规定时间区间的功率谱(步骤S302)。段决定部 126初始化i (步骤S303),检测出规定时间区间i和规定时间区间i + l 中的特定频率的位移量(步骤S304)。将检测出的位移量与域值比较(步骤 S305),在位移量为域值以下的情况下(在步骤S305中为否),对i加1 (步骤S306),转移到步骤S304。
在位移量大于域值的情况下(在步骤S305中为是),读入部123a读取 与该位移量对应的、相邻的规定时间区间的边界点之前的分类结果作为段 区间的分类结果(步骤S307)。类别占有率计算部124计算段区间中的类别 占有率(步骤S308),环境判定部125根据该类别占有率来判定该段区间的 环境(步骤S309)。若判定了环境,则将环境信息发送到存储部20以及来 信音需要与否判定部30中(步骤S310)。 〈具体例〉
图11是示意地示出实施方式2特征的图。本图上部是示出每个环境音 类别的分类结果的图。本图下部是在时间序列上示出段单位的类别占有率 的变化的图。本图中的横轴是时间轴。公共汽车、电车、语音、室内、以 及室外示出环境音类别。
与实施方式1中的具体例的差异在于,不计算某个固定的时间区间单 位(30秒)的类别占有率,而计算段区间的类别占有率。图中从时刻tl 到时刻t5的各时刻示出功率谱超过域值发生变化的时刻,即段的边界点。 从时刻tl到时刻t2的区间是段区间,声音分析装置100a计算该段区间中 的类别占有率。
同样地,从时刻t2到时刻t3、从时刻t3到时刻t4、从时刻t4到时 刻t5分别为段区间。
环境判定部125在各段区间中根据类别占有率来判定环境,并且在时 间上处于前后的两个段区间中的类别占有率超过规定域值地变化时,将这 些段的边界判定为环境变化的划分点。
如上所述根据本实施方式,首先,通过声音信号的功率谱的时间位移 来设定段,其后,根据该段中的类别占有率来判定环境,因此能够提高环 境判定的精度。另外,设定段后,用根据环境音类别结果的类别占有率的 变化的比例来确定环境的变化时刻,因此能够进一步提高环境变化时刻的 检测精度。例如,即使在类别占有率缓慢变化的情况下,也能够更加没有 误差地检测出环境变化时刻。
而且,在本实施方式中,蓄积部121不像实施方式1那样蓄积由时间 区间设定部122设定的时间量的的类别结果,而是蓄积由段决定部126决定的段的从开始点到结束点的分类结果。即,不能单独设定在蓄积部121 中应该蓄积的分类结果的时间量。因此,也可以在决定段边界时,存储在 蓄积部121中可蓄积的最大时间长度,将在其范围内示出最大位移量的时 刻判定为段边界点。 (实施方式3)
在实施方式1中,将在时间上位于前后的两个判定对象区间的类别占 有率的变化的比例超过域值地变化的情况作为环境变化,并检测出该时刻, 但可以假定在没有用户动作时发生环境变化的可能性低。因此,在本实施 方式中,声音分析装置具备检测用户动作的结构,在用户动作中时,进行 环境判定,并且在环境变化时检测环境的变化时刻。
<声音分析装置100b的构成〉
图12是本实施方式中的声音分析装置100b的功能框图。如图12所示, 声音分析装置100b除了实施方式1中的声音分析装置100的构成要素以外, 还包括动作检测部140。另外,本实施方式中的事件分割点判定部120b除 了实施方式1中的事件分割点判定部120的构成要素以外,还构成为包括 用户动作判定部127。
动作检测部140构成为包括3轴加速度传感器或陀螺仪传感器、电 子高度计、电子指南针等,检测用户的动作,并且将检测出的动作信息发 送到用户动作判定部127中。3轴加速度传感器或陀螺仪传感器的抽样频 率,例如设定为30Hz以上。而且,这些传感器可以与声音分析装置100b 一起设置在便携式电话机l内,传感器类也可以直接佩戴于用户的身体。
用户动作判定部127根据从动作检测部140输入的动作信息判定用户 是否在动作中。具体地,因为用户在步行或跑步状态下在2 4Hz出现特征 峰值,所以根据能否检测出该特征峰值来判定用户是否在动作中。
另外,用户动作判定部127将基于判定结果的通知发送到时间区间设 定部122b中。
时间区间设定部122b除了实施方式1的时间区间设定部122的功能以 外,具有根据从用户动作判定部127输入的与用户动作有关的通知来控制 读入部123b的功能。具体地,在输入了表示用户动作中的通知时,对读入 部123b允许读入,在输入了表示用户不在动作中的通知时,制止由读入部123b的读入。
读入部123b在由时间区间设定部122b允许读入时,g卩,在用户动作 区间,与实施方式1的读入部123同样地从蓄积部121读入分类结果。在 由时间区间设定部122b制止读入时,B卩,在用户动作区间以外的区间,不 从蓄积部121读入分类结果。
〈声音分析装置100b的动作〉
接着,图13是示出声音分析装置100b的处理步骤的流程图。步骤S401 的环境音分类处理与图4示出的环境音分类处理相同。用户动作判定部127 判定用户是否在动作中(步骤S402),在判定是肯定的情况下(在步骤S402 中为是),声音分析装置100b进行环境判定处理(步骤S403)。该环境判定 处理与图4示出的环境判定处理相同。用户动作判定部127判定用户动作 是否结束(步骤S404),在判定是肯定的情况下(在步骤S404中为是),转 移到步骤S402,在判定是否定的情况下(在步骤S404中为否),转移到步 骤S403。即,在判定为用户在动作中的区间中进行环境判定处理。 〈具体例〉
图14是示意地示出实施方式3的图。本图上部是示出每个环境音类别 的分类结果的图。本图下部是在时间序列上示出时间区间单位中的类别占 有率的变化的图。本图中的横轴是时间轴。公共汽车、电车、语音、室内、 以及室外示出环境音类别。
与实施方式l中的具体例不同点在于,在判定为用户动作中的区间中 进行环境的判定。图中从时刻tll到时刻t12示出用户在动作中的期间。 同样地,从时刻t13到时刻t14、从时刻t15到时刻t16也分别示出用户在 动作中的期间。声音分析装置100b在这些区间中,根据各判定对象区间中 的类别占有率进行环境判定。与环境判定一起,在检测出用户动作的区间, 且在时间上位于前后的两个判定对象区间中的类别占有率超过规定域值地 变化的情况下,将这些判定对象区间的边界判定为环境变化的划分点。
如上所述根据本实施方式,在用户动作中的区间,且在时间上位于前 后的两个判定对象区间中的类别占有率超过规定域值地变化的情况下,将 这些判定对象区间的边界判定为环境变化的划分点,因此能够提高环境变 化的分界点的检测精度。另外,在用户动作时间以外的区间中,不读入分类结果,即,不进行分类占有率的计算以及环境判定,因此能够提高运算 效率。
(实施方式4)
本实施方式是特定于与交通手段有关的环境判定的实施方式。 〈声音分析装置100c的构成〉
图15是本实施方式中的声音分析装置100c的功能框图。如图15所示, 声音分析装置100c构成为包括交通手段判定部128,以代替实施方式1中 的环境判定部125。另外,将在环境音分类部110中分类的环境音类别作为 特定于交通的环境音类别(以下,称为「交通手段」)。与特定于交通的环 境音类别相当的是如步行、列车、公共汽车、车、自行车、以及电梯等。
本实施方式中的事前学习数据保持部113如在步行情况下保持脚步 声,在列车、公共汽车、以及车的情况下保持加减速时或惯性运转时的马 达音或引擎音,在自行车的情况下保持风吹音或链条旋转的声音,在电梯 的情况下保持其寂静音,来作为各自的音响参数。由此,可以进行用于交 通手段判定的声音识别。
交通手段判定部128基本上与实施方式1中的环境判定部125相同。 即,根据判定对象区间中类别占有率来判定环境。另外,由类别占有率发 生变化的比例来判定交通手段是否变化,在变化的情况下将交通手段的变 化时刻作为环境的变化时刻。
而且,在仅仅根据类别占有率来判定环境的情况下,非常难以对例如 是否是电梯进行判定。原因在于,难以判别电梯内的寂静音和室内的寂静 音。因此,也可以为了提高环境的判定精度,声音分析装置100c还具备电 子高度计,根据类别占有率和高度位移判定是否是电梯。
若采用以上那样的本实施方式,能够仅仅通过声音信号判定所利用的 交通。
(实施方式5)
本实施方式不像实施方式4那样仅由环境音判定交通手段,而是由环 境音和用户动作来判定交通手段的实施方式。 〈声音分析装置100d的构成〉 图16是本实施方式中的声音分析装置100d的功能框图。如图16所示,声音分析装置100d除了实施方式1中的声音分析装置100的构成要素以外, 还含有动作检测部140。另外,声音分析装置100d中的事件分割点判定部 120d构成为包括交通手段判定部128d,以代替环境判定部125,还含有利 用交通手段候选推测部129。
利用交通手段候选推测部129根据从动作检测部140输入的加速度信 息或高度信息,选择一个以上与本装置有关的用户利用的交通手段的候选, 并且将选择的交通手段的候选发送到交通手段判定部128d中。
交通手段判定部128d根据从利用交通手段候选推测部129输入的利用 交通手段候选以及从类别占有率计算部124输入的类别占有率,判定交通 手段。将示出被判定的交通手段的交通手段信息发送到记录部20以及来信 音需要与否判定部30中。进而,判定交通手段是否变化,在变化的情况下 检测出交通手段的变化时刻作为环境变化时刻,并且发送到记录部20中。
具体地,例如,在是判定对象区间的类别占有率之中的占有率最高的 交通手段,而且,是被选定为在该判定对象区间中利用交通手段候选的交 通手段的情况下,交通手段判定部128d决定该判定对象区间的环境是该交 通手段。另外,在最近的判定对象区间和先前的判定对象区间,类别占有 率超过规定域值地变化,而且,在利用交通手段候选发生变化的情况下, 将最近的判定对象区间的开始点判定为交通手段变化的划分点。而且,也 可以只在检测出环境的变化时刻的情况下使用利用交通手段候选,各判定 对象区间中的交通手段的判定仅根据类别占有率来进行。 〈交通手段候选选择〉
图17是示出交通手段候选选择处理的流程图。利用交通手段候选推测 部129首先,根据高度信息计算规定期间中的高度位移值(步骤S501)。接 着,根据规定期间和高度位移值计算垂直方向的速度(步骤S502)。利用交 通手段候选推测部129预先存储第一域值以及第二域值,比较第一域值和 垂直方向的速度,判定垂直方向的速度是否大于第一域值(步骤S503),比 较第二域值和高度位移值,判定高度位移值是否大于第二域值(步骤S505)。 垂直方向的速度大于第一域值的情况下(在步骤S503中为是),或者高度 位移值大于第二域值的情况下(在步骤S505中为是),选定电梯作为交通 手段的候选(步骤S504)。在步骤S503以及505中的判定都是否定的情况下,利用交通手段候选推测部129例如定是否在3轴加速度传感器中检测出大于15Hz的加速度值(步骤S506)。在检测出大于15Hz的加速度的情况下(在步骤S506中为是),选定公共汽车、车、列车以及自行车中的任一个以上。特别是在公共汽车、车、以及自行车中,能够频繁地观察到上下方向的微小加速度,因此通过在时间方向上追踪功率谱的平均值,能够比较性地检测出移动和停止。因此,利用交通手段候选推测部129判定是否检测出一定时间以上的上下方向的微小加速度(步骤S507),在检测出一定时间以上的上下方向的微小加速度的情况下(在步骤S507中为是),选定公共汽车、车、以及自行车作为交通手段的候选(步骤S508)。
在没有检测出一定时间以上的上下方向的微小加速度的情况下(在步骤S507中为否),选定列车作为交通手段的候选(步骤S509)。
这样,根据移动以及停止频度等可以将公共汽车、车、以及自行车与列车区别。
另外,因为对于步行以及跑步,在2 4Hz中出现特征峰值,所以通过检测出这样的特征峰值,能够将步行以及跑步与其他交通手段区别。因此,在加速度值为15Hz以下的情况下(在步骤S506中为否),判定是否在2 4Hz存在特征峰值(步骤S510)。在2 4Hz中检测出峰值的情况下(在步骤S510中为是),选定步行以及跑步作为交通手段(步骤S511)。在2 4Hz中没有检测出峰值的情况下(在步骤S510中为否),设为不可选定(步骤S512)0
利用交通手段候选推测部129将这样选定的交通手段的几个作为利用交通手段候选输出到交通手段判定部128d中。
另外,利用交通手段候选推测部129也可以将上述那样被选定的时刻作为该交通手段的开始点,将变得不选定该交通手段的时刻作为结束点来存储。
〈声音分析装置100d的动作〉接着,图18是示出声音分析装置100d的处理步骤的流程图。步骤S601的环境音分类处理与图4所示的环境音分类处理相同。在本流程图中,与图4所示的流程图不同点有以下四点。第一点是交通手段判定部128d获取交通手段候选这一点(步骤S604)。第二点是交通手段判定部128d判定是否已经存储了类别占有率以及交通手段候选这一点(步骤S606)。第三点是在步骤S606中判定是否定的情况下,根据类别占有率以及交通手段候选判定环境这一点(步骤S607)。第四点是判定比例值大于域值、而且交通手段候选是否发生变化这一点(步骤S609)。
如上所述根据本实施方式,使用一个以上的利用交通手段候选和环境音分类结果来检测出交通手段的变化时刻,因此能够提高环境变化的分界点的检测精度。
(实施方式6)
参照图19对本实施方式中的声音分析装置进行说明。〈声音分析装置100e的构成〉,
图19示出本实施方式中的声音分析装置100e的构成的一例。构成声音分析装置100e除了实施方式1中的声音分析装置100的构成要素以外,构成为还包括位置信息检测部150以及地图信息保持部160。另外,声音分析装置100e中的事件分割点判定部120e构成为包括交通手段判定部128e以代替环境判定部125,还包括利用交通手段候选推测部129e。
具体地,位置信息检测部150构成为包括GPS (全球定位系统)等,检测出用户乃至本装置的位置信息,将检测出的位置信息输出到利用交通手段候选推测部129e。
地图信息保持部160保持地图信息。特别是保持与交通机构(列车或公共汽车)有关的路线信息以及道路信息。
利用交通手段候选推测部129e根据从位置信息检测部150输入的每固定时间的用户乃至本装置的位置信息,求出用户乃至本装置的移动路线。将移动路线与保持在地图信息保持部160中的路线信息对照,选出利用交通手段的候选。而后,将选出的利用交通手段候选发送到交通手段判定部128d。
例如,如果用户乃至本装置的移动路线与列车的移动路线相同,那么选出列车作为利用交通手段的候选。如果用户乃至本装置的移动路线与公共汽车的移动路线相同,那么选出公共汽车作为利用交通手段的候选。在除此以外的情况下,选出徒步、汽车、以及自行车作为利用交通手段的候选。
声音分析装置100e中的其他构成要素与实施方式5中的构成要素相同。
如上所述根据本实施方式,使用一个以上的利用交通手段候选和环境音分类结果来检测出交通手段的变化时刻,因此能够提高环境变化的分界点的检测精度。
(实施方式7)
参照图20对本实施方式中的声音分析装置进行说明。〈声音分析装置100f的构成〉
图20是示出本实施方式中的声音分析装置100f的构成的一例的图。声音分析装置100f构成为包括速度推测部170以代替实施方式6的声音分析装置100e的利用交通手段推测部129e以及地图信息保持部160。其他构成要素与实施方式6的声音分析装置100e中的各构成要素相同。
速度推测部170根据从位置信息检测部150输入的每固定时间的用户乃至本装置的位置信息,求出用户乃至本装置的移动速度。进而,从推测的移动速度来推测交通手段,将所推测的交通手段发送到交通手段判定部128f。
具体地,例如,若预先设定为以1秒间隔输入位置信息,则使用各时刻上的位置信息(纬度、经度信息)和胡贝尼(Hubeny)距离计算公式,计算各相邻时间的2点间的距离。因为该距离相当于平均单位时间的移动距离,所以能够原样近似为秒速。从这样计算的速度,计算移动期间或停止期间、最大速度等,并且推测交通手段。
速度推测部170例如,至少间隔数分钟以上存在移动期间以及停止期间,且计算的最大速度超过80km/h的情况下,推测是列车移动。而后,作为交通手段,将示出列车的信息发送到交通手段判定部128f中。
另外,如果在更短的间隔内有移动期间以及停止期间,且计算的最大速度在60km/h以下,那么推测是车或是公共汽车移动,如果计算的最大速度在10kra/h以下,那么推测是徒步移动。
交通手段判定部128f根据从速度推测部170输入的交通手段候选以及从类别占有率计算部124输入的类别占有率,判定交通手段。将示出所判定的交通手段的交通手段信息发送到记录部20以及来信音需要与否判定部30中。进而,判定交通手段是否发生变化,在变化的情况下检测出交通手段的变化时刻作为环境变化时刻,并且发送到记录部20中。环境的判定和变化时刻的检测方法的详情与交通手段判定部128d相同。
如上所述根据本实施方式,使用一个以上的利用交通手段候选和环境音分类结果来检测出交通手段的变化时刻,因此能够提高环境变化的分界点的检测精度。
而且,速度推测方法不限于在本实施方式中使用的速度推测方法。(变形例)
以上,根据实施方式对本发明涉及的声音分析装置进行说明,但本发明并不限于上述的实施方式。
在上述实施方式中,便携式电话机1是按照由声音分析装置判定的环境自动进行向礼貌模式的转移的结构,但也可以是按照环境执行来信限制的结构。在这样的情况下,便携式电话机代替来信音需要与否判定部30,具备来信需要与否判定部,根据从声音分析装置100输入的环境信息来判定是否需要来信,并且将判定结果发送到来信制止部;代替模式设定部40,具备来信制止部,根据从来信需要与否判定部输入的判定结果制止来信。更详细地,例如在环境信息是示出公共汽车或电车的情况下,来信不需要判定部判定不需要来信,来信制止部制止来信。由此,能够按照来信时的接收侧的状况防止不需要的来信。
另外,也可以是按照环境将按键时的声音设定为无声的结构。在这样的情况下,便携式电话机代替来信音需要与否判定部30,具备判定部,根据从声音分析装置输入的环境信息来判定是否应该将按键时的声音设成无声,并且将判定结果发送到按键音设定部;代替模式设定部40,具备按键音设定部,根据从判定部输入的判定结果转移到无声设定,使按键时的声音变为无声。更详细地,例如在环境信息是示出公共汽车或电车的情况下,判定部判定应该使按键时的声音变为无声,按键音设定部设定使按键时的声音变为无声。
在上述实施方式中,对便携式终端是便携式电话机的情况进行了说明,但除此以外,也可以是例如可佩戴式终端、万步计(注册商标)、携带式PC、数字静态照相机、数字视频摄像机、助听器等。
对便携式终端是可佩戴式照相机的情况进行说明。可佩戴式照相机是例如佩戴在胸前位置或挂眼镜的部位等,常时拍摄并记录佩戴者体验的设备。通过将上述声音分析装置配备在可佩戴式照相机上,可以实现例如用环境音捕捉工厂中的工作人员的停留场所的变化,并且将它们作为记录保留的功能。具体地,可佩戴式照相机具备判定部,根据从声音分析装置输入的环境信息来判定环境有无变化,将判定结果发送到环境变化时刻记录部中;和环境变化时刻记录部,与记录时刻一起记录从判定部输入的判定结果。更详细地,例如在环境信息从室内变化到室外的情况下,或者从室外变化到室内的情况下,环境变化时刻记录部记录该变化时刻的时间和环境信息。其他构成要素与便携式电话机l的构成要素相同。
接着,对便携式终端是万步计的情况进行说明。万步计是例如佩戴在腰的位置,计测佩戴者步数的设备。通过将上述声音分析装置配备在万步计上,可以实现例如详细地分类步行状态的功能,该步行状态为什么时候、在怎样的环境下进行步行。具体地,万步计具备步行时环境获取部,根据从声音分析装置输入的环境信息获取步行中的环境信息;和步行时环境记录部,与记录时刻、以及步数一起记录从步行时环境获取部输入的环境信息。其他构成要素与便携式电话机1的构成要素相同。由此,例如能够判定是每天早晚在室外上下班移动时的步行、还是在工作地点的室内工作时的步行等,能够期待对万步计佩戴者给予在健康管理方面的新发现的效果。
接着,对便携式终端是照相机的情况进行说明。在不仅记录静止图像、而且也相应地记录拍摄静止图像的时刻前后的声音的数字静止照相机(包括便携式电话机等的静止图像摄影功能等),或将动画和声音对应起来记录的数字视频摄像机(也包括便携式电话机的视频摄像功能等)中,将拍摄的场景氛围作为元数据与其场景对应记录,从而能够自动地对场景进行分类。具体地,数字静止照相机或者数字视频摄像机具备支配性环境音判定部,汇总从环境判定部125依次输入的环境判定结果,判定规定区间中的支配性的环境音;和支配性环境音记录部,将从支配性环境音判定部输入的支配性环境音的信息,与记录在照相机中的声音以及图像信号关联记录。例如,在拍摄的场景20秒中,按时间序列顺序从环境判定部125向支 配性环境音判定部输入20个环境判别结果(例如以l秒为单位输入),设 根据这些判别结果,例如室外的杂乱声是支配性的(例如设20秒之中占有 的比例是7成以上等、某个固定比例以上的情况下是支配性的),对于拍摄 的场景赋予「室外杂乱声」的标签作为氛围信息。
由此,能够将拍摄场景按氛围信息分别分类,能够期待用户此后易于 简单回想起该场景的效果。而且,判定是否是支配性的方法,并不限于上 述方法,也可以将在该场景中分类为最多的环境音判定是支配性的。
接着,对便携式终端是助听器的情况进行说明。作为助听器的具体结 构,具备助听方法选择部,按照从环境判定部125输入的环境判定结果 选择助听方法;和助听处理部,按照选择的助听方法进行助听处理。在助 听器中,通过与声音的环境相对应来改变用于助听的信号处理,能够大幅 改善清晰度。例如,当室内杂乱时,提高频率的中高频域部分以便不产生 不快感,当在室外交通噪音下,提高频率的低频域部分以不产生不快感。
接着,对便携式终端是携带式PC的情况进行说明。在携带式PC的情 况下,具体地,为了在PC上实现以便携式电话机或照相机说明的功能,可 以考虑将各自的构成要素的全部或者一部分安装至在PC上工作的软件、或 者PC卡或USB连接等的外部设备等。
在上述实施方式中,环境音分类部IIO具体地由DSP等实现,但也可 以由微处理器实现。另外,事件分割点判定部120具体地由微处理器等实 现,也可以由DSP实现。
在上述实施方式中,时间区间的设定是重合设定的,但也可以不重合 地设定时间区间。
在上述实施方式6中,位置信息检测部150构成为含有GPS等,但也 不限于此。也可以是利用PHS/TV广播波的位置信息系统等。
在上述实施方式中,在判定为比例值大于域值的情况下,检测出与新 接收的类别占有率对应的时间区间的开始点作为环境的变化时刻,但也不 限于此。例如,也可以检测出与存储的类别占有率对应的时间区间的结束 点作为环境变化时刻,也可以将占有率超过规定域值地变化的时刻,判定 为环境变化的划分点,检测出该时刻作为变化时刻。在上述实施方式中,在比例值超过域值变化的情况下,检测出变化时 刻,但也可以在类别占有率中的一个环境音类别的占有率超过规定域值的
情况下(例如,在公共汽车的占有率超过90%的情况下),检测出变化时刻。
在上述实施方式中,通过判定比例值是否大于域值来判定环境,但也 可以不计算比例值,根据各时间区间中的各环境音类别的占有率来判定环 境。在这样的情况下,也可以例如环境判定部125接收从类别占有率计算 部124发送的类别占有率,通过决定在接收的类别占有率中各环境音类别 的占有率之中的、占有率最高的环境音类别,来进行环境的判定。图21是 关于不使用比例值的情况的环境判定的流程图。步骤S701 711是与图4 中的步骤S101 111相同的处理。与图4中的处理不同点在于,在步骤712 中,根据计算的类别占有率来判定环境,在步骤S713中,判定是否在判定 的环境发生了变化,在发生环境变化时,在步骤S714中,将判定的环境发 送到记录部20以及来信音需要与否判定部30。
另外,即使不计算类别占有率,也可以通过对判定对象区间中的各环 境音类别的数量进行计数来判定环境。例如,环境的判定也可以通过决定 在判定对象区间中数量最多的环境音类别来进行。
在上述实施方式中,便携式电话机1作为记录环境信息和时刻的结构, 但也可以是根据环境信息和时刻,自动生成用于回想什么时候、在何处、 做了什么的日记,或者自动生成例如旅行记录。另外,也可以根据环境信 息和时刻,实时地推测用户的状况,进行按照其状况的导航服务等。
在上述实施方式中,对声音分析装置进行了说明,但本发明也可以是 包含上述流程图中示出的步骤的方法,以及是包含使计算机执行上述流程 图中示出的步骤的程序代码的程序,以及系统LSI等集成电路。系统LSI 因集成度不同,也可以称为IC、 LSI、超级LSI、特大型LSI。
另外,集成电路化的手段不限于LSI,也可以用专用电路或者通用处 理器来实现。也可以在制造LSI后,利用可编程的FPGA (现场可编程门阵 列Field Programmable Gate Array)、可重新构成LSI内部的电路元件 的连接或设定的可重构处理器。
进而,如果因半导体技术的进步或者派生的技术而出现替换LSI的集 成电路化的技术,当然,也可以使用这样的技术进行功能块的集成电路化。例如,可以有应用于生物技术的可能性。 工业上的利用可能性
本发明涉及的声音分析装置作为主要用于便携式终端等的声音分析装 置是有用的。在此,所谓便携式终端是可佩戴式照相机、万步计、携带式 PC、便携式电话机、数字静态照相机、数字视频摄像机以及助听器等。
权利要求
1.一种声音分析装置,包括音响参数计算单元,对声音信号进行收音,计算每单位时间的音响参数;类别决定单元,根据计算的音响参数,决定单位时间的部分声音信号属于多个环境音类别之中的哪个环境音类别;区间设定单元,随着时间经过,沿时间轴上随时设定判定对象区间,该判定对象区间构成为包括多个连续的单位时间;以及环境判定单元,根据至少最近的判定对象区间中包含的环境音类别数,判定该判定对象区间中的本装置的周围的环境。
2. 在权利要求l记载的声音分析装置,其中,上述环境判定单元包括计算单元,根据上述最近的判定对象区间中包含的环境音类别数,计算表示各环境音类别占该判定对象区间整体的比例的类别占有率;通过决定上述类别占有率之中的占有比例最高的环境音类别,来进行 根据上述环境音类别数的环境的判定。
3. 在权利要求1记载的声音分析装置,其中,上述环境判定单元包括计算单元,对于每个判定对象区间计算表示 各环境音类别占该判定对象区间整体的比例的类别占有率;根据对于最近的判定对象区间的类别占有率与先前的判定对象区间的 类别占有率之间的变化的比例是否大于预先设定的域值的判定,来进行根 据上述环境音类别数的环境的判定。
4. 在权利要求1记载的声音分析装置,其中, 上述声音分析装置还包括功率谱计算单元,计算上述声音信号的功率谱;以及 位移判定单元,检测由上述功率谱计算单元计算的功率谱的时间位移, 判定被检测出的位移是否超过预先设定的域值;上述区间设定单元设定判定对象区间,以使由上述位移判定单元作出 肯定判定的时刻作为先前的判定对象区间的结束点并且作为上述最近的判 定对象区间的开始点,并使接下来作出肯定判定的时刻作为上述最近的判 定对象区间的结束点并且作为其后续的判定对象区间的开始点。
5. 在权利要求3记载的声音分析装置,其中,由上述区间设定单元以前后设定的两个判定对象区间具有相互重叠的部分;上述环境判定单元还在上述变化的比例大于上述域值的情况下,检测 上述最近的判定对象区间或者上述先前的判定对象区间的规定时刻,来作 为上述环境的变化时刻。
6. 在权利要求l记载的声音分析装置,其中, 上述声音分析装置还包括动作检测单元,检测与本装置有关的用户的动作信息; 动作判定单元,根据检测的动作信息来判定上述用户是否为动作中;以及控制单元,在上述动作判定单元的判定是否定的情况下,制止由上述 环境判定单元对环境的判定,在上述动作判定单元的判定是肯定的情况下, 允许由上述环境判定单元对环境的判定。
7. 在权利要求5记载的声音分析装置,其中,上述多个环境音类别的各个环境音类别是与交通手段有关的环境音类别;上述声音分析装置还包括-选出单元,根据由上述动作检测单元检测的动作信息,选出一个以上 的环境音类别,来作为上述用户的交通手段的候选;上述环境判定单元还在上述最近的判定对象区间和上述先前的判定对 象区间内,由上述选出单元选出的上述一个以上的环境音类别发生变化的 情况下,检测上述规定时刻来作为上述环境的变化时刻。
8. 在权利要求5记载的声音分析装置,其中,上述多个环境音类别的各个环境音类别是与交通手段有关的环境音类别;上述声音分析装置还包括位置信息检测单元,检测与本装置有关的用户位置信息; 存储单元,存储地图信息;以及选出单元,根据由上述位置信息检测单元检测的位置信息以及上述地 图信息,选出一个以上的环境音类别,来作为上述用户的交通手段的候选;上述环境判定单元还在上述最近的判定对象区间和上述先前的判定对 象区间内,由上述选出单元选出的上述一个以上的环境音类别发生变化的 情况下,检测上述规定时刻来作为上述环境的变化时刻。
9. 在权利要求5记载的声音分析装置,其中,上述多个环境音类别的各个环境音类别是与交通手段有关的环境音类别;上述声音分析装置还包括位置信息检测单元,检测与本装置有关的用户的位置信息;速度推测单元,通过以规定间隔获取位置信息,并计算各相邻时间的 2点间的距离,来推测速度;以及选出单元,根据由上述速度推测单元推测的速度,选出一个以上的环 境音类别,来作为上述用户的交通手段的候选;上述环境判定单元还在上述最近的判定对象区间和上述先前的判定对 象区间内,由上述选出单元选出的上述一个以上的环境音类别发生变化的 情况下,检测上述规定时刻来作为上述环境的变化时刻。
10. 在权利要求5记载的声音分析装置,其中,上述多个环境音类别的各个环境音类别是与交通手段有关的环境音类 别,由上述环境判定单元检测的环境的变化时刻是交通手段变化的时刻。
11. 一种声音分析方法,包括音响参数计算步骤,对声音信号进行收音,计算每单位时间的音响参数;类别决定步骤,根据计算的音响参数,决定单位时间的部分声音信号 属于多个环境音类别之中的哪个环境音类别;区间设定步骤,随着时间经过,沿时间轴上随时设定判定对象区间, 该判定对象区间构成为包含多个连续的单位时间;以及环境判定步骤,根据至少最近的判定对象区间中包含的环境音类别数, 来判定该判定对象区间中的本装置的周围的环境。
12. —种声音分析程序,能够由计算机读取,其特征在于,使计算机 执行包括以下步骤的次序音响参数计算步骤,对声音信号进行收音,计算每单位时间的音响参数;类别决定步骤,根据计算的音响参数,决定单位时间的部分声音信号 属于多个环境音类别之中的哪个环境音类别;区间设定步骤,随着时间经过,沿时间轴上随时设定判定对象区间, 该判定对象区间构成为包含多个连续的单位时间;以及环境判定步骤,根据至少最近的判定对象区间中包含的环境音类别数, 来判定该判定对象区间中的本装置的周围的环境。
13. —种系统集成电路,设置于声音分析装置,具备 音响参数计算单元,对声音信号进行收音,计算每单位时间的音响参数;类别决定单元,根据计算的音响参数,决定单位时间的部分声音信号 属于多个环境音类别之中的哪个环境音类别;区间设定单元,随着时间经过,沿时间轴上随时设定判定对象区间, 该判定对象区间构成为包括多个连续的单位时间;以及环境判定单元,根据至少最近的判定对象区间中包含的环境音类别数, 判定该判定对象区间中的本装置的周围的环境。
全文摘要
一种声音分析装置,包括音响参数计算部,对声音信号进行收音,计算每单位时间的音响参数;类别决定部,根据计算的音响参数,决定单位时间的部分声音信号属于多个环境音类别之中的哪个环境音类别;区间设定部,随着时间经过,沿时间轴上随时设定判定对象区间,该判定对象区间构成为包括多个连续的单位时间;以及环境判定部,根据至少最近的判定对象区间中包含的环境音类别数,判定该判定对象区间中的本装置的周围的环境。
文档编号G10L11/00GK101636783SQ20088000851
公开日2010年1月27日 申请日期2008年3月13日 优先权日2007年3月16日
发明者川西亮一, 河村岳 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1