一种基于区间差分特征的婴儿啼哭检测方法

文档序号:9418697阅读:1301来源:国知局
一种基于区间差分特征的婴儿啼哭检测方法
【技术领域】
[0001] 本发明涉及音频处理技术领域,具体是一种基于区间差分特征的婴儿啼哭检测方 法。
【背景技术】
[0002] 啼哭是婴儿的本能反应,尤其是对于小于两周岁的婴儿,由于他们还不具备语言 表达能力,啼哭是他们表达感情、对外界刺激做出反应的最重要方式,因此,当婴儿啼哭时, 看护人需要及时地去照看。然而,在现实环境中,看护人不可能每时每刻都在看护,尤其是 在婴儿睡着时,往往会从事一些其他的工作,如做家务、看电视等,如果此时婴儿发生了啼 哭,看护人尤其是老年人,往往会听不见,不能及时地进行照看,可能会导致婴儿受到一些 意想不到的伤害,给整个家庭带来悲伤。
[0003]目前,已有一些用于婴儿啼哭检测的技术,如"一种能识别婴儿哭声的婴儿监护器 及婴儿哭声识别方法"(中国专利【申请号】CN201310440063),"利用婴儿哭声频率的婴儿监 视系统及其方法"(中国专利【申请号】CN200410020849)等,这类技术的主要原理是基于婴 儿啼哭时的音量较高和音频频率较大的特点,通过统计一段时间内的外部音频的特征,判 断婴儿是否处于啼哭状态。该类技术在理想环境下是可以达到检测效果的,然而,其缺点也 很多,如误检侧严重,该类技术只是被动地接受外部音频,判断准则简单,易受到外部音频 干扰,如手机铃声、电视音频、大人咳嗽等,同样,该类技术会存在漏检。

【发明内容】

[0004] 本发明的目的在于提供一种检测结果更加准确的基于区间差分特征的婴儿啼哭 检测方法。
[0005] 本发明的技术方案为:
[0006] -种基于区间差分特征的婴儿啼哭检测方法,包括以下顺序的步骤:
[0007] (1)采集一段音频波形数据;
[0008] (2)对采集的一段音频波形数据,统计其中波形幅度大于一定数值的音频波形数 据所占的时间比例,作为该段音频波形数据的音频能量特征;
[0009] (3)判断所述音频能量特征是否大于一定阈值,若是,则执行步骤(4),若否,则返 回步骤(1);
[0010] (4)去除该段音频波形数据的背景干扰音频;
[0011] (5)基于预先训练的婴儿啼哭音频分类器,确定该段音频波形数据上的候选婴儿 啼哭音频位置区间;
[0012] (6)按照以下公式,获得该段音频波形数据上任意一个音频位置区间的统计特 征:
[0013] CN 105139869 A 仇 卞> 2/6 页
[0014] T = λ *max {I ta_tb I,I tc_td I}
[0015] 其中,N表示某个音频位置区间被检测为婴儿啼哭音频的累计数目,[ta, t b)、[t。,td)表示该音频位置区间内的候选婴儿啼哭音频位置区间,λ表示常数且有 0. 25彡λ彡0. 4, max {}函数的功能是选择最大的数据元素;
[0016] (7)若该段音频波形数据上某个音频位置区间的统计特征大于预定数值,则执行 步骤(8),若该段音频波形数据上任意一个音频位置区间的统计特征均不大于预定数值,则 返回步骤(1);
[0017] (8)发出报警信号。
[0018] 所述的基于区间差分特征的婴儿啼哭检测方法,步骤(4),包括:
[0019] a、按照以下公式,去除该段音频波形数据的背景音频:
[0020]
[0021] 其中,s(t)表示该段音频波形数据上t时刻的波形幅度,驗表示该段音频波形数据 的平均波形幅度。
[0022] b、去除干扰噪声,即去除该段音频波形数据上的孤立区间,所述孤立区间由以下 公式定义:
[0023]
[0024] 其中,[a,b)表示该段音频波形数据上的孤立区间,s(t)表示该段音频波形数据 上t时刻的波形幅度,T。表示时间间距阈值。
[0025] 所述的基于区间差分特征的婴儿啼哭检测方法,步骤(5),包括:
[0026] a、在当前尺度下的音频波形数据上,按照训练正样本的时长进行遍历,遍历的步 长为μ秒,对于每一个遍历位置区间,基于婴儿啼哭音频分类器,判断当前遍历位置区间 内的音频波形数据是否属于婴儿啼哭音频,若是,则将当前遍历位置区间标记为候选婴儿 啼哭音频位置区间;
[0027] b、按照一定的缩放因子,对当前尺度下的音频波形数据进行水平方向的缩放处 理,按照以下公式,计算缩放后的音频波形数据上t时刻的波形幅度:
[0028]
[0029] 其中,s(t)表示缩放后的音频波形数据上t时刻的波形幅度,^表示距离t时刻 最近的前一个已知波形幅度s U1)对应的时刻,丨2表示距离t时刻最近的后一个已知波形 幅度S (t2)对应的时刻;
[0030] c、将缩放后的音频波形数据作为新的当前尺度下的音频波形数据,返回步骤a ;
[0031] d、获得每一个尺度下音频波形数据上的候选婴儿啼哭音频位置区间,并按照以下 公式,将所有候选婴儿啼哭音频位置区间变换到原始尺度空间上:
[0032]
[0033] 其中,[tmi,tm2)表示某个尺度空间上的候选婴儿啼哭音频位置区间,s表示该尺 度空间的缩放因子,[t ni,tn2)表示原始尺度空间上的候选婴儿啼哭音频位置区间。
[0034] 所述的基于区间差分特征的婴儿啼哭检测方法,步骤(5)中,所述婴儿啼哭音频 分类器的获取,包括:
[0035] a、收集各种婴儿啼哭的音频波形数据作为训练正样本,所述训练正样本的时长为 τ秒;
[0036] b、收集除婴儿啼哭声之外的其他音频波形数据作为训练负样本,所述训练负样本 的时长也为τ秒;
[0037] c、分别去除训练正样本、训练负样本的背景干扰音频;
[0038] d、按照以下公式,分别获取训练正样本、训练负样本的区间差分特征集:
[0039] I;
[0040]
[0041] 其中,S(t)表示一段音频波形数据上t时刻的波形幅度,ti、t2、t 3、t4依次是该段 音频波形数据上的不同时刻位置,且它们之间的时间间距是相等的;
[0042] e、基于adaboost学习算法进行样本训练,获取婴儿啼哭音频分类器文件。
[0043] 所述的基于区间差分特征的婴儿啼哭检测方法,步骤(8),包括:语音报警或者向 指定手机号码发送报警短信。
[0044] 由上述技术方案可知,本发明采用粗检测和精检测相结合的逻辑结构,系统整体 速度更快;采用自适应的机器视觉学习算法获取最优的训练样本特征,检测结果更加准确, 误检和漏检更少;较少受外部环境音频的影响。
【附图说明】
[0045] 图1是本发明训练步骤的逻辑流程图;
[0046] 图2是本发明检测步骤的逻辑流程图;
[0047] 图3是婴儿啼哭音频波形图;
[0048] 图4是非婴儿啼哭音频波形图。
【具体实施方式】
[0049] 下面结合附图和具体实施例进一步说明本发明。
[0050] 一种基于区间差分特征的婴儿啼哭检测方法,包括训练步骤和检测步骤,具体如 下:
[0051] 训练步骤的功能是获取婴儿啼哭音频分类器,主要是以音频的波形数据为学习样 本,基于adaboost学习算法自适应地选择最优特征进行训练,获取相应的分类器学习文 件,如图1所示,包括以下步骤:
[0052] T1、收集训练正样本,主要是各种婴儿啼哭的音频波形数据,包括不同年龄段、不 同情况的婴儿啼哭音频波形数据,每一段波形数据的时长为15秒,如图3所示。
[0053] T2、收集训练负样本,主要是除婴儿啼哭声之外的所有可能的音频波形数据,每一 段波形数据的时长与正样本一样,如图4所示。
[0054] T3、去除背景干扰音频,主要做法是基于检测步骤中的步骤S5来完成。
[0055] T4、按照公式(1)和(2),分别获取训练正样本、负样本的区间差分特征集:
[0056]
( 1 )
[0057] sum(i, j) = jS(t) (2)
[0058] 其中,s(t)表示一段音频波形数据上t时刻的波形幅度,t2、t3、t 4依次是该段 音频波形数据上的不同时刻位置,且它们之间的时间间距是相等的。
[0059] T5、基于adaboost学习算法进行样本训练,获取婴儿啼哭音频分类器文件,有关 adaboost 算法参见文南犬:A Decision-Theoretic Generalization of OnLine Learning and an Application to Boosting, Yoav Freund, Robert E.Schapire, Journal of Computer and System Sciences55,119-139 (1997)〇
[0060] 检测步骤的功能是实时检测外部音频环境中是否出现婴儿的啼哭音频,如果出现 了婴儿的啼哭音频,则报警提
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1