一种基于区间差分特征的婴儿啼哭检测方法

文档序号：9418697阅读：1301来源：国知局

一种基于区间差分特征的婴儿啼哭检测方法
【技术领域】
[0001] 本发明涉及音频处理技术领域，具体是一种基于区间差分特征的婴儿啼哭检测方法。
【背景技术】
[0002] 啼哭是婴儿的本能反应，尤其是对于小于两周岁的婴儿，由于他们还不具备语言表达能力，啼哭是他们表达感情、对外界刺激做出反应的最重要方式，因此，当婴儿啼哭时，看护人需要及时地去照看。然而，在现实环境中，看护人不可能每时每刻都在看护，尤其是在婴儿睡着时，往往会从事一些其他的工作，如做家务、看电视等，如果此时婴儿发生了啼哭，看护人尤其是老年人，往往会听不见，不能及时地进行照看，可能会导致婴儿受到一些意想不到的伤害，给整个家庭带来悲伤。
[0003]目前，已有一些用于婴儿啼哭检测的技术，如"一种能识别婴儿哭声的婴儿监护器及婴儿哭声识别方法"（中国专利【申请号】CN201310440063)，"利用婴儿哭声频率的婴儿监视系统及其方法"（中国专利【申请号】CN200410020849)等，这类技术的主要原理是基于婴儿啼哭时的音量较高和音频频率较大的特点，通过统计一段时间内的外部音频的特征，判断婴儿是否处于啼哭状态。该类技术在理想环境下是可以达到检测效果的，然而，其缺点也很多，如误检侧严重，该类技术只是被动地接受外部音频，判断准则简单，易受到外部音频干扰，如手机铃声、电视音频、大人咳嗽等，同样，该类技术会存在漏检。

【发明内容】

[0004] 本发明的目的在于提供一种检测结果更加准确的基于区间差分特征的婴儿啼哭检测方法。
[0005] 本发明的技术方案为：
[0006] -种基于区间差分特征的婴儿啼哭检测方法，包括以下顺序的步骤：
[0007] (1)采集一段音频波形数据；
[0008] (2)对采集的一段音频波形数据，统计其中波形幅度大于一定数值的音频波形数据所占的时间比例，作为该段音频波形数据的音频能量特征；
[0009] (3)判断所述音频能量特征是否大于一定阈值，若是，则执行步骤（4)，若否，则返回步骤（1);
[0010] (4)去除该段音频波形数据的背景干扰音频；
[0011] (5)基于预先训练的婴儿啼哭音频分类器，确定该段音频波形数据上的候选婴儿啼哭音频位置区间；
[0012] (6)按照以下公式，获得该段音频波形数据上任意一个音频位置区间的统计特征：
[0013] CN 105139869 A 仇卞> 2/6 页
[0014] T = λ *max {I ta_tb I，I tc_td I}
[0015] 其中，N表示某个音频位置区间被检测为婴儿啼哭音频的累计数目，[ta， t b)、[t。，td)表示该音频位置区间内的候选婴儿啼哭音频位置区间，λ表示常数且有 0. 25彡λ彡0. 4, max {}函数的功能是选择最大的数据元素；
[0016] (7)若该段音频波形数据上某个音频位置区间的统计特征大于预定数值，则执行步骤（8)，若该段音频波形数据上任意一个音频位置区间的统计特征均不大于预定数值，则返回步骤（1);
[0017] (8)发出报警信号。
[0018] 所述的基于区间差分特征的婴儿啼哭检测方法，步骤（4)，包括：
[0019] a、按照以下公式，去除该段音频波形数据的背景音频：
[0020]
[0021] 其中，s(t)表示该段音频波形数据上t时刻的波形幅度，驗表示该段音频波形数据的平均波形幅度。
[0022] b、去除干扰噪声，即去除该段音频波形数据上的孤立区间，所述孤立区间由以下公式定义：
[0023]
[0024] 其中，[a，b)表示该段音频波形数据上的孤立区间，s(t)表示该段音频波形数据上t时刻的波形幅度，T。表示时间间距阈值。
[0025] 所述的基于区间差分特征的婴儿啼哭检测方法，步骤（5)，包括：
[0026] a、在当前尺度下的音频波形数据上，按照训练正样本的时长进行遍历，遍历的步长为μ秒，对于每一个遍历位置区间，基于婴儿啼哭音频分类器，判断当前遍历位置区间内的音频波形数据是否属于婴儿啼哭音频，若是，则将当前遍历位置区间标记为候选婴儿啼哭音频位置区间；
[0027] b、按照一定的缩放因子，对当前尺度下的音频波形数据进行水平方向的缩放处理，按照以下公式，计算缩放后的音频波形数据上t时刻的波形幅度：
[0028]
[0029] 其中，s(t)表示缩放后的音频波形数据上t时刻的波形幅度，^表示距离t时刻最近的前一个已知波形幅度s U1)对应的时刻，丨2表示距离t时刻最近的后一个已知波形幅度S (t2)对应的时刻；
[0030] c、将缩放后的音频波形数据作为新的当前尺度下的音频波形数据，返回步骤a ;
[0031] d、获得每一个尺度下音频波形数据上的候选婴儿啼哭音频位置区间，并按照以下公式，将所有候选婴儿啼哭音频位置区间变换到原始尺度空间上：
[0032]
[0033] 其中，[tmi，tm2)表示某个尺度空间上的候选婴儿啼哭音频位置区间，s表示该尺度空间的缩放因子，[t ni，tn2)表示原始尺度空间上的候选婴儿啼哭音频位置区间。
[0034] 所述的基于区间差分特征的婴儿啼哭检测方法，步骤（5)中，所述婴儿啼哭音频分类器的获取，包括：
[0035] a、收集各种婴儿啼哭的音频波形数据作为训练正样本，所述训练正样本的时长为 τ秒；
[0036] b、收集除婴儿啼哭声之外的其他音频波形数据作为训练负样本，所述训练负样本的时长也为τ秒；
[0037] c、分别去除训练正样本、训练负样本的背景干扰音频；
[0038] d、按照以下公式，分别获取训练正样本、训练负样本的区间差分特征集：
[0039] I；
[0040]
[0041] 其中，S(t)表示一段音频波形数据上t时刻的波形幅度，ti、t2、t 3、t4依次是该段音频波形数据上的不同时刻位置，且它们之间的时间间距是相等的；
[0042] e、基于adaboost学习算法进行样本训练，获取婴儿啼哭音频分类器文件。
[0043] 所述的基于区间差分特征的婴儿啼哭检测方法，步骤（8)，包括：语音报警或者向指定手机号码发送报警短信。
[0044] 由上述技术方案可知，本发明采用粗检测和精检测相结合的逻辑结构，系统整体速度更快；采用自适应的机器视觉学习算法获取最优的训练样本特征，检测结果更加准确，误检和漏检更少；较少受外部环境音频的影响。
【附图说明】
[0045] 图1是本发明训练步骤的逻辑流程图；
[0046] 图2是本发明检测步骤的逻辑流程图；
[0047] 图3是婴儿啼哭音频波形图；
[0048] 图4是非婴儿啼哭音频波形图。
【具体实施方式】
[0049] 下面结合附图和具体实施例进一步说明本发明。
[0050] 一种基于区间差分特征的婴儿啼哭检测方法，包括训练步骤和检测步骤，具体如下：
[0051] 训练步骤的功能是获取婴儿啼哭音频分类器，主要是以音频的波形数据为学习样本，基于adaboost学习算法自适应地选择最优特征进行训练，获取相应的分类器学习文件，如图1所示，包括以下步骤：
[0052] T1、收集训练正样本，主要是各种婴儿啼哭的音频波形数据，包括不同年龄段、不同情况的婴儿啼哭音频波形数据，每一段波形数据的时长为15秒，如图3所示。
[0053] T2、收集训练负样本，主要是除婴儿啼哭声之外的所有可能的音频波形数据，每一段波形数据的时长与正样本一样，如图4所示。
[0054] T3、去除背景干扰音频，主要做法是基于检测步骤中的步骤S5来完成。
[0055] T4、按照公式（1)和（2)，分别获取训练正样本、负样本的区间差分特征集：
[0056]
( 1 )
[0057] sum(i, j) = jS(t) (2)
[0058] 其中，s(t)表示一段音频波形数据上t时刻的波形幅度，t2、t3、t 4依次是该段音频波形数据上的不同时刻位置，且它们之间的时间间距是相等的。
[0059] T5、基于adaboost学习算法进行样本训练，获取婴儿啼哭音频分类器文件，有关 adaboost 算法参见文南犬：A Decision-Theoretic Generalization of OnLine Learning and an Application to Boosting， Yoav Freund， Robert E.Schapire， Journal of Computer and System Sciences55,119-139 (1997)〇
[0060] 检测步骤的功能是实时检测外部音频环境中是否出现婴儿的啼哭音频，如果出现了婴儿的啼哭音频，则报警提

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张卡;尼秀明;何佳;赵章伦;
技术所有人：安徽清新互联信息科技有限公司;
我是此专利的发明人

上一篇：一种光盘的实时刻录方法及装置的制造方法
上一篇：一种用于录音笔的语音频率自动补偿控制方法