一种声控告警方法及装置的制作方法

文档序号：7927819阅读：258来源：国知局

专利名称：一种声控告警方法及装置的制作方法
技术领域：
本发明涉及电子技术领域，特别是涉及声控告警方法及装置。
背景技术：
安全相信是每一个人在做事前考虑的第一要点，因为只有安全了，才能使宝贵的生命不受到伤害，使生活充满欢乐、更加美好。所以希望能够及早发现异常预防危险的发生，或者在发生危险后及早的采取紧急措施。安保工作人员和各种各样的监控设备应运而生。随着电子技术的迅猛发展，视频监控设备已遍及公共场所的各个角落，进行着24 小时的不间断监视，从而取代了人工巡逻的传统方式。视频监控设备是通过对周围环境的视频图像采集来进行环境监控，其未对声音进行采集。需要工作人员在监视器前收看视频监控设备传回的视频图像，并发现危险情况。如果工作人员的注意力离开了监视器，则无法及时发现危险情况，可能导致危险蔓延和恶化。

发明内容
本发明实施例提供一种声控告警方法及装置，用于实现在发现危险声音时进行告
氛 —种声控告警方法，包括以下步骤
采集声音信号；将采集到的声音信号与预设的危险声音信号样本进行匹配；在匹配成功的情况下，第一终端自动向预设的指定号码所对应的第二终端发出告警通知。 —种通信设备，包括
麦克风，用于采集声音信号；匹配模块，用于将采集到的声音信号与预设的危险声音信号样本进行匹配；
通信模块，用于在匹配成功的情况下，根据匹配模块的触发，自动向预设的指定号码所对应的第二终端发出告警通知。本发明实施例利用终端的麦克风对周围环境的声音进行监控，并在发现危险的情况下，利用终端的通信功能进行告警，从而实现了声控告警，并且有效利用了终端固有的一些功能，节省了额外的资源开销。

图1为本发明实施例中声控告警的主要方法流程图；图2为本发明实施例中声控告警的详细方法流程图；图3为本发明实施例中带视频和声音监控的告警方法的流程图；图4为本发明实施例中声源定位方法的示意4
图5为本发明实施例中通信终端的主要结构图；图6为本发明实施例中通信终端的详细结构图；图7为本发明实施例中带视频模块的通信终端的详细结构图；图8为本发明实施例中可视终端的示意图。
具体实施例方式
本发明实施例对周围环境进行声控监听，并在发现危险声音信号的情况下自动向工作人员的终端发出告警通知，以便及时通知工作人员。
参见图l，本实施例中声控告警的主要方法流程如下步骤101 :采集声音信号。该步骤可以由第一终端的麦克风实现，也可以由外接到第一终端的麦克风实现。步骤102 :将采集到的声音信号与预设的危险声音信号样本进行匹配。该步骤可以由第一终端实现，也可以由可外接到第一终端的芯片实现。步骤103 :在匹配成功的情况下，第一终端自动向预设的指定号码所对应的第二终端发出告警通知。上述流程可以由一个独立的芯片完成，该芯片可以置入第一终端中，即由第一终端实现该方法。
参见图2，本实施例中声控告警的详细方法流程如下步骤201 :第一终端通过包括的麦克风采集声音信号。该麦克风可以是第一终端的听筒上的麦克风，也可以是免提通话时使用的麦克风，或者在第一终端上安装的其它麦克风。
步骤202 :第一终端对采集到的声音信号进行能量检测，得到声音信号的能量包
络。本实施例中是以帧为单位对声音信号进行能量检测，所以较佳的，得到的一帧声音信号
的能量包络为各位声音信号的能量包络的平均值。当然，得到的一帧声音信号的能量包络
也可以为一帧声音信号中任一位声音信号的能量包络，或者采用其它方式。
步骤203 :第一终端将该能量包络与预设的能量阈值进行比较，若不小于预设的
能量阈值，则确定环境有声，继续步骤204，否则确定环境无声，结束本次流程。通过该步骤
可以过滤掉一些无用的声音，减少后续步骤的执行次数，节省资源。如果把脚步声等设为危
险声音，则较小的能量阈值比较合适；如果把爆炸声等设为危险声音，则较大的能量阈值比
较合适。步骤204:第一终端将采集到的声音信号与声音库中的各声音信号样本进行匹配，得到与各声音信号样本的相似度。具体匹配过程包括提取出一帧声音信号的美尔倒谱 (Mel Frequency C印strum Coefficients，MFCC)系数；采用经过声音分类训练的混合高斯模型(Gauss mixture model，G匪)算法，其中一类声音对应一套混合高斯模型参数，根据提取出的MFCC系数和应用一套混合高斯模型参数，计算出关于该类声音的特征变量，通过计算混合高斯模型的概率密度得到该特征变量的出现概率；关于一种声音信号样本，其特征变量的出现概率即为采集到的声音信号与该声音信号样本的相似度，概率越大表示相似度越大。声音信号样本包括枪声、爆炸声、着火声、流水声、玻璃碎声、电话铃声、尖叫声、说话声、风声、打雷声、下雨声、脚步声等。步骤205 :第一终端判断相似度最大的声音信号样本是否为危险声音信号样本，若是，则匹配成功，继续步骤206，否则匹配失败，结束本次流程。如何判断是否为危险声音信号样本有多种方式，如为声音信号样本打上"危险"或"普通"的标记，带有"危险"标记
的声音信号样本为危险声音信号样本；或者，用一个独立的声音库存储危险声音信号样本，将相似度最大的声音信号样本与该声音库中的危险声音信号样本进行匹配，如果匹配成功 (即基本一致)，则确定该声音信号样本为危险声音信号样本。声音库中的哪些声音信号样本为危险声音信号样本，可以由用户根据自身需要进行设置，可以在不同时段设置不同的危险声音信号样本。第一终端可以判断相似度最大的声音信号样本是否为当前时段的危险声音信号样本。其中，第一终端包括时钟功能。
步骤206 :第一终端自动向预设的指定号码所对应的第二终端发出告警通知。可以将安全工作人员或公共应急电话等号码设为指定号码。第一终端可以通过呼叫第二终端，或者向第二终端发送短信或彩信等方式，来发出告警通知。其中，第一终端在呼叫并接通第二终端的情况下，向第二终端发送预设的告警铃声、告警录音等，或将采集到的声音信号作为告警声音信号传输给第二终端。通常在得知发生危险时，更希望看到现场的画面。现有技术均是通过视频监控系统的监视器收看现场画面，如果不在监视器前则看不到。并且，整个视频监控系统需要安装、布线和调试等工作，工程量比较大。本实施例通过可视终端来解决该问题。
参见图3，声音和视频联合监控的方法流程如下步骤301 :第一终端通过两个麦克风采集声音信号。第一终端可采用听筒上的麦克风、免提通话时的麦克风和可视屏上的麦克风等。第一终端可采用任意两个麦克风或更多的麦克风。步骤302 :第一终端将两个麦克风组成麦克风阵列，并通过该麦克风阵列进行声源定位，获得声源方向。步骤303 :第一终端对声音方向进行平滑处理。该步骤是为了减少摄像头的频繁转动，影响观察效果。步骤304 :第一终端根据声源方向调整摄像头的朝向，使摄像头采集声源处(即危险现场)的视频图像信号。步骤305 :第一终端将视频图像信号传输给第二终端。工作人员通过第二终端的显示屏观看视频图像，以对现场进行观察。在步骤302中，利用声源发出声音信号到两个麦克风的时间差来确定声源方向。参见图4所示，麦克风l和麦克风2组成麦克风阵列，用声源相对于一个麦克风的入射角来表示声源方向，即伊arcsin(c^"),其中d为声波到达两个麦克风的时间差，c 表示声速，L表示两个麦克风的间距，^是声源的入射角度。时间差d可以通过计算声波到两个麦克风的相位差来得到。可以进一步通过平滑因子对入射角度进行平滑处理，即 < =<。w" + p(l-a),其中a为平滑因子，本实施例中取0.8， p'为本次最终得到的入射角
度，,。,d为曾经得到的入射角度(如上一次最终得到的入射角度)。麦克风阵列的位置通常是固定的，入射角的参考方向固定，该参考方向可采用麦克风的水平方向或垂直方向等。在知道了摄像头相对于麦克风阵列的方向、入射角的参考方向和入射角度的情况下，便可以确定声源相对于摄像头的方向，摄像头便可根据该方向进行旋转。经过上述流程，工作人员即可以听到危险声音，又可以看到现场画面，充分了解现场发生的情况。并且，利用已有的可视电话进行监控，不再需要安装视频监控系统，节省人力和物力。摄像头可以一直保持监控状态，通常在得知发生危险时才比较希望看到现场画面，这样还可以节省设备和电力等方面的资源，则摄像头可以在转向声源后开始进行视频图像信号的采集，或者在第一终端向第二终端发送告警通知的同时，触发摄像头采集视频图像信号。摄像头可以边旋转边采集。第一终端可以24小时对周围环境进行声音和视频监控。为了节省资源，第一终端也可以受定时器的触发，在预设的时间段内进行监控。触发条件还可以有很多，如收到特定号码所对应的终端的呼叫或短信等。即工作人员可以通过第二终端呼叫第一终端，第一终端采用免提方式接听，这样第一终端可通过免提通话时的麦克风进行声音信号的采集。第一终端可继续进行采集，不考虑第二终端的通话状态，或者在第二终端挂机时第一终端结束采集。通过以上描述了解了声音及视频监控的过程，下面对第一终端的内部结构进行详细介绍。参见图5，本实施例中的通信设备包括麦克风501、匹配模块502和通信模块503。该通信设备可以是固定电话和手机等。
麦克风501用于采集声音信号。匹配模块502用于将采集到的声音信号与预设的危险声音信号样本进行匹配，得到与各声音信号样本的相似度，并判断相似度最大的声音信号样本是否为危险声音信号样本。通信模块503用于在匹配成功的情况下，根据匹配模块502的触发，自动向预设的指定号码所对应的第二终端发出告警通知。通信模块503为呼叫模块；则呼叫模块自动呼叫第二终端，并在呼叫接通的情况下向第二终端传输告警声音信号；或者，通信模块503为短信模块；则短信模块自动向第二终端发送包括告警信息的短信。在通信设备的语音频信号编码器中，输入声音信号首先经过异常事件检测器(即匹配模块502)，如果检测到异常(比如尖叫声，枪声，爆炸声等)，将检测结果传递给码率控制模块，码率控制模块将根据检测到的事件的重要性控制语音频编码器的编码码率，以提高编码信号的质量。该通信设备还包括能量检测模块504，参见图6所示，该能量检测模块504用于对采集到的声音信号进行能量检测，得到声音信号的能量包络。匹配模块502用于将能量包络与预设的能量阈值进行比较，在能量包络(即检测值)不小于预设的能量阈值的情况下，将采集到的声音信号与预设的危险声音信号样本进行匹配。该通信设备可包括两个麦克风501或更多，使多个麦克风501构成麦克风阵列。通过该麦克风阵列进行声源定位。则该通信设备还包括声源定位模块505和视频模块506，参见图7所示。声源定位模块505用于将所述两个麦克风组成麦克风阵列，并进行声源定位，获得声源方向，以及将声源方向发送给视频模块506。具体的，声源定位模块505利用声源发出声音信号到两个麦克风的时间差来确定声源方向。视频模块506用于根据声源方向调整自身的朝向，来采集声源处的视频图像信号，并将采集到的视频图像信号发送给第二终端。视频模块506包括摄像头。视频模块506 根据摄像头相对于麦克风阵列的方向、入射角的参考方向和入射角度，确定声源相对于摄像头的方向，并使摄像头根据该方向进行旋转。该通信设备还包括平滑模块507、设置模块508、控制模块509和存储模块510。
平滑模块507用于对声源方向进行平滑处理，并将处理结果传输给视频模块。
设置模块508用于进行关于危险声音信号样本的设置，以及指定号码和特定号码的设置等。其中，特定号码用于触发麦克风采集声音信号，指定号码用于在发现危险情况时向指定的终端告警。用户可以通过设置模块508进行各种设置。控制模块509用于在收到特定终端的通知时，触发麦克风采集声音信号。该特定终端的号码可预先保存在通信设备中，在发现来电号码是特定号码时，触发麦克风采集声音信号。存储模块510用于存储设置模块508的设置结果，如指定号码等，还存储声音库等。本实施例提供可视电话的示意图，如图8所示。可视电话可以通过麦克风801和麦克风802进行声音信号的采集，通过摄像头803采集视频图像信号。可视电话根据麦克风801和麦克风802组成的麦克风阵列进行声源定位，然后控制可旋转轴805并使其朝向声源，以便采集危险现场的视频图像。该可视电话当需要呼叫对方终端或需要接收对方终端的呼叫时，可自动按下免提键804进行通话，即通过免提通话的麦克风将现场的声音传输给对方终端。用于实现本发明实施例的软件可以存储于软盘、硬盘、光盘和闪存等存储介质。
本发明实施例利用终端的麦克风对周围环境的声音进行监控，并在发现危险的情况下，利用终端的通信功能进行告警，从而实现了声控告警，并且有效利用了终端固有的一些功能，节省了额外的资源开销。本发明实施例还通过能量阈值对采集到的声音信号进行过滤，减少无用的处理。并且，本发明实施例在进行声音监控的过程中，还可以利用终端上的摄像头进行视频监控，使工作人员充分了解现场的情况，尽早排除危险。为了减少摄像头的频繁转动，影响观察效果，本发明实施例对声源方向进行平滑处理。以及，本发明实施例为了更灵活的使用声音和视频监控，通信终端可以在时间或呼叫等触发条件的触发下进行声音信号和视频图像信号的采集。本发明实施例还为方便用户设置，为用户提供了操作接口，即设置模块508。显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
权利要求
一种声控告警方法，其特征在于，包括以下步骤采集声音信号；将采集到的声音信号与预设的危险声音信号样本进行匹配；在匹配成功的情况下，第一终端自动向预设的指定号码所对应的第二终端发出告警通知。
2. 如权利要求1所述的声控告警方法，其特征在于，对采集到的声音信号进行能量检测，在检测值不小于预设的能量阈值的情况下，将采集到的声音信号与预设的危险声音信号样本进行匹配。
3. 如权利要求1所述的声控告警方法，其特征在于，将采集到的声音信号与预设的危险声音信号样本进行匹配的步骤包括将采集到的声音信号与预设的各声音信号样本进行匹配，若相似度最大的声音信号样本为危险声音信号样本，则确定匹配成功。
4. 如权利要求1所述的声控告警方法，其特征在于，第一终端自动向预设的指定号码所对应的第二终端发出告警通知的步骤包括第一终端自动呼叫第二终端，并在呼叫接通的情况下向第二终端传输告警声音信号；或者第一终端自动向预设的指定号码所对应的第二终端发出告警通知的步骤包括第一终端自动向第二终端发送包括告警信息的短信。
5. 如权利要求4所述的声控告警方法，其特征在于，在呼叫接通的情况下，第一终端采用免提方式接听，并将采集到的声音信号作为告警声音信号传输给第二终端。
6. 如权利要求1至5中任一项所述的声控告警方法，其特征在于，通过第一终端的麦克风采集声音信号。
7. 如权利要求6所述的声控告警方法，其特征在于，所述麦克风包括两个。
8. 如权利要求7所述的声控告警方法，其特征在于，还包括步骤通过两个麦克风进行声源定位，获得声源方向；根据声源方向调整第一终端的摄像头的朝向，并采集声源处的视频图像信号；将采集到的视频图像信号发送给第二终端。
9. 如权利要求8所述的声控告警方法，其特征在于，在根据声源方向调整第一终端的摄像头的朝向之前，对声源方向进行平滑处理。
10. 如权利要求8所述的声控告警方法，其特征在于，通过进行声源定位获得声源方向的步骤包括利用声源发出声音信号到所述两个麦克风的时间差来确定声源方向。
11. 如权利要求l所述的声控告警方法，其特征在于，当定时器达到预设的时间时，采集声音信号；或者当第一终端接收到第二终端的声控通知时，采集声音信号。
12. —种通信设备，其特征在于，包括麦克风，用于采集声音信号；匹配模块，用于将采集到的声音信号与预设的危险声音信号样本进行匹配；通信模块，用于在匹配成功的情况下，根据匹配模块的触发，自动向预设的指定号码所对应的第二终端发出告警通知。
13. 如权利要求12所述的通信设备，其特征在于，通信模块为呼叫模块；通信模块自动向预设的指定号码所对应的第二终端发出告警通知的步骤包括呼叫模块自动呼叫第二终端，并在呼叫接通的情况下向第二终端传输告警声音信号；或者通信模块为短信模块；通信模块自动向预设的指定号码所对应的第二终端发出告警通知的步骤包括短信模块自动向第二终端发送包括告警信息的短信。
14. 如权利要求12所述的通信设备，其特征在于，还包括能量检测模块，用于对采集到的声音信号进行能量检测；匹配模块用于在检测值不小于预设的能量阈值的情况下，将采集到的声音信号与预设的危险声音信号样本进行匹配。
15. 如权利要求12、13或14所述的通信设备，其特征在于，包括两个麦克风。
16. 如权利要求15所述的通信设备，其特征在于，还包括声源定位模块和视频模块；射声源定位模块，用于将所述两个麦克风组成麦克风阵列，并进行声源定位，获得声源方向，以及将声源方向发送给视频模块；视频模块，用于根据声源方向调整自身的朝向，来采集声源处的视频图像信号，并将采集到的视频图像信号发送给第二终端。
17. 如权利要求16所述的通信设备，其特征在于，还包括平滑模块，用于对声源方向进行平滑处理，并将处理结果传输给视频模块。
18. 如权利要求12所述的通信设备，其特征在于，还包括设置模块，用于进行关于危险声音信号样本的设置。
19. 如权利要求12所述的通信设备，其特征在于，还包括控制模块，用于在收到第二终端的通知时，触发麦克风采集声音信号。
全文摘要
本发明公开了一种声控告警方法，用于实现在发现危险声音时进行告警。所述方法包括采集声音信号；将采集到的声音信号与预设的危险声音信号样本进行匹配；在匹配成功的情况下，第一终端自动向预设的指定号码所对应的第二终端发出告警通知。本发明还公开了一种用于实现所述方法的装置。
文档编号H04M11/04GK101739789SQ20081022627
公开日2010年6月16日申请日期2008年11月11日优先权日2008年11月11日
发明者冯宇红, 张晨申请人:北京中星微电子有限公司;中星电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张晨;冯宇红
技术所有人：北京中星微电子有限公司;中星电子股份有限公司
我是此专利的发明人

上一篇：推送认证页面的方法、系统及装置的制作方法
上一篇：一种推送个性化页面的方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。