利用云端实现智能摄像机自动拨号的方法与流程

文档序号：11524391阅读：1511来源：国知局

本发明涉及智能家电领域，尤其涉及利用云端实现智能摄像机自动拨号的方法。

背景技术：

随着家庭监控类产品概念被引爆，一波家庭智能摄像机的浪潮也在中国迅速掀起。360、小米、联想、大华、海康纷纷推出自己的家庭智能摄像机产品，一时国内家庭智能摄像机市场呈现百花齐放之景，各种品牌家庭智能摄像机层出不穷。

所谓的智能摄像机相比传统摄像机，智能摄像机基于云计算技术的发展，让摄像机结合人工智能，给家庭智能摄像机的应用提供了一个更广阔的平台。

现有智能摄像机大多是手机应用对摄像头进行远程控制，接入云端，提供监控功能、双向通话、云录等功能。现有技术如需实现智能摄像机与app通话，则智能摄像机及配套app必须联网。而且通话质量很大程度受网络状况影响，并且只对特定的用户才能实现双向通话，如一些报警号码、急救号码、公共服务号码则无法与其进行通话。

技术实现要素：

为了解决上述技术问题，本发明提出利用云端实现智能摄像机自动拨号的方法，解决了用户在紧急情况或对方未联网的情况下，可通过此方案进行求助、报警、通话，通过云端智能识别即可主动拨打任意或预设号码。

为了实现上述目的，本发明采用的方案是：

利用云端实现智能摄像机自动拨号的方法，包括步骤：

s1，所述摄像机采集音频与视频信号；

s2，所述摄像机将步骤s1中采集到的音频信号经过降噪算法、回声消除算法以及增益控制算法的处理，采集到的视频信号经过滤镜算法、美颜算法以及白平衡算法的处理，然后将处理后的音频信号与视频信号进行rtp打包处理并发送至云端；

s3，所述云端实时检测收到的rtp音频与视频信息，进行解码后打包发送至第三方人工智能开放平台进行识别；并接收所述第三方人工智能开放平台反馈的识别结果；

s4，如果所述云端接收到的音频识别结果为用户呼叫指令，则所述云端支持呼叫，跳至步骤s7；

s5，如果所述云端接收到的音频识别结果为关键字或预设频率的音频，则所述云端直接拨打用户预设的电话号码，跳至步骤s8；

s6，所述云端接收到视频识别结果后，如果识别结果符合用户的预设条件，则所述云端自动拨打用户预设的电话号码，跳至步骤s8；

s7，所述摄像机接收到所述云端在步骤s4中的呼叫指令后提示用户进行指令确定，并将所述用户给出的指令确定的结果发送给所述云端；若所述云端收到的是确认执行指令，则执行步骤s8，若所述云端收到的是确认执行指令，则跳至步骤s3；

s8，所述云端建立用户与被呼叫方的通信关系；

s9，在步骤s8中，若被呼叫方接受通话请求，则进行通话；若被呼叫方没有接受通话请求，所述云端支持用户重播或者顺序呼叫其他预设号码，执行步骤s8；

s10，在所述步骤s9中，通话结束后，所述云端通话释放，执行步骤s3。

步骤s3中所述的第三方人工智能开放平台为讯飞开放平台。

步骤s5中所述的关键字包括：救命以及报警。

步骤s5中所述的预设频率为婴儿哭声频率：频率范围1500—3000赫兹，声音大小75-85分贝。

步骤s6中视频识别结果的预设条件包括：火灾、摔倒、人形以及打斗。

所述火灾的验证方法包括：通过对视频进行火灾色彩验证、图像面积阀值以及相似度计算；所述摔倒的验证方法包括：通过高斯混合模型算法对背景进行更新，并用背景减除法来分割运动目标。

所述人形的验证方法包括：目标检测、边界提取、人形目标匹配和人形目标识别；所述打斗的验证方法包括：利用光流法获得两帧图像的相对运动，根据光流的相对运动，获取能量变化的历史图，通过能量变化的大小来检测打斗。

在步骤s8中，所述云端通过接入第三方sip落地网关、第三方通讯云服务商接入国内外运营商，或者直接接入国内外运营商不经过第三方；所述国内外运营商呼叫被呼叫方。

本发明的有益效果为：

1、通过语音识别拨打手机或固定电话。可以是用户语音指令让智能摄像机拨打任意固定电话及手机。也可以是智能摄像机检测到其他声音(如婴儿哭声)后拨打预设的手机及固定电话。

2、通过图像智能识别拨打手机或固定电话。实时检测智能摄像机上传的图像，分析图像判断是否需要拨打预设的手机及固定电话。如用户设置人形检测(看家应用)、摔倒检测(家中老人摔倒)、打斗检测、火灾检测等拨打手机。

3、基于智能摄像机的多方语音通话。

4、可预设多个手机或固定电话，当第一个手机或固定电话打不通时，则呼叫第二个手机或固定电话，以此类推。

附图说明

图1本发明的流程图。

具体实施方式

为了更好的了解本发明的技术方案，下面结合附图对本发明作进一步说明。

如图1所示，利用云端实现智能摄像机自动拨号的方法，包括步骤：

s1，所述摄像机采集音频与视频信号。

s2，所述摄像机将步骤s1中采集到的音频信号经过声学算法处理，采集到的视频信号经过图像算法处理，然后将处理后的音频信号与视频信号进行rtp打包处理并发送至云端。

s3，所述云端实时检测收到的rtp音频与视频信息，进行解码后打包发送至第三方人工智能开放平台进行识别；并接收所述第三方人工智能开放平台反馈的识别结果；所述的第三方人工智能开放平台为科大讯飞。

s4，如果所述云端接收到的音频识别结果为用户呼叫指令，则所述云端支持呼叫，跳至步骤s7。

s5，如果所述云端接收到的音频识别结果为关键字或预设频率的音频，则所述云端直接拨打用户预设的电话号码，跳至步骤s8；所述的关键字包括：救命以及报警。所述的预设频率为婴儿哭声频率：频率范围1500—3000赫兹，声音大小75-85分贝左右。

s6，所述云端接收到视频识别结果后，如果识别结果符合用户的预设条件，则所述云端自动拨打用户预设的电话号码，跳至步骤s8。

视频识别结果的预设条件包括：火灾、摔倒、人形以及打斗。

s7，所述摄像机接收到所述云端在步骤s4中的呼叫指令后提示用户进行指令确定，并将所述用户给出的指令确定的结果发送给所述云端；若所述云端收到的是确认执行指令，则执行步骤s8，若所述云端收到的是确认执行指令，则跳至步骤s3。

s8，所述云端建立用户与被呼叫方的通信关系；所述云端通过接入第三方sip落地网关、第三方通讯云服务商接入国内外运营商，或者直接接入国内外运营商不经过第三方；所述国内外运营商呼叫被呼叫方。

s9，在步骤s8中，若被呼叫方接受通话请求，则进行通话；若被呼叫方没有接受通话请求，所述云端支持用户重播或者顺序呼叫其他预设号码，执行步骤s8。

s10，在所述步骤s9中，通话结束后，所述云端通话释放，执行步骤s3。

本申请所涉及的技术专业名词有：

sip：sessioninitiationprotocol,会话初始协议。

rtp：real-timetransportprotocol，实时传输协议rtp。

pstn：publicswitchedtelephonenetwork，公用电话交换网。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐婷;彭远疆
技术所有人：深圳市悠响声学科技有限公司
我是此专利的发明人

上一篇：一种手机来电通话信息预知显示方法及系统与流程
上一篇：一种自动拨号通信装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。