一种声控拍照的方法及装置的制造方法

文档序号：9456089阅读：439来源：国知局

一种声控拍照的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及计算机技术领域，尤其涉及一种声控拍照的方法及装置。
【背景技术】
[0002] 随着通信技术的不断发展，对照相机而言，除了可以通过设置在终端上的按钮控制拍照之外，还可以通过声控技术来控制拍照。在现有的声控拍照方法中，其声控的实现是通过麦克风获取音频数据，然后将获取到的音频数据与音频样本数据库进行比对，在音频数据匹配时，则生成与所述音频数据对应的拍照指令，并发送给终端的拍照模块。但是，当拍照环境中声音嘈杂或背景声音多样的情况下，例如在街道等环境中，周围环境的杂音，也可能触发拍照，造成误操作，给用户带来不变。因此，现有的声控拍照存在不能区分背景杂音和目标声音，从而导致声控拍照的误操作率很高，影响了用户体验。

【发明内容】

[0003] 基于此，为解决上述提到的传统技术中声控拍照存在的不能区分背景杂音和目标声音导致的声控拍照的误操作率高的技术问题，特提供了一种声控拍照的方法。
[0004] 一种声控拍照的方法，包括：
[0005] 获取摄像头采集的目标图像，获取所述目标图像中的人脸区域，获取所述人脸区域对应的距离信息；
[0006] 根据所述人脸区域对应的距离信息，获取与所述人脸区域对应的声音参考振幅值；
[0007] 获取麦克风采集的音频数据，所述音频数据包括声音振幅值；
[0008] 判断所述声音振幅值是否与所述声音参考振幅值匹配且所述音频数据是否与预设的声音样本数据匹配；
[0009] 若是，则生成与所述音频数据对应的拍照指令。
[0010] 可选的，所述获取所述目标图像中的人脸区域步骤包括：根据人脸识别算法在所述目标图像中查找与人脸对应的特征区域，将查找到的所述特征区域作为人脸区域。
[0011] 可选的，所述摄像头为双摄像头；所述获取所述人脸区域对应的距离信息步骤包括：根据双摄像头测距原理通过双摄像头获取所述人脸区域对应的距离信息。
[0012] 可选的，所述获取所述人脸区域对应的距离信息步骤包括：选取所述人脸区域中预设数量的参考像素点，获取与所述参考像素点对应的距离信息，计算所有所述参考像素点对应的距离信息的平均值，以所述所有参考像素点对应的距离信息的平均值为所述人脸区域对应的距离信息。
[0013] 可选的，所述根据所述人脸区域对应的距离信息，获取与所述人脸区域对应的声音参考振幅值步骤包括：根据预设的函数，以所述人脸区域对应的距离信息为自变量，计算与所述人脸区域对应的声音参考振幅值。
[0014] 可选的，所述音频数据包括各声源所发出的声音数据，所述各声源所发出的声音数据均包括与所述声音数据对应的声音振幅值；所述判断所述声音振幅值是否与所述声音参考振幅值匹配，且所述音频数据是否与预设的声音样本数据匹配的步骤包括：分别判断所述与各声源所发出的声音数据对应的声音振幅值是否与所述声音参考振幅值匹配，且所述各声源所发出的声音数据是否与预设的声音样本数据匹配。
[0015] 此外，为解决上述提到的传统技术中声控拍照存在的不能区分背景杂音和目标声音导致的声控拍照的误操作率高的技术问题，本发明还提供了一种声控拍照的装置。
[0016] -种声控拍照的装置，包括：
[0017] 图像获取模块，用于获取摄像头采集的目标图像，获取所述目标图像中的人脸区域，获取所述人脸区域对应的距离信息；
[0018] 声音参考振幅值获取模块，用于根据所述人脸区域对应的距离信息，获取与所述人脸区域对应的声音参考振幅值；
[0019] 音频数据获取模块，用于获取麦克风采集的音频数据，所述音频数据包括声音振幅值；
[0020] 判断模块，用于判断所述声音振幅值是否与所述声音参考振幅值匹配且所述音频数据是否与预设的声音样本数据匹配；
[0021] 指令生成模块，用于在所述判断模块的判断结果为是时，生成与所述音频数据对应的拍照指令。
[0022] 可选的，所述图像获取模块还用于：根据人脸识别算法在所述目标图像中查找与人脸对应的特征区域，将查找到的所述特征区域作为人脸区域。
[0023] 可选的，所述摄像头为双摄像头；所述图像获取模块还用于：根据双摄像头测距原理通过双摄像头获取所述人脸区域对应的距离信息。
[0024] 可选的，所述图像获取模块还用于：选取所述人脸区域中预设数量的参考像素点，获取与所述参考像素点对应的距离信息，计算所有所述参考像素点对应的距离信息的平均值，以所述所有参考像素点对应的距离信息的平均值为所述人脸区域对应的距离信息。
[0025] 可选的，所述声音参考振幅值获取模块还用于：根据预设的函数，以所述人脸区域对应的距离信息为自变量，计算与所述人脸区域对应的声音参考振幅值。
[0026] 可选的，所述音频数据包括各声源所发出的声音数据，所述各声源所发出的声音数据均包括与所述声音数据对应的声音振幅值；所述判断模块还用于：分别判断所述与各声源所发出的声音数据对应的声音振幅值是否与所述声音参考振幅值匹配，且所述各声源所发出的声音数据是否与预设的声音样本数据匹配。
[0027] 实施本发明实施例，将具有如下有益效果：
[0028] 采用了上述声控拍照的方法及装置之后，在利用声控技术进行拍照的过程中，首先根据摄像头采集的图像中的人脸区域离镜头的距离确定相应的人物所发出的声音的参考范围，从而使得麦克风采集到的声音不仅要符合预设的拍照动作的触发语音设置，还需要其声音的大小在上述参考范围之内。综上叔叔，周围环境中的声音在其声音大小不满足条件的情况下，是不可能触发拍照操作的，即不会造成误拍。也就是说，采用本发明提出的声控拍照的方法及装置，可以区分背景声音和目标声音，从而降低了声控拍照的误操作率，提升了用户体验。
【附图说明】
[0029] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0030] 其中：
[0031] 图1为一个实施例中一种声控拍照的方法流程示意图；
[0032] 图2为一个实施例中一种声控拍照的装置结构示意图。
【具体实施方式】
[0033] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0034] 为解决上述提到的传统技术中声控拍照存在的不能区分背景杂音和目标声音导致的声控拍照的误操作率高的技术问题，在本实施例中，提供了一种声控拍照的方法。该方法可依赖于计算机实现，可运行于基于冯诺依曼体系的计算机系统上。该计算机程序可以是相机应用或者相机应用的客户端程

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴磊;
技术所有人：广东欧珀移动通信有限公司;
我是此专利的发明人

上一篇：拍摄提醒方法及装置的制造方法
上一篇：一种比赛现场根据篮球位置控制摄像头自动跟拍的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。