一种声控拍照的方法及装置的制造方法

文档序号:9456089阅读:439来源:国知局
一种声控拍照的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及计算机技术领域,尤其涉及一种声控拍照的方法及装置。
【背景技术】
[0002] 随着通信技术的不断发展,对照相机而言,除了可以通过设置在终端上的按钮控 制拍照之外,还可以通过声控技术来控制拍照。在现有的声控拍照方法中,其声控的实现是 通过麦克风获取音频数据,然后将获取到的音频数据与音频样本数据库进行比对,在音频 数据匹配时,则生成与所述音频数据对应的拍照指令,并发送给终端的拍照模块。但是,当 拍照环境中声音嘈杂或背景声音多样的情况下,例如在街道等环境中,周围环境的杂音,也 可能触发拍照,造成误操作,给用户带来不变。因此,现有的声控拍照存在不能区分背景杂 音和目标声音,从而导致声控拍照的误操作率很高,影响了用户体验。

【发明内容】

[0003] 基于此,为解决上述提到的传统技术中声控拍照存在的不能区分背景杂音和目标 声音导致的声控拍照的误操作率高的技术问题,特提供了一种声控拍照的方法。
[0004] 一种声控拍照的方法,包括:
[0005] 获取摄像头采集的目标图像,获取所述目标图像中的人脸区域,获取所述人脸区 域对应的距离信息;
[0006] 根据所述人脸区域对应的距离信息,获取与所述人脸区域对应的声音参考振幅 值;
[0007] 获取麦克风采集的音频数据,所述音频数据包括声音振幅值;
[0008] 判断所述声音振幅值是否与所述声音参考振幅值匹配且所述音频数据是否与预 设的声音样本数据匹配;
[0009] 若是,则生成与所述音频数据对应的拍照指令。
[0010] 可选的,所述获取所述目标图像中的人脸区域步骤包括:根据人脸识别算法在所 述目标图像中查找与人脸对应的特征区域,将查找到的所述特征区域作为人脸区域。
[0011] 可选的,所述摄像头为双摄像头;所述获取所述人脸区域对应的距离信息步骤包 括:根据双摄像头测距原理通过双摄像头获取所述人脸区域对应的距离信息。
[0012] 可选的,所述获取所述人脸区域对应的距离信息步骤包括:选取所述人脸区域中 预设数量的参考像素点,获取与所述参考像素点对应的距离信息,计算所有所述参考像素 点对应的距离信息的平均值,以所述所有参考像素点对应的距离信息的平均值为所述人脸 区域对应的距离信息。
[0013] 可选的,所述根据所述人脸区域对应的距离信息,获取与所述人脸区域对应的声 音参考振幅值步骤包括:根据预设的函数,以所述人脸区域对应的距离信息为自变量,计算 与所述人脸区域对应的声音参考振幅值。
[0014] 可选的,所述音频数据包括各声源所发出的声音数据,所述各声源所发出的声音 数据均包括与所述声音数据对应的声音振幅值;所述判断所述声音振幅值是否与所述声音 参考振幅值匹配,且所述音频数据是否与预设的声音样本数据匹配的步骤包括:分别判断 所述与各声源所发出的声音数据对应的声音振幅值是否与所述声音参考振幅值匹配,且所 述各声源所发出的声音数据是否与预设的声音样本数据匹配。
[0015] 此外,为解决上述提到的传统技术中声控拍照存在的不能区分背景杂音和目标声 音导致的声控拍照的误操作率高的技术问题,本发明还提供了一种声控拍照的装置。
[0016] -种声控拍照的装置,包括:
[0017] 图像获取模块,用于获取摄像头采集的目标图像,获取所述目标图像中的人脸区 域,获取所述人脸区域对应的距离信息;
[0018] 声音参考振幅值获取模块,用于根据所述人脸区域对应的距离信息,获取与所述 人脸区域对应的声音参考振幅值;
[0019] 音频数据获取模块,用于获取麦克风采集的音频数据,所述音频数据包括声音振 幅值;
[0020] 判断模块,用于判断所述声音振幅值是否与所述声音参考振幅值匹配且所述音频 数据是否与预设的声音样本数据匹配;
[0021] 指令生成模块,用于在所述判断模块的判断结果为是时,生成与所述音频数据对 应的拍照指令。
[0022] 可选的,所述图像获取模块还用于:根据人脸识别算法在所述目标图像中查找与 人脸对应的特征区域,将查找到的所述特征区域作为人脸区域。
[0023] 可选的,所述摄像头为双摄像头;所述图像获取模块还用于:根据双摄像头测距 原理通过双摄像头获取所述人脸区域对应的距离信息。
[0024] 可选的,所述图像获取模块还用于:选取所述人脸区域中预设数量的参考像素点, 获取与所述参考像素点对应的距离信息,计算所有所述参考像素点对应的距离信息的平均 值,以所述所有参考像素点对应的距离信息的平均值为所述人脸区域对应的距离信息。
[0025] 可选的,所述声音参考振幅值获取模块还用于:根据预设的函数,以所述人脸区域 对应的距离信息为自变量,计算与所述人脸区域对应的声音参考振幅值。
[0026] 可选的,所述音频数据包括各声源所发出的声音数据,所述各声源所发出的声音 数据均包括与所述声音数据对应的声音振幅值;所述判断模块还用于:分别判断所述与各 声源所发出的声音数据对应的声音振幅值是否与所述声音参考振幅值匹配,且所述各声源 所发出的声音数据是否与预设的声音样本数据匹配。
[0027] 实施本发明实施例,将具有如下有益效果:
[0028] 采用了上述声控拍照的方法及装置之后,在利用声控技术进行拍照的过程中,首 先根据摄像头采集的图像中的人脸区域离镜头的距离确定相应的人物所发出的声音的参 考范围,从而使得麦克风采集到的声音不仅要符合预设的拍照动作的触发语音设置,还需 要其声音的大小在上述参考范围之内。综上叔叔,周围环境中的声音在其声音大小不满足 条件的情况下,是不可能触发拍照操作的,即不会造成误拍。也就是说,采用本发明提出的 声控拍照的方法及装置,可以区分背景声音和目标声音,从而降低了声控拍照的误操作率, 提升了用户体验。
【附图说明】
[0029] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0030] 其中:
[0031] 图1为一个实施例中一种声控拍照的方法流程示意图;
[0032] 图2为一个实施例中一种声控拍照的装置结构示意图。
【具体实施方式】
[0033] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0034] 为解决上述提到的传统技术中声控拍照存在的不能区分背景杂音和目标声音导 致的声控拍照的误操作率高的技术问题,在本实施例中,提供了一种声控拍照的方法。该方 法可依赖于计算机实现,可运行于基于冯诺依曼体系的计算机系统上。该计算机程序可以 是相机应用或者相机应用的客户端程
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1