一种控制摄像头拍摄方法及终端的制作方法_2

文档序号：9220000阅读：来源：国知局

效语音信号中确定优先级别最高的有效语音信号，将优先级别最高的有效语音信号对应作为目标语音信号，其中，产生目标语音信号的用户为目标用户；根据各麦克风接收到目标语音信号的接收时间得到目标用户与终端的相对位置；根据目标用户与终端的相对位置，旋转摄像头，以使摄像头正对目标用户；提取目标语音信号中的关键字；判断目标语音信号中的关键字与预设关键字是否匹配；当目标语音信号中的关键字与预设关键字匹配时，控制摄像头执行与关键字相对应的拍摄操作。采用本发明提供的一种控制摄像头拍摄方法及终端，可以通过识别不同用户产生的语音信号的声纹特征的优先级别控制摄像头旋转并正对优先级别最高的用户，根据优先级别最高的用户产生的语音信号控制摄像头执行拍摄操作，可以丰富摄像头旋转拍摄方式。
【附图说明】
[0061]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0062]图1是本发明实施例公开的一种控制摄像头拍摄方法的流程图；
[0063]图2是本发明实施例公开的另一种控制摄像头拍摄方法的流程图；
[0064]图3是本发明实施例公开的另一种控制摄像头拍摄方法的流程图；
[0065]图4是本发明实施例公开的一种终端的结构示意图；
[0066]图5是本发明实施例公开的另一种终端的结构示意图；
[0067]图6是本发明实施例公开的另一种终端的结构示意图。
【具体实施方式】
[0068]下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述。显然，所描述的实施方式是本发明的一部分实施方式，而不是全部实施方式。基于本发明中的实施方式，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施方式，都应属于本发明保护的范围。
[0069]本发明实施例提供一种控制摄像头拍摄方法及终端，可以丰富摄像头旋转拍摄方式。以下分别进行详细说明。
[0070]本发明实施例中描述的终端可包括:手机、平板电脑或者随身听等，上述终端仅是举例，而非穷举，包含但不限于上述终端。
[0071]请参阅图1，图1是本发明实施例公开的一种控制摄像头拍摄方法的流程图。如图1所示，本实施例中所描述的控制摄像头拍摄方法，包括步骤:
[0072]S101，通过至少三个麦克风接收多个用户产生的多个语音信号，其中，每个用户至少产生一个语音信号。
[0073]本发明实施例中，针对每个用户产生的每个语音信号，都通过至少三个麦克风接收，每个用户产生的语音信号可以有多个，可以通过至少三个麦克风接收多个用户产生的多个语音信号，也可以通过至少三个麦克风接收一个用户产生的一个或多个语音信号。
[0074]S102，分别提取每个语音信号的声纹特征。
[0075]本发明实施例中，声纹特征可以包括语音信号中的共振峰的频率、共振峰的强度、共振峰的数量、共振峰的波长、共振峰的变化趋势等。
[0076]S103，分别判断每个语音信号的声纹特征是否与预先建立的用户声纹特征库中的多个有效用户声纹特征之一匹配。
[0077]本发明实施例中，预先建立的用户声纹特征库可以是预先录入的多个有效用户的声纹特征，针对一个语音信号，可以判断该语音信号的声纹特征是否与预先建立的用户声纹特征库中的多个有效用户声纹特征之一匹配，若该语音信号与预先建立的用户声纹特征库中的第一有效用户声纹特征匹配，表明该语音信号由第一有效用户产生。
[0078]S104，若匹配，将语音信号作为有效语音信号；其中，一个有效用户声纹特征与一个有效用户相对应，每个有效用户的优先级别均不相同。
[0079]本发明实施例中，针对一个语音信号，若该语音信号的声纹特征与预先建立的用户声纹特征库中的多个有效用户声纹特征之一匹配，则将该语音信号作为有效语音信号，若该有效语音信号与预先建立的用户声纹特征库中的第一有效用户声纹特征匹配，该有效语音信号的优先级别由第一有效用户的优先级别决定。
[0080]S105，从所有的有效语音信号中确定优先级别最高的有效语音信号，将优先级别最高的有效语音信号对应作为目标语音信号，其中，产生目标语音信号的用户为目标用户。
[0081]本发明实施例中，每个有效语音信号的优先级别可以通过与该有效语音信号的声纹特征匹配的有效用户声纹特征决定，举例来说，若第一有效语音信号的声纹特征与第一有效用户声纹特征匹配，若第二有效语音信号的声纹特征与第二有效用户声纹特征匹配，若第三有效语音信号的声纹特征与第三有效用户声纹特征匹配，且第一有效用户的声纹特征与第一有效用户相对应，第二有效用户的声纹特征与第二有效用户相对应，第三有效用户的声纹特征与第三有效用户相对应，第一有效用户、第二有效用户、第三有效用户的优先级别均不相同，若第一有效用户的优先级别最高，第二有效用户的优先级别其次，第三有效用户的优先级别最低，则第一有效语音信号的优先级别最高，若所有的有效语音信号只包括第一有效语音信号、第二有效语音信号和第三有效语音信号，则从所有的有效语音信号中确定优先级别最高的有效语音信号为第一有效语音信号，即将第一有效语音信号对应作为目标语音信号，其中，产生第一有效语音信号的用户为第一有效用户产生，即将第一有效用户作为目标用户。
[0082]S106，根据各麦克风接收到目标语音信号的接收时间得到目标用户与终端的相对位置。
[0083]本发明实施例中，相对位置可以是在同一平面内的相对位置，该相对位置包括水平方向和水平距离。由于各麦克风是固定在终端上的，各麦克风在终端上的位置是已知的，各麦克风之间的位置距离也是已知的，目标语音信号在空气中的传播速度也是已知的，这些已知条件再加各麦克风接收到目标语音信号的接收时间就可以计算出目标语音信号与终端的相对位置，例如:通过平面几何相关算法计算出目标语音信号与终端的相对位置。在同一平面内，任意一点到固定的三个点的距离是唯一的，该实施方式中，步骤SlOl中的麦克风数量超过三即可。
[0084]相对位置也可以是在三维空间内的相对位置，该相对位置包括空间方向和空间距离。由于在三维空间中，任意一点到固定的四个点的距离是唯一的，即通过任意四个点可以确定三维空间中另外一个点。该实施方式中，步骤SlOl中的麦克风数量超过四个即可，步骤SlOl具体可以是通过至少四个麦克风接收目标用户的目标语音信号。
[0085]在一些可行的实施方式中，步骤S106根据各麦克风接收到目标语音信号的接收时间得到目标用户与终端的相对位置可以包括:
[0086]11)根据各麦克风接收到目标语音信号的接收时间计算目标用户与各麦克风的相对位置；
[0087]12)根据目标用户与各麦克风的相对位置得到目标用户与终端的相对位置。
[0088]本发明实施例中，终端首先根据各麦克风接收到目标语音信号的接收时间计算目标用户与各麦克风的相对位置，然后根据目标用户与各麦克风的相对位置得到目标用户与终端的相对位置。其中，各麦克风之间的相对位置是已知的，根据各麦克风接收到目标语音信号的接收时间可以计算出目标用户与各麦克风的相对置，然后可以在终端上选定一个参考点，根据各麦克风的位置与参考点的相对位置，即可以得到出目标用户与终端上的参考点的相对位置，从而可以得到目标用户与终端的相对位置。
[0089]S107，根据目标用户与终端的相对位置，旋转摄像头，以使摄像头正对目标用户。
[0090]本发明实施例中，根据目标用户与终端的相对位置，可以计算出摄像头需要旋转的角度和方向，根据摄像头需要旋转的角度和方向，旋转摄像头，以使摄像头正对目标用户。正对目标用户可以理解为使目标用户处于摄像头捕捉的画面的正中央。
[0091]S108，提取目标语音信号中的关键字。
[0092]本发明实施例中，提取目标语音信号中的关键字可以通过语音关键字提取算法进行提取。
[0093]S109，判断目标语音信号中的关键字与预设关键字是否匹配。
[0094]本发明实施例中，目标语音信号中预设关键字可以包括拍照”、“录像”、“连拍”、“快拍”、“闪拍”、“抓拍”等。若目标语音信号中的关键字与预设关键字匹配，即目标语音信号中的关键字包含预设关键字，控制摄像头执行与关键字相对应的拍摄操作；若目标语音信号中的关键字与预设关键字不匹配，即目标语音信号中的关键字不包含任意一种预设关键字，摄像头不执行任何操作。
[0095]S110，当目标语音信号中的关键字与预设关键字匹配时，控制摄像头执行与关键字相对应的拍摄操作。
[0096]本发明实施例中，举例来说，若目标语音信号中的关键字为“闪拍”，与关键字相对应的拍摄操作为闪拍，即控制摄像头执行闪拍操作；若目标语音信号中的关键字为“连拍”，与关键字相对应的拍摄操作为连拍，即控制摄像头执行连拍操作。
[0097]本发明实施例中，通过至少三个麦克风接收多个用户产生的多个语音信号，其中，每个用户至少产生一个语音信号；分别提取每个语音信号的声纹特征；分别判断每个语音信号的声纹特征是否与预先建立的用户声纹特征库中的多个有效用户声纹特征之一匹配；若匹配，将语音信号作为有效语音信号；其中，一个有效用户声纹特征与一个有效用户相对应，每个有效用户的优先级别均不相同；从所有的有效语音信号中确定优先级别最高的有效语音信号，将优先级别最高的有效语音信号对应作为目标语音信号，其中，产生目标语音信号的用户为目标用户；根据各麦克风接收到目标语音信号的接收时间得到目标用户与终端的相对位置；根据目标用户与终端的相对位置，旋转摄像头，以使摄像头正对目标用户；提取目标语音信号中的关键字；判断目标语音信号中的关键字与预设关键字是否匹配；当目标语音信号中的关键字与预设关键字匹配时，控制摄像头执行与关键字相对应的拍摄操作。实施本发明实施例，可以通过识别不同用户产生的语音信号的声纹特征的优先级别控制摄像头旋转并正对优先级别最高的用户，根据优先级别最高的用户产生

完整全部详细技术资料下载

当前第2页1 2 3 4 5