语音拾取方法及相关产品与流程

文档序号:16129713发布日期:2018-12-01 00:10阅读:274来源:国知局

本申请涉及通信技术领域,主要涉及了一种语音拾取方法及相关产品。

背景技术

目前,电子设备(如手机)设置了多个麦克风,包括单个主麦克风和多个副麦克风,其中:主麦克风主要作为输入麦克风,副麦克风主要作为降噪麦克风,可抑制拾取范围内的环境噪声,提高语音拾取质量。



技术实现要素:

本申请实施例提供了一种语音拾取方法及相关产品,可提高语音拾取质量,便于提高用户体验。

第一方面,本申请实施例提供一种语音拾取方法,应用于电子设备,所述电子设备包括主麦克风和副麦克风,其中:

在语音拾取模式下,获取目标用户握持所述电子设备的目标握持参数;

根据所述目标握持参数确定所述主麦克风是否被遮挡;

若是,获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号;

对所述第一音频信号和所述第二音频信号进行处理,得到目标语音。

第二方面,本申请实施例提供一种语音拾取装置,应用于电子设备,所述电子设备包括主麦克风和副麦克风,其中:

获取单元,用于在语音拾取模式下,获取目标用户握持所述电子设备的目标握持参数;

确定单元,用于根据所述目标握持参数确定所述主麦克风是否被遮挡;

所述获取单元,还用于若所述确定单元确定为是,获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号;

处理单元,用于对所述第一音频信号和所述第二音频信号进行处理,得到目标语音。

第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。

第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。

第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

实施本申请实施例,将具有如下有益效果:

采用了上述的语音拾取方法及相关产品之后,应用于包括主麦克风和副麦克风的电子设备。在电子设备处于语音拾取模式下,获取目标用户握持所述电子设备的目标握持参数,若根据所述目标握持参数确定主麦克风被遮挡,获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号,对所述第一音频信号和所述第二音频信号进行处理得到目标语音,如此,在主麦克风被遮挡时,通过主麦克风和副麦克风同时采集音频信号,提高语音提取质量,便于提高用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

其中:

图1a为本申请实施例提供的一种语音拾取方法的流程示意图;

图1b为本申请实施例提供的一种电子设备的侧面示意图;

图1c为本申请实施例提供的一种电子设备的正面示意图;

图1d为本申请实施例提供的另一种电子设备的侧面示意图;

图1e为本申请实施例提供的一种三轴加速度传感器的原理示意图;

图2为本申请实施例提供的一种语音拾取装置的结构示意图;

图3为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子设备。下面对本申请实施例进行详细介绍。

本申请实施例提供了一种语音拾取方法及相关产品,可提高语音拾取质量,便于提高用户体验。

请参照图1a,本申请实施例提供一种语音拾取方法的流程示意图。该语音拾取方法应用于电子设备,请参照图1b和图1c,其中:图1b为电子设备的侧面示意图,图1c为电子设备的正面示意图。如图1b所示,主麦克风12位于电子设备100的底端的侧面。如图1c所示,副麦克风14位于电子设备100的顶端的正面,听筒15旁边。

需要说明的是,本申请所涉及的电子设备可能包括多个副麦克风,如图1d所示的另一种电子设备的侧面示意图,如图1d所示,副麦克风14位于电子设备100的顶端。此外还可位于电子设备的背面的闪光灯的边上,在此不做限定。

若主麦克风故障时,可选取多个副麦克风中的一个副麦克风作为主麦克风,对于选取方法不做限定,可多个副麦克风分别采集音频信号,根据音频信号的强度确定作为主麦克风的副麦克风;也可确定目标用户的位置,根据其位置选取作为主麦克风的副麦克风等。

具体的,如图1a所示,一种语音拾取方法,包括:

s101:在语音拾取模式下,获取目标用户握持电子设备的目标握持参数。

在本申请实施例中,在电子设备运行通话或录音类型的应用或功能时,进入语音拾取模式,上述的通话或录音类型的应用或功能包括通话应用、视频通话功能、语音通话功能、发送语音信息功能、录音功能、录制视频功能等,在此不做限定。

目标用户为使用电子设备的用户,目标握持参数包括电子设备的握持姿态、握持力度、握持面积、握持位置等多个维度信息,可通过触控显示屏检测触控操作进行确定目标握持参数,在此也不做限定。

进一步的,握持位置包括多个手指和手掌的握持位置,握持面积包括多个手指的接触面积和手掌的接触面积。

可选的,根据所述多个手指的握持位置确定所述多个手指中每一手指之间的间隔距离;获取所述电子设备的重量;根据所述多个手指中每一手指之间的间隔距离、所述每一握持位置对应的接触面积和所述重量确定所述握持力度。

可以理解,根据多个手指中每一手指之间的间隔距离可估算多个手指中每一手指的长度,根据多个手指中每一手指的握持面积确定对应手指的宽度,再根据每一手指的长度、宽度、间隔距离、手掌的接触面积和电子设备的重量确定握持力度。由于在握持状态时,手掌处于缩紧状态,而非展开状态,通过握持位置、握持面积和重量确定握持力度,可提高确定握持力度的准确性。

握持姿态可通过三轴加速度传感器进行确定。三轴加速度传感器具有体积小和重量轻特点,可以测量空间加速度,用于测量电子设备的姿态和倾斜角,除了自动切换水平、垂直显示视角外,还可在全球定位系统(globalpositioningsystem,gps)信号不好时,用作运动偏移补偿计算,能够全面准确反映物体的运动性质。

请参照图1e,图1e为三维加速度传感器确定电子设备的握持姿态的原理示意图。如图1e所示,x轴、y轴、z轴均是相对电子设备机身位置的,通常y轴向机身向上,x轴向机身向右,z轴垂直机身正面,与地心引力同向。横向分量、纵向分量、竖向分量一般是一个单位的地心引力(大小1g(m*m/s),方向垂直地面向下),在各轴上的投影。横向分量对应与x轴上的数值,纵向分量对应与y轴上的数值,竖向分量对应与z轴上的数值,则横向倾斜角度为x轴与水平面的夹角,纵向倾斜角度为y轴与水平面的夹角。

例如:将电子设备平放在桌面上,x轴默认为0,y轴默认0,z轴默认9.81;将电子设备朝下放在桌面上,z轴为-9.81;将电子设备向左倾斜,x轴为正值;将电子设备向右倾斜,x轴为负值;将电子设备向上倾斜,y轴为负值;将电子设备向下倾斜,y轴为正值;将z轴小于-3的情况,视为电子设备的触控显示屏朝下。

基于此,可选的,所述通过所述三轴加速度传感器确定所述电子设备的握持姿态包括:获取所述三轴加速度传感器对应的横向分量、纵向分量和竖向分量,根据所述横向分量、所述纵向分量和所述竖向分量确定所述握持姿态。

在本申请中,可预先存储握持姿态和上述分量之间的映射关系,在确定横向分量、纵向分量和竖向分量之后,从而快速确定握持姿态,提高了确定握持姿态的准确性。

进一步的,根据所述横向分量和所述纵向分量确定所述电子设备的偏转角度;根据所述偏转角度和所述竖向分量确定所述握持姿态。也就是说,从偏转角度的方向和竖向分量确定握持姿态,可提高了确定握持姿态的准确性。

s102:根据所述目标握持参数确定主麦克风是否被遮挡。

在本申请实施例中,对于确定主麦克风是否被遮挡的方法不做限定,可获取目标握持参数中的握持位置,在握持位置接近主麦克风时,确定主麦克风被遮挡。可选的,在主麦克风附近设置一个接近光传感器,如图1b所示上述的接近光传感器13采用无孔光感的结构,用于确定目标用户是否接近与主麦克风。

可选的,所述通过所述接近光传感器确定所述主麦克风是否被遮挡包括:通过所述接近光传感器获取指定时长内的反射红外线强度值;获取所述反射红外线强度值对应的红外线变化量;若所述红外变化量大于接近阈值,确定所述主麦克风被遮挡。

其中,指定时长可以是电子设备中预先存储的时间间隔或用户设置的检测时间,还可以根据主麦克风输入的音频数据的时长进行确定,例如:10秒的音频数据,指定时长为2秒,5秒的音频数据,指定时长为1秒。

接近阈值可根据电子设备所处环境的环境光强进行确定,也可根据电子设备当前运行的前台应用进行确定,还可根据目标用户握持电子设备的姿态进行确定等,在此不做限定。

在可选实施例中,接近光传感器利用红外线的反射性质测量反射红外线强度得到反射红外线强度值,并将指定时长内的反射红外线强度值的变化量作为红外线变化量,可提高确定红外线变化量的准确性。再根据红外线变化量确定主麦克风是否被遮挡,从而提高了确定主麦克风是否被遮挡的准确性。

进一步的,所述方法还包括:获取所述多个维度信息中每一维度对应的遮挡概率值得到多个遮挡概率值;根据预先存储的所述多个维度信息中每一维度信息对应的预设权值对所述多个遮挡概率值进行加权计算得到目标概率值;若所述目标概率值大于遮挡阈值,确定所述主麦克风被遮挡。

在可选实施例中,遮挡阈值可根据电子设备所处环境的环境光强进行确定,也可根据电子设备当前运行的前台应用进行确定,还可根据目标用户握持电子设备的握持姿态进行确定等。

在其中一个示例中,所述方法还包括:确定所述电子设备的前台应用;根据所述握持姿态和所述前台应用确定所述遮挡阈值。

由于电子设备运行不同的前台应用时,用户的握持姿态不同,例如:在查看社交网络信息时,电子设备常处于竖屏握持状态,在打游戏或观看视频时,电子设备常处于横屏握持状态。

可以理解,确定电子设备的前台应用和电子设备的握持姿态,根据握持姿态和前台应用确定遮挡阈值,可提高确定遮挡阈值的准确性,便于提高确定主麦克风是否被遮挡的准确性。

在可选实施例中,遮挡概率值用于描述维度信息对应遮挡主麦克风的概率值;每一维度信息对应的预设权值为电子设备中预先为该维度信息对应类型分配的权重,其中,多个维度信息对应的多个预设权值之和为1,可根据该维度信息对应的类型与遮挡主麦克风之间的关联度进行分配。

对于获取每一维度信息和遮挡主麦克风之间的关联度的方法不做限定,可选的,获取预先存储的多条语音拾取记录中每一语音拾取记录对应的握持参数和遮挡结果得到多个握持参数和多个遮挡结果;对所述多个遮挡结果和所述多个握持参数进行分析得到每一维度信息与遮挡主麦克风之间的关联度。

也就是说,对预先存储的语音拾取记录中的握持参数和遮挡结果进行分析,从而确定每一维度信息对应的关联度,分析电子设备中的历史记录可提高确定关联度的准确性。

可以理解,获取目标握持参数中每一维度信息对应的遮挡概率值,然后根据每一维度信息对应的遮挡概率值和预设权值进行加权计算得到目标概率值,在目标概率值大于遮挡阈值时,确定主麦克风被遮挡,从而从多个方面确定目标概率值,可提高确定目标概率值的准确性,便于提高确定主麦克风是否被遮挡的准确性。

可选的,所述方法还包括:获取预先存储的多条语音拾取记录中每一语音拾取记录对应的握持参数;根据所述多个握持参数生成目标模型;将所述目标握持参数输入所述目标模型得到输出结果。

其中,所述输出结果用于确定所述主麦克风是否被遮挡。

在可选实施例中,目标模型为神经网络模型,对于生成目标模型的方法不做限定,可依照神经网络的训练方法进行训练,即分为正向运算和反向运算两个阶段,并设置一个训练阈值。其中:正向运算为输入数据输入至输出数据输出的过程,反向运算与正向运算相反,为最终结果数据与期望输出数据的误差反向通过正向运算的过程。经过正向运算可得到一个运算结果,若该运算结果满足预设条件或训练次数大于训练阈值,则结束训练;否则,继续训练。通过周而复始的信息正向运算和反向运算过程,按误差梯度下降的方式修正各层权值,对各层权值进行调整,也是神经网络学习训练的过程,可减少网络输出的误差。

可以理解,根据预先存储多条语音拾取记录中每一语音拾取历史记录对应的握持参数进行分析,并生成用于确定主麦克风是否被遮挡的目标模型。然后,将目标握持参数输入该目标模型,从而根据输出结果确定主麦克风是否被遮挡。也就是说,从对大量的语音拾取数据进行训练得到目标模型,则在检测到进入语音拾取模式时,将目标用户握持所述电子设备的目标握持参数输入该目标模型,可确定主麦克风是否被遮挡,且可提高确定主麦克风是否被遮挡的准确性。

可选的,所述方法还包括:等待预设时长对所述目标模型进行更新。

其中,预设时长不做限定,可以为一周、一个月或者一年等,当预设时长到达时,更新目标模型,可提高输出结果的准确性。

s103:若确定所述主麦克风被遮挡,获取所述主麦克风输入的第一音频信号和副麦克风输入的第二音频信号。

当主麦克风被遮挡时,难以采集完整的音频数据。在本申请实施例中,若确定主麦克风被遮挡时,可通过主麦克风和副麦克风同时采集音频信号,从而提高语音提取质量。

在本申请中对于如何获取主麦克风输入的第一音频信号和副麦克风输入的第二音频信号不做限定,可选的,所述获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号包括:根据所述目标握持参数获取所述主麦克风的遮挡程度和所述副麦克风的第二工作参数;根据所述遮挡程度获取所述主麦克风对应的第一工作参数;获取所述主麦克风按照所述第一工作参数采集的所述第一音频信号和所述副麦克风按照所述第二工作参数采集的所述第二音频信号。

在可选实施例中,对于根据目标握持参数确定主麦克风的遮挡程度不做限定,可根据上述的目标概率值进行确定,即预先存储目标概率值与遮挡程度之间的映射关系,根据该映射关系确定与目标概率值对应的遮挡程度。

上述的工作参数包括拾取范围、功率、电流、电压等,在此不做限定。其中,第二工作参数可根据握持姿态进行确定,从而提高了拾取音频质量,并节省功耗。

可以理解,通过目标握持参数确定主麦克风的遮挡程度和副麦克风的第二工作参数,然后根据其遮挡程度确定第一工作参数,再分别按照对应的工作参数采集音频信号,从而得到第一音频信号和第二音频信号,提高了提取第一音频信号和第二音频信号的质量和准确性。

s104:对所述第一音频信号和所述第二音频信号进行处理得到目标语音。

在本申请实施例中,在获取第一音频信号和第二音频信号之后,将第一音频信号和第二音频信号处理为单声道数据,则电子设备可传输或存储上述的单声道数据。

可选的,所述对所述第一音频信号和所述第二音频信号进行处理得到目标语音包括:获取所述第一音频信号和所述第二音频信号对应的音调变化曲线;获取所述第一音频信号对应的第一文本和第一音频信号对应的第二文本;按照时间顺序对所述第一文本和所述第二文本进行去重复操作得到目标文本;按照所述音调变化曲线对所述目标文本进行合成得到所述目标语音。

可以理解,在可选实施例中,获取第一音频信号和第二音频信对应的音调变化曲线,再对第一音频信号和第二音频信号进行文字识别得到第一音频信号对应的第一文本和第二音频信号对应的第二文本,从而按照音调变化曲线对目标文本进行合成得到目标语音,可提高目标语音的还原度和语音质量。

进一步的,对所述第一音频信号和所述第二音频信号进行声音识别,可得到在第一音频信号中目标用户对应的多个第一音频片段和第二音频信号中目标用户对应的多个第二音频片段,然后获取所述多个第一音频片段和所述多个第二音频片段对应的所述音调变化曲线;获取所述多个第一音频片段对应的所述第一文本和所述多个第二音频片段对应的所述第二文本。也就是说,预先提取第一音频信号和第二音频信号中的目标用户的音频片段,再执行后续步骤,从而提高合成的效率和准确性。

在如图1a所示的语音拾取方法中,在电子设备处于语音拾取模式下,获取目标用户握持电子设备的目标握持参数,若根据目标握持参数确定主麦克风被遮挡,获取主麦克风输入的第一音频信号和副麦克风输入的第二音频信号,对第一音频信号和第二音频信号进行处理得到目标语音,如此,在主麦克风被遮挡时,通过主麦克风和副麦克风同时采集音频信号,提高语音提取质量,便于提高用户体验。

在其中一个可能的示例中,所述方法还包括:根据所述目标握持参数确定所述副麦克风是否被遮挡;若是,执行所述获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号的步骤。

可以理解,在电子设备处于语音拾取模式下,获取目标用户握持电子设备的目标握持参数,根据目标握持参数确定主麦克风或副麦克风被遮挡,获取主麦克风输入的第一音频信号和副麦克风输入的第二音频信号,对第一音频信号和第二音频信号进行处理得到目标语音,如此,在主麦克风或副麦克风被遮挡时,通过主麦克风和副麦克风同时采集音频信号,提高语音提取质量,便于提高用户体验。

与图1a的实施例一致,请参照图2,图2是本申请实施例提供的一种语音拾取装置的结构示意图,所述装置应用于电子设备,所述电子设备包括主麦克风和副麦克风。如图2所示,上述语音拾取装置200包括:

获取单元201用于在语音拾取模式下,获取目标用户握持所述电子设备的目标握持参数;

确定单元202用于根据所述目标握持参数确定所述主麦克风是否被遮挡;

所述获取单元201还用于若所述确定单元确定为是,获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号;

处理单元203用于对所述第一音频信号和所述第二音频信号进行处理,得到目标语音。

可以理解,在电子设备处于语音拾取模式下,获取单元201获取目标用户握持电子设备的目标握持参数,确定单元202根据目标握持参数确定主麦克风是否被遮挡,获取单元201获取主麦克风输入的第一音频信号和副麦克风输入的第二音频信号,处理单元203对第一音频信号和第二音频信号进行处理得到目标语音,如此,在主麦克风被遮挡时,通过主麦克风和副麦克风同时采集音频信号,提高语音提取质量,便于提高用户体验。

在一个可能的示例中,所述目标握持参数包括多个维度信息,所述确定单元202具体用于获取所述多个维度信息中每一维度对应的遮挡概率值,得到多个遮挡概率值;根据预先存储的所述多个维度信息中每一维度信息对应的预设权值对所述多个遮挡概率值进行加权计算得到目标概率值;若所述目标概率值大于遮挡阈值,确定所述主麦克风被遮挡。

可以理解,获取目标握持参数中每一维度信息对应的遮挡概率值,然后根据每一维度信息对应的遮挡概率值和预设权值进行加权计算得到目标概率值,在目标概率值大于遮挡阈值时,确定主麦克风被遮挡,从而从多个方面确定目标概率值,可提高确定目标概率值的准确性,便于提高确定主麦克风是否被遮挡的准确性。

在一个可能的示例中,所述确定单元202具体用于获取预先存储的多条语音拾取记录中每一语音拾取记录对应的握持参数得到多个握持参数;根据所述多个握持参数生成目标模型;将所述目标握持参数输入所述目标模型得到输出结果,所述输出结果用于确定所述主麦克风是否被遮挡。

可以理解,根据预先存储多条语音拾取记录中每一语音拾取历史记录对应的握持参数进行分析,并生成用于确定主麦克风是否被遮挡的目标模型。然后,将目标握持参数输入该目标模型,从而根据输出结果确定主麦克风是否被遮挡。也就是说,从对大量的语音拾取数据进行训练得到目标模型,则在检测到进入语音拾取模式时,将目标用户握持所述电子设备的目标握持参数输入该目标模型,可确定主麦克风是否被遮挡,且可提高确定主麦克风是否被遮挡的准确性。

在一个可能的示例中,所述获取单元201具体用于根据所述目标握持参数获取所述主麦克风的遮挡程度和所述副麦克风的第二工作参数;根据所述遮挡程度获取所述主麦克风对应的第一工作参数;获取所述主麦克风按照所述第一工作参数采集的所述第一音频信号和所述副麦克风按照所述第二工作参数采集的所述第二音频信号。

可以理解,通过目标握持参数确定主麦克风的遮挡程度和副麦克风的第二工作参数,然后根据其遮挡程度确定第一工作参数,再分别按照对应的工作参数采集音频信号,从而得到第一音频信号和第二音频信号,提高了提取第一音频信号和第二音频信号的质量和准确性。

在一个可能的示例中,所述处理单元203具体用于获取所述第一音频信号和所述第二音频信号对应的音调变化曲线;获取所述第一音频信号对应的第一文本和第一音频信号对应的第二文本;按照时间顺序对所述第一文本和所述第二文本进行去重复操作得到目标文本;按照所述音调变化曲线对所述目标文本进行合成得到所述目标语音。

可以理解,获取第一音频信号和第二音频信对应的音调变化曲线,再对第一音频信号和第二音频信号进行文字识别得到第一音频信号对应的第一文本和第二音频信号对应的第二文本,从而按照音调变化曲线对目标文本进行合成得到目标语音,可提高目标语音的还原度和语音质量。

与图1a的实施例一致,请参照图3,图3是本申请实施例提供的一种电子设备的结构示意图。如图3所示,该电子设备300包括处理器310、存储器320、通信接口330以及一个或多个程序340,其中,通信接口330包括主麦克风和副麦克风,上述一个或多个程序340被存储在上述存储器320中,并且被配置由上述处理器310执行,上述程序340包括用于执行以下步骤的指令:

在语音拾取模式下,获取目标用户握持所述电子设备的目标握持参数;

根据所述目标握持参数确定所述主麦克风是否被遮挡;

若是,获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号;

对所述第一音频信号和所述第二音频信号进行处理得到目标语音。

可以理解,在电子设备300处于语音拾取模式下,获取目标用户握持电子设备的目标握持参数,根据目标握持参数确定主麦克风是否被遮挡,获取主麦克风输入的第一音频信号和副麦克风输入的第二音频信号,对第一音频信号和第二音频信号进行处理得到目标语音,如此,在主麦克风被遮挡时,通过主麦克风和副麦克风同时采集音频信号,提高语音提取质量,便于提高用户体验。

在一个可能的示例中,所述目标握持参数包括多个维度信息,在所述根据所述目标握持参数确定所述主麦克风是否被遮挡方面,所述程序340中的指令具体用于执行以下操作:

获取所述多个维度信息中每一维度对应的遮挡概率值得到多个遮挡概率值;

根据预先存储的所述多个维度信息中每一维度信息对应的预设权值对所述多个遮挡概率值进行加权计算,得到目标概率值;

若所述目标概率值大于遮挡阈值,确定所述主麦克风被遮挡。

可以理解,获取目标握持参数中每一维度信息对应的遮挡概率值,然后根据每一维度信息对应的遮挡概率值和预设权值进行加权计算得到目标概率值,在目标概率值大于遮挡阈值时,确定主麦克风被遮挡,从而从多个方面确定目标概率值,可提高确定目标概率值的准确性,便于提高确定主麦克风是否被遮挡的准确性。

在一个可能的示例中,在所述根据所述目标握持参数确定所述主麦克风是否被遮挡方面,所述程序340中的指令具体用于执行以下操作:

获取预先存储的多条语音拾取记录中每一语音拾取记录对应的握持参数,得到多个握持参数;

根据所述多个握持参数生成目标模型;

将所述目标握持参数输入所述目标模型得到输出结果,所述输出结果用于确定所述主麦克风是否被遮挡。

可以理解,根据预先存储多条语音拾取记录中每一语音拾取历史记录对应的握持参数进行分析,并生成用于确定主麦克风是否被遮挡的目标模型。然后,将目标握持参数输入该目标模型,从而根据输出结果确定主麦克风是否被遮挡。也就是说,从对大量的语音拾取数据进行训练得到目标模型,则在检测到进入语音拾取模式时,将目标用户握持所述电子设备的目标握持参数输入该目标模型,可确定主麦克风是否被遮挡,且可提高确定主麦克风是否被遮挡的准确性。

在一个可能的示例中,在所述获取所述主麦克风输入的第一音频信号和所述副麦克风输入的第二音频信号方面,所述程序340中的指令具体用于执行以下操作:

根据所述目标握持参数获取所述主麦克风的遮挡程度和所述副麦克风的第二工作参数;

根据所述遮挡程度获取所述主麦克风对应的第一工作参数;

获取所述主麦克风按照所述第一工作参数采集的所述第一音频信号和所述副麦克风按照所述第二工作参数采集的所述第二音频信号。

可以理解,通过目标握持参数确定主麦克风的遮挡程度和副麦克风的第二工作参数,然后根据其遮挡程度确定第一工作参数,再分别按照对应的工作参数采集音频信号,从而得到第一音频信号和第二音频信号,提高了提取第一音频信号和第二音频信号的质量和准确性。

在一个可能的示例中,在所述对所述第一音频信号和所述第二音频信号进行处理得到目标语音方面,所述程序340中的指令具体用于执行以下操作:

获取所述第一音频信号和所述第二音频信号对应的音调变化曲线;

获取所述第一音频信号对应的第一文本和第一音频信号对应的第二文本;

按照时间顺序对所述第一文本和所述第二文本进行去重复操作得到目标文本;

按照所述音调变化曲线对所述目标文本进行合成得到所述目标语音。

可以理解,获取第一音频信号和第二音频信对应的音调变化曲线,再对第一音频信号和第二音频信号进行文字识别得到第一音频信号对应的第一文本和第二音频信号对应的第二文本,从而按照音调变化曲线对目标文本进行合成得到目标语音,可提高目标语音的还原度和语音质量。

本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于存储计算机程序,该计算机程序使得计算机执行如方法实施例中记载的任一方法的部分或全部步骤,计算机包括电子设备。

本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。

集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、rom、ram、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1