耳机通话自适应调整方法、装置、移动终端及存储介质与流程

文档序号:11254174阅读:998来源:国知局
耳机通话自适应调整方法、装置、移动终端及存储介质与流程

本发明涉及移动终端技术领域,尤其涉及一种耳机通话自适应调整方法、装置、移动终端及存储介质。



背景技术:

目前,手机的应用已经非常普遍,人们也越来越习惯利用耳机进行语音通话,通常情况下,人们让麦克风正常下垂来进行通话,但是利用该种方式进行通话时存在着通话音量小的问题,现有技术中,通常利用自动增益控制(automaticgaincontrol,agc)自适应调整增益的方式,来提高通话音量,但是,agc自适应调整增益的方式来提高通话音量的同时,会对整个语音信号均进行放大,势必会放大语音信号中的环境噪声,反而导致通话的质量降低。



技术实现要素:

本发明实施例提供一种耳机通话自适应调整方法、装置、移动终端及存储介质,可以解决现有技术中存在的通过agc自适应调整增益的方式来提高通话音量的同时,会对整个语音信号均进行放大,势必会放大语音信号中的环境噪声,反而导致通话的质量降低的问题。

为实现上述目的,本发明实施例第一方面提供一种耳机通话自适应调整方法,包括:

在移动终端处于耳机通话模式下,采集环境中的语音信号;

解析所述语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征;

确定所述目标声纹特征所属的声音在所述语音信号中的语音幅值;

根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值。

为实现上述目的,本发明实施例第二方面提供一种耳机通话自适应调整装置,包括:

采集模块,用于在移动终端处于耳机通话模式下,采集环境中的语音信号;

解析匹配模块,用于解析所述语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征;

确定模块,用于确定所述目标声纹特征所属的声音在所述语音信号中的语音幅值;

调整模块,用于根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值。

为实现上述目的,本发明实施例第三方面提供一种移动终端,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现第一方面所述的耳机通话自适应调整方法中的各个步骤。

为实现上述目的,本发明实施例第四方面提供一种存储介质,所述存储介质为计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现第一方面所述的耳机通话自适应调整方法中的各个步骤。

本发明实施例提供一种耳机通话自适应调整方法、装置、移动终端及存储介质,该方法包括:在移动终端处于耳机通话模式下,采集环境中的语音信号,解析语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征,确定目标声纹特征所属的声音在语音信号中的语音幅值,根据语音幅值调整语音信号中目标声纹特征所属的声音的响度值及频率值。相对于现有技术,在耳机通话模式下,针对采集到的语音信号,通过预置的声纹特征识别库匹配出目标声纹特征,对目标声纹特征所属的声音的响度值及频率值进行调整,相对于agc自适应增益调节方式,在提高通话音量的同时,能够有效避免对环境噪声放大的问题,提升通话质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一种移动终端的结构框图;

图2为本发明第一实施例提供的一种耳机通话自适应调整方法的流程示意图;

图3是本发明第一实施中的步骤202的细化步骤的流程示意图;

图4是本发明第一实施中的步骤204的细化步骤的流程示意图;

图5为本发明第二实施例提供的一种耳机通话自适应调整方法的流程示意图;

图6为本发明第三实施例提供的一种耳机通话自适应调整装置的结构示意图;

图7为本发明第三实施例中的解析匹配模块602的细化结构示意图;

图8为本发明第三实施例中的调整模块604的细化结构示意图;

图9为本发明第四实施例提供的一种耳机通话自适应调整装置的结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1示出了一种移动终端的结构框图。本发明实施例提供的耳机通话自适应调整方法可应用于如图1所示的移动终端10中,移动终端10可以但不限于包括:需依靠电池维持正常运行且支持网络及下载功能的智能手机、笔记本、平板电脑、穿戴智能设备等。

如图1所示,移动终端10包括存储器101、存储控制器102,一个或多个(图中仅示出一个)处理器103、外设接口104、射频模块105、按键模块106、音频模块107以及触控屏幕108。这些组件通过一条或多条通讯总线/信号线109相互通讯。

可以理解,图1所示的结构仅为示意,其并不对移动终端的结构造成限定。移动终端10还可包括比图1所示更多或者更少的组件,或者具有与图1所示不同的配置。图1所示的各组件可以采用硬件、软件或其组合实现。

存储器101可用于存储软件程序以及模块,如本发明实施例中的耳机通话自适应调整方法及装置对应的程序指令/模块,处理器103通过运行存储在存储器101内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的耳机通话自适应调整方法及装置。

存储器101可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器101可进一步包括相对于处理器103远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器103以及其他可能的组件对存储器101的访问可在存储控制器102的控制下进行。

外设接口104将各种输入/输入装置耦合至cpu以及存储器101。处理器103运行存储器101内的各种软件、指令以执行移动终端10的各种功能以及进行数据处理。

在一些实施例中,外设接口104,处理器103以及存储控制器102可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。

射频模块105用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。射频模块105可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(sim)卡、存储器等等。射频模块105可与各种网络如互联网、企业内部网、预置类型的无线网络进行通讯或者通过预置类型的无线网络与其他设备进行通讯。上述的预置类型的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的预置类型的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(globalsystemformobilecommunication,gsm),增强型移动通信技术(enhanceddatagsmenvironment,edge),宽带码分多址技术(widebandcodedivisionmultipleaccess,w-cdma),码分多址技术(codedivisionaccess,cdma),时分多址技术(timedivisionmultipleaccess,tdma),蓝牙,无线保真技术(wireless-fidelity,wifi)(如美国电气和电子工程师协会标准ieee802.11a、ieee802.11b、ieee802.11g和/或ieee802.11n),网络电话(voiceoverinternetprotocal,voip),全球微波互联接入(worldwideinteroperabilityformicrowaveaccess,wi-max),其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议。

按键模块106提供用户向移动终端进行输入的接口,用户可以通过按下不同的按键以使移动终端10执行不同的功能。

音频模块107向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。音频电路从外设接口104处接收声音数据,将声音数据转换为电信息,将电信息传输至扬声器。扬声器将电信息转换为人耳能听到的声波。音频电路还从麦克风处接收电信息,将电信号转换为声音数据,并将声音数据传输至外设接口104中以进行进一步的处理。音频数据可以从存储器101处或者通过射频模块105获取。此外,音频数据也可以存储至存储器101中或者通过射频模块105进行发送。在一些实例中,音频模块107还可包括一个耳机播孔,用于向耳机或者其他设备提供音频接口。

触控屏幕108在移动终端与用户之间同时提供一个输出及输入界面。具体地,触控屏幕108向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频、及其任意组合。一些输出结果是对应于一些用户界面对象。触控屏幕108还接收用户的输入,例如用户的点击、滑动等手势操作,以便用户界面对象对这些用户的输入做出响应。检测用户输入的技术可以是基于电阻式、电容式或者其他任意可能的触控检测技术。触控屏幕108显示单元的具体实例包括但并不限于液晶显示器或发光聚合物显示器。

基于上述移动终端描述本发明实施例中耳机通话自适应调整方法。

由于现有技术中,通过agc自适应调整增益的方式来提高通话音量的同时,会对整个语音信号均进行放大,势必会放大语音信号中的环境噪声,反而导致通话的质量降低的问题。

为了解决上述问题,本发明提出一种耳机通话自适应调整方法,在耳机通话模式下,针对采集到的语音信号,通过预置的声纹特征识别库匹配出目标声纹特征,对目标声纹特征所属的声音的响度值及频率值进行调整,相对于agc自适应增益调节方式,在提高通话音量的同时,能够有效避免对环境噪声放大的问题,提升通话质量。

请参阅图2,为本发明第一实施例中耳机通话自适应调整方法的流程示意图,该方法包括:

步骤201、在移动终端处于耳机通话模式下,采集环境中的语音信号;

在本发明实施例中,上述的耳机通话自适应调整方法由耳机通话自适应调整装置(以下简称为:调整装置)实现,该调整装置为程序模块,存储在移动终端的计算机可读存储介质中,可以由处理器执行。

在通话过程中,若移动终端处于耳机通话模式下,移动终端上的麦克风将采集环境中的语音信号,该调整装置将实时获取到麦克风采集到的语音信号,可以理解的是,该语音信号中至少包含该移动终端的通话者的声音,且若环境中有其他声音,麦克风也将采集到环境中存在的其他声音。

其中,若移动终端处于耳机通话模式,则有两种耳机通话方式,第一种是将耳机的麦克风靠近嘴边来进行通话,第二种是让麦克风正常下垂来进行通话。

步骤202、解析所述语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征;

在本发明实施例中,声纹在用电学仪器显示时,是可以观看到的携带语言信息的声波频谱,人类语言产生时,人体语言中枢与发音器官之间有一个复杂的生物物理过程,人在讲话时所使用的发声器官包括:舌、喉头、肺、鼻腔等等,由于每一个人的发声器官在尺寸和形态上各不相同,所以彼此的声纹图谱也会存在差异。声纹特征是声纹所具备的特征参数,是使得声纹可靠的参数,不同的声纹特征可以区分不同的声音。

其中,每个移动终端中至少有一个预置的声纹特征识别库,该预置的声纹特征识别库中存储该移动终端的使用者的声纹特征。

在本发明实施例中,对于采集到的语音信号,将解析该语音信号,并将解析得到的声纹特征与预置的声纹特征识别库进行匹配,从解析得到的声纹特征中识别哪个才是当前的通话者的声纹特征,并将识别的声纹特征作为目标声纹特征。

步骤203、确定所述目标声纹特征所属的声音在所述语音信号中的语音幅值;

步骤204、根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值。

在本发明实施例中,调整装置确定该目标声纹特征所属的声音在语音信号中的语音幅值,其中,该目标声纹特征所属的声音即是通话者的声音,且该语音幅值是指通话者的声音所形成的声波中波幅的平均值,或者是波幅的最小值。

其中,调整装置将根据语音幅值调整语音信号中目标声纹特征所属的声音的响度值及频率值。

其中,响度值用于衡量音量的大小,频率值用于衡量声音的清晰度。

需要说明的是,在完成对语音信号的调整之后,可以将该语音信号发送给另一端的通话对象所使用的移动终端,以便该通话对象能够收听到清晰且音量合适的语音。

在本发明实施例中,在移动终端处于耳机通话模式下,采集环境中的语音信号,解析语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征,确定目标声纹特征所属的声音在语音信号中的语音幅值,根据语音幅值调整语音信号中目标声纹特征所属的声音的响度值及频率值。相对于现有技术,在耳机通话模式下,针对采集到的语音信号,通过预置的声纹特征识别库匹配出目标声纹特征,对目标声纹特征所属的声音的响度值及频率值进行调整,相对于agc自适应增益调节方式,在提高通话音量的同时,能够有效避免对环境噪声放大的问题,提升通话质量。

请参阅图3,为本发明第一实施例中的步骤202的细化步骤的流程示意图,包括:

步骤301、解析所述语音信号,获取所述语音信号中不同来源的各声音的声纹特征;

在本发明实施例中,不同来源的各声音可以是通话者、电视、动物、机器等等各种各样的能够产生声音的人或物或设备。

步骤302、查找所述声纹特征识别库,判断所述各声音的声纹特征中,是否存在与所述声纹特征识别库中的声纹特征相匹配的声纹特征;

在本发明实施例中,移动终端内预置了声纹特征识别库,包括一个或多个用户的声纹特征,具体设置方式可以是:用户通过点击操作进入移动终端的设置界面,并选择声纹设置功能,以便移动终端的显示界面显示声纹设置的开始按钮,用户点击该按钮之后说任意的内容,或者念出显示界面显示的内容,由移动终端上的麦克风采集用户说的内容,并进行声纹特征的分析,判断分析得到的声纹特征是否符合要求,若符合要求,则保存该声纹特征至声纹特征库中,以完成声纹特征的设置,若不符合要求,则显示提示消息,提示用户重新进行设置。通过该种方式,可以实现一个或多个用户在一台移动终端上的声纹特征的设置。

步骤303、若存在匹配的声纹特征,则将所述匹配的声纹特征确定为所述目标声纹特征;

在本发明实施例中,将解析得到的声纹特征与预置的声纹特征识别库进行匹配,从解析得到的声纹特征中识别哪个才是当前的通话者的声纹特征,并将识别的声纹特征作为目标声纹特征。

在本发明实施例中,在移动终端处于耳机通话模式下,采集环境中的语音信号,解析语音信号,获取语音信号中不同来源的各声音的声纹特征,查找声纹特征识别库,判断各声音的声纹特征中,是否存在与声纹特征识别库中的声纹特征相匹配的声纹特征,若存在匹配的声纹特征,则将匹配的声纹特征确定为目标声纹特征,确定目标声纹特征所属的声音在语音信号中的语音幅值,根据语音幅值调整语音信号中目标声纹特征所属的声音的响度值及频率值。相对于现有技术,在耳机通话模式下,针对采集到的语音信号,通过预置的声纹特征识别库匹配出目标声纹特征,对目标声纹特征所属的声音的响度值及频率值进行调整,相对于agc自适应增益调节方式,在提高通话音量的同时,能够有效避免对环境噪声放大的问题,提升通话质量。

请参阅图4,为本发明第一实施例中的步骤204的细化步骤的流程示意图,包括:

步骤401、查找预置的参数调整表,确定与所述语音幅值对应的目标响度值及目标频率值,其中,所述参数调整表包括语音幅值、响度值及频率值的映射关系;

步骤402、判断所述目标响度值是否小于或等于预置阈值;

在本发明实施例中,移动终端预置了一个参数调整表,该参数调整表包括语音幅值、响度值及频率值的映射关系,参数调整表预先设置一个标准参数,例如,语音幅值为10,对应的响度值及频率值都为40,语音幅值为30,对应的响度值及频率值都为70,该参数调整表中的响度值需要比语音幅值大40,40即为标准参数。

其中,预置一个阈值是为了防止响度值增加过大,出现破音现象。

步骤403、若所述目标响度小于或等于所述预置阈值,则将所述目标声纹特征所属的声音的响度值及频率值分别调整为所述目标响度值及所述目标频率值。

在本发明实施例中,预置阈值是一个响度极限值,当目标响度值超过预置阈值时,在将目标声纹特征所属的声音的响度值调整为目标响度值时,会出现破音现象。

在本发明实施例中,进行语音通话的时候,当本端通话者将耳机靠近嘴边的时候,因目标响度小于或等于预置阈值,在将目标声纹特征所属的声音的响度值调整为目标响度值时,对端通话者接收到语音信号时,不会出现破音的现象,因此目标响度小于或等于预置阈值,则将目标声纹特征所属的声音的响度值及频率值分别调整为目标响度值及目标频率值。例如,预置阈值为100,语音幅值为10,对应的响度值及频率值都为40,40小于100,则将目标声纹特征所属的声音的响度值及频率值分别调整为40。

进一步地,在步骤402之后还包括步骤404,步骤404与步骤403为并列关系,具体的:

步骤404、若所述目标响度大于所述预置阈值,则将所述目标声纹特征所属的声音的响度值及频率值分别调整为所述预置阈值及与所述预置阈值对应的预置频率值。

在本发明实施例中,当本端通话者将耳机靠近嘴边的时候,在目标响度大于预置阈值时,若将目标声纹特征所属的声音的响度值及频率值分别调整为目标响度值及目标频率值,对端通话者接收到语音信号时,会出现破音的现象,因此,将目标声纹特征所属的声音的响度值及频率值分别调整为预置阈值及与预置阈值对应的预置频率值。例如,预置阈值为100,语音幅值为70,对应的响度值及频率值都为110,110大于100,则将目标声纹特征所属的声音的响度值及频率值分别调整为100,其中,通过判断目标响度与预置阈值的关系,可以准确地调整目标声纹特征所属的声音的响度值及频率值,增强目标声纹特征所属的声音的响度值及频率值,提高通话音量的同时,防止接收方接听语音信号时出现破音现象。

在本发明实施例中,若移动终端处于耳机通话模式,则有两种耳机通话方式,第一种是将耳机的麦克风靠近嘴边来进行通话,该方式存在破音现象;第二种是让麦克风正常下垂来进行通话,该方式的通话音量小,现有技术中通过agc自适应增益调节方式来兼容这两种通话方式,即提高通话音量的同时,防止破音现象,但是agc自适应增益调节方式在提高通话音量的同时,会对整个语音信号均进行放大,势必会放大语音信号中的环境噪声,反而导致通话的质量降低,本发明实施例中,通过调整目标声纹特征所属的声音的响度值及频率值来提高通话音量,通过判断目标响度与预置阈值的关系从而防止出现破音,保证了通话语音质量。

请参阅图5,为本发明第二实施例中语音信号自适应调整方法的流程示意图,包括:

步骤501、在移动终端处于耳机通话模式下,采集环境中的语音信号;

步骤502、解析所述语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征;

步骤503、确定所述目标声纹特征所属的声音在所述语音信号中的语音幅值;

步骤504、根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值;

步骤505、从所述语音信号中提取除所述目标声纹特征以外的其他声纹特征所属的声音,得到干扰语音信号;

步骤506、对所述干扰语音信号进行降噪处理。

可以理解的是,步骤501至步骤504分别与第一实施例中的步骤201至步骤204描述的内容相似,具体可以参阅第一实施例,此处不做赘述。

在本发明实施例中,在针对目标声纹特征所属的声音进行调整后,为了进一步提高通话质量,还可以针对其他的声音进行调整,具体的:调整装置将从语音信号中提取除目标声纹特征以外的其他声纹特征所属的声音,得到干扰语音信号,例如,若语音信号中包含通话者的声音、电机机播放广告的声音,则该通话者的声音即为目标声纹特征所属的声音,调整装置将从该语音信号中提取电视机播放广告的声音,并作为干扰语音信号。进一步的,调整装置将对该干扰语音信号进行降噪处理,以便在将调整后的语音信号发送给另一端的通话对象之后,该通话对象收听到的语音信号中有效信号(即通话者的声音)更加清晰且音量合适,而无效信号(即干扰语音信号)更弱。

其中,该降噪处理可以采用的方式有多种,如噪声门降噪法、采样降噪法、滤波降噪法等等。

在本发明实施例中,在对语音信号中目标声纹特征所属的声音进行调整后,还将进一步的对语音信号中的干扰语音信号进行降噪处理,以便进一步的提升通话质量,改善通话体验。

请参阅图6,为本发明第三实施例中耳机通话自适应调整装置的结构示意图,该装置包括采集模块601、解析匹配模块602、确定模块603及调整模块604,具体的:

采集模块601,用于在移动终端处于耳机通话模式下,采集环境中的语音信号;

在本发明实施例中,上述的耳机通话自适应调整方法由耳机通话自适应调整装置(以下简称为:调整装置)实现,该调整装置为程序模块,存储在移动终端的计算机可读存储介质中,可以由处理器执行。

在通话过程中,若移动终端处于耳机通话模式下,移动终端上的麦克风将采集环境中的语音信号,采集模块601将实时获取到麦克风采集到的语音信号,可以理解的是,该语音信号中至少包含该移动终端的通话者的声音,且若环境中有其他声音,麦克风也将采集到环境中存在的其他声音。

其中,若移动终端处于耳机通话模式,则有两种耳机通话方式,第一种是将耳机的麦克风靠近嘴边来进行通话,第二种是让麦克风正常下垂来进行通话。

解析匹配模块602,用于解析所述语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征;

在本发明实施例中,声纹在用电学仪器显示时,是可以观看到的携带语言信息的声波频谱,人类语言产生时,人体语言中枢与发音器官之间有一个复杂的生物物理过程,人在讲话时所使用的发声器官包括:舌、喉头、肺、鼻腔等等,由于每一个人的发声器官在尺寸和形态上各不相同,所以彼此的声纹图谱也会存在差异。声纹特征是声纹所具备的特征参数,是使得声纹可靠的参数,不同的声纹特征可以区分不同的声音。

其中,每个移动终端中至少有一个预置的声纹特征识别库,该预置的声纹特征识别库中存储该移动终端的使用者的声纹特征。

在本发明实施例中,对于采集到的语音信号,解析匹配模块602将解析该语音信号,并将解析得到的声纹特征与预置的声纹特征识别库进行匹配,从解析得到的声纹特征中识别哪个才是当前的通话者的声纹特征,并将识别的声纹特征作为目标声纹特征。

确定模块603,用于确定所述目标声纹特征所属的声音在所述语音信号中的语音幅值;

调整模块604,用于根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值。

在本发明实施例中,确定模块603确定该目标声纹特征所属的声音在语音信号中的语音幅值,其中,该目标声纹特征所属的声音即是通话者的声音,且该语音幅值是指通话者的声音所形成的声波中波幅的平均值,或者是波幅的最小值。

其中,调整模块604将根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值。

其中,响度值用于衡量音量的大小,频率值用于衡量声音的清晰度。

需要说明的是,在完成对语音信号的调整之后,可以将该语音信号发送给另一端的通话对象所使用的移动终端,以便该通话对象能够收听到清晰且音量合适的语音。

在本发明实施例中,在移动终端处于耳机通话模式下,采集模块601采集环境中的语音信号,解析匹配模块602解析语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征,确定模块603确定目标声纹特征所属的声音在语音信号中的语音幅值,调整模块604根据语音幅值调整语音信号中目标声纹特征所属的声音的响度值及频率值。相对于现有技术,在耳机通话模式下,针对采集到的语音信号,通过预置的声纹特征识别库匹配出目标声纹特征,对目标声纹特征所属的声音的响度值及频率值进行调整,相对于agc自适应增益调节方式,在提高通话音量的同时,能够有效避免对环境噪声放大的问题,提升通话质量。

请参阅图7,为本发明第三实施例中的解析匹配模块602的细化结构示意图,包括解析单元701、第一查找单元702及确定单元703,具体的:

解析单元701,用于解析所述语音信号,获取所述语音信号中不同来源的各声音的声纹特征;

在本发明实施例中,不同来源的各声音可以是通话者、电视、动物、机器等等各种各样的能够产生声音的人或物或设备。

第一查找单元702,用于查找所述声纹特征识别库,判断所述各声音的声纹特征中,是否存在与所述声纹特征识别库中的声纹特征相匹配的声纹特征;

在本发明实施例中,移动终端内预置了声纹特征识别库,包括一个或多个用户的声纹特征,具体设置方式可以是:用户通过点击操作进入移动终端的设置界面,并选择声纹设置功能,以便移动终端的显示界面显示声纹设置的开始按钮,用户点击该按钮之后说任意的内容,或者念出显示界面显示的内容,由移动终端上的麦克风采集用户说的内容,并进行声纹特征的分析,判断分析得到的声纹特征是否符合要求,若符合要求,则保存该声纹特征至声纹特征库中,以完成声纹特征的设置,若不符合要求,则显示提示消息,提示用户重新进行设置。通过该种方式,可以实现一个或多个用户在一台移动终端上的声纹特征的设置。

确定单元703,用于若存在匹配的声纹特征,则将所述匹配的声纹特征确定为所述目标声纹特征;

在本发明实施例中,将解析得到的声纹特征与预置的声纹特征识别库进行匹配,从解析得到的声纹特征中识别哪个才是当前的通话者的声纹特征,并将识别的声纹特征作为目标声纹特征。

在本发明实施例中,在移动终端处于耳机通话模式下,采集环境中的语音信号,解析单元701解析语音信号,获取语音信号中不同来源的各声音的声纹特征,第一查找单元702查找声纹特征识别库,判断各声音的声纹特征中,是否存在与声纹特征识别库中的声纹特征相匹配的声纹特征,若存在匹配的声纹特征,确定单元703则将匹配的声纹特征确定为目标声纹特征,确定目标声纹特征所属的声音在语音信号中的语音幅值,根据语音幅值调整语音信号中目标声纹特征所属的声音的响度值及频率值。相对于现有技术,在耳机通话模式下,针对采集到的语音信号,通过预置的声纹特征识别库匹配出目标声纹特征,对目标声纹特征所属的声音的响度值及频率值进行调整,相对于agc自适应增益调节方式,在提高通话音量的同时,能够有效避免对环境噪声放大的问题,提升通话质量。

请参阅图8,为本发明第三实施例中的调整模块604的细化结构示意图,包括第二查找单元801、判断单元802、第一调整单元803及第二调整单元804,具体的:

第二查找单元801,用于查找预置的参数调整表,确定与所述语音幅值对应的目标响度值及目标频率值,其中,所述参数调整表包括语音幅值、响度值及频率值的映射关系;

判断单元802,用于判断所述目标响度值是否小于或等于预置阈值;

在本发明实施例中,移动终端预置了一个参数调整表,该参数调整表包括语音幅值、响度值及频率值的映射关系,参数调整表预先设置一个标准参数,例如,语音幅值为10,对应的响度值及频率值都为40,语音幅值为30,对应的响度值及频率值都为70,该参数调整表中的响度值需要比语音幅值大40,40即为标准参数。

其中,预置一个阈值是为了防止响度值增加过大,出现破音现象。

第一调整单元803,用于若所述目标响度小于或等于所述预置阈值,则将所述目标声纹特征所属的声音的响度值及频率值分别调整为所述目标响度值及所述目标频率值。

在本发明实施例中,预置阈值是一个响度极限值,当目标响度值超过预置阈值时,在将目标声纹特征所属的声音的响度值调整为目标响度值时,会出现破音现象。

在本发明实施例中,进行语音通话的时候,当本端通话者将耳机靠近嘴边的时候,因目标响度小于或等于预置阈值,在将目标声纹特征所属的声音的响度值调整为目标响度值时,对端通话者接收到语音信号时,不会出现破音的现象,因此目标响度小于或等于预置阈值,则将目标声纹特征所属的声音的响度值及频率值分别调整为目标响度值及目标频率值。例如,预置阈值为100,语音幅值为10,对应的响度值及频率值都为40,40小于100,则将目标声纹特征所属的声音的响度值及频率值分别调整为40。

第二调整单元804,用于若所述目标响度大于所述预置阈值,则将所述目标声纹特征所属的声音的响度值及频率值分别调整为所述预置阈值及与所述预置阈值对应的预置频率值。

在本发明实施例中,当本端通话者将耳机靠近嘴边的时候,在目标响度大于预置阈值,若将目标声纹特征所属的声音的响度值及频率值分别调整为目标响度值及目标频率值,对端通话者接收到语音信号时,会出现破音的现象,因此,将目标声纹特征所属的声音的响度值及频率值分别调整为预置阈值及与预置阈值对应的预置频率值。例如,预置阈值为100,语音幅值为70,对应的响度值及频率值都为110,110大于100,则将目标声纹特征所属的声音的响度值及频率值分别调整为100,其中,判断单元802通过判断目标响度与预置阈值的关系,可以准确地调整目标声纹特征所属的声音的响度值及频率值,增强目标声纹特征所属的声音的响度值及频率值,提高通话质量的同时,防止接收方接听语音信号时出现破音现象。

在本发明实施例中,若移动终端处于耳机通话模式,则有两种耳机通话方式,第一种是将耳机的麦克风靠近嘴边来进行通话,该方式存在破音现象;第二种是让麦克风正常下垂来进行通话,该方式的通话音量小,现有技术中通过agc自适应增益调节方式来兼容这两种通话方式,即提高通话音量的同时,防止破音现象,但是agc自适应增益调节方式在提高通话音量的同时,会对整个语音信号均进行放大,势必会放大语音信号中的环境噪声,反而导致通话的质量降低,本发明实施例中,通过调整目标声纹特征所属的声音的响度值及频率值来提高通话音量,通过判断目标响度与预置阈值的关系从而防止出现破音,保证了通话语音质量。

请参阅图9,为本发明第四实施例中耳机通话自适应调整装置的结构示意图,该装置包括采集模块601、解析匹配模块602、确定模块603、调整模块604、提取模块901及降噪模块902,具体的:

采集模块601,用于在移动终端处于耳机通话模式下,采集环境中的语音信号;

解析匹配模块602,用于解析所述语音信号,并通过预置的声纹特征识别库从解析得到的声纹特征中,匹配得到目标声纹特征;

确定模块603,用于确定所述目标声纹特征所属的声音在所述语音信号中的语音幅值;

调整模块604,用于根据所述语音幅值调整所述语音信号中所述目标声纹特征所属的声音的响度值及频率值;

其中,本发明实施例中的采集模块601、解析匹配模块602、确定模块603及调整模块604分别与第三实施例中的采集模块601、解析匹配模块602、确定模块603及调整模块604描述的内容一致,此处不再赘述

提取模块901,用于从所述语音信号中提取除所述目标声纹特征以外的其他声纹特征所属的声音,得到干扰语音信号;

降噪模块902,用于对所述干扰语音信号进行降噪处理。

在本发明实施例中,在针对目标声纹特征所属的声音进行调整后,为了进一步提高通话质量,还可以针对其他的声音进行调整,具体的:提取模块901将从语音信号中提取除目标声纹特征以外的其他声纹特征所属的声音,得到干扰语音信号,例如,若语音信号中包含通话者的声音、电机机播放广告的声音,则该通话者的声音即为目标声纹特征所属的声音,提取模块901将从该语音信号中提取电视机播放广告的声音,并作为干扰语音信号。进一步的,降噪模块902将对该干扰语音信号进行降噪处理,以便在将调整后的语音信号发送给另一端的通话对象之后,该通话对象收听到的语音信号中有效信号(即通话者的声音)更加清晰且音量合适,而无效信号(即干扰语音信号)更弱。

其中,该降噪处理可以采用的方式有多种,如噪声门降噪法、采样降噪法、滤波降噪法等等。

在本发明实施例中,在提取模块901对语音信号中目标声纹特征所属的声音进行调整后,降噪模块902还将进一步的对语音信号中的干扰语音信号进行降噪处理,以便进一步的提升通话质量,改善通话体验。

本发明实施例还提供一种移动终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现第一实施例至第二实施例中任意一实施例中的耳机通话自适应调整方法中的各个步骤。

本发明实施例还提供一种存储介质,该存储介质具体可以为计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现第一实施例至第二实施例中任意一实施例中的耳机通话自适应调整方法中的各个步骤。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上为对本发明所提供的一种耳机通话自适应调整方法、装置、移动终端及存储介质的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1