噪音消除方法和装置、以及移动终端的制作方法

文档序号:7980360阅读:278来源:国知局
噪音消除方法和装置、以及移动终端的制作方法
【专利摘要】本发明提供了噪音消除方法和装置、以及移动终端,该方法包括:预先从通话方的声音中提取出用于标识该通话方声音的音频指纹;在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方。
【专利说明】噪音消除方法和装置、以及移动终端
【技术领域】
[0001]本发明涉及计算机技术,特别涉及噪音消除方法和装置、以及移动终端。
【背景技术】
[0002]当今社会,通过移动终端比如手机等进行通话正变得越来越普遍。而经常,该通话会被周围环境的背景噪音影响,比如,如果通话一端处于周围比较嘈杂的环境中,则该通话端的声音会受到周围背景噪音干扰,会导致通话对端接收的声音含有背景噪音,影响通话质量。
[0003]为了提高通话质量,现有技术中,需要在移动终端上额外增加硬件设备即消噪硬件设备,来降低噪音对通话质量的影响。其中,该消噪硬件设备包括一个背景消噪麦克风、一个消噪芯片和一个发生装置。所述背景消噪麦克风区别于移动终端上正常的通话麦克风,用于采集噪音声波;所述消噪芯片用于基于所述背景消噪麦克风采集的噪音声波来生成与噪音相反的声波;所述发声装置,用于发出所述与噪音相反的声波,以利用抵消原理来消除通话过程中噪音,从而提高通话质量。
[0004]但是,由于现有技术在提高通话质量过程中,需要在移动终端上额外增加消噪硬件设备,尤其是在手机上,这会增加硬件成本;另外,上述的发声装置并不能彻底消除噪音,会导致未被消除的噪音携带在移动终端用户的音频数据中传输给对端,这导致传输的音频数据过大,影响音频数据的传输速度和质量;还有,为了消除噪音,现有技术中,背景消噪麦克风被放置在移动终端的位置并非随意,其需要和移动终端上的通话麦克风保持足够的距离,这就要求移动终端在设计时需要加以考虑,影响移动终端的设计。

【发明内容】

[0005]本发明提供了噪音消除方法和装置、以及移动终端,以在不额外增加现有消噪硬件设备的基础上消除通话过程中的背景噪音。
[0006]本发明提供的技术方案包括:
[0007]一种噪音消除方法,包括:
[0008]预先从通话方的声音中提取出用于标识该通话方声音的音频指纹;
[0009]在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方。
[0010]一种噪音消除装置,该装置包括:
[0011]提取模块,用于预先从通话方的声音中提取并存储用于标识该通话方声音的音频指纹;
[0012]传输模块,用于在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方。[0013]一种移动终端,所述移动终端包括如上所述的噪音消除装置。
[0014]由以上技术方案可以看出,本发明中,通过先从通话方的声音中提取出用于标识该通话方声音的音频指纹,这样,在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方,这保证了保证对端受话方听到更清楚的、且自身需要的声音,提高了通话质量;
[0015]进一步地,本发明中,由于通过通信网络传输的声音仅为用户A实际发出的声音,不包括其他噪音,这相比于现有技术,减少了通信网络的负载。
【专利附图】

【附图说明】
[0016]图1为本发明实施例提供的流程图;
[0017]图2为本发明实施例提供的另一流程图;
[0018]图3为本发明实施例提供的装置结构图。
【具体实施方式】
[0019]为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
[0020]本发明提供的方法能够实现在不需要额外增加消噪硬件设备的基础上消除通话过程中的背景噪音。下面对本发明提供的方法进行描述:
[0021]首先,需要说明的是,本发明提供的方法可以应用在移动终端比如手机等上,也可以应用于固定硬件设备比如PC机等上,本发明并不具体限定。以下均以本发明提供的方法应用于移动终端为例:
[0022]参见图1,图1为本发明实施例提供的方法流程图。如图1所示,该流程可包括以下步骤:
[0023]步骤101,预先从通话方的声音中提取出用于标识该通话方声音的音频指纹。
[0024]步骤102,在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方。
[0025]本发明中,所述当前通话声音可包含所述通话方实际发出的声音和影响所述通话方实际发出声音的噪音。
[0026]通常,如果通话方处于一个嘈杂的环境中,噪音会跟着通话方的声音混杂在一起作为通话方声音,如果移动终端将该作为通话方声音的混杂声音直接通过通信网络传输,则对端受话方就会收到混杂声音,影响通话质量。而本发明中,在通过通信网络传输通话方声音之前,先将通话方实际的声音从混杂声音中提取出来,只将被提取的声音通过通信网络传输,这样,对端受话方就会收到通话方实际的声音,保证对端受话方听到更清楚的、且自身需要的声音,提高了通话质量。
[0027]需要说明的是,上述步骤101至步骤102可通过安装在移动终端的软件实现,下面对图1所示流程进行详细描述。
[0028]参见图2,图2为本发明实施例提供的详细流程图。该流程应用于移动终端,如图2所示,该流程可包括以下步骤:
[0029]步骤201,移动终端从各个用户的声音中提取出用于标识各用户声音的音频指纹。
[0030]本步骤201中,移动终端从用户声音中提取出用于标识该用户声音的音频指纹包括:
[0031]步骤1,将用户声音信号分成互相重叠的帧;
[0032]步骤2,对每一帧进行特征运算,使用分类器方式将得到的结果映射为一数据,将该得到的数据作为用于标识该用户声音的音频指纹。
[0033]其中,在步骤I中,将用户声音信号分成互相重叠的帧包括:从不同起始时间开始按照设定时间间隔将用户声音信号分成互相重叠的帧;或者,从不同起始频率开始按照设定频率间隔将用户声音信号分成互相重叠的帧。以按照设定时间间隔将用户声音信号分成互相重叠的帧为例,假如设定时间间隔为1ms,则可从第Oms开始以Ims为间隔将用户声音信号分成巾贞,从0.5ms开始以Ims为间隔将用户声音信号分成巾贞,从第Ims开始以Ims为间隔将用户声音信号分成帧、以及从第1.5ms开始以Ims为间隔将用户声音信号分成帧等,通过这种划分方式,这显然使分成的帧之间有一部分互相重叠。
[0034]另外,在步骤2中的特征运算,其具体实现时可为以下任一或者任一组合:傅立叶变换(FFT)、小波变换(WT)、迈尔倒谱系数(MFCC)、频谱平滑度、尖锐度、线性预测编码(LPC)。
[0035]还有,在步骤2中的分类器方式可为现有的隐含马尔可夫模型或量化技术,其中,使用分类器方式将得到的结果映射为一数据,可为现有技术中使用隐含马尔可夫模型或量化技术映射的方式类似,这里不再赘述。
[0036]步骤202,移动终端将提取出的音频指纹存储在本地。
[0037]步骤203,移动终端在一用户比如用户A进行通话时,从本地存储的用户音频指纹中找到用户A的音频指纹。
[0038]如果移动终端当前处于一个嘈杂的环境,则用户A当前的通话声音就包括:用户A实际发出的声音和影响用户A实际发出声音的噪音比如周围的背景噪音等。
[0039]步骤204,移动终端利用已提取的用户A的音频指纹从当前通话声音中提取出与该音频指纹匹配的声音。
[0040]具体地,本步骤204可为:
[0041]步骤a,采用目标声音采集预测方式从当前通话声音中预测出与已提取的用于标识通话方声音的音频指纹的声音;
[0042]步骤b,采用时频域内目标声音的二次定位从当前通话声音中提取出该预测的声音,将该提取出的声音作为与用于标识所述通话方声音的音频指纹匹配的声音。
[0043]在步骤a中的目标声音采集预测方式、以及步骤b中的时频域内目标声音的二次定位可与现有技术类似,本发明不再赘述。
[0044]步骤205,移动终端通过通信网络发送步骤204提取出的声音至对端受话方。
[0045]如此,通过上述步骤201至步骤205,对端受话方即可听到用户A实际发出的声音,这保证用户A与对端受话方之间的通话质量,并且,由于通过通信网络传输的声音仅为用户A实际发出的声音,不包括其他噪音,这相比于现有技术,减少了通信网络的负载。
[0046]以上对本发明提供的方法进行了描述,下面对本发明提供的装置进行描述:[0047]参见图3,图3为本发明实施例提供的装置结构图。如图3所示,该装置包括:
[0048]提取模块,用于预先从通话方的声音中提取并存储用于标识该通话方声音的音频指纹;
[0049]传输模块,用于在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方;其中,所述当前通话声音包含所述通话方实际发出的声音和影响所述通话方实际发出声音的噪音。
[0050]优选地,本发明中,如图3所示,所述提取模块包括:
[0051]划分单元,用于将通话方的声音信号分成互相重叠的帧;
[0052]映射单元,用于对每一帧进行特征运算,使用分类器方式将得到的结果映射为一数据,将该得到的数据作为用于标识该通话方声音的音频指纹。
[0053]本发明中,所述划分单元将通话方的声音信号分成互相重叠的帧包括:
[0054]从不同起始时间开始按照设定时间间隔将通话方的声音信号分成互相重叠的帧;或者,从不同起始频率开始按照设定频率间隔将通话方的声音信号分成互相重叠的帧。
[0055]优选地,本发明中,所述传输模块通过以下单元从当前通话声音中提取出与所述音频指纹匹配的声音包括:
[0056]预测单元,用于采用目标声音采集预测方式从当前通话声音中预测出与已提取的用于标识通话方声音的音频指纹的声音;
[0057]提取单元,用于采用时频域内目标声音的二次定位从当前通话声音中提取出该预测的声音,将该提取出的声音作为与用于标识所述通话方声音的音频指纹匹配的声音。
[0058]至此,完成图3所示装置的描述。
[0059]优选地,本发明还提供了一种移动终端,其中,该移动终端可包括图3所示的装置。
[0060]由以上技术方案可以看出,本发明中,通过先从通话方的声音中提取出用于标识该通话方声音的音频指纹,这样,在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方;其中,所述当前通话声音包含所述通话方实际发出的声音和影响所述通话方实际发出声音的噪音,这保证了保证对端受话方听到更清楚的、且自身需要的声音,提高了通话质量;
[0061]进一步地,本发明中,由于通过通信网络传输的声音仅为用户A实际发出的声音,不包括其他噪音,这相比于现有技术,减少了通信网络的负载。
[0062]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【权利要求】
1.一种噪音消除方法,其特征在于,该方法包括: 预先从通话方的声音中提取出用于标识该通话方声音的音频指纹; 在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方。
2.根据权利要求1所述的方法,其特征在于,所述方法应用于移动终端上; 所述预先从通话方的声音中提取出的用于标识该通话方声音的音频指纹存储于所述移动终端; 所述利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音包括: 从所述移动终端所存储的所有音频指纹中获取用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音。
3.根据权利要求1或2所述的方法,其特征在于,所述从通话方的声音中提取出用于标识该通话方声音的音频指纹包括: 将通话方的声音信号分成互相重叠的帧; 对每一帧进行特征运算,使用分类器方式将得到的结果映射为一数据,将该得到的数据作为用于标识该通话方声音的音频指纹。
4.根据权利要求3所述的方法,其特征在于,所述特征运算包括以下任一个或者任一组合: 傅立叶变换FFT、小波变换WT、迈尔倒谱系数MFCC、频谱平滑度、尖锐度、线性预测编码LPC。
5.根据权利要求3所述的方法,其特征在于,所述将通话方的声音信号分成互相重叠的帧包括: 从不同起始时间开始按照设定时间间隔将通话方的声音信号分成互相重叠的帧;或者, 从不同起始频率开始按照设定频率间隔将通话方的声音信号分成互相重叠的帧。
6.根据权利要求3所述的方法,其特征在于,所述利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音包括: 采用目标声音采集预测方式从当前通话声音中预测出与已提取的用于标识通话方声音的音频指纹的声音; 采用时频域内目标声音的二次定位从当前通话声音中提取出该预测的声音,将该提取出的声音作为与用于标识所述通话方声音的音频指纹匹配的声音。
7.一种噪音消除装置,其特征在于,该装置包括: 提取模块,用于预先从通话方的声音中提取并存储用于标识该通话方声音的音频指纹; 传输模块,用于在所述通话方当前和对端受话方通话时,利用已提取的用于标识所述通话方声音的音频指纹,从当前通话声音中提取出与所述音频指纹匹配的声音,并通过通信网络发送至对端受话方。
8.根据权利要求7所述的装置,其特征在于,所述提取模块包括:划分单元,用于将通话方的声音信号分成互相重叠的帧; 映射单元,用于对每一帧进行特征运算,使用分类器方式将得到的结果映射为一数据,将该得到的数据作为用于标识该通话方声音的音频指纹。
9.根据权利要求8所述的装置,其特征在于,所述划分单元将通话方的声音信号分成互相重叠的帧包括: 从不同起始时间开始按照设定时间间隔将通话方的声音信号分成互相重叠的帧;或者, 从不同起始频率开始按照设定频率间隔将通话方的声音信号分成互相重叠的帧。
10.根据权利要求7所述的装置,其特征在于,所述传输模块通过以下单元从当前通话声音中提取出与所述音频指纹匹配的声音包括: 预测单元,用于采用目标声音采集预测方式从当前通话声音中预测出与已提取的用于标识通话方声音的音频指纹的声音; 提取单元,用于采用时频域内目标声音的二次定位从当前通话声音中提取出该预测的声音,将该提取出的声音作为与用于标识所述通话方声音的音频指纹匹配的声音。
11.一种移动终端,其特征在于,所述移动终端包括权利要求7至10任一所述的装置。
【文档编号】H04M1/725GK103514876SQ201210217760
【公开日】2014年1月15日 申请日期:2012年6月28日 优先权日:2012年6月28日
【发明者】彭伟刚, 吴博, 胡先, 付红峰, 李少博, 蒋奎 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1