一种降噪方法及装置与流程

文档序号:20834881发布日期:2020-05-22 16:44阅读:228来源:国知局
一种降噪方法及装置与流程

本申请涉及通信技术领域,尤其涉及一种降噪方法及装置。



背景技术:

现实生活中,用户发出的语音信息中通常含有噪声,比如,环境中的风声、汽车声、机器运转的声音等。在用户使用语音装置进行通话的过程中,这些噪声可能会影响用户的通话质量,使得用户的体验不好。举个例子,用户a和用户b通过终端设备(比如手机)进行通话,若用户a通过手机a发出的语音信息中包含的噪声较大,可能会使得用户b通过手机b无法正常获取到用户a的语音信息,比如获取到的语音信息不够清晰,或者获取不到用户a发出的语音信息。

因此,目前亟需一种降噪方法,用以解决因存在噪声而导致用户之间通话质量较低的技术问题。



技术实现要素:

本申请实施例提供一种降噪方法及装置,用以解决因存在噪声而导致用户之间通话质量较低的技术问题。

本申请实施例提供的一种降噪方法,包括:

服务器获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;

所述服务器根据所述训练数据,确定所述训练数据的时域特征值和目标值;所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;

所述服务器基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备;所述模型参数用于所述终端设备对用户输入的语音信息进行降噪处理。

本申请实施例提供的一种降噪方法,包括:

终端设备接收服务器发送的模型参数;

所述终端设备根据所述模型参数,对所述终端设备中的第一语音降噪模型的参数进行更新,得到更新后的第一语音降噪模型;

所述终端设备在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行降噪处理。

可选地,所述终端设备接收服务器发送的模型参数之后,还包括:

所述终端设备将预设标志更新为第一指示值;

所述终端设备得到更新后的第一语音降噪模型之后,还包括:

所述终端设备将所述预设标志更新为第二指示值。

可选地,所述终端设备在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行更新之前,还包括:

所述终端设备确定所述预设标志为所述第二指示值。

可选地,所述方法还包括:

所述终端设备在接收到用户输入的语音信息后,若确定所述预设标志为所述第一指示值,则使用所述终端设备中的第二语音降噪模型对所述语音信息进行降噪处理;所述第二语音降噪模型为所述第一语音降噪模型的备用模型。

本申请实施例提供的一种服务器,该服务器包括:

获取模块,用于获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;

确定模块,用于根据所述训练数据,确定所述训练数据的时域特征值和目标值,所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;

处理模块,用于基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备,以使所述终端设备使用所述模型参数对用户输入的语音信息进行降噪处理。

本申请实施例提供的一种终端设备,该终端设备包括:

收发模块,用于接收服务器发送的模型参数;

更新模块,用于根据所述模型参数,对所述终端设备中的第一语音降噪模型的参数进行更新,得到更新后的第一语音降噪模型;

降噪模块,用于在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行降噪处理。

可选地,在所述收发模块接收到服务器发送的模型参数之后,所述更新模块还用于:将预设标志更新为第一指示值,以及在得到更新后的第一语音降噪模型之后,将所述预设标志更新为第二指示值。

可选地,所述降噪模块还用于:

确定所述预设标志为所述第二指示值。

可选地,所述降噪模块还用于:

在接收到用户输入的语音信息后,若确定所述预设标志为所述第一指示值,则使用所述终端设备中的第二语音降噪模型对所述语音信息进行降噪处理;所述第二语音降噪模型为所述第一语音降噪模型的备用模型。

本申请的上述实施例中,服务器通过将收集到的第一环境(噪声小于等于预设阈值)中的第一语音信息和第二环境(噪声大于预设阈值)中的第二语音信息作为训练数据,并在确定训练数据的时域特征值和目标值后,基于频域构建的深度学习训练模型对时域特征值和目标值进行训练,得到模型参数,以及将模型参数发送给终端设备,使得终端设备可以在接收到服务器发送的模型参数后,对终端设备中的第一语音降噪模型的参数进行更新,并可以使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过获取训练数据的时域特征值(可以体现时域特征)和目标值,并采用基于频域构建的深度学习训练模型(可以体现频域特征)对训练数据的时域特征值和目标值进行训练,可以在训练模型的过程中将语音信息的时域特征和频域特征进行结合,进而提升深度学习训练模型的训练性能,加快深度学习训练模型的训练速度;且,由于训练数据可以包括多种环境下的语音信息,并可以多次采用不同的训练数据对深度学习训练模型进行训练,因此可以得到比较准确的模型参数;进一步地,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。此外,采用深度学习训练模型对训练数据进行训练获取模型参数的过程和终端设备对用户语音信息的降噪过程可以并行处理,从而能够提高语音降噪的处理速度和处理效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种可能的系统架构示意图;

图2为本申请实施例提供的一种降噪方法对应的流程示意图;

图3为本申请实施例中提供的一种服务器的结构示意图;

图4为本申请实施例中提供的一种终端设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

图1为本申请实施例提供的一种可能的系统架构,该系统架构中可以包括网络设备100、一个或多个终端设备(比如,图1中示意出的终端设备101和终端设备102),终端设备101和终端设备102可以通过网络设备100进行通信。其中,网络设备100可以为基站,比如长期演进(longtermevolution,lte)通信系统中的演进型基站(比如,evolvednodeb)。终端设备可以为手机(mobilephone)、平板电脑(pad)等,具体不做限定。

本申请实施例中,用户a和用户b可以通过终端设备进行通话,其中,用户a使用终端设备101,用户b使用终端设备102,一种可能的场景为,用户a向终端设备101输入语音信息,终端设备101通过网络设备100将用户a输入的语音信息传输给终端设备102,终端设备102在接收到语音信息后,将接收到的语音信息提供给用户b。

为了提高通话质量,一种可能的实现方式(为便于描述简称实现方式a)为,采用预设噪声信号对用户发出的语音信息进行降噪处理,即过滤掉用户发出的语音信息中的预设噪声信号,得到过滤后的语音信息。采用这种语音降噪方法,可以对用户发出的语音信息中的预设噪声信号进行过滤。然而,该种方法所采用的预设噪声信号是固定的,也就是说,终端设备可能会采用该预设噪声信号对所有后续用户发出的语音信息进行降噪处理,而不会对终端设备中的模型参数进行更新。在某种情况下,采用预设噪声信号对用户在多种不同环境下的语音信息进行降噪处理得到的语音信息可能会不准确。

基于此,本申请实施例提供一种语音降噪方法,用以解决因存在噪声而导致用户之间通话质量较低的技术问题。

图2为本申请实施例提供的一种降噪方法对应的流程示意图,该方法包括:

步骤201,服务器获取训练数据,并确定训练数据的时域特征值和目标值。

此处,训练数据可以包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,第一环境中的噪声可以小于等于预设阈值,也就是说,第一环境中的噪声较小,第二环境中的噪声可以大于预设阈值,也就是说,第一环境中的噪声较大。其中,预设阈值可以是由本领域技术人员根据经验进行设置得到的,或者也可以是通过一次或多次实验确定的,本申请实施例对此不作限定。

本申请实施例中,训练数据的获取方式可以有多种,在一种可能的实现方式中,可以由测试人员携带语音采集装置分别在第一环境和第二环境中收集第一语音信息和第二语音信息。举个例子,以预设阈值为-30分贝为例,若应用场景为预设楼层的某个房间,则可以将语音采集装置采集到的测试人员在该房间噪声小于等于-30分贝(或者没有噪声)的第一位置发出的语音信息作为第一语音信息,且可以将语音采集装置采集到的测试人员在该房间噪声大于-30分贝的第二位置发出的相同的语音信息作为第二语音信息。比如,用户在室内远离窗户的a位置对语音采集装置说“测试室内环境的噪声”(为便于描述,简称语音1),并在窗户旁边的位置b对语音采集装置说“测试室内环境的噪声”(为便于描述,简称语音2),则第一语音信息可以为语音1,第二语音信息可以为语音2。

本申请实施例中,语音信息作为一种信号,一般可以具有时域特征和频域特征。具体地说,语音信息的时域特征可以由语音信息的幅值维度和语音信息的时间维度来描述,比如,可以表示为幅值随时间变化的函数;通过语音信息的时域特征,可以获取到语音信息在某个时间段内的能量值、语音信息在某个时间点的幅值等信息。语音信息的频域特征可以由语音信息的幅值维度和语音信息的频率维度来描述,比如,可以表示为幅值随频率变化的函数。语音信息的时域特征与频域特征之间可以进行转换,在一个示例中,可以通过傅里叶变换将随时间变化的语音信息拆解为多个具有不同频率的语音信息。

本申请实施例中,服务器可以获取语音采集装置采集的训练数据,并确定训练数据的时域特征值,训练数据的时域特征值可以用于指示训练数据在时间域上的特征,在一种可能的实现方式中,训练数据的时域特征值可以包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项。可以理解的,训练数据的时域特征值还可以包括其他的信息,本申请实施例对此不作限定。

具体实施中,噪声阈值可以用于指示噪声的幅值范围,在一个示例中,可以预先设置一个初始噪声阈值(比如,-40分贝),此时,训练数据中幅值小于-40分贝的语音信息可以认定为噪声,幅值大于-40分贝的语音信息可以认定为用户的语音。具体实施中,不同的环境可以对应有不同的初始噪声阈值,比如,办公环境对应的初始噪声阈值可以为-40分贝,商场对应的初始噪声阈值可以为-30分贝。本申请实施例中,每一个环境对应的初始噪声阈值可以由本领域技术人员根据经验进行设置,或者也可以由本领域技术人员通过实验进行确定,对此不作限定。

长时能量值和短时能量值可以用于指示语音信息在预设时间段内的能量信息。下面以第一语音信息为例描述获取第一语音信息的长时能量值和短时能量值的实现过程,获取第二语音信息的长时能量值和短时能量值的过程可以参照第一语音信息来处理。

本申请实施例中,可以预先根据第一语音信息的总时长对第一语音信息进行分帧操作,得到多帧语音信息。其中,多帧语音信息中任意两帧语音信息的时长可以相同,或者也可以不同。具体实施中,将第一语音信息划分为多帧语音信息的方式可以有多种,在一种可能的实现方式中,可以预先设置一个标准帧时长(比如,10ms),从而根据标准帧时长将第一语音信息划分为多帧语音信息。在一个示例中(为便于描述,简称示例一),第一语音信息的总时长为205ms,则根据标准帧时长划分后,可以得到21帧语音信息,其中第1帧语音信息至第20帧语音信息的时长和标准帧时长相同,均为10ms,第21帧语音信息的时长为5ms。

进一步地,可以设置长时能量值为a帧(比如,a为3)语音信息的总能量的平均值,并可以设置短时能量值为最近b帧(比如,b为1)语音信息的能量值。基于示例一中的多帧语音信息和每帧语音信息的时长,则长时能量值可以为30ms时长的语音信息的总能量的平均值(若包括第21帧语音信息,则可以为25ms时长的语音信息的总能量的平均值);相应地,短时能量值可以为第21帧语音信息的能量值。需要说明的是,本申请实施例中,a和b的数值可以由本领域技术人员根据实际情况进行调整,对此不作限定。

噪声包络跟踪值可以用于对噪声的幅值进行估计。一般来说,噪声可能会比语音具有更宽的时间特性,因此,可以通过跟踪第二语音信息中每帧语音信息对应的最小幅值来获取噪声幅值的估计值。比如,可以预先提取第二语音信息中每帧语音信息对应的最小值,并据此绘制噪声包络跟踪图,并可以根据噪声包络跟踪图和预设指标(比如,快降慢升的原则),计算得到估计的噪声信息(比如,长时能量值对应的噪声包络值、短时能量值对应的噪声包络值等)。

需要说明的是,本申请实施例中,噪声阈值的大小还可以根据噪声包络跟踪值进行调整。在一个示例中,可以预设一个增量(比如,2分贝),若计算得到的噪声包络跟踪值大于初始噪声阈值(比如,-40分贝),则可以按照预设增量依次增大噪声阈值。举个例子,若第一次计算得到的噪声包络跟踪值为-35分贝,则可以将噪声阈值调整为-33分贝,并可以基于-33分贝的噪声阈值对噪声包络跟踪值进行计算。

本申请实施例中,服务器还可以确定训练数据的目标值,训练数据的目标值可以包括第一语音信息的语音活动检测值和/或第二语音信息的全带信噪比。其中,第一语音信息的语音活动检测值可以用于指示检测到的是语音还是噪声,在一个示例中,可以预设第一指示值(1)和第二指示值(0),比如,“1”可以用于指示当前检测到的是语音,“0”可以用于指示当前检测到的是噪声,或者,“0”可以用于指示当前检测到的是语音,“1”可以用于指示当前检测到的是噪声,本申请实施例对此不做限定。第二语音信息的全带信噪比可以用于指示语音和噪声的对应关系,在一个示例中,第二语音信息的全带信噪比可以为第二语音信息的平均功率和第二语音信息相对应的噪声的平均功率的比值。

步骤202,服务器基于频域构建的深度学习训练模型,对时域特征值和目标值进行训练,得到模型参数。

此处,深度学习训练模型的构建方法可以有多种,在一种可能的实现方式中,可以基于keras构建深度学习训练模型。具体地说,keras是一个基于theano的高度模块化的神经网络库,比如,keras可以基于torch并可以采用python语言进行编写,且keras可以支持图形处理器(graphicsprocessingunit,gpu)和中央处理器(centralprocessingunit,cpu)。

本申请实施例中,深度学习训练模型可以包括语音活动检测模块、噪声谱估计模块和谱减模块。其中,语音活动检测模块可以通过检测第一语音信息和第二语音信息,并根据检测到的第一语音信息和第二语音信息的活动标志(比如,幅值范围等)来区分语音和幅值。噪声谱估计模块可以用于对第一语音信息和第二语音信息进行计算,并可以根据计算得到的结果对噪声的频谱特性进行估计。谱减模块可以用于根据语音活动检测模块和噪声谱估计模块得到的计算结果,确定增益值,该增益值可以用于对语音信息中的噪声进行抑制。

具体实施中,服务器可以将训练数据的时域特征值作为深度学习训练模型的输入信息,并可以将训练数据的目标值作为深度学习训练模型的输出信息,进而控制深度学习训练模型根据输入信息和输出信息进行模型训练,得到模型参数。在一个示例中,服务器通过将时域特征值输入语音活动检测模块,可以得到第一模型参数;进一步地,服务器通过将第一模型参数输入噪声谱估计模块,可以得到第二模型参数,同时,服务器通过将第一模型参数输入谱减模块,可以得到第三模型参数;最后,服务器通过将第一模型参数、第二模型参数和第三模型参数共同输入谱减模块,可以得到训练数据经过深度学习训练模型训练后的模型参数。需要说明的是,本申请实施例中,深度学习训练模型中的各个模块可以为通过keras构建的功能模块,也就是说,语音活动检测模块、噪声谱估计模块和谱减模块仅为对确定模型参数的过程进行描述而引入的,具体实施中,还可以包括其它模块,具体不做限定。且,各个功能模块的名称也可以为其它可能的名称,具体不做限定。

步骤203,将模型参数发送给终端设备。

此处,服务器可以通过与终端设备进行通信,将模型参数发送给终端设备,其中,服务器与终端设备进行通信的方式可以有多种,在一个示例中,服务器可以通过无线方式与终端设备进行通信;在又一个示例中,服务器也可以通过有线(比如,光纤、网线等)与终端设备进行通信,本申请实施例对此不作限定。

步骤204,终端设备接收服务器发送的模型参数,并使用该模型参数对终端设备中的第一语音降噪模型的参数进行更新。

本申请实施例中,终端设备中可以预先设置有第一语音降噪模型和第二语音降噪模型,第二语音降噪模型可以为第一语音降噪模型的备用模型。其中,第一语音降噪模块和第二语音降噪模型在初始状态(比如,在终端设备出厂时,或者终端设备被初始化后)的参数可以为未对基于kears搭建的深度语音学习训练模型进行模型训练前的参数。

具体实施中,终端设备中可以设置有一个预设标志,该预设标志可以用于指示终端设备中的第一语音降噪模型是否处于更新状态。在一个示例中,终端设备在接收到服务器发送的模型参数,并在使用该模型参数对终端设备中的第一语音降噪模型的参数进行更新之前,终端设备可以将预设标志更新为第一指示值,第一指示值可以用于指示终端设备中的第一语音降噪模型处于更新状态。进一步地,终端设备可以在得到更新后的第一语音降噪模型之后,将预设标志更新为第二指示值,第二指示值可以用于指示终端设备中的第一语音降噪模型处于未更新状态,或者可以用于指示终端设备中的第一语音降噪模型已更新完成。本申请实施例中,预设标志可以通过一个比特位来表示,比如,第一指示值可以为“0”,第二指示值可以为“1”;或者,第一指示值可以为“1”,第二指示值可以为“0”,具体不做限定。

本申请实施例中,若终端设备检测到第一语音降噪模型由于某些原因(比如,终端设备的某些硬件损坏或者第一语音降噪模型的更新算法出错等)无法进行降噪处理,则终端设备也可以将预设标志更新为第一指示值。

需要说明的是,本申请实施例中,终端设备可以在得到更新后的第一语音降噪模型后,将第二语音降噪模块更新为第一语音降噪模块,比如,可以将第二语音降噪模块的参数更新为第一语音降噪模块的参数。

步骤205,终端设备在接收到用户输入的语音信息后,若确定预设标志为第一指示值,则可以执行步骤206a;若确定预设标志为第二指示值,则可以执行步骤206b;若确定预设标志为第二指示值,则可以执行步骤206b。

步骤206a,终端设备使用第二语音降噪模型对语音信息进行降噪处理。

此处,终端设备若确定预设标志为第一指示值,说明终端设备中的第一语音降噪模型处于更新状态,或者第一语音降噪模型无法进行降噪处理,此时,终端设备可以控制终端设备中的第二语音降噪模型对用户输入的语音信息进行降噪处理。

具体地说,第二语音降噪模型的参数可以为终端设备接收到的服务器上一次进行模型训练所得到的模型参数(或者在初始状态下可以为传统语音降噪模型的模型参数),因此,终端设备可以采用上一次得到的模型参数(或者传统语音降噪模型的模型参数)对用户输入的语音信息进行降噪处理。

步骤206a,终端设备使用更新后的第一语音降噪模型对语音信息进行降噪处理。

此处,终端设备确定预设标志为第二指示值,说明终端设备中的第一语音降噪模型已更新完成,此时,终端设备可以控制更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。也就是说,终端设备可以采用服务器进行模型训练得到的最新的模型参数对用户输入的语音信息进行降噪处理。

本申请的上述实施例中,通过获取训练数据的时域特征值(可以体现时域特征)和目标值,并采用基于频域构建的深度学习训练模型(可以体现频域特征)对训练数据的时域特征值和目标值进行训练,可以在训练模型的过程中将语音信息的时域特征和频域特征进行结合,进而提升深度学习训练模型的训练性能,加快深度学习训练模型的训练速度;且,由于训练数据可以包括多种环境下的语音信息,并可以多次采用不同的训练数据对深度学习训练模型进行训练,因此可以得到比较准确的模型参数;进一步地,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。此外,采用深度学习训练模型对训练数据进行训练获取模型参数的过程和终端设备对用户语音信息的降噪过程可以并行处理,从而能够提高语音降噪的处理速度和处理效率。

针对上述方法流程,本申请实施例还提供一种降噪装置,该装置的具体内容可以参照上述方法实施。

图3为本申请实施例提供的一种服务器的结构示意图,包括:

获取模块301,用于获取训练数据,所述训练数据包括在第一环境中收集的第一语音信息和在第二环境中收集的第二语音信息,所述第一环境中的噪声小于等于预设阈值,所述第二环境中的噪声大于所述预设阈值;

确定模块302,用于根据所述训练数据,确定所述训练数据的时域特征值和目标值,所述训练数据的时域特征值包括噪声阈值、长时能量值、短时能量值和噪声包络跟踪值中的一项或多项;所述训练数据的目标值包括所述第一语音信息的语音活动检测值和/或所述第二语音信息的全带信噪比;

处理模块303,用于基于频域构建的深度学习训练模型,对所述时域特征值和所述目标值进行训练,得到模型参数,并将所述模型参数发送给终端设备,以使所述终端设备使用所述模型参数对用户输入的语音信息进行降噪处理。

图4为本申请实施例提供的一种终端设备的结构示意图,包括:

收发模块401,用于接收服务器发送的模型参数;

更新模块402,用于根据所述模型参数,对所述终端设备中的第一语音降噪模型的参数进行更新,得到更新后的第一语音降噪模型;

降噪模块403,用于在接收到用户输入的语音信息后,使用所述更新后的第一语音降噪模型对所述语音信息进行降噪处理。

可选地,在所述收发模块401接收到服务器发送的模型参数之后,所述更新模块402还用于:将预设标志更新为第一指示值,以及在得到更新后的第一语音降噪模型之后,将所述预设标志更新为第二指示值。

可选地,所述降噪模块403还用于:

确定所述预设标志为所述第二指示值。

可选地,所述降噪模块403还用于:

在接收到用户输入的语音信息后,若确定所述预设标志为所述第一指示值,则使用所述终端设备中的第二语音降噪模型对所述语音信息进行降噪处理;所述第二语音降噪模型为所述第一语音降噪模型的备用模型。

从上述内容可以看出:本申请的上述实施例中,服务器通过将收集到的第一环境(噪声小于等于预设阈值)中的第一语音信息和第二环境(噪声大于预设阈值)中的第二语音信息作为训练数据,并在确定训练数据的时域特征值和目标值后,基于频域构建的深度学习训练模型对时域特征值和目标值进行训练,得到模型参数,以及将模型参数发送给终端设备,使得终端设备可以在接收到服务器发送的模型参数后,对终端设备中的第一语音降噪模型的参数进行更新,并可以使用更新后的第一语音降噪模型对用户输入的语音信息进行降噪处理。本申请实施例中,通过获取训练数据的时域特征值(可以体现时域特征)和目标值,并采用基于频域构建的深度学习训练模型(可以体现频域特征)对训练数据的时域特征值和目标值进行训练,可以在训练模型的过程中将语音信息的时域特征和频域特征进行结合,进而提升深度学习训练模型的训练性能,加快深度学习训练模型的训练速度;且,由于训练数据可以包括多种环境下的语音信息,并可以多次采用不同的训练数据对深度学习训练模型进行训练,因此可以得到比较准确的模型参数;进一步地,通过使用深度学习训练模型训练得到的模型参数对终端设备中的第一语音降噪模型的参数进行更新,可以使得终端设备采用深度学习训练模型训练得到的模型参数对用户输入的语音信息进行降噪处理,从而能够使降噪处理得到的语音信息更加准确,提高用户的体验感。此外,采用深度学习训练模型对训练数据进行训练获取模型参数的过程和终端设备对用户语音信息的降噪过程可以并行处理,从而能够提高语音降噪的处理速度和处理效率。

本领域内的技术人员应明白,本申请的实施例可提供为方法、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1