语音数据处理方法、装置和电子设备与流程

文档序号:31114955发布日期:2022-08-12 21:39阅读:114来源:国知局
语音数据处理方法、装置和电子设备与流程

1.本发明涉及语音识别技术领域,尤其是涉及一种语音数据处理方法、装置和电子设备。


背景技术:

2.语音前端处理,一般是指为了达到更好的识别效果,在语音信号输入到语音识别系统之前对语音信号进行的一些预处理。例如,在实际生活中,为了使语音识别系统能在嘈杂的环境中达到很好的识别效果,需要降低语音信号中的噪声水平,这就是一种语音前端处理的方式。
3.实际应用中的语音识别系统一般包含两部分功能,第一部分是语音唤醒,第二部分是语音内容识别,在实际使用过程中,用户需要说出特定的唤醒词并成功进行语音唤醒之后,才能进行后续的语音内容识别。现有的语音识别系统的服务及产品,大多都是把这两部分放在一起进行处理,即建立同一套语音信号处理机制,以及同一套声学模型和语言模型。
4.然而,目前的语音识别系统大都基于深度学习技术,通过对超大语料库的训练和学习来建立声学模型和语言模型。如果语音唤醒和语音内容识别共用一套处理机制,那么将需要更大的语料库和更复杂的模型结构,使得训练时间变长,训练难度加大。同时,利用深度学习技术建立语音识别系统,往往会忽略对数据的预处理,这会使得训练更加困难,比如,带噪声的语料中语音特征不明显,会使得训练不容易收敛,训练效果不好。另外,一般大型的连续语音识别系统都建立在云端,需要联网才能进行语音唤醒和识别,这将会带来一定的时间延迟,而为了有更好的使用体验,用户都希望语音唤醒能够快速响应,这个要求将进一步加大建立识别模型的难度。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种语音数据处理方法、装置和电子设备,以减少神经网络模型的训练时间和训练难度,提升训练效果,降低云端识别系统开发难度,有助于后期维护和优化。
6.第一方面,本发明实施例提供了一种语音数据处理方法,应用于语音设备,语音设备包括预先训练完成的语音唤醒模型;方法包括:采集语音数据;对语音数据进行预处理;预处理包括降噪和/或消除回声;将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果;如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,以使设置在云端的语音内容识别模型识别语音数据的语音内容。
7.在本发明较佳的实施例中,上述语音数据包括来自语音设备的回声数据和来自语音设备所处环境的环境数据;语音设备包括通道控制器和与通道控制器连接的麦克风;麦克风包括用于采集环境数据的第一通道和第二通道,以及用于采集回声数据的第三通道;上述采集语音数据的步骤,包括:通过通道控制器确定当前语音采集选用的目标通道;如果
目标通道为第一通道和第二通道,通过第一通道和第二通道采集环境数据;如果目标通道为第三通道,通过第三通道采集回声数据。
8.在本发明较佳的实施例中,上述通过第一通道和第二通道采集环境数据的步骤,包括:通过第一通道采集第一环境数据;通过第二通道采集第二环境数据;计算第一环境数据和第二环境数据的均值,将均值作为环境数据。
9.在本发明较佳的实施例中,上述对语音数据进行预处理的步骤,包括:判断语音数据中是否包含回声数据;如果是,消除语音数据中的回声数据,并且降低语音数据中的噪声;如果否,降低语音数据中的噪声。
10.在本发明较佳的实施例中,上述降低语音数据中的噪声的步骤,至少包括以下之一:将语音数据输入预先训练完成的神经网络降噪模型,输出降噪后的声音数据;对语音数据进行非线性化处理,对非线性化处理后的语音数据进行降噪;基于预设的谱减降噪算法对语音数据进行降噪。
11.在本发明较佳的实施例中,上述对语音数据进行预处理的步骤,包括:确定语音数据的声音起始点和声音结束点;对声音起始点和声音结束点之间的语音数据进行预处理。
12.在本发明较佳的实施例中,上述将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果的步骤,包括:将预处理后的语音数据输入语音唤醒模型;通过语音唤醒模型从预处理后的语音数据中提取第一语音特征;将第一语音特征与语音唤醒模型预先保存的第二语音特征进行比对,得到唤醒结果。
13.在本发明较佳的实施例中,上述语音唤醒模型包括声学模型和语言模型,语音唤醒模型对第二语音特征进行建模和识别。
14.第二方面,本发明实施例还提供一种语音数据处理装置,应用于语音设备,语音设备包括预先训练完成的语音唤醒模型;装置包括:语音数据采集模块,用于采集语音数据;语音数据预处理模块,用于对语音数据进行预处理;预处理包括降噪和/或消除回声;唤醒结果输出模块,用于将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果;语音数据发送模块,用于如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,以使设置在云端的语音内容识别模型识别语音数据的语音内容。
15.第三方面,本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述的语音数据处理方法的步骤。
16.第四方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述的语音数据处理方法的步骤。
17.本发明实施例带来了以下有益效果:
18.本发明实施例提供的一种语音数据处理方法、装置和电子设备,可以在语音设备中对语音数据进行预处理,将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果,如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,由云端的语音内容识别模型识别语音数据的语音内容。该方式中,预处理和语音唤醒的流程可以在语音设备中离线处理,语音内容识别可以在云端进行处理,可以减少神经网络模型的训练时间和训练难度,提升训练效果,加快响应速度,降低云端识别系统开发难度,有助于后期维护和优化。
19.本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
20.为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
21.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1为本发明实施例提供的一种语音数据处理方法的流程图;
23.图2为本发明实施例提供的另一种语音数据处理方法的流程图;
24.图3为本发明实施例提供的一种语音数据处理方法的示意图;
25.图4为本发明实施例提供的一种语音数据处理装置的结构示意图;
26.图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
27.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
28.目前的语音识别系统大都基于深度学习技术,语音唤醒和语音内容识别共用一套处理机制,需要更大的语料库和更复杂的模型结构,使得训练时间变长,训练难度加大。同时,目前的语音识别系统往往会忽略对数据的预处理,这会使得训练更加困难,使得训练不容易收敛,训练效果不好。此外,一般大型的连续语音识别系统都建立在云端,这将会带来一定的时间延迟,响应速度较慢。
29.基于此,本发明实施例提供的一种语音数据处理方法、装置和电子设备,该技术可以应用于语音设备,例如手机、平板电脑、计算机等多种设备中。该技术可以属于计算机、语音识别的技术领域,具体涉及一种用于在线语音识别的语音前端处理方法。该技术可采用相应的软件和硬件实现,以下对本发明实施例进行详细介绍。
30.为便于对本实施例进行理解,首先对本发明实施例所公开的一种语音数据处理方法进行详细介绍。
31.实施例一:
32.本实施例提供了一种语音数据处理方法,该方法应用于语音设备,语音设备包括预先训练完成的语音唤醒模型;参见图1所示的一种语音数据处理方法的流程图,该语音数据处理方法包括如下步骤:
33.步骤s102,采集语音数据。
34.本实施例提供的方法可以应用于语音设备,语音设备可以为能够采集语音数据、对采集的语音数据进行数据处理,并且与云端通信连接的电子设备。例如:语音设备可以为
手机、电脑、平板电脑等设备。
35.本实施例中的语音数据,可以包含语音设备自身发出的声音和语音设备所处环境发出的声音。这里需要说明的是,语音设备所处环境发出的声音是可以包含语音设备自身发出的声音的。例如:用户a携带语音设备在马路上行走,语音设备外放音乐,则语音设备自身发出的声音可以为上述音乐,语音设备所处环境发出的声音可以包含上述音乐,还可以包含用户a的脚步声,路面上的车辆发出的声音等。
36.语音设备可以包含采集语音数据的模块,一般可以为麦克风,通过麦克风的不同通道可以分别采集语音设备自身发出的声音和语音设备所处环境发出的声音。
37.步骤s104,对语音数据进行预处理;预处理包括降噪和/或消除回声。
38.对语音数据进行预处理可以理解为对语音数据进行前端处理,预处理可以包括但不限于对语音数据进行降噪和消除回声,降噪即降低语音数据的噪声,例如:用户b在地铁中打电话,语音数据可以包括用户b说话的内容和地铁运行的声音。此时,地铁运行的声音可以为噪声,可以进行降噪处理。
39.本实施例中的回声可以理解为语音设备自身发出的声音。又例如:用户c的手机外放音乐,又在跟其朋友说话,则语音数据可以包括外放的音乐和用户c说话的内容。此时外放的音乐可以为回声,可以进行回声消除的处理。
40.步骤s106,将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果。
41.语音设备中可以包含预选训练完成的语音唤醒模型中,语音唤醒模型可以进行语音唤醒的相关操作,例如:确定预处理后的语音数据中是否包含预设的唤醒词,如果包括,则唤醒结果为语音唤醒成功;如果不包括,则唤醒结果为语音唤醒失败。
42.步骤s108,如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,以使设置在云端的语音内容识别模型识别语音数据的语音内容。
43.如果唤醒结果表征语音唤醒成功,则可以进行后续语音内容识别的操作,本实施例的语音内容识别的相关操作可以在云端设置的语音内容识别模型中进行。其中,云端可以为服务器。即,本实施例中的语音前端处理(即上述预处理)和语音唤醒可以离线处理(即在语音设备中处理),语音内容识别则在云端处理,从而降低云端识别系统开发难度,提高响应速度。
44.本发明实施例提供的一种语音数据处理方法,可以在语音设备中对语音数据进行预处理,将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果,如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,由云端的语音内容识别模型识别语音数据的语音内容。该方式中,预处理和语音唤醒的流程可以在语音设备中离线处理,语音内容识别可以在云端进行处理,可以减少神经网络模型的训练时间和训练难度,提升训练效果,加快响应速度,降低云端识别系统开发难度,有助于后期维护和优化。
45.实施例二:
46.实施例提供了另一种语音数据处理方法,该方法在上述实施例的基础上实现;本实施例重点描述采集语音数据的具体实施方式。参见图2所示的另一种语音数据处理方法的流程图,本实施例中的语音数据处理方法包括如下步骤:
47.步骤s202,通过通道控制器确定当前语音采集选用的目标通道。
48.本实施例中的语音数据包括来自语音设备的回声数据和来自语音设备所处环境
的环境数据;语音设备包括通道控制器和与通道控制器连接的麦克风;麦克风包括用于采集环境数据的第一通道和第二通道,以及用于采集回声数据的第三通道。
49.其中,回声数据只有语音设备本身播放的声音,没有人声;而环境数据包括语音设备能采集到的周围所有声音,包括人声和语音设备本身的声音。
50.参见图3所示的一种语音数据处理方法的示意图,如果图3所示,语音数据经过麦克风输入到语音设备中,由语音设备的道路控制器确定当前语音采集选用的目标通道。
51.道路控制器可以接收语音设备的据底层硬件通知:如果该底层硬件通知指示当前是回声状态(第三通道数据有效),那么目标通道为第三通道,就走“第三通道采集回声数据”,如果通知指示当前是非回声状态(第三通道数据无效),那么目标通道为第一通道和第二通道,就走“第一通道和第二通道取均值,转化为单通道数据”,如果通知从回声状态和非回声状态反复切换,那上述两个通路就反复切换,另外需要说明的是,不可能同时走上述两个通路,每次只能是一个通路。
52.步骤s204,如果目标通道为第一通道和第二通道,通过第一通道和第二通道采集环境数据。
53.如图3所示,如果目标通道为第一通道和第二通道,则语音数据包括来自语音设备所处环境的环境数据,是第一通道和第二通道分别采集环境数据,例如,可以通过下述步骤采集环境数据:通过第一通道采集第一环境数据;通过第二通道采集第二环境数据;计算第一环境数据和第二环境数据的均值,将均值作为环境数据。
54.此时,第一通道和第二通道分别采集第一环境数据和第二环境数据,第一环境数据和第二环境数据的均值,转化为单通道数据,可以作为环境数据。
55.步骤s206,如果目标通道为第三通道,通过第三通道采集回声数据。
56.如图3所示,如果目标通道为第三通道,则语音数据包括来自语音设备的回声数据,可以由第三通道采集回声数据。
57.步骤s208,对语音数据进行预处理;预处理包括降噪和/或消除回声。
58.如图3所示,由底层硬件通知语音信号中是否含有回声,分为有回声通路和无回声通路,“有回声?”判断框为是的通路为有回声通路,有回声?”判断框为否的通路为无回声通路。无回声通路即语音数据不包含回声数据,可以不进行回声消除,即没有图3中的回声消除模块。可以通过图3中的各个模块在唤醒通路和识别通路中进行预处理,这里需要说明的是,唤醒通路和识别通路的模块数量可以相同,也可以不同,相同名称的模块在唤醒通路和识别通路中的作用可能存在区别。
59.例如:对语音数据进行预处理的步骤,包括:判断语音数据中是否包含回声数据;如果是,消除语音数据中的回声数据,并且降低语音数据中的噪声;如果否,降低语音数据中的噪声。
60.如果语音数据中包含回声数据,则在“有回声?”判断框判断为是,需要进行回声消除和降噪;如果语音数据中不包含回声数据,则在“有回声?”判断框判断为否,不需要进行回声消除,只需要进行降噪。
61.具体来说,在图3中的每个通路中,唤醒通路判断是否唤醒成功,识别通路表征如果已唤醒成功,语音数据送入云端服务器进行识别。通路中各信号处理模块的功能类似。
62.其中,本实施例中降低语音数据中的噪声的步骤,至少包括以下之一:将语音数据
输入预先训练完成的神经网络降噪模型,输出降噪后的声音数据;对语音数据进行非线性化处理,对非线性化处理后的语音数据进行降噪;基于预设的谱减降噪算法对语音数据进行降噪。
63.图3中的回声消除(acoustic echo cancellation,aec)模块,可以消除语音设备自身播放的声音数据(即回声数据),该回声数据不应再次送入识别系统。
64.具体来说,本实施例消除的回声可以为声学回音(acoustic echo)。声学回音是由于在免提或者会议应用中,扬声器的声音多次反馈到麦克风引起的。举例来说,远端讲话者的声音被远端麦克风采集并传入通信设备,经过无线或有线传输之后达到近端的通信设备,并通过近端扬声器播放,这个声音又会被近端麦克风拾取至其通信设备形成声学回声,经传输又返回到远端的通信设备,并通过远端扬声器播放出来,从而远端讲话者就听到了自己的回声。
65.可以通过下述几种方式进行回声消除:回声抑制器、声场环境材料处理、自适应回声抵消等,还可以使用自适应滤波算法调整滤波器的权值向量,估计一个近似的回声路径来逼近真实回声路径,从而得到估计的回声信号,并在纯净语音和回声的混合信号中除去此信号来实现回声的消除。
66.图3中的神经网络降噪模型,可以使用高效的神经网络降噪模型(例如rnnoise神经网络模型)降低数据中的噪声水平,使语音内容不受其他噪声的干扰。
67.图3中的对数谱幅度估计(log-spectral amplitude estimation,lsa)模块,可以在有回声通路中对残余的回声进行非线性化处理同时进行降噪,而在无回声通路中只进行噪声估计并不降噪。即对数谱幅度估计模块在有回声通路和无回声通路中的功能并不完全相同。通过对数谱幅度估计的方式,可以几乎屏蔽音乐噪声(谱减法由于未完整消除统计噪声而带来的周期性噪音)的影响,能够能实现优秀的单通道音频降噪处理。
68.图3中的传统降噪模块,可以使用传统谱减降噪算法,进一步消除噪声影响。
69.谱减降噪算法的原理为:假设语音中的噪声只有加性噪声,只要将带噪语音谱减去噪声谱,就可以得到纯净语音幅度。得到纯净信号的幅度谱后,可以结合带噪语音相位(近似带替纯净语音相位),从而得到近似的纯净语音。
70.除了上述三个模块之外,还可以通过下述方式对语音数据进行预处理:确定语音数据的声音起始点和声音结束点;对声音起始点和声音结束点之间的语音数据进行预处理。图3中的语音活动检测(voice activity detection,vad)模块,可以检测语音数据的声音起始点和声音结束点。
71.步骤s210,将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果。
72.完成预处理之后,可以将预处理后的语音数据输入语音唤醒模型。这里需要说明的是,输入语音唤醒模型的语音数据可以与之前进行预处理的语音数据不同,例如:图3中的有回声通路的唤醒通路中进行的预处理包括:回声消除、神经网络降噪模型、语音活动监测、对数谱幅度估计和传统降噪,而输入语音唤醒模型的语音数据(有回声通路的识别通路中进行的预处理)包括:回声消除、语音活动监测、对数谱幅度估计和传统降噪。
73.又例如:图3中的无回声通路的唤醒通路中进行的预处理包括:神经网络降噪模型、语音活动监测、对数谱幅度估计和传统降噪,而输入语音唤醒模型的语音数据(无回声通路的识别通路中进行的预处理)包括:语音活动监测、对数谱幅度估计和传统降噪。
74.本实施例中的唤醒模型可以通过下述步骤进行语音唤醒:将预处理后的语音数据输入语音唤醒模型;通过语音唤醒模型从预处理后的语音数据中提取第一语音特征;将第一语音特征与语音唤醒模型预先保存的第二语音特征进行比对,得到唤醒结果。唤醒模型可以使用轻量级识别引擎julius建立声学模型和语言模型,对特定唤醒词(即第二语音特征)进行建模和识别。
75.步骤s212,如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,以使设置在云端的语音内容识别模型识别语音数据的语音内容。
76.本实施例的语音内容识别模型可以设置在云端;唤醒模型可以设置在语音设备,即离线设置。因此,本实施例中的语音唤醒和语音识别并不同时处理,无需建立同一套语音信号处理机制,也无需使用同一套声学模型和语言模型。因此,本实施例不需要较大的语料库和复杂的模型结构,训练时间较短,训练难度较低。
77.本实施例的语音设备可以进行预处理,使用预处理后的语音数据进行语音唤醒和识别,可以使用预处理后的语音数据进行语音唤醒模型和语音识别模型的训练,语音唤醒模型和语音识别模型更加容易收敛,训练的效果较好。
78.本实施例由于唤醒模型可以设置在语音设备,语音内容识别模型可以设置在云端;联网只需要进行语音识别,可以离线进行语音唤醒,因此,延迟较低,用户具有较好的使用体验,可以进行快速响应,语音识别模型的建立难度也较低。
79.实施例提供的上述方法,建立了离线语音唤醒通路,保证快速的唤醒速度,降低云端识别系统开发难度;添加了前端处理模块,降低云端识别系统开发难度;根据有无回声,建立了不同的前端处理模块和通路,有助于后期维护和优化。
80.该方式中,语音唤醒功能可以从云端转为离线进行,并与其他信号处理模块一起作为前端处理方法,为云端的识别系统做语音信号预处理,降低了训练声学模型和语言模型的难度,同时保证了快速的唤醒速度。
81.该方式中,通过细化语音识别系统各部分功能,设计了不同的信号处理模块和流程,从而缩短开发时间,降低建立识别模型的难度,同时保证唤醒速度,唤醒率和识别率等指标,后期维护和优化将会有的放矢,更有效率。
82.实施例三:
83.对应于上述方法实施例,本发明实施例提供了一种语音数据处理装置,应用于语音设备,语音设备包括预先训练完成的语音唤醒模型;参见图4所示的一种语音数据处理装置的结构示意图,该语音数据处理装置包括:
84.语音数据采集模块41,用于采集语音数据;
85.语音数据预处理模块42,用于对语音数据进行预处理;预处理包括降噪和/或消除回声;
86.唤醒结果输出模块43,用于将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果;
87.语音数据发送模块44,用于如果唤醒结果表征语音唤醒成功,将预处理后的语音数据发送至云端,以使设置在云端的语音内容识别模型识别语音数据的语音内容。
88.本发明实施例提供的一种语音数据处理装置,可以在语音设备中对语音数据进行预处理,将预处理后的语音数据输入语音唤醒模型中,得到唤醒结果,如果唤醒结果表征语
音唤醒成功,将预处理后的语音数据发送至云端,由云端的语音内容识别模型识别语音数据的语音内容。该方式中,预处理和语音唤醒的流程可以在语音设备中离线处理,语音内容识别可以在云端进行处理,可以减少神经网络模型的训练时间和训练难度,提升训练效果,加快响应速度,降低云端识别系统开发难度,有助于后期维护和优化。
89.上述语音数据包括来自语音设备的回声数据和来自语音设备所处环境的环境数据;语音设备包括通道控制器和与通道控制器连接的麦克风;麦克风包括用于采集环境数据的第一通道和第二通道,以及用于采集回声数据的第三通道;上述语音数据采集模块,用于通过通道控制器确定当前语音采集选用的目标通道;如果目标通道为第一通道和第二通道,通过第一通道和第二通道采集环境数据;如果目标通道为第三通道,通过第三通道采集回声数据。
90.上述语音数据采集模块,用于通过第一通道采集第一环境数据;通过第二通道采集第二环境数据;计算第一环境数据和第二环境数据的均值,将均值作为环境数据。
91.上述语音数据预处理模块,用于判断语音数据中是否包含回声数据;如果是,消除语音数据中的回声数据,并且降低语音数据中的噪声;如果否,降低语音数据中的噪声。
92.上述语音数据预处理模块,用于将语音数据输入预先训练完成的神经网络降噪模型,输出降噪后的声音数据;对语音数据进行非线性化处理,对非线性化处理后的语音数据进行降噪;基于预设的谱减降噪算法对语音数据进行降噪。
93.上述语音数据预处理模块,用于确定语音数据的声音起始点和声音结束点;对声音起始点和声音结束点之间的语音数据进行预处理。
94.上述唤醒结果输出模块,用于将预处理后的语音数据输入语音唤醒模型;通过语音唤醒模型从预处理后的语音数据中提取第一语音特征;将第一语音特征与语音唤醒模型预先保存的第二语音特征进行比对,得到唤醒结果。
95.上述语音唤醒模型包括声学模型和语言模型,语音唤醒模型对第二语音特征进行建模和识别。
96.本发明实施例所提供的语音数据处理装置,其实现原理及产生的技术效果和前述语音数据处理方法实施例相同,为简要描述,语音数据处理装置实施例部分未提及之处,可参考前述语音数据处理方法实施例中相应内容。
97.本发明实施例还提供了一种电子设备,用于运行上述语音数据处理方法;参见图5所示的一种电子设备的结构示意图,该电子设备包括存储器100和处理器101,其中,存储器100用于存储一条或多条计算机指令,一条或多条计算机指令被处理器101执行,以实现上述语音数据处理方法。
98.进一步地,图5所示的电子设备还包括总线102和通信接口103,处理器101、通信接口103和存储器100通过总线102连接。
99.其中,存储器100可能包含高速随机存取存储器(ram,random access memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口103(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线102可以是isa总线、pci总线或eisa总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
100.处理器101可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processor,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现场可编程门阵列(field-programmable gate array,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器100,处理器101读取存储器100中的信息,结合其硬件完成前述实施例的方法的步骤。
101.本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述语音数据处理方法,具体实现可参见方法实施例,在此不再赘述。
102.本发明实施例所提供的语音数据处理方法、装置和电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
103.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和/或装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
104.另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
105.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
106.在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
107.最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使
相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1