一种语音处理方法及装置与流程

文档序号:17493667发布日期:2019-04-23 20:58阅读:165来源:国知局
一种语音处理方法及装置与流程

本发明涉及通信技术领域,尤其涉及一种语音处理方法及装置。



背景技术:

现阶段,随着科技的快速发展,各种智能语音设备为人们的生活带来了极大的便捷,比如语音音响、语音电视和语音空调等。这些设备通常可以采集用户的语音指令,并根据采集到的语音内容确定用户所需要的服务,如收听广播、打开空调或播放视频等。因此,准确采集用户的语音,能够帮助语音设备准确识别用户的指令,从而可以使得语音设备更加智能。

然而,智能语音设备在获取用户语音指令的过程中,可能会受到环境因素的影响,比如环境中的噪声、机器的震动或者风声等,均有可能会对用户发出的语音造成一定的影响。其中,风(比如自然风、电风扇或者空调的出风)对用户语音的影响主要体现在两个方面,一是风会阻碍用户语音的传播过程,尤其是在逆风的情况下,用户语音在传播的过程中受到风的阻力影响,导致用户语音内容损失较大,使得语音设备接收到的用户语音比较衰弱,影响到语音内容的识别;二是语音设备采集到的用户语音中可能掺杂有风中的噪音,导致语音设备识别出的指令不太准确,或者无法有效识别出用户的语音指令。

综上,如何提高语音识别的准确性是现阶段语音设备发展的过程中面临的重要问题。



技术实现要素:

本发明实施例提供一种语音处理方法及装置,用以提高语音识别的准确性。

本发明实施例提供的一种语音处理方法,包括:

获取到预设空间内设置的至少一个语音采集设备采集到的用户的语音信息后,确定所述用户的位置;

获取到所述预设空间内设置的至少一个风力传感器采集到的风力信息和风向信息后,确定所述预设空间内的风力和风向;

若所述风力大于第一阈值,则根据所述风力和所述风向确定风源位置,并根据所述至少一个语音采集设备的位置,从所述至少一个语音采集设备中选择出与所述风源位置之间的距离小于第二阈值的第一语音采集设备,获取所述第一语音采集设备采集的风声信息;

根据所述至少一个语音采集设备的位置、所述风向和所述用户的位置,从所述至少一个语音采集设备中选择出第二语音采集设备;

根据所述第一语音采集设备采集的风声信息,对所述第二语音采集设备采集的语音信息进行降噪处理,得到待解析的语音信息。

可选地,所述确定所述用户的位置,包括:

根据所述至少一个语音采集设备采集到所述语音信息的时间、所述语音信息的声音强度,确定所述用户的位置。

可选地,所述方法还包括:

若所述风力小于或等于所述第一阈值,则根据所述至少一个语音采集设备的位置,从所述至少一个语音采集设备中选择出与所述用户的位置之间的距离小于第三阈值的第三语音采集设备,并根据所述第三语音采集设备采集的语音信息得到待解析的语音信息。

可选地,所述至少一个所述语音采集设备包括第一类型语音采集设备和第二类型语音采集设备,所述第一类型语音采集设备的采集方向和所述风向一致,所述第二类型语音采集设备的采集方向和所述风向不一致;

根据所述至少一个语音采集设备的位置、所述风向和所述用户的位置,从所述至少一个语音采集设备中选择出第二语音采集设备,包括:

根据所述至少一个语音采集设备的位置和所述用户的位置,从所述第一类型语音采集设备中选择出与所述用户的位置之间的距离小于第四阈值的所述第二语音采集设备。

可选地,所述第一语音采集设备和所述第二语音采集设备为不同的语音采集设备。

本发明实施例提供一种语音处理装置,该装置包括:

确定模块,用于获取到预设空间内设置的至少一个语音采集设备采集到的用户的语音信息后,确定所述用户的位置;以及,获取到所述预设空间内设置的至少一个风力传感器采集到的风力信息和风向信息后,确定所述预设空间内的风力和风向;

选择模块,用于若所述风力大于第一阈值,则根据所述风力和所述风向确定风源位置,并根据所述至少一个语音采集设备的位置,从所述至少一个语音采集设备中选择出与所述风源位置之间的距离小于第二阈值的第一语音采集设备,获取所述第一语音采集设备采集的风声信息;以及根据所述至少一个语音采集设备的位置、所述风向和所述用户的位置,从所述至少一个语音采集设备中选择出第二语音采集设备;

处理模块,用于根据所述第一语音采集设备采集的风声信息,对所述第二语音采集设备采集的语音信息进行降噪处理,得到待解析的语音信息。

可选地,所述确定模块具体用于:

根据所述至少一个语音采集设备采集到所述语音信息的时间、所述语音信息的声音强度,确定所述用户的位置。

可选地,所述选择模块还用于:

若所述风力小于或等于所述第一阈值,则根据所述至少一个语音采集设备的位置,从所述至少一个语音采集设备中选择出与所述用户的位置之间的距离小于第三阈值的第三语音采集设备,并根据所述第三语音采集设备采集的语音信息得到待解析的语音信息。

可选地,所述至少一个所述语音采集设备包括第一类型语音采集设备和第二类型语音采集设备,所述第一类型语音采集设备的采集方向和所述风向一致,所述第二类型语音采集设备的采集方向和所述风向不一致;

所述选择模块具体用于:

根据所述至少一个语音采集设备的位置和所述用户的位置,从所述第一类型语音采集设备中选择出与所述用户的位置之间的距离小于第四阈值的所述第二语音采集设备。

可选地,所述第一语音采集设备和所述第二语音采集设备为不同的语音采集设备。

本发明的上述实施例中,通过获取预设空间内设置的至少一个语音采集设备采集到的用户的语音信息,可以确定用户的位置;通过获取到所述预设空间内设置的至少一个风力传感器采集到的风力信息,可以确定预设空间内的风力和风向;具体地,在确定风力大于第一阈值后,可以根据风力和风向确定风源位置,并可以从至少一个语音采集设备中选择出与风源位置之间的距离小于第二阈值的第一语音采集设备;并根据至少一个语音采集设备的位置、风向和用户的位置,可以从至少一个语音采集设备中选择出第二语音采集设备;进一步地,可以根据第一语音采集设备采集的风声信息,对第二语音采集设备采集的语音信息进行降噪处理,从而得到待解析的语音信息。本发明实施例中,通过确定用户的位置和风源位置,并使用第一语音采集装置和第二语音采集装置分别采集用户的语音信息和风声信息,能够使用风声信息对用户的语音进行降噪处理,从而可以提高语音识别的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种系统架构示意图;

图2为本发明实施例中提供的一种可能的应用场景示意图;

图3为本发明实施例中提供的一种语音处理方法对应的流程示意图;

图4为本发明实施例提供的一种语音处理装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

图1为本发明实施例提供的一种系统架构示意图,如图1中所示,该系统架构包括:服务器101、一个或多个语音采集设备(比如图1所示意出的语音采集设备1021和语音采集设备1022)、一个或多个风力传感器(比如图1所示意出的风力传感器1023和风力传感器1024)。

本发明实施例中,服务器可以分别与多个语音采集设备和多个风力传感器进行通信,如此,服务器可以获取多个语音采集设备中的任一个语音采集设备采集的语音信息或者风声信息,并可以获取多个风力传感器中的任一个风力传感器采集的风力信息。

图2为本发明实施例提供的一种可能的应用场景示意图,其中,图2所示意出的区域可以是指一个房间中的区域。在一个示例中,该房间中可以设置有语音采集设备a、语音采集设备b、语音采集设备c和语音采集设备d,并可以设置有风力传感器a、风力传感器b、风力传感器c和风力传感器d。其中,语音采集设备a、语音采集设备b、语音采集设备c和语音采集设备d可以分别设置于房间中的四个不同的位置,比如,可以分别设置于房间天花板(或地板)的四个角落,或者也可以设置于房间中的多个家具上。风力传感器a、风力传感器b、风力传感器c和风力传感器d可以分别设置于房间中的四个不同的位置。在一个示例中,可以在四个语音采集设备中的每一个语音采集设备上设置对应的风力传感器,比如风力传感器a设置于语音采集设备a上,风力传感器b设置于语音采集设备b上,风力传感器c设置于语音采集设备c上,风力传感器d设置于语音采集设备d上。

需要说明的是,语音采集设备的数量和风力传感器的数量可以相同,或者也可以不同,图2中仅是简单示意出语音采集设备的数量和风力传感器的数量相同时的一种可能的设置方式,具体实施中,语音采集设备和风力传感器的位置可以由本领域技术人员根据实际需要进行设置,本发明实施例对此不作具体限定。

图3为本发明实施例提供的一种语音处理方法对应的流程示意图,该方法包括:

步骤301,获取到预设空间内设置的至少一个语音采集设备采集到的用户的语音信息后,确定用户的位置。

此处,预设空间可以为一个房间,或者也可以为包括多个房间的区域,比如,可以为包括厨房、客厅以及卧室的公寓,或者可以为包括多条走廊以及楼道的区域。

本发明实施例中,预设空间内可以设置有多个语音采集设备,语音采集设备具体可以为麦克风或者其它能够实现语音采集功能的设备,具体不做限定。其中,多个语音采集设备中的每一个语音采集设备均可以采集到一定范围内的声音信息,该声音信息可以包括用户发出的语音信息,还可以包括预设空间中的噪声信息,比如设备运转的声音、空气中的风声等。本发明实施例中,可以通过设置多个语音采集设备的位置,使得用户在预设空间中的任意位置发出语音信息时,均可以存在至少一个语音采集设备能够采集到用户发出的语音信息。

进一步地,服务器若获取到预设空间内设置的至少一个语音采集设备采集到的用户的语音信息,则可以根据至少一个语音采集设备采集到语音信息的时间和语音信息的声音强度,确定用户的位置。通常情况下,用户与某一个语音采集设备的距离越近,则该语音采集设备采集到用户的语音信息的时间越靠前(即越早接收到用户的语音信息),且采集到的用户的语音信息的声音越强,因此,可以通过解析多个语音采集设备采集到用户的语音信息的时间和多个语音采集设备采集到的用户的语音信息的强弱,确定用户与每一个语音采集设备之间的距离范围,从而可以通过几何方法确定用户的位置。

步骤302,获取到预设空间内设置的至少一个风力传感器采集到的风力信息后,确定预设空间内的风力和风向。

此处,预设空间内可以设置有多个风力传感器。其中,多个风力传感器的位置与多个语音采集设备的位置可以相同,也可以不同。具体实施中,可以将多个风力传感器设置于预设空间中的多个不同位置,且多个风力传感器中的每一个风力传感器均可以采集对应的风力信息,该风力信息可以包括该风力传感器采集到的该风力传感器所在的位置的风力和风向。进一步地,通过综合分析至少一个风力传感器采集到的风力信息,可以确定出预设空间中的风力和风向。

本发明实施例中,通过在预设空间中设置风力传感器,可以通过风力传感器采集到预设空间中的风力和风向,并能够考虑该风力是否会对用户的语音信息造成影响,从而可以使得获取到的用户的语音信息较为准确。

步骤303,若风力大于第一阈值,则根据风力和风向确定风源位置,并根据至少一个语音采集设备的位置,从至少一个语音采集设备中选择出与风源位置之间的距离小于第二阈值的第一语音采集设备,获取第一语音采集设备采集的风声信息。其中,第一阈值可以由本领域技术人员根据实验进行确定。

本发明实施例中,若确定预设空间中的风力大于第一阈值,则可以认为预设空间中的风声会对用户的语音信息造成干扰,具体地说,风声可能会对用户的语音信息的传播距离和用户的语音信息的强度产生影响。此时,可以根据预设空间中的风力和风向,确定风源位置。此处,风源可以为能够产生风的智能语音空调、电风扇等,相应地,风声可以为智能语音空调发出的风声、电风扇产生的风声,风源的位置可以在预设空间内,或者也可以在预设空间外的某一个位置,本发明实施例对此不作限定。

进一步地,可以预先存储预设空间中的至少一个语音采集设备的位置,并可以根据存储的至少一个语音采集设备的位置,从至少一个语音采集设备中选择出与风源位置之间的距离小于第二阈值的第一语音采集设备。此处,第二阈值可以由本领域技术人员根据实际情况进行设置。在一种可能的实现方式中,若存在多个语音采集设备与风源位置之间的距离小于第二阈值,则可以选择多个语音采集设备中与风源位置之间的距离最近的语音采集设备为第一语音采集设备。举个例子,第二阈值可以设置为1m,若预设空间中语音采集设备a与风源的位置为1m,语音采集设备b与风源的位置为0.5m,则可以选择语音采集设备b作为第一语音采集设备。

本发明实施例中,若确定预设空间中的风力小于或等于第一阈值,则可以认为预设空间中的风声不会对用户的语音信息造成干扰。此时,可以根据至少一个语音采集设备的位置,从至少一个语音采集设备中选择出与用户的位置之间的距离小于第三阈值的第三语音采集设备,并根据第三语音采集设备采集的语音信息得到待解析的语音信息(可以是指直接将第三语音采集设备采集到的语音信息作为待解析的语音信息)。此处,第三阈值可以由本领域技术人员根据实际需要进行设置。

具体实施中,若存在多个语音采集设备与用户的位置之间的距离小于第三阈值,则可以选择多个语音采集设备中与用户的位置之间的距离最近的语音采集设备为第三语音采集设备,并根据第三语音采集设备采集的语音信息得到待解析的语音信息。

本发明实施例中,通过确定风源位置,可以选择与风源位置之间的距离较近的语音采集设备作为第一语音采集设备,从而能够使得通过第一语音采集设备采集得到的风声信息最为准确。

步骤304,根据至少一个语音采集设备的位置、风向和用户的位置,从至少一个语音采集设备中选择出第二语音采集设备。

本发明实施例中,在确定风向之后,可以将至少一个语音采集设备划分为第一类型语音采集设备和第二类型语音采集设备。其中,第一类型语音采集设备的采集方向可以和风向一致,第二类型语音采集设备的采集方向可以和风向不一致。

具体实施中,可以根据至少一个语音采集设备的位置和用户的位置,从第一类型语音采集设备中选择出与用户的位置之间的距离小于第四阈值的第二语音采集设备。此处,第四阈值可以由本领域技术人员根据实际情况进行设置,在一种可能的实现方式中,第四阈值可以与第二阈值或第三阈值相同,或者也可以不同,本发明实施例不作具体限定。

进一步地,若存在多个与用户的位置之间的距离小于第四阈值的第一类型语音采集设备,则可以选择多个第一类型语音采集设备中与用户的位置之间的距离最近的语音采集设备为第二语音采集设备。

需要说明的是,若与用户的位置之间的距离小于第四阈值的第一类型语音采集设备与第一语音采集设备为同一个语音采集设备,则可以从不包括第一语音采集设备的第一类型语音采集设备中选择第二语音采集设备。也就是说,第一语音采集设备和第二语音采集设备可以为不同的语音采集设备。举个例子,若第一语音采集设备为语音采集设备b,预设空间中存在两个第一类型语音采集设备与用户的位置之间的距离小于第四阈值,分别语音采集设备a和语音采集设备b,则第二语音采集设备可以为语音采集设备a。

本发明实施例中,通过从与预设空间中的风向一致的第一类型语音采集设备中选择第二语音采集设备,可以限定采集用户的语音信息的第二语音采集设备位于顺风方向;同时,通过设置第一语音采集设备和第二语音采集设备为不同的语音采集设备,可以避免采用距离风源较近的语音采集设备采集用户的语音信息;如此,可以使得采集到的用户的语音信息中包含的风声较弱,从而可以较为准确的得到待解析的语音信息。

步骤305,根据第一语音采集设备采集的风声信息,对第二语音采集设备采集的语音信息进行降噪处理,得到待解析的语音信息。

具体实施中,可以将第一语音采集设备采集到的风声信息作为噪声,通过生成该噪声对应的反向音频,可以使用该噪声对应的反向音频对第二语音采集设备采集到的语音信息中的风声进行过滤,从而可以得到较为准确的语音信息,并可以将过滤得到的语音信息作为待解析的语音信息。

本发明的上述实施例中,通过获取预设空间内设置的至少一个语音采集设备采集到的用户的语音信息,可以确定用户的位置;通过获取到所述预设空间内设置的至少一个风力传感器采集到的风力信息,可以确定预设空间内的风力和风向;具体地,在确定风力大于第一阈值后,可以根据风力和风向确定风源位置,并可以从至少一个语音采集设备中选择出与风源位置之间的距离小于第二阈值的第一语音采集设备;并根据至少一个语音采集设备的位置、风向和用户的位置,可以从至少一个语音采集设备中选择出第二语音采集设备;进一步地,可以根据第一语音采集设备采集的风声信息,对第二语音采集设备采集的语音信息进行降噪处理,从而得到待解析的语音信息。本发明实施例中,通过确定用户的位置和风源位置,并使用第一语音采集装置和第二语音采集装置分别采集用户的语音信息和风声信息,能够使用风声信息对用户的语音进行降噪处理,从而可以提高语音识别的准确性。

针对上述方法流程,本发明实施例还提供一种语音处理装置,该装置的具体内容可以参照上述方法实施。

图4为本发明实施例提供的一种语音处理装置的结构示意图,该装置包括:

本发明实施例提供一种语音处理装置,该装置包括:

确定模块401,用于获取到预设空间内设置的至少一个语音采集设备采集到的用户的语音信息后,确定所述用户的位置;以及,获取到所述预设空间内设置的至少一个风力传感器采集到的风力信息和风向信息后,确定所述预设空间内的风力和风向;

选择模块402,用于若所述风力大于第一阈值,则根据所述风力和所述风向确定风源位置,并根据所述至少一个语音采集设备的位置,从所述至少一个语音采集设备中选择出与所述风源位置之间的距离小于第二阈值的第一语音采集设备,获取所述第一语音采集设备采集的风声信息;以及根据所述至少一个语音采集设备的位置、所述风向和所述用户的位置,从所述至少一个语音采集设备中选择出第二语音采集设备;

处理模块403,用于根据所述第一语音采集设备采集的风声信息,对所述第二语音采集设备采集的语音信息进行降噪处理,得到待解析的语音信息。

可选地,所述确定模块401具体用于:

根据所述至少一个语音采集设备采集到所述语音信息的时间、所述语音信息的声音强度,确定所述用户的位置。

可选地,所述选择模块402还用于:

若所述风力小于或等于所述第一阈值,则根据所述至少一个语音采集设备的位置,从所述至少一个语音采集设备中选择出与所述用户的位置之间的距离小于第三阈值的第三语音采集设备,并根据所述第三语音采集设备采集的语音信息得到待解析的语音信息。

可选地,所述至少一个所述语音采集设备包括第一类型语音采集设备和第二类型语音采集设备,所述第一类型语音采集设备的采集方向和所述风向一致,所述第二类型语音采集设备的采集方向和所述风向不一致;

所述选择模块403具体用于:

根据所述至少一个语音采集设备的位置和所述用户的位置,从所述第一类型语音采集设备中选择出与所述用户的位置之间的距离小于第四阈值的所述第二语音采集设备。

可选地,所述第一语音采集设备和所述第二语音采集设备为不同的语音采集设备。

从上述内容可以看出:本发明的上述实施例中,通过获取预设空间内设置的至少一个语音采集设备采集到的用户的语音信息,可以确定用户的位置;通过获取到所述预设空间内设置的至少一个风力传感器采集到的风力信息,可以确定预设空间内的风力和风向;具体地,在确定风力大于第一阈值后,可以根据风力和风向确定风源位置,并可以从至少一个语音采集设备中选择出与风源位置之间的距离小于第二阈值的第一语音采集设备;并根据至少一个语音采集设备的位置、风向和用户的位置,可以从至少一个语音采集设备中选择出第二语音采集设备;进一步地,可以根据第一语音采集设备采集的风声信息,对第二语音采集设备采集的语音信息进行降噪处理,从而得到待解析的语音信息。本发明实施例中,通过确定用户的位置和风源位置,并使用第一语音采集装置和第二语音采集装置分别采集用户的语音信息和风声信息,能够使用风声信息对用户的语音进行降噪处理,从而可以提高语音识别的准确性。

本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1