一种语音数据处理方法和系统与流程

文档序号：13139326阅读：234来源：国知局

本发明涉及数据处理技术领域，更具体的说是涉及一种语音数据处理方法和系统。

背景技术：

目前，大多数电子设备，如手机、智能音响、智能电视等都支持语音助手，语音助手具有通过语音交互方式实现语音控制、信息查询等功能。

在电子设备的语音助手处于唤醒状态下，能够进行语音交互。

作为一种应用场景，当用户想要与一个电子设备进行语音交互时，若用户身边的多个电子设备上的语音助手均处于唤醒状态时，那么该多个电子设备均会对用户的语音信息作出响应，显然与用户的本意相违背。当发生这种情况时，用户需要控制其他电子设备的语音助手退出唤醒状态，操作繁琐，降低用户体验。

技术实现要素：

有鉴于此，本发明提供一种语音数据处理方法和系统，以简化用户操作，提高用户体验。

为实现上述目的，本发明提供如下技术方案：

一种语音数据处理方法，包括：

获取属于同一组群的多个电子设备的语音助手同时发送的语音数据；

从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备；

控制所述目标电子设备的语音助手响应所述语音数据。

优选的，还包括：

判断所述多个电子设备是否位于同一网络；

相应的，所述从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，包括：

从属于同一网络的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备。

优选的，还包括：

判断所述多个电子设备的语音助手同时发送的所述语音数据是否属于同一声纹；

相应的，所述从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，包括：

从语音数据属于同一声纹的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备。

优选的，还包括：

若否，控制所述多个电子设备的语音助手分别响应所述语音数据。

优选的，从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，包括：

接收所述多个电子设备分别发送的距离参数；其中，所述距离参数为电子设备基于语音数据的属性信息确定的其与语音数据的发送者之间的距离；

确定距离参数最小的电子设备为目标电子设备。

优选的，从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，包括：

获取所述语音数据的属性信息；

确定所述属性信息满足预设条件的电子设备为目标电子设备。

一种语音数据处理系统，包括：

多个电子设备，分别运行有语音助手，用于通过所述语音助手采集语音数据；

服务器，用于获取属于同一组群的多个电子设备的语音助手同时发送的语音数据，从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，控制所述目标电子设备的语音助手响应所述语音数据。

优选的，所述服务器还用于判断所述多个电子设备是否位于同一网络，并具体用于从属于同一网络的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备。

优选的，所述服务器还用于判断所述多个电子设备的语音助手同时发送的所述语音数据是否属于同一声纹，并具体用于从语音数据属于同一声纹的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备。

优选的，所述电子设备用于基于所述语音数据的属性信息确定其与所述语音数据的发送者之间的距离参数；

所述服务器具体用于接收所述多个电子设备分别发送的距离参数，确定距离参数最小的电子设备为目标电子设备。

优选的，所述服务器具体用于获取所述语音数据的属性信息，确定所述属性信息满足预设条件的电子设备为目标电子设备。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种语音数据处理方法，包括：接收属于同一组群的多个电子设备的语音助手同时发送的语音数据，从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，控制目标电子设备的语音助手响应所述语音数据；由此可见，本发明中，当多个电子设备的语音助手均接收到用户发送的语音数据时，只有与用户相距最近的目标电子设备的语音助手才会响应该语音数据，从而无需用户手动操作，提高了用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明一个实施例公开的一种语音数据处理方法的流程示意图；

图2为本发明一个实施例公开的一种语音数据处理方法的应用场景的结构示意图；

图3为本发明另一实施例公开的一种语音数据处理方法的流程示意图；

图4为本发明又一实施例公开的一种语音数据处理方法的流程示意图；

图5为本发明一个实施例公开的一种语音数据系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明一个实施例公开了一种语音数据处理方法，如图1所示，该方法包括以下步骤：

步骤101：获取属于同一组群的多个电子设备的语音助手同时发送的语音数据；

本申请中的一种数据处理方法可以应用于服务器中，服务器用于接收电子设备的语音助手发送的语音数据，当接收到多个电子设备的语音助手发送的语音数据时，确定出属于同一组群的多个电子设备的语音助手同时发送的语音数据。

可以理解的，“同时”的含义为同一时刻，但是由于存在网络延迟等因素，本发明中的“同时”可以指代为时间差在预设时间内，而预设时间特别短，如0.5秒、1秒等等。例如，两个电子设备语音助手发送的语音数据的时间差相距1秒可以认定为该两个电子设备同时发送了语音数据。

可选的，对于接收的多个电子设备的语音助手同时发送的语音数据，需确定出属于同一组群的多个电子设备的语音助手同时发送的语音数据，其中，可以通过电子设备的身份标识来确定其所属组群，具有相同身份标识的电子设备属于同一组群。该身份标识可以为用户设定的用于表征多个电子设备均属于同一持有人的标识，具体实现形式本发明不做限定。

需说明的是，电子设备的身份标识可以指代为电子设备本身的身份标识，也可以指代为电子设备的语音助手的身份标识。

其中，电子设备的语音助手在向服务器发送语音数据时可以携带身份标识，当然也可以预先将每一电子设备的身份标识存储在服务器中，使得服务器预先进行组群的划分。

步骤102：从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备；

在实际应用中，当用户想要与电子设备进行语音交互时，一般会靠近该电子设备，也就是说，若用户身边有多个电子设备，那么，该用户离其想要进行语音交互的电子设备的距离最近。因此，本申请中，可以由服务器从多个电子设备中确定出与语音数据的发送者相距最近的目标电子设备。

其中，从多个电子设备中确定出至少一个电子设备为与语音数据的发送者相距最近的目标电子设备。

可选的，在一个实施例中，从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，包括以下过程：

(1)接收多个电子设备分别发送的距离参数；

其中，距离参数为电子设备基于语音数据的属性信息确定的其与语音数据的发送者之间的距离。

电子设备基于语音助手采集的语音数据的属性信息计算其与语音数据的发送者之间的距离参数，并将其发送给服务器。需说明的是，电子设备可以将该距离参数可以携带在语音数据中直接发送给服务器，或者，单独将距离参数发送给服务器。

语音数据的属性信息包括以下参数中的一个或多个：信噪比参数、能量强度。电子设备预先存储有不同的属性信息与距离参数的对应关系，从预先存储的对应关系中查找与语音数据的属性信息对应的距离参数，并将其发送给服务器。

(2)确定距离参数最小的电子设备为目标电子设备。

服务器接收到电子设备发送的距离参数后，从属于同一组群的多个电子设备中确定出距离参数最小的电子设备为目标电子设备。

可选的，在另一个实施例中，从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，包括以下过程：

(1)获取所述语音数据的属性信息；

当接收到电子设备的语音助手发送的语音数据后，确定该语音数据的属性信息，语音数据的属性信息包括以下参数中的一个或多个：信噪比参数、能量强度。

(2)确定所述属性信息满足预设条件的电子设备为目标电子设备。

一种实现方式中，可以将同一组群的多个电子设备的语音助手发送的语音数据的属性信息进行对比，确定出属性信息满足预设条件的电子设备为目标电子设备，其中，该预设条件为用于确定电子设备与语音数据的发送者之间的距离最近的条件。在一个实施例中，当属性信息为信噪比参数时，预设条件为多个语音数据中，信噪比最佳的条件；当属性信息为能量强度时，预设条件为多个语音数据中，能量强度最强的条件。以属性信息为信噪比参数为例，需从同一组群的多个电子设备的语音助手发送的语音数据的属性信息中确定出信噪比最佳的电子设备为目标电子设备。

另一种实现方式中，可以将同一组群的多个电子设备的语音助手发送的语音数据的属性信息均与一预设的属性信息进行比较，确定满足预设的属性信息的电子设备为目标电子设备。

步骤103：控制目标电子设备的语音助手响应语音数据。

该目标电子设备为与语音数据的发送者相距最近的电子设备，即为用户想要与其进行语音交互的电子设备，因此控制目标电子设备语音助手响应该语音数据。

本发明实施例提供了一种数据处理方法，包括：接收属于同一组群的多个电子设备的语音助手同时发送的语音数据，从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，控制目标电子设备的语音助手响应所述语音数据；由此可见，本发明中，当多个电子设备的语音助手均接收到用户发送的语音数据时，只有与用户相距最近的目标电子设备的语音助手才会响应该语音数据，从而无需用户手动操作，提高了用户体验。

在一个应用场景下，如图2所示，服务器100分别接收电子设备201的语音助手、电子设备202的语音助手以及电子设备203的语音助手同时发送的语音数据，确定出电子设备201和电子设备202属于同一组群，从而从电子设备201和电子设备202中确定出电子设备201与语音数据发送者的距离最近，那么，则控制电子设备201的语音助手响应其语音助手发送的语音数据，而禁止电子设备202响应其语音助手发送的语音数据。由于电子设备203与电子设备201和电子设备202属于不同的组群，那么也控制电子设备203响应其语音助手发送的语音数据。

也就是说，在上述场景下，用户身边具有电子设备201和电子设备202，而用户想要与电子设备201进行语音交互，由于电子设备201的语音助手和电子设备202的语音助手均处于唤醒状态，因此，电子设备201的语音助手和电子设备202的语音助手均能够接收到该语音数据，并将其发送给服务器。

本发明另一实施例公开了一种语音数据处理方法，如图3所示，该方法包括以下步骤：

步骤301：获取属于同一组群的多个电子设备的语音助手同时发送的语音数据；

步骤302：判断所述多个电子设备是否位于同一网络，若是，进入步骤303；如否，进入步骤305；

具体的，该多个电子设备指代为属于同一组群的且其语音助手同时向服务器发送语音数据的电子设备，通过判断该多个电子设备是否位于同一网络来确定该多个电子设备是否位于同一位置，如果位于同一网络中，确定该多个电子设备位于同一位置，如果位于不同网络中，确定该多个电子设备位于不同的位置。

可选的，可以基于电子设备的网络地址或网络标识来确定该多个电子设备是否位于同一网络，具有相同网络地址或相同网络标识的电子设备位于同一网络，具有不同网络地址或不同网络标识的电子设备位于不同网络。

步骤303：从属于同一网络的多个电子设备中确定出与语音数据的发送者相距最近的目标电子设备；

属于同一网络的多个电子设备位于相同位置，其语音助手所采集的语音数据由同一发送者发送，因此，从属于同一网络的多个电子设备中确定出与语音数据的发送者相距最近的目标电子设备。

步骤304：控制目标电子设备的语音助手响应所述语音数据；

步骤305：控制属于不同网络的多个电子设备的语音助手分别响应所述语音数据。

由于属于不同网络的电子设备位于不同位置，因此，即便该多个电子设备的语音助手是同时向服务器发送语音数据，属于同一组群，每一电子设备的语音助手所接收的语音数据也不是同一发送者发送的。

作为一个应用场景，电子设备a和电子设备b属于同一组群，电子设备a位于用户1的家中，电子设备b位于用户1的公司，存在这样一个时刻，用户1的家人2使用电子设备a进行语音交互的同时，用户1使用电子设备b也在进行语音交互。因此，这种情况下，即便电子设备a和电子设备b属于同一组群，同时通过语音助手向服务器发送了语音数据，由于两个电子设备属于不同的网络，因此，服务器控制电子设备a的语音助手和电子设备b的语音助手分别响应其所接收的语音数据。

本发明实施例提供了一种数据处理方法，包括：接收属于同一组群的多个电子设备的语音助手同时发送的语音数据，判断所述多个电子设备是否位于同一网络，从属于同一网络的多个电子设备中确定出与语音数据的发送者相距最近的目标电子设备，控制目标电子设备的语音助手响应所述语音数据；由此可见，本实施例中，当多个电子设备的语音助手均接收到用户发送的语音数据时，可以从属于同一网络的电子设备中确定出与用户相距最近的目标电子设备，并控制其语音助手响应该语音数据，无需用户手动操作，提高了用户体验，且提高了数据处理的准确性。

本发明又一实施例公开了一种语音数据处理方法，如图4所示，该方法包括以下步骤：

步骤401：获取属于同一组群的多个电子设备的语音助手同时发送的语音数据；

步骤402：判断所述多个电子设备的语音助手同时发送的所述语音数据是否属于同一声纹，若是，进入步骤403；若否，进入步骤405；

具体的，该多个电子设备指代为属于同一组群的且其语音助手同时向服务器发送语音数据的电子设备，通过判断该多个电子设备是否属于同一声纹来确定该多个电子设备的语音助手所采集的语音数据是否为同一发送者发送的，如果属于同一声纹中，确定该多个电子设备的语音助手所采集的语音数据为同一发送者发送，如果属于不同的声纹，则确定该多个电子设备的语音助手所采集的语音数据为不同的发送者发送。

步骤403：从语音数据属于同一声纹的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备；

步骤404：控制目标电子设备的语音助手响应所述语音数据；

步骤405：控制语音数据属于不同声纹的多个电子和设备的语音助手分别响应所述语音数据。

由于语音数据属于不同声纹，因此可以确定不同电子设备语音助手所采集的语音数据由不同发送者发送。

作为一个应用场景，电子设备a和电子设备b属于同一组群，且均位于用户1的家中，存在这样的一个时刻，用户1使用电子设备a进行语音交互的同时，用户1的家人2使用电子设备b也在进行语音交互。因此，这种情况下，即便电子设备a和电子设备b属于同一组群，同时通过语音助手向服务器发送了语音数据，由于两个电子设备的语音助手所采集的语音数据由不同的发送者发送，因此，服务器控制电子设备a的语音助手和电子设备b的语音助手分别响应其所接收的语音数据。

本发明实施例提供了一种数据处理方法，包括：接收属于同一组群的多个电子设备的语音助手同时发送的语音数据，判断所述多个电子设备的语音助手同时发送的所述语音数据是否属于同一声纹，从语音数据属于同一声纹的多个电子设备中确定出与语音数据的发送者相距最近的目标电子设备，控制目标电子设备的语音助手响应所述语音数据；由此可见，本实施例中，当多个电子设备的语音助手均接收到用户发送的语音数据时，可以从语音数据属于同一声纹的电子设备中确定出与用户相距最近的目标电子设备，并控制其语音助手响应该语音数据，无需用户手动操作，提高了用户体验，且提高了数据处理的准确性。

与上述一种语音数据处理方法对应的，本发明实施例还公开了一种语音数据处理系统，以下分别通过实施例进行说明：

本发明一个实施例公开了一种语音数据处理系统，如图5所示，该系统包括：服务器100、电子设备201、电子设备202以及电子设备203；

其中，电子设备201和电子设备202属于同一组群，电子设备203不属于电子设备201和电子设备202所属组群，可以属于另一组群，也可以不属于任何组群。

电子设备201、电子设备202以及电子设备203分别运行有语音助手，当通过语音助手采集到语音数据时，会将其发送给服务器100。

在本发明中，语音数据处理系统包括多个电子设备，本实施例仅以三个电子设备为例。

服务器100，用于获取属于同一组群的多个电子设备的语音助手同时发送的语音数据，从所述多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，控制所述目标电子设备的语音助手响应所述语音数据。在本实施例中，服务器100用于获取电子设备201和电子设备202的语音助手同时发送的语音数据，并从电子设备201和电子设备202中确定与语音数据的发送者相距最近的目标电子设备，控制所述目标电子设备的语音助手响应所述语音数据。

可以理解的是，“同时”的含义为同一时刻，但是由于存在网络延迟等因素，本发明中的“同时”可以指代为时间差在预设时间内，而预设时间特别短，如0.5秒、1秒等等。

可选的，服务器可以通过电子设备的身份标识来确定其所属组群，具有相同身份标识的电子设备属于同一组群。该身份标识可以为用户设定的用于表征多个电子设备属于同一持有人的标识，具体实现形式本发明不做限定。

需说明的是，电子设备的身份标识可以指代为电子设备本身的身份标识，也可以指代为电子设备的语音助手的身份标识。

其中，从多个电子设备中确定出至少一个电子设备为与语音数据的发送者相距最近的目标电子设备。

可选的，在一个实施例中，电子设备用于基于其语音助手所采集的语音数据的属性信息确定其与语音数据的发送者之间的距离参数；服务器用于接收所述多个电子设备分别发送的距离参数，确定距离参数最小的电子设备为目标电子设备。

需说明的是，电子设备可以将该距离参数可以携带在语音数据中直接发送给服务器，或者，单独将距离参数发送给服务器。

语音数据的属性信息包括以下参数中的一个或多个：信噪比参数、能量强度。电子设备预先存储有不同的属性信息与距离参数的对应关系，从预先存储的对应关系中查找与语音数据的属性信息对应的距离参数，并将其发送给服务器；服务器接收到电子设备发送的距离参数后，从属于同一组群的多个电子设备中确定出距离参数最小的电子设备为目标电子设备。

可选的，在另一实施例中，服务器具体用于获取语音数据的属性信息，确定属性信息满足预设条件的电子设备为目标电子设备。

语音数据的属性信息包括以下参数中的一个或多个：信噪比参数、能量强度。

服务器在确定属性信息满足预设条件的电子设备为目标电子设备时，一种实现方式中，服务器可以将同一组群的多个电子设备的语音助手发送的语音数据的属性信息进行对比，确定出属性信息满足预设条件的电子设备为目标电子设备，其中，该预设条件为用于确定电子设备与语音数据的发送者之间的距离最近的条件。在一个实施例中，当属性信息为信噪比参数时，预设条件为多个语音数据中，信噪比最佳的条件；当属性信息为能量强度时，预设条件为多个语音数据中，能量强度最强的条件。

服务器在确定属性信息满足预设条件的电子设备为目标电子设备时，另一种实现方式中，服务器可以将同一组群的多个电子设备的语音助手发送的语音数据的属性信息均与一预设的属性信息进行比较，确定满足预设的属性信息的电子设备为目标电子设备。

由此可见，本实施例中，当多个电子设备的语音助手均接收到用户发送的语音数据时，只有与用户相距最近的目标电子设备的语音助手才会响应该语音数据，从而无需用户手动操作，提高了用户体验。

本发明另一实施例公开了一种语音数据处理系统，在本实施例中，服务器还用于判断所述多个电子设备是否位于同一网络；相应的，服务器从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，具体为从属于同一网络的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备。

其中，服务器通过判断该多个电子设备是否位于同一网络来确定该多个电子设备是否位于同一位置，如果位于同一网络中，确定该多个电子设备位于同一位置，如果位于不同网络中，确定该多个电子设备位于不同的位置。

可选的，服务器可以基于电子设备的网络地址或网络标识来确定该多个电子设备是否位于同一网络，具有相同网络地址或相同网络标识的电子设备位于同一网络，具有不同网络地址或不同网络标识的电子设备位于不同网络。

在本发明另一实施例中，服务器还用于控制属于不同网络的电子设备分别响应其语音助手发送的语音数据。

由此可见，本发明中，当多个电子设备的语音助手均接收到用户发送的语音数据时，可以从属于同一网络的电子设备中确定出与用户相距最近的目标电子设备，并控制其语音助手响应该语音数据，无需用户手动操作，提高了用户体验，且提高了数据处理的准确性。

本发明又一实施例公开了一种语音数据处理系统，在本实施例中，服务器还用于判断所述多个电子设备的语音助手同时发送的所述语音数据是否属于同一声纹，相应的，服务器从多个电子设备中确定与语音数据的发送者相距最近的目标电子设备，具体为从语音数据属于同一声纹的多个电子设备中确定与语音数据的发送者相距最近的目标电子设备。

其中，服务器通过判断该多个电子设备是否属于同一声纹来确定该多个电子设备的语音助手所采集的语音数据是否为同一发送者发送的，如果属于同一声纹中，确定该多个电子设备的语音助手所采集的语音数据为同一发送者发送，如果属于不同的声纹，则确定该多个电子设备的语音助手所采集的语音数据为不同的发送者发送。

在本发明另一实施例中，服务器还用于控制语音数据属于不同声纹的电子设备分别响应其语音助手发送的语音数据。

由此可见，本实施例中，当多个电子设备的语音助手均接收到用户发送的语音数据时，可以从语音数据属于同一声纹的电子设备中确定出与用户相距最近的目标电子设备，并控制其语音助手响应该语音数据，无需用户手动操作，提高了用户体验，且提高了数据处理的准确性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢兵;黎广斌;张旭辉;王东洋;张天铖
技术所有人：联想（北京）有限公司
我是此专利的发明人

上一篇：一种单回路直线塔中相组合防鸟装置的制作方法
上一篇：一种酒杯型铁塔中相防鸟隔离栏的制作方法