语音信号处理方法、装置、设备及系统与流程

文档序号：18457903发布日期：2019-08-17 01:45阅读：307来源：国知局

本发明涉及语音识别领域，更具体地，涉及一种语音信号处理方法、一种语音信号处理装置、一种电子设备以及一种语音信号处理系统。

背景技术：

随着语音识别技术的发展，越来越多的电子设备开始采用语音方式进行交互，使产品变得更加智能便利。例如在智能音箱类产品中，用户可以通过语音方式唤醒设备、控制音乐播放、查询天气等。

由于声音信号固有的特点，同一语音信号可以被多个电子设备接收，并被多个电子设备响应，这很容易对用户造成困扰。例如，对于具有相同唤醒词的多个设备，用户进行语音唤醒时，多个设备的响应时间甚至响应内容会出现不一致的情况，这使得用户收到的响应信息混乱，从而影响用户的使用体验。

技术实现要素：

本发明实施例的一个目的是提供一种语音信号处理的新的技术方案。

根据本发明的第一方面，提供了一种语音信号处理方法，其特征在于，对于由多个设备构成的设备群组中的每一个设备：

接收当前的语音信号；

决策是否需要响应所述语音信号，得到决策结果；

在所述决策结果为需要响应所述语音信号的情况下，对所述语音信号进行响应。

可选地，所述决策是否需要响应所述语音信号，包括：

获取所述设备自身所接收的所述语音信号的设定指标；

获取所述设备群组中其他设备所接收的所述语音信号的设定指标；

根据所述设备自身的所述设定指标和所述其他设备的所述设定指标，决策是否需要响应所述语音信号。

可选地，所述获取所述设备群组中其他设备所接收的所述语音信号的设定指标，包括：

接收预设时间段内由所述其他设备发送的所述其他设备的所述设定指标。

可选地，所述设定指标包括：接收到所述语音信号的时刻和接收到所述语音信号的强度中的至少一项。

可选地，其中，所述设定指标为所述接收到所述语音信号的时刻；所述根据所述设备自身的所述设定指标和所述其他设备的所述设定指标，决策是否需要响应所述语音信号，包括：

在所述设备自身所接收的所述语音信号的时刻最早的情况下，确定所述决策结果为需要响应所述语音信号。

可选地，所述设定指标为接收到所述语音信号的强度；所述根据所述设备自身的所述设定指标和所述其他设备的所述设定指标，决策是否需要响应所述语音信号，包括：

在所述设备自身所接收的所述语音信号的强度最大的情况下，确定所述决策结果为需要响应所述语音信号。

可选地，所述设定指标同时包括所述接收到所述语音信号的时刻和所述接收到所述语音信号的强度；所述根据所述设备自身的所述设定指标和所述其他设备的所述设定指标，决策是否需要响应所述语音信号，包括：

根据每一所述设备所接收的所述语音信号的时刻和强度，确定所述语音信号的综合指标；

在所述设备自身所接收的所述语音信号的综合指标最优的情况下，确定所述决策结果为需要响应所述语音信号。

可选地，所述方法还包括：

在所述决策结果为不需要响应所述语音信号的情况下，不对所述语音信号进行响应，并且设置所述设备自身不再接收或者响应后续的语音信号。

可选地，所述决策是否需要响应所述语音信号，得到决策结果，包括：

获取所接收的所述当前的语音信号的设定指标，作为当前指标；

获取所接收的在先的语音信号的设定指标，作为参照指标；

比较所述当前指标与所述参照指标，得到比较结果；

在所述比较结果满足设定条件的情况下，将对应所述在先的语音信号的决策结果作为对应所述当前的语音信号的决策结果。

可选地，所述设定条件通过以下方式确定：

获取多次语音信号的设定指标，作为历史数据；

根据所述历史数据确定所述设定条件。

可选地，所述决策是否需要响应所述语音信号，得到决策结果，包括：

确定所述设备自身是否为所述设备群组中的主设备；

在确定所述设备自身为所述主设备的情况下，确定所述决策结果为需要响应所述语音信号；

其中，所述主设备是在所述设备群组中向其他设备推送音频数据的设备。

根据本发明的第二方面，还提供了一种语音信号处理装置，所述语音信号处理装置位于由多个设备构成的设备群组中的每一个设备中，包括：

接收模块，用于接收当前的语音信号：

决策模块，用于决策是否需要响应所述语音信号，得到决策结果；以及

响应模块，用于在所述决策结果为需要响应所述语音信号的情况下，对所述语音信号进行响应。

根据本发明的第三方面，还提供了一种电子设备，包括如本发明第二方面所述的语音信号处理装置；或者，所述电子设备包括：

存储器，用于存储可执行命令；

处理器，用于在所述可执行命令的控制下，执行如本发明第一方面所述的任一项方法。

根据本发明的第三方面，还提供了一种语音信号处理系统，包括多个如本发明第三方面所述的电子设备，并且对于同一语音信号，每一所述电子设备均执行如本发明第一方面所述的任一项方法。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

本发明的一个有益效果在于，在本实施例提供的语音信号处理方法中，设备群组中的任一设备在接收语音信号后对自身是否需要响应进行决策，根据决策结果对语音信号进行响应，避免了多个设备对于同一语音信号响应混乱的问题，有利于改善用户的使用体验，使语音设备变得更加智能便利。

此外，在本实施例提供的语音信号处理方法中，语音设备对语音信号的响应决策是由其自身做出的，群组中各个设备的决策过程相对独立，从而避免了部分设备的决策故障对设备群组的响应表现造成较大影响，使得本实施例中语音信号处理方法交互稳定，可靠性高。

另外，本实施例中语音信号设定指标的传递可以在局域网中进行，无需与服务器通信，能够避免因网络延时导致的交互卡顿现象。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1示出了可用于实现本发明实施例的语音设备的示意图。

图2是本发明实施例提供的语音信号处理方法的一种应用场景的的示意图。

图3是本发明实施例一提供的语音信号处理方法的流程图。

图4是本发明实施例五提供的语音信号处理装置的示意图。

图5是本发明实施例六提供的电子设备的示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人物已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

<硬件配置>

图1示出了可用于实现本发明实施例的语音设备的示意图。该语音设备例如能够识别语音信号并做出响应。

如图1所示，语音设备1000包括了处理器1010、存储器1020、通信装置1030、显示装置1040、麦克风1050和扬声器1060。

处理器1010例如是中央处理器cpu、微处理器mcu等。存储器1020例如包括rom(只读存储器)、ram(随机存取存储器)、诸如硬盘的非易失性存储器等。通信装置1030例如能够进行有线通信或者无线通信。显示装置1040例如可用于显示所播放的音乐信息等，例如是液晶显示屏。麦克风1050例如可用于接收语音信号，例如是电动式麦克风、电容式麦克风、压电式麦克风等。扬声器1060例如可用于播放声音，例如是电动式扬声器、电磁式扬声器、静电式扬声器、压电式扬声器等。

图1所示的信息处理系统1000仅是解释性的，并且决不是为了要限制本发明、其应用或用途。

<实施例一>

图2是本发明实施例提供的语音信号处理方法的一种应用场景的的示意图。

图2中的语音设备包括了语音设备210、语音设备220和语音设备230。这些语音设备的配置例如与图1中语音设备1000的配置相同。

图2中的多个语音设备可以组成设备群组。该设备群组例如是能够对相同语音信号进行响应并能够相互通信的多个语音设备，又例如是组成了音频组的多个音箱，通过所建立的音频组，这些音箱之间可以同步地播放音频信号，例如音乐流媒体。其中，多个语音设备相互通信时，任意两个设备之间的通信可以是直接进行的，也可以是借助于其他设备比如路由器进行的。

如图2所示，用户通过说话产生语音信号，由于声音能够以声波的形式向四周传播，该语音信号能够被多个语音设备接收到，这容易引发多个设备响应混乱的情况。为此，本实施例针提供了一种语音信号处理方法，该方法可应用于图2所示的场景。

本实施例提供的语音信号处理方法，由设备群组中的每一个语音设备实施，例如由图2中语音设备210、语音设备220、语音设备230中的每一个设备同时实施。如图3所示，该方法包括以下步骤s3100-s3300：

步骤s3100，接收当前的语音信号。

例如，由图2中的语音设备210接收当前的语音信号。当前的语音信号例如是用于唤醒语音设备的唤醒语音信号，例如，由若干个音节、字或词构成的简短语音信号，用于唤醒语音设备以进一步接收用户发出的语音指令。当前的语音信号还可以是用户发出的“调大音量”“查询天气”“设置闹钟”等语音。语音设备210例如可以通过麦克风接收该语音信号，并将语音信号从声波形式转化为电信号形式。

在接到到语音信号后，语音设备执行以下步骤s3200：

步骤s3200，决策是否响应语音信号，得到决策结果。

例如，图2中语音设备210接收到当前的语音引号后，对自身是否需要对该语音信号响应进行决策，得到响应的决策结果。

在一个例子中，步骤s3200包括以下步骤s3210-s3230：

步骤s3210：语音设备获取自身接收语音信号的设定指标。

例如，图2中的语音设备210根据自身接收到的语音信号，确定自身接收语音信号的设定指标。该设定指标例如是接收到语音信号的时刻，又例如是接收到语音信号的强度，还可以同时包括接收到语音信号的时刻和接收到语音信号的强度。

在确定语音设备接收到语音信号的时刻时，可以预先对多个语音设备进行时间同步，再由每个语音设备对自身接收到语音信号的时刻进行记录，以保证不同设备记录的时间具有可比性。

在确定语音设备接收到语音信号的强度时，可以由语音设备测量自身接收到语音信号的声音幅值、响度等指标，以表征语音信号的强度。

步骤s3220，获取设备群组中其他设备接收语音信号的设定指标。

以图2中的语音设备为例，在语音设备210获取到了自身接收语音信号的设定指标的情况下，语音设备220、230也按照相同方式分别获取到了自身接收语音信号的设定指标。这时，语音设备220、230可以分别将自身接收语音信号的设定指标发送给语音设备210，从而使语音设备210获取到语音设备220、230的接收语音信号的设定指标。

在一个例子中，语音设备210接收设定时间段内的由其他设备发送的设定指标。该设定时间段例如是从语音设备210接收到语音信号的时刻起算，又例如是从语音设备210收到其他设备发送的设定指标的最早时刻起算。对于超过该设定时间段的其他设备的设定指标，语音设备210可以不再接收。通过选择合适的设定时间段长度，能够避免接收其他设备设定指标的过程耗费较多时间。

语音设备220、230也可以通过类似方式获得设备群组中其他设备接收语音信号的设定指标。

步骤s3230：根据自身的设定指标和其他设备的设定指标，决策是否需要响应语音信号。

对于设备群组中的任一设备，在获取了自身设定指标和其他设备的设定指标情况下，可以据此决策自身是否需要响应语音设备。步骤s3230的实施方式例如是：

(1)在步骤s3230中，语音设备将自身接收到语音信号的强度与其他设备接收到语音信号的强度进行比较，在自身接到语音信号的强度为最大的一个时，做出需要响应语音信号的决策。这种方式有利于实现设备群组中距离用户较近的设备做出响应。

(2)在步骤s3230中，语音设备将自身接收到语音信号的时刻与其他设备接收到语音信号的时刻进行比较，在自身接收到语音信号的时刻为最早的一个时，做出需要响应语音信号的决策。这种方式有利于实现设备群组对语音信号做出较为快速的响应。

(3)在步骤s3230中，语音设备根据每一设备所接收的语音信号的时刻先后和强度大小，确定该语音信号的综合指标；在设备自身所接收的语音信号的综合指标最优的情况下，做出需要响应语音信号的决策。这种方式综合考量了时刻指标和强度指标，有利于优化响应策略。此外，在确定设备与用户的距离时，综合指标相对于单个指标更加准确可到。在一个例子中，可以根据该综合指标选出与用户距离最近的设备进行响应。根据有关的声学规律，假设某一点的声强为i，该点到声源的距离为d，声音的传播时间为t，一方面，声强i与距离d的平方成反比，也就是i∝1/d²，另一方面，时间t与距离d成正比，也就是t∝d。由此可见，设备与用户的距离d可以由声强i和传播时间t两个方面的指标来反映。为了衡量距离d的远近，可以根据和t，并分配以相应的权重来计算综合指标。以图2中的语音设备为例，假设语音设备210、220、230接收到语音信号的强度值i依次是1、2、3，那么对应的依次是1、0.71、0.57。假设语音设备210、220和230接收到语音信号的时刻依次是1、2、3，这里对声音的传播时间进行近似处理，认为最早接收到语音信号的设备对应的传播时间为0s，那么语音设备210、220、230对应的传播时间t依次为0、1、2。和t的权重例如依次是0.8和0.2，那么语音设备210、220和230接收到语音信号的综合指标依次是0.8、0.768、0.856，该综合指标数值越小，代表响应设备与用户的距离越小，即综合指标的数值越小其指标含义越优。因此本例中语音设备220的综合指标最优，该设备据此做出需要响应语音信号的决策。通过这种方式，能够更准确地选出距离用户最近的设备。

上述步骤s3230的不同实施方式可以适用于不同的设备群组响应策略。例如，如果响应策略为选择设备群组中距离用户较近的设备进行响应，可以选择上述实施方式(1)或者(3)，其中，以设备接收到语音信号的强度或者强度和时刻的加权结果作为设备与用户间距离远近的衡量指标。又例如，如果响应策略为选择群组中反应速度最快的设备进行响应，可以选择上述实施方式(2)，其中，以设备接收到语音信号的时刻作为设备的反应速度的衡量指标。

得到响应的决策结果后，语音设备执行以下步骤s3300：

步骤s3300，在决策结果为需要响应语音信号的情况下，对语音信号进行响应。

语音设备通过步骤s3200确定了自身是否需要响应语音信号的决策结果。在决策结果为需要响应的情况下，语音设备可以调用自身硬件进行语音信号的响应。

设备对语音信号进行响应的方式例如是通过扬声器发出应答语音，又例如是通过显示装置显示应答图形或应答文字，又例如是通过指示灯的变化和动作进行响应提示。

语音设备通过步骤s3200确定自身不需要响应语音信号的情况下，不对当前的语音信号进行响应。

在本实施例提供的语音信号处理方法中，设备群组中的任一设备在接收语音信号后对自身是否需要响应进行决策，根据决策结果对语音信号进行响应，避免了多个设备对于同一语音信号响应混乱的问题，有利于改善用户的使用体验，使语音设备变得更加智能便利。

另外，本实施例中语音信号设定指标的传递可以在局域网中进行，无需与服务器通信，能够避免因网络延时导致的交互卡顿现象。

本实施例中语音信号处理方法的一个具体例子如下：

如图2所示，语音设备210、语音设备220和语音设备230均为音箱，三台音箱组成了设备群组并正在播放同一歌曲。此时，用户想要查询明天的天气，并发出了“明天天气怎么样”的语音信号(这种情况下，无需三台音箱都对该语音信号进行响应)。对于该语音信号，三台音箱均执行前文所述的步骤s3100-3300，其中，设定指标为接收设备接收到语音信号的时刻。经过决策，设备210确定自身接收到语音信号的时刻最早，因此对语音信号进行响应，开始播报明天的天气。设备220和设备230确定自己接收到语音信号的时刻不是最早，因此不对语音信号进行响应，继续播放歌曲。由此可见，本实施例中的语音信号处理方法能够使设备群组的语音信号处理更加有序、智能。

<实施例二>

本实施例提供一种语音信号处理方法，在实施例一中语音信号处理方法的基础上，从设备群组中选出特定设备，由该设备对后续的语音信号进行接收和响应。

本实施例中的语音信号处理方法由设备群组中的任一语音设备实施，例如由图2中语音设备210、语音设备220、语音设备230中的任一设备实施。该方法包括以下步骤s4100-s4400：

步骤s4100，接收当前的语音信号。

步骤s4200，决策是否响应语音信号，得到决策结果。

步骤s4300，在决策结果为需要响应语音信号的情况下，对语音信号进行响应。

上述步骤s4100-s4300的具体实施方式可以参照实施例一中对步骤s3100-s3300的描述和说明，这里不再叙述。

步骤s4400，在决策结果为不需要响应语音信号的情况下，不对语音信号进行响应，并且设置设备自身不再接收或者响应后续的语音信号。

在步骤s4400中，对于不需要响应当前语音信号的语音设备，除了不对本次语音信号进行响应外，还设置设备自身不再对后续的语音信号进行接收或响应。例如，语音设备设置设备自身关闭麦克风，从而不再接收后续的语音信号。又例如，语音设备仍然保持麦克风开启，但是将后续语音信号的决策结果均确定为不需要响应。

语音设备不再对后续的语音信号进行接收或响应的持续时间是可以设置的。例如，设置为持续一小时、持续一天或者持续到设备关机。

在步骤s4400中，对于需要响应当前语音信号的语音设备，该设备除了对当前语音信号进行响应外，还对后续的语音信号进行接收和响应。例如，该设备接收到后续信号后，将决策结果均确定为需要响应。又例如，该设备接收到后续语音信号后，无需决策直接响应。

通过本实施例中的语音信号处理方法，能够从设备群组中选出特定设备，由该设备对本次语音信号之后的语音信号进行接收和响应，其他设备不再对后续语音信号进行接收和响应，避免了响应混乱的同时，还简化了对后续语音信号的响应处理过程，有利于提高设备群组对后续语音信号的响应速度。

<实施例三>

本实施例提供一种语音信号处理方法，在实施例一中语音信号处理方法的基础上，对于相邻两次的语音信号优先由相同的语音设备进行响应。

本实施例中的语音信号处理方法由设备群组中的任一语音设备实施，例如由图2中语音设备210、语音设备220、语音设备230中的任一设备实施。该方法包括以下步骤s5100-s5300：

步骤s5100，接收当前的语音信号。

步骤s5200，决策是否响应语音信号，得到决策结果。

步骤s5300，在决策结果为需要响应语音信号的情况下，对语音信号进行响应。

上述步骤s5100-s5300的具体实施方式可以参照实施例一中对步骤s3100-s3300的描述和说明，这里不再叙述。

在本实施例中，步骤s5200进一步包括以下步骤s5210-s5240：

步骤s5210：获取接收当前的语音信号的设定指标，作为当前指标。

在该步骤中，接收当前的语音信号的设定指标，包括语音设备自身的设定指标，也包括其他设备的设定指标。

步骤s5220：获取接收在先的语音信号的设定指标，作为参照指标。

在该步骤中，接收在先的语音信号的设定指标，包括语音设备自身所接收的在先语音信号的设定指标，也包括其他设备所接收的在先语音信号的设定指标。

获取接收在先语音信号的设定指标的方式例如是：在在先语音信号的决策过程中，由语音设备对接收语音信号的设定指标进行记录，并在当前语音信号的决策过程中调取该记录。

步骤s5230：比较当前指标与参照指标，得到比较结果。

步骤s5240：在比较结果满足设定条件的情况下，将对应在先的语音信号的决策结果作为对应当前的语音信号的决策结果。

在上述步骤s5230和步骤s5240中，将上次语音信号的设定指标作为了本次语音信号决策过程的参照，当本次语音信号的设定指标相对于上次语音信号的设定指标的比较结果满足设定条件时，无论本次语音信号原本的决策结果是否与在先语音信号的决策结果一致，都将在先语音信号的决策结果作为当前语音信号的决策结果。

例如，对于图2中的语音设备210、语音设备220和语音设备230，将语音设备接收到语音信号的声音幅值作为设定指标。语音设备210、语音设备220和语音设备230接收在先语音信号的设定指标的数值例如依次是10、8、5，以此作为参照指标。可以看出，在在先的决策结果中，语音设备210的决策结果为需要响应，其余设备的决策结果为不需要响应。语音设备210、语音设备220和语音设备230接收当前语音信号的设定指标的数值例如依次是20、21、2，以此作为当前指标。可以看出，本次语音信号原本的决策结果是由语音设备220进行响应。将参照指标与当前指标进行比较，在先设定指标最大的设备为语音设备210，本次设定指标最大的设备为语音设备220，但是本次中语音设备210和语音设备220的设定指标数值依次为20和21，较为接近。本次设定指标的最大值(即语音设备220的设定指标值21)与在先响应语音信号的设备(即语音设备210)接收当前语音信号的设定指标的数值(即语音设备210的设定指标值21)的比值为1.05，假设设定条件为上述比值不超过1.5，则上述比较结果满足比较条件。因此，语音设备将在先的语音信号的决策结果作为当前语音信号的结果，最终结果是当前语音信号仍然由语音设备210进行响应。

本发明实施例提供的语音信号处理方法，在避免了响应混乱的同时，能够通过比较当前指标和参照指标，使得在设定指标变化相对不大的情况下，由相同的语音设备对相邻两次语音信号进行响应，有利于保持设备群组响应的一致性，避免进行响应的设备频繁变化，因此能够提升用户体验。

在本实施例一具体体现中，步骤s5240中的设定条件可以通过以下方式确定；

获取多次语音信号的设定指标，作为历史数据；根据历史数据确定设定条件。

例如，对设备群组多次接收语音信号的设定指标进行记录，作为历史数据。确定历史数据中设定指标的平均值、每个数值出现的频率等，根据历史数据反映出的用户语音信号的特点确定合适的设定条件。

通过上述方式确定设定条件，有利于根据用户的个性化特点进行语音信号处理，从而进一步提升用户体验。

<实施例四>

本实施例提供一种语音信号处理方法，在实施例一中语音信号处理方法的基础上，基于设备群组是否为主设备确定决策结果。

本实施例中的语音信号处理方法由设备群组中的任一语音设备实施，例如由图2中语音设备210、语音设备220、语音设备230中的任一设备实施。该方法包括以下步骤s6100-s6300：

步骤s6100，接收当前的语音信号。

步骤s6200，决策是否响应语音信号，得到决策结果。

步骤s6300，在决策结果为需要响应语音信号的情况下，对语音信号进行响应。

上述步骤s6100-s6300的具体实施方式可以参照实施例一中对步骤s3100-s3300的描述和说明，这里不再叙述。

在本实施例中，步骤s6200进一步包括以下步骤：

步骤s6210：确定自身是否为设备群组中的主设备；

步骤s6220：在确定自身为主设备的情况下，确定决策结果为需要响应语音信号。

其中，主设备是在设备群组中向其他设备推送音频数据的设备。

在本实施例中，设备群组中的多个设备组成了音频组，由音频组中的主设备向从设备推送音频数据。音频组中的设备例如是音箱。

音频组中主设备的确定方式例如是：

(1)对于建组时均处于播放状态或者均不处于播放状态的两个设备，由先发起建组请求的设备作为主设备；

(2)对于建组时一个处于播放状态、一个不处于播放状态的两个设备，由处于播放状态的设备作为主设备。

对于音频组中的设备，在响应决策时，由设备确定自身是否为主设备，若自身为主设备则对语音信号进行响应，若自身不是主设备则不对语音信号进行响应。

本实施例中提供的语音信号处理方法，能够在避免响应混乱的同时，提高决策速度，进而提高设备群组的响应速度。

<实施例五>

本实施例提供一种语音信号处理装置。如图4所示，语音信号处理装置400包括：

接收模块410，用于接收当前的语音信号：

决策模块420，用于决策是否需要响应语音信号，得到决策结果；以及

响应模块430，用于在决策结果为需要响应语音信号的情况下，对语音信号进行响应。

本实施例中各个模块的用途可以参照实施例一中关于语音信号处理方法的描述，这里不再赘述。

在本实施例一具体体现中，决策模块420还用于：

获取设备自身所接收的语音信号的设定指标；

获取设备群组中其他设备所接收的语音信号的设定指标；

根据设备自身的设定指标和其他设备的设定指标，决策是否需要响应语音信号。

在本实施例一具体体现中，决策模块420还用于：接收预设时间段内由其他设备发送的其他设备的设定指标。其中，设定指标包括接收到语音信号的时刻和接收到语音信号的强度中的至少一项。

在本实施例一具体体现中，决策模块420还用于：在设备自身所接收的语音信号的时刻最早的情况下，确定决策结果为需要响应语音信号。

在本实施例一具体体现中，决策模块420还用于：在设备自身所接收的语音信号的强度最大的情况下，确定决策结果为需要响应语音信号。

在本实施例一具体体现中，决策模块420还用于：根据每一设备所接收的语音信号的时刻先后和强度大小，确定语音信号的综合指标；在设备自身所接收的语音信号的综合指标最优的情况下，确定决策结果为需要响应语音信号。

在本实施例一具体体现中，语音信号处理装置400还包括后续响应模块(图中未示出)，该后续响应模块用于：在决策结果为不需要响应语音信号的情况下，不对语音信号进行响应，并且设置设备自身不再接收或者响应后续的语音信号；

在决策结果为需要响应语音信号的情况下，设置设备自身接收和响应后续的语音信号。

在本实施例一具体体现中，语音信号处理装置400还包括比较模块(图中未示出)，该比较模块用于：

获取接收当前的语音信号的设定指标，作为当前指标；

获取接收在先的语音信号的设定指标，作为参照指标；

比较当前指标与参照指标，得到比较结果；

在比较结果满足设定条件的情况下，将对应在先的语音信号的决策结果作为对应当前的语音信号的决策结果。

在本实施例一具体体现中，该比较模块还用于：

获取多次语音信号的设定指标，作为历史数据；

根据历史数据确定设定条件。

在本实施例一具体体现中，决策模块420还用于

确定自身是否为设备群组中的主设备；

在确定自身为主设备的情况下，确定决策结果为需要响应语音信号；

其中，主设备是在设备群组中向其他设备推送音频数据的设备。

<实施例六>

本实施例提供一种电子设备，该电子设备包括如实施例五所述的语音信号处理装置，具体可参见实施例五中关于语音信号处理装置的描述。

或者，该电子设备如图5中的电子设备500，包括：

储存器510，用于存储可执行命令。

处理器520，用于在可执行命令的控制下，执行如实施例一至实施例三中任一项所述的方法。具体可参见实施例一至实施例三中关于语音信号处理方法的描述。

<实施例七>

本实施例提供一种语音信号处理系统，该语音信号处理系统包括多个实施例六所述的电子设备，并且对于同一语音信号，每一电子设备均执行如实施例一至实施例三中任一项所述的方法。

该语音信号处理系统例如是图由图2中的语音设备210、220和230组成的设备群组，具体可参加实施例一至实施例三中对于该设备群组的描述，这里不再赘述。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等，以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李赛;娄晓磊;王重乐
技术所有人：北京小鸟听听科技有限公司
我是此专利的发明人

上一篇：一种氟维司群制备方法与流程
上一篇：告达亭皂苷组合物及其制备方法和用途与流程