多音区语音唤醒、识别方法和装置、设备、存储介质与流程

文档序号：26585117发布日期：2021-09-10 18:54阅读：来源：国知局

技术特征：
1.一种多音区语音唤醒方法，包括：获取n路音频信号，其中，每路音频信号对应于n个音区中的一个音区；基于所述n路音频信号与唤醒引擎中n个同步音频处理线程之间的对应关系，将每路音频信号输入一个对应的音频处理线程；以及响应于所述n个同步音频处理线程中出现有唤醒结果的线程，将与所述有唤醒结果的线程对应的音区确定为所述n个音区中的已唤醒音区。2.根据权利要求1所述的方法，还包括：响应于所述n个同步音频处理线程中出现有唤醒结果的线程，确定所述n个同步音频处理线程中是否同时有多个线程有唤醒结果；响应于确定所述n个同步音频处理线程中同时有多个线程有唤醒结果，确定同时有唤醒结果的多个线程中输入音频信号最强的一个目标线程；其中，将与所述有唤醒结果的线程对应的音区确定为所述n个音区中的已唤醒音区，包括：将与所述目标线程对应的一个目标音区确定为所述n个音区中的已唤醒音区。3.根据权利要求1所述的方法，其中，所述获取n路音频信号，包括：利用n个拾音器同时采集n路音频信号，其中，每个拾音器设置在所述n个音区中的一个音区内；将所述n个拾音器同时采集的n路音频信号组合成一帧音频数据传输至所述唤醒引擎；通过所述唤醒引擎，从所述音频数据中提取对应的n路音频信号，以便按照所述对应关系，分别输入一个对应的音频处理线程进行处理。4.一种多音区语音识别方法，包括：根据权利要求1至3中任一项所述的多音区语音唤醒方法，确定出n个音区中的第一已唤醒音区；获取设置在所述第一已唤醒音区内的拾音器采集的音频信号；以及将所述音频信号传输至语音识别引擎进行语音识别。5.根据权利要求4所述的方法，还包括：在所述确定出n个音区中的第一已唤醒音区之后，响应于所述拾音器在预设时间段内一直未采集到音频信号，关闭所述第一已唤醒音区的语音识别通道；以及根据权利要求1至3中任一项所述的多音区语音唤醒方法，重新确定所述n个音区中的已唤醒音区。6.根据权利要求4所述的方法，还包括：在进行语音识别过程中，响应于所述n个音区中出现第二已唤醒音区，关闭所述第一已唤醒音区的语音识别通道，其中，所述第二已唤醒音区的权限高于所述第一已唤醒音区的权限；获取设置在所述第二已唤醒音区内的拾音器采集的音频信号；以及将该音频信号传输至所述语音识别引擎进行语音识别。7.一种多音区语音唤醒装置，包括：第一获取模块，用于获取n路音频信号，其中，每路音频信号对应于n个音区中的一个音区；输入模块，用于基于所述n路音频信号与唤醒引擎中n个同步音频处理线程之间的对应
关系，将每路音频信号输入一个对应的音频处理线程；以及第一确定模块，用于响应于所述n个同步音频处理线程中出现有唤醒结果的线程，将与所述有唤醒结果的线程对应的音区确定为所述n个音区中的已唤醒音区。8.根据权利要求7所述的装置，还包括：第二确定模块，用于响应于所述n个同步音频处理线程中出现有唤醒结果的线程，确定所述n个同步音频处理线程中是否同时有多个线程有唤醒结果；第三确定模块，用于响应于确定所述n个同步音频处理线程中同时有多个线程有唤醒结果，确定同时有唤醒结果的多个线程中输入音频信号最强的一个目标线程；其中，所述第一确定模块还用于：将与所述目标线程对应的一个目标音区确定为所述n个音区中的已唤醒音区。9.根据权利要求7所述的装置，其中，所述第一获取模块包括：采集单元，用于利用n个拾音器同时采集n路音频信号，其中，每个拾音器设置在所述n个音区中的一个音区内；传输单元，用于将所述n个拾音器同时采集的n路音频信号组合成一帧音频数据传输至所述唤醒引擎；提取单元，用于通过所述唤醒引擎，从所述音频数据中提取对应的n路音频信号，以便使所述输入模块按照所述对应关系，将提取的n路音频信号分别输入一个对应的音频处理线程进行处理。10.一种多音区语音识别装置，包括：第四确定模块，用于根据权利要求7至9中任一项所述的多音区语音唤醒装置，确定出n个音区中的第一已唤醒音区；第二获取模块，用于获取设置在所述第一已唤醒音区内的拾音器采集的音频信号；以及第一语音识别模块，用于将所述音频信号传输至语音识别引擎进行语音识别。11.根据权利要求10所述的装置，还包括：第一音区关闭模块，用于在所述确定出n个音区中的第一已唤醒音区之后，响应于所述拾音器在预设时间段内一直未采集到音频信号，关闭所述第一已唤醒音区的语音识别通道；以及第五确定模块，用于根据权利要求7至9中任一项所述的多音区语音唤醒装置，重新确定所述n个音区中的已唤醒音区。12.根据权利要求10所述的装置，还包括：第二音区关闭模块，用于在所述语音识别模块进行语音识别过程中，响应于所述n个音区中出现第二已唤醒音区，关闭所述第一已唤醒音区的语音识别通道，其中，所述第二已唤醒音区的权限高于所述第一已唤醒音区的权限；第三获取模块，用于获取设置在所述第二已唤醒音区内的拾音器采集的音频信号；以及第二语音识别模块，用于将该音频信号传输至所述语音识别引擎进行语音识别。13.一种电子设备，包括：唤醒引擎，包括n个同步音频处理线程，其中，每个音频处理线程对应于一个音区，用于
处理对应音区内设置的拾音器采集的一路音频信号，所述唤醒引擎用于监听所述n个同步音频处理线程的处理结果，并将与所述n个同步音频处理线程中有唤醒结果的线程对应的音区确定为n个音区中的已唤醒音区。14.一种车载终端，包括：唤醒引擎，包括n个同步音频处理线程，其中，每个音频处理线程对应于一个车载音区，用于处理对应车载音区内设置的拾音器采集的一路音频信号，所述唤醒引擎用于监听所述n个同步音频处理线程的处理结果，并将与所述n个同步音频处理线程中有唤醒结果的线程对应的车载音区确定为n个车载音区中的已唤醒音区。15.一种车辆，包括：权利要求7至9中任一项所述的多音区语音唤醒装置；以及权利要求10至12中任一项所述的多音区语音识别装置。16.一种车辆，包括：权利要求14所述的车载终端。17.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至6中任一项所述的方法。18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至6中任一项所述的方法。19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1至6中任一项所述的方法。

技术总结
本公开公开了一种多音区语音唤醒方法，涉及人工智能领域，尤其涉及语音技术、自然语言处理、语音交互等领域，可用于车联网、自动驾驶等场景。具体实现方案为：获取N路音频信号，其中，每路音频信号对应于N个音区中的一个音区；基于N路音频信号与唤醒引擎中N个同步音频处理线程之间的对应关系，将每路音频信号输入一个对应的音频处理线程；以及响应于N个同步音频处理线程中出现有唤醒结果的线程，将与有唤醒结果的线程对应的音区确定为N个音区中的已唤醒音区。唤醒音区。唤醒音区。

技术研发人员：周毅左声勇
受保护的技术使用者：阿波罗智联（北京）科技有限公司
技术研发日：2021.06.08
技术公布日：2021/9/9

完整全部详细技术资料下载

当前第2页1 2