语音处理模组和具有语音功能的终端的制作方法

文档序号：17308717发布日期：2019-04-05 19:41阅读：222来源：国知局

本实用新型涉及终端领域，特别涉及一种语音处理模组和具有语音功能的终端。

背景技术：

语音是一种重要的人机交互方式，用户只需要说话就可以从终端得到反馈结果，当语音应用到对终端进行唤醒时，用户可以通过发出特定的语音信息唤醒终端，在一定程度上方便了用户对终端的使用。

然而，实用新型人发现现有技术中至少存在如下问题：现有技术中对终端采用语音唤醒的方式时，终端中的主处理器需要一直处于开启语音服务，由主处理器对接收到的语音唤醒信息进行实时监测，进而在识别到特定的语音信息时被唤醒。虽然实现了对终端的唤醒，但主处理器需要一直开启语音服务并对外界的语音信息进行实时监测，增大了主处理器的功耗，使终端的耗电量会很大，用户体验较差。

技术实现要素：

本实用新型的目的在于提供一种语音处理模组和具有语音功能的终端，使得终端在采用语音服务时，耗电较高的主处理器处于休眠，降低了终端的整体功耗。

为解决上述技术问题，本实用新型的实施方式提供了一种语音处理模组，包括：接收单元、数字信号处理器DSP和输出单元；接收单元，用于接收语音信号，将语音信号发送至数字信号处理器；DSP，用于识别所接收到的语音信号，根据识别结果触发输出单元；输出单元，用于向独立于语音处理模组的主处理器发送唤醒信号。

本实用新型的实施方式还提供了一种具有语音功能的终端，包含：语音处理模组、主处理器和语音采集器；语音处理模组分别连接主处理器和语音采集器；语音处理模组中的接收单元接收到的语音信号来自语音采集器；主处理器在休眠状态下接收到唤醒信号后，接收来自语音采集器的语音信号。

本实用新型实施方式相对于现有技术而言，语音处理模组，包括：接收单元、数字信号处理器DSP和输出单元；接收单元与数字信号处理器DSP连接，数字信号处理器DSP与输出单元连接，使得接收单元接收语音信号，主处理器无需一直处于开启状态。由于主处理器开启后会使得终端的整体功耗增大，因此，由语音处理模组监测接收到的语音信号，而主处理器通常处于休眠状态，使得终端的整体功耗大大降低。数字信号处理器DSP对接收到的语音信号进行识别处理，避免了现有技术中主控制器对语音信号进行识别而造成的增大主控制器的处理负担。DSP根据识别结果触发输出单元，通过输出单元向独立于语音处理模组的主处理器发送唤醒信号，保证了发送唤醒信号的有效性和及时性，使得处于休眠状态的主处理器在接收到唤醒信号后可以被唤醒，在降低功耗的同时也不会影响主处理器的正常工作，提高了用户的使用体验。

另外，语音处理模组还包括：存储单元，存储单元分别连接接收单元和DSP，有利于对接收单元接收的语音信号或经过DSP识别处理过的语音信号进行存储。

另外，接收单元为模数转换ADC采样器或串行音频通信接口I2S。使得接收单元的实现更加多样化。

另外，输出单元为：通用输入输出GPIO接口，语音处理模组通过GPIO接口向主处理器发送唤醒信号。GPIO接口具有更低的功率损耗，有利于降低语音处理模组的功耗，从而进一步降低终端的整体功耗。

另外，语音采集器的数量为一个，语音采集器还和主处理器连接；语音采集器和语音处理模组导通，或者，语音采集器和主处理器导通。语音采集器为一个时，还和主处理器连接，使得语音采集器和主处理器导通后可以直接接收语音采集器的语音信号。

另外，语音处理模组还包括，转换开关，切换开关的一端连接语音采集器，另一端可在语音处理模组和主处理器之间切换连接；切换开关根据主处理器或语音处理模组的控制信号确定导通语音采集器和主处理器，或者导通语音采集器和语音处理模组。切换开关使得语音采集器的连接方式切换更加方便快速准确。

另外，语音采集器的数量大于一个，语音处理模组的接收单元的数量大于一个，接收单元和语音采集器一一对应；语音处理模组还包括音频接口，语音处理模组通过音频接口连接至主处理器，使得主处理器可以通过音频接口得到多个语音采集器的语音信号。

另外，音频接口为I2S接口，有利于进行准确的音频传输，采用了沿独立的导线传输时钟与数据信号的设计，通过将数据和时钟信号分离，避免了因时差诱发的失真，为用户节省了购买抵抗音频抖动的专业设备的费用。

附图说明

图1是根据本实用新型第一实施方式的语音处理模组的结构示意图；

图2是根据本实用新型第二实施方式的具有语音功能的终端的结构示意图；

图3是根据本实用新型第三实施方式的语音处理模组的结构示意图；

图4是根据本实用新型第三实施方式的具有语音功能的终端中的主处理器退出休眠状态的示意图；

图5是根据本实用新型第四实施方式的具有语音功能的终端的结构示意图；

图6是根据本实用新型第五实施方式的具有语音功能的终端的结构示意图。

具体实施方式

为使本实用新型的目的、技术方案和优点更加清楚，下面将结合附图对本实用新型的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本实用新型各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请各权利要求所要求保护的技术方案。

本实用新型的第一实施方式涉及一种语音处理模组。本实施方式的核心在于语音处理模组，包括：接收单元、数字信号处理器DSP和输出单元。下面对本实施方式的语音处理模组的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。

本实施方式中的语音处理模组如图1所示，具体包括：接收单元101，DSP102和输出单元103，其中，接收单元101与DSP102连接，DSP102和输出单元103连接。

具体地说，接收单元101用于接收语音信号并将语音信号发送至DSP102，接收单元101接收的语音信号来自与接收单元101连接的语音采集器。如果语音采集器为模拟语音采集器，即采集到的语音信号直接为模拟信号，那么接收单元101可以为模数转换ADC采样器，模拟语音采集器与模数转换ADC采样器连接，将模拟信号发送给模数转换ADC采样器，模数转换ADC采样器将模拟信号转换为数字信号。如果语音采集器为数字语音采集器，即采集的语音信号直接为数字信号，那么接收单元101可以为串行音频通信I2S接口，数字语音采集器与I2S接口连接，发送数字信号。如果由多个语音采集器，可以在语音处理模组中设置多个接收单元分别与多个语音采集器连接，从而接收多个语音采集器发送的语音信号。在实际应用中，语音采集器可以为麦克风，麦克风可以包括接收模拟麦克风和数字麦克风。

数字信号处理器DSP102与接收单元101连接，识别所接收到的语音信号，根据识别结果触发输出单元103，DSP102识别接收到的语音信号，比如说将语音信号的特征参数即时地提取出来，与已知的语音样本进行匹配，从而判定出待识别语音信号的音素属性。关于语音识别方法，有统计模式语音识别，结构和语句模式语音识别，利用这些方法可以得到共振峰频率、音调、嗓音、噪声等重要参数。如果提取的特征参数与已知的语音样本匹配成功，则触发输出单元103。

输出单元103与DSP102连接，输出单元103在被DSP102触发后，向独立于语音处理模组的主处理器发送唤醒信号。输出单元可以为通用输入输出GPIO接口。语音处理模组可以通过GPIO接口104向主处理器发送唤醒信号，唤醒信号可以为中断信号，也可以为GPIO口的电信号。也就是说，主处理器一般处于休眠状态，在接收到通过输出单元103发送的唤醒信号后，退出休眠状态，执行相应的程序，开始正常的工作。

与现有技术相比，本实用新型实施方式中的语音处理模组独立于主控制器，通过语音处理模组中的接收单元接收语音信号，使得主处理器无需一直处于开启状态。由于主处理器开启后会使得终端的整体功耗增大，因此，由语音处理模组监测接收到的语音信号，而主处理器通常处于休眠状态，使得终端的整体功耗大大降低。数字信号处理器DSP对接收到的语音信号进行识别处理，避免了现有技术中主控制器对语音信号进行识别而造成的增大主控制器的处理负担。DSP根据识别结果触发输出单元，输出单元向主处理器发送唤醒信号，保证了发送唤醒信号的有效性和及时性，使得处于休眠状态的主处理器在接收到唤醒信号后可以被唤醒，在降低功耗的同时也不会影响主处理器的正常工作，提高了用户的使用体验。同时，本实施方式中的GPIO接口具有更低的功率损耗，并且可预先确定响应时间，缩短或确定外部事件与中断之间的响应时间，同时仅需使用2条就可以组成IIC总线或3条组成SPI总线，布线更加简单。因此，语音处理模组包括通用输入输出GPIO接口，使得语音处理模组不仅降低了功耗，而且在性能上得到了进一步的提高。

本实用新型的第二实施方式涉及一种语音处理模组。第二实施方式是第一实施方式的进一步改进，主要改进之处在于：在本实用新型第二实施方式中，语音处理模组还包括：存储单元，存储单元分别连接接收单元和DSP，有利于对接收单元接收的语音信号或经过DSP识别处理过的语音信号进行存储。

本实施方式的语音处理模组如图2所示，具体包括：接收单元101，DSP102和输出单元103，和存储单元204。其中，接收单元101与DSP102连接，DSP102和输出单元103连接，存储单元204分别与接收单元101和DSP102连接。

具体地说，存储单元204可以对接收单元101接收的语音信号或经过DSP102识别处理过的语音信号进行存储，如果有多个接收单元，还可以对多个接收单元接收到的语音信号均进行存储。

存储单元204中可以预存预定的唤醒词的标准特征参数；DSP102分析所接收到的语音信号，提取语音信号中的特征参数，识别所提取的特征参数中是否包括标准特征参数。由于接收的语音信号中通常含有背景噪声、人的情绪等不具辨识性的成分，因此，DSP 102可以分析所接收到的语音信号，把语音信号中具有辨识性的成分提取出来。对于接收到的语音信号，在语音信号的特征参数的提取上，梅尔频率倒谱系数考虑到了人类的听觉特征，如果在识别语音信号中的关键字时能模拟人类听觉感知处理特点，就有可能提高语音的识别率，因此，语音信号中提取的特征参数可以为与梅尔频率倒谱系数相关的特征向量。DSP 102可以根据提取的特征参数判断特征参数中是否包括预存的唤醒词对应的标准特征向量，如果包括预存的标准特征向量则触发输出单元103。

与现有技术相比，本实施方式中的存储单元分别连接接收单元和DSP，有利于对接收单元接收的语音信号或经过DSP识别处理过的语音信号进行存储。预存预定的唤醒词的标准特征参数；DSP通过对语音信号的特征参数进行比对，有利于准确的识别出接收的语音信号中是否包括预定的唤醒词，有利于准确及时的触发输出单元。

本实用新型第三实施方式涉及一种具有语音功能的终端，本实施方式的核心在于终端包括：语音处理模组、主处理器和语音采集器，终端可以为具有语音功能的手机、平板电脑、蓝牙音箱等智能设备，本实施方式对此不做限定。下面对本实施方式的语音处理模组的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。

本实施方式中的具有语音功能的终端如图3所示，具体包括：语音采集器301、上述实施例中的语音处理模组302、主处理器303，其中，语音处理模组302分别与主处理器303和语音采集器301连接，主处理器303与语音采集器301连接。

具体地说，语音处理模组302中的接收单元101接收到的语音信号来自语音采集器301。语音采集器301可以为模拟语音采集器，当语音采集器301为模拟语音采集器时语音处理模组302中的接收单元101为模数转换ADC采样器。语音采集器301还可以为数字语音采集器，语音采集器301为数字语音采集器时，语音处理模组302中的接收单元为串行音频通信I2S接口。

主处理器303在休眠状态下接收到唤醒信号时，退出休眠状态。退出休眠状态可以理解为终端从灭屏状态退出转为亮屏状态，或从锁屏状态退出转为解锁后的状态，主处理器303与语音处理模组302之间通过I2C传输控制信号。在实际应用中，如果主处理器303被唤醒，则主处理器303可以直接与语音采集器301导通，直接接收语音采集器301发送的语音信号，也可以由语音处理模组302通过I2S接口将语音信号发送给主处理器303。

语音采集器301和语音处理模组302导通，即主处理器303处于休眠状态；语音采集器301和主处理器303导通，即主处理器303退出休眠状态。以主处理器303退出休眠状态为例，如图4所示，语音处理模组302的EN使能端，拉高的时候，语音处理模组302芯片工作，即此时语音处理模组302与语音采集器301导通。当语音处理模组302向主处理器303发送唤醒信号后，可以拉低语音处理模组302的EN使能端口，语音处理模组302与语音采集器301不导通。需要说明的是，在实际应用中语音处理模组302还具有其他功能的接口，由于为实现本实施方式的退出休眠状态，主要用到语音处理模组302的EN使能端，因此对于语音处理模组302的其他端口不做具体限定。

与现有技术相比，本实施方式中具有语音功能的终端包括：语音处理模组、主处理器和语音采集器；终端中耗电较高的主处理器通常处于休眠状态，由耗电较低的语音处理模组接收语音信号，并根据识别结果向主处理器发送唤醒信号，使得主处理器退出休眠状态开始工作，在降低终端整体功耗的同时，也不影响终端的正常工作。

本实用新型的第四实施方式涉及一种具有语音功能的终端，第四实施方式与第三实施方式大致相同，不同之处在于：切换方式不同，第三实施方式中，通过语音处理模组的EN使能端来实现切换。而在本实施方式中，通过切换开关来实现切换，通过切换开关使得语音采集器的连接方式切换更加方便快速准确。

本实施方式的具有语音功能的终端如图5所示，包括：语音采集器301、上述实施例中的语音处理模组302、主处理器303，切换开关404。切换开关404的一端连接语音采集器301，另一端可在语音处理模组302和主处理器303之间切换连接；切换开关404根据主处理器303或语音处理模组302的控制信号确定导通语音采集器301和主处理器303，或者导通语音采集器301和语音处理模组302。

具体地说，切换开关404可以为三极管、单刀双掷开关等电子器件。控制信号可以为控制语音处理模组302和主处理器303导通的控制信号，这一控制信号可以由主处理器303在接收到语音处理模组302发送的唤醒信号后向切换开关404发送的控制信号，也可以由语音处理模组302在发送唤醒信号的同时向切换开关404发送的控制信号，从而使主处理器303退出休眠状态。在实际应用中，控制信号还可以为控制语音处理模组302和主处理器303断开的控制信号，从而使主处理器303进入休眠状态。

与现有技术相比，本实用新型实施方式，通过切换开关使得语音采集器在不同情况下更加准确快速的进行切换，使得主控制器可以快速退出或进入休眠状态，在降低终端的整体功耗的同时，也不影响终端的正常工作。

本实用新型的第五实施方式涉及一种具有语音功能的终端，第五实施方式是第三实施方式的进一步改进，主要改进之处在于：在本实用新型第五实施方式中，语音采集器有多个，使得主处理器可以得到从多个语音采集器接收到的语音信号。

本实施方式中的具有语音功能的终端如图6所示。语音采集器的数量大于一个，语音处理模组302的接收单元的数量大于一个，接收单元和语音采集器一一对应；语音处理模组302还包括音频接口，语音处理模组302通过音频接口连接至主处理器303。比如图6中的语音采集器3011与接收单元1011连接，语音采集器3012与接收单元1012连接，图6中只画出2个语音采集器和对应的接收单元，在实际应用中语音采集器和对应的接收单元的数量并不以此为限。

具体地说，接收单元1011和接收单元1012分别同时接收语音采集器3011和语音采集器3012发送的语音信号，通过唤醒词识别单元102的识别后，如果唤醒了主处理器303，那么语音处理模组302可以通过I2S接口连接至主处理器303，向主处理器303传输从语音采集器3011和语音采集器3012接收到的语音信号。语音处理模组302中的存储单元204还可以存储接收单元1011和接收单元1012接收到的语音信号。接收单元1011和接收单元1012接收到的语音信号均与存储单元204连接(图中未画出)，存储单元204存储各个接收单元接收的语音信息。主处理器303与语音处理模组302之间通过I2C传输控制信号，语音处理模组302通过音频接口向主处理器303传输从多个语音采集器接收到的语音信号，音频接口可以为I2S接口。主处理器303在接收到语音处理模组302发送的唤醒信号后退出休眠状态，开始工作。

与现有技术相比，本实用新型实施方式，语音采集器的数量有多个，使得主处理器可以得到从多个语音采集器接收到的语音信号，有效的解决了现有技术中主处理器只能得到一个语音采集器接受的语音信号的技术问题。

值得一提的是，为了突出本实用新型的创新部分，本实施方式中并没有将与解决本实用新型所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

本领域的普通技术人员可以理解，上述各实施方式是实现本实用新型的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本实用新型的精神和范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾令江
技术所有人：上海与德通讯技术有限公司
我是此专利的发明人

上一篇：一种多功能妇产科用护理遮挡帘的制作方法
上一篇：骨料仓出料装置的制作方法