语音识别处理器及智能设备的制作方法

文档序号：2832517阅读：306来源：国知局

专利名称：语音识别处理器及智能设备的制作方法
技术领域：
本实用新型涉及电路技术领域，尤其涉及一种语音识别处理器及智能设备。
背景技术：
随着人们生活水平的提高，家电产品由最早的机械开光控制发展到遥控控制。相对于机械开光控制，遥控控制使得人们通过遥控器来控制家电产品开启或关闭，控制方式较为灵活。但是，现有的遥控控制方式局限于专用的遥控器，遥控器通常需要与具体的家电产品匹配。例如电视机对应专用的电视遥控器，空调对应专用的空调遥控器等。一旦用户找不到专用遥控器或遥控器没电，则需要通过操作家电产品上的按键来控制家电设备，甚至无法控制家电设备(例如壁挂式空调)。因此，现有的家电产品控制方式有待进一步改进。

实用新型内容本实用新型的主要目的在于提供一种针对特定人的语音识别处理器，进而实现特定人对家电产品的语音控制。为了达到上述目的，本实用新型提出一种特定人语音识别处理器，包括微控制器、电源管理及复位电路、功能IO端口、模数转换器、存储器、数学运算单元以及振荡电路；其中，所述电源管理及复位电路与所述微控制器连接，用于对所述微控制器提供电源以及复位所述微控制器；所述功能IO端口与所述微控制器连接，用于接收外部输入的控制信号以及向外输出识别结果，所述识别结果中携带控制指令；所述模数转换器用于接收外部输入的模拟语音，并将模拟语音转换为数字语音；所述存储器用于存储用户录入的数字语音；所述数学运算单元与所述微控制器连接，用于根据输入的数字语音进行用户的语音识别并生成识别结果，所述识别结果中携带控制指令；所述振荡电路与所述微控制器连接，用于提供所述微控制器运行的时钟信号。优选的，所述存储器还存储有需要播放的提示音；所述语音识别处理器还包括与所述微控制器连接的数模转换器，所述数模转换器用于将所述需要播放的提示音转换为模拟的提示音信号输出。优选的，语音识别处理器还包括运算放大器以及音频功放；所述运算放大器与所述数模转换器连接，用于对所述模拟的提示音信号进行混音滤波；[0020]所述音频功放与运算放大器和微控制器连接，用于对混音滤波后的提示音信号进行功率放大。优选的,所述震荡电路包括基频振荡电路以及与所述基频振荡电路连接的锁相环电路；所述锁相环电路向所述微控制器输出时钟信号。优选的，所述的语音识别处理器，还包括与所述微控制器连接的PWM放音端口。优选的,所述功能IO端口包括驱动端口，用于输出驱动LED或马达的驱动信号；开始训练输入端口，用于接收外部输入的开始训练信号；结束训练输入端口，用于接收外部输入的结束训练信号；识别结果输出端口，用于向外输出数学运算单元输出的识别结果。优选的，所述功能IO端口还包括红外输出端口，用于根据标准红外协议以载波形式输出语音识别结果；休眠唤醒输入控制端口，用于接收外部输入的休眠或唤醒控制信号。优选的，所述微控制器为增强型8位核，所述数模转换器和模数转换器的位数为16位。本实用新型还提出一种智能设备，包括如上所述的特定人语音识别处理器。在本实用新型提出特定人语音识别处理器中，存储器中存储有特定用户预先录入的语音，在模数转换器将模拟语音转换为数字语音后，数学运算单元根据输入的数字语音进行用户的语音识别并生成识别结果向外输出。外部的家电设备根据识别结果的控制指令执行相应的动作，例如开启或关闭等，进而实现家电设备的语音控制。相对于现有技术中的遥控器控制家电设备，控制方式更为灵活有效，避免遥控器控制带来的问题。

图I是本实用新型提供的特定人语音识别处理器的结构示意图。图2是本实施例提供的语音识别处理器的具体结构图。图3是本实施例提供的语音识别处理器中数模转换器、运算放大器以及音频功放的连接示意图。图4是本实施例提供的语音识别处理器的封装示意图。为了使本实用新型的目的、技术方案及优点更加清楚明白，
以下结合附图及实施例，对本实用新型进行进一步详细说明。
具体实施方式
应当理解，此处所描述的具体实施例仅仅用以解释本实用新型，并不用于限定本实用新型。参考图1，图I是本实用新型提供的特定人语音识别处理器的结构示意图。在本实施例中，语音识别处理器具体包括微控制器10、电源管理及复位电路20、功能IO端口 30、模数转换器40、存储器50、数学运算单元60以及振荡电路70。[0045]其中，所述电源管理及复位电路20与所述微控制器10连接，用于对所述微控制器10提供电源以及复位所述微控制器10 ；所述功能IO端口 30与所述微控制器10连接，用于接收外部输入的控制信号以及向外输出识别结果，所述识别结果中携带控制指令；所述模数转换器40用于接收外部输入的模拟语音，并将模拟语音转换为数字语
曰；所述存储器50用于存储用户录入的数字语音；所述数学运算单元60与所述微控制器10连接，用于根据输入的数字语音进行用户的语音识别并生成识别结果，所述识别结果中携带控制指令；
所述振荡电路70与所述微控制器10连接，用于提供所述微控制器10运行的时钟信号。在本实用新型提出特定人语音识别处理器中，存储器50中存储有特定用户预先录入的语音，在模数转换器40将模拟语音转换为数字语音后，数学运算单元60根据输入的数字语音进行用户的语音识别并生成识别结果向外输出，该识别结果中携带控制指令。外部的智能设备(例如家电设备)根据识别结果的控制指令执行相应的动作，例如开启或关闭等，进而实现家电设备的语音控制。相对于现有技术中的遥控器控制家电设备，控制方式更为灵活有效，避免遥控器控制带来的问题。进一步的，存储器50还存储有需要播放的提示音，例如提示用户说出指令的提示音等；语音识别处理器还可以包括与所述微控制器10连接的数模转换器80，所述数模转换器80用于将所述需要播放的提示音转换为模拟的提示音信号输出。本实施例通过增加数模转换器80，可以语音识别处理器在用户通过语音来控制家电设备时，向用户发出相应的提示音，例如提示用户说出指令或要求用户重复或指令输入成功的提不等，可以提闻用户的体验度。进一步的，本实施例提供的语音识别处理器还包括运算放大器90以及音频功放100 ；其中，运算放大器90与所述数模转换器80连接，用于对所述模拟的提示音信号进行混音滤波；所述音频功放100与运算放大器和微控制器10连接，用于对混音滤波后的提示音信号进行功率放大。本实施例通过增加运算放大器90与音频功放100，可以实现直接对外部的扬声器进行驱动，增强了语音识别处理器的功能。参见图2，图2是本实施例提供的语音识别处理器的内部结构图。在本实施例中，微控制器具体为增强型8位核，数模转换器(DAC)和模数转换器(ADC)的位数为16位。存储器包括只读存储器(ROM)和静态存储器(SRAM)，其中存储有需要播放的提示音和训练、识别的控制程序。震荡电路在本实施例中具体为VC0-PLL，其中VCO-PLL具体包括基频振荡电路以及与所述基频振荡电路连接的锁相环电路，锁相环电路向所述微控制器输出系统时钟信号。在本实施例中，语音识别处理器还包括与所述微控制器连接的12位PWM放音端□。参见图3，图3是本实施例提供的语音识别处理器中数模转换器、运算放大器以及音频功放的连接示意图。如图所示，其中CL，RL, CR，RR, RF，CF为语音识别处理器的外围阻容器件。图示电路可实现AUDI0_L和AUDI0_R两路信号的混合放大及滤波，其输出端0P_0可直接连接AMP_IN。对于绝大多数应用，AUDI0_L, AUDI0_R两路无须同时使用，仅需连接AUDI0_L即可，此时，CR, RR可以省略。以下结合图2-3对语音识别处理器中的常用端口进行说明，常用的外部端口可大致分为四类I.电源端口其包括WC, GND, VDD, VSS, VPP, VSL 及 RESET 脚。VCC、GND——数字部分的电源和地。VDD、VSS——模拟部分的电源和地。VPP、VSL——语音识别处理器内置ROM的供电电源。RESET—语音识别处理器的复位脚，语音识别处理器上电后低电平复位。2.振荡电路端口振荡电路端口具体包括R_FREQ及C_PLL脚。语音识别处理器内部集成R/C振荡(基频振荡)及PLL电路，R_FREQ脚需外接270K电阻，可实现I. 86MHz的基频振荡。C_PLL脚控制PLL电路的稳定时间，可以空置或使用彡IOOOpF的电容。3.音频端口音频端口具体包括 ADC_IN，AUDI0_L, AUDI0_R, 0P_P, 0P_N, 0P_0, AMP_IN, AMP_P 及AMP_N 脚。ADC_IN——16位ADC的输入口，输入范围0 VDD，建议直流电平设置在0. 5r0. 53VDD处，以获得更好的线性度。语音识别处理器上电或复位后会自动进行ADC_IN脚的直流电平检测，用时为0. 5^0. 75秒。AUDI0_L——左路DAC的输出口，输出范围为(TVDD。AUDI0_R——右路DAC的输出口，输出范围为(TVDD。0P_P—混音滤波运算放大器的同相输入端，系统内部连接1/2 VDD,常规使用时
请空置。0P_N—混音滤波运算放大器的反相输入端。0P_0—混音滤波运算放大器的信号输出端，标准应用中连接至AMP_IN。AMP_IN——音频功率放大器的信号输入端。AMP_P——音频功率放大器的正输出断，可直接驱动0.5W/8 Q的扬声器或蜂鸣片。AMP_N——音频功率放大器的负输出断，可直接驱动0.5W/8 Q的扬声器或蜂鸣片。4 功能 IO 端口功能IO端口具体包括PORTO及PORTl两组共16个管脚，提供SPI Flash端口、音频电路的电源控制、按键输入、LED驱动、MOTOR驱动、红外发射驱动及串行数据输出等多种常用功能。其中，POO—开始训练键输入口，低脉冲有效。在训练模式下无效；在识别模式下为“开始训练”，进入训练模式，清除原训练的数据，重新训练。POl——BLA控制输出口，该端口默认输出高电平，语音识别处理器播放声音时输出低电平，放音结束后回到高电平。可连接LED灯，也可驱动马达。语音识别处理器处于语音段中的静音时(由程序模拟产生)，端口不动作，回到高电平。P02——LED动态显示控制口，低有效，该端口功能在语音识别处理器播放声音时启动，放音结束后停止。端口会根据音量的大小而改变输出电平。功能详述端口默认输出高电平，语音识别处理器解码放音时，如语音数据的值(16Bit)在中点电平±1000H之间，端口输出高电平，否则端口输出低电平。P03——3Hz显示控制口，低有效，该端口功能在语音识别处理器播放声音时启动，放音结束后停止。该功能若启动，则播放声音时，将按照Flash内设定的频率值(可以不为3Hz)变换端口的输出电平。 P04—重新训练键输入口，低脉冲有效。训练模式下当正在训练该词条第二遍时，重新开始训练该词条；当正在训练该词条第一遍时，重新训练上一词条。识别模式下从上次训练中止处继续训练，直至全部语句训练完成。作为从片工作时，主控语音识别处理器需要产生大于50ms的低脉冲以使之工作。P05——结束训练键输入口，低脉冲有效。中止训练并进入识别模式，在识别模式下无用。作为从片工作时，主控语音识别处理器需要产生大于50ms的低脉冲以使之工作。P04、P05可配合实现Voice Test功能，用于对系统的全部声音进行测试，可检测散句组合是否正确。Voice Test的使用方法是开机提示音播放结束前，同时拉低P04和P05，则语音识别处理器将自动按照顺序播放系统里的所有语音。P04、P05中任何一个或两个变高，则测试结束。若语音全部播完，语音识别处理器将进入训练/识别模式。P06——休眠/唤醒输入控制口，低电平有效。当第一次拉低本端口并维持3秒钟(或50ms，可选)，系统播放关机提示音(可屏蔽)，并进入休眠；再次拉低本端口(下降沿触发)可唤醒语音识别处理器，系统播放提示音(可屏蔽)后，进入识别状态。利用本端口，可配置“开机/关机”按键，也可将语音识别处理器作为协处理器，构成主从控制系统。P07—红外输出端口，本端口可用于实现对家电等红外设备的智能语音控制。根据Flash内的设置，在每次识别结束后，语音识别处理器将按照标准红外协议以载波形式发送控制数据。本端口功能需配合外部红外发射电路方可实现。上述各端口均可通过设置Flash内容，决定其在休眠时的状态。端口状态可设置为输入模式或输出模式，输入模式下可配置是否上拉，输出模式下上拉无意义。应根据外部电路，合理配置端口状态，以达到降低系统功耗的目的。默认状态下，休眠时各端口均为上拉输入。实测数据表明当驱动简单的低有效LED电路时，休眠时设置为输入上拉，将比输出高电平时功耗更低。P10 P13-SPI Flash 端口，PlO 连接 Flash 的 CLK 脚；Pl I 连接 Flash 的 CS 脚；
P12为语音识别处理器的数据输出，连接Flash的Data in脚；P13为语音识别处理器的数据输入，连接Flash的Data out脚。P14—双线串行输出的CLK脚，本端口为语音识别处理器工作状态及识别结果的串行输出提供时钟线。[0101]P15——初始化状态及端点检测指示口，可驱动LED，低电平有效。本端口在系统上电初始化过程中，一直为低电平，直到系统进入识别状态后，输出高电平。识别状态下，当检测到声音开始，输出低电平，声音结束，返回高电平；非识别状态下(如放音时)，维持高电平。本端口用于指示语音端点检测是否准确；也可监控语音识别处理器启动是否正常若初始化失败，语音识别处理器将会尝试再次初始化，仍然失败，则进入休眠模式，此过程中，P15将一直为低。P16—双线串行输出的DATA脚，本端口为语音识别处理器工作状态及识别结果的串行输出提供数据线。串行输出数据为0，代表系统正播放答录提示音；数据为1、，代表识别结果为第I、个模型，N个模型对应不同的控制指令；N+1则表明输入语音被拒识。P17——麦克风音频放大电路的电源控制口，可通过改变Flash中的相应设置，设定闻有效或低有效。设定为闻有效时，端口可提供最大4mA的驱动电流。本端口控制逻辑已由语音识别处理器内部设定，开机并初始化成功后置为有效状态，休眠后则输出反向电平。P1(TP17在休眠状态下的端口状态，均由系统自动控制，无须用户设定。本实施例提供的语音识别处理器在8位增强型微处理核的基础上，集成了专用的数学运算单元，可实时实现特定人的语音训练、识别及高压缩格式语音的解码回放过程；此夕卜，处理器内含SRAM及R0M，已嵌入训练、识别控制的完整程序；语音识别处理器提供I路16位ADC及2路16位DAC通道，可实现高质量的音频输入输出转换；语音识别处理器内置音频功率放大器，可直接驱动0.5W 8Q的扬声器；此外，语音识别处理器内还集成有R/C基频振荡电路及倍频可控的PLL电路。SOC设计思路使得语音识别处理器的外围电路大大的精简，成为目前嵌入式语音识别领域里集成度最高的语音识别处理器。此外，语音识别处理器定义了多个动作控制的端口，通过简单配置即可实现按键输入、LED显示、马达驱动及红外发射驱动功能。语音识别处理器提供语音识别结果的串行数据输出，可作协处理器使用，便于系统的应用扩展。语音识别处理器可以应用于智能对话玩具、家电智能控制、PDA及手持设备的人机交互等。参见图4，图4是本实施例提供的语音识别处理器封装示意图。本实施例提供的语音识别处理器包括44个管脚，具体的管脚定义如下I-VDDP模拟信号的电源:2. 7疒3. 6V (典型值3. 0V)；2-VSSP模拟信号的参考地；3-AMP_INA音频功放的信号输入端；4_0P_0A内部运算放大器的输出端；5_0P_PA内部运算放大器的同相输入端；6_0P_NA内部运算放大器的反相输入端；7-AUDI0_LA 左通道 DAC 输出；8-AUDI0_RA 右通道 DAC 输出；9 IONC保留，不连接；11-ADC_INAADC 的信号输入端；12 19NC保留，不连接；20-VPPP 内部 ROM 的电源；21-VSLP 内部 ROM 的电源；[0122]22-R_FREQI内部基频VCO的电阻输入端(建议270K)；23-C_PLLI内部PLL电路的阻尼电容端(建议空置或接IOOOpf)；24-GNDP数字信号的参考地；25-VCCP数字信号的电源:2.7V 3.6V (典型值3. 0V);26-RESETIS复位脚，低电平有效；27-P0RT170麦克风音频放大电路的电源控制端；28-P0RT160双线串行输出的DATA脚；29-P0RT150初始化及端点检测指示脚；··[0130]30-P0RT140双线串行输出的CLK脚；31-P0RT070红外输出驱动端口；32-P0RT06IS休眠/唤醒输入控制口；33-P0RT05IS 中止训练；34-P0RT04IS 重新训练；35-P0RT0303HZ 显示控制口；36-P0RT020LED 动态显示控制口；37-P0RT010BLA 控制输出口；38-P0RT00IS 开始训练；39-P0RT13/SPI_MIS0I/0 SPI端口的主设备输入/从设备输出；40-P0RT12/SPI_M0SII/0 SPI端口的主设备输出/从设备输入；41-P0RT11/SSB0SPI 端口的 SSB 端；42-P0RT10/SCKI/0 SPI 端口的 SCK 端；43-AMP_NA音频功放的负输出端(直接接喇叭或蜂鸣片);44AMP_PA音频功放的正输出端(直接接喇叭或蜂鸣片)。以上对本实施例提供的特定人语音识别处理器进行了详细介绍，本实施例最后还提供一种智能设备，其包括如上所述的特定人语音识别处理器。其中，智能设备不限于智能电视、手机、智能空调、风扇等其它家电设备。在本实用新型提供的智能设备中包含特定人语音识别处理器，语音识别处理器中的存储器50存储有特定用户预先录入的语音，在模数转换器40将模拟语音转换为数字语音后，数学运算单元60根据输入的数字语音进行用户的语音识别并生成识别结果向外输出。智能设备根据识别结果的控制指令执行相应的动作，例如开启或关闭等，进而实现智能设备的语音控制。相对于现有技术中的遥控器控制家电设备，控制方式更为灵活有效，避免遥控器控制带来的问题。以上所述仅为本实用新型的优选实施例，并非因此限制本实用新型的专利范围，凡是利用本实用新型说明书及附图内容所作的等效结构或流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本实用新型的专利保护范围内。
权利要求1.一种语音识别处理器，其特征在于，包括微控制器、电源管理及复位电路、功能IO端口、模数转换器、存储器、数学运算单元以及振荡电路；其中，所述电源管理及复位电路与所述微控制器连接，用于对所述微控制器提供电源以及复位所述微控制器；所述功能IO端口与所述微控制器连接，用于接收外部输入的控制信号以及向外输出识别结果，所述识别结果中携带控制指令；所述模数转换器用于接收外部输入的模拟语音，并将模拟语音转换为数字语音；所述存储器用于存储用户录入的数字语音；所述数学运算单元与所述微控制器连接，用于根据输入的数字语音进行用户的语音识别并生成识别结果，所述识别结果中携带控制指令；所述振荡电路与所述微控制器连接，用于提供所述微控制器运行的时钟信号。
2.根据权利要求I所述的语音识别处理器，其特征在于，所述存储器还存储有需要播放的提示音；所述语音识别处理器还包括与所述微控制器连接的数模转换器，所述数模转换器用于将所述需要播放的提示音转换为模拟的提示音信号输出。
3.根据权利要求2所述的语音识别处理器，其特征在于，还包括运算放大器以及音频功放；所述运算放大器与所述数模转换器连接，用于对所述模拟的提示音信号进行混音滤波；所述音频功放与运算放大器和微控制器连接，用于对混音滤波后的提示音信号进行功率放大。
4.根据权利要求I所述的语音识别处理器，其特征在于，所述震荡电路包括基频振荡电路以及与所述基频振荡电路连接的锁相环电路；所述锁相环电路向所述微控制器输出时钟信号。
5.根据权利要求I所述的语音识别处理器，其特征在于，还包括与所述微控制器连接的PWM放音端口。
6.根据权利要求1-5中任一项所述的语音识别处理器，其特征在于，所述功能IO端口包括驱动端口，用于输出驱动LED或马达的驱动信号；开始训练输入端口，用于接收外部输入的开始训练信号；结束训练输入端口，用于接收外部输入的结束训练信号；识别结果输出端口，用于向外输出数学运算单元输出的识别结果。
7.根据权利要求6所述的语音识别处理器，其特征在于，所述功能IO端口还包括红外输出端口，用于根据标准红外协议以载波形式输出语音识别结果；休眠唤醒输入控制端口，用于接收外部输入的休眠或唤醒控制信号。
8.根据权利要求7所述的语音识别处理器，其特征在于，所述微控制器为增强型8位核，所述数模转换器和模数转换器的位数为16位。
9.一种智能设备，其特征在于，包括如权利要求I到8任一项所述的特定人语音识别处理器。
专利摘要本实用新型涉及一种语音识别处理器及智能设备，在本实用新型提出特定人语音识别处理器中，存储器中存储有特定用户预先录入的语音，在模数转换器将模拟语音转换为数字语音后，数学运算单元根据输入的数字语音进行用户的语音识别并生成识别结果向外输出，该识别结果中携带控制指令。外部的智能设备(例如家电设备)根据识别结果的控制指令执行相应的动作，例如开启或关闭等，进而实现家电设备的语音控制。相对于现有技术中的遥控器控制家电设备，控制方式更为灵活有效，避免遥控器控制带来的问题。
文档编号G10L15/28GK202563884SQ20112046180
公开日2012年11月28日申请日期2011年11月18日优先权日2011年11月18日
发明者赖春晖申请人:深圳市派高模业有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赖春晖
技术所有人：深圳市派高模业有限公司
我是此专利的发明人