一种面向pc的嵌入式非特定语音沟通系统的制作方法

文档序号：8339353阅读：362来源：国知局

一种面向pc的嵌入式非特定语音沟通系统的制作方法
【技术领域】
[0001] 本发明涉及一种非特定语音信号识别电路，具体地说是涉及一种通过嵌入式非特定语音信号和电脑沟通的电路系统。
【背景技术】
[0002] 嵌入式技术作为21世纪智能时代的核心技术，越来越多的在科技和生活领域发挥了支柱性作用。目前，计算机的控制是通过键盘和鼠标来完成，随着科技的不断发展，人们需要一种更方便、更自然、更加人性化的方式与计算机进行交互。语音识别技术是信息
技术领域十大重要的科技发展技术之一，它是一门交叉学科，正逐步成为信息技术中人机交互的关键技术，它的应用已经成为一个具有竞争性的新兴高技术产业。目前主流的语音识别技术是基于统计模式识别的基本理论，而统计模型训练由于算法复杂，运算量大，功耗高，成本高等缺点，在实际应用中限制了它的运用。而嵌入式语音人机交互由于其实时性好，稳定性高等许多优点已成为目前研宄的热门课题，但尚无比较成熟，设计复杂程度低、功耗较小的可实施性方案问世。

【发明内容】

[0003] 鉴于上述现有技术的不足，本发明的目的是提出一种面向PC的嵌入式非特定语音沟通系统，以简单的电路设计、识别率高、实时性高、稳定性好等特点提出PC语音交互的技术解决方案。
[0004] 本发明的上述目的，其得以实现的技术解决方案是：一种面向PC的嵌入式非特定语音沟通系统，其特征在于：所述沟通系统由微处理器、语音识别芯片LD3320、USB电缆和辅配电路组成，其中所述微处理器为Cortex-M4内核的STM32F407VG主控芯片且移植有 yC/OS-III操作系统，所述语音识别芯片LD3320外接设有音频播放器和音频采集器且与微处理器SPI通信相连，所述USB电缆连接微处理器至PC机，且语音沟通包括步骤： I、通用初始化，通用初始化就是语音识别以及语音播放都适用的初始化。LD3320内部集成PLL，根据时钟频率正确配置PLL是语音识别ADC采样和语音播放.DA输出的保证，只需要修改代码中的CLK_IN这个宏定义即可； II、初始化语音识别一些参数，这参数主要包括设置语音检测的灵敏度、起始语音的时间、背景噪音时间，灵敏度并不是越高越好，灵敏度越高误触发的可能性越大，因此要根据实际环境设置一个合适的值。起始语音时间为当芯片检测到多长的语音时决策为一次真正的语音开始，背景噪音时间为当芯片检测到语音多久没有输入之后判断为语音的结束。
[0005] III、面向微处理器通过拼音直接写入非特定的识别短语，每一个识别短语都包含一个短语ID且对应一项PC动作指令，对应在PC机上虚拟成为一个人机接口键盘； IV、启动语音识别，音频采集器接收外部的非特定语音，由语音识别芯片LD3320识别语音并将识别结果向微处理器申请中断，微控制器中断读取出识别结果并选定与短语ID 相对应的PC动作指令、通过USB电缆向PC机输出动作指令并由PC机响应动作。
[0006] 进一步地，所述微处理器为最高工作频率达168MHz的MCU。
[0007] 进一步地，所述语音识别芯片LD3320为内置有非特定语音识别DSP算法的语音识别器。
[0008] 应用本发明的非特定语音沟通系统，其显著优点体现为：无需通过键盘和鼠标来完成计算机的控制和操作，只需通过人发出声音命令来控制和操作计算机，该电路具有稳定性好、语音识别率高、抗噪声干扰能力强、结构简单和使用方便等优点，可以有效降低成本，并可广泛应用于服务机器人智能空间、智能家居和消费电子产品等多个领域。
【附图说明】
[0009] 图1是本发明的电路总框图。
[0010] 图2是本发明沟通系统中语音识别芯片LD3320的电路连接示意图。
【具体实施方式】
[0011] 以下便结合实施例附图，对本发明技术方案作进一步的详细说明，以使本发明创新性、实用性更易于理解。
[0012] 本发明创新提出一种通过嵌入式非特定语音信号和电脑交互的沟通电路，该电路主要包括主控和语音识别两大部分。如图1所示从具体的结构来看：其结构由微处理器 STM32F407VG、语音识别芯片LD3320、USB电缆及其它看门狗等辅配电路组成，其中微处理器为CortexHM内核的STM32F407VG主控芯片（下称MCU)，并且移植μ COS-III操作系统作为任务管理，移植了 USB作为HID标准设备，MCU选择SPI与语音识别芯片LD3320通信。该MCU的最高工作频率达168MHz，处理速度快；μ COS-III是micrium公司的第三代微控制器系统，它是一个全新的操作系统，在国内外被广泛应用于各类产品，在主控芯片上移植 μ COS-III操作系统，作为任务的管理和调度。
[0013] 如图2本发明沟通系统中语音识别芯片LD3320的电路连接示意图所示，LD3320采用并行方式直接与MCU相接，一般采用IkQ电阻上拉，复位信号以及中断返回信号与MCU 直接相连并采用3. 3kΩ的上拉电阻，辅助系统稳定工作，LD3320和处理器采用同一个外部时钟，图下方为有源晶振，右上方为麦克风和耳机的接口，右下方排针引出来连接到相应管脚上。对LD3320来说，复位信号由MCU发出，而中断信号由LD3320发出，MCU负责接收。语音识别芯片LD3320外接设有音频播放器和音频采集器且与微处理器SPI通信相连，USB电缆连接微处理器至PC机，语音识别芯片LD3320内置有非特定语音识别的DSP算法，可以动态编辑识别条目列表，无需外挂其它辅助器件，单一芯片即可完成语音识别，并且直接支持 mp3数据的语音播放，语音识别芯片检测语音输入并对语音进行识别，识别结果向MCU申请中断，MCU中断读取出识别结果，并启动相应的识别任务，对PC机进行相关的操作。
[0014] 上述语音沟通包括步骤： I、通用初始化，通用初始化就是语音识别以及语音播放都适用的初始化。LD3320内部集成PLL，根据时钟频率正确配置PLL是语音识别ADC采样和语音播放.DA输出的保证，我们只需要修改代码中的CLK_IN这个宏定义即可。
[0015] II、初始化语音识别一些参数，这参数主要包括设置语音检测的灵敏度、起始语音的时间、背景噪音时间，灵敏度并不是越高越好，灵敏度越高误触发的可能性越大，因此要根据实际环境设置一个合适的值。起始语音时间为当芯片检测到多长的语音时决策为一次真正的语音开始，背景噪音时间为当芯片检测到语音多久没有输入之后判断为语音的结束。
[0016] III、面向微处理器通过拼音直接写入非特定的识别短语，每一个识别短语都包含一个短语ID且对应一项PC动作指令，对应在PC机上虚拟成为一个人机接口键盘。
[0017] IV、启动语音识别，音频采集器接收外部的非特定语音，由语音识别芯片LD3320 识别语音并将识别结果向微处理器申请中断，微控制器中断读取出识别结果并选定与短语 ID相对应的PC动作指令、通过USB电缆向PC机输出动作指令并由PC机响应动作。
[0018] 通常情况下，每次识别只要重复步骤I至IV即可；如果系统持续工作在语音识别功能且没有复位，那么只需要每次启动识别时只执行一次步骤IV即可，从而可以节省时间，提高语音识别的响应速度。
[0019] 以下从本发明沟通系统在实际各种场合下的沟通实验来进一步了解本技术方案的实际优异效果。在家庭(安静环境）和商场(吵闹环境）等两个不同噪音背景的环境下，通过按以上方案架构连接而成的沟通电路，并对该沟通电路在步骤II中设置合理的语音检测灵敏度、语音起始时间、背景噪音时间等参数后，即可进行面向PC机的嵌入式非特定语音沟通。让大人和小孩根据预设的语音指令对该沟通电路发出声控，观察并记录PC机的实际运作情况（这边次数设为15次），结果整理如下表所示(识别率为识别次数与总次数之比)：
【主权项】
1. 一种面向PC的嵌入式非特定语音沟通系统，其特征在于：所述沟通系统由微处理器、语音识别芯片LD3320、USB电缆和辅配电路组成，其中所述微处理器为Cortex-M4内核的STM32F407VG主控芯片且移植有y C/OS-III操作系统，所述语音识别芯片LD3320外接设有音频播放器和音频采集器且与微处理器SPI通信相连，所述USB电缆连接微处理器至 PC机，且语音沟通包括步骤：
1. 对语音识别芯片LD3320进行语音识别及语音播放的通用初始化，语音识别芯片 LD3320内部集成PLL，根据时钟频率通过修改代码中的CLK_IN这个宏定义正确配置PLL以保证语音识别ADC采样和语音播放.DA输出； II、初始化语音识别的参数，所述参数包括语音检测的灵敏度、判断语音开始的起始语音时间和判断语音结束的背景噪音时间； III、面向微处理器通过拼音直接写入非特定的识别短语，每一个识别短语都包含一个短语ID且对应一项PC动作指令，对应在PC机上虚拟成为一个人机接口键盘； IV、启动语音识别，音频采集器接收外部的非特定语音，由语音识别芯片LD3320识别语音并将识别结果向微处理器申请中断，微控制器中断读取出识别结果并选定与短语ID 相对应的PC动作指令、通过USB电缆向PC机输出动作指令并由PC机响应动作。
2. 根据权利要求1所述面向PC的嵌入式非特定语音沟通系统，其特征在于：所述微处理器为最高工作频率达168MHz的MCU。
3. 根据权利要求1所述面向PC的嵌入式非特定语音沟通系统，其特征在于：所述语音识别芯片LD3320为内置有非特定语音识别DSP算法的语音识别器。
【专利摘要】本发明揭示了一种嵌入式非特定语音信号和电脑沟通电路的设计，其组成包括微处理器STM32F407VG，语音识别芯片LD3320，USB电缆等。整个系统使用的是Cortex-M4内核的STM32F407VG作为主控芯片，并且移植μC/OS-III操作系统作为任务管理，移植了USB电缆作为人机接口标准设备，语音识别芯片外接设有音频播放器和音频采集器且与微处理器SPI通信相连，且USB电缆连接微处理器至PC机。本发明方案的提出，无需通过键盘和鼠标来完成计算机的控制和操作，只需通过人发出声音命令来控制和操作计算机，该电路具有稳定性好、语音识别率高、抗噪声干扰能力强、结构简单和使用方便等优点，可以有效降低成本，并可广泛应用于服务机器人智能空间、智能家居和消费电子产品等多个领域。
【IPC分类】G10L15-22, G06F3-16
【公开号】CN104657104
【申请号】CN201510030838
【发明人】吴振英
【申请人】苏州工业职业技术学院
【公开日】2015年5月27日
【申请日】2015年1月22日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴振英;
技术所有人：苏州工业职业技术学院;
我是此专利的发明人

上一篇：一种开启终端的语音输入功能的方法和装置的制造方法
上一篇：基于深度摄像机的手持cave投影系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。