一种简单语音识别装置的制作方法

文档序号：11252373阅读：533来源：国知局

【技术领域】

本发明涉及识别技术领域，具体为一种简单语音识别装置。

背景技术：

语音识别在现代社会中的应用越来越频繁，人们在生活中也会经常使用带有语音识别功能的科技产品。例如语音打电话，语音写短信，语音控制电视等等。按发音方式分类，可以分为孤立词识别，连接词识别和连续语音识别等，识别的算法有动态时间规整，矢量量化，隐马尔可夫模型，人工神经网络等等。在不断研究下，语音识别获得了长足的进展，识别率和识别范围有了很大的提升，但是这些算法的识别系统比较复杂，对芯片计算能力要求较高，有的甚至需要联网实现。

技术实现要素：

针对以上，本发明通过一种简单语音识别装置，其结构简单，识别率高，对硬件系统要求低。

本发明的目的通过以下技术方案实现：

一种简单语音识别装置，其特征在于，包括包括启动模块、语音采集模块、语音处理模块、语音识别模块和输出模块；

所述启动模块与所述语音采集模块连接，所述语音采集模块与语音处理模块相连，所述语音处理模块与所述语音识别模块连接，所述语音识别模块与所述输出模块连接；

所述启动模块用于检测语音信号并启动语音采集模块；

所述语音采集模块用于采集语音信号；

所述语音处理模块包括转换单元及降噪单元，所述转换单元用于接受所述语音采集模块采集到的语音信号，并对所述语音信号进行模数转换，所述降噪单元用于降低所述语音信号的噪声；

所述语音识别模块包括第一识别单元、第二识别单元、存储单元、加权处理单元，所述第一识别单元用于将经过模数转换及降噪后的语音信号与存储预设语音的格式文件进行相似性比较，得出与语音信号相似的预设语音格式文件；所述第二识别单元用于接收所述的相似预设语音格式文件以及降噪后的语音信号，并将所述降噪后的语音信号与相似预设语音格式文件进行比较，获取两者差异值；所述存储单元用于存储进行比较的所有预设语音的集合；所述加权处理单元对第二语音识别单元得出的差异值与加权变量进行叠加，得出成功值；

所述输出模块用于输出所述语音识别模块识别出来的结果。

进一步的，所述差异值与预设的阈值进行比较，若所述差异值小于预设的阈值时，则进入加权处理单元，否则，指示第一识别单元、第二识别单元重新进行比较识别，直到识别的差异值小于预设的阈值为止。

进一步的，所述语音采集模块采用麦克风将语音信号转换成电信号。

进一步的，启动模块包括检测单元及唤醒单元，所述检测单元及唤醒单元相互连接，所述检测单元用于检测是否有启动所述语音采集模块的信号，唤醒单元用于唤醒语音采集模块。

本发明的有益效果是：通过对启动模块对整个系统进行控制，没有信号是系统静默，降低能耗。语音处理模块对语音进行处理减少外部噪声、呼吸气流、电流的干扰。语音识别模块对语音分别进行相似性、相异性识别处理，获取与语音信号的识别结果，提高了语音识别的成功率。

附图说明

图1是本发明简单语音识别装置结构框图；

【具体实施方式】

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，当组件被称为“固定于”另一个组件，它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件，它可以是直接连接到另一个组件或者可能同时存在居中组件。当一个组件被认为是“设置于”另一个组件，它可以是直接设置在另一个组件上或者可能同时存在居中组件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

请参见附图

一种简单语音识别装置，包括包括启动模块1、语音采集模块2、语音处理模块3、语音识别模块4和输出模块5。启动模块1与语音采集模块2连接，语音采集模块2与语音处理模块3相连，语音处理模块3与语音识别模块4连接，语音识别模块4与输出模块5连接。启动模块1用于检测语音信号并启动语音采集模块2；语音采集模块2用于采集语音信号。语音处理模块3包括转换单元31及降噪单元32，转换单元31用于接受语音采集模块2采集到的语音信号，并对所述语音信号进行模数转换，降噪单元32用于降低所述语音信号的噪声。语音识别模块4包括第一识别单元42、第二识别单元43、存储单元41、加权处理单元44，第一识别单元41用于将经过模数转换及降噪后的语音信号与存储预设语音的格式文件进行相似性比较，得出与语音信号相似的预设语音格式文件；第二识别单元43用于接收所述的相似预设语音格式文件以及降噪后的语音信号，并将所述降噪后的语音信号与相似预设语音格式文件进行比较，获取两者差异值；存储单元41用于存储进行比较的所有预设语音的集合；加权处理单元44对第二语音识别单元得出的差异值与加权变量进行叠加，得出成功值。输出模块5用于输出所述语音识别模块识别出来的结果。

进一步的，所述差异值与预设的阈值进行比较，若所述差异值小于预设的阈值时，则进入加权处理单元，否则，指示第一识别单元42、第二识别单元43重新进行比较识别，直到识别的差异值小于预设的阈值为止。所述语音采集模块3采用麦克风将语音信号转换成电信号。启动模块1包括检测单元11及唤醒单元12，检测单元11及唤醒单元12相互连接，检测单元11用于检测是否有启动所述语音采集模块的信号，唤醒单元12用于唤醒语音采集模块。

上述说明是针对本发明较佳可行实施例的详细说明，但实施例并非用以限定本发明的专利申请范围，凡本发明所提示的技术精神下所完成的同等变化或修饰变更，均应属于本发明所涵盖专利范围。

技术特征：

技术总结
本发明涉及识别技术领域，具体为一种简单语音识别装置，包括启动模块、语音采集模块、语音处理模块、语音识别模块和输出模块；所述启动模块用于检测是否有启动所述语音采集模块的信号并唤醒语音采集模块；所述语音采集模块用于采集语音信号；所述语音处理模块用于接受所述语音采集模块采集到的语音信号，并对所述语音信号进行模数转换，所述语音识别模块用于识别经过模数转换的语音信号；所述输出模块用于输出所述语音识别模块识别出来的结果。本发明语音识别装置结构简单识别的成功率高。

技术研发人员：谢英健
受保护的技术使用者：靖西市秀美边城农业科技有限公司
技术研发日：2017.05.31
技术公布日：2017.09.15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢英健
技术所有人：靖西市秀美边城农业科技有限公司
我是此专利的发明人