一种智能家居语音控制系统及其语音识别方法与流程

文档序号:12736580阅读:902来源:国知局
一种智能家居语音控制系统及其语音识别方法与流程

本发明涉及一种语音系统,具体是一种智能家居语音控制系统及其语音识别方法。



背景技术:

语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,计算机对语音的理解是计算机科学中的一个引人人胜的、富有挑战性的课题。

随着科技的发展,语音交互模块被越来越多的应用到智能家居系统里面。考虑到智能家居的应用性、便捷性和小型化需求,目前应用于智能家居的语音交互系统基本都是 用嵌入式系统,这些嵌入式系统大都采用专门的语音识别芯片,如 MCU、DSP和语音识别专用芯片。

目前业界的智能家居语音控制系统及其语音识别方法识别的语音指令,都是前期预设在嵌入式系统中,目前主流的的语音识别方法是基于HTK(Hidden Markov Model Toolkit)进行开发的,HTK是一套专门的建立和处理隐马可夫模型(HMMs)的实验工具包,由英国剑桥大学工程系开发,主要应用于语音识别领域。HTK经过剑桥大学、 Entropic公司及 Microsoft公司的不断增强和改进,使其在语音识别领域处于世界领先水平。

然而基于HTK的语言识别时,识别结果只能显示在DOS或终端上,而且不利于将结果保存、移植或者二次开发利用。



技术实现要素:

本发明的目的在于提供一种智能家居语音控制系统及其语音识别方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种智能家居语音控制系统,通过麦克风拾取声音信号,并经AD转换电路完成模数转换后送到语音处理模块,经语音处理模块完成编解码过程后分成两路,一路直接送控制器,控制器采用语音识别算法进行运算;另一路送到DA转换电路进行数模转换后送功率放大电路放大,放大后的语音信号通过扬声器对外输出;所述语音处理模块还为控制器、AD转换电路、DA转换电路、功率放大电路供电。

优选的,所述控制器采用芯片OMAP3530。

优选的,所述语音处理模块采用集电源管理、ADC、嵌入式电源控制和全功能音频编解码器于一体的芯片TPS65930。

优选的,所述语音识别算法采用语音识别软件应用系统,具体包括语音信号采集模块、基于DMA的双向高速RAM存取模块、语音识别模块、系统管理模块和语音输出模块。

优选的,所述系统管理模块负责系统的总体管理调度,是应用系统的调度中心。

优选的,所述语音信号采集模块负责控制芯片TPS65930。

优选的,所述基于DMA的双向RAM存取模块负责实现DMA驱动及双向RAM的读写存取,使用通道1来实现高速地把语音信号采集到的数据存储到RAM存储模块上,并使用通道2实现高速地把RAM存储模块上的数据取出来,用于语音的识别。

优选的,所述语音输出模块负责把相应的音频数据送到芯片TPS65930,并控制芯片TPS65930对接收到的音频解码输出到功率放大电路,实现语音输出的功能。

优选的,所述语音识别模块采用如下方法对语音进行识别:(1)将智能家居电器的语音控制功能与相应的语音信息建立对应关系;(2)控制器接收到语音处理模块送来的语音信号,此时的语音信号已经被语音处理模块进行了解码,控制器将上述解码后的语音信号进行傅里叶变换,从而将上述语音信号从时间域变换到频率域;(3)对上述频率域的频谱进行划分,提取划分后每个小方格的梯度直方图特征,划分的个数在识别效率和识别精度间取平衡;建立与RAM存储模块上预存储语音对象相适应的基于数值估计的模型,根据所述梯度直方图特征计算每个小方格对应于该模型的评分;采用下式计算每个小方格对应于所述模型的局部评分:

Sk(I,gi,pk)=wk*φ(I,gi)

其中,I表示当前语音信息,gi表示当前语音信息中第i个小方格,pk表示所述模型的第k个部位,φ(I,gi)表示当前语音信息中小方格gi的梯度直方图特征;

针对所述模梯度直方图特征,筛选几个局部评分较高的小方格,筛选的个数在识别效率和识别精度间取平衡;

对筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;

将最高的全局评分与阈值比较,若超出所述阈值则判定语音中存在待识别的语音信息;

(4)根据识别出来的语音信息指令,根据(1)中所述的对应关系,控制相应的执行机构工作;实现智能语音控制功能。

与现有技术相比,本发明的有益效果是:本发明智能家居语音控制系统及其语音识别方法,基于傅里叶变换对语音信息进行识别,配合由芯片OMAP3530担任控制器的控制系统,在保证语音识别精度的情况下,还能够实现高速的存储功能,方便保存、移植或者二次开发利用;另外本发明还采用集电源管理、ADC、嵌入式电源控制和全功能音频编解码器于一体的芯片TPS65930为系统供电,相对于独立的电源,具有集成度高、体积小的优点,适应于小型化的发展。

附图说明

图1为智能家居语音控制系统的结构示意图。

图2为智能家居语音控制系统控制流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1~2,本发明实施例中,一种智能家居语音控制系统及其语音识别方法,通过麦克风拾取声音信号,并经AD转换电路完成模数转换后送到语音处理模块,经语音处理模块完成编解码过程后分成两路,一路直接送控制器,控制器采用语音识别算法进行运算;另一路送到DA转换电路进行数模转换后送功率放大电路放大,放大后的语音信号通过扬声器对外输出;所述语音处理模块还为控制器、AD转换电路、DA转换电路、功率放大电路供电。所述控制器采用芯片OMAP3530;所述语音处理模块采用集电源管理、ADC、嵌入式电源控制和全功能音频编解码器于一体的芯片TPS65930;所述语音识别算法采用语音识别软件应用系统,具体包括语音信号采集模块、基于DMA的双向高速RAM存取模块、语音识别模块、系统管理模块和语音输出模块;所述系统管理模块负责系统的总体管理调度,是应用系统的调度中心。所述语音信号采集模块负责控制芯片TPS65930;所述基于DMA的双向RAM存取模块负责实现DMA驱动及双向RAM的读写存取,使用通道1来实现高速地把语音信号采集到的数据存储到RAM存储模块上,并使用通道2实现高速地把RAM存储模块上的数据取出来,用于语音的识别;所述语音输出模块负责把相应的音频数据送到芯片TPS65930,并控制芯片TPS65930对接收到的音频解码输出到功率放大电路,实现语音输出的功能。

所述语音识别模块采用如下方法对语音进行识别:(1)将智能家居电器的语音控制功能与相应的语音信息建立对应关系;(2)控制器接收到语音处理模块送来的语音信号,此时的语音信号已经被语音处理模块进行了解码,控制器将上述解码后的语音信号进行傅里叶变换,从而将上述语音信号从时间域变换到频率域;(3)对上述频率域的频谱进行划分,提取划分后每个小方格的梯度直方图特征,划分的个数在识别效率和识别精度间取平衡;建立与RAM存储模块上预存储语音对象相适应的基于数值估计的模型,根据所述梯度直方图特征计算每个小方格对应于该模型的评分;采用下式计算每个小方格对应于所述模型的局部评分:

Sk(I,gi,pk)=wk*φ(I,gi)

其中,I表示当前语音信息,gi表示当前语音信息中第i个小方格,pk表示所述模型的第k个部位,φ(I,gi)表示当前语音信息中小方格gi的梯度直方图特征;

针对所述模梯度直方图特征,筛选几个局部评分较高的小方格,筛选的个数在识别效率和识别精度间取平衡;

对筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;

将最高的全局评分与阈值比较,若超出所述阈值则判定语音中存在待识别的语音信息;

(4)根据识别出来的语音信息指令,根据(1)中所述的对应关系,控制相应的执行机构工作;实现智能语音控制功能。

本发明中扬声器用于播放识别的语音信息,在无法找到预存储的语音指令时,播放“无关语句”语音提示操作者,使操作者能够及时发现识别失误的情况,从而对受控的智能家居电器重新下语音指令。

在实验中总共进行了3轮话语测试,每轮500句话语测试,其中250句为系统需要识别的话语,250句话语为机器人不予置理的无关话语。本系统只设置10个需要识别的话语,由25名测试者分别读音进行测试。同时对无关话语也是由该25名测试者,每人10句分别随机读音测试。第1轮中,先测试的250句无关话语中,能正确识别出无关话语数为250句,识别出无关话语率为100%,但对需识别的话语中,正确识别出247句,3句识别出错,识别率为98.8%;在第2轮中,同样先测试的250句无关话语中,能正确识别出无关话语数为250句,识别出为无关话语率为100%,但对需识别的话语中,正确识别出245句,5句识别出错,识别率为98%;在第3轮中,同样先测试的250句无关话语中,能正确识别出无关语句数为250句,识别出为无关话语率为100%,但对需识别的话语中,正确识别出246句,识别率为98.4%。并且在试验测试的过程中,系统的响应速度都非常快,感官上没有时间延迟,与真人交流速度相当。

综上所述,本发明智能家居语音控制系统及其语音识别方法,基于傅里叶变换对语音信息进行识别,配合由芯片OMAP3530担任控制器的控制系统,在保证语音识别精度的情况下,还能够实现高速的存储功能,方便保存、移植或者二次开发利用;另外本发明还采用集电源管理、ADC、嵌入式电源控制和全功能音频编解码器于一体的芯片TPS65930为系统供电,相对于独立的电源,具有集成度高、体积小的优点,适应于小型化的发展。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1