语音识别的空调机控制方法及装置与流程

文档序号:18515448发布日期:2019-08-24 09:25阅读:1233来源:国知局
语音识别的空调机控制方法及装置与流程

本发明涉及语音识别领域,尤其涉及语音识别的空调机控制方法及装置。



背景技术:

随着社会的进步,人们的生活水平提高,人们对于生活质量的追求也越来越高,在炎热的夏天,空调无疑给人们的生活带来了舒适。

现有空调通常是遥控控制,这种方式控制起来比较麻烦,而且对于一些行动不便的人,去获取遥控器可能也是一件难事;也有少数一些企业采用语音识别的方式进行空调控制,但语音识别的精度不够高,这样一来能够适用的人群就比较少,推广起来也就相对困难,无法让人们完全体验到语音识别的便利。

当今市场急需一种识别精度较高的语音识别的空调机及相应的控制方法,能够较高精度地对空调进行语音控制,给人们的生活带来便利。



技术实现要素:

本发明的目的是解决现有技术的不足,提供语音识别的空调机控制方法及装置,能够较高精度地对空调进行语音控制,给人们带来便利。

为了实现上述目的,本发明采用以下的技术方案:提出语音识别的空调机控制方法,包括以下步骤:

101、获取采集的语音信息;

102、将所述语音信息进行预处理;

103、将预处理后的所述语音信息转化为文本文档;

104、将所述文本文档进行断句,分成名词片段和动词片段的组合形式,将所述名词片段在特定数据库进行查表匹配;

105、将匹配后的新名词片段进行组合,获得组合语音信息,通过所述组合语音信息确定组合语意信息;

106、将所述组合语意信息作为语音识别结果调用相应的控制程序进行控制操作,之后回到步骤101;若无相应的控制程序可调用,则直接回到步骤101。

进一步地,所述的预处理包括以下步骤:

201、采用带通滤波器对所述语音信息进行滤波处理;

202、将滤波处理后的所述语音信息进行a/d转换;

203、将a/d转换后的所述语音信息进行预加重处理;

204、将预加重处理后的所述语音信息进行分帧加窗处理。

进一步地,将预处理后的所述语音信息转化为文本文档包括以下步骤

301、将分帧加窗处理后的所述语音信息进行离散傅里叶变换,之后进行mel滤波;

302、将mel滤波后的所述语音信息进行离散余弦变换,之后进行能量与差分处理获得所述语音信息的mfcc参数向量;

303、根据所述语音信息的mfcc参数向量提取特征并形成相应的文本文档。

进一步地,所述特定数据库包括重点部分以及普通部分,所述重点部分为空调产品对应的所有遥控器上的按键所包含的名词信息,所述普通部分为除所述重点部分外的其他名词信息的词典。

进一步地,在进行所述查表匹配操作时,优先进行将所述名词片段与所述重点部分的匹配,接着进行将所述名词片段中未识别的片段与所述普通部分的匹配。

进一步地,在步骤101中的获取语音信息的预设时长为30s-40s。

语音识别的空调机控制装置,所述语音识别的空调机控制装置包括:安装于空调机上的语音接收模块、存储模块、语音识别模块、处理模块;

所述语音接收模块用于接收用户的语音信息;

所述存储模块用于所述特定数据库的信息、采集到的语音信息、语音信息转化后的文本文档以及控制程序;

所述语音识别模块用于进行对采集到的语音信息进行语音识别;

所述处理模块用于控制整个装置的运行。

进一步地,所述语音识别的空调机控制装置还包括返回模块,用于在确定了组合语音信息却无相应的控制程序可调用时返回步骤101。

本发明的有益效果为:本发明首先将采集到的语音信息进过一系列的预处理后生成文本文档,之后对生成的文本文档进行断句,因为空调的语音调用,往往仅仅需要识别名词,所以将生成的文本文档中的名词片段提取出来,在特定数据库进行查表匹配,最后对匹配的结果进行控制程序的调用。通过在声音采集的时候就进行精确度的把控,并略去多余的动词片段,还采用特定数据库进行查表匹配,使整个过程使语音识别的精确度得到较大的提高,能够真正使人们在使用空调时感受到便利。

附图说明

图1所示为语音识别的空调机控制方法流程图;

图2所示为语音识别的空调机的预处理过程流程图。

具体实施方式

以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。

图1所示为语音识别的空调机控制方法。包括以下步骤:

101、获取采集的语音信息;

语音信号采集是语音信号处理的前提。语音通常通过话筒输入计算机。话筒将声波转换为电压信号,然后通过a/d装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号。

目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备。其中声卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、a/d和d/a转换等功能。而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。

对于现场环境不好,或者空间受到限制,特别是对于许多专用设备,目前广泛采用基于单片机、dsp芯片的语音信号采集与处理系统。

102、将所述语音信息进行预处理;

103、将预处理后的所述语音信息转化为文本文档;

104、将所述文本文档进行断句,分成名词片段和动词片段的组合形式,将所述名词片段在特定数据库进行查表匹配;

105、将匹配后的新名词片段进行组合,获得组合语音信息,通过所述组合语音信息确定组合语意信息;

106、将所述组合语意信息作为语音识别结果调用相应的控制程序进行控制操作,之后回到步骤101;若无相应的控制程序可调用,则直接回到步骤101。

进一步地,结合图2所述的预处理包括以下步骤:

201、采用带通滤波器对所述语音信息进行滤波处理;滤波的目的有两个:一是抑制输入信号中频率超出a/2的所有分量(a:为采样频率),以防止混叠干扰;二是抑制50hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。

202、将滤波处理后的所述语音信息进行a/d转换;

203、将a/d转换后的所述语音信息进行预加重处理;根据预加重的性质,可以通过一个一阶的高通滤波器来实现,在时域输入信号x[n]并且给定一个b值0.85≤b≤1.0,则相应的滤波器为y[n]=x[n]-bx[n-1];在频域则表示为h(z)=1-a*z-1

204、将预加重处理后的所述语音信息进行分帧加窗处理。

日常生活中的声音一般是非平稳信号,其统计特性不是固定不变的,但在一段相当短的时间内,可以认为信号时平稳的,这就是加窗。窗由三个参数来描述:窗长(单位毫秒)、偏移和形状。每一个加窗的声音信号叫做一帧,每一帧的毫秒数叫做帧长,相邻两帧左边界的距离叫帧移。

从信号s[n]中提取一帧的过程可表示为y[n]=w[n]s[n],如果w[n]是矩形窗,则信号会在边界处切断,这些不连续会对傅里叶分析造成影响。因此本方案采用边缘平滑降到0的汉明窗,表达式如下:

进一步地,将预处理后的所述语音信息转化为文本文档包括以下步骤

301、将分帧加窗处理后的所述语音信息进行离散傅里叶变换,之后进行mel滤波;

302、将mel滤波后的所述语音信息进行离散余弦变换,之后进行能量与差分处理获得所述语音信息的mfcc参数向量;

303、根据所述语音信息的mfcc参数向量提取特征并形成相应的文本文档。通过采用现有成熟的mel滤波、倒谱、能量与差分的方式来获取声音信息的mfcc参数向量,进而提取特征形成文本文档的形式,在一定程度上提升了生成文本文档的准确度。

进一步地,所述特定数据库包括重点部分以及普通部分,所述重点部分为空调产品对应的所有遥控器上的按键所包含的名词信息,所述普通部分为除所述重点部分外的其他名词信息的词典。

进一步地,在进行所述查表匹配操作时,优先进行将所述名词片段与所述重点部分的匹配,接着进行将所述名词片段中未识别的片段与所述普通部分的匹配。

结合生活中那些文化程度不高的人群,他们一般学习东西的方式都是通过眼睛看到的然后去询问他人,或是从他人时常说的话来进行相应的学习,因为刚买了一个东西的话尤其是语音控制的空调这样的“大件”,往往好奇心较重,一般会去研究机械遥控器,然后才会向他人学习如何使用智能语音功能,这样一来教他们的人也可以通过遥控器这样一个眼睛能够看到的实体并结合从前使用遥控器的经验来告诉他们如何进行语音控制,这样一来二去,人们就会对遥控器上的名词信息十分熟悉,每次控制的时候也就会自觉的以遥控器上的名词作为标准,这样一来遥控器上的名词出现识别的频率就会非常高,如果将遥控器上的名字作为重点识别对象的话也会收到非常好的效果。

进一步地,在步骤101中的获取语音信息的预设时长为30s-40s。通过设置一定时间的获取语音信息的过程,防止人们话没说完就开始识别了,在一定程度上增加用户良好体验。

语音识别的空调机控制装置,所述语音识别的空调机控制装置包括:安装于空调机上的语音接收模块、存储模块、语音识别模块、处理模块;

所述语音接收模块用于接收用户的语音信息;

所述存储模块用于所述特定数据库的信息、采集到的语音信息、语音信息转化后的文本文档以及控制程序;

所述语音识别模块用于进行对采集到的语音信息进行语音识别;

所述处理模块用于控制整个装置的运行。

进一步地,所述语音识别的空调机控制装置还包括返回模块,用于在确定了组合语音信息却无相应的控制程序可调用时返回步骤101。

尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。

以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1