一种语音识别方法及运用该方法的穿戴式语音控制设备的制造方法

文档序号：10654538阅读：414来源：国知局

一种语音识别方法及运用该方法的穿戴式语音控制设备的制造方法
【专利摘要】本发明提供了一种语音识别方法及运用该方法的穿戴式语音控制设备，所述穿戴式语音控制设备包括有家电控制装置、用户操作装置和存储装置，该用户操作装置设置有语音识别系统、语音学习体统及红外学习系统；语音识别系统只设置两个基本命令，可以降低语音识别系统的识别出错率，可以大大减小环境噪音的干扰，提高语音识别率，用户还可以根据自定的语音命令来控制家电，使用方便，具有更好的用户体验。而且本发明设置有存储装置，利用该存储装置存储相关命令及红外编码命令，相比现有技术，可以不需要网络的支持即可实现对各种家电不同功能的操控。
【专利说明】
一种语音识别方法及运用该方法的穿戴式语音控制设备
技术领域
[0001]本发明涉及语音领域，尤其涉及一种智能家居控制用穿戴式语音控制方法及装置。
【背景技术】
[0002]语音识别技术，也被称为自动语音识别(Automatic Speech Recognit1n，ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。
[0003]语音识别的基本原理是基于贝叶斯统计建模的理论框架，以最大后验概率决策准则判断声学特征。首先需要建立语言数据库和语音数据库，其中存放某种语言的字库和词库并关联对应的标准读音的声学特征。通过以遗传算法为主体，辅以语音、语言知识，信号处理技术，数据挖掘技术和统计建模方法对数据库进行训练。使数据库从一般性的存储数据库变成具备一定筛选功能的声学模型库和语言模型库。通过话筒等设备提取语音的声学特征之后，与数据库中的模型进行比较，对比较结果进行统计建模分析，根据事先设定的特征值得到最优结果。
[0004]穿戴式装备，是指应用穿戴式技术，对日常穿戴装备进行智能化设计，开发出可以穿戴的设备的总称。既可以是独立实现完整功能的设备，也可以是与其他设备配合使用以实现完整功能的设备。
[0005]智能家居，是以住宅为平台，利用综合布线技术、网络通信技术、智能家居-系统设计方案安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成，构建高效的住宅设施与家庭日程事务的管理系统，提升家居安全性、便利性、舒适性、艺术性，并实现环保节能的居住环境。
[0006]在智能家居领域，语音控制家电技术也逐渐占据了一席之地。比如在122届广交会(中国进出口商品交易会即广州交易会)上，海尔空调推出了首个“语音遥控器”，用户需要对着手掌大小的语音遥控器说话，可以控制空调进行开关机、调温等操作。康佳公司推出了语音电饭煲、语音微波炉，也都实现了电器的语音控制。
[0007]然而，穿戴式设备领域在语音方面的产品较少，售价高达1500美元的高端产品谷歌眼镜，可以通过声音控制拍照、视频通话和辨明方向，以及上网冲浪、处理文字信息和电子邮件等。而在智能家电控制方面的穿戴式产品，国内外至今仍是一片空白。

【发明内容】

[0008]为了克服上述问题，本发明提供了一种可以在语音指令不完整或者顺序发生错误时进行有效的纠正和模糊匹配的语音识别方法，还提供了一种能够离线处理非特定人声的语音指令，进而实现对不同家电的匹配与遥控的穿戴式语音控制装置。
[0009]为实现上述目的，本发明提供的技术方案是:
一种语音控制方法，其特征在于，它包括以下步骤: 1)在声学特征提取过程中采用隐马尔可夫模型和神经网络进行概率计算；
2)通过粒子滤波器对提取到的信号进行重采样；
3)建立语音及某语言规律的概率分布模型；
4)对步骤2)重采样后的声学特征赋予权重，并进行加权计算；
5)就步骤4)的计算结果比较步骤3)的概率分布模型，当步骤4)的计算结果不符合步骤
3)的概率分布模型，屏敝步骤2)重采样对应语音。
[0010]对于符合概率分布模型的声学特征采用多重模式识别方法进一步识别，所述多重模式识别方法包括括以下步骤:
1)根据语音指令发送的目标不同，设计了独立的语音模型和语言模型群；
2)收到语音指令时将其声学特征和不同种类的模型群进行比较，先将语音指令划分至某一大类模型中，再用这一大类模型内部的模型群进行模式识别，一直到最后与最小模型群中的具体模型进行比较，完成语音指令的识别。
[0011]采用主元分析方法划分步骤2)模型群大小和层次的依据，所述主元分析法包括以下步骤:
1)提取几个声学特征；
2)在多个特征中寻找一个辨识度最高，最能将模型区分开的特征作为模式识别的主要依据，并作为主元；
3)对所有模型进行分类，得到第一层模型群；
4)从剩下的特征中寻找一个最主要的特征作为主元；
5)对所有模型重新分类，得到下一层次的模型群；
6)重复步骤4)和5)直至将所有特征都使用完毕，并完成多层模型群的划分。
[0012]步骤I)所述的语音模型包括N-Gram模型、决策树模型、上下文无关语法语言模型等多种语言模型，并根据以下步骤执行:
1)将得到的语音信号与所有的语言模型中的主要特征进行匹配；
2)将其与所有语言模型的匹配度进行排序，选择其中匹配度最高的五种模型通过投票的方式决定。
[0013]—种语音识别方法的穿戴式语音控制设备，其包括有家电控制装置、用户操作装置和存储装置;其中，所述的家电控制装置设置有信号发射模块和信号接收模块，家电控制装置利用信号发射模块和信号接收模块与用户操作装置、存储装置远程连接;所述存储装置内设置有两个以上用于存储不同家电控制命令的存储区，所述的信号发射模块设置有红外发射器，所述的用户操作装置内设置有语音识别系统、用于学习语音命令的语音学习体统以及用于学习红外编码的红外学习系统;所述语音学习系统与红外学习系统配合，红外学习系统通过家电控制装置的信号接收模块连接与存储装置连接;所述语音识别系统设置有识别引擎，该识别引擎包括启动命令、学习命令以及语音存储区，语音学习系统与语音存储区及存储装置连接。
[0014]所述存储区都设置有若干存储小区。
[0015 ]还设置有自闭电路，该自闭电路内设置有定时装置。
[0016]所述控制设备还包括蓝牙通信模块、主控芯片、功能键与显示模块、语音合成模块、语音识别电路、单片机和无线通信模块;所述蓝牙通信模块包括蓝牙音频发射器和蓝牙音频接收器;所述蓝牙音频发射器和蓝牙音频接收器无线连接;所述蓝牙音频接收器连接语音识别电路音频输入端;所述语音识别电路数据接口与单片机输入输出接口相连接。
[0017]上述技术方案的有益之处在于:
1、本发明提供的语音识别方法可以在语音指令不完整或者顺序发生错误时进行有效的纠正和模糊匹配。
[0018]2、本发明提供了一种语音识别方法的穿戴式语音控制设备，其包括有家电控制装置、用户操作装置和存储装置，该用户操作装置设置有语音识别系统、语音学习体统及红外学习系统;语音识别系统只设置两个基本命令，可以降低语音识别系统的识别出错率，可以大大减小环境噪音的干扰，提高语音识别率，用户还可以根据自定的语音命令来控制家电，使用方便，具有更好的用户体验。而且本发明设置有存储装置，利用该存储装置存储相关命令及红外编码命令，相比现有技术，可以不需要网络的支持即可实现对各种家电不同功能的操控。
[0019]3、本发明控制装置接受操作人的语音指令，根据指令进行配对，并通过红外编码信号输出。采用蓝牙无线音频传输装置或通过WIFI通信模块来实现把控制编码调制到射频无线电载波上，操作人携带蓝牙音频发射器，通过语音实现对家电控制。
[0020]下面结合具体实施例对本发明作进一步的说明。
【具体实施方式】
[0021]实施例1
一种语音控制方法，它包括以下步骤:
1)在声学特征提取过程中采用隐马尔可夫模型和神经网络进行概率计算；
2)通过粒子滤波器对提取到的信号进行重采样；
3)建立语音及某语言规律的概率分布模型；
4)对步骤2)重采样后的声学特征赋予权重，并进行加权计算；
5)就步骤4)的计算结果比较步骤3)的概率分布模型，当步骤4)的计算结果不符合步骤
3)的概率分布模型，屏敝步骤2)重采样对应语音；
6)对于符合概率分布模型的声学特征采用多重模式识别方法进一步识别，所述多重模式识别方法包括括以下步骤:
6.1根据语音指令发送的目标不同，设计了独立的语音模型和语言模型群；
6.2收到语音指令时将其声学特征和不同种类的模型群进行比较，先将语音指令划分至某一大类模型中，再用这一大类模型内部的模型群进行模式识别，一直到最后与最小模型群中的具体模型进行比较，完成语音指令的识别；
7)采用主元分析方法划分步骤6.2模型群大小和层次的依据，所述主元分析法包括以下步骤:
7.1提取几个声学特征；
7.2在多个特征中寻找一个辨识度最高，最能将模型区分开的特征作为模式识别的主要依据，并作为主元；
7.3对所有模型进行分类，得到第一层模型群；
7.4从剩下的特征中寻找一个最主要的特征作为主元； 7.5对所有模型重新分类，得到下一层次的模型群；
7.6重复步骤7.4和7.5直至将所有特征都使用完毕，并完成多层模型群的划分。
[0022]本实施例中步骤6.1所述的语音模型包括N-Gram模型、决策树模型、上下文无关语法语言模型等多种语言模型，并根据以下步骤执行:
1)将得到的语音信号与所有的语言模型中的主要特征进行匹配；
2)将其与所有语言模型的匹配度进行排序，选择其中匹配度最高的五种模型通过投票的方式决定。
[0023]实施例2
一种语音识别方法的穿戴式语音控制设备，其包括有家电控制装置、用户操作装置和存储装置;其中，所述的家电控制装置设置有信号发射模块和信号接收模块，家电控制装置利用信号发射模块和信号接收模块与用户操作装置、存储装置远程连接。
[0024]所述的用户操作用于识别用户发出的指令，并传输给家电控制装置，存储装置用于存储不同家电遥控器的所用红外编码，家电控制装置是用于接收编码信号和发送编码信号，即接收用户操作装置所发出命令，再调动存储装置内对应编码发送给对应家电，实现对家电的控制。也可以是接收用户操作装置的“学习”命令后，再接收家电遥控器的红外编码波形，并将之存储在存储装置内。
[0025]在进行控制时，用户操作装置接收用户发出的指令，并进行识别判断，而后发出给家电控制装置，家电控制装置根据所接收的指令调动存储装置内对应的红外编码利用信号发射模块发出。
[0026]具体的，所述的存储装置内设置有存储区，存储区存储不同家电遥控器的红外编码，存储区内设置有若干存储小区，存储小区的数量为5-100或以上，若干存储小区即用于存储控制家电工作的不同红外编码;通过将存储装置分为存储区和存储小区的设置，家电控制装置接收用户操作装置的命令后，会首先确定对应该家电红外编码的存储区，再从该存储区中找出对应所接收命令的存储小区，而后则将该存储小区内的红外编码通过发射器发射出去，这种方式可以使家电控制装置精准且快速的确定对应命令的红外编码并发射出去，准确率高，反应速度快;例如，存储区包括冰箱存储区，该空调存储区包括有启动存储小区、停止存储小区、上升存储小区、下降存储小区、模式切换存储小区、定时存储小区以及温度10-50共44个存储小区，其中启动存储小区即存储空调的启动红外编码，停止存储小区即存储空调的停止红外编码，上升和下降存储小区即存储增加温度和降低温度的红外编码，模式切换即存储切换空调模式的红外编码，定时存储小区即存储空调遥控器的定时红外编码，温度10-50分别存储10-50°的红外编码；用户在操作时，发出命令如“空调启动24°”，家电控制装置则会先发出空调的启动红外编码启动空调，然后再发出24°的红外编码将空调调整为24°，若命令为“空调温度下降”，则发出下降存储小区内的红外编码，使空调温度下降I。。
[0027]具体的，所述的信号发射模块设置有一个红外发射器，红外发射器的信号发射方向位于穿戴式语音控制装置的正面，即用户正常佩戴穿戴式语音控制装置时，用户的正面即为红外发射器的发射方向；通过红外发射器的设置，家电控制装置接收命令后直接启动对应红外发射器，然后再从存储装置内确定对应该红外发射器存储区，从该存储区内找出对应命令的红外编码通过红外发射器发出，反应速度快，准确性高;在用户使用时，用户只需要正对需操控的家电，再发出命令，即可准确的操控对应家电，这种方式相对于不同红外发射器360°全方位的发射信号更为精准，即可以进一步提高本发明对于家电控制的准确率。
[0028]具体的，所述的用户操作装置内设置有语音识别系统、语音学习系统及红外学习系统;所述的红外学习系统是用于学习其他家电遥控器的红外编码，该红外学习系统包括:
步骤1，用户发出“学习”命令，并被语音识别系统识别；
步骤2，用户操作装置启动红外学习系统，同时启动家电控制装置的信号接收模块；步骤3，用户操作需学习家电的遥控器，家电控制装置接收该遥控器所发出的红外编码波形数据，并将该红外编码波形数据存储入存储装置内。
[0029]进一步的，在步骤3中，家电控制装置接收到红外学习命令后，可以通过视觉或听觉进行反馈，例如设置指示灯持续亮一段时间(例如6s)，用户需在指示灯熄灭前(共6s等待时间)将需学习的遥控器所对应的按键对准家电控制装置按下即可。
[0030]所述的语音学习系统是用于学习语音命令，与红外学习系统配合，实现对不同家电遥控器的各种命令进行学习，具体的:
步骤I，步骤I，用户发出“学习”命令，并被语音识别系统识别；
步骤2，用户操作装置启动红外学习系统以及语音学习系统，同时启动家电控制装置的信号接收模块；
步骤3，用户操作需学习家电的遥控器，家电控制装置接收该遥控器所发出的红外编码波形数据，同时用户发出对应该红外编码的波形数据的命令，该命令通过语音学习系统记录，记录的命令与对应该命令的红外编码波形数据存储入存储装置内的一个存储小区内。
[0031]例如:需学习空调遥控器，用户说出“学习”命令，红外学习系统和语音学习系统启动，然后按下空调遥控器的任意按键，例如“开启”，空调遥控器发出的“开启”红外编码被家电控制装置接收，同时，用户发出语音“开启”被语音学习系统记录，家电控制装置将语音学习系统记录的语音“开启”命令存储入语音命令存储区内，同时也将该语音命令和红外学习系统学习到的对应该语音“开启”命令的红外编码同时存入存储装置内的一个存储小区内，而后即可按下遥控器的另一按键进行学习，依次进行即可学习空调遥控器的各种遥控命令。
[0032]其中，所述的语音识别系统设置有识别引擎，该识别引擎包括:启动命令和学习命令，以及语音命令存储区，启动命令用于启动本发明穿戴式语音控制设备，学习命令用于使本发明穿戴式语音控制设备进入学习状态;通过只设置两个基本命令，可以降低语音识别系统的识别出错率，可以大大减小环境噪音的干扰，提高语音识别率，用户还可以根据自定的语音命令来控制家电，使用方便，具有更好的用户体验。而且本发明设置有存储装置，利用该存储装置存储相关命令及红外编码命令，相比现有技术，可以不需要网络的支持即可实现对各种家电不同功能的操控。
[0033]更具体的，在本发明内还设置有自闭电路，该自闭电路内设置有定时装置，自闭电路与本发明的供电系统连接，用户在没有操作时，定时装置进入倒计时状态或计时状态，倒计时或计时完毕后，自闭电路切断供电系统，即关闭本发明，降低能源的消耗。
[0034]所述控制设备还包括蓝牙通信模块、主控芯片、功能键与显示模块、语音合成模块、语音识别电路、单片机和无线通信模块;所述蓝牙通信模块包括蓝牙音频发射器和蓝牙音频接收器;所述蓝牙音频发射器和蓝牙音频接收器无线连接;所述蓝牙音频接收器连接语音识别电路音频输入端;所述语音识别电路数据接口与单片机输入输出接口相连接。
[0035]工作时，话筒接收到使用者的声音转换成电信号，进入语音识别模块，通过放大、消侧音处理、数字化处理后，与预存标准语音库的数据按照特定的算法进行比对，识别出相应的语句或控制指令来，并传送给主控芯片，多个话筒的设计将有利于消除背景噪声以提高信噪比；主控芯片根据收到的指令去执行相应的程序，通过显示模块显示相关信息，同时再把收到的指令语句通过语音合成模块转换成预设的人声，通过耳机或喇叭说出相应的语音指令来，用户在听到回馈语音信息后，可以判断前面发出的语音指令是否正确。这种方式就可以通过人机交互来提高语言识别率和可靠性。
[0036]另外，首次使用语音遥控器，需要对所有电器进行适应性配对，所以通过红外接收模块来进行智能学习和配对，具体方式就是主控芯片在执行学习模式时，通过语音提醒用户，把被控电器的遥控器对着红外接收模块，按压遥控器的键盘，发出相应的红外信息编码，红外接收模块收到红外信号并滤除载波后，把获取的键盘编码信息传送给主控芯片，主控芯片通过存储单元预存的标准代码库分析出该遥控器编码类型，再通过人机交流把该遥控编码类型与被控电器的关联保存到存储单元当中，供以后控制调用。如果在预存标准编码库里找不到对应编码类型，就要采用编码复制方式，把遥控器的每个按键对应的编码信息保存到存储单元中，同样供以后控制调用。
[0037]在本实施例中，当主控芯片接收并分析出用户发出的语音指令后，要把该指令从存储单元中取出相应的红外遥控编码，传给红外发射模块，红外发射模块实现把红外编码调制到红外载波上，再通过红外发射管向被控电器发出红外遥控信号。由于存储单元容量的限制，以及标准语言的繁杂程度，当靠穿戴式语音控制装置的处理就不够理想，所以语言的识别就不能单靠语音识别模块来实现，而是还要借助接驳互联网的云端语言识别服务器来实现。这种方式就要通过WIFI通信模块与路由器对接并连接到互联网来实现。
【主权项】
1.一种语音控制方法，其特征在于，它包括以下步骤: 1)在声学特征提取过程中采用隐马尔可夫模型和神经网络进行概率计算； 2)通过粒子滤波器对提取到的信号进行重采样； 3)建立语音及某语言规律的概率分布模型； 4)对步骤2)重采样后的声学特征赋予权重，并进行加权计算； 5)就步骤4)的计算结果比较步骤3)的概率分布模型，当步骤4)的计算结果不符合步骤3)的概率分布模型，屏敝步骤2)重采样对应语音。2.如权利要求1所述的一种语音控制方法，其特征在于:对于符合概率分布模型的声学特征采用多重模式识别方法进一步识别，所述多重模式识别方法包括以下步骤: 1)根据语音指令发送的目标不同，设计了独立的语音模型和语言模型群； 2)收到语音指令时将其声学特征和不同种类的模型群进行比较，先将语音指令划分至某一大类模型中，再用这一大类模型内部的模型群进行模式识别，一直到最后与最小模型群中的具体模型进行比较，完成语音指令的识别。3.如权利要求2所述的一种语音识别方法，其特征在于，采用主元分析方法划分步骤2)模型群大小和层次的依据，所述主元分析法包括以下步骤: 1)提取几个声学特征； 2)在多个特征中寻找一个辨识度最高，最能将模型区分开的特征作为模式识别的主要依据，并作为主元； 3 )对所有模型进行分类，得到第一层模型群； 4)从剩下的特征中寻找一个最主要的特征作为主元； 5)对所有模型重新分类，得到下一层次的模型群； 6)重复步骤4)和5)直至将所有特征都使用完毕，并完成多层模型群的划分。4.如权利要求2所述的一种语音识别方法，其特征在于:步骤I)所述的语音模型包括N-Gram模型、决策树模型、上下文无关语法语言模型等多种语言模型，并根据以下步骤执行: 1)将得到的语音信号与所有的语言模型中的主要特征进行匹配； 2)将其与所有语言模型的匹配度进行排序，选择其中匹配度最高的五种模型通过投票的方式决定。5.—种运用权利要求1所述语音识别方法的穿戴式语音控制设备，其特征在于:其包括有家电控制装置、用户操作装置和存储装置;其中，所述的家电控制装置设置有信号发射模块和信号接收模块，家电控制装置利用信号发射模块和信号接收模块与用户操作装置和存储装置远程连接;所述存储装置内设置有用于存储不同家电控制命令的存储区，所述的信号接收模块设置有红外发射器;所述的用户操作装置内设置有语音识别系统、用于学习语音命令的语音学习体统以及用于学习红外编码的红外学习系统;所述语音学习系统与红外学习系统配合，红外学习系统通过家电控制装置的信号接收模块连接与存储装置连接;所述语音识别系统设置有识别引擎，该识别引擎包括启动命令、学习命令以及语音存储区，语音学习系统与语音存储区及存储装置连接。6.如权利要求5所述的一种语音识别方法的穿戴式语音控制设备，其特征在于:所述存储区都设置有若干存储小区；所述控制设备还设有自闭电路，该自闭电路内设置有定时装置。7.如权利要求5所述的一种语音识别方法的穿戴式语音控制设备，其特征在于:所述控制设备还包括蓝牙通信模块、主控芯片、功能键与显示模块、语音合成模块、语音识别电路、单片机和无线通信模块;所述蓝牙通信模块包括蓝牙音频发射器和蓝牙音频接收器;所述蓝牙音频发射器和蓝牙音频接收器无线连接;所述蓝牙音频接收器连接语音识别电路音频输入端;所述语音识别电路数据接口与单片机输入输出接口相连接。
【文档编号】G10L15/26GK106023995SQ201610535986
【公开日】2016年10月12日
【申请日】2016年7月10日
【发明人】郭永禄, 施众, 杨辉潜, 郭蓉汾
【申请人】漳州凯邦电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭永禄;施众;杨辉潜;郭蓉汾;
技术所有人：漳州凯邦电子有限公司;
我是此专利的发明人

上一篇：基于十字形声阵列宽带波束形成的声识别方法
上一篇：一种语音处理的方法、装置以及系统的制作方法