一种红外热释电触发多级多词语音唤醒控制灯具的方法与流程

文档序号:14685312发布日期:2018-06-12 23:24
一种红外热释电触发多级多词语音唤醒控制灯具的方法与流程

本发明涉及语音识别控制、灯具控制技术领域,提供一种红外热释电触发多级多词语音唤醒控制灯具的方法。



背景技术:

语音识别目前在国内和国际上均表现出寡头垄断的格局。国际市场上Nuance市场份额遥遥领先,占据了62%的市场份额。在国内市场方面,科大讯飞优势明显,占据了54%的市场份额排名第一.

目前国内外语音识别技术虽然取得了很大的进展但是应用还有很多局限性,语音识别一般分为基于云端的非特定人声大规模连续语音识别、不联网的语音唤醒、可以不联网的命令词识别。

(1)云端的非特定人声大规模连续语音识别,识别精度高,可以增加语义理解、NLP、TTS功能,但是要求设备必须联网,响应时间慢、成本高、用户体验差。

(2)语音唤醒,就是一直实时检测唤醒词,用户体验好,但是当多个唤醒词时,误唤醒的概率会增大,同时唤醒词在不同的MCU上需要特别的定制,不能通用。

(3)命令词识别,就是通过某种触发如按键、语音唤醒使其工作,录3-5秒的音然后识别,这种方式比较成熟,但是运行时占用的CPU和RAM会显著增大,同时命令词在不同的MCU上需要特别的定制,不能通用。

(4)现有的不联网的语音识别模块,基本都是采用的ARM11及以上的cpu运行,体积大,成本高,功耗大,识别率低,同时由于ARM11以上芯片都必须带操作系统如linux,系统的稳定性比普通MCU差很多,不适合用在灯具上。

(5)现有的不联网的语音识别模块,由于都需要做傅里叶运算,功耗很大,而没有人时,一直在做识别,即不节能,也没有必要。

本发明可以在普通灯具的基础上,提供一种红外热释电触发多级多词语音唤醒控制灯具的方法,系统硬件由通用MCU,一个独立16位的ADC芯片,一个高灵敏、高信噪比麦克风,一个红外热释电传感器及其信号处理电路,一个拨码开关及外围电路组成,软件为多级多词语音唤醒引擎。本发明主要通过11个步骤实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而有效的培养用户习惯,让用户真正的解放双手。



技术实现要素:

本发明的目的是提供一种红外热释电触发多级多词语音唤醒控制灯具的方法,成本低、使用简单、识别率高、使用场景覆盖广,方便用户在家远距离语音控制灯具开关、调光、调色。实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而有效的培养用户习惯,让用户真正的解放双手,方便人们生活。

本发明的目的是这样实现的:系统硬件由通用MCU,一个独立16位的ADC芯片,一个高灵敏、高信噪比麦克风,一个红外热释电传感器及其信号处理电路,一个拨码开关及外围电路组成,软件为多级多词语音唤醒引擎。

系统分如下两个方面:

(1)硬件方面:

当红外热释电传感器探测到人体信号之后,电路中的传感器将会输出电压信号,信号进入U1A及周围电阻电容组成的带通放大器,直流增益为1,交流增益为50,这样就可以仅仅放大所需的信号,而不改变直流部分;然后信号通过电容C7,C7可以完成隔直通交的功能,然后信号进入直流值固定在VCC/2,交流增益为50倍的U2A组成的放大器,将信号放大到以VCC/2为中心上下浮动的可以处理的信号,这两个放大器整体组成一个一个带通的放大器,放大器的上限频率16hz,下限频率为0.5hz,中心频率为3hz,增益为2500倍,放大过的信号送给窗口比较器,当信号赋值超过窗口比较器的上下限系统就会输出高电平信号,触发多级多词语音唤醒引擎。

(2)软件方面:

步骤1:预先训练、存储多个不同唤醒词的特征值模型到系统中硬件部分的通用MCU中;

步骤2:系统根据拨码开关,选择灯具的类型:卧室灯、厨房灯、客厅灯、厕所灯、书房灯、小夜灯、台灯、小灯中的一个,并确定一个唤醒词;

步骤3:系统中高灵敏、高信噪比麦克风实时采集语音并输入独立16位的ADC芯片;

步骤4:独立16位的ADC芯片通过I2S或SPI接口把语音实时送入通用MCU;

步骤5:通用MCU实时运行预处理算法,进行回声消除、降噪;

步骤6:通用MCU实时计算预处理后的语音声学特征参数MFCC及计算似然概率打分;

步骤7:如果通用MCU实时计算的语音声学特征参数MFCC与拨码开关确定的一级唤醒词的特征值模型的特征值都不匹配,则继续进行步骤2。

步骤8:如果通用MCU实时计算的语音声学特征参数MFCC与拨码开关确定的一级唤醒词的特征值模型的特征值匹配,则停止语音唤醒流程,并开始录音。

步骤9:录音一段时间后(2-5秒可以设置),停止录音,通用MCU计算的录音的语音声学特征参数MFCC与预先存储的通用二级唤醒词识别模型不匹配,则继续进行步骤2。

步骤10:录音一段时间后(2-5秒可以设置),停止录音,通用MCU计算的录音的语音声学特征参数MFCC与预先存储的通用二级唤醒词识别模型匹配,则对灯具进行各种开关、调光、调色控制,然后则继续进行步骤2。

预先训练、存储的一级唤醒词,为大于或等于一个的一级唤醒词,唤醒词具体为卧室灯、厨房灯、客厅灯、厕所灯、书房灯、小夜灯、台灯、小灯中的一个或多个。

预先训练、存储通用二级唤醒词,为大于或等于一个的二级唤醒词,二级唤醒词具体为打开、关闭、改变颜色、增加亮度、减小亮度、变黄色光、变蓝色光、变红色光、变绿色光、变白色光中的一个或多个。

当用户说出二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能。

与现有技术相比,本发明的有益效果在于,本发明可以在灯具的基础上,提供一个系统硬件由通用MCU,一个独立16位的ADC芯片,一个高灵敏、高信噪比麦克风,一个红外热释电传感器及其信号处理电路,一个拨码开关及外围电路组成,软件为多级多词语音唤醒引擎。本发明主要通过11个步骤实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而解决了现有语音识别系统成本高、使用复杂、识别率低、占用的CPU和RAM、识别距离近、使用场景覆盖广窄无法用在灯具上的问题。本发明可用于任何灯具。

附图说明

为了更清楚地说明本发明具体实施方式中的技术方案,下面将对具体实施方式中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。

图1是本发明系统软硬件示意图。

图2是本发明系统运行流程图。

图3是红外热释电传感器及信号处理电路图。

具体实施方式

下面结合附图与具体实施方式对发明做进一步详细描述:

如图1所示,本实施例,系统包括硬件系统和软件系统,系统硬件由通用MCU,本发明可以在普通灯具的基础上,提供一种红外热释电触发多级多词语音唤醒控制灯具的方法,系统硬件由通用MCU,一个独立16位的ADC芯片,一个高灵敏、高信噪比麦克风,一个红外热释电传感器及其信号处理电路,一个拨码开关及外围电路组成,软件为多级多词语音唤醒引擎。本发明主要通过11个步骤实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而有效的培养用户习惯,让用户真正的解放双手。

该识别方法包括以下两个方面:

硬件方面:

当红外热释电传感器探测到人体信号之后,电路中的传感器将会输出电压信号,信号进入U1A及周围电阻电容组成的带通放大器,直流增益为1,交流增益为50,这样就可以仅仅放大所需的信号,而不改变直流部分;然后信号通过电容C7,C7可以完成隔直通交的功能,然后信号进入直流值固定在VCC/2,交流增益为50倍的U2A组成的放大器,将信号放大到以VCC/2为中心上下浮动的可以处理的信号,这两个放大器整体组成一个一个带通的放大器,放大器的上限频率16hz,下限频率为0.5hz,中心频率为3hz,增益为2500倍,放大过的信号送给窗口比较器,当信号赋值超过窗口比较器的上下限系统就会输出高电平信号,触发多级多词语音唤醒引擎。

放大器U1A的增益公式为:

放大器U2A的增益公式为:

很显然两个放大器的结构是一样的,实际的时候也是用的同样的参数,下边分析一下参数选择,因为信号频率再5hz左右,所以设计一个低频高增益的放大器即可对于U1A来说,当R2=800k,C2=10nF,R1=10K,C1=47uF的时候放大器带宽为0.5hz-16hz增益为50倍,同样的配置设计U2A即可得到放大倍数为2500倍,带宽0.5hz-16hz的放大器。

软件方面包含如下步骤:

步骤1:预先训练、存储多个不同唤醒词的特征值模型到系统中硬件部分的通用MCU中;

步骤2:系统根据拨码开关,选择灯具的类型:卧室灯、厨房灯、客厅灯、厕所灯、书房灯、小夜灯、台灯、小灯中的一个,并确定一个唤醒词;

步骤3:系统中高灵敏、高信噪比麦克风实时采集语音并输入独立16位的ADC芯片;

步骤4:独立16位的ADC芯片通过I2S或SPI接口把语音实时送入通用MCU;

步骤5:通用MCU实时运行预处理算法,进行回声消除、降噪;

步骤6:通用MCU实时计算预处理后的语音声学特征参数MFCC及计算似然概率打分;

步骤7:如果通用MCU实时计算的语音声学特征参数MFCC与拨码开关确定的一级唤醒词的特征值模型的特征值都不匹配,则继续进行步骤2。

步骤8:如果通用MCU实时计算的语音声学特征参数MFCC与拨码开关确定的一级唤醒词的特征值模型的特征值匹配,则停止语音唤醒流程,并开始录音。

步骤9:录音一段时间后(2-5秒可以设置),停止录音,通用MCU计算的录音的语音声学特征参数MFCC与预先存储的通用二级唤醒词识别模型不匹配,则继续进行步骤2。

步骤10:录音一段时间后(2-5秒可以设置),停止录音,通用MCU计算的录音的语音声学特征参数MFCC与预先存储的通用二级唤醒词识别模型匹配,则对灯具进行各种开关、调光、调色控制,然后则继续进行步骤2。

本发明,作为一个灯具的控制模块,可以通过硬件上的拨码开关,选择当前的灯具是什么模式,比如是安装在卧室的卧室灯、安装在厨房的厨房灯、安装在客厅的客厅灯、安装在厕所的厕所灯、安装在书房的书房灯、安装在卧室的小夜灯、安装在书房的台灯、安装在各处的小灯,通过选择灯具的一级唤醒词,选择灯具。

系统上电后根据硬件上的拨码开关,确定一级唤醒词,当用户说出一级唤醒词后(各种灯),2-5秒后判断用户有没有说出二级唤醒词如打开、关闭、改变颜色、增加亮度、减小亮度、变黄色光、变蓝色光、变红色光、变绿色光、变白色光,从而根据二级唤醒词去控制灯具的开关、调光、调色的功能。

比如用户在家躺在床上就能说:“卧室灯、打开”,卧室灯开;在厨房说:“厨房灯、关闭”,厨房灯关闭;在客厅说:“客厅灯、改变颜色”,客厅灯在正白和暖白二中色调中切换;在厕所说:“厕所灯、减小亮度”,厕所灯PWM输出分三档降低亮度;在书房说:“书房灯、增加亮度”,书房灯PWM输出分三档提高亮度。实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而有效的培养用户习惯,让用户真正的解放双手,方便人们生活。

本发明并不局限于上述实施例,在本发明公开的技术方案的基础上,本领域的技术人员根据所公开的技术内容,不需要创造性的劳动就可以对其中的一些技术特征作出一些替换和变形,这些替换和变形均在本发明的保护范围内。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1