语音唤醒装置及方法与流程

文档序号:13032600阅读:454来源:国知局
语音唤醒装置及方法与流程

本发明涉及一种语音唤醒装置的技术领域,特别涉及一种语音唤醒装置及方法。



背景技术:

目前的智能音箱、人工智能设备等都有语音唤醒和识别功能,为了能达到好的远场识别效果,一般采用两麦克风以上的多麦克风阵列,并结合微处理器或数字信号处理器来实现音源定位、语音增强、回声消除的效果,以提高识别准确率。但是如果系统一直处在在关键词唤醒的接收信号状态功耗一般较大,适合采用市电或大容量电池供电的设备,不太适合小电池的移动智能设备,这样使得语音唤醒合识别的应用场景受限。



技术实现要素:

本发明的主要目的为提供一种语音唤醒装置及方法,旨在解决语音唤醒装置待机功耗过大的技术问题。

本发明提出一种语音唤醒装置,包括主处理器单元、声控激活单元、麦克风阵列单元;

所述声控激活单元,用于采集并处理语音信号,当所述语音信号满足预设条件时,则生成触发信号并传输至所述麦克风阵列单元,以激活所述麦克风阵列单元接收语音信号;

所述麦克风阵列单元,用于接收并识别语音信号,当识别出关键语音信号,输出唤醒信号,所述唤醒信号用于唤醒所述主处理器单元;其中,当所述麦克风阵列单元在激活后识别时间达到预设时间,而所述麦克风阵列单元未识别出关键语音信号,所述麦克风阵列单元进入非工作状态。

进一步地,所述麦克风阵列单元包括单片机和麦克风阵列;

所述单片机,用于接收所述声控激活单元的触发信号,启动所述麦克风阵列并进入预设时间的计时,并在接收所述麦克风阵列的语音信号后,判断所述语音信号是否关键语音信号,若是则输出唤醒主处理器单元的唤醒信号,若不是则在预设时间过后输出使所述麦克风阵列单元休眠的休眠信号;

所述麦克风阵列,用于接收语音信号,并将语音信号输送给所述单片机。

进一步地,所述声控激活单元包括第一麦克风、第一带通滤波放大器、第一整流滤波器以及第一比较器;

所述第一麦克风,用于拾音并将语音转换为语音信号;

所述第一带通滤波放大器,用于接收所述第一麦克风输出的语音信号,并将语音信号放大处理输送至所述整流滤波器;

所述第一整流滤波器,用于接收放大后的语音信号,并将该语音信号处理转换成直流信号,并输送至所述第一比较器;

所述第一比较器,用于比较所述直流信号,当所述直流信号超过所述第一比较器预设的门限值,所述比较器输出所述触发信号。

进一步地,还包括有电源开关,所述电源开关分别与电源单元、声控激活单元、麦克风阵列单元连接;

所述声控激活单元输出触发信号,所述触发信号控制所述电源开关打开,电源单元通过所述电源开关供电于所述麦克风阵列单元使所述麦克风阵列单元进入识别工作状态;

当麦克风阵列单元识别时间达到所述预设时间而未识别出关键语音信号,所述触发信号控制所述电源开关关闭。

进一步地,所述电源开关还连接所述主处理器单元,所述主处理器单元接收休眠信号后控制所述电源开关关闭。

进一步地,所述声控激活单元包括第二麦克风、第二带通滤波放大器、第二整流滤波器、第二比较器以及单稳态触发器;

所述第二麦克风,用于拾音并将语音转换为语音信号;

所述第二带通滤波放大器,用于接收所述第二麦克风输出的语音信号,并将语音信号放大处理输送至所述第二整流滤波器;

所述第二整流滤波器,用于接受放大后的语音信号,并将该语音信号处理转换成直流信号,并输送至所述第二比较器;

所述第二比较器,用于比较所述直流信号,当所述直流信号超过所述第二比较器预设的门限值,所述第二比较器输出第一触发信号;

所述单稳态触发器,用于接收所述第一触发信号,并将所述第一触发信号转换成第二触发信号,所述第二触发信号控制所述电源开关。

本发明还提供一种语音唤醒方法,具体包括如下步骤:

通过声控激活单元采集并处理语音信号,当语音信号满足预设条件则通过所述声控激活单元输出触发信号,所述触发信号激活麦克风阵列单元;

通过所述麦克风阵列单元接收语音信号,当该语音信号被识别为关键语音信号则通过所述麦克风阵列单元输出唤醒信号,所述唤醒信号唤醒主处理器单元;或者,通过所述麦克风阵列单元计算语音识别时间长度,若识别时间长度达到预设时间,而所述麦克风阵列单元未识别关键语音信号,则控制所述麦克风阵列单元进入非工作状态。

进一步地,所述声控激活单元采集并输出触发信号的具体步骤包括如下:

通过第一麦克风拾音并将语音转换为语音信号,并将语音信号输送至第一带通滤波放大器;

通过所述第一带通滤波放大器对所述语音信号进行放大处理后输送至第一整流虑波器;

通过所述第一整流虑波器将放大后的语音信号转换成直流信号,并输送至第一比较器;

通过所述第一比较器将所述直流信号与预设的门限值比较,当所述直流信号超过预设的门限值则通过所述第一比较器输出所述触发信号。

进一步地,所述麦克风阵列单元识别并输出唤醒信号的具体步骤包括如下:

通过单片机接收所述触发信号,且启动麦克风阵列并进入预设时间的计时;

通过所述麦克风阵列接收语音信号,并将语音信号输送给所述单片机;

通过所述单片机接收所述麦克风阵列输出的语音信号,并判断所述语音信号是否关键语音信号,若所述语音信号为关键语音信号则通过所述单片机输出唤醒信号,所述唤醒信号将主处理器单元唤醒,若所述语音信号不是关键语音信号则通过所述单片机在预设时间过后输出休眠信号,所述休眠信号使所述麦克风阵列单元进入休眠。

进一步地,所述语音唤醒方法具体包括如下步骤:

通过第二麦克风拾音并将语音转换为语音信号,并将语音信号输送至第二带通滤波放大器;

通过第二所述带通滤波放大器对所述语音信号放大处理后输送至第二整流虑波器;

通过第二所述整流虑波器将放大后的语音信号转换成直流信号,并输送至第二比较器;

通过所述第二比较器将所述直流信号与预设的门限值比较,当所述直流信号超过预设的门限值则通过所述第二比较器输出第一触发信号;

通过单稳态触发器接收所述第一触发信号,并将第一触发信号转换成第二触发信号,所述第二触发信号控制电源开关打开,电源单元通过所述电源开关供电于所述麦克风阵列单元;其中,通过所述麦克风阵列单元计算语音识别时间长度,若识别时间长度达到预设时间,而所述麦克风阵列单元未识别出关键语音信号,则所述第二触发信号控制所述电源单元开关关闭。

本发明中提供的语音唤醒装置采用声控激活单元以及麦克风阵列单元结合,其中在该装置在待机模式时只有声控激活单元工作,麦克风阵列单元须通过声控激活单元的激活而开始工作,使得待机功耗大大减小,装置的待机电流,特别是环境噪音不大时的待机电流比原来大大降低,即使小电池也能提供足够的电量,使该语音唤醒装置可以应用在移动智能终端上,大大地提高了语音唤醒装置的应用范围。

附图说明

图1为本发明一实施例中的语音唤醒装置结构示意图;

图2为本发明实施例一中的语音唤醒装置结构示意图;

图3为本发明实施例一中的声控激活单元结构示意图;

图4为本发明实施例二中的声控激活单元结构示意图;

图5为本发明实施例三中的语音唤醒的方法步骤图;

图6为本发明实施例三中步骤s1的方法步骤图;

图7为本发明实施例三中步骤s2的方法步骤图;

图8为本发明实施例四中的语音唤醒的方法步骤图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

参照图1-8,本发明提供的语音唤醒装置,包括声控激活单元10、麦克风阵列单元20、主处理器单元30以及电源单元40。

其中,声控激活单元10,用于采集并处理语音信号,并设有预设条件,当上述处理过的语音信号满足预设条件,则通过声控激活单元10生成触发信号并传输至麦克风阵列单元20,以激活麦克风阵列单元20接收语音信号。

例如预设条件为“hello”的语音信号,则预设的语音为前置唤醒词“hello”,当该前置唤醒词被声控激活单元10采集并处理得到“hello”的语音信号,该语音信号满足预设条件,声控激活单元10输出触发信号激活麦克风阵列单元20。

上述预设条件可以根据用户需求而设置,进一步地,为了较高的声控灵敏度和抗噪声性能,前置唤醒词可以采用一个双音节词或两个单音字,发声的基频可以在400hz至3khz之间,以便采用硬件带通滤波器将带外噪声滤除。

麦克风阵列单元20,用于接收语音信号,并预设有识别关键语音信号的程序和麦克风阵列单元20识别出唤醒语音信号的预设时间,麦克风阵列单元20被激活后,当接收的语音信号被识别为关键语音信号,则麦克风阵列单元20输出唤醒信号,唤醒信号唤醒主处理器单元30,同时麦克风阵列单元20退出该识别关键语音信号的程序,并等待接收和识别后续语音信号,例如采用本地语音识别引擎或联网到云端服务器进一步识别其它语音信号;当接收的语音信号不是关键语音信号,则该语音信号不能被麦克风阵列单元20识别,预设时间过后,麦克风阵列单元20进入非工作状态。

例如关键唤醒词可以设置为“alexa”,则关键语音信号为“alexa”的语音信号,且识别预设时间为5s,当麦克风阵列单元20接收并通过波束形成、多麦降噪、语音增强、回音消除等方法来准确识别出“alexa”的语音信号,则输出唤醒信号,该唤醒信号唤醒主处理器,当5s过后,麦克风阵列单元20仍未识别出“alexa”的语音信号,则麦克风阵列单元20进入非工作状态。

当主处理器单元30被唤醒信号输出应答信号,并执行相应的操作,直到接收到休眠信号,才使主处理器单元30和麦克风阵列单元20进入非工作状态。

电源单元40分别供电于声控激活单元10、麦克风阵列单元20和主处理器单元30,使其可以正常工作。

这样上述语音唤醒装置在待机模式时只有声控激活单元10工作,麦克风阵列单元20须通过声控激活单元10的激活而开始工作,主处理器单元30需经过麦克风阵列单元20的唤醒才开始工作,这样使得待机功耗大大减小,待机电流减低,从而使该语音唤醒装置可以应用的移动智能终端上。

实施例一:

如图2至图3所示,声控激活单元10包括第一麦克风110、第一带通滤波放大器111、第一整流滤波器112以及第一比较器113,且第一麦克风110、第一带通滤波放大器111、第一整流滤波器112以及第一比较器113依次连接。

其中,第一麦克风110用于拾音并将语音转换为语音信号;第一带通滤波放大器111用于接收麦克风输出的语音信号,并将语音信号放大处理输送至第一整流滤波器112;第一整流滤波器112用于接收放大后的语音信号,并将该语音信号处理转换成直流信号输送至第一比较器113;第一比较器113用于比较直流信号,当直流信号超过第一比较器113预设的门限值,则第一比较器113输出电平翻转,即触发信号。

其中上述预设条件为本实施例中的直流信号超过第一比较器113预设的门限值。

麦克风阵列单元20包括单片机201和麦克风阵列202,第一比较器113连接单片机201的中断口,单片机201分别与麦克风阵列202以及主处理器单元30连接。

其中单片机201用于接收声控激活单元10的触发信号,接收到触发信号后启动麦克风阵列202,即第一比较器113输出的电平翻转脉冲边沿触发单片机201中断,并控制麦克风阵列202进入工作状态且进入预设时间的计时;麦克风阵列202用于接收语音信号,并将语音信号输送给单片机201;单片机201接收麦克风阵列202输送的语音信号后,判断该语音信号是否为关键语音信号,若是则单片机201输出唤醒主处理器单元30的唤醒信号,若不是则在识别的预设时间过后单片机201输出使麦克风阵列单元20休眠的休眠信号。

实施例二:

如图4所示,声控激活单元10包括第二麦克风120、第二带通滤波放大器121、第二整流滤波器122、第二比较器123以及单稳态触发器124,第二麦克风120、第二带通滤波放大器121、第二整流滤波器122、第二比较器123以及单稳态触发器124依次连接。

其中,第二麦克风120用于拾音并将语音转换为语音信号;第二带通滤波放大器121用于接收麦克风输出的语音信号,并将语音信号放大处理输送至第二整流滤波器122;第二整流滤波器122用于接收放大后的语音信号,并将盖语音信号处理转换成直流信号输送至第二比较器123;第二比较器123用于比较直流信号,当直流信号超过第二比较器123预设的门限值,则第一比较器113输出电平翻转,即第一触发信号;单稳态触发器124用于接收第一触发信号并将第一触发信号转换成第二触发信号,即第二比较器123输出的电平翻转脉冲边沿触发单稳态触发器124,单稳态触发器124输出带有时间限定的脉冲。

其中,上述预设条件为本实施例中的直流信号超过第二比较器123预设的门限值。

麦克风阵列单元20与电源单元40之间连接有电源开关125,单稳态触发器124与电源开关125连接。

上述带有时间限定的脉冲控制电源开关125打开,电源单元40可以通过电源开关125供电于麦克风阵列单元20,使麦克风阵列单元20可以进入正常的识别工作状态。

上述带有时间限定的脉冲可以为10秒的单稳态脉冲,在10秒后麦克风阵列单元20未仍未识别出关键语音信号,则该脉冲消失,电源开关125关闭,麦克风阵列单元20断电;若在10秒内麦克风阵列单元20识别出关键语音信号,则麦克风阵列单元20输出唤醒信号并唤醒主处理器单元30,同时麦克风阵列单元20退出识别关键语音信号的程序,并等待接收和识别后续语音信号。

其中电源开关125还连接主处理器单元30,当主处理器单元30被唤醒后,会输出控制信号控制电源开关125在单稳态脉冲结束后保持打开状态,从而使电源单元40可以持续为麦克风阵列单元20供电;当主处理器单元30收到休眠信号,则主处理器单元30控制电源开关125关闭,使麦克风阵列单元20断电。

实施例三:

如图5所示,本发明还提供了一种对应上述语音唤醒装置的语音唤醒方法,包括如下步骤:

步骤s1:通过声控激活单元10采集并处理语音信号,当语音信号满足预设条件,则通过声控激活单元10输出触发信号,触发信号激活麦克风阵列单元20;

步骤s2:通过麦克风阵列单元20接收语音信号,当该语音信号被识别为关键语音信号,则通过麦克风阵列单元20输出唤醒信号,唤醒信号唤醒主处理器单元30;或者,通过麦克风阵列单元20计算语音识别时间长度,若识别时间长度达到预设时间,而麦克风风阵列单元未识别出关键语音信号,则控制麦克风阵列单元20进入非工作状态。

进一步地,如图6至图7所示,上述语音唤醒方法的步骤s1中,声控激活单元10采集并输出触发信号的具体包括如下步骤:

步骤s10:通过第一麦克风110拾音并将语音转换为语音信号,并将语音信号输送至第一带通滤波放大器111;

步骤s11:通过第一带通滤波放大器111对语音信号进行放大处理后输送至第一整流滤波器112;

步骤s12:通过第一整流滤波器112将放大后的语音信号转换成直流信号,并输送至第一比较器113;

步骤s13:通过第一比较器113将直流信号与预设的门限值比较,当所述直流信号超过预设的门限值,则通过第一比较器113输出触发信号。

另外,步骤2中,麦克风阵列单元20识别并输出唤醒信号的具体步骤包括如下:

步骤s20:通过单片机201接收触发信号,且启动麦克风阵列202并进入预设时间的计时;

步骤s21:通过单片机201接收麦克风阵列202的输出的语音信号,并判断语音信号是否关键语音信号,若所述语音信号为关键语音信号,则通过单片机201输出唤醒信号,唤醒信号将主处理器单元30唤醒,若所述语音信号不是关键语音信号则通过单片机201在预设时间过后输出休眠信号,所述休眠信号使麦克风阵列单元20进入休眠。

上述预设条件为本实施例中的直流信号超过预设的门限值,第一比较器113输出的触发信号可以是第一比较器113输出的电平翻转,其脉冲边沿触发单片机201中断控制麦克风阵列202开始工作,并进入预设时间的计时;其中关键语音信号可以是预设的“alexa”唤醒关键词的语音信号,当单片机201接收到麦克风阵列202输送来的语音信号为“alexa”唤醒关键词的语音信号,即所述语音信号被判断为关键语音信号,这时单片机201输出唤醒信号;在预设时间内,单片机201没有接收到麦克风阵列202输送来的“alexa”唤醒关键词的语音信号,则单片机201输出休眠信号让麦克风阵列单元20休眠。

实施例四:

如图5和图8所示,上述语音唤醒方法的步骤s1声控激活单元10采集并输出触发信号的具体包括如下步骤:

步骤s10':通过第二麦克风120拾音并将语音转换为语音,并将语音信号输送至第二带通滤波放大器121;

步骤s11':通过第二带通滤波放大器121对语音信号放大处理后输送至第二整流滤波器122;

步骤s12':通过第二整流滤波器122将放大后的语音信号转换成直流信号,并输送至第二比较器123;

步骤s13':通过第二比较器123键直流信号与预设的门限值比较,当所述直流信号超过预设的门限值,则通过第二比较器123输出第一触发信号;

步骤s14':通过单稳态触发器124接收第一触发信号,并将第一触发信号转换成第二触发信号,第二触发信号控制电源开关125打开,电源单元40通过电源开关125供电于麦克风阵列单元20;其中,通过麦克风阵列单元20计算语音识别时间长度,若识别时间长度达到预设时间,而麦克风阵列单元20未识别出关键语音信号,则第二触发信号控制所述电源开关125关闭。

上述预设条件为本实施例中的的直流信号超过预设的门限值,第二比较器123输出的第一触发信号可以是第二比较器123输出的电平翻转,其脉冲边沿触发单稳触发器输出脉冲,该脉冲带有时间限时,例如该脉冲是10秒的脉冲,则该脉冲控制电源开关125打开10秒,使电源单元40供电于麦克风阵列单元20,在10秒内若麦克风阵列单元20识别出关键语音信号,麦克风阵列单元20输出唤醒主处理器单元30的唤醒信号,电源开关125持续打开;否则10秒过后电源开关125关闭。

另外,当装置处于工作或连续的环境噪音比较大时,麦克风阵列单元20将在非工作状态和唤醒关键词识别控制程序之间循环切换,从而避免漏掉唤醒关键词。

综上所述,本发明中提供的语音唤醒装置采用声控激活单元10以及麦克风阵列单元20结合,其中在该装置在待机模式时只有声控激活单元10工作,麦克风阵列单元20须通过声控激活单元10的激活而开始工作,主处理器单元30需经过麦克风阵列单元20的唤醒才开始工作,这样在可以保证语音唤醒装置正常工作的基础上,使得待机功耗大大减小,装置的待机电流,特别是环境噪音不大时的待机电流比原来大大降低,即使小电池也能提供足够的电量,使该语音唤醒装置可以应用在移动智能终端上,提高了语音唤醒装置的应用范围。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1