声音唤醒侦测装置与方法_2

文档序号：9923970阅读：来源：国知局

分段为“Hi”以及“Patent”，也可以分段为“H1-Pa”以及“tent”。
[0030]如图2B所示，于睡眠状态时，前端侦测电路210于第一侦测程序时，利用子关键词模型参数先行辨识声音信号Sa中是否有子关键词“Hi”的声音。当前端侦测电路210确认声音信号Sa中有出现子关键词“Hi”的声音后，即产生第一中断信号INTl至声音辨识处理器220。
[0031]再者，声音辨识处理器220为一种数字信号处理器(DSP)，又称为微小处理器(tinyprocessor)，其作用在于对声音信号Sa进行语音识别。同理，当第一中断信号INTl未动作之前，声音辨识处理器220未被供电，所以无法运作，此时尚处于第一侦测程序。反之，当第一中断信号INTl动作时，声音辨识处理器220被供电后即由第一侦测程序进入第二侦测程序。
[0032]于第二侦测程序时，声音辨识处理器220即根据关键词模型参数来辨识声音信号Sa是否为关键词“H1-Patent”的声音。当声音辨识处理器220确认声音信号Sa是关键词“H1-Patent”的声音，声音辨识处理器220即产生第二中断信号INT2至主处理器，并第二侦测程序由进入第三侦测程序。
[0033]反之，当声音辨识处理器220辨识声音信号Sa不是关键词“H1-Patent”的声音，并不会动作第二中断信号INT2至主处理器，并且声音辨识处理器220会再次被停止供电。此时，由第二侦测程序进入第一侦测程序，并且等待前端侦测电路210再次产生第一中断信号INTl0
[0034]明显地，本发明系于第一侦测程序时，先行进行声音信号Sa中的子关键词辨识。因此，可以有效地降低声音唤醒侦测装置执行第二侦测程序的次数，并降低电子装置的日电能损耗(day of use power consumpt1n) 0
[0035]参照图3，其所绘示为本发明电子产品中的声音唤醒侦测装置的第一实施例。电子产品中的声音唤醒侦测装置300包括:前端侦测电路310、声音辨识处理器320、以及主处理器330。其中，前端侦测电路310包括麦克风312、声音解编器(aud1 codec)314与子关键词判断电路316。麦克风312产生的模拟的声音信号，经由声音解编器314转换为数字的声音信号Sa0
[0036]再者，主处理器330连接至主存储器334，声音辨识处理器320连接至子内存322，子关键词判断电路316中有一内嵌内存(embedded memory)。当然，本发明并不限定于上述内存的连接方式，主存储器334与子内存322也可以分别为主处理器330与声音辨识处理器320中的内嵌内存，而子关键词判断电路316也可以连接外部内存。
[0037]于正常运作状态时，使用者可控制主处理器330执行训练动作。于训练动作时，主处理器330中的模型参数估算单元332即接收用户所发出关键词“H1-Patent”的声音信号Sa后，利用HMM模型来对声音信号Sa建立关键词模型参数以及子关键词模型参数。训练动作完成后，关键词模型参数以及子关键词模型参数储存于主存储器334。其中，主存储器334可为非挥发式内存(non-volatile memory)。
[0038]当电子产品即将进入睡眠状态之前，主存储器334中的关键词模型参数以及子关键词模型参数会被读取并储存于子内存322。再者，声音辨识处理器320可基于环境因素来修改子关键词模型参数。举例来说，声音辨识处理器320由声音信号Sa中获得周围环境的信噪比(SNR)、噪音的形态(noise type)等等，并使得声音辨识处理器320据以将子关键词模型参数变更为修正的子关键词模型参数(modified sub-keyword model parameter)。之后，将修正的子关键词模型参数传递至子关键词判断电路316的内嵌内存。
[0039 ]于电子产品进入睡眠状态时，前端侦测电路310会被供电，使得麦克风312、声音解编器314与子关键词判断电路316持续运作。根据本发明实施例，电子产品由睡眠状态被唤醒的过程需要经过三个侦测程序(detect1n phase)。说明如下:
[0040]于睡眠状态时，前端侦测电路310于第一侦测程序时，利用修正的子关键词模型参数先行辨识声音信号Sa中是否有子关键词“Hi”的声音。当前端侦测电路310确认声音信号Sa中有出现子关键词“Hi”的声音后，即产生第一中断信号INTl至声音辨识处理器320。
[0041]换句话说，于第一侦测程序，子关键词判断电路316会根据修正的子关键词模型参数来辨识声音信号Sa中是否出现子关键词“Hi”的声音。当子关键词判断电路316确认声音信号Sa中出现子关键词“Hi”的声音时，即产生一第一中断信号INTl至声音辨识处理器320，并进入第二侦测程序;反之，当声音信号Sa中未出现子关键词“Hi”的声音时，即维持在第一侦测程序。
[0042]再者，声音辨识处理器320为一种数字信号处理器(DSP)，又称为微小处理器，其作用在于对声音信号Sa进行语音识别。当第一中断信号INTl未动作之前，声音辨识处理器320未被供电，所以无法运作，此时尚处于第一侦测程序。反之，当第一中断信号INTl动作时，声音辨识处理器320被供电后即进入第二侦测程序。
[0043]于第二侦测程序时，声音辨识处理器320即根据关键词模型参数来辨识声音信号Sa是否为关键词“H1-Patent”的声音。当声音辨识处理器320确认声音信号Sa是关键词“H1-Patent”的声音，声音辨识处理器320即产生第二中断信号INT2至主处理器330，并第二侦测程序由进入第二侦测程序。
[0044]反之，当声音辨识处理器320辨识出声音信号Sa不是关键词“H1-Patent”的声音，并不会动作第二中断信号INT2至主处理器330，并且声音辨识处理器320会再次被停止供电。此时，由第二侦测程序进入第一侦测程序，并且等待前端侦测电路310再次产生第一中断信号INTl。
[0045]再者，于第三侦测程序时，主处理器330被供电，并进一步使得电子产品进入正常运作状态。
[0046]请参照图4，其所绘示为本发明电子产品中的声音唤醒侦测装置的第二实施例。电子产品中的声音唤醒侦测装置400包括:前端侦测电路410、声音辨识处理器420、以及主处理器430。其中，前端侦测电路410包括麦克风412、声音解编器414与子关键词判断电路416。
[0047]主处理器430连接至主存储器434，声音辨识处理器420连接至子内存422，子关键词判断电路416中有一内嵌内存(embedded memory)。
[0048]相较于第一实施例，其差异在于关键词模型参数以及子关键词模型参数的储存路径。亦即，当电子产品即将进入睡眠状态之前，主存储器434中的关键词模型参数以及子关键词模型参数会被读取并分别储存于子内存422以及子关键词判断电路416的内嵌内存。
[0049]换言之，第二实施例中的子关键词模型参数并未经过任何修改，即直接由主存储器434储存至子关键词判断电路416的内嵌内存。
[0050]同理，电子产品由睡眠状态被唤醒的过程需要经过三个侦测程序(detect1nphase)。并且，前端侦测电路410于第一侦测程序时，利用子关键词模型参数先行辨识声音信号Sa中是否有子关键词“Hi”的声音。当前端侦测电路410确认声音信号Sa中有出现子关键词“Hi”的声音后，即产生第一中断信号INTl至声音辨识处理器420。反之，则不产生第一中断信号INTl至声音辨识处理器420。
[0051]再者，第二实施例中的第二侦测程序与第三侦测程序与第一实施例相同，不再赘述。
[0052]请参照图5A与图5B，其所绘示为本发明子关键词判断电路示意图。如图5A所示，子关键词判断电路500包括:信号侦测器510、特征撷取电路(feature extractor)520、匹配电路(matching circuit)530。其中，特征撷取电路520包括:频谱分析器(spectralanalyzer)522与特征正规器(feature normalizer)524。
[0053]信号侦测器510接收声音信号Sa，并且侦测声音信号Sa的振幅、信噪比(SNR)或者子频段信噪比(sub-band SNR)。举例来说，当声音信号Sa的振幅大于一临限值(threshold)时，信号侦测器510即发出使能信号EN用以致能(enable)特征撷取电路520。
[0054]当特征撷取电路520被致能时，频谱分析器522撷取声音信号Sa中的信息，并转换为声音特征信号(voice feature signal)Ve，代表声音信号声音Sa的声音特性。接着，特征正规器524将声音特征信号Ve进行正规化(normalize)后，产生正规化声音特征信号(normalized voice feature signal)Vn0
[0055]再者，匹配电路530根据内存中预先储存的子关键词模型参数来判断所接收的正规化声音特征信号Vn是否为子关键词“Hi”的声音。当匹配电路530确认声音信号Sa中有出现子关键词“Hi”的声音后，即产生第一中断信号INT1。反之，当匹配电路530确认声音信号Sa中有未出现子关键词“Hi”的声音后，即不会产生第一中

完整全部详细技术资料下载

当前第2页1 2 3