一种家庭语音处理系统的制作方法

文档序号:8682142阅读:314来源:国知局
一种家庭语音处理系统的制作方法
【技术领域】
[0001]本实用新型涉及一种在家庭环境下使用语音交互控制家用设备,特别是一种家庭语音处理系统。
【背景技术】
[0002]随着科技的发展,语音交互技术已经广泛应用于各行各业,极大的提升了人机交互的体验效果。在家庭应用场景下,各种电器设备的控制及操作对语音控制的需求十分迫切。当前已经有一些在家庭环境使用语音交互控制电器设备的案例,但是由于家庭环境下充斥着各类噪声,而且说话人位置不固定,类似这些不确定因素导致语音交互准确性大大降低,用户体验较差,语音交互在家庭环境下使用存在巨大的挑战。
【实用新型内容】
[0003]本实用新型技术解决问题:当前的语音交互设备在安静环境下使用准确率较高,在不同家庭应用场景下使用鲁棒性较差,用户体验效果不好,为了克服现有技术的不足,本实用新型提供一种家庭语音处理系统,在家庭应用环境下时,提高了语音交互准确性,提升了用户体验效果。
[0004]本实用新型采用如下技术解决方案来实现上述目的:一种家庭语音处理系统,如图1所示,包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。
[0005]所述多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作;
[0006]所述微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器通过通讯装置将控制信息传送给控制装置,由控制装置实现对相关设备的控制;
[0007]所述语音唤醒模块、声源定位模块、语音增强模块、语音识别模块在微处理器中运行;录音装置的输出接至声源定位模块的输出,声源定位模块的输出连接语音增强模块,语音增强模块的输出分别接至语音唤醒模块和语音识别模块;所述声源定位模块根据多麦克风装置采集的语音信息确定声源至系统的相对位置;所述语音增强模块基于声源定位模块确定的声源位置信息形成有效波束,对波束内有效语音信号进行增强,对波束外噪声进行抑制;所述语音唤醒词模型引擎预置在处理器中,多麦克风装置采集的语音信息与内置的模型引擎进行对比语音识别,并输出结果;所述语音识别模块为有限词集语音识别系统。
[0008]所述多麦克风装置为多麦克风阵列,多麦克风“一”字排开,各麦克风之间间距不限。
[0009]所述通讯装置包含有线和无线两种形式,有线方式包含IIC、UART、SPI形式,无线方式包含2.4G、蓝牙、Wi Fi形式。
[0010]与现有技术方案相比,本实用新型的有益效果是:本实用新型使用多麦克风阵列系统,相对于传统的单麦克风采音系统,能够采集更多空间内的语音信息,为声源定位、语音增强提供数据保障。声源定位技术能够准确判定人员的位置信息,结合语音增强技术能够有效提升语音信号信噪比,提升在家庭环境下语音交互的准确性,提升用户体验效果,进而实现语音交互在家庭应用环境下的普及。
【附图说明】
[0011]图1是本实用新型系统框图;
[0012]图2是本实用新型涉及语音唤醒模块示意图;
[0013]图3是本实用新型涉及声源定位模块示意图;
[0014]图4是本实用新型涉及语音增强模块示意图。
【具体实施方式】
[0015]如图1所示,本实用新型一种家庭语音处理系统包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。多麦克风装置麦克风数量大于等于2个,麦克风类型以硅麦克风为主,同时能够兼顾普通驻极体麦克风;录音装置采用高精度、多通道录音芯片,提供高质量录音;语音唤醒模块、声源定位模块、语音增强模块、语音识别模块运行在微处理器中,微处理器使用高性能DSP芯片。
[0016]如图2所示,语音唤醒模块实现过程如下:
[0017](I)声学特征提取:通过语音增强模块获取处理后的语音信号,提取具有区分性的、基于人耳听觉特性的特征;
[0018](2)唤醒词检测:将提取的声学特征在唤醒词检测网络上计算声学得分,如果声学得分最优路径包含检测唤醒词,则确认检出唤醒词,否则重新回到第一步重新进行声学特征提取;
[0019](3)唤醒词确认:将步骤二计算的声学得分与预先设定的门限进行对比,如果声学得分大于门限值,则确认为真实唤醒词,输出给执行模块,如果声学得分小于门限值,则确认为虚假唤醒词,重新回到第一步重新进行声学特征提取。
[0020]如图3所示,声源定位模块实现过程如下:
[0021](I)延时时间计算:根据麦克风阵列装置中各个麦克风录音音频计算延时时间T ;
[0022](2)位置估计:将第一步计算的延时时间进行位置估算计算,确定目标声源的空间位置信息;
[0023](3)位置确认及输出:将第二步确定的空间位置信息值进行确认评估,如果评估通过则输出空间信息,如果评估不通过则重新回到第一步执行。
[0024]如图4所示,语音增强模块实现过程如下:
[0025](I)束波形成:根据声源定位模块提供的声源空间位置信息形成针对声源的束波;
[0026](2)语音降噪:对步骤一所述束波内语音信号进行语音降噪处理,提升语音信号信噪比;
[0027](3)结果输出:将语音增强信号输出给后级语音处理模块。
[0028]通讯装置包含有线和无线两种形式,有线方式包含IIC、UART、SPI形式,无线方式包含2.4G、蓝牙、Wi Fi形式。
[0029]本实用新型工作过程如下:
[0030]以电视语音交互应用为例。当多个用户在家庭客厅里使用语音交互控制电视时,此应用场景的特点是(I)应用场景中有多个用户需要使用语音交互控制电视;(2)应用场景中有电视背景噪声、家庭内各种嘈杂声等噪声存在。基于本实用新型的实现方式为:
[0031]第一步:通过语音唤醒模块启动语音交互,在电视正常运行条件下,用户通过语音唤醒词,如“你好语音助理”,将设备从正常运行状态打断,调整到语音交互状态,相当于我们通过遥控器控制设备需要先拿到遥控器一样。
[0032]第二步:通过声源定位模块获取控制权,在多个用户控制一个设备的条件下,某用户想要控制设备,必须先获取对设备的控制权,相当于通过遥控器控制设备遥控器必须先抢到遥控器一样。通过唤醒词唤醒设备的同时,声源定位模块将获取发音人的位置,并将控制权交给发音人。
[0033]第三步:通过语音识别进行语音交互,当用户获取控制权后,通过语音识别模块即可实现对设备的控制,应用环境中的各种噪声将会影响语音识别交互的准确性,语音增强模块能够实现在嘈杂环境下提高目标说话人语音信噪比的效果,进而提升产品的语音交互体验效果。
[0034]以上所述的仅是本实用新型优选实施方式,用户在各类家庭环境下,例如空调语音控制、灯具语音控制同样可以通过家庭语音处理系统提高语音交互的准确性,提升语音交互效果。
[0035]应当指出,对于本领域工作人员而言,在不脱离本实用新型构思的前提下,还可以做出若干变形和改进,这都属于本实用新型的保护范畴。
【主权项】
1.一种家庭语音处理系统,其特征在于包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置; 所述多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作; 所述微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器通过通讯装置将控制信息传送给控制装置,由控制装置实现对相关设备的控制; 所述语音唤醒模块、声源定位模块、语音增强模块、语音识别模块在微处理器中运行;录音装置的输出接至声源定位模块,声源定位模块的输出连接至语音增强模块,语音增强模块的输出分别连接至语音唤醒模块和语音识别模块。
2.根据权利要求1所述的一种家庭语音处理系统,其特征在于:所述多麦克风装置为多麦克风阵列,多麦克风“一”字排开,各麦克风之间间距不限。
3.根据权利要求1所述的一种家庭语音处理系统,其特征在于:所述通讯装置包含有线或无线形。
4.根据权利要求3所述的一种家庭语音处理系统,其特征在于:所述有线方式包含IIC、UART 或 SPI 形式。
5.根据权利要求3所述的一种家庭语音处理系统,其特征在于:所述无线方式包含2.4G、蓝牙或Wi Fi形式。
【专利摘要】一种家庭语音处理系统包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作;语音唤醒模块、声源定位模块、语音增强模块、语音识别模块运行在微处理器中,微处理器将语音信息经过各模块处理后转换为控制信息;微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器将控制信息传送给控制装置,由控制装置完成相应的控制操作。本实用新型实现了在家庭环境下通过语音交互对家庭电器设备的控制,同时提升了语音识别的准确度。
【IPC分类】G10L15-20
【公开号】CN204390737
【申请号】CN201420423442
【发明人】钱勇, 康怀茂, 武兵, 邢猛, 王海坤, 谢信珍
【申请人】科大讯飞股份有限公司
【公开日】2015年6月10日
【申请日】2014年7月29日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1