本发明涉及音响控制领域,涉及到一种基于智能语音的音响。
背景技术:
1、随着智能语音技术的快速发展,其在智能家居、智能客服、智能车载等领域的应用日益广泛,用户规模持续增长。用户对智能语音设备的交互体验提出了更高要求。然而,现有技术在实际应用中仍存在以下不足:1.设备激活可靠性低:现有技术,如授权公告号为cn114071323b的中国专利公开了基于全景播放的tws音响的控制方法及控制装置,通过到位感应激活设备,但在多人场景中易误判,且用户靠近设备未必有使用需求,导致不必要的触发。
2、2.多人控制场景适应性差:缺乏主用户退出、次用户接管的机制,无法有效处理多人交互时的指令获取与执行。
3、3.用户区分与响应效率不足:未区分新老用户,老用户无法享受基于历史指令的实时解析与推荐,影响响应速度。
4、此外,现有技术未充分考虑用户音色变化对语音识别的影响,导致识别准确性下降。因此,亟需一种更智能、可靠的语音控制方案以解决上述问题。
技术实现思路
1、针对上述问题,本发明提出了一种基于智能语音的音响,实现对音响控制的功能。
2、本发明解决其技术问题采用的技术方案是:本发明提供一种基于智能语音的音响,包括:语音唤醒模块:采集环境首段音频,过滤非人声后基于音色分离出各音频,若音频含有唤醒指令,则标记该音频所属人员为设备唤醒者,若无则结束运行。
3、指令发出者识别模块:采集次段音频,若存在设备唤醒者或其他人员的含操作指令的音频,则识别指令发出者并执行指令,若无则结束运行。
4、用户类型识别模块:比对指令发出者音色与历史用户音色,若匹配则为老用户,执行老用户模式运行模块并对历史用户音色迭代更新,否则为新用户,执行新用户模式运行模块。
5、新用户模式运行模块:在指令发出者语音输入结束后,解析完整音频并与指令库匹配执行操作指令。
6、老用户模式运行模块:在指令发出者语音输入过程中,基于其历史操作指令集实时解析已输入音频并推荐疑似操作指令,若被采纳则立即执行,否则在输入结束后匹配完整音频执行。
7、相对于现有技术,本发明所述的一种基于智能语音的音响以下有益效果:(1)精准的语音唤醒控制:通过音色分离与唤醒指令双重验证,有效避免环境噪声或无关人员导致的误触发,提升唤醒可靠性。
8、(2)多用户场景适配性:支持主用户唤醒后由其他用户接管控制,通过音色识别区分指令发出者,满足多人协同使用的复杂需求。
9、(3)用户类型差异化处理:对新用户采用完整指令解析模式,确保操作准确性;对老用户实时推荐历史指令,显著提升响应速度与交互效率。
10、(4)动态音色特征更新:检测到用户音色变化后,通过保守缩放系数调整音色特征的数值范围,平衡适应性与稳定性,避免单次异常值干扰,进而实现用户音色的迭代更新。
1.一种基于智能语音的音响,其特征在于,包括:
2.根据权利要求1所述的一种基于智能语音的音响,其特征在于:所述语音唤醒模块的具体工作过程为:
3.根据权利要求1所述的一种基于智能语音的音响,其特征在于:所述指令发出者识别模块的具体工作过程为:
4.根据权利要求3所述的一种基于智能语音的音响,其特征在于:所述判断各音频是否包含指令库中的操作指令的具体过程为:
5.根据权利要求4所述的一种基于智能语音的音响,其特征在于:计算所述关键词集合与指令库中各操作指令的匹配度,具体过程为:
6.根据权利要求1所述的一种基于智能语音的音响,其特征在于:所述用户类型识别模块的具体工作过程为:
7.根据权利要求6所述的一种基于智能语音的音响,其特征在于:所述计算指令发出者与各历史用户在每一音色特征上的匹配度,具体过程为:
8.根据权利要求6所述的一种基于智能语音的音响,其特征在于:所述对历史用户音色迭代更新的具体过程为:
9.根据权利要求1所述的一种基于智能语音的音响,其特征在于:所述新用户模式运行模块的具体工作过程为:
10.根据权利要求1所述的一种基于智能语音的音响,其特征在于:所述老用户模式运行模块的具体工作过程为: