本发明涉及语音控制,具体而言,涉及一种基于语音调节的调焦方法及系统。
背景技术:
1、在眼科手术中,配合眼科手术显微镜使用的非接触式广角透镜系统焦距的电动调焦需要脚踏开关进行触发,但是在手术中往往还准备有激光光凝器及其他治疗设备脚踏开关,在长期手术过程中容易出现误踏的情况,导致手术存在隐患,同时设置较多的脚踏开关占据了较大的空间,因此亟需一种眼科手术调焦方法可以脱离脚踏开关的同时,快速精确的实现眼科手术的调焦。
技术实现思路
1、本发明的目的在于提供一种基于语音调节的调焦方法及系统,以改善上述问题。
2、为了实现上述目的,本申请实施例提供了如下技术方案:
3、一方面,本申请实施例提供了一种基于语音调节的调焦方法,所述方法包括:
4、获取语音信号,所述语音信号包括眼科手术室中采集的语音信号;
5、基于所述语音信号识别目标用户的身份,得到识别结果;
6、根据所述识别结果得到目标用户对应的权限信息,并基于所述语音信号和所述权限信息判断目标用户是否具有对调焦装置发出控制指令的权限,得到判断结果;
7、根据所述判断结果对语音信号进行预处理,得到预处理后的语音信号;
8、根据所述预处理后的语音信号对调焦装置进行调焦。
9、第二方面,本申请实施例提供了一种基于语音调节的调焦系统,所述系统包括:
10、获取模块,用于获取语音信号,所述语音信号包括眼科手术室中采集的语音信号;
11、识别模块,用于基于所述语音信号识别目标用户的身份,得到识别结果;
12、第一处理模块,用于根据所述识别结果得到目标用户对应的权限信息,并基于所述语音信号和所述权限信息判断目标用户是否具有对调焦装置发出控制指令的权限,得到判断结果;
13、第二处理模块,用于根据所述判断结果对语音信号进行预处理,得到预处理后的语音信号;
14、第三处理模块,用于根据所述预处理后的语音信号对调焦装置进行调焦。
15、第三方面,本申请实施例提供了设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述方法基于语音调节的调焦的步骤。
16、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于语音调节的调焦方法的步骤。
17、本发明的有益效果为:
18、本发明通过语音信号来识别目标用户的身份信息,从而匹配目标用户对应的权限信息,判断用户能够采取的控制指令,当用户的权限与控制指令匹配时,才能进一步对用户的语音信号进行预处理,得到预处理后的语音信号,再根据预处理后的语音信号识别出用户具体的控制指令对调焦镜进行快速的调焦,提高调焦的效率和精度。
19、本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
1.一种基于语音调节的调焦方法,其特征在于,包括:
2.根据权利要求1所述的基于语音调节的调焦方法,其特征在于,根据所述判断结果对语音信号进行预处理,得到预处理后的语音信号,包括:
3.根据权利要求1所述的基于语音调节的调焦方法,其特征在于,根据所述预处理后的语音信号对调焦装置进行调焦,包括:
4.根据权利要求3所述的基于语音调节的调焦方法,其特征在于,将所述预处理后的干扰语音信号和所述预处理后的语音信号发送至训练后的语音增强模型中,包括:
5.根据权利要求3所述的基于语音调节的调焦方法,其特征在于,将所述预处理后的干扰语音信号和所述预处理后的语音信号发送至训练后的语音增强模型中之前,还包括:
6.根据权利要求3所述的基于语音调节的调焦方法,其特征在于,根据所述控制指令对调焦装置进行调焦,包括:
7.根据权利要求6所述的基于语音调节的调焦方法,其特征在于,根据所述第三信息确定最佳合焦点的位置信息,包括:
8.一种基于语音调节的调焦系统,其特征在于,包括:
9.根据权利要求8所述的基于语音调节的调焦系统,其特征在于,所述第二处理模块,包括:
10.根据权利要求8所述的基于语音调节的调焦系统,其特征在于,所述第三处理模块,包括: