本技术涉及语音识别领域,尤其涉及一种语音识别与车辆控制方法、语音识别系统及车辆。
背景技术:
1、随着语音指令在车内控制中的广泛应用,包括音量调节、车窗控制、空调调节、运动模式选择,甚至车辆辅助驾驶开启和座椅调节等功能,驾驶者和乘客享受到了更多便利。现有技术中,通常默认了座舱内的语音指令来源于驾驶员或被授权人员,且为安全指令。然而,在语音指令不来源于驾驶员和被授权人员时,或者语音识别系统受到外部语音干扰或攻击时,会导致车辆执行一些非驾驶者和被授权人员发出的控制指令,车辆安全驾驶受到影响。
技术实现思路
1、本技术提供了一种语音识别与车辆控制方法、语音识别系统及车辆。通过预先确定语音指令是否安全,在确定采集的语音指令是安全语音指令的情况下,根据语音指令控制车辆,从而可以提高车辆操作的安全性。
2、第一方面,本技术实施例提供了一种语音识别方法,包括:
3、对语音控制指令与目标语音控制指令进行识别,确定语音控制指令是否安全;
4、其中,目标语音控制指令包括系统预设语音,和/或对接收的语音控制指令进行预处理之后的语音指令。
5、上述方法中,通过识别和验证语音控制指令,可以有效防止恶意指令的执行,保护用户和车辆的安全,避免因恶意攻击导致的安全风险。
6、在第一方面的一种可能的实现方式中,在对语音控制指令与目标语音控制指令进行识别之前,包括:
7、接收用户输入的语音控制指令。
8、在第一方面的一种可能的实现方式中,系统预设语音包括来源于系统存储人员的语音,对语音控制指令与目标语音控制指令进行识别,确定语音控制指令是否安全的具体流程如下:
9、判断语音控制指令是否来源于系统存储人员,在语音控制指令来源于系统存储人员的情况下,确定语音控制指令为安全的语音控制指令,在语音控制指令不来源于系统存储人员的情况下,确定语音控制指令为不安全的语音控制指令。
10、上述方法中,判断语音控制指令是否来源于系统存储人员,对于来自系统存储联系人的语音指令,可以认定为经过授权的操作,将来自系统存储联系人的语音指令输入语音识别与防御模块,可以提高指令的准确性和可靠性,确保车辆操作的精准性和稳定性。对于不来源于系统存储联系人的语音指令,确定语音控制指令为不安全的语音控制指令,可以避免误操作和意外发生,保障车辆操作的安全性和稳定性。
11、在第一方面的一种可能的实现方式中,在判断语音控制指令是否来源于系统存储人员之前,该方法还包括:
12、判断语音控制指令是否为人声语音;
13、在语音控制指令是人声语音的情况下,判断语音控制指令是否来源于系统存储人员,在语音控制指令不是人声语音的情况下,语音控制指令为不安全的语音控制指令。
14、上述方法中,确定语音控制指令是否为人声语音。人声语音可以为后续的语音识别提供准确的输入数据。对于被确定为非人声语音的语音控制指令,通过将语音控制指令为不安全的语音控制指令,可以避免不必要的计算和资源浪费,提高系统的效率和性能。
15、在第一方面的一种可能的实现方式中,对语音控制指令与目标语音控制指令进行识别,确定语音控制指令是否安全的流程还包括:
16、将语音控制指令输入第一语音处理模块得到第一输出结果;
17、将语音控制指令输入第二语音处理模块得到第二输出结果,第一输出结果和第二输出结果的类型相同;
18、其中,第一语音处理模块用于对语音控制指令直接转化输出,第二语音处理模块用于对语音控制指令进行降噪和语言判断后转化输出;
19、对第一输出结果和第二输出结果进行距离判断;
20、在距离小于设定距离阈值的情况下,确定语音控制指令为安全语音指令;
21、在距离大于或等于设定距离阈值的情况下,确定语音控制指令为不安全语音指令。
22、上述方法中,通过对第一和第二输出结果进行距离判断,可以有效识别和区分安全语音指令和不安全语音指令,从而保障车辆的安全运行。此外通过对语音控制指令进行识别,可以避免不安全指令的执行,保护用户和车辆的安全,同时提高用户对系统的信任度,提升用户体验。
23、在第一方面的一种可能的实现方式中,将语音控制指令输入第一语音处理模块得到第一输出结果的具体流程如下:
24、将语音控制指令转化为第一文本指令,并且/或者,将第一文本指令转化为第一语音指令;第一输出结果包括第一文本指令和/或第一语音指令。
25、上述方法中,第一语音处理模块能够将语音控制指令转化为文本指令和/或语音指令,使得系统能够更灵活地处理不同形式的指令输入,使得语音识别更加灵活。
26、在第一方面的一种可能的实现方式中,将语音控制指令输入第二语音处理模块得到第二输出结果的具体流程如下:
27、将噪声信号加入语音控制指令,并去除语音控制指令里低于第一阈值的噪声和/或高于第二阈值的噪声得到第二语音指令;其中,第一阈值小于第二阈值。
28、上述方法中,将噪声信号加入语音控制指令,并去除语音控制指令里低于第一阈值的噪声和/或高于第二阈值的噪声得到第二语音指令,有助于减少环境噪音对语音控制指令的干扰,提高指令的准确性和系统的稳定性。得到的第一语音指令更加清晰和准确,有助于提高语音识别的准确性,减少误判,提升系统的可靠性。
29、在第一方面的一种可能的实现方式中,该方法还包括:将第二语音指令转化为第二文本指令,并根据第二文本指令的长度和/或语言类型生成第三语音指令,第二输出结果包括第三语音指令和/或第三语音指令转化的文本指令;其中,语言类型包括各国语言以及多种中文方言。
30、上述方法中,通过考虑各国语言以及多种中文方言,系统可以满足不同地区和用户的语音控制需求,提高系统的适用性和用户体验。根据文本指令的长度和语言类型生成第二语音指令可以使系统更加灵活地适应不同的语音输入情况,提高系统的鲁棒性和适应性。此外,第二语音处理模块能够将语音控制指令转化为文本指令和/或语音指令,使得系统能够更灵活地处理不同形式的指令输入,使得语音识别更加灵活。
31、在第一方面的一种可能的实现方式中,该方法还包括:在语音控制指令是不安全的语音控制指令的情况下,存储并反馈语音识别结果。
32、上述方法中,通过将判定为不安全的语音控制指令进行存储,系统可以及时记录和分析潜在的安全威胁,保障车辆和系统的安全。存储语音识别结果可以为后续的分析提供数据基础,有助于发现潜在的安全漏洞、改进语音识别算法和提升系统的安全性。通过分析存储的语音识别结果,可以发现系统在处理不安全指令时的弱点和不足之处,从而改进系统的安全性和鲁棒性。此外,反馈语音识别结果可以向用户提供警示信息,提醒用户当前的操作存在安全风险,促使用户采取相应的安全措施。
33、第二方面,本技术实施例提供了一种车辆控制方法,该方法包括:
34、在语音识别结果为语音控制指令是安全的语音控制指令的情况下,根据语音控制指令控制车辆;
35、在语音识别结果为语音控制指令是不安全的语音控制指令时,将语音控制指令和车辆的信息发送至云服务器,并停止根据语音控制指令控制车辆。
36、上述方法中,根据识别结果采取不同的控制措施,使得只有语音控制指令为安全语音指令的情况下才能执行该语音控制指令,提高了车辆操作的安全性。当语音控制指令为不安全语音指令的情况下,会停止使用语音控制指令控制车辆,并将语音控制指令和车辆的信息发送至云服务器进行进一步处理,能够提高对车辆操作的实时性和准确性,有效防范潜在的安全风险。此外,云服务器可以对接收到的不安全指令和车辆信息进行分析和处理,为安全管理和系统改进提供数据支持。
37、第三方面,本技术提供了一种语音识别装置,包括确定模块,确定模块用于对语音控制指令与目标语音控制指令进行识别,确定语音控制指令是否安全;
38、其中,目标语音控制指令包括系统预设语音,和/或对接收的语音控制指令进行预处理之后的语音指令。
39、在第三方面的一种可能的实现方式中,语音识别装置还包括接收模块,接收模块用于接收用户输入的语音控制指令。
40、在第三方面的一种可能的实现方式中,确定模块用于判断语音控制指令是否来源于系统存储人员,在语音控制指令来源于系统存储人员的情况下,确定语音控制指令为安全的语音控制指令,在语音控制指令不来源于系统存储人员的情况下,确定语音控制指令为不安全的语音控制指令。
41、在第三方面的一种可能的实现方式中,确定模块用于判断语音控制指令是否为人声语音;
42、在语音控制指令是人声语音的情况下,判断语音控制指令是否来源于系统存储人员,在语音控制指令不是人声语音的情况下,语音控制指令为不安全的语音控制指令。
43、在第三方面的一种可能的实现方式中,确定模块用于:
44、将语音控制指令输入第一语音处理模块得到第一输出结果;
45、将语音控制指令输入第二语音处理模块得到第二输出结果,第一输出结果和第二输出结果的类型相同;
46、其中,第一语音处理模块用于对语音控制指令直接转化输出,第二语音处理模块用于对语音控制指令进行降噪和语言判断后转化输出;
47、对第一输出结果和第二输出结果进行距离判断;
48、在距离小于设定距离阈值的情况下,确定语音控制指令为安全语音指令;
49、在距离大于或等于设定距离阈值的情况下,确定语音控制指令为不安全语音指令。
50、在第三方面的一种可能的实现方式中,将语音控制指令转化为第一文本指令,并且/或者,将第一文本指令转化为第一语音指令;第一输出结果包括第一文本指令和/或第一语音指令。
51、在第三方面的一种可能的实现方式中,将噪声信号加入语音控制指令,并去除语音控制指令里低于第一阈值的噪声和/或高于第二阈值的噪声得到第二语音指令;其中,第一阈值小于第二阈值。
52、在第三方面的一种可能的实现方式中,将第二语音指令转化为第二文本指令,并根据第二文本指令的长度和/或语言类型生成第三语音指令,第二输出结果包括第三语音指令和/或第三语音指令转化的文本指令;其中,语言类型包括各国语言以及多种中文方言。
53、在第三方面的一种可能的实现方式中,语音识别装置还包括存储模块,存储模块用于在语音控制指令是不安全的语音控制指令的情况下,存储并反馈语音识别结果。
54、第三方面中的各个功能模块用于实现上述第一方面以及第一方面的可能的实现方式的方法。
55、第四方面,本技术提供了一种车辆控制装置,包括控制模块和发送模块,其中,控制模块用于:在语音识别结果为语音控制指令是安全的语音控制指令的情况下,根据语音控制指令控制车辆;
56、发送模块用于在语音识别结果为语音控制指令是不安全的语音控制指令时,将语音控制指令和车辆的信息发送至云服务器,并停止根据语音控制指令控制车辆。
57、第四方面中的各个功能模块用于实现上述第二方面以及第二方面的可能的实现方式的方法。
58、第五方面,本技术实施例提供了一种语音识别系统,包括:
59、第一语音处理模块,用于通过用户输入的语音控制指令生成第一输出结果,第一输出结果包括文本指令和/或语音指令;
60、第二语音处理模块,用于对用户输入的语音控制指令进行降噪和/或转换以生成第二输出结果,第二输出结果包括文本指令和/或语音指令;
61、判断模块,用于根据第一输出结果和第二输出结果确定语音控制指令是否安全。
62、在第五方面的一种可能的实现方式中,第一语音处理模块包括语音识别子系统;
63、第二语音处理模块包括噪音处理单元、语音识别子系统和对抗生成器,对抗生成器包括多个对抗生成网络;
64、噪音处理单元用于对语音控制指令进行噪音消除,语音识别子系统用于将噪音消除后的语音控制指令转化为文本指令,对抗生成器用于根据文本指令的长度和/或语言类型选择相应的生成对抗网络以生成第二语音指令。
65、第六方面,本技术提供了一种电子设备,电子设备用于实现上述第一方面以及第一方面的任意一种可能的实现方式所描述的方法,或者,以实现上述第二方面以及第二方面的任意一种可能的实现方式所描述的方法,或者,以实现上述第五方面以及第五方面的任意一种可能的实现方式所描述的语音识别系统。
66、第七方面,本技术实施例提供了一种计算机存储介质,包括程序指令,当程序指令被电子设备执行时,使得电子设备执行第一方面以及第一方面的任意一种可能的实现方式所描述的方法,或者,使得电子设备执行第二方面以及第二方面的任意一种可能的实现方式所描述的方法。
67、第八方面,本技术提供了一种计算机存储产品,包括程序指令,当该计算机程序产品被电子设备执行时,该电子设备用于执行前述第一方面以及第一方面的任意一种可能的实现方式的方法,或者前述第二方面以及第二方面的任意一种可能的实现方式的方法。该计算机程序产品可以为一个软件安装包,在需要使用前述第一方面的任一种可能的设计提供的方法或者前述第二方面的任一种可能的设计提供的方法的情况下,可以下载该计算机程序产品并在电子设备上执行该计算机程序产品,以实现第一方面以及第一方面的任意一种可能的实现方式的方法,或者,以实现第二方面以及第二方面的任意一种可能的实现方式的方法。
68、第九方面,本技术提供了一种车辆,包括上述语音识别系统,或者上述计算机存储产品,或者上述电子设备,以执行上述语音识别方法实施例或者上述车辆控制方法中所描述的部分或全部步骤。
69、本技术在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。本技术通过接收语音控制指令,并对所述语音控制指令与目标语音控制指令进行识别,确定所述语音控制指令是否安全,在确定采集的语音指令是安全语音指令的情况下,再根据语音指令控制车辆,从而可以提高语音控制车辆操作的安全性。