一种车辆的语音控制方法、装置及系统与流程

文档序号：31417418发布日期：2022-09-03 17:34阅读：268来源：国知局

1.本技术涉及车辆控制技术利用，更具体地，涉及一种车辆的语音控制方法、装置及系统。

背景技术：

2.车载语音交互已成为继中控屏后汽车的第二交互手段。在前装搭载率方面，语音识别及交互功能的前装标配搭载率逐渐上升。语音交互与智能座舱的深度融合，是改善驾驶体验的新机会。采用全场景语音车载系统将语音车控延伸至整台车是未来的一大趋势。
3.现有的车载语音交互系统对不同的声纹没有控制权限的限制，注册的声纹可以全方面对车辆进行控制，车辆语音控制的安全性无法保障。
4.现有的车载语音交互系统无法识别语音控制指令是通过播放已注册声纹的录音音频还是用户的实时音频发出的，因此存在安全隐患。

技术实现要素：

5.本技术提供一种车辆的语音控制方法、装置及系统，声纹注册需要经车主同意，并且对每个声纹id都设置了相应的控制权限，保证了车辆语音控制的安全性。
6.本技术提供了一种车辆的语音控制方法，包括：
7.通过车联网平台和车主的用户终端进行声纹注册；
8.接收语音控制指令；
9.对语音控制指令进行第一声纹认证；
10.若第一声纹认证通过，则判断与语音控制指令对应的声纹id是否具有语音控制指令中的控制权限；
11.若权限认证通过，则依据语音控制指令向相关的车辆控制器下发指令。
12.优选地，若权限认证通过，依据语音控制指令向相关的车辆控制器下发指令之前，还包括：
13.向用户询问是否进行随机验证；
14.若是，则接收用户的第一语音信息，第一语音信息是用户的实时语音；
15.对第一语音信息进行第二声纹认证；
16.若第二声纹认证通过，则依据语音控制指令向相关的车辆控制器下发指令。
17.优选地，对语音控制指令进行第一声纹认证，具体包括：
18.依据语音控制指令生成第一声纹特征值；
19.将第一声纹特征值与声纹库中的第二声纹特征值进行匹配；
20.若存在与第一声纹特征值的匹配度高于阈值的第二声纹特征值，则第一声纹认证通过，将第二声纹特征值对应的声纹id作为与语音控制指令对应的声纹id。
21.优选地，声纹注册包括：
22.若接收到用户的声纹注册请求，则接收用户的第二语音信息；
23.判断第二语音信息对应的声纹是否存在；
24.若不存在，则向车联网平台发送声纹注册申请，声纹注册申请包括第二语音信息对应的声纹id、车辆的设备信息，使得车联网平台依据设备信息对车辆进行鉴权验证后通过车主的用户终端对声纹注册申请进行审核和控制权限的设置；
25.若声纹注册申请成功，则接收车联网平台的声纹id及对应的控制权限并保存；
26.输出注册结果，注册结果显示注册成功。
27.优选地，将语音控制指令输入基于神经网络的声纹识别模型，声纹识别模型的输出为第一声纹特征值。
28.优选地，还包括在向相关的车辆控制器下发指令的同时，查询与声纹id对应的账户信息，并调取账户信息中与车辆控制器相关的预设数据。
29.本技术还提供一种车辆的语音控制装置，包括注册模块、控制指令接收模块、第一声纹认证模块、权限认证模块以及指令下发模块；
30.注册模块用于通过车联网平台和车主的用户终端进行声纹注册；
31.控制指令接收模块用于接收语音控制指令；
32.第一声纹认证模块用于对语音控制指令进行第一声纹认证；
33.权限认证模块用于判断与语音控制指令对应的声纹id是否具有语音控制指令中的控制权限；
34.指令下发模块用于若权限认证通过，则依据语音控制指令向相关的车辆控制器下发指令。
35.优选地，还包括随机验证询问模块、语音信息接收模块、第二声纹认证模块；
36.随机验证询问模块用于向用户询问是否进行随机验证；
37.语音信息接收模块用于接收用户的第一语音信息；
38.第二声纹认证模块用于对第一语音信息进行第二声纹认证。
39.优选地，第一声纹认证模块包括特征值生成模块、匹配模块、匹配结果获得模块；
40.特征值生成模块用于依据语音控制指令生成第一声纹特征值；
41.匹配模块用于将第一声纹特征值与声纹库中的第二声纹特征值进行匹配；
42.匹配结果获得模块用于若存在与第一声纹特征值的匹配度高于阈值的第二声纹特征值，则第一声纹认证通过，将第二声纹特征值对应的声纹id作为与语音控制指令对应的声纹id。
43.本技术还提供一种车辆的语音控制系统，包括车身娱乐系统、车联网平台以及车主的用户终端；
44.车身娱乐系统用于执行上述的车辆的语音控制方法；
45.车联网平台用于接收车身娱乐系统的声纹注册申请，并依据车辆的设备信息对车辆进行鉴权验证，并在鉴权验证通过后将车辆的语音控制权限列表以及声纹注册申请发送给车主的用户终端；
46.车主的用户终端用于确定声纹注册申请是否通过，并且允许声纹注册申请通过后进行权限设置，并将权限设置信息返回给车联网平台；
47.车联网平台还将声纹id及与其对应的权限设置信息返回给车身娱乐系统。
48.通过以下参照附图对本技术的示例性实施例的详细描述，本技术的其它特征及其
优点将会变得清楚。
附图说明
49.被结合在说明书中并构成说明书的一部分的附图示出了本技术的实施例，并且连同其说明一起用于解释本技术的原理。
50.图1为本技术提供的车辆的语音控制系统的结构图；
51.图2为本技术提供的声纹注册的流程图；
52.图3为本技术提供的车辆的语音控制方法的流程图；
53.图4为本技术提供的第一声纹认证的流程图；
54.图5为本技术提供的车辆的语音控制装置的结构图；
55.图6为本技术提供的第一声纹认证模块的结构图。
具体实施方式
56.现在将参照附图来详细描述本技术的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本技术的范围。
57.以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本技术及其应用或使用的任何限制。
58.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。
59.在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。
60.实施例一
61.如图1所示，本技术提供的车辆的语音控制系统包括车身娱乐系统110、车联网平台120以及车主的用户终端130。
62.车身娱乐系统110集成了各个应用程序，实现娱乐功能、语音控制功能以及账号服务等功能。除此之外，车身娱乐系统110还集成了声纹识别模块，声纹识别模块内包括基于神经网络的声纹识别模型和声纹库。声纹库用于存储声纹特征值与声纹id的对应关系，每个声纹特征值对应一个声纹id。声纹识别模型是基于大量声纹数据和分析算法建立的模型，用于将车身娱乐系统采集的语音信息转化成声纹特征值，并利用声纹库对声纹特征值进行匹配，判断声纹特征值是否存在在声纹库中。
63.车联网平台120用于接收车身娱乐系统110的声纹注册申请，并依据车辆的车辆识别码、t-box的唯一识别码、车身娱乐系统的唯一识别码等设备信息对车辆进行鉴权验证，并在鉴权验证通过后将车辆的权限列表以及声纹注册申请发送给车主的用户终端130，对车辆的识别码、设备信息、语音控制权限、声纹id进行数据管理，以及转发声纹注册申请的结果。
64.车主的用户终端130用于受理声纹注册申请，确定声纹注册申请是否通过，并且允许声纹注册申请通过后对声纹进行权限设置，并将权限设置信息返回给车联网平台120。
65.作为一个实施例，车主的用户终端为车主的手机app。
66.需要说明的是，车主可随时在用户终端上查看自己车辆所注册的声纹信息及对应的控制权限信息，并具备实时删除、变更声纹权限的功能。车主对声纹id及相应的控制权限的设置信息在车联网平台进行存储。
67.车联网平台具备对声纹id的安全验证文本库的增、删、改、查功能，每台车辆每次上电联网后，可随机获取100个声纹id的安全验证文本，同时可从车联网平台获取该车辆的当前声纹id及其控制权限的绑定关系数据。
68.基于上述系统，如图2示出了基于车身娱乐系统的声纹注册流程，具体包括：
69.s210：若接收到用户的声纹注册请求，则接收用户的第二语音信息。
70.具体地，用户在车身娱乐系统上点击声纹注册请求，车身娱乐系统接收到用户的声纹注册请求后启动音频录制，形成用户的第二语音信息。
71.s220：判断第二语音信息对应的声纹是否存在；
72.具体地，声纹识别模块接收到第二语音信息后判断与第二语音信息对应的声纹是否存在。具体地，将第二语音信息输入声纹识别模型，声纹识别模型输出第三声纹特征值。将第三声纹特征值与声纹库中的第四声纹特征值进行匹配，并判断匹配度是否高于阈值。
73.若存在与第三声纹特征值的匹配度高于阈值的第四声纹特征值，说明存在与第二语音信息对应的声纹id，则执行s230；否则，执行s240。
74.s230：通过车身娱乐系统进行注册结果展示，提示用户该声纹已经注册过。
75.s240：向车联网平台发送声纹注册申请，声纹注册申请包括第二语音信息对应的声纹id、车辆的车辆识别码vin、t-box的唯一识别码、车身娱乐系统的唯一识别码等设备信息，使得车联网平台依据设备信息对车辆进行鉴权验证后通过车主的用户终端对声纹注册申请进行审核和控制权限的设置。
76.s250：判断声纹注册申请是否成功。若声纹注册申请成功，则执行s260；否则，执行s280。
77.具体的，车联网平台对设备信息进行鉴权验证，若鉴权验证通过，则将车辆的语音控制权限列表以及声纹注册申请发送给车主的用户终端。
78.若车主不同意声纹注册申请，则声纹注册申请失败，则通过车联网平台将失败结果返回至车身娱乐系统，车身娱乐系统执行s280：显示注册失败。
79.若车主同意声纹注册申请，则车主通过用户终端根据车联网平台发送的语音控制权限列表进行该声纹id的控制权限设置以及声纹id的命名，并将vin、声纹id以及控制权限设置信息发送给车联网平台，车联网平台对该反馈进行保存，以便后续的数据管理，并转发给车身娱乐系统。
80.s260：接收车联网平台的声纹id及对应的控制权限并保存，并执行s270。
81.s270：输出注册结果，注册结果显示注册成功。
82.优选地，每个用户在同一台车辆上只能注册一个声纹id。若同一用户同时拥有多台车辆，则需要在每台车辆上分别注册一个声纹id。
83.如图3所示，本技术提供的基于车身娱乐系统的车辆的语音控制方法包括：
84.s310：通过车联网平台和车主的用户终端进行声纹注册。请见上述关于声纹注册的说明。
85.s320：接收语音控制指令。
86.用户使用车载语音控制装置对车辆的各应用进行控制时，向车载娱乐系统输入语音控制指令。车载娱乐系统将语音控制指令的音频作为语音信息来处理。
87.s330：对语音控制指令进行第一声纹认证。
88.具体地，如图4所示，对语音控制指令进行第一声纹认证，包括：
89.s3301：依据语音控制指令生成第一声纹特征值。
90.将语音控制指令输入声纹识别模型，声纹识别模型的输出为第一声纹特征值。
91.s3302：将第一声纹特征值与声纹库中的第二声纹特征值进行匹配。
92.s3303：判断是否存在与第一声纹特征值的匹配度高于阈值的第二声纹特征值。若是，则执行s3305；否则，执行s3304。
93.s3304：通过车身娱乐系统提示用户未进行语音控制注册。
94.s3305：第一声纹认证通过，将第二声纹特征值对应的声纹id作为与语音控制指令对应的声纹id。
95.s340：若第一声纹认证通过，则判断与语音控制指令对应的声纹id是否具有语音控制指令中的控制权限，即对与语音控制指令对应的声纹id进行权限认证。具体地，识别语音控制指令对应的车辆控制器，在与该声纹id对应的控制权限列表中查询是否存在该车辆控制器。若是，则权限认证通过，执行s380。否则，权限认证不通过，则执行s3100：提示用户无该控制权限。
96.s380：依据语音控制指令向相关的车辆控制器下发指令。随后执行s390，提示控制指令正在执行。
97.优选地，若权限认证通过，依据语音控制指令向相关的车辆控制器下发指令之前，还包括：
98.s350：向用户询问是否进行随机验证。若是，则执行s360；否则，执行s380。
99.s360：接收用户的第一语音信息，第一语音信息是用户的实时语音。
100.s370：对第一语音信息进行第二声纹认证。认证过程请参见图4。若第二声纹认证通过，则执行s380。否则，执行s390，提示随机验证不通过。
101.s390：提示控制指令完成情况。
102.优选地，随机验证适用于安全级别比较高的语音控制，如车窗开启、高级辅助驾驶设置等，防止运用录制的声纹进行车辆控制。
103.优选地，用户、声纹id、用户的账户信息一一对应，车身娱乐系统中存储了每个账户信息中对于每个车辆控制器的预设数据，例如喜好数据，比如喜欢的音乐、空调设置数据等。在多个用户同时控制车辆时，车身娱乐系统在向相关的车辆控制器下发指令的同时，查询与声纹id对应的账户信息，并调取账户信息中与该车辆控制器相关的预设数据并按照预设数据执行指令。作为举例，当用户a和用户b同时控制车辆时，用户a下达了听音乐的控制指令，则播放用户a喜欢的音乐；同时若用户b下达了开空调的控制指令，则按照用户b的空调设置数据控制空调。
104.实施例二
105.基于上述车辆的语音控制方法，本技术提供了一种车辆的语音控制装置。如图5所示，车辆的语音控制装置包括注册模块510、控制指令接收模块520、第一声纹认证模块530、权限认证模块540以及指令下发模块550。
106.注册模块510用于通过车联网平台和车主的用户终端进行声纹注册。
107.控制指令接收模块520用于接收语音控制指令。
108.第一声纹认证模块530用于对语音控制指令进行第一声纹认证。
109.权限认证模块540用于判断与语音控制指令对应的声纹id是否具有语音控制指令中的控制权限。
110.指令下发模块550用于若权限认证通过，则依据语音控制指令向相关的车辆控制器下发指令。
111.优选地，语音控制装置还包括随机验证询问模块560、语音信息接收模块570、第二声纹认证模块580。
112.随机验证询问模块560用于向用户询问是否进行随机验证。
113.语音信息接收模块570用于接收用户的第一语音信息；
114.第二声纹认证模块580用于对第一语音信息进行第二声纹认证。
115.优选地，如图6所示，第一声纹认证模块530包括特征值生成模块5301、匹配模块5302、匹配结果获得模块5303。
116.特征值生成模块5301用于依据语音控制指令生成第一声纹特征值。
117.匹配模块5302用于将第一声纹特征值与声纹库中的第二声纹特征值进行匹配。
118.匹配结果获得模块5303用于若存在与第一声纹特征值的匹配度高于阈值的第二声纹特征值，则第一声纹认证通过，将第二声纹特征值对应的声纹id作为与语音控制指令对应的声纹id。
119.优选地，语音控制装置还包括查询调用模块590，查询调用模块590用于查询与声纹id对应的账户信息，并调取账户信息中与车辆控制器相关的预设数据。
120.本技术的有益效果如下：
121.1、所有声纹注册请求都需要经过车主同意，且车主可根据申请人的身份进行不同等级的控制权限设置，后续车主也可通过用户终端对已设置的声纹的控制权限进行删除、修改，最大限度地保证了车主的权利。
122.2、本技术基于车辆的vin对声纹id进行本地注册，小样本具有较高的识别准确率和识别效率。
123.3、所有语音控制指令都进行声纹认证和权限认证，确保车辆语音控制的安全性。
124.4、在用户进行安全级别比较高的语音控制时进行随机验证，防止运用录制的声纹进行车辆控制而对车辆的安全带来隐患。
125.虽然已经通过例子对本技术的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上例子仅是为了进行说明，而不是为了限制本技术的范围。本领域的技术人员应该理解，可在不脱离本技术的范围和精神的情况下，对以上实施例进行修改。本技术的范围由所附权利要求来限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈桃花李兵张雨婷阚瑞王点墨胡燕娇
技术所有人：安徽江淮汽车集团股份有限公司
我是此专利的发明人

上一篇：一种便于安装球扁钢的可拆卸式吊装结构及其使用方法与流程
上一篇：防荧光污染丝光机的制作方法