一种车端语音控制方法及系统与流程

文档序号：33173913发布日期：2023-02-04 03:08阅读：77来源：国知局

技术简介：
本发明针对现有车端语音控制指令识别准确率低、响应率差的问题，提出通过云端智能重组未匹配语音文字并进行语义识别，结合场景数据动态优化控制参数的解决方案。车端将语音转文字上传云端，云端通过过滤无意义短语、语义重组及场景匹配，提升指令识别准确率与响应效率，实现个性化控制。
关键词：语音控制,智能重组

1.本发明涉及智能感知技术领域，具体地说，涉及一种车端语音控制方法及系统。

背景技术：

2.随着语音分析技术的发展，现有很多智能人机对话装置中都带有语音控制，在现有的语音控制方案中，主要是单向无反馈的语音操控，即通过用户输入正确的语音指令，智能人机对话装置对正确的语音指令进行响应，从而执行相应的操作。
3.但语音控制在具体使用时，由于不同用户的说话习惯不同和语音指令复杂程度的增加，现有技术对用户语音对应的语音指令识别的准确率较低，影响语音控制响应率。

技术实现要素：

4.为了解决上述问题，本发明提出一种车端语音控制方法及系统，提高语音识别的准确率，提高车端语音控制的响应率。
5.本发明实施例提供一种车端语音控制方法，所述方法由车端和云端执行，所述方法包括：
6.所述车端将用户输入的语音转化为对应的语音文字，并将所述语音文字发送给所述云端；
7.所述云端检测到所述语音文字与预建的指令库的指令集中所有指令均不匹配时，对所述语音文字进行智能重组，并进行语义识别；当识别出的重组文字与所述指令库的指令集中任一指令匹配时，根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作。
8.优选地，所述云端对所述语音文字进行检测的过程具体包括：
9.采用预建的过滤数据库对所述语音文字中无意义的短语进行过滤；
10.将过滤后的语音文字与所述指令库中指令集的每一指令进行语义比对。
11.进一步地，所述云端构建所述过滤数据库的过程具体包括：
12.所述云端预先对输入的语音训练库进行语音自监督学习，分析所述语音训练库中无意义的短语，作为过滤数据库；
13.所述语音训练库具体为所述用户通过所述车端输入的语音数据。
14.优选地，所述方法还包括：
15.所述云端检测到所述语音文字与所述指令库的指令集中任一指令匹配时，根据匹配的指令中的控制参数或根据获取当前的场景数据在所述云端的场景数据库中匹配对应的控制参数下发对应控制动作给所述车端，以使所述车端执行相应动作，所述场景数据库中包括用户在不同场景数据下对应偏好的控制参数；
16.所述车端在执行对应控制指令动作后的第一预设时间内，检测到用户通过语音输入的动作修改指令时，根据所述动作修改指令中的控制参数修改所述控制动作；并将所述动作修改指令中的控制参数和当前车身所处的场景数据对应存储到所述云端的场景数据
库中。
17.进一步地，所述场景数据包括所述车端的当前的车速、当前时间和当前天气。
18.优选地，所述云端根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作，具体包括：
19.所述云端获取所述车端当前的场景数据，根据获取的场景数据在所述云端的场景数据库中匹配对应的控制参数，并生成对应的控制动作发送给车端；
20.所述车端输出是否执行控制动作的交互提示给所述用户，并在输出交互提示后的第二预设时间内检测到用户输入的确认指令时，执行相应动作；将所述控制参数和当前车身所处的场景数据对应存储到所述云端的场景数据库中；对所述语音文字和对应的控制动作进行对应标记，在下一次语音识别到相同语音文字时，直接根据所述控制动作进行相应控制。
21.进一步地，所述方法还包括：
22.所述车端在输出交互提示后的第二预设时间内未检测到用户输入的确认指令或检测到用户输入的取消指令时，将所述语音文字和无操作反馈进行对应标记，在下一次语音识别到相同语音文字时，不作响应。
23.优选地，所述方法还包括：
24.所述云端检测到所述重组文字与所述指令库的指令集中所有指令均不匹配时，将所述语音文字和无操作反馈进行对应标记，在下一次通过所述车端识别到用户输入的相同语音文字时，不作响应。
25.优选地，所述云端对所述语音文字进行智能重组，并进行语义识别的过程包括：
26.所述云端对所述语音文字进行拆分，得到所述语音文字中的动词及对应关键词；
27.根据预设的语音指令格式对所述动词及对象关键词进行重新组合，对重新组合后的语句进行语义识别。
28.本发明实施例还提供一种车端语音控制系统，所述系统包括车端和云端，所述系统用于执行如上述实施例中任意一项所述的车端语音控制方法。
29.本发明提供一种车端语音控制方法及系统，通过车端将用户输入的语音转化为对应的语音文字，并将所述语音文字发送给所述云端；云端检测到所述语音文字与预建的指令库的指令集中所有指令均不匹配时，对所述语音文字进行智能重组，并进行语义识别；当识别出的重组文字与所述指令库的指令集中任一指令匹配时，根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作。通过对未识别到指令的语音文字进行重组和再次语义识别，再次进行指令匹配提高指令匹配的准确率，也提高了语音控制的响应率。
附图说明
30.图1是本发明实施例提供的一种车端语音控制方法的流程示意图；
31.图2是本发明另一实施例提供的一种车端语音控制方法的流程示意图。
具体实施方式
32.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完
整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
33.实施例一
34.参见图1，是本发明实施例提供的一种车端语音控制方法的流程示意图，所述方法包括步骤s1～s2；
35.s1，所述车端将用户输入的语音转化为对应的语音文字，并将所述语音文字发送给所述云端；
36.s2，所述云端检测到所述语音文字与预建的指令库的指令集中所有指令均不匹配时，对所述语音文字进行智能重组，并进行语义识别；当识别出的重组文字与所述指令库的指令集中任一指令匹配时，根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作。
37.在本实施例具体实施时，车端通过配置的麦克风或其他语音输入设备检测用户输入的语音信号，将其转化通过语音识别技术转化为对应的语音文字；
38.将转化的语音文字发送到云端进行指令匹配，云端预建有语音识别的指令库，通过对语音文字和指令库中指令的匹配，判断是否能够识别到指令库的指令集中的指令；
39.当所述语音文字与指令库的指令集中所有指令均不匹配时，则说明初始的语音文字无法进行响应的指令控制，此时需要采用预设语义识别算法对语音文字进行智能重组，并进行语义识别，生成语义识别后的模糊指令；
40.对识别出的重组文字进行指令匹配，当模糊指令与所述指令库的指令集中任一指令匹配时，根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作。
41.所述指令集中的指令包含对应的控制动作，可根据对应的控制动作控制车端执行相应的动作，以实现车端的语音控制。
42.需要说明的是，本实施例中语音控制对应的车端的语音控制功能在车端通过控制指令控制，通过控制指令控制语音控制功能开启和关闭，所述控制指令输入过程基于对用户的身份认证，因此还需要配置身份识别模块，通过对用户身份认证，以使身份认证通过的用户进行响应的功能控制，其中身份认证可具体通过验证登录信息、或用户的指纹信息或相关的声纹信息实现，提高安全性能。
43.通过对未识别到指令的语音文字进行重组和再次语义识别，再次进行指令匹配提高指令匹配的准确率，也提高了语音控制的响应率。
44.实施例二
45.在本发明提供的又一实施例中，所述云端对所述语音文字进行检测的过程具体包括：
46.采用预建的过滤数据库对所述语音文字中无意义的短语进行过滤；
47.将过滤后的语音文字与所述指令库中指令集的每一指令进行语义比对。
48.在本实施例具体实施时，参见图2，是本发明另一实施例提供的一种车端语音控制方法的流程示意图；
49.用户输入语音信号，车端将语音信号转化为语音文字，将语音文字上传至云端；
50.所述云端在对语音文字检测的过程中，需要根据过滤数据库过滤，即过滤出所述
语音文字中无意义的短语，例如，语气助词“额”和无意义短语“那个”等。
51.将过滤后的语音文字在预建的指令库中进行指令匹配，判断是否匹配到指令；
52.需要说明的是，所述指令库中的指令为预先根据设定的，在用户使用过程中可根据用户输入的语音指令增加进行拓展。
53.根据预先生成的过滤数据库过滤无意义话术或无意义口头禅，能够提高指令匹配的准确率。
54.实施例三
55.在本发明提供的又一实施例中，所述云端构建所述过滤数据库的过程具体包括：
56.所述云端预先对输入的语音训练库进行语音自监督学习，分析所述语音训练库中无意义的短语，作为过滤数据库；
57.所述语音训练库具体为所述用户通过所述车端输入的语音数据。
58.在本实施例具体实施时，参见图2，所述过滤数据库构建过程为，车端上传监测到车端用户的语音数据至云端，作为语音训练库；
59.云端对输入的语音训练库进行语音自监督学习，分析所述语音训练库中无意义的短语，作为过滤数据库；
60.需要说明的时，所述语音训练库中，还可通过管理员录入对应的过滤词，以作为优先过滤关键词，通过语音子监督学习，能够过滤出用户常用的口头禅或语气助词，作为过滤数据库，对语音文字进行过滤，提高指令识别准确率。
61.通过对车端用户自己的语音数据进行分析，确定过滤数据库，能够更好匹配用户的语言习惯，更加准确的过滤无意义词语，提高后续指令识别的准确度。
62.实施例四
63.在本发明提供的又一实施例中，所述方法还包括：
64.所述云端检测到所述语音文字与所述指令库的指令集中任一指令匹配时，根据匹配到指令中的对应控制参数下发对应控制动作给所述车端，以使所述车端执行相应动作，
65.所述车端在执行对应控制指令动作后的第一预设时间内，检测到用户通过语音输入的动作修改指令时，根据所述动作修改指令中的控制参数修改所述控制动作；并将所述动作修改指令中的控制参数和当前车身所处的场景数据对应存储到所述云端的场景数据库中。
66.在本实施例具体实施时，参见图2，云端对语音文字进行指令匹配时，所述语音文字与所述指令库的指令集中任一指令匹配时，对指令进行识别，当匹配到准确指令时，其中包含控制参数时，例如：播放周杰伦的七里香、查询北京明天的天气或将空调调整为15℃的指令。
67.当匹配的指令为模糊指令时，即其中不包括控制参数时，获取当前的场景数据，根据所述场景参数在所述云端的场景数据库中匹配对应的控制参数下发对应控制动作给所述车端；
68.下发控制动作给车端，即根据匹配到指令中的对应控制参数下发对应控制动作给所述车端。
69.车端执行相应动作，并判断是否有动作修改指令输入，即车端响应云端下发的控制动作后，在执行对应控制指令动作后的第一预设时间内，监测用户是否输入动作修改指
令；
70.当在第一预设时间内监测到用户通过语音输入的动作修改指令时，修改控制动作，即根据所述动作修改指令中的控制参数修改所述控制动作；并存储控制参数和对应的场景数据到场景数据库中，将所述动作修改指令中的控制参数和当前车身所处的场景数据对应存储到所述云端的场景数据库中。
71.例如，当识别到控制指令为将车窗开启1/3，即下发包含开启到1/3的控制参数的车窗控制动作给车端，以使所述车端执行相应的动作；
72.当识别的控制为打开车窗，此时对于车窗的控制参数不清楚，因此需要通过获取当前车端的场景参数，包括当前的车速、当前时间和当前天气等。预先在场景数据库中预设车速在30km/h-60km/h为中等速度场景时，车窗打开的控制参数为1/3，此时当获取的场景数据中车速在30km/h-60km/h间时，即根据1/3的控制参数控制车端执行相应的动作；
73.在车端将车窗开启至1/3后，在第一预设时间内，例如30s内，判断是否有动作修改指令输入，譬如，用户在20s时，语音输入将车窗开启1/3改为1/2，此时根据动作修改指令中的控制参数1/2修改所述控制动作；
74.并将动作修改指令中的控制参数1/2和30km/h-60km/h为中等速度场景对应存储到所述云端的场景数据库。
75.或者识别到用户输出的指令，我要听陈奕迅的歌，此时音乐播放一首“十年”，用户语音输入动作修改指令，切歌为“明年今日”，修改相应动作后，记录当下的场景数据如时间，早中午等，后续用户说出我要听陈奕迅的歌时，默认播放“明年今日”，在另外场景时播放“十年”以达成同一命令同一场景，根据用户习惯的不同，出现技能执行的参数不同，实现千人千面。
76.通过场景数据为用户匹配不同的控制指令，为提供用户提供个性化的参数设置。
77.实施例五，
78.在本发明提供的又一实施例中，所述场景数据包括车端的当前的车速、当前时间和当前天气。
79.在本实施例具体实施时，通过当前的车速、当前时间和当前天气能够准确用于记录用户在不同场景下的控制指令，下次匹配准确的控制指令。
80.实施例六
81.在本发明提供的又一实施例中，所述云端根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作，具体包括：
82.所述云端获取所述车端当前的场景数据，根据获取的场景数据在所述云端的场景数据库中匹配对应的控制参数，并生成对应的控制动作发送给车端；
83.所述车端输出是否执行控制动作的交互提示给所述用户，并在输出交互提示后的第二预设时间内检测到用户输入的确认指令时，执行相应动作；将所述控制参数和当前车身所处的场景数据对应存储到所述云端的场景数据库中；对所述语音文字和对应的控制动作进行对应标记，在下一次语音识别到相同语音文字时，直接根据所述控制动作进行相应控制。
84.在本实施例具体实施时，在根据重组的后模糊指令进行语音控制时，控制过程包括：
85.首先进行动作确定，由于重组后的模糊指令的控制参数不清楚，因此在动作确认时，需要获取所述车端当前的场景数据，根据所述场景参数在所述云端的场景数据库中匹配对应的控制参数下发对应控制动作给所述车端；
86.下发控制动作给车端，即根据匹配到指令中的对应控制参数下发对应控制动作给所述车端。
87.车端需要与用户进行交互反馈，即输出是否执行控制动作的交互提示给所述用户，交互提示可通过文字显示的形式或语音播报的形式；
88.在输出交互提示后的第二预设时间检测用户是否确认指令，当在第二预设时间内检测到用户输入的确认指令时，例如5s内检测到用户输入的确认时，执行相应动作；将所述控制参数和当前车身所处的场景数据对应存储到所述云端的场景数据库中；
89.对所述语音文字和对应的控制动作进行对应标记，在下一次语音识别到相同语音文字时，直接根据所述控制动作进行相应控制；
90.车端在输出交互提示后的未检测到用户输入的确认指令或检测到用户输入的取消指令时，将所述语音文字和无操作反馈进行对应标记，在下一次语音识别到相同语音文字时，不作响应。
91.例如：用户说出模糊命令如“打开我的那个空调”，此时云端自学习能力进行智能重组，重组后为“打开我的空调”或“打开空调”在车载环境下命中指令库开启空调，并通过场景数据库匹配当前车外温度35摄氏度下对应的空调控制参数25摄氏度，会与用户进行交互反馈，即输出语音“是否需要为您打开空调至25℃？”，用户确认后，后续命令“打开我的那个空调”将直接进行车内空调的开启，无需进行确认，根据用户习惯完成了语音的自学习升级。
92.若当前用户面临环境更加复杂，其将已提前将汽车与家庭智能设备进行连接，可以在车内控制家庭的灯、空调、香氛等设备；则对于该用户，命中指令库开启空调，将进行确认“您是要打开车内空调还是屋内空调”，用户若选择屋内空调，后续用户说出“打开屋内空调”将直接开启屋内空调无需确认，因该设备在车外，为了更好的体验与降低容错率会进行语音播报：已为您开启屋内空调。
93.用户对模糊指令进行交互确认，确保用户指令的准确执行，避免误识别的指令开启造成的困扰，并且通过对识别的模糊指令进行标记，进行语音自学习，后续用户输入同样指令能够快速响应，提高语音识别响应速度。
94.实施例八
95.在本发明提供的又一实施例中，所述方法还包括据：
96.所述车端在输出交互提示后的第二预设时间内未检测到用户输入的确认指令或检测到用户输入的取消指令时，将所述语音文字和无操作反馈进行对应标记，在下一次语音识别到相同语音文字时，不作响应。
97.在本实施例具体实施时，输出交互提示后的第二预设时间内未检测到用户输入的确认指令或检测到用户输入的取消指令时，即用户为确认时，此时表明用户输入的语音文字对应的指令无效，此时将所述语音文字和无操作反馈进行对应标记，在下一次语音识别到相同语音文字时，不作响应。
98.将用户手动确认不执行的动作指令，标记为无效指令，后续不再进行重复识别，避
免后续指令的误识别。
99.实施例八
100.在本发明提供的又一实施例中，所述方法还包括：
101.所述云端检测到所述重组文字与所述指令库的指令集中所有指令均不匹配时，将所述语音文字和无操作反馈进行对应标记，在下一次通过所述车端识别到用户输入的相同语音文字时，不作响应。
102.在本实施例具体实施时，参加图2，对重组文字再次进行指令匹配时，所述重组文字与所述指令库的指令集中所有指令均不匹配时，表明重组后的文字仍然无法匹配到对应文字，此时表明用户输入的语音文字无效。
103.此时将所述语音文字和无操作反馈进行对应标记，在下一次语音识别到相同语音文字时，不作响应。
104.通过对多次指令匹配失败后的语音文字进行标记，后续不再进行重复识别，避免后续重复语音文字输入过程中再次识别的算力占用。
105.实施例九
106.在本发明提供的又一实施例中，所述方法还包括：
107.所述云端对所述语音文字进行智能重组，并进行语义识别的过程包括：
108.所述云端对所述语音文字进行拆分，得到所述语音文字中的动词及对应关键词；
109.根据预设的语音指令格式对所述动词及对象关键词进行重新组合，对重新组合后的语句进行语义识别。
110.在本实施例具体实施时，采用现有的语音识别算法根据语音文字中的语言结构和词性对语音文字进行拆分，获得语音文字中的对应动作，一般为开启、关闭、播放等动作，对象关键词为名词，具体为车内的装置，例如空调、车窗等。
111.根据预设的语音指令格式对所述动词及对象关键词进行重新组合，例如，重组为动作+对象关键词的结构，对重新组合后的语句进行语义识别，得到重组文字。
112.通过对未能匹配到指令的语音文字进行拆分，再度重组，将语音文字精简化，提高语音文字的识别准确率，提高语音控制的响应率。
113.实施例十
114.本发明实施例还提供的一种车端语音控制系统，所述系统包括车端和云端。
115.所述车端用于将用户输入的语音转化为对应的语音文字，并将所述语音文字发送给所述云端；
116.所述云端用于检测到所述语音文字与预建的指令库的指令集中所有指令均不匹配时，对所述语音文字进行智能重组，并进行语义识别；当识别出的重组文字与所述指令库的指令集中任一指令匹配时，根据匹配的指令反馈对应控制指令给所述车端，以使所述车端执行相应动作。
117.本实施例提供的车端语音控制装置，能够执行上述任一实施例提供的车端语音控制方法的所有步骤与功能，在此对该系统的具体功能不作赘述。
118.本发明根据预先生成的过滤数据库过滤无意义话术或无意义口头禅，能够提高指令匹配的准确率；通过对未识别到指令的语音文字进行重组和再次语义识别，再次进行指令匹配提高指令匹配的准确率，也提高了语音控制的响应率。通过场景数据为用户匹配不
同的控制指令，为提供用户提供个性化的参数设置。通过用户对模糊指令进行交互确认，确保用户指令的准确执行，避免误识别的指令开启造成的困扰，并且通过对识别的模糊指令进行标记，进行语音自学习，后续用户输入同样指令能够快速响应，提高语音识别响应速度。
119.应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李兆全许为康夏静武子平汪华锋张盼盼邓晨刘俊峰梁伟强
技术所有人：星河智联汽车科技有限公司
我是此专利的发明人

上一篇：一种计算机主板安装结构的制作方法
下一篇：一种方便拆装的复印机搓纸轮的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！