语音识别方法、装置、系统、电子设备和存储介质与流程

文档序号:31995449发布日期:2022-11-02 03:21阅读:112来源:国知局
语音识别方法、装置、系统、电子设备和存储介质与流程

1.本发明涉及车联网技术领域,特别涉及一种语音识别方法、装置、系统、电子设备和存储介质。


背景技术:

2.在当驾驶车辆处于行驶状态时,若驾驶用户需要发送微信、发送短信、打电话等时,若当前车载设备(如车机)没有安装对应的应用程序,且不支持语音识别功能、语音识别功能受限制,则无法依赖于车载设备满足这些操作需求;若驾驶用户使用智能终端去执行相关操作时,则需要手脱离方向盘拿取手机执行对应动作,因此不可避免地存在一定的安全隐患;特别在手机放置在包内或者其他不方便拿取的位置时,则会存在更大的安全问题,严重的可能会导致交通事故的发生。


技术实现要素:

3.本发明的一个目的在于提供一种语音识别方法,其优势在于通过与智能终端之间先建立蓝牙通信连接,然后触发指令以建立与智能终端之间的语音传输通道,进而激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序,即实现车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
4.本发明的另一个目的在于提供一种语音识别方法,其优势在于采用蓝牙的voice recognize命令或语音触发命令等方式激活智能终端的语音识别功能,以保证语音传输识别实现的及时性和可靠性。
5.本发明的另一个目的在于提供一种语音识别方法,其优势在于通过配置物理激活按钮,通过用户手动按压该激活按钮以一键直接触发具体场景设备与智能终端之间的蓝牙连接,便于用户操作的同时,也可以满足用户根据自身习惯进行随时触发的操作需求,也提高了触发蓝牙连接的灵活性。
6.本发明的另一个目的在于提供一种语音识别方法,其优势在于通过预先配置热词以经由获取热词以主动触发与智能终端之间的蓝牙通信连接,也提高了触发蓝牙连接的灵活性。
7.本发明的另一个目的在于提供一种语音识别方法,其优势在于在激活智能终端的语音识别功能之前,通过预先设定的智能终端唤醒词将其唤醒,以使得整个智能终端处于被唤醒状态,以保证后续操作步骤执行的有效性。
8.本发明的另一个目的在于提供一种语音识别方法,其优势在于建立hfp协议连接以保证后续数据传输通道对数据有效顺利传输。
9.本发明的另一个目的在于提供一种语音识别装置,其优势在于通过与智能终端之间先建立蓝牙通信连接,然后生成触发指令以建立与智能终端之间的语音传输通道,进而激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序,即实现在车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
10.本发明的另一个目的在于提供一种语音识别系统,其优势在于通过与智能终端之间先建立蓝牙通信连接,然后触发指令以建立与智能终端之间的语音传输通道,进而激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序(如微信、短信、电话等),即实现在车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
11.本发明的另一个目的在于提供一种电子设备,其优势在于执行上述语音识别方法,以实现在车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,能够及时有效地满足驾驶用户的使用需求。
12.本发明的另一个目的在于提供一种计算机可读存储介质,其优势在于执行上述语音识别方法,以实现在车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,能够及时有效地满足驾驶用户的使用需求。
13.本发明是通过下述技术方案来解决上述技术问题:
14.本发明第一方面提供一种语音识别方法,所述方法包括如下步骤:
15.与智能终端建立蓝牙通信连接;
16.生成触发指令;
17.基于所述触发指令开启与所述智能终端的语音传输通道;
18.采用预设方式激活所述智能终端进入语音识别状态;
19.采集第一语音指令,并将所述第一语音指令通过所述语音传输通道发送至所述智能终端,以供所述智能终端进行识别处理;
20.所述第一语音指令用于表征操作所述智能终端中应用程序的控制信息。
21.本发明第二方面提供一种语音识别装置,包括:
22.声音采集单元,
23.通信单元,所述通信单元与智能终端建立蓝牙通信连接;
24.一个或多个第一处理器,所述一个或多个第一处理器与所述通信单元、所述声音采集单元,以及第一存储器通信连接;
25.所述第一存储器被配置成存储指令,当所述指令被所述一个或多个所述第一处理
器执行时,使所述一个或多个所述第一处理器执行步骤,所述步骤包括:
26.生成触发指令,发送所述触发指令给所述通信单元;
27.控制所述通信单元开启与所述智能终端的语音传输通道,采用预设方式激活所述智能终端进入语音识别状态;
28.控制所述声音采集单元采集第一语音指令;
29.控制所述通信单元将所述第一语音指令通过所述语音传输通道发送至所述智能终端,以供所述智能终端进行识别处理。
30.本发明第三方面提供一种语音识别系统,所述系统包括车载设备和智能终端;
31.所述车载设备与所述智能终端建立蓝牙通信连接;
32.所述车载设备生成触发指令,与所述智能终端建立语音传输通道;
33.所述车载设备采用预设方式激活所述智能终端进入语音识别状态;
34.所述车载设备采集第一语音指令,并将所述第一语音指令通过所述语音传输通道发送至所述智能终端进行识别处理以操作所述智能终端中应用程序。
35.本发明第四方面提供一种电子设备,包括第二存储器、第二处理器及存储在第二存储器上并可在第二处理器上运行的计算机程序,所述第二处理器执行计算机程序时实现上述的语音识别方法。
36.本发明第五方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被第三处理器执行时实现上述的语音识别方法。
37.在符合本领域常识的基础上,所述各优选条件,可任意组合,即得本发明各较佳实施例。
附图说明
38.图1为本发明实施例1的语音识别方法的流程图。
39.图2为本发明实施例2的语音识别方法的第一流程图。
40.图3为本发明实施例3的语音识别方法的第二流程图。
41.图4为本发明实施例3的语音识别装置的结构示意图。
42.图5为本发明实施例4的语音识别系统的结构示意图。
43.图6为本发明实施例6的实现语音识别方法的电子设备的结构示意图。
具体实施方式
44.下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
45.实施例1
46.如图1所示,本实施例的语音识别方法包括:
47.s101、与智能终端建立蓝牙通信连接;
48.s102、生成触发指令;
49.s103、基于触发指令开启与智能终端的语音传输通道;
50.其中,在骤s103执行开启语音传输通道之前还包括如下步骤:
51.建立hfp(hands-free profile,一种蓝牙设备控制电话的技术)协议连接。
52.s104、采用预设方式激活智能终端进入语音识别状态;
53.其中,预设方式包括但不限于蓝牙的voice recognize命令、语音触发命令。
54.s105、采集第一语音指令,并将第一语音指令通过语音传输通道发送至智能终端,以供智能终端进行识别处理;
55.其中,第一语音指令用于表征操作智能终端中应用程序的控制信息。
56.当该语音识别方法应用在车联网场景中,采用车载设备(如车机)直接采集用户的声音信息,并将该声音信息经由语音传输通道发送至用户的智能终端(如手机等),在智能终端中完成声音信息语义识别,并根据该语音识别结果在智能终端中完成对应的实际操作,如打开应用程序、对应用程序进一步执行具体操作,如打开微信应用程序、发送微信;打开短信应用程序、发送短息;打开电话应用程序、拨打电话;即实现即便车载设备中没有安装对应软件程序且不支持语音功能等,也能够实现基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求。
57.本实施例中,通过车载设备与智能终端之间先建立蓝牙通信连接,然后车载设备生成触发指令以建立与智能终端之间的语音传输通道,再通过预设方式激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序(如微信、短信、电话等),即实现车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
58.实施例2
59.本实施例的语音识别方法是对实施例1的进一步改进,具体地:
60.在一可实施的方案中,如图2所示,步骤s101之前还包括:
61.s10101、配置激活按钮;
62.s10102、基于激活按钮生成激活命令;
63.步骤s101包括:
64.s1011、根据激活命令与智能终端建立蓝牙通信连接。
65.在具体场景设备(如车载设备、方控等)中增设激活按钮(物理按键),通过用户手动按压该激活按钮以一键直接触发具体场景设备与智能终端之间的蓝牙连接,便于用户操作的同时,也可以满足用户根据自身习惯进行随时触发的操作需求。
66.在一可实施的方案中,如图3所示,步骤s101之前还包括:
67.s10103、预设用于激活蓝牙的热词信息;
68.s10104、接收热词信息;
69.步骤s101包括:
70.s1012、根据热词信息与智能终端建立蓝牙通信连接。
71.通过预先设置激活蓝牙的热词,如“请开启蓝牙连接”、“请蓝牙连接吧”等,以主动触发与智能终端之间的蓝牙通信连接。
72.当然,还可以采用其他方式触发当前场景设备与智能终端之间的蓝牙通信连接,
只要实现该功能即可。
73.步骤s104之前还包括:
74.采集第二语音指令,并通过语音传输通道发送第二语音指令至智能终端以唤醒智能终端。
75.在激活智能终端的语音识别功能之前,通过预先设定的智能终端唤醒词将其唤醒,以使得整个智能终端处于被唤醒状态,以保证后续操作步骤执行的有效性。
76.本实施例中,通过车载设备与智能终端之间先建立蓝牙通信连接,然后车载设备生成触发指令以建立与智能终端之间的语音传输通道,再通过预设方式激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序(如微信、短信、电话等),即实现车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
77.实施例3
78.如图4所示,本实施例的语音识别装置包括声音采集单元1、通信单元2、第一存储器3,以及一个或多个第一处理器4。
79.通信单元2与智能终端建立蓝牙通信连接;
80.一个或多个第一处理器4与通信单元2、声音采集单元1,以及第一存储器3通信连接;
81.第一存储器3被配置成存储指令,当指令被一个或多个第一处理器4执行时,使一个或多个第一处理器4执行步骤,步骤包括:
82.生成触发指令,发送触发指令给通信单元2;
83.控制通信单元2开启与智能终端的语音传输通道,采用预设方式激活智能终端进入语音识别状态;
84.其中,预设方式包括但不限于蓝牙的voice recognize命令、语音触发命令。
85.另外,在开启与智能终端的语音传输通道之前还需要建立hfp协议连接。
86.控制声音采集单元1采集第一语音指令;
87.控制通信单元2将第一语音指令通过语音传输通道发送至智能终端,以供智能终端进行识别处理。
88.其中,第一语音指令用于表征操作智能终端中应用程序的控制信息。
89.当该语音识别方法应用在车联网场景中,采用车载设备(如车机)直接采集用户的声音信息,并将该声音信息经由语音传输通道发送至用户的智能终端(如手机等),在智能终端中完成声音信息语义识别,并根据该语音识别结果在智能终端中完成对应的实际操作,如打开应用程序、对应用程序进一步执行具体操作,如打开微信应用程序、发送微信;打开短信应用程序、发送短息;打开电话应用程序、拨打电话;即实现即便车载设备中没有安装对应软件程序且不支持语音功能等,也能够实现基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求。
90.本实施例中,通过车载设备与智能终端之间先建立蓝牙通信连接,然后车载设备生成触发指令以建立与智能终端之间的语音传输通道,再通过预设方式激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序(如微信、短信、电话等),即实现车载设备中没有安装且不支持语音功能对应软件程序,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
91.实施例4
92.本实施例的语音识别装置是对实施例3的进一步改进,具体地:
93.在一可实施的方案中,第一处理器4还执行如下步骤:配置激活按钮,基于激活按钮生成激活命令。
94.通信单元2根据激活命令与智能终端建立蓝牙通信连接。
95.在具体场景设备(如车载设备、方控等)中增设激活按钮(物理按键),通过用户手动按压该激活按钮以一键直接触发具体场景设备与智能终端之间的蓝牙连接,便于用户操作的同时,也可以满足用户根据自身习惯进行随时触发的操作需求。在一可实施的方案中,第一处理器4还执行如下步骤:
96.预设用于激活蓝牙的热词信息,接收热词信息;
97.通信单元2根据热词信息与智能终端建立蓝牙通信连接。
98.通过预先设置激活蓝牙的热词,如“请开启蓝牙连接”、“请蓝牙连接吧”等,以主动触发与智能终端之间的蓝牙通信连接。
99.当然,还可以采用其他方式触发当前场景设备与智能终端之间的蓝牙通信连接,只要实现该功能即可。另外,本实施例的第一处理器4还执行如下步骤:
100.控制声音采集单元1采集第二语音指令,控制通信单元2通过语音传输通道发送第二语音指令至智能终端以唤醒智能终端。
101.在激活智能终端的语音识别功能之前,通过预先设定的智能终端唤醒词将其唤醒,以使得整个智能终端处于被唤醒状态,以保证后续操作步骤执行的有效性。
102.本实施例中,通过车载设备与智能终端之间先建立蓝牙通信连接,然后车载设备生成触发指令以建立与智能终端之间的语音传输通道,再通过预设方式激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序(如微信、短信、电话等),即实现车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
103.实施例5
104.如图5所示,本实施例的语音识别系统包括车载设备100和智能终端200;
105.车载设备100与智能终端200建立蓝牙通信连接;
106.车载设备100生成触发指令,与智能终端200建立语音传输通道;
107.车载设备100采用预设方式激活智能终端200进入语音识别状态;
108.车载设备100采集第一语音指令,并将第一语音指令通过语音传输通道发送至智能终端200进行识别处理以操作智能终端200中应用程序。
109.其中,该语音识别系统中的语音识别功能对应的工作原理与实施例3或4中类似,因此此处就不再赘述。
110.本实施例中,通过车载设备与智能终端之间先建立蓝牙通信连接,然后车载设备生成触发指令以建立与智能终端之间的语音传输通道,再通过预设方式激活智能终端的语音识别功能,实现基于车载设备采集语音信息并通过语音传输通道将其传输至智能终端中进行解析,以根据解析后的语义直接操作智能终端中的应用程序(如微信、短信、电话等),即实现车载设备中没有安装对应软件程序且不支持语音功能等情况下,也可以基于车载设备与智能终端的链路交互触发智能终端中安装的对应程序执行相关操作,从而不受限于车载设备自身的局限性,能够及时有效地满足驾驶用户的使用需求,提高了驾驶用户的使用体验的同时,也有效地提升了驾车的安全性。
111.实施例6
112.图6为本发明实施例6提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现实施例1或2中任一实施例中的语音识别方法。图6显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
113.如图6所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
114.总线33包括数据总线、地址总线和控制总线。
115.存储器32可以包括易失性存储器,例如随机存取存储器(ram)321和/或高速缓存存储器322,还可以进一步包括只读存储器(rom)323。
116.存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
117.处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或2中任一实施例中的语音识别方法。
118.电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口35进行。并且,电子设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图6所示,网络适配器36通过总线33与电子设备30的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
119.应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述
的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
120.实施例7
121.本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例1或2中任一实施例中的语音识别方法中的步骤。
122.其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
123.在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例1或2中任一实施例中的语音识别方法中的步骤。
124.其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
125.虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1