语音交互方法、装置及车载通讯终端的制作方法

文档序号:7999248阅读:133来源:国知局
语音交互方法、装置及车载通讯终端的制作方法
【专利摘要】本发明提供一种语音交互方法、装置及车载通讯终端,用于行车中用户与车载通讯终端通过语音进行信息交互。该语音交互方法包括:通过车载通讯系统的浏览器界面接口获取用户通过语音方式输入的语音信息;识别所述语音信息;根据所述语音信息对应的系统功能与服务器端的数据库进行信息交互,得出交互结果;以及对所述交互结果进行语音合成,并将所述合成结果反馈给用户。通过语音识别和语音合成的方式实现人机的智能语音交互,大大增强了用户体验和行车安全。
【专利说明】语音交互方法、装置及车载通讯终端

【技术领域】
[0001] 本发明涉及行车过程中的人机交互,特别是一种语音交互方法、装置及车载通讯 终端。

【背景技术】
[0002] 汽车远程服务(Telematics Service Provider,简称TSP)提供商在给车厂提供 Telematics演示程序时,需要针对于不同车厂的车机软硬件进行TSP服务开发定制,增加 了时间和软硬件等各种成本;同时,传统的人与车机手动交互式的Telematics服务方式, 影响了用户的行车安全,制约和影响用户在开车过程的Telematics体验。
[0003] 随着语音技术的日渐成熟,车机端语音应用日趋增多,车厂用户对于车机的语音 应用也提出了更高的要求。而传统的在车机端进行开发的TSP应用,对语音的使用比较少, 用户体验车机端的应用需要过多的手动操作,分散用户的驾车注意力,极大的影响了用户 的行车安全。
[0004] 目前虽然有些Telematics服务已经增加了语音应用,但有限的支持语音输入关 键字的方式,并不能满足用户行车过程中高度安全的要求。
[0005] 因此,现有行车过程中缺乏人机智能语音交互的问题。


【发明内容】

[0006] 本发明的目的是提供一种语音交互方法、装置及车载通讯终端,用于解决现有行 车过程中缺乏人机智能语音交互的问题。
[0007] 为实现上述目的,根据本发明的一个方面,提供一种语音交互方法,并采用如下技 术方案:
[0008] 语音交互方法,用于车载通讯系统,包括:通过车载通讯系统的浏览器界面接口获 取用户通过语音方式输入的语音信息;识别所述语音信息;根据所述语音信息对应的系统 功能与服务器端的数据库进行信息交互,得出交互结果;以及对所述交互结果进行语音合 成,并将所述合成结果反馈给用户。
[0009] 进一步地,识别所述语音信息包括:以语音的形式提示该用户确认所述语音信息 的识别是否正确;并在所述语音信息的识别不正确的情况下提示用户重新输入所述语音信 肩、。
[0010] 进一步地,在所述语音信息不正确的情况下提示用户重新输入所述语音信息之 后,还包括:在所述语音信息的识别不正确的次数超出预设阈值时,与预设远端进行通信; 接收所述预设远端根据通信确定的用户指示,并根据所述用户指示与所述数据库进行信息 交互。
[0011] 进一步地,在反馈所述交互结果之前,还包括:以语音的形式向用户提示当前与所 述服务器端的数据库进行信息交互所处的阶段
[0012] 根据本发明的另外一个方面,提供一种语音交互装置,并采用如下技术方案:
[0013] 语音交互装置,用于车载通讯系统,包括:获取模块,用于通过车载通讯系统的浏 览器界面接口获取用户通过语音方式输入的语音信息;语音识别模块,用于识别所述语音 信息;信息交互模块,用于根据所述语音信息对应的系统功能与服务器端的数据库进行信 息交互,得出交互结果;以及语音合成模块,用于对所述交互结果进行语音合成,并将所述 合成结果反馈给用户。
[0014] 进一步地,语音识别模块包括:确认模块,用于以语音的形式提示该用户确认所述 语音信息的识别是否正确;第一提示模块,用于并在所述语音信息的识别不正确的情况下 提示用户重新输入所述语音信息。
[0015] 进一步地,语音交互装置还包括:通信模块,用于在所述语音信息的识别不正确的 次数超出预设阈值时,与预设远端进行通信;接收模块,用于接收所述预设远端根据通信确 定的用户指示,并根据所述用户指示与所述数据库进行信息交互。
[0016] 进一步地,语音交互装置还包括:第二提示模块,用于以语音的形式向用户提示当 前与所述服务器端的数据库进行信息交互所处的阶段。
[0017] 根据本发明的又一个方面,提供一种车载通讯终端,并采用如下技术方案:
[0018] 车载通讯终端,包括上述的语音交互装置。
[0019] 本发明通过语音识别和语音合成的方式实现人机的智能语音交互,大大增强了用 户体验和行车安全,使车载通讯终端的应用更加实用和人性化。并且,在TSP服务商给车厂 提供Telematics演示程序时,不需要针对于不同车厂的车机软硬件进行TSP服务开发定 制,节约了时间和软硬件等各种成本,同时,本发明提供的技术方案跨越了车机端的软硬件 平台,增强了平台独立性。

【专利附图】

【附图说明】
[0020] 图1表示本发明实施例一所述的语音交互方法的流程图;
[0021] 图2表示本发明实施例二所述的语音交互方法的流程图;
[0022] 图3表示本发明实施例三所述的语音交互装置的结构示意图。

【具体实施方式】
[0023] 以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定 和覆盖的多种不同方式实施。
[0024] 实施例一:
[0025] 图1表示本发明实施例一所述的语音交互方法的流程图;
[0026] 参见图1所示,语音交互方法包括:
[0027] S101 :通过车载通讯系统的浏览器界面接口获取用户通过语音方式输入的语音信 息;
[0028] S103 :识别所述语音信息;
[0029] S105:根据所述语音信息对应的系统功能与服务器端的数据库进行信息交互,得 出交互结果;
[0030] S107 :对所述交互结果进行语音合成,并将所述合成结果反馈给用户。
[0031] 在本实施例的上述技术方案中,步骤S101中通过车载通讯系统的浏览器界面接 口获取用户通过语音方式输入的语音信息,即是通过Browser浏览器的模拟装置获取用户 的语音信息,例如,导航指示、查看天气、紧急救援等,系统首先获取该语音信息,并在步骤 S103中对该语音信息进行识别,其识别结果可以通过开发B/S结构的模拟器直接将用户的 语言指示建立原型,其中B是Browser浏览器,S为Server服务器,在步骤S105中,根据所 述语音信息对应的系统功能与服务器端的数据库进行信息交互,本实施例中的信息交互是 指系统与服务器之间的,例如,系统通过语音向服务器发出"导航"的指令,服务器则会根据 具体的设置给出"导航"指令所对应的交互结果,并在步骤107中,将上述信息交互的结果 进行语音合成,得出合成结果以及将合成结果反馈给该用户。
[0032] 并且,根据不同的情况,系统会以语音的方式进一步的与用户进行信息交互,比如 在导航服务应用中,系统会用语音提示用户给出具体的目的地,并且再一次确认目的地的 识别是否正确。
[0033] 进一步地,在语音信息的识别不正确的次数超出一个预设阈值时,例如超出2次 或3次时,系统会自动连接人工坐席,由人工坐席协助设置,整个过程都无需用户进行手动 设置。
[0034] 优选地,系统会自动以语音的形式向用户提示当前与所述预设的数据库进行信息 交互所处的阶段,例如,"车载导航正在导入,请稍候"。
[0035] 本实施例的上述技术方案,设计了高度的语音交互的Telematics系统,使用户在 行车过程中,可以彻底解放双手和双眼,安全的享受Telematics服务,给旅程增加更多的 安全和乐趣。
[0036] 实施例二:
[0037] 本实施例采用Flex开发技术,将语音识别技术与语音合成技术应用在B/S结构的 模拟器中,其中Flex是一个高效、免费的开源框架,可用于构建具有表现力的Web应用程 序,然后通过该应用程序利用Adobe Flash Player和Adobe AIR,运行时跨浏览器、桌面和 操作系统实现一致的部署,实现TSP原型的快速开发,现以导航流程为例,具体介绍语音交 互方法的实现步骤:
[0038] 步骤1 :车主按键启动"趣驾"语音交互功能;
[0039] 在本步骤中,"趣驾"即为语音交互系统的名称,用户只需在终端设备上点击"启 动"按钮,即可进入语音交互模式。
[0040] 步骤2 :语音导航提示系统准备就绪;
[0041] 步骤3 :用户说出命令;
[0042] 在本步骤中,用户可以通过语音方式输入需要模拟器执行的命令,如,目的地导 航,客服服务、查看天气、紧急救援等。这里以导航为例,用户说:目的地导航。
[0043] 步骤4 :语音交互系统的语音识别模块ASR对用户输入的命令进行业务识别;
[0044] 在本步骤中,ASR如果识别出用户的命令,则进入步骤5 ;否则返回执行步骤3,并 且语音提示用户再说一遍。
[0045] 如果ASR两次都识别不出用户语音输入的命令,则自动连接人工坐席,进行坐席 协助设置。
[0046] 步骤5 :根据步骤4识别的结果,语音提示用户说出目的地;
[0047] 步骤6 :用户说出目的地;
[0048] 步骤7 :ASR对用户输入的目的地进行兴趣点Ρ0Ι业务识别;
[0049] 在本步骤中,如果识别出用户的输入的目的地Ρ0Ι,则进入步骤8 ;否则返回执行 步骤6,语音提示用户再说一遍。
[0050] 另外,如果ASR两次都识别不出用户语音输入的Ρ0Ι,则自动连接人工坐席,进行 坐席协助设置。
[0051] 步骤8 :根据步骤6识别的结果,语音提示用户确认目的地;
[0052] 步骤9 :用户确认目的地;
[0053] 步骤10 :ASR对用户确认信息进行识别;
[0054] 如果识别出用户是正确的,进入步骤11 ;
[0055] 否则返回执行步骤5;
[0056] 另外,如果ASR两次都未识别出用户的目的地,则自动连接人工坐席,进行坐席协 助设置;
[0057] 步骤11 :提示用户正在进行规划路线,同时地图搜索服务将导航地图显示的Ρ0Ι 位置下发到车机端;
[0058] 步骤12 :用户选择目的地,开始导航;
[0059] 步骤13:应用结束。
[0060] 本发明通过上述实施例,提出了 B/S模拟器来开发Telematics应用的方法,使TSP 在开发初期能更快的设计原型供用户确认,减少了时间和风险成本;同时,本发明提出利用 Flex进行开发的模拟器,因此继承了 Flex有界面表现能力一流,异步调用界面无刷新,兼 容多浏览器,跨平台等优点;并且,这种非嵌入的B/S结构的语音识别和语音合成应用,并 且,这种非嵌入的B/S结构的语音识别和语音合成应用,可以自动合成语音,减少了服务器 端词库和语库的训练,使识别的结果更加人性化,贴近用户的意图。
[0061] 实施例三:
[0062] 图3表示本发明实施例三所述的语音交互装置的结构示意图。
[0063] 参见图3所示,语音交互装置包括:
[0064] 获取模块30,用于通过车载通讯系统的浏览器界面接口获取用户通过语音方式输 入的语首?目息;
[0065] 语音识别模块32,用于识别所述语音信息;
[0066] 信息交互模块34,用于根据所述语音信息对应的系统功能与服务器端的数据库进 行信息交互,得出交互结果;
[0067] 语音合成模块36,用于对所述交互结果进行语音合成,并将所述合成结果反馈给 用户。
[0068] 优选地,语音识别模块包括:确认模块(图中未示),用于以语音的形式提示该用户 确认所述语音信息的识别是否正确;第一提示模块(图中未示),用于并在所述语音信息的 识别不正确的情况下提示用户重新输入所述语音信息。
[0069] 优选地,语音交互装置还包括:通信模块(图中未示),用于在所述语音信息的识别 不正确的次数超出预设阈值时,与预设远端进行通信;接收模块(图中未示),用于接收所述 预设远端根据通信确定的用户指示,并根据所述用户指示与所述数据库进行信息交互。
[0070] 优选地,语音交互装置还包括:第二提示模块(图中未示),用于以语音的形式向用 户提示当前与所述服务器端的数据库进行信息交互所处的阶段。
[0071] 本发明提供的车载通讯终端,包括上述的语音交互装置。
[0072] 根据本发明的上述技术方案,可以了解本发明通过语音识别和语音合成的方式实 现人机的智能语音交互,大大增强了用户体验和行车安全,使应用更加实用和人性化。并 且,在TSP服务商在给车厂提供Telematics演示程序时,不需要针对于不同车厂的车机软 硬件进行TSP服务开发定制,节约了时间和软硬件等各种成本,同时,本发明提供的技术方 案跨越了车机端的软硬件平台,增强了平台独立性。
【权利要求】
1. 一种语音交互方法,用于车载通讯系统,其特征在于,包括: 通过车载通讯系统的浏览器界面接口获取用户通过语音方式输入的语音信息; 识别所述语音信息; 根据所述语音信息对应的系统功能与服务器端的数据库进行信息交互,得出交互结 果; 以及对所述交互结果进行语音合成,并将所述合成结果反馈给用户。
2. 如权利要求1所述的语音交互方法,其特征在于,识别所述语音信息包括: 以语音的形式提示该用户确认所述语音信息的识别是否正确; 并在所述语音信息的识别不正确的情况下提示用户重新输入所述语音信息。
3. 如权利要求2所述的语音交互方法,其特征在于,在所述语音信息不正确的情况下 提示用户重新输入所述语音信息之后,还包括: 在所述语音信息的识别不正确的次数超出预设阈值时,与预设远端进行通信; 接收所述预设远端根据通信确定的用户指示,并根据所述用户指示与所述数据库进行 信息交互。
4. 如权利要求1所述的语音交互方法,其特征在于,在反馈所述交互结果之前,还包 括: 以语音的形式向用户提示当前与所述服务器端的数据库进行信息交互所处的阶段。
5. -种语音交互装置,用于车载通讯系统,其特征在于,包括: 获取模块,用于通过车载通讯系统的浏览器界面接口获取用户通过语音方式输入的语 音信息; 语音识别模块,用于识别所述语音信息; 信息交互模块,用于根据所述语音信息对应的系统功能与服务器端的数据库进行信息 交互,得出交互结果; 以及语音合成模块,用于对所述交互结果进行语音合成,并将所述合成结果反馈给用 户。
6. 如权利要求5所述的语音交互装置,其特征在于,所述语音识别模块包括: 确认模块,用于以语音的形式提示该用户确认所述语音信息的识别是否正确; 第一提示模块,用于并在所述语音信息的识别不正确的情况下提示用户重新输入所述 语首?目息。
7. 如权利要求6所述的语音交互装置,其特征在于,还包括: 通信模块,用于在所述语音信息的识别不正确的次数超出预设阈值时,与预设远端进 行通信; 接收模块,用于接收所述预设远端根据通信确定的用户指示,并根据所述用户指示与 所述数据库进行信息交互。
8. 如权利要求5所述的语音交互装置,其特征在于,还包括: 第二提示模块,用于以语音的形式向用户提示当前与所述服务器端的数据库进行信息 交互所处的阶段。
9. 一种车载通讯终端,其特征在于,包括权利要求5-8任一项所述的语音交互装置。
【文档编号】H04W88/02GK104144192SQ201310172887
【公开日】2014年11月12日 申请日期:2013年5月10日 优先权日:2013年5月10日
【发明者】席小丁 申请人:北京四维图新科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1