车内语音对话系统的制作方法

文档序号:2836168阅读:569来源:国知局
专利名称:车内语音对话系统的制作方法
技术领域
本发明涉及信息处理技术领域,尤其涉及一种车内语音对话系统。
背景技术
随着经济的发展及社会的进步,汽车已逐渐成为大众化的消费品。汽车的消费群体在不断扩张,消费者对汽车的要求也越来越高。近年来,除经济性、动力性外,在行车过程中的驾驶体验也成为了消费者关注的焦点。车载设备的技术发展也随之越来越深而被入。目前,汽车上大都搭载有具有例如音乐播放、广播收听、电子书阅读等功能的车载设备。这些车载设备在行车过程中为用户提供了多种娱乐及应用功能的体验。而随着液晶触摸技术的发展,车载设备的控制面板也从传统的按键面板转换为液晶触摸显示屏,这些都进一步提高了用户使用的便利性,并且提供了更为直观的用户操作界面。此外,随着移动通信技术的发展,车载设备的技术也越来越像功能集成化发展。目前,有些车载设备已能通过最新的3G网络实现语音通话、网络浏览等功能,使得车载设备真正成为了一种能提供全方位功能体验的移动应用系统。然而,即使由于液晶触摸技术的引入,用户在行车过程中的操作方式仍未发生改变,任何的功能应用仍需用户通过手动输入操作指令来实现。对于一些复杂的功能应用,这无疑增加了操作的复杂度。此外,行车过程中的安全性历来是需要考虑的重要因素,频繁的手动操作也必然会分散驾驶者的注意力,由此为行车过程增加了很多安全隐患。

发明内容
本发明解决的问题是提供一种车内语音对话系统,简化车载功能应用的操作复杂度,并且增强行车的安全性。为了解决上述问题,本发明提供了一种车内语音对话系统,包括:语音输入单元,用于接收语音;语音转换单元,用于识别语音,并将所述语音转换为语音特征信息;存储单元,用于存储各种车载应用场景所对应的场景指令文本,以及各种场景下的应用操作所对应的操作指令文本;指令识别单元,从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;以及从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令;应用控制单元,解析所述场景启动指令,启动相应的应用处理单元;以及解析所述应用操作指令,形成应用操作参数,并提供给相应的应用处理单元;应用处理单元,启动后,在获得应用操作参数后,执行应用操作。与现有技术相比,上述方案具有以下优点:所述车内语音对话系统在实现车载功能应用时,仅需用户通过语音方式输入指令,无需任何手动操作,从而大大降低了用户在实现车载功能应用时的操作复杂度。此外,由于无需手动操作,对于驾驶者而言,其在驾驶过程中就无需分散注意力进行车载功能应用操作,即,驾驶者可以在双手不离开方向盘、视线不离开路面的情况下控制车载设备,从而提高驾驶者驾驶集中度,提高驾车安全性以及驾车体验。


图1是本发明车内语音对话系统的一种实施方式的结构示意图;图2是本发明车内语音对话系统的一种实施例的结构示意图;图3是本发明车内语音对话系统的另一种实施例的结构示意图。
具体实施例方式正如背景技术部分所述,现有车载设备中,任何的功能应用仍需用户通过手动输入操作指令来实现。从而,对于一些复杂的功能应用,这无疑增加了操作的复杂度。并且,为行车过程增加了很多安全隐患。有鉴于此,本发明提供的车内语音对话系统通过对用户发出的语音指令进行转换,获得所述语音指令中包含的指令信息,根据所述指令信息启动并执行应用,以实现通过语音指令进行车载应用操作。下面结合附图进一步阐述本发明的车内语音对话系统。参照图1所示,本发明车内语音对话系统的一种实施方式包括:语音输入单元10,用于接收语音;语音转换单元20,用于识别语音,并将所述语音转换为语音特征信息;存储单元30,用于存储各种车载应用场景所对应的场景指令文本,以及各种场景下的应用操作所对应的操作指令文本;指令识别单元40,从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;以及从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令;应用控制单元50,解析所述场景启动指令,启动相应的应用处理单元;以及解析所述应用操作指令,形成应用操作参数,并提供给相应的应用处理单元;应用处理单元60,启动后,在获得应用操作参数后,执行应用操作。上述实施方式中,通过语音转换单元20将用户通过语音输入单元10输入的语音转换为语音特征信息,再通过指令识别单元40对所述语音特征信息进行识别。当用户输入的语音中包含指令信息时,所述指令识别单元40就能从所述语音特征信息中获得与存储单元30存储的场景指令文本或操作指令文本匹配的信息,进而就能够形成相应的指令。从而,所述应用控制单元50就能够通过解析场景启动指令获得需相应启动的应用处理单元60,以及通过解析应用操作指令,形成供已启动的应用处理单元60执行应用操作所需的应用操作参数。进而,应用处理单元60在启动后,就可在获得所述应用操作后执行应用操作。因此,通过上述车内语音对话系统就能够实现用户通过语音进行车载应用操作的功能,从而大大降低了用户在实现车载功能应用时的操作复杂度。并且,提高了驾车安全性以及驾车体验。
参照图2所示,根据本发明车内语音对话系统的一种实施例,所述语音输入单元10可以为麦克风。所述语音转换单元20可以包括:语音特征库201,用于存储语音特征信息;语音识别单元202,从语音输入单元10接收的语音中识别出语音信息,并从语音特征库201中搜索出与所述语音信息匹配的语音特征信息。所述指令识别单元40可以包括:场景识别单元401,从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;应用操作识别单元402,从存储单元30中搜索与语音转换单元20转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令。所述车载应用场景可以包括:电话场景、本地音乐播放场景、广播场景、情景对话场景、预订服务场景。首先以电话场景为例,驾驶者可以通过麦克风输入语音指令“打电话给张三”。所述语音特征库201可以预先存入一些常用的语音特征信息,例如日常用语、包括车载应用操作的一些会话用语。所述语音识别单元202在从麦克风处获得语音指令时,就会从所述语音特征库201中搜索匹配的语音特征信息。假定所述语音特征库201中已经预先存入包括打电话的关键词的会话用语。则所述语音识别单元202会将所述语音指令“打电话给张三”转换为包括打电话及打电话对象的语音特征信息。接下来,所述场景识别单元401和应用操作识别单元402就会对所述语音识别单元202转换的语音特征信息进行识别。类似于语音特征库201,存储单元30中也预先存入了对应各种车载应用场景的场景指令文本,以及对应所述车载应用场景下各种应用操作的操作指令文本。所述场景识别单元401根据所述打电话的语音特征信息形成电话场景启动指令。所述应用操作识别单元402根据所述打电话的对象的语音特征信息形成包括“张三”的电话号码的拨号指令。然后,所述应用控制单元50在解析所述电话场景启动指令后,获知需启动作为应用处理单元的车载通话单元。并且,所述应用控制单元50在解析所述包括“张三”的电话号码的拨号指令后,获得“张三”的电话号码,并将电话号码发送至所述车载通话单元。所述车载通话单元在启动后,就会依据所述应用控制单元50提供的“张三”的电话号码进行拨号,以实现驾驶者与张三的电话通信应用操作。当然,所述应用操作识别单元402也可根据所述打电话的对象的语音特征信息形成包括“张三”的联系人拨打指令。所述应用控制单元50解析后,将联系人“张三”发送至所述车载通话单元。相应地,所述车载通话单元在启动后,会依据联系人“张三”来搜索通讯录获得该联系人的电话号码进行拨号。在其他应用场景下,依据用户的语音指令不同,指令识别单元40产生的启动指令和所述应用控制单元50解析获得的应用操作参数也与应用场景对应,而所述应用处理单元也相应为能实现所述应用场景功能的设备。例如,当驾驶者通过麦克风输入语音指令“播放至少还有你”时,所述指令识别单元40根据所述语音转换单元20转换的语音特征信息形成本地音乐播放场景启动指令及包括“至少还有你”的歌曲播放指令。所述应用控制单元50在解析所述本地音乐播放场景启动指令后,相应启动作为应用处理单元的车载音响。并且,所述应用控制单元50在解析所述包括“至少还有你”的歌曲播放指令后,获得播放的歌曲名“至少还有你”,并将所述歌曲名“至少还有你”发送至所述车载音响。所述车载音响在启动后,就会播放“至少还有你”,以实现播放歌曲的应用操作。当然,驾驶者也可通过麦克风输入语音指令“播放林忆莲的歌”。相应地,所述应用控制单元50解析获得的应用操作参数就为歌手名“林忆莲”。所述车载音响就会开始播放已存储的林忆莲的歌曲。此外,驾驶者也可通过麦克风输入语音指令“随便放几首歌”或“随便听听歌”。相应地,所述应用控制单元50解析获得的应用操作参数就为随机播放指示。所述车载音响就会随机播放本地音乐,所述本地音乐可以为例如车载端的存储设备中的音乐,或者也可以为连接至车载端的外部存储设备(例如SD卡)中的音乐。又例如,当驾驶者通过麦克风输入语音指令“我要听FM103.7”时,所述指令识别单元40根据所述语音转换单元20转换的语音特征信息形成广播场景启动指令及包括“FM103.7”的电台开启指令。所述应用控制单元50在解析所述广播场景启动指令后,相应启动作为应用处理单元的车载收音机。并且,所述应用控制单元50在解析所述包括“FM103.7”的电台开启指令后,获得需开启的电台名为“FM103.7”,并将所述电台名“FM103.7”发送至所述车载收音机。所述车载收音机在启动后,就会播放电台“FM103.7”中的节目,以实现收听广播的应用操作。当然,驾驶者也可通过麦克风输入语音指令“音乐广播”,所述车载收音机就会相应播放音乐电台类型的广播;或者驾驶者还可通过麦克风输入语音指令“随便听听广播”,所述车载收音机就会随机播放搜索到的电台广播。再例如,当驾驶者通过麦克风输入语音指令“你好”时,所述指令识别单元40根据所述语音转换单元20转换的语音特征信息形成情景对话场景启动指令和包括“你好”的应答指令。所述应用控制单元50在解析所述情景对话场景启动指令后,相应启动作为应用处理单元的应答语处理单元。并且,所述应用控制单元50在解析所述包括“你好”的应答指令后,获得情景对话触发短句“你好”,并将所述情景对话触发短句“你好”发送至所述应答语处理单元。所述应答语处理单元在启动后,就会调用自身存储的与“你好”对应的应答语,例如“老板好”,并通过与其连接的扬声器朗读“老板好”,以实现与驾驶者间的情景对话应用操作。还例如,当驾驶者通过麦克风输入语音指令“预订机票”时,所述指令识别单元40根据所述语音转换单元20转换的语音特征信息形成预订服务场景启动指令和包括“机票”的预订操作指令。所述应用控制单元50在解析所述预订服务场景启动指令后,相应启动作为应用处理单元的数据通道建立单元。并且,所述应用控制单元50在解析所述包括“机票”的预订操作指令后,获得预订服务关键字“机票”,并将所述预订服务关键字“机票”发送至所述数据通道建立单元。所述数据通道建立单元在启动后,就会依据所述预订服务关键字“机票”建立车载端与机票预订中心的数据通道。所述数据通道可以包括语音通道或短信通道,使得驾驶者可通过语音或短信的方式与机票预订中心联系,以实现机票预订的应用操作。参照图3所示,根据本发明车内语音对话系统的另一种实施例,所述车内语音对话系统除包括上述实施例的各部件外,还可以包括提示单元70。所述应用控制单元50在获得场景启动指令时,形成提示场景已启动的提示信息,并通过所述提示单元70向驾驶者提
/Jn ο所述提示单元70可以为语音播报单元,例如车载音响。仍以前述“我要听FM103.7”的语音指令为例,则在指令识别单元40形成广播场景启动指令及包括“FM103.7”的电台开启指令时,所述应用控制单元50就会形成“FM103.7已开启”的提示信息,并通过提示单元70语音播报所述提示信息:FM103.7已开启。由于驾驶者可以通过所述提示信息获知应用操作的执行过程,因而提高了驾驶者的使用体验。所述提示单元70也可以为显示单元,例如液晶触摸屏。仍以前述“我要听FM103.7”的语音指令为例,则在指令识别单元40形成广播场景启动指令及包括“FM103.7”的电台开启指令时,所述应用控制单元50就会形成“FM103.7已开启”的提示信息,并通过所述提示单元70就可向驾驶者显示提示信息:FM103.7已开启。同样地,由于驾驶者可以通过所述提示信息获知应用操作的执行过程,因而提高了驾驶者的使用体验。另外,所述应用控制单元50在获得场景启动指令且未获得应用操作指令时,形成提示进一步输入应用操作指令的提示信息,并通过所述提示单元70向驾驶者提示。例如,驾驶者通过麦克风输入语音指令“打电话”后,所述指令识别单元40根据所述语音转换单元20转换的语音特征信息形成电话场景启动指令。所述应用控制单元50在获得电话场景启动指令后且未获得拨号指令时,形成提示信息“打给哪位”,并通过提示单元以语音播报或显示的方式向驾驶者提示。此外,所述车内语音对话系统还可以包括应答信息存储单元80。所述应用控制单元50还根据用户基于所述提示信息反馈的确认信息,从所述应答信息存储单元80中搜索与当前启动场景对应的应答信息,并通过所述提示单元向用户提示。例如,驾驶者基于前述提供的提示信息:FM103.7已开启,通过麦克风发送“确认”的语音后,所述应用控制单元50就会从所述应答信息存储单元80中搜索与广播场景对应的应答信息,例如,所述应答信息可以为:很高兴为您提供广播服务。所述应答信息也可以通过显示或语音播报的方式呈现给驾驶者。通过所述应答信息,可以增强驾驶者与车内语音对话系统的互动,进一步提高驾驶者的使用体验。在本发明车内语音对话系统的其他实施例中,所述车内语音对话系统还可以包括触发单元,用于基于用户的请求启动所述车内语音对话系统。例如,设置触发按键,当用户按下所述触发按键时,启动所述车内语音对话系统。此外,所述车内语音对话系统还可以包括计时单元,在所述车内语音对话系统启动后计时,在计时时间达到时间阈值且此期间语音输入单元未接收到语音时,关闭所述车内语音对话系统。由此,在所述车内语音对话系统启动后,但用户长时间未发出语音指令时,可以通过关闭所述车内语音对话系统以节省能源消耗,节省了使用成本。虽然本发明已以较佳实施例披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
权利要求
1.一种车内语音对话系统,其特征在于,包括: 语音输入单元,用于接收语音; 语音转换单元,用于识别语音,并将所述语音转换为语音特征信息; 存储单元,用于存储各种车载应用场景所对应的场景指令文本,以及各种场景下的应用操作所对应的操作指令文本; 指令识别单元,从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令;以及从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令; 应用控制单元,解析所述场景启动指令,启动相应的应用处理单元;以及解析所述应用操作指令,形成应用操作参数,并提供给相应的应用处理单元; 应用处理单元,启动后,在获得应用操作参数后,执行应用操作。
2.如权利要求1所述的车内语音对话系统,其特征在于,所述语音转换单元包括: 语音特征库,用于存储语音特征信息; 语音识别单元,从语音输入单元接收的语音中识别出语音信息,并从语音特征库中搜索出与所述语音信息匹配的语音特征信息。
3.如权利要求1所述的车内语音对话系统,其特征在于,所述指令识别单元包括:场景识别单元及应用操作识别单元, 场景识别单元,从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本,在搜索到匹配的场景指令文本时,形成对应的场景启动指令; 应用操作识别单元,从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本时,形成对应的应用操作指令。
4.如权利要求1所述的车内语音对话系统,其特征在于,还包括提示单元;所述应用控制单元在获得场景启动指令时,形成提示场景已启动的提示信息,并通过所述提示单元向用户提示。
5.如权利要求4所述的车内语音对话系统,其特征在于,所述应用控制单元在获得场景启动指令且未获得应用操作指令时,形成提示进一步输入应用操作指令的提示信息,并通过所述提示单元向用户提示。
6.如权利要求4所述的车内语音对话系统,其特征在于,还包括应答信息存储单元;所述应用控制单元还根据用户基于所述提示信息反馈的确认信息,从所述应答信息存储单元中搜索与当前启动场景对应的应答信息,并通过所述提示单元向用户提示。
7.如权利要求4或5或6所述的车内语音对话系统,其特征在于,所述提示单元为语音播报单元。
8.如权利要求4或5或6所述的车内语音对话系统,其特征在于,所述提示单元为显示单元。
9.如权利要求1所述的车内语音对话系统,其特征在于,所述场景启动指令为电话场景启动指令;所述应用操作参数包括电话号码或电话联系人名称;所述应用处理单元为车载通话单元。
10.如权利要求1所述的车内语音对话系统,其特征在于,所述场景启动指令为本地音乐播放场景启动指令;所述应用操作参数包括歌曲名、歌手名或随机播放指示;所述应用处理单元为车载音响。
11.如权利要求1所述的车内语音对话系统,其特征在于,所述场景启动指令为广播场景启动指令;所述应用操作参数包括电台名、电台类型或随机播放指示;所述应用处理单元为车载收音机。
12.如权利要求1所述的车内语音对话系统,其特征在于,所述场景启动指令为情景对话场景启动指令;所述应用操作参数包括情景对话触发短句;所述应用处理单元包括应答语处理单元和与所述应答语处理单元连接的扬声器,所述应答语处理单元存储有与所述情景对话触发短句对应的应答语。
13.如权利要求1所述的车内语音对话系统,其特征在于,所述场景启动指令为预订服务场景启动指令;所述应用操作参数包括预订服务关键字;所述应用处理单元包括数据通道建立单元,所述数据通道建立单元用于建立与所述预订服务关键字对应的预订中心的语音通道或短信。
14.如权利要求1所述的车内语音对话系统,其特征在于,还包括触发单元,用于基于用户的请求启动所述车内语音对话系统。
15.如权利要求14所述的车内语音对话系统,其特征在于,所述触发单元为触发按键。
16.如权利要求14所述的车内语音对话系统,其特征在于,还包括计时单元,在所述车内语音对话系统启动后计时,在计时时间达到时间阈值且此期间语音输入单元未接收到语音时,关闭所述车内语音对话系统。
17.如权利要求1或16所述 的车内语音对话系统,其特征在于,所述语音输入单元为麦克风。
全文摘要
一种车内语音对话系统,包括语音输入单元,用于接收语音;语音转换单元,用于识别语音,将所述语音转换为语音特征信息;存储单元,存储各车载应用场景对应的场景指令文本及各场景下应用操作对应的操作指令文本;指令识别单元,从存储单元中分别搜索与语音转换单元转换的语音特征信息匹配的场景指令文本及操作指令文本,在搜索到匹配的场景指令文本及操作指令文本时,形成对应的场景启动指令及应用操作指令;应用控制单元,解析场景启动指令,启动相应应用处理单元;及解析应用操作指令,形成应用操作参数,提供给相应应用处理单元;应用处理单元,启动后执行对应应用操作参数的应用操作。所述车内语音对话系统简化用户操作,提高行车安全性。
文档编号G10L15/26GK103187058SQ20111045000
公开日2013年7月3日 申请日期2011年12月28日 优先权日2011年12月28日
发明者刘根华, 廖建国, 张晓海 申请人:上海博泰悦臻电子设备制造有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1