基于车载应用的语音处理系统的制作方法

文档序号：2836169阅读：173来源：国知局

专利名称：基于车载应用的语音处理系统的制作方法
技术领域：
本发明涉及信息处理技术领域，尤其涉及一种基于车载应用的语音处理系统。
背景技术：
随着经济的发展及社会的进步，汽车已逐渐成为大众化的消费品。汽车的消费群体在不断扩张，消费者对汽车的要求也越来越高。近年来，除经济性、动力性外，在行车过程中的驾驶体验也成为了消费者关注的焦点。车载设备的技术发展也随之越来越深而被入。目前，汽车上大都搭载有具有例如音乐播放、广播收听、电子书阅读等功能的车载设备。这些车载设备在行车过程中为用户提供了多种娱乐及应用功能的体验。而随着液晶触摸技术的发展，车载设备的控制面板也从传统的按键面板转换为液晶触摸显示屏，这些都进一步提高了用户使用的便利性，并且提供了更为直观的用户操作界面。此外，随着移动通信技术的发展，车载设备的技术也越来越像功能集成化发展。目前，有些车载设备已能通过最新的3G网络实现语音通话、网络浏览等功能，使得车载设备真正成为了一种能提供全方位功能体验的移动应用系统。然而，即使由于液晶触摸技术的引入，用户在行车过程中的操作方式仍未发生改变，任何的功能应用仍需用户通过手动输入操作指令来实现。对于一些复杂的功能应用，这无疑增加了操作的复杂度。此外，行车过程中的安全性历来是需要考虑的重要因素，频繁的手动操作也必然会分散驾驶者的注意力，由此为行车过程增加了很多安全隐患。

发明内容
本发明解决的问题是提供一种基于车载应用的语音处理系统，简化车载功能应用的操作复杂度，并且增强行车的安全性。为了解决上述问题，本发明提供了一种基于车载应用的语音处理系统，包括:车载端和服务器；所述车载端包括车载语音处理装置和车载应用处理装置；所述车载语音处理装置接收用户的语音输入，并形成语音请求发送至服务器；所述服务器在获得所述语音请求后，基于所述语音请求形成录音文件，并将所述录音文件转换成文本文件进行识别，并基于识别结果形成语音特征信息，从所述语音特征信息中识别出所述语音请求包含的指令信息，并基于所述指令信息向所述应用处理装置提供应用处理参数；所述车载应用处理装置基于所述应用处理参数执行相应车载应用。与现有技术相比，上述方案具有以下优点:所述基于车载应用的语音处理系统在实现车载功能应用时，仅需用户通过语音方式输入指令，车载语音处理装置就会将所述语音转换成语音请求发送至服务器，并由服务器基于所述语音请求反馈应用处理参数，从而车载应用处理装置就可基于所述应用处理参数执行相应车载应用。由于整个过程中，无需用户进行任何手动操作，从而大大降低了用户在实现车载应用时的操作复杂度。此外，由于无需手动操作，对于驾驶者而言，其在驾驶过程中就无需分散注意力进行车载应用操作，即，驾驶者可以在双手不离开方向盘、视线不离开路面的情况下控制车载设备，从而提高驾驶者驾驶集中度，提高驾车安全性以及驾车体验。

图1是本发明基于车载应用的语音处理系统的一种实施方式的结构示意图；图2是本发明基于车载应用的语音处理系统的一种实施例中车载语音处理装置的结构不意图；图3是本发明基于车载应用的语音处理系统的一种实施例中服务器的结构示意图；图4是图3所示系统中语音转换单元及指令识别单元的一种细化结构示意图；图5是图3中语音转换单元的一种实现结构示意图；图6是本发明基于车载应用的语音处理系统的另一种实施例中车载端及服务器的结构不意图；图7是本发明基于车载应用的语音处理系统的又一种实施例中车载端的结构示意图。
具体实施例方式正如背景技术部分所述，现有车载设备中，任何的功能应用仍需用户通过手动输入操作指令来实现。从而，对于一些复杂的功能应用，这无疑增加了操作的复杂度。并且，为行车过程增加了很多安全隐患。有鉴于此，本发明提供的基于车载应用的语音处理系统通过对用户发出的语音指令进行转换，获得所述语音指令中包含的指令信息，根据所述指令信息启动并执行应用，以实现通过语音指令进行车载应用操作。下面结合附图进一步阐述本发明的基于车载应用的语音处理系统。参照图1所示，本发明基于车载应用的语音处理系统的一种实施方式包括:车载端I和服务器2 ;所述车载端I包括车载语音处理装置10和车载应用处理装置11 ;所述车载语音处理装置10接收用户的语音输入，并形成语音请求发送至服务器2 ;所述服务器2在获得所述语音请求后，基于所述语音请求形成录音文件，并将所述录音文件转换成文本文件进行识别，并基于识别结果形成语音特征信息，从所述语音特征信息中识别出所述语音请求包含的指令信息，并基于所述指令信息向所述应用处理装置11提供应用处理参数；所述车载应用处理装置11基于所述应用处理参数执行相应车载应用。上述实施方式中，在用户通过语音方式输入指令后，车载语音处理装置10就会将所述语音转换成语音请求发送至服务器2，并由服务器2基于所述语音请求反馈应用处理参数，从而车载应用处理装置11就可基于所述应用处理参数执行相应车载应用。由于整个过程中，无需用户进行任何手动操作，从而大大降低了用户在实现车载应用时的操作复杂度。此外，由于无需手动操作，对于驾驶者而言，其在驾驶过程中就无需分散注意力进行车载应用操作，即，驾驶者可以在双手不离开方向盘、视线不离开路面的情况下控制车载设备，从而提高驾驶者驾驶集中度，提高驾车安全性以及驾车体验。参照图2所示，根据本发明基于车载应用的语音处理系统的一种实施例，所述车载语音处理装置10可以包括:
语音输入单元101，用于接收语音；请求处理单元102，在语音输入单元接收到语音时，基于所述语音形成语音请求发送至服务器。其中，所述语音输入单元101可以为麦克风。参照图3所示，根据本发明基于车载应用的语音处理系统的一种实施例，所述服务器2可以包括:语音转换单元20，在获得所述车载语音处理装置10发送的所述语音请求后，基于所述语音请求形成录音文件，并将所述录音文件转换成文本文件进行识别，并基于识别结果形成语音特征信息；存储单元22，用于存储各种车载应用的场景所对应的场景指令文本，以及各种场景下的应用操作所对应的操作指令文本；指令识别单元21，从存储单元22中搜索与语音转换单元20转换的语音特征信息匹配的场景指令文本，在搜索到匹配的场景指令文本时，形成对应的场景启动指令；以及从存储单元22中搜索与语音转换单元20转换的语音特征信息匹配的操作指令文本，在搜索到匹配的操作指令文本时，形成对应的应用操作指令；预处理单元23，在获得对应的场景启动指令后启动，并在获得对应的应用操作指令后，执行预处理操作，并将预处理操作形成的应用处理参数发送至所述车载应用处理装置11。参照图4所示，所述语音转换单元20可以包括:文本识别库201，用于存储基准词条；录音单元202，用于接收所述车载端发送的语音请求，并形成录音文件；语音识别单元203，将所述录音文件转换成文本文件，并将所述文本文件中的词条与所述文本识别库201中的基准词条进行比对，在从所述文本识别库201中获得匹配的基准词条时，基于所述匹配的基准词条形成语音特征信息。所述指令识别单元21可以包括:场景识别单元211，从存储单元22中搜索与语音转换单元20转换的语音特征信息匹配的场景指令文本，在搜索到匹配的场景指令文本时，形成对应的场景启动指令；应用操作识别单元212，从存储单元22中搜索与语音转换单元20转换的语音特征信息匹配的操作指令文本，在搜索到匹配的操作指令文本时，形成对应的应用操作指令。结合图4和图5所示，所述语音识别单元203可以包括:文本识别单元203a、词条比对单元203b及语音特征信息形成单元203c ；所述文本识别单元203a，用于将所述录音文件转换成文本文件；所述词条比对单元203b将所述文本文件中的词条与所述文本识别库201中的基准词条进行比对，获得相应的比对结果；所述语音特征信息形成单元203c，在比对结果的置信度大于预设置信度时，确定所述文本文件中的词条与所述文本识别库201中的相应基准词条匹配，并基于所述匹配的基准词条形成语音特征信息。所述车载应用可以包括:短信应用、网络音乐应用及导航应用。以网络音乐应用为例，驾驶者可以通过麦克风输入语音指令“播放网络音乐”。所述请求处理单元102会基于所述“播放网络音乐”的语音指令形成语音请求发送至语音转换单元20。所述录音单元202会将所述语音请求录音，并形成录音文件后发送至所述文本识别单元203a。所述文本识别单元203a在获得所述录音文件后，会识别所述录音文件中语音对应的文本，从而将所述录音文件转换成文本文件。例如，所述文本识别单元203a会将所述录音文件转换成内容为“播放网络音乐”的文本文件。通常，为了增加转换的准确性，还会对所述录音文件先进行去噪处理，以滤除人声音频率外的其他频段的声音波形。所述文本识别库201可以预先存入一些常用的词条作为基准词条。例如，可以存入日常用语、包括车载应用操作的一些会话用语所对应的词条。这些日常用语及会话用语所对应的词条通常以各自独立的文本文件存入所述文本识别库201，以方便后续比对时分别调用。所述词条比对单元203b在从所述文本识别单元203a处获得转换的文本文件后，就会将所述文本文件中的词条与所述文本识别库201中的基准词条进行比对，并且在比对后将比对结果发送至所述语音特征信息形成单元203c。例如，所述词条比对单元203b会将
所述文本识别库201中与车载应用操作的会话用语所对应的文本文件--打开，并将其中
的基准词条与所述转换的文本文件中的词条一一进行比对，获得多个比对结果。所述比对结果中包含所转换的文本文件中的词条与所述文本识别库201中的基准词条匹配的置信度。所述语音特征信息形成单元203c在获得所述比对结果后，会解析所述比对结果获得所述置信度，在比对结果的置信度大于预设置信度时，确定转换的文本文件中的词条与所述文本识别库201中的相应基准词条匹配。例如，当转换的文本文件中的词条与所述文本识别库201中“播放网络音乐”这个基准词条的比对结果对应的置信度都大于预设置信度时，所述语音特征信息形成单元203c就会认为转换的文本文件中的词条与“播放网络音乐”这个基准词条匹配，则所述语音特征信息形成单元203c可就此确定转换的文本文件对应的语音请求中包含“播放网络音乐”的词条，则所述语音特征信息形成单元203c会将所述词条“播放网络音乐”转换为包括网络音乐的语音特征信息。接下来，所述场景识别单元211和应用操作识别单元212就会对所述语音识别单元202转换的语音特征信息进行识别。类似于语音特征库201，存储单元22中也预先存入了对应各种车载应用场景的场景指令文本，以及对应所述车载应用场景下各种应用操作的操作指令文本。所述场景识别单元211根据所述网络音乐的语音特征信息形成网络音乐应用场景启动指令。所述应用操作识别单元212根据所述网络音乐的语音特征信息形成打开某一网络电台的电台开启指令。然后，在获得网络音乐应用场景启动指令，作为预处理单元的网络电台搜索单元启动，并且依据打开某一网络电台的电台开启指令搜索相应的网络电台，并且获取所述网络电台的链接信息，将所述链接信息作为网络音乐应用的应用处理参数发送至车载应用处理装置11。而所述车载应用处理装置11在获得所述网络电台的链接信息后，就会依据所述链接信息链接至所述网络电台，获取所述网络电台的页面文件，以向用户呈现所述网络电台的界面，并向用户播放网络电台的歌曲。在其他应用场景下，所述基于车载应用的语音处理系统也可进行类似的处理，通过识别出用户语音中包含的指令类型及指令内容，以启动并执行相应的车载应用。参照图6所示，根据本发明基于车载应用的语音处理系统的另一种实施例，所述服务器2除包括上述实施例的各部件外，还可以包括提示信息形成单元24，在指令识别单元21识别出所述场景指令文本或所述操作指令文本时，形成对应所述场景指令文本或所述操作指令文本的提示信息，并发送至所述车载端。所述车载端还包括提示装置12，在获得所述提示信息后，向用户进行提示。所述提示装置12可以为语音播报单元，例如车载音响。仍以前述“播放网络音乐”的语音指令为例，则在指令识别单元21形成网络音乐应用场景启动指令及电台开启指令时，所述提示信息形成单元24就形成提示信息:正在打开网络电台。而所述提示装置12在获得所述提示信息后，就通过语音播放的方式向用户进行提示。由于用户可以通过所述提示信息获知应用操作的执行过程，因而提高了用户的使用体验。所述提示装置12也可以为显示单元，例如液晶触摸屏。仍以前述“播放网络音乐”的语音指令为例，则在指令识别单元21形成网络音乐应用场景启动指令及电台开启指令时，所述提示信息形成单元24就形成提示信息:正在打开网络电台。而所述提示装置12在获得所述提示信息后，就通过显示的方式向用户进行提示。。同样地，由于用户可以通过所述提示信息获知应用操作的执行过程，因而提高了用户的使用体验。此外，所述服务器还可以包括应答信息存储单元25，所述提示信息形成单元24还根据用户基于所述提示信息反馈的确认信息，从所述应答信息存储单元25中搜索与所述场景指令文本或所述操作指令文本对应的应答信息，并发送至所述车载端。例如，用户基于前述提供的提示信息:正在打开网络电台，通过麦克风发送“确认”的语音后，所述提示信息形成单元24就会从所述应答信息存储单元25中搜索与网络音乐应用场景对应的应答信息，例如，所述应答信息可以为:很高兴为您提供网络音乐应用服务。通过所述应答信息，可以增强用户与车载端的互动，进一步提高用户的使用体验。对应地，在所述指令识别单元21未能搜索到匹配的场景指令文本或操作指令文本时，所述提示信息形成单元24也可以向用户提示识别失败的信息。可以得知，所述应答信息及所述识别失败的信息也可以通过显示或语音播报的方式呈现给用户。参照图7所示，在本发明基于车载应用的语音处理系统的其他实施例中，所述车载端还可以包括触发装置13，用于基于用户的请求启动所述车载语音处理装置10。例如，设置触发按键，当用户按下所述触发按键时，启动所述车载语音处理装置10。此外，所述车载端还可以包括计时装置14，在所述车载语音处理装置10启动后计时，在计时时间达到时间阈值且此期间车载语音处理装置未接收到语音时，关闭所述车载语音处理装置。由此，在所述车载语音处理装置启动后，但用户长时间未发出语音指令时，可以通过关闭所述车载语音处理装置以节省能源消耗，节省了使用成本。虽然本发明已以较佳实施例披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。
权利要求
1.一种基于车载应用的语音处理系统，其特征在于，包括:车载端和服务器；所述车载端包括车载语音处理装置和车载应用处理装置；所述车载语音处理装置接收用户的语音输入，并形成语音请求发送至服务器；所述服务器在获得所述语音请求后，基于所述语音请求形成录音文件，并将所述录音文件转换成文本文件进行识别，并基于识别结果形成语音特征信息，从所述语音特征信息中识别出所述语音请求包含的指令信息，并基于所述指令信息向所述应用处理装置提供应用处理参数；所述车载应用处理装置基于所述应用处理参数执行相应车载应用。
2.如权利要求1所述的基于车载应用的语音处理系统，其特征在于，所述车载语音处理装置包括: 语音输入单元，用于接收语音；请求处理单元，在语音输入单元接收到语音时，基于所述语音形成语音请求发送至服务器。
3.如权利要求2所述的基于车载应用的语音处理系统，其特征在于，所述语音输入单元为麦克风。
4.如权利要求1所述的基于车载应用的语音处理系统，其特征在于，所述服务器包括: 语音转换单元，在获得所述车载语音处理装置发送的所述语音请求后，基于所述语音请求形成录音文件，并将所述录音文件转换成文本文件进行识别，并基于识别结果形成语首特征目息；存储单元，用于存储各种车载应用的场景所对应的场景指令文本，以及各种场景下的应用操作所对应的操作指令文本；指令识别单元，从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本，在搜索到匹配的场景指令文本时，形成对应的场景启动指令；以及从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本，在搜索到匹配的操作指令文本时，形成对应的应用操作指令；预处理单元，在获得对应的场景启动指令后启动，并在获得对应的应用操作指令后，执行预处理操作，并将预处理操作形成的应用处理参数发送至所述车载应用处理装置。
5.如权利要求4所述的基于车载应用的语音处理系统，其特征在于，所述语音转换单元包括: 文本识别库，用于存储基准词条；录音单元，用于接收所述车载端发送的语音请求，并形成录音文件；语音识别单元，将所述录音文件转换成文本文件，并将所述文本文件中的词条与所述文本识别库中的基准词条进行比对，在从所述文本识别库中获得匹配的基准词条时，基于所述匹配的基准词条形成语音特征信息。
6.如权利要求5所述的基于车载应用的语音处理系统，其特征在于，所述语音识别单元包括:文本识别单元、词条比对单元及语音特征信息形成单元；所述文本识别单元，用于将所述录音文件转换成文本文件；所述词条比对单元将所述文本文件中的词条与所述文本识别库中的基准词条进行比对，获得相应的比对结果；所述语音特征信息形成单元，在比对结果的置信度大于预设置信度时，确定所述文本文件中的词条与所述文本识别库中的相应基准词条匹配，并基于所述匹配的基准词条形成语音特征信息。
7.如权利要求4所述的基于车载应用的语音处理系统，其特征在于，所述指令识别单元包括:场景识别单元及应用操作识别单元；场景识别单元，从存储单元中搜索与语音转换单元转换的语音特征信息匹配的场景指令文本，在搜索到匹配的场景指令文本时，形成对应的场景启动指令；应用操作识别单元，从存储单元中搜索与语音转换单元转换的语音特征信息匹配的操作指令文本，在搜索到匹配的操作指令文本时，形成对应的应用操作指令。
8.如权利要求4所述的基于车载应用的语音处理系统，其特征在于，所述服务器还包括提示信息形成单元，在指令识别单元识别出所述场景指令文本或所述操作指令文本时，形成对应所述场景指令文本或所述操作指令文本的提示信息，并发送至所述车载端；所述车载端还包括提示装置，在获得所述提示信息后，向用户进行提示。
9.如权利要求8所述的基于车载应用的语音处理系统，其特征在于，所述服务器还包括应答信息存储单元，所述提示信息形成单元还根据用户基于所述提示信息反馈的确认信息，从所述应答信息存储单元中搜索与所述场景指令文本或所述操作指令文本对应的应答信息，并发送至所述车载端；所述提示装置在获得所述应答信息后，向用户进行提示。
10.如权利要求8所述的基于车载应用的语音处理系统，其特征在于，所述提示信息形成单元在指令识别单元未能搜索到匹配的场景指令文本或操作指令文本时，形成识别失败的提示信息，并发送至所述车载端；所述提示装置在获得所述识别失败的提示信息后，向用户进行提示。
11.如权利要求8至10任一项所述的基于车载应用的语音处理系统，其特征在于，所述提示装置为语音播报单元。
12.如权利要求8至10任一项所述的基于车载应用的语音处理系统，其特征在于，所述提示装置为显示单元。
13.如权利要求1所述的基于车载应用的语音处理系统，其特征在于，所述车载端还包括触发装置，用于基于用户的请求启动所述车载语音处理装置。
14.如权利要求13所述的基于车载应用的语音处理系统，其特征在于，所述触发装置为触发按键。
15.如权利要求13所述的基于车载应用的语音处理系统，其特征在于，所述车载端还包括计时装置，在所述车载语音处理装置启动后计时，在计时时间达到时间阈值且此期间车载语音处理装置未接收到语音时，关闭所述车载语音处理装置。
16.如权利要求1所述的基于车载应用的语音处理系统，其特征在于，所述车载应用包括:短信应用、网络音乐应用及导航应用。
全文摘要
一种基于车载应用的语音处理系统，包括车载端和服务器；所述车载端包括车载语音处理装置和车载应用处理装置；所述车载语音处理装置接收用户的语音输入，并形成语音请求发送至服务器；所述服务器在获得所述语音请求后，基于所述语音请求形成录音文件，并将所述录音文件转换成文本文件进行识别，并基于识别结果形成语音特征信息，从所述语音特征信息中识别出所述语音请求包含的指令信息，并基于所述指令信息向所述应用处理装置提供应用处理参数；所述车载应用处理装置基于所述应用处理参数执行相应车载应用。所述基于车载应用的语音处理系统简化了用户操作，提高了行车安全性。
文档编号G10L15/26GK103187059SQ20111045000
公开日2013年7月3日申请日期2011年12月28日优先权日2011年12月28日
发明者杨建 , 张晓海申请人:上海博泰悦臻电子设备制造有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨建;张晓海
技术所有人：上海博泰悦臻电子设备制造有限公司
我是此专利的发明人