语音服务提供方法、装置和终端的制作方法

文档序号:7770780阅读:138来源:国知局
语音服务提供方法、装置和终端的制作方法
【专利摘要】本发明公开了一种语音服务提供方法、装置和终端,属于计算机【技术领域】。所述语音服务提供方法包括:接收应用程序发送的携带有待处理信息的语音服务请求;通过统一接口调用语音处理单元;通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。解决了【背景技术】中语音服务提供方法可能不能实现以及开发成本大的问题。达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本发明中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
【专利说明】语音服务提供方法、装置和终端
【技术领域】
[0001]本公开涉及计算机【技术领域】,特别涉及一种语音服务提供方法、装置和终端。
【背景技术】
[0002]目前,市场上能够提供语音服务的应用程序越来越多,并且这些应用程序大多是应用提供商通过与提供语音技术的第三方合作,通过在第三方提供的语音技术的基础上重新开发得到。比如,某语音服务的应用程序就是使用语音技术提供商提供的SDK (SoftwareDevelopment Kit,软件开发工具包)或者API (Application Programming Interface,应用编程接口),进而实现语音拨号和语音播报天气的功能。
[0003]安装上述应用程序的终端即可为用户提供语音服务,常见的一种语音服务提供方法包括:第一,终端接收用户输入的语音信息;第二,终端使用安装的能够提供语音服务的应用程序对接收到的语音信息进行解析;第三,终端根据解析结果为用户提供语音服务。
[0004]发明人在实现本公开的过程中,发现上述方式至少存在如下缺陷:
[0005]当第三方不再为应用提供商提供技术支持时,上述应用程序将不能继续工作,也即上述语音服务提供方法将不能实现;此时应用提供商需要向新的第三方寻求技术支持,但是由于不同技术提供商编写程序的方式也有所不同,所以应用提供商需要重新适配新的程序编写方式,开发成本大。

【发明内容】

[0006]为了解决上述服务提供方法可能不能实现以及程序开发成本大的问题,本公开实施例提供了一种语音服务提供方法、装置和终端。所述技术方案如下:
[0007]第一方面,提供了一种语音服务提供方法,所述方法包括:
[0008]接收应用程序发送的携带有待处理信息的语音服务请求;
[0009]通过统一接口调用语音处理单元;
[0010]通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0011]在第一种可能的实现方式中,所述通过统一接口调用语音处理单元,包括:
[0012]通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或,
[0013]通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或,
[0014]通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音
处理单元。
[0015]在第二种可能的实现方式中,若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元;[0016]若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
[0017]在第三种可能的实现方式中,所述通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,包括:
[0018]通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息;
[0019]或者,
[0020]通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。
[0021]在第四种可能的实现方式中,所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息;
[0022]其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
[0023]第二方面,提供了一种语音服务提供装置,所述装置包括:
[0024]请求接收模块,用于接收应用程序发送的携带有待处理信息的语音服务请求;
[0025]单元调用模块,用于通过统一接口调用语音处理单元;
[0026]信息获取模块,用于通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0027]在第一种可能的实现方式中,所述单元调用模块,包括:
[0028]第一调用单元,用于通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或,
[0029]第二调用单元,用于通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或,
[0030]第三调用单元,用于通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音处理单元。
[0031]在第二种可能的实现方式中,
[0032]若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元;
[0033]若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
[0034]在第三种可能的实现方式中,所述信息获取模块,包括:
[0035]第一获取单元或者第二获取单元;
[0036]所述第一获取单元,用于通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息;
[0037]所述第二获取单元,用于通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。[0038]在第四种可能的实现方式中,所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息;
[0039]其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
[0040]第三方面,提供了 一种终端,所述终端包括第二方面所述的语音服务提供装置。
[0041]第四方面,提供了一种终端,所述终端包括:
[0042]一个或多个处理器;
[0043]存储器;和
[0044]—个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块具有如下功能:
[0045]接收应用程序发送的携带有待处理信息的语音服务请求;
[0046]通过统一接口调用至少语音处理单元;
[0047]通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0048]本公开实施例提供的技术方案的一些有益效果可以包括:
[0049]通过接收应用程序发送的携带有待处理信息的语音服务请求,通过统一接口调用语音处理单元;通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序;通过统一接口调用语音处理单元,达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本实施例中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
[0050]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
【专利附图】

【附图说明】
[0051]为了更清楚地说明本公开的实施例,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0052]图1是本公开的实施例提供的语音服务提供方法的示例性方法流程图;
[0053]图2是本公开的另一实施例提供的语音服务提供方法的示例性方法流程图;
[0054]图3是本公开的实施例提供的语音服务提供装置的示例性结构方框图;
[0055]图4是本公开的另一实施例提供的语音服务提供装置的示例性结构方框图;
[0056]图5是本公开的实施例提供的终端的示例性结构方框图。
[0057]通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
【具体实施方式】[0058]为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,显然,所描述的实施例仅仅是本公开一部份实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
[0059]请参考图1,其示出了本公开的实施例提供的语音服务提供方法的方法流程图,该语音服务提供方法可以包括如下步骤。
[0060]在步骤101中,接收应用程序发送的携带有待处理信息的语音服务请求。
[0061]在步骤102中,通过统一接口调用语音处理单元。
[0062]在步骤103中,通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0063]综上所述,本实施例提供的语音服务提供方法,通过接收应用程序发送的携带有待处理信息的语音服务请求,通过统一接口调用语音处理单元;通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序;通过统一接口调用语音处理单元,达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本实施例中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
[0064]请参考图2,其示出了本公开的另一实施例提供的语音服务提供方法的方法流程图,该语音服务提供方法可以包括如下步骤:
[0065]在步骤201中,接收应用程序发送的携带有待处理信息的语音服务请求;
[0066]应用程序是终端中不可或缺的组成部分,并且终端中的应用程序可以包括终端自带的系统应用程序以及终端为了扩展自身功能而下载安装的第三方应用程序。在用户使用终端中的某一应用程序时,用户可以通过应用程序发送携带有待处理信息的语音服务请求,相应的,终端可以接收到应用程序发送的携带有待处理信息的语音服务请求。其中,待处理/[目息可以是语首/[目息,也可以是文字/[目息。
[0067]比如,用户在使用手机自带的拨号软件时,用户想要通过语音来控制手机给好友张三打电话,则用户可以在拨号软件的选择菜单中选择开始录音按钮,说出‘帮我给张三打电话’的语音信息后结束录音,并在录音结束后通过拨号软件发送语音服务请求,此时手机可以接收到拨号软件发送的携带有内容为‘帮我给张三打电话’的语音信息的语音服务请求;
[0068]而用户在使用手机中的阅读软件阅读小说时,为了避免阅读大篇幅的文字从而减轻人眼的疲劳度,用户可以选择将小说中的文字转换为语音后进行朗读,此时用户可以在阅读软件的选择菜单中选择将文字转换为语音进行朗读的选项,则阅读软件可以发送携带有文字信息的语音服务请求,相应的,手机可以接收到携带有文字信息的语音服务请求。
[0069]在步骤202中,通过统一接口调用语音处理单元;
[0070]在终端接收到语音服务请求之后,终端可以通过统一接口调用语音处理单元。其中,统一接口为支持至少两个提供同类功能的语音处理单元共用的接口,并且语音处理单元可以是根据语音弓I擎封装得到的单元。
[0071]在实际实现时,语音服务可以包括语音识别服务和语音合成服务,语音识别服务是指将语音信息转换为文字信息的服务,语音合成服务是指将文字信息转换为语音信息的服务;并且终端中可以为语音识别服务定义一个语音识别接口,为语音合成服务定义一个语音合成接口,从而这就使得所有能够提供语音识别服务的语音处理单元都可以共用语音识别接口,而能够提供语音合成服务的语音处理单元都可以共用语音合成接口 ;所以:
[0072]若待处理信息为语音信息,则统一接口为语音识别接口,至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元;
[0073]如果语音服务请求中的待处理信息为语音信息,则说明终端需要将语音信息转换为文字信息,此时终端可以通过语音识别接口调用至少两个提供语音识别功能的语音处理单元中的一个语音处理单元,也即此时统一接口为语音识别接口,语音处理单元是指提供语音识别功能的语音处理单元。比如,当终端接收到拨号软件发送的携带有内容为‘帮我给张三打电话’的语音信息的服务请求,则此时终端可以通过语音识别接口调用提供语音识别功能的语音处理单元中的一个语音处理单元。
[0074]若待处理信息为文字信息,则统一接口为语音合成接口,至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
[0075]如果语音服务请求中的待处理信息为文字信息,则说明终端需要将文字信息转换为语音信息,此时,终端可以通过语音合成接口调用至少两个提供语音合成功能的语音处理单元中的一个语音处理单元,也即此时统一接口为语音合成接口,语音处理单元是提供语音合成功能的语音处理单元。
[0076]同时,常见的语音服务提供商可以包括‘XX讯飞’、‘云知X’和‘X度’等等,每个语音服务提供商大多可以同时提供语音识别和语音合成两种服务,所以终端中提供语音识别服务的语音处理单元可以包括根据‘XX讯飞’提供的语音识别引擎封装得到的第一语音处理单元、根据‘云知X’提供的语音识别引擎封装得到的第二处理单元以及根据‘X度’提供的语音识别引擎封装得到第三语音处理单元等等;类似的,终端中提供语音合成服务的语音处理单元可以包括根据‘XX讯飞’提供的语音识合成引擎封装得到的第一语音处理单元、根据‘云知X’提供的语音合成引擎封装得到的第二处理单元以及根据‘X度’提供的语音合成引擎封装得到第三语音处理单元等等;其中,语音识别引擎和语音合成引擎可以是语音提供商以SDK形式提供也可以是语音提供商以API的形式提供,本实施例对此并不做限定;
[0077]由于提供同类功能的语音处理单元可以有两个或者两个以上,所以当提供同类功能的语音处理单元有至少两个时,终端通过统一接口调用语音处理单元的步骤可以包括如下方式中的任意一种:
[0078]第一,通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;
[0079]在第一种可能的实现方式中,终端接收到语音服务请求之后,终端可以通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元。
[0080]比如,终端中提供语音识别功能的语音处理单元包括根据‘XX讯飞’提供的语音识别引擎封装得到的第一语音处理单元、根据‘云知X’提供的语音识别引擎封装得到的第二处理单元以及根据‘X度’提供的语音识别引擎封装得到第三语音处理单元,则在终端接收到携带有内容为‘帮我给张三打电话’的语音信息的语音服务请求之后,终端可以通过语音识别接口调用‘XX讯飞’对应的第一语音处理单元。[0081]第二,通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;
[0082]在第二种可能的实现方式中,用户可以在系统设置中从至少两个提供同类功能的语音处理单元中选择一个语音处理单元,并将选择得到的语音处理单元作为终端默认的语音处理单元,从而当终端需要调用与该语音处理单元提供相同功能的语音处理单元时,终端可以通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元。
[0083]比如,终端中提供语音识别功能的语音处理单元包括第一语音处理单元、第二语音处理单元和第三语音处理单元,则用户可以在三个语音处理单元中选择将第二语音处理单元也即‘云知X’对应的语音处理单元作为系统默认的语音处理单元,从而在终端接收携带有内容为‘帮我给张三打电话’的语音信息的语音服务请求之后,终端通过语音识别接口调用‘云知X’对应的第二语音处理单元。
[0084]第三,通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的
语音处理单元。
[0085]在第三种可能的实现方式中,终端还可以通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音处理单元。在实际实现时,终端可以默认提供相同类型的功能的至少两个语音处理单元中的一个语音处理单元作为终端使用的语音处理单元,从而在终端接收到语音服务请求而需要调用语音处理单元时,终端可以通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音处理单元。
[0086]需要说明的一点是,在实际实现时,可以将同一个语音提供商提供的语音识别引擎和语音合成引擎分别封装为一个独立的语音处理单元,所以在终端需要调用提供语音识别功能的语音处理单元时,终端可以调用根据语音服务提供商A提供的语音识别引擎封装得到的语音处理单元;并且在终端需要调用提供语音合成功能的语音处理单元时,终端可以调用根据语音服务提供商B提供的语音合成引擎封装得到的语音处理单元,从而这就更大限度了满足了用户的需求,本实施例对此并不做限定。
[0087]需要说明的另一点是,本实施例中的语音处理单元可以是终端自带的处理单元,也可以是服务器在封装得到语音处理单元的apk (Android Package,安装包),用户下载并安装apk之后获得的语音处理单元,本实施例只要能够实现提供同类功能的语音处理单元能够通用统一接口即可,对其实际实现形式并不做限定。
[0088]在步骤203中,通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序,结果信息为语音处理单元根据预定对应关系获取与应用程序对应的语音数据库,将待处理信息与获取到的语音数据库进行匹配后得到的信肩、O
[0089]在终端通过统一接口调用语音处理单元之后,被调用的语音处理单元可以对待处理信息进行处理,从而得到处理后的结果信息;相应的,终端可以通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,并将结果信息反馈给应用程序。其中,结果信息为语音处理单元根据预定对应关系获取与应用程序对应的语音数据库,将待处理信息与获取到的语音数据库进行匹配后得到的信息。
[0090]比如,语音处理单元处理得到的结果信息为‘给张三打电话’,则终端可以相应的通过统一接口获取到内容为‘给张三打电话’的结果信息,则终端可以反馈‘给张三打电话’的结果信息给拨号软件,从而使得拨号软件在接收到结果信息之后,执行给张三拨号的操作。
[0091]在实际实现时,语音处理单元对待处理信息进行处理的步骤可以包括:
[0092]第一,根据预定对应关系获取与应用程序对应的语音数据库;
[0093]由于每个应用程序发出的语音服务请求所需要的语音服务各不相同,并且同一个应用程序发出的语音服务请求所需要的语音服务基本相同,所以为了后续步骤的执行,在终端通过被调用的语音处理单元对语音服务请求中的待处理信息进行处理时,终端可以通过被调用的语音处理单元根据预定对应关系获取应用程序对应的语音数据库。其中,预定对应关系是应用程序与处理应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
[0094]如,由于终端中的拨号软件发出语音服务请求时,大多需要识别语音服务请求的待处理信息中的联系人姓名以及操作联系人姓名的关键词,从而在识别得到联系人姓名之后,查询与联系人姓名对应的电话号码,根据操作联系人姓名的关键字向查询到的电话号码发送短信或者拨打电话,所以在终端接收到拨号软件发出的语音服务请求时,终端可以查询预定对应关系,获取与拨号软件对应的存储有联系人姓名和控制关键词的语音数据库;
[0095]类似的,提供天气预报功能的软件发出服务请求时,大多是查询某一城市的天气情况,也即大多需要识别语音服务请求的待处理信息中的城市名称,所以在终端接收到天气预报软件发出的语音服务请求时,终端可以查询预定对应关系,从而获取与天气预报软件对应的存储有城市名称的语音数据库。
[0096]第二,将待处理信息与获取到的语音数据库进行匹配,得到处理后的结果信息;
[0097]为了提高语音处理单元对语音服务请求的处理效率,在终端通过被调用的语音处理单元获取到语音数据库之后,终端可以通过被调用的语音处理单元将待处理信息与获取到的语音数据库进行匹配,从而得到处理后的结果信息。
[0098]比如,终端接收到拨号软件发送的携带有内容为‘帮我给张三打电话’的语音信息的语音服务请求,则终端可以通过被调用的语音处理单元将内容为‘帮我给张三打电话’的语音信息与获取到的存储有联系人姓名以及控制关键词的语音数据库进行匹配,从而可以高效率的得到内容为‘打电话给张三’的结果信息;
[0099]类似的,终端接收到天气预报软件发送的携带有内容为‘明天北京天气怎么样’的语音信息的语音服务请求,则终端可以通过被调用的语音处理单元将内容为‘明天北京天气怎么样’的语音信息将获取到的存储有城市名称的语音数据库进行匹配,从而可以高效率的得到内容为‘北京’的结果信息。
[0100]当然在语音处理单元对待处理信息进行处理时,可以根据终端中的所有语音数据库对待处理信息进行处理,本实施例只是为了提高处理效率,所以先获取与应用程序对应的语音数据库,然后根据语音数据库进行处理,本实施例对其实际实现形式并不做限定。
[0101]此外,由于不同语音服务提供商在表达相同含义时使用的数据格式也所有不同,比如在表示‘打电话给张三’时,有些语音服务提供商采用‘CALL张三’来表示,有些语音服务提供商采用‘phone张三’来表示,并且如果语音处理单元对语音服务请求中的待处理信息进行处理之后得到的结果信息是上层应用程序不能识别的格式时,流程将结束,所以为了保证后续步骤继续执行,终端通过统一接口获取语音处理单元得到的结果信息,将结果信息反馈给应用程序的步骤可以包括如下方式中的任一种:
[0102]第一,通过统一接口获取语音处理单元得到的符合统一格式的结果信息;
[0103]在第一种可能的实现方式中,终端通过统一接口获取语音处理单元得到的符合统一格式的结果信息。其中,统一格式为至少两个提供同类功能的语音处理单元所通用的格式。
[0104]在实际实现时,可以为提供同类功能的至少两个语音处理单元设定统一的格式,比如,为提供语音识别功能的语音处理单元设定统一格式A,而为提供语音合成功能的语音处理单元设定统一格式B ;从而使得各个语音处理单元在对语音服务请求中的待处理信息进行处理后,直接可以得到具有统一格式的结果信息,终端就可以通过统一接口获取语音处理单元得到的符合统一格式的结果信息。
[0105]第二,通过统一接口获取语音处理单元得到的符合对应于语音处理单元的专用格式的结果信息;将符合对应于语音处理单元的专用格式的结果信息转换为符合统一格式的结果息。
[0106]在第二种可能的实现方式中,终端还可以通过统一接口获取语音处理单元得到的符合对应于语音处理单元的专用格式的结果信息,将符合对应于语音处理单元的专用格式的结果信息转换为符合统一格式的结果信息。其中,统一格式是预先设定的格式。
[0107]在实际实现时,可以不规定各家语音服务提供商返回的处理结果的数据格式,也即在语音处理单元对语音服务请求中的待处理信息进行处理后,语音处理单元仍然可以采用各自对应的专用格式来表示结果信息,比如语音服务提供商‘XX讯飞’对应的第一语音处理单元采用‘CALL张三’的数据格式;而语音服务提供商‘云知X’对应的第二语音处理单元采用‘phone张三’的数据格式;只是在终端通过统一接口获取语音处理单元得到的符合专用格式的结果信息之后,终端再将符合专用格式的结果信息转换为符合统一格式的结果信息。
[0108]比如,统一格式为采用‘CALL+联系人姓名’方式来表达的格式,则终端通过统一接口获取到第二语音处理单元得到的‘phone张三’的结果信息之后,终端可以将获取到的结果信息转换为具有统一格式‘CALL张三’的结果信息。
[0109]需要说明的是,在实际实现时,统一格式可以是预定义的任何格式,本实施例只是为了制定一个统一标准,使得其他应用提供商可以在得知这个标准之后能够识别获取到的结果信息,对其实际的表示形式并不做限定。
[0110]综上所述,本实施例提供的语音服务提供方法,通过接收应用程序发送的携带有待处理信息的语音服务请求,通过统一接口调用语音处理单元;通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序;通过统一接口调用语音处理单元,达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本实施例中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
[0111]请参考图3,其示出了本公开实施例提供的语音服务提供装置的结构方框图,该语音服务提供装置可以通过软件、硬件或者两者的结合实现成为终端中的全部或者部分,该语音服务提供装置可以包括:请求接收模块310、单元调用模块320和信息获取模块330 ;
[0112]请求接收模块310,用于接收应用程序发送的携带有待处理信息的语音服务请求;
[0113]单元调用模块320,用于通过统一接口调用语音处理单元;
[0114]信息获取模块330,用于通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0115]综上所述,本实施例提供的语音服务提供装置,通过接收应用程序发送的携带有待处理信息的语音服务请求,通过统一接口调用语音处理单元;通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序;通过统一接口调用语音处理单元,达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本实施例中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
[0116]请参考图4,其示出了本公开另一实施例提供的语音服务装置的结构方框图,该语音服务提供装置可以通过软件、硬件或者两者的结合实现成为终端中的全部或者部分,该语音服务提供装置可以包括:请求接收模块310、单元调用模块320和信息获取模块330 ;
[0117]请求接收模块310,用于接收应用程序发送的携带有待处理信息的语音服务请求;
[0118]单元调用模块320,用于通过统一接口调用语音处理单元;
[0119]信息获取模块330,用于通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0120]在本实施例的第一种可能的实现方式中,所述单元调用模块320,包括:
[0121]第一调用单元321,用于通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或,
[0122]第二调用单元322,用于通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或,
[0123]第三调用单元323,用于通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音处理单元。
[0124]在本实施例的第二种可能的实现方式中,若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元;
[0125]若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
[0126]在本实施例的第三种可能的实现方式中,信息获取模块330,包括:
[0127]第一获取单元331,用于通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息;或者,
[0128]第二获取单元332,用于通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。
[0129]在本实施例的第四种可能的实现方式中,所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息;
[0130]其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
[0131]综上所述,本实施例提供的语音服务提供装置,通过接收应用程序发送的携带有待处理信息的语音服务请求,通过统一接口调用语音处理单元;通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序;通过统一接口调用语音处理单元,达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本实施例中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
[0132]请参考图5,其示出了本公开实施例提供的终端的结构方框图,该终端用于实施上述实施例提供的语音服务提供方法,本公开实施例中的终端可以包括一个或多个如下组成部分:用于执行计算机程序指令以完成各种流程和方法的处理器,用于信息和存储程序指令随机接入存储器(RAM)和只读存储器(ROM),用于存储数据和信息的存储器,I/O设备,界面,天线等。具体来讲:
[0133]终端400可以包括RF (Radio Frequency,射频)电路410、存储器420、输入单元430、显示单元440、传感器450、音频电路460、WiFi (wireless fidelity,无线保真)模块470、处理器480、电源482、摄像头490等部件。本领域技术人员可以理解,图5中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0134]下面结合图5对终端400的各个构成部件进行具体的介绍:
[0135]RF电路410可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器480处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、稱合器、LNA (Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路410还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System ofMobile communication,全球移动通讯系统)、GPRS (General Packet Radio Service,通用分组无线服务)、CDMA (Code Division Multiple Access,码分多址)、WCDMA (WidebandCodeDivision Multiple Access,宽带码分多址)、LTE (Long Term Evolution,长期演进)、电子邮件、SMS (Short Messaging Service,短消息服务)等。
[0136]存储器420可用于存储软件程序以及模块,处理器480通过运行存储在存储器420的软件程序以及模块,从而执行终端400的各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端400的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0137]输入单元430可用于接收输入的数字或字符信息,以及产生与终端400的用户设置以及功能控制有关的键信号输入。具体地,输入单元430可包括触控面板431以及其他输入设备432。触控面板431,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板431上或在触控面板431附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板431可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器480,并能接收处理器480发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板431。除了触控面板431,输入单元430还可以包括其他输入设备432。具体地,其他输入设备432可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0138]显示单元440可用于显示由用户输入的信息或提供给用户的信息以及终端400的各种菜单。显示单元440可包括显示面板441,可选的,可以采用IXD(Liquid CrystalDisplay,液晶显示器)、OLED (Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板441。进一步的,触控面板431可覆盖显示面板441,当触控面板431检测到在其上或附近的触摸操作后,传送给处理器480以确定触摸事件的类型,随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图5中,触控面板431与显示面板441是作为两个独立的部件来实现终端400的输入和输入功能,但是在某些实施例中,可以将触控面板431与显示面板441集成而实现终端400的输入和输出功能。
[0139]终端400还可包括至少一种传感器450,比如陀螺仪传感器、磁感应传感器、光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板441的亮度,接近传感器可在终端450移动到耳边时,关闭显示面板441和/或背光。作为运动传感器的一种,加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端400还可配置的气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[0140]音频电路460、扬声器461,传声器462可提供用户与终端400之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号,传输到扬声器461,由扬声器461转换为声音信号输出;另一方面,传声器462将收集的声音信号转换为电信号,由音频电路460接收后转换为音频数据,再将音频数据输出处理器480处理后,经RF电路410以发送给比如另一终端,或者将音频数据输出至存储器420以便进一步处理。
[0141 ] WiFi属于短距离无线传输技术,终端400通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了 WiFi模块470,但是可以理解的是,其并不属于终端400的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
[0142]处理器480是终端400的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器420内的数据,执行终端400的各种功能和处理数据,从而对终端进行整体监控。可选的,处理器480可包括一个或多个处理单元;优选的,处理器480可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器480中。
[0143]终端400还包括给各个部件供电的电源482 (比如电池),优选的,电源可以通过电源管理系统与处理器482逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0144]摄像头490 —般由镜头、图像传感器、接口、数字信号处理器、CPU、显示屏幕等组成。其中,镜头固定在图像传感器的上方,可以通过手动调节镜头来改变聚焦;图像传感器相当于传统相机的“胶卷”,是摄像头采集图像的心脏;接口用于把摄像头利用排线、板对板连接器、弹簧式连接方式与终端主板连接,将采集的图像发送给所述存储器420;数字信号处理器通过数学运算对采集的图像进行处理,将采集的模拟图像转换为数字图像并通过接口发送给存储器420。
[0145]尽管未示出,终端400还可以包括蓝牙模块等,在此不再赘述。
[0146]终端400除了包括一个或者多个处理器480,还包括有存储器,以及一个或者多个模块,其中一个或者多个模块存储于存储器中,并被配置成由一个或者多个处理器执行。上述一个或者多个模块具有如下功能:
[0147]接收应用程序发送的携带有待处理信息的语音服务请求;
[0148]通过统一接口调用语音处理单元;
[0149]通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0150]在本实施例的第一种可能的实现方式中,所述通过统一接口调用语音处理单元,包括:
[0151]通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或,
[0152]通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或,
[0153]通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音
处理单元。
[0154]在本实施例的第二种可能的实现方式中,若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元;
[0155]若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
[0156]在本实施例的第三种可能的实现方式中,所述通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,包括:
[0157]通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息;
[0158]或者,
[0159]通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。
[0160]在本实施例的第四种可能的实现方式中,所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息;
[0161]其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
[0162]综上所述,本实施例提供的终端,通过接收应用程序发送的携带有待处理信息的语音服务请求,通过统一接口调用语音处理单元;通过统一接口获取语音处理单元对待处理信息进行处理后得到的结果信息,将结果信息反馈给应用程序;通过统一接口调用语音处理单元,达到了即使当前语音处理单元被更改为其它语音处理单元,应用层也不需要做任何修改,从而降低开发成本的效果。同时,本实施例中的语音服务对所有应用层开放,使得终端中的所有应用程序都可以调用语音服务,是系统级的语音服务。
[0163]本公开实施例还提供了一种计算机可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在电子设备中时,可以使得该电子设备执行如下步骤的指令(instructions):
[0164]接收应用程序发送的携带有待处理信息的语音服务请求;
[0165]通过统一接口调用语音处理单元;
[0166]通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
[0167]在本实施例的第一种可能的实现方式中,所述通过统一接口调用语音处理单元,包括:
[0168]通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或,
[0169]通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或,
[0170]通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音
处理单元。
[0171]在本实施例的第二种可能的实现方式中,若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元;
[0172]若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
[0173]在本实施例的第三种可能的实现方式中,所述通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序,包括:
[0174]通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息;
[0175]或者,
[0176]通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。
[0177]在本实施例的第四种可能的实现方式中,所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息;
[0178]其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
[0179]需要说明的是:上述实施例提供的语音服务提供装置和终端在提供语音服务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音服务提供装置盒终端与语音服务提供方法的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0180]上述本公开的实施例的序号仅仅为了描述,不代表实施例的优劣。
[0181]本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0182]以上所述仅为本公开的部分实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
【权利要求】
1.一种语音服务提供方法,其特征在于,所述方法包括: 接收应用程序发送的携带有待处理信息的语音服务请求; 通过统一接口调用语音处理单元; 通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
2.根据权利要求1所述的方法,其特征在于,所述通过统一接口调用语音处理单元,包括: 通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或, 通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或, 通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音处理单元。
3.根据权利要求2所述的方法,其特征在于, 若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元; 若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
4.根据权利要求1所述的方法,其特征在于,所述通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,包括: 通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息; 或者, 通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。
5.根据权利要求1所述的方法,其特征在于, 所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息; 其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
6.一种语音服务提供装置,其特征在于,所述装置包括: 请求接收模块,用于接收应用程序发送的携带有待处理信息的语音服务请求; 单元调用模块,用于通过统一接口调用语音处理单元; 信息获取模块,用于通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
7.根据权利要求6所述的装置,其特征在于,所述单元调用模块,包括: 第一调用单元,用于通过统一接口调用至少两个提供同类功能的语音处理单元中的第一个语音处理单元;或, 第二调用单元,用于通过统一接口调用至少两个提供同类功能的语音处理单元中被用户选择的语音处理单元;或, 第三调用单元,用于通过统一接口调用至少两个提供同类功能的语音处理单元中被默认指定的语音处理单元。
8.根据权利要求7所述的方法,其特征在于, 若所述待处理信息为语音信息,则所述统一接口为语音识别接口,所述至少两个提供同类功能的语音处理单元是提供语音识别功能的语音处理单元; 若所述待处理信息为文字信息,则所述统一接口为语音合成接口,所述至少两个提供同类功能的语音处理单元是提供语音合成功能的语音处理单元。
9.根据权利要求6所述的装置,其特征在于,所述信息获取模块,包括: 第一获取单元或者第二获取单元; 所述第一获取单元,用于通过所述统一接口获取所述语音处理单元得到的符合统一格式的所述结果信息; 所述第二获取单元,用于通过所述统一接口获取所述语音处理单元得到的符合对应于所述语音处理单元的专用格式的所述结果信息;将所述符合对应于所述语音处理单元的专用格式的所述结果信息转换为符合统一格式的所述结果信息。
10.根据权利要求6所述的装置,其特征在于, 所述结果信息为所述语音处理单元根据预定对应关系获取与所述应用程序对应的语音数据库,将所述待处理信息与获取到的所述语音数据库进行匹配后得到的信息; 其中,所述预定对应关系是应用程序与处理所述应用程序对应的待处理信息时所需要使用的语音数据库之间的对应关系。
11.一种终端,其特征在于,其包括如权利要求6至10任一所述的语音服务提供装置。
12.一种终端,其特征在于,所述终端包括: 一个或多个处理器; 存储器;和 一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块具有如下功能: 接收应用程序发送的携带有待处理信息的语音服务请求; 通过统一接口调用至少语音处理单元; 通过所述统一接口获取所述语音处理单元对所述待处理信息进行处理后得到的结果信息,将所述结果信息反馈给所述应用程序。
【文档编号】H04M1/725GK103501382SQ201310425146
【公开日】2014年1月8日 申请日期:2013年9月17日 优先权日:2013年9月17日
【发明者】文振威, 许瑞军, 孙大庆 申请人:小米科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1