实现语音控制应用的方法、装置和服务器与流程

文档序号:12274061阅读:220来源:国知局
实现语音控制应用的方法、装置和服务器与流程
本发明涉及计算机应用
技术领域
,具体涉及实现语音控制应用的方法、装置和服务器。
背景技术
:随着智能终端技术的发展,人们的工作生活越来越多地依赖智能终端(手机、PAD等)上的各类应用(APP)。如邮件应用、通讯录应用、即时通讯应用(微信、QQ等)、搜索引擎应用、电子地图应用。而智能终端上的各类应用都在语音控制功能,以进一步方便用户。目前,各类应用要实现语音控制功能,应用的安装包本身需要集成语音SDK。这使得应用开发的成本提高,而且使得应用的体积增大。一个智能终端上一般都安装几十个甚至上百个应用,每个应用都自成各自的SDK,会造成智能终端存储空间的浪费。技术实现要素:鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的实现语音控制应用的方法、装置和服务器。依据本发明的一个方面,提供了一种实现语音控制应用的方法,其中,该方法包括:为指定应用设定语音控制协议;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器;当接收到关于所述指定应用的语音时,将所述语音发送至服务器,由服务器根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。可选地,所述将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器包括:在所述指定应用的视图的上下文描述属性中的设置所述语音控制协议的内容,从而使得服务器通过抓取所述指定应用的页面并解析其中的各视图中设置的语音控制协议的内容。可选地,该方法进一步包括:监控所述指定应用的页面,从而获知服务器根据所述语音控制协议控制该指定应用执行相应的操作后的结果。可选地,所述监控所述指定应用的页面包括:通过辅助服务实现对所述指定应用的页面的监控。可选地,每条协议内容中还包括:页面路径;该方法进一步包括:当接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。可选地,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。依据本发明的一个方面,还公开了一种实现语音控制应用的方法,该方法包括:通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议并保存;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;当接收到所述应用发送的语音时,根据所述应用的语音控制协议确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。可选地,所述通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议包括:抓取所述应用的页面,解析各页面中的视图的上下文描述属性的内容,获取所述应用设定的语音控制协议。可选地,每条协议内容中还包括:页面路径;该方法进一步包括:在接收所述应用发送的语音的同时还接收所述应用发送的所述应用的当前页面路径;根据接收的语音和页面路径确定对应的执行信息。可选地,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。可选地,所述根据对应的执行信息控制该指定应用执行相应的操作包括:直接控制该应用执行相应的操作;或者,向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作。依据本发明的一个方面,提供了一种实现语音控制应用的装置,其中,该装置包括:协议设定单元,适于为指定应用设定语音控制协议;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;协议通知单元,适于将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器;语音处理单元,适于当接收到关于所述指定应用的语音时,将所述语音发送至服务器,由服务器根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。可选地,所述协议通知单元,适于在所述指定应用的视图的上下文描述属性中的设置所述语音控制协议的内容,从而使得服务器通过抓取所述指定应用的页面并解析其中的各视图中设置的语音控制协议的内容。可选地,该装置进一步包括:监控单元,适于监控所述指定应用的页面,从而获知服务器根据所述语音控制协议控制该指定应用执行相应的操作后的结果。可选地,所述监控单元,适于通过辅助服务实现对所述指定应用的页面的监控。可选地,每条协议内容中还包括:页面路径;所述语音处理单元,还适于当接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。可选地,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。依据本发明的另一个方面,提供了一种实现语音控制应用的服务器,其中,该服务器包括:协议获取单元,适于通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议并保存;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;语音控制单元,适于当接收到所述应用发送的语音时,根据所述应用的语音控制协议确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。可选地,所述协议获取单元,适于通过抓取所述应用的页面,解析各页面的中的视图的上下文描述属性的内容,获取所述应用设定的语音控制协议。可选地,每条协议内容中还包括:页面路径;所述语音控制单元,适于在接收所述应用发送的语音的同时还接收所述应用发送的所述应用的当前页面路径;并根据接收的语音和页面路径确定对应的执行信息。可选地,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。可选地,所述语音控制单元,适于直接控制该应用执行相应的操作;或者,适于向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作。本发明的方案中,由于预先为应用设置语音控制协议,并将所设置的语音控制协议告知服务器。应用在接收到语音后,将语音发送给服务器,由服务器能将语音与预先保存的语音控制协议的内容进行匹配,如果存在匹配项则也确定了被执行对象要执行的操作,并执行相应的操作。这种方式使得应用的安装包本身不再需要集成语音SDK,减小了应用安装包的体积。这样一个智能终端上安装几十个甚至上百个应用时,各应用都不需要集成语音SDK,节省智能终端的存储空间和资源。并且这种方法中,无需进行语义解析,大大提高了应用的语音控制效率和正确率。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本发明一个实施例的实现语音控制应用方法的流程图;图2示出了本发明实施例中的在安卓系统中实现监控所述指定应用的页面的流程图;图3示出了根据本发明一个实施例的实现语音控制应用方法的流程图;图4示出了根据本发明一个实施例的实现语音控制装置的结构图;图5示出了根据本发明一个实施例的实现语音控制的服务器的结构图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本发明一个实施例的实现语音控制应用方法的流程图。该方法包括如下步骤:步骤S110,为指定应用设定语音控制协议;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息。步骤S120,将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器。步骤S130,当接收到关于所述指定应用的语音时,将所述语音发送至服务器,由服务器根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。图1所示的方法中,由于预先为应用设置语音控制协议,并将所设置的语音控制协议告知服务器。应用在接收到语音后,将语音发送给服务器,由服务器能将语音与预先保存的语音控制协议的内容进行匹配,如果存在匹配项则也确定了被执行对象要执行的操作,并执行相应的操作。这种方式使得应用的安装包本身不再需要集成语音SDK,减小了应用安装包的体积。这样一个智能终端上安装几十个甚至上百个应用时,各应用都不需要集成语音SDK,节省智能终端的存储空间和资源。并且这种方法中,无需进行语义解析,大大提高了应用的语音控制效率和正确率。在本发明的一个实施例中,步骤S120中所述将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器包括:在所述指定应用的视图的上下文描述属性中的设置所述语音控制协议的内容,从而使得服务器通过抓取所述指定应用的页面并解析其中的各视图中设置的语音控制协议的内容。这里,视图即View。View类是Android的一个超类,这个类几乎包含了所有的屏幕类型。每一个View都有一个用于绘图的画布,这个画布可以进行任意扩展。例如在游戏开发中也可以自定义视图(View),这个画布的功能更能满足我们在游戏开发中的需要。在Android中,任何一个View类都只需重写onDraw方法来实现界面显示,自定义的视图可以是复杂的3D实现,也可以是非常简单的文本形式等。视图的上下文描述属性即View的ContentDescription属性。ContentDescription作为View的一个属性,可以用于添加语音控制协议的协议内容。在本发明的一种实施例中,一个View中具有一个或多个控件,对于每个控件可以设置一条或多条语音控制操作。则可以在该view的ContentDescription属性中设置包含多条协议内容的语音控制协议。举例为:控件1为联系人1,则对于控件1可以设置的语音控制操作可以包括发送消息、拨打电话、发起视频会议等等。则针对控件1的“发送消息”操作设置一条协议内容,针对控件1的“拨打电话”操作设置一条协议内容,针对控件1的“发起视频会议”设置一条协议内容。以此类推,可以针对每个控件的每个操作设置一条协议内容。在本发明的实施例中,在应用的视图中定义语音控制协议,具体在视图的上下文描述属性中设置所述语音控制协议的协议内容。服务器能够通过抓取所述指定应用的页面并解析其中的各视图的上下文描述属性中设置的语音控制协议的内容,从而获取到该应用的语音控制协议。在本发明的一个实施例中,步骤S120中将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器还可以包括:应用客户端直接将语音控制协议通过特定的信令告知服务器。或者是应用客户端在与服务器建立通信之后,将本应用的语音控制协议发送给服务器。在本发明的一个实施例中,步骤S130中当接收到关于所述指定应用的语音时,将所述语音发送至服务器。服务器接收到语音之后,根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。在本发明的一个实施例中,在图1所述的方法中为了对不同应用中不同视图进行区分,以及能够更加快捷的查找到对应的视图,步骤S110中每条协议内容中还包括:页面路径;通过在每条协议内容中增加页面路径,对不同应用的不同的视图进行区分。其中,页面路径可以为当前视图所对应的URL地址。服务器可以通过该URL地址查找对应的视图。则在本发明的一个实施例中,图1的步骤S130中进一步包括:当接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。服务器根据接收到当前页面路径查找到对应的视图,然后根据该视图所对应的协议内容,对接收到的语音进行匹配,确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。在本发明的一个实施例中,步骤S130中每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数。在本发明的一个实施例中,步骤S130中每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数,以及指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。指定的执行动作,可以为点击、滑动、暂停、放大、缩小等。相应的工作参数时关于执行动作时的尺度参数,如滑动多长距离,缩小多少尺寸等。指定执行动作之前或之后执行的动作,是指在指定执行动作之前后之后还执行的其他动作。例如,在执行暂停操作后滑动进度条。在本发明的一个实施例中,在步骤S130之后,还包括:步骤S140,监控所述指定应用的页面,从而获知服务器根据所述语音控制协议控制该指定应用执行相应的操作后的结果。在本发明的一个实施例中,在步骤S140中,所述监控所述指定应用的页面包括:通过辅助服务实现对所述指定应用的页面的监控。其中,安卓系统中的辅助服务,即AccessibilityService。利用AccessibilityService可以获取手机当前页面的信息,用户的操作事件等等。图2示出了本发明实施例中的在安卓系统中实现监控所述指定应用的页面的流程图。如图2所示,监控的整体流程是:view将信息往上传递到ViewRoot,对应于图2中所示view设置协议,生成event并发送给parent即viewroot的流程;然后ViewRoot通过辅助管理器AccessibilityManager再把信息传送给辅助管理服务器AccessibilityManagerService,对应于图2中viewroot将event发送给AccessibilityManager,AccessibilityManager再将event发送给AccessibilityManagerService的流程;最后辅助管理服务器AccessibilityManagerService把信息分发到辅助服务,辅助服务对协议进行解析。在本发明的一个实施例中,对于一个应用的页面,在该页面的View中定义语音控制协议。例如该语义控制协议中的一条协议内容如表1所示协议头vc:pathmatch_voiceactionaction_paramspre_actionpre_action_paramspost_actionpost_action_params表1在表1中,“path”为页面路径;“match_voice”为匹配的语音;“action”为指定的执行动作,“action_params”是执行的执行动作的参数,“pre_action”是action之前执行的动作,“pre_action_params”是pre_action需要的参数,“post_action”是action之后执行的动作,“post_action_params”是post_action需要的参数。在本发明的一种实施例中,视图通过match_voice,匹配具体的语音,然后指定“pre_action”“action”“action_params”比如点击、滑动等执行动作。图3示出了根据本发明一个实施例的实现语音控制应用方法的流程图。该方法为服务器端的执行流程,包括如下步骤:步骤S310,通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议并保存;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息。步骤S320,当接收到所述应用发送的语音时,根据所述应用的语音控制协议确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。在本发明的一个实施例中,在步骤S310中,所述通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议包括:抓取所述应用的页面,解析各页面中的视图的上下文描述属性的内容,获取所述应用设定的语音控制协议。在本发明的一个实施例中,在应用的各页面中的视图中定义语音控制协议,在视图的的上下文描述属性的内容中设置所述语音控制协议的协议内容。服务器能够通过抓取所述指定应用的页面并解析其中的各视图的上下文描述属性中设置的语音控制协议的内容。从而获取到该应用的语音控制协议。在本发明的一个实施例中,图3所示方法中的步骤S310中,所述通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议还可以为:应用将定义好的语音控制协议通过指定的信令发送给服务器。在本发明的一个实施例中,图3所示方法中的步骤S310中,服务器所接收的语音控制协议中的每条协议内容中还包括:页面路径;通过在每条协议内容中增加页面路径,对指定应用的不同的视图进行区分。服务器则能够根据页面路径查找对应的视图。则在本发明的一个实施例中,图3所示方法进一步包括:服务器在接收所述应用发送的语音的同时还接收所述应用发送的所述应用的当前页面路径;根据接收的语音和页面路径确定对应的执行信息。即服务器根据接收到当前页面路径查找到对应的视图,然后根据该视图所对应的协议内容,对接收到的语音进行匹配,根据语音的匹配结果确定对应的执行信息,然后根据对应的执行信息控制该应用执行相应的操作。步骤S320中每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数。在本发明的一个实施例中,步骤S320中每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数,以及指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。指定的执行动作,可以为点击、滑动、暂停、放大、缩小等。相应的工作参数时关于执行动作时的尺度参数,如滑动多长距离,缩小多少尺寸等。指定执行动作之前或之后执行的动作,是指在指定执行动作之前后之后还执行的其他动作。例如,在执行暂停操作后滑动进度条。例如,一条协议内容如前述的表1所示。在本发明的一种实施例中,执行图3所示方法的服务器可以为该应用提供服务的服务器。则在步骤S320中根据对应的执行信息控制该指定应用执行相应的操作包括:直接控制该应用执行相应的操作。举例为,指定应用为通讯录应用客户端(仅为举例),服务器为通讯录应用服务器;则通讯录应用服务器能够根据执行信息控制通讯录应用客户端执行相应的操作。如相应的语音控制操作为对联系人A发起语音,则服务器端控制通讯录应用客户端,打开联系人A,在对联系人A发起语音操作。在本发明的一种实施例中,执行图3所示方法的服务器还可以为第三方服务器。则在步骤S320中根据对应的执行信息控制该指定应用执行相应的操作包括:向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作。举例为,指定应用为通讯录应用客户端(仅为举例),服务器为第三方服务器,该应用所属的服务器为通讯录应用服务器;则第三方服务器向该应用所属的通讯录应用服务器发送通知,由通讯录应用服务器在收到通知后控制该通讯录应用客户端执行相应的操作。如相应的语音控制操作为对联系人A发起语音,则第三方服务器端想通讯录应用服务器发送通知,通讯录应用服务器接收到该通知之后控制通讯录应用客户端,打开联系人A,在对联系人A发起语音操作。图4示出了根据本发明一个实施例的实现语音控制装置的结构图。参见图4所示,该实现语音控制装置400包括:协议设定单元410,适于为指定应用设定语音控制协议;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;协议通知单元420,适于将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器;语音处理单元430,适于当接收到关于所述指定应用的语音时,将所述语音发送至服务器,由服务器根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。在图4所示的装置中,由于协议设定单元410预先为应用设置语音控制协议,并将所设置的语音控制协议告知服务器。因此在接收到语音后,服务器能够将收到的语音与预先保存的语音进行匹配,如果存在匹配项则也确定了被执行对象要执行的操作并执行相应的操作。这种方式使得应用的安装包本身不再需要集成语音SDK,减小了应用安装包的体积。这样一个智能终端上安装几十个甚至上百个应用时,各应用都不需要集成语音SDK,节省智能终端的存储空间和资源。并且这种方法中,无需进行语义解析,大大提高了应用的语音控制效率和正确率。在本发明的一个实施例中,图4所示装置中的所述协议通知单元420,适于在所述指定应用的视图的上下文描述属性中的设置所述语音控制协议的内容,从而使得服务器通过抓取所述指定应用的页面并解析其中的各视图中设置的语音控制协议的内容。这里,视图即View。View类是Android的一个超类,这个类几乎包含了所有的屏幕类型。每一个View都有一个用于绘图的画布,这个画布可以进行任意扩展。例如在游戏开发中也可以自定义视图(View),这个画布的功能更能满足我们在游戏开发中的需要。在Android中,任何一个View类都只需重写onDraw方法来实现界面显示,自定义的视图可以是复杂的3D实现,也可以是非常简单的文本形式等。上下文描述属性即ContentDescription属性。ContentDescription作为View的一个属性,能够用于添加语音控制协议的协议内容。在本发明的一种实施例中,一个View中具有一个或多个控件,对于每个控件可以设置一条或多条语音控制操作。则可以在该view的ContentDescription属性中设置包含多条协议内容的语音控制协议。在本发明的实施例中,在应用的View中定义语音控制协议,过在view的ContentDescription属性中设置所述语音控制协议的协议内容。服务器能够通过抓取所述指定应用的页面并解析其中的各View的ContentDescription属性中设置的语音控制协议的内容。从而获取到该应用的语音控制协议。在本发明的一个实施例中,协议通知单元420将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器还可以包括:直接将语音控制协议通过特定的信令告知服务器。在本发明的一个实施例中,语音处理单元430,接收到关于所述指定应用的语音时,将所述语音发送至服务器。服务器接收到语音之后,根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。在本发明的一个实施例中,协议设定单元410所设置的语音控制协议中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数。在本发明的一个实施例中,协议设定单元410所设置的语音控制协议中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数,以及指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。指定的执行动作,可以为点击、滑动、暂停、放大、缩小等。相应的工作参数时关于执行动作时的尺度参数,如滑动多长距离,缩小多少尺寸等。指定执行动作之前或之后执行的动作,是指在指定执行动作之前后之后还执行的其他动作。例如,在执行暂停操作后滑动进度条。在本发明的一个实施例中,图4所示的装置进一步包括:监控单元440,适于监控所述指定应用的页面,从而获知服务器根据所述语音控制协议控制该指定应用执行相应的操作后的结果。在本发明的一个实施例中,所述监控单元440,适于通过辅助服务实现对所述指定应用的页面的监控。其中,安卓系统中的辅助服务,即AccessibilityService。利用AccessibilityService可以获取手机当前页面的信息,用户的操作事件等等。通过辅助服务实现对页面的监控方式如图3所示。在本发明的一个实施例中,为了对每个应用中不同视图进行区分,以及能够更加快捷的查找到对应的视图。每条协议内容中还包括:页面路径;语音处理单元430,还适于当接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。则在本发明的一个实施例中,页面路径可以为当前视图所对应的URL地址。服务器可以通过该URL地址查找对应的视图。即语音处理单元430,接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。服务器根据接收到当前页面路径查找到对应的视图,然后根据该视图所对应的协议内容,对接收到的语音进行匹配,确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。图5示出了根据本发明一个实施例的实现语音控制的服务器的结构图。参见图5所示,该服务器500包括:协议获取单元510,适于通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议并保存;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;语音控制单元520,适于当接收到所述应用发送的语音时,根据所述应用的语音控制协议确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。在本发明的一个实施例中,图5所示服务器中的所述协议获取单元510,适于通过抓取所述应用的页面,解析各页面的中的视图的上下文描述属性的内容,获取所述应用设定的语音控制协议。在本发明的一个实施例中,在图5所示服务器中,每条协议内容中还包括:页面路径;所述语音控制单元,适于在接收所述应用发送的语音的同时还接收所述应用发送的所述应用的当前页面路径;并根据接收的语音和页面路径确定对应的执行信息。在本发明的一个实施例中,在图5所示服务器中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。在本发明的一个实施例中,图5所示服务器中的所述语音控制单元520,适于直接控制该应用执行相应的操作;或者,适于向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作。具体来说,当服务器500即为应用所属的服务器时,可以直接控制该应用执行相应的操作;否则当服务器500相对于应用来说是第三方服务器时,需要向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作综上所述,由于在本发明的技术方案中,预先为应用设置语音控制协议,并将所设置的语音控制协议告知服务器。应用在接收到语音后,将语音发送给服务器,由服务器能将语音与预先保存的语音控制协议的内容进行匹配,如果存在匹配项则也确定了被执行对象要执行的操作,并执行相应的操作。这种方式使得应用的安装包本身不再需要集成语音SDK,减小了应用安装包的体积。这样一个智能终端上安装几十个甚至上百个应用时,各应用都不需要集成语音SDK,节省智能终端的存储空间和资源。并且这种方法中,无需进行语义解析,大大提高了应用的语音控制效率和正确率。本发明的技术方案还存在如下优点:1.免去了应用开发过程中的语音SDK开发过程,进而进行测试时也不再需要安排语音控制测试,大大减轻了应用开发的工作量。2.实现了统一的语音交互。各应用收到语音后发送给服务器,有服务器进行匹配确定相应的执行操作,根据确定的执行操作对应用进行操作。可以实现各式各样的操作,如听音乐、打电话、发短信等,不再需要手指触发。3.本发明的语音控制方法可以应用的各类场景,包括智能家居的物联网系统。这样,可以用手机控制电视、洗衣机、冰箱等。需要说明的是:在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的实现语音控制应用的装置和服务器中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。本发明提供了A1、一种实现语音控制应用的方法,其中,该方法包括:为指定应用设定语音控制协议;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器;当接收到关于所述指定应用的语音时,将所述语音发送至服务器,由服务器根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。A2、如A1所述的方法,其中,所述将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器包括:在所述指定应用的视图的上下文描述属性中的设置所述语音控制协议的内容,从而使得服务器通过抓取所述指定应用的页面并解析其中的各视图中设置的语音控制协议的内容。A3、如A1所述的方法,其中,该方法进一步包括:监控所述指定应用的页面,从而获知服务器根据所述语音控制协议控制该指定应用执行相应的操作后的结果。A4、如A3所述的方法,其中,所述监控所述指定应用的页面包括:通过辅助服务实现对所述指定应用的页面的监控。A5、如A1所述的方法,其中,每条协议内容中还包括:页面路径;该方法进一步包括:当接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。A6、如A1所述的方法,其中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。本发明还提供了B7、一种实现语音控制应用的方法,其中,该方法包括:通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议并保存;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;当接收到所述应用发送的语音时,根据所述应用的语音控制协议确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。B8、如B7所述的方法,其中,所述通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议包括:抓取所述应用的页面,解析各页面中的视图的上下文描述属性的内容,获取所述应用设定的语音控制协议。B9、如B7所述的方法,其中,每条协议内容中还包括:页面路径;该方法进一步包括:在接收所述应用发送的语音的同时还接收所述应用发送的所述应用的当前页面路径;根据接收的语音和页面路径确定对应的执行信息。B10、如B7所述的方法,其中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。B11、如B7-B10中任一项所述的方法,其中,所述根据对应的执行信息控制该指定应用执行相应的操作包括:直接控制该应用执行相应的操作;或者,向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作。本发明还提供了C12、一种实现语音控制应用的装置,其中,该装置包括:协议设定单元,适于为指定应用设定语音控制协议;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;协议通知单元,适于将所述语音控制协议通过与服务器之间的预定的通信方式告知服务器;语音处理单元,适于当接收到关于所述指定应用的语音时,将所述语音发送至服务器,由服务器根据所述语音控制协议确定语音对应的执行信息,并根据对应的执行信息控制该指定应用执行相应的操作。C13、如C12所述的装置,其中,所述协议通知单元,适于在所述指定应用的视图的上下文描述属性中的设置所述语音控制协议的内容,从而使得服务器通过抓取所述指定应用的页面并解析其中的各视图中设置的语音控制协议的内容。C14、如C12所述的装置,其中,该装置进一步包括:监控单元,适于监控所述指定应用的页面,从而获知服务器根据所述语音控制协议控制该指定应用执行相应的操作后的结果。C15、如C14所述的装置,其中,所述监控单元,适于通过辅助服务实现对所述指定应用的页面的监控。C16、如C12所述的装置,其中,每条协议内容中还包括:页面路径;所述语音处理单元,还适于当接收到关于所述指定应用的语音时,将所述指定应用的当前页面路径与所述语音发送至服务器。C17、如C12所述的装置,其中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。本发明还提供了D18、一种实现语音控制应用的服务器,其中,该服务器包括:协议获取单元,适于通过与应用之间的预定的通信方式获取所述应用设定的语音控制协议并保存;所述语音控制协议包括一条或多条协议内容;每条协议内容至少包括:匹配的语音和对应的执行信息;语音控制单元,适于当接收到所述应用发送的语音时,根据所述应用的语音控制协议确定对应的执行信息,并根据对应的执行信息控制该应用执行相应的操作。D19、如D18所述的服务器,其中,所述协议获取单元,适于通过抓取所述应用的页面,解析各页面的中的视图的上下文描述属性的内容,获取所述应用设定的语音控制协议。D20、如D18所述的服务器,其中,每条协议内容中还包括:页面路径;所述语音控制单元,适于在接收所述应用发送的语音的同时还接收所述应用发送的所述应用的当前页面路径;并根据接收的语音和页面路径确定对应的执行信息。D21、如D18所述的服务器,其中,每条协议内容中的所述对应的执行信息包括:指定执行动作和相应的动作参数;还包括:指定执行动作之前执行的动作和相应的动作参数,和/或,指定执行动作之后执行的动作和相应的动作参数。D22、如D18-D21中任一项所述的装置,其中,所述语音控制单元,适于直接控制该应用执行相应的操作;或者,适于向该应用所属的服务器发送通知,由该应用所属的服务器在收到通知后控制该应用执行相应的操作。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1