一种基于语音服务的拨号方法和装置与流程

文档序号:12068446阅读:743来源:国知局
一种基于语音服务的拨号方法和装置与流程

本发明涉及通信技术领域,特别是涉及一种基于语音服务的拨号方法和一种基于语音服务的拨号装置。



背景技术:

语音服务是一种自动的业务代理,在拨通语音服务号码后,语音服务系统播放有关菜单的提示音,用户可以按照听到的提示音来按压终端上的相应的按键向语音服务系统发出指令,以进入下一层的语音菜单,在最底层语音菜单中,选择所需的服务的按键,然后从该系统中获得相应语音服务。

比如,用户拨打某电信运营商提供的语音服务号码,在电话拨通后,用户会听到语音服务系统发出的语音菜单“尊敬的用户您好,业务查询请按1,业务咨询请按2,业务办理请按3,故障申报请按4、投诉建议请按5、宽带提速介绍请按6……”。

之后,用户可根据提示音选择相应的按键向电信运营商的语音服务系统发出指令,从而获取对应的服务。

目前,用户每次获取语音服务均需要听完大部分提示音,才能按压相应的按键,而获取一个语音服务的过程通常需要按下多个按键,操作繁琐,若用户中途忘记了关键的提示音,还需要重复收听语音菜单,容易浪费语音服务系统和移动设备的资源。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于语音服务的拨号方法和相应的一种基于语音服务的拨号装置。

依据本发明的一个方面,提供了一种基于语音服务的拨号方法,包括:

在语音服务号码的服务界面中显示一个或多个服务入口对象;

当检测到所述服务入口对象被触发时,查找所述服务入口对象的拨号路径信息,所述拨号路径信息包括按顺序排序的一个或多个数字按键;

当接通所述语音服务号码时,检测所接收到的语音数据中的一个或多个菜单切换点;

当检测到所述一个或多个菜单切换点时,按照排序顺序触发所述一个或多个数字按键,直至所述数字按键触发完毕。

可选地,还包括:

当接通所述语音服务号码时,显示正在拨打的提示信息;

当所述数字按键触发完毕时,显示拨打成功的提示信息。

可选地,所述在语音服务号码的服务界面中显示一个或多个服务入口对象的步骤包括:

当检测到拨打某个号码时,判断所述号码是否为语音服务号码;若是,则加载所述语音服务号码对应的服务界面模板;

在所述服务界面模板中加载所述语音服务号码的一个或多个服务入口对象。

可选地,所述在所述界面模板中加载所述语音服务号码的一个或多个服务入口对象的步骤包括:

查询所述语音服务号码的一个或多个服务入口对象的点击频率;

按照所述点击频率对所述一个或多个服务入口对象排序;

将排序之后的一个或多个服务入口对象加载至所述语音服务号码。

可选地,所述检测所接收到的语音数据中的一个或多个菜单切换点的步骤包括:

对所述语音数据进行语音活动检测;

当在语音活动检测中检测到所述静音点时,确认检测到菜单切换点。

可选地,所述检测所接收到的语音数据中的一个或多个菜单切换点的步骤包括:

对所述语音数据进行语音识别,以获得第一文本;

当所述第一文本具有预设的菜单切换文本时,确认检测到菜单切换点。

可选地,还包括:

接通语音服务号码;

对所接收到的语音数据进行语音识别,以获得第二文本;

当所述第二文本具有预设的菜单切换文本时,判断所述第二文本中是否具有特征文本组合,所述特征文本组合包括按键标识文本和数字按键;

若是,则触发每一个数字按键,分别返回执行所述对所接收到的语音数据进行语音识别,以获得第二文本的步骤;

若否,则提取上一层的特征文本组合之前的识别文本;

根据所述识别文本生成服务入口对象;

将到达所述识别文本及之前所触发的数字按键按照顺序排序,生成拨号路径信息。

根据本发明的另一方面,提供了一种基于语音服务的拨号装置,包括:

服务入口对象显示模块,适于在语音服务号码的服务界面中显示一个或多个服务入口对象;

拨号路径信息查找模块,适于在检测到所述服务入口对象被触发时,查找所述服务入口对象的拨号路径信息,所述拨号路径信息包括按顺序排序的一个或多个数字按键;

菜单切换点检测模块,适于当接通所述语音服务号码时,检测所接收到的语音数据中的一个或多个菜单切换点;

数字按键触发模块,适于在检测到所述一个或多个菜单切换点时,按照排序顺序触发所述一个或多个数字按键,直至所述数字按键触发完毕。

可选地,还包括:

第一提示模块,适于在接通所述语音服务号码时,显示正在拨打的提示信息;

第二提示模块,适于在所述数字按键触发完毕时,显示拨打成功的提示信息。

可选地,所述服务入口对象显示模块还适于:

当检测到拨打某个号码时,判断所述号码是否为语音服务号码;若是,则加载所述语音服务号码对应的服务界面模板;

在所述服务界面模板中加载所述语音服务号码的一个或多个服务入口对象。

可选地,所述服务入口对象显示模块还适于:

查询所述语音服务号码的一个或多个服务入口对象的点击频率;

按照所述点击频率对所述一个或多个服务入口对象排序;

将排序之后的一个或多个服务入口对象加载至所述语音服务号码。

可选地,所述菜单切换点检测模块还适于:

对所述语音数据进行语音活动检测;

当在语音活动检测中检测到所述静音点时,确认检测到菜单切换点。

可选地,所述菜单切换点检测模块还适于:

对所述语音数据进行语音识别,以获得第一文本;

当所述第一文本具有预设的菜单切换文本时,确认检测到菜单切换点。

可选地,还包括:

拨号模块,适于接通语音服务号码;

语音识别模块,适于对所接收到的语音数据进行语音识别,以获得第二文本;

特征文本组合判断模块,适于在所述第二文本具有预设的菜单切换文本时,判断所述第二文本中是否具有特征文本组合,所述特征文本组合包括按键标识文本和数字按键;若是,则调用按键模块,若否,则调用识别文本提取模块;

按键模块,适于触发每一个数字按键,分别返回调用所述语音识别模块;

识别文本提取模块,适于提取上一层的特征文本组合之前的识别文本;

服务入口对象生成模块,适于根据所述识别文本生成服务入口对象;

拨号路径信息生成模块,适于将到达所述识别文本及之前所触发的数字按键按照顺序排序,生成拨号路径信息。

本发明实施例识别语音服务的菜单切换点,按照排序顺序触发拨号路径信息的数字按键,实现直达语音服务,大大提高了操作的简便性,避免重复收听语音菜单,减少了语音服务系统和移动设备的资源浪费。

本发明实施例识别出语音服务的第二文本,通过与特征文本组合的匹配,自动生成拨号路径信息,无需人工进行重播拨打,大大节省人工成本。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的一种基于语音服务的拨号方法实施例1的步骤流程图;

图2示出了根据本发明一个实施例的一种基于语音服务的拨号方法实施例2的步骤流程图;

图3示出了根据本发明一个实施例的一种基于语音服务的拨号装置实施例1的结构框图;以及

图4示出了根据本发明一个实施例的一种基于语音服务的拨号装置实施例2的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

参照图1,示出了根据本发明一个实施例的一种基于语音服务的拨号方法实施例1的步骤流程图,具体可以包括如下步骤:

步骤101,在语音服务号码的服务界面中显示一个或多个服务入口对象;

需要说明的是,本发明实施例可以应用在各种移动设备中,例如,手机、平板电脑、个人数字助理、穿戴设备(如眼镜、手表等)等等。

该移动设备的操作系统可以包括Android(安卓)、IOS、Windows Phone、Windows等等,通常可以支持各种通信工具的运行,包括操作系统自身携带的通信工具,第三方的通信工具,该通信工具可以用于拨打号码、进行通话。

应用本发明实施例,可以预先采集语音服务号码,由于每个语音服务号码所属的运营商各有不同,因此,可以针对每个运营商设计一个服务界面。

当检测到拨打某个号码时,判断该号码是否为语音服务号码;若是,则加载语音服务号码对应的服务界面模板,在该服务界面模板中,具有服务界面的布局信息,如背景图、运营商名称、运营商LOGO等等。

在该服务界面模板中可以加载该语音服务号码的一个或多个服务入口对象,其中,服务入口对象为语音服务的标识,如“话费查询”、“积分查询”、“流量包办理”等等,该服务入口对象可以为图标、文本,也可以为JSON(JavaScript Object Notation,数据交换格式)数据等等,本发明实施例对此不加以限制。

该服务界面模板可以在移动设备本地进行查找,若未查找到,则可以向服务器请求该语音服务号码对应的服务界面模板。

进一步而言,为了方便用户操作,可以查询该语音服务号码的一个或多个服务入口对象的点击频率,该点击频率可以为全网用户的点击频率,也可以是当前用户的点击频率,还可以是全网用户的点击频率与当前用户的点击频率的加权之和,等等。

按照该点击频率对所述一个或多个服务入口对象排序,将排序之后的一个或多个服务入口对象加载至语音服务号码,如将排序前N(N为正整数)个服务入口对象加载至语音服务界面的首页,其他服务入口对象加载至语音服务界面的二级及二级以下的菜单。

步骤102,当检测到所述服务入口对象被触发时,查找所述服务入口对象的拨号路径信息;

在具体实现中,用户可以通过点击、滑动等操作,触发服务入口对象,即若该服务入口对象被触发,则表示用户需要该服务入口对象标识的语音服务。

应用本发明实施例,可以预先针对服务入口对象设置拨号路径信,拨号路径信息包括按顺序排序的一个或多个数字按键,一个数字按键表示在一个语音菜单中需要触发的按键。

步骤103,当接通所述语音服务号码时,检测所接收到的语音数据中的一个或多个菜单切换点;

在具体实现中,若接听语音服务号码,则语音服务系统播放在先录制的语音菜单(即语音数据),移动设备可以检测语音菜单中的菜单切换点,菜单切换点可以指语音菜单之间切换的节点。

当然,当接通语音服务号码时,可以显示正在拨打的提示信息,提示用户正在接入语音服务的过程。

在本发明的一种可选实施例中,步骤103可以包括如下子步骤:

子步骤S11,对所述语音数据进行语音活动检测;

子步骤S12,当在语音活动检测中检测到所述静音点时,确认检测到菜单切换点。

在本发明实施例中,可以通过语音活动检测(Voice Activity Detection,VAD)检测菜单切换点。

语音活动检测又称语音端点检测、语音边界检测等等,可以指在噪声环境中检测语音的存在与否,不存在语音的位置可以称之为静音点。

语音活动检测主要包括如下四个步骤:

(1)语音信号的预处理,如通过普减法进行降噪处理;

(2)一段输入语音的特征提取,如短时能量、倒谱系数、语音及噪声的PSD;同时根据假设检验计算门限值;

(3)VAD判断过程,将所提取参数特征值和门限值比较,根据比较规 则得出相应的VAD值;

(4)VAD判断值优化过程,通常是根据语音的相关性加Hangover算法。

在具体实现中,语音菜单播放完毕之后,会不存在语音信号,若检测到静音点,则表示语音菜单播放完毕,可以进行菜单切换。

在本发明的另一种可选实施例中,步骤103可以包括如下子步骤:

子步骤S21,对所述语音数据进行语音识别,以获得第一文本;

子步骤S22,所述第一文本具有预设的菜单切换文本时,确认检测到菜单切换点。

在本发明实施例中,可以通过语音识别(Automatic Speech Recognition,ASR)检测菜单切换点。

语音识别将语音中的词汇内容(即语音数据)转换为计算机可读的输入(即文本信息)。

目前,语音识别技术通常由语音识别系统实现,一种基于统计模式识别方法的语音识别系统由以下几个基本模块所构成:

1、信号处理及特征提取模块;该模块的主要任务是从语音数据中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。

2、声学模型;语音识别系统多采用基于一阶隐马尔科夫模型进行建模。

3、发音词典;发音词典包含语音识别系统所能处理的词汇集及其发音。发音词典实际提供了声学模型与语言模型的映射。

4、语言模型;语言模型对语音识别系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。

5、解码器;解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。从数学角度可以更加清楚的了解上述模块之间的关系。

在实际应用中,语音菜单中通常以星号键“*”、井号键“#”作为返回上一层语音菜单、重听等功能,在最后播放。

因此,可以预先设置菜单切换文本,如“星号键”、“井号键”等,若识别的第一文本与该菜单切换文本匹配,则表示当前层的语音菜单播放完毕,可以进行菜单切换。

当然,上述菜单切换点的检测方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他菜单切换点的检测方式,本发明实施例对此不加以限制。另外,除了上述菜单切换点的检测方式外,本领域技术人员还可以根据实际需要采用其它菜单切换点的检测方式,本发明实施例对此也不加以限制。

步骤104,当检测到所述一个或多个菜单切换点时,按照排序顺序触发所述一个或多个数字按键,直至所述数字按键触发完毕。

在具体实现中,若检测到菜单切换点,则表示当前层的语音菜单播放完毕,可以点击当前层的语音菜单对应的数字键,直至数字按键触发完毕。

例如,某个电信运营商提供的流量查询(语音服务)的拨号路径信息为“12”,表示第一层语音菜单点击数字键“1”,第二层语音菜单点击数字键“2”。

假设第一层语音菜单为:“尊敬的用户您好,业务查询请按1,业务咨询请按2,业务办理请按3,故障申报请按4、投诉建议请按5、宽带提速介绍请按6……”。

则在检测到菜单切换点时,点击数字键“1”,进行业务查询的语音菜单。

假设业务查询的语音菜单为:“话费查询请按1,流量查询请按2……”

则在检测到菜单切换点时,点击数字键“2”,进行流量查询。

当然,当数字按键触发完毕时,可以显示拨打成功的提示信息,提示用户已接入语音服务,可以接听电话。

本发明实施例识别语音服务的菜单切换点,按照排序顺序触发拨号路径信息的数字按键,实现直达语音服务,大大提高了操作的简便性,避免重复收听语音菜单,减少了语音服务系统和移动设备的资源浪费。

参照图2,示出了根据本发明一个实施例的一种基于语音服务的拨号方 法实施例2的步骤流程图,具体可以包括如下步骤:

步骤201,接通语音服务号码;

在实际应用中,运营商的数量终端,而且,各运营商的语音服务的语音菜单也众多,且在不断更新中,因此,语音服务的数量众多。

在本发明实施例中,为节省人工成本,可以针对不同运营商,接通语音服务号码,以制作拨号路径信息。

步骤202,对所接收到的语音数据进行语音识别,以获得第二文本;

语音识别将语音中的词汇内容(即语音数据)转换为计算机可读的输入(即文本信息)。

目前,语音识别技术通常由语音识别系统实现,一种基于统计模式识别方法的语音识别系统由以下几个基本模块所构成:

1、信号处理及特征提取模块;该模块的主要任务是从语音数据中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。

2、声学模型;语音识别系统多采用基于一阶隐马尔科夫模型进行建模。

3、发音词典;发音词典包含语音识别系统所能处理的词汇集及其发音。发音词典实际提供了声学模型与语言模型的映射。

4、语言模型;语言模型对语音识别系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。

5、解码器;解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。从数学角度可以更加清楚的了解上述模块之间的关系。

步骤203,当所述第二文本具有预设的菜单切换文本时,判断所述第二文本中是否具有特征文本组合,若是,则执行步骤204,若否,则执行步骤205;

在实际应用中,语音菜单中通常以星号键“*”、井号键“#”作为返回上一层语音菜单、重听等功能,在最后播放。

因此,可以预先设置菜单切换文本,如“星号键”、“井号键”等,若识别的第二文本与该菜单切换文本匹配,则表示当前层的语音菜单播放完毕。

进一步地,检测第二文本中是否具有特征文本组合,特征文本组合可以表示具有下一层语音菜单,具体可以包括按键标识文本和数字按键。

其中,按键标识文本为标识按键操作的信息,数字按键为标识数字(按键)的信息,如在第二文本“业务查询请按1”中,“请按”为按键标识文本,“8”为数字按键。

步骤204,触发每一个数字按键,分别返回执行步骤202;

如果具有下一层语音菜单,即可以触发数字按键,进入下一层语音菜单。

步骤205,提取上一层的特征文本组合之前的识别文本;

若不具有下一层语音菜单,则可以表示当前层的语音菜单为具体的语音服务,上一层的语音菜单为最底层的语音菜单。

在特征文本组合之前的识别文本,可以表示该语音服务的具体功能。

例如,在“流量查询请按2”中,特征文本组合为“请按2”,即识别文本为“流量查询”。

步骤206,根据所述识别文本生成服务入口对象;

在具体实现中,可以以该识别文本生成图标、文本、JSON数据等服务入口对象。

当然,本领域技术人员也可以通过其他方式生成服务入口对象,如人工设计等,本发明实施例对此不加以限制

步骤207,将到达所述识别文本及之前所触发的数字按键按照顺序排序,生成拨号路径信息。

在本发明实施例中,可以将到达语音服务之前所出发的数字按键按照顺序排序,即可生成拨号路径信息。

例如,在第一层语音菜单中,按照“业务查询请按1”触发数字按键“1”,在其第二层语音菜单中,按照“流量查询请按2”触发数字按键“2”,到达了具体的语音服务,即拨号路径信息为“12”。

当然,为了进一步提高拨号路径信息的准确度,最后可以通过人工进行 校验,本发明实施例对此不加以限制。

本发明实施例识别出语音服务的第二文本,通过与特征文本组合的匹配,自动生成拨号路径信息,无需人工进行重播拨打,大大节省人工成本。

对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图3,示出了根据本发明一个实施例的一种基于语音服务的拨号装置实施例1的结构框图,具体可以包括如下模块:

服务入口对象显示模块301,适于在语音服务号码的服务界面中显示一个或多个服务入口对象;

拨号路径信息查找模块302,适于在检测到所述服务入口对象被触发时,查找所述服务入口对象的拨号路径信息,所述拨号路径信息包括按顺序排序的一个或多个数字按键;

菜单切换点检测模块303,适于当接通所述语音服务号码时,检测所接收到的语音数据中的一个或多个菜单切换点;

数字按键触发模块304,适于在检测到所述一个或多个菜单切换点时,按照排序顺序触发所述一个或多个数字按键,直至所述数字按键触发完毕。

在本发明的一种可选实施例中,该装置还可以包括如下模块:

第一提示模块,适于在接通所述语音服务号码时,显示正在拨打的提示信息;

第二提示模块,适于在所述数字按键触发完毕时,显示拨打成功的提示信息。

在本发明的一种可选实施例中,所述服务入口对象显示模块301还可以适于:

当检测到拨打某个号码时,判断所述号码是否为语音服务号码;若是,则加载所述语音服务号码对应的服务界面模板;

在所述服务界面模板中加载所述语音服务号码的一个或多个服务入口对象。

在本发明的一种可选实施例中,所述服务入口对象显示模块301还可以适于:

查询所述语音服务号码的一个或多个服务入口对象的点击频率;

按照所述点击频率对所述一个或多个服务入口对象排序;

将排序之后的一个或多个服务入口对象加载至所述语音服务号码。

在本发明的一种可选实施例中,所述菜单切换点检测模块303还可以适于:

对所述语音数据进行语音活动检测;

当在语音活动检测中检测到所述静音点时,确认检测到菜单切换点。

在本发明的一种可选实施例中,所述菜单切换点检测模块303还可以适于:

对所述语音数据进行语音识别,以获得第一文本;

当所述第一文本具有预设的菜单切换文本时,确认检测到菜单切换点。

参照图4,示出了根据本发明一个实施例的一种基于语音服务的拨号装置实施例2的结构框图,具体可以包括如下模块:

拨号模块401,适于接通语音服务号码;

语音识别模块402,适于对所接收到的语音数据进行语音识别,以获得第二文本;

特征文本组合判断模块403,适于在所述第二文本具有预设的菜单切换文本时,判断所述第二文本中是否具有特征文本组合,所述特征文本组合包括按键标识文本和数字按键;若是,则调用按键模块404,若否,则调用识别文本提取模块405;

按键模块404,适于触发每一个数字按键,分别返回调用所述语音识别 模块402;

识别文本提取模块405,适于提取上一层的特征文本组合之前的识别文本;

服务入口对象生成模块406,适于根据所述识别文本生成服务入口对象;

拨号路径信息生成模块407,适于将到达所述识别文本及之前所触发的数字按键按照顺序排序,生成拨号路径信息。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以 把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于语音服务的拨号设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一 个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明实施例公开了A1、一种基于语音服务的拨号方法,包括:

在语音服务号码的服务界面中显示一个或多个服务入口对象;

当检测到所述服务入口对象被触发时,查找所述服务入口对象的拨号路径信息,所述拨号路径信息包括按顺序排序的一个或多个数字按键;

当接通所述语音服务号码时,检测所接收到的语音数据中的一个或多个菜单切换点;

当检测到所述一个或多个菜单切换点时,按照排序顺序触发所述一个或多个数字按键,直至所述数字按键触发完毕。

A2、如A1所述的方法,还包括:

当接通所述语音服务号码时,显示正在拨打的提示信息;

当所述数字按键触发完毕时,显示拨打成功的提示信息。

A3、如A1所述的方法,所述在语音服务号码的服务界面中显示一个或多个服务入口对象的步骤包括:

当检测到拨打某个号码时,判断所述号码是否为语音服务号码;若是,则加载所述语音服务号码对应的服务界面模板;

在所述服务界面模板中加载所述语音服务号码的一个或多个服务入口对象。

A4、如A3所述的方法,所述在所述界面模板中加载所述语音服务号码的一个或多个服务入口对象的步骤包括:

查询所述语音服务号码的一个或多个服务入口对象的点击频率;

按照所述点击频率对所述一个或多个服务入口对象排序;

将排序之后的一个或多个服务入口对象加载至所述语音服务号码。

A5、如A1或A2或A3或A4所述的方法,所述检测所接收到的语音数据中的一个或多个菜单切换点的步骤包括:

对所述语音数据进行语音活动检测;

当在语音活动检测中检测到所述静音点时,确认检测到菜单切换点。

A6、如A1或A2或A3或A4所述的方法,所述检测所接收到的语音数据中的一个或多个菜单切换点的步骤包括:

对所述语音数据进行语音识别,以获得第一文本;

当所述第一文本具有预设的菜单切换文本时,确认检测到菜单切换点。

A7、如A1或A2或A3或A4所述的方法,还包括:

接通语音服务号码;

对所接收到的语音数据进行语音识别,以获得第二文本;

当所述第二文本具有预设的菜单切换文本时,判断所述第二文本中是否具有特征文本组合,所述特征文本组合包括按键标识文本和数字按键;

若是,则触发每一个数字按键,分别返回执行所述对所接收到的语音数据进行语音识别,以获得第二文本的步骤;

若否,则提取上一层的特征文本组合之前的识别文本;

根据所述识别文本生成服务入口对象;

将到达所述识别文本及之前所触发的数字按键按照顺序排序,生成拨号路径信息。

本发明实施例还公开了B8、一种基于语音服务的拨号装置,包括:

服务入口对象显示模块,适于在语音服务号码的服务界面中显示一个或多个服务入口对象;

拨号路径信息查找模块,适于在检测到所述服务入口对象被触发时,查找所述服务入口对象的拨号路径信息,所述拨号路径信息包括按顺序排序的一个或多个数字按键;

菜单切换点检测模块,适于当接通所述语音服务号码时,检测所接收到的语音数据中的一个或多个菜单切换点;

数字按键触发模块,适于在检测到所述一个或多个菜单切换点时,按照排序顺序触发所述一个或多个数字按键,直至所述数字按键触发完毕。

B9、如B8所述的装置,还包括:

第一提示模块,适于在接通所述语音服务号码时,显示正在拨打的提示信息;

第二提示模块,适于在所述数字按键触发完毕时,显示拨打成功的提示信息。

B10、如B8所述的装置,所述服务入口对象显示模块还适于:

当检测到拨打某个号码时,判断所述号码是否为语音服务号码;若是,则加载所述语音服务号码对应的服务界面模板;

在所述服务界面模板中加载所述语音服务号码的一个或多个服务入口对象。

B11、如B10所述的装置,所述服务入口对象显示模块还适于:

查询所述语音服务号码的一个或多个服务入口对象的点击频率;

按照所述点击频率对所述一个或多个服务入口对象排序;

将排序之后的一个或多个服务入口对象加载至所述语音服务号码。

B12、如B8或B9或B10或B11所述的装置,所述菜单切换点检测模块还适于:

对所述语音数据进行语音活动检测;

当在语音活动检测中检测到所述静音点时,确认检测到菜单切换点。

B13、如B8或B9或B10或B11所述的装置,所述菜单切换点检测模块还适于:

对所述语音数据进行语音识别,以获得第一文本;

当所述第一文本具有预设的菜单切换文本时,确认检测到菜单切换点。

B14、如B8或B9或B10或B11所述的装置,还包括:

拨号模块,适于接通语音服务号码;

语音识别模块,适于对所接收到的语音数据进行语音识别,以获得第二文本;

特征文本组合判断模块,适于在所述第二文本具有预设的菜单切换文本时,判断所述第二文本中是否具有特征文本组合,所述特征文本组合包括按键标识文本和数字按键;若是,则调用按键模块,若否,则调用识别文本提 取模块;

按键模块,适于触发每一个数字按键,分别返回调用所述语音识别模块;

识别文本提取模块,适于提取上一层的特征文本组合之前的识别文本;

服务入口对象生成模块,适于根据所述识别文本生成服务入口对象;

拨号路径信息生成模块,适于将到达所述识别文本及之前所触发的数字按键按照顺序排序,生成拨号路径信息。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1