基于语音识别的语音呼叫方法和接入网关的制作方法

文档序号:7809369阅读:154来源:国知局
基于语音识别的语音呼叫方法和接入网关的制作方法
【专利摘要】本发明实施例提供一种基于语音识别的语音呼叫方法和接入网关。该方法包括:接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。本发明实施例提供的基于语音识别的语音呼叫方法和接入网关,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而与被叫进行语音通话。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。
【专利说明】基于语音识别的语音呼叫方法和接入网关

【技术领域】
[0001] 本发明实施例涉及通信【技术领域】,尤其涉及一种基于语音识别的语音呼叫方法和 接入网关。

【背景技术】
[0002] 近几年,随着国家大力提倡的"宽带中国"和"最后一公里"建设,大量的接入网关 应运而生。随着2013年工业和信息化部提出新建小区必须实施光纤到户的规定,接入网 关作为最后一公里,与终端用户的关系更加紧密;特别是语音业务,作为运营商提供的最基 本业务,目前使用最为广泛。以家庭网关为例,家庭网关与用户的终端设备接触紧密,用于 将家庭内部的所有终端设备与外部的所有接入网连接。例如,如果某一家庭要通过家庭内 的话机与外界终端进行语音通话,则需要通过家庭网关接入网络后与外界终端进行语音通 话。
[0003] 现有技术中,话机通过家庭网关进行语音呼叫时,首先在用户摘机后,由用户通过 操作话机按键拨被叫号码,然后话机通过家庭网关发起语音呼叫请求,最终接通被叫终端, 从而实现与被叫语音通话的目的。
[0004] 上述语音呼叫技术存在以下缺陷:由于需要用户操作话机按键拨被叫号码,也即 需要用户逐位按下话机上与被叫号码对应的一连串按键,尤其是对于被叫是手机用户、夕卜 市或外国用户,对应的被叫号码通常在11位以上,需要在话机上按11个以上的按键,操作 过程繁琐,容易出错;而且一旦按错一个键,就得挂机后重新摘机拨号呼叫,既不方便又耗 费大量时间。此外,这种通过按键实现语音呼出的方式无法适应残疾人或手脚不便的老年 人等特定人群的需求。


【发明内容】

[0005] 本发明实施例提供一种基于语音识别的语音呼叫方法和接入网关,以简化语音呼 叫流程、实现快速呼叫被叫号码的目的,并提升用户体验。
[0006] 第一方面,本发明实施例提供了一种基于语音识别的语音呼叫方法,包括:
[0007] 获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
[0008] 根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
[0009] 第二方面,本发明实施例还提供了一种基于语音识别的接入网关,包括:
[0010] 呼叫语音获取模块,用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信 息;
[0011] 语音呼叫模块,用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
[0012] 本发明实施例提供的基于语音识别的语音呼叫方法和接入网关,通过接入网关识 别用户的呼叫语音,能够从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而 能够与被叫进行语音通话。由于无需用户逐位按下话机上与被叫号码对应的一连串按键, 因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按 键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。

【专利附图】

【附图说明】
[0013] 为了更清楚地说明本发明,下面将对本发明中所需要使用的附图做一简单地介 绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来 讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0014] 图1为本发明实施例一提供的一种基于语音识别的语音呼叫方法的流程图;
[0015] 图2为本发明实施例二提供的一种基于语音识别的语音呼叫方法的流程图;
[0016] 图3为本发明实施例三提供的一种基于语音识别的语音呼叫方法的流程图;
[0017] 图4为本发明实施例四提供的一种基于语音识别的语音呼叫方法的流程图;
[0018] 图5为本发明实施例五提供的一种基于语音识别的语音呼叫方法的流程图;
[0019] 图6为本发明实施例六提供的一种基于语音识别的接入网关的结构示意图。

【具体实施方式】
[0020] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例 中的技术方案作进一步详细描述,显然,所描述的实施例是本发明一部分实施例,而不是全 部的实施例。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的 限定,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得 的所有其他实施例,都属于本发明保护的范围。另外还需要说明的是,为了便于描述,附图 中仅示出了与本发明相关的部分而非全部内容。
[0021] 实施例一
[0022] 请参阅图1,为本发明实施例一提供的一种基于语音识别的语音呼叫方法的流程 图。本发明实施例的方法可以由硬件和/或软件实现的语音呼叫装置来执行,该实现装置 典型的是配置在接入网关设备中,如家庭网关。
[0023] 如图1所示,所述方法包括:
[0024] 步骤110、接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
[0025] 本步骤具体是获取主叫用户输入的包含有被叫方信息的呼叫语音。具体地,主叫 用户可以通过话机的话筒或者免提按键输入所述呼叫语音,并将所述呼叫语音发送至接入 网关,以使接入网关接收到主叫用户输入的呼叫语音。主叫用于也可以通过接入网关内置 的麦克风或功放设备输入所述呼叫语音。
[0026] 所述呼叫语音可以有多种实施方式,例如包括下述至少一项:被叫号码的自然语 言、被叫姓名的自然语言以及被叫短号的自然语言。
[0027] 具体地,被叫号码的自然语音包括被叫方信息,也即被叫号码。被叫号码的自然语 音是所述呼叫语音中常见的一种语音形式,例如主叫用户在摘机后通过话机的话筒说出被 叫方的手机号码"13012345678",则主叫用户的语音"13012345678"即为被叫号码的自然 语音。
[0028] 其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电 子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系。具体地,被叫姓名的 自然语言包括被叫方信息,也即被叫姓名。
[0029] 例如,主叫用户在摘机后通过话机的话筒说出被叫方的姓名"黄小明",则主叫用 户的语音"黄小明"即为被叫姓名的自然语言。
[0030] 其中,电子通讯录是被叫方信息的载体,而电子通讯录具体反映了被叫方的各信 息之间的关联关系。所述电子通讯录还可以包括被叫家庭地址和被叫电子邮件地址等。
[0031] 作为在接入网关中预先配置电子通讯录这一操作的一种可选的实施方式,具体可 以包括:
[0032] 将电子通讯录导入到接入网关,具体地,可以将智能手机中的电子通讯录导入到 接入网关;
[0033] 接入网关解析所述电子通讯录,以得到所述第一映射关系,并所述第一映射关系 存储在接入网关的数据区。
[0034] 可选地,所述导入到网关中的电子通讯录的格式可以为VCF格式、VCard格式、CSV 格式、doc格式或excel格式。优选地,所述导入到网关设备中的电子通讯录的格式为VCF 格式、VCard格式或CSV格式,以增加电子通讯录的通用性。
[0035] 优选地,接入网关在解析所述电子通讯录,以得到所述第一映射关系之后,还可以 包括:接入网关将解析后的电子通讯录预先发送至话机。
[0036] 换言之,主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显 示在显示屏上的电子通讯录,以确定被叫方;然后通过话机听筒输入被叫姓名的自然语言, 例如"黄小明"。
[0037] 在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号 的第二映射关系,被叫短号的位数可以为1-3。
[0038] 被叫短号适用于缩位呼叫,具体地,用户可以根据呼叫被叫号码的频率,设置与 被叫号码对应的被叫短号,例如,根据用户的行为习惯,可以将呼叫频率较高的被叫号码 "13012345678"设置对应的被叫短号"01",当用户在摘机后通过话机的话筒说出被叫短号 "01"时,则主叫用户的语音"01"即为被叫短号的自然语言。
[0039] 以上以被叫短号的位数为2为例进行说明,需要注意的是,当被叫短号的位数 为3位时,不能与现有的常规业务对应的3位号码设置冲突,也即不能将被叫短号设置为 "110"、"119"以及"120"等短号。需要说明的是,当被叫为手机用户、外市或外国用户时, 对应的被叫号码通常在11位以上,而被叫短号的位数优选为1-3位,便于用户执行呼叫操 作。
[0040] 步骤120、接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
[0041] 本步骤具体是通过语音识别,获得被叫号码,然后根据获得的被叫号码进行语音 呼叫,以实现与被叫语音通话的目的。
[0042] 本实施例的技术方案,通过接入网关识别用户的呼叫语音,能够从呼叫语音中识 别获得被叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话 机上与被叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码 的目的,同时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特 定人群的需求,提升了用户体验。
[0043] 实施例二
[0044] 请参阅图2,为本发明实施例二提供的一种基于语音识别的语音呼叫方法的流程 图。本实施例在上述实施例的基础上,提供了根据所述呼叫语音,识别获得被叫号码的优选 方法。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫语音为被叫号码的自然语 言。本实施例的方法可以由接入网关执行。
[0045] 如图2所示,所述方法包括:
[0046] 步骤210、接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息;
[0047] 步骤220、接入网关将所述呼叫语音进行模数转换,并进行语音预处理;
[0048] 本步骤具体是在对所述呼叫语音进行语音预处理之前,进行模数转换,也即将用 户的自然语言从模拟信号转换为数字电信号;然后进行语音预处理。
[0049] 优选地,所述语音预处理包括:数字滤波处理、预加重处理、加窗分帧处理和端点 检测处理。
[0050] 其中,数字滤波处理是利用离散时间系统的特性对所述数字电信号的波形进行滤 波处理,以降低噪声,使得输出信号的频谱变得平坦。
[0051] 本领域的技术人员可以理解,在很高的频率(GHz以上)下,高频信号在传输中的 衰减很明显,为了补偿传输中的高频信号衰减,可以采取信号预加重方法,对传输信号中的 高频部分进行补偿,使得接收到的高频和低频信号的幅度一致。
[0052] 加窗处理是使原本没有周期性的语音信号呈现出周期性的语音特征,同时也避免 出现吉布斯效应。其中,吉布斯效应是当用信号的谐波分量的和来表述具有间断点的波形 时出现,并能够观察的现象。
[0053] 本领域的技术人员可以理解,语音端点检测是语音识别是否正确的关键技术之 一,可以在语音识别中提高识别精度及减少识别时间。常用语音端点检测方法包括能量法、 过零率法和相关系数法等。
[0054] 步骤230、接入网关从经语音预处理后的呼叫语音中获取语音特征;
[0055] 语音特征主要是指语音特征参数,包括线性预测倒谱系数、MF2CC(美尔倒谱系 数)、小波分析的特征参数。这些参数本质上是一个个语音的帧。也就是说,利用短时傅立 叶分析,将预处理后的语音信号分割成l〇-20ms的帧,或者通过小波分析获取语音特征。
[0056] 步骤240、接入网关在预设语音模型库中匹配所述语音特征,确定与所述语音特征 对应的语音模板;
[0057] 其中,语音模型库中既包括语音模板,也包括语音查询表,所述语音查询库中包括 所述语音模板与对应的字段。在本实施例中所述对应的字段为数字。
[0058] 在本步骤中,优选将匹配度最高的语音模板作为与所述语音特征对应的语音模 板。
[0059] 步骤250、接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被 叫号码,并执行语音呼叫。
[0060] 本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与 匹配到的最优语音模板对应的字段作为被叫号码,从而得到用户输入的呼叫语音的识别结 果,然后执行语音呼叫,进行实现与被叫语音通话的目的。
[0061] 例如,用户输入的呼叫语音为"13012345678"的自然语言,通过本实施例的方法可 以匹配到最优的语音模板,通过在语音查询库中查询,识别到与最优语音模板对应的字段 为"13012345678",即得到了被叫号码。
[0062] 本实施例中,可以采用上述离线语音识别方式,即接入网关通过自身的离线语音 模型库进行识别呼叫语音,也可以采用在线语音识别方式。区别在于:在线语音识别时,需 要建立接入网关与能够提供语音识别功能的服务器之间的连接链路,通过所述服务器实现 呼叫语音识别,然后接入网关基于所述识别结果执行语音呼叫。
[0063] 本实施例的技术方案,在接入网关获取用户的呼叫语音之后,接入网关通过从经 模数转换和语音预处理后的呼叫语音中提取特征,并进行特征匹配,能够识别用户的呼叫 语音,并根据匹配结果从呼叫语音中识别获得被叫号码,基于识别获得的被叫号码,从而实 现语音呼叫。由于无需用户逐位按下话机上与被叫号码对应的一连串按键,因此能够简化 语音呼叫流程,实现快速呼叫被叫号码的目的,同时由于避免了用户操作按键,因此能够适 应残疾人或手脚不便的老年人这类特定人群的需求,提升了用户体验。
[0064] 实施例三
[0065] 请参阅图3,为本发明实施例三提供的一种基于语音识别的语音呼叫方法的流程 图。本发明在上述实施例的基础上,提供了根据所述语音模板,利用预设语音库中的语音查 询表,得到被叫号码的优选方案。本实施例提供的基于语音识别的语音呼叫方法适用于呼 叫语音为被叫姓名的自然语言。本实施例方法可以由接入网关执行。
[0066] 如图3所示,所述优选方法包括:
[0067] 步骤310、接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获 得被叫姓名;
[0068] 与上述实施例的区别在于:第一,本实施例中用户输入的呼叫语音为被叫姓名的 自然语言;而上述实施例中用户输入的呼叫语音为被叫号码的自然语言。第二,本实施例中 语音查询库既包括语音模板,也包括语音查询表,所述语音查询库中包括所述语音模板与 对应的字段,其中对应的字段为汉字;而上述实施例中语音模型库中既包括语音模板,也包 括语音查询表,所述语音查询库中包括所述语音模板与对应的字段,其中所述对应的字段 为数字。第三,本实施例中所述接入网关中预先配置有电子通讯录,所述电子通讯录包括被 叫姓名和被叫号码的第一映射关系。
[0069] 作为在接入网关中预先配置电子通讯录这一操作的一种可选的实施方式,具体可 以包括:将电子通讯录导入到接入网关,具体地,可以将智能手机中的电子通讯录导入到接 入网关;接入网关解析所述电子通讯录,以得到所述第一映射关系,并所述第一映射关系存 储在接入网关的数据区。
[0070] 进一步优选地,在接入网关解析所述电子通讯录,以得到所述第一映射关系之后, 还可以包括:接入网关将解析后的电子通讯录预先发送至话机。
[0071] 换言之,主叫用户在摘机后,可以通过话机上的上翻按键和/或下翻按键查看显 示在显示屏上的电子通讯录,以确定被叫方;然后通过话机听筒输入被叫姓名的自然语言。
[0072] 第四,本实施例中接入网关的识别结果为与呼叫语音对应的被叫姓名;而上述实 施例中接入网关的识别结果为与呼叫语音对应的被叫号码。
[0073] 步骤320、接入网关利用所述第一映射关系,得到被叫号码,并执行语音呼叫。
[0074] 本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与 匹配到的最优语音模板对应的字段作为被叫姓名,并利用接入网关中存储的所述第一映射 关系得到被叫号码,然后执行语音呼叫,进行实现与被叫语音通话的目的。
[0075] 需要说明的是,接入网关中存储通过解析获得的所述第一映射关系,以在接入网 关识别到所述被叫姓名的自然语言对应的被叫姓名后,基于预先存储的所述第一映射关 系,从而得到与被叫姓名对应的被叫号码,进而执行语音呼叫。
[0076] 优选地,在接入网关解析所述电子通讯录,以得到所述第一映射关系之后,还可以 包括:接入网关将解析后的电子通讯录预先发送至话机,以使主叫用户在摘机后,可以通过 话机上的上翻按键和/或下翻按键查看显示在显示屏上的电子通讯录,从而确定被叫方。
[0077] 实施例四
[0078] 请参阅图4,为本发明实施例四提供的一种基于语音识别的语音呼叫方法的流程 图。本发明在实施例二的基础上,提供了根据所述语音模板,利用预设语音库中的语音查询 表,得到被叫号码的优选方案。本实施例提供的基于语音识别的语音呼叫方法适用于呼叫 语音为被叫短号的自然语言。本实施例的方法可以由接入网关执行。
[0079] 如图4所示,所述优选方法包括:
[0080] 步骤410、接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获 得被叫短号;
[0081] 本实施例在于实施例二的区别在于:第一,本实施例中用户输入的呼叫语音为被 叫短号的自然语言;而实施例二中用户输入的呼叫语音为被叫号码的自然语言。第二,本实 施例中接入网关中预置被叫号码和被叫短号的第二映射关系,被叫短号的位数可以为1-3。 第三,本实施例中接入网关的识别结果为与呼入语音对应的被叫短号;而实施例二中接入 网关的识别结果为与呼入语音对应的被叫号码。
[0082] 步骤420、接入网关利用所述第二映射关系,得到被叫号码,并执行语音呼叫。
[0083] 本步骤具体是根据匹配到的最优语音模板,以及语音查询表,将语音查询表中与 匹配到的最优语音模板对应的字段作为被叫短号,并利用接入网关中存储的所述第二映射 关系得到被叫号码,然后执行语音呼叫,进行实现与被叫语音通话的目的。
[0084] 需要说明的是,接入网关中预置的所述第二映射关系,以在接入网关识别到所述 被叫短号的自然语言对应的被叫短号后,基于所述第二映射关系,能够得到与被叫短号对 应的被叫号码,进而执行语音呼叫。
[0085] 优选地,接入网关可以将所述第二映射关系发送至话机,也即,所述第二映射关系 预置在话机中,以使主叫用户在摘机后,可以通过操作话机上的1-3位按键,能够采用传统 的按键呼叫方式实现与被叫语音通话的目的。也即,被叫短号的自然语音的呼叫方式可以 与传统的按键呼叫方式兼容应用,主叫用户可以根据自身的呼叫习惯和实际需求,决定采 用哪种呼叫方式,简化了呼叫流程,并增加了呼叫的灵活性。
[0086] 实施例五
[0087] 请参阅图5,为本发明实施例五提供的一种基于语音识别的语音呼叫方法的流程 图。本实施例在上述各实施例的基础上,提供了获取用户输入的呼叫语音的优选方案。如 图5所示,所述优选方法包括:
[0088] 步骤510、接入网关获取用户通过话机按键输入的按键值;
[0089] 步骤520、接入网关在预配置的语音识别业务键号码表中匹配所述按键值,如果匹 配成功,则触发获取用户输入的呼叫语音的操作。
[0090] 用户通过话机输入的按键值,传输至接入网关,如果用户输入的按键值与接入网 关预配置的语音识别业务键号码表匹配一致,则接入网关触发获取用户的呼叫语音以及语 音识别流程,即接入网关将此后从话机接收到的语音作为呼叫语音进行识别。接入网关也 可以显式地向话机发送启动语音识别的指令,控制话机向用户提示,可以开始输入语音信 肩、。
[0091] 其中,话机与接入网关一般是通过POTS 口连接。
[0092] 示例性的,接入网关预配置的语音识别业务键号码表中语音识别业务键设置为 *#,那么当用户摘机并且依次按下*#按键,则匹配成功。
[0093] 需要说明的是,如果匹配失败,可以将该匹配结果返回话机,以提示用户,例如通 过在话机听筒播放"请重新输入"的语音提示,或在话机的显示屏显示"输入失败"或"请重 新输入"的提示。
[0094] 除了上述通过话机上的按键值进行触发操作之外,还可以通过用户与话机之间的 交互进行触发,例如语音交互,或者触摸话机的显示频的设定区域的方式进行触发,所述设 定区域可以预先设定为语音获取区域。
[0095] 本实施例的技术方案,在获取用户输入的按键值之后,通过在预配置的语音识别 业务键号码表中匹配所述按键值,并根据匹配结果决定是否触发获取用户输入的呼叫语音 以及语音识别的操作。
[0096] 在本实施例的基础上,接入网关获取用户输入的呼叫语音优选包括:
[0097] 接入网关按预设DigitMap (数图)收号规则或预设DialPlan (拨叫计划)收号规 则获取用户输入的呼叫语音,其中所述DigitMap收号规则包括:首位拨号定时器的时长、 位间定时器的时长。
[0098] 换言之,本优选方案具体是通过所述DigitMap收号规则或所述DialPlan收号规 则获取用户的呼叫语音。
[0099] 以DigitMap收号规则为例进行说明。
[0100] 首位拨号定时器、位间定时器用在用户摘机到呼叫结束的不同阶段。具体地可以 有多种实施方式,下面介绍其中两种。
[0101] 方式一、摘机到输入呼叫语音前的阶段由首位拨号定时器控制,如果在首位拨号 定时器的时长(例如15s)内,用户没有输入呼叫语音,则接入网关向话机下发催挂音或忙 音提示。如果在首位拨号定时器的时长内,用户开始输入呼叫语音,接入网关则启用位间定 时器,当用户的呼叫语音停顿间隔时长超过位间定时器的时长(比如5s),接入网关对呼叫 语音进行语音识别,也即对之前的语音进行一次识别,然后进行后续呼出流程。
[0102] 方式二、摘机到输入呼叫语音前的阶段由首位拨号定时器控制,如果在首位拨号 定时器的时长(例如15S)内,用户没有输入呼叫语音,则接入网关向话机下发催挂音或忙 音提示。如果在首位拨号定时器的时长内,用户开始输入呼叫语音,接入网关进行实时语音 识别,例如,用户输入一位呼叫语音,接入网关就进行一次语音识别,同时启用位间定时器, 当用户的呼叫语音停顿间隔时长超过位间定时器的时长(比如5s),则进行后续呼出流程。
[0103] 方式一和方式二的区别在于:接入网关进行语音识别的时间点不同,进行语音识 别的次数不同。
[0104] 换言之,用户通过呼叫语音与被叫进行语音通话过程中,是以预先配置的各个定 时器的时长为依据,决定是否结束收取用户的呼叫语音以便执行识别流程。
[0105] 需要说明的是,各定时器的时长可通过配置来设置和更改。
[0106] 实施例六
[0107] 请参阅图6,为本发明实施例六提供的一种基于语音识别的接入网关的结构示意 图。所述接入网关包括:呼叫语音获取模块610和语音呼叫模块620。
[0108] 其中,呼叫语音获取模块610用于获取用户输入的呼叫语音,所述呼叫语音包括 被叫方信息;语音呼叫模块620用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼 口 L1。
[0109] 本实施例的技术方案,通过识别用户的呼叫语音,能够从呼叫语音中识别获得被 叫号码,基于识别获得的被叫号码,从而实现语音呼叫。由于无需用户逐位按下话机上与被 叫号码对应的一连串按键,因此能够简化语音呼叫流程,实现快速呼叫被叫号码的目的,同 时由于避免了用户操作按键,因此能够适应残疾人或手脚不便的老年人这类特定人群的需 求,提升了用户体验。
[0110] 在上述方案中,所述呼叫语音包括下述至少一项:被叫号码的自然语言、被叫姓名 的自然语言以及被叫短号的自然语言;
[0111] 其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电 子通讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系;
[0112] 在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号 的第二映射关系,被叫短号的位数可以为1-3。
[0113] 在上述方案中,语音呼叫模块620优选包括:预处理单元、语音特征获取单元、语 音特征匹配单元和被叫号码获取单元。
[0114] 其中,预处理单元用于将所述呼叫语音进行模数转换,并进行语音预处理;语音特 征获取单元用于从经语音预处理后的呼叫语音中获取语音特征;语音特征匹配单元用于在 预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语音模板;被叫号码获 取单元用于根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。
[0115] 作为被叫号码获取单元的一种优选的实施方式,所述被叫号码获取单元优选包 括:第一识别子单元和第一映射子单元。
[0116] 其中,第一识别子单元用于根据所述语音模板,利用预设语音库中的语音查询表, 识别获得被叫姓名;第一映射子单元用于利用所述第一映射关系,得到被叫号码。
[0117] 作为被叫号码获取单元的另一种优选的实施方式,所述被叫号码获取单元优选包 括:第二识别子单元和第二映射子单元。
[0118] 其中,第二识别子单元用于根据所述语音模板,利用预设语音库中的语音查询表, 识别获得被叫短号;第二映射子单元用于利用所述第二映射关系,得到被叫号码。
[0119] 在上述方案中,所述语音预处理包括:数字滤波处理、预加重处理、加窗分帧处理 和端点检测处理。
[0120] 作为本实施例的一种优选的实施方式,该装置还可以包括:按键值获取模块和触 发模块。
[0121] 其中,按键值获取模块用于在获取用户输入的呼叫语音之前,获取用户通过话机 按键输入的按键值;触发模块用于在预配置的语音识别业务键号码表中匹配所述按键值, 如果匹配成功,则触发获取用户输入的呼叫语音的操作。
[0122] 在上述方案中,呼叫语音获取模块610具体用于:
[0123] 按预设DigitMap收号规则或预设DialPlan收号规则获取用户输入的呼叫语音, 其中所述DigitMap收号规则包括:首位拨号定时器的时长、位间定时器的时长。
[0124] 本发明实施例提供的基于语音识别的接入网关可执行本发明任意实施例所提供 的基于语音识别的语音呼叫方法,具备执行方法相应的功能模块和有益效果。
[0125] 本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通 过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程 序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟 或者光盘等各种可以存储程序代码的介质。
[0126] 最后应说明的是:以上各实施例仅用于说明本发明的技术方案,而非对其进行限 制;实施例中优选的实施方式,并非对其进行限制,对于本领域技术人员而言,本发明可以 有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均 应包含在本发明的保护范围之内。
【权利要求】
1. 一种基于语音识别的语音呼叫方法,其特征在于,包括: 接入网关获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息; 所述接入网关根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
2. 根据权利要求1所述的方法,其特征在于,所述呼叫语音包括下述至少一项:被叫号 码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言; 其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通 讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系; 在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第 二映射关系。
3. 根据权利要求2所述的方法,其特征在于,所述接入网关根据所述呼叫语音,识别获 得被叫号码,包括: 所述接入网关将所述呼叫语音进行模数转换,并进行语音预处理; 所述接入网关从经语音预处理后的呼叫语音中获取语音特征; 所述接入网关在预设语音模型库中匹配所述语音特征,确定与所述语音特征对应的语 音模板; 所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,得到被叫号码。
4. 根据权利要求3所述的方法,其特征在于,所述接入网关根据所述语音模板,利用预 设语音库中的语音查询表,得到被叫号码,包括: 所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫姓 名; 所述接入网关利用所述第一映射关系,得到被叫号码;或 所述接入网关根据所述语音模板,利用预设语音库中的语音查询表,识别获得被叫短 号; 所述接入网关利用所述第二映射关系,得到被叫号码。
5. 根据权利要求3或4所述的方法,其特征在于,所述语音预处理包括:数字滤波处 理、预加重处理、加窗分帧处理和端点检测处理。
6. 根据权利要求3或4所述的方法,其特征在于,在接入网关获取用户输入的呼叫语音 之前,还包括: 接入网关获取用户通过话机按键输入的按键值; 接入网关在预配置的语音识别业务键号码表中匹配所述按键值,如果匹配成功,则触 发获取用户输入的呼叫语音的操作。
7. 根据权利要求3或4所述的方法,其特征在于,接入网关获取用户输入的呼叫语音, 包括: 接入网关按预设数图DigitMap收号规则或预设拨号计划DialPlan收号规则获取用户 输入的呼叫语音,其中所述DigitMap收号规则包括:首位拨号定时器的时长、位间定时器 的时长。
8. -种基于语音识别的接入网关,其特征在于,包括: 呼叫语音获取模块,用于获取用户输入的呼叫语音,所述呼叫语音包括被叫方信息; 语音呼叫模块,用于根据所述呼叫语音,识别获得被叫号码,并执行语音呼叫。
9. 根据权利要求8所述的接入网关,其特征在于,所述呼叫语音包括下述至少一项:被 叫号码的自然语言、被叫姓名的自然语言以及被叫短号的自然语言; 其中,在所述呼叫语音为被叫姓名的自然语言时,所述接入网关中预先配置有电子通 讯录,所述电子通讯录包括被叫姓名和被叫号码的第一映射关系; 在所述呼叫语音为被叫短号的自然语言时,接入网关中预置被叫号码和被叫短号的第 二映射关系。
10. 根据权利要求9所述的接入网关,其特征在于,语音呼叫模块包括: 预处理单元,用于将所述呼叫语音进行模数转换,并进行语音预处理; 语音特征获取单元,用于从经语音预处理后的呼叫语音中获取语音特征; 语音特征匹配单元,用于在预设语音模型库中匹配所述语音特征,确定与所述语音特 征对应的语音模板; 被叫号码获取单元,用于根据所述语音模板,利用预设语音库中的语音查询表,得到被 叫号码。
【文档编号】H04M1/725GK104092829SQ201410347198
【公开日】2014年10月8日 申请日期:2014年7月21日 优先权日:2014年7月21日
【发明者】商琦, 曹纪清, 伏玉琛 申请人:苏州工业园区服务外包职业学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1