生成语音用户界面的方法和系统的制作方法

文档序号:7612516阅读:179来源:国知局
专利名称:生成语音用户界面的方法和系统的制作方法
技术领域
本发明涉及电话银行自动语音(IVR)应用技术领域,特别是涉及一种生成语音用户界面的方法和系统,它可以减小开发语音用户界面的复杂度。
背景技术
目前各商业银行及其他金融机构逐步建立起集中式的电话银行系统,有效提高了电话银行的服务水平,但一些新问题也随之出现,其中最突出的是各分支机构(分行)特色业务的开发问题。象在中国这样幅员辽阔的国家,各商业银行分支机构的数目往往比较庞大,同时各地民俗风情炯异,地方特色业务也种类繁多,如果采用传统的方式,由总部统一受理需求,集中开发,则首先对总行开发部门的压力会很大,更重要的是统一版本的开发、发布和投产需要较长周期,很难满足各地快速响应市场需要的要求,因此从业务发展的角度来看,更适于采用分支机构自行开发的方式,但在目前情况下,分布式开发存在以下问题(1)目前的电话银行系统中,开发测试需要本地有交换机、IVR等硬件设施,而在集中式电话银行应用中,所需的运行设备全部集中布署在一个托管运营中心,各分支机构本地没有开发测试所必需的设备环境。
(2)不便于集中运行,集中模式下运行的是同一个程序,如果由各分支机构分别开发,需要将各分支机构开发的程序融合成一个,难度很大。
(3)难以统一管理和指导监督,以传统的开发方式,各分支机构只能进行源码级开发,难以进行统一管理,容易出现各分支机构在开发中各自为政、应用水平参差不齐甚至不兼容、业务发展得不到统一的问题。

发明内容
鉴于上述问题,提出了本发明。本发明的目的是提供一种生成语音用户界面的方法,其中通过深入研究和运用该领域的基本规律,将纷繁复杂的语音流程开发问题转化为简单的5元素组合问题,可极大地降低新业务开发的复杂度,从而使新业务的开发变得简单、高效、快速,同时开发工作可在远程进行,可实现分布式开发,有效解决集中式电话银行系统的分支机构特色业务支持问题。
本发明除了能解决集中式电话银行应用的关键问题外,在普通的电话银行应用中对提高开发效率也有极大帮助。
在本发明的一个方面,提出了一种生成语音用户界面的方法,包括步骤将一项电话银行业务的流程划分成5类基本元素;根据该电话银行业务的要求,具体定义所述5类基本元素;按照该电话银行业务的执行顺序组合所述定义的5类基本元素,形成组合的流程;以及将组合的流程转换成语音用户界面,提供给用户。
在本发明的另一方面,提出了一种生成语音用户界面的系统,包括分类单元,用于将一项电话银行业务的流程划分成5类基本元素;定义单元,用于根据该电话银行业务的要求,具体定义所述5类基本元素;组合单元,用于按照该电话银行业务的执行顺序组合所述定义的5类基本元素,形成组合的流程;以及文语转换单元,将组合的流程转换成语音用户界面,提供给用户。
利用本发明的生成语音用户界面的方法和系统,使新业务功能的开发变得简单、高效和快速,对银行分支机构特色业务起到很好的支持,主要表现在如下方面(1)提高开发效率和降低开发难度。本发明将纷繁复杂的语音流程开发问题转化为简单的5元素组合问题,将业务无关的技术细节隐藏在系统内部,实现直接面向业务流程的高效开发,新业务的开发可由业务人员直接进行,基本不需要专业程序员参与。
(2)开发工作可远程、分布式进行,各分支机构不需要单独的开发与测试环境,有效解决集中式电话银行应用中分布开发、集中运行的需要。
(3)各分支机构分别开发的功能很好的融合到一起,适合于集中模式电话银行系统的集中生产运行。
(4)便于对各分支机构统一管理和指导监督,避免了各分支机构在开发中各自为政、应用水平参差不齐、业务发展得不到统一的问题。


图1是本发明的5元素组成规律示例图。
图2A是本发明的开发装置结构示意图;图2B是图2A所示的开发系统中的定义单元的详细结构图。
图3是图2B所示的参数定义部分的功能示意图。
图4是图2B所示的输出定义部分的功能示意图。
图5是图2B所示的输入定义部分的功能示意图。
图6是图2B所示的交易定义部分的功能示意图。
图7是图2B所示的判断定义部分的功能示意图。
图8是本发明的系统的组合单元的功能示意图。
图9是示例业务(代缴固话话费)的注册卡号定义示意图。
图10是示例业务(代缴固话话费)的电话号码定义示意图。
图11是示例业务(代缴固话话费)的校验电话号码定义示意图。
图12是示例业务(代缴固话话费)的缴费金额定义示意图。
图13是示例业务(代缴固话话费)的全部参数定义列表。
图14是示例业务(代缴固话话费)的输入电话号码定义示意图。
图15是示例业务(代缴固话话费)的输入校验电话号码定义示意图。
图16是示例业务(代缴固话话费)的判断两次输入电话号码是否一致定义示意图。
图17是示例业务(代缴固话话费)的重新输入校验电话号码定义示意图。
图18是示例业务(代缴固话话费)的查询话费定义示意图。
图19是示例业务(代缴固话话费)的播报缴费金额定义示意图。
图20是示例业务(代缴固话话费)的客户按键判断定义示意图。
图21是示例业务(代缴固话话费)的调用缴费交易定义示意图。
图22是示例业务(代缴固话话费)的播报缴费结果定义示意图。
图23是示例业务(代缴固话话费)示例业务(代缴固话话费)的全部步骤定义列表。
图24是示例业务(代缴固话话费)的输入电话号码后续步骤定义示意图。
图25是示例业务(代缴固话话费)的输入校验电话号码后续步骤定义示意图。
图26是示例业务(代缴固话话费)的判断两次号码是否一致后续步骤定义示意图。
图27是示例业务(代缴固话话费)的重新输入校验电话号码后续步骤定义示意图。
图28是示例业务(代缴固话话费)的查询话费后续步骤定义示意图。
图29是示例业务(代缴固话话费)的播报话费后续步骤定义示意图。
图30是示例业务(代缴固话话费)的客户按键判断后续步骤定义示意图。
图31是示例业务(代缴固话话费)的调用缴费交易后续步骤定义示意图。
图32是示例业务(代缴固话话费)的播报缴费结果后续步骤定义示意图。
图33是示例业务(代缴固话话费)的完整业务流程。
具体实施例方式
以参考附图对本发明的实施例进行详细的说明。
经过对电话银行IVR应用规律的长期应用和研究,本发明人发现在这类应用中存在一个基本规律所有的IVR语音流程都可以分解为5种基本元素,分别是语音报读播报语音菜单、操作结果或输入提示等,IVR应用系统一般都是以一段语音报读开始,如“欢迎使用某某系统”等。
用户输入指用户按照提示通过电话键盘输入一些选择或卡号、账号等,鉴于电话键盘的限制,一般限于输入0-9及“*”和“#”共12个字符或数字。
交易调用IVR本身只作为一个语音客户端,交易逻辑处理通过调用后台系统提供的交易接口来完成,IVR只需指定后台交易的名称和代码,并将中间数据作为交易的输入、输出参数进行绑定即可。
选择为每个操作设置下一个操作,可以根据不同参数设置多种选择。
中间数据(流程参数)用户在使用系统期间,有些数据需多次用到,如登录ID、账号等,这些数据在用户会话的全过程中都应保持有效。由于电话银行的输入主要是数字,中间数据比较简单。
图1示出了一个典型的流程(代缴固话话费)来说明这种5元素组成规律,该业务包括以下顺序执行的步骤客户输入电话号码(S101)。
输入确认(校验)电话号码(S102)。
判断两次输入是否一致,如不一致则要求重输确认电话号码(S103)。
调用后台交易查询应缴金额(S104)。
报读应缴金额,并提示用户确认、重听或退出(S105)。
判断用户选择(S106)。
如重听则再播报一次(S105)。
如确认则调用后台交易,扣款缴费(S107)。
报读缴费结果(S108)。
退出。
其中卡号、电话号码及缴费金额为中间数据110,在业务流程中使用。
本发明就是基于这个规律来建造一个容易扩展功能的电话银行系统,将纷繁复杂的语音流程开发问题转化为简单的5种基本元素组合问题,通过对5种基本元素的排列组合,可以创造出客户需要的各种业务流程。
图2示出了本发明的一个生成语音用户界面的系统,作为一种实施方式,它可以是一台运行本发明的5元素组合程序(基于B/S架构设计,可远程登录和使用)的PC服务器或主机,或者由硬件形式的各个功能单元所构成,来达到本发明的目的。
对于一项新的电话银行业务,本发明的系统首先将构成该项业务的流程划分成5类基本元素,然后按照该业务的要求来具体定义这5类基本元素,并按指定的序列对定义后的基本元素进行组合,最后,利用TTS技术将组合的业务流程转换成语音界面,提供给用户。
如图2A所示,本发明的生成语音用户界面的系统主要包括分类单元21,用于将一项电话银行业务的流程划分成5类基本元素;定义单元22,用于根据该电话银行业务的要求,具体定义5类基本元素;组合单元23,按照该电话银行业务的执行顺序组合所述定义的5类基本元素,形成组合的流程;以及TTS单元,用于将组合的流程转换成语音用户界面,提供给用户。
图2B示出了图2A所示的定义单元22的结构示意图。定义单元22包括参数定义部分221、输入定义部分222、报读定义部分223、交易定义部分224和选择(判断)定义部分225。
图3示出了参数定义部分的功能,也就是针对各个步骤中所涉及的具体交易参数,指定参数的名字、长度、类型,类型通常有号码、金额、日期、数字、文本。长度通常以比特或者字节为单位。
图4示出了输入定义部分的功能,也就是对由用户通过电话小键盘所执行的输入的类型进行定义。通常的输入包括简单输入(直接赋值,不需进行判断等进一步处理)、字符限制输入(有些字符必须为指定值,如手机号前两位必须为“13”)、倍数输入(如不允许输入小数位,实际上相当于只能输入1的倍数,或只允许为100的倍数,通常用于金额等输入)、最小值输入、固定值输入(如输入币种、性别等)、取消限制输入(指输入过程中随时可按*键中止)。
图5示出了报读定义部分的功能,也就是确定业务流程的某个步骤中所涉及的报读是简单报读还是绑定报读。简单报读指报读一段静态文字。绑定报读指动态报读,可在静态文字中插入参数,如根据查询结果报读应缴金额。
图6示出了交易定义部分的功能,在交易定义部分中,针对业务流程的各个步骤中所涉及的具体交易,指定交易名称、交易代码、输入、输出参数,其中输出参数有可能是单结果(一条记录),或多结果(如明细)。
图7示出了选择(判断)定义部分的功能。对于选择(判断)而言,通常包括定值(判断参数值是否等于某个数值)、等同(判断两个参数值是否相等)、按键(判断客户按键值)、取值(判断参数值的范围)、大于/等于/小于(判断参数值与某个数相比较是大于、小于还是等于)5种情况。
图8示出了图2A所示的组合单元24的功能,它可以按照前后串行关系或者分支关系,根据不同的情况选择后续步骤(如图26),并将各个步骤组合在一起。
下面再以代缴固话话费为例说明本发明的系统的详细工作过程,具体包括以下几部分第一部分对步骤进行分类如图1所示,将代缴固话话费的步骤分成5类基本元素两个输入步骤,输入电话号码(S101),输入校验电话号码(S102);两个选择(判断)步骤(S103和S106);两个交易步骤(S104和S107);两个报读步骤(S105和S108);和四个中间数据110(卡号、手机号、校验手机号和应缴金额)。
第二部分定义图9,定义扣费(注册)卡号,即要从哪张卡上扣除电话费用。
图10,定义电话号码,即发生费用的那个电话号码。
图11,定义校验电话号码,防止用户误输入。
图12,定义缴费金额,即发生的费用。
图13,该业务流程的全部参数列表,即卡号、电话号码、校验电话号码和交费金额。
图14,定义电话号码的输入,输入数据保存到图定义的参数-电话号码。
图15,定义输入校验电话号码输入,数据保存到图定义的参数-校验电话号码。
图16,定义判断两次输入电话号码是否一致。
图17,定义重新输入校验电话号码。
图18,定义查询话费,输入参数为电话号码,已在前面步骤中赋值,输出数据保存到参数“缴费金额”中。
图19,定义播报话费,需用到上一步赋值的参数“缴费金额”。
图20,定义判断客户按键,客户可选择确定、重听或取消,对应的按键分别为1、2、0。
图21,定义缴费请求交易,交易的输入参数为扣费(注册)卡号、电话号码、金额,输出参数为交易返回码(系统定义)。
图22,定义播报结果,播报成功或失败原因(系统定义)。
图23,为该业务流程的全部步骤列表。
第三部分组合图24,定义输入电话号码的下一个步骤,为输入校验电话号码。
图25,定义输入校验电话号码的下一个步骤—判断两次输入的号码是否一致。
图26,定义判断两次输入电话号码是否一致的下一个步骤,如果一致,则下一步为查询话费;如果不一致则下一步为重新输入校验电话号码。
图27,定义重新输入校验电话号码的下一个步骤—判断两次输入的电话号码是否一致。
图28,定义查询话费的下一个步骤—播报缴费金额。
图29,定义播报话费的下一个步骤—判断客按键。
图30,定义判断客户按键的下一个步骤,如果按键为1则下一步为调用缴费交易,如果按键为2则回到上一步—播报话费,如果按键为0则退出。
图31,定义调用缴费交易的下一个步骤—播报缴费结果。
图32,定义播报缴费结果的下一个步骤—退出。
图33为该业务的步骤关系总表,也就是完整的业务流程。
第四部分文语转换在TTS(文语转换)单元24,按照图33所示的步骤关系总表,将整个业务流程转换成语音用户界面,提供给用户,引导用户完成代缴固话费业务。
最后所应说明的是以上实施例仅用于说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。
权利要求
1.一种生成语音用户界面的方法,包括步骤将一项电话银行业务的流程划分成5类基本元素;根据该电话银行业务的要求,具体定义所述5类基本元素;按照该电话银行业务的执行顺序组合所述定义的5类基本元素,形成组合的流程;以及将组合的流程转换成语音用户界面,提供给用户。
2.如权利要求1所述的方法,其特征在于,所述定义步骤包括针对各个业务流程的各个步骤中所涉及的具体交易参数,指定参数的名字、长度、类型;对由用户通过电话小键盘所执行的输入的类型进行定义;确定业务流程的步骤中所涉及的报读是简单报读还是绑定报读;针对业务流程的各个步骤中所涉及的具体交易,指定交易名称、交易代码、输入、输出参数;以及定义所进行的选择或判断是定值判断、等同判断、按键判断、取值判断、还是大于/等于/小于判断。
3.如权利要求2所述的方法,其特征在于,所述类型包括号码、金额、日期、数字、文本。
4.如权利要求2所述的方法,其特征在于,所述长度以比特或者字节为单位。
5.如权利要求2所述的方法,其特征在于,所述输入包括简单输入、字符限制输入、倍数输入、最小值输入、固定值输入、取消限制输入。
6.如权利要求2所述的方法,其特征在于,简单报读指报读一段静态文字,绑定报读指动态报读,可在静态文字中插入参数。
7.一种生成语音用户界面的系统,包括分类单元,用于将一项电话银行业务的流程划分成5类基本元素;定义单元,用于根据该电话银行业务的要求,具体定义所述5类基本元素;组合单元,用于按照该电话银行业务的执行顺序组合所述定义的5类基本元素,形成组合的流程;以及文语转换单元,将组合的流程转换成语音用户界面,提供给用户。
8.如权利要求7所述的系统,其特征在于,所述定义单元包括参数定义部分,针对各个业务流程的各个步骤中所涉及的具体交易参数,指定参数的名字、长度、类型;输入定义部分,对由用户通过电话小键盘所执行的输入的类型进行定义;报读定义部分,确定业务流程的步骤中所涉及的报读是简单报读还是绑定报读;交易定义部分,针对业务流程的各个步骤中所涉及的具体交易,指定交易名称、交易代码、输入、输出参数;以及选择或判断定义部分,定义所进行的选择或判断是定值判断、等同判断、按键判断、取值判断、还是大于/等于/小于判断。
9.如权利要求8所述的系统,其特征在于,所述类型包括号码、金额、日期、数字、文本。
10.如权利要求9所述的系统,其特征在于,所述长度以比特或者字节为单位。
11.如权利要求8所
全文摘要
公开了一种生成语音用户界面的方法,以解决集中式开发和分布式开发中出现的问题。该方法包括步骤将一项电话银行业务的流程划分成5类基本元素;根据该电话银行业务的要求,具体定义所述5类基本元素;按照该电话银行业务的执行顺序组合所述定义的5类基本元素,形成组合的流程;以及将组合的流程转换成语音用户界面,提供给用户。本发明还提供了一种生成语音用户界面的系统。
文档编号H04M3/487GK1716985SQ200510012109
公开日2006年1月4日 申请日期2005年7月7日 优先权日2005年7月7日
发明者苏文力, 李秀媛, 李昭文, 钱大智, 成汉平, 孙东光, 刘华军 申请人:中国工商银行
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1