实现ip网络中交互式语音应答的方法

文档序号:7906604阅读:372来源:国知局
专利名称:实现ip网络中交互式语音应答的方法
技术领域
本发明涉及多媒体语音通讯领域中实现交互式语音应答(IVR)的方法,特别是涉及基于MGCP协议和VXML规范实现IP网络中交互式语音应答(IVR)的方法。
SCP(Service Control Point)服务控制点,实现智能网中的业务控制功能,与SSP之间用NO.7信令交互。SMS(Service Manage System)业务管理系统,对SSP和SCP进行管理。
SCE(Service Create Environment)业务生成环境,负责创建新的业务逻辑。
目前在公众服务电话网(Public Service Telephone NetworkPSTN)上存在很多种不同类型的IVR设备,例如电话银行、168声讯台等。这些设备都是通过中继接口直接接到PSTN上。由于PSTN上涉及复杂的信令处理和中继接口,导致其只能在特殊硬件上开发;与硬件的相关性使得开发出的系统具有成本较高,系统灵活性较差的缺点,在更换了硬件之后一般还需要重新开发;同时由于涉及复杂的信令处理,对于不熟悉PSTN网络信令的开发人员来说,开发的难度也非常大,一般需要专业的开发人员来进行相应的开发工作。而且目前的IVR系统的流程控制大多采用自行定义的语言,无法与其它IVR系统互通,这就导致了用户必须熟悉所采用的IVR系统的流程控制语言,不便于IVR系统的应用。
传统的网关用来实现宽带网络和传统网络之间业务的互通,网关需要能够建立PSTN和Internet之间的呼叫连接;能够执行媒体格式的变换和信令的转换网关在Internet一侧执行H.323、MGCP或者SIP协议,在PSTN侧通常执行ISDN信令、一号信令或者七号信令;由于传统网关功能过于复杂,通常只能支持较少用户,因此为了系统扩展的需要,必须将网关进行分离。
分离网关的关键就是将媒体变换功能和网关控制功能分离。使网关只承担简单的媒体变换功能,复杂的网关控制功能则由网关之外的独立的控制实体(呼叫代理或者媒体网关控制器)执行。它的特点是将控制智能集中到网络中来,即少量的呼叫代理中,其思路和电信网中的智能网类似。MGCP协议就是根据网关功能分离的基本思想提出的一种协议。分离后的网关模型如图2所示,图中的各个组件的含义如下SG信令网关(Signal Gateway),完成PSTN上的信令(例如七号信令,R2信令,ISDN信令)到IP网络上的信令(例如BICC,SIGTRAN)的转换。
MG媒体网关(Media Gateway),完成PSTN上的语音(例如T1、E1)到IP网络上的语音(例如RTP/RTCP)的转换。
MGC媒体网关控制器(Media Gateway Controller),实现复杂的网关控制功能,通常作为独立的控制实体。
MGCP媒体网关控制协议(Media Gateway Control Protocol),MGC通过此协议定义的消息和控制流程来实现对MG的控制。
VoiceXML(VXML)是XML的一个扩展标准,其主要用途是通过声音和电话访问Internet的内容和信息,将基于WEB的开发和内容移植到IVR应用中。结构模型如图3,图中的各个组件的含义如下文档服务器(Document Server),存放VoiceXML文档,用户通过编辑VoiceXML文档定制需要的流程。
VoiceXML解释器(VoiceXML Interpreter),主要完成VoiceXML文档的解释。
执行平台(Implementation Platform),主要完成VoiceXML文档的执行,并负责与用户进行交互。VXML通过在一个文件中定义多个交互,减少了客户/服务器的交互操作;把应用开发人员从底层、平台相关的细节中解放出来;分离了用户交互代码(VoiceXML)和服务逻辑(CGI scripts);增强了服务在不同执行平台的可移植性。对内容提供商、工具提供者和平台提供者而言,VoiceXML是一个通用语言。
本发明的解决方案为将交互式语音应答(IVR)系统接入IP网络中,所述的IP网络采用MGCP协议对交互式语音应答系统的语音呼叫控制;在交互式应答(IVR)系统中设置声码器,对接收的语音进行解码和对发送的语音进行编码;在交互式应答(IVR)系统中建立语音VXML文档及VXML文档管理模块,并使所述的VXML文档定制的业务流程与交互式应答的控制流程建立映射关系,所述的VXML文档管理模块负责读取、解释和执行系统指定的VXML文档;
当用户通过语音呼叫交互式应答系统时,IP网络中的媒体网关控制器完成呼叫的信令交互过程并使呼叫用户与交互式应答系统接通,交互式应答系统根据用户的服务需求,通过XML文档管理模块对系统指定的VXML文档进行操作,以控制IVR与用户的交互过程。
根据上述技术方案;所述的交互式应答系统通过以太网接口接入IP网络;所述的声码器为ACM解码器和ACM编码器;所述的映射关系为交互式应答的流程控制要求与VXML规范的主要语法元素之间的映射关系。
本发明通过MGCP协议来解决IP网络上IVR应用的信令控制,通过VXML来解决IVR应用的流程控制,这样就采用完全标准的接口实现了IP网络上的IVR应用。由于全部基于标准协议,不仅大大简化了实际应用中的开发过程,也能够与目前所有的标准设备互通。采用本发明的方法,可在计算机上开发出基于软件的IVR设备,有效地克服现有IVR系统的缺点和大大降低开发成本,并使系统具有较强的灵活性。
(2)MGC收到Setup消息后,判断能否接受呼叫,当呼叫合法时,就向IVR发出CRCX命令,通知IVR有呼叫到来。
(3)IVR接受到CRCX命令后,分配相关的资源,然后回复ACK消息,表示接受次呼叫。
(4)MGC收到ACK后,向GW发送Alerting消息,开始传送回铃音。
(5)IVR进行完相关的初始化操作,向MGC发送NTFY消息,携带offhook参数,表示IVR接通电话。
(6)MGC收到NTFY消息后,向GW发送Connect消息,同时向IVR发送MDCX消息,把呼叫接通,主叫能够停到IVR播放的提示音,IVR也能够开始录音。
(7)IVR按照预先定义的流程开始工作,用户可以通过电话输入DTMF按键控制流程,例如电话银行应用中用户可以通过电话输入他的卡号和密码查询余额。GW把用户的DTMF按键通过UserInput消息送给MGC(8)MGC把用户按键消息通过RQNT消息送给IVR设备,IVR根据用户按键进入到相应的流程。
(9)用户完成相应操作,挂机后,GW给MGC发送Release消息。
(10)MGC收到Release消息给IVR发送DLCX消息,IVR结束流程。
IVR设备需要提供单向的语音通道,以便播放语音,这就要求IVR设备能够支持IP网络上的实时语音,目前IP网络上的实时语音传送一般采用RTP/RTCP协议,IVR设备若需支持普通电话通过IP电话网关访问或者PC客户端直接访问,则必须支持RTP/RTCP协议。目前IP网络上的语音一般都进行压缩以节约带宽,常用的压缩算法有G.723.1、G.729,可以根据具体情况选用。
本发明通过采用ACM(Audio Compress Management)来进行语言编码的变换,来解决对IP网络语音的支持,在接收时,把RTP包和RTCP包的相关信息送给ACM解码器,解码为指定格式的文件保存;在发送时,从预先保存的文件中读取信息,送给ACM编码器,还原出RTP包和RTCP包送给对方用户。
通过ACM的使用,由于进行了语音的压缩,能够大大减少文件保存的空间,同时通过对RTP和RTCP信息的处理,能够提供非常好的音质,完全能够满足语音应用的要求。
为了使业务流程控制过程更加灵活和方便,本发明采用VXML规范。在交互式应答(IVR)系统中建立语音VXML文档及VXML文档管理模块,整个IVR系统的流程控制遵循VXML规范,并通过VXML文档定制。VXML文档管理模块读取系统指定的VXML文档,并解释和执行文档中制定的流程来控制与用户的IVR交互过程。此方法的优点是控制灵活、修改方便。VXML主要有如下的语法元素

在IVR流程控制中主要有如下的要求录音、放音、接收DTMF输入、文本到语音转换(Text To SpeechTTS)、语音识别(Auto speech RecognizationASR)、菜单选择和异常处理。
本实施例把IVR中流程控制要求和VXML元素建立下表中的映射关系

通过映射,使得所有的IVR流程控制全部可以由VXML语音表示,这样通过标准的VXML语音书写的流程就能够被IVR设备支持,解决了不同厂家的IVR设备互通的问题。
图5进一步显示了本发明的IVR系统的逻辑结构,整个IP IVR系统主要由以下几个部分组成IVR Application Logic,为整个IVR系统的应用逻辑控制部分,对外提供各种IVR业务。
MGCP and RTP/RTCP Stack,这部分主要在系统中负责语音呼叫的信令控制和媒体流在IP网络上的实时传输。
VoiceXML Core,为核心VoiceXML部件,主要完成VoiceXML文档的解释与执行,负责IVR系统业务流程的控制。其中包含VoiceXML Interpreter和VirtualVoice Device两部分。VoiceXML Interpreter解释并执行VoiceXML文档。VoiceXML Parser和FIA(Form Interpreter Algorithm)是其中的两个重要部分。Virtual Voice Device是虚拟的语音设备,它实现VoiceXML语音设备到物理语音设备的转换。
IVR Procedure Definition,这是IVR业务流程及应用相关的对象的定义。它包含两部分,VoiceXML Documents和External VoiceXML Objects,VoiceXMLDocuments用于定义流程,External VoiceXML Objects是与应用相关的VoiceXML外部对象的定义。通过这一部分可以根据用户的不同需求定制出不同的IVR业务,使系统具有较高的灵活性。
请参阅图6,在IP网络中实现本发明。IP网络基于软交换(SoftSwitch)架构。普通电话用户通过IP电话网关GW通过软交换(SoftSwitch)设备完成对IVR系统的访问,PC用户通过PC客户端在IP网络上完成对IVR系统的访问,Web用户则可以通过浏览器直接访问IVR系统。
本发明通过MGCP作为呼叫控制信令,解决了与其它设备互通的问题,同时由于MGCP较为简单,基于MGCP协议的IVR也能够较为容易的实现。
权利要求
1.一种实现IP网络中交互式语音应答的方法,其特征在于将交互式语音应答(IVR)系统接入IP网络中,所述的IP网络采用MGCP协议对交互式语音应答系统的语音呼叫进行控制;在交互式应答(IVR)系统中设置声码器,对接收的语音进行解码和对发送的语音进行编码;在交互式应答(IVR)系统中建立语音VXML文档及VXML文档管理模块,并使所述的VXML文档定制的业务流程与交互式应答的控制流程建立映射关系,所述的VXML文档管理模块负责读取、解释和执行系统指定的VXML文档;当用户通过语音呼叫交互式应答系统时,IP网络中的媒体网关控制器完成呼叫的信令交互过程并使呼叫用户与交互式应答系统接通,交互式应答系统根据用户的服务需求,通过XML文档管理模块对系统指定的VXML文档进行操作,以控制IVR与用户的交互过程。
2.根据权利要求1所述的方法,其特征在于所述的交互式应答系统通过以太网接口接入IP网络。
3.根据权利要求1所述的方法,其特征在于所述的声码器为ACM解码器和ACM编码器。
4.根据权利要求1所述的方法,其特征在于所述的映射关系为交互式应答的流程控制要求与VXML规范的主要语法元素之间的映射关系。
全文摘要
本发明公开了基于MGCP协议和VXML规范实现IP网络中交互式语音应答(IVR)的方法,该方法通过MGCP协议对IP网络中的IVR设备的语音呼叫进行控制,并采用声码器使IVR设备支持IP网络上的实时语音,使IVR设备的流程控制遵循VXML规范,使得IVR设备能够在IP网络上独立运行。该方法使IVR系统的灵活性提高,系统开发成本降低,开发难度也大为减少,可以非常容易的构造出满足各种不同需求的IP IVR设备。
文档编号H04M3/42GK1457180SQ0211899
公开日2003年11月19日 申请日期2002年5月10日 优先权日2002年5月10日
发明者冒晓鸣 申请人:北京艾尼通科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1