采用计算机电话连接的音频控制信息服务和询问服务的对话控制方法

文档序号:7580391阅读:177来源:国知局
专利名称:采用计算机电话连接的音频控制信息服务和询问服务的对话控制方法
技术领域
本发明所述方法,涉及到用户与受语音控制的信息服务、消息服务及联接服务之间的对话控制,这些服务,是由供应商提供并由计算机电话加实现的。
语音处理系统,尤其是在通信领域内,正在日益扩大其应用。在美国,许多这样的自动的信息服务、消息服务和联接服务,已进入日常的生活。这也是一个重要的原因,说明为什么在这个市场上已经建立起大量的生产基于语音处理技术的产品的公司。为了实现这一类服务,软件组件及其运行期系统,以及对话编辑器,就具有重要的意义。
对自动化电话对话进行控制的方法和系统,已有将近二十年的历史了。它们有着各不相同的基本结构。较著名的有—只对语音数据流进行控制的系统和方法,例如,在电话交换机处便是这样;—对语音数据流本身加以处理的系统和方法。
对语音数据流本身加以处理的系统和方法,是针对人机之间的对话的。这一类方法和系统,越是接近人的对话行为和交互行为,就越是好。当然,这一类方法和系统,也可以对例如电话通信进行控制,也即选号、接通等等。这类方法所采用的步骤,基本上相当于一个用户在打电话时的行为方式。
这一类解决方法,一步步由完全单独的程序系统发展到借助于脚本语言的面向应用的可编程系统。
目前现有的系统,其特征为—基于文本的、接近硬件的脚本语言;—先是图形描述语言,然后放置到脚本语言上去;—使对话成为适合于普遍应用的严格按层次结构构成的进程序列,或者,使其成为适合于研究用途的基于规则的语言学系统;—在一个封闭的系统世界内为某时专用的组件完成靠近硬件的实现;
—在测试和纠错条件较差时的顺序开发过程;—在对应用加以规定时由于缺少结构化手段而导致所建立的应用的复杂性。
已知的系统,总是在个别参数上存在较大的缺陷。尽管有些系统也标榜使用对话,然而,它们大多是高度依赖于硬件的,或者,需要很高的运算开销。可参见“欧洲语音年会会记录”(Proceedings of Eurospeech),93,2(3),943-946页,“对话设计原则”。
一些并联线路多的和电话装机量多的结构系统,则从结构就难以变更,并且,在其对话行为中显得极其僵硬。
可参见Rabiner的“IEEE语音处理在通信中的应用会议录”(Application of Voice Processing to TelecommunicationsProceedings of the IEEE),Vol.82,No.2,1994年2月。
本发明的任务,就在于提供一种方法去控制人机对话所必需的硬件组件,使这种方法适合于由计算机电话(CTI)介入的受语音控制的信息服务、通讯服务和联接服务,本方法所适用的信息服务,通讯服务和联接服务,尤其是指那种建立在高度并行性和针对群体电话服务系统,这时,所建立的体系结构易于扩充并可灵活地进行对话,从而使用户能够迅速地访问到所需的信息。
本发明所述方法之实现,是藉助于由所涉及的服务开发商,利用一个以流程图形式的图形编码器建立起来的控制程序,在该控制程序中,人机对话的进行是作为一个倒行进程,从而能够同时并行地控制所有为询问提供具体服务的部门以及对参与到用户交换信息的信息输入部件及信息输出部件进行控制,并且,能够对所有就询问和与用户交换信息而言不再需要的组件实行单个切断和按序复位。
以流程图形式构思的控制程序,是基于对人机之间的信息交换所必需的对话的描述,它是借助对话的行动和已经描述的子对话,通过对一系列行动的定义、在对话之内对并行行动的识别以及通过对一般事件的处理规定的基础上进行的,对所述对话的解释,则是在一台计算机系统上进行的,该系统有一个控制模块用来对资源进行控制,有一个S.100或S.300接口,使得必要时可以不依赖于电话线的数目而并行地进行解释。
按上述原则建立起来的控制程序或流程图,被集成到相关服务的供应商的控制台管理模块中去。
当某个用户对服务供应商呼叫时,经过由服务供应商系统对该用户的有效验证后,即调用相应的控制程序或流程图,然后,就启动所有该用户为了获得信息、为了与系统进行交流、尤其是为了将他的获得相关信息的愿望输入给系统所必需的CTI信息输入部件和CTI信息输出部件,这样,用户可同时使用这些部件。
在本发明是,CTI部件是指—将信息输出用户的部件(信息输出部件)和—将用户的信息或愿望输入给系统的部件(信息输入部件)。
属于CTI部件的,例如有—语音识别部件或ASR部件—语音输出部件—传真部件—电话部件—发话人验证部件用于将信息输出给用户的信息输出组件,例如播音文本;适宜于作此组件的例如有录音放送器,它可将各个单独控制的播音文本贮存其内。
用于输入用户的要求的信息输入组件,可以是健盘或语音识别部件。
为了在人机对话中了解用户的要求,例如可以启动一个开通着的语音识别部件(ASR部件),并且使用户同样可以并行地去支配其它CTI部件。
在编制流程图时,应使用户在听到问候语时即可将一个作为询问例行程序在运行的、由一个用作录音放送器的语音输出部件将播音文本加以输出的、有用户信息的播音文本主动地予以中断,这样,就能为用户提供输入可能性、主要是通过语音,来表达他的信息要求。经由与此并行运行的语音识别组件,使这个要求被接收到,并与已贮存的信息作比较。如果某个要求藉助于由用户表达的关键词汇而被识别,就经由控制程序或流程图使它得到控制,播音文本立刻被中断,信息输出部件就被复位。在编制控制程序或流程图时,原则上作如下的考虑,即当那些并行地被接通的CTI部件中的某一个由用户启动或提出请求时,所有并行地被接收的CTI部件被复位并且被切断。如果由用户输入的信息已足以表明用户所要求的信息,那么,用户就能去支配他所要求的信息。例如,可以通过向用户作语音输出来完成播音服务。
如果由用户输入的信息尚不足以表明用户所要求的信息,那么,经由控制程序或流程图而使询问例行程序重新激活,所有参与用户询问的如上所述的CTI部件,又并行地被启动并被置于用户的支配之下,这时,信息输出部件,例如,一个录音放送器,在播音文本处被启动,在已经从用户处得到的信息的基础上再进一步针对目标对信息输出加以精化。在这个部位上,用户还可以通过输入一个进一步将其信息要求加以精化的信息来中断询问例行程序的运行过程。这样,众所周知,在经由语音识别部件(ASR部件)输入一个被确认为有效的用户信息以后,所有其他的并行地开通着的CTI部件就又被有序地复位和切断。
按上述原则,对话将一直继续到用户所要求的信息得以表明为止。对CTI部件的中断条件或者对由用户输入而产生的提前中断,可以全局地或专门地在对话中作出反应,这一点,可以在编辑器中通过一个全局的对话框加以实现。
在下面的实施例中,本发明的方法将对用户和服务供应商的计算机电话问讯服务和信息服务之间的对话的描述进行较深入地说明。


图1表示对话系统的原理构成图。
图2表示某个信息服务对话系统的构成图。
图3通过流程图以信息服务为例说明本方法中用户和对话系统之间进行对话的各个步骤。
按照图1,应用层中的对话系统包含有一个控制程序/流程图,使它成为对话代理,及时地对对话作出解释。通过S.100接口,使应用层跟用于控制资源的设置在控制层的控制模块相联接。通过S.300接口,又使控制层与网络和资源相联接,后者由CTI信息输出部件及CTI信息输入部件组成。
图2表示某服务供应商信息服务的一个实施形式。
作为具体应用,控制程序/流程图包含有用于信息服务的应用程序。用于控制资源的控制模块,跟电话接口部件、用作语音识别的ASR部件、DTMF(dual tone mode frequency,双音模式频率)部件和录音放送器相联接。这里,将录音放送器作为信息输出部件,而ASR部件及DTMF部件则作为信息输入部件。与用户的联接,是通过电话接口这个部件来建立的。
按图3的流程图,下面对用户与系统的对话作进一步说明。
当某个用户呼叫服务供应商的服务号码时,在电话接通并由服务供应商的系统对该用户验证后,就自动地通过应用层的控制程序/流程图使信息服务得以启动。这时,在本发明中,不管是输出部件录音放大器1,还是在信息服务范围内设置的输入部件ASR部件和DTMF部件,都同时并行地被启动,并经过电话接口连通到用户那里去。那些同时并行地可由用户支配的信息输入部件和信息输出部件,它们的状态则处于经常的监控之下。通过录音放送器1,向用户发出问候语,例如,“例如进入‘×’公司的信息线…”。从信息输入部件和信息输出部件可由用户支配的时刻开始,用户就可以主动地经过ASR部件或DTMF部件进入对话控制,因为信息输入部件和信息输出部件一直受到监控。
按照这里所选的实例,用户在由他所选的信息服务的范围内,有多种可能性去主动地形成对话。
—初次请求信息服务的用户,往往会听完由录音放送器1送出的问候语。在这种情况下,当问候文本结束后ASR部件和DTMF部件都中止复位。录音放送器2被启动,向用户发送进一步的信息文本,其中含有在信息服务范围内所提供的信息内容,例如产品信息、服务信息或新消息。
—已多次请求过信息服务的用户,则在问候语未完成便可以主动进入对话,因为他通常已经知道信息服务范围内所提供的服务业务。这样,他可以通过语音输入,例如说“产品”这个词,将问候语中断。由用户用语音输入的词语,通过ASR部件去与可以使问候中断的那些词语作比较,加以确认。通过用于控制资源的控制模块,使录音放送器1、ASR部件和DTMF部件复位和切断。这时,使录音放送器3被启动并通向用户,录音放送器3中包含有“×”公司产品目录信息,例如电话机、传真机。随着录音放送器3起动,同时又使ASR部件和DTMF部件并行启动并接通用户。用户可以从产品目录表中选择所需的产品,并通过语音信息将他的要求输入进去。然后,通过录音放送器3,将所需的信息输出给用户。
为了使用户还有另一种方法能进入对话,还向用户附加提供一种功能,使他可以以手动方式,例如按压他的电话或PC机上的一个键,来进入对话。在图3所示的实施形式中,用户既可以通过语音输入,也可以以手动方式通过按压电话机上的一个键,来进入对话。尤其是当用户遇到麻烦,想要接通到操作员(话务员)时,就特别需要有这种通过电话键或计算机键的输入方法。当用户例如在问候语放送过程中按压他的被赋予相应功能的电话键时,则由DTMF部件对此予以确认。在包含有向话务员接通的信息的录音放送器4被启动之前,录音放送器1和ASR部件先被中止和复位。在录音放送器4给出语音信息之后,自动地将用户接通到话务员。
按照下述两个原则,可使对话控制的结构对话系统的效率得到进一步的提高。这两个原则是a)藉助于一些动作和一些已被说明的对话,通过对动作的次序的规定、在一次对话之内对并行动作的标识、对一般性的事件处理的规定,来对所需的对话加以说明;b)只要有需要,就对已被说明的对话作并行的解释,不管电话线的数目有多少。
当所需的对话由图形加以说明时,就使得对话进程变得十分明确和易于掌握。
为了扩大对话的应用范围,可以让对话用一些子对话来加以说明,这些子对话,可以通过一个子对话行动而被吸收到别的对话中去。
为了有目的地使对话的进行得以扩充,也可以让各个并行的解释(电话代理)彼此之间进行通信和交换数据。
如果对话是用一些子对话来加以说明的,而这些子对话可以经由一个子对话行动而被吸收到别的对话中去,那么,有益的做法是使每一个子对话行动都在输入和输出事件以及参数方面自动地与所属的子对话取得平衡。
另外,如果能预先考虑到可以以图形方式交互地测试对话和排除故障,那就是很可取的。
尤其是当有多个不同的用户在使用时,如果各个行动都能文档化,是很有好处的。
还有一个在应用时可以预见到的简化方法,就是藉助于参数来配置行动。另外,直接在图形开放环境内部来对语音数据加以处理,这也是很有好处的。
在较大范围应用时,可以藉助于网络管理协议通过一个计算机网来控制对话的解释。
为了按照本发明的方法实现对对话所作的解释,按下列算法进行1.建立起一张全局域的变量表。2.对话被装入,也就是说,该文件连同时对话的说明一起被读入,并根据内容确立行动对象的网络。各个行动对象包含了由用户定义的参数;输入事件表;输出事件表;表示该行动是否为并行行动的一个布尔变量,并且,如果是并行的话,就有一个并行输出。此外,按照行动的类型,确定三个工作功能,即进入行动、等待事件和离开行动。3.在激活对话以后,对于每一个所需的对话代理,都有一个对对话的并行解释被启动,如下面各步所述。每个代理,其工作都完全独立于并行地开通着的各个代理。任何时候,整个系统都可以扩充更多的代理,或者,在所有代理以后被结束。也可以通过为某个代理设置一个结束标志而从外部强迫这个代理结束(Smart Shutdown)。要让整个系统结束,就首先要使所有代表都结束。4.为本次对话的代理,也即对本次对话所作的即时的解释,建立起通往S.100/S.300的联接,并且,独立于CTI部件的请求,等待着某个CTI部件的转接,例如,经由一次电话呼叫。5.对第一个子对话的起始点进行搜索,先使即时的对话状态表出清,然后用一个针对这个起始点的对话状态填入。6.下面从第7点到第9点将循环执行,直到所有的对话状态都处于结束状态。然后,将所有对话状态都消去,并且,如果在第7-××点处至少运行过一次等待,则解释重新在第5点处被接受。不然的话,就在本次对话代理的范围内使解释结束。7.每个对话状态,依次被检验i.如果它处于“退出”状态,就设置一个结束标志,使全部对话的解释结束。ii.如果它处于“处理”状态,则先实施其所属的行动的“退出”功能。然后,对输出条件进行检查,选出合适的输出事件。通过运算,计算出后继行动及其输入事件,并相应地改变对话状态中的参数。按现在的即时的行动实施“进入”功能,然后,对于该对话状态,使即时的步骤7被重复。特点a)在作“子拨号/启动”(SUBDIAL/START)动作时,则占用了该地区变量的一个新的变量空间,并在那里是参照其上的变量空间,而且其呼叫的“子拨号”行动被登记注册的。b)在作“返回”(RETURN)行动时,对所有的对话状态进行检查,看它们或它们的正在进行调用的先行者是否使用同一个地区变量空间。在这种情况下是运行并行的流程,并随着这个“返回”行动而被结束。而且,在处于这些对话状态时,状态被置在“取消”位置,并且随时可调用对所属的行动的“取消”功能。然后,各个参数被传送到正在进行调用的对话的该地区变量中去,使地区变量的结构被解锁,并随同正在呼叫的“子拨号”行动的输出一起向前继续。c)在作“停止”(STOP)行动时,状态处于“退出”位置。iii.如果对话状态处于“等待事件”状态,则应对该状态的所有输出条件进行检查。如果其中有一个条件为真,则为即时的对话状态算出后继状态,如i条款中所述。iv.如果对话状态处于“等待”状态,并且设置有结束标志,就将状态设为“取消”,调用所属行动的“取消”功能。v.除上述情况之外,则对话状态保持不变。8.如果设置有结束标志,且所有状态都处于结束状态,解释程序则结束。这时,各变量的数据结构被解除,还可能使通到S.100/S.300系统或通到数据库去的公开联接被结束,从而使这个代理记录的数据结构被释放。9.如果对话状态处于“等待”状态,那现在等待的是一个CTI部件的某个外部事件(来自于S.100/S.300,计时器,另一个代理,另一个过程),而且,一旦这个事件进入,就按次序对全部对话状态一一检查,直到某个所属的行动的事件处理功能通过返回一个肯定的真值来确定已对事件信息作了处理为止。10.如果解释过程系由外部予以控制,那就可以设置一个全局的结束标志,由该标志实施切断的功能,在第7步之下使所有开通着对话状态被结束。解释程序则一直运行到所有对话状态均处于结束状态,也就是说,处于“已结束”状态或者其本身已自动取消。建立在对话系统流程图上的作用原理,其突出的特点在于,图形化的体系结构对用户有利,对于大量并行的计算机电话系统提供了集中的运行时间环境。流程图的主要设计组成部分在于按分类层次结构,它一方面包含各对话流程,另一方面,又包括图形和说明的单元;将对话的说明以页面的方式加以结构化;辅以程序库;使语音数据的处理集成化;建立在S.100/S.300标准之上的系统结构,具有输入和输出部件,做到使各个组件如编辑器、调试程序、运行时间控制器以及其他辅助组件都达到集成化。
权利要求
1.一种由计算机电话连接的、受语音控制信息服务、通讯服务和联接服务的对话控制法,在该方法中,当某个用户进行呼叫时,在对其访问的权限进行验证后,有一个藉助于图形编辑器作为流程图而建立起来的、用于对话控制的控制程序被启动来对对话进行控制,其特征在于—对作为流程图建立起来的控制程序的对话的解释是按下列算法完成的a)藉助于一些行动和一些已经说明的子对话,通过对行动序列的规定,通过对一次对话内部某些并行行动加以特别标志,通过对一般的事件处理的规定,来对所需的对话加以说明;b)在一个具有S.100和S.300接口的控制模块的计算机系统上,不管电话线数目的多少,只要有需要,即可实现并行地对已作出说明的对话及对话步长作出解释;—通过作为控制程序构建的流程图,形成一个对资源进行控制的控制模块,通过该模块,使得用户可以对所有在随时进行的对话的范围内预先设定的CTI信息输入部件和信息输出部件进行同时并行的支配,使这些部件受到永久的状态监视;—经过信息输出部件,自动地使一个构成询问例行程序的、具有操作信息的播音文本得以启动并向用户发送,该文本在逻辑上是与流程图结合起来的;—不管是由用户经过某一个已经激活的信息输入部件输入某个信息时,还是在已输出操作信息以后,将该信息与在询问例行程序范围内可容许的信息内容作比较并经由对资源进行控制的控制模块认可之后,所有受用户支配的CTI信息输入和输出部件都被中止和复位;—当由用户输入的信息还不足以实现他的信息要求时,经过那个以流程图形式建成的控制程序,与对资源进行控制的控制模块一起,使得所有CTI信息输入和输出组件重新同时并行地处于用户支配之下;使得包含已经由用户输入信息作为基础的播音文本的信息输出部件得以启动;用户通过进一步输入一个更精确化的信息,可以主动使正在播送文本中断;而用户在确认获得有效信息后,又可重新地使所有已并行接通的信息输入和输出部件中止和复位;—对话过程一直进行到a)由用户所取得所取得的信息已包含所有为实现用户的要求所必要的内容,或者b)由用户通过受他支配的信息输入部件发出中断命令。
2.如权利要求1所述的方法,其特征在于,对将由用户通过语音输入输入的词语或用户终端设备的某个键,被赋有这样的功能,即不管是得到认可或发出中断命令,都能通过对资源进行控制的控制模块建立起对服务供应商的操作员的联接。
全文摘要
按本发明的方法,可使客户能进行方便和灵活的对话,并且能够很快地存取所希望的信息。根据本发明,用户在呼叫之后及输入确认验证后,借助一个以流程图表示的图形编辑器,起动一个用来对话的控制程序。通过一个控制资源的控制模块,为用户同时并行地提供所有的CTI-信息输入和输出部件,该部件一直受到监视,同时是并联的。用户当得到问候语时,已经通过分配给他的信息输入件,可以主动地进入对话了。该对话可以根据用户的标记位置重新地接通。该方法适用于并联线路及装机客量特多的信息服务、通信及电话连接服务领域。
文档编号H04M3/493GK1260932SQ98806165
公开日2000年7月19日 申请日期1998年6月16日 优先权日1997年6月16日
发明者L·布拉德曼, C·米勒, T·蒙丁, H·帕鲁斯, T·齐姆, R·P·韦策尔 申请人:德国电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1