一种语音浏览系统的制作方法

文档序号:7595774阅读:131来源:国知局
专利名称:一种语音浏览系统的制作方法
技术领域
本发明涉及信息系统,尤其涉及语音网络处理系统,特别是一种语音浏览系统。
背景技术
现有技术中,浏览互联网、获取信息的唯一手段是通过固定的终端上网,其访问方式有限。虽然语音门户技术已经在被许多大的网站应用,如中国第一代语音门户--TOM公司的TOM Voice即是一个概念性的样例。但其实现非常有局限性,不同的语音门户需要不同的接入。

发明内容
本发明所要解决的现有技术中的技术问题是现有技术中,浏览互联网、获取信息的唯一手段是通过固定的终端上网,其访问方式有限。虽然语音门户技术已经在被许多大的网站应用,但其实现非常有局限性,不同的语音门户需要不同的接入。访问互联网信息的手段仍然没有整合。
本发明为解决已有技术中的上述技术问题所采用的技术方案是提供一种语音浏览系统,所述的这种语音浏览系统由服务器设备、公共网络和终端设备构成,所述的服务器设备、所述的终端设备与所述的公共网络连接,其特征在于所述的服务器设备包括WEB服务器、信息采集服务器、计费服务器、ASR服务器、TTS服务器和数据库服务器,所述的公共网络中设置有UMS设备、CTI设备、IVR设备和内容编辑工作站,所述的公共网络通过PBX设备与PSTN网络相连接,所述的PSTN网络中设置有语音终端设备,所述的终端设备和语音终端设备通过公共网络与所述的服务器设备实现信息通信,所述的服务器设备实现通信控制和计费认证,所述的终端设备向所述的服务器设备传递服务请求,所述的服务器设备实现动态、海量信息的数据查询以及对互联网络上动态、海量信息的采集、分析、编辑,并以语音方式向语音终端设备提供业务服务。
进一步的,所述的公共网络是INTERNET网络。
进一步的,所述的公共网络通过PBX设备与ISDN网络相连接,所述的ISDN网络中设置有语音终端设备。
进一步的,所述的信息采集服务器连接有多媒体终端。
进一步的,所述的服务器设备与所述的公共网络之间设置有防火墙。
进一步的,所述的服务器设备与所述的终端设备采用数据传输和语音传输两种通信方式。
进一步的,所述的语音终端设备装置在机动车辆中,所述的语音终端设备通过无线网络与所述的公共网络连接。所述的语音终端设备在移动过程中通过公共网络从所述的服务器设备获得语音浏览服务。
本发明中所述的WEB服务器、信息采集服务器、计费服务器、ASR服务器、TTS服务器和数据库服务器以及UMS设备、CTI设备、IVR设备和内容编辑工作站均为信息通信行业的公知技术,在此不再赘述。
本发明的工作原理是,本发明利用了下列核心技术,进行动态、海量信息的数据查询以及对互联网络上动态、海量信息的采集、分析、编辑,其中1)CTI技术实现语音、短信等各种通讯方式的接入,以及实现整个系统的基础通讯平台(包括IVR)2)语音合成技术(TTS)用以将文本信息转换为语音信息提供给用户
3)语音识别技术(ASR)用以取代繁琐的按键输入,使输入更为便捷和人性化。
4)VXML技术用以IVR平台与互联网络交互信息。(IVRInteractiveVoice Response,交互式语音应答系统。)5)网络蜘蛛技术(Web Spider)系统可以动态、实时的采集、分析网络上的海量信息。
6)统一信息智能生成技术对网上采集的信息能够智能的编辑处理。
具体的,CTI技术的飞速发展使得电话、计算机、互联网三网合一的应用逐渐成熟,而实现这些的关键是要有一个好的CTI通讯平台,要提供基本的和更高级的通讯控制服务,要适合更多的通讯方式,有有高的效率、好的稳定性、灵活的结构,这样,才能在该平台上部署各种应用服务。
CTI技术的实现使得通过电话开展的应用越来越多,三网合一的信息共享成为可能。
可见CTI技术与其他技术的融合发展已经是非常广泛。
语音合成技术的本质是将文本信息转化为语音信息,是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的关键技术之一。
在信息爆炸式增长的现代社会,信息有两个很显著的特征信息量大、信息变化快。但是对于电话信息服务系统来说,它与客户之间的“界面”主要是语音,如何用语音来传递这些海量和动态的信息,这就是必须用到语音合成技术。
传统的预录音方式,需要人工将这些信息以录音的方式预先存放好,其漫长的制作周期和繁重的工作量,显然已经越来越显得力不从心。而语音合成技术(TEXT TO SPEECH),能够将各种文字信息转化成连续的语音,是电话信息服务系统成为提供高质量、智能化的语音服务的关键技术,可以预见,语音合成技术在电话信息服务行业中将会有非常广阔的应用前景。
语言是人类进行信息交流的最主要、最常用、最直接的方式。语音识别技术是实现人-机对话的一项重大突破,在国外近年来发展十分迅速,其应用也逐步得到推广。
传统电话服务从事服务性行业的公司通过大量客户服务员为客户翻查和处理所需资料,答复客户所需的资讯,但是长期聘用和培训大量这些客户服务员,成本大幅上升,并且容易造成人为的失误,严重地影响到企业的服务质量和形象。近几年逐渐普及的电话自动应答(IVR)处理了不少简单而又重复的咨询工作,节省生了不少人力,但这种按键式的语音自动应答系统却让客户花费很多时间选择按所需目录指引来完成的简单查询,令用户倍感烦恼。“语音识别”无疑可解决该方面的问题。
在语音浏览系统中,语音识别应用,将充分发挥计算机技术和网络技术的优势,采用先进的人-机语言对话方式,摆脱电话按键的束缚,人们只要像平常一样对着电话简单地说出所需服务项目即可轻松获取自动系统提供的所需信息。
同时,本发明建立了不同的语法模型,主要采用自然语言理解技术、SAY-ANYTHING技术、STUDY-BY技术。
AT&T,朗讯,摩托罗拉与其他17家公司于1999年联合推出语音扩展语言论坛(VXML),用以拟定一项标准,此标准能够将语音、电话用于因特网。除为消费者服务外,VXML还支持一些商务应用,如话务中心、银行交易和电子商务。
其他方面的应用包括因特网用户核对电子邮件,获得天气预报、股市行情和其他来自电话线的在线数据。用户也可编写自己的VXML应用。AT&T,朗讯,摩托罗拉一直都在致力于VXML的不同版本,但基本途径相同。最终目标是产生统一的标准。
语音浏览系统是以先进的CTI技术以及开放的Voice XML工业标准为基础,架构在互联网上的海量信息;通过电话畅游互联网,轻松“听”网上的信息,“说”E-mail,“点击”网上的链接。由于引入了VXML相关技术,使平台的IVR流程编辑遵循统一的标准,提高IVR的灵活性。
网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
这是一项很复杂的技术,往往有两种策略广度优先和深度优先。
语音浏览系统中主要用到了,信息采集,内容提取,算法采用了简单搜索模型。
网上的信息通常有着自己的格式,并不是所有内容都可以直接播放,所以对自动采集提取的信息必须要经过处理和优化,该技术就是完成这个工作,它提供了一个统一信息的编辑平台,同时具有强大的学习功能,不是所有的工作都要由人工完成,它会随着编辑者的不断使用,具备记忆功能,本发明采用了记忆-学习-自动处理模型。通过此技术,最终系统会快速处理各种信息,生成统一的信息,提供给用户。
本发明与已有技术相对照,其效果是积极和明显的。本发明通过构建一个统一的互联网语音访问门户将互联网资源通过电话、手机、语音设备终端等提供给用户,为用户提供全天候、全方位的服务。本发明特别在汽车行业的应用中具有很好的前景,将此系统加入车载信息系统中,可以为汽车提供各类服务,包括驾驶员和乘客在移动过程中,利用语音指令取得互联网信息。
本发明的目的、特征及优点将通过实施例结合附图进行详细说明。


图1是本发明一种语音浏览系统的一个优选实施例的物理结构示意图。
图2是本发明一种语音浏览系统的一个优选实施例的系统服务平台示意图。
具体实施例方式
如图1和图2所示,本发明一种语音浏览系统,由服务器设备、公共网络和终端设备构成,其特征在于所述的服务器设备和所述的终端设备以所述的公共网络10为平台,连接在所述的公共网络10上的服务器设备包括,WEB服务器1、信息采集服务器2、计费服务器3、ASR服务器4、TTS服务器50和数据库服务器5,此外,所述的公共网络10上还相应的设置有UMS设备6、CTI设备7、IVR设备8和内容编辑工作站9,所述的公共网络10通过PBX设备20与PSTN网络或ISDN网络30相连接,所述的PSTN/ISDN网络30连接设置有语音终端设备31,所述的终端设备通过公共网络与所述的服务器设备实现信息通信,且所述的服务器设备实现通信控制和计费认证功能,通过终端设备向服务器请求服务,所述的服务器设备实现动态、海量信息的数据查询以及对互联网络上动态、海量信息的采集、分析、编辑,并以语音方式向用户提供业务服务,从而构建了一个统一的互联网语音访问门户系统,具体的,所述的公共网络10为INTERNET网络,所述的信息采集服务器2连接设置有多媒体终端21,所述的服务器设备与所述的公共网络之间设置有防火墙40。所述的服务器设备与所述的终端设备采用数据传输和语音传输两种通信方式。
本发明各功能模块描述如下IVR设备实现各种业务流程的编辑功能;UMS设备实现将电话、手机、传真、呼机、数字移动设备和个人电脑等途径提供的消息转换为统一的消息处理;TTS服务器实现将文字转换为语音的功能,包括在线转换和离线转换;ASR服务器实现语音识别的功能;信息采集服务器实现对网上信息的动态采集和提取功能;本发明的整个服务平台支持多种终端,如普通手机用户、具有特定功能的车灾终端用户、普通电话用户等等。
本发明可以广泛应用于语音读报、新闻浏览、VOICE-MAIL和语音杂志等各类网络信息处理系统中。
权利要求
1,一种语音浏览系统,由服务器设备、公共网络和终端设备构成,所述的服务器设备、所述的终端设备与所述的公共网络连接,其特征在于所述的服务器设备包括WEB服务器、信息采集服务器、计费服务器、ASR服务器、TTS服务器和数据库服务器,所述的公共网络中设置有UMS设备、CTI设备、IVR设备和内容编辑工作站,所述的公共网络通过PBX设备与PSTN网络相连接,所述的PSTN网络中设置有语音终端设备,所述的终端设备和语音终端设备通过公共网络与所述的服务器设备实现信息通信,所述的服务器设备实现通信控制和计费认证,所述的终端设备向所述的服务器设备传递服务请求,所述的服务器设备实现动态、海量信息的数据查询以及对互联网络上动态、海量信息的采集、分析、编辑,并以语音方式向语音终端设备提供业务服务。
2,如权利要求1所述的语音浏览系统,其特征在于所述的公共网络是INTERNET网络。
3,如权利要求1所述的语音浏览系统,其特征在于所述的公共网络通过PBX设备与ISDN网络相连接,所述的ISDN网络中设置有语音终端设备。
4,如权利要求1所述的语音浏览系统,其特征在于所述的信息采集服务器连接有多媒体终端。
5,如权利要求1所述的语音浏览系统,其特征在于所述的服务器设备与所述的公共网络之间设置有防火墙。
6,如权利要求1所述的语音浏览系统,其特征在于所述的服务器设备与所述的终端设备采用数据传输和语音传输两种通信方式。
7,如权利要求1所述的语音浏览系统,其特征在于所述的语音终端设备包括电话和手机。
8,如权利要求1所述的语音浏览系统,其特征在于所述的语音终端设备装置在机动车辆中,所述的语音终端设备通过无线网络与所述的公共网络连接。
全文摘要
一种语音浏览系统,由服务器设备、公共网络和终端设备构成,其特征在于所述的服务器设备和所述的终端设备以所述的公共网络为平台,终端设备通过公共网络与所述的服务器设备实现信息通信,且服务器设备实现通信控制和计费认证功能,通过终端设备向服务器请求服务,服务器设备实现动态、海量信息的数据查询以及对互联网络上动态、海量信息的采集、分析、编辑,并以语音方式向用户提供业务服务,从而构建了一个统一的互联网语音访问门户系统。本发明可以将互联网资源通过电话、手机、语音设备终端等提供给用户,为用户提供全天候、全方位的服务。本发明特别在汽车行业的应用中具有很好的前景,将此系统加入车载信息系统中,可以为汽车提供各类服务。
文档编号H04L12/66GK1750499SQ20041006647
公开日2006年3月22日 申请日期2004年9月17日 优先权日2004年9月17日
发明者张政, 王勇, 苗刚 申请人:北京优能城际信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1