专利名称:一种全自动语音通讯系统的制作方法
技术领域:
本发明涉及一种全自动语音通讯系统,尤其涉及一种由声控拨号平台和多个一键式全自动语音通讯装置组成的全自动语音通讯系统,属于电话通信技术领域。
背景技术:
随着经济的发展和社会的进步,人们之间的信息交流变得日益频繁。在此背景下,电话已经成为人们在日常生活中的基本信息交流工具。在使用电话的过程中,人们普遍遇到的一个问题就是难以査找所需要的电话号码。为了方便人们在拨打电话时、省去査找电话号码的烦恼,人们进行了深入的研究,普遍认为在目前的技术条件下,鉴于在语音识别技术的准确度方面己有突破性的进展,因此以语音拨号方式代替按键式拨号,即用说话方式直接讲出对方姓名,由语音终端识别并自动匹配相应的电话号码,是解决这一问题的有效方式。
专利号为03240639.8的中国实用新型专利"两级式语音识别电话号码呼出装置"就是这一领域的典型研究成果。该装置对需分组的号码类进行语音识别。使用者对电话号码分组类名进行语音训练。已显示所述分组号码后,在拨出电话前,使用训练好的语音命令,语音电话机识别这些命令,选择并拨出相应的电话号码。
但是,上述的电话号码呼出装置仅能实现语音拨号的功能,使用范围很有限。随着语音识别技术的发展,人们发展出了新的人机交互语音系统。该技术在申请号为200510114477.3的发明专利申请中公开,其方法包括如下步骤通过音频输入单元接收用户的音频输入数据;通过自动语音识别步骤对用户的音频输入数据进行处理,将其转换成相应的指令;根据全球定位单元执行指令结果搜索数据库并生成与用户的人机交互信息;将所述人机交互信息通过语音合成单元输出。该专利申请增强了驾驶员在驾驶过程中的安全性,并且增加了自然语言理解技术,使人机对话更具有人性化,用户无需记忆复杂的命令,所想即所说。
除此之外,在专利号为ZL 99125249.7的发明专利中,公开了一种电话语音交互的信息服务系统及方法。用户通过电话网接入服务器端;用户的语音信号经接入与交换模块接收,并经语音识别服务模块识别业务类别及所在地;目的城市节点的服务器端,经业务控制模块进入业务的流程,用户可与系统交互。该发明可完全实现用户和系统通过语言交流的远程信息服务。
在专利号为ZL 02159244.6的发明专利中,公开了一种电话语音交互
系统,包括主控单元,用于创建一个以上工作单元及每个工作单元内
部的功能单元,并控制系统内往来消息的数据交换和存储;至少一个工
作单元,用于实现整个系统的语音交互过程,每个工作单元进一步包括
用于实现语音交互过程中逻辑处理、系统动态配置以及信息提供的情景导航单元和用于实现对电话语音各种处理的语音处理单元;其中,情景
导航单元与外部信息提供设备相连,语音处理单元与电话语音板卡相连。
该发明还同时公开了一种实现电话语音交互的方法,该系统和方法能够
准确地识别用户当前输入语音,并支持系统以不同的引导逻辑进行处理,
以保证系统的正常运行,不仅提高系统的处理能力和效率,而且更便于
用户使用。
但是,现有的电话语音交互技术仍然存在操控不方便的问题,也无法提供发送语音短信和进行语音搜索等增值服务,因此仍需要进一步加以改进。
发明内容
本发明的目的是提供一种全自动语音通讯系统。该系统由设置在通信运营商指定的机房中的声控拨号平台和分布在用户处的多个一键式全自动语音通讯装置组成。
为实现上述的发明目的,本发明采用下述的技术方案
一种全自动语音通讯系统,其特征在于
所述全自动语音通讯系统包括一个声控拨号平台和至少一个一键式全自动语音通讯装置;
所述声控拨号平台位于通信运营商处,所述一键式全自动语音通讯装置分布在各个用户之中,所述声控拨号平台和所述一键式全自动语音通讯装置通过电信网络实现信息交互;
所述声控拨号平台包括IVS设备、ASR服务器、数据库服务器、Web服务器、短信/计费服务器、坐席服务器,所述IVS设备连接通信运营商处的交换机,所述Web服务器连接通信运营商处的业务支撑运营系统,所述短信/计费服务器连接通信运营商处的短信网关。
其中,所述IVS设备分别连接所述ASR服务器、短信/计费服务器和数据库服务器,所述短信/计费服务器连接所述数据库服务器,所述数据库服务器分别连接所述Web服务器和所述坐席服务器。
所述IVS设备具有音频数据处理模块、其它数据处理模块、信令处理模块和TCP/IP网络通讯模块。
所述ASR服务器具有语音识别模块和语音合成模块。
所述短信/计费服务器具有短信网络模块和计费模块,其中所述短信网络模块通过短信网关接口与移动运营商的短消息中心相连接,所述计费模块通过计费接口与计费账务系统相连接。
所述音频数据处理模块分别连接所述语音识别模块和所述语音合成模块,所述其它数据处理模块分别连接所述短信/计费服务器和所述数据库服务器。
所述一键式全自动语音通讯装置包括蓝牙芯片、控制单元、回音与噪声消除电路、电源模块、麦克风和功放单元,其中所述电源模块连接所述蓝牙芯片,所述蓝牙芯片连接所述回音与噪声消除电路,所述回音与噪声消除电路分别连接所述麦克风和功放单元,所述控制单元与所述蓝牙芯片连接。
所述一键式全自动语音通讯装置包括至少一个按键,所述按键与所述控制单元连接,以便通过该按键触发所述控制单元拨打预置的特服接入号码。
本发明所提供的全自动语音通讯系统将声控拨号平台和一键式全自动语音通讯装置巧妙地结合,可以让用户以一键拨号方式轻松地实现语音拨号、发送语音短信和进行语音搜索等多项功能。
下面结合附图和具体实施方式
对本发明作进一步的说明。
图1为声控拨号平台的硬件架构示意图2为声控拨号平台的内部功能模块示意图3为一键式全自动语音通讯装置的内部功能模块示意图;图4为全自动语音通讯系统的系统功能示意图;图5为全自动语音通讯系统的业务流程示意图。
具体实施例方式
本全自动语音通讯系统由声控拨号平台和分布在用户处的多个一键式全自动语音通讯装置(简称语音通讯装置)组成。声控拨号平台作为提供各项交互式语音服务的中心服务系统,设置在通信运营商指定的机房中。语音通讯装置以车载电话或者固定(移动)电话的方式分布在各个用户之中。它们之间通过现有的移动通信网或者固定电话网实现信息交互。具体而言,用户按下语音通讯装置中的"一键通"键,该"一键通"键捆绑预定的特服接入号码。语音通讯装置通过移动通信网或者固定电话网拨打该特服接入号码,从而与声控拨号平台实现信息交互。声控拨号平台通过语音菜单导航方式,为用户提供拨打电话、发送语音短信和语音搜索等多项电信增值服务。
下面首先介绍本发明中的声控拨号平台。图1显示了该声控拨号平
台的硬件架构,包括IVS设备、ASR服务器、数据库服务器、Web服务器、短信/计费服务器、坐席服务器等。这些设备之间基于TCP/IP协议实现信息交互。另外,IVS设备通过ISUP/TUP协议与通信运营商侧的交换机进行信息交互,Web服务器与通信运营商侧的BOSS系统(业务支撑运营系统)进行通信,而短信/计费服务器连接通信运营商侧的短信网关。另外,在声控拨号平台内部还安装有适应电信级应用的防火墙,通过该防火墙连接Internet 。
本声控拨号平台的硬件采用高可靠的电信级设备,可以通过简单的叠加达到系统扩容的目的。数据库系统硬件根据系统的规模容量,可以方便地进行扩容和功能划分组合。同时可通过备份硬件的方式提高硬件平台的可靠性和运行的稳定性。
图2是声控拨号平台的内部功能模块示意图。其中,IVS设备一方面接入PSTN (公共交换电话网),另一方面分别连接ASR服务器、短信/
计费服务器和数据库服务器。短信/计费服务器一方面连接短信网关,另一方面连接数据库服务器。数据库服务器内部的数据接口层分别连接Web
服务器和坐席服务器的数据接口层,以便交换彼此之间的数据。
IVS (Interactive Voice Search,互动式语音搜索)设备是声控拨号平台的控制中心,也是实现本发明的关键技术点之一。它是在IVR
(Interactive Voice Response,互动式语音应答)技术的基础上,针对提 升系统信息搜索功能及扩容需求而专门设计的。其核心部分主要包括音 频数据处理模块、信令处理模块和TCP/IP网络通讯模块。其中,音频数 据处理模块和其它数据处理模块业务应用处理层,信令处理模块和 TCP/IP网络通讯模块位于业务应用支撑层。信令处理模块通过7号信令 与PSTN (公共交换电话网)中的交换机进行通信。音频数据处理模块分 别与ASR服务器中的语音识别和语音合成模块进行连接,其它数据处理 模块分别连接短信/计费服务器和数据库服务器。
上述IVS设备的具体实施方案有两种第一种方案是在针对16E1以 下的应用时,可以采用简单的服务器与板卡组合来实现;第二种方案是 采用成熟的交换机来实现16E1以上的应用,特别是基于NGN概念下的 相关产品,比如东进Keygoe系列多媒体交换机,结合自主开发的支撑 软件就能够实现声控拨号平台的信息搜索功能及扩容需求。
对声控拨号平台而言,IVS设备提供了自动业务流程的运行平台,并
对自动业务流程进行控制。在自动业务流程的运行过程中,将会调用及
管理上述声控拨号平台中的相关资源(如语音资源、数据资源、短信/计费
资源等),用于语音的互动、短信的收发等,其典型应用是实现如图5所
示的业务流程。声控拨号平台与外部不同局向之间由IVS设备通过El、
ISUP/TUP实现互联互通。对用户来说,只须用电话拨打特服接入号码(比
如1258XXX),然后根据语音导航,即可方便地使用声控拨号、语音短信
和语音搜索等功能。
ASR ( Automated Speech Recognition ,自动语音识别)服务器包括语
音识别和语音合成两个功能模块,分别应用最新的语音识别技术和语音
合成技术。语音识别技术是一种将人的语音转换为文本的技术。语音合
成技术TTS的英文全称是Text To Speech,它的过程和语音识别技术刚好
相反,是把计算机中任意出现的文字转换成自然流畅的语音输出。目前,
语音识别技术和语音合成技术都比较成熟,能够支持多种不同口音的识
别。用户无需预先进行语音训练,只需要拨打特服接入号,根据语音提
示对用户进行语音导航,直接说出联系人姓名,系统便会自动进行转接。
数据库服务器将数据分为用户数据和系统数据两部分,其中用户数
据用于存储用户及其联系人的信息,系统数据用于存储系统内部的运行信息。数据库服务器采用高可靠性和高稳定性的服务器,具有较高的处 理性能,能有效承担数据入库、ofacle入库进程、处理各种统计数据、前
台应用请求和其他事务的硬件要求。
Web服务器为Web网站提供支持服务。该Web网站主要是为语音通 讯录用户提供通讯录查询、添加删除联系人、发送短信、短信群发、添 加事件提醒、资费査询、新用户注册、注销等功能的一个服务平台。用 户可以通过Internet网络来访问系统,该Web服务器必须在防火墙的保 护下才能够保证系统的安全使用,Web服务器提供双网卡的结构,以便 使系统的LAN和Internet在物理层面上断开。
坐席服务器主要采用的是人工坐席接听方式进行用户需求的受理, 是集信息咨询、用户资料修改和建议收集等多种功能为一体的服务平台。
短信/计费服务器包括短信网络模块和计费模块,该服务器和运营商 侧的短信网关和计费中心相互联系,支持短信业务和计费功能。具体而 言,短信网络模块通过短信网关接口与移动运营商的短消息中心相连, 方便用户使用短信的方式下载査询的各类信息。计费模块通过计费接口 将用户使用本系统的话单记录发送计费账务系统中,以便于系统与计费 账务系统进行话单的核对。
在上述的声控拨号平台中,IVS设备运行在Linux操作系统上,可提 供较高可靠性、可伸縮的高性能业务。Linux操作系统由于其开放性、可 移植和多用户多任务的特性在关键系统中得到广泛应用,属于较为成熟 可靠的操作系统类型,因此系统的可靠性能够得到保障。其他的服务器 运行在Windows 2003 server平台下,能够满足用户在使用过程中界面友 好的要求、便于操作且性能稳定。
数据库管理系统(DBMS)选择Oracle作为系统的数据库支撑平台, Oracle数据库作为世界上最流行的数据库平台之一,以其优越强大的数据 库开发管理功能受到业界的青睐。系统正是建立在数据库对大容量,高 可靠性的数据存储和管理的支持之上。
本发明中的应用软件采用模块化设计,具有较好的自检自测功能, 通过自身管理保证系统可靠运行,系统提供标准的应用接口,可为新业 务的应用需求提供较好的支持。
上述声控拨号平台的主要功能是声控拨号,还包括一些辅助功能,包括信息下载、声控通讯录管理、留言管理、短信代理、事件提醒等。 下面分别进行具体的说明
1. 声控拨号
用户通过拨打特服接入号码使用此项服务,根据语音识别出联系人 姓名后,再根据数据库内存储的号码信息进行电话转接;
2. 信息下载
根据语音识别出的联系人名称,从数据库中取出联系人的相关信息, 再通过短信下载到用户手机。
3. 声控通讯录管理
声控通讯录业务以每个人的手机号码作为身份认证的依据注册后, 可以通过多种方式将联系人信息登记到系统中,使用时只需要说出通讯 录中设定好的联系人姓名即可呼叫其电话。
4. 留言管理
留言功能是注册用户预先设置留言,当主叫用户呼叫该用户时,系 统播放留言信息并以文本的形式通过手机短信息发送给主叫用户。
5. 短信代理
短信越来越成为人们生活中不可缺少的一种通信方式,但在手机上 进行中文输入却不是容易的事,用户可以使用短信发送代理功能使短信 息的发送变得快捷。
用户可以通过以下两种方式进行短信代发
通过人工坐席将信息发送到指定联系人用户打电话到人工坐席台, 告诉话务员待发信息的内容和目标用户的手机号码,接着话务员通过短 信/计费服务器实现短信息的发送。
通过Web网站进行该项操作用户通过登陆系统设置的专用的Web
网站,输入个人的服务号码以及服务密码等,选择短信发送功能,可以 发送短信到指定的手机。
6. 事件提醒
自定义事件提醒是在事件到达前自动向用户的手机发送提醒消息的
功能。包含两种形式周期性事件提醒和一次性事件提醒。周期性事件 提醒一旦定义后将保持有效,除非用户将其删除。而一次性事件提醒是 在事件发生后,该事件的设置将被系统自动清除。图3是一键式全自动语音通讯装置的内部功能模块示意图。该语 音通讯装置主要由蓝牙芯片、控制单元、回音与噪声消除电路等组成, 还包括电源模块、指示灯、麦克风和功放单元等。其中电源模块连接 蓝牙芯片。该蓝牙芯片一方面连接指示灯以显示工作状态,另一方面 连接回音与噪声消除电路。该回音与噪声消除电路分别连接麦克风和 功放单元。控制单元由单片机实现,它与蓝牙芯片连接以控制该芯片 的工作状态。该控制单元还存储全自动语音通讯系统的特服接入号码。 "一键通"键与控制单元实现电信号上的连接,以便通过该按键触发 控制单元拨打该特服接入号码。
通过上述的各个功能模块,语音通讯装置可以实现如下的基本功
能
1. 网络连接智能匹配蓝牙手机,建立稳定连接。
2. 去话呼叫 一键拨号(拨叫电信运营商提供的特服接入号码,
如1258XXX)。
3. 来话接听 一键免提通话。
4. 音量调节可调节免提通话音量大小,也可连接耳机进行隐私 通话。
5. 电源保障可使用外接(或车载)电源,也可以使用内置的可 充电池。
图4是全自动语音通讯系统的系统功能示意图。本发明将声控拨
号系统的特服接入号码捆绑到一键式全自动语音通讯装置的一个按键 上,用户只需要按此键就能进入声控拨号系统,后续拨打电话操作、 发送语音短信操作和语音搜索的操作都可以根据声控拨号系统的语音 菜单导航来自动完成。
本全自动语音通讯系统的主要功能包括一键通话、语音短信和语
音搜索等。这些功能可以通过图5所示的系统业务流程图加以实现,下 面分别加以说明。
一键通话功能是专为行车安全和舒适性而设计的。在汽车上安装一 键式全自动语音通讯装置后,车主在开车打电话和接听电话时不需要手 持电话机而分散注意力,不仅在接听来电时,用户只需轻轻按一个键可 以接听电话,特别的是在拨打电话时,直接在语音通讯装置上按一个键就以免提的方式自动进行拨号、发送语音短信或使用语音搜索功能。这 样提高了驾车的安全性和便捷性。
语音短信的主要实现步骤是(1)用户通过拨打特服接入号码进入 系统;(2)系统验证用户资料合格后对用户进行语音导航,用户根据语 音提示录制一段语音后挂机;(3)系统呼叫被叫,如果接通则播放语音 短信;如果没接通,则发送短信给被叫提示拨打某号码听短信。语音短 信还支持回复、转发、群发功能,方便进行群体内的信息的通报、告知。
语音搜索是当用户拨打特服接入号码如1258XXX进入系统,系统验
证用户资料合格后对用户进行语音导航,根据语音提示,用户说出要搜 索内容的关键字,系统在数据库中査找匹配的信息,如果匹配成功,则 向用户逐条反馈匹配信息。
以上对本发明所述的全自动语音通讯系统进行了详细的说明。对本 领域的一般技术人员而言,在不背离本发明实质精神的前提下对它所做 的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应 的法律责任。
权利要求
1. 一种全自动语音通讯系统,其特征在于所述全自动语音通讯系统包括一个声控拨号平台和至少一个一键式全自动语音通讯装置;所述声控拨号平台位于通信运营商处,所述一键式全自动语音通讯装置分布在各个用户之中,所述声控拨号平台和所述一键式全自动语音通讯装置通过电信网络实现信息交互;所述声控拨号平台包括互动式语音搜索设备、自动语音识别服务器、数据库服务器、Web服务器、短信/计费服务器、坐席服务器,所述互动式语音搜索设备连接通信运营商处的交换机,所述Web服务器连接通信运营商处的业务支撑运营系统,所述短信/计费服务器连接通信运营商处的短信网关。
2. 如权利要求1所述的全自动语音通讯系统,其特征在于所述互动式语音搜索设备分别连接所述自动语音识别服务器、短信/计费服务器和数据库服务器,所述短信/计费服务器连接所述数据库服务器,所述数据库服务器分别连接所述Web服务器和所述坐席服务器。
3. 如权利要求1所述的全自动语音通讯系统,其特征在于所述互动式语音搜索设备具有音频数据处理模块、其它数据处理模块、信令处理模块和TCP/IP网络通讯模块。
4. 如权利要求1所述的全自动语音通讯系统,其特征在于所述自动语音识别服务器具有语音识别模块和语音合成模块。
5. 如权利要求1所述的全自动语音通讯系统,其特征在于所述短信/计费服务器具有短信网络模块和计费模块,其中所述短信网络模块通过短信网关接口与移动运营商的短消息中心相连接,所述计费模块通过计费接口与计费账务系统相连接。
6. 如权利要求3 5中任意一项所述的全自动语音通讯系统,其特征在于所述音频数据处理模块分别连接所述语音识别模块和所述语音合成模块,所述其它数据处理模块分别连接所述短信/计费服务器和所述数据库服务器。
7. 如权利要求1所述的全自动语音通讯系统,其特征在于所述一键式全自动语音通讯装置包括蓝牙芯片、控制单元、回音与噪声消除电路、电源模块、麦克风和功放单元,其中所述电源模块连接所述蓝牙芯片,所述蓝牙芯片连接所述回音与噪声消除电路,所述回音与噪声消除电路分别连接所述麦克风和功放单元,所述控制单元与所述蓝牙芯片连接。
8. 如权利要求7所述的全自动语音通讯系统,其特征在于所述一键式全自动语音通讯装置包括至少一个按键,所述按键与所述控制单元连接,以便通过该按键触发所述控制单元拨打预置的特服接入号码。
全文摘要
本发明公开了一种全自动语音通讯系统,该系统包括一个声控拨号平台和至少一个一键式全自动语音通讯装置。其中,声控拨号平台位于通信运营商处,一键式全自动语音通讯装置分布在各个用户之中,它们之间通过电信网络实现信息交互。声控拨号平台包括IVS设备、ASR服务器、数据库服务器、Web服务器、短信/计费服务器、坐席服务器等,可以让用户以一键拨号方式轻松地实现语音拨号、发送语音短信和进行语音搜索等多项功能。
文档编号H04M1/247GK101547264SQ200810084248
公开日2009年9月30日 申请日期2008年3月27日 优先权日2008年3月27日
发明者丁言波, 沛 王 申请人:广州市易风通讯科技有限公司