面向车联网的智能语音网应用及其实现方法

文档序号:2825447阅读:473来源:国知局
面向车联网的智能语音网应用及其实现方法
【专利摘要】本发明是面向车联网的一种创造性的语音网技术及其应用,该语音网是一个基于语音的互联网络,可以让汽车驾驶员在驾驶过程中以语音的方式进行电话呼叫、获取车况信息、与调度中心信息交互,以及获取各种生活信息与资讯,如交通信息、个人资讯、信息搜索等服务,解放了驾驶员的双手和双眼,可以让汽车驾驶员安全的驾驶,避免事故的发生。同时能够让驾驶员获得更多的信息与业务开展,为车联网的发展与扩展,提供了强有力的支撑与推动。本发明具有多项技术创新和应用创新等特性。
【专利说明】面向车联网的智能语音网应用及其实现方法
【技术领域】
[0001]本发明是属于新一代信息【技术领域】,主要涉及到物联网、移动互联网、语音识别及网络通讯、数据库等技术,具体为面向车联网而建立的一种智能化的语音互联网络,能够让车辆驾驶员通过语音对话的方式可以实现电话呼叫和转接、行驶操控与信息获取、生活、娱乐等各种信息的查询服务等。
【背景技术】
[0002]车联网是物联网在汽车领域的一个细分应用,是移动互联网、物联网向业务实质和纵深发展的必经之路,是未来信息通信、环保、节能、安全等发展的融合性技术。车联网是指车与车、车与路、车与人、车与传感设备等交互,实现车辆与公众网络通信的动态移动通信系统。它可以通过车与车、车与人、车与路互联互通实现信息共享,收集车辆、道路和环境的信息,并在信息网络平台上对多源采集的信息进行加工、计算、共享和安全发布,根据不同的功能需求对车辆进行有效的引导与监管,以及提供专业的多媒体与移动互联网应用服务。
[0003]车联网主要功能以行车安全与车辆保全为主,基本可总结为:卫星定位、道路救援、汽车防窃、自动防撞系统、车况掌握、个性化资讯接收、多媒体娱乐资讯接收。车联网的服务可分为三种基本类型,即交通信息与导航服务、安全驾驶与车辆保护服务,以及故障诊断的车辆维护、娱乐及通信服务。
[0004]语音(讲话)是最为方便、快捷、自然的人际交流手段,采用自然语音作为人与计算机交互的手段,使计算机能像人一样,具有听、说和理解的能力,是智能语音技术应用发展的基础。在其中所需的各种技术中,以语音识别技术最具挑战性,因而被国外众多媒体和专家评为21世纪前十年将对人类生活方式产生重大影响的十大科技进展之一。语音识别技术在国外研究得比较早,美国早在50年代就已经开始研究语音识别技术,最早以国防部军方以国防应用为研究目的,后来发展主要以MIT、IBM、NUANCE等研究机构与企业为代表,拥有专业的研发团队和自主知识产权。语音识别技术相当复杂,包括了声学、语言学、数字信号处理、统计模式、概率论和信息论、发声机理和听觉机理、人工智能等多学科技术的一项综合性技术,研究所投入的人力、物力等非常大,所需时间相对也比较长。直到进入90年代,语音识别技术逐渐开始了商业应用,起初主要应用于电信、金融等行业,如美国电信运营商Sprint公司的语音助理、美洲银行的语音银行等,随着智能手机等移动终端和通信网络的发展,应用也开始越来越普遍。经过近二十年的发展,已经形成了一定规模的应用市场。
[0005]网络俯拾即是,电话无处不在。如果把两种网络结合起来,就形成了另外一种大型网络:语音网。到底什么是语音网?它其实是一种基于语音的互联网络,通过它,用户可从任何一个具有语音功能的终端(手机、IPAD等)获取基于互联网的信息、开展电子商务以及获得个人通信服务。使用语音网,不但可以拨打电话,还可以在一次连续的通话过程中获取互联网上的有关内容。目前,在信息的收集和从事商务活动过程中,言语交流仍然是最常用、最有效的途径之一。随着计算机处理及语音算法的飞速发展,基于电话的语音识别系统现在已经能够理解正常的语言交流。近年来伴随着3G等移动互联网络的发展,网络的带宽不仅能够保证文本数据等信息的传输,语音与视频的传输也得到了保证,这为语音网的成功推出,奠定了基础。
[0006]本发明是在车联网基础上,开发了一套智能的语音网络系统(以下简称:语音网),语音网融合了到了云计算、移动网络通信、呼叫控制、语音识别及文本合成、HTTP、数据库等技术,可让汽车驾驶员在汽车驾驶过程中通过说话方式,进行汽车操控、打电话以及获取各种信息等,其中所获得的信息可以是语音播报的方式,从而解放了汽车驾驶员双手和双眼,可以让汽车驾驶员安全的驾驶,避免事故的发生。本发明用多项技术创新,分别描述如下。
[0007]云计算技术:
语音网的结构体系是基于云计算,主要包括云端的语音及应用服务技术平台,以及车载终端的客户端软件模块。云端的语音平台融合了多项技术,软件结构与系统结构有多项创新,主要功能包括接收来自车载终端的用户语音请求,并进行语音识别处理,根据识别结果,获取相关的信息或调用相关的指令,发送给车载终端,实现车载终端与平台的实时通讯和信息互动,满足汽车驾驶员在驾驶过程中的各种需求。
[0008]移动网络通信技术:
目前主要的移动通信网络为3G和WLAN,而车联网的网络层主要承载于移动运营商的3G网络之上,语音网也是同样基于3G和WLAN网络,实现云端平台和车载终端的语音和信息的传递。其中语音一般采用一定的压缩技术,以占用少量的网络带宽,确保语音的流畅。
[0009]呼叫控制技术:
车载终端与云端平台建立通讯后,可实现一些呼叫功能,例如电话转接,呼叫等待等,而云端平台具有呼叫中心特性,实现语音交互、转接人工坐席等功能。
[0010]语音识别与文本合成技术:
本发明的顺利实现和应用,除了车联网相关技术的发展成熟外,语音识别技术的成熟,也是为语音网的实现打下了基础。语音识别技术相对比较复杂,但经过几十年的研究,近年来已有了突破性的发展,语音识别技术在很多环节已经很成熟,如关键字识别、长短句识另IJ、大容量识别等,可以达到了商用的程度,近年来更是很多领域得到了广泛的应用,如电话银行、通讯助理、智能家电等。而文本合成技术,能够将文本信息,合成语音,播报给用户,如驾驶过程中的驾驶员。
[0011]HTTP 技术:
HTTP是基于浏览器的超文本传输协议,而本发明云端语音技术平台应用了 HTTP技术,通过HTTP调用应用程序以及获取互联网信息,而各种应用程序,就可以是一个个网页,从而语音网上各种内容,都可以通过网页开发来获取。
[0012]数据库技术:
语音网上的各种信息,都是存放于数据库,目前主流的Oracle、SQL Server、MySQL都支持,除了对大容量数据存储的需求外,还可根据不同业务类型实现实时动态数据存储。

【发明内容】

[0013]本发明是面向车联网而创建了语音网及其应用,其目标是通过以语音识别技术为核心建立一个信息网络,汽车驾驶员在驾驶过程中可通过语音对话方式来实现电话、车辆控制、随时获取各种信息等。本发明的
【发明内容】
主要包括语音网的体系结构、语音网的系统软件结构、语音网的应用模式等,下面分别给予说明描述。
[0014]【专利附图】

【附图说明】:
图1是语音网的体系结构图;图2是语音网的系统软件结构图;图3是语音网的应用模式图。
[0015]语音网的体系结构:
语音网是类似于互联网的一种系统和应用网络,但又有不同于互联网的独特性,其体系结构如图1所示。在语音网上,各种内容和服务将会以两种方式出现——即语音站点和语音入口。语音入口和语音站点都属于语音网络上的节点,这两者由一个标准的语音浏览器连接起来。而车载终端通过移动网络(3G、WLAN等)与语音入口和语音站点建立语音通道和数据通道,获取各种信息。其中:
语音入口是将服务(如车况、电话、调度等服务)和基于互联网的内容(交通、餐饮、旅游等)搜集起来。安装于车载终端的客户端软件通过一个专用的基于移动网络的连接代码,呼叫者(汽车驾驶员)可以进入连接到语音入口服务上。
[0016]语音站点是语音网上的节点,它包括可以使用语音服务的企业或电子商务应用程序以及语音商务服务等。
[0017]车载终端安装客户端软件,该软件一方面实现与语音入口和语音站点实现通讯夕卜,另一方面还将与车载终端其它软件和控制系统保持通信连接,根据业务要求发布和传递相关指令信息,如获取发动机各种信息等。
[0018]语音网体系结构的主要创新点和优点在于:
1、分别由车载终端、语音入口、语音站点等组成语音网的节点式结构,可以充分利用现有的通信网络和互联网资源,减少语音网系统建设投入和充分获取现有的服务及内容等资源,使语音网更容易部署和得以业务开展;
2、瘦身的车载终端客户端软件。在现有的车载终端只需安装客户端软件,以及一个授权号码,就可以使用车联网的服务,而该客户端主要用来收发语音和反馈信息,以及通过相关接口与车载系统实时通信,而大量的数据处理、算法等处理,如语音识别、搜索等,都由语音入口等云端平台来实现,可节省车载终端的资源占用,从而易于与现有所有类型的车载终端整合,易于业务的开展和部署。
[0019]语音网的系统软件结构:
语音网的实现是基于软件技术的,其云端平台系统软件结构如图2所示。平台系统软件结构有多项创新,其设计原则如下:
1、平台在设计时,充分考虑了通信网络的发展趋势,除了具有智能网的设计思想外,更多的融合了 NGN下一代通信网络的技术特点,完全符合通信发展的趋势,能够充分利用运营商的各种通信资源,方便快速灵活地建立各项语音业务;
2、平台作为先进的智能语音应用服务平台,集成了计算机技术、NGN软交换技术、语音识别与合成技术、网络通讯技术、数据库技术等,并采用了国际标准的VoiceXML作为业务逻辑控制,可实现包括NGN业务以及各种基于智能语音业务的应用;
3、平台实现业务逻辑与呼叫控制相分离的系统架构设计,不仅有利于平台可集成多种业务,纯软件架构设计,同时也节省系统的投入和开发资源;
4、平台拥有良好的开放性与兼容性,支持H.323和SIP协议,可以直接与运营商的NGN软交换平台对接,也可以通过TGW与运营商的交换机El线路联接;
5、采用国际标准的VoiceXML语音标记扩展语言,作为业务控制流程,使建立各种业务,就像写网页一样方便快捷。另外,只要符合Voice XML标准的业务,均可以运行在平台上;
6、平台符合电信设计的技术规范要求,只要硬件稳定,就能够保证系统每天24小时不间断运行,而且不管业务的新增或修改,都不需要重启系统。
[0020]语音网的系统软件结构如图2所示。系统软件采用分层结构,从下至上分别为接入层、呼叫控制层、会话层、语音浏览层和业务流程控制层,另外通过TCP/IP方式与各种外部服务或第三方产品保持通信。现分别介绍如下:
接入层:
接入层包括平台对接模块与终端用户接入模块,平台接入模块支持H.323协议和SIP协议;终端用户接入模块支持SIP类型的终端注册到平台上;
呼叫控制层:
呼叫控制层实现呼入呼出、呼叫状态分析、电话转接、录放音、接收DTMF、转接坐席等各种与呼叫相关的功能;
会话层:
会话层主要实现用户与系统的对话过程,包括媒体处理、语音识别声音采样、文本合成媒体输出等功能,以及与语音识别服务、文本合成服务的接口和交互处理;
语音浏览层:
语音浏览层主要实现Voice XML的流程脚本解析功能,根据来自业务流程控制层的业务请求,控制着用户的业务流程;
业务流程控制层:
业务流程控制层接收来自应用服务器的业务请求,经过判断分析,将该业务请求交付给语音浏览层处理;
外部接口模块:
外部接口模块主要包括应用服务器(包括数据库服务器和Web服务器)、语音识别服务器、文本合成服务器、媒体服务器、内容服务器、人工坐席、IP终端、管理和维护终端等。
[0021]这种分层次的系统软件结构,具体实现的软件模块也是分布式的,这些模块可以运行在同一台服务器上,也可以分别运行在不同的服务器上,随着业务量的增加,可增加相应的硬件和软件即可,既能节省资源的利用,又容易多项业务的部署。运行上也有稳定性的保障,即使某一台服务器出现故障,系统会该也无自动转移到其它服务器上来处理。
[0022]语音网的应用模式:
因为语音网的创新性的软件结构,能够让语音网的应用灵活性与多种业务的集成能力,如面向具体行业,出租车公司、物流公司、客运公司等,开展业务管理等;也可以面向是驾车等大众用户,提供个人信息管理、路况查询、餐饮预定、旅游咨询等生活信息。语音网的应用模式如图3所示。图3展示了语音网之节点车载终端、语音入口、应用服务和语音站点的网络关系,以及可获取的服务和站点内容。[0023]整个语音网应用产业链可包括平台服务商、应用服务商、内容服务商和终端用户。
[0024]其中平台服务商负责系统平台的搭建、运行与维护;
应用服务商可以是行业应用服务提供商,如出租车公司、物流公司、客运公司等;
语音网中的语音站点可以是内容提供商,如餐饮公司、旅游公司等;
终端用户可以是应用服务提供商的用户,如物流公司驾驶员,也可以众多个人用户,如私家车主等。
[0025]车联网的应用模式具有新颖性,并且带动了多项产业的发展和融合,其应用不仅能够为企业带来了效率和良好的经济效益,也会带来显著的社会效益。
【权利要求】
1.一种面向车联网的智能语音网应用及其实现方法,其特征是:该语音网是一个基于语音的互联网络,可以让汽车驾驶员在驾驶过程中以语音的方式进行电话呼叫、获取车况信息、与调度中心信息交互,以及获取各种生活信息与资讯,解放了驾驶员的双手和双眼。
2.根据权利要求1所述的面向车联网的智能语音网应用及其实现方法,其特征是:语音网的体系结构,包括车载终端、语音入口和语音站点。
3.根据权利要求1所述的面向车联网的智能语音网应用及其实现方法,其特征是:语音网的软件结构,包括分层次的模块化软件结构。
4.根据权利要求1所述的面向车联网的智能语音网应用及其实现方法,其特征是:语音网的应用模式,其应用产业链可包括平台服务商、应用服务商、内容服务商和终端用户。
【文档编号】G10L15/26GK103680502SQ201210315101
【公开日】2014年3月26日 申请日期:2012年8月30日 优先权日:2012年8月30日
【发明者】简相超, 余金环, 陈洪林 申请人:上海语联信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1