无线通信呼叫中的一键通语音缓存系统和方法

文档序号:7949184阅读:157来源:国知局
专利名称:无线通信呼叫中的一键通语音缓存系统和方法
技术领域
本发明一般涉及无线通信,尤其涉及在无线通信中进行语音缓存的系统和方法。
背景技术
使用无线通信装置的用户要求越来越短的接通时间,其目标是即时连通。PTT(Push to Talk,一键通)通信是减少在无线通信中延迟的一种方法,尤其在例如便携式电话(cellular phone)(也就是公知的蜂窝式便携移动电话)进行通信的蜂窝式通信中。在PTT通信中,用户仅仅需要按动移动电话的按钮,就可以通过移动电话与其它人连接。而其它人不必听到响铃或甚至不应答该蜂窝电话。换而言之,移动电话可以配置成不需要接收方任何介入就能实现自动连接。在2004年7月30日由MurtuzaChhatriwala和Joseph Giacalone递交的案卷(Atty.Doc.)号为UTL 00442、题为“呼叫处理系统和方法(CALL PROCESSING SYSTEM ANDMETHOD)”的美国专利申请中进一步描述了PTT系统,该申请通过引用并入本文。
PTT通信一般比标准的移动电话通信要更为快速。但是,很多PTT用户还是想要更短暂的呼叫建立时间。虽然呼叫建立时间在5秒和20秒之间或更多一点,但是发起PTT会话和发起者被允许开始通话之间的延迟使得使用PTT无线通信装置的用户感到很不舒服。
在基于IP的语音的(VOIP)PTT系统中,通过在等待建立呼叫时将音频数据(如语音)暂存在缓存器中来解决上述问题。在基于语音信道的语音中(voice over voice channel,VOVC)进行缓冲存在的问题在于,在完成建立VOVC呼叫时,会发出命令来初始化无线通信装置上的音码器(vocoder)。在VOIP系统中之所以能够顺利地进行语音缓冲,除了其它原因之外,就是因为数据呼叫的建立并不会触发音码器的初始化。
VOVC中的缓存还存在与接收来电消息(例如,其它PTT呼叫和普通语音呼叫)有关的其它问题。VOIP呼叫中的缓存能顺利进行的原因在于,普通VOIP呼叫不允许例如其它PTT呼叫和普通语音呼叫的来电呼叫。因此,能够顺利地在VOIP呼叫中进行语音缓冲,而不存在其它来电消息(例如,其它PTT呼叫和普通语音呼叫)带来的问题。

发明内容
为了避免产生与VOVC PTT呼叫相关联的问题,对VOVC PTT呼叫提供语音缓存。在VOVC呼叫建立之前,开始进行缓存。在VOVC呼叫建立之前,PTT用户就能开始进行交谈。
本发明的其它方面、优点和新颖的特征在参照附图进行详细描述后变得显而易见。


在本文中所教导的本发明的实施方式是通过附图所示的实施例(但并非用于限制)的方式进行说明的,其中,图1示出了说明呼叫建立、音频缓存和传输事件的相关时序框图;图2示出了说明呼叫建立、音频缓存和传输事件的相关时序框图;图3示出了说明试图建立呼叫事件和音频缓存事件的相关时序框图;图4示出了能存储缓存的用于VOVC PTT呼叫通信的音频信息的无线通信装置的框图;以及图5示出了用于传送和接收缓存的VOVC PTT呼叫的音频的无线通信系统的框图。
具体实施例方式
图1示出了说明呼叫建立、音频缓存以及传输事件的相关时序框图,其中,即使在VOVC PTT呼叫中缓存的音频也能够被无线通信装置传输。无线通信装置(也公知为手持装置)可以例如为便携式电话(也公知为移动电话)。箭头105代表时间105。PTT起始动作(origination action)100可以为在时序开始时(如箭头108所示)用户按动PTT按钮。响应于起始动作100,移动电话(将在后面参照图4进行描述)发送起始消息170。箭头125代表起始消息170通过无线电方式正在被发送至如后面参照图5所描述的无线通信网络。
在时间125,如后面参照图5所描述的那样,无线通信网络开始建立与移动电话的无线通信连接。建立无线通信连接通常需要5到10秒的时间。这个延迟使用户感到不满,尤其是那些为了连接速度而选择了PTT通信的用户。与其它移动电话相比,PTT装置具有的主要优点是,另一端的一方不必在听到响铃后,通过按发送按钮或者“OK”来建立通信连接,因此通常建立PTT连接较快。事实上,PTT连接是自动的。因此,如按动PTT按钮的PTT命令100和告知用户可以进行交谈的啁啾(chirp)之间的5或10秒的延迟通常太长了。而有利的是,如下面进一步描述的那样,用户能够在按动PTT按钮后立即开始说话,或者在某些合适的延迟例如一秒钟后开始说话。
在图1中或者以下的任意一个图中,没有标出时间的刻度大小,而是将时间显示为描述事件的相对顺序。例如,起始消息170显示在PTT起始事件100之后,用以指示PTT起始事件170在PTT起始动作100之后发生。无线通信装置基于其时隙周期指数(slot cycle index,SCI)发出起始事件。SCI可以设置为0,表示使用了1.28秒的最短的时隙周期。即,将需要大约1.28秒来发送该起始事件。这个起始事件一般是在PTT起始动作后的200ms至800ms这段时间内发送。基站和该无线通信装置同步,且无线通信装置分配有能发送的时隙。当SCI=0时,无线通信装置每1.28秒获得一次时隙。由此,用于发送起始事件的时间将达1.28秒。
一些事件在隔开几微秒后立刻发生,而另一些事件是在隔开几毫秒后立刻发生。还有一些事件是在隔开几秒后发生的。由于相对时间差之间的较大不等,因此不便将时间以比例方式显示。
有利的是,在起始170后的大约1秒钟,移动电话指示用户可以开始进行PTT呼叫的交谈,例如播放啁啾(chirp)命令102所示的那样。通常在PTT通信中,通过制造类似于啁啾声样(chirp-like)的声音,手持装置向用户指示可以开始说话了。任何合适的指示类型能用来替换啁啾音。箭头112指示播放啁啾音。由于用户是在按动PTT按钮大约1秒后,而不是5至10秒后听到这种啁啾音的,因此避免了用户的不满。在按下PTT按钮和啁啾音之间的一秒钟的延迟是可以配置的。这个延迟能被指定为包括0秒在内的任何合适的时间。
在(或大约在)播放啁啾音112时,移动电话向音码器(图中未示出)发送命令172,使其启动,并开始将音频信息记录在存储器中(图中未示出)。记录的信息被存储在存储器中用以以后传输。如箭头130所示,启动音码器,并且在存储器中存储被记录的音频。在存储器中存储信息被称为缓存或记录。记录或缓存包括通过传感器例如麦克风来捕获信息,并将该信息存储在存储器中。换而言之,移动电话缓存音频信息,用以在稍后时间传送该音频信息。在曲线153所指示的时间中,缓存音频信息。在开始播放啁啾之前,音码器也能被立刻启动。因此,在这种情况下,箭头130将在箭头112之前。
在通过无线通信网络建立呼叫后,网络向移动电话发送服务连接信息104。如箭头116所示,移动电话接收服务连接信息104。如上所述,该过程通常将会在起始消息170被发送后的大约5至10秒后发生。有利的是,音频输入已经被缓存了大约4至9秒钟。
在此时,移动电话可将缓存的音频传输给网络。但是,除了无线通信网络建立呼叫所需要的时间之外,PTT服务器还需要一定延迟来建立该呼叫。因此,移动电话可以等待一段时间(例如4秒多钟),直到进行传输缓存的音频,如传输缓存的音频的命令174所示的那样。缓存的音频的传输由箭头135表示。在手持装置是漫游的情况下,该传输可被延迟,直到在箭头120所示的传输缓存的音频(漫游)命令106。这个动作大约为在116处接收到服务连接消息104后的约7秒后发生。服务连接信息104和传输缓存的音频命令174或106之间的延迟是可配置的。如曲线156所示的,缓存的音频被连续传输,直到缓存器为空。
从时间段153和156的重叠部分可以看出,移动电话可以在传输存储在缓冲器中的最旧的音频信息的同时缓存新的音频信息。因此,循环缓存被应用来传输任何时期的音频信息。如果出现了很长的起始音频会话,缓冲器将连续循环,即,沿着缓冲器反复记录,而仅播放该记录之前的缓存的音频会话。因此,可能需要二十秒循环的缓存器。
在某个时间,用户释放PTT按钮,或者终止PTT呼叫。呼叫终止176或按钮释放176在箭头140所示。这就确定了传输的呼叫起始音频信息的长度。如椭圆159所示,音频信息的传输可以再持续一段时间,并且在较后的时间被终止(未示出)。周期长度156可以与周期长度153相同。
在呼叫发起者释放底层(floor)后,呼叫还可以持续一段时间。其它用户在呼叫过程中可以响应或不响应。在释放呼叫后,如果或当底层还可用时,发起者可以开始再次交谈。这个过程可以通过再次按下PTT按钮来完成。在此时(未示出),音频信息将会被再次捕获,并如图4所示和描述的那样,被编解码器(CODEC)数字化,并且也如图4所示和描述的那样,被音码器压缩用来传输。
图2示出了说明呼叫建立事件、音频缓存事件和传输事件的相关时序框图,其中即使在VOVC PTT呼叫中,缓存的音频能被无线通信装置传输。除了按钮释放的时间178被改变了之外,图2与图1相似。在图2中,用户在服务连接信息104之前,就释放PTT按钮。在这种情况下,缓存的音频的持续时间162非常短。且在这种情况下,仍然在时间段165中的箭头135或120所指示的时间以无线电方式传输缓存的音频。另外,按钮释放可以在箭头116和135之间发生,或者甚至在箭头135和120之间发生。在箭头116和135之间的持续时间是可配置的,就像箭头116和120之间的持续时间一样。
参照图3现将描述另外一种情况。图3示出了说明试图建立呼叫事件、音频缓存事件的相关时序框图。在图3所示的情况中,呼叫建立失败。如事件195所示的那样,在时间200定时器超时。如果定时器超时,如事件210所示的那样在箭头205指示的时间呼叫被终止。音频信息在箭头130开始被缓存,直到箭头200。在定时器超时的时间200,或者在呼叫被终止的时间205,缓存器为空。定时器超时事件195可以通过缓存器为满而被触发,而不是真的定时器超时。换而言之,独立的定时器是不必要的。可以为缓存器指定一定的存储空间。当缓存器为满时,定时器的时间就超时。
图4示出了说明了能存储在VOVC PTT呼叫中用于通信的缓存的音频信息的无线通信装置210的框图。无线通信装置210可以为移动电话210。
处理器232为移动电话210处理信息。处理器232与收发器306相连接,用以调制和解调无线通信信号。天线312与收发器相连接,用以以无线电方式传输无线通信信号。电源(图中未示出)也与处理器232和收发器306相连接,用以向处理器232和收发器306提供电源。
处理器232可包括通用的处理器模块或专用处理器模块。例如,处理器可包括用于执行快速傅立叶变换(FFT)的专用电路。在处理器内部还示出了其它几个功能。所示的一些功能可以以在处理器232上运行的软件的方式来实施,而一些功能可以以专用电路方式来实施。而且,一个以上的处理器(图中未示出)可被用来实施所示功能。更进一步地,可包括不同类型的处理器,例如RISC处理器、ARM处理器、现场可编程逻辑门阵列和其它任何合适的处理器。还可使用一个或多个处理器与分离部件(例如运算放大器、电容器和感应器)的组合。应当理解,处理器232可包括任何适宜类型的处理器和相关电路。
处理器232还与音频用户界面装置303、其它用户界面装置228和存储器309相连接。音频用户界面装置303包括麦克风295和扬声器300。其它用户界面装置228包括按键界面220(在图4中被指定为键盘)和显示器224(在图4中被指定为液晶显示器(LCD))。
用户界面模块242主要控制用户在显示器224上所见的内容,并且处理用户通过键盘220输入的信息。键盘220包括PTT按钮(没有分开示出)。PTT按钮可以设置在与主键盘不同的界面上,但是PTT按钮仍将被认为是键盘的一部分。进一步,PTT起始事件100(图1所示的)可以是按动PTT按钮和其它按钮的一些组合按压而产生的。例如,从由UI软件模块236显示在显示器224上的菜单中选择出一些第三方联系列表信息后,PTT起始事件可以是按动PTT按钮。更进一步地,PTT起始事件可以是语音识别事件的结果。PTT起始事件的其它可选方式在此不再描述。而手持装置驱动器236在UI软件242和其它UI装置228之间起到接口作用。
UI软件242分别与呼叫管理器275和状态机246连接。响应于PTT起始事件100,UI软件242发送消息告知呼叫管理器275应当开始呼叫。PTT客户端270位于处理器232上,并且管理移动电话270的PTT呼叫。呼叫管理器275传送消息给主控任务280来发起语音呼叫。主控任务280使发送和接收模块285将语音呼叫起始请求发送给收发器306。接着收发器306调制该请求,使得该请求通过天线312以无线电方式传送出去。
在发起请求之时,UI软件242可选地启动定时器(未示),并且可能在定时器终止一秒钟后,使状态机246经过编解码器265在扬声器300上播放啁啾音。可选地,在接收到PTT起始动作100后立刻播放啁啾音。编解码器265将来自麦克风的音频信号量化和数字化,并将来自状态机246的数字信号转换为模拟信号用来在麦克风295上播放。
大约与扬声器300上播放啁啾音(如图1描述的那样)同一时间,UI软件242向状态机246发送命令,来初始化音码器260,并开始记录(缓存)声音即音频。音码器置于数字信号处理(DSP)硬件上,并且执行用于压缩数字语音音频数据,以在有限带宽的通信信道上进行传输的算法。鉴于许多任务都要使用音码器,首先必须获得音码器260。因此,状态机246首先告知与DSP硬件255和状态机246相连的DSP驱动器250,来将音码器图像(vocoder image)315装载进DSP硬件255,从而使用一部分DSP硬件作为音码器260。
音码器图像315可以被存储在存储器309中。具有能够使DSP 255以不同方式工作的几个图像。例如,语音识别引擎(未示出)将一个DSP图像装载进DSP硬件255中,而声音软件模块(未示出)将不同的DSP图像装载进DSP硬件255中。如上所述的那样,音码器图像315被装载进DSP硬件用来记录声音。有利的是,音码器图像315可以是与语音呼叫使用的图像相同。如在后将会描述的那样,这种情况下有助于防止音频短脉冲波形干扰(audio glitch),例如当接收到语音呼叫连接消息时,出现的噼啪声和爆裂声。
状态机246请求DSP驱动器250来将音频信息存储在DSP驱动器的内部存储器290中,用以缓存来自麦克风295的该音频信息。内部存储器290被示出为位于DSP驱动器250的外部。出于速度方面的考虑,存储器290是处于处理器232的内部。但在一些情况下,也有可能在外部存储器309中缓存音频信息。
DSP驱动器250每20ms从DSP硬件255接收语音记录中断。语音记录中断指示可存储(缓存)语音数据(数据包)292的20ms的记录。状态机246使DSP驱动器250将语音包292存储在内部存储器290中。
参见图1、2、3和4,状态机246在缓存时间周期153(图1)、162(图2)和215(图3)中每20ms接收语音包中断消息。在时间周期153、162和215中,状态机246使DSP驱动器250将语音包292存储在内部存储器290中。
在服务连接消息104的时间(参见图1和图2),呼叫管理器275使UI软件242通过状态机246发送消息,来获得和配置音码器260,以响应服务连接消息104连接语音呼叫。有利地,音码器260已经被配置用于语音记录,即语音记录的音码器图像315已经被装载进音码器中。有利地,语音记录图像315与用于语音呼叫的图像相同。
可选地,用来配置音码器260的消息能被状态机246截取。音码器246可以设置用于指示音频数据已正在被缓存,以及音码器260不应通过重载音码器图像315而被重新初始化的标记。重载音码器图像315将会使缓存的音频中出现音频短脉冲波形干扰。在这种情况下,接收缓存的音频将可能听到讨厌的刮擦声。
在服务连接消息104之后和在传送音频135或120之前的这段时期内,状态机246告知接收和发送模块285没有待发送的音频信息(也公知为语音数据或语音信息)。这个过程是在EVRC(enhanced variable rate codec,增强型可变速率编解码器)系统中通过封装1/8速率(one eighth rate)语音包248,并将该1/8速率语音包248发送给接收和发送模块285来完成的。因此,在EVRC系统中,在该时间周期(一般为4秒)中将会发送1/8速率数据来保存网络资源。
一旦开始语音包292的传输,状态机246每20ms从接收和发送模块285接收语音传输中断。并且响应于该语音传输中断,状态机246使DSP驱动器250将一个语音包传送给接收和发送模块285。参见图1和图2,这个过程在时间周期156和165中发生。
因此,如图1所描述的那样,通过每20ms记录的语音包中断和每20ms的传输语音包中断来进行循环的缓存。通过音码器260的请求,DSP硬件255发出记录的语音包中断,该中断被DSP驱动器250接收。接着响应记录的语音包中断,DSP驱动器246将语音包292存储在内部存储器290中。而接收和发送模块285发出传输语音包中断。响应于该传输语音包中断(也被称之为语音信道中断)状态机246驱使DSP驱动器250从内部存储器290中获得语音包292。接着状态机246将获得的数据包292传送给接收和传输模块285,以便通过收发器306和天线312以无线电方式传输该数据包。
图5示出了用于传送和接收缓存的VOVC PTT呼叫中的音频的无线通信系统320的框图。无线通信装置210以无线电方式将信号传送给基站330。该基站330与无线通信网络380相连接。无线通信网络380可包括例如移动交换中心(未示出)和网络运营商必须用来管理移动通信的其它系统(未示出)。
无线通信网络可以是任何一种具有数字语音信道的数字无线通信网络。举例来说,无线通信网络可以为遵守通信工业协会和电子工业协会标准的IS-2000系列(TIA/EIA-IS-2000)的码分多址(CDMA)网络。另一个例子,无线通信网络可为遵守全球移动通信系统(GSM)联盟的GSM标准的GSM网络。也能为其它类型的数字无线通信网络。
无线通信网络380与在图中被显示为互联网云图340的互联网340相连接。PTT服务器350在互联网340中。并且PTT服务器350向无线通信装置210和其它无线通信装置(未示出)提供PTT服务。如图1-4所描述的那样,无线通信装置210将PTT起始消息170传送给网络380。接着网络380将该PTT起始消息170发送给PTT服务器350。PTT服务器350通过试图建立与其它PTT用户(未示出)的PTT连接来响应该PTT起始消息。PTT服务器350为其它PTT用户存储呈现信息(presence information)370。基于该呈现信息370,PTT服务器350可与其它一个用户或多个用户建立PTT会话。
有利的是,使用无线通信装置210的用户不用非得等待PTT服务器350与其它一个或多个用户建立起了PTT会话。参见图1-3,如播放啁啾命令102和起始音码器命令所示的那样,在PTT会话被建立起来之前,用户就能开始说话。
进一步地,由于已经示出和描述了本发明的实施方式和实现,因此,很明显,更多的实施方式和实现属于本发明的范围。总而言之,除了权利要求和他们的等同之外,并不限制本发明。
权利要求
1.一种处理无线通信音频信息的方法,包括以下步骤接收语音信道一键通请求;记录第一音频信息;接收语音信道呼叫连接消息;以及在语音信道上传输所述第一音频信息。
2.根据权利要求1所述的方法,还包括在所述接收语音信道呼叫连接消息的步骤之前选择第一数字信号处理图像。
3.根据权利要求2所述的方法,还包括响应于所述接收语音信道呼叫连接消息的步骤,识别第二数字信号处理图像,并产生所述第二数字信号处理图像的标识。
4.根据权利要求3所述的方法,其中所述第二数字信号处理图像与所述第一数字信号处理图像相同。
5.根据权利要求3所述的方法,还包括在所述接收语音信道呼叫连接消息的步骤之后,通过使用所述第一数字信号处理图像来记录第二音频信息。
6.根据权利要求3所述的方法,还包括以下步骤存储用于指示所述第一音频信息正在被记录的指示;截取所述第二数字信号处理图像的标识;保留所述第一数字信号处理图像;以及在截取所述第二数字信号处理图像的标识的步骤之后,通过使用所述第一数字信号处理图像来记录第二音频信息。
7.根据权利要求2所述的方法,其中,所述选择的步骤包括选择增强性可变比例编解码器图像;以及所述记录的步骤包括以增强型可变比例编解码器格式记录所述音频信息。
8.根据权利要求1所述的方法,还包括在接收语音信道呼叫连接消息的步骤和在语音信道上传输所述第一音频信息之间等待预先确定的时间周期。
9.根据权利要求8所述的方法,还包括以下步骤确定无线通信装置是处于漫游状态还是非漫游状态;如果该装置处于漫游状态,则除了等待第一预先确定的时间周期之外,还等待第二预先确定的时间周期。
10.根据权利要求1所述的方法,还包括以下步骤通过无线通信信道接收用于指示应该执行记录步骤的指示。
11.一种无线通信装置包括收发器;存储器;以及处理器,与所述存储器和收发器相连接,并被配置用于接收语音信道一键通请求;在存储器中记录第一音频信息;接收语音信道呼叫连接消息;以及将所述第一音频信息发送给所述收发器,用以在无线通信信道的语音信道上传输记录的音频信息。
12.根据权利要求11所述的装置,其中所述处理器还配置用于在接收语音信道呼叫连接消息之前,选择数字信号处理图像。
13.根据权利要求12所述的装置,其中所述处理器还配置用于响应接收所述语音信道呼叫连接消息的步骤,而识别第二数字信号处理图像,并产生所述第二数字信号处理图像的标识。
14.根据权利要求13所述的装置,其中所述第二数字信号处理图像与所述第一数字信号处理图像相同。
15.根据权利要求13所述的装置,其中所述处理器还配置用于在接收所述语音信道呼叫连接消息之后,通过使用第一数字信号处理图像来记录第二音频信息。
16.根据权利要求13所述的装置,其中所述处理器还配置用于存储用于指示所述第一音频信息正在被记录的指示;截取所述第二数字信号处理图像的标识;保留所述第一数字信号处理图像;以及在截取所述第二数字信号处理图像的标识的步骤之后,通过使用所述第一数字信号处理图像来记录附加的音频信息。
17.根据权利要求12所述的装置,其中所述处理器还配置用于选择增强性可变比例编解码器图像;以及以增强型可变比例编解码器格式记录所述音频信息。
18.根据权利要求11所述的装置,其中所述处理器还配置用于在接收语音信道呼叫连接消息的步骤和在语音信道上传输所记录的音频信息之间,等待预先确定的时间周期。
19.根据权利要求11所述的装置,其中所述处理器还配置用于确定无线通信装置是处于漫游状态还是非漫游状态;如果该装置处于漫游状态,则除了等待第一预先确定的时间周期之外,还等待第二预先确定的时间周期。
全文摘要
提供了用于在VOVC PTT呼叫中缓存语音的系统和方法。在VOVC呼叫被建立起之前,开始缓存。
文档编号H04W4/10GK101076974SQ200580035479
公开日2007年11月21日 申请日期2005年10月19日 优先权日2004年10月19日
发明者克莱·瑟宾, 斯各特·R·齐尔克塞纳, 阿龙·C·蒂格, 穆尔图扎·查特里娃拉 申请人:京瓷无线公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1