一种即时语音通信方法

文档序号:7923507阅读:236来源:国知局
专利名称:一种即时语音通信方法
技术领域
本软件给用户提供了一种方法,可以对满足高保真语音通信的质量。
背景技术
目前,现代信息技术的发展及应用越来越广泛,网络上的语音通信技术即网络电话技术在现代科技领域的应用也日趋深入,对网络语音通信质量的要求也越来越高,这样就需要优质的语音编码技术与高效的网络传输技术的有机结合。消费者对网络电话的最基本的要求是通话清晰,目前网络的语音通信软件普遍存在传输延迟与失真的问题。
影响网络即时通信的话音质量因素有很多,其中带宽和网络环境的是原因之一,而语音编解码技术和落地运营商的选择(话音的落地路由的质量)也是影响话音质量的关键因素。

发明内容
本发明的目的是针对现有问题的上述不足,优化了MPEG-4语音编码算法。并将其整合在网络通信模块,以降低了信号延迟,减小了信号的失真。
本发明的一种即时语音通信方法,主要针对用于局域网办公环境的语音通信进行优化,其特征在包含以下步骤
步骤1:音频信号采集,即使用录音设备对声音的激励信号进行采集,并通过windows自带的windowsAPI函数完成对音频数据的采样、量化等基本处理;
步骤2:语音编码,即首先将输入的音频数据进行分频处理,并将不同码率的音频数据分块,采用不同码率的音频编码方法将语音数据编码处理;
步骤3:语音信息传输,即通过网络将音频数据分帧传输至接收端;
步骤4:语音解码,即以帧为单位进行,主要对码流进行解码;
步骤5:音频回放,即针对解码后所得的相应参数,根据语音产生原理,合成语音。通过本发明的这种方法可以实现的有益效果有优化的编码算法减小了语音信号的失真,有效降低了传输的延迟。这是一款专用于要求高清网络语音通信的用户,提供给用户在进行网络语音传输过程中失真小、延迟小的高保真语音通信质量。软件包括了一个可执行文件、高效网络传输技术Socket传输模块、及优化的高保真语音编码算法MPEG-4。通过在网络传输模块中写入对语音编码模块的应用程序,将两大模块结合,进而完成音频通信功能。


图l:即时语音通信流程图;图2:优化语音编码流程;图3:网络通信流程。
具体实施例方式
下面结合附图对本发明进行更详细的阐述。
如图1所示, 一个完整的音频通信程序要完成以下工作
语音信息的采集、音频数据的编码、将处理后的音频数据进行压缩打包发送、接收音频数据、音频数据的解码、语音信息的输出。
为了使本发明的目的、技术方案即优点更加清楚明白,以下结合上述通信工程,给出具体实例,对本发明进行进一步的详细说明。
1. 音频信息的采集。录音设备对声音的激励信号进行采集,输出设备对对解码后的激励信号进行回放。音频的采集和回放两个基本处理过程采用直接、高效的波形输出方法,这种方法包含在Windows机制之下,更具推广性。音频采集及回放部分使用windows API函数,完成对音频数据的基本处理,如采样,量化等。
2. 音频数据的编码与解码。经过音频采集模块进行初步处理后的数据难以保证高保真的
通信要求。通过语音编码模块对音频数据进行深度处理。
如图2所示,左侧是本发明音频数据的编码流程图、右侧是本发明音频数据的解码流程图。由于音频数据的编码和解码流程近似,所以此处进行对比说明。
首先将输入的音频数据进行分频处理,并将不同码率的音频数据分块,采用不同码率的音频编码方法将语音数据编码处理,将处理后的音频数据分帧,传输至网络传输模块。
本发明标准化了不同码率从2kbit/s到高于64kbit/s范围的音频编码。为了在整个码率范围内实现最好的音频效果,并同时提供额外的函数功能,语音编码技术和通用的音频编码技术同时整和在一个公用的框架中。在低码率的语音编码通过谐音矢量激励编码和码激励线性预测来实现,其中,谐音矢量激励编码用于码流在2kbit/s到4kbit/s的语音编码,码激励线性预测用于码流在2kbit/s到25kbit/s的语音编码。此外谐音矢量激励编码能在其可变码率模式下实现平均码流下降到1.2kbit/s的语音编码。码率在更高情况下应用音频变换编码技术变换编码。通常在这一区域的音频信号的采样码率从8kHz开始。
从低码率的编码开始,逐步向通用音频编码器中加入增强部分。这样一来,编码质量和音频带宽都可以得到提高。编码算法具有一定的抗信道误码的能力,且不会引入大的干扰。另外,如果信道衰减很大,或传输的帧完全丢失,解码器能在最少损失话音质量的情况下隐去所丢失的帧。提供了较低速的高质量的低延迟的语音编码,是当前较理想的编码算法。编码器是基于码激励线性预测声码器模型的。运算的帧长为10ms,相应于抽样率为8kHz的语音数据流的80个样值。对于每10ms的一帧,语音信号经过分析,得到编码参数。
3. 音频信号的传输。经过高保真编码算法处理后的音频数据,通过网络传输模块发送至接收端。采用数据报式类型的传输方式。
如图4所示,给出了数据报方式传输的过程。
负责接收连接的服务端Socket模块该程序作为服务器网络端口。在该模块中,设置缓存中音频的结构与本地计算机具体参数(音频格式、通道数、采样码率等)。
负责接收/发送数据的客户端Socket模块对套接字的发送数据和接收数据进行消息处理。简单的重载基础类的接收和发送函数。
该模块中,设计了具体的传输协议面向无连接的用户数据报传输协议,形成数据报,校验和用于检査传输中是否出现错误,数据报长度包含五个域的字节数。
4. 音频信号的输出。解码是以帧为单位进行,主要是对码流进行解码。解码完成后,得到相应的参数,并根据语音产生的原理,合成语音。其主要部分大致有参数解码、后滤波处理、丢帧处理。音频的解码过程,在解码器端解出激励信号与合成滤波器参数。重建语音信号是将激励信号通过短时合成滤波器而得到的。
在本发明中,首先将音频数据中按照不同码率进行分块分帧,然后将多个码率帧的音频数据进行编码处理,最后将处理后的数据发送给接收端进行解码和音频数据的回复接收。由此可知,本发明的基本传输单元是不同码率帧。这样就解决了传统的对于音频数据不能进行完整编码的弊端,进而优化了语音传输的失真。
权利要求
1. 一种即时语音通信方法,主要针对用于局域网办公环境的语音通信进行优化,其特征在包含以下步骤步骤1音频信号采集,即使用录音设备对声音的激励信号进行采集,并通过windows自带的windows API函数完成对音频数据的采样、量化等基本处理;步骤2语音编码,即首先将输入的音频数据进行分频处理,并将不同码率的音频数据分块,采用不同码率的音频编码方法将语音数据编码处理;步骤3语音信息传输,即通过网络将音频数据分帧传输至接收端;步骤4语音解码,即以帧为单位进行,主要对码流进行解码;步骤5音频回放,即针对解码后所得的相应参数,根据语音产生原理,合成语音。
2. 如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音编码步骤,标准化了 从2kbit/s到高于64kbit/s范围的不同码率的音频编码。
3. 如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音编码步骤,在低码率 的语音编码通过谐音矢量激励编码和码激励线性预测来实现,其中,谐音矢量激励编码用 于码流在2kbit/s到4kbit/s的语音编码,码激励线性预测用于码流在2kbit/s到25kbit/s的语 音编码;码率在更高情况下应用音频变换编码技术变换编码。
4. 如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音编码步骤,从低码率 的编码开始,逐步向通用音频编码器中加入增强部分。
5. 如权利要求l所述的一种即时语音通信方法,其特征在于,所述语音信息传输步骤,其基 本传输单元是不同码率帧。
全文摘要
网络上的语音通信技术即网络电话技术在现代科技领域的应用日趋深入,对网络语音通信质量的要求也越来越高,这样就需要优质的语音编码技术与高效的网络传输技术的有机结合。根据语音通信模块与网络传输模块的整合,设计优质的网络语音传输技术。在此背景下研究并设计了一个网络语音通信的软件平台。本发明通过将音频数据中不同码率的数据采用针对的编码处理方法,然后将处理后的数据发送给接收端,这样音频数据处理方法保证了对整个语音码率范围内的数据进行处理,从而保证了通常码率的语音传输中出现的失真现象。本设计应用Socket编程技术完成网络通信的功能模块,有效地降低了网络传输中的延迟。
文档编号H04M7/00GK101478616SQ20081018853
公开日2009年7月8日 申请日期2008年12月19日 优先权日2008年12月19日
发明者玺 遇 申请人:深圳市神舟电脑股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1