一种基于树形服务器、pc客户端和电话终端的会议系统的制作方法

文档序号：7710049阅读：121来源：国知局

专利名称：：一种基于树形服务器、pc客户端和电话终端的会议系统的制作方法
技术领域：
：本发明属于一种电话和VoIP混合会议系统，具体来讲，本发明为基于PC机的用户和基于电话终端的用户建立通信会话的一种会议系统。
背景技术：
：会议是语音通信网络一个重要组成部分。音频会议在为不同地方的人，彼此进行实时的沟通提供了一种便利方法方面起着非常重要的作用。现今，廉价个人电脑，网络设备，电信，以及相关技术的有效性，极大地改变了人们的交流方式，从而引起人类与全球因特网连接的急剧增长。这种连接是由互联网完成。互联网是基于一个共同的协议套件，这协议套件帮助计算机连接到互联网。部分共同协议套件是互联网协议(IP)，即TCP/IP标准协议。它规定IP数据包为穿越因特网的信息单位，因特网提供了无连接和尽最大努力的包发送服务。IP也包括处理控制和错误信息的因特网控制信息协议(ICMP)。多年来，通过全球公共互联网传输语音已被广泛研究。1996年，国际电信联盟(国际电联)通过了H.323互联网电话标准作为一种手段来通过IP网络传输语音(VoIP)。H.323协议规定了最低标准为语音通个IP传输，例如，呼叫建立和控制。符合H.323标准的设备可以通过IP传输语音，但这种语音通话质量无法得到保证。因此，人们开发了称为多点控制单元(MCU)的会议服务器来主办会议，参加者使用基于PC的设备和互联网连接到中央MCU，而不是通过公共服务电话网的传统的电话设备(PSTN)。最近，会议开始协议(SIP)被发展。它是由制定互联网工程任务组(IETF)的SIP工作组完成。SIP协议是一种信令协议，它被广泛用于建立和关闭多媒体通信会议，如语音和视频通过互联网呼叫。SIP协议比H.323的功能更强大，它提供了呼叫控制和扩展功能设置。它能处理基本设置功能以及增强服务功能，如呼叫转移。随着电话行业在协议和设备，包括存在的传统设备，如电话和交换网络的迅速发展，高渗透的电话网络将需要VoIP会议能提供一个优质的服务为PSTN的用户。于是，这要求会议服务器能提供对基于数据包和交换系统的用户的支持。因此需要提出了基于PC机和电话终端会议的服务器体系来满足这个需求。中国发明专利申请CN100344140C(公告日为2007年10月17日)提供一种电话视频会议系统，其包括主控制单元、数字信号处理单元，内部总线和以太网接口和EI/模拟电话线接入端口，以太网接口用以连接至以太网，使计算机用户能加入电话视频会议系统，EI/模拟电话线接入端口通过数字信号处理单元中的电话接入模块，将固定电话/移动电话接入到该电话视频会议系统，此发明使用电话用户和计算机用户都能够方便参加会议，但是其存在如下缺陷(1)在音频处理模块，它使用一个简单的加法和减法的混音方法。这将会引起混音值的溢出，从而影响了音频的质量，产生理解性差的音频。(2)它采用了传统的解码_混音-编码的音频混音算法，这极大地增加了音频处理模块的中央处理器(CPU)的负荷，从而极大地降低了音频处理模块处理多用户的能力。(3)它增加了端到端的延迟。
发明内容为了克服现有技术中音频质量差，CPU负荷重和端到端的延迟长的缺陷，本发明提出一种有能力处理参与者的不同设备如PC机、固定电话并依据参与者的不同设备，提供相应的音频数据给每位参与者的会议系统。本发明解决其技术问题所采用的技术方案是—种基于树形服务器、PC和电话终端会议系统，该系统包括多个基于PC机的客户端，该客户端通过广域网和路由器接到次级服务器或直接连接根服务器，次级服务器连接到根服务器；多个通过电话线与公共交换电话网络连接的电话设备终端，公共交换电话网通过网关连接到远程服务器，根服务器，次级服务器并形成了呈树状形的网络；次级服务器用于扫描RTP实时传输协议数据包，从所有收到的音频流获取当前帧的能量，经过能量值比较获得对应N个最大能量的客户端标识符，将选定的N个音频流发送给根服务器；根服务器，用于扫描RTP实时传输协议数据包，将收到的音频流和从次级服务器发送的音频流中获取当前帧的能量，经过能量值比较获得对应N个最大能量的客户端标识符，将选定的N个音频流发送给远程服务器；远程服务器，用于收到所有公共交换电话网音频流并计算当前帧的能量，音频数据流的当前帧的能量E可由以下公式(1)计算获得^、度x[A:]2(1)式中，卜[}1;=。,...}1表示音频数据流的输入信号；通过比较E值的大小获得对应N个最大能量值的电话客户端标识符，最终在基于PC机的客户端和电话设备客户端进行选择，远程服务器编码其中公共交换电话网音频流以RTP协议封装成数据包并发送根服务器，根服务器形成多个音频数据包发送到或通过次级服务器发送到基于PC机的客户端，远程服务器形成混合音频流发送给电话设备客户端。所述基于PC机的客户端还包括有用于采集音频信号并进行混音处理的混音模块。所述混音模块，用于将选中的音频数据送入抖动缓冲区队列，经过解码器解码后送入语音帧缓冲区队列，定时激活混音算法处理，混音处理是从每列语音帧缓冲区中提取最早到达的语音帧，做语音信号混音处理，混音公式可以表示为(2)其中，Unput[j][1]^=。,...^表示第j列语音流所包括的语音帧，经解码后得到的语音输入信号；混音处理后的输出结果被放到mixing[i]，M表示语音流的总数，i表示音频数据流输入信号的样本点指数，N表示语音帧的大小。本发明的有益效果主要表现在1、使用音频流选择算法，避免了传统的解码_混音_编码的混音算法，极大地降低了根服务器，次级服务器和远程服务器的CPU负荷。2、降低了端点到端点的延迟。3、保证终端用户得到高质量的音频。4.树形服务器的架构保证会议具有可伸縮性。图1是本发明会议系统结构图。图1中S表示选择；PS表示为部分选择；Mix表示为混合器；MUX表示为复用。图2为次级服务器的详细框图。图3为根服务器的详细框图。图4为远程服务器的详细框图。具体实施例方式下面结合具体实施例来对本发明进行进一步说明，但并不将本发明局限于这些具体实施方式。本领域技术人员应该认识到，本发明涵盖了权利要求书范围内所可能包括的所有备选方案、改进方案和等效方案。本发明所述基于树形服务器，PC客户端和电话终端的会议系统，该系统包括多个基于PC机的客户端，该客户端通过广域网和路由器接到次级服务器或直接连接根服务器，次级服务器连接到根服务器；所述基于PC机的客户端，是运行与因特网的计算机，通过SIP协议可以进行任意通信会话。多个通过电话线与公共交换电话网络连接的电话设备客户端，公共交换电话网通过网关连接到远程服务器，根服务器，和次级服务器，形成了呈树状形的网络；次级服务器用于扫描RTP实时传输协议数据包，将收到的音频流获取当前帧的能量，经过能量价值比较获得对应N个最大能量的客户端标识符，将选定的N个音频流发送给根服务器；根服务器，用于扫描RTP实时传输协议数据包，将收到的音频流和从次级服务器发送的N个音频流中获取当前帧的能量，经过能量价值比较获得对应N个最大能量的客户端标识符，将选定的N个音频流发送给远程服务器；远程服务器，用于将收到的所有公共交换电话网音频流并计算当前帧的能量，音频数据流的当前帧的能量E可由以下公式(1)计算获得￡=、￡x[A:]2(1)式中，卜[}1;=。,...}1表示音频数据流的输入信号；通过比较E值的大小获得对应N个最大能量值的电话客户端标识符，最终在基于PC机的客户端和电话设备客户端进行选择，远程服务器编码其中公共交换电话网音频流以RTP协议封装成数据包并发送根服务器，根服务器形成多个音频数据包发送到或通过次级服务器发送到基于PC机的客户端，远程服务器形成混合音频流发送给电话设备客户端。本发明中所述基于PC机的客户端，是运行与因特网的计算机，通过SIP协议可以进行任意通信会话。本发明中所述基于公共交换电话网络的电话设备终端，是指传统电话设备，可以发送一个信号给PSTN给本发明会议系统来启动通话，检测并显示出通过电话呼叫到来和数据信息的到来，接收会议系统的指令可启动会话，传输和接收来自远程服务器的音频数据。图1显示本发明会议系统的架构及各组成部分的连通性为PC机和电话机终端的会议。该会议系统包括一个网关连结PSTN，从而为传统PSTN来电者，维持了一个传统服务接入方法。系统架构包括众多基于PC机的客户端，该客户端连接到广域网(WAN)，通过广域网和路由器接到次级服务器。次级服务器再连接到根服务器。此外，系统结构还包括众多基于电话的终端，这些终端连接到PSTN网。PSTN网通过网关连接到远程服务器。在此架构中，根服务器，次级服务器和远程服务器，又形成了完全连接的树形网络，以实现VoIP音频流和PSTN音频流端到端的的分发。基于PC的客户通过这些次级服务器发送他们的音频流到根服务器以及接收从邻近次级服务器中选定的音频流。混音实施在基于PC机客户方。基于电话的终端，从远程服务器接收混音包。所述基于PC机的客户端还包括有用于采集音频信号并进行混音处理的混音模块。混音模块，用于将选中的音频数据送入抖动缓冲区队列，经过解码器解码后送入语音帧缓冲区队列，定时激活混音算法处理程序，混音处理程序从每列语音帧缓冲区中提取最早到达的语音帧，做语音信号混音处理，混音公式可以表示为A/附/x/"g[/]=2]/w/"^/][/]其中，{input[j][i]}i=。,...,h表示第j列语音流所包括的语音帧，经解码后得到的语音输入信号；i表示音频数据流输入信号的样本点指数；N表示语音帧的大小；混音处理后的输出结果被放到mixing[i]，M表示语音流的总数；这里设成3。远程服务器混音接收到各个积极发言的客户的音频数据包并组合成一个包。在每个次级服务器，我们扫描RTP协议数据包，从所有收到的音频流获取当前帧的能量。彼此经过能量价值比较获得对应三个最大的能量的三个客户端标识符，这样选定的三个音频流发送给根服务器。在根服务器，我们扫描RTP协议数据包，从所有收到的音频流和从次级服务器发送的音频流中获得当前帧的能量。通过彼此比较能量值获得对应三个最大的能量的三个客户端标识符。这样选定的三个音频流发送给远程服务器。在远程服务器，我们为所有收到的PSTN音频流计算当前帧的能量。获得对应三个最大的能量值的三个电话的终端标识符。与此同时，我们在三个基于PC的客户端和三个基于电话的终端之间进行最后的选择。最终选择结果列于表l。表l:最终的选择情况<table>tableseeoriginaldocumentpage7</column></row><table>案例1:通知根服务器选中三路VoIP流。根服务器形成多个音频数据包发送到基于PC机的客户端。远程服务器形成混合音频流发送给基于电话的终端。案例2:通知根服务器选中两路VoIP流。远程服务器编码一路PSTN的音频流，把它打包成RTP协议包并发送给根服务器。根服务器形成多个音频数据包发送到基于PC机的客户端。远程服务器形成混合音频流发送给基于电话的终端。案例3:通知根服务器选中一路VoIP流。远程服务器编码两路PSTN的音频流，把它们打包成RTP协议包并将它们发送到根服务器。根服务器形成多个音频数据包发送到基于PC机的客户端。远程服务器形成混合音频流发送给基于电话的终端案例4:通知根服务器没有选中VoIP流。远程服务器形成混合音频流发送给基于电话的终端。与此同时，远程服务器使用RTP协议打包这种混合音频流并发送给根服务器。然后，根服务器传给基于PC机的客户端。权利要求一种基于树形服务器、PC客户端和电话终端的会议系统，该系统包括多个基于PC机的客户端，该客户端通过广域网和路由器接到次级服务器或直接连接根服务器，次级服务器连接到根服务器；所述基于PC机的客户端，是运行与因特网的计算机，通过SIP协议可以进行任意通信会话。多个通过电话线与公共交换电话网络连接的电话设备客户端，公共交换电话网通过网关连接到远程服务器，根服务器，和次级服务器，形成了呈树状形的网络；次级服务器用于扫描RTP实时传输协议数据包，将收到的音频流获取当前帧的能量，经过能量价值比较获得对应N个最大能量的客户端标识符，将选定的N个音频流发送给根服务器；根服务器，用于扫描RTP实时传输协议数据包，将收到的音频流和从次级服务器发送的N个音频流中获取当前帧的能量，经过能量价值比较获得对应N个最大能量的客户端标识符，将选定的N个音频流发送给远程服务器；远程服务器，用于将收到的所有公共交换电话网音频流并计算当前帧的能量，音频数据流的当前帧的能量E可由以下公式(1)计算获得<mrow><mi>E</mi><mo>=</mo><msqrt><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><mi>x</mi><msup><mrow><mo>[</mo><mi>k</mi><mo>]</mo></mrow><mn>2</mn></msup></msqrt><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>式中，{x[k]}k＝0，...，L-1表示音频数据流的输入信号；通过比较E值的大小获得对应N个最大能量值的电话客户端标识符，最终在基于PC机的客户端和电话设备客户端进行选择，远程服务器编码其中公共交换电话网音频流以RTP协议封装成数据包并发送根服务器，根服务器形成多个音频数据包发送到或通过次级服务器发送到基于PC机的客户端，远程服务器形成混合音频流发送给电话设备客户端。所述基于PC机的客户端还包括有用于采集音频信号并进行混音处理的混音模块。2.如权利要求1所述基于树形服务器、PC客户端和电话终端的会议系统，其特征在于所述混音模块，用于将选中的音频数据送入抖动缓冲区队列，经过解码器解码后送入语音帧缓冲区队列，定时激活混音算法处理，混音处理是从每列语音帧缓冲区中提取最早到达的语音帧，做语音信号混音处理，混音公式可以表示为mix/"g[/]=Z/"/W[y'][/](2)其中，{inpUt[j][i]}i=。,...,N—工表示第j列语音流所包括的语音帧，经解码后得到的语音输入信号；混音处理后的输出结果被放到mixing[i]，M表示语音流的总数，i表示音频数据流输入信号的样本点指数，N表示语音帧的大小。全文摘要一种基于树形服务器、PC客户端和电话终端的会议系统，包括众多基于PC机的客户端，该客户端连接到广域网，通过广域网和路由器接次级服务器，次级服务器接根服务器，和众多连接到PSTN网基于电话的客户端，PSTN网通过网关连接到远程服务器。本发明根服务器、次级服务器和远程服务器形成树形网络，实现VoIP音频流和PSTN音频流端到端的分发。PC客户通过次级服务器发送音频流到根服务器及接收从邻近次级服务器选定音频流，混音实施在PC机客户方，基于电话客户端从远程服务器接收混音包，远程服务器混音接收到积极发言客户的音频数据包并组合成一个包。本发明降低端点到端点的延迟，保证终端用户得到高质量音频，树形服务器的架构保证会议具有可伸缩性。文档编号H04M3/56GK101707593SQ200910154228公开日2010年5月12日申请日期2009年11月17日优先权日2009年11月17日发明者宋旭东,宗明,杜武平申请人:红杉树(杭州)信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋旭东;杜武平;宗明
技术所有人：红杉树（杭州）信息技术有限公司
我是此专利的发明人

上一篇：一种基于智能网信令监控的网络问题监控方法和网络问题监控系统的制作方法
上一篇：H.264高速亮度插值装置与方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。