一种矢量化技术中节省功耗的方法及相关设备与流程

文档序号:20614509发布日期:2020-05-06 19:59阅读:161来源:国知局
一种矢量化技术中节省功耗的方法及相关设备与流程

本发明实施例涉及但不限于vectoring技术,尤其适合一种矢量化技术中节省功耗的方法及相关设备。



背景技术:

矢量化vectoring技术使用的是预编码算法,对fext(far-endcrosstalk,远端串扰)串扰信道进行矩阵分解,来消除dpu(distributionpointunit,分布点单元)端口线对间的串扰。但是,随着用户接入线对的急剧增加,dpu端口数也相应地成倍增加,dpu端口数的成倍增加,带来的是vectoring处理芯片中,fext串扰信道矩阵求逆所需要的计算复杂度的指数增长。矩阵求逆与端口数的算法复杂度关系为o(n3),n是dpu端口的数量。可见,因dpu端口数的倍增,vectoring计算预编码系数的复杂度,将随着dpu端口数n(也就是接入线对数、接入用户数)呈n3增长,芯片面积、功耗、成本等,也会随着计算复杂度等比例增长。

以192根线对的vectoring处理芯片为例,一种p2020芯片配置如下:

32位宽,2内核,频率800mhz,最大功耗3w;

当线对数量增加到384根时,一种p308b芯片配置如下:

64位宽,8内核,频率1.2ghz;最大功耗18.5w;

从上述的芯片配置可以看出,p308b(384线对)需要p2020(192线对)六倍左右的功耗。因而,vectoring处理芯片的内核数量越多、工作频率越高,芯片的功耗就越大;同样地,价格成本也就越高。由于芯片价格受到采购数量、市场波动等因素的影响,无法准确评估成本飙升,因此,通过功耗来评估本发明的vectoring分解算法更加客观。

现有技术中,并不存在一种矢量化技术中节省功耗的技术方案,能够在dpu端口数的倍增的情况下,降低计算预编码系数的复杂度,减少vectoring处理芯片的功耗。



技术实现要素:

为了解决上述技术问题,本发明实施例提供了一种矢量化vectoring技术中节省功耗的方法,包括:

矢量化控制实体vce确定包含了n个dpu端口的两个vectoring矢量组的串扰信道系数,所述n为2的任意倍数;

根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d;

对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,所述预编码系数用于对下行数据进行预编码处理。

本发明实施例还提供了一种矢量化控制实体vce,所述vce包括:

1个vcecpu、分别与所述vcecpu连接的两个vce管理器;

所述两个vce管理器,用于确定包含了n个dpu端口的两个vectoring矢量组的串扰信道系数,所述n为2的任意倍数;

所述vcecpu,用于根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d;并对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,所述预编码系数用于对下行数据进行预编码处理。

本发明实施例还提供了一种矢量化技术中节省功耗的系统,包括:

上述矢量化控制实体,以及dpu设备和cpe设备;

所述dpu设备包含n个dpu端口,所述n个dpu端口被配置为两个vectoring矢量组,所述cpe设备包含与所述n个dpu端口一一对应的n个cpe。

本发明实施例还提供了一种矢量化控制实体,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述节省功耗的方法。

本发明实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现上述节省功耗的方法的步骤。

与相关技术相比,本发明实施例提供了一种矢量化技术中节省功耗的方法及相关设备,其中该方法包括:矢量化控制实体vce确定包含了n个dpu端口的两个vectoring矢量组的串扰信道系数,所述n为2的任意倍数;根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d;对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,所述预编码系数用于对下行数据进行预编码处理。如此,能够在dpu端口数倍增的情况下,降低计算预编码系数的复杂度,减少vce的功耗。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为示例一中涉及的现有的vectoring处理芯片的结构示意图;

图2为本发明实施例一提供的矢量化技术中节省功耗的方法的流程示意图;

图3为本发明实施例二提供的矢量化控制实体vce的结构示意图;

图4为本发明示例二中涉及的vectoring处理芯片的结构示意图;

图5为本发明示例二中提供的矢量化vectoring技术中节省功耗的方法的流程示意图;

图6为本发明示例二中cpe1-96接收端口1发送导频符号1的示意图;

图7为本发明示例二中cpe91-192接收端口1发送导频符号1的示意图;

图8为本发明示例二中cpe1-96反馈串扰信道系数的示意图;

图9为本发明示例二中cpe97-192反馈串扰信道系数的示意图;

图10为本发明示例二、三中进行矩阵求逆得到预编码系数的过程示意图;

图11为本发明示例二中vp的结构示意图;

图12为本发明示例三中提供的矢量化vectoring技术中节省功耗的方法的流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

dsl(digitalsubscriberline,数字用户线路)是一种利用电话双绞线进行高速数据传输的技术。由于电磁感应原理,dsl线路(线对)信号之间会产生串扰(crosstalk)。串扰是影响传输性能的重要因素。为此,提出了一种矢量化vectoring技术,可以针对多个串扰dsl线路进行矢量化,消除串扰,使每个线路的速率接近无串扰的水平。串扰包括近端串扰(next)和远端串扰(fext)两种。其中,矢量化vectoring技术中利用预编码算法来消除fext,即串扰信道h利用矩阵形式进行表示,然后对信道矩阵进行矩阵求逆,计算得到预编码系数,然后利用预编码系数对下行数据预编码后再发送,实现串扰消除。

具体而言,下面通过示例一对现有矢量化vectoring技术中的预编码技术进行说明。

示例一

本示例一中,dpu设备支持96线对,veccpu(vectoringcontrolentity,矢量化控制实体;cpu,centralprocessingunit,中央处理器)的处理能力为96线对,取vectoring矢量组的端口数n=96。

图1为示例一中涉及的现有的vectoring处理芯片的结构示意图。如图1所示:

dsp(digitalsignalprocessing,数字信号处理)线卡:将dpu各个端口与dsl双绞线连接;dsp线卡既接收上行链路方向,由cpe(customerpremiseequipment,客户终端设备)反馈的es数据;也发送下行方向,由vp经过预编码处理后,消除串扰后的各端口的下行数据。

vce管理器:负责收集上行链路,由cpe反馈的es数据;负责初始化过程中,dpu设备(ftu-o)与cpe设备(ftu-r)之间的信令交互。

vcedpu:负责将es数据转换成fext串扰系数矩阵,再将fext矩阵求逆,得到预编码系数矩阵。

vp:将预编码矩阵中的系数,配置加载到dpu的各个端口,以及端口与端口之间两两连接的乘法器上;配置完成预编码矩阵后,dpu各端口见的串扰就被消除了。

在本示例一中,一个完整的下行链路预编码系数求取过程如下:

1,vce管理器通过dsp线卡,实现与cpe的信令交互,完成初始化过程,收集到上行链路的es反馈数据;

2,vce管理器将es数据再传递给vcecpu;

3,vcecpu将es数据转换成fext串扰矩阵,并且完成矩阵求逆,得到下行链路的预编码系数;

4,vcecpu将计算得到的预编码矩阵传递给vp;

5,vp将预编码矩阵中的系数,配置加载到dpu的各个端口,以及端口与端口之间两两连接的乘法器上;配置完成预编码矩阵后,dpu各端口见的串扰就被消除了;

6,vp将消除串扰后的各端口数据传递给dsp线卡,dsp线卡通过dsl双绞线将下行链路的数据发送给cpe。

在示例一中,由于矩阵求逆与端口数的算法复杂度关系为o(n3),因而上述步骤3中,dpu端口数成倍增加的情况下,fext串扰信道矩阵求逆所需要的计算复杂度会呈指数增长,导致vectoring处理芯片的功耗也数倍的增长,大大提高了vectoring系统的功耗。

为此,本发明实施例提供了一种矢量化技术中节省功耗的技术方案,能够在dpu端口数倍增的情况下,降低计算预编码系数的复杂度,减少vectoring处理芯片的功耗。进一步地,可以使用n/2端口的vcecpu来计算n端口vectoring矢量组的预编码系数,n为n是dpu端口的数量,将大大地降低vectoring系统的功耗。下面结合具体的实施例,阐述该技术方案。

实施例一

图2为本发明实施例一提供的矢量化技术中节省功耗的方法的流程示意图,如图2所示,该方法包括:

步骤201,矢量化控制实体vce确定包含了n个dpu端口的两个vectoring矢量组的串扰信道系数,所述n为2的任意倍数;

步骤202,根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d;

步骤203,对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,所述预编码系数用于对下行数据进行预编码处理。

其中,在所述确定两个vectoring矢量组的串扰信道系数之前,该方法还包括:

将包含了所述n个dpu端口的dpu设备配置成两个vectoring矢量组,每一个矢量组包含n/2个dpu端口。

其中,所述vce包括:1个vcecpu、分别与所述vcecpu连接的两个vce管理器;

所述两个vce管理器确定包含了n个dpu端口的两个vectoring矢量组的串扰信道系数,并将所述串扰信道系数保存到所述vcecpu,所述n为2的任意倍数;

所述vcecpu根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d;并对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,所述预编码系数用于对下行数据进行预编码处理。

其中,所述确定两个vectoring矢量组的串扰信道系数,包括:

所述两个vce管理器通过dpu设备与对端的cpe设备连接,所述cpe设备包含与所述n个dpu端口一一对应的n个cpe,一个vce管理器控制一个vectoring矢量组;

所述两个vce管理器中的第一vce管理器在初始化过程中控制第一矢量组与对应的cpe进行信令交互确定第一矢量组的串扰信道系数和第一矢量组串扰到第二矢量组的串扰信道系数;

所述两个vce管理器中的第二vce管理器在初始化过程中控制第二矢量组与对应的cpe进行信令交互确定第二矢量组的串扰信道系数和第二矢量组串扰到第一矢量组的串扰信道系数。

其中,所述第一vce管理器控制第一矢量组与对应的cpe进行信令交互,包括:

第一阶段:

所述第一vce管理器控制所述第一矢量组向所述cpe设备发送第一信令,所述第一信令包含了所述第一vce管理器为第一矢量组分配的导频序列;

所述cpe设备保存根据接收到的第一信令估计得到的直传信道系数和串扰信道系数;

第二阶段:

所述第一vce管理器控制所述第一矢量组向所述cpe设备发送第二信令,所述第二信令用于要求反馈所述cpe设备保存的直传信道系数和串扰信道系数;

所述cpe设备正确接收到所述第二信令后,向所述第一矢量组反馈确认消息;

所述第一矢量组收到所述确认消息后向所述cpe设备发送第三信令;

所述cpe设备收到所述第三信令后,向所述第一矢量组上报本地保存的直传信道系数和串扰信道系数;

所述第一vce管理器将通过所述第一矢量组接收到的直传信道系数和串扰信道系数保存到所述vcecpu,并控制所述第一矢量组向所述cpe设备发送第四信令,所述第四信令用于通知所述cpe设备完成信道系数上报过程。

其中,所述第一阶段具体包括:

所述第一vce管理器控制所述第一矢量组的第一端口根据所述第一vce管理器分配的第一导频序列向对端直连的第一cpe发送第一信令,所述第一信令包含了所述第一导频序列;所述第一cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了第一cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

所述第一vce管理器控制所述第一矢量组的第二端口根据所述第一vce管理器分配的第二导频序列向对端直连的第二cpe发送第一信令,所述第一信令包含了所述第二导频序列;所述第二cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了第二cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

依次类推,直到所述第一vce管理器控制所述第一矢量组的全部端口发送完成第一信令。

其中,所述第二阶段具体包括:

所述第一vce管理器控制所述第一矢量组的第一端口向对端直连的第一cpe发送第二信令;所述第一cpe正确接收到所述第二信令后,向所述第一端口反馈确认消息;所述第一端口收到所述确认消息后向所述第一cpe发送第三信令;所述第一cpe收到所述第三信令后,向所述第一端口上报本地保存的直传信道系数和串扰信道系数;

所述第一vce管理器控制所述第一矢量组的第二端口向对端直连的第二cpe发送第二信令;所述第二cpe正确接收到所述第二信令后,向所述第二端口反馈确认消息;所述第二端口收到所述确认消息后向所述第二cpe发送第三信令;所述第二cpe收到所述第三信令后,向所述第二端口上报本地保存的直传信道系数和串扰信道系数;

依次类推,直到所述第一vce管理器控制所述第一矢量组的全部端口发送完成第二信令并将依次收到的直传信道系数和串扰信道系数依次保存到所述vcecpu;

所述第一vce管理器控制所述第一矢量组的全部端口向对应的cpe发送第四信令。

其中,所述第二vce管理器控制第二矢量组与对应的cpe进行信令交互,包括:

第一阶段:

所述第二vce管理器控制所述第二矢量组向所述cpe设备发送第一信令,所述第一信令包含了所述第二vce管理器为第二矢量组分配的导频序列;

所述cpe设备保存根据接收到的第一信令估计得到的直传信道系数和串扰信道系数;

第二阶段:

所述第二vce管理器控制所述第二矢量组向所述cpe设备发送第二信令,所述第二信令用于要求反馈所述cpe设备保存的直传信道系数和串扰信道系数;

所述cpe设备正确接收到所述第二信令后,向所述第二矢量组反馈确认消息;

所述第一矢量组收到所述确认消息后向所述cpe设备发送第三信令;

所述cpe设备收到所述第三信令后,向所述第二矢量组上报本地保存的直传信道系数和串扰信道系数;

所述第二vce管理器将通过所述第二矢量组接收到的直传信道系数和串扰信道系数保存到所述vcecpu,并控制所述第二矢量组向所述cpe设备发送第四信令,所述第四信令用于通知所述cpe设备完成信道系数上报过程。

其中,所述第一阶段具体包括:

所述第二vce管理器控制所述第二矢量组的第一端口根据所述第二vce管理器分配的第一导频序列向对端直连的第一cpe发送第一信令,所述第一信令包含了所述第一导频序列;所述第一cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了所述第一cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

所述第二vce管理器控制所述第二矢量组的第二端口根据所述第二vce管理器分配的第二导频序列向对端直连的第二cpe发送第一信令,所述第一信令包含了所述第二导频序列;所述第二cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了第二cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

依次类推,直到所述第二vce管理器控制所述第二矢量组的全部端口发送完成第一信令。

其中,所述第二阶段具体包括:

所述第二vce管理器控制所述第二矢量组的第一端口向对端直连的第一cpe发送第二信令;所述第一cpe正确接收到所述第二信令后,向所述第一端口反馈确认消息;所述第一端口收到所述确认消息后向所述第一cpe发送第三信令;所述第一cpe收到所述第三信令后,向所述第一端口上报本地保存的直传信道系数和串扰信道系数;

所述第二vce管理器控制所述第二矢量组的第二端口向对端直连的第二cpe发送第二信令;所述第二cpe正确接收到所述第二信令后,向所述第二端口反馈确认消息;所述第二端口收到所述确认消息后向所述第二cpe发送第三信令;所述第二cpe收到所述第三信令后,向所述第二端口上报本地保存的直传信道系数和串扰信道系数;

依次类推,直到所述第二vce管理器控制所述第二矢量组的全部端口发送完成第二信令并将依次收到的直传信道系数和串扰信道系数依次保存到所述vcecpu;

所述第二vce管理器控制所述第二矢量组的全部端口向对应的cpe发送第四信令。

其中,所述根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d,包括:

根据所述串扰信道系数得到一个n*n的远端串扰fext信道系数矩阵h;

将所述矩阵h分解为4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d,即:

其中,所述矩阵a为第一矢量组的串扰系数矩阵、所述矩阵d第二矢量组的串扰系数系数,所述矩阵b为第一矢量组串扰到第二矢量组的串扰系数矩阵,所述矩阵c为第二矢量组串扰到第一矢量组的串扰系数矩阵。

其中,所述对4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,包括:

求解出矩阵a的逆矩阵a-1,将a-1覆盖矩阵a;

根据矩阵a-1、b、c、d,计算出(d-ca-1b)-1;再将(d-ca-1b)-1覆盖d矩阵;

根据矩阵a-1、b、c、(d-ca-1b)-1计算得到下面的预编码系数,即:

其中,所述求解出矩阵a的逆矩阵a-1,包括:

将矩阵a分解为4个(n/4)*(n/4)的串扰系数矩阵a1、a2、a3、a4;

求解出矩阵a1的逆矩阵a1-1,将a1-1覆盖矩阵a1;

根据矩阵a1-1、a2、a3、a4,计算出(a4-a3a1-1a2)-1;再将(a4-a3a1-1a2)-1覆盖a4矩阵;

根据矩阵a1-1、a2、a3、(a4-a3a1-1a2)-1计算得到矩阵a的逆矩阵a-1,即:

其中,所述根据矩阵a-1、b、c、d,计算出(d-ca-1b)-1,包括:

根据矩阵a-1、b、c、d,计算出矩阵d-ca-1b;

将矩阵d-ca-1b分解为4个(n/4)*(n/4)的串扰系数矩阵d1、d2、d3、d4;

求解出矩阵d1的逆矩阵d1-1,将d1-1覆盖矩阵d1;

根据矩阵d1-1、d2、d3、d4,计算出(d4-d3d1-1d2)-1;再将(d4-d3d1-1d2)-1覆盖d4矩阵;

根据矩阵d1-1、d2、d3、(d4-d3d1-1d2)-1计算得到矩阵d-ca-1b的逆矩阵(d-ca-1b)-1,即:

其中,将串扰最小的dpu端口产生的信道系数集中在矩阵a,将串扰严重的dpu端口产生的信道系数集中在矩阵d。

其中,所述vce还包括:

矢量化处理器vp;

该方法还包括:

所述vcecpu将得到的预编码系数发送给所述vp;

所述vp根据所述预编码系数对下行数据进行预编码处理。

实施例二

图3为本发明实施例二提供的矢量化控制实体vce的结构示意图,如图3所示,所述vce包括:

1个vcecpu、分别与所述vcecpu连接的两个vce管理器;

所述两个vce管理器,用于确定包含了n个dpu端口的两个vectoring矢量组的串扰信道系数,所述n为2的任意倍数;

所述vcecpu,用于根据确定的串扰信道系数得到4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d;并对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数,所述预编码系数用于对下行数据进行预编码处理。

其中,所述两个vce管理器通过dpu设备与对端的cpe设备连接,所述dpu设备包含所述n个dpu端口,所述n个dpu端口被配置为两个vectoring矢量组,所述cpe设备包含与所述n个dpu端口一一对应的n个cpe;

一个vce管理器控制一个vectoring矢量组。

其中,所述两个vce管理器中的第一vce管理器,用于在初始化过程中控制第一矢量组与对应的cpe进行信令交互确定第一矢量组的串扰信道系数和第一矢量组串扰到第二矢量组的串扰信道系数;

所述两个vce管理器中的第二vce管理器,用于在初始化过程中控制第二矢量组与对应的cpe进行信令交互确定第二矢量组的串扰信道系数和第二矢量组串扰到第一矢量组的串扰信道系数。

其中,所述第一vce管理器,还用于将确定的第一矢量组的串扰信道系数和第一矢量组串扰到第二矢量组的串扰信道系数保存到所述vcecpu;

所述第二vce管理器,还用于将确定的第二矢量组的串扰信道系数和第二矢量组串扰到第一矢量组的串扰信道系数保存到所述vcecpu。

其中,所述第一vce管理器,具体用于在初始化过程中,控制第一矢量组与cpe设备之间的信令交互,包括:

第一阶段:

所述第一vce管理器控制所述第一矢量组向所述cpe设备发送第一信令,所述第一信令包含了所述第一vce管理器为第一矢量组分配的导频序列;

所述cpe设备保存根据接收到的第一信令估计得到的直传信道系数和串扰信道系数;

第二阶段:

所述第一vce管理器控制所述第一矢量组向所述cpe设备发送第二信令,所述第二信令用于要求反馈所述cpe设备保存的直传信道系数和串扰信道系数;

所述cpe设备正确接收到所述第二信令后,向所述第一矢量组反馈确认消息;

所述第一矢量组收到所述确认消息后向所述cpe设备发送第三信令;

所述cpe设备收到所述第三信令后,向所述第一矢量组上报本地保存的直传信道系数和串扰信道系数;

所述第一vce管理器将通过所述第一矢量组接收到的直传信道系数和串扰信道系数保存到所述vcecpu,并控制所述第一矢量组向所述cpe设备发送第四信令,所述第四信令用于通知所述cpe设备完成信道系数上报过程。

其中,所述第一阶段具体包括:

所述第一vce管理器控制所述第一矢量组的第一端口根据所述第一vce管理器分配的第一导频序列向对端直连的第一cpe发送第一信令,所述第一信令包含了所述第一导频序列;所述第一cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了第一cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

所述第一vce管理器控制所述第一矢量组的第二端口根据所述第一vce管理器分配的第二导频序列向对端直连的第二cpe发送第一信令,所述第一信令包含了所述第二导频序列;所述第二cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了第二cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

依次类推,直到所述第一vce管理器控制所述第一矢量组的全部端口发送完成第一信令。

其中,所述第二阶段具体包括:

所述第一vce管理器控制所述第一矢量组的第一端口向对端直连的第一cpe发送第二信令;所述第一cpe正确接收到所述第二信令后,向所述第一端口反馈确认消息;所述第一端口收到所述确认消息后向所述第一cpe发送第三信令;所述第一cpe收到所述第三信令后,向所述第一端口上报本地保存的直传信道系数和串扰信道系数;

所述第一vce管理器控制所述第一矢量组的第二端口向对端直连的第二cpe发送第二信令;所述第二cpe正确接收到所述第二信令后,向所述第二端口反馈确认消息;所述第二端口收到所述确认消息后向所述第二cpe发送第三信令;所述第二cpe收到所述第三信令后,向所述第二端口上报本地保存的直传信道系数和串扰信道系数;

依次类推,直到所述第一vce管理器控制所述第一矢量组的全部端口发送完成第二信令并将依次收到的直传信道系数和串扰信道系数依次保存到所述vcecpu;

所述第一vce管理器控制所述第一矢量组的全部端口向对应的cpe发送第四信令。

其中,所述第二vce管理器,具体用于在初始化过程中,控制第二矢量组与cpe设备之间的信令交互,包括:

第一阶段:

所述第二vce管理器控制所述第二矢量组向所述cpe设备发送第一信令,所述第一信令包含了所述第二vce管理器为第二矢量组分配的导频序列;

所述cpe设备保存根据接收到的第一信令估计得到的直传信道系数和串扰信道系数;

第二阶段:

所述第二vce管理器控制所述第二矢量组向所述cpe设备发送第二信令,所述第二信令用于要求反馈所述cpe设备保存的直传信道系数和串扰信道系数;

所述cpe设备正确接收到所述第二信令后,向所述第二矢量组反馈确认消息;

所述第一矢量组收到所述确认消息后向所述cpe设备发送第三信令;

所述cpe设备收到所述第三信令后,向所述第二矢量组上报本地保存的直传信道系数和串扰信道系数;

所述第二vce管理器将通过所述第二矢量组接收到的直传信道系数和串扰信道系数保存到所述vcecpu,并控制所述第二矢量组向所述cpe设备发送第四信令,所述第四信令用于通知所述cpe设备完成信道系数上报过程。

其中,所述第一阶段具体包括:

所述第二vce管理器控制所述第二矢量组的第一端口根据所述第二vce管理器分配的第一导频序列向对端直连的第一cpe发送第一信令,所述第一信令包含了所述第一导频序列;所述第一cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了所述第一cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

所述第二vce管理器控制所述第二矢量组的第二端口根据所述第二vce管理器分配的第二导频序列向对端直连的第二cpe发送第一信令,所述第一信令包含了所述第二导频序列;所述第二cpe保存根据接收到的第一信令估计得到的直传信道系数;所述cpe设备的除了第二cpe之外的其他cpe保存根据接收到的第一信令估计得到的串扰信道系数;

依次类推,直到所述第二vce管理器控制所述第二矢量组的全部端口发送完成第一信令。

其中,所述第二阶段具体包括:

所述第二vce管理器控制所述第二矢量组的第一端口向对端直连的第一cpe发送第二信令;所述第一cpe正确接收到所述第二信令后,向所述第一端口反馈确认消息;所述第一端口收到所述确认消息后向所述第一cpe发送第三信令;所述第一cpe收到所述第三信令后,向所述第一端口上报本地保存的直传信道系数和串扰信道系数;

所述第二vce管理器控制所述第二矢量组的第二端口向对端直连的第二cpe发送第二信令;所述第二cpe正确接收到所述第二信令后,向所述第二端口反馈确认消息;所述第二端口收到所述确认消息后向所述第二cpe发送第三信令;所述第二cpe收到所述第三信令后,向所述第二端口上报本地保存的直传信道系数和串扰信道系数;

依次类推,直到所述第二vce管理器控制所述第二矢量组的全部端口发送完成第二信令并将依次收到的直传信道系数和串扰信道系数依次保存到所述vcecpu;

所述第二vce管理器控制所述第二矢量组的全部端口向对应的cpe发送第四信令。

其中,所述vcecpu,具体用于根据所述串扰信道系数得到一个n*n的远端串扰fext信道系数矩阵h;

将所述矩阵h分解为4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d,即:

其中,所述矩阵a为第一矢量组的串扰系数矩阵、所述矩阵d第二矢量组的串扰系数系数,所述矩阵b为第一矢量组串扰到第二矢量组的串扰系数矩阵,所述矩阵c为第二矢量组串扰到第一矢量组的串扰系数矩阵。

其中,所述vcecpu,还具体用于求解出矩阵a的逆矩阵a-1,将a-1覆盖矩阵a;

根据矩阵a-1、b、c、d,计算出(d-ca-1b)-1;再将(d-ca-1b)-1覆盖d矩阵;

根据矩阵a-1、b、c、(d-ca-1b)-1计算得到预编码系数,即:

其中,所述求解出矩阵a的逆矩阵a-1,包括:

将矩阵a分解为4个(n/4)*(n/4)的串扰系数矩阵a1、a2、a3、a4;

求解出矩阵a1的逆矩阵a1-1,将a1-1覆盖矩阵a1;

根据矩阵a1-1、a2、a3、a4,计算出(a4-a3a1-1a2)-1;再将(a4-a3a1-1a2)-1覆盖a4矩阵;

根据矩阵a1-1、a2、a3、(a4-a3a1-1a2)-1计算得到矩阵a的逆矩阵a-1,即:

其中,所述根据矩阵a-1、b、c、d,计算出(d-ca-1b)-1,包括:

根据矩阵a-1、b、c、d,计算出矩阵d-ca-1b;

将矩阵d-ca-1b分解为4个(n/4)*(n/4)的串扰系数矩阵d1、d2、d3、d4;

求解出矩阵d1的逆矩阵d1-1,将d1-1覆盖矩阵d1;

根据矩阵d1-1、d2、d3、d4,计算出(d4-d3d1-1d2)-1;再将(d4-d3d1-1d2)-1覆盖d4矩阵;

根据矩阵d1-1、d2、d3、(d4-d3d1-1d2)-1计算得到矩阵d-ca-1b的逆矩阵(d-ca-1b)-1,即:

其中,所述vce还包括:

矢量化处理器vp;

所述vcecpu,还用于将得到的预编码系数发送给所述vp;

所述vp,用于根据所述预编码系数对下行数据进行预编码处理。

其中,所述vp由4w个n/2端口的vp电路堆叠实现,w=n/192。

其中,所述vcecpu由1个96端口的cpu电路实现,每一个vce管理器由n/192个96端口的vce管理器电路堆叠实现。

相较于现有技术中vce直接对n*n的fext信道矩阵h直接求逆计算得到预编码系数,本发明实施例一、二提供的技术方案,将n*n的fext信道矩阵h,先分解为4个(n/2)*(n/2)的串扰系数矩阵a、b、c、d,然后对所述4个信道矩阵a、b、c、d进行矩阵求逆得到预编码系数;如此,fext信道矩阵h的维数为n,而矩阵a、b、c、d的维数只有n/2,因此矩阵a、b、c、d求逆的算法复杂度为o(n3/4),只需要矩阵h求逆的四分之一,vectoring的计算量降低到25%,当n代表的端口数=192或者更大时,75%的节省就非常可观,大大地降低了vectoring系统的功耗。

进一步地,在不增加vectoring计算量复杂度的条件下,可以将vectoring矢量组处理的端口数增加一倍或者两倍,即将接入的线对数目或者用户数增加一倍或者两倍。经济效益是十分可观的。

进一步地,包含了n个dpu端口的m个vectoring矢量组可以共用一个vcecpu,大大降低了芯片成本。

进一步地,n个端口的vp(vectoringprocessing)硬件电路芯片,可以用4个n/2端口的vp电路堆叠实现,同样降低了芯片成本。

下面通过几个具体的示例详细阐述上述实施例一、二提供的技术方案。

示例二

本示例二中,dpu设备支持192线对,veccpu的处理能力为96线对,取vectoring矢量组的端口数n=192。

根据示例一中现有的vectoring处理芯片的结构,如果支持dpu端口数n=192,则需要两个如图1所示的vectoring处理芯片。

而本发明示例二中,支持dpu端口数n=192,则vectoring处理芯片的结构如图4所示,

dpu首先将192根线对分成2个96端口的vectoring组,来实现192端口的vectoring;

dsp线卡、vce管理器,需要使用2个96端口的原器件堆叠来进行端口的扩展;

vcecpu仍然采用1个96端口的原器件。

vp须要扩展为192端口的器件。

基于图4所示的vectoring芯片,本示例二还提供了一种矢量化vectoring技术中节省功耗的方法,图5为本发明示例二提供的矢量化vectoring技术中节省功耗的方法的流程示意图,如图5所示,该方法包括:

步骤501,将192个端口的dpu设备配置成两个96端口的vectoring组;

例如,本示例二中,n=192,端口1-96为矢量组1,端口97-192为矢量组2。一个vce管理器控制一个vectoring矢量组,矢量组1对应vce管理器1、矢量组2对应vce管理器2,vce管理器1、2都与同一个vcecpu连接。

其中,可以利用旧有的96端口dpu,实现192端口的串扰消除;只需要软件更新,而不需要重新购买新的vectoring处理芯片。例如本示例中,如图4所示,一种vectoring系统包括:

dsp线卡、vce管理器,使用2个96端口的原器件,vcecpu仍然采用1个96端口的原器件;将192根线对分成2个96端口的vectoring组;vp须要扩展为192端口的器件。

其中,以192端口dpu的vectoring分解为例,分成两个vectoring组,端口号1-96为组1,端口号97-192为组2,通过上述vectoring系统可以获得一个192*192的串扰系数矩阵h,将192*192的大矩阵,分解成4个96*96的小矩阵,如下所示:

其中,

其中,dpu1是96端口的dpu设备,是端口号1-96的vectoring矢量组1的串扰系数矩阵;

dpu2也是96端口的dpu设备,是端口号97-192的vectoring矢量组2的串扰系数矩阵;

dpu1,2是vectoring矢量组1串扰到矢量组2的串扰系数矩阵,也就是dpu端口号1-96串扰到cpe端口号97-192。

dpu2,1是vectoring矢量组2串扰到矢量组1的串扰系数矩阵,也就是dpu端口号97-192串扰到cpe端口号1-96。

dpu1、dpu1,2、dpu2,1、dpu2分别对应于矩阵a、b、c、d。

再将分解后的小矩阵a、b、c、d,由vcecpu做中间处理进行矩阵矩阵求逆,就可以求解得到192*192的h矩阵的预编码系数。具体的获得矢量组1、2的信道系数dpu1、dpu1,2、dpu2,1、dpu2的过程,参见步骤502。

步骤502,在初始化过程中,通过dpu设备(ftu-o)与cpe设备(ftu-r)之间的信令交互,确定两个vectoring矢量组的串扰信道系数;

其中,根据g.993.5协议中图10-1所示,dpu与fext计算有关的信令,主要是o-p-vector1,o-p-vector1-1,o-p-vector2,o-p-vector2-1等信令。

具体而言,获取两个vectoring矢量组信道系数的主要过程包括:dpu端口发送导频序列,dpu要求cpe上报es(errorsample,误差采样点)、cpe将es数据反馈给dpu端口、dpu端口告知cpe当前阶段结束等一些列动作,主要集中在o-vector-1与o-vector-2两个阶段。因此下面结合o-p-vectorxx信令来描述获取fext串扰矩阵的过程。

1、o-vevtor-1阶段:

vce管理器控制dpu端口发送导频序列(也可以称之为导频符号),经过dsl双绞线线对(串扰信道)后,被cpe接收;cpe保存串扰信道系数:

(1)、vce管理器1控制“端口号1”向cpe1发送o-p-vector1信令,信令中包含了“端口号1”的导频序列1。本发明中,o-p-vector1信令也可以称之为第一信令。

其中,vce如何分配导频序列为现有技术,在此不再赘述。

(2)、cpe1收到导频序列1,估计得到直传信道系数;cpe2-cpe96收到导频序列1,估计得到串扰信道系数,如图6所示。

(3)、cpe97-cpe192虽然是由vce管理器2控制的另一个矢量组,但是在握手阶段,已经被vce管理器2通过cl能力表参数告知导频序列1也是本矢量组的导频序列,因此cpe97-cpe192收到导频序列1,不会将导频序列1当干扰处理,会估计得到串扰信道系数,如图7所示。

以此类推,vce管理器1的96个端口完成a、b矩阵的估计,cpe把结果保存下来,等待上报。

同样,vce管理器2的96个端口完成c、d矩阵的估计,cpe把结果保存下来,等待上报。

vce管理器1和vce管理器2结束o-vector-1阶段。

2、vector-2阶段:

cpe将串扰信道系数反馈给dpu端口(vce管理器):

vce管理器1控制“端口号1”向cpe1发送o-p-vector2信令,内含o-vector-feedback消息,要求cpe1反馈计算得到的直传信道系数与串扰信道系数;cpe1正确接收o-vector-feedback消息后,向“端口号1”反馈r-ack;“端口号1”收到r-ack后,再向cpe1发送o-p-synchro3-1信令;cpe1收到o-p-synchro3-1后,将es数据(串扰信道系数)封装在r-vector-feedback消息中,上报给端口号1”。本申请中,o-p-vector2信令也可以称之为第二信令,r-ack也可以称之为确认消息,o-p-synchro3-1信令也可以称之为第三信令。

以此类推,vce管理器1的“端口号2”-端口号96”的处理过程与“端口号1”相同,如图8所示。

同样,vce管理器2的“端口号97”-端口号192”的处理过程也与“端口号1”相同。如图9所示。

vce管理器1与vce管理器2同时向cpe发送o-p-synchro4信令,结束vector-2阶段阶段,完成es上报的过程,即初始化过程中,vector2阶段的结束标志o-p-synchro4不再能由某个ftu-o单独决定,而应由矢量组内的ftu-o联合决定。本申请中,o-p-synchro4信令也可以称之为第四信令。

另外,所述矩阵a为第一矢量组的串扰系数矩阵、所述矩阵d第二矢量组的串扰系数系数,所述矩阵b为第一矢量组串扰到第二矢量组的串扰系数矩阵,所述矩阵c为第二矢量组串扰到第一矢量组的串扰系数矩阵。

b、c矩阵内系数的求取,需要在两个n/2端口的dpuvectoring设备之间交换信道串扰信息。以n=192为例,dpu端口1将导频符号1通过信道h1,97传递给cpe97;通过串扰信道h1,98传递给cpe98;...通过串扰信道h1,192传递给cpe192;如图7所示。而终端收到导频符号后,再将各自估计得到的信道信息,反馈给本地dpu相对应的端口,即96端口的dpu1与dpu2,将从另一个dpu串扰过来的信道信息反馈给vce的cpu,如图9所示。

步骤503,根据确定的串扰信道系数得到4个96*96的串扰系数矩阵a、b、c、d;

其中,vce管理器1与vce管理器2将cpe上报的信道系数(es数据)上报给cpecpu保存,由cpecpu将es数据转换成fext串扰矩阵;fext串扰矩阵为一个192*192的矩阵,将该192*192的矩阵分解为4个96*96的小矩阵a、b、c、d,即:

其中,所述矩阵a为第一矢量组的串扰系数矩阵、所述矩阵d第二矢量组的串扰系数系数,所述矩阵b为第一矢量组串扰到第二矢量组的串扰系数矩阵,所述矩阵c为第二矢量组串扰到第一矢量组的串扰系数矩阵。

步骤504,对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码矩阵;

其中,cpecpu将分解后的小矩阵a、b、c、d进行矩阵求逆,得到下行链路的预编码系数。

具体进行矩阵求逆得到预编码系数的过程包括:

(1)、将a、b、c、d四个96*96的小矩阵依次缓存在cpu内存中,如图10-1所示;

(2)、先将a矩阵读出,求取逆矩阵,得到a-1;再将a-1覆盖原来的a矩阵,如图10-2所示;

(3)、将a-1、b、c、d依次读出,并且计算(d-ca-1b)-1;再将(d-ca-1b)-1覆盖原来的d矩阵;如图10-3所示;

(4)、将a-1、b、c、(d-ca-1b)-1依次读出,并且计算得到预编码矩阵,如图10-4所示;

(5)、将计算得到的4个96*96的矩阵分别保存在内存中,就完成了对一个192*192矩阵的求逆过程。

cpu内存中所存储的数值,就是192端口vectoring矢量组的预编码系数。根据上述矩阵求逆过程,由于a矩阵的维数只有n/2,d-ca-1b的矩阵维数也只有n/2,因此矩阵求逆的算法复杂度为o(n3/4),只需要现有的n端口矩阵求逆的四分之一,大大减低了vectoring系统的功耗。进一步地,本示例二中,vectoring系统中,vcecpu只需要采用1个96端口的原器件,节省了芯片成本。

步骤505,vcecpu将96*96的vectoring矢量组的预编码系数,传递给vp,以便于vp根据所述预编码系数对下行数据进行预编码。

其中,192*192的所述vp,可以用4个原有的96*96vp,通过堆叠实现,如图11所示。

其中,vcecpu将4个96*96的预编码矩阵系数分别传递给图11中的192*192的vp。如图11所示,每个vp内部,96个端口之间两两相连,每根连线上有一个乘法器与一个寄存器。每个寄存器内配置预编码矩阵中的一个系数。因此一个96端口的vp需要配置96*96个寄存器系数。a、b、c、d矩阵,每个矩阵含有96*96个系数,将a、b、c、d分别配置到图11的4个96端口的vp,便实现了192端口vp的分解,然后vp可以对下行数据进行预编码处理,得到消除串扰后的各端口下行数据。

示例三

本示例三中,dpu设备支持384线对,veccpu的处理能力为96线对,取vectoring矢量组的端口数n=384。

根据示例一中现有的vectoring处理芯片的结构,如果支持dpu端口数n=384,则需要四个如图1所示的vectoring处理芯片。

而本发明示例三中,支持dpu端口数n=384,则vectoring处理芯片的结构与图4类似,只需要在图4的基础上增加双倍的dsp线卡、vce管理器,vcecpu跟图4一样只用一个:

dpu首先将384根线对分成两个192端口的vectoring组,来实现384端口的vectoring;

dsp线卡、vce管理器,需要使用2个192端口的原器件,或者4个96端口的元器件堆叠来进行端口的扩展;

vcecpu仍然采用1个192端口的原器件,或者1个96端口的原器件。

vp须要扩展为384端口的器件。

本示例三还提供了一种矢量化vectoring技术中节省功耗的方法,图12为本发明示例三提供的矢量化vectoring技术中节省功耗的方法的流程示意图,如图12所示,该方法包括:

步骤1201,将384个端口的dpu设备配置成两个192端口的vectoring组;

其中,可以将n个dpu端口配置为两个vectoring矢量组,n为2的任意倍数;一个vce管理器控制一个vectoring矢量组,

其中,可以利用旧有的96端口dpu,实现384端口的串扰消除;只需要软件更新,而不需要重新购买新的vectoring处理芯片。

例如,本示例中,共需要两个vce管理器,一个vce管理器可以由1个192端口的元器件电路,或者2个96端口的元器件电路堆叠实现。

例如,本示例三中,n=384,端口1-192为矢量组1,端口193-384为矢量组2。矢量组1对应vce管理器1、矢量组2对应vce管理器2,两个vce管理器都与同一个vcecpu连接。本示例中,vcecpu可以由1个192端口或者1个96端口的cpu电路实现。

其中,通过上述步骤中提到的vectoring获得一个384*384的串扰系数矩阵h,可以一次分解成4个192*192的小矩阵,再二次将每一个192*192的小矩阵分解成4个96*96的小矩阵。

例如,本示例中,以384端口dpu的vectoring分解为例,分成两个vectoring组,端口号1-192为组1,端口号193-384为组2,,将384*384的大矩阵分解成4个192*192的矩阵如下所示:

其中,

其中,dpu1、dpu1,2、dpu2,1、dpu2分别对应于矩阵a、b、c、d。

其中,a是vectoring矢量组1的串扰系数矩阵;

b是vectoring矢量组1串扰到矢量组2的串扰系数矩阵,

c是vectoring矢量组2串扰到矢量组1的串扰系数矩阵,

d是vectoring矢量组3的串扰系数矩阵。

通过这样迭代分解的方式,最终得到a、b、c、d四个192*192的串扰系数矩阵。由vcecpu做中间处理进行矩阵矩阵求逆,就可以求解得到384*384的h矩阵的预编码系数。具体的获得矢量组1、2的串扰信道系数dpu1、dpu1,2、dpu2,1、dpu2的过程,参见步骤1402。

另外,也可以将分解后的矩阵a、b、c、d,可以按照上述方法再进一步分解成四个96*96的矩阵,即:

步骤1202,在初始化过程中,通过dpu设备(ftu-o)与cpe设备(ftu-r)之间的信令交互,确定两个vectoring矢量组的信道系数;

其中,根据g.993.5协议中图10-1所示,dpu与fext计算有关的信令,主要是o-p-vector1,o-p-vector1-1,o-p-vector2,o-p-vector2-1。

具体而言,获取两个vectoring矢量组信道系数的主要过程包括:dpu端口发送导频序列,dpu要求cpe上报es、cpe将es数据反馈给dpu端口、dpu端口告知cpe当前阶段结束等一些列动作,主要集中在o-vector-1与o-vector-2两个阶段。因此下面结合o-p-vectorxx信令来描述获取fext串扰矩阵的过程。

1、o-vevtor-1阶段:

vce管理器控制dpu端口发送导频符号,经过dsl双绞线线对(串扰信道)后,被cpe接收;cpe保存串扰信道系数:

(1)、vce管理器1控制“端口号1”向cpe1发送o-p-vector1信令,信令中包含了“端口号1”的导频序列1;o-p-vector1信令,在本申请中,也可以称之为导频符号。

(2)、cpe1收到导频序列1,估计得到直传信道系数;cpe2-cpe384收到导频序列1,估计得到串扰信道系数;

(3)、cpe193-cpe384虽然是由另外的vce管理器控制的矢量组,但是在握手阶段,已经被vce管理器2通过cl能力表参数告知导频序列1也是本矢量组的导频序列,因此cpe193-cpe384收到导频序列1,不会将导频序列1当干扰处理,会估计得到串扰信道系数。

以此类推,vce管理器1、2控制384个端口完成串扰系数的估计,cpe把结果保存下来,等待上报。

vce管理器1、2结束o-vector-1阶段。

2、vector-2阶段:

cpe将串扰信道系数反馈给dpu端口(vce管理器):

vce管理器1控制“端口号1”向cpe1发送o-p-vector2信令,内含o-vector-feedback消息,要求cpe1反馈计算得到的直传信道系数与串扰信道系数;cpe1正确接收o-vector-feedback消息后,向“端口号1”反馈r-ack;“端口号1”收到r-ack后,再向cpe1发送o-p-synchro3-1信令;cpe1收到o-p-synchro3-1后,将es数据(串扰信道系数)封装在r-vector-feedback消息中,上报给端口号1”。

以此类推,vce管理器1的“端口号2”-端口号192”的处理过程与“端口号1”相同。

同样,vce管理器2的“端口号193”-端口号384”的处理过程也与“端口号1”相同。

vce管理器1、2同时向cpe发送o-p-synchro4信令,结束vector-2阶段阶段,完成es上报的过程。

步骤1203,根据确定的串扰信道系数得到4个192*192的串扰系数矩阵a、b、c、d;

其中,vce管理器1、2将cpe上报的信道系数(es数据)上报给cpecpu保存,由cpecpu将es数据转换成fext串扰矩阵,得到一个384*384的大矩阵,然后将大矩阵进行分解得到4个192*192的小矩阵a、b、c、d;即:

其中,所述矩阵a为第一矢量组的串扰系数矩阵、所述矩阵d第二矢量组的串扰系数系数,所述矩阵b为第一矢量组串扰到第二矢量组的串扰系数矩阵,所述矩阵c为第二矢量组串扰到第一矢量组的串扰系数矩阵。

步骤1204,对所述4个矩阵a、b、c、d进行矩阵求逆得到预编码系数;

其中,cpecpu将分解后的小矩阵进行矩阵求逆,得到下行链路的预编码系数。

具体进行矩阵求逆得到预编码系数的过程包括:

(1)、将四个192*192的小矩阵a、b、c、d

依次缓存在cpu内存中,如图10-1所示;

(2)、先将a矩阵读出,求取逆矩阵,得到a-1;再将a-1覆盖原来的a矩阵,如图10-2所示;

(3)、将a-1、b、c、d依次读出,并且计算(d-ca-1b)-1;再将(d-ca-1b)-1覆盖原来的d矩阵;如图10-3所示;

(4)、将a-1、b、c、(d-ca-1b)-1依次读出,并且计算得到预编码系数,如图10-4所示;

(5)、将计算得到的4个192*192的矩阵分别保存在内存中,就完成了对一个384*384矩阵的求逆过程。

cpu内存中所存储的数值,就是384端口vectoring矢量组的预编码系数。根据上述矩阵求逆过程,由于a矩阵的维数只有n/2,d-ca-1b的矩阵维数也只有n/2,因此矩阵求逆的算法复杂度为o(n3/4),只需要现有的n端口矩阵求逆的四分之一,大大减低了vectoring系统的功耗。

进一步地,本示例三中,vectoring系统中,vcecpu可以只需要采用1个192端口的原器件,节省了芯片成本。

另外,也可以将四个192*192的小矩阵a、b、c、d分别进行二次分解为4个96*96的小矩阵:

另外,也可以将分解后的矩阵a、b、c、d,可以按照上述方法再进一步分解成四个96*96的矩阵,即:

如此,vcecpu可以只需要采用1个96端口的原器件,更加节省了芯片成本。

步骤1205,vcecpu将384*384的vectoring矢量组的预编码系数,传递给vp,以便vp根据所述预编码系数对下行数据进行预编码处理。

其中,384*384的vp,可以用4*4个原有的96*96vp,通过堆叠实现,即两个如图11所示的vp。

其中,vcecpu将4个192*192的预编码矩阵系数分别传递给384*384的vp。

其中,每个所述vp内部,96个端口之间两两相连,每根连线上有一个乘法器与一个寄存器。每个寄存器内配置预编码矩阵中的一个系数。因此一个96端口的vp需要配置96*96个寄存器系数。a、b、c、d矩阵,每个矩阵含有192*192个系数,将a、b、c、d分别配置到4*4个96端口的vp,便实现了384端口vp的分解。

示例四

本示例四与示例二、三的不同在于,矩阵求逆的过程可以在示例二、三的基础上,进一步改进。

示例二、三中,求解出矩阵a的逆矩阵a-1的过程,可以包括:

(1)、先将矩阵a继续分解为4个(n/4)*(n/4)的串扰系数矩阵a1、a2、a3、a4;

(2)、求解出矩阵a1的逆矩阵a1-1,将a1-1覆盖矩阵a1;

(3)、根据矩阵a1-1、a2、a3、a4,计算出(a4-a3a1-1a2)-1;再将(a4-a3a1-1a2)-1覆盖a4矩阵;

(4)、根据矩阵a1-1、a2、a3、(a4-a3a1-1a2)-1计算得到矩阵a的逆矩阵a-1,即:

同样的,示例二、三中,根据矩阵a-1、b、c、d,计算出(d-ca-1b)-1,包括:

(1)、根据矩阵a-1、b、c、d,计算出矩阵d-ca-1b;

(2)、将矩阵d-ca-1b分解为4个(n/4)*(n/4)的串扰系数矩阵d1、d2、d3、d4;

(3)、求解出矩阵d1的逆矩阵d1-1,将d1-1覆盖矩阵d1;

(4)、根据矩阵d1-1、d2、d3、d4,计算出(d4-d3d1-1d2)-1;再将(d4-d3d1-1d2)-1覆盖d4矩阵;

(5)、根据矩阵d1-1、d2、d3、(d4-d3d1-1d2)-1计算得到矩阵d-ca-1b的逆矩阵(d-ca-1b)-1,即:

如此,h矩阵求逆的算法复杂度仅需o(n3/16),即在示例二、三的基础上再将计算量节省75%。若将h矩阵分解得越小,所需要的处理时延也变得越大。需要折衷的是,vectoring分解的处理时延要跟得上dsl信道的变化快慢。因此在计算复杂度与处理时延存在一个折衷。根据目前的vcecpu处理速度和器件工艺水平,申请人认为按照示例二和示例三的方法,对h矩阵进行一次矩阵求逆,或者按照示例四中对h矩阵进行两次矩阵求逆,是比较合理的一次矩阵求逆过程中的矩阵求逆次数。

例如,当n=384时,进行两次矩阵求逆的过程为:

(1)、h384*384矩阵是一个384*384的矩阵,分成a、b、c、d四个192*192的矩阵;

(2)、将h384*384矩阵对角线上的a、d矩阵,进行一次矩阵求逆,包括:

1、求解出矩阵a的逆矩阵a-1的过程,包括:

(1)、先将矩阵a继续分解为4个96*96的串扰系数矩阵a1、a2、a3、a4;

(2)、求解出矩阵a1的逆矩阵a1-1,将a1-1覆盖矩阵a1;

(3)、根据矩阵a1-1、a2、a3、a4,计算出(a4-a3a1-1a2)-1;再将(a4-a3a1-1a2)-1覆盖a4矩阵;

(4)、根据矩阵a1-1、a2、a3、(a4-a3a1-1a2)-1计算得到矩阵a的逆矩阵a-1,即:

2、根据矩阵a-1、b、c、d,计算出(d-ca-1b)-1,包括:

(1)、根据矩阵a-1、b、c、d,计算出矩阵d-ca-1b;

(2)、将矩阵d-ca-1b分解为4个96*96的串扰系数矩阵d1、d2、d3、d4;

(3)、求解出矩阵d1的逆矩阵d1-1,将d1-1覆盖矩阵d1;

(4)、根据矩阵d1-1、d2、d3、d4,计算出(d4-d3d1-1d2)-1;再将(d4-d3d1-1d2)-1覆盖d4矩阵;

(5)、根据矩阵d1-1、d2、d3、(d4-d3d1-1d2)-1计算得到矩阵d-ca-1b的逆矩阵(d-ca-1b)-1,即:

3、将a-1覆盖矩阵a;再将(d-ca-1b)-1覆盖d矩阵,进行第二次矩阵求逆,即根据矩阵a-1、b、c、(d-ca-1b)-1计算得到下面的矩阵,即:

如此,计算得到h-1384*384,完成了维数n=384的vectoring矢量组的预编码系数求取过程。h384*384矩阵求逆的算法复杂度仅需o(n3/16),由于将n=384的矩阵进一步分解成更多个n=96的矩阵,因此h-1384*384的计算量只需要原来的1/16。

本发明实施例还提供了一种矢量化技术中节省功耗的系统,包括:

权利要求13-22中任一项所述的矢量化控制实体,以及dpu设备和cpe设备;

所述dpu设备包含n个dpu端口,所述n个dpu端口被配置为两个vectoring矢量组,所述cpe设备包含与所述n个dpu端口一一对应的n个cpe。

本发明实施例还提供了一种矢量化控制实体,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一项所述节省功耗的方法。

本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现上述任一项所述节省功耗的方法的步骤。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1