球形解码器和使用树搜索的其它向量查找方法的并行处理与流程

文档序号：14213365阅读：286来源：国知局

本发明涉及使用树搜索的向量查找方法的并行处理。更具体地说但非排他地，本发明涉及使用多个处理元件执行球形解码或编码。

背景技术：

近年来，对无线容量的日益增长的需求引起了对从正交信号发射切换到非正交信号发射的兴趣。当允许进行非正交信号发射时，在不同信息流之间存在干扰。有前景的非正交方法的实例包含具有积极空间多路复用的传统分布式多天线(mimo)系统、超密网络架构、“快于尼奎斯特(faster-than-nyquist)”信令、非正交多址方案和网络译码。然而，为了在实践中像理论上预测的那样递送非正交信号发射的对应增益，有必要能够在最大可能性(ml)的意义上最佳地多路分用彼此干扰的信息流。

一种众所周知的用于最佳地多路分用彼此干扰的信号的技术是球形解码，其中对应的穷尽性搜索问题被转化成等效的树搜索。然而，球形解码器的复杂度随着干扰流的数目而以指数方式增加。这种高复杂度以及近年来传统处理器的速度已达到稳定水平的事实导致无法针对大量干扰流实现ml性能。因此，有兴趣开发并行化球形解码器的方法，所述方法将使得处理负载能够划分成在不同处理元件上运行的子过程。球形解码器并行化是一种极具前景的用于减少处理时延和功率消耗的方法。然而，并行化球形解码器并不简单平常。球形解码的效率取决于在不损害最优性的情况下提早修剪球形解码树的大部分的能力，且实际上，简单的并行化方法可能会导致树修剪效率更低、计算次数增加甚至处理时延增加。

在此情形下进行本发明。

技术实现要素：

根据本发明的第一方面，提供一种使用多个处理元件找出针对树搜索问题的向量解的并行处理方法，所述方法包括：获得树图；识别所述树图中可能是针对所述树图的解的部分的多个节点；将所述树图分割成多个子树，每一子树包含经识别节点中的一个或多个；通过向所述子树中的每一个分配所述处理元件中的一个或多个来并行处理所述多个子树；以及基于所述子树处理的结果确定所述解。在根据第一方面的一些实施例中，所述方法可用于找出针对树搜索问题的多个向量解。针对树搜索问题的解可被称为想要解(wantedsolution)。

在根据第一方面的一些实施例中，所述方法进一步包括，针对树图中的多个节点中的每一个，确定与所述节点是针对所述树图的解的部分的可能性有关的希望度量(metricofpromise)，其中基于所确定的希望度量识别可能是针对所述树图的解的部分的多个节点。当使用所述方法找出多个解时，希望度量可与所述节点是想要解中的至少一个的部分的可能性有关。

可替代地，所述方法可进一步包括使用向量搜索方法处理树图以获得候选解列表，其中从候选解列表中识别可能是针对所述树图的解的部分的多个节点。

在根据第一方面的一些实施例中，并行处理多个子树进一步包括：确定针对所述多个子树中的一个子树的局部解；将所述局部解传达到处理元件中的一个或多个，从而继续处理所述多个子树中的其它子树；以及基于针对所述多个子树中的所述一个子树的局部解，针对所述多个子树中的所述其它子树执行树修剪。

在根据第一方面的一些实施例中，分配处理元件中的一个或多个包括：针对每一子树，确定所述子树中由子树中的其它子树共享的节点数目；以及通过向具有更少共享节点的子树分配比具有更多共享节点的子树更多的处理元件来向子树分配处理元件。

在根据第一方面的一些实施例中，分配处理元件中的一个或多个包括：确定处理元件在子树之间的初次分配；使用初次分配的处理元件开始处理多个子树；以及在处理多个子树时，从多个子树中的一个向多个子树中的另一个动态地重新分配处理元件。

在根据第一方面的一些实施例中，提前确定并针对多个干扰矩阵中的每一个存储限定子树的信息，并且所述方法进一步包括：确定接收信号的目前干扰矩阵；以及检索与多个干扰矩阵中的一个相关联的所存储的限定子树的信息，所述多个干扰矩阵中的一个对应于接收信号的目前干扰矩阵。

在根据第一方面的一些实施例中，通过识别希望度量的值小于阈值的一个或多个叶节点将树图分割成子树，其中可通过将所有经识别叶节点包含在子树中并从子树中排除其它叶节点来将所述树图分割成子树。在此类实施例中，所述方法可进一步包括：基于希望度量，通过识别c个最有可能含有针对球形解码树的解的叶节点来识别c个叶节点，其中c等于处理元件的数目，其中树图被分割成c个子树，c个子树中的每一个含有经识别c个叶节点中的一个。

在根据第一方面的一些实施例中，可使用k-best球形解码来处理每一子树，并且在处理子树之前，所述方法可进一步包括：针对树图的每一层级，通过选择包含所述层级处的所有经识别一个或多个叶节点的所有所访问节点所需的最小值来分开选择k参数的值。

在根据第一方面的一些实施例中，所述方法可用于多载波系统中的球形解码，并且可进一步包括：通过执行将球形解码树分割成多个子树并通过向子树中的每一个分配处理元件中的一个或多个来并行处理子树的步骤来执行多个子载波中的第一个子载波的球形解码；以及针对多个子载波中的每一剩余子载波，依序重复将球形解码树分割成多个子树并通过向子树中的每一个分配处理元件中的一个或多个来并行处理子树的步骤，直到已经针对多个子载波中的每一个都执行了球形解码为止。

在根据第一方面的一些实施例中，使用次最佳球形解码算法来处理子树，并且子树中的每一个包含来自球形解码树的单个叶节点。

在根据第一方面的一些实施例中，可向子树中的一个子树分配处理元件中的两个或更多个，并且可通过将所述一个子树分割成两个或更多个次子树并向所述两个或更多个次子树中的每一个分配处理元件中的一个来处理子树中的所述一个子树。

根据本发明的第二方面，提供一种非暂时性计算机可读存储媒体，在其上存储用于使用多个处理元件找出针对树搜索问题的向量解的计算机程序指令，其中在经执行时，所述计算机程序指令被配置成执行以下步骤：获得树图；识别所述树图中可能是针对所述树图的解的部分的多个节点；将所述树图分割成多个子树，每一子树包含所述经识别节点中的一个或多个；通过向所述子树中的每一个分配所述处理元件中的一个或多个来并行处理所述多个子树；以及基于所述子树处理的结果确定所述解。

根据本发明的第三方面，提供用于找出针对树搜索问题的向量解的设备，所述设备包括：多个处理元件；用于获得树图的构件；用于识别所述树图中可能是针对所述树图的解的部分的多个节点的构件；用于将树图分割成多个子树的构件，每一子树包含所述经识别节点中的一个或多个；用于控制所述多个处理元件以通过向所述子树中的每一个分配所述处理元件中的一个或多个来并行处理所述多个子树并基于所述子树处理的结果确定所述解的构件。

附图说明

现在将参考附图仅举例描述本发明的实施例，其中：

图1是根据本发明的实施例的说明球形解码方法的流程图；

图2说明球形解码树的实例；

图3说明根据本发明的实施例的通过分割图2的球形解码树获得的多个球形解码子树；

图4是根据本发明的实施例的说明将球形解码树分割成子树的方法的流程图；

图5是比较常规非并行球形解码器的时延与不采用mop的假设并行球形解码器的时延的图形；

图6是比较常规非并行球形解码器的复杂度与不采用mop的假设并行球形解码器的复杂度的图形；

图7是根据本发明的实施例的比较常规非并行球形解码器的时延与两个并行球形解码器的时延的图形；

图8是根据本发明的实施例的比较常规非并行球形解码器的复杂度与两个并行球形解码器的复杂度的图形；

图9是根据本发明的实施例的绘制常规非并行球形解码器和两个并行球形解码器的随snr而变的符号差错率(ser)的图形；

图10是根据本发明的实施例的绘制常规非并行球形解码器(单pe)、具有64个pe且其中向每一子载波分配一个pe的并行球形解码器以及其中64个pe被配置成针对每一子载波依序执行并行球形解码的并行球形解码器的随snr而变的平均时延的图形；

图11是根据本发明的实施例的绘制精确ml解、常规非并行sic实施方案、32-pe并行球形解码器和256-pe并行球形解码器的随snr而变的ser的图形；

图12是根据本发明的实施例的绘制精确ml解、常规k-best方案和自适应k-best方案的随snr而变的ser的图形；以及

图13示意性地说明根据本发明的实施例的用于找出针对树搜索问题的向量解的设备。

具体实施方式

在本发明的实施例中，可使用多个处理元件并行找出针对树搜索问题的一个或多个向量解。一个或多个向量可为所关注的任何解，例如精确或近似解，并且可为极值(最大值或最小值)或近似值。本文公开本发明的实施例，其中树搜索问题是球形解码问题，但本发明的实施例并不限于在球形解码器中使用。在其它实施例中，例如，可在球形编码器或最大对数最大后验概率(map)软解码器中使用类似方法。并且，应了解尽管相对于搜索发射符号的一个或多个向量来描述本发明的实施例，但是本文公开的原理可易于适用于任何种类的搜索空间。例如，在一些实施例中，可执行软球形解码(软输出、软输入软输出)。

现将描述本发明的实施例，其中球形解码树被分割成子树，所述子树可接着通过多个处理元件进行并行处理。在本发明的实施例中，处理元件可采用各种形式。例如，在多处理器片上系统(mpsoc)实施例中，每一处理元件可为芯片上的单独处理器，在现场可编程门阵列(fpga)实施例中，每一处理元件可为fpga芯片的具体分配部分，并且在云处理实施例中，每一处理元件可为网格计算系统中的单独处理元件。

现将参考图1中所示的流程图描述根据本发明的实施例的球形解码方法。在图2中说明球形解码树的实例，并在图3中说明使用图1的方法分割图2的球形解码树所获得的子树。

通过图1中所示的流程图说明根据本发明的实施例的球形解码方法。所述方法可用于多路分用由任一无线通信网络中的单个设备或若干个设备(例如，在分布式mimo的情况下)接收的多个彼此干扰的信号，所述设备例如无线电信网络中的用户设备(ue)或无线接入点。接收信号y可表示为：

y＝hs+n

其中s是包含选自星座s的干扰数据符号中的每一个的具有大小n的符号向量，h是描述彼此干扰的信号的效应的干扰矩阵，并且n是噪声向量。例如，在具有空间多路复用的多输入多输出(mimo)无线系统的情况下，y可为模数转换之后的接收信号，并且h可为mimo信道矩阵。

一般来说，球形解码可用于解决具有以下形式的问题：

在本实施例中，在步骤s101中，基于干扰矩阵h，通过构造球形解码树来执行球形解码。将检测问题转换成树搜索问题的方法在球形解码的领域中是已知的，并且此处不会提供详细描述以免混淆本发明。然而，简单来说，可通过将干扰矩阵h分解成具有元素rij的上三角矩阵r的任何方法来构造球形解码树，以使得h＝qr。

接着，检测问题变为找出估计符号向量的树搜索问题，向量通过最小化欧几里德距离给出：

其中y′＝q^hy

可根据例如图2中所示的图的图来理解树搜索问题。球形解码树200包括被布置在从l＝(n+1)往下到l＝1的层级中的多个节点。在层级(n+1)处的节点在下文称为根节点，并且在层级1处的每一节点在下文称为叶节点。树中的每一节点表示可能的发射数据符号。层级l处的节点连接到层级l-1处的共b个节点，其中b是从中选择数据符号的符号集的大小。层级的数目等于发射向量的大小。因此，球形解码树包含共bⁿ个叶节点。在本实例中，b和n都等于4，但是本发明的实施例可应用于其中b和n为任何值的系统。从叶节点回到根节点的路径对应于一个可能发射向量。因此，叶节点中的一个将对应于实际符号向量s。通过识别具有最小欧几里德距离的此叶节点，可在最大可能性的意义上确定干扰信号的数据符号。

如由eq1(在下方)所定义，通过执行树搜索来找出具有最小部分欧几里德距离(pd)的叶节点，球形解码器确定估计符号向量递归开始于层级l＝(n+1)处的根节点，并且任一层级l处的任一节点(符号)的对应pd是属于相同路径的较高层级处的所有节点的函数。在本实施例中，每一节点的pd可计算为：

d(sl)＝d(sl+1)+δ(sl)(eq.1)

其中

其中sl＝[sl,sl+1,λ,sn]^t是这一树路径上的部分符号向量，且d(sn+1)＝0。接着，ml解对应于找出在层级l＝1处具有最小pd的ml。

执行树搜索以找出估计符号向量的过程被称为球形解码。本发明的实施例可应用于任何种类的球形解码器和树搜索问题，其中可通过与eq.1中所示的等式类似的等式描述或估计度量。

在构造球形解码树之后，在步骤s102中，确定球形解码树中的多个节点中的每一个的希望度量(mop)。每一节点的mop与所述节点是ml解的部分的可能性有关。换句话说，每一节点的mop与所述节点是从根(l＝n+1处的节点)到具有最小pd的叶(l＝1处的节点)的路径的部分的可能性有关。在步骤s102中，mop可用于识别树图中可能是针对所述树图的解的部分的多个节点。

mop可采用不同形式，这取决于实施例。例如，mop可为所述节点是针对球形解码问题的解的部分的精确概率，其可为正确解、最大可能性解，或一般地说，正确解的某一错误版本，或mop可为概率的近似值或界限(上界)，或与对应的可能性有关的任何度量。可替代地，mop可为概率性推理的临时度量，例如基于以下观察结果：具有较小pd的节点比具有较高pd的节点更有可能出现在ml解中。此外，在一些实施例中，mop可为在先前球形解码过程期间计算的pd的函数。此外，mop可考虑精确干扰矩阵h、h的近似值或函数，如h的分解或它的统计数据(例如，均值、方差)或它们的近似值(如果此类矩阵具有若干种实现的话)。mop可考虑噪声统计数据、函数或近似值。

在一些实施例中，在检测过程开始之前提前计算并存储mop。例如，在其中基于干扰矩阵的统计数据确定mop的实施例中，可提前计算mop，而无需知道每一元素rij的精确值，只有获得完整信道状态信息(csi)之后，所述值才可获得。

此外，尽管在本实施例中是基于mop识别最有可能是针对球形解码树的解的部分的节点，但在其它实施例中可使用用于识别最有希望的节点的不同方法。例如，在一些实施例中，可以使用例如列表球形解码器的向量搜索方法来获得候选解列表，而不需要计算球形解码树中的每一节点的特定mop。候选解中的每一个包含可能是针对球形解码树的解的部分的多个节点。

然后，在步骤s103中，球形解码树被分割成子树，每一子树包含在步骤s102中识别为是针对球形解码树的解的有希望的候选者的节点中的一个或多个。如上文所描述，在本实施例中，基于所确定的mop识别最有希望的节点。取决于实施例，树分割步骤s103可包含初次树搜索的所有节点，或可仅包含产生近似球形解码的节点子集。在一些实施例中，当在树分割步骤s103中排除节点时，可能不需要计算将被排除的节点的mop，但在一些实施例中，可在计算整个sd树中的所有节点的mop之后排除节点。

由于每一子树包含想要解的有希望的候选者，所以子树是几乎独立的，并且每一子树可进行处理而不必等待来自其它子树的结果。因此，本实施例的方法实现几乎会令人觉得麻烦的sd树的并行处理。相比而言，并行化球形解码器的现有技术方法不会产生独立处理线程，且因此需要并行处理器之间的强交互。

在一些实施例中，可在两个阶段中对子树进行处理。在第一处理阶段中，独立地处理子树以识别每一子树的一个或多个局部候选解，并且所述候选解在处理元件之间共享。接着，在第二处理阶段中，可考虑来自其它子树的经识别候选解，针对实际解搜索每一子树的先前未搜索的(无希望的)部分。

在图3中说明可从图2的sd树200获得的三个可能子树301、302、303的实例。图3中所示的子树包含第一子树301(左图)、第二子树302(中心图)和第三子树303(右图)。图3中所说明的子树301、302、303仅出于示例目的而示出，并且子树可采用不同形式，这取决于实际干扰矩阵h和分割策略，它们可根据将通过并行化实现的目标改变。例如，sd树200被分割成子树的方式可根据预期目标(例如，时延减少或功率降低)、将使用的树遍历算法以及在不同子树上并行操作的处理元件之间是否准许信息交换而不同。此外，尽管图3中说明三个子树301、302、303，但一般来说，球形解码树可被分割成任何数目的子树。

取决于实施例，每一子树可在一个或多个层级处包括多个节点，在图3中的第一子树301和第二子树302的情况就是如此，或者可在每一层级处包括单个节点，在图3中的第三子树303的情况就是如此。换句话说，每一子树可包含来自整个球形解码树200的单个叶节点，或可包含多个叶节点。一些节点可被包含在超过一个子树中。此外，在一些实施例中，子树在较高层级处可能不包含根或节点。

在本发明的实施例中，可通过检查每一树层级或遍及多个层级的所确定的mop来分割球形解码树200。用于分割球形解码树的方法可取决于sd并行化的目标，例如时延减少或功率降低是不是主要考虑因素。分割方法还可取决于当对每一子树执行球形解码时将使用的树遍历算法，和/或取决于在分配给不同子树的处理元件之间是否准许任何信息交换。例如，知晓遍及sd树的所有分区找出的最小pd可使得树修剪更高效，并且在一些实施例中，分配给子树的处理元件可被配置成将子树的最小pd传达到分配给不同子树的其它处理元件。

可在球形解码操作期间执行或可提前(‘离线’)执行将球形解码树200分割成子树的步骤。当离线分割球形解码树200时，可提前确定并存储限定子树的信息。由于将树图分割成子树是一种计算密集型过程，所以离线计算子树通过使得球形解码操作能够在正常操作期间更快速地完成而提供性能益处。在其中接收信号的干扰矩阵可随着时间推移改变的应用中，可获得多个树图，并针对干扰矩阵的多个可能值将其提前分割。接着，当接收到信号并且将执行球形解码时，可识别目前干扰矩阵，并且可针对目前干扰矩阵检索所存储的限定子树的信息。这避免了每次执行球形解码时都必须要构造树图、计算mop和确定子树。

在将球形解码树200分割成子树之后，在步骤s104中，通过向子树中的每一个分配处理元件中的一个或多个并使用所分配处理元件并行处理子树来处理子树。因此，分配给子树的每一处理元件或处理元件集合负责搜索整个树搜索的子空间，并找出子树内具有最小pd的对应叶节点。

为了找出子树内具有最小pd的叶节点，分配给子树的处理元件可使用各种树遍历算法。树遍历算法可大体上表征为深度优先或广度优先，但不属于这两种类别中任一种的其它变化形式是可能的，例如蒙特卡洛(montecarlo)树遍历算法。此外，在一些实施例中，处理元件可被配置成在执行球形解码时在彼此之间交换信息。例如，分配给不同子树的处理元件可交换关于到目前为止在它们自己的子树内找出的最小pd的信息，以使得其它子树在球形解码仍在进行中时能够进行更积极的修剪。

深度优先算法可保证ml解且效率极高，这是因为可基于子树内已经访问的叶节点的pd执行积极修剪。然而，它们的处理时延和复杂度并不固定，而是取决于干扰矩阵、信噪比(snr)和复用流的数目，且对于实际高阶系统(例如，大型mimo)来说可能过高。

广度优先算法通常在每一树层级访问预定数目的节点。它们展现出降低的时延要求，然而为了提供接近ml解的性能，搜索空间(所访问节点的数目)必须大到足以考虑“最坏情况”操作情形。因此，典型的广度优先算法展现出大体上比深度优先算法高的复杂度，并且它们的复杂度和功率消耗对于极其密集的符号星座和大量彼此干扰的流来说可能过高。

在一些实施例中，所有处理元件可使用相同的树遍历算法。然而，在其它实施例中，可针对不同子树使用不同的树遍历算法，并且考虑到特定子树的几何结构，可针对每一子树选择最高效的树遍历算法。

在一些实施例中，可以动态方式分配处理元件，由此最初分配给一个子树的处理元件可在检测符号向量期间重新分配给另一子树。例如，已结束处理子树的空闲处理元件可接着重新分配给仍然进行处理的其它子树。在一些实施例中，如果在处理期间以下很明显：所要解(例如，精确解或ml解)不大可能包含在第一子树中且第二子树是更有希望的候选者，那么可在第一子树的处理完成之前，将一个或多个处理元件从第一子树重新分配给第二子树。然而，在其它实施例中，可以静态方式分配处理元件，由此在检测符号向量期间不执行处理元件的重新分配。

继续参考图1，在子树已经处理之后，接着在步骤s105中，基于子树处理的结果确定整个球形解码树的ml解。例如，在步骤s105中，在所有子树之间具有最小pd的叶节点可识别为整个球形解码树的ml解。在一些实施例中，关于目前找出的最小pd的信息可在处理完成之前在处理元件之间共享，以实现子树的修剪。

现将参考特定实例描述本发明的实施例。对于所有实例，在具有64个子载波的多载波系统中假设在mimo检测的上下文中的球形解码，其中具有16-qam(正交振幅调制)的8×8mimo系统存在空间多路复用。发射/接收天线对之间的每一子信道建模为5抽头独立同分布(iid)瑞利(rayleigh)信道(在时域中)，并且采用加性高斯白噪声。这些参数仅作为实例使用，并且本发明的实施例还可适用于其中使用不同参数和调制技术的其它类型的系统中的球形解码。

实例1

在此实施例中，通过使用深度优先树遍历算法处理每一子树来执行球形解码。目标是精确ml解，即遍及整个sd树具有最小pd的叶节点。针对整个球形解码树中的每一节点计算是平均实际pd的近似界限的mop。在本实施例中，基于具有较小pd的节点更有可能被包含在ml解中，将球形解码树分割成子树。

在本实施例中，层级l和对应的符号(节点)sl的欧几里德距离被定义为：

d²(sl)＝||sl,0-sl||²

其中sl,0是最小化所述距离的符号：

对于例如qam的对称星座，mop可定义为：

m(sl)＝m(sl+1)+δm(sl)(eq.2)

其中

且δm(sn+1)＝0

在本实施例中，基于通过分解干扰矩阵h获得的上三角矩阵r的统计数据将项wll定义为：

在本实施例中，基于干扰矩阵的统计数据定义mop，并且d²(sl)仅是星座符号之间的距离的函数，所述距离是固定的且因此凭经验已知。因此，每一节点的mop的值并不取决于rij的实际值，且因此分割球形解码树的方式也不取决于rij的实际值。因此，在本实施例中，mop和子树可提前确定，这是因为它们仅是干扰矩阵统计数据和星座几何结构的函数。例如，可通过使用非并行列表球形解码器找出一定数目的具有较小度量m的叶节点(sl)来提前获得子树。由于将完整球形解码树分割成子树的步骤可离线进行，所以它不影响所述方法的复杂度。响应于干扰矩阵改变，例如在系统中的用户数目改变的情况下，可相应地调整分割方案。因此，应注意，在并行球形解码器的此实施例中，取决于节点距sl,0的相对距离，节点映射到节点，以便判定应该首先计算包含在每一子树中的实际节点sl,0。

mop和wll的替代性定义是可能的。在另一实施例中，wll可设置成等于rll以便基于精确干扰矩阵执行分割。

在图4中说明在本实施例中使用的分割方法。在此实施例中，在步骤s401中，针对整个球形解码树中的每一节点计算两个mop。每一节点的第一mop如上文eq.2中所定义的那样计算。在本实施例中，在球形解码树中的层级l处与星座符号s(k)有关的节点k的第二mopm2(k)被计算为：

在本实施例中，第二mop的定义采用加性高斯白噪声，并且是基于以下观察结果：两个自由度的卡方分布的概率密度函数是指数函数。因此，第二mop包含关于噪声统计数据的信息。然而，在其它实施例中，第二mop可使用不同定义。

然后，在步骤s402中，使用eq.3计算的第二mop的值用于识别整个球形解码树中不大可能是ml解的部分的一个或多个节点。在本实施例中，在步骤s402中，如果节点的m2(k)的值小于预定义阈值th，那么所述节点被识别为不大可能是ml解的部分。

接着，在步骤s403中，当使用根据eq.2计算的第一mop搜索整个球形解码树中最有可能含有ml解的叶节点时，排除在步骤s402中识别出的任何节点。在本实施例中，在步骤s403中搜索预定义数目c个叶节点，其中c等于可用处理元件的数目。也就是说，步骤s403中的搜索返回最有可能含有ml解的c个叶节点，如由第一mop指示。这些c个叶节点在下文称为‘植株(plant)’。

通过使用第二mop从在步骤s403实施的搜索中排除不大可能是ml解的部分的节点，本实施例可减小球形解码方案的总复杂度。

在一些实施例中，可计算植株而无需mop的特定数学定义，但要间接地使用向量搜索方法，例如通过执行一个或多个列表或传统的单个元素树搜索来获得候选解列表。候选解中的每一个包含可能是针对球形解码树的解的部分的多个节点。接着，植株可由候选解列表构成，所述植株中的每一个含有可能是解的部分的叶节点。通过这种方式，球形解码树可被分割成子树而无需计算mop。

接着，在步骤s404中，多个子树根据整个球形解码树构造，以使得在步骤s403中识别出的c个叶节点的所有所访问节点都被包含在子树中。每一子树围绕植株中的一个，也就是围绕在步骤s403中识别出的c个叶节点中的一个构造，所述构造是通过将其它叶节点添加到不属于步骤s403中识别出的c个最有希望的叶节点的植株的方式。通过这种方式，在步骤s404中构造的每一子树包含c个最有希望的叶节点中的一个以及来自整个sd树的一个或多个其它希望较小的叶节点。由于所有所访问节点都被包含在子树中，所以与常规的非并行球形解码方法相比并未经受性能下降。

在本实施例中，通过pd一超过来自另一子树的已知最小pd就终止分支的方式，一旦处理元件找出它的子树的第一候选解(针对所述子树具有最小pd的解)，此候选解就被传达到其它处理元件以实现高效子树修剪。

另外，在一些实施例中，可基于一些节点将被包含在多个植株中并因此导致在处理植株时要执行冗余计算，针对植株中的每一个计算冗余因数。在一些实施例中，冗余因数可用于排除最不可能含有ml解的一个或多个植株，以满足冗余要求并减小总体复杂度。

在步骤s404中获得子树之后，接着通过向每一子树分配一个处理元件，如在上文的图1的步骤s104中所描述的那样来处理子树。通过这种方式，c个可用处理元件中的每一个将处理c个最有希望的叶节点中的一个。可通过找出遍及经并行处理的子树具有最小pd的叶节点来获得最终ml估计。

在本实施例中，使用基于平均信道的特定mop，如eq.2和eq.3中所定义。然而，本发明的实施例不限于这些mop。例如，在其它实施例中，可使用不同mop，所述mop是基于特定信道实现的近似版本。

此外，在某些情形中，可能需要运行应用于相同干扰矩阵上的多个球形解码器。在这些情况下，本发明的实施例可被配置成运行一些球形解码器中的非并行列表球形解码器，并接着通过找出在若干个列表中出现更多次数的叶节点来识别子树。

在图5到10中说明常规非并行球形解码器、不具有概率性mop的并行球形解码器和根据本实施例的基于mop的并行球形解码器的模拟结果。模拟结果假设每一子树映射到一个处理元件上，所述处理元件负责使用球形解码执行所述子树的对应树搜索，并在每一处理时钟循环访问一个树节点。此假设准许关于时钟循环评估总体时延，其中实际时钟频率取决于特定球形解码器实施方案。此外，假设在处理元件找出它的子树的第一候选解之后，所述第一候选解是针对所述子树具有最小pd的叶节点，此pd被传达到所有其它子树球形解码器。

图5和6说明常规非并行球形解码器(单处理元件pe)和不采用mop的并行球形解码器的随信噪比(snr)而变的在循环方面的球形解码处理时延和在所访问节点方面的复杂度。由于采用每一循环一个节点的架构，所以常规单pe球形解码器在所访问节点方面的复杂度等于循环中的时延。

用作图5和6中的实例的并行球形解码器采用16个处理元件，并将初始球形解码树分割成16个类似子树，其中每一子树由树的两个较高层级处的四个随机选择的节点(例如，16个中的4个qam符号)组成。如图5和6中所示，此类无需考虑mop的极简的并行化方法实际上增加了而非降低了时延和复杂度，这是由于并行化阻止了高效的树修剪的执行。

与图5和6中所说明的极简的并行球形解码器相比，在图7和8中示出了根据本发明的实施例的基于mop的并行球形解码器的结果。基于mop的并行球形解码器还可被称作‘概率性’球形解码器，这是因为通过考虑给定节点出现在ml解中的可能性来执行并行化。此处，术语‘概率性’未必意味着mop是基于精确的数学概率。例如，在一些实施例中，概率性球形解码器可采用与给定节点出现在针对树搜索问题的所要解中的可能性有关的任何mop。如图7所示，相比于常规非并行球形解码器，概率性球形解码器提供减少的时延，并且增加的处理元件越多，时延减少得越多。并且，如图8所示，相比于如图6所示的产生高得多的复杂度的简单并行化方案，概率性球形解码器的复杂度与常规的高度优化的非并行球形解码器的复杂度相当。在图8中所示的实例中，球形解码树的mop计算和分割离线进行(即，不考虑特定信道实现)，并且因此，分割复杂度不影响总体并行球形解码复杂度。如图7和8中所示，处理时延随着处理元件的数目而有效地缩放，并且对于32个处理元件，可实现几乎数量级的时延减少，同时复杂度未显著增加。

图9是根据本发明的实施例的绘制常规非并行球形解码器和两个概率性球形解码器的随snr而变的符号差错率(ser)的图形。如图9中所示，概率性球形解码器的ser与非并行球形解码器的ser相同，这指示了将球形解码树分割成子树未损失精确性。

在本发明的一些实施例中，概率性球形解码方法可应用于具有mimo空间多路复用的多载波方案，其中每一子载波存在一个mimo系统。在此情况下，有必要针对每一子载波分开执行球形解码。在此类情形中，一种假设并行化方案可涉及向每一子载波分配一个处理元件并并行处理子载波。实际上，这将导致针对n个子载波并行运行n个单pe系统。在此情况下，将通过n个单pe系统中的最慢单pe系统确定找出ml解所需的处理时延。

然而，本发明人的研究已经展示出可通过依序而不是并行地处理子载波并向每一子载波应用概率性并行球形解码来获得进一步的性能改进。可通过使用概率性球形解码方案和多个处理元件针对每一子载波分开执行并行球形解码，例如上文所描述的并行球形解码。一旦针对第一子载波完成球形解码，就可接着使用处理元件针对第二子载波执行概率性并行球形解码，以此类推，直到所有子载波处理完毕为止。

在图10中示出多载波mimo系统中的不同球形解码方案的相对性能，图10说明根据本发明的实施例的绘制常规非并行球形解码器(单pe)、具有64个pe且其中向每一子载波分配一个pe的系统以及其中64个pe被配置成针对每一子载波依序执行并行球形解码的概率性球形解码器的随snr而变的平均时延的图形。尽管当通过向每一子载波分配一个pe来执行并行化时存在大约2×的性能增益，但是通过执行每一子载波的概率性并行球形解码并依序处理子载波可获得更显著的改进。

实例2

在此实施例中，通过使用次最佳球形解码器来执行球形解码，所述次最佳球形解码器在它们找出第一候选解时终止树搜索，这是连续干扰消除(sic)的一种形式。采用与实例1中相同的mop，并且通过识别最有可能含有解的c个叶节点，如上文在步骤图4的s403中所描述的那样识别‘植株’。然而，由于在每一子树中将仅访问一个叶节点，所以可省略图4中的构造子树的步骤(s404)。相反地，c个植株中的每一个用作子树，并且使用次最佳球形解码器进行处理。向每一子树分配处理元件以执行深度优先搜索，直到找出第一解为止。接着，可通过找出遍及经并行处理的子树具有最小pd的叶节点来获得最终估计。

图11是根据本实施例的绘制精确ml解、常规非并行sic实施方案、32-pe概率性球形解码器和256-pe概率性球形解码器的随snr而变的ser的图形。通常，次最佳球形解码器具有低时延，但也具有高ser，如图11所示。然而，如图11所示，当针对不同子树使用多个处理元件执行并行球形解码时，本实施例使得性能能够更接近于利用次最佳球形解码器获得的ml解。

实例3

在此实施例中，针对每一子树执行k-best球形解码。k-best球形解码器在本领域中已知，且具有减少的时延。然而，它们的性能是基于它们的k参数的选择。对于球形解码树中的不同层级，k的选择可能会改变，并且所述选择通常是推测性的，从而产生不必要的复杂度。

在本实施例中，采用与实例1中使用的mop相同的mop，并且如图4的步骤s403那样执行最有希望的叶节点的搜索。接着，针对球形解码树的每一层级，通过选择每一层级处使得每一层级处的经识别叶节点的所有所访问节点都将被包含所需的最小k参数来分开设置k参数。通过这种方式，使得在对每一子树执行球形解码时需要访问的节点的数目最小化。

图12是根据本实施例的绘制精确ml解、常规k-best方案和自适应k-best方案的随snr而变的ser的图形。如图12中所示，本实施例的自适应k-best方案提供在ser方面与常规k-best方案几乎相同的性能，但自适应k-best方案具有低得多的复杂度(416个节点对比1808个节点)。

现参考图13，示意性地说明根据本发明的实施例的用于找出针对树搜索问题的向量解的设备。所述设备包括多个处理元件100，其可采用各种形式，如上文所描述。例如，多个处理元件100可包含多个不同类型的处理元件，所述多个不同类型的处理元件包含在单独的装置中。所述设备进一步包括用于控制处理元件100以执行各种任务的控制单元110。控制单元110包括树图产生器111、节点识别单元112、子树产生器113、处理元件控制器114和计算机可读存储器115。取决于实施例，树图产生器111、节点识别单元112、子树产生器113和处理元件控制器114中的任一个可以硬件或软件实施，例如呈存储于存储器115中的计算机程序指令形式。

树图产生器111被配置成构造树图。节点识别单元112被配置成识别树图中可能是针对树图的解的部分的多个节点。子树产生器113被配置成将树图分割成多个子树，每一子树包含通过节点识别单元112识别的节点中的一个或多个。处理元件控制器114被配置成控制多个处理元件以通过向所述子树中的每一个分配处理元件中的一个或多个来并行处理多个子树，以及基于子树处理的结果确定解。

本发明的实施例可识别树图中最有可能是解的部分的最有希望的节点，并且可通过构造包含最有希望的节点中的不同节点的子树来将最有希望的节点分布在处理单元之间，如上文所描述。这实现了树搜索问题的高效并行处理，因为最有希望的节点分散在可用处理单元之间，并且避免了在不大可能含有所关注的解的树图的处理部分中占用一些处理元件的情形。因此，本发明的实施例可通过(例如)在球形解码器或球形编码器中使用并行操作的多个处理元件来高效地确定针对树搜索问题的解。

已经参考球形解码描述本发明的实施例。然而，在本发明的其它实施例中，本文公开的原理可以类似方式应用于球形编码。例如，当在下行链路方向上发射信号时可在基站处执行球形编码，以通过找出所发射数据向量的最佳干扰向量来进一步降低发射功率。因此，本发明的实施例还提供用于并行球形编码的方法和设备。

尽管已经参考图式在本文中描述本发明的某些实施例，但应理解，在不脱离如所附权利要求书中所限定的本发明的范围的情况下，多种变化和修改将是可能的。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：康斯坦丁诺斯·尼基托普拉斯;拉希姆·塔法佐利
技术所有人：萨里大学
我是此专利的发明人

上一篇：总线开关装置的制作方法
上一篇：智能控制面板及智能控制系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。