使用二次似然函数进行数据统计建模的方法和系统的制作方法_4

文档序号:9794045阅读:来源:国知局
知项A(x),其不是估算参数的一部分。信号和背景的组合pdf则是
[0207]当信号被描述为基函数的线性组合时,方程式(9),pdf变成
[0209]丢掉一个常数项,则估算量是
[0211] 其中
[0212] a = JdxB(X)A(X)(解空间中的背景)(41)
[0213]以及
[0215]引入一个固定外部背景的结果则是简单地在解空间中将该背景项a从该源项b中 减去。然而,注意a是由所有X上的积分给出的,方程式(41),而b是这些观察Xl的和,方程式 (31)〇
[0216] 8.优化
[0217] 在方程式(4)中一般QLF的优化取决于该pdf如何被参数化。对于主要感兴趣的线 性非参数pdf,QLF是凸二次型,方程式(28),其中Q和b由方程式(30)和(31)给出。则待解梯 度方程式,方程式(29),是在Θ中的线性方程式。然而,在几乎所有情况中,线性方程式应该 被迭代地求解,如在图2中提供的基本流程图200所示出的。该流程图是如在本领域已知的 常规的迭代过程,因此被标记为"现有技术"。
[0218]简言之,如在流程图200中所示,常规的迭代过程开始于输入201,其提供了待建模 的初始参数202和数据203。使用初始参数201,构建数据模型207。数据模型207对数据203的 拟合值由步骤204中的参数估算量计算并且接着在步骤205中求拟合优度。如果该拟合值落 在一个预定范围或阈值内,这些估算的参数可以被显示(步骤208)和/或被存储在存储器中 (步骤209)。如果没有达到指定的拟合条件,通过在步骤206中更新这些参数、基于这些更新 后的参数构建一个修改的数据模型并且求拟合值来重复这个过程,直到满足期望的条件。
[0219] 图2中示出的基本类型的迭代方案通常在估算参数时是有效的,但是它们也会具 有严重困难,包括:
[0220] 1.大型的问题可以包含数以百万计的数据点和数以百万计的参数。那么将Β、;Τ 和Q作为具有万亿个元素的完整的矩阵存储在存储器中是不实际的。通常可能的是稀疏的 矩阵表示,但是对于许多系统而言,甚至稀疏矩阵都太大了。在这些情况下,必须 被看作为算子,其中使用大规模平行化重新计算每个矩阵乘法。
[0221] 2.作为推论,不可能采用任何需要B、Bt和Q的严重重排或任何相关矩阵的方法。特 别地,绝对不可能计算逆格拉姆矩阵T1,或甚至Q的楚列斯基分解(如普雷斯(Press)等人, 2007)〇
[0222] 3.对于多数问题,Q是病态的,即,其最大和最小本征值之间的比率的绝对值非常 大。这就是说,除非被控制住,否则源项b中的统计噪声在优化中会被大大地放大,导致解中 具有显著的伪值。因此优化方法必须具有良好的约束机制。
[0223]上述考虑建议使用迭代的共辄梯度(CG)法(福克斯、哈斯基与威尔金森1948;斯特 尼与施蒂费尔1952)<XG的优点是不需要显式计算任何矩阵,并且矩阵B、Bf和Q能够被应用 为算子。方程式(29)QLF梯度的Q0项被分成两步,从参数空间到数据空间的前向投影, 随后是从数据空间到参数空间的后向投影B。
[0224] 其中估算的参数的数量与数据点的数量相差无几或超过数据点的数量的非渐近 问题需要附加的约束以避免噪声被拟合为信号,导致解中的伪值。可以将约束方法(例如培 特等人的观点2005)以与将它们应用到其他统计估算量中大致相同的方式应用到QLF估算 量中,尽管它们可需要附加的统计估算量。
[0225] 大多数piX〇N_'K)方法应用例如使用拟合优度(G0F)统计确定平滑度,其可以与参 数估算量不同。例外的是新技术,其将PIXON?平滑应用到参数估算量的梯度上并且不需 要附加的G0F统计(美国专利号8,675,983)。
[0226] CG方法还借由向凸集上投影的方法(比蒙德、Lagendi jk和Mersereau 1990)将其 自身借给约束应用。例如,这些参数通常必须是非负的 [0227] Θ20 (非负条件)(43)
[0228]可以在每次迭代之后通过将负分量截断为零(培特等人2005)并且就像没有进行 截断一样继续来施加这一条件。
[0229] 9.预处理器
[0230] 可以通过添加预处理器(例如戈卢布和Van Loan 1996;萨德2003)来极大地加速 CG方法,用下式替换QLF的梯度
[0232]其中该线性方程式
[0233] P0 = c (预处理方程式)(4?5)
[0234] 可以被毫不费力的求解。所得方法被称为预处理共辄梯度(PCG)方法。
[0235] 一种聪明的、依赖问题的预处理器能够显著地加速PCG方法的收敛速度。故障保护 一般选择是简单的重新换算,其中Ρ被设定为Q的对角线部分,即,其元素由下式给出的对角 矩阵
[0236] P? = QcM = Jdx | Βα(χ) |2 (换算预处理器)(46)
[0237]该换算预处理器由于该半有限的Q的对角线优势而工作
[0239]预处理加速收敛的程度取决于Q的这些对角线外的项离方程式(47)中的极限有多 远以及Q的制约数。
[0240]对于大型问题而言,在实际中方程式(46)可以是难以计算的,然而,因为需要分离 地求每个基函数的值,其涉及将51与其之后的Βα应用为算子。替代的(安与费斯乐2003)是 将方程式(46)替换成
[0242]计算优点在于方程式(48)的和可以被计算成在单位参数的阵列上的单一向前投 影
[0244] 10.非线性的情况
[0245] 方程式(9)中解的线性非参数表示的简明性无论如何强调都不过分。尽管如此,弓丨 入附加的非线性参数以表征这些基函数偶尔会有用。一个示例应该是其宽度是可调节的基 函数。那么有必要添加QLF相对于非线性参数的偏导数并且追求非线性CG最优化(例如普雷 斯等人2007)。
[0246] 11.数值积分
[0247] 在前面的§10中注意到格拉姆矩阵Q仅取决于该系统,并且所有的数据依赖在源项 b中。这个差别的实际表现在于Q是数据空间上的一个空间积分(方程式(30)),而b是数据点 的和,方程式(31)。
[0248] 随着问题的维数增加,固定网格上的空间积分很快变成计算密集的,因为空间分 辨率需要每个维("维数祸根")中网点的相称数量。有两种方式来解决这一难题。一种方法 是在数据空间中形成自适应分层笛卡尔网格。一个替代方案是识别由数据点本身的位置提 供的"自然"无结构的网格。可以借由数据位置的V 〇r〇n〇i(1908)镶嵌划分数据空间,其中 (通常有限的)数据量V被划分成单元,其中空间中的每个点被分配到其最近的数据点位置 周围的单元中
[0249]
[0250] 参见普雷斯等人(2007)对于Voronoi镶嵌的讨论。Voronoi单元对体积V的限制借 由截断无界限的Voronoi单元来实现。
[0251] -旦数据空间被镶嵌,只有必要在数据点的位置处计算pdf。函数F(x)的空间积分 被每个数据点处的被积函数的值与它们的Vorono i单元的体积的乘积的和逼近。
[0253] (Vi很少被用来指明包括Voronoi单元i和其体积两者的点集)。
[0254] 应当承认,由于数据点位置上的统计性起伏,Voronoi单元具有起伏的体积,但是 积分函数在大量数据点上应该是平滑的,使得由Voronoi体积变化引起的额外方差应该不 足以严重影响计算的积分。
[0255]另一种可能性是构建形心的Voronoi镶嵌(CVT),其中镶嵌的结点也是其形心(Du、 法泊尔与Gunzburgerl999)。则在CVT的结点上计算该pdf并且将其与平滑单元体积进行积 分。能够通过插值法计算项源b需要的数据点位置上的pdf值。CVT的确定需要一定的计算努 力,但是有一个平行化概率方法可以做这些(Ju,Du和Gunzburger 2002)和CVT能量函数的 较新的牛顿型最优化,具有其C2平滑度的优点(Liu等人2009)。
[0256] 本文所提出的所有应用的中心点是在迭代参数估算中计算QLF,在图2中示出了其 基本步骤。如在§§4-11中所描述的,在图3的流程图中示出了这一计算的实质。数据与权重 301和基函数302被用于计算源项304和格拉姆矩阵305,接着将这些与参数303组合以便给 出QLF307。尤其对于大型问题而言,通常不显式地计算格拉姆矩阵307,但是在步骤306中, 基函数302与其共辄被应用作为算子。一种附加选项是基于在§11中详细描述的数据的 Voronoi镶嵌309使Voronoi积分308逼近数据空间上的积分。在流程图中借由虚线连接指示 出这一可选步骤。为清晰起见,在§§4-11中详细描述的其他可选特征中的一些特征被省略 了,但是对任何本领域技术人员而言应该是明显的。
[0257] 图4a和图4b将普通Voronoi镶嵌与CVT相比较,其中图4a示出了具有用黑点标记的 7个域点和用小(开)圆标记的Vorono i单元的形心的圆形域的普通Vorono i镶嵌,并且图4b 示出了具有7个域点的相同域的CVT。
[0258] 12.示例
[0259] 以下给出了用于统计估算的本发明的算法的应用示例:
[0260] 示例i:稀疏信号检测
[0261]如果抽样太稀疏,甚至是强信号都难以被检测。例如,可以从远距离观测军用信 号,只有很少数量的光子被检测到。图6提供了在非零常数背景上发出强周期信号加上一些 白噪声的源的模拟。图7显示了图7中信号的功率频谱(普雷斯等人2007),示出了不同频率 (省略了零频率)的相对强度。
[0262]因为检测器"离源很远",检测到的光子(如200个光子)数量相对较少。图8中光子 的到达时间的直方图示出了某个高频率行为,但是没有在图9中的直方图中的功率频谱中 检测到周期性。另一方面,QLF估算清楚地检测了在正确频率上的功率频谱的周期信号,如 图10中所看到的。
[0263] 示例ii:数字乳房造影术
[0264]数字乳房造影术实质上与传统乳房造影术使用相同的X射线造影术,但是该系统 配备了数字接收器和计算机而不是胶片暗盒。在标准乳房造影术中,使用X射线暗盒在胶片 上记录图像,并且该胶片由放射科医生使用灯箱查看并且随后被存储在设施档案护套中。 使用数字乳房造影术,使用特殊的电子X射线检测器捕捉乳房图像,其将图像转换为数字图 片供计算机监视器查看并且被存储在数字档案系统中。使用数字乳房造影术,图像的放大 倍数、定向、亮度和对比度可以被改变以帮助放射科医生将特定区域看的更加清楚。
[0265]数字全视野乳房造影术允许屏筛并且诊断乳房癌,并且最终可以替代传统的乳房 造影术。数字点视野乳房造影术允许更快速以及更准确的立体定向活检,其中从两个不同 的方向为乳房取像,从而提供更准确的三维活检指导。这导致更短的检查时间和极大改善 的病人舒适度以及便利性,因为病人必须保持静止的时间变得更短了。使用数字点视乳房 造影术,图像被数字化地采集并且立即被显示在系统监视器上,而传统的立体定向活检需 要将乳房X射线造影胶片曝光、显影并且然后查看,这极大地增加了乳房活检能够被完成之 前的时间。
[0266] 数字乳房造影术具有提供许多优于标准胶片乳房造影术的潜能:(a)改善了稠密 的和非稠密的乳房组织之间的对比度,(b)更快速的图像采集(小于一分钟),(c)更短的检 查时间(接近基于胶片的乳房造影术的一半的时间),(d)更容易的图像存储,(e)医生操作 图像用于更准确的检测乳房癌,(f)校正胶片曝光不足/过度曝光无需重复进行乳房造影的 能力,以及(g)图像的数字传输以供远程咨询其他医生。
[0267] 结合降噪技术的QLF(诸如PIX〇NK方法)能够借由更好地利用收集的数字数据 以改善乳房造影图像的锐度而有助于这些目标。这将使医生能够得到与更低X射线计数相 同的图像质量,允许更少剂量、更短的扫描时间,或者两者的组合。
[0268
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1