用于确定数据点流内被平滑数据点的方法和设备的制造方法

文档序号:9872436阅读:347来源:国知局
用于确定数据点流内被平滑数据点的方法和设备的制造方法
【技术领域】
[0001] 本申请涉及一种用于确定数据点流内至少一个被平滑数据点的方法和设备。在本 发明的又一方面,本申请涉及该设备的用途。在本发明的又一方面,本申请涉及一种计算机 程序。在本发明的又一方面,本申请涉及一种具有在其上存储的数据结构的数据载体。
【背景技术】
[0002] 获取数据点流HuS1Kl Si Sz)是众所周知的问题,其发生在与记录科学或技术 效果有关的所有科学和技术领域中,所述科学或技术效果在时间^产生信号 81,其中Z是指 代在所述数据点流内记录的数据点的数量的任意数,并且其中所述数据点流是以在先前数 据点(tH,S 1-O后获取特定数据点U1,S1)的方式被连续获取的。典型的实例是在科学实验 过程中,以及在监视环境数据或监测用户(特别是患者)的任何种类的身体机能期间可以记 录的物理和/或化学和/或生物和/或环境实验数据。还可以设想许多其他实例。
[0003] 在数据获取领域中进一步公知的是,数据点流并不总是仅包括信号S1在时间^的 有效值。实践中,数据点流可以进一步包括信号S 1在时间^的无效值,或者,可替代地,预期 在特定时间ti被记录但可能缺失的信号si。然而,在已制定测量以提供实时或近实时信息 时,例如在确定用户(诸如在重症监护室永久监测的患者)的一个或多个身体机能时,从实 际经验中已知的这种情况并不特别令人满意。尤其是在要求实时或近实时信息以触发任何 进一步的装置和/或作出决定的情况中,无效值或缺失值可能严重影响数据点的记录的结 果,在一些情况中甚至是在无意识的方向。
[0004] 作为实例,William L.Clarke和Eric Renard在《糖尿病科学和技术杂志》6第2期 (2012)444-452页"Clinical Requirements for Closed-Loop Control Systems(闭环控 制系统的临床要求)"中提到用于I型糖尿病患者使用的闭环治疗系统。由此,描述了葡萄糖 变化的测量,并建议作为目标范围内、上和下的百分比的葡萄糖水平的记录合理替代复杂 的统计分析。因此,需要一种检测方法,以警告系统和患者关于改变的胰岛素给药,包括内 部压力和流量警报。葡萄糖监测仪传感器精度是另一种要求;它包括导致毛细血管葡萄糖 测量最终紧随传感器校准或更换的条件的定义。关键的临床要求将是当患者需要从闭环治 疗系统移动到胰岛素给药的人工管理时的彻底定义,或者相反在所请求的中断后能够切换 回闭环治疗系统。
[0005] 特别地,为了最小化底层有意义数据的损失或失真,同时抑制随机误差的影响,通 过采用已被指定为"数据平滑"的方法,已实现了从数据点流中提取信息。由此,对于相关数 据值序列,特别是与可观察的时间序列测量有关的,考虑误差减少问题,其预期要遵循一种 模式,所述模式可能不是预先已知的但能够在二维表示中起草,并且在其中能够假设误差 主要发生在两个维度的一个中。
[0006] 大多数公知的误差降低技术包括一种假设,即所记录的数据点,至少局部地,可由 程序近似或"配适",该程序通常包括线性的或更高阶多项式,并且其中关于偏差通常采用 "最小平方"标准。使用该程序特别允许通过分段多项式近似而最小化失真。由此,用于该程 序的数据点集被用来沿着整个数据集滑动。越多数据点被用于该程序,就越好去除随机误 差,然而,去除随机误差是以由应用该程序本身而引入系统误差为代价来实现的。在这方面 的流行技术是被指定为"样条拟合"的方法,"样条拟合"确定了连接数据子区域的三次方程 集。然而,基于该方法的这种多项式回归也可能导致延迟和失真。
[0007] 在已发现物理模型适于描述记录的噪声行为的情况下,已开发了所谓的"卡尔曼 (Kalman)滤波器"来平滑记录的数据点。然而,这种过滤器不适用于这种模型缺失或不适当 的情况。作为一个实例,在现实生活设置中监测用户的生理数据时,提供一种能合理描述类 似针对胰岛素摄入的葡萄糖浓度行为的参数的适当物理模型是不可行的。然而,已由 B.Wayne Bequette在《糖尿病科学和技术杂志》4第2期(2010年3月)404_418页"Continuous Glucose Monitoring:Real-time Algorithms for Calibrating,Filtering,and Alarms (连续葡萄糖监测:用于校准、过滤和报警的实时算法)"以及Andrea Facchinetti、 Giovanni Sparacino和Claudio Cobelli在《有关生物医学工程的IEEE事务》57第3期(2010 年3月)634_641 页"An Online Self-tunable Method to Denoise CGM Sensor Data(去噪 CGM传感器数据的在线自调谐方法)"分别提出了这种模型,其假定一个恒定参数,例如随时 间的葡萄糖斜率或随时间的第二葡萄糖导数。因此,不意外会在对应数据集中引入延迟和 失真。作为一个实例,Giovanni Sparacino等人建议了一种算法,在该算法中,从需要适配 生理变化以及患者、传感器间的变化或患者内随时间的变化的所记录的数据点中,经验地 发现模型和滤波器参数。尽管该算法从过去给定时间间隔中的数据点计算当前最佳参数, 但始终有相当大的风险,即不可预见的生理条件或不寻常的传感器行为导致被平滑数据集 的报告中的意想不到的、可能危险的误差。
[0008] 可替代地,已例如由K Rebrin等人在《美国生理学杂志》277第3期第1部分(1999年 9月)E561-571"Subcutaneous Glucose Predicts Plasma Glucose Independent of Insulin: Implications for Continuous Monitoring(独立于膜岛素的皮下葡萄糖预测血 浆葡萄糖:连续监测的影响)"提出了所谓的"维纳(Wiener)滤波器",用于平滑葡萄糖监测 数据,其最近已被D.Barry Keenan等人在《生物医学信号处理和控制》8第1期(2013年1月) 81-89页"Interstitial Fluid Glucose Time-lag Correction for Real-time Continuous Glucose Monitoring(用于实时连续葡萄糖监测的组织间液体葡萄糖时间滞 后校正)"中结合时间滞后校正所采用。不论为此目的其潜在适用性如何,维纳滤波器受其 基于阻碍其实现的复杂数学算法的事实的影响。
[0009] Eugen和lone la Iancu在《Craiova大学史册》第8卷(36) 2011年第2期1-6页 "Predictive Blood Glucose Control Using Exponential Smoothing Method(使用指数 平滑法的预测葡萄糖控制)"中,提出了一种适于从借助连续葡萄糖监测系统获取的患者数 据流中去除误差值的预测算法的结构。为了该目的,采用平滑常数α的单指数平滑被用于平 滑离散时间序列,其中α是从间隔0〈α〈1中选择的数。
[0010] 进一步地,美国2008/0167841Α1公开了一种用于通过使用缩放指数平滑作为数据 流处理的系统和方法,以维持直方图。
[0011] J.Haworth和Tao Cheng在2012年《计算机、环境与城市系统》第36卷第6期530-550 页"Non-parametric regression for space-time forecasting under missing data(用 于缺失数据下时空预测的非参数回归)"处理实时时空数据集,用于提供关于时空过程的预 测信息。在该方面,他们证实,时空数据序列中存在时空自相关改善了各自的预测。特别地, 采用非参数时空内核回归方法,用于在传感器故障假设下预测在伦敦中心的道路连接的未 来单位行程时间值,以及与其他类型的非参数回归方法相比已知对此目的有效。D.E.Roark 在《生物物理化学》108(2004)121-126页"Reverse Smoothing:a model-free data smoothing algorithm(逆向平滑:无模型数据平滑算法)"提出了一种被他称为"逆向平滑" 的方法,其能够显著减少或消除时间滞后效果同时保持指数平滑的降噪好处,所述指数平 滑是一种公知技术,例如在C.Holt 1957年原创文章的翻版,《国际预测杂志》20(2004)5-10 页"Forecasting seasonals and trends by exponentially weighted moving averages (通过指数加权移动平均值而预测季节性与趋势)"中予以描述。根据Roark,该方法适用于 预期数据点集会表现出平滑行为的情况。而且,足够数量的数据点是进一步必要的,以便在 本地表征斜率。作为典型的实例,Roark将该方法用于80个数据点。此外,在斜率急剧变化的 区域中,需要更高密度的数据点。Roark采用指数平滑,但是,不是对原始数据,而是对原始 数据的估计的一阶导数。为了达到良好的平滑,在各斜率集进行连续三次指数平滑,即所谓 的"通过"。由此,第一通过是在数据点集内从第二点到最后点的所谓"前向通过",而第二通 过是在数据点集内从倒数第二点到第一点的所谓"逆向通过"。第三前向通过结束平滑处 理。根据Roark,更有效作用于数据点集的一阶导数的平滑处理消除随机波动并更少地引入 对基础数据的失真。然而,如下文将进一步解释的那样,已发现在数据点流内包括大量缺失 值时,Roark提出的该方法面临着严重问题,在这种情况下,不可容忍的误差被引入平滑处 理中。此外,该算法被设计用于完整数据集,而不是数据流。由于逆向通过的原因,只能在已 完成数据获取之后,通过原始Roark过程生成输出。
[0012] 要解决的问题
[0013] 因此,本发明的目的是克服已知的用于确定数据点流中至少一个被平滑数据点的 方法和设备的缺点和劣势。特别地,旨在提出相应方法,可以以最小的失真提供良好程度的 平滑,而不引入任何滞后时间,并且甚至能够在同一时间报告导数。另外,这种方法在计算 上应该是简单的并且应该能够没有任何要求地采用固定参数向各个用户、传感器、或逐日 变量调整这些参数。特别地,该方法应该允许实时或近实时的报告,无论无需所记录的数据 是同等或近同等间距的事实。
[0014] 本发明的另一目的是提供一种设备,其允许最小化功耗以及不受测量装置干扰的 传感器的曝光,例如辐射冲击传感器。
[0015] 本发明的另一目的是提供在该设备被特别调适的情况下该设备用途。
[0016] 本发明的另一目的是提供一种计算机程序,其应该包括当程序在计算机或计算机 网络上执行时用于执行根据本发明的方法的计算机可执行指令。
[0017] 本发明的另一目的是提供一种数据载体,其应该具有在其上存储的数据结构,在 加载到计算机或计算机网络后,所述数据结构能够执行根据本发明的方法。

【发明内容】

[0018] 该问题通过方法、通过设备、通过用于确定数据点流内至少一个被平滑数据点的 设备的用途、通过计算机程序、以及通过具有独立权利要求的特征的数据载体来解决。从属 权利要求中列出了可以以独立方式或任意的组合来实现的优选实施例。
[0019] 如以下所使用的,术语"具有"、"包括"或"包含"或其任意语法变化因此以非排他 性的方式被使用。因而,这些术语既可以指代在该上下文描述的实体中除了由这些术语引 入的特征外不存在进一步特征的情况,也可以指代还存在一个或多个进一步特征的情况。 作为实例,表达"A具有B"、"A包括B"和"A包含B"可以既指代A中除了B没有其它元件的情况 (即,A仅仅、排他性地由B组成的情况),也可以指代实体A中除了 B还存在一个或多个其它元 件,诸如元件C、元件C和D、甚至进一步元件。
[0020] 进一步地,如下文中所使用的,术语"优选地"、"更优选地"、"特别地"、"更特别 地"、"具体地"、"更具体地"或类似术语被结合可选特征一起使用,而不限制替代的可能性。 因此,由这些术语引入的特征是可选特征,而不是旨在以任何方式限制权利要求的范围。如 本领域技术人员将意识到的,本发明可以通过使用替代特征来实施。类似地,由"本发明的 实施例中"或类似表达引入的特征旨在是可选特征,而没有任何关于本发明替代实施例的 限制,没有任何关于本发明的范围的限制,以及没有任何关于将以这种方式引入的特征和 本发明的其它可选或非可选特征组合在一起的可能性的限制。
[0021] 在第一方面,本发明涉及一种用于确定数据点流H11S1I内至少一个被平滑数据点 (tk,sk)的方法,其中I < i < z是指数据点流{ti,si}中的第i个数据点(ti,si),其中I < k〈z是 指第k个被平滑数据点(tk,Sk),其中第k个被平滑数据点(t k,Sk)将由根据本发明的方法在 数据点流H1, Sl}内确定,其中i、z和k为整数。如此处进一步使用的,数据点流被认为是z个 数据点的集合,其中根据时间顺序以在时间间隔At之后实施对特定数据点U 1, S1)的获取 的方式,获取数据点,在时间间隔At之后已实施了对先前数据点(tnsn)的获取。由此, 数字z构成一个指代特定数据点流内记录的数据点的数量的任意数值。作为实例,数字z可 以是1、2、3...等小数字,但实践中,也可以是几十、几百、几千或甚至更多数据点的大数字。 针对本发明,要特别强调的是,数字z的绝对值并不重要,因为各方法特别适用于对数据点 的实时或近实时报告,并且在仍在进一步记录数据点流时就已经可能被采用。然而,也可以 设想采用本方法的其它方式,例如,平滑处理仅在已结束数据获取之后开始。
[0022]本发明的能够已经开始平滑处理并同时仍然实施对数据点流的获取的优选特征 是特别相对于现有技术状态的。例如,如Roark描述的用于确定被平滑数据点的方法,要求 这种方法不能在已收集全部数据点集之前开始。而且,与现有技术状态相对,已发现根据本 发明的算法能够平滑甚至短数据点集,即,包括相对小数字z特别是低于20甚至低于10的范 围内的数据点的数据点集。因此,根据本发明的方法允许不考虑是否已记录流内所有z个数 据点的事实,确定进入数据点集内的至少一个被平滑数据点。然而,以替代的方式,本方法 仍然适用于已收集数据点流内所有z个数据点的情况。
[0023]类似于现有技术状态中已知的方法,数据点流HbS1I中的每个数据点H1, 81}可 以包括信号S1在时间^的有效值。此处,信号S1的有效值是在时间录的值,其中"在时间 t记录信号81 "尤其指借助任何技术设置获取任何物理、化学、生物、环境、和/或技术数据, 从而记录第二数据集,其中第二集内的值指定与信号S 1相关联的时间U。特别地,第二集中 的各值提供实际时间,在所述实际时间处或附近相关信号81被记录和/或以任何其它方 式相关。通
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1