基于实时医学数据流分析的重症及手术监测预警方法和系统的制作方法

文档序号:10725432阅读:472来源:国知局
基于实时医学数据流分析的重症及手术监测预警方法和系统的制作方法
【专利摘要】本发明公开了一种基于实时医学数据流分析的重症及手术监测预警方法和系统。本发明方法的具体步骤如下:(1)采用基于斜率变化的压缩算法对输入的多个医学数据流进行时间序列压缩;(2)对压缩后的多个医学数据流,用中心分裂式聚类算法进行聚类,发掘周期模式;(3)从发掘的周期模式中分析不同数据点之间的时间间隔的变化波动,获得周期模式的变化幅度,实现对观测病人的病情变化的监控及预警。本发明采用的系统包括时间序列压缩模块、时间序列聚类模块和周期异常模式发掘模块。本发明方法和系统用于分析医学数据流时,具有实时性、高准确性和稳定性,能有效监控及预警观测病人的病情变化。
【专利说明】
基于实时医学数据流分析的重症及手术监测预警方法和系统
技术领域
[0001] 本发明涉及医学数据监测技术领域,具体的说,涉及一种基于实时医学数据流分 析的重症及手术监测预警方法和系统。
【背景技术】
[0002] 在现阶段的医学诊断和医疗监护场景中,各种用于测量及显示病人生理特征(如 心率、血压)的医用设备(如心电图机、监护仪等)只具有数据采集和整合显示的功能,并不 能综合分析多条不同生理特征医学数据流之间的变化关系,进而难于进行突发状况预警。
[0003] 医学数据流在疾病预测中起着不可或缺的作用,它们可以提供更多关于病人的细 节信息(疾病发作的精确时间和发病阶段等):例如,在重症监护环境下,将多条实时采集的 同一病人不同生理特征的医学数据流进行实时异常分析,可以使主治医生掌握病人病情突 变的风险,从而提前进行干预达到挽救患者生命的目的。
[0004] 目前的医疗决策大多依靠主治医生或者手术师对实时采集到的医学数据流进行 人工判断:通过监护仪上显示的各种医学数据流的视觉信息,人工对比病人的各种测量指 标与基线或目标值的关系,并依据医生的医学认识判断病人病情的变化趋势。这种诊断方 式的问题在于:过度依赖医生的瞬时判断。其准确性会根据医生的经验发生波动并且不能 及时发现多条医学数据流之间复杂的变化趋势。随着医用传感器技术的飞速发展与普及, 能够采集到的医学数据流将会越来越多,单单凭借医生的经验对众多的医学数据流进行分 析判断并做出最有利于病人的决策是极其困难的。

【发明内容】

[0005] 为了克服现有技术的不足,本发明的目的在于提供一种的基于实时医学数据流分 析的重症及手术监测预警方法和系统。本发明采用计算机科学研究领域中的时间序列分析 和数据挖掘理论方法,通过对多条医学数据流进行实时分析发掘其中的异常情况,实现对 病人的病情变化的预警。
[0006] 本发明的技术方案具体介绍如下。
[0007] 本发明提供一种基于医学数据流分析的重症及手术监测预警方法,具体步骤如 下: (1) 采用基于角度关系的压缩算法对输入的多个医学数据流进行时间序列压缩; (2) 对压缩后的多个医学数据流,用中心分裂式聚类算法进行聚类,发掘周期模式; (3) 从发掘的周期模式中分析不同数据点之间的时间间隔的变化波动,获得周期模式 的变化幅度,实现对观测病人的病情变化的监控及预警;其中: 步骤(1)的基于角度关系的压缩算法,假设点4、?1、?23是医学数据流中随着时间推移 出现的4个连续的点,将这4个点看作一个基本结构(称为"4点结构"),用于判断原始数据流 中数据点是否冗余,A、P1连线和P1、B连线之间夹角记为QhAj〗连线和P2、B连线之间的夹 角为Θ 2; 压缩算法中,选择如下3个度量准则: (a) 衡量θι和Θ 2的相似程度; (b) 衡量θι和Θ 2接近180°的程度; (c) 1)当Α、Β分别位于Ρ1、Ρ2连线的两侧时:计算Α,Β两点在垂直方向上的距离与Α,Β两 点在平面空间上的距离比值;2)当Α、Β分别位于Ρ1、Ρ2连线的同一侧时:计算三角形Ρ1、Ρ2、 Β的面积和整个楔形的4、?1、?2、8的面积的比值,用1减去这个比值; 以上(a)、(b)和(c)的加和值域为(0,3],加和的值越大说明这4个点的分布越接近同一 条直线。
[0008]通过设置加和结果的保留阈值,可以从角度关系的侧面度量4个连续点之间的关 系,从而删除冗余的数据点,达到对原始医学数据流进行压缩的目的; 步骤(2)的中心分裂式聚类算法中,首先根据压缩后的医学数据流的每个尖峰的角度 大小进行排序,然后计算排序后的中点Co,通过设置Emax阈值将距离Co小于Emax的尖峰点划 分到同一个簇I,之后分别计算簇I两侧的数据点中点 Cl,C2,用相同的Emax阈值将距离&, C2小于Emax的尖峰点分别划分到簇II,簇III中;直到所有的数据点都被划分到不同的簇中 或者无法形成新的簇时,算法停止,从而将原有的所有尖峰点根据角度的大小划分成若干 独立的簇;最后通过计算每一个簇的标准差来衡量每一个簇的变化程度大小,选择标准差 最小的一个簇作为该数据流的周期模式; 步骤(3)中,对步骤(2)得到的周期模式进行进一步的分析,发掘周期模式中的异常波 动。周期模式的异常波动程度用Λ表示,具体的计算公式如下:
首先计算周期模式中两个连续尖峰点之间的是时间间隔,使用DBScan聚类算法得到的 时间间隔进行聚类,时间间隔相近的尖峰点划分到同一个簇中,将得到的簇个数记为 表示第i个簇的包含的时间间隔数目,表示所有的X个簇中包含时间间 隔做多的簇中的时间间隔数目,记为nkdk表示第k个簇中的时间间隔的平均值。w表示所有 间隔的个数,nk/w表示周期模式的稳定性,这个比值的值域为(0,1],越接近1表示该周期模 式越稳定。
[0009]本发明还提供一种基于实时医学数据流分析的重症及手术监测预警系统,包括时 间序列压缩模块、时间序列聚类模块和关联性分析模块;其中: 时间序列压缩模块,采用基于角度关系的压缩算法对输入的多个医学数据流进行压 缩; 时间序列聚类模块,对压缩后的多个医学数据流,用中心分裂式聚类算法进行聚类,发 掘周期模式; 关联性分析模块,从发掘的周期模式中分析不同数据点之间的时间间隔的变化波动, 获得周期模式的变化幅度,实现对观测病人的病情变化的监控及预警。
[0010]本发明的有益效果在于: (1)本发明设计了适应医学数据流特征的时间序列压缩方法,提出了一种基于角度关 系的压缩算法,这是对原始医学数据流进行分析及挖掘的初始步骤,该方法克服了 DP压缩 算法的缺点,既能最大程度保持原始医学数据流中的关键语义信息又具有高压缩率; (2)聚类算法是具有高准确性和高一致性的医学数据流序列聚类算法,可用于准确捕 捉原始数据流中的周期模式。
[0011] (3)可通过病人医学数据流序列的周期变化对病人进行实时监控。
[0012] (4)可通过对周期模式的分析对病人的突发情况进行预警。
【附图说明】
[0013] 图1是心电图第一导联数据流示意图。
[0014] 图2是DP压缩在8秒时间长度的心电图上得到的压缩结果图。
[0015] 图3是4点结构[六、?1、?2、8],?1、?2在六、8连线两侧示意图。
[0016] 图4是4点结构[六、?1、?2、8],?1、?2在六、8连线同侧示意图。
[0017] 图5是在心电图数据上找到的4点结构。
[0018] 图6是在心电图数据上应用新压缩算法得到的结果。
[0019] 图7是中心分裂式聚类算法的示意图。
[0020] 图8是在压缩后的心电图数据上发掘周期模式。
[0021]图9是本专利系统的具体流程图。
[0022]图10是本专利系统的原型界面。
【具体实施方式】
[0023]下面结合附图和实施例对本发明技术方案详细阐述。
[0024] 图9是本专利系统的具体流程图。
[0025] 1.时间序列压缩 时间序列压缩:计算机科学研究领域已经提出了多种时间序列压缩的方法,例如离散 小波变换(DWT)、DP压缩、分段线性近似(PLA)、适应性常数近似(APCA)、符号聚合近似(SAX) 等。上述方法各有特色,但都受限于语义信息完整性和压缩率的权衡一一为了最大程度地 保存语义信息,不得不增加摘要信息以便描述多种数据,从而降低了压缩率;如果在追求高 压缩率的前提下,不得不放弃某些细致的语义信息,牺牲语义完整性。大多数压缩算法需要 对时间序列进行分段,并分别对每一段进行分别进行压缩。分段会直接影响压缩的效 果一一对时间序列的自动分段与隐藏在时间序列背后的天然语义分段越接近,压缩的效果 通常越好。某些压缩方法(如DWT、SAX等)使用简单的均匀分段方法,这显然不能良好地反 映序列背后的语义分段;而某些使用具有适应性的非均匀分段方法的压缩算法(如PLA、 APCA等)往往具有更好的性能。
[0026] 现有的DP压缩算法存在两个瓶颈:1).参数的选择过于依赖原始数据集,这样带来 的问题是该算法不具有通用性。2).参数选择不当会丢失原始数据流中的形状信息。图1是 一段心电图(ECG)第一导联(Lead I)的不意图,图1中记录了一个病人1分钟内的心电数据 流[1]。使用DP压缩算法在这段心电图数据上进行压缩操作,设置DP压缩的参数为推荐参数: 0.5,得到的结果中抽取一部分如图2所示 图2中的实线代表的是原始的心电数据流,虚线代表的是DP压缩算法的结果。可以看到 圈中的形状信息在DP压缩算法的结果中被遗漏了。这样导致DP压缩后得到的结果会损失掉 原始心电数据流中的信息。
[0027]从图2可以非常直观的看出DP压缩在短时间间隔中进行压缩得到的结果会大大损 失原始的数据流中的信息,而DP压缩的参数又直接依赖于原始数据流本身,所以参数的选 择没有一个通用的标准,如果使用推荐的参数在不同的数据流上会得到很大的偏差造成最 终的分析结果无法反应原始数据流中的特征。下面我着重阐述两个问题:1.压缩为什么会 造成以上图2这种信息丢失的情况;2.为什么本专利技术必须在短时间间隔内对原始数据 流进行合理的压缩。回答这两个问题可以直接解释本技术中提出的压缩算法对于医学数据 流的应用场景有着重要的创新价值。
[0028] 1) DP压缩为什么会造成以上图2这种信息丢失的情况? 这是由于DP压缩是通过点到直线的距离来衡量其重要程度的,时间区域的大小直接 决定了基准直线的位置,当时间间隔较大的情况下,基准直线会在原始数据流流的中 心位置附近,这样可以将最偏离中心位置的数据点保留下来,而这些数据点形成的新的基 准直线与数据流中的其他数据点的距离是最大的,所以在时间间隔较大的情况下DP压缩丢 失的信息相对较少,比较难以从压缩后的数据流中体现出来。而随着时间间隔的减小,基准 直线会随之发生变化,这样造成在短时间间隔上应用DP压缩得到的结果会造成大量的形状 信息丢失。直观的解释,较大的时间间隔包含的点多,保留下来的形状信息就多,较小的时 间间隔包含的点少,无法从有限多的点中发掘包含形状信息的点,所以造成了图2中描述的 情况。
[0029] 2)为什么本专利技术必须在短时间间隔内对原始数据流进行合理的压缩? 本发明的目的是达到对病人的多条医学数据流进行实时的监控并对病人的病情 变化进行及时的预警,所以需要对病人短时间间隔中的数据流进行分析。
[0030] 回答了以上两个问题,也就明确的指出了现有的以DP压缩为代表的压缩算法无法 适应本发明的应用场景。
[0031] 本发明设计了新的一种基于角度关系的压缩算法应用在本专利技术中。点A,P1, P2,B,是随着时间推移出现的4个连续的点。可以发现4个连续出现的点组成一种简单的结 构,称为4点结构,它分为以下的两种情况。
[0032] (a)4 点结构[△、?1、?23],?1、?2在厶、8连线两侧 如图3所示,P1、P2两点出现在A、B两点连线的两侧。
[0033] 首先衡量Θ#ΡΘ2的相似程度:Min{ θ!,?〗} / Maxi?!,? 2},表示用Θ#ΡΘ 2 中大的角度除以小的角度,这个值越接近1,说明Θ :和Θ 2越相近。
[0034] 然后衡量?丨和? 2的大小:Min{ θ!,? 2} / ΡΙ(圆周率)〈Max{ Θ!,? 2} / PI(圆周 率),表示Θ4ΡΘ 2接近PI(180°)的程度,这个值越接近1,说明Θ4ΡΘ 2越接近180度, 说明点六,?1,?2,8应属于同一条直线。
[0035] 最后发现当A,B两点连成的斜线斜率越大,以上的两个条件需要进行放宽,所以可 以用(A、B两点的直线距离)/(A、B两点的距离)来刻画A、B两点连线的斜率大小,这个值越接 近1,说明A、B两点连线的斜率越大。
[0036] (b) 4点结构[△、卩1、?2、8],?1、卩2在厶、8连线同侧 同侧情况和以上描述的异侧情况非常相似,如图4所示。
[0037]除了衡量?#^? 2的相似程度以及接近PI(180°)的程度,需要计算三角形P1、P2、 B的面积和整个楔形4、?112、8的面积的比值,这个比值越接近于0,说明?1和?2两个点离得 越近。所以用1减去这个比值,作为衡量P1和P2临近程度的指标。
[0038] 注意到以上每种情况都包含3个度量准则,它们加起来的值域是(0,3],通过这个 参数本专利设计的新的压缩算法可以度量4个连续点之间的关系,通过设置阈值可以在原 始的医学数据流(如心电图(图1))上发掘4点结构并进行压缩,如图5所示。
[0039] 图5是在图1心电图中的一段区间上发掘的4点结构,压缩的目标是使用最少的数 据点重现图5实线的形状,由于原始数据流在采集的过程中会存在噪声,这些噪声有可能来 自测量设备或者外界干扰,不能避免,这样的情况会造成4点结构过多,不能达到理想的压 缩性能。所以可以使用DBScan算法对邻近的4点结构进行聚类,以达到提高压缩性能的目 的。整个压缩的结果如图6所示;看到新的压缩算法能够很好的保持原始数据流中的形状信 息,与此同时能够保持DP压缩算法近似的压缩性能。
[0040] 2.时间序列聚类 本发明需要对压缩之后的医学数据流进行聚类,挖掘医学数据流中蕴含的周期模式。 为此我们设计了一种中心分裂式聚类算法应用在本专利中,用于挖掘医学数据流中的周期 模式。如图7,根据压缩后的心电图数据的每一尖峰角度的大小,本发明设计一种中心分裂 式聚类算法将不同角度的尖峰划分到不同的簇中。
[0041] 步骤(2)的中心分裂式聚类算法中,首先根据压缩后的医学数据流的每个尖峰的 角度大小进行排序,然后计算排序后的中点Co,通过设置Emax阈值将距离Co小于Emax的尖峰 点划分到同一个簇I,之后分别计算簇I两侧的数据点中点&、C 2,用相同的Emax阈值将距离 &,C2小于Emax的尖峰点分别划分到簇II,簇III中;直到所有的数据点都被划分到不同的 簇中或者无法形成新的簇时,算法停止,从而将原有的所有尖峰点根据角度的大小划分成 若干独立的簇;最后通过计算每一个簇的标准差来衡量每一个簇的变化程度大小,选择标 准差最小的一个簇作为该数据流的周期模式; 中心分裂式聚类算法的思想如图7所示,算法首先根据每个尖峰的角度大小进行排序, 然后计算排序后的中点Co,通过设置Emax阈值将距离Co小于Emax的尖峰点划分到同一个簇 I,之后分别计算簇I两侧的数据点中点&、C2,用相同的Emax阈值将距离&、C2小于Emax的 尖峰点分别划分到簇II、簇III中;直到所有的数据点都被划分到不同的簇中或者无法形成 新的簇时,算法停止,从而将原有的所有尖峰点根据角度的大小划分成若干独立的簇。
[0042] 将以上描述的聚类算法应用到压缩后的数据流上,如图8所示的结果,压缩后的数 据流能够被合理的分成以下4个独立的簇。
[0043]最后通过计算每一个簇的标准差,选择标准差最小的一个簇作为该数据流的周期 模式。
[0044] 3.通过周期模式发掘原始数据流中的周期波动 本专利技术定义了用于衡量周期模式的波动程度大小的公式,从发掘的周期模式中衡 量原始数据流周期波动。借助该公式计算周期模式的异常程度从而达到对各个原始数据流 的周期异常进行评估的目的。
[0045] 本专利将以上技术整合在基于实时医学数据流分析的重症及手术监测预警系统 中,通过对病人实时采集的医学数据流分析得到的周期异常信息来实时监控及预警。图10 是本专利技术配套系统的原型示意图,左边两列呈现的多条医学数据流来自于同一病人, 最右边一列是对各条数据流实时分析得到的周期异常程度,病情信息推测信息显示在第二 列的第一个窗口中。
[0046] 该病人的诊断为低血压(Hypotension)和脉搏异常(Pulsus paradox)。经过本专 利软件对病人多医学数据流(ECGI、II、V、ART、PAP、CVP)分析挖掘得到ART(动脉压)指标的 异常程度达到0.96远远高于其他医学数据流的异常程度(ECGI: 0.04、II: 0.00、V: 0.00、 PAP: 0.00、CVP:0.00),表明通过本专利技术对该病人的发掘得到的周期异常复合其实际 病情。
[0047] 参考文献
[1] Goldberger AL, Amaral LAN, Glass L, Hausdorff JM, Ivanov PCh, Mark RG, Mietus JE, Moody GB, Peng CK, Stanley HE. PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals. Circulation 101(23):e215-e220〇
【主权项】
1. 一种基于医学数据流分析的重症及手术监测预警方法,其特征在于,具体步骤如下: (1) 采用基于角度关系的压缩算法对输入的多个医学数据流进行时间序列压缩; (2) 对压缩后的多个医学数据流,用中屯、分裂式聚类算法进行聚类,发掘周期模式; (3 )从发掘的周期模式中分析各个表征周期模式中关键点之间的时间间隔变化,发掘 周期模式的异常波动,实现对病人的实时监测W及病情变化的监控及预警;其中: 步骤(1)的基于角度关系的压缩算法,假设点4、?1、?2、8是医学数据流中随着时间推移 出现的4个连续的点,将运4个点看作一个基本结构,即表示为[A, P1,P2, B]的4点结构, 用于判断原始数据流中数据点是否冗余,A、P1连线和P1、B连线之间夹角记为Θι,Α、Ρ2连线 和Ρ2、Β连线之间的夹角为Θ 2; 压缩算法中,选择如下3个度量准则: (a) 衡量Θι和Θ 2的相似程度; (b) 衡量Θι和Θ 2接近180°的程度; (C) 1)当Α、Β分别位于Ρ1、Ρ2连线的两侧时:计算Α、Β两点在垂直方向上的距离与Α、Β两 点在平面空间上的距离比值;2)当Α、Β分别位于Ρ1、Ρ2连线的同一侧时:计算Ξ角形Ρ1、Ρ2、 Β的面积和整个模形的4、?1、?2、8的面积的比值,用1减去运个比值; W上(a)、(b)和(C)的加和值域为(0,3],加和的值越大说明运4个点的分布越接近同一 条直线; 通过设置加和结果的保留阔值,可W从角度关系的侧面度量4个连续点之间的关系,从 而删除冗余的数据点,达到对原始医学数据流进行压缩的目的; 步骤(2)的中屯、分裂式聚类算法中,首先根据压缩后的医学数据流的每个尖峰的角度 大小进行排序,然后计算排序后的中点Co;通过设置Emax阔值将距离Co小于Emax的尖峰点划 分到同一个簇I,之后分别计算簇I两侧的数据点中点Cl、C2,用相同的Emax阔值将距离Cl、 C2小于Emax的尖峰点分别划分到簇II、簇HI中;直到所有的数据点都被划分到不同的簇中 或者无法形成新的簇时,算法停止,从而将原有的所有尖峰点根据角度的大小划分成若干 独立的簇;最后通过计算每一个簇的标准差来衡量每一个簇的变化程度大小,选择标准差 最小的一个簇作为该数据流的周期模式; 步骤(3)中,对步骤(2)得到的周期模式进行进一步的分析,发掘周期模式中的异常波 动。周期模式的异常波动程度用A表示,具体的计算公式如下:首先计算周期模式中两个连续尖峰点之间的是时间间隔,使用DBScan聚类算法得到的 时间间隔进行聚类,时间间隔相近的尖峰点划分到同一个簇中,将得到的簇个数记为x,m 表示第i个簇的包含的时间间隔数目,;表示所有的X个簇中包含时间间 隔做多的簇中的时间间隔数目,记为nk;Sk表示第k个簇中的时间间隔的平均值,W表示所有 间隔的个数,nk/w表示周期模式的稳定性,运个比值的值域为(0,1],越接近1表示该周期模 式越稳定。2. -种基于实时医学数据流分析的重症及手术监测预警系统,其特征在于,包括时间 序列压缩模块、时间序列聚类模块和关联性分析模块;其中: 时间序列压缩模块,采用基于角度关系的压缩算法对输入的多个医学数据流进行压 缩; 时间序列聚类模块,对压缩后的多个医学数据流,用中屯、分裂式聚类算法进行聚类,发 掘周期模式; 关联性分析模块,从发掘的周期模式中分析不同尖峰点之间的时间间隔的变化波动, 获得周期模式的变化幅度,实现对观测病人的病情变化的监控及预警。
【文档编号】G06F19/00GK106096316SQ201610547207
【公开日】2016年11月9日
【申请日】2016年7月13日
【发明人】张彦春, 李烨, 梁燊
【申请人】复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1