适用于心血管远程监测系统的数据质量控制方法

文档序号:6629582阅读:163来源:国知局
适用于心血管远程监测系统的数据质量控制方法
【专利摘要】本发明公开了一种适用于心血管远程监测系统的数据质量控制方法,包括:S1、对数据采集阶段提取的心电图数据的QRS波群的完整性,数据存储与管理阶段的数据的完整性、准确性、一致性和时效性,以及数据处理与分析阶段的数据的分类复杂度进行质量检测,判断数据质量是否符合标准;S2、当数据采集阶、数据存储与管理阶段及数据处理与分析阶段中的某个或几个的数据质量不符合标准时,采取相应的控制措施以使各个阶段的数据符合标准;对于质量达标的数据,提供最合适的分类模型以及数据预处理的建议。本发明实现了不同数据阶段的数据质量集成控制。
【专利说明】适用于心血管远程监测系统的数据质量控制方法

【技术领域】
[0001] 本发明涉及信息质量控制领域,特别涉及一种适用于心血管远程监测系统的数据 质量控制方法。

【背景技术】
[0002] 根据国家心血管病中心发布的《中国心血管病报告2013》,我国目前心血管疾病 患者人数高达2. 9亿,每年死于心血管疾病的人数约350万人,居各种死因的首位。心血管 疾病具有早期诊断困难、发病突然、致死率高等特点,并严重影响病人的日常生活质量。采 用心血管远程监测系统对病情相对稳定或行动不便的病人实施远程家庭监护,不仅可以24 小时监测患者的关键生理参数以便及早发现异常并预警,还可以节省患者的医疗费用、改 善其生活质量、缓解医院的床位压力,以及提高医疗服务覆盖的患者人数。
[0003] 尽管心血管远程监测系统有着上述的诸多优势,但在我国的使用率和普及率远远 低于欧美发达国家。除了使用成本和配套设施等方面的原因外,有一个至关重要的原因是 缺乏对这类系统中的数据质量进行控制,监测到的病人生理数据因各种原因而产生失真, 导致较高的误报警率,使得整个系统的有效性、实用性和可信度大大降低。
[0004] 在心血管远程监测领域,数据质量控制技术主要集中在数据采集阶段和数 据预处理阶段。在数据采集阶段,传感器定期自动检测(self-testing)和自动标定 (self-calibration)技术能够在一定程度上保证传感器的精度和准确度。在数据预处理阶 段,基于不同生理参数在时间、空间或者模式上的相关性的数据预处理技术能够在一定程 度上解决由环境噪声或者人为因素而产生的数据失真问题。
[0005] 虽然已经有不同的方法来控制心血管远程监测系统的数据质量,但是仍然存在以 下的问题有待解决: 1) 对心血管远程监测系统的数据质量缺乏有效的评估模型; 2) 不同阶段的数据质量控制技术各自为政,没有进行有效的集成。


【发明内容】

[0006] 本发明的主要目的在于,针对上述现有技术中的不足,提供一种适用于心血管远 程监测系统的数据质量控制方法。
[0007] 本发明解决现有技术问题所采用的技术方案是:一种适用于心血管远程监测系统 的数据质量控制方法,包括: 51、 对数据采集阶段提取的心电图数据的QRS波群的完整性,数据存储与管理阶段的 数据的完整性、准确性、一致性和时效性,以及数据处理与分析阶段的数据的分类复杂度进 行质量检测,判断数据质量是否符合标准; 52、 当数据采集阶、数据存储与管理阶段及数据处理与分析阶段中的某个或几个的数 据质量不符合标准时,采取相应的控制措施以使各个阶段的数据符合标准;对于质量达标 的数据,提供最合适的分类模型以及数据预处理的建议。
[0008] 进一步地,所述对数据采集阶段提取的心电图数据的QRS波群的完整性进行质量 检测的具体方法为: 依次对心电图数据进行低通滤波、高通滤波、幅值平方、移动窗积分、取门限等信号处 理步骤,提取QRS波群;

【权利要求】
1. 一种适用于心血管远程监测系统的数据质量控制方法,其特征在于,包括: 51、 对数据采集阶段提取的心电图数据的QRS波群的完整性,数据存储与管理阶段的 数据的完整性、一致性、准确性和时效性,以及数据处理与分析阶段的数据的分类复杂度进 行质量检测,判断数据质量是否符合标准; 52、 当数据采集阶、数据存储与管理阶段及数据处理与分析阶段中的某个或几个的数 据质量不符合标准时,采取相应的控制措施以使各个阶段的数据符合标准;对于质量达标 的数据,提供最合适的分类模型以及数据预处理的建议。
2. 根据权利要求1所述的适用于心血管远程监测系统的数据质量控制方法,其特征在 于,所述对数据采集阶段提取的心电图数据的QRS波群的完整性进行质量检测的具体方法 为: 依次对心电图数据进行低通滤波、高通滤波、幅值平方、移动窗积分、取门限等信号处 理步骤,提取QRS波群;
如果从采集到的心电图数据中能够提取完整的QRS波群,则该心电图数据的数据质量 符合标准。
3. 根据权利要求1所述的适用于心血管远程监测系统的数据质量控制方法,其特征 在于,所述数据存储与管理阶段的数据的完整性、准确性、一致性和时效性的质量检测方法 为: 完整性:完整性从属性和记录两个层面考虑,假设数据集的总记录数为K,就属性层面 而言,对于第2个属性,其取值缺失的记录数为Wi ,则该属性的完整性Cli的计算公式为:
就记录层面而言,假设数据集中有属性缺失的记录为OT,则数据集完整性Cl的计算 公式为:
完整性Cli和Gl的取值越高,说明数据的完整性越好,当Cli和超过预定的门限 值,则该数据的完整性达到标准; 准确性:准确性从属性和记录两个层面考虑,假设数据集的总记录数为《,就属性层 面而言,对于第?个属性,其取值与真实值不符合的记录数为t,则该属性的准确性為的 计算公式为:
就记录层面而言,假设数据集中有属性取值与真实值不符合的记录为是,则数据集准 确性2的计算公式为:
准确性和4的取值越高,说明数据的准确性越好,当和i超过预定的门限值, 则该数据的准确性达到标准; 一致性:心血管远程监测系统的最终目的是对被监测者的心脏健康状况做出准确判 断,即实现准确的模式分类,从这一角度考虑,数据集的一致性体现在各属性取值相同的记 录,其类别属性的取值应该一致,假设数据集的总记录数为β,各属性取值相同而类别属性 取值不一致的记录数为w,则数据集的一致性C2的计算公式为:
一致性C2的取值越高,说明数据的一致性越好,当C2超过预定的门限值,则该数据 的一致性达到标准; 时效性:时效性衡量数据在真实世界中发生变化与这种变化录入数据并影响数据使用 之间的时滞程度,对于以模式分类为最终使用目的的数据集,假设用于分类模型训练的记 录数为,用于该模型验证的记录数为W5 ,则数据集的实效性f的计算公式为:
时效性7的取值越低,说明数据的时效性约好,当Γ低于预定的门限值,则该数据的 时效性达到标准; 在数据存储与管理阶段,当用完整性、准确性、一致性、时效性组成的数据质量模型检 测数据质量时,如果其中有两个或者两个以上的指标不达标,则说明该数据的质量不达 标。
4.根据权利要求1所述的适用于心血管远程监测系统的数据质量控制方法,其特征在 于,所述数据处理与分析阶段的数据的分类复杂度的质量检测方法为: 分类复杂度从数据混叠度、数据可分性两个方面衡量数据质量是否达标,其中,数据混 叠度包括最大Fisher判别率(F1)、数据取值变化率(F2),而数据可分性则包括线性可分性 (L)和非线性可分性(N); (1)最大Fisher判别率(Fl) :F1为数据中各属性的Fisher判别率最大的那个值,计 算公式如下:
其中对于第i个属性,Λ,ft,C12,OT22分别指类别1、类别2的均 值与方差,类别1为:心脏健康状况正常,类别2为心脏健康状况异常,而 ,=1, 2,…,W,其中m是指属性的总个数; 最大Fisher判别率是通过不同类别属性取值的概率分布情况来衡量数据的混叠情 况,Fl值越高在一定层面反映了数据混叠轻微,可分性好;当Fl超过预定的门限值,则表明 Fl指标达标; ⑵数据取值变化率(F2):设5Ci) ,min(七sC;.)分别为类别?(例如:心脏 健康状况正常或者异常)中属性&的最大、最小取值,则F2的计算式如下: 数据取值变化率: 一一1
金一一 一一:? 其中:
F2是通过不同类别属性取值的情况来衡量数据的混叠程度,F2值越低反映了数据混 叠轻微,可分性好;当F2低于预定的门限值,则表明F2指标达标; (3) 线性可分性(L):用线性分类器:
对数据进行分类,数据的线性可分性(L)就是该分类器的错分率;L值越低在一定程 度上反映数据的线性可分性好;当L低于预定的门限值,则表明L指标达标; (4) 非线性可分性(N):用非线性分类器(如最近邻分类器)对数据进行分类,数据的非 线性可分性(N)就是该分类器的错分率,低的N值在一定程度上反映数据的非线性可分性 好;当N低于预定的门限值,则表明N指标达标; 在数据处理与分析阶段,用Fl,F2,L,N组成的分类复杂度检测数据质量时,如果其 中有两个或者两个以上的指标不达标,则说明数据质量不达标。
5.根据权利要求1所述的适用于心血管远程监测系统的数据质量控制方法,其特征在 于,所述数据采集阶段的数据质量不符合标准时,采取的相应的控制措施为:会发出警告, 要求重新采集数据,同时把质量不合格的数据删除; 所述数据存储与管理阶段的数据质量不符合标准时,采取的相应的控制措施为:会发 出警告,要求对不合格的数据采取相应的补救措施、或者要求增加新的数据,同时删除不合 格的数据; 所述数据处理与分析阶段的数据质量不符合标准时,采取的相应的控制措施为:会发 出警告,或者要求增加新数据,或者提供对数据进行补救的建议。
【文档编号】G06F19/00GK104462744SQ201410526662
【公开日】2015年3月25日 申请日期:2014年10月9日 优先权日:2014年10月9日
【发明者】邢延, 蔡延光, 蔡灏, 杨其宇 申请人:广东工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1