一种基于数据校验技术的数据质量测评系统及方法

文档序号:9787640阅读:489来源:国知局
一种基于数据校验技术的数据质量测评系统及方法
【技术领域】
[0001] 本发明涉及医疗行业数据质量控制领域,具体涉及一种基于数据校验技术的数据 质量测评系统及方法。
【背景技术】
[0002] 在医疗数据的处理过程中,数据质量问题一直是数据处理过程中需要逐步改善和 提升的内容。那么如何将数据质量的改善过程循序渐进的落实到数据处理的各个阶段和步 骤中是当前关注和亟待解决的主要问题。
[0003] 数据质量的评测其核心是依赖数据的校验结果,而数据的校验过程是可以灵活安 插在数据处理各个阶段和过程中的,同时其校验规则的灵活定义也为数据质量的评测提供 较为灵活的评测基础。而数据的校验过程与数据质量评价间的映射,是基于一系列关键指 标项的关联映射,这些映射关系是数据校验值向数据质量值综合汇聚的依据,而这关联映 射关系又可根据对数据质量关注的不同也灵活调配,从而可覆盖多维度的医疗业务数据质 量控制。

【发明内容】

[0004] 针对现有技术存在的问题,本发明提供一种基于数据校验技术的数据质量测评系 统及方法。
[0005] 本发明的技术方式呢是:
[0006] -种基于数据校验技术的数据质量测评系统,包括:
[0007] 数据采集单元:获取异构医疗数据系统中的医疗数据源内业务数据信息,所述业 务数据信息的类型包括结构化数据与非结构化数据;
[0008] 校验单元:根据定义的校验规则、校验指标及其权重对获取的业务数据信息内容 进行合规性校验;
[0009] 质量评价单元:对获取的业务数据的不同质量评价指标进行评价,并根据各质量 评价指标的权重对业务数据的质量评价指标进行综合评分;
[0010] 报告反馈单元:将业务数据的质量评价结果以质量评分报告及数据校验报告的形 式反馈给数据维护人员;
[0011]统计分析单元:对业务数据实际质量评价结果进行统计分析,包括对业务数据运 行趋势及业务数据的各类质量评价指标对比情况。
[0012]所述的数据采集单元包括数据源适配模块和采集规则编辑模块;
[0013]数据源适配模块:用于根据异构医疗数据系统中的医疗数据源类型对医疗数据源 进行访问适配,实现对医疗数据源的连通以及对医疗数据源内业务数据信息的查询,并根 据采集逻辑的要求来动态访问不同医疗数据源,为采集规则编辑模块提供连通支持;
[0014]采集规则编辑模块:实现对异构医疗数据系统中的业务数据获取规则的编辑和维 护,通过支持对SQL脚本的编辑来实现对医疗数据源中结构化数据的获取以及对非结构化 数据获取规则的维护和管理。
[0015] 所述的数据质量评价单元包括指标映射模块和质量评价引擎模块;
[0016] 指标映射模块:根据定义的质量评价规则将质量评价指标与校验指标进行映射, 并对质量评价指标权重信息进行读取,将读取的数据提供给质量评价引擎模块,同时将质 量评价引擎模块计算的质量评价结果返回给统计分析单元及报告反馈单元;
[0017] 质量评价引擎模块:根据定义的质量评价规则,对某一类业务数据中某一质量评 价指标计算其质量评价值,并根据各质量评价指标的权重对该类业务数据的质量评价指标 进行综合评分得到质量评价结果。
[0018] 所述的校验单元包括校验执行引擎模块和校验规则维护模块;
[0019] 校验执行引擎模块:进行基于校验规则文件的数据校验,在进行数据校验的过程 中同步完成数据校验指标的映射与数据校验指标的权重计算;
[0020] 校验规则维护模块:实现对配置资源文件内容的维护管理,包括对校验规则文件、 校验指标文件及权重定义信息的维护和管理,校验规则文件、校验指标文件及权重定义信 息均以XML结构进行定义。
[0021] 所述校验规则文件中包括用于校验数据表间业务逻辑的正确性的数据重复校验 规则和数据关联校验规则,用于校验数据字段内数据内容的正确性的非空校验规则、正则 校验规则和值域校验规则。
[0022] 所述的报告反馈单元包括报告发布模块、质量评分报告模块、质量报告模块和配 置维护模块;
[0023] 质量评分报告模块:对某一类业务数据所涉及数据的不同质量评价指标的质量评 价结果汇总形成质量评分报告;
[0024] 校验报告模块:实现对某一类业务数据中所存在的错误进行汇总形成数据校验报 告;
[0025] 报告发布模块:根据报告信息配置表中定义的发布条件,将质量评分报告和数据 校验报告发布给订阅该报告的对象;
[0026] 配置维护模块:定义报告发布条件,实现对报告信息配置表的维护和管理,包括对 报告时间、报告周期、报告对象及报告类型信息的配置管理。
[0027] 所述的统计分析单元包括质量评分趋势模块和综合评分对比模块;
[0028] 质量评分趋势模块:根据质量评分报告,生成某一个时间区间内某类业务数据根 据某一类质量评价指标的数据质量趋势图表;
[0029] 综合评分对比模块:根据质量评分报告,生成同类型业务数据间针对某一类质量 评价指标的数据质量的对比图表。
[0030] 采用所述的基于数据校验技术的数据质量测评系统进行数据质量测评的方法,包 括以下步骤:
[0031] 步骤1、获取异构医疗数据系统中的医疗数据源内业务数据信息,所述业务数据信 息的类型包括结构化数据与非结构化数据;
[0032] 步骤2、根据定义的校验规则、校验指标及其权重对获取的业务数据信息内容进行 合规性校验;
[0033] 步骤3、对获取的业务数据的不同质量评价指标进行评价,并根据各质量评价指标 的权重对业务数据的质量评价指标进行综合评分;
[0034] 步骤4、将业务数据的质量评价结果以质量评分报告及数据校验报告的形式反馈 给数据维护人员;
[0035] 步骤5、对业务数据实际质量评价结果进行统计分析,包括对业务数据运行趋势及 业务数据的各类质量评价指标对比情况。
[0036] 有益效果:
[0037] 本发明的数据质量测评系统的实现是基于模糊评判校验技术,实现对医疗业务数 据的业务校验,对数据中所存在的问题进行汇总统计,并结合数据质量指标来为医疗业务 数据进行统一质量评价。数据校验指标项与校验规则是可以通过校验规则文件来灵活制定 的,其针对具体的业务数据特点来而进行定义;而数据质量指标的定义根据用户或数据分 析人员所关心的数据质量范围而进行定义,使得系统的数据质量评价结果满足数据分析人 员的数据质量诉求。
[0038] 本发明所解决的是区域医疗系统数据校验过程中的数据质量评测问题,使得数据 校验处理不仅是发现数据问题,而是将数据问题与数据质量进行综合评价,即从数据宏观 得到数据质量结论,也从数据微观跟踪校验细节,从而提升数据质量。本数据校验方法及质 量控制系统目前已经成功实施在区域医疗数据处理项目中,跟踪并实时分析医疗业务数据 质量情况,推动医疗卫生体系的建设和管理,为区域医疗系统的构建提供有力支撑。
【附图说明】
[0039] 图1是本发明【具体实施方式】的基于数据校验技术的数据质量测评系统结构框图;
[0040] 图2是本发明【具体实施方式】的数据采集单元结构框图;
[0041]图3是本发明【具体实施方式】的数据质量评价单元结构框图;
[0042]图4是本发明【具体实施方式】的校验单元结构框图;
[0043]图5是本发明【具体实施方式】的报告反馈单元结构框图;
[0044]图6是本发明【具体实施方式】的统计分析单元结构框图;
[0045] 图7是本发明【具体实施方式】的数据质量测评方法流程图;
[0046] 图8是本发明【具体实施方式】的应用结构示意图;
[0047] 图9是本发明【具体实施方式】的各级指标关联结构图;
[0048] 图10是本发明【具体实施方式】的各级文件关联结构图。
【具体实施方式】
[0049]下面结合附图对本发明的【具体实施方式】做详细说明。
[0050] 本发明的基于数据校验技术的数据质量测评系统及方法实现对卫生医疗数据进 行校验处理,将校验结果与数据质量评价指标进行统筹计算而获得客观质量评价
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1