本发明涉及一种参考区间构建方法及装置,属于数据分析领域。
背景技术:
1、实验室检验项目的参考区间通常指健康个体测定参考值的95%中心分布,是解释检验结果、分析检验信息的一个基本尺度,在临床医学评估和决策过程中不可或缺,为疾病诊断、预后判断、疗效评价及健康监测提供分析依据。
2、但目前大多数实验室应用的参考区间的构建基于参考检测数据,利用单一的参考区间算法进行参考区间构建,构建的方法单一,导致参考区间构建的可靠性较差。
技术实现思路
1、本发明提供一种参考区间构建方法、装置及计算机可读存储介质,其主要目的在于提高对参考区间构建的可靠性。
2、为实现上述目的,本发明提供的一种参考区间构建方法,包括:
3、获取目标实验项目的检验数据集;
4、对所述检验数据集进行数据去重处理,得到第一检验数据集;
5、对所述第一检验数据集进行异常数据筛选,得到第二检验数据集;
6、对所述第二检验数据集进行有效数据筛选,得到第三检验数据集;
7、对所述第三检验数据集进行数据去隐私化处理,得到目标检验数据集;
8、判断所述目标检验数据集中的所有检验数值是否符合正态分布;
9、当所述目标检验数据集中的所有检验数值符合正态分布,分别利用多种预设参考区间算法,基于所述目标检验数据集中的所有检验数值进行计算,得到每种所述参考区间算法对应的参考区间;
10、计算每个所述参考区间与所述目标实验项目预设的设定参考区间的差异,得到对应的差异结果,并根据所有所述差异结果对所有所述参考区间进行筛选,得到所述目标实验项目的目标参考区间;
11、当所述目标检验数据集中的所有检验数值不符合正态分布,对每个所述检验数值进行数据正态性转换,得到对应的转换检验数值;
12、分别利用多种预设参考区间算法,基于所有所述转换检验数值进行计算,得到每种所述参考区间算法对应的转换参考区间;
13、对所述转换参考区间进行转换还原,得到对应的参考区间,并返回所述计算每个所述参考区间与所述目标实验项目预设的设定参考区间的差异步骤。
14、可选地,所述对所述第一检验数据集进行异常数据筛选,得到第二检验数据集,包括:
15、将所述第一检验数据集中预设数据类型的数据为空的检验数据确定为异常检验数据;
16、删除所述第一检验数据集中的所有异常检验数据,得到所述第二检验数据集。
17、可选地,所述对所述第二检验数据集进行有效数据筛选,得到第三检验数据集,包括:
18、识别所述第二检验数据集中不符合预设有效数据筛选规则的检验数据,得到无效检验数据;
19、将所述第二检验数据集中的所有无效检验数据进行删除,得到第三检验数据集。
20、可选地,所述对所述第三检验数据集进行数据去隐私化处理,得到目标检验数据集,包括:
21、获取需要进行隐私处理的所有隐私数据类型;
22、识别所述第三检验数据集中每种所述隐私数据类型对应的数据,并将识别的所有数据删除,得到目标检验数据集。
23、可选地,所述对所述第三检验数据集进行数据去隐私化处理,得到目标检验数据集,包括:
24、获取需要进行隐私处理的所有隐私数据类型及对应的加密规则;
25、识别到的所述第三检验数据集中每种所述隐私数据类型对应的数据,并利用每种所述隐私数据类型对应的加密规则对识别到的所述第三检验数据集中每种所述隐私数据类型对应的数据进行加密,得到所述目标检验数据集。
26、可选地,所述判断所述目标检验数据集中的所有检验数值是否符合正态分布,包括:
27、计算所述目标检验数据集中的所有检验数值的峰度系数;
28、计算所述目标检验数据集中的所有检验数值的偏度系数;
29、基于所述峰度系数及所述偏度系数进行计算,得到正态分布评估数值;
30、当所述正态分布评估数值大于预设的正态分布评估阈值,则所述目标检验数据集中的所有检验数值不符合正态分布;
31、当所述正态分布评估数值不大于预设的正态分布评估阈值,则所述目标检验数据集中的所有检验数值符合正态分布。
32、可选地,所述判断所述目标检验数据集中的所有检验数值是否符合正态分布,包括:
33、计算所述目标检验数据集中的所有检验数值的均值和标准差;
34、基于所述均值及所述标准差,利用正态分布的累积分布函数,计算每个所述目标检验数据集中每个检验数值对应的理论累积概率;
35、对所述目标检验数据集中的所有检验数值进行排序,计算所述目标检验数据集中每个检验数值对应的实际累积概率;
36、计算所述目标检验数据集中每个检验数值对应的理论累积概率及实际累积概率的差值,得到所述目标检验数据集中每个检验数值对应的检验差值;
37、当最大的所述检验差值大于预设临界值,则所述目标检验数据集中的所有检验数值不符合正态分布;
38、当最大的所述检验差值不大于预设临界值,则所述目标检验数据集中的所有检验数值符合正态分布。
39、可选地,所述计算每个所述参考区间与所述目标实验项目预设的设定参考区间的差异,得到对应的差异结果,并根据所有所述差异结果对所有所述参考区间进行筛选,得到所述目标实验项目的目标参考区间,包括:
40、计算每个所述参考区间与所述设定参考区间的相对偏差值;
41、获取所述目标实验项目的参考变化值;
42、筛选小于所述参考变化值的相对偏差值,得到初始相对偏差值;
43、将最小的所述初始相对偏差值确定为目标相对偏差值;
44、将所述目标相对偏差值对应的参考区间确定为目标参考区间。
45、可选地,所述对每个所述检验数值进行数据正态性转换,得到对应的转换检验数值,包括:
46、利用如下公式计算得到所述转换检验数值:
47、
48、其中,x为所述检验数值,m为预设的变换参数,y为所述检验数值x对应的转换检验数值。
49、为了解决上述问题,本发明还提供一种参考区间构建装置,所述装置包括:
50、数据获取模块,用于获取目标实验项目的检验数据集;
51、数据筛选模块,用于对所述检验数据集进行数据去重处理,得到第一检验数据集;对所述第一检验数据集进行异常数据筛选,得到第二检验数据集;对所述第二检验数据集进行有效数据筛选,得到第三检验数据集;对所述第三检验数据集进行数据去隐私化处理,得到目标检验数据集;
52、目标参考区间构建模块,用于判断所述目标检验数据集中的所有检验数值是否符合正态分布;当所述目标检验数据集中的所有检验数值符合正态分布,分别利用多种预设参考区间算法,基于所述目标检验数据集中的所有检验数值进行计算,得到每种所述参考区间算法对应的参考区间;计算每个所述参考区间与所述目标实验项目预设的设定参考区间的差异,得到对应的差异结果,并根据所有所述差异结果对所有所述参考区间进行筛选,得到所述目标实验项目的目标参考区间;当所述目标检验数据集中的所有检验数值不符合正态分布,对每个所述检验数值进行数据正态性转换,得到对应的转换检验数值;分别利用多种预设参考区间算法,基于所有所述转换检验数值进行计算,得到每种所述参考区间算法对应的转换参考区间;对所述转换参考区间进行转换还原,得到对应的参考区间,并返回所述计算每个所述参考区间与所述目标实验项目预设的设定参考区间的差异步骤。
53、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
54、至少一个处理器;以及,
55、与所述至少一个处理器通信连接的存储器;其中,
56、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的参考区间构建方法。
57、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的参考区间构建方法。
58、相比于背景技术所述问题,本发明实施例对所述检验数据集进行数据去重处理,得到第一检验数据集;对所述第一检验数据集进行异常数据筛选,得到第二检验数据集;对所述第二检验数据集进行有效数据筛选,得到第三检验数据集;对所述第三检验数据集进行数据去隐私化处理,得到目标检验数据集;分别利用多种预设参考区间算法,基于所述目标检验数据集中的所有检验数值进行计算,得到每种所述参考区间算法对应的参考区间;计算每个所述参考区间与所述目标实验项目预设的设定参考区间的差异,得到对应的差异结果,并根据所有所述差异结果对所有所述参考区间进行筛选,得到所述目标实验项目的目标参考区间;对数据进行多重筛选提高了数据的有效性,进而提高了基于筛选的数据构建的参考区间的有效性,同时利用多重参考区间算法构建多个参考区间,再筛选一个更可靠的参考区间作为目标参考区间,与只利用单一构建的方法构建一个参考区间作为目标参考区间相比,参考区间构建的更加可靠。因此本发明提出的参考区间构建方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高参考区间构建的可靠性。