一种基于临床变量属性的决策分析方法与流程

文档序号:21094263发布日期:2020-06-16 20:09阅读:来源:国知局

技术特征:

1.一种基于临床变量属性的决策分析方法,用于针对来自同一数据源的数据库中各个样本对象、以及各样本对象分别对应相同各变量属性的数据,实现变量属性对样本对象的影响效应量化性分析,其特征在于,包括如下步骤:

步骤a.分别针对各个变量属性,获得变量属性对应各样本对象的数据中、彼此不重复的非空数据的个数,作为该变量属性所对应不重复数据个数m,m≥2;完成对各变量属性的上述操作后,然后进入步骤b;

步骤b.分别针对各个变量属性,若变量属性对应各样本对象的非空数据为数值型变量,则获得该变量属性对应各样本对象的非空数据中的最大值max、最小值min,以及针对该各非空数据进行由小至大排序或由大直小排序,并获得该排序中间位置的非空数据,作为中值med,完成对各变量属性的上述操作后,然后进入步骤c;

步骤c.分别针对各个变量属性,若变量属性对应各样本对象的非空数据为数值型变量,则根据该变量属性所对应的最大值max、最小值min、以及中值med,分别针对该变量属性所对应各样本对象的非空数据,应用线性效应函数进行效应归一化处理,获得该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y;

若变量属性对应各样本对象的非空数据为分类型变量,则以1/m的值,作为该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y;并且进一步若该变量属性所对应各样本对象的非空数据、等于样本对象所对应各变量属性的判定目标,则以1/m+0.5的值,作为该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y;

完成对各变量属性的上述操作后,然后进入步骤d;

步骤d.分别针对各个变量属性,根据变量属性所对应各样本对象的非空数据、分别对应的初级效应值y,获得该变量属性所对应的l2范数值;完成对各变量属性的上述操作后,然后进入步骤e;

步骤e.获得各变量属性分别所对应l2范数值的和sum(l2),然后分别针对各个变量属性,以变量属性所对应l2范数值与sum(l2)的比值,作为该变量属性所对应的权重值;即获得各变量属性分别所对应的权重值,并进入步骤f;

步骤f.分别针对各个变量属性,分别针对变量属性所对应各样本对象的非空数据,以非空数据所对应初级效应值y与该变量属性所对应权重值的乘积,作为该变量属性所对应各样本对象的非空数据、分别对应的终级效应值,即该变量属性分别对各样本对象的影响效应量化值yy;完成对各变量属性的上述操作后,然后进入步骤g;

步骤g.分别针对各个样本对象,以样本对象所对应各变量属性的非空数据、分别对应的终级效应值yy之和,作为全部变量属性整体对该样本对象的影响效应量化值;即获得全部变量属性整体分别对各样本对象的影响效应量化值sum(yy)。

2.根据权利要求1所述一种基于临床变量属性的决策分析方法,其特征在于:还包括如下步骤h至步骤i,执行完步骤g之后,进入步骤h;

步骤h.分别针对各个变量属性,针对变量属性分别对各样本对象的影响效应量化值yy,按由低至高进行排序,然后顺序针对该排序、进行样本对象数量的累加,并做如下操作:以最小影响效应量化值,作为该变量属性对应0%数量样本对象的临界效应值yy1;

获取该变量属性对50%数量样本对象的各影响效应量化值中的最大值,作为该变量属性对应50%数量样本对象的临界效应值yy2;

获取该变量属性对75%数量样本对象的各影响效应量化值中的最大值,作为该变量属性对应75%数量样本对象的临界效应值yy3;

获取该变量属性对90%数量样本对象的各影响效应量化值中的最大值,作为该变量属性对应90%数量样本对象的临界效应值yy4;

以最大影响效应量化值,作为该变量属性对应100%数量样本对象的临界效应值yy5;

完成对各变量属性的上述操作后,即构成数据库中各变量属性分别对样本对象的影响效应量化值、相对数据库中全部样本对象的分布;然后进入步骤i;

步骤i.针对全部变量属性整体分别对各样本对象的影响效应量化值sum(yy),按由低至高进行排序,然后顺序针对该排序、进行样本对象数量的累加,并做如下操作:

以最小影响效应量化值,作为全部变量属性整体对应0%数量样本对象的临界效应值sum(yy)1;

获取全部变量属性整体对50%数量样本对象的各影响效应量化值中的最大值,作为全部变量属性整体对应50%数量样本对象的临界效应值sum(yy)2;

获取全部变量属性整体对75%数量样本对象的各影响效应量化值中的最大值,作为全部变量属性整体对应75%数量样本对象的临界效应值sum(yy)3;

获取全部变量属性整体对90%数量样本对象的各影响效应量化值中的最大值,作为全部变量属性整体对应90%数量样本对象的临界效应值sum(yy)4;

以最大影响效应量化值,作为全部变量属性整体对应100%数量样本对象的临界效应值sum(yy)5;

即构成数据库中全部变量属性整体对样本对象的影响效应量化值、相对数据库中全部样本对象的分布。

3.根据权利要求2所述一种基于临床变量属性的决策分析方法,其特征在于:还包括用于针对与数据库来自同一数据源的目标样本对象、以及目标样本对象对应相同各变量属性的数据,获得变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布,包括如下步骤i至步骤iii,实现变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布分析;

步骤i.通过步骤a至步骤g的方法,获得各变量属性分别对目标样本对象的影响效应量化值yy,以及全部变量属性整体对目标样本对象的影响效应量化值sum(yy),然后进入步骤ii;

步骤ii.分别针对各变量属性,根据变量属性对目标样本对象的影响效应量化值yy,结合数据库中各变量属性分别对样本对象的影响效应量化值、相对数据库中全部样本对象的分布,获得该变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布;即获得各变量属性分别对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布;然后进入步骤iii;

步骤iii.针对全部变量属性整体对目标样本对象的影响效应量化值sum(yy),结合数据库中全部变量属性整体对样本对象的影响效应量化值、相对数据库中全部样本对象的分布,获得全部变量属性整体对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布。

4.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法,其特征在于:所述步骤c中,分别针对各个变量属性,若变量属性对应各样本对象的非空数据x为数值型变量,则根据该变量属性所对应的最大值max、最小值min、以及中值med,分别针对该变量属性所对应各样本对象的非空数据x,按如下公式:

若x≤med,

若x>med,

应用线性效应函数进行效应归一化处理,获得该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y。

5.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法,其特征在于:所述步骤d.分别针对各个变量属性,针对变量属性所对应各样本对象的非空数据、分别对应的初级效应值y,先计算获得各初级效应值平方的和,再对该和开二次根号,所获结果,即为该变量属性所对应的l2范数值。

6.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法,其特征在于:所述步骤b中,若变量属性对应各样本对象的非空数据的个数为奇数个,则针对各非空数据的排序,直接获得该排序中间位置的非空数据,作为中值med;若变量属性对应各样本对象的非空数据的个数为偶数个,则针对各非空数据的排序,获得该排序中间位置两个非空数据的平均数,作为中值med。


技术总结
本发明涉及一种基于临床变量属性的决策分析方法,采用全新逻辑设计方法,基于同一数据源的样本对象,针对样本对象所对应各变量属性的数据,先基于数值型变量与分类型变量的区分,获得数据所对应的初级效应值;然后基于初级效应值,获得各变量属性的L2范数值,并进一步获得各变量属性的权重值;最后结合初级效应值,获得变量属性对样本对象的影响效应量化值;如此实现变量属性对样本对象的影响的量化反应,为后续对变量属性数据的分析应用提供了客观、且准确的数据参考依据,有效提高了最终数据分析应用的准确性。

技术研发人员:成晓亮;张磊
受保护的技术使用者:南京品生医学检验实验室有限公司
技术研发日:2020.02.27
技术公布日:2020.06.16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1