1.一种基于临床变量属性的决策分析方法,用于针对来自同一数据源的数据库中各个样本对象、以及各样本对象分别对应相同各变量属性的数据,实现变量属性对样本对象的影响效应量化性分析,其特征在于,包括如下步骤:
步骤a.分别针对各个变量属性,获得变量属性对应各样本对象的数据中、彼此不重复的非空数据的个数,作为该变量属性所对应不重复数据个数m,m≥2;完成对各变量属性的上述操作后,然后进入步骤b;
步骤b.分别针对各个变量属性,若变量属性对应各样本对象的非空数据为数值型变量,则获得该变量属性对应各样本对象的非空数据中的最大值max、最小值min,以及针对该各非空数据进行由小至大排序或由大直小排序,并获得该排序中间位置的非空数据,作为中值med,完成对各变量属性的上述操作后,然后进入步骤c;
步骤c.分别针对各个变量属性,若变量属性对应各样本对象的非空数据为数值型变量,则根据该变量属性所对应的最大值max、最小值min、以及中值med,分别针对该变量属性所对应各样本对象的非空数据,应用线性效应函数进行效应归一化处理,获得该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y;
若变量属性对应各样本对象的非空数据为分类型变量,则以1/m的值,作为该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y;并且进一步若该变量属性所对应各样本对象的非空数据、等于样本对象所对应各变量属性的判定目标,则以1/m+0.5的值,作为该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y;
完成对各变量属性的上述操作后,然后进入步骤d;
步骤d.分别针对各个变量属性,根据变量属性所对应各样本对象的非空数据、分别对应的初级效应值y,获得该变量属性所对应的l2范数值;完成对各变量属性的上述操作后,然后进入步骤e;
步骤e.获得各变量属性分别所对应l2范数值的和sum(l2),然后分别针对各个变量属性,以变量属性所对应l2范数值与sum(l2)的比值,作为该变量属性所对应的权重值;即获得各变量属性分别所对应的权重值,并进入步骤f;
步骤f.分别针对各个变量属性,分别针对变量属性所对应各样本对象的非空数据,以非空数据所对应初级效应值y与该变量属性所对应权重值的乘积,作为该变量属性所对应各样本对象的非空数据、分别对应的终级效应值,即该变量属性分别对各样本对象的影响效应量化值yy;完成对各变量属性的上述操作后,然后进入步骤g;
步骤g.分别针对各个样本对象,以样本对象所对应各变量属性的非空数据、分别对应的终级效应值yy之和,作为全部变量属性整体对该样本对象的影响效应量化值;即获得全部变量属性整体分别对各样本对象的影响效应量化值sum(yy)。
2.根据权利要求1所述一种基于临床变量属性的决策分析方法,其特征在于:还包括如下步骤h至步骤i,执行完步骤g之后,进入步骤h;
步骤h.分别针对各个变量属性,针对变量属性分别对各样本对象的影响效应量化值yy,按由低至高进行排序,然后顺序针对该排序、进行样本对象数量的累加,并做如下操作:以最小影响效应量化值,作为该变量属性对应0%数量样本对象的临界效应值yy1;
获取该变量属性对50%数量样本对象的各影响效应量化值中的最大值,作为该变量属性对应50%数量样本对象的临界效应值yy2;
获取该变量属性对75%数量样本对象的各影响效应量化值中的最大值,作为该变量属性对应75%数量样本对象的临界效应值yy3;
获取该变量属性对90%数量样本对象的各影响效应量化值中的最大值,作为该变量属性对应90%数量样本对象的临界效应值yy4;
以最大影响效应量化值,作为该变量属性对应100%数量样本对象的临界效应值yy5;
完成对各变量属性的上述操作后,即构成数据库中各变量属性分别对样本对象的影响效应量化值、相对数据库中全部样本对象的分布;然后进入步骤i;
步骤i.针对全部变量属性整体分别对各样本对象的影响效应量化值sum(yy),按由低至高进行排序,然后顺序针对该排序、进行样本对象数量的累加,并做如下操作:
以最小影响效应量化值,作为全部变量属性整体对应0%数量样本对象的临界效应值sum(yy)1;
获取全部变量属性整体对50%数量样本对象的各影响效应量化值中的最大值,作为全部变量属性整体对应50%数量样本对象的临界效应值sum(yy)2;
获取全部变量属性整体对75%数量样本对象的各影响效应量化值中的最大值,作为全部变量属性整体对应75%数量样本对象的临界效应值sum(yy)3;
获取全部变量属性整体对90%数量样本对象的各影响效应量化值中的最大值,作为全部变量属性整体对应90%数量样本对象的临界效应值sum(yy)4;
以最大影响效应量化值,作为全部变量属性整体对应100%数量样本对象的临界效应值sum(yy)5;
即构成数据库中全部变量属性整体对样本对象的影响效应量化值、相对数据库中全部样本对象的分布。
3.根据权利要求2所述一种基于临床变量属性的决策分析方法,其特征在于:还包括用于针对与数据库来自同一数据源的目标样本对象、以及目标样本对象对应相同各变量属性的数据,获得变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布,包括如下步骤i至步骤iii,实现变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布分析;
步骤i.通过步骤a至步骤g的方法,获得各变量属性分别对目标样本对象的影响效应量化值yy,以及全部变量属性整体对目标样本对象的影响效应量化值sum(yy),然后进入步骤ii;
步骤ii.分别针对各变量属性,根据变量属性对目标样本对象的影响效应量化值yy,结合数据库中各变量属性分别对样本对象的影响效应量化值、相对数据库中全部样本对象的分布,获得该变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布;即获得各变量属性分别对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布;然后进入步骤iii;
步骤iii.针对全部变量属性整体对目标样本对象的影响效应量化值sum(yy),结合数据库中全部变量属性整体对样本对象的影响效应量化值、相对数据库中全部样本对象的分布,获得全部变量属性整体对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布。
4.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法,其特征在于:所述步骤c中,分别针对各个变量属性,若变量属性对应各样本对象的非空数据x为数值型变量,则根据该变量属性所对应的最大值max、最小值min、以及中值med,分别针对该变量属性所对应各样本对象的非空数据x,按如下公式:
若x≤med,
若x>med,
应用线性效应函数进行效应归一化处理,获得该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y。
5.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法,其特征在于:所述步骤d.分别针对各个变量属性,针对变量属性所对应各样本对象的非空数据、分别对应的初级效应值y,先计算获得各初级效应值平方的和,再对该和开二次根号,所获结果,即为该变量属性所对应的l2范数值。
6.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法,其特征在于:所述步骤b中,若变量属性对应各样本对象的非空数据的个数为奇数个,则针对各非空数据的排序,直接获得该排序中间位置的非空数据,作为中值med;若变量属性对应各样本对象的非空数据的个数为偶数个,则针对各非空数据的排序,获得该排序中间位置两个非空数据的平均数,作为中值med。