一种基于临床变量属性的决策分析方法与流程

文档序号：21094263发布日期：2020-06-16 20:09阅读：来源：国知局

技术特征：

1.一种基于临床变量属性的决策分析方法，用于针对来自同一数据源的数据库中各个样本对象、以及各样本对象分别对应相同各变量属性的数据，实现变量属性对样本对象的影响效应量化性分析，其特征在于，包括如下步骤：

步骤a.分别针对各个变量属性，获得变量属性对应各样本对象的数据中、彼此不重复的非空数据的个数，作为该变量属性所对应不重复数据个数m，m≥2；完成对各变量属性的上述操作后，然后进入步骤b；

步骤b.分别针对各个变量属性，若变量属性对应各样本对象的非空数据为数值型变量，则获得该变量属性对应各样本对象的非空数据中的最大值max、最小值min，以及针对该各非空数据进行由小至大排序或由大直小排序，并获得该排序中间位置的非空数据，作为中值med，完成对各变量属性的上述操作后，然后进入步骤c；

步骤c.分别针对各个变量属性，若变量属性对应各样本对象的非空数据为数值型变量，则根据该变量属性所对应的最大值max、最小值min、以及中值med，分别针对该变量属性所对应各样本对象的非空数据，应用线性效应函数进行效应归一化处理，获得该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y；

若变量属性对应各样本对象的非空数据为分类型变量，则以1/m的值，作为该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y；并且进一步若该变量属性所对应各样本对象的非空数据、等于样本对象所对应各变量属性的判定目标，则以1/m+0.5的值，作为该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y；

完成对各变量属性的上述操作后，然后进入步骤d；

步骤d.分别针对各个变量属性，根据变量属性所对应各样本对象的非空数据、分别对应的初级效应值y，获得该变量属性所对应的l2范数值；完成对各变量属性的上述操作后，然后进入步骤e；

步骤e.获得各变量属性分别所对应l2范数值的和sum(l2)，然后分别针对各个变量属性，以变量属性所对应l2范数值与sum(l2)的比值，作为该变量属性所对应的权重值；即获得各变量属性分别所对应的权重值，并进入步骤f；

步骤f.分别针对各个变量属性，分别针对变量属性所对应各样本对象的非空数据，以非空数据所对应初级效应值y与该变量属性所对应权重值的乘积，作为该变量属性所对应各样本对象的非空数据、分别对应的终级效应值，即该变量属性分别对各样本对象的影响效应量化值yy；完成对各变量属性的上述操作后，然后进入步骤g；

步骤g.分别针对各个样本对象，以样本对象所对应各变量属性的非空数据、分别对应的终级效应值yy之和，作为全部变量属性整体对该样本对象的影响效应量化值；即获得全部变量属性整体分别对各样本对象的影响效应量化值sum(yy)。

2.根据权利要求1所述一种基于临床变量属性的决策分析方法，其特征在于：还包括如下步骤h至步骤i，执行完步骤g之后，进入步骤h；

步骤h.分别针对各个变量属性，针对变量属性分别对各样本对象的影响效应量化值yy，按由低至高进行排序，然后顺序针对该排序、进行样本对象数量的累加，并做如下操作：以最小影响效应量化值，作为该变量属性对应0％数量样本对象的临界效应值yy1；

获取该变量属性对50％数量样本对象的各影响效应量化值中的最大值，作为该变量属性对应50％数量样本对象的临界效应值yy2；

获取该变量属性对75％数量样本对象的各影响效应量化值中的最大值，作为该变量属性对应75％数量样本对象的临界效应值yy3；

获取该变量属性对90％数量样本对象的各影响效应量化值中的最大值，作为该变量属性对应90％数量样本对象的临界效应值yy4；

以最大影响效应量化值，作为该变量属性对应100％数量样本对象的临界效应值yy5；

完成对各变量属性的上述操作后，即构成数据库中各变量属性分别对样本对象的影响效应量化值、相对数据库中全部样本对象的分布；然后进入步骤i；

步骤i.针对全部变量属性整体分别对各样本对象的影响效应量化值sum(yy)，按由低至高进行排序，然后顺序针对该排序、进行样本对象数量的累加，并做如下操作：

以最小影响效应量化值，作为全部变量属性整体对应0％数量样本对象的临界效应值sum(yy)1；

获取全部变量属性整体对50％数量样本对象的各影响效应量化值中的最大值，作为全部变量属性整体对应50％数量样本对象的临界效应值sum(yy)2；

获取全部变量属性整体对75％数量样本对象的各影响效应量化值中的最大值，作为全部变量属性整体对应75％数量样本对象的临界效应值sum(yy)3；

获取全部变量属性整体对90％数量样本对象的各影响效应量化值中的最大值，作为全部变量属性整体对应90％数量样本对象的临界效应值sum(yy)4；

以最大影响效应量化值，作为全部变量属性整体对应100％数量样本对象的临界效应值sum(yy)5；

即构成数据库中全部变量属性整体对样本对象的影响效应量化值、相对数据库中全部样本对象的分布。

3.根据权利要求2所述一种基于临床变量属性的决策分析方法，其特征在于：还包括用于针对与数据库来自同一数据源的目标样本对象、以及目标样本对象对应相同各变量属性的数据，获得变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布，包括如下步骤i至步骤iii，实现变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布分析；

步骤i.通过步骤a至步骤g的方法，获得各变量属性分别对目标样本对象的影响效应量化值yy，以及全部变量属性整体对目标样本对象的影响效应量化值sum(yy)，然后进入步骤ii；

步骤ii.分别针对各变量属性，根据变量属性对目标样本对象的影响效应量化值yy，结合数据库中各变量属性分别对样本对象的影响效应量化值、相对数据库中全部样本对象的分布，获得该变量属性对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布；即获得各变量属性分别对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布；然后进入步骤iii；

步骤iii.针对全部变量属性整体对目标样本对象的影响效应量化值sum(yy)，结合数据库中全部变量属性整体对样本对象的影响效应量化值、相对数据库中全部样本对象的分布，获得全部变量属性整体对目标样本对象的影响效应量化值、相对数据库中全部样本对象的分布。

4.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法，其特征在于：所述步骤c中，分别针对各个变量属性，若变量属性对应各样本对象的非空数据x为数值型变量，则根据该变量属性所对应的最大值max、最小值min、以及中值med，分别针对该变量属性所对应各样本对象的非空数据x，按如下公式：

若x≤med,

若x>med,

应用线性效应函数进行效应归一化处理，获得该变量属性所对应各样本对象的非空数据、分别对应的初级效应值y。

5.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法，其特征在于：所述步骤d.分别针对各个变量属性，针对变量属性所对应各样本对象的非空数据、分别对应的初级效应值y，先计算获得各初级效应值平方的和，再对该和开二次根号，所获结果，即为该变量属性所对应的l2范数值。

6.根据权利要求1至3中任意一项所述一种基于临床变量属性的决策分析方法，其特征在于：所述步骤b中，若变量属性对应各样本对象的非空数据的个数为奇数个，则针对各非空数据的排序，直接获得该排序中间位置的非空数据，作为中值med；若变量属性对应各样本对象的非空数据的个数为偶数个，则针对各非空数据的排序，获得该排序中间位置两个非空数据的平均数，作为中值med。

技术总结
本发明涉及一种基于临床变量属性的决策分析方法，采用全新逻辑设计方法，基于同一数据源的样本对象，针对样本对象所对应各变量属性的数据，先基于数值型变量与分类型变量的区分，获得数据所对应的初级效应值；然后基于初级效应值，获得各变量属性的L2范数值，并进一步获得各变量属性的权重值；最后结合初级效应值，获得变量属性对样本对象的影响效应量化值；如此实现变量属性对样本对象的影响的量化反应，为后续对变量属性数据的分析应用提供了客观、且准确的数据参考依据，有效提高了最终数据分析应用的准确性。

技术研发人员：成晓亮;张磊
受保护的技术使用者：南京品生医学检验实验室有限公司
技术研发日：2020.02.27
技术公布日：2020.06.16

完整全部详细技术资料下载

当前第2页1 2