一种基于Cox回归模型的老人健康数据分析方法_3

文档序号:9911469阅读:来源:国知局

[0080] 本发明按照上文提到的RR值分类将危险因素分为5类,一类危险因子作为独立的 一组进行,分别进行单独一组协变量检验。
[0081] 假设某组拥有m个值,如:(β1; ...,0m)。假设为= ... =&!1=0,1〈111〈?(其中 P为研究初始的危险因素的个数. . .,i3m)中至少有一个h不为0。这里将 # = 〇0P...,足;)最大部分似然函数的对数值记作本发明将似然函数的检验水准α设 为0.05〇 Λ Λ
[0082] X2的值为:ζ2=2[1 η?(#;所有 x) -hiL(多識去1ν·.,\,以外的所有 χ)] (6)
[0083] 可以证明在Ho成立的条件下,统计量服从自由度为m的卡方分布。
[0084] 通过卡方检验,如果假设成立的概率落在接受域之内,则这组回归系数对应的危 险因子与老人健康状况的关联性较弱可以被忽略,否则就不能被忽略,该组的危险因子就 被收入危险因子集合中。
[0085] 在进行完所有五组回归系数的假设检验后,排除与老人健康无关的因子,得到与 之具有强关联的因子的集合X。
[0086] 步骤D:通过以上步骤,获得了与老人健康相关联的因子的集合X,设为X=(X1, χ2, ...,xt) '。通过以上对群体健康数据的测试,得到影响老人健康的关联危险因子的集合 X,设为X= (Xl,X2, ...,Xt)和相关危险因子的回归系数向量β,β= (βι,...,0t)。本步骤的主 要工作是收集单个老人的相关危险因子数据,使用人群的平均危险因子水平和平均发病率 对Cox生存函数进行调整,最终实现利用Cox回归模型对对个体老人进行健康状况的预测。 老人未来4年的发病危险率P计算公式如下:
[0087] P =卜 S〇(t)exp(f(x'M))⑴
[0088] 其中:f (X,Μ) = βι(χι-Μι)+β2(Χ2_Μ2) + · · · +Pt(xt_Mt),βι,· · ·,i5t为集合中各危险因 素不同分层的偏回归系数,Xl,.. .Χη为个人各危险因素的水平,Μι ...,"为本人群各危险 因素的平均水平。
【主权项】
1. 一种基于Cox回归模型的老人健康数据分析方法,其特征在于,设定Cox回归模型为: h(t,X)=ho(t)exp(0ixi+&X2+. · ·+βηΧη) 其中,Χ= (Χ1,Χ2, . . . ,Χη) '是η维向量,它表示一个个体的η个变量的观测值,也是风险 函数的η个协变量;h(t,X)表示具有协向量X在时刻t的风险率函数,ho(t)表示t时刻的基准 风险率函数,即t时刻协变量X的取值为0时的风险率函数,可以看出ho(t)仅与时间有关;X = (X1,X2, ... ,Χη) '表示相应协变量回归系数向量;β为回归系数向量; 设定Cox回归模型对应的生存函数为: S(t;X) = So(t)exp(x,i!) 其中,So(t)是t时刻的平均生存函数,即在危险因素处在平均水平时的生存函数; 则分析方法包括以下步骤: a. 收集多个老人的健康数据作为样本,估算出危险因子的回归系数,所述危险因子为 影响老人健康的因素; b. 根据步骤a中获得的回归系数估计值,分析危险因子的相对危险系数RR; c. 根据步骤b中获得的相对危险系数,获取与老人健康数据相关联的危险因子的集合; d. 使用Cox生态函数对个体老人的发病率进行预测。2. 根据权利要求1所述的一种基于Cox回归模型的老人健康数据分析方法,其特征在 于,所述步骤a包括: al.假设由η个老人组成样本,则需要从观测时间开始,在时刻t得到k个不同的健康时 间段统计值和n-k个不同的删失数据,所述删失数据为在观测时间段内退出的个体;将得到 的k个不同的观测值表示为:tl<t2< . . . <tk;设Ri = { j: tj 2 ti}表示ti时刻的风险集,其含 义为在t时刻之前没有发生老人生病且没有出现删失的个体; a2.采用似然函数求出回归系数邱勺估计值。3. 根据权利要求2所述的一种基于Cox回归模型的老人健康数据分析方法,其特征在 于,包括a还包括以下步骤: a3.假设由η个老人组成样本,则需要从观测时间开始,在时刻t得到k个不同的健康时 间段统计值和n-k个不同的删失数据,所述删失数据为在观测时间段内退出的个体;将得到 的k个不同的观测值表示为:tl<t2< . . . <tk;设Ri = { j: tj 2 ti}表示ti时刻的风险集,其含 义为在t时刻之前没有发生老人生病且没有出现删失的个体; a4.改进后的似然函数求出回归系数β的估计值;其中,di为老人的健康时间等于ti的个数;令Di表示ti时刻老 人发生疾病的人数的集合;S⑴为cU个样本个体的变量总和4. 根据权利要求3所述的一种基于Cox回归模型的老人健康数据分析方法,其特征在 于,步骤b还包括: bl.通过公式: RR=exp(P) 获得危险因子的相对危险系数RR;所述相对危险系统RR为危险因子^暴露与未暴露的 相对危险度,RR值越大,表明暴露的效应越大; b2.根据获得的RR值进行危险因子分类统计,具体为: 第一类:RR为0.9~1或1.0~1.1,表示暴露因素与疾病无关联; 第二类:RR为0.7~0.8或1.2~1.4,表示暴露因素与疾病有弱的关联; 第三类:RR为0.4~0.6或1.5~2.9,表示暴露因素与疾病有中的关联; 第四类:RR为0.1~0.3或3.0~9.9,表示暴露因素与疾病有强的关联; 第五类:RR小于0.1或大于10,表示暴露因素与疾病关联很强。5. 根据权利要求4所述的一种基于Cox回归模型的老人健康数据分析方法,其特征在 于,所述步骤c还包括: cl.根据步骤b2的分类,分别将每一类危险因子作为独立的一组进行协变量检验,具体 为: 假设某组拥有m个值,例如:(β?, . . . ,βιη);假设为Η〇:βι = β2= . . . =ftn = 0,l〈m〈P^*P Λ 为初始研究的危险因素的个数;Hi: (β?, . . .,ftn)中至少有一个β?不为0;将,U最 大部分似然函数的对数值记作lnl^p >将似然函数的检验水准0设为0.05; 可得:x2的值为:x2 = 2[lnL(爲所有XhlnU#;除去Xl,· · ·,xm以外的所有x)]; 可以证明在Ho成立的条件下,统计量服从自由度为m的卡方分布;通过卡方检验,如果假 设成立的概率落在接受域之内,则这组回归系数对应的危险因子与老人健康状况的关联性 较弱可以被忽略,否则就不能被忽略,该组的危险因子就被收入危险因子集合中; c2.依次完成5类危险因子的回归系数假设检验,排除与老人健康无关的因子,得到与 之具有强关联的因子的集合X。6. 根据权利要求5所述的一种基于Cox回归模型的老人健康数据分析方法,其特征在 于,步骤d还包括: 设步骤c2获得的集合X为X= (X1,X2, . . .,Xt),再使用人群的平均危险因素水平和平均 发病率对Cox生存函数进行调整,实现利用Cox回归模型对老人身体健康状况进行预测;老 人未来4年的发病危险率P计算公式如下: P=l-So(t)exp(f(x>M)) 其中,f(X,Μ) = β?(Χ1_Μ?)+β2(Χ2-Μ2) + · · · +0t(Xt-Mt),β?,· · ·,i5t 为集合中各危险因素不 同分层的偏回归系数,X1,.. .Χη为个人各危险因素的水平,Mi,...,Μη为本人群各危险因素 的平均水平。
【专利摘要】本发明属于大数据分析技术领域,涉及一种基于Cox回归模型的老人健康数据分析方法。本发明的主要方法是收集多个老人的健康数据作为样本,估算出危险因子的回归系数;所述危险因子为影响老人健康的因素;根据步骤a中获得的回归系数估计值,分析危险因子的相对危险系数RR;根据步骤b中获得的相对危险系数,获取与老人健康数据相关联的危险因子的集合;使用Cox生存函数对个体老人的发病率进行预测。本发明的有益效果为,从老人的身体健康数据入手,通过大数据分析老人自身因素与发生疾病之间的关系并建立起判定疾病发生的模型,最终通过监控老人的生命体征,实现对疾病的预测,实现智能养老。
【IPC分类】G06F19/00
【公开号】CN105678104
【申请号】CN201610209336
【发明人】饶云波, 刘伟, 陆川, 廖丹, 张明, 范柏江, 葛丰, 王诗琪, 徐凡超, 李慧, 邓建华
【申请人】电子科技大学成都研究院
【公开日】2016年6月15日
【申请日】2016年4月6日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1