疾病风险评估与个性化健康报告生成系统及方法与流程

文档序号:11475972阅读:1046来源:国知局
疾病风险评估与个性化健康报告生成系统及方法与流程

本发明涉及一种疾病风险评估与个性化健康报告生成系统及方法。



背景技术:

慢性病已经成为全球重大公共卫生问题之一,约80%的死亡可以归因于慢性病。慢性病的不可逆性严重影响患者的生活质量,给社会和家庭带来沉重的经济负担。发达国家的理论研究和实践探索已证实慢性病健康管理(healthmanagement,hm)是低成本高效益的预防和控制策略。

hm是对个人及人群的健康危险因素进行全面管理的过程,其宗旨是调动个人及集体的积极性,有效地利用有限资源来达到最大的健康效果。具体做法是在对个人健康状况进行评价的基础上,提供有针对性的hm计划,并鼓励和促使人们采取行动来改善和维护自己的健康。hm是一项连续的、动态的系统工程,它包括三个基本步骤,即个体健康信息采集、健康风险评估和健康干预。

中国的hm始于上世纪90年代末,其主体是综合医院健康体检中心或专业健康体检中心,主要执行了个体健康信息采集的功能,由于缺乏基于中国队列人群的风险评估模型及健康干预的科学依据,基本未对体检个体进行有效的健康风险评估和健康干预。

此外,健康体检数据已成为流行病学数据的热点来源,相对于普通的流行病学调查数据,健康体检数据具有信息量全面、丰富、大型,样本含量大,技术一致且稳定等优点,可较为突出的反映出一定范围人群的健康状况及疾病特点。健康体检数据是一种典型的纵向监测数据,积累着人群多年的、全面的健康信息,但并未得到充分利用。



技术实现要素:

本发明的目的就是为了解决上述问题,提供疾病风险评估与个性化健康报告生成系统及方法,它具有利用已有健康体检数据,对个体的疾病风险进行精确评估,生成个性化健康报告的优点。

为了实现上述目的,本发明采用如下技术方案:

疾病风险评估与个性化健康报告生成系统,包括:

iaas层:用于提供硬件及网络资源环境,以及负载均衡服务;

daas层,用于对数据进行结构化、集约化和虚拟化处理,集中对数据进行聚合、质量管理或数据清洗处理,然后再将数据提供给不同的应用和服务。

paas层,用于在网上提供各种开发和分发应用的解决方案,为系统提供各种应用的解决方案,根据不同的服务应用,调用paas层相应的模块组合生成相应的解决方案;

saas层用于针对不同的服务对象,提供不同的服务,是系统的控制访问层,根据用户的不同访问需要,提供不同的应用服务。针对体检机构用户、政府机构用户、行业团体用户和体检人员,系统提供不同的应用服务;

所述访问层,包括:体检机构pc端,保证体检机构用户能够在pc端访问系统应用;政府部门pc端,保证政府用户能够在pc端访问系统应用;行业团体pc端,保证行业团体用户能够在pc端访问系统应用;体检人员移动终端,保证体检人员能够在移动端访问系统应用;微信公众平台,保证体检人员能够在微信公众平台访问系统应用;

第三方接口,用于更好的与体检系统和ca安全认证系统等进行对接。

iaas层,包括:云中心资源管理模块和资源池,其中,资源池,包括:应用资源池、存储资源池和网络及资源安全池。

云中心资源管理模块,针对各种系统应用服务所需的硬件和网络资源进行合理的调配和管理,保证系统资源的高效使用和运转。

应用资源池,用于管理云中心的应用服务器资源,合理安排和调配相应的资源配置,保证应用服务的安全和高效运行;

存储资源池,用于管理云中心的硬件存储资源,合理安排和调配相应的硬件存储资源。

网络及资源安全池,用于管理云中心的网络及资源安全,合理的安排和调配相应的带宽设置和防火墙安全资源配置。

daas层,包括:用户信息库、调查问卷信息库、体检信息库、评估报告库和模型算法库;

用户信息库,用于存储和管理用户的个人基本信息;

调查问卷信息库,用于存储和管理用户填写的调查问卷信息;

体检信息库,用于存储和管理体检者的体检信息;

评估报告库,用于存储和管理体检者的评估报告结果和生成的评估报告;

模型算法库,用于存储和管理健康评估所使用到的模型算法;

paas层,包括:报告模板管理模块、webservice接口管理模块、用户管理模块、健康评估模块、模型算法管理模块、app接口管理模块、微信公众平台接口、数据交换服务模块;

报告模板管理模块,用于管理评估报告的模板,根据不同的客户需要,使用相应的模板,生成与其对应的评估报告;

webservice接口管理模块,用于对外提供服务的webservice接口,让风险评估服务以webservice接口的形式对外提供风险评估服务;

用户管理模块,用于管理系统中存储的用户数据信息,保证数据的安全性和完整性;

健康评估模块,用于采集相应的指标信息和生成相应的评估报告,是整个系统中连接用户信息和模型算法的关键模块,接收用户填写的指标信息,根据查看请求输出相应的评估报告结果和个性化健康干预结论;

模型算法管理模块,用于提供健康评估的所有模型算法,是系统的核心模块,健康评估模块通过调用相应的模型算法,生成计算出相应的评估结果;

app接口管理模块,用于提供与手机app相应的接口,由于手机app是通过互联网与系统进行通信,为了安全性,系统与手机app的通信是使用相应的接口来实现的;

微信公众平台接口,用于提供与微信公众平台相应的接口,由于微信公众平台是通过互联网与系统进行通信,为了安全性,系统与微信公众平台的通信是使用相应的接口来实现的;

数据交换服务模块,用于实现数据在应用服务和数据库之间的交互,可以把数据从数据库中查询返回给应用服务,同时也可以将应用服务产生的数据存储进入数据库。

saas层,包括:面向体检机构模块、面向政府机构模块、面向行业团体模块和面向体检人员模块;

所述面向体检机构模块包括:

体检机构评估管理单元,用于采集体检机构的体检信息,调用相应的模型算法和模板生成对应的健康风险评估报告;

体检机构报告管理单元,对已生成完成的评估报告进行管理,体检机构调用相应的接口程序进行报告的预览、打印和下载;

健康干预单元,针对已经生成的评估报告结果系统会提供个性化的健康干预方案,个性化的健康干预方案,包括饮食、运动、生活方式、心理健康和用药指导;

评估统计单元,对体检机构的评估报告数量进行统计汇总;

用户管理单元,用于管理体检机构中体检用户的基础信息;

所述面向政府机构模块,包括:

政府机构评估管理单元,用于采集民众的体检信息,调用相应的模型算法和模板生成对应的健康风险评估报告;

政府机构报告管理单元,用于对于生成完成的评估报告进行管理,承载政府机构人员体检的体检机构能够调用相应的接口程序进行报告的预览、打印和下载;

干预随访单元,针对已经生成的评估报告结果系统提供个性化的健康干预方案,个性化的健康干预方案,包括饮食、运动、生活方式、心理健康和用药指导;

人员管理单元,用于管理政府部门管辖下民众的基础信息;

所述面向行业团体模块,包括:

行业团体评估管理单元,用于采集行业团体下的客户的体检信息,调用相应的模型算法和模板生成对应的健康风险评估报告;

评估推荐单元,针对行业团体的需要,基于风险评估的结果,给行业团体推荐相应的产品和服务;

所述面向体检人员模块,包括:

健康档案单元,用于面向体检人员,为其建立完整的健康档案,健康档案包括个人基本信息、历次的体检信息、历次的健康评估结果和干预方案;

个人中心单元,用于面向体检人员,体检人员提供了个人中心功能,允许通过多种方式登陆进入系统查看其个人的健康档案信息;

手机app单元,用于面向体检人员,为体检人员提供了手机app服务,体检者允许使用相应手机app来查看和访问相应的个人信息;

微信公众平台,用于面向体检人员,为体检人员提供了微信公众平台,体检者能够应用微信公众平台来查看和访问相应的个人信息。

访问层,用于对外提供应用访问,服务对象包括体检机构、政府部门、行业团体和体检人员,针对前三个服务对象开通pc端服务,针对体检人员开通pc端或移动终端服务;

第三方接口包括:体检系统、ca认证系统;

体检系统,系统预留了相应的接口,可以与多种体检系统直接进行对接;

ca认证系统,为了安全访问的需要,系统提供了与ca安全认证系统的接口。

疾病风险评估与个性化健康报告生成方法,包括如下步骤:

步骤(1):输入纵向健康体检大数据;所述纵向健康体检大数据,包括设定时间范围内,跨地域的若干家健康体检机构提供的健康体检数据;

步骤(2):对数据进行整理:包括对数据的标准化处理、人员去重处理、变量对照处理、疾病对照处理和结构化审核处理,最终得到需要的结构化数据;

步骤(3):根据疾病的名称对疾病的各项指标阈值范围进行定义,同时根据疾病的各项指标阈值范围,利用sas软件建立对应疾病的队列;

步骤(4):建立队列之后,利用cox单因素回归分析方法对每个变量均进行变量选择;最后将纳入cox回归模型的变量进行多因素回归分析;

步骤(5):利用多因素回归分析方法,构建cox比例风险模型;

步骤(6):对cox比例风险模型内部进行验证,对cox比例风险模型外部进行验证;得到疾病预测模型;

步骤(7):生成疾病风险评估双曲线:平均风险评估曲线和低风险评估曲线;

步骤(8):输入新个体体检指标,根据步骤(6)的疾病预测模型和步骤(7)的疾病风险评估双曲线,生成疾病风险评估结果,同时根据预先设定的体检指标,输出包括体检指标、疾病的发病风险、风险年龄、风险等级和干预处方的疾病风险评估与个性化健康报告。

所述干预处方包括:饮食处方、运动处方、生活方式处方及精神方面处方。

所述生成疾病风险评估双曲线,包括:并发进行的平均风险评估曲线绘制步骤和低风险评估曲线绘制步骤;

平均风险评估曲线绘制步骤:

步骤(701):将队列数据代入模型

p(t)表示:表示累积发病风险;s0(t)表示:表示基准生存率;β0表示:βi表示体检指标的系数;xi表示:第i个体检指标;xi′表示第i个体检指标的均值;exp,高等数学里以自然常数e为底的指数函数

步骤(702):计算出队列中每个人的疾病发病风险p(t);

步骤(703):对每个人的累积发病风险根据年龄分组(每个年龄一组(20岁的一组,21岁的一组,22岁的一组,…)),对于每个组中的疾病累积发病风险p进行正态性检验,p表示每个人的累积发病风险,是一个常数,使用计算得出的;p(t)表示累积发病风险,与t有关,用来计算每个人的累积发病风险;若满足正态性检验,则取每个年龄累积发病风险的平均值p_mean为该年龄人群平均风险p;若不满足正态性检验,则取每个年龄累积发病风险的中位数p_median为该年龄人群平均风险p;

步骤(704):将每组(age,p)对应直角坐标系中的点,用直线连接,形成折线图;age表示个体的年龄;

步骤(705):对折线通过拟合得到最优趋势线,即平均风险线,平均风险值用表示。

低风险评估曲线绘制步骤,包括:

步骤(711):取出cox比例风险模型中用到的指标xi的基线数据;

步骤(712):计算指标xi的1%分位数xi,1%;计算指标xi的99%分位数xi,99%;

步骤(713):判断βi>0是否成立,若成立,则若不成立,则

βi表示:回归系数;表示:指标正常范围的上限;表示:指标范围的下限;xi表示:计算低风险线上的值时需要带入到模型;

中的体检指标xi的真实指标值。

步骤(714):将xi带入到模型

中,计算出低风险值

步骤(715):画出低风险值随年龄的折线图;

步骤(716):对折线图通过拟合得到最优趋势线,即平均风险线。

风险等级的判断过程为:如果那么该个体的风险等级为高风险;如果那么定义该个体的风险等级为中风险;如果那么定义该个体的风险等级为低风险。

风险年龄的计算方法为:

首先计算出体检者的累积发病风险p,然后对比平均风险线,看哪个年龄的平均风险p与p最接近,哪个年龄就是体检者的风险年龄。

所述标准化处理是指:对新输入的变量,首先判断新变量是否是变量标准数据库里面已经存在的变量,若已经存在,则删除;若不存在,则依据变量标准数据库变量的标准编码的编码规则对新的变量进行重新编码,将重新编码后的变量存储到变量标准数据库中。

所述人员去重处理是指:根据体检人员的标准编码,删除重复的体检人员;

所述变量对照处理是指:将新的变量名与变量标准数据库中的标准编码建立一一对应关系,便于查阅;

所述疾病对照处理是指:将原始数据中疾病名称与标准icd10疾病名称和icd10编码建立一一对应关系;

所述结构化审核处理是指:将原始数据中b超文本数据、ct文本数据、心电图文本数据、问诊文本数据,分词成结构化数据。

所述步骤(4)用cox单因素回归分析进行变量选择的目的:由于在进行cox多因素回归分析之前,待考虑的与结局有关的变量较多,所以先通过cox单因素回归分析筛掉一些与疾病结局相关性较小的变量,即单因素回归分析在起到变量选择的作用。

所述步骤(4)用单因素回归分析进行变量选择的步骤:

步骤(41):确定要分析的自变量xi;

步骤(42):利用sas统计软件进行cox单因素回归分析,得到单因素回归分析模型:

h(t|x)=h0(t)*exp(βi*xi);

步骤(43):设定一个显著性水平α,当对回归系数βi检验的p值小于α时,认为变量xi与变量结局之间有明显的线性关系,变量xi能够纳入cox回归模型。

步骤(5)的cox比例风险模型:

对cox比例风险模型内部进行验证:

十折交叉验证:初始数据采样分割成10个子样本,每次交叉验证中将某个子样本作为验证模型的数据,其他9个样本合集作为训练集;交叉验证重复10次,使得每个子样本验证一次,然后平均10次的结果,最终得到一个单一估测。反应模型效果的拟合统计量分别是:auc=0.847,gini系数=0.695,ks统计量=0.536。若auc在0.6以上,则模型可用。

对cox比例风险模型外部进行验证:

将外部数据带入已经建立好的cox回归模型,根据发病风险的预测值p以及疾病结局,绘制出roc曲线,得到auc的值,若auc在0.6以上,则模型可用。

roc曲线绘制方法:

表1预测结局与真实解决对照表

其中,灵敏度=n1/(n1+n2);特异度=n4/(n3+n4);

对于发病风险的预测值,设定临界点,例如0.5,超过临界点则是阳性,低于临界点则是是阴性,从而得到预测结局。就能够得到灵敏度和特异度,如果取若干个临界点,就能够得到若干个灵敏度和特异度,将灵敏度和特异度的点连接起来,就得到roc曲线,也能够得到auc的值,auc的值就是roc曲线下的面积。

本发明的有益效果:通过本发明可以给不同的体检人群,提供个性化的健康体检报告,同时给出疾病风险评估曲线。

附图说明

图1为本发明的硬件连接关系图;

图2为本发明的软件功能模块图;

图3为本发明的工作方法流程图;

图4为本发明的工作方法流程图中的双曲线生成流程图;

图5为本发明的队列展示示意图;

图6为本发明的报告生成实施例;

图7为两种队列示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

如图1所示,系统硬件服务器架设分为内网区和dmz(隔离区),为了保证服务器的安全,将数据库服务器和应用服务器放置在内网区。同时架设了dmz(隔离区)供外界资源访问。

1内网区和dmz(隔离区)中的硬件服务器资源通过安全网关和防火墙与internet进行连接。

2公众用户使用手机或者pc端来通过internet来访问

机构用户通过安全网关,使用internet与系统建立安全的访问通道,从而保证数据的安全交互。

如图2所示,风险评估与个性化健康干预系统面向的对象主要包括体检机构、政府部门、行业团体、体检人员等,分为访问层、saas层、paas层、daas层和laas层。

访问层:系统对外提供的应用访问(包括门户网站、app和微信),服务对象包括体检机构、政府部门、行业团体(保险)和体检人员,针对前三个服务对象,主要开通pc端服务,针对体检人员,主要开通pc端、手机端和平板端的服务。

saas层:software-as-a-service软件服务层,提供给客户的服务就是运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问

paas层:platform-as-a-service平台服务器层,公司在网上提供各种开发和分发应用的解决方案

daas层:data-as-a-service数据服务层,对于数据进行结构化、集约化,虚拟化等处理主要包括用户信息库、调查问卷信息库、体检信息库、评估报告库、模型算法库、科研分析库、财务结算库、商城信息库、统计分析库。

iaas层:infrastructureasaservice基础构架服务层,包括云中心资源管理、应用资源池、存储资源池和网络及资源安全池

如图3所示,风险评估与个性化健康管理系统中已经集成了我们的疾病预测系统,首先介绍一下疾病预测系统中模型的建模过程:将收集到的健康体检队列大数据,应用“山东康评健康医疗大数据整合平台”,进行标准化处理、人员去重、变量对照、疾病对照、结构化审核等步骤,最终得到需要的结构化的数据,然后根据定义好的疾病结局,利用sas软件建立疾病的队列;建立好队列之后利用单因素回归方法进行变量选择,再利用多因素回归,结合医学知识构建cox比例风险模型;然后按照双曲线生成方法生成疾病风险评估双曲线。至此,建模过程完成。

然后,对于一个新的体检个体,将体检指标输入疾病预测系统就可以得到自己的评估报告,评估报告中主要包括疾病的发病风险、风险年龄以及风险等级。

3、最后个性化管理系统会根据风险评估报告的结果和体检指标的具体情况,输出相应的干预处方,干预处方主要包括饮食处方、运动处方、生活指导、精神指导四个方面。

如图4所示,平均风险线说明:

1、数据处理:应用“山东康评健康医疗大数据整合平台”,进行标准化处理、人员去重、变量对照、疾病对照、结构化审核等步骤,最终得到需要的结构化的数据;

2、建立队列:根据疾病定义,规定好疾病的结局,然后利用sas软件建立该疾病的对应队列,如下图所示(以脑卒中为例);

图5描述:

脑卒中队列从2004年开始,到2016年结束,13年间共74326人进入队列。其中2004年1438人进入队列,2014年结束时1人发生脑卒中,0人死亡;2005年1400人进入队列,2005年结束时,2人发生脑卒中,0人死亡;…;2016年0人进入队列,2016年结束时322人发生脑卒中,59人死亡。13年共诊断脑卒中新发病例1299例,238人死亡(这些死亡,包括脑卒总死亡,也包括其他原因死亡。)

3、疾病发病风险计算:将整理好的队列中的基线数据带入到已经建立好的疾病预测模型中,计算出疾病的发病风险p;

4、平均风险折线图:将第三步中计算出来的人群的疾病发病风险根据年龄agei(i=1,…,n)分组,对于每个组中的疾病发病风险(发病概率p)进行正态性检验,如果满足,那么取出这组发病概率p的平均值p_mean作为该年龄人群的平均风险p;如果不满足正态性检验,那么取出这组发病概率p的中值p_median作为该年龄人群的平均风险p。最后将每组(age,p)对应直角坐标系中的点用直线连接,画出折线图;

5、平均风险折线图平滑:对第四步中得到的折线图进行平滑,平滑方法包括指数平滑、线性平滑、对数平滑、多项式平滑、幂平滑等方法,利用拟合优度来衡量拟合程度,r2越接近于1,表示拟合程度越好。

低风险线说明:

1、数据处理和建立队列与平均风险线的处理过程相同;

2、计算疾病预测模型中涉及到的体检指标的1%和99%分位数;

3、计算最低风险线:如果βi>0,那么如果βi<0,那么其中表示指标正常范围的上限,表示指标范围的下限,例如对于收缩压来说,

将xi带入到已经建立好的模型

中,计算出低风险值

4、画出低风险值随年龄变化的折线图;

5、曲线平滑:对第四步中得到的折线图进行平滑,平滑方法包括指数平滑、线性平滑、对数平滑、多项式平滑、幂平滑等方法,利用拟合优度来衡量拟合程度,r2越接近于1,表示拟合程度越好。

风险等级划分规则:

p:表示个体的风险值;

age:表示该个体的年龄;

表示与该个体同年龄人群的平均风险值;

:表示与该个体同年龄人群的低风险值。

如果那么该个体的风险等级为高风险;如果那么定义该个体的风险等级为中风险;如果那么定义该个体的风险等级为低风险。

如图6所示,以高血压为例:

第一条线:各年龄人群未来几年某病发病风险的平均值变化曲线;

第二条线:各年龄人群未来几年某病发病风险的低风险水平变化曲线;

星号:表示体检者本人未来几年某病的发病风险;

星号下方第一个点:表示同年龄组的平均风险水平;

星号下方第二个点:表示同年龄组的最低风险水平;

星号水平向右第一个点:对应的横坐标表示同风险人群的平均年龄,即风险年龄;

风险年龄(69岁):根据星号水平向右第一个点对应出来的年龄。

如图7所示,队列定义:根据人群进入队列的时间不同,队列可以分为两种:一种是固定队列,是指人群都在某一个固定时间或一个短期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有因为结局事件以外的其他原因退出,也不再加入新的成员,即在观察期内保持队列成员的相对固定;另一种是动态队列,即在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入。图7为两种队列的示意图:其中abkcd组成固定队列;efghi组成动态队列。我们研究过程中使用的是动态队列。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1