面向慢性病康复的精准运动大数据智能预测、分析及优化系统的制作方法

文档序号:20610431发布日期:2020-05-06 19:30阅读:602来源:国知局
面向慢性病康复的精准运动大数据智能预测、分析及优化系统的制作方法

本发明属于慢性病等慢性病管理系统技术领域,具体涉及一种面向慢性病康复的精准运动大数据智能预测、分析及优化系统。



背景技术:

随着生活方式的改变,糖尿病、肥胖症、高血压、血管栓塞、冠心病等慢性病的发病率逐年攀升。以糖尿病为例,调研统计发现,中国成人中糖尿病患病率已超过11.6%,且50.1%以上的成人处于糖尿病前期。糖尿病将导致各种组织特别是眼、足、肾、心脏、血管、脑、神经的慢性损害、功能障碍,不予及时治疗将导致严重的后果。

长期以来,运动一直被公认为慢性病的重要康复手段。比如,大量研究证明,糖尿病的运动处方为降糖、控糖发挥了重要的作用。但是,运动项目、运动强度以及运动时间等运动处方关键要素的确立,仍是一个有争议的问题,对糖尿病及其并发症的有效性还缺乏实证研究。由于泛化的运动方式及运动处方建议,70%的糖尿病患者对运动处方的效益缺乏满意度。糖尿病门诊调查发现,运动处方的采用比例只有38%,规范者不足5%。

虽然现有技术中也有很多针对慢性病患者运动处方的研究,但是仍然存在以下缺陷:

(1)目前针对病人的运动处方仍是建议性的、指导性的、不精确的;在给病人制定运动处方后,运动处方是否被病人精准执行,是否能够精准理解医生的指示并执行到位,执行前、中、后的效果是怎样的,这些情况都不得而知;医生根据模糊的信息,进一步对运动处方做调整,仅是凭借经验,没有运动处方的积累和进一步优化,不能形成,针对慢性病病患群的个性化的、最优的、精确的指导性运动处方;

(2)有些研究虽然已经做了部分实验,对相关运动处方知识进行了采集,但数据量仅为实验的样本数,对相类似病患群的数据采集,应用何种运动处方,应用运动处方后的预测,持续的运动处方的比较、优化等指导意义不大。



技术实现要素:

本发明针对现有技术中慢性病患者的运动训练方案康复训练效果差等缺陷,提出一种面向慢性病康复的精准运动大数据智能预测、分析及优化系统,通过对病患进行聚类分析,结合短、长期关键指标水平预测和运动训练方案寻优算法预测结果,输出针对不同患者的较优的运动训练方案,以使运动训练方案能够明确、精准,并有效指导慢性病病患康复。

本发明是采用以下的技术方案实现的:一种面向慢性病康复的精准运动大数据智能预测、分析及优化系统,所述智能康复训练系统包括运动过程数据检测层、运动训练方案决策层和大数据分析层,运动过程数据检测层、运动训练方案决策层和大数据分析层之间形成运动过程数据的采集、运动训练方案的制定以及运动训练方案执行、反馈与优化的闭环控制:

运动过程数据检测层,用以实现对影响运动训练方案制定的运动过程数据的全面采集和预处理,并提供与医疗康复训练设备的通讯接口;

运动训练方案决策层,用以结合运动过程数据检测层和大数据分析层的分析反馈,实现运动训练方案的制定与更新;

大数据分析层,包括聚类模块、关键指标水平预测模块和运动训练方案寻优模块:

聚类模块对病患进行聚类分析得出多个具有共性的病患族群,并基于运动训练方案决策层分析得出不同病患族群对应的初步运动训练方案;

关键指标水平预测模块实现对初步运动训练方案执行下的短期关键指标水平预测分析和长期关键指标水平预测分析,以判断初步运动训练方案的有效性;

运动训练方案寻优模块针对关键指标水平预测模块的预测得到的有效运动训练方案与相应关键指标水平关系进行智能寻优,进而获得面向特定慢性病病患群的精确运动训练方案。

进一步的,所述聚类分析模块包括数值量化模块、降维模块、异常值确认模块、聚类模块和初步运动训练方案确认模块;

数值量化模块:对影响慢性病因素的相关参数指标量化成数值型数据,所述相关参数指标包括详细的病史、全面的体格检查结构数据、相关实验室检查结果数据和个体行为特征数据;

降维模块:对数值量化模块量化后的数值型多维数据进行标准化处理,并将原有相关参数指标在线性变化下融合,实现降维处理;

异常值确认模块:对降维处理后的对象集进行聚类,通过选取病患的任意一个数据点,并判断该数据点在所设定的特定值领域内的数据点特征找出异常值;

聚类模块:将确认的异常值单独作为一类,并对剩余患者数据进行聚类判断,获得最终聚类结果;

初步运动训练方案确认模块:在获得聚类结果后,基于运动训练方案决策层对各聚类中心对象的相关数据进行诊断,制定初步运动训练方案。

进一步的,所述关键指标水平预测模块包括关键指标水平短期预测模块和关键指标水平长期预测模块;

关键指标水平短期预测模块结合运动过程数据检测层采集个体病患的慢性病运动治疗过程数据,将运动干预天数、当天空腹关键指标、运动前中后所测得的关键指标值和所执行的初步运动训练方案参数作为输入,预测该病患行该初步运动训练方案后未来短期内某一天的空腹关键指标水平是否趋于正常,以判断初步运动训练方案的有效性;若判断初步运动训练方案无效,则基于运动训练方案决策层对其重新制定和验证,若判断初步运动训练方案有效,则通过关键指标水平长期预测模块对其长期有效性进行预测分析。

进一步的,所述关键指标水平短期预测模块的预测分析原理如下:

(1)将采集的病患样本数据映射到一个高维特征空间,并建立病患信息从低维空间到高维空间上的映射关系;

(2)根据所建立的病患信息的映射关系,基于svm,求得分类超平面并确定分类决策函数,该分类超平面把患者执行初步运动训练方案后的效果分为两类,若某一天的空腹关键指标水平趋于正常,则为正类,否则为负类;

(3)根据确定的分类超平面,将新的病患数据带入分类决策函数,判断该病患在执行完初步运动训练方案后关键指标水平为正类还是负类,进而实现对初步运动训练方案的有效性判断。

进一步的,所述关键指标水平长期预测模块的预测分析基于bp神经网络模型实现,原理如下:

通过关键指标水平短期预测模块得到针对每一类病患制定的初步运动训练方案后,将运动干预天数和关键指标水平短期预测模块得到的初步运动训练方案作为输入,以指定周期时间的关键指标水平分别作为输出,所述指定周期至少为3个月,并设定隐含层功能函数和输出层功能函数,通过训练人工智能模型,验证并优化训练后的模型,实现对应用运动训练方案后未来长期的关键指标趋势及关键指标水平值的预测,为开具和优化运动训练方案提供准确建议。

进一步的,所述运动训练方案寻优模块基于关键指标水平短期预测模块和关键指标水平长期有效性预测模块得到的运动训练方案与关键指标水平关系的预测,并将该预测结果作为非线性适应度函数,将已有的运动训练方案抽象构建为染色体模型,生成遗传基因的初始染色体种群,基于神经网络遗传算法对运动训练方案进行迭代寻优,寻优成功后获得的最优染色体即为针对某类病患的最优运动训练方案。

进一步的,所述运动训练方案寻优模块还包括运动训练方案指标数据库,以对运动训练方案指标内容、数量、对应量程区间、以及缺失时的默认值进行统计设定;运动过程中根据实时反馈的病患体征信息,结合运动过程数据检测层的反馈,对运动设备的运行状态进行适应性调整,使运动过程中的病人体征始终维持在运动训练方案指标数据库的对应量程区间内,从而达到控制运动过程的效果,实现对运动训练方案的精准控制。

进一步的,所述运动训练方案寻优模块在运动训练方案寻优过程中:

(1)在生成初始染色体种群环节,将某一病患种群有效运动训练方案总空间与子空间中的选中染色体分别作为初代染色体,参与后续的寻优过程;其中,将某一病患种群的有效运动训练方案对应的染色体记为总空间,根据运动训练方案的关键指标干预水平对总空间中的染色体均匀分割产生的多个子区间记为子空间;

(2)在寻优执行过程中,对参数组的参数随着迭代次数的增加与关键指标水平预测结果的变化进行适应性变化,基于不同的参数组初始值,进行重复寻优过程,直到找到相对最优的针对不同种群的运动训练方案,所述参数组的参数内容包括交叉率、变异率、变异幅度和神经网络遗传算法的终止进化代数。

进一步的,所述关键指标水平预测模块中所指的关键指标针对不同的慢性病类型进行调整,包括:

对于糖尿病来说,所述关键指标包括血糖水平;

对于高血压来说,所述关键指标包括血压水平;

对于肥胖症来说,所述关键指标包括体重水平。

进一步的,所述运动训练方案决策层包括人机交互模块和智能监测与报告模块,人机交互模块包括运动训练方案开具模块、病人康复记录模块和多维康复报表生成模块,分别对应的实现运动训练方案开具、病人康复记录和生成多维康复报表功能,智能监测与报告模块包括运动信息反馈模块、运动指标监测模块以及运动训练方案效果评估模块,分别对应的实现运动信息反馈、运动指标监测以及运动训练方案效果评估。

与现有技术相比,本发明的优点和积极效果在于:

本发明方案基于关键指标水平预测与运动训练方案寻优算法,用于针对不同患者寻找较优的运动训练方案,并结合大数据和机器学习技术,应用在广大慢性病患者和医生人群;通过对慢性病病患数据进行持续采集,将具有共性的病患分类制定出针对性的运动训练方案;然后通过面向个体的精准运动训练方案短期有效性预测分析和面向慢性病运动医疗康复大数据的关键指标水平中长期回归、优化分析,基于运动训练方案与相应关键指标水平关系进行智能寻优,获得面向慢性病病患群的精确的、最优的、确认有效的运动训练方案;实现协助医生制定、调整面向慢性病病患群的精确运动训练方案,帮助病患建立康复信心,对慢性病患者的康复具有重要指导意义。

附图说明

图1为本发明方案所述智能预测、分析及优化系统的原理框图。

具体实施方式

本方案提出一种面向慢性病康复的精准运动大数据智能预测、分析及优化系统,在了解糖尿病病患的分类情况基础上,针对共性病患群形成的大数据,应用大数据深度学习算法,对运动训练方案的有效性进行预测、分析及优化,将具有共性的病患分类制定出针对性的运动训练方案;然后通过面向个体的精准运动训练方案小样本量短期有效性预测分析和面向慢性病运动医疗康复大数据的大样本量关键指标水平中长期回归、优化分析,基于运动训练方案与相应关键指标水平关系进行智能寻优,进而获得面向慢性病病患群的精确的、最优的、确认有效的运动训练方案(也可称之为运动康复策略,运动训练计划或运动处方)。

如图1所示,所述智能康复训练系统包括运动过程数据检测层、运动训练方案决策层和大数据分析层;所述大数据分析层包括负载均衡缓冲层、数据存储层、业务逻辑层以及核心分析层,所述核心分析层包括聚类模块、关键指标水平预测模块和运动训练方案寻优模块;所述运动过程数据检测层用以对有可能影响运动训练方案制定的运动过程数据进行全面采集和处理,并提供与医疗康复训练设备的通讯接口;所述运动训练方案决策层用以实现运动训练方案的制定与更新;所述大数据分析层将具有共性的病患分类,与运动训练方案决策层结合制定出针对性的运动训练方案;

所述大数据分析层首先通过聚类模块对病患进行聚类分析,然后基于关键指标水平预测模块实现面向个体的精准运动训练方案小样本量短期有效性预测分析和面向慢性病运动医疗康复大数据的大样本量关键指标水平中长期回归、优化分析;最后基于运动训练方案寻优模块基于运动训练方案与相应关键指标水平关系进行智能寻优,进而获得面向慢性病病患群的精确的、最优的、确认有效的运动训练方案。

本方案中所述的慢性病为可以通过运动有效缓解症状的疾病,包括糖尿病,肥胖症,高血压,血管栓塞和冠心病等,为了能够更清楚的理解本发明的上述目的和优点,下面结合不同慢性病的具体实施方式做详细地描述:

实施例1、对于糖尿病病患,关键指标水平预测模块中关键指标为血糖水平,运动训练方案具体化为运动处方,则相应的,本实施例中,将关键指标水平预测模块记为血糖水平预测模块。

一、运动过程数据检测层:

所述运动过程数据检测层包括数据采集模块、数据预处理模块和康复设备通讯接口模块,用以实现对影响运动处方制定的运动过程数据的全面采集和预处理,并提供与医疗康复训练设备的通讯接口,根据数据采集模块得到的病患实时运动信息,结合运动训练方案决策层反馈的处方信息,调整康复设备的运动策略(运动策略包括医疗康复训练设备的运动模式中的速度、阻力和坡度等信息),实现运动处方执行过程中的闭环反馈,进而实现精准运动控制。

本实施例中,所述运动过程数据包括年龄、性别、地域、症状(血糖指数)、并发症(高血压、心脏病)、饮食、运动设备参数、作息习惯等,比如在对运动过程数据中的运动设备参数影响项进行采集时,通过医疗康复训练设备(如肌力训练设备、前臂旋转训练器、电动起立床、功率车、连续性关节被动训练器、踏步器、助行器、平衡训练设备、运动控制能力训练设备等)来对运动进行精准的控制和监测,所述医疗康复训练设备能够对运动强度、速度、力度和完成度等进行控制(如胸部推举机可以对运动幅度,角度,时间,运动消耗能量等参数进行量化,指导运动),做到精准运动,对运动过程数据进行实时监测,通过自动获取医生下达的运动处方,监督病患执行。

将这些采集到的运动过程数据,上传至数据存储层进行进一步存储、管理和分析,另外,在具体实施时,还需要对所获得的运动过程数据采用专家判断的方法进行数据的预处理,建立数据预处理模型,以实现对所有病患样本的清洗;选取需要的参数,并结合特定病患的其他数据完成单个病例的采集,进而实现对所有样本病例的采集。

当然运动过程数据的采集也可以与第三方的数据接口做对接,在技术实现上比较常规,只要保证数据采集的全面性和准确性即可。

二、运动训练方案决策层:

所述运动训练方案决策层包括人机交互模块和智能监测与报告模块,人机交互模块用以实现运动处方开具、病人康复记录和生成多维康复报表等功能,智能监测与报告模块用以实现运动信息反馈、运动指标监测以及处方效果评估等,结合面向精准运动控制的信息采集与控制策略反馈模块,通过运动过程数据检测层的康复设备通讯接口调整运动康复设备的运行模式,从而达到精准运动控制的效果。通过对病患运动处方的开具、执行和反馈,结合大数据分析层的运动训练方案寻优模块的分析处理,辅助医生制定出个性化的、针对特定病患的精准运动处方。

三、大数据分析层:

3.1、聚类分析模块:

对糖尿病运动治疗中具有共性的病患进行聚类分析,在所有的运动过程数据中,采用相关性、基尼系数、信息熵、统计检验或随机森林等方法选取最为重要的运动过程数据来作为聚类分析的特征变量;考虑到影响因素维数较多,运动训练方案决策层不仅要为有共性的糖尿病病患制定运动处方,而且也要为任何不具有共性的糖尿病病患制定针对性的运动处方进行治疗,本实施例基于降维、聚类算法,获得多个具有相近特性的患者簇群和有特性的患者样本,所述聚类分析模块包括数值量化模块、降维模块、异常值确认模块、聚类模块和初步运动处方确认模块,具体的:

(1)数值量化模块:对影响糖尿病因素的相关参数量化成数值型数据,所述的相关参数即为对糖尿病有影响的因素,这些数据经量化后成为病患数据;

首先,挑选出对病患影响比较大的因素,包括:

·详细的病史:是否有糖尿病家族遗传史,记录病发过程,是否有急性或者慢性的并发症,比如酮症酸中毒、低血糖、高血压、冠心病、视网膜病、肾病以及神经病变等,女性病患还需要记录是否有生育历史及生育期间内分泌水平;

·全面的体格检查结果数据:记录身高、体重、血压、神经系统检查以及眼底检查结果;

·相关的实验室检查结果:包括不同生理状态下血糖、尿糖、血脂、糖化血红蛋白以及尿白蛋白、心电图、胸片等等,必要的时候,可以对超声心动图、肌电图、眼底荧光造影等结果进行记录;

·个体行为特征数据:“三多一少”症状是否出现,饮食习惯是否健康,是否经常运动,是否有家族遗传史,是否长期饮酒,是否有情绪的异常波动,生活习惯是否规律。

将是否有某种并发症用0和1来表示,而其他各因素都能得到具体的数值,这样糖尿病患者病历中的每一项都能用具体的数值进行表示。

(2)降维模块:基于主成分分析pca算法对数值量化模块量化后的多维数据进行降维处理;

降维时,考虑到所采集的数据(病患数据)往往存在不同指标量纲,需要将原始数据标准化,以消除量纲的影响,从而便于后续的问题分析。

首先进行z-score标准化处理:

其中,n为病患的数量,i=1,2,……n,j=1,2,…,m,依次表示m个因素,aij表示第j个因素的第i个人的数据,bij是相应的标准化之后的数据。

影响血糖变化的阴性和显性因素有很多,本实施例中在数值量化模块只给出了30个左右,这30个因素都能够对血糖水平产生影响并且部分因素之间相互耦合,比如是否影响经常运动能够影响血糖水平的变化,体重也会影响血糖水平的变化,同时是否经常运动也会影响体重的变化,这也就是说因素之间并不是相互独立的,他们之间的互相影响并最终共同影响血糖水平的变化。因此需要运用主成分分析法把原来的多个指标重新划分为几个新的指标,这些新的指标不是从原有指标中进行挑选,而是原有指标在一定的线性变化下的融合,这样能够在保证信息最小丢失的前提下减少变量个数,降低数据维度利于后面的计算。

在进行主成分分析时,本实施例采用相关系数矩阵来解决,基于上述描述可知一共有m个观测值,记bij(i=1,2,…,n,j=1,2,…,m)是无量纲化处理后的第j个指标的第i个观测值,记b=(b1,b2,…,bm)t,bj=(b1j,b2j,…,bnj)t,j=1,2,…,m。

相关对称矩阵为:

其中是指第i个指标和第j个指标之间的相关系数。根据系数相关矩阵可以求得m个非负特征值λi(i=1,2,…,m),将这些非负特征值按照从小到大的顺序排列:0≤λ1≤λ2≤…≤λm。基于这些特征求出主成分zi的贡献率这里贡献率的实际含义是主成分zi对原先p个指标信息的反映能力和综合能力的大小,且一定存在以下关系:z1≤z2≤…≤zm。

选取前k个指标的累计贡献率以反映主成分z1,z2,…,zk对指标变量b1,b2,…,bm的累积解释能力,构造出z1,z2,…,zk:

其中系数向量ui=(l1i,l2i,…,lpi)是特征值λi的特征向量。基于以上条件,只要按照从大到小的的顺序从中选出贡献率累积不小某一限定值即可,比如可以限定为95%,这样就在保留原始影响因素指标最主要的信息并且解决了不同因素之间相互耦合的问题,同时降低了原始信息的维度。

(3)异常值确认模块:基于dbscan算法对病患数据这一对象集进行聚类,找出异常值;

1)任意选取一个病患的数据点,然后找到到这个点距离小于等于某一特定值eps(设定值)的所有病患的数据点;如果距起始点的距离在eps之内的数据点个数小于min_samples,那么这个数据点被标记为噪声,如果距离在eps之内的数据点个数大于min_samples,则这个点被标记为核心样本,并被分配一个新的簇标签;

2)访问该病患的数据点的所有邻居(在距离eps以内),如果它们还没有被分配一个簇,那么就将所创建的新的簇标签分配给它们;如果它们是核心样本,那么就依次访问其邻居,以此类推;簇逐渐增大,直到在簇的eps距离内没有更多的核心样本为止;

3)选取另一个尚未被访问过的数据点,并重复相同的过程;

通过该环节的处理以挑选出异常值,这些异常值对应的患者数据具有一定的特性,需要单独给出运动处方。

(4)聚类模块:将异常值单独作为一类,剩余患者数据用k-means算法获得最终聚类结果;

1)将每个病患的数据抽象成一个个点,所有的点构成一个数据群,然后随机选取k个种子点,一个种子点就是一个病患的数据信息;

2)求所有病患数据点到种子点的距离,将点纳入距离最近的种子点群;

3)所有病患数据点均被纳入群内后,将种子点移动到种子群中心;

4)重复上述步骤1)-3),直至种子点没有移动,完成整个聚类过程。

该过程完成之后能够得到已经按照一定规则划分的病患数据类别,每个类别里面的病患都有一些相似的特征,不同种类的病患之间的差别较大,同种类别的病患之间的特征差距较小。对于同种类别的病患可以给出通用的运动处方,同时在上一步中得到的噪声点病患数据是难以和其他数据进行合并处理的,他们有着自己的较为特殊的表现特性,因此需要单独对其进行分析,给出相应的处方,这样可以将运动处方可以适用的范围在简化的基础上尽可能的扩大,这里所谓的简化是不再需要对每个病患给出单独的运动处方,而是针对每一类。

(5)初步运动训练方案确认模块:在获得聚类结果后,基于运动训练方案决策层对各聚类中心对象的相关数据进行诊断,制定出经验式的、初步的精准运动处方;

将pca降维之后的k个主成分作为聚类算法的输入,找出噪声点,最终聚类输出n个病征相似的病患族群,将噪声点单独作为一类作为特殊情况进行处理,最终得到了有共性病症的n个族群和有特性是1个族群,比如有的族群患者发病过程相似,都有酮症酸中毒,也都有高血压、冠心病这些疾病,或者有些族群患者的血糖、尿糖、血脂的水平相似。

3.2、血糖水平预测模块:

在执行运动康复处方之后,对糖尿病病人的血糖水平进行短期和长期预测,以获得不同康复周期的血糖水平预测结果,所述血糖水平预测模块包括血糖水平短期预测模块和血糖水平长期预测模块,以辅助医生对运动处方的优化调整,并帮助病患了解自己执行某个运动处方之后的血糖水平变化情况,增加康复自信,具体的:

(1)血糖水平短期预测模块:对运动处方短期有效性进行预测,以判断运动处方的有效性;

正确的糖尿病运动处方及精准的运动过程,会使病患的血糖水平形成平缓降低的趋势,针对某病患及开具的初步的精准运动处方,结合运动过程数据检测层采集个体病患的糖尿病运动治疗过程数据,将病患运动数据即运动干预天数、当天空腹血糖、运动前中后所测得的血糖值、所执行的精准运动处方等参数作为输入,预测该病患行该精准运动处方后未来短期内某一天的空腹血糖水平是否趋于正常(如空腹血糖水平低于6.1mmol/l,餐后两小时血糖水平低于7.8mmol/l为正常),医生基于运动处方决策层的智能监测与报告模块获得的实时数据及预测后的短期内血糖趋势,对病患的运动处方进行调整、优化。

这里所采用的是个体病患本身的相关数据,其对自身的血糖水平进行短期预测,分析、挖掘出的结果也是个性化的、认同个体差异的。由于个体病患的样本数据量有限,需要在小样本量情况下进行短期内的血糖水平预测、分析,具体的:

本实施例基于支持向量机面向个体病患的精准运动处方小样本量短期有效性进行预测及分析,训练出学习器函数,通过此函数就可以再结合病患自身数据预测出该病患执行该精准运动处方后未来短期内某一天的空腹血糖水平是否趋于正常。

比如,通过一个非线性映射,把样本空间映射到一个高维的特征空间中,使用非线性映射算法将低维输入空间线性不可分的样本,转化为高维特征空间使其线性可分,在高维特征空间采用线性算法对样本的非线性特征进行线性分析;基于结构风险最小化理论,在特征空间中构建最优超平面,使得学习器得到全局最优化,并且在整个样本空间的期望以某个概率满足一定上界。

因此,如何构建分类器函数则成为需要考虑到的首要问题,具体如下:

1).病患运动数据显然是线性不可分的,对于这种对于线性不可分的情况,把已经收集到的病患的运动数据映射到一个高维特征空间,并建立该数据从低维空间到高维空间上的映射关系,给定的病患运动数据样本是{(xi,yi)}(i=1,2,...,n),xi=(xi1,xi2,...,xim),其中n为样本容量,m每个病患运动数据一共有m项;xij为第i个病患运动数据样本的第j的数据;yi为相应的输出数据,即病患在使用运动处方进行治疗之后血糖变化情况;非线性映射关系表示如下:rn→rm(m≥n)将输入量映射到高维特征空间,φ(xi)表示xi经过非线性映射之后的数值。由此,将原病患运动数据的非线性映射转化成一个线性映射,避免在高维空间上的计算过于复杂,容易划分分类超平面。

构造并求解约束最优化问题:

ai≥0,i=1,2,…,n

求得最优a*,其中,w是分类超平面的斜率,a指的是拉格朗日乘值,它用来辅助求得w的值,φ(xi)代表的是映射函数,也就是xi经映射之后的值,φ(xj)代表的是xj经映射后的值,yi表示第i的样本中病患血糖是否正常的输出值,其中a*=(a1,a2,...,an),a*是最优的a的组合。

计算

求得分类超平面w*φ(x)+b*=0;

w*是分类超平面斜率的向量,b*表示分类超平面的截距。

2).获得分类超平面后,将病患的数据带入svm的公式,实现分类:

该分类超平面把患者分类两类,一类是病患执行该精准运动处方后未来短期内某一天的空腹血糖水平趋于正常,这类为正类;另一类是病患执行该精准运动处方后未来短期内某一天的空腹血糖水平不趋于正常,这类为负类。

分类决策函数为:

f(x)=sign(w*φ(x)+b*)

sign函数表示当w*φ(x)+b*>0的时候f(x)的值为1,当w*φ(x)+b*<0的时候f(x)的值为-1,当w*φ(x)+b*=0的时候f(x)的值为0。

3).利用已经求好的分类超平面,将新的病患运动数据进行带入分类决策函数,判断该病患在执行完精准运动处方后血糖水平为正类还是负类;将新病患的运动数据作为输入,运动干预天数、当天空腹血糖、运动前、中、后所测得的血糖值为输入就能预测出患者执行该精准运动处方后未来短期内某一天的空腹血糖水平是否趋于正常。

本模块中,在面向个体病患的样本数据量较有限的情况下,选用支持向量机(supportvectormachine,svm)方法,通过一个非线性映射,把样本空间映射到一个高维的特征空间中,使用非线性映射算法将低维输入空间线性不可分的样本,转化为高维特征空间使其线性可分,在高维特征空间采用线性算法对样本的非线性特征进行线性分析;基于结构风险最小化理论,在特征空间中构建最优超平面,使得学习器得到全局最优化,并且在整个样本空间的期望以某个概率满足一定上界。

通过短期预测血糖水平发展趋势,如果预测完得到发现运动处方无效,医生需要基于运动训练方案决策模块再对初步的运动处方进行相应的调整,然后再进行短期预测。

(2)血糖水平长期预测模块:实现对运动处方长期有效性预测:

分析判断血糖水平短期预测模块得到的运动处方是否对病患长期有效,因此需要预测出病患的长期血糖水平。

在糖尿病运动医疗康复大数据云存储层模块持续采集积累大量数据后,已经针对大量的病患完成了聚类。在血糖水平短期预测模块中得到了针对每一小类病患指制定的短期有效的运动处方。则在长期预测模块,将糖尿病有关的各个因素,运动干预天数和血糖水平短期预测模块得到的运动处方数据(如果运动处方被调整,也应包括调整后的若干次运动处方、运动干预天数)作为输入,以指定周期时间的血糖水平分别进行输出,如3个月后、6个月后、12个月后的血糖水平分别作为输出,训练人工智能模型,并验证、优化训练后的模型。

具体的可通过bp神经网络或其他人工智能算法训练实现,把所有患者的运动处方数据划分为训练集和验证集去训练神经网络模型。以运动处方数据作为输入层,如果运动处方被调整,也应包括调整后的若干次运动处方、运动干预天数,这些指标分别设为xi1,xi2,…,xim,采用有监督学习算法进行训练集学习,根据给出正确的输入和输出对神经网络进行调整,让神经网络能做出正确的反应,学习训练样本表示为(xi1,xi2,...,xim,zi),i=1,2,...,n,其中(xi1,xi2,...,xim)为样本输入数据,zi为样本输出数据,n为训练集样本数量。通过学习调整个神经元的参数,让神经网络产生期望的结果。

其中,隐含层神经元的功能函数为:

其中,θ'j为指定的阈值,gij为权重,且为激活函数。

输出层的功能函数为

其中,θ”j为指定的阈值,uij为权重,且f=1-eh/1+eh,为激活函数。

通过构建的bp神经网络模型能够很好的分析出运动处方与长期血糖水平之间的关系,最终获得的人工智能算法模型,可为新病患预测应用某个运动处方后未来长期的血糖趋势及血糖水平值,为医生针对某类病患开具、优化运动处方提供有效、准确建议。

3.3、运动训练方案寻优模块:针对不同类型的病患得到最优的运动处方;

基于血糖水平短期预测模块和血糖水平长期预测模块得到的运动处方与血糖水平关系的预测,将这个预测作为人工智能寻优算法中的非线性适应度函数,将已有的运动处方抽象构建为染色体模型,生成遗传基因的初始染色体种群,使用人工智能寻优算法对运动处方进行迭代寻优,寻优成功后获得的最优染色体即为针对某类病患的最优运动处方。

神经网络遗传算法函数极值寻优过程如下:

1.初始化:设置进化代数计数器t=0,设置最大进化代数t,将用pca降维后的运动处方抽象构建为染色体模型,生成遗传基因的初始染色体种群p(0),对于种群初始化,个体编码方法为实数编码,每个运动处方包括很多运动指标,每个运动指标均能进行实数编码,因此每个病患的运动处方数据均为一个实数串;

2.个体评价:计算群体p(t)中各个个体的适应度,这一步主要是利用血糖水平长期预测模块的bp神经网络作为自适应函数,bp神经网络可以预测出3个月后、6个月后、12个月后的血糖水平,以此来评价运动处方的优劣;

3.选择运算:将选择算子作用于群体,选择运算的作用是选择优良的基因参与遗传运算,目的是防止优良的运动处方被淘汰,从而提高全局收敛的速度。

在个体评价这一步可以评估出某一个运动处方的好坏程度,选择操作是建立在群体中个体的适应度评估基础上的。具体步骤如下:找出当前群体中适应度最高和最低的个体的集合;若当代群体中存在适应度值比迄今为止最好个体的适应度高的个体,则用此个体作为新的迄今为止的最好个体;用迄今为止的最好个体将当代群体中的最差的个体替换掉,经过多代运动处方的选择,运动处方群体逐渐优化;

4.交叉运算:将交叉算子作用于群体。遗传算法中起核心作用的就是交叉算子,交叉运算这一步主要有一点杂交、两点杂交、多点杂交三种。针对本专利基于运动处方指标数据库的单链染色体模型来说,一点杂交就是两个染色体相同位置上的的值成对的进行交换。比如处方a和b有很多运动指标项,从a中选取一个运动指标项的值与b中的一个运动指标项的值交换,同理两点杂交、多点杂交也类似,以产生更多的运动处方;

5.变异运算:将变异算子作用于群体;

即是对群体中的个体串的某些基因座上的基因值作变动,也就是说将运动处方的部分数据在一定范围内进行随机变化,这样能产生出更多的数据组合,也就是更多的处方种类。变异运算的最主要的目的就是增加处方种类的个数,从而增加找到更加优化的运动处方的概率。群体p(t)经过选择、交叉、变异运算之后得到下一代群体p(t+1);

具体操作过程如下:先指定一个变异概率pm,然后在(0,1)之间取一组随机数,其长度与编码长度相同,然后将随机数小于变异概率pm的位置上的个体基因(即相应的康复项)在一定范围内调整。需要注意的是在进行变异计算时,存储运动指标名称的染色体链上变异的范围是可选择的运动指标名称,即所有可选择的运动指标,另一条存储运动指标值的染色体链上变异的范围要由相应的运动指标决定。

6.终止条件判断:若t=t,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算,这时能够得到一个最优化的运动处方,这个运动处方输入进bp神经网络时能够预测出来的3个月后、6个月后、12个月后的血糖水平应该是较好的。

对于未知的非线性函数,仅通过函数的输入输出数据难以准确寻优函数极值,遗传算法通过模拟自然界遗传机制和生物进化论能够进行并行随机搜索最优化。

血糖水平长期预测模块使用bp神经网络训练拟合运动处方与相应血糖水平的非线性函数关系,把训练后的bp神经网络预测结果作为个体适应度值,通过选择、交叉和变异操作寻找函数的全局最优值及对应的值。利用神经网络的非线性拟合能力和遗传算法的非线性寻优能力寻找函数极值,寻找最优的运动处方。

在此需要说明的是:运动处方寻优算法将会对一批优质处方进行寻优,而在染色体模型设计的环节会遇到如下问题:(1)运动处方中所含的运动指标没有就运动指标的内容与对应量程做出说明;(2)运动处方所包含的运动指标出现顺序没有一个明确的规范,甚至可能会出现缺漏,处方长度不统一等情况。

对此,为了更好的进行运动处方寻优,本实施例采用以下手段:

本实施例对运动处方中的指标进行规范化,构建运动处方指标数据库,对运动处方指标内容、数量、对应量程,以及缺失时的默认值进行统计分析,具体如表1所示:

表1:糖尿病运动处方指标数据库参数表

系统对运动过程数据检测层(设备层)提供统一的通讯接口,远程控制病人执行设备的运动模式,运动模式包括:等速模式、适应性模式、被动模式、主被动模式、主动模式等。具体实现方式为运动过程中根据实时反馈的病患体征信息,通过预留的通讯接口控制设备参数,如速度,阻力,坡度等,根据设置的运动模式智能的调整运动设备的运行情况,结合运动过程数据检测层的反馈,使运动过程中的病人体征始终维持在运动处方指标数据库的约定区间,从而达到控制运动过程的效果,实现对运动处方的精准控制。

按照运动处方的特性设计一种基于运动处方指标数据库的单链染色体模型,使用浮点数编码的方式,将染色体看作定长数组,每个下标对应空间赋予不同的运动指标含义,染色体的长度即为运动处方指标数据库中运动指标的数量之和;为了方便后期运算对染色体的内容做特殊处理:对于缺失的运动指标,使用字典中该运动指标的默认值进行填充。

针对计算过程中算法本身容易陷入局部最优的问题,基于不同的参数组,进行重复寻优过程,直到找到相对最优的针对不同种群的运动处方为止,所述参数组的参数内容包括:交叉率,变异率,变异幅度,遗传算法的终止进化代数等。

在算法中数据的起始环节,即初始化种群过程中,提出基于血糖干预水平区间分割的初始种群产生办法,将某一病患种群有效运动处方总空间与子空间中的选中染色体分别作为初代染色体,参与后续的寻优过程,兼顾全局与局部的寻优结果;在寻优过程中,对关键步骤的参数随着迭代次数的增加与血糖水平预测结果的变化进行适应性变化,如:在变异环节,随着迭代次数的增加,线性增加或者减少变异率,变异幅度,具体的:

首先将总空间中的全部个体作为初始种群,进行运动处方寻优流程,在迭代过程中,不断改变上文提到的参数组中的参数,如随着迭代次数的增加线性增加或者减少变异率,最终得到收敛结果即为对总空间寻优得到的最优处方。

然后,根据运动处方的血糖干预水平对总空间中的染色体均匀分割产生k个子区间(子空间),设某一变量子区间的边界为[b1,b2],则以b1+(b2-b1)/2作为该子区间的均值avg,采用变量子区间均值附近m量程[avg-m,avg+m]的染色体个体作为初始种群,且avg-m>b1且avg-m<b2,将该子空间产生的个体作为初始种群,参与后续的算法流程,迭代过程与总空间操作方法相似,仍然不断改变参数组中的参数,得到该子区间的算法收敛结果,重复这个过程,直到得到所有子区间的k个寻优结果。

最后,针对上述过程得到针对该病患种群的k+1个运动处方带入适应性函数进行评估,得到该种群的最优的处方。

该方式的提出不改变算法框架,只改变迭代过程中的参数,避免了改动算法框架带来的负优化作用,使用基于总空间的全局寻优方法配合子区间梯度变化的局部寻优方法,可以使最终获得的染色体是最优染色体的概率增强,兼顾了全局与局部的染色体寻优结果,避免陷入局部最优问题。

实施例2、对于肥胖症病患,关键指标水平预测模块中关键指标为体重水平,运动训练方案具体化为运动训练计划,则相应的,本实施例中,将关键指标水平预测模块记为体重水平预测模块。本实施例与实施例1不同之处在于,针对肥胖症的参数的选择方面做适应性改变,比如,将监测的血糖水平相应的替换为监测体重水平,而具体的原理与实施例1相同。

比如,在基于降维、聚类算法获得多个具有相近特性的患者簇群和有特性的患者样本时,所述聚类分析模块中的数值量化模块采用以下处理原则:

对影响肥胖症因素的相关参数量化成数值型数据,所述的相关参数即为对肥胖症有影响的因素,这些数据经量化后成为病患数据;

首先,挑选出对病患影响比较大的因素,包括:

·详细的病史:是否有肥胖症家族遗传史,记录病发过程,是否有急性或者慢性的并发症,比如高血糖、高血压、脂肪肝等,女性病患还需要记录是否有生育历史及生育期间体重水平;

·全面的体格检查结果数据:记录身高、体重、血压、神经系统检查以及眼底检查结果;

·相关的实验室检查结果:包括不同生理状态下血糖、尿糖、血脂、糖化血红蛋白以及尿白蛋白、心电图、胸片等等,必要的时候,可以对超声心动图、肌电图、眼底荧光造影等结果进行记录;

·个体行为特征数据:饮食习惯是否健康,是否经常运动,是否有家族遗传史,是否长期饮酒,是否有情绪的异常波动,生活习惯是否规律。

将是否有某种并发症用0和1来表示,而其他各因素都能得到具体的数值,这样肥胖症患者病历中的每一项都能用具体的数值进行表示。

影响体重变化的隐性和显性因素有很多,在数值量化模块只给出了30个左右,这30个因素都能够对体重水平产生影响并且部分因素之间相互耦合,比如是否影响经常运动能够影响体重水平的变化,生活习惯也会影响体重水平的变化,同时是否经常运动也会影响生活习惯的变化,这也就是说因素之间并不是相互独立的,他们之间的互相影响并最终共同影响体重水平的变化。

同理,对于构建运动训练计划指标数据库,对运动训练计划的指标内容、数量、对应量程,以及缺失时的默认值等参数进行响应的改变,具体如表2所示:

表2:肥胖症运动训练计划指标数据库参数表

本实施例在实施例1所公开技术思路的前提下,基于关键指标水平预测模块实现面向个体的精准运动处方小样本量短期有效性预测分析和面向肥胖症的运动医疗康复大数据的大样本量体重水平中长期回归、优化分析;最后基于运动训练方案寻优模块基于运动训练计划与相应体重水平关系进行智能寻优,进而获得面向肥胖症病患群的精确的、最优的、确认有效的运动处方。

实施例3、同样的,对于高血压病患,关键指标水平预测模块中关键指标为血压水平,运动训练方案具体化为运动处方,则相应的,本实施例中,将关键指标水平预测模块记为血压水平预测模块。本实施例与实施例1不同之处在于,针对高血压病患的参数的选择方面做适应性改变,比如,将监测的血糖水平相应的替换为监测血压水平,而具体的原理与实施例1相同。

比如,在基于降维、聚类算法获得多个具有相近特性的患者簇群和有特性的患者样本时,所述聚类分析模块中的数值量化模块采用以下处理原则:

数值量化模块:对影响高血压因素的相关参数量化成数值型数据,所述的相关参数即为对高血压有影响的因素,这些数据经量化后成为病患数据;

首先,选择对病患影响比较大的因素,包括:

·详细的病史:是否有高血压家族遗传史,记录病发过程,是否有急性或者慢性的并发症,比如高血糖、冠心病、脂肪肝等,女性病患还需要记录是否有生育历史及生育期间血压水平;

·全面的体格检查结果数据:记录身高、体重、血压、神经系统检查以及眼底检查结果;

·相关的实验室检查结果:包括不同生理状态下血压,血糖、尿糖、血脂、糖化血红蛋白以及尿白蛋白、心电图、胸片等等,必要的时候,可以对超声心动图、肌电图、眼底荧光造影等结果进行记录;

·个体行为特征数据:饮食习惯是否健康,是否经常运动,是否有家族遗传史,是否长期饮酒,是否有情绪的异常波动,生活习惯是否规律。

将是否有某种并发症用0和1来表示,而其他各因素都能得到具体的数值,这样高血压患者病历中的每一项都能用具体的数值进行表示。

影响血压变化的隐性和显性因素有很多,本实施例中在数值量化模块只给出了30个左右,这30个因素都能够对血压水平产生影响并且部分因素之间相互耦合,比如是否影响经常运动能够影响血压水平的变化,生活习惯也会影响血压水平的变化,同时是否经常运动也会影响生活习惯的变化,这也就是说因素之间并不是相互独立的,他们之间的互相影响并最终共同影响血压水平的变化。

同理,对于构建运动处方指标数据库,对运动处方的指标内容、数量、对应量程,以及缺失时的默认值等参数进行响应的改变,具体如表3所示:

表3:高血压运动处方指标数据库参数表

本实施例在实施例1所公开技术思路的前提下,基于关键指标水平预测模块实现面向个体的精准运动处方小样本量短期有效性预测分析和面向高血压的运动医疗康复大数据的大样本量体重水平中长期回归、优化分析;最后基于运动训练方案寻优模块基于运动处方与相应体重水平关系进行智能寻优,进而获得面向肥胖症病患群的精确的、最优的、确认有效的运动处方。

最后需要强调的是,本实施例主要针对糖尿病、高血压和肥胖症的运动康复治疗进行介绍,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,而在不脱离本发明设计构思和原理的前提下,同样适用于心脏病等其他慢性病的康复治疗,而只需要对关键指标的选择做出适应性调整和改变;在不付出创造性劳动的前提下,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型,比如简单的调整参数和算法细节等内容,并应用于其它慢性病康复的精准运动大数据聚类、预测、分析及优化中,或者结合上述技术内容加以变更或改型为等同变化的等效实施例应用于其它领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1