本发明涉及一种基于多因素线索网络的血压预测方法。
背景技术:
血压检测中,研究者们多用光电容积脉搏波(ppg)[12]、脉搏传导时间(ptt)[13]、心电图(ecg)[14]、血压仪示波[15]等这些人体生理信号来估测实时的血压值。对于这类血压估测经常用到的模型有线性回归模型[16],支持向量机(svm)[17],支持向量回归(svr)[18],递归神经网络[19],改进的高斯混合回归(igmr)方法[20],多模型混合[21,22]等等。文献[12]仅使用光电容积脉搏波(ppg),基于递归神经网络(lstm)开发出了一种高精度,估测连续动脉血压的模型,文献[13]采用了新的数据处理方式two-stagezero-orderholding(tzh)处理脉搏传导时间(ptt),也是基于lstm模型建模,并与传统线性回归方法对比,提高了血压估测的精度,文献[16]使用了线性回归模型,该模型结合了静态和动态ptt特征来更准确地估测用户血压值,文献[23]将深度信念网络(deepbeliefnetwork)引入血压值的估测,文献[24]提出模拟特征回归模型学习从示波信号获得的模拟特征向量与目标血压之间的复杂非线性关系,文献[25]提出一种小波神经网络算法,根据ppg信号重建完整的血压波形以提取收缩压和舒张压。以上血压检测研究利用示波信号来实现对血压数据的估测,使用估测结果对用户的血压状况进行评价,当用户血压处于非正常状态时,对用户进行提醒预警,这类方法需要设备来测量,无法提前预测血压变化情况,要实现及时有效的血压预警非常困难。
技术实现要素:
本发明的目的在于提供一种基于多因素线索网络的血压预测方法。
本发明采用的技术方案是:
一种基于多因素线索网络的血压预测方法,其包括以下步骤:
步骤1,输入近期血压观测值x1=[x11,x12,...,xln],采用现有的双通道预测的lstm模型获取血压预测通道隐藏层输出h3;
步骤2,输入与血压关联的时序数据x2=[x21,x22,…,x2n],采用现有的双通道预测的lstm模型获取时序数据预测通道隐藏层输出h4;
步骤3,从原始用户信息数据提取与血压预测相关性高的n个因素数据融合得到用户基本信息线索b,n为大于2的整数:
步骤4,血压预测通道隐藏层输出h3、时序数据预测通道隐藏层输出h4、基本信息线索b的数据联合并采用relu函数进行非线性激活得到隐藏层输出h5,计算公式如下:
h5=relu(h3w3+h4t+bq)(3.3)
其中,w3表示血压预测通道隐藏层输出的权重,t表示时序数据预测通道隐藏层输出的权重,q表示基本信息线索的权重;
步骤5,应用线性回归得到血压预测值和时序数据预测值,计算公式如下:
y1*=h5v1+b1(3.4)
y2*=h4v2+b2(3.5)
其中,v1是血压预测的线性回归参数,v2是时序数据预测的线性回归参数,b1是血压预测的偏差,b2是时序数据预测的偏差;y1表示血压预测值,y2表示预测时序数据预测值。
进一步地,步骤2中具体选取用户的心率数据作为时序数据。
进一步地,步骤3中基本信息线索包括用户基本信息及环境温度,用户基本信息包括年龄、性别、bmi、身高、体重、服药情况、饮酒情况、吸烟情况。
进一步地,步骤3的具体步骤如下:
步骤3.1,获取包括各个关联因素数据的原始用户信息数据;
步骤3.2,采用皮尔森相关系数去计算原始用户信息数据中各关联因素数据与血压数值的相关性大小,
步骤3.3,从各关联因素数据中选取相关系数排列的前n个因素融合得到用户基本信息线索b,融合公式如下:
其中,datan代表第n个因素值,pearn代表第n个因素对应的相关系数大小在所有系数中所占比例。
进一步地,步骤3中n的取值为7。
本发明采用以上技术方案,将用户的个人基本信息以及与血压相关联的时序测量数据(心率)作为辅助因素作用于血压预测,添加的相关时序测量数据的预测结果,将模型中添加的所有因素看作用户未来一天所有线索数据,在预测其未来血压时提前将用户的状态输送给血压预测。利用现有的双通道预测的lstm模型形成血压预测通道和时序预测通道,双通道工作原理相同。血压预测通道利用近期血压观测值x1=[x11,x12,...,x1n]预测血压预测值y1;时序预测通道通过与血压关联的时序测量数据x2=[x21,x22,...,x2n]预测时序数据预测值y2,运用的多任务学习。用户通过预测值,就可以改变生活习惯,采取一定的措施和手段改善血压状况,达到身体健康的目的。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明采用的网络模型结构示意图;
图2为本发明的多任务训练示意图;
图3为血压与心率相关对比示意图。
具体实施方式
如图1-3之一所示,本发明提出一种多因素线索-lstm网络,将用户的个人基本信息以及与血压相关联的时序测量数据(心率)作为辅助因素作用于血压预测,此模型添加时序因素时,不是添加的相关时序测量数据本身,而是添加的相关时序测量数据的预测结果,可以将模型中添加的所有因素看作用户未来一天所有线索数据,在预测其未来血压时提前将用户的状态输送给血压预测,故将模型定义为本发明cues-lstm网络。
如图1所示,本发明采用现有的lstm双通道预测模型结构,该模型包括双通道预测:血压预测通道和时序预测通道。血压预测通道利用近期血压观测值x1=[x11,x12,...,x1n]预测血压预测值y1;时序预测通道通过与血压关联的时序测量数据x2=[x21,x22,...,x2n]预测时序数据预测值y2,二者取相同的n个时间长度的数据。本发明同时对血压和时序数据预测结果进行输出采用的是多任务训练的思想如图2所示。
其中,用户的个人信息包括几个与血压值息息相关的几个因素直播如下表1所示:
表1与血压有关的用户基本信息
本发明方法的具体工作流程:
(1)时序数据x=[x1,x2]通过双层lstm网络,对输出结果进行拆分,分别得到血压和时序预测通道上隐藏层的输出h1和h2,对二者选用relu(x)=max(0,x)来进行非线性激活。relu会使部分神经元的输出为0,缓解了过拟合问题的发生,使用relu在进行反向传播时计算量会节省很多,相比较的,对于深层网络,sigmoid和tanh在反向传播时,很容易会出现梯度消失的情况。
(2)对于用户基本信息线索b的处理,原始数据中包含多个与血压数据相关联的因素数据,首先采用皮尔森相关系数去计算各关联因素数据与血压数值的相关性大小,计算方法见式(3.1),其中对于用户的基本信息线索,采用用户个人所有血压数据记录的平均值来计算与其相关系数大小,从中选取相关系数排列的前7个因素按公式(3.2)融合得到模型中的基本信息线索b。同时,此处在进行因素选取时,要考虑因素之间共线性的影响,如,在计算时,臀围和腰臀比与血压相关性大小差不多,我们只选取腰臀比作为一个因素,避免腰围与腰臀比这种本身关联性比较的因素都被选取进来,对模型训练造成干扰。
其中,cov(x,y)代表x和y的协方差,σx,σy分别代表各自的标准差。
其中,datan代表第n个因素值,pearn代表第n个因素对应的相关系数大小在所有系数中所占比例。
(3)为血压预测通道隐藏层输出h3、时序数据预测通道隐藏层输出h4、基本信息线索b的联合添加额外的隐藏层,将隐藏层添加在此处,使得模型能够将循环结构与固定信息进行联合。数据联合后依然采用relu来进行非线性激活得到隐藏层输出h5,见公式(3.3),多数据的联合使得血压预测不光从血压数据中提取特征,同时从与血压关联的数据中提取特征。最后应用线性回归来得到血压和时序线索的预测值,见公式(3.4)(3.5)。
h5=relu(h3w3+h4t+bq)(3.3)
y1*=h5v1+b1(3.4)
y2*=h4v2+b2(3.5)
其中,v1,v2分别是血压和时序线索数据线性回归的参数,b1,b2分别是它们的偏差。
下面将本发明具体工作原理做详细说明:
本发明的本发明cues-lstm网络中时序数据的选择部分,时序数据包括心率和环境温度,对于心率,多项研究已经表明心率变化与血压变化息息相关,如文献[50]通过研究夜间收缩压变化与心率变化之间的关系证明血压变化与心率变化有很大关联性。图3所示,为本发明实验数据中某用户心率和血压的变化趋势图,图3中变化趋势可以看出心率和血压变化趋势有很大的相似性。对于温度数据,实验温度数据采用每天气温的平均值,这导致短期温度数据的变化趋势不明显,不适合做时序数据线索。所以采用心率作为时序线索。
本发明模型中基本信息线索b的组成包含用户基本信息及环境温度,用户基本信息即数据介绍中用户基本信息包含的属性,同时加入了会影响人体血压变化的温度因素,选用该序列长度n天的平均气温作为温度线索。
实验验证:
实验数据包括三部分,其中目标数据包括舒张压、收缩压;时序线索数据包括心率、温度;用户基本信息线索数据包括年龄、性别、bmi、身高、体重、服药情况、饮酒情况、吸烟情况、是否能正常运动。实验数据采自某养老院中190个用户在2017年的全部血压数据,共20774条血压数据,其中个人基本信息完整的有131人,本部分实验选用信息记录完整的用户进行血压预测,共15162条血压数据。
实验结果评价方法:预测结果的评价选用平均绝对误差(mae)和均方根误差(rmse),公式见(3.8)(3.9),mae能很好的反应预测值误差的实际情况,rmse用来衡量预测值与真实值之间的偏差。
其中,yi代表血压的真实值,y1*代表血压的预测值。
不同方法实验对比:
参见表2,本发明的发明相较于其他网络误差更小,效果更好。分析表2实验结果,lstm-cl网络模型较传统lstm模型血压预测准确率更高,证明用户个人基本信息的添加确实会提高血压预测的准确度。multi-lstm模型较传统模型血压预测准确度也有提高,证明与血压相关联的时序测量数据的引入会提高血压预测的准确度,同时multi-lstm模型比lstm-cl模型效果也要稍好,个人分析认为有两方面原因,一是multi-lstm模型采用多任务训练的方式,将心率与血压数据之间隐藏的关联关系用于血压预测,在两个输入反馈时,心率数据也会影响处理血压部分神经元的调参,另一方面,虽然multi-lstm模型中只有心率数据作为辅助因素,不如lstm-cl网络辅助因素个数多,但由于心率因素为时序测量数据,使得每组血压数据都添加了不同的心率因素值,所以multi-lstm模型效果更好。本发明cues-lstm网络血压预测准确度要高于其他模型,分析认为本发明cues-lstm网络包含了个人基本信息以及关联时序测量数据,血压预测不仅提取血压数据本身特征,更充分利用了其他相关联的因素影响特征,更综合了其他模型的优点。将用户基本信息与时序关联因素共同作用于血压预测。模型中时序因素选择的是心率,由multi-lstm网络模型相较传统lstm网络有更好的效果,也证明本发明cues-lstm中时序数据的确可以选用心率数据。
表2不同方法预测结果
本发明采用以上技术方案,将用户的个人基本信息以及与血压相关联的时序测量数据(心率)作为辅助因素作用于血压预测,添加的相关时序测量数据的预测结果,将模型中添加的所有因素看作用户未来一天所有线索数据,在预测其未来血压时提前将用户的状态输送给血压预测。利用现有的双通道预测的lstm模型形成血压预测通道和时序预测通道,双通道工作原理相同。血压预测通道利用近期血压观测值x1=[x11,x12,...,x1n]预测血压预测值y1;时序预测通道通过与血压关联的时序测量数据x2=[x21,x22,...,x2n]预测时序数据预测值y2,运用的多任务学习。本发明所提供的预测血压的方法,用户通过预测值,就可以改变生活习惯,采取一定的措施和手段改善血压状况,达到身体健康的目的。
参考文献
[1]顾景范.《中国居民营养与慢性病状况报告(2015)》解读[j]营养学报,2016,38(6):525-529.
[2]sparrowd,garveyaj,rosnerb,etal.factorsinpredictingbloodpressurechange[j]circulation,1982,65(4):789-94.
[3]reckelhoffjf.genderdifferencesintheregulationofbloodpressure[j].hypertension,2001,37(5):1199-1208.
[4]golinohf,amaralls,duartesf,etal.predictingincreasedbloodpressureusingmachinelearning[j].jobes,2014,2014(5):637635.
[5]criquimh,wallacerb,mishkelm,etal.alcoholconsumptionandbloodpressure.thelipidresearchclinicsprevalencestudy[j]hypertension,1981,3(5):557-565.
[6]hartunggh,kohlhw,blairsn,etal.exercisetoleranceandalcoholintake.bloodpressurerelation[j].hypertension,1990,16(5):501.
[7]李帅.基于大规模快递数据的时序分析研究与实现[d].北京邮电大学,2018.
[8]povinellirj.timeseriesdatamining:identifyingtemporalpatternsforcharacterizationandpredictionoftimeseriesevents[m].marquetteuniversity,1999.
[9]王志堂,蔡淋波.隐马尔可夫模型(hmm)及其应用[j]湖南科技学院学报,2009,30(4):42-44.
[10]chobanianav,bakrisgl,blackhr,etal.theseventhreportofthejointnationalcommitteeonprevention,detection,evaluation,andtreatmentofhighbloodpressure:thejnc7report[j].acccurrentjournalreview,2003,12(4):31-32.
[11]niiranentj,havulinnaas,langénvl,etal.predictionofbloodpressureandbloodpressurechangewithageneticriskscore[j].journalofclinicalhypertension,2016,18(3):181-186.
[12]yoonyz,yoongw.nonconstrainedbloodpressuremeasurementbyphotoplethysmography[j]journaloftheopticalsocietyofkorea,2006,10(2):91-95.
[13]lofp,licx,wangj,etal.continuoussystolicanddiastolicbloodpressureestimationutilizinglongshort-termmemorynetwork[j].confprocieeeengmedbiolsoc,2017:1853-1856.
[14]ghoshs,banerjeea,rayn,etal.continuousbloodpressurepredictionfrompulsetransittimeusingecgandppgsignals[c].healthcareinnovationpoint-of-caretechnologiesconference.ieee,2016:188-191.
[15]forouzanfarm,dajanihr,grozavz,etal.feature-basedneuralnetworkapproachforoscillometricbloodpressureestimation[j].ieeetransactiohsoninstrumentation&measurement,2011,60(8):2786-2796.
[16]hsiehyy,wucd,luss,etal.alinearregressionmodelwithdynamicpulsetrannsittimefeaturesfornoninvasivebloodpressureprediction[c].biomedicalcircuitsandsystemsconference.ieee,2017:604-607.
[17]liangb,duank,xieq,etal.livedemonstration:asupportvectormachinebasedhardwareplatformforb1oodpressureprediction[c].biomedicalcircuitsandsystemsconference.ieee,2017∶130-130.
[18]贵明俊,张新峰,张钊,刘晓民,王新宴.基于svr的桡动脉血压预测[j]北京生物医学工程,2016,35(3):267-271
[19]siderisc,kalantarianh,nematie,etal.buildingcontinuousarterialbloodpressurepredictionmodelsusingrecurrentnetworks[c].ieeeinternationalconferenceonsmartcomputing.ieeecomputersociety,2016∶1-5.
[20]lees,parkch,changjh.improvedgaussianmixtureregressionbasedonpseudofeaturegenerationusingbootstrapinbloodpressureestimation[j].ieeetransactiohsonindustrialinformatics,2015(99):1-1.
[21]sadrawim,shiehjs,fansz,etal.intermittentbloodpressurepredictionviamultiscaleehtropyandensembleartificialneuralnetworks[c].biomedicalengineeringandsciences.ieee,2017:356-359.
[22]kaurg,aroraas,jainvk.usinghybridmodelstopredictbloodpressureteactivitytounsupportedbackbasedonanthropometriccharacteristics[j].frontiersofinformationtechnology&electronicengineering,2015,16(6):474-485.
[23]lees,changjh.deepbeliefnetworksensembleforbloodpressureestimation[j].ieeeaccess,2017,5:9962-9972.
[24]lees,changjh.deepboltzmannregressionwithmimicfeaturesforoscillometricbloodpressureestimation[j].ieeesensorsjournal,2017,pp(99):1-1.
[25]lip,lium,zhangx,etal.novelwaveletneuralnetworkalgorithmforcontinuousandnoninvasivedynamicestimationofbloodpressurefromphotoplethysmography[j]sciencechinainformationsciences,2016,59(4):1-10.
[26]abbasir,moradimh,molaeezadehsf.long-termpredictionofbloodpressuretimeseriesusingmultiplefuzzyfunctions[c].biomedicalengineering.ieee,2015:124-127.
[27]boxge,jenkinsgm.timeseriesanalysis:forecastingandcontro1rev.ed.[j]journaloftime,1976,31(4):238-242.
[28]wuth,pangkh,kwongwypredictingsystolicbloodpressureusingmachinelearning[c].internationalconferenceoninformationandautomationforsustainability.ieee,2015∶1-6.
[29]lix,wus,wangl.bloodpressurepredictionviarecurrentmodelswithcontextuallayer[c].internationalconferenceonworldwideweb.internationalwotldwidewebconferencessteeringcommittee,2017:685-693.
[30]sparrowd,garveyaj,rosnerb,etal.factorsinpredictingbloodpressurechange[j].circulation,1982,65(4):789-94.
[31]golinohf,amaralls,duartesf,etal.predictingincreasedbloodpressureusingmachinelearning[j].jobes,2014,2014(5):637635.
[32]cooknr.useandmisuseofthereceiveroperatingcharacteristiccurveinriskprediction[j].circulation,2007,115(7):928-35.
[33]lydicke,epsteinrs,himmelbergerd,etal.areaunderthecurve:ametricforpatientsubjectiveresponsesinepisodicdiseases.[j].qualityofliferesearch,1995,4(1):41-45.
[34]gevinsas,morgannh.applicationsofneural-network(nn)signalprocessinginbrainresearch[j].ieeetransactionsonacousticsspeech&signalprocessing,1988,36(7):1152-1161.
[35]gravesa.longshort-termmemory[m].supervisedsequencelabellingwithrecurrentneuralnetworks.springerberlinheidelberg,2012:1735-1780.
[36]梁军,柴玉梅,原慧斌,等.基于极性转移和lstm递归网络的情感分析[j]中文信息学报,2015,29(5):152-160.
[37]bottoul.large-scalemachinelearningwithstochasticgradientdescent[j]2010:177-186.
[38]zhangx.regularization[j].encyclopediaofmachinelearning,2017,53(6):845-849.
[39]ioffes,szegedyc.batchnormalization:acceleratingdeepnetworktrainingbyreducinginternalcovariateshift[c].internationalconferenceoninternationalconferenceonmachinelearning.jmlr.org,2015∶448-456.
[40]yaoy,rosascol,caponnettoa.onearlystoppingingradientdescentlearning[j].constructiveapproximation,2007,26(2):289-315.
[41]srivastavan,hintong,krizhevskya,etal.dropout:asimplewaytopreventneuralnetworksfromoverfitting[j]journalofmachinelearningresearch,2014,15(1):1929-1958.
[42]feelgood,steven,schaefer,gerarda.dealingwithmissingdata[j].researchlettersintheinformation&mathematicalsciences,2002,3(1):153--160.
[43]min-lingzhang,zhi-huazhou.ml-knn:alazylearbingapproachtomulti-labellearning[j]patternrecognition,2007,40(7):2038-2048.
[44]于亚飞.基于划分和密度的聚类算法研究[d].安徽大学,2011.
[45]aristidislikas,nikosvlassis,jakobj.verbeek.theglobalk-meansclusteringalgorithm[j].patternrecognition,2003,36(2):451-461.
[46]沈洁,赵雷,杨季文,等.一种基于划分的层次聚类算法[j]计算机工程与应用,2007,43(31):175-177.
[47]schikutae.grid-clustering:anefficienthierarchicalclusteringmethodforverylargedatasets[c].internationalconferenceonpatternrecognition.ieee,1996∶101-105vol.2.
[48]prattl,prattl,thruns.machinelearning-specialissueoninductivetransfer[m].kluweracademicpublishers,1997.
[49]caruanar.multitasklearning[j]machinelearning,1997,28(1):41-75.
[50]刘洪洋,李莉,崔天祥,等.血压控制良好的原发性高血压患者夜间收缩压下降率与心率及心率变异性的关系[j].中华高血压杂志,2015(11):1076-1079
[51]billingssa,zhenggl.radialbasisfunctionnetworkconfigurationusinggeneticalgorithms[m].elsevierscienceltd.1995.
[52]董学思.多组学缺失数据联合填补方法评价及其应用[d].南京医科大学,2017.
[53]罗高博.健康管理云平台的设计与实现[d].北京交通大学,2017.