本发明涉及生物技术领域,尤其涉及一种利用脂质生物标志物预测糖尿病高血压的方法,能够准确预测糖尿病高血压。
背景技术:
高血压既是糖尿病的风险因素,与其他因素协同促进了糖尿病及其他并发症的发生,也可以是糖尿病的并发症状之一。也可以说糖尿病与高血压经常是相互伴随的,三分之二的糖尿病患者患有高血压,而高血压患者也会出现不同程度的胰岛素抵抗。目前还没有对于高血压作为糖尿证并发症的特异性标志物,而对其进行预测与检测。但是高血压本身的早期标志物主要集中于内皮细胞功能障碍与氧化应激方面,如一氧化氮与前列环素的下降,氧化的低密度脂蛋白与脂质过氧化物的增加,因此,开发快速高效,且可以通过验血就能了解和预测糖尿病并发症高血压的方法和模型,具有重要的临床意义和市场前景。
技术实现要素:
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种利用脂质生物标志物预测糖尿病高血压的方法,能够快捷、准确、高效地预测糖尿病高血压。
本发明还有一个目的是提供一种针对中国人群的利用脂质生物标志物预测糖尿病高血压的方法。
本发明还有一个目的是提供一组针对中国人群的与糖尿病高血压密切相关的化合物。
为了实现根据本发明的这些目的和其它优点,提供了以下技术方案:
一种利用脂质生物标志物预测糖尿病高血压的方法,其中,主要包括以下步骤:
步骤1、筛选出正常人组群和糖尿病高血压组群之间vip值大于1的排名前6位的差异性化合物,分别为表1所示:
表1
步骤2、利用逻辑回归模型2进行计算,得到tc值,所述逻辑回归模型2的计算公式为:
tc=15.272+(-0.179)*r751+(-0.751)*r773+(-0.1.315)*r1400+(-1.094)*r1461;
步骤3、根据所得tc值进行判断,tc=0为否;tc=1为是。
优选的是,所述的利用脂质生物标志物预测糖尿病高血压的方法中,步骤1中利用opls-da模型对差异性化合物进行筛选,筛选条件vip>1。
优选的是,所述的利用脂质生物标志物预测糖尿病高血压的方法中,步骤1中筛选的具体方法为:
步骤1.1将样品进行超高效液相色谱和质谱分析,得到脂质组学数据,将正常人组群和糖尿病高血压组群分别计为ck及gxy。
步骤1.2对脂质组学数据进行标准化操作,利用opls-da模型对ck及gxy进行s-plot分布得到s形曲线,并进行强制分组,计算影响ck及gxy分组的变量重要性,即得vip值。
步骤1.3按照vip值大于1的标准得到93个化合物,并将该93个化合物作为与糖尿病高血压相关度最高的差异性化合物。
步骤1.4将所得93个化合物按照vip值大小从高到低排列,取前6位,即得步骤1中所述差异性化合物。
优选的是,所述的利用脂质生物标志物预测糖尿病高血压的方法中,步骤2中tc值或者用逻辑回归模型1进行计算,所述逻辑回归模型1的计算公式为:
tc=18.661+(-0.484)*r751+(0.475)*r773+(-0.134)*r776+(-0.436)*r904+(-1.445)*r1400+(-1.207)*r1461。
优选的是,所述的利用脂质生物标志物预测糖尿病高血压的方法中,步骤2中tc值或者用逻辑回归模型3进行计算,所述逻辑回归模型3的计算公式为:
tc=18.309+(-0.490)*r751+(-0.525)*r773+(-0.458)*r904+(-1.410)*r1400+(-1.175)*r1461。
本发明至少包括以下有益效果:
本发明通过筛选,首次发现与糖尿病高血压相关的一组化合物,即与糖尿病高血压相关的脂质生物标志物,并通过构建逻辑回归模型,得到根据这些脂质标志物预测糖尿病高血压的方法,快捷方便,准确度高。通过aic值初步判断,并进行roc曲线绘制,准确度高达94.3%。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明中所述的opls-da模型的s-plot分布图;
图2为本发明中利用opls-da模型对ck和gxy进行强制分组的结果;
图3为本发明中用来考察筛选出的化合物的火山图;
图4为本发明中roc曲线图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。
一种利用脂质生物标志物预测糖尿病高血压的方法,其中,主要包括以下步骤:
步骤1、筛选出正常人组群和糖尿病高血压组群之间vip值大于1的排名前6位的差异性化合物,分别为表1所示:
表1
步骤2、利用逻辑回归模型2进行计算,得到tc值,所述逻辑回归模型2的计算公式为:
tc=15.272+(-0.179)*r751+(-0.751)*r773+(-0.1.315)*r1400+(-1.094)*r1461;
步骤3、根据所得tc值进行判断,tc=0为否;tc=1为是。
一个优选方案中,步骤1中利用opls-da模型对差异性化合物进行筛选,筛选条件vip>1。
一个优选方案中,步骤1中筛选的具体方法为:
步骤1.1将样品进行超高效液相色谱和质谱分析,得到脂质组学数据,将正常人组群和糖尿病高血压组群分别计为ck及gxy;
步骤1.2对脂质组学数据进行标准化操作,利用opls-da模型对ck及gxy进行s-plot分布得到s形曲线,并进行强制分组,计算影响ck及gxy分组的变量重要性,即得vip值;
步骤1.3按照vip值大于1的标准得到93个化合物,并将该93个化合物作为与糖尿病高血压相关度最高的差异性化合物;
步骤1.4将所得93个化合物按照vip值大小从高到低排列,取前6位,即得步骤1中所述差异性化合物。
一个优选方案中,步骤2中tc值或者用逻辑回归模型1进行计算,所述逻辑回归模型1的计算公式为:
tc=18.661+(-0.484)*r751+(0.475)*r773+(-0.134)*r776+(-0.436)*r904+(-1.445)*r1400+(-1.207)*r1461。
一个优选方案中,步骤2中tc值或者用逻辑回归模型3进行计算,所述逻辑回归模型3的计算公式为:
tc=18.309+(-0.490)*r751+(-0.525)*r773+(-0.458)*r904+(-1.410)*r1400+(-1.175)*r1461。
本发明通过筛选,首次发现与糖尿病高血压相关的一组化合物,即与糖尿病高血压相关的脂质生物标志物,并通过构建逻辑回归模型,得到根据这些脂质标志物预测糖尿病高血压的方法,快捷方便,准确度高。通过aic值初步判断,并进行roc曲线绘制,准确度高达94.3%。
实施例1
材料和方法
1.实验对象(均选自中国人):59例糖尿病患者(无其他并发症),111例糖尿病高血压患者,抽取静脉血5ml。准确量取100μl的血液,加入0.9ml的提取液(100%异丙醇),转入2ml离心管中,漩涡振荡10s以上,超声10min,然后在-20度冰箱中冷冻1小时,取出后在室温下漩涡振荡,用冷冻离心机10000rpm离心10min,然后取上清液1ml到玻璃进样瓶中,保存在冰箱中待测。
2.主要仪器
2.1.1冷冻离心机:型号d3024r,scilogex公司,美国
2.1.2漩涡振荡器:型号mx-s,scilogex公司,美国
2.1.3高分辨质谱仪:esi-qtof/ms;型号:xevog2-sq-tof;厂家:waters
2.1.4超高效液相色谱:uplc;型号:acquityuplci-class系统;厂家:waters
2.1.4数据采集软件:masslynx4.1;厂家:waters
2.1.5分析鉴定软件:progenesisqi;厂家:water
2.1.6作图软件:ezinfo;hemi;simca-p
3.主要试剂
甲醇、乙腈、甲酸、甲酸铵、亮氨酸脑啡肽、甲酸钠。厂家均为fisher。
4.实验设置
以提取液(100%异丙醇)作为空白对照(blank)样品;从每个样品的进样品种取出100μl混合到新的进样品种作为质控(qc)样品;正式样品按照每组样品间隔进样,例如先是blank1,然后是qc1,然后是w1,然后是w2这个顺序,然后再进行下一轮进样。
液相方法
色谱柱:acquityuplccshc18column,
柱温:55度
流速:0.4ml/min
流动相:
a:acn/h2o(60%/40%),含有10mm甲酸铵和0.1%甲酸
b:ipa/acn(90%/10%),含有10mm甲酸铵和0.1%甲酸
(注:acn为乙腈,ipa为异丙醇)
进样体积:0.2μl
洗脱程序:
质谱方法
数据采集方式:mse;分子量扫描范围:50-1500m/z;分辨率模式(轮廓图)。
正负离子模式各采集一次。
离子源:电喷雾电离源(esi)
毛细管电压:3kv
锥孔电压为:25v
碰撞能:15-60v
源温度:120度
脱溶剂温度:500度
锥孔气体速度:50l/h
脱溶剂气体速度:500l/h
扫描时间:0.2s
使用亮氨酸脑啡肽(m/z556.2771,正离子;554.2615,负离子)进行实时校正。使用甲酸钠进行校正。
脂质组学数据分析
progenesisqi软件(waters,massachusetts,usa)用于结果分析,抽提非靶向脂质分子的特征峰,进行比对和筛选。同时,用qc(quantifyingcontrol)和blank(空白)来筛选背景数据。最终的数据,导入ezinfo3.0,并进行principalcomponentanalysis(pca)分析,orthogonalsignalcorrectionpartialleastsquarediscriminationanalysis(opls-da)建模,variableimportanceinprojection(vip)的计算,同时得到s-plot和火山图(coefficientsvs.vipspots)。其中,逻辑回归模型以及roc曲线通过r语言进行建设和绘制。
结果描述
糖尿病(无其他并发症)与糖尿病高血压人群脂质差异物质的鉴定。
我们首先建立opls-da模型,对糖尿病(无其他并发症)(ck)和糖尿病高血压(gxy)组群进行分类,并研究造成他们出现差异的原因。我们看到在opls-da模型中,利用相关性(correlation)和协方差(covarience)的p值作出的s-plot形成了s形曲线,opls-da模型的s-plot分布如图1所示,更多的差异脂质显示有极大的升高。
利用opls-da将两组数据进行强制分组,结果如图2所示。
计算影响ck和gxy分组的变量重要性,即vip(variableimportanceinprojection)值。一共筛选到93个化合物,他们的vip值大于1;我们挑选vip贡献率大的6个化合物。
我们通过vip>1筛选出来的化合物在s-plot上用红色方框标出,发现他们均匀的分布在两侧。同时,我们利用火山图,来考察筛选出的化合物的分布,如图3所示,发现筛选出来的化合物都分布在火山图的外围。这些结果都说明,借由opls-da模型,我们成功筛选出造成ck和gxy差异的化合物。
建立逻辑回归模型以及roc曲线。
我们对脂质组学的数据进行标准化操作(rproject:scale)。然后将vip>1的排名前6的数据提取出来,建立逻辑回归模型和roc曲线。
公式中,tc:是否患有高血压,0为否,1为是。
模型1:tc=18.661+(-0.484)*r751+(0.475)*r773+(-0.134)*r776+(-0.436)*r904+(-1.445)*r1400+(-1.207)*r1461。经过roc曲线绘制,模型1的auc值为0.942,准确度为94.2%。
模型3:tc=18.309+(-0.490)*r751+(-0.525)*r773+(-0.458)*r904+(-1.410)*r1400+(-1.175)*r1461。经过roc曲线绘制,模型1的auc值为0.943,准确度为94.3%。
经过roc曲线绘制,模型2的auc值为0.923,准确度为92.3%。
模型2:tc=15.272+(-0.179)*r751+(-0.751)*r773+(-0.1.315)*r1400+(-1.094)*r1461。
经过roc曲线绘制,模型3的auc值为0.943,准确度为94.3%。
针对以上三个逻辑回归模型,进行roc曲线绘制,如图4所示,模型1为m1,auc值达到0.942;模型2为m2,auc值为0.943;模型3为m3,auc值达到0.923。我们发现模型2最靠近左上角定点,同时auc值最高,最终,确定模型2为基于脂质指标来预测糖尿病血脂异常较好的预测模型。也可以根据所测样品数据情况,选择模型1或者模型3进行计算预测,或者优先选择模型2进行计算,同时使用1和3模型进行辅助验证,协同分析预测。
本发明利用opls-da模型,首次发现与糖尿病高血压相关的6个biomarker。利用逻辑回归模型以及roc曲线,首次提出了基于脂质生物标志物的糖尿病高血压预测模型。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。