序代码进行数据预处理,包括 基线过滤、峰识别,进行保留时间校正、峰对齐和质谱碎片归属分析,最后在EXCEL2007软 件中进行后期编辑,包括来自于柱流失和样本制备造成的杂质峰剔除和定量离子选择,将 最终结果组织为二维数据矩阵,包括变量(rt_mz,即保留时间_质荷比)、观察量(样本)和峰 强度,本发明实施例所得血清经分离分析共得到1639个物质(每组至少80%以上样本中存 在);提取并对齐仪器原始数据,获得无噪音干扰、可用于统计分析的数据; d. 数据分析: 将所有数据归一化到总信号积分,将编辑后的数据矩阵导入版本11. 〇的Simca-P软 件,分别进行主成分分析和偏最小二乘方判别分析; Simca-P软件中,数据均采用默认的UV格式化(UnitVarianceScaling)和平均中 心化(Mean-Centered)处理,以获得更加可靠且更加直观的结果。主成分分析作为一种 非监督式的方法,能够真实反应样本的情况,所以首先采用PCA的方法对整体样本进行评 估。软件对整体数据进行模型拟合分析,共获得5个主成分,R2X=0. 203 (横坐标为第1主 成分得分,用t[l]表示;纵坐标为第2主成分得分,用t[2]表示)。PCA得分图(Scores plot)如图1所示;样本大部分处于95%置信区间(Hotelling T2 ellipse)内。一般来 说临床样本PCA分析中的参数R2X值大于0. 1就表示该模型可靠,因此当前PCA模型能 可靠地用于解释样本之间的代谢差异。从图1中可以直观地观察出三组之间的大体分布 趋势,为了保证数据的原始性,在不影响后续分析的前提下,不剔除三个在置信区间外的 样本。之后采用PLS-DA对AB两组及AC两组样本进行模型分析;AB两组间共获得3个 主成分,R2X=0. 139, R2Y=0. 996, Q2=0. 818,得分图如图2所示;AC两组间共获得3个主成 分,R2X=0. 16, R2Y=0. 998, Q2=0. 905,得分图如图3所示;AC两组间共获得3个主成分, R2X=0. 133, R2Y=0. 995, Q2=0. 785,得分图如图4所示;大部分样本均处于95%置信区间内。 一般来说R2Y及Q2值大于0. 4就表示该模型可靠,因此当前PLS-DA模型能可靠地用于解 释两组样本之间的代谢差异; e. 差异性代谢产物确定及其结构鉴定: 采用PLS-DA模型第一主成分的VIP值(阈值>1),并结合学生氏t检验的p值(阈值 0. 05)确定差异性代谢产物并对其结构进行鉴定; f. 分析预测平台的建立: 选择显著的差异性代谢产物构成预测平台,具体步骤: f. 1分别按照差异性代谢产物的VIP值、R0C曲线下的面积和倍数变化的绝对值降序排 列,P值升序排列,形成四个列表; f. 2挑选所有列表中的前20%的变量为分析预测糖尿病认知功能障碍的标准值,构成 预测平台。
[0014] 定性方法为:搜索自建的标准物质数据库和公共网络数据库(Metlin以及HMDB)。
[0015] 可根据所选择的差异性代谢产物建立代谢网络,具体步骤为: 下载KEGG数据库中pathway数据,通过R(http://www.r-project.org/)下载 (http://www.bioconductor,org/packages/2. 4/bioc/html/KEGGSOAP.html)软件包,分析 基因组范围内的代谢物之间的相互作用,参数设定5步反应之内为相关的代谢物,建立网 络,网络构建软件使用cytoscape(http://www.cytoscape.org)。
【主权项】
1. 一种基于代谢组学数据建立分析预测糖尿病认知功能障碍平台的方法, 其特征在于按照如下步骤进行: a. 取冷冻储存的H组血浆样本,分别为A组健康人;B组糖尿病患者但未 患认知功能障碍;C组糖尿病患者但患有认知功能障碍;将H组血浆样本均置于室温 下解冻15min,润縱震荡5s;分别取每个样本100y1加入300y1HPLC级甲醇,润縱震荡 30s,4°C静置20min;对所有样本进行冷冻离也,12000巧m,4°C,15min,取每个样本的上 清液; b. 将每个样本的上清液分别进入LC/MS进行分离; 色谱条件;分离色谱柱为C18色谱柱,分离条件为;柱温为4(TC;流速0. 4ml/min;流 动相组成A;水+0. 1%甲酸,B;己膳+0. 1%甲酸;梯度洗脱程序见表1 ;进样量为5y1,自动 进样器温度4C; 表1质谱条件:采用ESI正离子模式进行检测,W氮气作为雾化、锥孔气;飞行管检测模式V型; 正离子模式条件:毛细管电压4kv、锥孔电压35kv、离子源温度locrc;脱溶剂气温度 35(TC、反向锥孔气流50L/K脱溶剂气6(K)LA、萃取锥孔4V;离子扫描时间0.03S、扫描 时间间隔0.02S、数据采集范围;5(n〇00m/z;应用亮氨酸-脑啡肤作为锁定质量,正离子 模式下产生[M+田+离子556. 2771Da; C.数据处理: 对所有原始质谱数据进行预处理并导出mz格式数据;具体步骤是在R软件平台下采用xcms程序代码进行数据预处理,包括基线过滤、峰识别,进行保留时间校正、峰对齐和质谱碎 片归属分析,最后在EXCEL2007软件中进行后期编辑,包括来自于柱流失和样本制备造成的 杂质峰剔除和定量离子选择,将最终结果组织为二维数据矩阵,包括变量、观察量和峰强度 d. 数据分析: 将所有数据归一化到总信号积分,将编辑后的数据矩阵导入版本11. 0的Simca-P软 件,分别进行主成分分析和偏最小二乘方判别分析; e. 差异性代谢产物确定及其结构鉴定: 采用PLS-DA模型第一主成分的VIP值,并结合学生氏t检验的P值确定差异性代谢产 物并对其结构进行鉴定; f. 分析预测平台的建立: 选择显著的差异性代谢产物构成预测平台,具体步骤: f. 1分别按照差异性代谢产物的VIP值、R0C曲线下的面积和倍数变化的绝对值降序排 列,P值升序排列,形成四个列表; f. 2挑选所有列表中的前20%的变量为分析预测糖尿病认知功能障碍的标准值,构成 预测平台。
【专利摘要】本发明公开一种基于代谢组学数据建立分析预测糖尿病认知功能障碍平台的方法,是采用高效液相色谱-质谱联用技术分离并鉴定健康人、糖尿病患者但未患认知功能障碍及糖尿病患者但患有认知功能障碍三组血浆,利用软件对所分离得到的物质分别进行主成分分析和偏最小二乘方判别分析,确定差异性代谢产物并对其结构进行鉴定,选择显著的差异性代谢产物构成分析预测糖尿病认知功能障碍平台。可以及时根据糖尿病患者的血浆分析预测糖尿病认知功能障碍,及早发现及早治疗,可降低糖尿病认知功能障碍的发病率,避免由糖尿病认知功能障碍引起的一系列家庭与社会问题。
【IPC分类】G01N30/02, G06F19/00
【公开号】CN104933277
【申请号】CN201410103285
【发明人】战丽彬, 张琳, 隋华, 梁丽娜, 路晓光
【申请人】大连医科大学附属第二医院
【公开日】2015年9月23日
【申请日】2014年3月20日