一种用于代谢组学数据处理中消除外源性成分干扰的分析方法

文档序号：6430703阅读：1166来源：国知局

专利名称：一种用于代谢组学数据处理中消除外源性成分干扰的分析方法
技术领域：
本发明涉及药物代谢学的数据处理方法，具体涉及一种药物代谢学数据处理中如何剔除外源性成分数据的分析方法，经消除外源性数据干扰后能真实展现和评价药物的整体生物效应。
背景技术：
代谢组学是“后基因组学”时期新兴的一门“组学”技术，也是系统生物学的重要组成部分，它是关于生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后)其代谢产物(内源代谢物质)种类、数量及其变化规律的科学。它研究的是生物整体、系统或器官的内源性代谢物质的代谢途径及其所受内在或外在因素的影响。常用的方法是检测和量化一个生物整体代谢组随时间变化的规律；建立内在和外在因素影响下，代谢组整体的变化轨迹，来反映某种病理(生理)过程中所发生的一系列生物事件。目前，代谢组学方法已被应用于评价药物(尤其是中药)的治疗作用。中药的化学成分复杂，其在治疗疾病时主要是药效组分在多靶点或多器官上发挥整体综合调节作用，而代谢组学是研究机体内所有小分子代谢物在受外界因素干扰后的整体变化，恰恰能表征中药多成分所产生的整体生物效应。然而，进行代谢组学研究时，要求所采用的分析技术如液相色谱质谱联用(LC-MS)技术和核磁共振光谱(NMR)技术对生物样品中所有小分子代谢物进行全扫描的检测，这其中包括外源性的药物原型成分及其代谢物。在随后的模式识别分析中，这些外源性成分数据的存在必定干扰对内源性代谢组的建模，将使对药物整体生物效应的评价发生偏离。因此，在代谢组学数据处理时，必须将外源性成分的数据彻底剔除，使正确评价药物的整体生物效应。以往剔除外源性成分数据的方法主要有(I)对采集的全扫描数据进行多变量统计分析，如PCA、PLS-DA, 0PLS-DA，抽提引起组间分离的标志物，然后进行鉴定，如果是外源性成分，则从数据中剔除，然后再次进行多变量统计分析，如此循环操作，直到抽提的标志物均为内源性代谢物，这时才能进行药物生物效应的整体评价；(2)首先比较给药组和空白组的图谱，找出药物的原型成分和代谢物，然后在代谢组学数据中将这些外源性的成分数据逐一剔除，最后进行多变量统计分析，评价药物的整体生物效应。上述方法繁琐费时，而且不能完全剔除外源性成分数据的干扰。本发明提供了一种在代谢组学数据处理过程中，通过有效分组，直接将外源性成分数据剔除的分析方法。该方法简单、快速、彻底，能使药物的整体生物效应得到真正展现和科学评价。

发明内容
本发明所要解决的技术问题是将各实验组进行重新合并分成两组，一组只包含给药组，另一组包含所有不给药的组，通常是空白组和模型组，然后进行多变量统计分析，抽提只有在给药组在存在，而在其它不给药组中响应值为零的标志物，即为外源性代谢物，将其剔除，从而解决利用代谢组学方法评价药物整体生物效应时如何排除外源性成分数据干扰的问题。为解决上述问题，本发明提供如下技术方案，步骤包括数据分组将各实验组合并分为两组，一组只包含给药组，另一组包含所有不给药的组，通常有空白组、动物模型组。数据处理应用化学计量学的正交偏最小二乘判别分析法(OPLS-DA)对两组数据进行处理，给出S-Plot图，或者应用化学计量学的偏最小二乘判别分析法(PLS-DA)进行处理，给出Loadings Plot图，再或者应用化学计量学的主成分分析法(PCA)进行处理，给出Loadings Plot 图。数据剔除结合Trend Plot图，在0PLS-DA分析的S-Plot图中，或者是在PLS-DA·分析的Loadings Plot图中，再或者是PCA分析的Loadings Plot图中，选择只有在给药组存在而在另一组中不存在的数据点，即为外源性成分数据，将这部分数据剔除。数据更新和建模剔除外源性成分数据点后，更新数据组，再进行模式识别的PCA分析，在Scores Plot图中描绘了内源性代谢组在药物治疗前后的变化轨迹，从而在整体上评价药物的整体生物效应。本发明的突出优点是，不需要预先获知药物组成及其代谢物的信息，通过本发明的分组设计，外源性成分将直接暴露在S-Plot图的一侧或Loadings Plot图的一个集中区域内，再根据外源性成分只有在给药组存在而在另一组中响应值为零的分布特点，能够将其直接抽提出来，然后剔除掉，数据更新后可直接进行下一步的内源性代谢组变化轨迹的分析。这一点对于化学组成复杂的中药尤为重要。

图I.黄芩干预酵母诱导大鼠发热证候模型前后尿液UPLC/T0F-MS数据直接经PCA处理后给出的Scores Plot图。由于尿液UPLC/T0F-MS数据中不仅包含了内源性小分子代谢物，还包含了来源于黄芩的外源性代谢物，结果导致代谢组的整体变化轨迹没有表现明显的回归趋势，不能说明黄芩的解热作用。K :空白组；M-10 :模型组；QD-10h :黄芩低剂量组；QG-1Oh :黄芩高剂量组。图2.黄芩干预酵母诱导大鼠发热证候模型前后尿液UPLC/T0F-MS数据经图3_8中方法剔除外源性成分数据后，再经PCA处理后给出的Scores Plot图。图中的代谢组变化轨迹真正体现了内源性代谢组的整体变化，图中显示黄芩干预后机体内源性代谢组表现明显的回归趋势，高剂量组最为明显，从而证明了黄芩具有解热作用。K:空白组；M-IO :模型组；QD-10h :黄芩低剂量组；QG-10h :黄芩高剂量组。图3. OPLS-DA分析的S-Plot图，图中标有红色方框的点为要剔除的外源性成分数据点。图4.图3中标有红色方框的数据点对于的Trend Plot图，图中显示这些数据点只有在黄芩给药组中存在，而在空白组和模型组中响应值为零。K :空白组;M-10 :模型组；QD-IOh :黄芩低剂量组；QG-10h :黄芩高剂量组。图5. PLS-DA分析的Loadings Plot图，图中标有红色方框的点为要剔除的外源性成分数据点。
图6.图5中标有红色方框的数据点对于的Trend Plot图，图中显示这些数据点只有在黄芩给药组中存在，而在空白组和模型组中响应值为零。K :空白组;M-10 :模型组；QD-IOh :黄芩低剂量组；QG-10h :黄芩高剂量组。图7. PCA分析的Loadings Plot图，图中标有红色方框的点为要剔除的外源性成分数据点。图8.图7中标有红色方框的数据点对于的Trend Plot图，图中显示这些数据点只有在黄芩给药组中存在，而在空白组和模型组中响应值为零。K :空白组;M-10 :模型组；QD-IOh :黄芩低剂量组；QG-10h :黄芩高剂量组。
具体实施例方式本发明通过下面的实施例进行详细的解释，但并不意味着本发明仅限于此。实施实例黄芩干预酵母诱导大鼠发热证候模型的代谢组学评价I.实验方案与样品采集40只Wistar大鼠，随机分为空白组、模型组、黄芩高剂量组(12g生药/kg体重)、黄芩低剂量组(3g生药/kg体重)；模型组、黄芩高剂量组、黄芩低剂量组应用干酵母造模，皮下注射干酵母(10ml/kg体重)，空白组皮下注射等体积的无菌生理盐水；黄芩高、低剂量组分别于造模后4h、8h灌胃给予黄芩水煎液，空白组和模型组给予同体积的蒸馏水；造模前三天用代谢笼收集24h尿液，每日上午8点收集I次，连续3d，尿液于冰水浴中收集；于干酵母造模后6h、10h、18h、24h、30h、36h各时间点的分别收集尿液I次,尿液于冰水浴中收集。收集的尿液置于超低温(-70°C )冰箱中保存。2.样品处理取冷冻保存的尿液，自然融化，用蒸馏水稀释5倍后于13000rpm离心15分钟，吸取上清液供UPLC/T0F-MS检测。3.样品测定仪器超高效液相色谱-飞行时间质谱(UPLC/T0F-MS)检测系统(美国WatersAcquity UPLC液相色谱仪，配备四元梯度泵-在线真空脱气机-自动进样器-柱温箱-二极管阵列检测器；美国Waters LCT Premier飞行时间质谱仪,配备电喷雾离子源-正负离子扫描方法-Lockspray)色谱条件色谱柱ACQUITYUPLC BEH C18column (50mmX 2. lmmi. d.，I. 7um,Waters Corp, Milford, USA);流速 0. 40ml/min ;柱温45°C :流动相A 0. I % 甲酸水溶液，B :0. I %甲酸乙腈溶液，梯度洗脱程序(表I)。柱后流出液不经分流直接导入质谱系统检测。质谱条件电喷雾离子源(ESI)，采用正离子扫描检测；毛细管电压为1500V ;样本锥孔电压为60V ;离子源温度为110°C ;脱溶剂温度为350°C ;脱溶剂气流量为700L/h ;锥孔气流量为20L/h ;微通道板电压为2450V ;每0. 2s采集一次谱图；准确质量校正采用亮氨酸-脑啡肽(leucine-enk印halin，[Μ+Η]+556· 2771)溶液；扫描方式为全扫描，质量扫描范围 m/z 50-1000。表I梯度洗脱程序表
权利要求
1.代谢组学方法评价药物整体生物效应时，一种清除外源性成分数据干扰的方法，所述方法包括步骤 (1)数据分组，即将空白组和动物模型组合并为一组，将给药组单独组成一组。
(2)数据处理，即应用化学计量学的正交偏最小二乘判别分析法(OPLS-DA)对(I)中分成的两组数据进行处理，给出S-Plot图，或者应用化学计量学的偏最小二乘判别分析法(PLS-DA)进行处理，给出Loadings Plot图，再或者应用化学计量学的主成分分析法(PCA)进行处理，给出Loadings Plot图。
(3)数据剔除，即结合TrendPlot图，在OPLS-DA分析的S-Plot图中，或者是在PLS-DA分析的Loadings Plot图中，再或者是PCA分析的Loadings Plot图中，选择只有在给药组存在而在另一组中不存在的数据点，即为外源性成分数据，将这部分数据剔除。
2.一种如权利要求I (I)所述的数据分组方法，其特征在于将不含外源性成分(如药物及其代谢物)数据的所有组合并为一组，将含有外源性成分(如药物及其代谢物)数据的所有组合并为另一组。
3.—种如权利要求1(2)所述的数据处理方法，其特征在于应用化学计量学的正交偏最小二乘判别分析法(OPLS-DA)或者偏最小二乘判别分析法(PLS-DA)再或者主成分分析法(PCA)进行处理。
4.一种如权利要求1(3)所述的数据剔除方法，其特征在于外源性成分数据点集中分布于S-Plot图中的一端,或者是Loadings Plot图中的一个区域,并且Trend Plot图中显示这些数据点只存在于给药组中，而在另一组中不存在，这些数据点即为要剔除的外源性数据点。
5.权利要求I中的代谢组学数据，是指利用液相色谱-飞行时间质谱采集的数据，生物样本包括血液、尿液、脑脊液、唾液、组织匀浆液、细胞培养液。
6.权利要求I中的药物包括化学药物、中药、中药复方。
全文摘要
本发明提供一种从海量的代谢组学数据中剔除外源性成分数据的分析方法。该方法特征在于将各实验组合并分为两组，一组包含所有不给药的组，通常包括空白组和模型组，另一组只包含给药组，然后利用多变量统计方法进行处理，抽提只有在给药组中存在，而在其它组中均不存在的标志物，即为外源性成分，然后将其数据剔除，数据更新后再进行下一步的模式识别分析。该方法能够简单、快速、完全地排除外源性成分数据的干扰，从而使反映药物(尤其是中药)整体生物效应的机体内源性代谢组的整体变化获得真实展现和科学评价。
文档编号G06F19/18GK102930182SQ20111023085
公开日2013年2月13日申请日期2011年8月12日优先权日2011年8月12日
发明者刘树民, 闫广利, 柳长凤, 卢芳申请人:刘树民

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘树民;闫广利;柳长凤;卢芳
技术所有人：刘树民
我是此专利的发明人

上一篇：包括迷你卡的微型电路卡的制作方法
上一篇：行车记录器、闪速存储器装置及其管理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。