用于早产预测的蛋白分子标志物及其预测方法与流程

文档序号:32994571发布日期:2023-01-18 00:00阅读:61来源:国知局
用于早产预测的蛋白分子标志物及其预测方法与流程

1.本发明涉及医学领域,具体涉及一种用于早产预测的蛋白分子标志物及其预测方法。


背景技术:

2.早产定义为胎龄小于37周分娩,世界范围内,每年约有1500万产妇发生早产,早产的发生率约为10%,并且早产率日益提高。在中国,早产约占所有新生儿的7.3%。早产可导致新生儿多种并发症,是导致新生儿死亡的主要原因,多数早产儿存活者也面临一生残疾,包括无学习能力、无视觉听觉能力、智力发育异常等严重疾病。早产婴儿的出生也带来了沉重的家庭开销与社会医疗负担。通过对孕妇早产风险进行评估和预防,并提供适当的产前监督、产前护理和预防性干预可以显著降低早产新生儿死亡率和发病率。但目前对早产的病因与发病机制有待深入,缺乏对早产安全性高和有效性高的孕早期筛查手段。
3.传统的早产筛查方法包括宫颈长度、胎儿纤连蛋白、白介素、胰岛素样生长因子结合蛋白1等。孕24周使用宫颈长度小于25mm预测早产风险灵敏度约为37.3%,特异度为92.2%。胎儿纤连蛋白为由胎儿羊膜细胞与滋养层细胞分泌的蛋白,可在22周之前在子宫阴道分泌物中发现胎儿纤连蛋白,而其在24到34周出现表明有早产风险,其灵敏度与特异度在产妇有早产相关临床表现时较高,对无症状的自发性早产预测效果较差,对无症状孕周小于34周的早产,roc曲线下面积为0.61。胰岛素样生长因子结合蛋白1在胎盘的生长与发育过程中发挥重要作用,而发育的异常则可能导致该蛋白被分泌到宫颈液中,为早期诊断提供可能,通过在24-34周检测宫颈粘液中的胰岛素样生长因子结合蛋白1可预测早产,对无症状产妇预测灵敏度约在14-47%,特异性约在76-93%,对有临床表现的早产孕妇预测灵敏度约60-68%,特异度约为77-81%。炎性因子与前列腺素的合成有关,其中白介素6(il-6)在宫颈液的出现与早产有关,对有早产表现的人群,il-6灵敏度约为69.4%,特异度约为68.2%。
4.传统的早产预测的方法灵敏度或特异度均不尽如人意,难以满足临床需求,这些方法通常对有临床表现的早产人群预测较好,但对于无表现的人群预测效能较差。而且大部分的检测都需要阴道或者宫颈口检测取样,对孕妇体验不友好。


技术实现要素:

5.根据第一方面,在一实施例中,提供表1所示蛋白中的至少一种作为生物标志物在制备和/或筛选早产预测试剂中的用途。
6.根据第二方面,在一实施例中,提供一种预测早产的方法,包括:分析母体样本中的任意一种或至少两种蛋白的组套的表达谱,根据所述表达谱预测受试者是否早产。
7.根据第三方面,在一实施例中,提供一种预测早产的系统,包括早产预测装置,分析母体样本中的任意一种或至少两种蛋白的组套的表达谱,根据所述表达谱预测受试者是否早产。
8.根据第四方面,在一实施例中,提供一种装置,包括:
9.存储器,用于存储程序;
10.处理器,用于通过执行所述存储器存储的程序以实现如第二方面所述的方法。
11.根据第五方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第二方面所述的方法。
12.依据上述实施例的用于早产预测的蛋白分子标志物及其预测方法,本发明首次检测孕妇体液样本中具有高标志作用的蛋白的表达量,检测灵敏度高,特异性高,可多次监测,相对于传统方法具有更好的临床应用前景。
附图说明
13.图1为筛选分子标志物时所使用的39例早产受试者的样本收样时间分布图;
14.图2为筛选分子标志物时所使用的39例早产受试者的孕周分布图;
15.图3为筛选分子标志物时所使用的42例足月分娩受试者的样本收样时间分布图;
16.图4为筛选分子标志物时所使用的42例足月分娩受试者的孕周分布图;
17.图5为筛选分子标志物时统计得到的早产、足月样本中的il-1ra、tr蛋白表达量图;
18.图6为筛选分子标志物时的训练集roc曲线(receiver operating characteristic curve,亦称接收者操作特征曲线)图;
19.图7为筛选分子标志物时的训练集roc曲线图;
20.图8为临床样本验证时的125例足月样本收样孕周分布图;
21.图9为临床样本验证时的125例足月分娩受试者的孕周分布图;
22.图10为临床样本验证时的123例早产受试者的样本收样时间分布图;
23.图11为临床样本验证时的123例早产受试者的孕周分布图;
24.图12为临床样本验证时的训练集roc曲线图;
25.图13为临床样本验证时的测试集roc曲线图。
具体实施方式
26.下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本技术能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本技术相关的一些操作并没有在说明书中显示或者描述,这是为了避免本技术的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
27.另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
28.本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,
不具有任何顺序或技术含义。而本技术所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
29.定义
30.本文中,如无特别说明,“il-1ra”是指白细胞介素1受体拮抗剂,英文全称为interleu-kin-1receptor antagonist,亦称il1ra、il-1ra等等。主要由单核/巨噬细胞产生的一种白细胞介素-1的内源抑制剂。可与i型和ii型il-1r结合,但不启动信号转导,从而竞争性抑制il-1与il-1r结合所产生的效应。
31.本文中,如无特别说明,“tr”是t细胞受体,亦称t细胞抗原受体,英文全称为t cell receptor,亦简称“tcr”。t细胞抗原受体(t cell receptor,tcr):是t细胞特异性识别和结合抗原肽-mhc分子的分子结构,通常与cd3分子呈复合物形式存在于t细胞表面。大多数t细胞的tcr由α和β肽链组成,少数t细胞的tcr由γ和δ肽链组成。
32.本文中,如无特别说明,“ccl3蛋白”是趋化因子(c-c基序)配体3(ccl3)蛋白质,也称为巨噬细胞炎性蛋白-1α(mip-1α)。ccl3是细胞因子,属于cc趋化因子家族(参与急性炎症状态的多形核白细胞的募集和激活)。
33.本文中,如无特别说明,“fs蛋白”是卵泡刺激素,英文全称是follistatin,亦称促卵泡激素,促卵泡激素是垂体前叶嗜碱性细胞分泌的一种激素,成分为糖蛋白,主要作用为促进卵泡成熟。促卵泡激素可促进卵泡颗粒层细胞增生分化,并促进整个卵巢长大。而其作用于睾丸曲细精管则可促进精子形成。促卵泡激素在人体内呈脉冲式分泌,女性随月经周期而改变。测定血清中促卵泡激素对了解垂体内分泌功能,间接了解下丘脑及卵巢的功能状态、预测排卵时间、不孕和内分泌疾病的诊断治疗都有重要的意义。
34.如本文所用,术语“无细胞rna”或“cfrna”是指由母体、胎儿和/或胎盘的细胞表达且可从母体血液的非细胞部分回收的rna,尤其是mrna,并且包含全长rna转录物的片段。在一些实施方案中,“cfrna”不包含rrna。在一些实施方案中,“cfrna”不包含mirna。在一些实施方案中,“cfrna”是指mrna。cf rna也可以从母体尿液中回收。
35.如本文所用,术语“表达水平”等同于“表达谱”,“表达谱”是指从母体样本获得的一种或多种蛋白(即基因产物)的表达水平。对于从母体血浆中回收的基因产物,表达水平可以表示为每ml母体血浆中特定多肽的质量或任何其他合适的单位。类似单位可用于从其他母体样本(如尿液)获得的基因产物。基因产物的表达可使用任何合适的方法(例如,如下所述)确定。通常对测量值进行归一化,以解释样本数量和质量、逆转录效率等方面的变化。当表达谱反映来自多个不同基因产物(例如,不同的cfrna转录物)的表达时,在生成或比较表达谱或参考谱时,可以赋予基因产物不同的权重。例如,当将来自孕妇的样本中包括cfrna 1和cfrna 2的表达谱与参考谱(下文讨论)进行比较时,在确定表达谱与参考谱之间相似性或差异程度时,cfrna 1值的2倍差相比cfrna 2的2倍差可以被赋予更大的权重。来自母体(例如,患者)样本的表达谱有时被称为“母体表达谱”,而在指定时间收集的样本中的母体表达谱可以被称为“[时间]母体表达谱”,例如“24周母体表达谱”。
[0036]
如本文所用,“参考谱”是衍生自参考群体的表达谱。为了说明,参考群体的示例是孕妇,足月分娩的孕妇或早产的孕妇。在一些实施方案中,参考群体是以母体年龄(例如,足月分娩的20-25岁妇女)、种族或民族(例如,足月分娩的欧裔中国人妇女、美裔中国人妇女、非裔中国人妇女等等)为特征的孕妇亚群。通过组合群体中统计学上显著数量的妇女的表
达谱来生成参考谱,对于指定的基因产物,该参考谱可以反映群体中的平均转录水平、群体中的中位转录水平,或者可以使用在流行病学和医学领域中已知的许多方法中的任何一种来确定。参考群体通常将包括至少10个受试者(例如10-200个受试者),有时50个或更多个受试者,有时1000个或更多个受试者。
[0037]
如本文所用,术语“谱组套”是指在特定测定中测量的基因产物集合。例如,在针对三(3)种不同的cfrna(“rna a-f”)的测定中,这三种cfrna将是谱组套。同样,在对来自母体血浆或尿液的三(3)种不同蛋白的测定中,这三种蛋白将成为谱组套。作为另一个例证,在一种收集了大量基因的转录物(例如整个转录组或大量胎盘基因转录物)的表达数据的测定中,用于估算胎龄或分娩时间或者评估早产风险的子集可以称为谱组套。未包含在组套中的rna或蛋白的测量值可以用作对照,以将样本内或样本之间的测量值归一化,或用于类似用途。在一些实施方案中,谱组套可包含基因产物集合,该集合包含cfrna和蛋白两者。谱组套有时称为“组套”。
[0038]
如本文所用,术语“早产”、“足月妊娠”、“足月分娩”和“正常足月妊娠”具有其正常含义。足月是指胎儿达到37周胎龄之后的分娩,而早产是指胎儿达到37周胎龄之前的分娩。在某些情况下,早产是指在16周至35周胎龄或24周至30周胎龄期间的分娩。
[0039]
如本文所用,“母体样本”是指从孕妇获得的体液的样本。体液通常是血清、血浆或尿液,并且通常是血清。在一些实施方案中,可以使用不同体液的样本,例如唾液、脑脊髓液、胸腔积液等。可以在妊娠期间的多个不同时间点获得母体样本,并进行存储(例如冷冻)直至进行测定。应当理解,母体样本的收集日期是样本不可或缺的特性。
[0040]
如本文所用,“分娩时间”是指从怀孕起始时间到分娩日期或预计分娩日期的周数。分娩时间的计算方法是(分娩时的时间)减去(怀孕起始时间)。怀孕起始时间通常是推算得到,例如,怀孕之前的最后一次月经来潮的第一天起算,作为是怀孕的开始时间,也可以通过b超检查进行推算,也可以通过孕吐出现的时间、胎动出现的时间、子宫底的高度、孕中期超声等其他方法来推测。本文中样本的取样时间的计算方法是(取样时的时间)减去(怀孕起始时间),即胎龄。
[0041]
如本文所用,术语“蛋白”和“多肽”可互换使用。提及从母体样本获得的蛋白并不一定意味着该蛋白是全长基因表达产物。可以根据本发明检测和确认部分、片段和切割产物。
[0042]
本文中,如无特别说明,“血清”是指血浆除去纤维蛋白原后的胶状液体。血浆是指血液的细胞外基质。
[0043]
鉴于现有技术存在的缺陷,需要灵敏度和特异性更高的分子标志物来进行早产早期筛查,并且需要方法简单、经济快捷、性能优良的临床检测方法预测早产风险高低,作为辅助诊断依据,供临床医生早产诊断参考。
[0044]
根据第一方面,在一实施例中,提供表1所示蛋白中的至少一种作为生物标志物在制备和/或筛选早产预测试剂中的用途。蛋白更方便检测,对条件要求也更简单,更能直接反应机体生理状态的变化。
[0045]
在一实施例中,所述生物标志物包括il-1ra蛋白、tr蛋白、ccl3蛋白、fs蛋白中的至少一种。
[0046]
在一实施例中,所述生物标志物包括il-1ra蛋白、tr蛋白、ccl3蛋白、fs蛋白中的
全部。
[0047]
在一实施例中,所述蛋白包括il-1ra蛋白、tr蛋白中的至少一种。
[0048]
在一实施例中,所述生物标志物包括il-1ra蛋白、tr蛋白中的全部。
[0049]
在一实施例中,所述生物标志物包括母体样本中相应蛋白的表达谱。
[0050]
在一实施例中,所述母体样本包括但不限于取自母体的体液样本。
[0051]
在一实施例中,所述体液样本包括但不限于母体血液、血浆、血清、尿液中的至少一种。
[0052]
在一实施例中,所述母体样本的取样时间为第7~28孕周,包括但不限于7孕周、8孕周、9孕周、10孕周、11孕周、12孕周、13孕周、14孕周、15孕周、16孕周、17孕周、18孕周、19孕周、20孕周21孕周、22孕周、23孕周、24孕周、25孕周、26孕周、27孕周、28孕周等等。
[0053]
在一实施例中,所述母体样本的取样时间为第7~20孕周。
[0054]
在一实施例中,通过母体样本中相应蛋白的表达谱计算受试者早产的概率值。概率值相当于风险值。
[0055]
在一实施例中,根据所述概率值与阈值的大小关系,预测受试者是否会早产。阈值通常可以根据roc曲线来确定。
[0056]
在一实施例中,如果所述概率值≥阈值,则预测受试者为早产,如果所述概率值<阈值,则预测受试者为足月分娩。
[0057]
在一实施例中,所述阈值为0.4~0.7。
[0058]
在一实施例中,所述阈值为0.458。
[0059][0060]
其中,t
il-1ra
是指母体样本中il-1ra蛋白的表达量,t
tr
是指母体样本中tr蛋白的表达量,e是指自然常数,为数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.718281828459045,蛋白表达量的单位包括但不限于ng/ml(即纳克/毫升),α、β、γ为常数,即数值不变的定量,不同的样本,模型输出的公式会有所不同,相应的常数会不同。α、β、γ可以为任意的正数、负数或者0,优选为正数。
[0061]
在一实施例中,α为22.7,β为2.83,γ为1.38。
[0062]
在一实施例中,所述表达谱包括待测的母体样本中相应基因相对于基线过量表达。
[0063]
在一实施例中,所述表达谱包括待测的母体样本中相应基因相对于基线不足表达。
[0064]
在一些实施例中,母体样本中部分基因相对于基线过量表达,另一部分基因相对于基线不足表达。在另一些实施例中,母体样本中相应基因相对于基线均过量表达。在另一些实施例中,母体样本中相应基因相对于基线均不足表达。
[0065]
在一实施例中,所述基线是足月分娩的母体样本中相应基因的表达谱。
[0066]
根据第二方面,在一实施例中,提供一种预测早产的方法,包括:分析母体样本中的任意一种或至少两种蛋白的组套的表达谱,根据所述表达谱预测受试者是否早产,所述蛋白为表1中所示蛋白中的至少一种。
[0067]
需要说明的是,本发明提供的预测早产的方法所检测的是离体样本,并且,预测结
果仅仅作为临床参考,医生在进行早产检测和/或诊断时,还需要通过临床推算(通常是根据以往月经周期进行推算)、超声检查(例如,胎儿头径、头围、腹围股骨长度与胎龄及体重密切相关,根据超声测量值可估计孕周与胎儿大小),胎儿纤维连接蛋白(ffn)棉拭子检测(胎儿纤维连接蛋白是由羊膜、蜕膜、绒毛膜联合分泌,存在于蜕膜和绒毛膜之间的糖蛋白,对胎膜起到黏附作用。孕21周以后,绒毛膜与蜕膜的融合阻止了ffn的释放,因此,正常的孕妇在22~35孕周时,ffn的含量极低。在绒毛膜与蜕膜分离、绒毛膜与蜕膜界面的细胞外基质遭到机械损伤或蛋白水解酶的降解时,ffn漏入阴道后穹窿分泌物中,孕22~35周宫颈阴道分泌物ffn水平,与早产有很好的相关性)。因此,本发明的预测结果并非最终结果,而是属于中间参考结果,不属于疾病的诊断方法,更不属于疾病的治疗方法。
[0068]
在一实施例中,所述蛋白包括il-1ra蛋白、tr蛋白、ccl3蛋白、fs蛋白中的至少一种。
[0069]
在一实施例中,所述蛋白包括il-1ra蛋白、tr蛋白中的至少一种。
[0070]
在一实施例中,所述蛋白包括il-1ra蛋白、tr蛋白中的全部。
[0071]
在一实施例中,所述母体样本包括但不限于取自母体的体液样本。
[0072]
在一实施例中,所述体液样本包括但不限于母体血液、血浆、血清、尿液中的至少一种。
[0073]
在一实施例中,所述母体样本的取样时间为第7~28孕周。
[0074]
在一实施例中,所述母体样本的取样时间为第7~20孕周。
[0075]
在一实施例中,通过母体样本中相应蛋白的表达谱计算受试者早产的概率值。概率值相当于风险值。
[0076]
在一实施例中,根据所述概率值与阈值的大小关系,预测受试者是否会早产。
[0077]
在一实施例中,如果所述概率值≥阈值,则预测受试者为早产,如果所述概率值<阈值,则预测受试者为足月分娩。
[0078]
在一实施例中,所述阈值为0.4~0.7,包括但不限于0.4、0.45、0.5、0.55、0.6、0.65、0.7等等。
[0079]
在一实施例中,所述阈值为0.458。
[0080]
在一实施例中,所述概率值的计算公式如下:
[0081][0082]
其中,t
il-1ra
是指母体样本中il-1ra蛋白的表达量,t
tr
是指母体样本中tr蛋白的表达量,e是指自然常数,为数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.718281828459045,蛋白的表达量的单位包括但不限于ng/ml(即纳克/毫升),α、β、γ为常数,即数值不变的定量,不同的样本,模型输出的公式会有所不同,相应的常数会不同。
[0083]
在一实施例中,α为22.7,β为2.83,γ为1.38。
[0084]
根据第三方面,在一实施例中,提供一种预测早产的系统,包括早产预测装置,分析母体样本中的任意一种或至少两种蛋白的组套的表达谱,根据所述表达谱预测受试者是否早产。
[0085]
在一实施例中,所述蛋白包括但不限于il-1ra蛋白、tr蛋白中的至少一种。
[0086]
在一实施例中,所述蛋白包括il-1ra蛋白、tr蛋白中的全部。
[0087]
根据第四方面,在一实施例中,提供一种装置,包括:
[0088]
存储器,用于存储程序;
[0089]
处理器,用于通过执行所述存储器存储的程序以实现如第二方面所述的方法。
[0090]
根据第五方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第二方面所述的方法。
[0091]
在一实施例中,一种用于人类早产早期筛查的分子标志物和检测方法。根据待检测样本分子标志物的比例预测早产的风险高低,其结果作为辅助诊断依据,供临床医生早产诊断参考。
[0092]
在一实施例中,我们发现,孕妇血浆中il-1ra、tr蛋白的相对比例能够反映孕妇可能发生早产的风险,该检测不受孕妇是否有相关临床症状的影响,无检测禁忌症,检测分子标志物的表达水平,通过风险模型计算即可预测早产风险。
[0093]
在一实施例中,本发明提供一种用于孕妇早产预测的分子标志物组合。
[0094]
在一实施例中,本发明提供的分子标志物组合为il-1ra蛋白、tr蛋白。
[0095]
在一实施例中,本发明提供的分子标志物组合来源于孕妇外周血的游离血浆。
[0096]
在一实施例中,本发明提供的检测分子标志物表达量的方法为蛋白质定量检测方法。
[0097]
在一实施例中,本发明提供的检测分子标志物的蛋白质定量检测方法包含酶联免疫吸附层析、放射性免疫测定、串联质谱分析等其他分子生物学常用的蛋白质定量方法。
[0098]
在一实施例中,本发明提供一种用于早产风险预测的分析模型分析早产风险值。
[0099]
在一实施例中,本发明提供一种用于早产风险预测的分析模型,其输入函数为il-1ra、tr蛋白质的表达量。
[0100]
在一实施例中,本发明提供一种用于早产风险预测的分析模型,其计算函数为如下:其中,t
il-1ra
是指母体样本中il-1ra蛋白的表达量,t
tr
是指母体样本中tr蛋白的表达量。
[0101]
在一实施例中,本发明提供一种用于早产风险预测的分析模型,p值的阈值基于roc曲线确定,阈值为0.458时,特异性和灵敏度分别为0.843和0.788。
[0102]
在一实施例中,本发明提供一种用于早产风险预测的分析模型分析,当p值≥阈值时,输出高风险;当p值<阈值时,输出低风险。
[0103]
在一实施例中,本发明提供一种用于早产风险预测的分析模型,并将分析模型封装为自动化计算插件,可自动化出具风险值。
[0104]
在一实施例中,本发明首次检测孕妇血浆中il-1ra、tr蛋白的表达量,并且建立一种风险预测模型,用于无临床症状的孕妇的早产风险预测。主要优势在于用孕妇血浆检测,无须像超声一样提前预约,无创检测,不需要阴道或者宫颈口取样,检测流程体验好。采用酶联免疫吸附层析的方法进行检测,简单,成本低。检测灵敏度,特异性高,可多次监测,相对于传统方法具有更好的临床应用前景。
[0105]
在一实施例中,本发明的预测早产的方法包括:
[0106]
1、使用edta抗凝管,采集5ml 8孕周以上孕妇外周血,分离2ml游离血浆进行蛋白分析或者-80℃长期保存;
[0107]
2、从2ml血浆中提取血浆蛋白质,进行血浆蛋白质定量分析,定量分析可选elisa试剂盒检测(human il-1ra(il-1f3)elisa kit,human tfr/transferrin r/cd71 elisa kit,raybiotech);
[0108]
3、将检测结果输入分析模型的计算插件,自动化出具风险值。
[0109]
在一实施例中,本发明的高灵敏度、高特异性能够有效提升孕妇早产筛查的准确性,能够弥补现有临床手段的不足。
[0110]
在一实施例中,本发明采用孕妇外周血检测,无创,不需要进行阴道宫颈口取样,方便临床取样检测。
[0111]
在一实施例中,本发明针对游离血浆蛋白质的检测方法,对检测条件不高,简便,成本低廉,可适用行强。
[0112]
在一实施例中,本发明可为无症状孕妇提供早产风险评估方法,可筛查出早产高危孕妇提前进行宫内转运等措施,从而降低早产的风险或者提高早产儿的存活率,对于提高我国出生人口具有重大意义。
[0113]
在一实施例中,本发明检测il-1ra、tr两个蛋白质作为早产筛查的分子靶标。
[0114]
在一实施例中,本发明的检测所采用的标志物数据自动化计算插件:其中,t
il-1ra
是指母体样本中il-1ra蛋白的表达量,t
tr
是指母体样本中tr蛋白的表达量。
[0115]
在一实施例中,本发明提供早产风险值的判断标准:当p值≥0.458时,输出高风险;当p值<0.458时,输出低风险。
[0116]
以下实施例中,以怀孕之前的最后一次月经来潮的第一天起算,作为是怀孕的开始时间。
[0117]
实施例1
[0118]
一、样本采集与血浆分离
[0119]
使用edta抗凝管,采集5ml 8孕周以上孕妇外周血,分离2ml游离血浆进行蛋白分析或者-80℃长期保存。
[0120]
二、蛋白质纯化、串联质谱分析筛选分子标志物
[0121]
1.分别在孕早期(8~20周)收集早产病例39例,足月42例外周血样本,分离血浆。血浆样本送诺禾致源生物科技有限公司进行串联质谱分析。主要过程包括:血浆样本预处理,蛋白质纯化和分离,进行蛋白质酶切,酶切后的肽段进行hplc分离,分离后的肽段加电压使其离子化,进行质谱分析,得到质谱谱图,进行蛋白质质谱数据分析。
[0122]
2.收集39例早产样本,图1所示为早产样本收样时间分布图,图2所示为39例早产受试者的早产分娩时间分布图。
[0123]
3.收集42例足月分娩样本,图3所示为足月分娩样本收样时间分布图,图4所示为足月分娩受试者的足月分娩时间分布图。
[0124]
4.通过秩和检验筛选p小于0.05的蛋白(以足月分娩的样本中相应蛋白表达量为基线),筛选出的蛋白如表1所示,共筛选出224种蛋白。随后通过十折交叉验证方法,通过随机森林方法进行变量迭代,选出最重要的蛋白,最终筛选出4个蛋白即il-1ra、tr、ccl3和fs蛋白,将这4个蛋白进行logistic回归分析,选择分析系数显著的蛋白,作为最终的生物标
志物,即il-1ra和tr蛋白。蛋白质表达量见图5。训练集auc曲线见图6。验证集auc曲线见图7。图5中,蛋白含量(即蛋白的表达量)的单位为ng/ml,即纳克/毫升。
[0125]
表1
[0126]
[0127][0128]
三、临床样本早产早筛分子标志物il-1ra、tr蛋白质性能确认和验证。
[0129]
1.收集125例足月样本,123例早产样本。图8所示为足月样本收样孕周分布图,图9所示为足月分娩孕周分布图。图10所示为早产样本收样时间分布图,图11所示为早产分娩孕周分布图。
[0130]
2.il-1ra、tr蛋白质定量分析
[0131]
取2ml血浆进行血浆蛋白质定量分析,定量分析使用elisa试剂盒(human il-1 ra(il-1f3)elisa kit,human tfr/transferrin r/cd71 elisa kit,raybiotech),实验操作按照试剂盒说明书进行。检测结果如表2所示。
[0132]
表2
[0133]
[0134]
[0135]
[0136]
[0137]
[0138]
[0139]
[0140][0141]
3.模型确认和验证
[0142]
将样本随机按照7:3的比例分为测试集与训练集,利用训练集进行模型的训练,测试集进行模型的验证。训练集auc为0.892(图12),取p阈值为0.458时,训练集灵敏度为0.788,特异度为0.843;测试集auc为0.849(图13)。概率计算公式如下:
[0143]
其中,t
il-1ra
是指母体样本中il-1ra蛋白的表达量,
t
tr
是指母体样本中tr蛋白的表达量,蛋白表达量的单位为ng/ml。
[0144]
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
[0145]
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1