本发明涉及生物技术领域中,用于预测子痫前期的成套SNP及其应用。
背景技术:
子痫前期(Pre-eclampsia,PE)又叫先兆子痫,是孕妇高发的一种多系统综合征,以怀孕20周后高血压和蛋白尿为主要特征,严重时可能出现脑缺血、肝肾衰竭、心力衰竭、胎盘早剥、溶血、弥漫性血管内凝血(Diffuse intravascular coagulation,DIC)以及产后大出血等并发症,对母体健康以及胎儿宫内发育均造成严重影响,甚至导致母婴死亡。PE的全球发病率约2-8%不等。在国内,随着晚婚晚育思想的盛行、计划生育政策的放宽等,生育年龄不断增加;另外,辅助生育技术的飞速进步,也促使非自然受孕的人群比例逐渐增加。这些因素都可能导致PE发病率的提升。
PE基本的病理生理变化是全身小血管痉挛、内皮损伤及局部缺血,但其发病机理至今不清。虽然有过PE发病史或者家族史的孕妇有更高的几率发病,具体的遗传模式迄今不明。其发病遗传上可能涉及多个基因,其它母体、胎盘以及胎儿的因素可能也涉及PE的发病,例如子宫螺旋小动脉重铸不足、免疫调节功能异常、血管内皮细胞受损以及影响因素等。虽然现在已经认识到多个PE的高危因素,如初产、怀孕年龄过大(大于40岁)或过小(小于18岁)、子痫前期病史或家族史、抗磷脂抗体阳性等自身免疫疾病、慢性肾炎、慢性高血压、糖尿病、血管或者胶原疾病、多胞胎以及葡萄胎等,临床上目前仍然缺少有效的PE筛查或风险评估方法。
有过PE发病史或者家族史的孕妇更可能发生PE,表明PE具有遗传特征。国外人群的PE遗传相关性研究中,报道了多个PE的可疑相关遗传位点。在不同的人群中,这些位点分别表现出了一定的疾病相关性,但是单一位点对于疾病的贡献性均较低,表明PE可能涉及多基因多位点的遗传改变。此外,不同的人群中,报道的PE相关基因和位点存在广泛变异;有些甚至呈现同一基因型具有截然相反的疾病贡献效果。因此,PE的遗传特征,可能与人种也有较大的关系。最近的一项华人PE发病遗传风险报告揭示,一方面,汉族女性PE的发病存在显著的遗传风险特征;另一方面,汉族女性PE的风险遗传位点与国外报道的位点和风险性显著不同。因此,鉴定华人各族女性特异的PE风险因子显得很有必要,基于这些风险因子、联合特异的检测方法以及风险预测评估模型,将有助于华人各族女性PE的早期风险评估和诊断,从而促进早期干预、降低PE对母婴造成的危害。
APOE参与血脂代谢,ERAP2参与免疫抗原表达,GSTP1参与滋养细胞的氧化应激,这些基因上各有一个多态性位点(分别为rs7412、rs2549782和rs1695),与PE的发病有关。这些基因和位点虽然均有报道与PE发病有关,但是在不同的人群中报道的基因型和相关性结果经常呈现差异甚至截然相反。NOS3为一氧化氮合成酶,与血管收缩和内皮细胞功能相关,其位点rs2070744的多态性与墨西哥、突尼斯等人群的PE发病有关;IL10为一种细胞因子,参与滋养细胞的炎症反应和血管重铸,其多态性位点rs1800896在中国、日本、伊朗等多个人群中报道与PE发病有关;TNF-α属于肿瘤坏死因子家族,参与免疫应答的调节,该基因的两个多态性位点(rs1799724和rs1800629)均与华人女性PE的发病相关;AGT为血管相关性蛋白,调节肾素-血管紧张素系统,位于该基因的rs4762位点多态性在非洲和亚洲人群中均发现与PE发病相关。
现有PE临床检测方法的缺陷:虽然新的遗传风险位点不断得到鉴定,但截止目前,临床对于PE的预测指导(NICE、PRECOG或中华医学会妇产科学分会“妊娠期高血压疾病诊治指南(2015)”修订版)均未包含分子遗传信息;迄今,虽然存在少量的针对特定蛋白质或者血浆代谢物的生物标记物分子检测方法,但它们都是针对已经发生的PE的实时诊断,缺乏对PE尚未发生或者发生早期的预测能力。临床上急需新的方法,可以更加方便、稳定、早期、高灵敏和特异地检测PE风险。
技术实现要素:
本发明所要解决的技术问题是如何预测子痫前期(Pre-eclampsia,PE)发病风险。
为解决上述技术问题,本发明首先提供了检测人基因组中成套SNP的多态性或基因型的物质或检测人基因组中rs7412的多态性或基因型的物质的下述任一应用:
X1)在制备筛查子痫前期患者产品中的应用;
X2)在筛查或辅助筛查子痫前期患者中的应用;
X3)在制备预测子痫前期患病风险产品中的应用;
X4)在预测子痫前期患病风险中的应用;
X5)在制备检测子痫前期易感性产品中的应用;
X6)在检测子痫前期易感性中的应用;
X7)在制备检测与子痫前期相关的单核苷酸多态性的产品中的应用;
X8)在检测与子痫前期相关的单核苷酸多态性中的应用;
X9)在制备鉴定或辅助鉴定与子痫前期相关的单核苷酸多态性的产品中的应用;
X10)在鉴定或辅助鉴定与子痫前期相关的单核苷酸多态性中的应用;
所述成套SNP为成套SNP1或成套SNP2;
所述成套SNP1由rs7412、rs2070744、rs1800896、rs1799724和rs4762组成;
所述成套SNP2由所述成套SNP1和成套SNP甲组成;所述成套SNP甲为rs2549782、rs1800629和rs1695中的三种、任两种或任一种。
上述应用中,所述检测人基因组中成套SNP的多态性或基因型的物质可包括检测所述成套SNP1的成套试剂1或检测所述成套SNP2的成套试剂2;
所述成套试剂1包括成套引物对1;所述成套引物对1由检测rs7412的引物对rs7412-P、检测rs2070744的引物对rs2070744-P、检测rs1800896的引物对rs1800896-P、检测rs1799724的引物对rs1799724-P和检测rs4762的引物对rs4762-P组成;
所述成套试剂2由所述成套试剂1和成套试剂甲组成;所述成套试剂甲包括成套引物对甲;所述成套引物对甲为检测rs2549782的引物对rs2549782-P、检测rs1800629的引物对rs1800629-P和检测rs1695的引物对rs1695-P中的三种、任两种或任一种。
所述检测人基因组中rs7412的多态性或基因型的物质可包括所述检测rs7412的引物对。
上述应用中,所述成套试剂1可由所述成套引物对1和成套延伸引物1组成;所述成套延伸引物1由检测rs7412的单碱基延伸引物rs7412-E、检测rs2070744的单碱基延伸引物rs2070744-E、检测rs1800896的单碱基延伸引物rs1800896-E、检测rs1799724的单碱基延伸引物rs1799724-E和检测rs4762的单碱基延伸引物rs4762-E组成;
所述成套试剂甲可由所述成套引物对甲和成套延伸引物甲组成;所述成套延伸引物甲为检测rs2549782的单碱基延伸引物rs2549782-E、检测rs1800629的单碱基延伸引物rs1800629-E和检测rs1695的单碱基延伸引物rs1695-E中的三种、任两种或任一种。
所述检测人基因组中rs7412的多态性或基因型的物质可由所述检测rs7412的引物对和所述检测rs7412的单碱基延伸引物组成。
所述rs7412-P由名称分别为rs7412-F和rs7412-R的单链DNA组成;
所述rs7412-F是如下a1)至a4)中的任一种单链DNA:
a1)序列表中SEQ ID No.1所示的单链DNA;
a2)在a1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
a3)与a1)或a2)限定的单链DNA具有85%以上的同一性的单链DNA;
a4)在严格条件下与a1)或a2)限定的单链DNA杂交的单链DNA;
所述rs7412-R是如下b1)至b4)中的任一种单链DNA:
b1)序列表中SEQ ID No.2所示的单链DNA;
b2)在b1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
b3)与b1)或b2)限定的单链DNA具有85%以上的同一性的单链DNA;
b4)在严格条件下与b1)或b2)限定的单链DNA杂交的单链DNA;
所述rs2070744-P由名称分别为rs2070744-F和rs2070744-R的单链DNA组成;
所述rs2070744-F是如下d1)至d4)中的任一种单链DNA:
d1)序列表中SEQ ID No.4所示的单链DNA;
d2)在d1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
d3)与d1)或d2)限定的单链DNA具有85%以上的同一性的单链DNA;
d4)在严格条件下与d1)或d2)限定的单链DNA杂交的单链DNA;
所述rs2070744-R是如下e1)至e4)中的任一种单链DNA:
e1)序列表中SEQ ID No.5所示的单链DNA;
e2)在e1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
e3)与e1)或e2)限定的单链DNA具有85%以上的同一性的单链DNA;
e4)在严格条件下与e1)或e2)限定的单链DNA杂交的单链DNA;
所述rs1800896-P由名称分别为rs1800896-F和rs1800896-R的单链DNA组成;
所述rs1800896-F是如下g1)至g4)中的任一种单链DNA:
g1)序列表中SEQ ID No.7所示的单链DNA;
g2)在g1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
g3)与g1)或g2)限定的单链DNA具有85%以上的同一性的单链DNA;
g4)在严格条件下与g1)或g2)限定的单链DNA杂交的单链DNA;
所述rs1800896-R是如下h1)至h4)中的任一种单链DNA:
h1)序列表中SEQ ID No.8所示的单链DNA;
h2)在h1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
h3)与h1)或h2)限定的单链DNA具有85%以上的同一性的单链DNA;
h4)在严格条件下与h1)或h2)限定的单链DNA杂交的单链DNA;
所述rs1799724-P由名称分别为rs1799724-F和rs1799724-R的单链DNA组成;
所述rs1799724-F是如下j1)至j4)中的任一种单链DNA:
j1)序列表中SEQ ID No.10所示的单链DNA;
j2)在j1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
j3)与j1)或j2)限定的单链DNA具有85%以上的同一性的单链DNA;
j4)在严格条件下与j1)或j2)限定的单链DNA杂交的单链DNA;
所述rs1799724-R是如下k1)至k4)中的任一种单链DNA:
k1)序列表中SEQ ID No.11所示的单链DNA;
k2)在k1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
k3)与k1)或k2)限定的单链DNA具有85%以上的同一性的单链DNA;
k4)在严格条件下与k1)或k2)限定的单链DNA杂交的单链DNA;
所述rs4762-P由名称分别为rs4762-F和rs4762-R的单链DNA组成;
所述rs4762-F是如下m1)至m4)中的任一种单链DNA:
m1)序列表中SEQ ID No.13所示的单链DNA;
m2)在m1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
m3)与m1)或m2)限定的单链DNA具有85%以上的同一性的单链DNA;
m4)在严格条件下与m1)或m2)限定的单链DNA杂交的单链DNA;
所述rs4762-R是如下n1)至n4)中的任一种单链DNA:
n1)序列表中SEQ ID No.14所示的单链DNA;
n2)在n1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
n3)与n1)或n2)限定的单链DNA具有85%以上的同一性的单链DNA;
n4)在严格条件下与n1)或n2)限定的单链DNA杂交的单链DNA;
所述rs2549782-P由名称分别为rs2549782-F和rs2549782-R的单链DNA组成;
所述rs2549782-F是如下p1)至p4)中的任一种单链DNA:
p1)序列表中SEQ ID No.16所示的单链DNA;
p2)在p1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
p3)与p1)或p2)限定的单链DNA具有85%以上的同一性的单链DNA;
p4)在严格条件下与p1)或p2)限定的单链DNA杂交的单链DNA;
所述rs2549782-R是如下q1)至q4)中的任一种单链DNA:
q1)序列表中SEQ ID No.17所示的单链DNA;
q2)在q1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
q3)与q1)或q2)限定的单链DNA具有85%以上的同一性的单链DNA;
q4)在严格条件下与q1)或q2)限定的单链DNA杂交的单链DNA;
所述rs1800629-P由名称分别为rs1800629-F和rs1800629-R的单链DNA组成;
所述rs1800629-F是如下s1)至s4)中的任一种单链DNA:
s1)序列表中SEQ ID No.19所示的单链DNA;
s2)在s1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
s3)与s1)或s2)限定的单链DNA具有85%以上的同一性的单链DNA;
s4)在严格条件下与s1)或s2)限定的单链DNA杂交的单链DNA;
所述rs1800629-R是如下t1)至t4)中的任一种单链DNA:
t1)序列表中SEQ ID No.20所示的单链DNA;
t2)在t1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
t3)与t1)或t2)限定的单链DNA具有85%以上的同一性的单链DNA;
t4)在严格条件下与t1)或t2)限定的单链DNA杂交的单链DNA;
所述rs1695-P由名称分别为rs1695-F和rs1695-R的单链DNA组成;
所述rs1695-F是如下v1)至v4)中的任一种单链DNA:
v1)序列表中SEQ ID No.22所示的单链DNA;
v2)在v1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
v3)与v1)或v2)限定的单链DNA具有85%以上的同一性的单链DNA;
v4)在严格条件下与v1)或v2)限定的单链DNA杂交的单链DNA;
所述rs1695-R是如下w1)至w4)中的任一种单链DNA:
w1)序列表中SEQ ID No.23所示的单链DNA;
w2)在w1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
w3)与w1)或w2)限定的单链DNA具有85%以上的同一性的单链DNA;
w4)在严格条件下与w1)或w2)限定的单链DNA杂交的单链DNA;
所述rs7412-E是如下c1)至c4)中的任一种单链DNA:
c1)序列表中SEQ ID No.3所示的单链DNA;
c2)在c1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
c3)与c1)或c2)限定的单链DNA具有85%以上的同一性的单链DNA;
c4)在严格条件下与c1)或c2)限定的单链DNA杂交的单链DNA;
所述rs2070744-E是如下f1)至f4)中的任一种单链DNA:
f1)序列表中SEQ ID No.6所示的单链DNA;
f2)在f1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
f3)与f1)或f2)限定的单链DNA具有85%以上的同一性的单链DNA;
f4)在严格条件下与f1)或f2)限定的单链DNA杂交的单链DNA;
所述rs1800896-E是如下i1)至i4)中的任一种单链DNA:
i1)序列表中SEQ ID No.9所示的单链DNA;
i2)在i1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
i3)与i1)或i2)限定的单链DNA具有85%以上的同一性的单链DNA;
i4)在严格条件下与i1)或i2)限定的单链DNA杂交的单链DNA;
所述rs1799724-E是如下l1)至l4)中的任一种单链DNA:
l1)序列表中SEQ ID No.12所示的单链DNA;
l2)在l1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
l3)与l1)或l2)限定的单链DNA具有85%以上的同一性的单链DNA;
l4)在严格条件下与l1)或l2)限定的单链DNA杂交的单链DNA;
所述rs4762-E是如下o1)至o4)中的任一种单链DNA:
o1)序列表中SEQ ID No.15所示的单链DNA;
o2)在o1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
o3)与o1)或o2)限定的单链DNA具有85%以上的同一性的单链DNA;
o4)在严格条件下与o1)或o2)限定的单链DNA杂交的单链DNA;
所述rs2549782-E是如下r1)至r4)中的任一种单链DNA:
r1)序列表中SEQ ID No.18所示的单链DNA;
r2)在r1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
r3)与r1)或r2)限定的单链DNA具有85%以上的同一性的单链DNA;
r4)在严格条件下与r1)或r2)限定的单链DNA杂交的单链DNA;
所述rs1800629-E是如下u1)至u4)中的任一种单链DNA:
u1)序列表中SEQ ID No.21所示的单链DNA;
u2)在u1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
u3)与u1)或u2)限定的单链DNA具有85%以上的同一性的单链DNA;
u4)在严格条件下与u1)或u2)限定的单链DNA杂交的单链DNA;
所述rs1695-E是如下x1)至x4)中的任一种单链DNA:
x1)序列表中SEQ ID No.24所示的单链DNA;
x2)在x1)的5′端和/或3′端添加一个或几个核苷酸得到的单链DNA;
x3)与x1)或x2)限定的单链DNA具有85%以上的同一性的单链DNA;
x4)在严格条件下与x1)或x2)限定的单链DNA杂交的单链DNA。
当所述成套SNP甲为rs2549782、rs1800629和rs1695时,所述成套引物对甲为所述rs2549782-P、所述rs1800629-P和所述rs1695-P,所述成套延伸引物甲为所述rs2549782-E、所述rs1800629-E和所述rs1695-E;
当所述成套SNP甲为rs1800629和rs1695时,所述成套引物对甲为所述rs1800629-P和所述rs1695-P,所述成套延伸引物甲为所述rs1800629-E和所述rs1695-E;
当所述成套SNP甲为rs2549782和rs1695时,所述成套引物对甲为所述rs2549782-P和所述rs1695-P,所述成套延伸引物甲为所述rs2549782-E和所述rs1695-E;
当所述成套SNP甲为rs2549782和rs1800629时,所述成套引物对甲为所述rs2549782-P和所述rs1800629-P,所述成套延伸引物甲为所述rs2549782-E和所述rs1800629-E;
当所述成套SNP甲为rs2549782时,所述成套引物对甲为所述rs2549782-P,所述成套延伸引物甲为所述rs2549782-E;
当所述成套SNP甲为rs1800629时,所述成套引物对甲为所述rs1800629-P,所述成套延伸引物甲为所述rs1800629-E;
当所述成套SNP甲为rs1695时,所述成套引物对甲为所述rs1695-P,所述成套延伸引物甲为所述rs1695-E。
所述添加一个或几个核苷酸可为添加一至十个核苷酸。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的核苷酸序列具有85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述85%以上同一性,可为85%、90%或95%以上的同一性。
所述物质还可包括检测SNP多态性或基因型的试剂、仪器、软件和/或模块。
所述检测SNP多态性或基因型的试剂、仪器、软件和/或模块可为SNaPshot基因型检测方法中用到的试剂、仪器、软件和/或模块。
所述物质可仅为所述成套试剂1或所述成套试剂2,也可为由所述成套试剂1或所述成套试剂2与所述检测SNP多态性或基因型的试剂、仪器、软件和/或模块组成的产品。
为解决上述技术问题,本发明还提供了人基因组中所述成套SNP的多态性或基因型在上述X1)-X10)中任一种中的应用。
为解决上述技术问题,本发明还提供了人基因组中rs7412的多态性或基因型在上述X1)-X10)中任一种中的应用。
为解决上述技术问题,本发明还提供了含有检测人基因组中所述成套SNP的多态性或基因型的物质或检测人基因组中rs7412的多态性或基因型的物质的产品。
本发明所提供的含有检测人基因组中所述成套SNP的多态性或基因型的物质或检测人基因组中rs7412的多态性或基因型的物质的产品,为a)-e)中的任一种产品:
a)筛查子痫前期患者产品;
b)预测子痫前期患病风险产品;
c)检测子痫前期易感性产品;
d)检测与子痫前期相关的单核苷酸多态性或基因型的产品;
e)鉴定或辅助鉴定与子痫前期相关的单核苷酸多态性或基因型的产品。
上述产品中,所述物质可为所述检测人基因组中成套SNP的多态性或基因型的物质或所述检测人基因组中rs7412的多态性或基因型的物质。
所述产品还可包括对人基因组中所述成套SNP的多态性或基因型和影响子痫前期发病的其他因素进行联合分析的软件和/或模块。
上述产品可为仅包括相关试剂的试剂或试剂盒。
为解决上述技术问题,本发明还提供了下述任一方法:
Y1、预测子痫前期患病风险的方法,包括:检测待测对象基因组中所述的成套SNP的基因型,根据M1或M2确定所述待测对象子痫前期的患病风险;所述M1为所述成套SNP的基因型;所述M2为所述成套SNP的基因型和所述待测对象的影响子痫前期发病的其他因素;
Y2、筛查子痫前期患者的方法,包括:检测待测对象基因组中所述的成套SNP的基因型,根据所述M1或所述M2确定所述待测对象是否为子痫前期患者;
Y3、检测子痫前期易感性的方法,包括:检测待测对象基因组中所述的成套SNP的基因型,根据所述M1或所述M2确定所述待测对象的子痫前期易感性。
在实际应用中,可利用本发明的成套SNP联合年龄,胎儿数目,子痫前期病史,家族史,或者其它合并疾病信息,评估受试者子痫前期发生的风险。
本发明中,所述影响子痫前期发病的其他因素可为影响PE发病的因素,如年龄,胎儿数目,子痫前期病史,家族史,或者其它合并疾病信息。
本发明中,所述人和所述待测对象均可为N1或N2:
N1、黄色人种;
N2、华人。
本发明具有以下优点为:(1)利用本发明的成套SNP预测PE发生风险是一种对人体无害的预测方法;(2)由于基因型的稳定性,因此可以极早期对子痫前期的风险评估提供有效指导;(3)成套SNP的联用以及成套SNP与年龄的组合预测待测对象的PE风险具有高准确率、特异度、灵敏度和曲线下面积;(4)联合使用SNaPshot基因型检测方法,具有准确度高,灵敏度好等技术优势,而且单个反应即可快速准确地检测出样品中所有相关基因的多态性,为临床提供一种优越的低成本分子诊断方法,有助于早期评估女性子痫前期的发病风险。
本发明发现rs7412是与华人子痫前期相关的SNP位点,风险等为基因为T。本发明还发现在华人中rs1800629、rs1695和r4762的风险等位基因分别为G、A和C,这与国外现有的报道不一致。表明,相同SNP位点在不同人群中的风险等位基因不一定一致。
本发明的成套SNP可对子痫前期患病风险进行风险评估,进而指导对子痫前期的尽早干预和预防,降低子痫前期的发病率以及对母婴的危害。
附图说明
图1为各SNP位点不同基因型的SNaPshot检测结果。
图2为利用八个SNP位点及其与其它指标组合对待测对象的受试者工作特征(receiver operating characteristic,ROC)分析结果。其中,虚线曲线表示5倍交叉验证的各单次模型预测性能。
图3为利用五个SNP位点及其与其它指标组合对待测对象的受试者工作特征分析结果。其中,虚线曲线表示5倍交叉验证的各单次模型预测性能。
图4为华人子痫前期和正常孕妇的年龄分布观察结果。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
实施例1、rs7412、rs2070744、rs1800896、rs1799724、rs4762、rs2549782、rs1800629和rs1695八个SNP可联合用于筛查子痫前期患者
1、研究对象
研究对象为深圳市妇幼保健院的156例华人子痫前期产妇(PE患者)和286例华人正常产妇(正常人,CT)。
2、基因型分型
1)采集受试者样品(外周血),提取基因组DNA;
2)以受试者基因组DNA为模板进行多基因片段PCR扩增,10μL PCR扩增体系如下:待检测受试者基因组DNA样品(10-20ng/μL)1μL,10X PCR缓冲液(美国Kapa Biosystems公司)1μL,25mM的氯化镁2μL,正向引物和反向引物(浓度分别为200nM)各0.5μL,DNA聚合酶(KAPA Taq HotStart DNA Polymerase,美国Kapa Biosystems公司)0.5μL,dNTPs(5mM)1μL,超纯水3.5μL;混匀后加入到96孔样品板上于PCR仪中进行PCR反应;PCR反应条件:95℃5分钟;95℃30秒钟,58℃30秒钟,72℃30秒钟,循环35次;72℃10分钟;4℃直至收取PCR产物。其中正向引物和反向引物见表1,每个反应体系中含有一个位点的正向引物和反向引物;
3)使用SAP和ExoI对PCR产物进行处理,去除多余的dNTPs和引物,反应体系:PCR产物10μL,SAP(虾碱酶,1U/μL;New England Biolabs公司)1μL,ExoI(20U/μL;New England Biolabs公司)0.1μL;混匀;反应条件:37℃孵育1小时,75℃孵育15分钟使酶失活,4℃直至收取PCR纯化产物;
4)收集纯化后的PCR产物,使用表1中所列各多态位点的单碱基延伸引物和ABIMultiplex Kit进行多态位点延伸反应,利用ABI 3730xL测序仪及配套软件测序及基因型分析。
各SNP位点不同基因型的SNaPshot检测结果如图1所示,纯合型表现为单一的峰型,杂合的则呈现两个不同的峰型;不同的碱基表现为不同的颜色和波长。
表1.引物序列
注:Y表示C/T,K表示G/T。
3、八个SNP与子痫前期(PE)的关联分析
分析rs7412、rs2070744、rs1800896、rs1799724、rs4762、rs2549782、rs1800629和rs1695八个SNP中每个SNP与PE的相关性。
除去基因分型不成功的个体,各位点的基因型个体数如表3所示。各位点的基因型群体分布均符合哈温平衡,罕见基因型均呈现显著(p<0.05,卡方检验)或者临界显著(p≥0.05并且p<0.1,卡方检验)地与子痫前期发病有关,各位点的基因型对疾病的贡献以及优势比(OR值)和95%置信区间如表2所述。关于基因型及其与疾病关联的统计分析方法与传统方法一致,参考Zhou L,Cheng L,He Y,et al.(2016).Inflamm Res.65(9):717-24。
表2.各多态位点基因型与子痫前期(PE)的关联和风险大小
表3、各SNP位点不同基因型的个体数
结果(表2和表3)显示,rs2070744是与PE相关的位点。rs2070744的三个基因型中,AA基因型的个体在PE患者群体中的比例显著低于其在正常人群中的比例,AG和GG基因型的个体在PE患者群体中的比例分别显著高于相应基因型在正常人群中的比例。rs2070744的风险等位基因为G,与正常对照相比该等位基因在PE患者中的基因频率增加了3%。
rs1800896是与PE相关的位点。rs1800896的三个基因型中,AA基因型的个体在PE患者群体中的比例显著低于其在正常人群中的比例,AG和GG基因型的个体在PE患者群体中的比例分别显著高于相应基因型在正常人群中的比例。rs1800896的风险等位基因为G,与正常对照相比该等位基因在PE患者中的基因频率增加了4%。
rs1800629是与PE相关的位点。rs1800629的三个基因型中,GG基因型的个体在PE患者群体中的比例显著高于其在正常人群中的比例,AG和AA基因型的个体在PE患者群体中的比例分别显著低于相应基因型在正常人群中的比例。rs1800629的风险等位基因为G,与正常对照相比该等位基因在PE患者中的基因频率增加了4%。
rs1799724是与PE相关的位点。rs1799724的三个基因型中,GG基因型的个体在PE患者群体中的比例显著低于其在正常人群中的比例,AG和AA基因型的个体在PE患者群体中的比例分别显著高于相应基因型在正常人群中的比例。rs1799724的风险等位基因为A,与正常对照相比该等位基因在PE患者中的基因频率增加了6%。
rs7412是与PE相关的位点。rs7412的三个基因型中,CC基因型的个体在PE患者群体中的比例显著低于其在正常人群中的比例,CT和TT基因型的个体在PE患者群体中的比例分别显著高于相应基因型在正常人群中的比例。rs7412的风险等位基因为T,与正常对照相比该等位基因在PE患者中的基因频率增加了3%。
rs1695是与PE相关的位点。rs1695的三个基因型中,AA基因型的个体在PE患者群体中的比例显著高于其在正常人群中的比例,AG和GG基因型的个体在PE患者群体中的比例分别显著低于相应基因型在正常人群中的比例。rs1695的风险等位基因为A,与正常对照相比该等位基因在PE患者中的基因频率增加了3%。
r4762是与PE相关的位点。r4762的三个基因型中,CC基因型的个体在PE患者群体中的比例显著高于其在正常人群中的比例,CT和TT基因型的个体在PE患者群体中的比例分别显著低于相应基因型在正常人群中的比例。r4762的风险等位基因为C,与正常对照相比该等位基因在PE患者中的基因频率增加了6%。
rs2549782是与PE相关的位点。rs2549782的三个基因型中,TT基因型的个体在PE患者群体中的比例显著低于其在正常人群中的比例,TG和GG基因型的个体在PE患者群体中的比例分别显著高于相应基因型在正常人群中的比例。rs2549782的风险等位基因为G,与正常对照相比该等位基因在PE患者中的基因频率增加了3%。
表明,可利用rs7412、rs2070744、rs1800896、rs1799724、rs4762、rs2549782、rs1800629和rs1695这八个SNP预测待测对象PE的发病风险及筛查PE患者。
4、联合分析SNP与子痫前期(PE)以及SNP和年龄与PE的关联性
分析rs7412、rs2070744、rs1800896、rs1799724、rs4762、rs2549782、rs1800629和rs1695八个SNP位点联合对子痫前期(PE)发病风险的预测能力。
采用的是5倍交叉验证的方法:将研究对象按阳性(子痫前期,PE)和阴性(正常人,CT)分别随机等分成5份,其中4份PE和4份CT用来进行基因型的比较和Logistic回归模型训练;使用训练得到的模型对剩余的1份PE和1份CT进行预测,进而计算这一模型预测PE的性能,即曲线下面积、准确率、灵敏度、特异度;取不同的等份组合作为模型训练数据集、余下的作为测试集,反复进行模型性能的评估;最后计算各个模型的平均性能。Logistic回归模型在R编程环境下实现(https://www.r-project.org/)。将各位点的基因型按照表2中的分组法分别编码为1或0:rs2070744位点如果呈现为AA基因型则编码为1,AG或者GG基因型均编码为0;rs1800896位点如果呈现为AA基因型则编码为1,AG或者GG基因型均编码为0;rs1800629位点如果呈现为GG基因型则编码为1,AG或者AA基因型均编码为0;rs1799724位点如果呈现为GG基因型则编码为1,AG或者AA基因型均编码为0;rs7412位点如果呈现为CC基因型则编码为1,CT或者TT基因型均编码为0;rs1695位点如果呈现为AA基因型则编码为1,AG或者GG基因型均编码为0;rs4762位点如果呈现为CC基因型则编码为1,CT或者TT基因型均编码为0;rs2549782位点如果呈现为TT基因型则编码为1,TG或者GG基因型均编码为0。从而得到数字关于训练人群的多态位点组合基因型数字编码矩阵。合并年龄分层的模型,各位点基因型的编码如前所述,年龄如果介于21-32岁(包含)之间定义为0,否则定义为1。将相应矩阵输入R,利用R自带的Logistic回归函数glm得到各位点的贡献值(如表4)和相应的风险预测函数。利用该预测模型可以计算任意上述风险位点基因型组合的发病概率。
表4是通过对研究对象的rs7412、rs2070744、rs1800896、rs1799724、rs4762、rs2549782、rs1800629和rs1695八个SNP位点基因型的分析和logisitic回归模拟生成。各位点系数为正表明相应的基因型组成(表2中展示优势比的基因型)对疾病起正性贡献,即增加子痫前期的发病风险;系数为负则相反,即减低子痫前期的发病风险;系数的绝对值大小表示贡献的大小;呈现统计显著性的位点表明该位点基因型组成对疾病风险预测起显著贡献。这八个SNP位点种有5个位点(rs7412、rs2070744、rs1800896、rs1799724和rs4762)呈现统计显著性,但是保留其它3个位点的基因型信息对子痫前期发病风险的预测能力有一定提升。
利用这八个SNP位点对子痫前期的预测准确率为67%,特异度为72%,灵敏度为61%,ROC曲线下面积(AUC)为0.66,ROC曲线见图2中SNP8曲线;
利用五个SNP位点(rs7412、rs2070744、rs1800896、rs1799724和rs4762)对子痫前期的预测准确率为62%,特异度为70%,灵敏度为56%,ROC曲线下面积为0.62,ROC曲线见图3中的SNP5曲线;
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762以及rs1800629和rs1695对子痫前期的预测准确率为63%,特异度为70%,灵敏度为58%,ROC曲线下面积为0.64;
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762以及rs2549782和rs1695对子痫前期的预测准确率为66%,特异度为71%,灵敏度为58%,ROC曲线下面积为0.64;
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762以及rs2549782和rs1800629对子痫前期的预测准确率为65%,特异度为69%,灵敏度为60%,ROC曲线下面积为0.65;
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762以及rs1695对子痫前期的预测准确率为63%,特异度为69%,灵敏度为61%,ROC曲线下面积为0.64;
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762以及rs1800629对子痫前期的预测准确率为64%,特异度为70%,灵敏度为59%,ROC曲线下面积为0.63;
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762以及rs2549782对子痫前期的预测准确率为63%,特异度为68%,灵敏度为60%,ROC曲线下面积为0.63;
单独利用年龄对PE进行预测的准确率为62%,特异度为65%,灵敏度为57%,ROC曲线下面积为0.61,ROC曲线见图2中Age曲线。
利用八个SNP位点与年龄对PE进行预测的准确率为75%,特异度为79%,灵敏度为74%,ROC曲线下面积为0.78,ROC曲线见图2中SNP8Age曲线。
利用rs7412、rs2070744、rs1800896、rs1799724和rs4762五个SNP位点与年龄对PE进行预测的准确率为74%,特异度为78%,灵敏度为74%,ROC曲线下面积为0.76,ROC曲线见图3中SNP5Age曲线。
利用这八个SNP位点和上述五个SNP位点(rs7412、rs2070744、rs1800896、rs1799724和rs4762)对PE的预测比单独利用年龄对PE进行预测具有更高的准确率、特异度、灵敏度和曲线下面积,利用八个SNP位点与年龄对PE进行预测比单独利用八个SNP位点对PE进行预测具有更高的准确率、特异度、灵敏度和曲线下面积,利用五个SNP位点与年龄对PE进行预测比单独利用五个SNP位点对PE进行预测具有更高的准确率、特异度、灵敏度和曲线下面积,在上述五个SNP位点的基础上,逐渐rs2549782、rs1800629和rs1695中的1个或2个SNP位点可以提高预测的准确率、特异度、灵敏度和曲线下面积。
表4是通过对研究对象的八个SNP位点基因型和logisitic回归模拟生成。各位点系数为正表明相应的基因型组成(表2中展示优势比的基因型)对疾病起正性贡献,即增加子痫前期的发病风险;系数为负则相反,即减低子痫前期的发病风险;系数的绝对值大小表示贡献的大小。
表4.八位点logisitic回归模型(SNP8)各变量的贡献性
利用这八个SNP位点对子痫前期的具体发病风险预测按照如下函数式进行:子痫前期发病风险Y=exp(SNP8pre)/(1+SNP8pre),SNP8pre=α+β1×X1+β2×X2+β3×X3+β4×X4+β5×X5+β6×X6+β7×X7+β8×X8。其中,α表示截距,该模型中为1.9932,β1~β8分别为表4自上而下(顺序依次为rs2549782、rs1695、rs2070744、rs1800896、rs1800629、rs1799724、rs4762和rs7412)的SNP位点的系数,X1~X8分别为表4自上而下(顺序依次为rs2549782、rs1695、rs2070744、rs1800896、rs1800629、rs1799724、rs4762和rs7412)的SNP位点基因型的数字编码(0或1)。
表5是通过对研究对象的八个SNP位点基因型及年龄的分析和logisitic回归模拟生成。各位点系数为正表明相应的基因型组成(表2中展示优势比的基因型)对疾病起正性贡献,即增加子痫前期的发病风险;系数为负则相反,即减低子痫前期的发病风险;系数的绝对值大小表示贡献的大小。年龄作为危险因素的分层参考中华医学会妇产科学分会“妊娠期高血压疾病诊治指南(2015)”修订版和图4基于深圳市妇幼保健院的156例华人子痫前期产妇(PE患者)和286例华人正常产妇(正常人)的年龄分布结果。
表5.八位点联合年龄的logisitic回归模型(SNP8Age)各变量贡献性
利用八个SNP位点与年龄对子痫前期发病风险的预测按照如下函数式进行:子痫前期发病风险Y=exp(SNP8Agepre)/(1+SNP8Agepre),SNP8Agepre=α+β1×X1+β2×X2+β3×X3+β4×X4+β5×X5+β6×X6+β7×X7+β8×X8+β9×X9。其中,α表示截距,该模型中为-1.24966,β1~β8分别为表5自上而下的SNP位点(顺序依次为rs2549782、rs1695、rs2070744、rs1800896、rs1800629、rs1799724、rs4762和rs7412)的系数、β9为表5中年龄因素的系数,X1~X8为表5自上而下的SNP位点(顺序依次为rs2549782、rs1695、rs2070744、rs1800896、rs1800629、rs1799724、rs4762和rs7412)的数字编码(0或1),X9为年龄编码。
<110> 深圳金蕊科技有限公司
<120> 用于预测子痫前期的成套SNP及其应用
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
cggaactgga ggaacaactg ac 22
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
tgctccttca cctcgtccag 20
<210> 3
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
gcctggtaca ctgccaggc 19
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
accagggcat caagctcttc 20
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
ccttgagtct gacattaggg tatc 24
<210> 6
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
ggctgaggca gggycagcc 19
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
acactactaa ggcttctttg gga 23
<210> 8
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
tacaagggta caccagtgcy a 21
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 9
cactactaag gcttctttgg ga 22
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 10
accacagcaa tgggtaggag 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 11
ggtcctggag gctctttcac 20
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 12
cctctacatg gccctgtctt y 21
<210> 13
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 13
gctgacaggc tacaggcaat c 21
<210> 14
<211> 24
<212> DNA
<213> 人工序列
<220>
<223>
<400> 14
catccagytc tktgaagtcc agag 24
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 15
atcataagtt ggggggaggg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 16
acctggtcac aatggaatgg 20
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 17
accttcaatg tttcatccag ttc 23
<210> 18
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 18
ggtggaatga tatttggctt aa 22
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 19
cccctcccag ttctagttct atc 23
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 20
taggaccctg gaggctgaac 20
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 21
caataggttt tgaggggcat g 21
<210> 22
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 22
ctgtgtggca gtctctcatc c 21
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 23
gttgatgtcc caggcaataa g 21
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 24
aggacctccg ctgcaaatac 20