一种基于39个SNP位点筛查高原肺水肿易感人群的试剂盒的制作方法

文档序号:31145966发布日期:2022-08-16 23:41阅读:105来源:国知局
一种基于39个SNP位点筛查高原肺水肿易感人群的试剂盒的制作方法
一种基于39个snp位点筛查高原肺水肿易感人群的试剂盒
技术领域
1.本发明属于基因检测领域,涉及一种基于39个snp位点筛查高原肺水肿易感人群的试剂盒。


背景技术:

2.高原肺水肿(high altitude pulmonary edema,hape)是指近期抵达高原(一般指海拔3000米以上,也有少量为海拔3000米以下),出现静息时呼吸困难、胸闷、胸部压塞感、咳嗽、咳白色或粉红色泡沫痰,患者感全身乏力或活动能力减低。高原肺水肿是高原特发性疾病,多见于3 000m以上的高海拔地区,以发病急、危害大、病死率高为主要特点。
3.近年来,国内外对hape的发生进行了一系列的研究,该病具有明显的遗传易感倾向,是遗传和环境共同作用的结果。在低氧环境下发病的机率与个体易感性基因密切相关,因此易感基因可能会作为一种重要的分子标志物预防和诊断疾病、评估病情严重程度,并提供有效的治疗办法。


技术实现要素:

4.本发明的目的是提供一种基于39个snp位点筛查高原肺水肿易感人群的试剂盒。
5.本发明提供了39个snp作为检测靶标在开发产品中的应用。
6.本发明还提供了一种产品,包括用于检测受试者基于39个snp的基因型的物质。
7.示例性的,所述用于检测受试者基39个snp的基因型的物质为引物组;所述引物组由117种引物组成,依次如序列表的序列1至序列117所示。
8.所述引物为单链dna分子。
9.所述产品还包括记载有预测模型的载体。
10.所述产品还包括记载有预测模型的建立方法和预测模型的应用方法的载体。
11.所述产品还包括记载有预测模型的建立方法、预测模型的评估方法和预测模型的应用方法的载体。
12.本发明还提供了用于检测受试者基于39个snp的基因型的物质在制备产品中的应用。
13.示例性的,所述用于检测受试者基39个snp的基因型的物质为引物组;所述引物组由117种引物组成,依次如序列表的序列1至序列117所示。
14.所述引物为单链dna分子。
15.以上任一所述产品的功能为如下(a)或(b):
16.(a)筛查高原肺水肿易感个体;
17.(b)评价受试者发生高原肺水肿的风险性。
18.以上任一所述39个snp如下:rs12733147、rs2941757、rs56240659、rs28843785、rs4836498、rs79522289、rs59140633、rs12569857、rs241970、rs11620394、rs12148912、rs740873、rs919197、rs6009184、rs938355、rs9932581、rs6194、rs9592406、rs2297441、
rs4762、rs2397218、rs12462380、rs699、rs11896604、rs12655827、rs130293、rs2486736、rs41417552、rs5768002、rs40305、rs11962222、rs2009196、rs2148582、rs1008438、rs10929728、rs820336、rs6888553、rs6010621和rs6882447。
19.以上任一所述预测模型为预测模型glm(phenotype~ps)。
20.预测模型glm(phenotype~ps)的建立方法如下:
21.(1)准备两个矩阵(matrix),一个包括训练集的每个受试者的39个snp的基因型信息,另一个包括39个snp的效应值信息;两个矩阵相乘,按照多基因风险评分的计算公式计算出每个受试者的ps数值,保存成一个额外的数据框,其中包括每个受试者的表型值(表型值指的是高原肺水肿患者或正常人)和ps数值。
22.(2)建立一个formula:phenotype~ps;对formula做逻辑回归,选择函数glm,回归的输入数据为步骤(1)得到的数据框;得到预测模型glm(phenotype~ps);
23.预测模型的建立方法具体包括如下步骤。
24.(1)准备两个矩阵(matrix),一个包括训练集的每个受试者的39个snp的基因型信息,另一个包括39个snp的效应值信息;两个矩阵相乘,按照多基因风险评分的计算公式计算出每个受试者的ps数值,保存成一个额外的数据框,其中包括每个受试者的表型值(表型值指的是高原肺水肿患者或正常人)和ps数值。
25.(2)建立一个formula:phenotype~ps;对formula做逻辑回归,选择函数glm,回归的输入数据为步骤(1)得到的数据框;得到预测模型glm(phenotype~ps)。
26.预测模型的评估方法如下:将验证集的每个受试者的39个snp的基因型信息输入预测模型glm(phenotype~ps),选择predict函数,获取受试者的预测结果(预测结果为高原肺水肿患者或正常人)。
27.预测模型的应用方法如下:将待测者的39个snp的基因型信息输入预测模型glm(phenotype~ps),选择predict函数,获取待测者的预测结果(预测结果为高原肺水肿患者或正常人)。
28.多基因风险评分(polygenic score,ps)的计算公式如下:
[0029][0030]
计算公式中,gi为受试者基于某个snp的基因型中效应等位基因的数量(数值为0或1或2),βi为关联分析中某个snp的效应值,n是纳入计算的snp数量(snp数量为39,39个snp的信息见表1)。各个snp的效应等位基因以及效应值见表3。表3中,beta即为效应值(βi)。
[0031]
以上任一所述训练集由具有统计学意义的高原肺水肿患者和正常人组成。
[0032]
以上任一所述验证集由具有统计学意义的高原肺水肿患者和正常人组成。
[0033]
以上任一所述产品可为试剂盒。
[0034]
以上任一所述受试者可为中国人。
[0035]
以上任一所述受试者可为中国汉族人。
[0036]
以上任一所述受试者可为中国汉族男性。
[0037]
以上任一所述受试者可为平原地区的中国人。
[0038]
以上任一所述受试者可为平原地区的中国汉族人。
[0039]
以上任一所述受试者可为平原地区的中国汉族男性。
[0040]
以上任一所述受试者可为由平原地区到达高原地区的中国人。
[0041]
以上任一所述受试者可为由平原地区到达高原地区的中国汉族人。
[0042]
以上任一所述受试者可为由平原地区到达高原地区的中国汉族男性。
[0043]
以上任一所述受试者可为由平原地区预计去高原地区的中国人。
[0044]
以上任一所述受试者可为由平原地区预计去高原地区的中国汉族人。
[0045]
以上任一所述受试者可为由平原地区预计去高原地区的中国汉族男性。
[0046]
以上任一所述高原地区可为青藏高原地区。
[0047]
以上任一所述高原地区可为青藏高原的拉萨地区。
[0048]
用于检测受试者基于39个snp的基因型的物质可为基于如下任一技术检测受试者基于39个snp的基因型的物质:dna测序、限制性酶切片段长度多态性、单链构象多态性、变性高效液相色谱、snp芯片等。snp芯片可包括基于核酸杂交反应的芯片、基于单碱基延伸反应的芯片、基于等位基因特异性引物延伸反应的芯片、基于“一步法”反应的芯片、基于引物连接反应的芯片、基于限制性内切酶反应的芯片、基于蛋白dna结合反应的芯片,基于荧光分子dna结合反应的芯片等。
[0049]
以上任一所述用于检测受试者基于39个snp的基因型的物质包括引物组。所述引物组由用于检测39个snp的所有引物组成(例如,用于检测每个snp的引物组由3种引物组成,那么用于检测39个snp的引物组由117种引物组成)。用于检测每个snp的引物组由三条引物组成,其中一条为单碱基延伸引物,另外两条用于扩增包括该snp的dna片段。两条扩增引物在序列上没有特殊要求,只要能扩增出包括该snp在内的基因组dna片段即可。所述单碱基延伸引物可根据人基因组中该snp的上游或下游(不包括该snp位点)设计,所述单碱基延伸引物延伸的核苷酸对应于人基因组中该snp,即所述单碱基延伸引物的3’末端核苷酸对应于人基因组中该snp的相邻位核苷酸(即该snp的前一位核苷酸或后一位核苷酸)。
[0050]
以上任一所述用于检测受试者基于某个snp的基因型的物质还可包括pcr试剂、dna测序试剂和dna测序仪等。
[0051]
以上任一所述用于检测受试者基于39个snp的基因型的物质包括引物组。所述引物组由用于检测39个snp的所有引物组成(例如,用于检测每个snp的引物组由2种引物组成,那么用于检测39个snp的引物组由78种引物组成)。用于检测每个snp的对由两条引物组成,用于扩增包括该snp的dna片段。两条引物在序列上没有特殊要求,只要能扩增出包括该snp在内的基因组dna片段即可。
[0052]
本发明提供的39个snp的组合可用于筛查高原肺水肿易感个体、预测人对高原肺水肿的易感性、筛查携带人高原肺水肿易感基因的个体和评价高原肺水肿患病风险。
[0053]
本发明可用于避免或减少高原肺水肿的发生,对于高原地区具有重大的应用推广价值。
具体实施方式
[0054]
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产
品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。伦理声明:每个受试者均签署知情同意书,本研究得到解放军第七医学中心和西藏解放军总医院医学伦理委员会的批准。高原肺水肿患者均为医院确诊的患者,诊断标准参见文献:我国高原病命名、分型及诊断标准;高原医学杂志2010年第20卷1期;9-11。本发明中的正常人指的是非高原肺水肿患者。
[0055]
实施例1、筛选与高原肺水肿患病风险具有相关性的snp
[0056]
配对群体由高原肺水肿患者群体以及相应的正常人群体组成。
[0057]
建立多组配对群体,进行大量全基因组测序以及序列比对分析的工作,获取到大量差异snp。依次验证各个差异snp在高原肺水肿患者群体以及相应的正常群体中的等位基因频率以及基因型频率以进行关联分析。尝试多种snp组合形式并分别初步建立模型和验证模型。通多大量的性能比较,最终筛选到39个snp的组合。
[0058]
39个snp的信息见表1。表1中,位于染色体的位置针对的都是grch37.p13。
[0059]
表1
[0060][0061]
实施例2、建立检测受试者基于各个snp的基因型的方法
[0062]
分别检测受试者基于各个snp的基因型(共39个snp,信息见表1)。
[0063]
1、取受试者的外周血,提取基因组dna。
[0064]
2、以步骤1提取的基因组dna为模板,采用特异引物对进行pcr扩增。
[0065]
特异引物对由引物f和引物r组成。
[0066]
pcr扩增在384孔板中进行,每个孔一个反应体系。
[0067]
pcr扩增的反应体系的组成(5μl):0.5μl 10
×
pcr缓冲液、0.4μl 25mm mgcl2溶液、0.1μl 25mm dntp mix、基因组dna、hotstart taq dna聚合酶、引物f、引物r,用超纯水补足体积。5μl体系中,基因组dna的含量为20-50ng,hotstar taq酶的含量为0.5u,引物f的含量为0.5pmol,引物r的含量为0.5pmol。
[0068]
pcr扩增的反应程序:94℃4分钟;94℃20秒、56℃30秒、72℃1分钟,45个循环;72℃3分钟;4℃保持。
[0069]
3、进行碱性磷酸酶处理(目的是去除体系中游离的dntps)。
[0070]
取完成步骤2的384孔板,制备反应体系然后进行反应。
[0071]
反应体系的组成(7μl):5μl步骤2得到的产物溶液、0.3μl sap、0.17μl 10
×
sap缓冲液、1.53μl超纯水。
[0072]
sap(shrimp alkaline phosphatase,虾碱性磷酸酶):产品规格为1.7u/μl;agena公司,货号为10002.1。10
×
sap缓冲液为sap的配套缓冲液。
[0073]
反应条件:37℃40分钟;85℃5分钟;4℃维持。
[0074]
4、进行单碱基延伸。
[0075]
取完成步骤3的384孔板,制备反应体系然后进行单碱基延伸反应。
[0076]
单碱基延伸的反应体系的组成(10μl):7μl步骤3得到的产物溶液、0.3μl单碱基延伸反应酶、0.17μl 10
×
单碱基延伸反应缓冲液、1μl单碱基延伸引物、1.53μl超纯水。
[0077]
单碱基延伸反应酶:产品规格为1.7u/μl;agena公司,货号为1432。10
×
单碱基延伸反应缓冲液为单碱基延伸反应酶的配套缓冲液。
[0078]
单碱基延伸的反应程序如下:
[0079]

94℃30秒;
[0080]

94℃5秒;
[0081]

52℃5秒、80℃5秒,5个循环;
[0082]

94℃5秒、52℃5秒、80℃5秒,40个循环;
[0083]

72℃3分钟;
[0084]

4℃保持。
[0085]
5、进行树脂纯化。
[0086]
取完成步骤4的384孔板,每孔加入16μl水,然后每孔加入clean resin树脂(美国sequenom公司),封膜,低速垂直旋转30分钟以使树脂与反应物充分接触,然后离心使树脂沉入孔底部,上清液即为树脂纯化后的延伸产物。
[0087]
6、芯片点样。
[0088]
启动massarraynanodispenser rs1000点样仪(sequenom公司),将树脂纯化后的延伸产物移至384孔spectrochip(sequenom)芯片(sequenom公司)上。
[0089]
7、质谱检测。
[0090]
将点样后的spectrochip芯片使用maldi-tof分析,检测结果使用typer 4.0软件(sequenom)分型并输出结果。
[0091]
检测受试者基于各个snp的基因型的引物f、引物r以及单碱基延伸引物见表2。
[0092]
表2
[0093]
[0094]
[0095][0096]
实施例3、建立风险评估模型
[0097]
一、多基因风险评分的计算公式
[0098]
多基因风险评分(polygenic score,ps)的计算公式如下:
[0099][0100]
计算公式中,gi为受试者基于某个snp的基因型中效应等位基因的数量(数值为0或1或2),βi为关联分析中某个snp的效应值,n是纳入计算的snp数量(snp数量为39,39个snp的信息见表1)。各个snp的效应等位基因以及效应值见表3。表3中,beta即为效应值(βi)。
[0101]
表3
[0102]
[0103][0104]
以rs12733147为例,其多态形式为a/g,效应等位基因为a;如果受试者的基因型为aa,那么其效应等位基因的数量为2;如果受试者的基因型为gg,那么其效应等位基因的数量为0;如果受试者的基因型为ag,那么其效应等位基因的数量为1。
[0105]
二、建立预测模型(逻辑回归模型)
[0106]
受试者群体由若干高原肺水肿患者和若干正常人组成。按照实施例2的方法分别检测每个受试者基于各个snp的基因型(共39个snp)。
[0107]
从受试者群体中取样1000次。每次取样时,受试者群体中的80%高原肺水肿患者和80%正常人组成训练集,剩余的20%高原肺水肿患者和20%正常人组成验证集。
[0108]
建立模型、评估模型和应用模型均使用r语言。
[0109]
建立模型的步骤如下:
[0110]
(1)准备两个矩阵(matrix),一个包括训练集的每个受试者的39个snp的基因型信息,另一个包括39个snp的效应值信息;两个矩阵相乘,按照上述多基因风险评分的计算公式计算出每个受试者的ps数值,保存成一个额外的数据框,其中包括每个受试者的表型值(表型值指的是高原肺水肿患者或正常人)和ps数值。
[0111]
(2)建立一个formula:phenotype~ps;对formula做逻辑回归,选择函数glm,回归的输入数据为步骤(1)得到的数据框;得到预测模型glm(phenotype~ps);
[0112]
评估模型的步骤如下:将验证集的每个受试者的39个snp的基因型信息输入预测模型glm(phenotype~ps),选择predict函数,获取受试者的预测结果(预测结果为高原肺
水肿患者或正常人)。
[0113]
根据验证集受试者的预测结果和实际表型的一致性评估模型。取样1000次,平均auc为0.95以上,说明此模型的分类效果较好。
[0114]
应用模型的步骤如下:将待测者的39个snp的基因型信息输入预测模型glm(phenotype~ps),选择predict函数,获取待测者的预测结果(预测结果为高原肺水肿患者或正常人)。
[0115]
实施例4、对受试者进行风险评估
[0116]
外周血样本获取自西藏解放军总医院。166份外周血样本获自166例高原肺水肿患者,142份外周血样本获自142例正常人(非高原肺水肿患者)。166例高原肺水肿患者和142例正常人均为血缘上无关的中国男性汉族人,均长期生活于平原地区(长期指的是1年以上)且在到达拉萨(海拔3658m)后取外周血。所有人均没有吸烟史和饮酒史,且都没有与自身免疫相关的疾病(例如白癜风、银屑病、i型糖尿病等),且之前都没有高原旅行史。
[0117]
按照实施例2的方法进行操作。检测受试者基于所述39个snp的基因型。
[0118]
按照实施例3中的多基因风险评分的计算公式计算各个受试者的ps数值。正常人组(142例)的平均ps数值为-3.85,高原肺水肿患者组(166例)的平均ps数值为1.99。
[0119]
按照实施例3中应用模型的步骤,将受试者基于所述39个snp的基因型代入预测模型glm(phenotype~ps),选择predict函数,获取待测者的预测结果(预测结果为高原肺水肿患者或正常人)。
[0120]
对预测结果(预测为高原肺水肿患者或正常人)以及实际表型(实际表型为高原肺水肿患者或正常人)进行拟合。结果显示,auc=0.95,表明模型能够实现极好的预测能力,敏感度为85.2%,特异度为9.0%,阳性预测值和阴性预测值为0.88和0.88。模型准确性指标见表2。混淆矩阵见表3。
[0121]
表2基于39个snps的二分类预测模型准确度(n=308)
[0122]
nauc敏感度特异度阴性预测值阳性预测值390.950.8520.090.880.88
[0123]
表3基于39个snps位点预测高原肺水肿的混淆矩阵(n=308)
[0124][0125]
以上结果说明,39个与高原肺水肿相关的易感基因构成的风险模型,能够较好的实现对疾病的预测。可用于筛查高原肺水肿易感个体、预测人对高原肺水肿的易感性、筛查携带人高原肺水肿易感基因的个体和评价高原肺水肿患病风险。
[0126]
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本技术欲包括任何变更、用途或对本发明的改进,包括脱离了本技术中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1