一种用于结核分枝杆菌分型SNP位点的试剂盒及其应用的制作方法

文档序号:12056626阅读:320来源:国知局

本发明涉及SNP分子标记领域,具体而言,涉及一种用于结核分枝杆菌分型SNP位点的试剂盒及其应用。



背景技术:

结核病(tuberculosis,TB)是伴随人类历史最长的疾病之一,也是全球由单一致病菌导致死亡人数最多的疾病,已经成为全球重大公共卫生问题,结核病的防治工作任重而道远。

结核分枝杆菌(M.tuberculosis),俗称结核杆菌,是引起结核病的病原菌。全球范围内流行的结核分枝杆菌主要被分为6大谱系和少数亚谱系。不同谱系的结核分枝杆菌在毒力、致病力、疫苗效力变化和抗药性等方面有较大差异,因此,有必要对结核分枝杆菌的谱系进行细分。

目前,结核分枝杆菌的分型方法主要有:长序列多态性(LSP)分型、Spoligotyping分型和单核苷酸多态性(SNP)分型。LSP分型是基于结核分枝杆菌基因组中差异区(RD)的缺失而建立的结核分枝杆菌谱系鉴定方法,该方法操作简单,只需普通PCR即可完成,结果易判读,但该方法只能将结核分枝杆菌分成6个大谱系和15个亚谱系,分辨能力不高。Spoligotyping分型是通过检测结核分枝杆菌染色体上DR序列之间的不同间隔序列从而实现结核分枝杆菌的分型,该分型方法也存在分辨率低的缺陷。

SNP分型技术是基于基因组水平上由单个核苷酸变异可引起基因组DNA序列多态性,SNP从全基因组序列中来,其优点是具有更高的分辨率,克服了其他分型方法的同源异质性的缺点,并且SNP更符合结核分枝杆菌的进化规律。目前,国外研究者已筛选SNP位点作为分型靶标,如Francesc Coll等研究发现62个SNP位点可以将结核分枝杆菌一共划分为55个亚谱系,Homolka C等用71个SNP位点将结核分枝杆菌划分为10个亚谱系,但国内并未发现一套成熟的SNP分类靶标应用于结核分枝杆菌中预防和控制的实践中。因此基于结核分枝杆菌全基因组序列数据,发现并筛选出一批具有代表性的SNP位点有助于将结核分枝杆菌分成更多的亚谱系,提高其分辨能力。

有鉴于此,特提出本发明。



技术实现要素:

本发明的第一目的在于提供一种检测结核分枝杆菌SNP位点的试剂盒,该试剂盒包括用于检测结核分枝杆菌的SNP集合的试剂或组件。上述试剂盒能够对结核分枝杆菌的SNP集合进行检测,从而将结核分枝杆菌细分为不同亚型,提高对结核分枝杆菌谱系的分辨能力。

本发明的第二目的在于提供一种上述试剂盒在结核分枝杆菌的分型或进化分析中的应用。上述应用能够提高结核分枝杆菌分型或进化分析的准确性。

本发明的第三目的在于提供一种上述试剂盒在制备用于结核病感染病原体亚型判断的诊断产品中的应用。

本发明的第四目的在于提供一种对结核分枝杆菌进行分型或进化分析的方法,所述方法使用上述试剂盒对结核分枝杆菌的SNP集合进行检测。

为了实现本发明的上述目的,特采用以下技术方案:

本发明提供一种检测结核分枝杆菌SNP位点的试剂盒,所述试剂盒中包括用于检测SNP集合的试剂和/或组件,所述SNP集合包括以下一个或多个SNP位点,所述SNP位点的物理位置是基于结核分枝杆菌H37Rv的全基因组序列比对确定的,所述结核分枝杆菌H37Rv的全基因组序列的Accesion Number为NC_000962.3:

SNP位点1:位于结核分枝杆菌染色体上第107791位,其核苷酸为C/T;

SNP位点2:位于结核分枝杆菌染色体上第108136位,其核苷酸为C/A;

SNP位点3:位于结核分枝杆菌染色体上第108181位,其核苷酸为C/T;

SNP位点4:位于结核分枝杆菌染色体上第109040位,其核苷酸为G/A;

SNP位点5:位于结核分枝杆菌染色体上第110395位,其核苷酸为G/C;

SNP位点6:位于结核分枝杆菌染色体上第111848位,其核苷酸为G/A;

SNP位点7:位于结核分枝杆菌染色体上第112333位,其核苷酸为G/A;

SNP位点8:位于结核分枝杆菌染色体上第112490位,其核苷酸为G/A;

SNP位点9:位于结核分枝杆菌染色体上第112734位,其核苷酸为G/A;

SNP位点10:位于结核分枝杆菌染色体上第113139位,其核苷酸为G/A;

SNP位点11:位于结核分枝杆菌染色体上第114695位,其核苷酸为G/A;

SNP位点12:位于结核分枝杆菌染色体上第116225位,其核苷酸为C/G;

SNP位点13:位于结核分枝杆菌染色体上第154049位,其核苷酸为A/G;

SNP位点14:位于结核分枝杆菌染色体上第200152位,其核苷酸为T/C;

SNP位点15:位于结核分枝杆菌染色体上第200377位,其核苷酸为C/T;

SNP位点16:位于结核分枝杆菌染色体上第200695位,其核苷酸为T/G;

SNP位点17:位于结核分枝杆菌染色体上第201894位,其核苷酸为A/G;

SNP位点18:位于结核分枝杆菌染色体上第204424位,其核苷酸为T/C;

SNP位点19:位于结核分枝杆菌染色体上第204502位,其核苷酸为C/G;

SNP位点20:位于结核分枝杆菌染色体上第207077位,其核苷酸为G/C;

SNP位点21:位于结核分枝杆菌染色体上第207590位,其核苷酸为G/A;

SNP位点22:位于结核分枝杆菌染色体上第208297位,其核苷酸为C/T;

SNP位点23:位于结核分枝杆菌染色体上第258921位,其核苷酸为C/T;

SNP位点24:位于结核分枝杆菌染色体上第259689位,其核苷酸为G/A;

SNP位点25:位于结核分枝杆菌染色体上第301341位,其核苷酸为C/A;

SNP位点26:位于结核分枝杆菌染色体上第392506位,其核苷酸为A/G;

SNP位点27:位于结核分枝杆菌染色体上第451896位,其核苷酸为T/C;

SNP位点28:位于结核分枝杆菌染色体上第452064位,其核苷酸为T/G;

SNP位点29:位于结核分枝杆菌染色体上第500533位,其核苷酸为G/A;

SNP位点30:位于结核分枝杆菌染色体上第501001位,其核苷酸为T/C;

SNP位点31:位于结核分枝杆菌染色体上第516658位,其核苷酸为C/G;

SNP位点32:位于结核分枝杆菌染色体上第580011位,其核苷酸为A/G;

SNP位点33:位于结核分枝杆菌染色体上第643386位,其核苷酸为A/C;

SNP位点34:位于结核分枝杆菌染色体上第643751位,其核苷酸为T/G;

SNP位点35:位于结核分枝杆菌染色体上第644442位,其核苷酸为C/T;

SNP位点36:位于结核分枝杆菌染色体上第644475位,其核苷酸为T/C;

SNP位点37:位于结核分枝杆菌染色体上第646051位,其核苷酸为C/G;

SNP位点38:位于结核分枝杆菌染色体上第646166位,其核苷酸为C/A;

SNP位点39:位于结核分枝杆菌染色体上第646246位,其核苷酸为T/C;

SNP位点40:位于结核分枝杆菌染色体上第732555位,其核苷酸为A/G;

SNP位点41:位于结核分枝杆菌染色体上第738045位,其核苷酸为A/C;

SNP位点42:位于结核分枝杆菌染色体上第752017位,其核苷酸为C/T;

SNP位点43:位于结核分枝杆菌染色体上第752049位,其核苷酸为C/T;

SNP位点44:位于结核分枝杆菌染色体上第770391位,其核苷酸为G/A;

SNP位点45:位于结核分枝杆菌染色体上第962104位,其核苷酸为A/G;

SNP位点46:位于结核分枝杆菌染色体上第962136位,其核苷酸为G/T;

SNP位点47:位于结核分枝杆菌染色体上第1061309位,其核苷酸为G/A;

SNP位点48:位于结核分枝杆菌染色体上第1129169位,其核苷酸为G/A;

SNP位点49:位于结核分枝杆菌染色体上第1143318位,其核苷酸为C/A;

SNP位点50:位于结核分枝杆菌染色体上第1149132位,其核苷酸为C/T;

SNP位点51:位于结核分枝杆菌染色体上第1149551位,其核苷酸为C/T;

SNP位点52:位于结核分枝杆菌染色体上第1150494位,其核苷酸为C/G;

SNP位点53:位于结核分枝杆菌染色体上第1219669位,其核苷酸为G/C;

SNP位点54:位于结核分枝杆菌染色体上第1219828位,其核苷酸为G/T;

SNP位点55:位于结核分枝杆菌染色体上第1225203位,其核苷酸为C/T;

SNP位点56:位于结核分枝杆菌染色体上第1228121位,其核苷酸为A/G;

SNP位点57:位于结核分枝杆菌染色体上第1235550位,其核苷酸为G/T;

SNP位点58:位于结核分枝杆菌染色体上第1271192位,其核苷酸为C/G;

SNP位点59:位于结核分枝杆菌染色体上第1310360位,其核苷酸为G/T;

SNP位点60:位于结核分枝杆菌染色体上第1324571位,其核苷酸为G/A;

SNP位点61:位于结核分枝杆菌染色体上第1324730位,其核苷酸为C/A;

SNP位点62:位于结核分枝杆菌染色体上第1324997位,其核苷酸为C/T;

SNP位点63:位于结核分枝杆菌染色体上第1325171位,其核苷酸为C/T;

SNP位点64:位于结核分枝杆菌染色体上第1326802位,其核苷酸为T/G;

SNP位点65:位于结核分枝杆菌染色体上第1347179位,其核苷酸为C/T;

SNP位点66:位于结核分枝杆菌染色体上第1377574位,其核苷酸为A/G;

SNP位点67:位于结核分枝杆菌染色体上第1378731位,其核苷酸为T/C;

SNP位点68:位于结核分枝杆菌染色体上第1386928位,其核苷酸为C/T;

SNP位点69:位于结核分枝杆菌染色体上第1386970位,其核苷酸为C/T;

SNP位点70:位于结核分枝杆菌染色体上第1421046位,其核苷酸为C/G;

SNP位点71:位于结核分枝杆菌染色体上第1421115位,其核苷酸为A/G;

SNP位点72:位于结核分枝杆菌染色体上第1421314位,其核苷酸为T/G;

SNP位点73:位于结核分枝杆菌染色体上第1460672位,其核苷酸为C/T;

SNP位点74:位于结核分枝杆菌染色体上第1486653位,其核苷酸为G/C;

SNP位点75:位于结核分枝杆菌染色体上第1494800位,其核苷酸为C/T;

SNP位点76:位于结核分枝杆菌染色体上第1495332位,其核苷酸为A/G;

SNP位点77:位于结核分枝杆菌染色体上第1501474位,其核苷酸为G/C;

SNP位点78:位于结核分枝杆菌染色体上第1502126位,其核苷酸为C/A;

SNP位点79:位于结核分枝杆菌染色体上第1502348位,其核苷酸为T/G;

SNP位点80:位于结核分枝杆菌染色体上第1505476位,其核苷酸为C/G;

SNP位点81:位于结核分枝杆菌染色体上第1505812位,其核苷酸为C/T;

SNP位点82:位于结核分枝杆菌染色体上第1510163位,其核苷酸为G/A;

SNP位点83:位于结核分枝杆菌染色体上第1581733位,其核苷酸为G/A;

SNP位点84:位于结核分枝杆菌染色体上第1586540位,其核苷酸为C/A;

SNP位点85:位于结核分枝杆菌染色体上第1587020位,其核苷酸为A/G;

SNP位点86:位于结核分枝杆菌染色体上第1588462位,其核苷酸为A/G;

SNP位点87:位于结核分枝杆菌染色体上第1597411位,其核苷酸为G/A;

SNP位点88:位于结核分枝杆菌染色体上第1656977位,其核苷酸为G/T;

SNP位点89:位于结核分枝杆菌染色体上第1658036位,其核苷酸为C/T;

SNP位点90:位于结核分枝杆菌染色体上第1706040位,其核苷酸为A/G;

SNP位点91:位于结核分枝杆菌染色体上第1719328位,其核苷酸为G/A;

SNP位点92:位于结核分枝杆菌染色体上第1719685位,其核苷酸为T/C;

SNP位点93:位于结核分枝杆菌染色体上第1719829位,其核苷酸为A/G;

SNP位点94:位于结核分枝杆菌染色体上第1776441位,其核苷酸为G/C;

SNP位点95:位于结核分枝杆菌染色体上第1790486位,其核苷酸为C/G;

SNP位点96:位于结核分枝杆菌染色体上第1791511位,其核苷酸为C/T;

SNP位点97:位于结核分枝杆菌染色体上第1793509位,其核苷酸为G/A;

SNP位点98:位于结核分枝杆菌染色体上第1849198位,其核苷酸为T/C;

SNP位点99:位于结核分枝杆菌染色体上第1850089位,其核苷酸为T/C;

SNP位点100:位于结核分枝杆菌染色体上第1851055位,其核苷酸为A/C;

SNP位点101:位于结核分枝杆菌染色体上第1867845位,其核苷酸为G/A;

SNP位点102:位于结核分枝杆菌染色体上第1919743位,其核苷酸为T/G;

SNP位点103:位于结核分枝杆菌染色体上第1919952位,其核苷酸为C/T;

SNP位点104:位于结核分枝杆菌染色体上第2066477位,其核苷酸为G/A;

SNP位点105:位于结核分枝杆菌染色体上第2066478位,其核苷酸为T/C;

SNP位点106:位于结核分枝杆菌染色体上第2067686位,其核苷酸为C/T;

SNP位点107:位于结核分枝杆菌染色体上第2095241位,其核苷酸为C/A;

SNP位点108:位于结核分枝杆菌染色体上第2095536位,其核苷酸为G/A;

SNP位点109:位于结核分枝杆菌染色体上第2183228位,其核苷酸为G/A;

SNP位点110:位于结核分枝杆菌染色体上第2192357位,其核苷酸为C/T;

SNP位点111:位于结核分枝杆菌染色体上第2192591位,其核苷酸为G/A;

SNP位点112:位于结核分枝杆菌染色体上第2202589位,其核苷酸为G/T;

SNP位点113:位于结核分枝杆菌染色体上第2202946位,其核苷酸为A/C;

SNP位点114:位于结核分枝杆菌染色体上第2283874位,其核苷酸为A/C;

SNP位点115:位于结核分枝杆菌染色体上第2294813位,其核苷酸为G/A;

SNP位点116:位于结核分枝杆菌染色体上第2295025位,其核苷酸为T/G;

SNP位点117:位于结核分枝杆菌染色体上第2295037位,其核苷酸为T/G;

SNP位点118:位于结核分枝杆菌染色体上第2295046位,其核苷酸为T/A;

SNP位点119:位于结核分枝杆菌染色体上第2295050位,其核苷酸为A/G;

SNP位点120:位于结核分枝杆菌染色体上第2296751位,其核苷酸为C/T;

SNP位点121:位于结核分枝杆菌染色体上第2298201位,其核苷酸为C/T;

SNP位点122:位于结核分枝杆菌染色体上第2300672位,其核苷酸为G/A;

SNP位点123:位于结核分枝杆菌染色体上第2300950位,其核苷酸为T/C;

SNP位点124:位于结核分枝杆菌染色体上第2303765位,其核苷酸为T/C;

SNP位点125:位于结核分枝杆菌染色体上第2304076位,其核苷酸为C/A;

SNP位点126:位于结核分枝杆菌染色体上第2329272位,其核苷酸为C/T;

SNP位点127:位于结核分枝杆菌染色体上第2329474位,其核苷酸为C/T;

SNP位点128:位于结核分枝杆菌染色体上第2371795位,其核苷酸为G/T;

SNP位点129:位于结核分枝杆菌染色体上第2371796位,其核苷酸为A/G;

SNP位点130:位于结核分枝杆菌染色体上第2462421位,其核苷酸为C/T;

SNP位点131:位于结核分枝杆菌染色体上第2496838位,其核苷酸为G/A;

SNP位点132:位于结核分枝杆菌染色体上第2505093位,其核苷酸为G/A;

SNP位点133:位于结核分枝杆菌染色体上第2512762位,其核苷酸为C/A;

SNP位点134:位于结核分枝杆菌染色体上第2514875位,其核苷酸为G/A;

SNP位点135:位于结核分枝杆菌染色体上第2527686位,其核苷酸为G/A;

SNP位点136:位于结核分枝杆菌染色体上第2547004位,其核苷酸为G/T;

SNP位点137:位于结核分枝杆菌染色体上第2547251位,其核苷酸为T/C;

SNP位点138:位于结核分枝杆菌染色体上第2549266位,其核苷酸为G/A;

SNP位点139:位于结核分枝杆菌染色体上第2549313位,其核苷酸为A/C;

SNP位点140:位于结核分枝杆菌染色体上第2549735位,其核苷酸为T/G;

SNP位点141:位于结核分枝杆菌染色体上第2610132位,其核苷酸为A/G;

SNP位点142:位于结核分枝杆菌染色体上第2610354位,其核苷酸为G/C;

SNP位点143:位于结核分枝杆菌染色体上第2654653位,其核苷酸为C/T;

SNP位点144:位于结核分枝杆菌染色体上第2654706位,其核苷酸为G/A;

SNP位点145:位于结核分枝杆菌染色体上第2672399位,其核苷酸为T/C;

SNP位点146:位于结核分枝杆菌染色体上第2672617位,其核苷酸为G/A;

SNP位点147:位于结核分枝杆菌染色体上第2672916位,其核苷酸为G/A;

SNP位点148:位于结核分枝杆菌染色体上第2673609位,其核苷酸为G/A;

SNP位点149:位于结核分枝杆菌染色体上第2673711位,其核苷酸为C/T;

SNP位点150:位于结核分枝杆菌染色体上第2673858位,其核苷酸为C/A;

SNP位点151:位于结核分枝杆菌染色体上第2681585位,其核苷酸为G/A;

SNP位点152:位于结核分枝杆菌染色体上第2682603位,其核苷酸为C/T;

SNP位点153:位于结核分枝杆菌染色体上第2775550位,其核苷酸为G/A;

SNP位点154:位于结核分枝杆菌染色体上第2789351位,其核苷酸为A/C;

SNP位点155:位于结核分枝杆菌染色体上第2789808位,其核苷酸为G/T;

SNP位点156:位于结核分枝杆菌染色体上第2789851位,其核苷酸为G/A;

SNP位点157:位于结核分枝杆菌染色体上第2790588位,其核苷酸为G/A;

SNP位点158:位于结核分枝杆菌染色体上第2810392位,其核苷酸为C/T;

SNP位点159:位于结核分枝杆菌染色体上第2810826位,其核苷酸为T/C;

SNP位点160:位于结核分枝杆菌染色体上第2817168位,其核苷酸为C/A;

SNP位点161:位于结核分枝杆菌染色体上第2818256位,其核苷酸为C/T;

SNP位点162:位于结核分枝杆菌染色体上第2859840位,其核苷酸为C/T;

SNP位点163:位于结核分枝杆菌染色体上第2860223位,其核苷酸为G/A;

SNP位点164:位于结核分枝杆菌染色体上第2860313位,其核苷酸为G/A;

SNP位点165:位于结核分枝杆菌染色体上第2872966位,其核苷酸为G/A;

SNP位点166:位于结核分枝杆菌染色体上第2884007位,其核苷酸为A/G;

SNP位点167:位于结核分枝杆菌染色体上第2996922位,其核苷酸为C/T;

SNP位点168:位于结核分枝杆菌染色体上第2997335位,其核苷酸为C/T;

SNP位点169:位于结核分枝杆菌染色体上第3012844位,其核苷酸为C/A;

SNP位点170:位于结核分枝杆菌染色体上第3016914位,其核苷酸为C/T;

SNP位点171:位于结核分枝杆菌染色体上第3016953位,其核苷酸为G/C;

SNP位点172:位于结核分枝杆菌染色体上第3017144位,其核苷酸为G/T;

SNP位点173:位于结核分枝杆菌染色体上第3017286位,其核苷酸为A/G;

SNP位点174:位于结核分枝杆菌染色体上第3050372位,其核苷酸为C/A;

SNP位点175:位于结核分枝杆菌染色体上第3051081位,其核苷酸为G/A;

SNP位点176:位于结核分枝杆菌染色体上第3118829位,其核苷酸为C/T;

SNP位点177:位于结核分枝杆菌染色体上第3118986位,其核苷酸为C/G;

SNP位点178:位于结核分枝杆菌染色体上第3151823位,其核苷酸为G/A;

SNP位点179:位于结核分枝杆菌染色体上第3152267位,其核苷酸为C/T;

SNP位点180:位于结核分枝杆菌染色体上第3152431位,其核苷酸为T/C;

SNP位点181:位于结核分枝杆菌染色体上第3169022位,其核苷酸为C/T;

SNP位点182:位于结核分枝杆菌染色体上第3194244位,其核苷酸为G/A;

SNP位点183:位于结核分枝杆菌染色体上第3219800位,其核苷酸为G/A;

SNP位点184:位于结核分枝杆菌染色体上第3285955位,其核苷酸为C/G;

SNP位点185:位于结核分枝杆菌染色体上第3286799位,其核苷酸为G/A;

SNP位点186:位于结核分枝杆菌染色体上第3332286位,其核苷酸为G/C;

SNP位点187:位于结核分枝杆菌染色体上第3332665位,其核苷酸为C/T;

SNP位点188:位于结核分枝杆菌染色体上第3336871位,其核苷酸为C/T;

SNP位点189:位于结核分枝杆菌染色体上第3401962位,其核苷酸为G/C;

SNP位点190:位于结核分枝杆菌染色体上第3402521位,其核苷酸为C/T;

SNP位点191:位于结核分枝杆菌染色体上第3423423位,其核苷酸为G/A;

SNP位点192:位于结核分枝杆菌染色体上第3423655位,其核苷酸为G/A;

SNP位点193:位于结核分枝杆菌染色体上第3424459位,其核苷酸为C/T;

SNP位点194:位于结核分枝杆菌染色体上第3424865位,其核苷酸为C/A;

SNP位点195:位于结核分枝杆菌染色体上第3453393位,其核苷酸为A/G;

SNP位点196:位于结核分枝杆菌染色体上第3471148位,其核苷酸为G/A;

SNP位点197:位于结核分枝杆菌染色体上第3536291位,其核苷酸为T/C;

SNP位点198:位于结核分枝杆菌染色体上第3536836位,其核苷酸为G/A;

SNP位点199:位于结核分枝杆菌染色体上第3537013位,其核苷酸为G/A;

SNP位点200:位于结核分枝杆菌染色体上第3606624位,其核苷酸为G/A;

SNP位点201:位于结核分枝杆菌染色体上第3612568位,其核苷酸为G/A;

SNP位点202:位于结核分枝杆菌染色体上第3626906位,其核苷酸为G/A;

SNP位点203:位于结核分枝杆菌染色体上第3651143位,其核苷酸为C/T;

SNP位点204:位于结核分枝杆菌染色体上第3664476位,其核苷酸为C/T;

SNP位点205:位于结核分枝杆菌染色体上第3722442位,其核苷酸为C/T;

SNP位点206:位于结核分枝杆菌染色体上第3786035位,其核苷酸为C/A;

SNP位点207:位于结核分枝杆菌染色体上第3786186位,其核苷酸为C/G;

SNP位点208:位于结核分枝杆菌染色体上第3817476位,其核苷酸为C/A;

SNP位点209:位于结核分枝杆菌染色体上第3817994位,其核苷酸为C/T;

SNP位点210:位于结核分枝杆菌染色体上第3913600位,其核苷酸为C/T;

SNP位点211:位于结核分枝杆菌染色体上第3921273位,其核苷酸为C/T;

SNP位点212:位于结核分枝杆菌染色体上第3959715位,其核苷酸为G/A;

SNP位点213:位于结核分枝杆菌染色体上第3973331位,其核苷酸为C/G;

SNP位点214:位于结核分枝杆菌染色体上第3979502位,其核苷酸为C/T;

SNP位点215:位于结核分枝杆菌染色体上第3980169位,其核苷酸为C/G;

SNP位点216:位于结核分枝杆菌染色体上第3980398位,其核苷酸为G/C;

SNP位点217:位于结核分枝杆菌染色体上第3981350位,其核苷酸为T/G;

SNP位点218:位于结核分枝杆菌染色体上第3981601位,其核苷酸为G/A;

SNP位点219:位于结核分枝杆菌染色体上第3984549位,其核苷酸为A/G;

SNP位点220:位于结核分枝杆菌染色体上第3985105位,其核苷酸为G/A;

SNP位点221:位于结核分枝杆菌染色体上第3996273位,其核苷酸为G/T;

SNP位点222:位于结核分枝杆菌染色体上第3996826位,其核苷酸为G/C;

SNP位点223:位于结核分枝杆菌染色体上第4016684位,其核苷酸为G/A;

SNP位点224:位于结核分枝杆菌染色体上第4030438位,其核苷酸为A/G;

SNP位点225:位于结核分枝杆菌染色体上第4054217位,其核苷酸为C/T;

SNP位点226:位于结核分枝杆菌染色体上第4054902位,其核苷酸为G/T;

SNP位点227:位于结核分枝杆菌染色体上第4056097位,其核苷酸为A/G;

SNP位点228:位于结核分枝杆菌染色体上第4056172位,其核苷酸为G/A;

SNP位点229:位于结核分枝杆菌染色体上第4070666位,其核苷酸为G/T;

SNP位点230:位于结核分枝杆菌染色体上第4090261位,其核苷酸为C/T;

SNP位点231:位于结核分枝杆菌染色体上第4090846位,其核苷酸为G/A;

SNP位点232:位于结核分枝杆菌染色体上第4092848位,其核苷酸为G/A;

SNP位点233:位于结核分枝杆菌染色体上第4095906位,其核苷酸为C/G;

SNP位点234:位于结核分枝杆菌染色体上第4125161位,其核苷酸为C/T;

SNP位点235:位于结核分枝杆菌染色体上第4139309位,其核苷酸为C/T;

SNP位点236:位于结核分枝杆菌染色体上第4168881位,其核苷酸为A/G;

SNP位点237:位于结核分枝杆菌染色体上第4168949位,其核苷酸为C/T;

SNP位点238:位于结核分枝杆菌染色体上第4201713位,其核苷酸为C/T;

SNP位点239:位于结核分枝杆菌染色体上第4243424位,其核苷酸为G/T;

SNP位点240:位于结核分枝杆菌染色体上第4243509位,其核苷酸为G/T;

SNP位点241:位于结核分枝杆菌染色体上第4243638位,其核苷酸为C/T;

SNP位点242:位于结核分枝杆菌染色体上第4244433位,其核苷酸为T/G;

SNP位点243:位于结核分枝杆菌染色体上第4244598位,其核苷酸为G/C;

SNP位点244:位于结核分枝杆菌染色体上第4244813位,其核苷酸为T/C;

SNP位点245:位于结核分枝杆菌染色体上第4245203位,其核苷酸为A/G;

SNP位点246:位于结核分枝杆菌染色体上第4245233位,其核苷酸为C/A;

SNP位点247:位于结核分枝杆菌染色体上第4245325位,其核苷酸为C/T;

SNP位点248:位于结核分枝杆菌染色体上第4246500位,其核苷酸为C/A;

SNP位点249:位于结核分枝杆菌染色体上第4267450位,其核苷酸为T/C;

SNP位点250:位于结核分枝杆菌染色体上第4267825位,其核苷酸为T/C;

SNP位点251:位于结核分枝杆菌染色体上第4268036位,其核苷酸为T/C;

SNP位点252:位于结核分枝杆菌染色体上第4268751位,其核苷酸为C/T;

SNP位点253:位于结核分枝杆菌染色体上第4273752位,其核苷酸为T/G;

SNP位点254:位于结核分枝杆菌染色体上第4274020位,其核苷酸为A/C;

SNP位点255:位于结核分枝杆菌染色体上第4327554位,其核苷酸为G/C;

SNP位点256:位于结核分枝杆菌染色体上第4340528位,其核苷酸为C/A;

SNP位点257:位于结核分枝杆菌染色体上第4340731位,其核苷酸为A/G;

SNP位点258:位于结核分枝杆菌染色体上第4343857位,其核苷酸为C/T;

SNP位点259:位于结核分枝杆菌染色体上第4344236位,其核苷酸为T/C;

SNP位点260:位于结核分枝杆菌染色体上第4345214位,其核苷酸为A/C;

SNP位点261:位于结核分枝杆菌染色体上第4345215位,其核苷酸为C/T;

SNP位点262:位于结核分枝杆菌染色体上第4345598位,其核苷酸为G/T;

SNP位点263:位于结核分枝杆菌染色体上第4347515位,其核苷酸为C/A;

SNP位点264:位于结核分枝杆菌染色体上第4347938位,其核苷酸为A/C;

SNP位点265:位于结核分枝杆菌染色体上第4348596位,其核苷酸为G/A;

SNP位点266:位于结核分枝杆菌染色体上第4349307位,其核苷酸为C/T;

SNP位点267:位于结核分枝杆菌染色体上第4354191位,其核苷酸为G/A;

SNP位点268:位于结核分枝杆菌染色体上第4355319位,其核苷酸为A/C;

SNP位点269:位于结核分枝杆菌染色体上第4355324位,其核苷酸为A/C;

SNP位点270:位于结核分枝杆菌染色体上第4355393位,其核苷酸为T/G;

SNP位点271:位于结核分枝杆菌染色体上第4355616位,其核苷酸为T/C;

SNP位点272:位于结核分枝杆菌染色体上第4362057位,其核苷酸为T/C;

SNP位点273:位于结核分枝杆菌染色体上第4362473位,其核苷酸为A/G;

SNP位点274:位于结核分枝杆菌染色体上第4362562位,其核苷酸为C/G;

SNP位点275:位于结核分枝杆菌染色体上第4362656位,其核苷酸为G/A;

SNP位点276:位于结核分枝杆菌染色体上第4362746位,其核苷酸为T/G;

SNP位点277:位于结核分枝杆菌染色体上第4363247位,其核苷酸为T/C;

SNP位点278:位于结核分枝杆菌染色体上第4363345位,其核苷酸为G/T;

SNP位点279:位于结核分枝杆菌染色体上第4396673位,其核苷酸为C/A;

SNP位点280:位于结核分枝杆菌染色体上第4397307位,其核苷酸为G/T;

SNP位点281:位于结核分枝杆菌染色体上第4398213位,其核苷酸为T/C;

SNP位点282:位于结核分枝杆菌染色体上第4398910位,其核苷酸为G/A;

SNP位点283:位于结核分枝杆菌染色体上第4399563位,其核苷酸为C/T;

SNP位点284:位于结核分枝杆菌染色体上第4399600位,其核苷酸为G/A;

SNP位点285:位于结核分枝杆菌染色体上第4400036位,其核苷酸为G/C。

本发明上述试剂盒能够对包括选自SNP位点1~285的SNP集合进行检测。本发明所述SNP位点1~285是在2372个结核分枝杆菌的全基因组数据的基础上进行比对获得,并在构建结核分枝杆菌的进化树后通过设置Fst系数筛选出最能代表结核分枝杆菌进化树上每一分枝的SNP位点以及进一步筛选出关键基因的同义突变而获得的SNP集合。因此,上述SNP位点极好地表征了结核分枝杆菌的谱系信息以及关键基因的突变信息。本发明所述试剂盒能够对结核分枝杆菌的上述SNP位点进行检测,提供上述信息,对结核分枝杆菌的分型或进化分析具有重要意义。

在一些实施方式中,上述SNP集合包括50~285个上述SNP位点,或100~285个上述SNP位点,或200~285个上述SNP位点,或250~285个上述SNP位点。

本发明上述实施方式对SNP集合中所包括的SNP位点的个数进行优选,经过优选的SNP集合能够更好地对结核分枝杆菌进行分型和进化分析。

在一些实施方式中,上述SNP集合包括285个上述SNP位点。

本发明用于筛选SNP位点的数据样本来自2372个结核分枝杆菌的全基因组序列,涵盖了现阶段已发现并测序的大部分结核分枝杆菌菌株,样本量远大于现有技术在筛选表征结核分枝杆菌谱系的SNP位点时所选取的样本,因此,本发明所述包括SNP位点1~285的SNP集合能够更全面地反映结核分枝杆菌在分型或进化上的整体情况。其次,本发明上述SNP集合通过构建进化树能够将结核分枝杆菌细分为7个大谱系和67个亚谱系以及M.bovis谱系及其亚谱系M.bovis1,较之现有SNP位点将结核分枝杆菌划分为10个或55个亚谱系而言,进一步提高了分辨能力,其分辨能力与优化前的106583个SNP位点集合的分辨能力基本相当,本发明上述SNP集合既保证了分辨率额,又减少了需要检测的SNP位点数量,在二者之间取得平衡。并且,采用本发明上述285个SNP位点对单个结核分枝杆菌进行分型,准确率高,能够将单个结核分枝杆菌细分到具体的亚谱系。

在一些实施方式中,上述用于检测SNP集合的试剂和/或组件包括PCR引物、分子探针、生物传感器和芯片中的一种或多种。

本发明还涉及一种上述试剂盒在结核分枝杆菌的分型或进化分析中的应用。

本发明还涉及一种上述试剂盒在制备用于结核病感染病原体亚型判断的诊断产品中的应用。

本发明还涉及一种对结核分枝杆菌进行分型或进化分析的方法,所述方法使用上述试剂盒对结核分枝杆菌的SNP位点进行检测。

在一些实施方式中,检测所述SNP位点的方法包括以下一种或几种:基于凝胶电泳的SNP检测法、DNA测序法、DNA芯片法、变性高效液相色谱法或质谱检测法。

在一些实施方式中,所述基于凝胶电泳的SNP检测法包括单链构象多态性检测法、变性梯度凝胶电泳检测法、酶切扩增多态性序列检测法和等位基因特异性PCR检测法中的一种或几种。

在一些实施方式中,所述质谱检测法包括基质辅助激光解吸附电离飞行时间质谱(MALDI-TOF)检测法。

与现有技术相比,本发明的有益效果为:

1)、本发明试剂盒、应用和方法中所涉及的SNP位点1~285是从2372个结核分枝杆菌的基因组序列中得到、并经过遗传分化系数(Fst)和结核分枝杆菌的236个关键基因筛选之后获得的SNP位点,是表征结核分枝杆菌各谱系或亚谱系且与结核分枝杆菌的功能密切相关的关键SNP位点,因此,检测上述SNP位点对结核分枝杆菌的分型和进化分析具有重要意义。

2)、本发明试剂盒、应用和方法中所涉及的SNP位点1~285能够将2372个结核分枝杆菌细分为7个大谱系和67个亚谱系,M.bovis谱系及其亚谱系M.bovis1,分辨率远远高于现有SNP位点对结核分枝杆菌的分型(62个SNP位点将结核分枝杆菌划分为55个亚谱系,或71个SNP位点将结核分枝杆菌划分为10个亚谱系);上述SNP位点1~285的分辨能力与本发明实施例中未经优化的106583个SNP位点(将结核分枝杆菌细分为7个大谱系和69个亚谱系,以及M.bovis谱系及其亚谱系M.bovis1)基本相当,但所需要用到的SNP位点数量却大大下降,在分辨率和所需检测的SNP位点数量上取得平衡。

3)、本发明试剂盒、应用和方法中所涉及的SNP位点1~285在对单个结核分枝杆菌进行分型时,其分型准确率高,能够将结核分枝杆菌准确地细分到具体的亚谱系。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为用优化前的SNP集合构建的进化树。

具体实施方式

下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。

实施例1、

按以下步骤在结核分枝杆菌的全基因组范围筛选SNP位点:

1、菌株数据下载

从NCBI数据库中下载全球代表性2726株结核分枝杆菌全基因组数据。

2、对菌株测序数据进行质量评估

采用FastQC(version 0.10.1)软件对菌株测序fastq文件GC含量进行质检评估:(1)去除GC含量小于60%或大于70%测序数据;(2)去除SNP miss call大于15%的菌株测序数据。最终2372株结核分枝杆菌测序数据纳入本研究。

3、统计回帖率

采用BWA(version 0.7.12)软件将菌株的测序文件回帖到结核分枝杆菌参考基因组H37rv(NC_000962.3)上,对菌株回帖率进行统计。

4、SNP Calling

将菌株的测序文件回帖到结核杆菌参考基因组H37Rv上进行序列比对,将比对后的序列采用samtools v 1.3和picard-tools v 1.112工具对生成的Sam文件进行Bam转换、排序以及去重处理。采用变异鉴定软件Varscan v2.4.0根据经过处理得到的Bam文件进行SNP鉴定,将基因组比对质量小于30或者碱基质量小于27的SNP位点舍去。

为提高SNP位点可信度,降低假阳性,对SNP位点按照下列标准进一步进行过滤:(1)选取最小等位基因突变频率大于于75%且有大于20条reads支持该位点的SNP位点;(2)去除分布在结核分枝杆菌PE/PPE家族SNP位点。

最终,从2372个测序菌株中得到106583个SNP位点。

实施例2、

按照以下步骤构建结核分枝杆菌的进化树:

1、样本过滤

将GC含量小于60%或大于70%的菌株舍弃,回帖率小于85%的菌株舍弃,将SNP miss call大于15%的菌株舍去。过滤后得到样本集合。

2、利用SNP位点构建系统进化树:根据实施例1获得的106583个SNP位点,以M.canettii(NC_019950.1)菌株为外群菌株,用RAxML(version 8.2.8)软件采用极大似然法对过滤后的菌株样本进行进化树的构建,选用Bootstrap value大于95%的分枝对进化树进行谱系分群,最终得到7个谱系包含69个亚型以及M.bovis谱系包含1个亚型,共计78个分枝(系统进化树见图1)。具体而言,利用上述SNP位点将结核分枝杆菌细分为以下谱系:

谱系1及其亚谱系1.1,1.2,1.1.1,1.1.2,1.1.2.1,1.2.1,1.2.2,1.2.3,1.2.3.1,1.2.3.2(共10个亚谱系);

谱系2及其亚谱系2.1,2.2,2.2.1,2.2.2(共4个亚谱系);

谱系3及其亚谱系3.1,3.2(共2个亚谱系);

谱系4及其亚谱系4.1,4.1.1,4.1.1.1,4.1.1.2,4.1.2,4.1.2.1,4.1.2.1.1,4.1.2.1.2,4.1.2.1.3,4.1.2.1.4,4.1.2.2,4.2,4.2.1,4.2.1.1,4.2.1.2,4.2.1.3,4.2.2,4.2.2.1,4.3,4.3.1,4.3.1.1,4.3.2,4.3.2.1,4.4,4.4.1,4.5,4.6,4.6.1,4.6.1.1,4.6.2,4.7,4.7.1,4.7.2,4.7.2.1,4.7.2.2,4.8,4.8.1,4.8.2,4.9,4.10,4.10.1,4.10.1.1,4.10.1.2,4.10.2,4.10.2.1,4.10.2.2,4.11,4.11.1,4.12,4.12.1,4.12.2,4.12.3,4.13(共53个亚谱系);

谱系5;

谱系6;

谱系7;

M.bovis谱系及其亚谱系M.bovis1。

根据文献中报道的19个RDs以及spoligotyping对下载的结核分枝杆菌进行注释和粗略分型。将前述SNP分型结果与LSP和spoligotyping粗略分型的结果进行比对,发现二者的重合性好,从侧面印证上述SNP位点的分型效果。

实施例3、

优化SNP集合并评估其分型效果

1、获得各分枝相关SNP集合

根据每个分枝,将分枝内菌株和剩余菌株分别作为一个群体,采用Genepop(version4.5.1)软件计算每个SNP位点的遗传分化系数(Fst),选用Fst大于0.99的SNP位点作为谱系相关SNP位点。

2、关键基因同义突变SNP集合获得

选取文献报道的结核分枝杆菌236个关键基因上的同义突变SNP位点作为最终集合,将分枝相关SNP位点用snpEff(version 4.3c)软件进行注释,然后选取关键基因上的同义突变SNP位点,作为最终集合。经过筛选得到位于关键基因上的285个谱系相关的同义SNP位点。该285个谱系相关的SNP位点的相关信息如下所示,其中SNP位点的物理位置是基于结核分枝杆菌H37Rv的全基因组序列比对确定的,所述结核分枝杆菌H37Rv的全基因组序列的Accession Number为NC_000962.3:

3、SNP集合优化前后分型比对

将经过优化后的285个SNP位点构建进化树,与SNP集合优化前(即106583个SNP位点)的分型效果进行比对。优化前,利用106583个SNP位点能够将结核分枝杆菌分为7大谱系和69个亚谱系,M.bovis谱系及亚谱系M.bovis1,而优化之后,285个SNP位点能够将结核分枝杆菌分为7个大谱系和67个亚谱系(与优化前的SNP集合相比,优化后的SNP集合不能细分的亚谱系是2.2.2和3.1),M.bovis谱系及其亚谱系M.bovis1。由此可见,优化后的SNP集合中的SNP位点远远少于优化前的SNP集合,但其仍具有极高的分型能力,与优化前SNP集合基本相当。

4、SNP集合分型效果评估

从NCBI数据库下载22株已知分型类型的结核分枝杆菌的完整参考基因组,根据最终得到的285个SNP集合对这些菌株进行分型(参见表1),285个SNP集合对完整参考基因组的分型结果与参考文献一致。

表1已知参考菌株基因组注释

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1