用于确定UGT1A基因的基因型的htSNP及其用于多重基因分型的方法

文档序号:397765阅读:403来源:国知局
专利名称:用于确定UGT1A基因的基因型的htSNP及其用于多重基因分型的方法
技术领域
本发明的设备和方法涉及用于确定细胞色素P450认2、2々6和206、?)0 和皿 -葡萄糖醛酸基转移酶IA基因的基因型的单倍型标签单核苷酸多态性(htSNP)和基因芯片,更具体而言,涉及用于确定人类CYP1A2、CYP2A6、CYP2D6、NR1I2( = PXR)和UGTlA基因的单倍型的htSNP的选择方法、确定所述基因的基因型的方法和用于所述方法的基因芯片。
背景技术
出于遗传多样性的原因,个体对药物的毒性和效果会有不同反应。因此,在药物的初始开发阶段考虑重要药用蛋白相对于遗传多样性的效果是必要的,因为这可以降低药物开发的可能性失败。单倍型是决定个体之间的遗传多样性的因素之一。单倍型指的是在单个研究种群中每个基因序列的多态性的组合。单倍型比个体多态性提供了更准确和更可靠的关于遗传多样性的信息。人类细胞色素P450是血红蛋白的一部分,血红蛋白协助氧化外来化学物质如药物、致癌物质和毒素以及内部物质如胆固醇、脂肪酸和维生素(Nelson等, Pharmacogenetics 6 :1-42,1996) 在肝、肾、小肠和肺中发现了细胞色素P450的各种亚科。人类细胞色素P450 1A2 (下文称CYP1A2)基因以及CYPlAl和CYPlBl都是CYPl 基因群中包含的药物代谢酶。CYP1A2主要在肝脏中产生,并占细胞色素酶总量的15%。 CYP1A2参与重要医用药物如咖啡因、氯氮平(clozapine)、丙咪嗪(imiparamine)和普萘洛尔(propranolol)的代谢。另外,CYP1A2催化内部合成物质(如17 β-雌二醇、尿卟啉原III),以及致癌物质的生物活化(如多环芳烃的环氧化和芳香胺/杂环胺的N-羟基化)(Brosen K. , Clinical Pharmacokinetic, 1995, 29 (suppll) :20-25 ;Josephy PD., Environ. Mol. Mutagen, 2001, 38 :12-18)。人类细胞色素 P4502A6(下文称 CYP2A6)基因位于19号染色体上,而具有非常相似的基因序列的伪基因CYP2A7处于CYP2A6基因之上。 CYP2A6酶是一种将尼古丁转化为可替宁(cotinine)的主要酶,且CYP2A6酶参与大约80% 的尼古丁代谢。CYP2A6酶将抗癌药物替加氟(tegafur)转化为体内活性药物5-氟尿嘧啶(5-FU)。所述酶主要由肝脏产生,并且在诸如肺、大肠、乳腺、肾和子宫等器官中少量表达(Drus Metab Dispos. ,29(2) :91-5,2001 ;Adv DrugDeliv Rev. , 18 ;54(10) :1245-56, 2002)。人类细胞色素P4502D6(下文称CYP2D6)基因位于22号染色体上,而伪基因CYP2D7和CYP2D8处于CYP2D6基因的一端。已知由所述基因编码的酶负责100种以上的重要临床药物(包括精神活性药物、心血管药物、吗啡药物等)的代谢。由所述CYP2D6基因编码的酶主要由肝脏产生。尽管所述酶占细胞色素P450酶总量的大约2%,它们却是参与30%的药物代谢的主要酶类。所述酶在个体中的活性各异,并根据其活性级别被划分为PM(弱代谢剂)、IM(中等代谢剂)、EM(强代谢剂)和UM(超快代谢剂)。所述基因的遗传多态性部分地造成了所述酶的不同活性。众所周知,CYP1A2基因展现了遗传多态性。到目前为止,在所述CYP1A2 基因的启动子、外显子和内含子中发现了 M种以上的变异体。到2007年6月为止,已有36 种单倍型(遗传变异体的组合)(http//www. cypalleles. kise/cypla2. htm)、δ0种CYP2A6 的基因型(http://www. cypalleles. kise. cyp2a6. htm)以及大约 80 种 CYP2D6 基因的遗传多态性(www. immi. ki. se. cypalleles/cyp2d6. htm),它们在物种之间有极大的差异。由于各种类型的基因变异体和单倍型已经被报道过,因此有必要通过最小的单核苷酸多态性 (SNP)确定准确的单倍型从而增强时间和成本有效性。在各种药物被人体吸收并排出以前,代谢和转运将一直进行。细胞色素P450 (CYP) 和药物转运蛋白参与代谢和转运。对参与药物代谢的CYP酶的研究一直在积极地进行。目前,15 种 CYP 酶,尤其是 CYP2D6、CYP2C9、CYP3A4、CYP2B6、MDRl 和 CYP2C19,已被报道具有遗传多态性。所述遗传多态性是影响所述酶的药物底物的临床效果、治疗效果和副作用的主要因素。一些遗传变异体造成酶的沉积而根本不能代谢药物。其它遗传变异体使酶活性部分地降低。例如,诸如CYP2D6和CYP2C9等酶根据所述遗传变异体的不同而在表型上不同,且基因型和表型之间具有相对较高的相似性。同时,很难根据功能性遗传变异体的存在与否来预测CYP3A4、CYP2B6和MDRl基因的表型。就人类而言,代谢50%的所有服用药物的CYP3A4在个体之间显示出极大的活性差异。已知CYP2B6在个体之间表现出最大270倍的差异。尽管个体差异如此之大,个体之间的活性差异仍很难直接从基因型来预测,因为基因型和表型之间具有低相关性的药物代谢酶或药物转运蛋白的蛋白表达根据外部因素的不同而出现极大的不同。对于这些基因而言,蛋白的表达调节,而非遗传变异体的存在与否,可能是更重要的导致代谢活性的个体差异的因素。当所述酶的表达被诱导后,这些酶自己大量生成来提高活性。表达诱导的机理通过将包含药物受体的外部材料与目标基因的启动子相结合来实现。所述药物受体的典型实例是已知在NRl 12基因中表达的孕烷X受体(PXR)。据报道,P)(R的表达量根据个体的不同而不同。有趣的是,所述受体的表达量与药物代谢酶如CYP3A4和CYP2B6的表达量具有高度相关性(Current DrugMetabolism, 2005, 6 :369-383) 0于是,个体之间的所述药物代谢酶的表达量差异取决于所述P)(R基因的表达量差异或活性差异,而不是取决于变异体蛋白。在这点上,对个体P)(R基因的遗传多态性或所述P)(R基因的表达差异的研究近来引起了关注。有报道称,尽管氨基酸序列并未改变,一些遗传变异体仍导致个体对药物反应的差异,如因红霉素呼吸测试或体内利福平(rifampin)引起的CYP3A4活性提升。这些PXR 变异体由于所述目标基因的表达变化而导致活性变化。因此,所述P)(R变异体可能导致药物或者生物分子在体内的活性差异,并极大地影响药物(P)CR基因的耦合剂)引起的药物相互作用的个体差异。
UDP-葡萄糖醛酸基转移酶(UGT)是催化葡萄糖醛酸与体内内源性物质和外源性物质相结合的酶。所述UDP-葡萄糖醛酸基转移酶产生诸如苯酚、乙醇、胺和脂肪酸化合物等具有毒性的物质的葡萄糖醛酸耦合剂,并把这些物质转化为亲水材料以从人体经胆汁或尿排出(Parkinson A, Toxicol Pathol. ,24 :48-57,1996) 据报道,所述UGT主要存在于间质细胞的内质网或核膜内,且在其它组织诸如肾和皮肤中也有表达。所述UGT酶可以根据一级氨基酸序列的相似性大致划分为UGTl和 UGT2亚科。人类UGTlA族有9种异构体(UGT1A1和UGT1A3 UGT1A10)。其中,五种异构体 (UGT1A1、UGT1A3、UGT1A4、UGT1A6和UGT1A9)由肝脏表达。所述UGTlA基因家族的遗传多态性因人而异。已知相对于UGT1A1、UGT1A3 UGT1A10基因存在数种遗传多态性(http:// galien. pha. ulaval. ca/alleles/alleles. html)。所述 UGTlA 基因的多态性在种族之间有极大的差异。已证实酶的活性因多态性的不同而不同,而多态性是决定对于药物治疗的敏感性的重要因素。UGT1A1*6和UGT1AN28与吉尔伯特综合征有关(Monaghan G,Lancet, 347 =578-581,1996)。另外,已报道了与各种疾病相关的各种功能性变异体。由于已报道了各种类型的遗传变异体和单倍型,所以搜索方法应当是有效的。所述单倍型可以由ArlequiruSNPalyze或其它类似软件进行分析。分析所有单核苷酸多态性 (SNP)来搜索每种单倍型的遗传变异体会在成本和时间上不够有效。为了提高效率,可以提供单倍型标签SNP(htSNP)选择方法。所述htSNP选择方法是一种选择最小标签组来准确标记每种单倍型的方法。如果确定了所选SNP,则可以预测所有单倍型。对于许多基因而言,遗传多态性的分布因种族的不同而不同。因此,有必要检查先天遗传变异体和单倍型是否频繁出现在高丽人中,而如果是的话,它们有多频繁,以及如何根据单倍型选择htSNP。然而,对高丽人的基因中的遗传变异体、与之对应的单倍型和根据每种单倍型的htSNP选择的研究并不多。近来,已报道了一种通过对主要发现于白种人中的CYP2D6遗传变异体进行 SNaPshot 分析来确定 11 种 SNP 的方法(Sistonen J 等,Clin Chem. 2005 Jul ;51 (7) 1291-1295), ^P Roche或Jurilab公司的CYP2D6诊断芯片。然而,它们集中在发现于白种人中的CYP2D6遗传变异体上。对诊断包括高丽人在内的亚洲人的CYP2D6遗传变异体的研究还不足。因此,本发明人研究开发了一种短时间内准确确定主要发现于高丽人中的人类 CYP1A2、CYP2A6、CYP2D6、NR1I2( = PXR)和UGTlA基因的变异体的方法。本发明提供了对主要发现于高丽人中的人类CYP1A2、CYP2A6、CYP2D6、NR1I2( = PXR)和UGTlA遗传变异体的htSNP选择方法,以便证明所选htSNP的可用性。

发明内容
因此,本发明的一个方面提供了用于确定发现于高丽人中的CYP1A2、CYP2A6、 CYP2D6、NRl 12 ( = PXR)和UGTlA基因的单倍型的htSNP选择方法。 另外,本发明的另一方面提供了使用所述htSNP确定人类CYP1A2、CYP2A6、 CYP2D6、NR1I2( = PXR)和UGTlA基因的基因型的方法。 另外,本发明的另一方面还提供了使用包含基因芯片的试剂盒来确定人类CYP2D6基因的基因型的方法。总发明构思的其它方面和优点将在下面的说明中部分阐明,并将部分地根据所述说明而显而易见,或可通过实践所述总发明构思而得到理解。本发明的上述和/或其它方面和优点通过提供选自人类CYP1A2、CYP2A6、CYP2D6、 P)(R和UGTlA基因中的基因的htSNP的选择方法而实现,所述方法包括从人类收集生物样本;从操作(a)中所收集的样本中提取核酸;用引物进行PCR(聚合酶链式反应),该反应使用操作中所提取的核酸作为模板来扩增选自人类CYP1A2、CYP2A6、CYP2D6、P)(R和UGTlA基因中的基因或其片段;由操作(c)中所得PCR产物的基因序列确定变异体的存在;由在操作(d)中已确定具有变异体的PCR产物的基因序列确定单倍型;和用SNPtagger软件对操作(d)中分析的所述单倍型进行测序并选择SNP。本发明的上述和/或其它方面和优点通过提供确定人类CYP2A2基因的基因型的方法而实现,所述方法包括(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取基因组DNA; (c)用引物进行PCR,该反应使用操作(b)中所提取的基因组DNA作为模板来扩增人类CYP1A2基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中确定CYP1A2基因的至少11种变异体的存在,所述至少11种变异体选自-3860G > A、_3598G
>Τ、-3594Τ > G、-3113G > A、-2847T > C、-2808A > C、-2603insA、-2467delT、-1708T
>C、-739T > G、-163C > A、1514G > A、2159G > A、2321G > C、3613T > C、5347C > T 和 5521A > G0本发明的上述和/或其它方面和优点通过提供检测CYP1A2启动子基因中的变异体的方法实现,所述方法包括(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取基因组DNA ; (c)用引物进行PCR,该反应使用操作(b)中所得基因组DNA作为模板来扩增人类CYP1A2基因的启动子区域;(d)在操作(c)中所得的PCR产物的基因序列中确定CYP1A2遗传变异体的存在,所述CYP1A2遗传变异体包括-3860G>A、-3598G>T、-3594T
>G、-3113G > A、-2847T > C、-2808A > C、_2603insA、_2467delT、-1708T > C、-739T > G 和-163C > A0本发明的上述和/或其它方面和优点通过提供确定人类CYP2A6基因的基因型的方法实现,所述方法包括(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所得核酸作为模板来扩增人类 CYP2A6基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中确定CYP2A6遗传变异体的存在,所述CYP2A6遗传变异体选自-48T > G、13G > A、567C > T、2134A > G、 3391T > C、6458A > T、6558T > C、6582G > T、6600G > T 和 6091C > Τ。本发明的上述和/或其它方面和优点通过提供确定人类CYP2D6基因的基因型的方法实现,所述方法包括(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所得的核酸作为模板来扩增人类 CYP2D6基因或其片段;和(d)确定CYP2D6基因中至少11种变异体的存在,所述至少11种变异体包括选自> TUOOC > !“和1039C > T中的一种;选自-1(^8T > C、-377Α
>G、3877G > A、4388C > T 和 4401C > T 中的一种;选自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、245A > G 和 2850C > T 中的一种; 1611T > A ; 1758G > A ; 1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;2D6 删除;和2D6重复。本发明的上述和/或其它方面和优点通过提供确定P)(R基因的基因型的方法实现,所述方法包括(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸; (c)用引物进行PCR,该反应使用操作(b)中所得核酸作为模板来扩增人类P)(R基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中研究P)(R基因的遗传变异体的存在,所述遗传变异体选自-25385C > T、-24113G > A.7635A > G、8055C > TU1156A > C 和 11193T > C。本发明的上述和/或其它方面和优点通过提供确定UGTlA基因的功能性变异体的方法实现,所述方法包括(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)使用操作(b)中所提取的核酸作为模板来单独地扩增人类UGTlA基因;和(d) 对操作(c)中扩增的所述基因测序并确定所述UGTlA基因中功能性变异体的存在,所述功能性变异体选自:UGT1A1 基因中的-39(TA)6 > (TA) 7、211G > A,233C > T 禾口 686C > A ; UGTlA3 基因中的 31T > CU33C > T 禾口 140T > C ;UGT1A4 基因中的 31C > TU42T > 6和 292C > T ;UGT1A6 基因中的 19T > G、541A > 6和 552A > C ;UGT1A7 基因中的 387T > G、 391C > A、392G < A、622T > C 和 701T > C ;和 UGT1A9 基因中的-118T9 > T10、726T > G 和 766G > A0本发明的上述和/或其它方面和优点通过提供确定UGTlA基因的与对依立替康 (irinotecan)的敏感性相关的多态性的方法而实现,所述方法包括(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)使用操作(b)中所提取的核酸作为模板来扩增人类UGTlA基因;和(d)对操作(c)中扩增的所述人类UGTlA基因测序并确定所述UGTlA基因中变异体的存在,所述变异体选自=UGTlAl基因中的21IG > A、233C > 丁和 686C > A ;UGT1A6 基因中的 19T > G、541A > 6和 552A > C ;和 UGT1A9 基因中的-118T9 > T10、726T > 6和 766G > Α。本发明的上述和/或其它方面和优点通过提供用基因芯片确定人类CYP2D6基因的基因型的方法实现,所述方法包括(a)提取待研究的基因并进行多重PCR以获得包含待鉴定的SNP的边界(circumference)的PCR产物;(b)用识别等位基因的特异性碱基的 ASPE (等位基因特异性引物延伸)引物进行ASPE反应;(c)将所述反应产物与基因芯片混合;和(d)分析所述基因芯片。本发明的上述和/或其它方面和优点通过提供用于确定CYP2D6基因的基因型的 SNaPshot基因分型试剂盒和用于确定SNP的具有Zip编码(Zip Code)寡核苷酸芯片的基因芯片来实现。本发明中所述生物样本包括对象的血液、皮肤细胞、粘液细胞和毛发,且优选的是血液。本发明中所述核酸可以包括DNA或RNA,优选的是DNA,更优选的是基因组DNA。本发明中所述变异体将说明如下。本发明中的术语“aN>M”或“NaM” (a是正数,N和M分别是A、C、T或G)是指在基因序列中第“a”位的碱基N被碱基M所替代。术语“ainsN”或“adelN”(a是正数,N是 A、C、T或G)是在基因序列中第“a”位处插入或删除一个碱基N。例如,“-1M8C > T”变异体是基因序列中第-1584位的C碱基被T碱基替代。
“2573insC”变异体是在基因序列中第2573位插入(加入)了 C碱基。 “4125-4133insGTGCCCACT”变异体是在人类CYP2D6基因的第4125 4133位碱基处插入了 9 个碱基 GTGCCCACT。"2D6删除”变异体是将整个人类CYP2D6基因从染色体中删除。另外,“2D6重复”变异体是在同一染色体中重复了至少2个人类CYP2D6基因。如上所述,本发明提供了使用最优搜索组合来分析与CYP1A2、CYP2A6、CYP2D6、PXR 和UGTlA基因的药物敏感性相关的功能性变异体或多态性的方法,所述最优搜索组合基于目前为止还未被检查的高丽人CYP1A2、CYP2A6、CYP2D6、PXR和UGTIA基因的多态性。本发明可以适用于确定包括在遗传学特性上与高丽人相似的日本人和中国人以及高丽人在内的亚洲人的CYP1A2、CYP2A6、CYP2D6、PXR和UGTlA基因的基因型。


根据结合附图的对本发明实施方式的下述说明,本发明的上述和/或其它方面将变得显而易见且更容易理解,在所述附图中图1说明了根据本发明首次确定的CYP1A2基因的一种变异体在CYP1A2基因的基因序列中的位置;图2 6是根据本发明选择的CYP1A2基因的htSNP组合的实例;图7 14说明了 CYP1A2启动子基因的变异体的结果,所述变异体是根据本发明选择的所述CYP1A2基因的功能性变异体(这里,X轴表示取决于引物分子数量的运动,Y轴表示每个峰的高度),图7说明了 CYP1A2启动子的野生型SNP,图8说明了位于杂合(hetero)变异体中的CYP1A2启动子的-3860G > A(CYP1A2* 1C)、-2467delT(CYPlA2*lD)和-163C > A (CYP1A2*1F)变异体,所述杂合变异体在双链 DNA
中含有一个变异体和一个野生型,图9说明了位于纯合(homo)变异体中的CYP1A2启动子的-3860G > A(CYP1A2*1 C)、-2467delT(CYPlA2*lD)和-163C > A(CYP1A2*1F)变异体,所述纯合变异体在双链 DNA 中含有两个变异体,图10说明了位于杂合变异体中的CYP1A2启动子的-163C > A (CYP1A2*1F) 和-2808A > C变异体,图11说明了位于纯合变异体中的CYP1A2启动子的-163C > A(CYP1A2*1F)变异体,还说明了位于杂合变异体中的 _2467delT(CYPlA2*lD)、-739T > G(CYP1A2*1E) ,-3598G > Τ、-3113G > A、-2847T > C 和-1708T > C 变异体,图12说明了位于纯合变异体中的CYP1A2启动子的-163C > A(CYP1A2*1F)变异体,还说明了位于杂合变异体中的_2467delT(CYPlA2*lD)、-3598G > 1~和-2847T > C变异体,图13说明了位于杂合变异体中的CYP1A2启动子的-163C > A(CYP1A2*1F)、-246 7delT(CYPlA2*lD)和-3594T > G 变异体,图14说明了位于纯合变异体中的CYP1A2启动子的-163C > A(CYP1A2*1F)变异体,还说明了位于杂合变异体中的-3860G > A(CYP1A2*C)、-2467delT(CYP1A2*1D)
8和-2603insA变异体;图15说明了根据本发明用于选择htSNP组合的CYP2A6在高丽人中的单倍型的种类和频率;图16 21举例说明了根据本发明选择的CYP2A6基因的htSNP组合,图16说明了用于通过在遗传变异体检测目标中添加6种功能性变异体和具有所谓功能性的3种遗传变异体来确定CYP2A6基因的单倍型的htSNP组合的选择,图17说明了用于确定CYP2A6基因的单倍型的htSNP组合的选择,所述CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和6种频繁 CYP2A6遗传变异体,图18说明了用于确定CYP2A6基因的单倍型的另一 htSNP组合的选择,所述 CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和 6种频繁CYP2A6遗传变异体,图19说明了用于确定CYP2A6基因的单倍型的另一 htSNP组合的选择,所述 CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和 6种频繁CYP2A6遗传变异体,图20说明了用于确定CYP2A6基因的单倍型的另一 htSNP组合的选择,所述 CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和 6种频繁CYP2A6遗传变异体,图21说明了用于确定CYP2A6基因的单倍型的另一 htSNP组合的选择,所述 CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和 6种频繁CYP2A6遗传变异体,图22 30说明了对所选htSNP组合和CYP2A6功能性遗传变异体组合的SNaPshot 分析的结果,图22说明了位于杂合变异体中的CYP2A6基因的-48T > G、2134A > 6和6558T
>C变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,图23说明了位于杂合变异体中的CYP2A6基因的567C > 7变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,图M说明了位于杂合变异体中的CYP2A6基因的6458A > T和6558T > C变异体, 所述杂合变异体在双链DNA中含有一个变异体和一个野生型,图25说明了位于杂合变异体中的CYP2A6基因的-48T > G、13G > A和6558T > C变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,图沈说明了位于杂合变异体中的CYP2A6基因的3391T > C变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,图27说明了位于杂合变异体中的CYP2A6基因的-48T > 6和2134A > 6变异体, 所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,图沘说明了位于杂合变异体中的CYP2A6基因的-48T > G、6558T > C和6600G
>T变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,图四说明了位于杂合变异体中的CYP2A6基因的6458A > T变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,
图30说明了位于杂合变异体中的CYP2A6基因的6558T > C和6582G > T变异体, 所述杂合变异体在双链DNA中含有一个变异体和一个野生型;图31和32说明了与图22 30中所述基因研究一起进行的SNaPshot分析,所述 SNaPshot分析另外确定了除图22 30中的所述遗传变异体之外的CYP2A6基因删除,图31说明了存在于同源染色体中的CYP2A6基因,图32说明了不存在于一个染色体中且只有一个基因的CYP2A6基因;图33说明了部分的CYP2A6基因和CYP2A7基因的共轭连接;图34 39说明了根据本发明选择的CYP2D6基因的htSNP组合,图40和41说明了根据本发明选择的CYP2D6基因的htSNP组合之一的SNaPshot 分析结果;图42说明了使用基因芯片确定CYP2D6基因的基因型的过程;图43说明了用于CYP2D6基因的所述基因芯片上的探针;图44说明了使用长PCR进行的CYP2D6基因扩增;图45说明了 ASPE反应过程;图46说明了显示根据示例性实施方式12对CYP2D6基因中的变异体的分析结果的基因芯片;图47说明了根据本发明选择的P)(R基因的htSNP组合;图48 50说明了搜索根据本发明选择的P)(R基因中的功能性变异体的结果(这里,X轴表示取决于每个引物的分子数量的运动,Y轴表示每个峰的高度),图 48 说明了 PXR基因的-25385C > T、_24113G > A.7635A > G、8055C > TU1156A
>C和11193T > C功能性变异体,所述变异体均为野生型;图49说明了位于杂合变异体中的PXR基因的-25385C > T、-24113G > A、7635A
>G、8055C > TU1156A > (和11193T > C功能性变异体,所述杂合变异体在双链DNA中
含有一个变异体和一个野生型;图50说明了位于纯合变异体中的PXR基因的-25385C > T、-24113G > A.7635A
>G、8055C > TU1156A > (和11193T > C功能性变异体,所述纯合变异体在双链DNA中含有两个变异体;图51 M说明了对50个高丽人的UGTlA基因的功能性变异体的分析结果(这里,X轴表示SNP的位置,Y轴表示每个峰的高度,红色是T,黑色是C,蓝色是G,绿色是A);图51说明了对UGTlAl (a)和UGT1A3 (b)基因的功能性变异体的分析结果;图52说明了对UGT1A4 (a)和UGT1A6 (b)基因的功能性变异体的分析结果;图53说明了对UGT1A7基因的功能性变异体的分析结果;图M说明了对UGT1A9基因的功能性变异体的分析结果;图55说明了对50个高丽人的UGTlAl、UGT1A6和UGT1A9基因的与对依立替康 (irinotecan)的敏感性相关的多态性的分析结果;(a)UGTlAl 基因的 211G>A、233C>T 和 686C>A ;UGT1A6 基因的 19T>G、541A
>6和552A > C ;以及UGT1A9基因的726T > 6和766G > A,上述均为野生型,(b)UGTlAl基因的野生型211G >六和233C > T,杂合型686C > A ;UGT1A6基因的杂合型19T > 6和552A > C,野生型MlA > G ;UGT1A9基因的野生型726T > 6和766G >A,(C)UGTlAl 基因的野生型 211G > A、233C > T 和 686C > A ;UGT1A6 基因的杂合型 19T > G、541A > 6和 552A > C ; UGT1A9 基因的杂合型 > G 和野生型 766G > Α,和(d)UGTlAl基因的杂合型211G >六和233C > T,野生型686C > A ;UGT1A6基因的杂合型 19T > G、541A > G 和 552A > C ;UGT1A9 基因的野生型 > G 和 766G > Α。
具体实施例方式下文将参照

本发明的示例性实施方式,其中相同的附图标记表示相同要素,并且将尽量避免重复性说明。本发明可供通过对高丽人CYP1A2基因的变异体分析来确定发现于高丽人中的 CYP1A2基因的基因型、选择htSNP作为每个单倍型的最优标签组并确认其可用性。另外,本发明可供确定人类CYP1A2基因的新单倍型。本发明的选择人类CYP1A2基因的htSNP的方法如下(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 CYP1A2基因或其片段;(d)从操作(c)中所得的PCR产物的基因序列中确定变异体的存在;(e)用SNPtagger软件对操作(d)中已确定具有变异体的所述PCR产物进行测序。从操作(a)中所收集的样本中提取核酸的方法没有限制,是本领域公知的。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen公司(美国)和Mratagene公司(美国)生产的DNA或RNA提取试剂盒。如果从所述试剂盒提取的是RNA,则通过逆转录生产cDNA待用。操作(c)中所述人类CYP1A2基因的片段是指包含人类CYP1A2基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类CYP1A2基因或其片段的所述引物可以基于人类CYP1A2基因或其片段的基因序列来设计,并且可以选自含参照2 31的引物, 但不限于此。操作(d)中的所述变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括17种变异体,如表5。所述测序方法没有限制,可以是本领域内已知方法。例如,可以使用自动DNA测序仪或进行焦磷酸测序来确定基因序列。所述焦磷酸测序是用于DNA测序中的已知SNP测定方法,是检测来自DNA聚合时释放的无机焦磷酸盐(PPi)的光表达的方法。所述DNA测序可以使用来自参照32 61的引物进行,但不限于此。可以通过比较野生型CYP1A2基因的基因序列来确定操作(d)中变异体的存在。可以使用所述野生型CYP1A2基因的基因序列,例如参照1的基因序列(基因库(GenBank)登录号NT_010194)或本领域内已知的每个 CYP1A2 基因型的基因序列(Drug Metab. Pharmacokinet, 2005, 20 (1) :24-33)。单倍型的频率和类型可以使用本领域内已知的技术程序或市场上销售的程序来估计。例如,可以使用免费分发的Haploview,或商业化程序SNPAlyze。所述Haploview软件是本领域内已知的。更优选的是,可以从http://www. broad, mit. edu/mpg/haploview下载所述软件。本发明的方法可以另外包括对操作(a) (d)的重复。为了确定诸如种族或者病人等特定群体内的CYP1A2基因的变异相及其单倍型,可以在检测完CYP1A2基因型的频率并从所述群体中选出频繁CYP1A2基因型之后执行操作(e)。在操作(e)中,用SNPtagger软件分析CYP1A2基因的单倍型数据以选择htSNP。所述 SNPtagger 软件在本领域内是已知的,例如 Genehunter、Merlin、Allegro、SNPHAP、htSNP finder (基于PCA)。更优选的是,所述软件可以从http://www. well. ox. ac. uk/ xiayi/ haplotype 或 http://slack, ser. man. ac. uk/progs/htsnp. html 下载。可以验证所选htSNP来改善精度从而确定二倍型。当由双链染色体确定人类的基因型后,将所述基因型解码以确定两种单倍型组合。如果同时分析数个SNP,则特定单倍型的组合可以和另一个单倍型的组合相同。如果所述基因型由根据本发明所开发的诊断解码,则应该验证它是否准确确定了所述基因型。可以用Matlab (迈斯沃克软件有限公司 (The Mathfforks, hc.),美国)来分析是否由基因分析结果对所述基因型进行了正确的解码,从而进行所述验证。在本发明的一个示例性实施方式中,首先研究了高丽人CYP1A2基因中的变异体来选择发现于高丽人中的CYP1A2基因型的htSNP。结果,在高丽人CYP1A2基因中共发现 17个SNP (参见表5)。17个SNP中有一个(_2603insA)是新型的。本发明首次提供的所述单一 SNP在双链DNA中包含一个变异体和一个野生型(参见图1)。在本发明的另一个示例性实施方式中,确定了发现于高丽人中的17个SNP的单倍型。结果,本发明确定了此前从未在高丽人中发现的CYP1A2基因的的单倍型(参见表6) 和基于上述单倍型的基因型。例如,表6中的CYP1A2基因的单倍型2(CYP1A2*1L)是指在所述CYP1A2基因的基因序列中的-3860、-2467和-163位碱基处有SNP的基因型。更具体而言,所述基因型具有-3860G > A、-2467T > delT (_2467delT)和-163C > A 的 SNP。在本发明的另一个示例性实施方式中,用SNPtagger软件分析已由含CYP1A2基因中的变异体的基因序列确定的单倍型以便选择htSNP,亦即发现于高丽人中的CYP1A2基因的变异体的17个单倍型的最小标记。根据本发明选择的htSNP组合的实例如图2 6中所示。根据本发明选择的所述htSNP组合可以用于确定人类CYP1A2基因的单倍型。因此,本发明提供了确定人类CYP1A2基因的单倍型的方法。所述方法包括如下步骤(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所得核酸作为模板来扩增人类CYP1A2 基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中确定所述CYP1A2基因中变异体的存在,所述变异体选自-3860G > A、-3598G > T、-3594T > G、-3113G > A、-2847T > C、-2808A > C、-2603insA、-2467delT、-1708T > C、-739T > G、-163C > A、1514G > A、 2159G > A、2321G > C、3613T > C、5347C > T 和 5521A > G。操作(b)中的所述提取核酸的方法与上述相同。
如上所述,所述人类CYP1A2基因的片段是指包含所述人类CYP1A2基因的已知SNP 的片段。用于操作(c)的所述引物没有限制,可以选自参照2 31。操作(d)中研究的所述SNP可以选自图4 6中的htSNP。所述SNP的存在可以由如下变异体研究图4中的-3860G > A、-3598G > T、-3113G > A、-2808A > C、-2603insA、-2467delT、-163C > A、1514G > A、2159G > A、5347C > T 和 5521A > G ;图 5 中的-3860G > A、-3113G > A、-2808A > C、-2603insA, -2467delT, -739T > G、-163C
>A、1514G > A、2159G > A、5347C > !“和 5521A > G ;以及图 6 中的-3860G > A、-3598G
>Τ、-3594Τ > G、-3113G > A、-2808A > C、-2603insA、-2467delT、-163C > A、1514G > A、2159G > A、5347C > !“和 5521A > G,或-3860G > A、-3598G > T、2321G > C、_3113G > A、-2808A > C、-2603insA、-2467delT、-163C > A、1514G > A、2159G > A、5347C > T 和 5521A > G0操作(d)中检测的所述SNP基于发现于高丽人中的CYP1A2基因中的变异体,且该 SNP对确定高丽人的CYP1A2基因的单倍型和基因型极具特异性。操作(d)中的所述PCR产物的基因序列中的CYP1A2基因的SNP可以用本领域内已知的多态性分析方法确定。优选的是,所述SNP可以由SNaPshot分析(参见[PeterM. Vallone等,Int J Legal Med,2004,118 :147-157])、电泳分析或它们的组合来确定,更优选的是用SNaPshot分析来确定。所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火基因序列(除SNP区域以外)和ddNTP。本发明中使用的所述 SNaPshot是用已知方法基于操作(c)中研究的所述CYP1A2基因的SNP设计和制造的。所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与SNP位点相邻的已退火基因序列,并在5’端添加了 T碱基即可。更具体而言,引物可以选自参照64 74。 优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个 SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为可变。例如,在所述5’端添加5 个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因SNP的不同而大小不同。因此,可以同时确定数个SNP。为确定用所述SNaPshot分析所得的基因分型结果是否正确,执行了另一种确定所述基因型的方法。另一种方法没有限制,优选包括自动DNA测序或焦磷酸测序。发现于高丽人中的所述CYP1A2基因中的17种变异体的11个SNP位于启动子区域。所述11个SNP包含由本发明首次确定的-2603insA变异体。因此,本发明提供了确定人类CYP1A2启动子基因中变异体的方法。所述方法包括下列步骤(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取基因组DNA ;(c)使用引物进行PCR,所述反应使用在操作(b)中所得的基因组DNA作为模板扩增人类CYP1A2基因的启动子区域;和(d)在操作(c)中所得的PCR产物的基因序列中确定所述CYP1A2基因中变异体的存在,所述变异体包括-3860G > A、-3598G > T、-3594T > G、-3113G > A、-2847T > C、-2808A > C、-2603insA、_2467delT、-1708T > C、-739T > G 禾口 -163C > A。
操作(b)中的所述提取基因组DNA的方法与上述相同。操作(c)中扩增人类CYP1A2基因的启动子区域的所述引物是可变的,只要所述引物能扩增来自参照1的从-3860G > A到-163C > A的SNP,更优选的是来自参照62和63 的SNP即可。操作(d)中所述PCR产物的基因序列中的CYP1A2基因的所述SNP可以用本领域内公知的多态性分析方法确定。优选的是,所述SNP可以用SNaPshot分析确定。本发明所用SNaPshot分析可以使用基于CYP1A2基因的所述11个SNP而设计的引物进行。本发明所用的SNaPshot引物是可变的,只要其被设计为包含与除所述SNP以外的序列相邻的基因序列即可。更优选的是,具有选自参照64 74的基因序列的引物。在本发明的另一个示例性实施方式中,基于所述影响CYP1A2酶活性的启动子区域中的11个SNP,由SNaPshot分析检测所述CYP1A2启动子基因的变异体。结果,证实本发明的所述方法可以准确地高速检测所述CYP1A2启动子基因中的变异体(参见图7 14)。2. CYP2A6本发明可供通过对高丽人CYP2A6基因的变异体分析来确定主要发现于高丽人中的CYP2A6基因的基因型、选择htSNP作为每个单倍型的最优标签组并确认其可用性。根据本发明选择人类CYP2A6基因的htSNP的方法如下(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 CYP2A6基因或其片段;(d)确定在操作(C)中所得的PCR产物的基因序列中变异体的存在;(e)由在操作(d)中已确定具有变异体的PCR产物的基因序列确定单倍型;和(f) M SNPtagger (http//www. well. ox. ac. uk/ xiayi/haplotype/) X^tM 作(e)中确定的所述单倍型进行测序以选择htSNP。所述从操作(a)中收集的样本中提取核酸的方法没有限制,是本领域内的已知方法。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen 公司(美国)和Mratagene公司(美国)生产的DNA或RNA提取试剂盒。如果提取的是 RNA,则通过逆转录生产cDNA待用。操作(c)中所述人类CYP2A6基因的片段是指包含人类CYP2A6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类CYP2A6基因或其片段的所述引物可以基于人类CYP2A6基因或其片段的基因序列来设计,并且可以选自参照76 89的引物,但不限于此。操作(d)中的所述变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括30种变异体,如表15。操作(d)中确定变异体的存在的方法可以包括本领域内已知的变异体检测方法。 优选的是,用序列分析或电泳分析来比较本领域内已知的野生型CYP2A6基因的基因序列 (例如参照75的基因序列(基因库登录号NC_000019))或本领域内已知的CYP2A6基因型的各基因序列。另外,还可用RFLP分析来比较所述野生型CYP2A6基因的限制性酶的切割相。所述CYP2A6基因的删除或重复可以通过对PCR产物的电泳分析来确定。所述测序可以通过自动DNA测序仪或焦磷酸测序进行。操作(e)中确定含有变异体的PCR产物的基因序列中的所述单倍型可以通过诸如 SNPAlyze, Haplotyper, Arlequin 等程序来确定。本发明的方法可以另外包括对操作(a) (d)的重复。为了确定诸如种族或者病人等特定群体内的CYP2A6基因的变异相,可以在检测完CYP2A6基因型的频率并从所述群体中选出频繁CYP2A6基因型之后执行操作(f)。在操作(f)中,用SNPtagger软件分析操作(e)中确定的所述单倍型的基因序列以选择 htSNP。用于选择 htSNP 的所述软件包括 HapBlock、LDSelect、Haploview、htSNP、 TagIT和tagSNPs以及SNPtagger。所述SNPtagger软件在本领域内是已知的,且优选的是可以从 http://www.well. ox. ac. uk/ xiayi/haplotype 下载。可以验证所选 htSNP 来改善精度从而确定二倍型。可以用Matlab(迈斯沃克软件有限公司,美国)来验证所述 htSNP。在本发明的一个示例性实施方式中,首先研究了发现于高丽人中的CYP2A6基因中的变异体来选择高丽人的CYP2A6基因型的htSNP。结果,在高丽人CYP2A6基因中共发现 30个SNP (参见表15)。在本发明的另一个示例性实施方式中,用DYNAC0M公司生产的SNPAlyze确定了所选的30个SNP中的14个SNP的单倍型,从而确定了具有以上的频率的总共19个单倍型。所述14个SNP包括8个导致氨基酸替换且含有功能性遗传变异体的变异体,和6个频繁变异体。用来确定所述单倍型的程序不限于所述SNPAlyze。作为另外一种选择,可以使用本领域内已知的各种软件,例如,Haplotyper (http //www. people, fas. harvard, edu/ junliu/Haplo/docMain. htm)、Arlequin (htt: //lgb. unife. ch/arlequin)禾口 Istech 公司生产的 SNP Analyzer (http://www. istech21. com/)。在本发明的另一个示例性实施方式中,用SNPtagger软件分析了包括19个单倍型和1个基因删除在内的20个单倍型的基因序列和频率以选择htSNP,亦即能方便地鉴定主要发现于高丽人中的CYP2A6基因的基因型的最小标记。htSNP的实例如图16 21所示。可以使用本发明所选的htSNP组合来确定所述人类CYP2A6基因的基因型。因此, 本发明提供了确定所述人类CYP2A6基因的基因型的方法。所述方法包括如下步骤(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 CYP2A6基因或其片段;(d)在操作(c)中所得的PCR产物的基因序列中确定所述CYP2A6基因中变异体的存在,所述变异体选自-48T > G、13G > A、567C > T、2134A > G、3391T > C、6458A > Τ、 6558T > C、6582G > T、6600G > T 和 6091C > Τ。操作(b)中的所述提取核酸的方法与上述相同。如上所述,所述人类CYP2A6基因的片段是指包含人类CYP2A6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。可以用于操作(c)的引物可以包括参照90、91、120 和130的引物,但不限于此。操作(d)中的所述变异体可以选自图16 21中的htSNP。例如,在操作(d)中,所述变异体可以由图 16 中的-48T > G ;22C > T ;567C > T ;2134A > G ;3391T > C ;6458A
>T ;6558T > C ;6582G > T ;6600G > T ;选自 6091C > T、5971G > 八和 5983T > G 中的一种;和13G > A ;51G > A ;1620T > C ;以及1836G > !“来确定。所述变异体也可以由图17 中的-48T > G ;22C > T ;51G > A ;567C > T ;1620T > C ; 1836G > T ;3391T > C ;6458A > T ;6558T > C ;6600G > T ;和选自 6091C > T、5971G > 六和 5983T > G 中的一种来确定。如图18 所示,所述变异体可以由 22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G
>T ;3391T > C ;6354T > C ;6458A > T ;6558T > C ;6600G > T ;和选自 6091C > T、5971G
>A和5983T > G中的一种来确定。如图19 所示,所述变异体可以由-48T > G ;13G > A ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;2134A > G ;3391T > C ;6458A > T ;6558T > C ;和选自 6091C > T、5971G >々和5983T > G中的一种来确定。如图20 所示,所述变异体可以由-48T > G ;13G > A ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;3391T > C ;6458A > T ;6558T > C ;和选自 6091C > T、5971G > A和5983T > G中的一种来确定。另外,如图21所示,所述变异体可以由-48T > G ;22C > T ;51G > A ;567C > T ; 1620T > C ; 1836G > T ;2134A > G ;3391T > C ;6458A > T ;6558T > C ;6600G > T ;和选自 6091C > T、5971G >々和5983T > G中的一种来确定。优选的是,所述变异体如图16所示
来确定。在图16中的变异体中,证实具有功能性或具有很高的潜在功能性的变异体包含了替换氨基酸或导致基因删除的变异体。因此,要检测图16中的变异体中的功能性CYP2A6 变异体,可以研究图16中的变异体中的所述氨基酸替换变异体或基因删除变异体。基因删除几乎无法由SNP检测。当搜索所述变异体以标记基因删除时,发现了 6091C > !“变异体。 所述6091C > T变异体是特异性地发现于操作(c)所扩增的PCR产物中删除了 CYP2A6基因的染色体中的SNP,而且所述6091C > T变异体可以用作基因删除标记变异体。用于确定功能性的所选变异体组合包括10个变异体,即-48T > G ;13G > A ;567C > T ;2134A > G ; 3391T > C ;6458A > T ;6558T > C ;6582G > T ;6600G > T ;和 6091C > T。所述 CYP2A6 基因中的5971G >々和5983T > G变异体可以替代所述6091C > T变异体来标记基因删除。操作(d)中研究的所述变异体基于主要发现于高丽人中的CYP2A6基因中的变异体。因此,它对确定高丽人的CYP2A6基因的单倍型和基因型极具特异性。操作(d)中的所述PCR产物的基因序列中的CYP2A6基因的变异体可以用本领域内已知的多态性分析方法研究。可以用SNaPshot分析(参见[Peter M.Vallone等,htj Legal Med, 2004,118 :147-157])、电泳分析或它们的组合,更具体而言,可以使用SNaPshot 分析来研究所述变异体。所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火序列(除SNP区域以外)和ddNTP。本发明中使用的所述 SNaPshot是用基于操作(d)中研究的所述CYP2A6基因的SNP的已知方法设计和制造的。 所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与所述SNP位点相邻的已退火基因序列,并在5’端添加了 T碱基即可。更优选的是,引物可以选自参照 97 102。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物的5’端的T碱基的长度被设计为可变。例如,在所述5’端添加5个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因所述SNP的不同而大小不同。因此,可以同时确定数个SNP。然后,扩增以用于SNaPshot分析的所述PCR产物的基因序列可以用本领域内的已知测序方法进行分析,优选的是使用自动DNA测序进行分析。例如,具有选自参照92 101的基因序列的引物可以在操作(c)中用于研究图16 中的htSNP组合。优选的是,可以使用来自参照92 101的所有引物,但不限于此。然后,扩增以用于SNaPshot分析的所述PCR产物的基因序列可以用本领域内的已知测序方法进行分析,优选的是使用自动DNA测序进行分析。在本发明的另一个示例性实施方式中,对所选htSNP组合的可用性进行了确认。 通过从图16的htSNP组合中选择10种功能性或潜在功能性CYP2A6变异体来分析操作(c) 中所得的PCR产物的基因序列,从而进行SNaPshot分析。结果,证实本发明的方法能高速地同时确定发现于高丽人中的CYP2A6基因型(参见图22 32)。可以用本发明所述方法确定的所述CYP2A6基因的基因型包括_48T > G、13G > A、 567C > T、2134A > G、3391T > C、6458A > T、6558T > C、6582G > T、6600G > T 和 6091C > Τ。与之相对应的每个基因型和变异体如图22 32中所示。例如,图22说明了含有-48Τ > G、6558T > C和2134A > G变异体和7个野生型的基因型。图23说明了含有567C > T 和9个野生型的基因型。所述CYP2A6*4基因型包含2A6删除变异体。当从人类染色体中删除CYP2A6基因后,根本不会生成酶。如果CYP2A6基因被删除,则所述基因的形状为部分 CYP2A6基因和部分CYP2A7基因相结合的形状。所述删除特异性变异体可以通过研究上述结合基因来确定。3. CYP2D6本发明可供通过对高丽人CYP2D6基因的变异体分析来确定主要发现于高丽人中的CYP2D6基因的基因型、选择htSNP作为每个单倍型的最优标签组并确认其可用性。根据本发明选择人类CYP2D6基因的htSNP的方法如下(a)从人类中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 CYP2D6基因或其片段;(d)由在操作(C)中所得的PCR产物的基因序列确定变异体的存在;(e)由在操作(d)中已确定具有变异体的PCR产物的基因序列确定单倍型;和(f)用SNPtagger软件对操作(e)中所确定的单倍型进行测序以选择htSNP。所述从操作(a)中收集的样本中提取核酸的方法没有限制,是本领域内的已知方法。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen 公司(美国)和Mratagene公司(美国)生产的DNA或RNA提取试剂盒。如果提取的是 RNA,则通过逆转录生产cDNA待用。操作(c)中所述人类CYP2D6基因的片段是指包含人类CYP2D6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类CYP2D6基因或其片段的所述引物可以
17基于人类CYP2D6基因或其片段的基因序列来设计。例如,所述引物可以包含选自参照106、 参照107、参照121 127、参照129 136、参照138、参照139、参照140和参照150的基因序列,但不限于此。操作(d)中的所述变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括33种变异体,如表34。操作(d)中确定变异体的存在的方法可以包括本领域内已知的变异体检测方法。 优选的是,可以用基因测序、电泳分析和RFLP分析来确定所述变异体。所述基因测序可以通过自动DNA测序仪或焦磷酸测序进行。所述焦磷酸测序是用于DNA测序中的已知SNP测定方法,是检测来自DNA聚合时释放的无机焦磷酸盐(PPi)的光表达的方法。可以通过比较野生型CYP2D6基因的基因序列来确定操作(d)中的变异体的存在。 所述野生型CYP2D6基因的基因序列是本领域内已知的。例如,可以使用参照105的基因序列(基因库登录号AYM5216)或本领域内已知的每个CYP2D6基因型的基因序列(基因库登录号M33388,http://www. cypalleles. kise/cyp2d6. htm)。另外,还可进行 RFLP 分析来比较所述野生型CYP2D6基因的限制性酶的切割相。所述CYP2D6基因的删除或重复可以通过对PCR产物的电泳分析来确定。操作(d)中已确定含有变异体的PCR产物的基因序列中的单倍型可以用全测序来确定。本发明的方法可以另外包括对操作(a) (d)的重复。为了确定诸如种族或者病人等特定群体内的CYP2D6基因的变异相,可以在检测完CYP2D6基因型的频率并从所述群体中选出频繁CYP2D6基因型之后执行操作(f)。在操作(f)中,用SNPtagger软件分析操作(e)中确定的单倍型的基因序列以选择htSNP。所述SNPtagger软件在本领域内是已知的,例如Genehunter、Merlin、Allegro、 SNPHAP、htSNP finder (基于 PCA),更优选的是,所述软件可以从 http://www. well. ox. ac. uk/ xiayi/hapIotype 或 http://slack, ser. man. ac. uk/progs/htsnp. html 下^^。可以验证所选htSNP来改善精度从而确定二倍型。当由双链染色体确定人类的基因型后,将所述基因型解码以确定两种单倍型组合。如果同时确定数个SNP,则特定单倍型的组合可能和另一个单倍型的组合相同。如果所述基因型由根据本发明所开发的诊断解码,则应该验证它是否准确确定了所述基因型。可以用Matlab (迈斯沃克软件有限公司,美国)分析是否由基因分析结果对所述基因型进行了正确的解码,从而进行所述验证。在本发明的一个示例性实施方式中,首先研究了发现于高丽人中的CYP2D6基因中的变异体以选择高丽人CYP2D6基因型的htSNP。结果,在高丽人CYP2D6基因中发现了 33种变异体和与之相对应的12个单倍型(基因型)(参见表34和35)。在本发明的另一个示例性实施方式中,用SNPtagger软件对12个CYP2D6基因型进行测序以选择htSNP,亦即可方便地鉴定主要发现于高丽人中的CYP2D6基因型的最小标记。根据本发明选择的htSNP组合的实例如图34 39中所示。根据本发明选择的所述htSNP组合可以用于确定人类CYP2D6基因的基因型。因此,本发明提供了确定人类CYP2D6基因的基因型的方法。所述方法包括如下步骤(a)从人类中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;
(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 CYP2D6基因或其片段;(d)在操作(c)中所得的PCR产物的基因序列中确定CYP2D6基因中的至少11种变异体的存在,所述至少11种变异体包括选自-1426C > TUOOC > !“和1039C > T中的一种;选自> C、-377Α > G、3877G > A、4388C > T 和 4401C > T 中的一种;选自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一种;1611T > A ; 1758G > A ;1887insTA ;2573insC ;2988G > A ;4125-4133insGTGCCCACT ;2D6 删除;禾口 2D6 重复。操作(b)中的所述提取核酸的方法与上述相同。如上所述,所述人类CYP2D6基因的片段是指包含人类CYP2D6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。可以用于操作(c)的引物可以包括选自参照106和 107、参照121 127、参照129 136、参照138、139、149和150的基因序列。操作(d)中的所述变异体可以选自图34 39中的htSNP。例如,如图34所示, 可以确定下述变异体的存在,所述变异体包括选自-1426C > TUOOC > !“和1039C > T 中的一种;选自 > C、-377Α > G、3877G > A、4388C > T 和 4401C > T 中的一种;选自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一种;1611T > A ; 1758G > A ; 1887insTA ;2573insC ;2988G > A ;4125-4133insGTGCCCACT ;2D6 删除;禾口 2D6 重复。如图35所示,可以确定下述变异体的存在,所述变异体包括_1584C > G ;选自-1426C > TUOOC > T 禾日 1039C > T 中的一种;1611T > A ; 1758G > A ;2573insC ;选自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一种;选自-1245insGA、-1028T > C、-377A > C、3877G > A、 4388C > T 禾口 4401C > T 中的一禾中;4125_4133insGTGCCCACT ;2D6 删除;禾口 2D6 重复。另外,如图36所示,可以确定下述变异体的存在,所述变异体包括选自-1426C > TUOOC > !“和 1039C > T 中的一种;-1584C > G ;选自-1028T > C、_377A > G、3877G > A、 4388C > !“和 4401C > T 中的一种;选自-740C > T、_678G > A、214G > C、221C > A、223C
>G、227T > C、232G > C、233A > C、245A > 6和 2850C > T 中的一种;1611T > A ; 1758G
>A ; 1887insTA ;2573insC ;4125_4133insGTGCCCACT ;2D6 删除;禾口 2D6 重复。另外,如图37所示,可以确定下述变异体的存在,所述变异体包括_1584C > G ; 选自> TUOOC > T 禾日 1039C > T 中的一种;1611T > A ; 1758G > A ;2573insC ;选自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一种;选自-1245insGA、-1028T > C、-377A > G、3877G > A、 4388C > T 禾口 4401C > T 中的一禾中;4125_4133insGTGCCCACT ;-1235A > G ; 1887insTA ;2D6 删除;和2D6重复。另外,如图38所示,可以确定下述变异体的存在,所述变异体包括选自-1426C > TUOOC > T 和 1039C > T 中的一种;选自-1028T > C、-377A > G、3877G > A、4388C > T 和 4401C > T 中的一种;1611T > A ;选自 1661G > C和 4180G > C 中的一种;1758G > A ; 1887insTA ;2573insC ;2988G > A ;4125_4133insGTGCCCACT ;-1235A > G ; 1887insTA ;2D6 删除;和2D6重复。
另外,如图39所示,可以确定下述变异体的存在,所述变异体包括_1584C > G ; 选自> TUOOC > T 禾日 1039C > T 中的一种;1611T > A ; 1758G > A ;2573insC ;选自-740C > T、-678G > A、214G > C、221C > A、223C > G、227T > C、232G > C、233A > C、 245A > 6和 2850C > T 中的一种;选自-1245insGA、-1028T > C、-377A > G、3877G > A、 4388C > T 和 4401C > T 中的一种;1887insTA ;2988G > A ;4125_4133insGTGCCCACT ;2D6 删除;和2D6重复。优选的是,可以确定图34中的变异体的存在。操作(d)中确定的所述变异体基于主要发现于高丽人中的CYP2D6基因中的变异体。因此,它对确定高丽人的CYP2D6基因的单倍型和基因型极具特异性。操作(d)中所述PCR产物的基因序列中的CYP2D6基因的变异体可以用本领域内已知的多态性分析方法确定。优选的是,可以用SNaPshot分析(参见[Peter Μ. Vallone 等,Int J Legal Med,2004,118 :147-157])、电泳分析或它们的组合来确定所述变异体。如果所述CYP2D6中的变异体包含SNP,则可以使用SNaPshot分析。所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火基因序列(除SNP区域以外)和ddNTP。本发明中使用的 SNaPshot分析是用基于操作(c)中确定的所述CYP2D6基因的SNP的已知方法设计和制造的。所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与所述SNP 位点相邻的已退火基因序列,并在5’端添加了 T碱基即可。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物5’ 端的T碱基的长度被设计为可变。例如,在所述5’端添加5个T碱基以使引物的大小不同, 从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因所述SNP的不同而大小不同。因此,可以同时确定数个SNP。例如,具有选自参照141 148以及参照152和153的基因序列的引物可以在操作(c)中用于研究图34中的htSNP组合。更优选的是,可以使用具有选自参照141 148 以及参照152和153的基因序列的所有引物。然后,通过所述SNaPshot分析扩增的PCR产物的基因序列可以用已知基因测序方法进行分析。所述基因测序方法可以在本领域内的已知方法中灵活选取,优选的是包括自动DNA测序。在本发明的另一个示例性实施方式中,对根据本发明所选的htSNP组合的可用性进行了确认。在使用图34中的htSNP组合进行所述SNaPshot分析后,分析了所得PCR产物的基因序列。结果,证实本发明的方法能高速地同时确定发现于高丽人中的CYP2D6基因型(参见图40和41)。可以用本发明所述方法确定的所述CYP2D6基因的基因型包括CYP2D6*1A、 CYP2D6*2A、CYP2D6*5、CYP2D6*2N、CYP2D6*10B、CYP2D6*14B、CYP2D6*18、CYP2D6*21B、 CYP2D6*41A、CYP2D6*49、CYP2D6*52和CYP2D6*60。各个基因型和与之相对应的变异体如表 34中所示。参见表34,例如,所述CYP2D6*1A基因型包含一个野生型,而所述CYP2D6*2A基因型包含野生型CYP2D6基因的基因序列中在SNP 1、SNP 5、SNP 8、SNP 9、SNP 12 SNP 18,SNP 2USNP 25和SNP 28位点的变异体。所述CYP2D6*5基因型包含2D5删除变异体。 当CYP2D6基因从人类染色体中被完全删除后,不再产生酶。所述CYP2D6*2N基因型包含 2D6重复变异体。即在同一染色体中至少存在2个CYP2D6基因。
本发明提供了使用基因芯片确定人类CYP2D6基因的基因型的方法。所述方法包括如下步骤(a)提取待研究的基因,对所述基因进行多重PCR并得到包含SNP的边界的PCR产物;(b)用ASPE (等位基因特异性引物延伸)引物进行ASPE反应以鉴定等位基因的特异性碱基;(c)将所述反应产物与基因芯片相混合;和(d)分析所述基因芯片。本发明提供了用于确定SNP的基因型分析芯片(参见图42),所述芯片含有基于 Zip编码(Zip Code)寡核苷酸的芯片。对每个SNP生成一对引物以在操作(b)中进行ASPE反应。所生成的ASPE引物是在3’端包含SNP位点并与等位基因特异性结合的基因序列。所述ASPE引物包含Zip编码, 即,朝向5’端具有Mbp的寡核苷酸。所生成Zip编码在每个等位基因中含有不同的基因序列。本发明从文献中公开的基因序列和用生物信息学技术设计的基因序列中选择了最优Zip编码序列,所述最优Zip编码序列经实验验证不与其它样品发生交叉反应。所选序列的Tm为61°C。所生成的Zip编码不互相干扰。所选基因序列具有AG值为-2以上的发夹形二级结构。如果使用所述ASPE引物进行ASPE反应,则含有对应于所述引物的3’端的等位基因的样品与所述引物反应以发生等位基因特异性延伸反应。如果使用与荧光材料Cyanine 5(Cy5)共价结合的dUTP(Cy5-dUTP)来进行所述延伸反应,则只有含对应等位基因的样品会被Cy5荧光材料标记(参见图4 。所述荧光材料不限于Cy5,可以使用其它材料,诸如 Cy3、TAMRA、TexasRed、Cy3· 5、Rhodamin 6G、SyBR Green 等。在本发明的分析芯片上提供了与所述Zip编码互补结合的寡核苷酸探针 (cZipCode,互补Zip编码)。因此,可以识别用所述Zip编码引物延伸的样品中包含的每个等位基因(参见图43)。在所述探针中,在3’端插入了 IObp的基因序列作为间隔区来诱导与目标的杂交。 例如,所述间隔区序列优选为5’ -CAG GCC AAGT-3’。本发明的所述探针优选包含参照158 184的基因序列。在操作(c)和(d)中的将所述反应产物与所述基因芯片相混合并分析经混合的所述芯片的方法可以包括本领域内已知的方法。所用的DNA芯片扫描仪可以变化。更优选的是,使用Axon公司生产的GenePix 4100B扫描仪。扫描的图片可以用GenePix Pro6. 0软件进行分析。如果用本发明所述基因芯片分析所述CYP2D6基因的变异体,则其结果与用序列分析所验证的结果相同。因此,本发明的基因芯片可以低成本分析各种基因的变异体。4. PXR本发明的方法使用基于高丽人P)(R基因中的变异体选择的htSNP来确定P)(R基因中的功能性变异体。本发明所述的选择人类P)(R基因的htSNP的方法包括如下步骤
(a)从人类中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 P)(R基因或其片段;(d)对操作(C)中所得PCR产物测序以确定变异体的存在;(e)确定操作(d)中已证实具有变异体的PCR产物的基因序列中的单倍型;和(f)用SNPtagger软件对操作(e)中所确定的单倍型进行测序并选择htSNP。所述从操作(a)收集的样本中提取核酸的方法没有限制,是本领域内的已知方法。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen 公司(美国)和Mratagene公司(美国)生产的DNA或RNA提取试剂盒。如果提取的是 RNA,则通过逆转录生产cDNA待用。操作(c)中的所述人类P)(R基因的片段是指包含人类P)(R基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类P)(R基因或其片段的引物可以基于人类PXR 基因或其片段的基因序列来设计,并且所述引物可以选自参照221 240的引物,但不限于此。操作(d)中所述的变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括22种变异体,如表48。操作(d)中确定变异体的存在的方法可以包括本领域内已知的变异体检测方法。 优选的是,可以进行基因测序、电泳分析和RFLP分析来确定所述变异体的存在。所述基因测序可以通过自动DNA测序仪或焦磷酸测序进行。可以通过比较野生型P)(R基因的基因序列来确定操作(d)中变异体的存在。可以使用所述野生型P)(R基因的基因序列,例如参照2200的基因序列(基因库登录号 NT_005612)或本领域内已知的每个PXR基因型的基因序列。另外,还可用RFLP分析来比较所述野生型P)(R基因的限制性酶的切割相。所述P)(R基因的删除或重复可以通过对PCR产物的电泳分析来确定。操作(d)中证实含有变异体的PCR产物的基因序列中的单倍型的频率和类型可以使用本领域内已知的技术程序或市场上销售的程序来分析。例如,可以使用免费分发的 Haploview,或商业化程序SNPAlyze。所述Haploview软件是本领域内已知的,而更优选的是,可以从 http://www. broad, mit. edu/mpg/haploview 下载所述软件。本发明的方法可以另外包括对操作(a) (e)的重复。为了确定诸如种族或者病人等特定群体内的P)(R基因的变异相及其单倍型,可以在检测完P)(R基因型的频率并从所述群体中选出频繁P)(R基因型之后执行操作(f)。在操作(f)中,用SNPtagger软件对操作(e)中确定的单倍型测序来选择htSNP。 所述SNPtagger软件在本领域内是已知的,例如Genehunter、Merlin、Allegro、SNPHAP, htSNPfinder (基于PCA),更优选的是,所述软件可以从http://www. well. ox. ac. uk/ xiayi/hapIotype 或 http://slack, ser. man. ac. uk/progs/htsnp. html 下^^。可以验证所选htSNP来改善精度从而确定二倍型。当由双链染色体确定人类的基因型后,将所述基因型解码以确定两种单倍型组合。如果同时确定数个SNP,则特定单倍型的组合可能和另一个单倍型的组合相同。如果所述基因型由根据本发明所开发的诊断解码,则应该验证它是否准确确定了所述基因型。可以用Matlab (迈斯沃克软件有限公司,美国)来分析是否由基因分析结果对所述基因型进行了正确的解码,从而进行所述验证。在本发明的一个示例性实施方式中,首先研究了高丽人P)(R基因中的变异体以选择htSNP,高丽人P)(R基因的功能性变异体。结果,在高丽人的P)(R基因中共发现了 22个 SNP (参见表48)。在本发明的另一个示例性实施方式中,用DYNAC0M公司生产的SNPAlyze软件确定了 22个所选SNP中的6个功能性变异体的单倍型,从而确定了总共14个单倍型(参见表 49)。在本发明的另一个示例性实施方式中,用SNPtagger软件对所述14个单倍型进行测序以选择htSNP,亦即可方便地确定发现于高丽人中的P)(R基因的功能性变异体的最小标记(参见图47)。可以使用根据本发明选择的htSNP组合来确定人类P)(R基因的功能性变异体。因此,本发明提供了确定人类P)(R基因的功能性变异体的方法。所述方法包括如下步骤(a)从人类中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类 P)(R基因或其片段;和(d)在操作(C)中所得的PCR产物的基因序列中确定P)(R基因中功能性变异体的存在,所述变异体选自-25385C > T、-24113G > A.7635A > G、8055C > TU1156A > C 和 11193T > C。操作(b)中的所述从收集的样本中提取核酸的方法与上述相同。所述人类P)(R基因的片段是指包含人类P)(R基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。可以用于操作(c)的引物可以选自参照242 M7的引物,但不限于此。操作(d)中研究的所述SNP基于发现于高丽人中的P)(R基因的功能性变异体,它对确定高丽人PXR基因的功能性变异体和所述功能性变异体的单倍型极具特异性。可以用本领域内已知的多态性分析方法来确定操作(d)中所述PCR产物的基因序列中的KCR基因的变异体的存在。优选的是,可以用SNaPshot分析(参见[Peter M-Vallone等,Int J Legal Med,2004,118 :147-157])、电泳分析或它们的组合,更优选的是用SNaPshot分析来确定所述变异体的存在。所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火基因序列(除SNP区域以外)和ddNTP。本发明中使用的 SNaPshot分析是用基于操作(d)中研究的所述P)(R基因的SNP的已知方法设计和制造的。 所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与所述SNP位点相邻的已退火基因序列,并在5’端添加了 T碱基即可。更优选的是,引物可以选自参照 242 M57的引物。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。 如果同时确定数个SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为可变。例如, 在所述5’端添加5个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后, 将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因所述SNP的不同而大小不同。因此,可以同时确定数个SNP。为了确定使用所述SNaPshot分析的基因分型结果是否正确,采用了另一种基因分型方法。另一种基因分型方法没有限制,优选包括自动DNA测序或焦磷酸测序。在本发明的另一个示例性实施方式中,对本发明所选的htSNP组合的可用性进行了确认。使用图47中的htSNP组合进行所述SNaPshot分析,并分析了所得PCR产物的基因序列。结果,证实本发明的方法能高速地同时确定发现于高丽人中的P)(R基因功能性变异体(参见图48 50)。可以用本发明的方法确定的所述P)(R基因的功能性变异体包括-25385C > T、-24113G > A、7635A > G、8055C > TU1156A > C 和 11193T > C。5. UGTlA根据本发明确定人类UGTlA基因的功能性变异体的方法包括如下步骤(a)从人类中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)使用操作(b)中所提取的核酸个别地扩增人类UGTlA基因;和(d)对操作(c)中扩增的所述基因进行测序并确定UGTlA基因的功能性变异体的存在,所述变异体选自UGT1A1基因中的-39(TA)6 > (TA) 7、211G > A,233C > T和686C > A ;UGTlA3 基因中的 31T > CU33C > T 禾日 140T > C ;UGT1A4 基因中的 31C > TU42T > G 禾口 292C > T ;UGT1A6 基因中的 19T > G、541A > G 禾口 552A > C ;UGT1A7 基因中的 387T > G、391C > A、392G < A、622T > C 和 701T > C ;和 UGT1A9 基因中的-118T9 > T10、726T > G 和 766G > A0本发明的确定UGTlA基因的与对依立替康的敏感性相关的多态性的方法包括如下步骤(a)从人类中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)使用操作(b)中所提取的核酸个别地扩增人类UGTlA基因;和(d)对操作(c)中扩增的所述基因进行测序并确定UGTlA遗传变异体的存在,所述变异体选自UGT1A1基因中的211G > A、233C > !“和686C > A ;UGT1A6基因中的19T > G、541A > G 和 552A > C ;和 UGT1A9 基因中的-118T9 > T10.726T > G 和 766G > A。本发明的方法采用了基于主要发现于高丽人的UGTlA基因的多态性而选择的最优多态性标签组,并确定了 UGTlA基因中的功能性变异体或药物敏感性。与现有方法相比, 本发明的方法对分析高丽人的UGTlA基因而言在时间和成本上具有有效性。在本发明的操作(a)中,所述生物样本采自人类,优选的是包括高丽人、中国人和日本人在内的亚洲人,而更优选的是高丽人。所述生物样本可以包括血液、皮肤细胞、粘液细胞或毛发,更优选的是血液。在本发明的操作(b)中,所述核酸提取自操作(a)中收集的生物样本。所述核酸可以包括DNA或RNA,优选的是DNA,更优选的是基因组DNA。从所收集的样本中提取核酸的工艺没有限制,可以根据本领域内已知的技术进行。作为另外一种选择,可以使用DNA或RNA 提取试剂盒,例如由Quiagen公司(美国)和Mratagene公司(美国)生产的试剂盒。在本发明的操作(C)中,使用操作(b)中提取的核酸作为模板并用引物扩增了所
24述UGTlA基因。如果操作(b)中提取的核酸是RNA,则将该RNA经逆转录转化为cDNA以用作模板。所述引物由已知方法基于人类UGTlA基因或其片段的基因序列设计和制造。在本发明的操作(c)中,优选的是扩增UGT1A1、UGTlA3, UGT1A4、UGT1A6、UGT1A7 和UGT1A9基因来确定UGTlA基因中的功能性变异体。优选的是,扩增UGTlAl、UGT1A6和 UGT1A9基因来确定UGTlA基因的决定了对依立替康的敏感性的多态性。在本发明的操作(d)中,使用操作(c)中所扩增的UGTlA基因来分析所述功能性变异体或与UGTlA基因的药物敏感性相关的多态性。可以使用本领域内已知的多态性分析方法来分析所述功能性变异体或多态性。例如,可以进行SNaPshot分析、电泳分析、焦磷酸测序或上述方法的组合。具体而言,如果待分析的UGTlA基因的变异体包含SNP,则优选的是SNaPshot分析。在SNaPshot分析中,使用可以使与SNP位点相邻的区域退火的引物和ddNTP来进行 PCR反应。SNaPshot分析中使用的所述引物由基于UGTlA基因的SNP的已知方法设计和制造。例如,设计和制造引物使得紧邻SNP位点的碱基是3’端,包含与所述SNP位点相邻的已退火基因序列,且在5’端添加了 T碱基。优选的是,所述已退火的基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为不同,从而改变所述PCR产物的长度。含参照四05 314的基因序列的引物可以用来进行确定UGTlA基因的功能性变异体的SNaPshot分析。含参照315 322的基因序列的引物可以用来进行确定UGTlA基因的与对依立替康的敏感性相关的多态性。由所述SNaPshot分析扩增的PCR产物的基因序列可以用已知测序方法分析。优选的是,所述PCR产物的基因序列可以用自动测序方法来分析,但不限于此。如果待分析的UGTlA基因变异体不是SNP (例如,UGTlAl基因中的-39 (TA) 6 > (TA) 7),则可以进行已知的焦磷酸测序来代替所述SNaPshot分析。所述焦磷酸测序评价在 DNA聚合时释放的PPi (无机焦磷酸盐)的表达。在本发明的一个示例性实施方式中,可以使用含参照四2 四4的基因序列的引物来进行焦磷酸测序以确定UGTlAl基因的-39 (TA) 6 > (TA)7。下文将对本发明的示例性实施方式进行详细说明。下述示例性实施方式对本发明进行了示例性说明,但本发明并不限于下述示例性实施方式。<CYP1A2>示例性实施方式1 确定高丽人CYP1A2基因的基因型<1-1>CYP1A2 基因的扩增从48个健康对象采集血液后,使用Qiagen公司生产的基因组DNA分离试剂盒将 DNA从血液中分离。所述CYP1A2基因包含7个外显子(exon),且大约为111Λ长。将所述 CYP1A2基因分为15个片段进行PCR。在每个PCR中使用的引物如表1所示。在本说明书中的基因序列中所写的A、T、G和C是指腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶。[表1]用于扩增CYP1A2基因及其基因序列的引物
权利要求
1.确定UGTlA基因中的功能性变异体的方法,所述方法包括(a)从人类收集生物样本;(b)从操作(a)中所收集的所述样本中提取核酸;(c)使用操作(b)中所提取的所述核酸扩增人类UGTlA基因;和(d)对在操作(c)中扩增的所述人类UGTlA基因进行测序并确定UGTlA基因中功能性变异体的存在,所述变异体选自=UGTlAl基因中的-39 (TA) 6 > (TA) 7、211G > A,233C > T 和 686C > A ;UGT1A3 基因中的 31T > CU33C > T 和 140T > C ;UGT1A4 基因中的 31C > T、 142T > G 禾口 292C > T ;UGT1A6 基因中的 19T > G、541A > G 禾口 552A > C ;UGT1A7 基因中的 387T > G、391C > A、392G < A、622T > C 和 701T > C ;和 UGT1A9 基因中的-118T9 > T10、 726T > G 和 766G > A。
2.确定UGTlA基因的与对依立替康的敏感性相关的多态性的方法,所述方法包括(a)从人类收集生物样本;(b)从操作(a)中所收集的所述样本中提取核酸;(c)使用操作(b)中所提取的所述核酸扩增人类UGTlA基因;和(d)对在操作(c)中扩增的所述人类UGTlA基因进行测序并确定UGTlA基因中变异体的存在,所述变异体选自UGT1A1基因中的211G > A、233C > T和686C > A ;UGT1A6基因中的 19T > G、541A > 6和 552A > C ;和 UGT1A9 基因中的-118T9 > T10.726T > 6和 766G > A。
3.如权利要求1或2所述的方法,其中,操作(a)中的所述人类包括高丽人。
4.如权利要求1或2所述的方法,其中,操作(a)中的所述生物样本选自血液、皮肤细胞、粘液细胞和毛发。
5.如权利要求1或2所述的方法,其中,所述核酸包括DNA或RNA。
6.如权利要求5所述的方法,其中,所述核酸包括基因组DNA。
7.如权利要求1所述的方法,其中,操作(c)中的所述UGTlA基因选自UGT1A1、UGT1A3、 UGT1A4、UGT1A6、UGT1A7 禾P UGT1A9 基因。
8.如权利要求2所述的方法,其中,操作(c)中的所述UGTlA基因选自UGTlAl、UGT1A6 禾口 UGT1A9基因。
9.如权利要求1或2所述的方法,其中,操作(d)中的所述测序通过SNaPshot、电泳、 焦磷酸测序或上述方法的组合进行。
10.如权利要求1所述的方法,其中,操作(d)中的所述测序通过使用含参照295 314 的引物的SNaPshot分析或者使用含参照292 四4的引物的焦磷酸测序进行。
11.如权利要求2所述的方法,其中,操作(d)中的所述测序通过使用含参照315 322 的引物的SNaPshot分析进行。
全文摘要
本发明涉及用于确定UDP-葡萄糖醛酸基转移酶1A(UGT1A)基因的基因型的单倍型标签单核苷酸多态性(htSNP)和使用所述htSNP的基因芯片,更具体而言,涉及用于确定人类UGT1A基因的单倍型的htSNP的选择方法、使用所述htSNP确定所述基因的基因型的方法和用于所述方法的基因芯片。
文档编号C12Q1/68GK102277437SQ20111023913
公开日2011年12月14日 申请日期2007年6月26日 优先权日2006年9月11日
发明者孙知弘, 崔银贞, 张仁珍, 李相燮, 申载国, 芮晟洙, 车仁浚, 车恩暎, 郑惠恩, 郑玄朱, 金佑永, 金垠泳, 金江美 申请人:Inje 大学校产学协力团
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1