用于预测2型糖尿病易感性的试剂盒及引物的制作方法

文档序号:420272阅读:364来源:国知局
专利名称:用于预测2型糖尿病易感性的试剂盒及引物的制作方法
技术领域
本发明涉及用于预测2型糖尿病易感性的试剂盒及引物,更具体地,本发明涉及利用新鉴别的2型糖尿病易感基因Cdc212的一个单核苷酸多态性(SNP)位点设计的预测2型糖尿病易感性的试剂盒和引物。本发明还涉及Cdc212基因在制备预测2型糖尿病易感性的诊断剂中的应用。
背景技术
大量流行病学资料表明,糖尿病是一种具有明显遗传倾向的复杂的多基因遗传病。遗传因素可明显影响机体对胰岛素的敏感性。最近几年,大多数研究者致力于通过定位克隆法寻找糖尿病相关基因,即寻找患病家系成员间共享的染色体DNA区域间的连锁。已发现2型糖尿病中的一些相对较少见的单基因形式,称为青年晚发型糖尿病(maturity-onset diabetes of the young,MODY),是由于突变导致了β细胞功能低下。这些病人通常在青春期到成人早期发病,表现为葡萄糖反应性胰岛素分泌缺陷。这些致病基因中有6个分别编码葡萄糖激酶、转录因子HNF1α、1β、4α及胰岛素启动因子(IPF1),神经细胞分化蛋白(NeuroD1)。这些基因突变最终导致高血糖血症。这些单基因糖尿病的发病率还不确切,估计占所有2型糖尿病的5%。但是,单纯利用定位克隆的策略来确定多基因遗传病的成功报道还不多。
除了定位克隆法外,目前对多基因遗传病的相关基因进行研究还有一种方法最常用的方法,即候选基因法,即直接研究疾病候选基因的变异与疾病表型之间的关系。该法主要基于对家系或人群的病例-对照关联分析。关联分析不需要大的家系研究而是比较某个或某一套标记在患者和正常个体的分布程度。某种标记如果在患病个体中分布十分明显,那么就可以认为该标记与疾病表型相关联。但是,候选基因法中由于对致病基因所在位置没有足够了解,在选择候选基因上存在较大的盲目性,主要针对与疾病发生发展相关的一些代谢通路进行研究。将上述两种方法相结合的定位候选克隆法在一定程度上弥补了任何单一一种方法的局限性,为目前多基因遗传病研究中所普遍采用的策略。
同遗传病研究策略相对应,其研究工具—多态性标记也从第一代的限制性片段长度多态性(Restrictive Fragment Length Polymorphism,RFLP),第二代的微卫星标记(Microsatellite Marker)发展到第三代的单核苷酸多态性(Single Nucleotide Polymorphism,SNP)。尤其在对多基因遗传病进行病例-对照关联分析中,需要利用大量高密度的标记物,前两代多态性标记已不能满足这种要求。因此,近年来,SNP作为第三代遗传图谱的构建者已越来越引起人们的广泛关注。
单核苷酸多态性(SNP)主要是指基因组水平上由单核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。SNP在人类基因组中广泛分布,平均每500-1000个碱基中就有1个,其总数估计可达300万个甚至更多。近年来,随着人类基因组及遗传学研究的进展,SNP在全面深入地了解个体和群体间基因组的变异或多态性及疾病研究等方面也越来越显示出其重要意义。将SNP用于疾病易感基因定位的一个最大的优点就是它的分布广泛性。其次是它有比微卫星更高的稳定性,可以最大限度地减少遗传过程中由于序列变异所导致的信息遗失。另外,SNP很容易实现高通量的分型,短时间内可以产生大量的结果,这一点是微卫星所无法比拟的。SNP的上述特点决定了它非常适合于进行象糖尿病这样的多基因疾病,尤其是多个微效基因所导致的疾病的定位研究。选择合适的病例和正常对照,采取关联分析的研究方法,对SNP而言,是非常适合的。
本发明人近几年来一直从事中国北方汉族人群2型糖尿病(非胰岛素依赖型糖尿病,NIDDM)基因定位研究。在先前进行的全基因组扫描工作中,本发明人已经分别鉴定出多个易感基因位点,它们分别位于1号,12号,18号及20号染色体上。其中在1号染色体上共有5个存在易感基因的区域。在此基础上,本发明人尝试从定位区域选择合适的候选基因,利用SNP进行了病例-对照关联分析,最终终于鉴定了一个糖尿病易感基因(即CDC2L2基因),以及该基因上的一个与中国北方汉族人2型糖尿病特别相关的SNP位点。由此经过深入研究完成了本发明。

发明内容
根据本发明的一个方面,提供了一种预测2型糖尿病易感性的试剂盒,所述试剂盒包含基于图1B或图1A的序列设计的用于PCR扩增的特异引物以及通过核酸扩增进行检测的试剂盒所含的常规组件。所述引物针对图中所示的SNP位点而设计,长度为18bp-21bp。优选地,所述引物选自SEQ ID NO1-16组成的一组,更优选地,所述引物为具有SEQ ID NO17,SEQ ID NO18所示序列的单碱基延伸(SBE)引物。
根据本发明的另一方面,提供了用于预测2型糖尿病易感性的引物,所述引物为基于图1B或图1A的序列设计的用于PCR扩增的特异引物,所述引物针对图中所示的SNP位点而设计,长度为18bp-21bp。优选地,所述引物选自SEQ ID NO1-16组成的一组。根据本发明的一个更优选的实施方案,本发明的引物为SEQ ID NO17,SEQID NO18所示的单碱基延伸(SBE)引物。
根据本发明的再一方面,提供了Cdc212基因作为2型糖尿病易感基因在制备用于糖尿病诊断的诊断剂中的应用,Cdc212基因的核苷酸序列如SEQ ID NO19所示。


图1A示出本发明的SNP位点(R)所在的Cdc212基因区域的核苷酸序列。
图1B为图1A序列的互补序列具体实施方式
定义单核苷酸多态性(SNP)主要是指基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。
微卫星位点把长度为2-6个核苷酸的串联重复序列(VNTR)称为微卫星(Microsatellite),微卫星位点有两个最突出的优点一是它出现频率很高,遍布于整个基因组,而且,由于短序列在进化上不受选择,因而在同一位点上可变重复单位数目变化很大,一个位点可能有多达几十种的等位基因,信息含量高;二是STR两侧的特异性单拷贝序列稳定性高,可作为检测其多态性的PCR引物。以PCR技术操作,可以实现自动化大规模操作基因分型及等位基因频率分布同一种群生物中,相同等位基因核苷酸序列顺序分析,在此表示相同SNP位点在不同个体中的组成成分的确定,为基因分型。等位基因频率是指所研究的同一种类等位基因里,所期望出现的等位基因占的比例,也就是出现变化的等位基因的所占比例。
疾病易感性(糖尿病易感性)人群对疾病容易感受程度。
病例-对照关联分析是一种由因及果的回顾性研究。它是先按疾病状态确定调查对象,分为病例和对照组,通过比较病例组与对照组间所研究的遗传标志出现频率的差异而获得该标志与疾病间关联的信息。
单碱基延伸(SBE)反应它是指在缺乏四种dNTP、存在四种ddNTP的情况下,测序酶可在引物的3’端加上一个ddNTP,但因为不能形成磷酸二酯键,故不会继续延伸,碱基延伸一个后即告终止。只需检测这一个碱基即可。又称微测序法(Minisequencing)。
参数连锁分析和非参数连锁分析根据基因的重组率来计算两个基因之间的染色体图距即连锁分析,用分类变量(离散变量)来进行分析,把测量指标按某一标准归类,计数,然后进行分析为参数分析,用实际测量后的结果进行的分析为非参数连锁分析,2型糖尿病的病因十分复杂,在大多数情况下都会发生胰岛素抵抗和β细胞的功能缺陷。随着病情的发展,β细胞的功能缺陷加剧,使得胰岛素的分泌不足,病人必须补充胰岛素来维持正常的代谢。研究表明,在出现临床症状之前,β细胞的缺损就已经出现了。已经通过不同的途径表现出来在葡萄糖或者其他促分泌剂的刺激下胰岛素的分泌减少,胰岛素的分泌特点上出现了问题,前胰岛素原到胰岛素的转变的效率的改变,还有,胰岛细胞淀粉小体多肽(Islet AmyloidPolypeptide,IAPP)释放的减少。
胰岛素的抵抗会引起β细胞分泌功能的提高。这一提高需要胰岛素的生物合成和释放,这一现象提示,经过一段时间,和胰岛素的抗性的增加引起的对胰岛素需求的增加导致了β细胞的“衰竭”,因此最终会失去功能。在没有遗传缺陷的个体中在胰岛素抵抗的时候,β细胞会有适应性改变,并且防止最终防止发生高血糖。因为,几乎在所有的肥胖个体中都有存在不同程度的胰岛素抵抗,只有一小部分的个体最终发展成为糖尿病。这说明,正常的β细胞可以适应胰岛素的抵抗,遗传易感个体携带的突变,使得个体无法完全适应胰岛素的抵抗,而导致遗传性的β细胞程序型死亡。这样,增加的胰岛素分泌因此暴露了β细胞功能的缺陷。
血液中葡萄糖不正常的代谢状态导致了细胞凋亡的加速。在人的体外培养的人的胰腺的朗罕氏细胞中发现高糖可以调控bcl基因家族的表达,来诱导细胞的凋亡。有一系列的研究表明在2型糖尿病患者中都发生减少。β细胞质量的减少导致了胰岛素的分泌的减少,然而质量的减少并不能解释观测到的所有的功能改变,质量减少的病理学原因可能是多因素的。
CDC2L2基因编码p34Cdc2蛋白激酶家族成员,位于1p36.3。该激酶家族成员对真核细胞的细胞周期调控起着关键的作用。
蛋白激酶p58(CDC2L1)是人的细胞分裂控制相关分子,在结构上和功能上与p34相关。CDC2是蛋白激酶复合体的催化亚基,叫做M-相促进因子,他可以诱导细胞进入有丝分裂,并且在真核生物中普遍存在。P58位于1p36,Eipers①等人通过人鼠体细胞杂交研究发现一个高度相关的p58序列定位到15号染色体,随后,在15号染色体上的CDC2L2被hugo命名委员会取消了这个名字。这个名字代表1p36的一个基因。
后期的神经细胞瘤和肿瘤细胞系都包含在1号染色体末端的一个缺失。这个缺失总是和增强的转化的可能性相关,表明有一个抑癌基因失活或者1p上的基因与这些癌症的致病有关。在研究位于1p上CDC2L1候选的肿瘤抑制基因时,Lahti等人发现高度相关的基因就位于100kb的区域内。他们把PITSLRE B叫做CDC2L1,遵循命名CDC2相关激酶的惯例,按照CDC2的保守的PSTAIRE框氨基酸序列。相关的基因命名为PITSLRE A,或者CDC2L2。
Xiang等人分离出了多个选择性剪切的CDC2L2 mRNA。CDC2L2转录产物不同的剪切产物编码5个蛋白的异构体,从65KD到110KD。不同的剪切产物N端长度不同,蛋白激酶的C端结构域是相同的。都包含一个30个残基的酸性结构域,主要由谷氨酸构成。这些mRNA编码了3个最大的异构体CDC2L2α2-1,2-2,和2-3,包含了两个翻译起始位点由58氨基酸分隔开。亚细胞成分研究表明,110KD蛋白首先定位在核内,65KD蛋白只有在细胞进行凋亡的时候才检测到。Northern杂交分析表明,α-2蛋白由3.5,3.7kbmRNA在大多数的人的细胞系和组织中都有表达,编码65kdCDC2L2蛋白的mRNAα-1具有更加严格的表达方式,另外还检测到了α-1 mRNA的一个反义mRNA。
CDC2L1和CDC2L2基因编码几乎一样的110KD的蛋白,这个蛋白的C端有一个58KD蛋白的开放阅读框。Comelis等人发现p110和p58蛋白是从一个转录子上不同的阅读框翻译的。
发现的SNP位于距EXON11下游49bp处的G→A的多态性位点,该EXON11受到选择性剪切,其中在异构体2,异构体3,异构体4,异构体5,异构体7,异构体10的mRNA中,而在异构体1,异构体9中不存在。CDC2L2基因的突变也许会对正常的细胞周期调控产生影响。导致细胞在高糖的生理状态下更容易滑向凋亡,从而在糖尿病的发病过程中起到很重要的作用。
本课题组的先期工作表明,1、12、18和20号染色体上均存在有中国北方汉族人2型糖尿病的易感基因位点,其中1号染色体上有4个区域(1p36、1p31、1q22及1q42-43)显示与2型糖尿病相连锁(本组前人作出,不需要文献)。如下述实施例所示,进一步对该区域进行的精细扫描结果显示,其中有3个区域(1p36.33-36.23、1q24.3-25.1及1q42.12-42.13)仍存在连锁。
目前有多个公共数据库储存了几百万条SNP信息,人们可以通过多种方式,如以基因名、登记号、染色体号、功能级别等,进行查寻。但是,这些数据库中的SNP绝大多数只是“候选者”,而非经过验证的真正SNP。它们是利用计算机在对多个克隆序列进行比对时发掘出来的,其中必然存在一部分假阳性SNP。另外,这些SNP大多数是利用高加索人和黑人测序寻找的SNP,在中国人群中的分布有些不一定相同,我们利用中国北方汉族人群的糖尿病患者和正常对照,重新测序寻找SNP。并利用我们在中国北方汉族糖尿病人群中发现的高频的SNP进行基因分型。
为寻找2型糖尿病易感基因,本发明人根据美国国家生物信息学(National Center for Biotechnology Information)中心公布的信息选取位于1p36.23-36.33、1q24.3-25.1及1q42.12-42.13区域的2型糖尿病34个候选基因,对这些基因的外显子,Promotor区2kb,以及临近的内含子的区域进行测序筛查中国北方汉族人群中的SNP。并对其中部分高频的SNP进行基因分型,通过SBE反应(包括直接的SBE反映,SnapshotTM试剂盒,SnupeTM试剂盒),酶切,序列测定等方法对其在病例组及对照组进行分型及病例-对照关联分析。
如以下实施例所详细讨论的,所选择的124个高频的SNP位点中,CDC2L2基因内选取了15个位点进行基因分型,发现本位点和糖尿病相关,分别位于异构体2,异构体3,异构体4,异构体5,的第11号内含子的+49位处,在异构体7中是位于第3号内含子的第+4199位点,在异构体10中是位于第3号内含子的第+49位点,的一个SNP位点(R,即A/G),这是一个全新的SNP,在NCBI的SNP数据库中没有登录。其等位基因频率分布在病例组和对照组中的差异有统计学意义(P<0.05),提示这一SNP位点与2型糖尿病相关,进一步得出结论,其所在基因CDC2L2基因为中国北方人2型糖尿病的易感基因。
因此,本发明的一个方面涉及糖尿病易感基因CDC2L2基因在预测糖尿病易感性中的应用。基于CDC2L2基因,可以获得各种诊断剂和试剂盒以用于预测糖尿病易感性。
CDC2L2所在基因组序列如SEQ ID NO19所示,全长为21,444bp,本发明所揭示的SNP位点(R)位于该序列的15,451-16,950位之间,这一区域的核苷酸序列如图1A所示,图中R为SNP位点,其代表碱基A/G多态性,即该位点可以为A,也可以为G。这一区域的互补序列如图1B所示,图中Y代表本发明的SNP位点的互补碱基,其代表碱基T/C。
本发明还涉及用于预测2型糖尿病易感性的引物。优选地,所述引物基于图1A的序列而设计,由此,PCR扩增后的产物测序可以直接测得SNP位点。当然,本发明的引物也可以基于图1B的序列设计,这样PCR扩增后的产物测序得到SNP的互补碱基。优选地,本发明的引物具有SEQ ID NO1-16所示的序列,特别优选的是SEQ IDNO17SEQ ID NO18所示的SBE引物。下表1举例示出了本发明的引物的一些组合,引物的解链温度(Tm)以及这些组合得到的产物大小。本领域技术人员能够理解,本发明的引物不限于这些列出的引物及其组合。
表1


本发明进一步涉及包含本发明的一或多种引物的试剂盒,该试剂盒用于检测2型糖尿病的易感性。除了本发明的引物之外,所述试剂盒还包含运用PCR扩增而进行检测的试剂盒的常规组件、试剂、缓冲液等,本领域技术人员熟悉这些常规组件和检测方法。
以下将参照实施例进一步描述本发明。
实施例1中国北方汉族人群2型糖尿病易感基因的精细定位1、2型糖尿病家系的收集收集中国北方汉族人群中满足以下要求的2型糖尿病家系1)家系中连续2代或2代以上出现2型糖尿病患者,每代至少有一个患者、一个正常人。
2)糖尿病患者应是在正规医院确诊的、对胰岛素不敏感者(除外1型糖尿病)。入选的对照个体年龄应在35岁以上(以尽量排除尚未发病的家系成员)。
3)除糖尿病外,不合并其它明显器质性疾病,如高血压、冠心病(除外糖尿病所导致的并发症)等。
在采集家系前应确保所有家系成员都了解采血目的,即有知情权,血样提供人在了解了所有情况后,若同意,要在“知情同意书”上签字,才能实施抽血和其它个人情况的调查。若不同意,则尊重其个人意见。将收集的资料严格保密,不对外公布供血成员的姓名、年龄、疾病等所有资料。
对入选家系的每一个成员,除已明确诊断的2型糖尿病患者外,均应进行口服葡萄糖糖耐量试验(Oral Glucose Tolerance Test,OGTT),以确认每一个成员是否可作为正常对照。OGTT试验过程抽取空腹静脉血及口服75g葡萄糖(5分钟内喝完)后30分钟、60分钟、120分钟及180分钟的静脉血,观察血糖浓度的动态变化情况。此外,记录每一个体一般情况,包括性别、出生年月、籍贯、发病年龄、身高、体重、心率、呼吸、血压、用药情况、有无合并症、以及血脂、血电解质等项目,必要时行特殊检查,以排除合并有高血压、心脏病、动脉粥样硬化等疾病的家系。
2型糖尿病的诊断严格按照WHO于1985年颁发的标准执行。即空腹血葡萄糖浓度≥7.8mmol/L或餐后2小时血糖≥11.1mmol/L为糖尿病。OGTT的判断标准为服糖后2小时血葡萄糖浓度<7.8mmol/L为正常,≥11.1mmol/L为糖尿病,在7.8-11.1mmol/L之间为糖耐量低减(impaired glucose tolerance,IGT)。
共采集到60个符合以上条件的2型糖尿病家系,成员共计367人。其中2型糖尿病患者180例,正常人171例,IGT患者16例。这些家系分别来自北京、山东、河北、内蒙古、河南等地的汉族人群。绘制所有家系的家系图,并对每一家系及家系成员进行编号,此编号同DNA入库号一致。在所收集到的家系中,15%(9/60)为三代家系,85%(51/60)为二代家系。患者中男性为83人,女性为97人;IGT者16人。家系成员平均年龄为50.03岁,其分布情况(分患病和正常)见表2表2 2型糖尿病家系成员年龄构成

取所有家系每一成员的外周血样备用。
2、PCR扩增微卫星片段、基因分型常规方法提取上述血样中的基因组DNA,提取后的DNA均溶解于TE缓冲液中,注明样品所属家系、编号等资料,-20℃保存待用。
在以往全基因组扫描阳性区(1p36,1p31,1p12,1q22,1q42-43区,20p12,20q13区,12p12区及18q23区)选择杂合度较高、分布较为均匀的微卫星位点进行第二轮扫描。共选择了60个位点,其中1号染色体5个阳性区域内34个,平均密度3.2cM;12号染色体4个,平均密度2.2cM;18号染色体4个,平均密度1.9cM;20号染色体上3个区域内18个,平均密度2.6cM。这些微卫星位点的最低杂合度为0.64,最高为0.88,平均值0.748。部分微卫星位点的遗传学位置自http//www-genome.wi.mit.edu查找所得(在“Human PhysicalMapping Project”栏下),部分自法国Genethon的人类多态性中心的资料上获得。在所用的60个微卫星位点中,16个在ABI公司Version2.0试剂盒中已有引物,46个需新设计合成引物。新合成的一对引物中的一条用荧光物质FAM或HEX标记。所有引物在合成时综合考量PCR扩增片段长度的大小及可能的合理分组情况来确定荧光标记的颜色。反应所用的引物序列参见法国Genethon遗传图谱的Microsatellite Markers Data Set。各微卫星位点扩增片段长度及引物信息见表3。
表3 60个微卫星位点的大小范围与标记荧光位点名称片段大小(bp)标记荧光位点名称片段大小(bp)标记荧光D1S243 142-170 HEX D1S2709 191-197 FAMD1S468 173-191 HEX D1S2800 195-225 FAMD1S2845 193-233 FAM D1S235 175-195 FAMD1S214 122-152 NED D1S2850 145-153 FAMD1S2663 183-205 FAM D12S1625264-280 FAMD1S472 228-244 FAM D12S77 163-193 FAMD1S2892 93-129 FAM D12S336 117-135 NEDD1S2722 195-223 FAM D12S89 254-288 HEXD1S463 223-233 HEX D18S465 233-251 HEXD1S211 170-198 HEX D18S61 213-243 NEDD1S2627 265-279 FAM D18S1125268-286 FAMD1S2868 210-224 FAM D18S488 239-264 HEXD1S497 250-278 FAM D20S906 229-247 FAMD1S206 208-226 NED D20S842 156-180 HEXD1S495 138-164 FAM D20S889 93-129 FAM
D1S2707 137-159 FAM D20S849 214-236 FAMD1S2878 152-178 NED D20S95 82-100 FAMD1S196 322-338 HEX D20S892 205-223 FAMD1S2815 210-237 FAM D20S115 238-250 NEDD1S218 266-286 NED D20S851 128-150 FAMD1S466 155-175 EAM D20S901 260-268 FAMD1S2692 187-217 HEX D20S186 121-143 HEXD1S245 235-253 FAM D20S852 152-176 HEXD1S205 94-112 FAM D20S112 217-241 FAMD1S425 336-360 NED D20S912 267-283 FAMD1S419 162-194 FAM D20S857 204-220 FAMD1S2860 168-184 FAM D20S840 141-165 FAMD1S2880 113-135 FAM D20S120 213-241 FAMD1S213 107-133 NED D20S100 213-239 HEXD1S2833 92-108 FAM D20S102 169-177 FAMPCR扩增后,在377电泳仪(ABI公司)上进行电泳,用377电泳图象收集软件(ABI PrismTM377-96 Collection或ABI PrismTM377XL Collection)收集结果,在GENEHUNTER2.0软件(美国麻省理工学院遗传系编写,从http//cmag.cit.nih.gov上可自由下载)上运算,计算相关的位点与表型连锁的P值、Z值。结果显示在所研究的10个区域中有3个区域继续显示出与糖尿病连锁的证据,如表4所示表4 3个阳性区域内有意义位点的遗传位置、P值及Z值位点名称距p末端距离(cM)细胞遗传学位置统计P值统计Z值D1S243 0.01p36.33 0.008341.653D1S468 6.21p36.33 0.0015 2.135D1S2845 11.1 1p36.32 0.033 1.292D1S214 16.4 1p36.31 0.0025 2.005D1S2663 16.9 1p36.23 0.002051.996D1S2815 193.8 1q24.30.001262.17D1S218 196.5 1q25.10.043 1.2
D1S2800 256.21q42.12 0.0128 1.579D1S235 258.71q42.13 0.0547 1.363从上表可以看出,1p36.33-36.23区有意义(P<0.05)的阳性位点最多,共有5个,最低的P值为0.0015,Z值2.135,5个位点分布在长达16.9cM的区域内。1q243-25.1区有2个位点,1q42.12-42.13区有1个位点满足P<0.05的标准,另外D1S235的P值虽然略高于0.05,但其Z值已达统计学界值(Z>1.36),因此可以认为该位点与糖尿病还是有连锁关系的。这两个区域已分别精细定位至2.7cM(D1S2815-D1S218)和2.5cM(D1S2800-D1S235)的狭窄范围内。引人注目的是在1p36.33-36.23区,连续5个位点都出现了P值小于0.05的情况,因此下一步选择此区域克隆易感基因。
实施例2 2型糖尿病易感基因CDC2L2的鉴定及该基因内SNP的相关研究1、中国北方汉族人群2型糖尿病患者及正常对照标本的收集正常组及2型糖尿病组人群外周血样本均采自北京协和医院内分泌科门诊。标本来源均为我国北方地区,包括北京、山东、河北、内蒙古自治区等地,以北京为主。糖尿病可为散发,也可为糖尿病家系的成员(但此时每一家系中通常只有一个患者入选,同一家系中没有任何血缘关系的成员可以选择一个以上);正常对照来自正常人群,要求其家庭三代以内没有糖尿病患者(包括I型糖尿病),对照组与患病组年龄及性别相匹配。
2型糖尿病诊断同实施例1。入选的每个成员记录一般情况,包括性别、出生年月、籍贯、发病年龄、身高、体重、心率、呼吸、血压、用药情况、有无合并症等,对每个成员检查血脂、血电解质等项目,必要时行特殊检查,以排除合并有高血压、心脏病、动脉粥样硬化等疾病。入选的每个成员都应在“知情同意书”上签字。
共采集到325份标本,其中病例组173份,对照组152份。两组在性别、年龄上相匹配,糖尿病患者的平均年龄为51.99岁,正常对照采样时的平均年龄为48.8岁。在所有成员中,男女的比例为169∶156,病例组男性92人,女性81人;对照组男性77人,女性75人。两组成员的年龄分布情况如下表5患病组和对照组成员的年龄构成

2、候选基因的确定及候选基因中用于基因分型的SNP位点的选择基于实施例1的结果,即染色体1p36.33-36.23区域与2型糖尿病相连锁,利用生物信息学方法从NCBI SNP数据库(www.ncbi.nlm.nih.gov/SNP)中选出位于这一区域或其附近的37个与葡萄糖代谢相关基因测定基因的promotor区2kb,外显子及其邻近的内含子区,和3’非翻译区。并对其中的80个高频的snp进行基因分型,所述的34个候选基因如下(1)CASP9位于染色体的1p36.3-p36.1,是caspase家族成员的半胱氨酸精氨酸蛋白酶,caspase蛋白的顺序活化在凋亡的执行阶段起到重要的作用。caspase蛋白以无活性的前提蛋白形式村子,通过在保守的精氨酸残基处断裂产生两个亚基,这两个亚基结合成有活性的蛋白酶。
(2)CDC2L2基因编码p34Cdc2蛋白激酶家族成员,位于1p36.3。该激酶家族成员对真核细胞的细胞周期调控起着关键的作用。
(3)磷酸葡萄糖脱氢酶(PGD)是戊糖磷酸旁路途径中的第二个脱氢酶,位于人染色体的1p36.3-p36.13。
(4)PRKCZ是蛋白激酶Cζ成员,位于染色体的1p36.33-p36.2位置。是丝氨酸,苏氨酸蛋白激酶家族中的ζ成员,它参与数种细胞代谢过程,(5)SAC基因编码一个与典型的哺乳动物不同的腺苷酸环化酶,位于染色体的1q24。
(6)Urotensin II基因位于染色体1p36,编码一个成熟的多肽具有活性的环12肽,从七腮鳗到人类具有很高的保守性。
(7)GNB1基因位于染色体1p36.33,在信号接受分子和效应分子之间传递信号,由三个不同的亚基组成,这个基因编码beta亚基。
(8)GPR52基因位于染色体1q24,G蛋白耦联的受体家族成员。
(9)氨氯吡咪敏感性钠离子通道δ亚基(dNaCh,SCNN1D)基因位于1p36.32区NT_002209中,编码产物属非电压敏感型通道蛋白,可被利尿剂氨氯吡咪抑制,介导腔内离子的电扩散,以异源四聚体的形式存在于膜上。
(10)乙酰CoA硫酯水解酶(HBACH)基因位于1p36.23区NT_002530中。编码产物属乙酰辅酶家族成员之一,可水解棕榈酸CoA的CoA硫酯及其它长链脂肪酸。
(11)Urotensin II位于1p36.23区NT_002530中。目前对其蛋白功能所知甚少,但已知其保守性很高。一个G蛋白偶联受体GPR14可作为其受体。
(12)DJ-1(RNA结合蛋白调节亚基)位于1p36.23区NT_002163中。
(13)5,10-亚甲基四氢叶酸还原酶(MTHFR)基因位于1p36.21区AL354994克隆中。5,10-亚甲基四氢叶酸还原酶参与叶酸代谢,是同型半胱氨酸叶酸依赖的再甲基化过程的关键酶,以同源二聚体形式发挥催化活性,受S-腺苷蛋氨酸别构调节。
(14)氯离子通道B(CLCNKB)基因位于1p36.13区bA254I4.00143(长47068bp,属unfinished sequence)中,编码电压门控型氯离子通道蛋白B型,主要在肾中表达,它和A型有94%的同源性。氯离子通道可参与调节细胞体积、膜电位稳定性、信号传导及跨上皮转运等。
(15)TNFSF4位于染色体的1q25,编码一个肿瘤坏死因子受体超家族的个体。
(16)TNFSF6位于染色体的1q23,编码一个肿瘤坏死因子受体超家族的个体。
(17)SLC19A2位于染色体的1q23.3,编码维生素b1的转运蛋白,属于叶酸转运超家族的成员。
(18)CDC42BPA又叫做PK428,位于染色体1q42.11,和肌强直性营养不良相关的蛋白激酶相似,丝氨酸,苏氨酸蛋白激酶,和cAMP依赖的蛋白激酶相似。
(20)KCNK1位于染色体的1q42-q43,这个基因编码一个钾离子通道蛋白超家族的成员,包含有2个形成孔蛋白的p结构域,这个基因的产物看起来不是一个功能性的通道,他需要其他的蛋白的参与才具有活性。
(21)ATP2B4位于染色体的1q25-q32,这个基因编码一个质膜钙离子泵。
(22)CACYBP位于染色体的1q24-q25,这个基因编码一个钙结合蛋白的结合蛋白,这个蛋白的结合的作用还不清楚。
(23)氯离子通道A(CLCNKA)基因,位于1p36.13区bA254I4.00143(长47068bp,属unfinished sequence)中,编码电压门控型氯离子通道蛋白A型,主要在肾中表达。
(24)ENO1位于染色体的1p36.3-p36.2,这个基因编码哺乳动物中的3个烯醇化酶异构酶中的一个,它编码一个alpha烯醇化酶,一个同源二聚体可溶性酶。
(25)DFFA位于染色体的1p36.3-p36.2,这个基因编码一个DNA片段化因子DFF,这个是个异源二倍体蛋白包括DFFB和DFFA两个亚基。
(26)G蛋白伽马4蛋白(GNG4),是异源三聚体的G蛋白复合体中的一个组分,三聚体蛋白从G蛋白耦联的受体产道信号到细胞内的效应器。
(27)ICMT异戊基半胱氨酸羰基甲基转移酶,位于染色体的1p36.21,这个基因编码一个翻译后修饰蛋白的转移酶。
(28)RE2是G蛋白耦联的受体,位于染色体的1q23.2,这个基因是视紫质家族的G蛋白耦联受体,协助调控攻击和进食。
(29)PKLR是肝脏丙酮酸激酶的L型的糖分解酶,位于染色体的1q23.2,将磷酸烯醇式丙酮酸转变成丙酮酸,并且生成ATP。
(30)ALPL是一种非组织特异性的碱性磷酸酶,位于染色体的1p36.1-p34,在肝脏,骨骼,肾脏都有分布。准确的生理功能现在未知。
(31)PLA2G2D是磷酸酯酶A2,IID组,位于染色体的1p36.12,优先水化磷脂的sn-2酯键,也许在感染的过程中有重要的功能。
(32)CA14是羰基脱水酶家族中的一个,位于染色体的1q21,催化二氧化碳的可逆性水化,参与数种不同的生理过程。
(33)CA6是羰基脱水酶家族中的一个,位于染色体的1p36.2,催化二氧化碳的可逆性水化,主要在唾液腺里边发现。
(34)PANK4是泛酸酯激酶家族的成员,位于染色体的1p36.23,在细菌和哺乳动物中催化辅酶A的生物合成。并受到辅酶A的反馈调节。
所选择的用于基因分型的80个SNP位点如表6所示。



3、SNP位点基因分型分析主要采用3种方法进行SNP的分型长度多重性单碱基延伸(LengthMultiplexed Single Base Extension,LM-SBE)反应,SnaPshot法,限制性片段长度多态性(Restrictive Fragment Length Polymorphism,RFLP-PCR)及测序分型。
1).LM-SBE反应进行SNP分型1.1)引物设计与合成针对上述23个SNP位点中的每一个SNP位点设计3条引物,其中的2条为PCR引物,用于扩增包含SNP位点的一段序列,另外一条是SBE引物,用于单碱基延伸反应。PCR引物通过Primer 3.0程序在线设计,扩增片段长度为150~300bp。
SBE引物设计原则引物要位于SNP位点的5′端,其3′端的最后一个碱基恰好是与SNP紧邻的前一个碱基。引物长度在18~46base之间,Tm值在55~80℃之间。预备同组的几个位点为不同类型交替出现,其长度相差4个(或其倍数)碱基,且它们之间不能形成发卡结构,较长的SBE引物不能形成回折等二级结构。参照文献(Lindhlad-Toh K,Winchester E,Daly MJ,et al.Lange-scale discoveryand genotyping of single-nucleotide polymorphisms in the mouse.Nat.Genet..2000,24381-386)。
另外,设计用作分子量大小标准的FAM标记的DNA片段,其大小分别为19bp、23bp、27bp、31bp、35bp、39bp、43bp、47bp,所有序列均为AT重复而成。
1.2)PCR反应及产物鉴定将不同类型及不同SBE引物长度的多个SNP位点(一般为3-5个)组合为一组,先进行多重PCR扩增包含SNP位点的相应数目DNA片段。反应体系5μl,各组分如下名称 原液浓度加样量(μl)体系终浓度Mg2+25mM0.63mM缓冲液 10× 0.51×dNTP 2mM 0.075 30nM引物 10μM 0.05×n各0.1μMAmpliGold5U/μl 0.05 0.05U/μl模板 50ng/μl1 5ng/μlddH2O 补齐至5μl采用Touch-down PCR,其程序如下94℃、12分钟后,进行15个循环的94℃ 30秒、63℃ 30秒(每一循环温度下降0.5℃)、72℃50秒,随后24个循环的94℃30秒、56℃30秒、72℃ 50秒,最后72℃10分钟两次。反应结束后用1%琼脂糖电泳鉴定,在UV灯下观察有无产物,并在紫外凝胶成像仪拍照,记录时间、位点名称、样品号等。
1.3)PCR产物纯化PCR反应后体系中残存的dNTP及没有参与反应的单链引物会影响下一步的SBE反应,故用作SBE反应模板的PCR产物需要清除这两者。虾碱性磷酸酶(Shrimp AlkalinePhosphatase,SAP)可以将dNTP 5′端的磷酸基团去除,使之不能形成磷酸二酯键,从而不能参与DNA链的延伸;核酸外切酶I(Exonuclease I,ExoI)可从单链DNA的3′端到5′端方向逐个降解核苷酸,从而避免PCR反应剩余的引物影响下一步的SBE反应。
在每5μl PCR产物中加入2μl酶混合液,其中含SAP 0.5U/μl,Exo I 1U/μl,混匀,置入37℃水浴箱消化1小时,取出后离心,85℃ 15min灭活SAP及Exo I,用作SBE反应模板。
1.4)LM-SBE反应由于体系中只有荧光标记的ddNTP(本实验中分别为JOE-ddATP,FAM-ddGTP,TAMRA-ddCTP ROX-ddUTP),使用对荧光标记ddNTP掺入率比较高的热测序酶(ThermoSequenase)来进行反应,可使每个SBE引物在反应中仅延伸一个碱基即告终止。尽管扩增只是线性增长的,但40个循环后,在ddNTP足量的情况下,其总量也达到了模板的40倍,足以进行检测。
反应体系为5μl,各组分如下名称 原液浓度 加样量(μl) 体系终浓度Mg2+25mM 0.5 2.5mM缓冲液 10× 0.5 1×JOE-ddATP0.12μM 0.1 2.4nMFAM-ddGTP0.12μM 0.1 2.4nMTAMRA-ddCTP 0.12μM 0.1 2.4nMROX-ddUTP0.60μM 0.1 12nMSBE引物 2μM 0.05×n 40nMTheromo Sequenase10U/μl 0.0250.05U/μl模板 1ddH2O 补齐至5μl反应程序为95℃、3分钟后,进行40个循环的95℃ 30秒、50℃ 30秒、60℃ 40秒,最后60℃2分钟。
1.5)电泳SBE产物1μl与上样缓冲液等比例混合,在377测序仪上进行电泳。加样时可分别于电泳时及加样后30分钟2次加样,在加样孔的两端分别各加一个孔的大小标准。电泳结束后通过观察SBE产物电泳位置并与大小标准比较,即可判断是哪一个位点。
1.6)基因型判定及数据整理根据条带颜色判定SNP基因型,蓝色为G/G,绿色为A/A,黄色为C/C,红色T/T,蓝/绿色为A/G,黄/红色为C/T。将各位点分型结果整理为Excel格式以进行统计处理。
2)SnaPshotTM进行基因分型
SnaPshotTM是PE公司基于单碱基延伸(SBE)的原理开发的基因分型的试剂盒,多重引物特异性延伸用于多个SNP位点同时做基因分型,必须在ABI3700测序仪上运行。
2.1)需要分型的SNP位点,一般把7~8个位点放入同一个体系中,引物的3’末端必须设计在SNP位点的上游或下游的邻近位点,规则同普通的PCR反应。各引物的Tm值最好接近,不能低于50℃;2.2)在引物前加上适当长度的polyT,使各个位点之间至少相差4bp,并尽可能使邻近的两个位点没有重合的碱基,(例如3个位点依次是C/T,A/G,C/T);2.3)分别用常规方法PCR含有各SNP位点的DNA片段,标定浓度后等量混合、纯化;2.4)将各个SNP位点的延伸引物等量混合并稀释到分别为0.5μM。将SNaPshot反应混合物2μl、引物混合物2μl和纯化后的PCR产物混合物1μl混匀,96℃ 10s,50℃ 5s,60℃30s,30个循环进行引物特异性延伸。反应产物中加入9倍体积的70%乙醇,常温下静置20分钟,4℃4000转离心45分钟,弃上清,再加入9倍体积的70%乙醇,静置20分钟,同样条件离心,弃上清,1300转倒置离心。空气中晾干30分钟,加入6μl双蒸水。
2.5)SNaPshot上样和判读每孔加甲酰胺(Hi-Di Formamide)9μl,长度标记0.2μl,SNaPshot反应产物3μl,95℃变性5分钟,冷却后在在ABI PRISM 3700 DNA测序仪上进行毛细管电泳,运行Genescan 3.7进行数据分析,Genotyper3.7输出各样本各位点的基因冷却后在在ABI PRISM 3700 DNA测序仪上进行毛细管电泳,运行Genescan 3.7进行数据分析,Genotyper3.7输出各样本各位点的基因型;3)RFLP-PCR进行SNP分型对于改变酶切位点的SNP,可先进行PCR扩增,扩增产物用相应的内切酶消化,电泳后根据条带位置判定基因型。完全酶切或不能被酶切的为两种不同的纯合型,不完全酶切的为杂合型。
4)测序分型对于不适合用以上两种方法分型或分型结果不理想的位点进行测序分型。
以上各SNP位点的分型均先在96个随机选取的正常对照个体中进行。
在病例组和对照组中,上述80个位点均符合Hardy-Weinberg平衡。经SPSS统计软件10.0版(免费下载于http//linkage.rockefeller.edu/soft/)分析,有1个SNP位点位于CDC2L2的第11号内含子的第+49位,这是一个全新的SNP,在NCBI的SNP数据库中没有登录。等位基因频率分布在两组中差异有统计学意义(P<0.05),如表7所示。
表7病例组与对照组SNP分型SPSS统计分析结果等位基因SNP C T A G 总计 P值病例组 96 376472 0.041L9N1SNP1对照组 82 226308总计位于CDC2L2基因的L9N1片断中的1个SNP位点等位基因频率在病例组和对照组存在显著差异,因此提示这一位点与2型糖尿病相关。进而提示CDC2L2基因为一种新的2型糖尿病易感基因。
CDC2L2示的SNP位点(R)位于该基因的15,451-16,950位之间,这一区域的核苷酸序列如图1A所示,图中R为SNP位点,其代表碱基G/A多态性,即该位点可以为G,也可以为A。这一区域的互补序列如图1B所示,图中Y代表所述SNP位点的互补碱基,其代表碱基C/T。
基于这一SNP位点,可以设计适当长度的引物,用于经PCR扩增而预测2型糖尿病易感性。
实施例3预测2型糖尿病易感性引物的设计及2型糖尿病易感性的预测1.SBE引物引物要位于SNP位点的5’端,其3’端的最后一个碱基恰好是与SNP紧邻的前一个碱基。该引物有一条。长度为18-46个碱基之间。要避免含有过多的G+C,Tm值在50~65℃之间。由于SNP位点中转换型较多,因此应避免连续几个出现相同的序列类型(如连续几个C/T型),如遇到准备放入同一个组的几个位点都是C/T型时,可以将其中的数个从反链设计,即变为A/G型,最好是C/T与A/G间隔出现。另外预备同组的几个位点之间不能有发卡等形成,较长的SBE引物不能形成回折等二级结构。根据以上原则设计的一个引物为5′CTG TCT TAG GAG AGG GCT GCT G 3′(SEQ ID NO17),或者5′CCCTCC TTG TCT GTC TCC GAG T3′(SEQ ID NO18)其为该链的同序引物,即与其互补链结合。以此SBE引物对待测个体基因组DNA进行SBE反应检测SNP位点的序列。
2、普通PCR扩增引物根据SNP位点所在的序列(图1A和1B),设计如SEQ ID NO1-16所示的引物。如表1所示进行各种组合。以所述组合为引物,以得自待测个体血样的基因组DNA为模板进行PCR扩增,对扩增产物进行测序检测所述SNP位点的单核苷酸多态性。
SEQUENCE LISTING<110>中国医学科学院基础医学研究所北京诺赛基因组研究中心有限公司国家人类基因组南方研究中心中国医学科学院北京协和医院<120>用于预测2型糖尿病易感性的试剂盒及引物<130>I20030512CB<160>19<170>PatentIn version 3.1<210>1<211>21<212>DNA<213>人工序列<400>1ccacctcttg gttggtaaga a21<210>2<211>18<212>DNA<213>人工序列<400>2ctgtggggaa ctggtcct18<210>3<211>21<212>DNA<213>人工序列<400>3atgaaaacca cctcttggtt g21<210>4<211>18<212>DNA
<213>人工序列<400>4gaactggtcc tgggcttc18<210>5<211>21<212>DNA<213>人工序列<400>5ttggttggta agaacctccc t21<210>6<211>18<212>DNA<213>人工序列<400>6aactggtcct gggcttcc18<210>7<211>21<212>DNA<213>人工序列<400>7cagcctccat atccattctt g21<210>8<211>18<212>DNA<213>人工序列<400>8tggtcagcac tgtgcctc18<210>9
<211>21<212>DNA<213>人工序列<400>9ccatatccat tcttgggaac a21<210>10<211>21<212>DNA<213>人工序列<400>10ctccatatcc attcttggga a21<210>11<211>21<212>DNA<213>人工序列<400>11aggacataac ctcactgcct g21<210>12<211>21<212>DNA<213>人工序列<400>12atccattctt gggaacactt g21<210>13<211>21<212>DNA<213>人工序列<400>13ggacataacc tcactgcctg t21
<210>14<211>19<212>DNA<213>人工序列<400>14gtgtcatgtg ggggacaag19<210>15<211>18<212>DNA<213>人工序列<400>15atgctgagct gggaggag18<210>16<211>21<212>DNA<213>人工序列<400>16tccatatcca ttcttgggaa c21<210>17<211>22<212>DNA<213>人工序列<400>17ctgtcttagg agagggctgc tg22<210>18<211>21<212>DNA<213>人工序列<400>18ccctccttgt ctgtctccga g
21<210>19<211>21444<212>DNA<213>Homo sapiens<400>19gatacttctg gcgagcgccg gttgctgttt cttctcaggc tcagggaccg gccgcggccc60cgtaggggtg agttccgact gggcggacca ggtgtgggag cgcgacgaga actgcgcacc120gaggtctttc ttccgagcag gcctcggagc ggggcggacc cgggcccggg ggcgagcgac180accctcgctt ccgcggacag tctcatcccg cacggaactt tgggtggtgg aggcggcggg240tccaaacgct gtctggagcc aacgtctgcc aggctgaacc tcaagtgtgc gggactgaac300ccgaggaaat agcccagtgc ccgggtcagg tggccttgtt cgcgagcaca tctcggagca360tctccccggt ctcaaggtgc agctgtccag tgtgctagtg gcttcacgta gtccaagcgg420tctttctagc agattctgac agtaaaagca gtgtttgatg agtggcaggt cctgagttaa480gagcctttaa acggatgatc tttaatccgc gatcgatact atcacgtagg tgttgttatt540ctggttgtac ggaagactga actgaggtga attacgttac ccaagaccat acaagaatga600cagaaacgag acttgatttc aagcggtcat ttttcagaac ccatcactct tttttgtcgc660ccatgctgca gcgcagtggc tgttcacaag cgcacttcag cctggaactc ctgggctcaa720tcggtctccc atctcagctt gcagagtata tgggactaca ggcgctcgcc accttgcctg780
gcttacaact tatcattctt gttttttttt tttttttttt tttttttttt ttttttgaga840cggggtcttg ctggagtgca gtgacgcgac ctcggctcac cggaacctcc gcctttcgga900ttcaagcgat tctgctgcct cggcctcccg agtagctggg attacaggca cccgccacca960cgcccagcta agttttgtat ttttagtgga gacagggttt tcgccgtgtt ggccaggctg1020gtcttgacct cccgaccttg tgatccaccc gcctcagcct agagcttacc tttttttttt1080ttttttttta accaagtctt actttgttat ctaggctgga gtgcagtggc gcagtcttgg1140ctcattgcag ccttgacctc tctgattcaa gtgatcctcc tgcctctagc agcctccttc1200ctgtagctag gaatacaggc acgcgccacc acactgggct aacttttgta ttttttgtag1260agacgaggtt ttgccatgtt gcccgggctg gtgttgaact ccggaactcc agcgatctgc1320tcgcctcggc ctcccaaagt gctagggtta ccgtcttgag ccactgcgcc gggcacaact1380tcttattctt aatgaggatt tattctgaat ccctcaaaag tgactaggtt caagtgttca1440gcaccatagc ttgctgtgtc ctgatgtagg ctgaattatt tttctttttg cagtgtttta1500actcaaatgg gtgatgaaaa ggactcttgg aaagtgaaaa ctttagatga aattcttcag1560gaaaagaaac gaaggaagga acaagaggag aaagcagaga taaaacgctt aaaaaatgta1620agccatattt ttttaagtaa gtggttttct taaaggagat ttaatttctt tgccctcatt1680tttccattag aacaacgctt cttcggtgaa gttcttttgt acttccaaat gtcgcaggtg1740
agcccaaaat gtattctaat attcagttga cattaaaggc agatttaaca cactaaagct1800gtgtctagat tgagcataca tggagaataa aatacgttga atgttaagtc attagcaaaa1860ctggactaat ttttctcggt tcattattag tatattcata atactatctc taagtatttt1920taatatagtg ggaacttgcc ttgaaattaa tataaatatt ttacgtcttt cttggtttgc1980atggtaatgt actcaggaaa cctttttagt aatttggtaa gaggcattgg caaagtacct2040cttttgctaa gatttgtagc atcatttggg atgttagtga gtacaggcat accttgcact2100tcactttatt atgcttcaca gatattgaaa tttttccaaa ttaaaggttt gtagcaactc2160tgctttgagt atttttccaa tagcatgtgc tcactttgtt agcttttttt ttgtttttga2220gacggaatct cgcactgtcg cccagggcca ggttcacacc attctcctac ctcagcttcc2280tgagtagctg ggactacagg ggctcaccaa catgccaagc taattttttg tatttttagt2340agagatgggg tctctccgtg ttagccagga tggtcttaat gtcctgacct cgtgatccac2400ccgcctcggc ctcccaaagt gctgggatta acaagcgtga gccactgcac ctggccaaaa2460attctttata ttttataaca ctggctcatt cagagtacat gtgaaagttt gttttgggat2520gttgcccagg tttgattatc attaaaaata cttttatcta tgaagaaaaa aaaacttata2580aagaaaatga ttaactttct ctttgcttct tagtctgatg accgggattc caagcgggat2640tcccttgagg agggggagct gagagatcac tgcatggaga tcacaataag gaactccccg2700
tatagaagag aagactcaat ggaagacagg tgagcggatg tacagatgtg caagacccaa2760ctgtacacag ccctggcctg gccagtcctt cctagggtca ctgtgacaac tgtgtgctat2820tgtaactatt aaggtttact ctttcctaga gttaccgtga cagggcgtgt tgtagctgtt2880gtactactga gattactctt tcctaaggtt accgtgacag ggtgtgctgt tgtaactatt2940gaggtttact ctttcctagg gctactgtga cggggtgtgc tgttttaact attgaggttt3000actcttccct agggttacgt gacggggtgt gctattgtaa ctattaaggt ttactctttc3060ctagggttac tgtgacagtg tgctcagtgt gctgttgtaa atactgaagt gtactctttt3120tttttttgag acggtgtctc aagagtcttg ctcacccagg ctggagtgca gtggcgccat3180ctcggctcac tgcaagctcc gcctccctgg ttcacaccat tctcctgcct cagcctcctg3240gctaacacgg tgaaaccccg tctctactaa aaatacaaaa aattagccag gatggtctcg3300atcttctgac ctggtgatcc gtccacctcg gcctcccaaa atgctgggat tacaggtgcg3360agccacgacc taggattact gtgacagggc atgctgttac aactattgag gtttactctt3420tcctagggtt actggtgaaa gcctgtctct actacaaata caaaaattag cctggcatgg3480tggtgtacac ctgtagtccc agctactcag gaggctgagg caggagaatt gcttgaatgt3540gggaggcaaa ggttgcagtg agccaagatt gtgcctctgt attctaccct gggggacata3600gcaagattct gtctgaaaaa aataataagt ccgggtgcga tggctcatgc ctgtaatccc3660
agcactttgg gaggctgagg cgggtggatc atgaggtcat gagtttcaga tcagcctgac3720caatatggtg aaaccccgtc tctactaaaa atataaaaat tagctgggtg tggtagcgca3780cgcctgtact cccagctact ccggaggctg aggcaggaga attgctcgaa cctgggacag3840gaggcagagg ttgcagtgag ccaagattgc gccgctggac tccagcctgg gcaacagagc3900gagactccat ctcaaaaaaa taaatacagg ccgggcgtgg cggctcacac ctgtaatccc3960agcactttgg gaggctgagg cgggcagatc acaaggtcag gagatcgaga ccaccctggc4020taacacagtg aaactccgtc tctactaaaa aatacaaaaa aaattagccg ggcgtggtgg4080tgggcgcctg tagtcccagt tacttggaag gctgaggcag gagaatggca tgaacccagg4140aggtagagct tgtagtgagc cgagagtctc gccactgccc tccagcctgg gcgacagagc4200aagactccaa tctcaaataa aataaataaa taaataaaat taaattaaat aaataagatg4260tgatgtattt ttacatgccc ctgaaactgt caccacagtc aagctaatga acctgcccct4320caccccctgc aggtcctctg agaggcattt cgttccatct gcacaaaaca ttgatttctt4380acatttttca tctgaatctt aagactccta ggccgggcgc ggtggctcac gcctgtaatc4440ccagcacttt gggaagccga ggcaggcaga tcaccaggtt aggagattga gaccatcttg4500gctaacacag tgaaaccccg tctctactaa aaatacaaaa attagctggg tgtggtggcg4560ggtgcctgta gtcccagcta ctccggaggc tgaggcagga gaatggtgtg aacccggaaa4620
ggtggaggtt gcagtgatcc gagatcgcgt gtctacactc cagcctgggt gacagagcga4680gactccgtct aaaaaaaaaa aaaaaaaaag atgcctgaag ttggagaatt aatgtaattt4740tttaaatgat gtttcagctt cgttcctatc tgaatcatgc atttttctgg gttgaaaaaa4800cctcataata gcctgatgct tttccgcact ttctcaagca tgacgcagtg ctgttgtgtt4860ttatttcaga ggagaagaag atgattcttt ggccatcaaa ccaccccagc aaatgtctcg4920gaaagaaaaa gttcatcaca gaaaagatga aaagagaaaa gaaaaatgta ggcatcatag4980ccattcagca gaagggggta cagaagcatt tactttcttt gacatcatgt tcaagtgtgg5040tttctttcct gttcctactc ttctgccttc cccagagcac cactgaaaaa ccagagaaag5100caaactgtag ctgaaagcat aatggtgtca cagaccgttc agaagggcta tagagagaat5160agctgaaagc atgcatgtgt cacagaccat tcagaggggc tatagagagc aaactctagc5220tgaaagcatg tgtgcgtcac agaccgaaaa ccagagagag caaactagct gaaagcatgc5280gtgtgtcaca ggccattcag aagggctata gagagagcaa actctagctg aaagcatgcg5340tgtgtcacag accattcaga agggctatag agagaatact ctagctgaag gccgggcgtg5400gtggctcaag cctgtaatcc cagcactttg ggaggctgag gcgggtggat cacaaggtca5460ggagatcaag accatcctgg ctaacacggt gaaacccagt ctctactaaa aatacaaaaa5520attagccggg cgtggtggcg ggcacctgta gtcccagctg ctctggaggc tgaggcagga5580
gaatggcatg aacctgggag gcggagcttg cagtgagccg ctatcgcacc actgcacact5640ctagcctggg cgacagagca agactccgtc tcaaaaaaaa aaaaaagaat actctagctg5700aaagcatacg tgcgtcacag accgttcaga atggctatag agagaatact ctagctgaaa5760gcgtgcgtgt gtcacagacc gaaaaccaga gagagcaaac tctagctgaa agcgtgcgtg5820tatcacagac cgaaaaccag agagagcaaa ctctagctga aagcgtgcgt gtgtcacaga5880ccattcagaa gggctatgga gagcaaactc tagctaaaag cctgcgtgtg tcacagaccg5940aaaaccagag agagcaaact ccagctgaaa gcatgcgtgt gtcacagacc gttcagaggg6000gctatagaga gaatactcta gctgaaagca tgcgtgtgtc acagaccgaa aaccagagag6060agcaaactcc acctgaaagc atgcgtgtgt cacagaccat tcagaagggc tatagagaga6120ataccctagc tgaaagcatg cgtgtgtcac agaccgaaaa ccagagagag caaactctag6180ctgaaagcat gcgtgtgtca cagaccgaaa accagaaaga gcaaactcta gctgaaagcg6240tgcgtgtgtc acagaccatt cagaagggct atagagagca aactagctaa aagcatgcgt6300gtgtcacaga ccgaaaacca gacagagcaa actccagctg aaagcatgcg tgtgtcacag6360accattcaga agggctatag agagaatact ctagctgaaa gcatgcatgt gtcacagact6420gaaaaccaga gagagcaaac tctagctgaa agcatgcgtg tgtcacagac cgttcagagg6480ggctatagag aggatactct agctgaaagc gtgcgtgtgt cacagaccga aaaccagaga6540
gagcaaactc tagctgaaag catgcgtgtg tcacagaccg ttcagagggg ctatagagag6600gatactccag ctgaaagtgt gcgtgtgtca cagaccgaaa accagagaga gcaaactcta6660gctgaaagca tgcgtgtgtc acagaccgaa aaccagagag agcaaactct agctgaaagc6720gtgcgtgtgt cacagaccat tcagaatggc tagtccattt ttcctctggg gttttctctc6780ccccattata ttgtttggga gcagtttgtt tacatttaaa atgacctgaa ttcaacaagt6840ataggagaaa aacacacccc aaaatgggta tttgctcaag tccaaagaat gggttaggct6900tgagcagttt gatctcgtac caacatcagg agattcttac gggtgttagg aaaattggac6960ctggagcccg attgaaatct cattattata aatacgcttg attaattaat gtggcttcat7020tgcacagtgg agaagcccac tgatagcaaa gctttgttct gtagtctttg tgaagagtgg7080tttttgtatt ataaaactga taattatagt ttattcagta tagaaaattt ttaaaagatg7140aatattacaa ttctcttctg tgatagcaga attgtttttc ttttttcttc tttcttcata7200attagacgct tactgcagat agttttctat tttcaaagtt ttttatttaa cataaaatca7260tgattattcg actgggtgca gtggcccagg cctgtaatcc cagcactttg ggaggacaag7320gatggaggat cacttgagcc caggagttca agaccagctt ggccaatata gtgagaccct7380gtctcttcaa aaaaaaaaaa aaaaagatta ggattactta acatcattat ttaaatattt7440aatgttcttg atttaatttc attttcatgt gatttttttt tttttttttt tttttttttt7500
tttttttttt gagatggagt ctcacttttt cgcccaggct ggagtgcagt ggcacgatct7560cggctcaccg caacctccac ctcccaggtt caagtgattc tacagcctca gcctccctta7620gtacctggga ttacaggtgc ctgccaccac gcccagctaa tttttgtatt tttagtagag7680acggggtttc accatgttgg ccaggctggt tttgaactcc tgacctcagg tgatccaccc7740gcctcggcct cccaaagtgc tgggattaca ggcgtaagcc accgtgcccg gcctcgtgaa7800atttttgaag tgaggtttct ttgcatgaca ctttatttct cattagggaa gcatgctaga7860gtgaaagaaa gagagcacga acgtcggaaa cgacatcgag aagaacagga taaagctcgc7920cgggaatggg aaagacagaa gagaagggaa atggcaaggg agcattccag gagagaaagg7980tgagtgggct gggtcagttg aggactttat gaaagggccg tggtagtgtg tcctgtcaca8040gcaatgaaga agaatttggc aatagaagtc acatttgttg cagaagtggt agacatggaa8100acagcacagt gaacgctgga cgaggctgac caagagaact gtcctgaggg agtgagtttt8160cactgcatct ggaagtaaga acgggtgtga tttgattgag ggaagacaat gaagggatca8220gaaatctgca cgtcccgccg ggcgcagtgg ctcacgctag aattccagca cttacgaggc8280tgaggtggtt ggatcccttg agcctgggag gtcaaggctg cagtaagcta tgaccatgct8340actgcactcc agcctggttg acagagtgag actgtctcaa aaaaaggaga agggagatcc8400caaaaacctt gaaacagtct ggaaatcggg acactggact cctaggactc ctggccatta8460
gtctgtatat tcgttcccct ttatgagcca gattcccaag aaagaacatc ggtgtagccc8520cagatctgtt ctgtgaacca ggaaaaaggc tgtaggccag gtgcgagcag gcccatctcc8580gccttcagag tgagtccaca gaaagcttgc aagctgctcc aggaagagag gagtctgaag8640cggaagggcg tgtgcagcga tgtttgccag cagccagggc tgggtacaca gcatgtaaag8700atgatgagag ggcgctggtt cttgttgatg ccgaagggtg tgggagacac tgaggcccag8760gggtcaaggt ccgagaccgc tgctgggtga gcaaggtttc agttggccta gttcctgtta8820gtgtgtgaaa cattcatgta tgccacgccc tgtgccagac attgagtgtg tcttgtccca8880cgagagtaga gcttgggata gaagtggagg ttggtagatg aaatttgggc tgtcatattg8940atttcccaga aggtaaagac aggagagtga atgaacaaaa attgttgggg gcagacttct9000gggtagggcc gattcagatc agccaatcca gaactgggtg tggtagcata tgctacgtgg9060gaggctaagg ccagaggacc gcatgacgcc agcctgggca acgtagagag accttgtctc9120tgacaaaaag gaaactgata aggataatct gagaagcact gatgcttgga aaactgctga9180gctgtgggta aaagcagtaa gaatctgacc ttctggcctg agagctgctc cctttactgc9240ttccactctg cacttggaag cacggaggtt ccactgggac agggcagctg caggacctgc9300agtttccttg ctgccttgga aggggttact ccgtttagag cagtgggcag tggccttgcc9360caccagcatc ctcagtggag ggaggaaaag gccaagaggt ctgctagaat gaagtacagt9420
gtggttggga gcagctgtga tcccgccaaa gacgtgcagc agagactgga gagagctcga9480gccgccaccc acttgtgacc agccctgagg atgcagctgc gtgaaaggac ctagcagaaa9540atagaagccg ccacagatgc gaatgacgcc tgaacgttca gtgtgctccc tgtccacaca9600cagccgtggg ccaaggaagc cttactgtgc tcgaggtatt tgagcccagc ctttttccag9660tgctggctaa ttgctaagct gtgcagccat ggtggtgacc cctaggaagc caaggttgaa9720aattaaaata ggcatgtggg aaggaacggg gtggccatga gctatgaggg agatggattt9780cacggacaac cagacaggcc ttggtggtaa caacgaaagg gaaaacttag aatccagaat9840tgctacaaat gtattatcta aaatacaaag aagtatgaca gtgtgacccg tactgaggaa9900gaacatcatc agtagaaact gtcttgagtg tccagatgtt gaatttagta aaggcttgga9960aacaacttgt ggatggagca gtagaaatta tccattctga agaacagaga gaaaaaaaca10020agaaaaatgc acagagcctc agaaacccgt ggtacaacat ctgctgtacc aaagcacgtc10080gaatgggggt tccaggagag aggaaagata tttgttacaa taatggttaa aaactttcca10140aattttaatt aaaaaatatg cacattcaag agcacaggaa gtttgaacta gaataaatgc10200aaagtcacat catagtcaaa ctggcaaagg ccaaagagaa aatgttgaaa gggctcagag10260aagaatgacc catcccatga aaggggagct tcaataccgc cagccactga cttcttagaa10320acaatggagg ccagaaggca gtggagtggc atactcaagc tgcttagaga gaagaaccat10380
cagccaggaa tcaaaactgt tctacacaag tgaaagggaa cgaacgacat tccctgagaa10440gcagagactg gtgggattca ttgttggcga aacctgcctt aaaggaaata ctaaaggaag10500accttcaagt tgaatagaaa tgacaccaga cggtaacttg aatcctcagg aaggaaggac10560aggcactgca gatagcaagt gtaggttgac gtcaatatcc tgtaaatatc tctcctcaca10620tcttaggttt tactggaact acgattgtgt aaaataatta cactgttgtc gtggtatgtg10680gcataaatgg actgcacaaa gaagacaggg aatgaagctg tgttacaaca gttttatatt10740gtactggact tgagctagta tcatgaggca tatggtgatc cctagagcaa ccactaagaa10800agttgttttc ttagtgttct aaaaagtaca aataaattaa aatggtatgc taaacgtatg10860taatttaaaa tcaaaaaggg aagaataaaa aagacacaac aaagcaagga aagtaaatcc10920aactgtacgt gtaattatat gacatgtgaa aggtctctgt gccccaaaca gacagggcag10980attatcagat agaaaaacaa gatctaactg tatgctgtct gctagagaac aggaaaagac11040gcagcgtaca aacatcagct gtcataggag agcttgaatg gctgtactca taccagacaa11100aacagatgtt aagaaatatt agaaaccagc ctggccaaca tggtgaaacc ctgtctctag11160taaaaataca aaaatcacct gggtgtggtg gtgcacacct gtaatcccag ctactcggga11220ggctcaggta tgagaatcac ttgaactcgt gagatggagg ttgcagtgag ccgagattgc11280gccactgcac tccagcctgg gtgacaaacc aagaccctgt ctcaaaaaaa aaaaaaaagc11340
tagaaacaag aaggagcaag gacttcacag ccagaaacag gccaatacag caggaagata11400cagcaatgat acatgtgaat gcatctaacc acagagccca aaatccatga agcaaacacc11460gatcgaatgg aaagaaatgg atcatttatt aattagaatt ggaaatggca gctgggcacg11520gtggctcggg cctgtaaacc cagcactttg aaaagcggag gcaggcggat cacgaggtca11580ggagattgag accatcctgg ctaacatggt gaaaccctcg tctctactaa aaatacaaaa11640attagctggg agtacagggc gcacgcctgt aatcccagct actcgggagg ctgaggcagg11700agaatcgctc gaacccggga ggcggaggtt gcagtgagcc gagatcgcgc caccgcactc11760cagcctgggg gacagatgaa gactccgtct caaagaaaat aaaataaaaa aatgaaaaaa11820aaacttcacg gattgaatta cgtagaaagc cagcttacaa atgtggacaa aaacgcgata11880agcaagcttc tgtttagggg gaatgatggc gtgtgcctct tcagggaccg cttggagcag11940ttagaaagga agcgggagcg ggagcgcaag atgcgggagc agcagaagga gcagcgggag12000cagaaggagc gcgagcggcg ggcggaggag cggcgcaagg agcgggaggc ccgcagggaa12060ggtaggcggc gcggtgggca gctgtgctcg gcgggacgcg tgtctgctgc cccctggtgc12120tgggcacttg ctgtcacagg cgggcgcttg gttccggtgc ttgcttttcg cccctgcctt12180tttttttttt tttggaggca gagttttgct cttgtccccc aggctggagt gcggtggcgc12240gatctcggct cactgcaccc tctgcccccc gggttcaagt gatcctcctg cctcagcctc12300
cggagtagca gggattacag gcacccgcca ccatgttcag ctattttttt atatttttag12360tagagacagg gtttcaccgt gttagccaga atagtctctt gatctcttgg cctcgtgatc12420cacccacctc ggcctcccac agtgctgcga ttacaggcgt gagccaccgc ggccggccag12480tacgagcttt tatagtcacc cacgtcctca ccttaatgga gatctttatt tcttcaccca12540gcttccggtt tctgtctcgc gtcctttcct tacaccccac acaactccct ggagcttatt12600cttcaaggca ggtctaggtc tagtagtaat gaactccctc tgcttttgtt tatctgagaa12660tatcctcatt tctccctcat ctttgaagga aagtttgctg gatacgtggt tcttggttga12720caattttgtt gttgttgttt tgagacagag tcttcttctg ttgcccaggc tggagtgcag12780tggagcgatc atagctcact gcaacctcga actcctgggc acaagtgatc ttcccacctc12840agcctcccgc gtagctggga cctacaggcg tagcgtgtgc caccacacct ggctcatttt12900tcagtagaaa caaggtgtcc ctgtattgcc caggctggtc ttgaattcct gggctcaagg12960aaccctcatg cctagctgac agtttttcct tttcacttgg actatttcag cccattgtct13020tctggcctcc aaagtttctg atgagaaatc tgatgatctt atagaggatc ccttggatgc13080tttaatctga tgacctaatt gaggatccct tggatgcttt gaagattctc tttgccttag13140gctttcaact gtttaataat gggttttcct gtgggcctct tgacttcatt ctacctggag13200ttcactgagc ctctctaatg tttatattta cggttttcat ccaatgtggg ggttttgagg13260
aattcttcag ataccctctc tgctcctctc ctccctcctg ggctcccaca gatctgttgg13320ggtccccgag gccgctcagc actgctccct tttcttcagt ctcttctgct ttcttttcct13380cagacgatgt gattttattg tcttcaggct caccgattat ttcttctgcc tgctcacatc13440tgcctgtgag tttctgttgt gaatatttac tttttagtgt ctattgtgag catgtactta13500ttagctctgg aatttctctc tggtttcttg ttggatcttc tgtctctgtt gatatttccg13560tcgtgttcac gcgtcatttt cttgactttc tccacatctt cctttcgttc tctgaggaac13620tgaaggttta agacagttcc ctaaaatctt tgtctgggac atctaccgtc aggtgatttt13680caggaaccgt gtctgttggc ttcttttttt cccctctgaa tgggacatac tgtcctgttt13740ctttgtttct cttgtgtttt tcttagtcaa aaaaatggac atttgattct catgatgtga13800ttcttcctgg tccccactca agggtgtgca cttgttgttt tggttgtgct gggctgtgtc13860tgtggggtcg gcctgttgtg gaaactcagg gtcttcacgg gtcttttctg agcctgagcc13920ttttcctggt cacgtgcagc cactttttaa cgttcccgtc aatacagatg tttttaatgt13980tcttgtcctg aagtgtctgc ctcctaaagg gggaatagag agaaatgaag ggggcaacgg14040gggacgtggt gctcatgccc tggaagtacc ttcagcttgg gggtggccgt ggctgctgcc14100tcttcatgcc tctggggtgg gacacgcagt catcacactg acctcgggtg tgtgtgtccg14160tctgcccacc tgggtccggc gagctgcatg caggctgctg cctgccagcg gggagtgagg14220
tgggagccac taatgtgcga agcggtgacg ttgattaatg aatcacagtt tactctccaa14280gattccccct gaagttgcaa accttcagta gactccagag cacctcagta gttgcacagg14340cctgatcctg tgatgcaagt gttgtctcgg tggggagact gattcccagt gcttcctact14400ccatctttcc agaatcttct cccgcccctt cctttttgac cagtgaagat cagtctagaa14460ggtccacctg ggtcctcggg ctcacggcct ccaggttgga gctttttctc cctgggcttc14520ctgggagacc tctggcctct gaccccgatg ctgtcagcac cctgtgcacg ctgtgggtgt14580gtctgccagg tgcgggtgtg ggagacgagg cagctgtgcc gggtggggcc ttttgaggaa14640ggcagtgctg ctagtgccat ctccctctct gccctgcgcg ccagtgtctg cacatcaccg14700aacgatgaga gaggactaca gcgacaaagt gaaagccagc cactggagtc gcagcccgcc14760tcggccgccg cgggagcggt tcgagttggg agacggccgg aagccaggtg aggccaggcc14820ggcgcctgcg cagaagccag cacagtgtga gtcttttctg ggggatgttt ggcataagtg14880tgtaggattc atttaaagcc cagctaagta accgcttcag aagaaagtga gagatgtgct14940ggctgaagtc ctctcgtgtc gtgagaggga ccgtgagtgt ctgtgtgcgg ccaggacaca15000ggacgtgtgt ttatccgctg ggacattcgc cactggcccc gttagagaag tggcttccag15060cgtctgtgga tgagctggtt tccgaccaag caaagttaat cgttacgtga aaggcactag15120ttttggggtg gtggtagctt gtttgtttaa aaacatttcc ccaaattcac ctttatggtt15180
tatctcataa gtaaaagaag agaaaatgga agaaagggac ctgctgtccg acttacagga15240catcagcgac agcgagagga agaccagctc ggccgagtcc tcgtcaggta cctggaaccg15300cctggccaag gccttgacca ctgctgccca ggaaggccca ggttcaccct ctgctctgct15360gtctttctac agcggaatca ggctcaggtt ctgaggaaga agaggaggag gaggaagagg15420aggaggagga agggagcacc agtgaagaat cagaggagga ggaggaggaa gaggaagagg15480aggaggagga gaccggcagc aactctgagg aggcatcaga gcagtctgcc ggtgaggcac15540cgcgacgact gtgtgaggtg ttgtgacttc actatagtgt tagaaaccgc agagaagtag15600ctggcgggcg ggggagttga aactcccttc tatctaggac tctctcggga cacctccaca15660tcgattcttt ttgtttgttt ttttgagatg gaatcttgat ctgttgccca ggctggagtg15720cagtggcatg atctcggctc actgcaacct ctgcctcccg ggttcaagtg atcctcccgc15780ctcagcctcc caagtagctg ggagtacagg tgtgcgccac cacgcccgga taatttttgt15840atttttagtc gagacggggt ttcaccacgt tggccaggat ggtctcgaac tcctgacctc15900aggtgatcca cccgcctcgg cctcccaaag cactgggatt acaggcgtga gccaccgcgc15960ccagcctcca tatccattct tgggaacact tgttgcttag ctgaagcgga gcccgcatcc16020tgcctgtggc agcactcgcc ccggtgctgg tctgagcaga cgcctccttt ctcttgcaga16080agaagtaagt gaggaagaaa tgagtgaaga tgaagaacga gaaaatgaaa accacctctt16140
ggttggtaag aacctccctg gagacagagc cccctccttg tctgtctccg agtgcagcag16200ccctctccta agacagccgg tcctgcgcgg cgtggggcac gccagggtct gggaggccgc16260ctgattcgtt ggccgctcca ggctgtgccg gtggggcccg cattcctcag cgaggcacag16320tgctgaccaa gggcgtcctg agtgcccagc agggccgagg agctgggaag cccaggacca16380gttccccaca ggggaggccc gtcagatggt ggctccgggc ctgtccctgc agaacagagg16440cctggcccag cctccgacag gcagtgaggt tatgtcctca gcctggtgga cgtggatgtg16500ggcttgtccc ccacatgaca cccgacgcct cctcccagct cagcatccgg gctctgtctc16560agccgagcct gccagcactc ttaggcctcg gtgccctgtg tccaggggac gagagcccag16620cgccagcacc tcccagcggg acacggggca gccctgccac gcgcttgatg cccccggggc16680aggaggaggt tcatgatcct tacttactcc tagcttcgta attaggttca acttttccag16740ttccagagtc acggttcgac cgagattccg gggagagtga agaagcagag gaagaagtgg16800gtgagggaac gccgcagagc agcgccctga cagagggcga ctatgtgccc gactcccctg16860ccctgttgcc catcgagctc aagcaggagc tgcccaagta cctgccggcc ctgcaggtca16920ggccctcccc tcgccccggg ccgctgtccg cattggcagt cggagttacc acaggggctg16980agcgaagcct ggcccccgtg ttggcgtctg tcgcctcaca gggctgctgg gcccactggg17040gcagtgacgg gcgggcacag ccactggccc ctcatgcttc taggtcccgc ctctttctca17100
tgctggacgg aactgggtgg acagggagct gcccgcagga ctgctctgcg gcttgaaagg17160cagcctgggc gtgcggccgc gctgctgtca ctgctgcccg agttgcgtcc tcctccgcac17220tggagagcag tgccttccac ttgacccctg cgtgggcggg ttatgtaggc accaaggcct17280tgttaccggc atctgtgcag ggcttggatg ggggagcggc tacgggagtc agtgtagatg17340tgtgaccaga agccttttgc tcaggcagct atcaataagg caggatattg ttgggagtga17400tttggaaggg acaagcctga gaaggtacca gtggcctcgg gggcctggga gaccggcagg17460gactcggccc cctccttggt gcctgtgggc ggagaggttc tctctggcgc atgcagcagg17520cctctgtcga ctgccctatg ccttgtgagc gcctctgccc cttagtgctg ctgagcgtag17580gcgtcgggcc acaggccacc cagagtacgt gacatccggc ctgggcaccg gccccaaggt17640acaccgaggg gtaggtgccc tggcatgggg catcatgctg cgcctggcag gtagggcccg17700tcctcagtgt catcctggta caagcagggg acacatccac tttgacagag agactctccg17760gatggccttt tttttggaga ctgggtctgt ctctgtcatc caggctggag tggagtggct17820taatcatagc tcactggagc ctccacctcc caggctcaaa caatcctccc atctcagcct17880cctgagtagc tggaactaca ggcgcaagcc accatgcctg gctaattttt ttattttgta17940gagaagagtt ttggccaggc acagtggctc acgcctgtaa tcccagcact ttgggaggcc18000gaggcggtgg gcggatcaga ggtcaggagt tcgagaccag cctggccaat atggtgaaat18060
cctgtctcta ctaaaaatac aaaaattagc ctggcgtggt ggtgcgtacc tatactccca18120gctactaggg aggctgaggc aggagaatcg cctgaaccca ggaggtggag gttgcagtga18180gccgagatct caccattgca ctccagcctg ggtgacagag cgagactcca tctcaaaaag18240aaaaaaagaa aacagagtgt tgctatgttg gccaggctgg tcttgaactc ctgggctcaa18300gcaatcctcc tgccttgccc tcccaaagtg ctggaattac aggcctgagc ccttgcacct18360ggctgggatg gccttttgtt cacactggtt ttgtttcata ataaagtgtc agatggtttt18420gcaaggaaag agactttgaa agaactgagc tgctcccagc tccacccccg gcccagtccc18480aaggctctgc cctgcacctg ccccgtgctg ggtgtgccgt gcctgtggac gcagccgccc18540tccctccagc tggcatggcc actgagacct cacacaggcg cttccttccc agggctgccg18600gagcgtcgag gagttccagt gcctgaacag gatcgaggag ggcacctatg gagtggtcta18660cagagcaaaa gacaagaaaa caggtgggtg gggtcccctc accccacaaa ggcaggggaa18720gtggggcagg ggctggctgc ccgagagctg cgactgcacc tgggcccgct tcacctgagc18780agctactgga ggttggaccc ctcagcacct ctagaagcca gaggtcagcc tggccctggg18840gctttgccac tcccttgcag tagcaggcgg cctgccccac agggccgagg cccagcgcgt18900ggagtggtct gtgccggggc tggtgtgcag gtttgcgttc ccagcgtccc acccaagcag18960gtgtgtgagc cgggaactct gttgggagtc ggccactggg atcccaggtg aggccggctc19020
tgttggggaa gtcgatgtgg agtcggcgtg gccgctggga tcccaggtgg ctgtaggtgg19080ctgtgagtgt ctgtggtgtg ttgagtggga agccgtgggt gttgccgaga cctcagctgg19140ggcgttctcc tggtgcccac gtgcccccac ctagaacgag acccccctcc gtgaaatgct19200ggcgctttgg gcactgcctg cggtcctcac tgaacgagtc cactgttggt accgtgactt19260tgagaatgcc tctcagtgcc gtctgtattt tcttcacaga tgaaattgtg gctctaaagc19320ggctgaagat ggagaaggag aaggagggct tcccgatcac gtccctgagg gagatcaaca19380ccatcctcaa ggcccagcat cccaacattg tcaccgttag agtgagcatg gccccaccac19440gcctggcccc gggtggaagg cttttccgac agggccccgt gctgtcctgg ggccgggtgc19500ttcctacact ctcctgcact tagtggagcc cttcacagac cacacagaag caagtatttg19560cctcccgggt ggcaccggag gtccttactg tccctcagca tctgcgcccg ggtgcagggg19620tgggtggggg cctggaggtg cccagcaccc acagagccgt gccctgcagg agattgtggt19680gggcagcaac atggacaaga tctacatcgt gatgaactac gtggagcacg acctcaagag19740cctgatggag accatgaaac agcccttcct gccaggtaca gccgcgcccc ggggtcctgt19800ctgcgtacaa gtgggggcag tgtcctggtc acccccgcgg tgacagtgct gcagggaggg19860ccagctgcat ccacagggaa agccctgaga agcctctgtt gctgccgagg cgagcgggcc19920accctgagtg ccctgggctt ggggcggccg ggtccacatg ggagcctccc tccctcccag19980
gggaggtgaa gaccctgatg atccagctgc tgcggggggt gaaacacctg cacgacaact20040ggatcctgca ccgtgacctc aagacgtcca acctgctgct gagccacgcc ggcatcctca20100aggtgagccc ccctccgagt ggcccatccc agggtgaccc gcccaggccc acccacagcc20160gcccatctgt cgttgcaggt gggtgatttt gggctggcgc gggagtacgg atcccctctg20220aaggcctaca ccccggtcgt ggtgacccag tggtaccgcg ccccagagct gctgcttggt20280gccaaggtga gtcctgggcg tctgagtgcc tcccctgtcc cccatgcagc ctcccacagc20340ttcgcgggca ctggccttcc tgaacacctc tcctggcgtc ttaggaatac tccacggccg20400tggacatgtg gtcagtgggc tgcatcttcg gggagctgct gactcagaag cctctgttcc20460ccgggaattc ggaaatcgat cagatcaaca aagtgttcaa ggtgggtctg gccctgccgc20520aggtgcgcta tggatttcag aggagttgca ggaatggggc tgcggggcgc acaggtgctg20580ggttgagatg gggaccaggg ccactgagag ccctcctggt ggcttgtctt ctctgacggg20640acacaggtgc caacactgtg ggccacttgg tgtggctgtt gaagcacctc tgtctttcag20700gagctgggga cccccagtga gaaaatctgg cccggctaca gtgagctccc agtagtcaaa20760aagatgacct tcagcgagca cccctacaac aacctccgca agcgcttcgg ggctctgctc20820tcagaccagg gcttcgacct catgaacaag tgagcccagt gcagccgggt ggcgggaggt20880cccgagccat agcggtgact tcccagtccc aggcctacct gctggctcac cacgttccag20940
aactgctctg gtgcctggcg tcccatgccc tgagccccgt cccaacacag cccatctttg21000ggggacccag tggagcacac gagcacctcc tgggcctctg gccctctccc cccaggttcc21060tgacctactt ccccgggagg aggatcagcg ctgaggacgg cctcaagcat gagtatttcc21120gcgagacccc cctccccatc gacccctcca tgttccccac gtggcccgcc aagagcgagc21180agcagcgtgt gaagcggggc accagcccga ggccccctga gggaggcctg ggctacagcc21240agctggtgag gggcctggcg ggtggggcgt gcccacaggt ggggctggct tgggcagggt21300tctcacggta gccgactcgt cccagggtga cgacgacctg aaggagacgg gcttccacct21360taccaccacg aaccaggggg cctctgccgc gggccccggc ttcagcctca agttctgaag21420gtcagagtgg accccgtcat gggg2144权利要求
1.用于预测2型糖尿病易感性的引物,所述引物为基于图1B或图1A的序列而设计的用于PCR扩增的特异引物,所述引物针对图中所示的SNP位点R而设计,长度为18-46个核苷酸。
2.如权利要求1所述的引物,其包含选自SEQ ID NO1-16组成的一组的一种序列。
3.如权利要求2所述的引物,其为具有SEQ ID NO17 SEQ IDNO18所示的序列的单碱基延伸引物。
4.用于预测2型糖尿病易感性的试剂盒,其包含如权利要求1-3任一项所述的引物。
5.CDC2L2基因在制备用于预测2型糖尿病易感性的诊断剂中的应用。
全文摘要
本发明涉及用于预测2型糖尿病易感性的试剂盒及引物,更具体地,本发明涉及利用新鉴别的2型糖尿病易感基因CDC2L2的一个单核苷酸多态性(SNP)位点设计的预测2型糖尿病易感性的试剂盒和引物。本发明还涉及CDC2L2基因在制备预测2型糖尿病易感性的诊断剂中的应用。
文档编号C12P19/34GK1548555SQ03136979
公开日2004年11月24日 申请日期2003年5月21日 优先权日2003年5月21日
发明者吴国栋, 李云峰, 左瑾, 方福德, 强伯勤, 沈岩, 姚志建, 陈竺, 黄薇, 王姮 申请人:中国医学科学院基础医学研究所, 北京诺赛基因组研究中心有限公司, 国家人类基因组南方研究中心, 中国医学科学院北京协和医院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1