本发明涉及囊性纤维化患者的CFTR基因缺失突变形式及其应用。
背景技术:
囊性纤维化(cystic fibrosis,CF)是一种常染色体隐性遗传病,是由于囊性纤维化跨膜传导调节因子(cystic fibrosis transm em brane conductance regulator,CFTR)的基因突变导致大量黏液阻塞全身外分泌腺,可累及呼吸、消化、生殖等多系统,临床表现为慢性咳嗽、咯大量黏痰、反复发作的肺部感染、脂肪泻、生长发育迟缓及男性不育等。
囊性纤维化首要累及的器官是肺,而肺部病变也是囊性纤维化患者的最主要的致死因素(85%)。囊性纤维化造成气道粘膜分泌物稠化,通过慢性阻塞、感染、炎症,最终导致支气管扩张和肺实质破坏。胰腺也是囊性纤维化的重要受累器官,患者主要表现为胰腺外分泌功能障碍:营养障碍(脂肪、蛋白质吸收障碍、脂肪泻、生长迟滞),胰腺功能不全所致低体重和肺功能及生存率呈负相关,是预后不良的重要因素。患者亦可有其他消化系统表现,如肝脏肿大、肝硬化、黄疸等。因此当同时出现呼吸系统和消化系统表现时,更应警惕囊性纤维化。
囊性纤维化在发达国家高加索人群中的流行病学研究较为完善,是高加索人群中最常见的遗传性疾病之一,发病率约为1/1800至1/25000。亚洲囊性纤维化发病率的数据主要来自回顾性研究或病例研究,并不能十分准确、客观地描述囊性纤维化在亚洲人群准确的发病率,其发病率很可能被低估。1975年-2015年报道的文献中,共记载了36例囊性纤维化患者。近10年,中国大陆报道的囊性纤维化患者为13例。由于病例数较少,我国目前尚无该病发病情况的流行病学统计数据。
基因检测作为一种安全、快速、易行的手段在囊性纤维化诊断中也有着重要作用。对于临床表现不典型和/或汗液试验阴性(或临界值)的患者可通过基因检测进行确诊。囊性纤维化在我国的可能并非罕见,患者临床表现不典型,但如提高对疾病的认识,仍可通过临床表现和相关辅助检查发现高度怀疑的病例,进而通过基因检测快速地做出正确的判断。我国CFTR基因与欧美国家报道大为不同且具有很高的异质性,因此关于CFTR基因突变谱及与临床表型关系还需要进一步完善。
技术实现要素:
本发明的目的是提供囊性纤维化患者的CFTR基因缺失突变形式及其应用。
本发明保护一种蛋白质,为如下(a1)或(a2):
(a1)将囊性纤维化跨膜传导调节因子第508位氨基酸残基“苯丙氨酸”缺失得到的蛋白质;
(a2)将囊性纤维化跨膜传导调节因子第476至478位氨基酸残基“谷氨酸-脯氨酸-丝氨酸”缺失得到的蛋白质。
囊性纤维化跨膜传导调节因子具体如序列表的序列1所示。
编码所述蛋白质的基因也属于本发明的保护范围。
所述基因为如下(b1)或(b2):
(b1)编码区为将序列表的序列2所示的DNA分子1520-1522位核苷酸“TCT”缺失得到的DNA分子;
(b2)编码区为将序列表的序列2所示的DNA分子1426-1434位核苷酸“GAGCCTTCA”缺失得到的DNA分子。
本发明还保护用于检测特异突变甲的物质和/或用于检测特异突变乙的物质在制备试剂盒中的应用;所述特异突变甲为:人基因组中序列表的序列3所示DNA分子中的第128-130位核苷酸“TCT”缺失;所述特异突变乙为:人基因组中序列表的序列3所示DNA分子中的第34-42位核苷酸“GAGCCTTCA”缺失;
所述试剂盒的功能为如下(c1)、(c2)或(c3):
(c1)评价待测者患囊性纤维化的风险性;
(c2)评价待测者或待测夫妻的后代患囊性纤维化的风险性;
(c3)诊断或辅助诊断待测者是否为囊性纤维化患者。
本发明还保护一种试剂盒,包括用于检测所述特异突变甲的物质和/或用于检测所述特异突变乙的物质;所述试剂盒的功能为评价待测者患囊性纤维化的风险性。所述试剂盒还包括记载如下判断标准(d1)和/或(d2)和/或(d3)的载体:(d1)如果待测者一条染色体携带所述特异突变甲,待测者相对正常人患囊性纤维化的风险性增高;(d2)如果待测者一条染色体携带所述特异突变乙,待测者相对正常人患囊性纤维化的风险性增高;(d3)如果待测者一条染色体携带所述特异突变甲,另一条染色体携带所述特异突变乙,待测者相对正常人患囊性纤维化的风险性增高。
本发明还保护一种试剂盒,包括用于检测所述特异突变甲的物质和/或用于检测所述特异突变乙的物质;所述试剂盒的功能为评价待测者的后代或待测夫妻的后代患囊性纤维化的风险性。所述试剂盒还包括记载如下判断标准(e1)和/或(e2)和/或(e3)和/或(e4)的载体:(e1)如果待测者一条染色体携带所述特异突变甲,待测者的后代相对正常人患囊性纤维化的风险性增高;(e2)如果待测者一条染色体携带所述特异突变乙,待测者的后代相对正常人患囊性纤维化的风险性增高;(e3)如果待测者一条染色体携带所述特异突变甲,另一条染色体携带所述特异突变乙,待测者的后代相对正常人患囊性纤维化的风险性增高;(e4)如果所述待测夫妻中的一位携带所述特异突变甲、另一位携带所述特异突变乙,待测夫妻的后代相对正常人患囊性纤维化的风险性增高。
本发明还保护一种试剂盒,包括用于检测所述特异突变甲的物质和/或用于检测所述特异突变乙的物质;所述试剂盒的功能为诊断或辅助诊断待测者是否为囊性纤维化患者。所述试剂盒还包括记载如下判断标准(f1)和/或(f2)和/或(f3)的载体:(f1)如果待测者一条染色体携带所述特异突变甲,待测者为或候选为囊性纤维化患者;(f2)如果待测者一条染色体携带所述特异突变乙,待测者为或候选为囊性纤维化患者;(f3)如果待测者一条染色体携带所述特异突变甲,另一条染色体携带所述特异突变乙,待测者为或候选为囊性纤维化患者。
所述正常人为两条染色体均携带序列表的序列1所示的囊性纤维化跨膜传导调节因子的编码基因的人。
所述序列表的序列1所示的囊性纤维化跨膜传导调节因子的编码基因具体如序列表的序列2所示。
所述序列表的序列1所示的囊性纤维化跨膜传导调节因子的编码基因具体如GENBANK ACCESSION NO.NG_016465.4所示(linear PRI 28-AUG-2016)。
以上任一所述用于检测所述特异突变甲的物质具体可为特异引物对。特异引物对由两条引物组成,一条引物为序列表的序列5所示的单链DNA分子,另一条引物为序列表的序列6所示的单链DNA分子。
以上用于检测所述特异突变乙的物质具体可为特异引物对。特异引物对由两条引物组成,一条引物为序列表的序列5所示的单链DNA分子,另一条引物为序列表的序列6所示的单链DNA分子。
本发明对于囊性纤维化患者的诊断具有重大应用价值。
附图说明
图1为胸部CT的照片。
图2为患儿、患儿父亲、患儿母亲与缺失突变甲临近区域的测序峰图。
图3为患儿、患儿父亲、患儿母亲与缺失突变乙临近区域的测序峰图。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
基因组中,CFTR基因的核苷酸序列见GENBANK ACCESSION NO.NG_016465.4所示(linear PRI 28-AUG-2016)。
CFTR基因编码的蛋白质,如序列表的序列1所示。
CFTR基因的cDNA中的读码框如序列表的序列2所示。
基因组中,CFTR基因包括27个外显子,其中第11外显子的核苷酸序列如序列表的序列3所示。基因组中,CFTR基因的第11外显子及其周边序列如序列表的序列4所示。
实施例、
一、患儿的相关信息
患儿基本情况:女1岁,于2015年8月因“反复咳嗽、喘息3月余”入院。
患儿病程:入院前3月,患儿接触“感冒”病人后出现咳嗽,为阵发性连声咳,晨起明显,喉中有痰声,伴喘息,于当地医院雾化治疗后好转;入院前2月因咳嗽、喘息加重,再次就诊于当地医院,诊断“重症肺炎”,抗感染治疗后好转;之后病情反复,为进一步诊治收入院;患儿发病以来,食欲可,大便呈油性,生长发育落后,
患儿父母及家族情况:父亲为英国人,有哮喘病史;否认囊性纤维化家族史。
2015年8月入院查体结果:体温36.9℃,体重7.5kg,身长67cm,头围44cm,呼吸30次/min,脉搏130次/min,血压80/40mmHg;体格发育落后,营养一般;桶状胸,双肺呼吸音粗,可闻及喘鸣音及湿啰音,杵状指(趾)阴性,余查体无明显异常。
2015年8月辅助检查结果:血常规、血气分析、血电解质、肾功能大致正常;大便常规脂肪球阳性;肝酶升高(ALT 85.6U/L,AST 102.8U/L),体液、细胞免疫功能正常;支气管灌洗液培养少量铜绿假单胞菌,少量嗜麦芽窄食单胞菌;胸部CT(见图1)可见少许肺炎,肺含气欠均匀,未见支气管扩张;腹部B超提示肝肋下3.1cm,实质回声欠均匀,余无异常;支气管镜检查可见气管、支气管内膜炎症,广泛粘稠分泌物阻塞。
2015年8月治疗过程:入院后先后予红霉素、头孢哌酮舒巴坦静点抗感染治疗,行3次电子支气管镜灌洗及其他对症支持治疗,49天好转出院。
二、患儿的CFTR基因测序
1、提取患儿的基因组DNA。
2、取步骤1得到的基因组DNA,进行二代测序,患儿的CFTR基因发生了复杂杂合突变,一条染色体中的CFTR基因发生了缺失突变甲(缺失了第11外显子中的第128-130位核苷酸“TCT”,对应序列2所示读码框的位置为第1520-1522位核苷酸,引起序列1所示蛋白质缺失了第508位氨基酸残基“苯丙氨酸”),另一条染色体发生了缺失突变乙(缺失了第11外显子中的第34-42位核苷酸“GAGCCTTCA”,对应序列2所示读码框的位置为第1426-1434位核苷酸,引起序列1所示蛋白质缺失了第476至478位氨基酸残基“谷氨酸-脯氨酸-丝氨酸”)。
综合步骤一的病症和步骤二的测序结果,该患儿确诊为囊性纤维化患者。
三、患儿父母的CFTR基因测序
1、分别提取患儿的父亲和母亲的基因组DNA。
2、以步骤1得到的基因组DNA为模板,采用F1和R1组成的引物对进行PCR扩增,将后将PCR扩增产物进行测序。
F1(序列表的序列5):5’-GGATGATAATTGGAGGCAAGTGA-3’;
R1(序列表的序列6):5’-AGACTAACCGATTGAATATGGAGC-3’。
患儿、患儿父亲、患儿母亲与缺失突变甲临近区域的测序峰图见图2。
患儿、患儿父亲、患儿母亲与缺失突变乙临近区域的测序峰图见图3。
结果表明:患儿父亲的一条染色体上的CFTR基因发生了缺失突变甲,另一条染色体上的CFTR基因未发生突变;患儿母亲的一条染色体上的CFTR基因发生了缺失突变乙,另一条染色体上的CFTR基因未发生突变;患儿获得了父亲CFTR基因发生了缺失突变甲的染色体和母亲CFTR基因发生了缺失突变乙的染色体,因此发生了囊性纤维化。
SEQUENCE LISTING
<110> 首都医科大学附属北京儿童医院
<120> 囊性纤维化患者的CFTR基因缺失突变形式及其应用
<130> GNCYX170283
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 1480
<212> PRT
<213> 人
<400> 1
Met Gln Arg Ser Pro Leu Glu Lys Ala Ser Val Val Ser Lys Leu Phe
1 5 10 15
Phe Ser Trp Thr Arg Pro Ile Leu Arg Lys Gly Tyr Arg Gln Arg Leu
20 25 30
Glu Leu Ser Asp Ile Tyr Gln Ile Pro Ser Val Asp Ser Ala Asp Asn
35 40 45
Leu Ser Glu Lys Leu Glu Arg Glu Trp Asp Arg Glu Leu Ala Ser Lys
50 55 60
Lys Asn Pro Lys Leu Ile Asn Ala Leu Arg Arg Cys Phe Phe Trp Arg
65 70 75 80
Phe Met Phe Tyr Gly Ile Phe Leu Tyr Leu Gly Glu Val Thr Lys Ala
85 90 95
Val Gln Pro Leu Leu Leu Gly Arg Ile Ile Ala Ser Tyr Asp Pro Asp
100 105 110
Asn Lys Glu Glu Arg Ser Ile Ala Ile Tyr Leu Gly Ile Gly Leu Cys
115 120 125
Leu Leu Phe Ile Val Arg Thr Leu Leu Leu His Pro Ala Ile Phe Gly
130 135 140
Leu His His Ile Gly Met Gln Met Arg Ile Ala Met Phe Ser Leu Ile
145 150 155 160
Tyr Lys Lys Thr Leu Lys Leu Ser Ser Arg Val Leu Asp Lys Ile Ser
165 170 175
Ile Gly Gln Leu Val Ser Leu Leu Ser Asn Asn Leu Asn Lys Phe Asp
180 185 190
Glu Gly Leu Ala Leu Ala His Phe Val Trp Ile Ala Pro Leu Gln Val
195 200 205
Ala Leu Leu Met Gly Leu Ile Trp Glu Leu Leu Gln Ala Ser Ala Phe
210 215 220
Cys Gly Leu Gly Phe Leu Ile Val Leu Ala Leu Phe Gln Ala Gly Leu
225 230 235 240
Gly Arg Met Met Met Lys Tyr Arg Asp Gln Arg Ala Gly Lys Ile Ser
245 250 255
Glu Arg Leu Val Ile Thr Ser Glu Met Ile Glu Asn Ile Gln Ser Val
260 265 270
Lys Ala Tyr Cys Trp Glu Glu Ala Met Glu Lys Met Ile Glu Asn Leu
275 280 285
Arg Gln Thr Glu Leu Lys Leu Thr Arg Lys Ala Ala Tyr Val Arg Tyr
290 295 300
Phe Asn Ser Ser Ala Phe Phe Phe Ser Gly Phe Phe Val Val Phe Leu
305 310 315 320
Ser Val Leu Pro Tyr Ala Leu Ile Lys Gly Ile Ile Leu Arg Lys Ile
325 330 335
Phe Thr Thr Ile Ser Phe Cys Ile Val Leu Arg Met Ala Val Thr Arg
340 345 350
Gln Phe Pro Trp Ala Val Gln Thr Trp Tyr Asp Ser Leu Gly Ala Ile
355 360 365
Asn Lys Ile Gln Asp Phe Leu Gln Lys Gln Glu Tyr Lys Thr Leu Glu
370 375 380
Tyr Asn Leu Thr Thr Thr Glu Val Val Met Glu Asn Val Thr Ala Phe
385 390 395 400
Trp Glu Glu Gly Phe Gly Glu Leu Phe Glu Lys Ala Lys Gln Asn Asn
405 410 415
Asn Asn Arg Lys Thr Ser Asn Gly Asp Asp Ser Leu Phe Phe Ser Asn
420 425 430
Phe Ser Leu Leu Gly Thr Pro Val Leu Lys Asp Ile Asn Phe Lys Ile
435 440 445
Glu Arg Gly Gln Leu Leu Ala Val Ala Gly Ser Thr Gly Ala Gly Lys
450 455 460
Thr Ser Leu Leu Met Val Ile Met Gly Glu Leu Glu Pro Ser Glu Gly
465 470 475 480
Lys Ile Lys His Ser Gly Arg Ile Ser Phe Cys Ser Gln Phe Ser Trp
485 490 495
Ile Met Pro Gly Thr Ile Lys Glu Asn Ile Ile Phe Gly Val Ser Tyr
500 505 510
Asp Glu Tyr Arg Tyr Arg Ser Val Ile Lys Ala Cys Gln Leu Glu Glu
515 520 525
Asp Ile Ser Lys Phe Ala Glu Lys Asp Asn Ile Val Leu Gly Glu Gly
530 535 540
Gly Ile Thr Leu Ser Gly Gly Gln Arg Ala Arg Ile Ser Leu Ala Arg
545 550 555 560
Ala Val Tyr Lys Asp Ala Asp Leu Tyr Leu Leu Asp Ser Pro Phe Gly
565 570 575
Tyr Leu Asp Val Leu Thr Glu Lys Glu Ile Phe Glu Ser Cys Val Cys
580 585 590
Lys Leu Met Ala Asn Lys Thr Arg Ile Leu Val Thr Ser Lys Met Glu
595 600 605
His Leu Lys Lys Ala Asp Lys Ile Leu Ile Leu His Glu Gly Ser Ser
610 615 620
Tyr Phe Tyr Gly Thr Phe Ser Glu Leu Gln Asn Leu Gln Pro Asp Phe
625 630 635 640
Ser Ser Lys Leu Met Gly Cys Asp Ser Phe Asp Gln Phe Ser Ala Glu
645 650 655
Arg Arg Asn Ser Ile Leu Thr Glu Thr Leu His Arg Phe Ser Leu Glu
660 665 670
Gly Asp Ala Pro Val Ser Trp Thr Glu Thr Lys Lys Gln Ser Phe Lys
675 680 685
Gln Thr Gly Glu Phe Gly Glu Lys Arg Lys Asn Ser Ile Leu Asn Pro
690 695 700
Ile Asn Ser Ile Arg Lys Phe Ser Ile Val Gln Lys Thr Pro Leu Gln
705 710 715 720
Met Asn Gly Ile Glu Glu Asp Ser Asp Glu Pro Leu Glu Arg Arg Leu
725 730 735
Ser Leu Val Pro Asp Ser Glu Gln Gly Glu Ala Ile Leu Pro Arg Ile
740 745 750
Ser Val Ile Ser Thr Gly Pro Thr Leu Gln Ala Arg Arg Arg Gln Ser
755 760 765
Val Leu Asn Leu Met Thr His Ser Val Asn Gln Gly Gln Asn Ile His
770 775 780
Arg Lys Thr Thr Ala Ser Thr Arg Lys Val Ser Leu Ala Pro Gln Ala
785 790 795 800
Asn Leu Thr Glu Leu Asp Ile Tyr Ser Arg Arg Leu Ser Gln Glu Thr
805 810 815
Gly Leu Glu Ile Ser Glu Glu Ile Asn Glu Glu Asp Leu Lys Glu Cys
820 825 830
Phe Phe Asp Asp Met Glu Ser Ile Pro Ala Val Thr Thr Trp Asn Thr
835 840 845
Tyr Leu Arg Tyr Ile Thr Val His Lys Ser Leu Ile Phe Val Leu Ile
850 855 860
Trp Cys Leu Val Ile Phe Leu Ala Glu Val Ala Ala Ser Leu Val Val
865 870 875 880
Leu Trp Leu Leu Gly Asn Thr Pro Leu Gln Asp Lys Gly Asn Ser Thr
885 890 895
His Ser Arg Asn Asn Ser Tyr Ala Val Ile Ile Thr Ser Thr Ser Ser
900 905 910
Tyr Tyr Val Phe Tyr Ile Tyr Val Gly Val Ala Asp Thr Leu Leu Ala
915 920 925
Met Gly Phe Phe Arg Gly Leu Pro Leu Val His Thr Leu Ile Thr Val
930 935 940
Ser Lys Ile Leu His His Lys Met Leu His Ser Val Leu Gln Ala Pro
945 950 955 960
Met Ser Thr Leu Asn Thr Leu Lys Ala Gly Gly Ile Leu Asn Arg Phe
965 970 975
Ser Lys Asp Ile Ala Ile Leu Asp Asp Leu Leu Pro Leu Thr Ile Phe
980 985 990
Asp Phe Ile Gln Leu Leu Leu Ile Val Ile Gly Ala Ile Ala Val Val
995 1000 1005
Ala Val Leu Gln Pro Tyr Ile Phe Val Ala Thr Val Pro Val Ile
1010 1015 1020
Val Ala Phe Ile Met Leu Arg Ala Tyr Phe Leu Gln Thr Ser Gln
1025 1030 1035
Gln Leu Lys Gln Leu Glu Ser Glu Gly Arg Ser Pro Ile Phe Thr
1040 1045 1050
His Leu Val Thr Ser Leu Lys Gly Leu Trp Thr Leu Arg Ala Phe
1055 1060 1065
Gly Arg Gln Pro Tyr Phe Glu Thr Leu Phe His Lys Ala Leu Asn
1070 1075 1080
Leu His Thr Ala Asn Trp Phe Leu Tyr Leu Ser Thr Leu Arg Trp
1085 1090 1095
Phe Gln Met Arg Ile Glu Met Ile Phe Val Ile Phe Phe Ile Ala
1100 1105 1110
Val Thr Phe Ile Ser Ile Leu Thr Thr Gly Glu Gly Glu Gly Arg
1115 1120 1125
Val Gly Ile Ile Leu Thr Leu Ala Met Asn Ile Met Ser Thr Leu
1130 1135 1140
Gln Trp Ala Val Asn Ser Ser Ile Asp Val Asp Ser Leu Met Arg
1145 1150 1155
Ser Val Ser Arg Val Phe Lys Phe Ile Asp Met Pro Thr Glu Gly
1160 1165 1170
Lys Pro Thr Lys Ser Thr Lys Pro Tyr Lys Asn Gly Gln Leu Ser
1175 1180 1185
Lys Val Met Ile Ile Glu Asn Ser His Val Lys Lys Asp Asp Ile
1190 1195 1200
Trp Pro Ser Gly Gly Gln Met Thr Val Lys Asp Leu Thr Ala Lys
1205 1210 1215
Tyr Thr Glu Gly Gly Asn Ala Ile Leu Glu Asn Ile Ser Phe Ser
1220 1225 1230
Ile Ser Pro Gly Gln Arg Val Gly Leu Leu Gly Arg Thr Gly Ser
1235 1240 1245
Gly Lys Ser Thr Leu Leu Ser Ala Phe Leu Arg Leu Leu Asn Thr
1250 1255 1260
Glu Gly Glu Ile Gln Ile Asp Gly Val Ser Trp Asp Ser Ile Thr
1265 1270 1275
Leu Gln Gln Trp Arg Lys Ala Phe Gly Val Ile Pro Gln Lys Val
1280 1285 1290
Phe Ile Phe Ser Gly Thr Phe Arg Lys Asn Leu Asp Pro Tyr Glu
1295 1300 1305
Gln Trp Ser Asp Gln Glu Ile Trp Lys Val Ala Asp Glu Val Gly
1310 1315 1320
Leu Arg Ser Val Ile Glu Gln Phe Pro Gly Lys Leu Asp Phe Val
1325 1330 1335
Leu Val Asp Gly Gly Cys Val Leu Ser His Gly His Lys Gln Leu
1340 1345 1350
Met Cys Leu Ala Arg Ser Val Leu Ser Lys Ala Lys Ile Leu Leu
1355 1360 1365
Leu Asp Glu Pro Ser Ala His Leu Asp Pro Val Thr Tyr Gln Ile
1370 1375 1380
Ile Arg Arg Thr Leu Lys Gln Ala Phe Ala Asp Cys Thr Val Ile
1385 1390 1395
Leu Cys Glu His Arg Ile Glu Ala Met Leu Glu Cys Gln Gln Phe
1400 1405 1410
Leu Val Ile Glu Glu Asn Lys Val Arg Gln Tyr Asp Ser Ile Gln
1415 1420 1425
Lys Leu Leu Asn Glu Arg Ser Leu Phe Arg Gln Ala Ile Ser Pro
1430 1435 1440
Ser Asp Arg Val Lys Leu Phe Pro His Arg Asn Ser Ser Lys Cys
1445 1450 1455
Lys Ser Lys Pro Gln Ile Ala Ala Leu Lys Glu Glu Thr Glu Glu
1460 1465 1470
Glu Val Gln Asp Thr Arg Leu
1475 1480
<210> 2
<211> 4443
<212> DNA
<213> 人
<400> 2
atgcagaggt cgcctctgga aaaggccagc gttgtctcca aacttttttt cagctggacc 60
agaccaattt tgaggaaagg atacagacag cgcctggaat tgtcagacat ataccaaatc 120
ccttctgttg attctgctga caatctatct gaaaaattgg aaagagaatg ggatagagag 180
ctggcttcaa agaaaaatcc taaactcatt aatgcccttc ggcgatgttt tttctggaga 240
tttatgttct atggaatctt tttatattta ggggaagtca ccaaagcagt acagcctctc 300
ttactgggaa gaatcatagc ttcctatgac ccggataaca aggaggaacg ctctatcgcg 360
atttatctag gcataggctt atgccttctc tttattgtga ggacactgct cctacaccca 420
gccatttttg gccttcatca cattggaatg cagatgagaa tagctatgtt tagtttgatt 480
tataagaaga ctttaaagct gtcaagccgt gttctagata aaataagtat tggacaactt 540
gttagtctcc tttccaacaa cctgaacaaa tttgatgaag gacttgcatt ggcacatttc 600
gtgtggatcg ctcctttgca agtggcactc ctcatggggc taatctggga gttgttacag 660
gcgtctgcct tctgtggact tggtttcctg atagtccttg ccctttttca ggctgggcta 720
gggagaatga tgatgaagta cagagatcag agagctggga agatcagtga aagacttgtg 780
attacctcag aaatgattga aaatatccaa tctgttaagg catactgctg ggaagaagca 840
atggaaaaaa tgattgaaaa cttaagacaa acagaactga aactgactcg gaaggcagcc 900
tatgtgagat acttcaatag ctcagccttc ttcttctcag ggttctttgt ggtgttttta 960
tctgtgcttc cctatgcact aatcaaagga atcatcctcc ggaaaatatt caccaccatc 1020
tcattctgca ttgttctgcg catggcggtc actcggcaat ttccctgggc tgtacaaaca 1080
tggtatgact ctcttggagc aataaacaaa atacaggatt tcttacaaaa gcaagaatat 1140
aagacattgg aatataactt aacgactaca gaagtagtga tggagaatgt aacagccttc 1200
tgggaggagg gatttgggga attatttgag aaagcaaaac aaaacaataa caatagaaaa 1260
acttctaatg gtgatgacag cctcttcttc agtaatttct cacttcttgg tactcctgtc 1320
ctgaaagata ttaatttcaa gatagaaaga ggacagttgt tggcggttgc tggatccact 1380
ggagcaggca agacttcact tctaatggtg attatgggag aactggagcc ttcagagggt 1440
aaaattaagc acagtggaag aatttcattc tgttctcagt tttcctggat tatgcctggc 1500
accattaaag aaaatatcat ctttggtgtt tcctatgatg aatatagata cagaagcgtc 1560
atcaaagcat gccaactaga agaggacatc tccaagtttg cagagaaaga caatatagtt 1620
cttggagaag gtggaatcac actgagtgga ggtcaacgag caagaatttc tttagcaaga 1680
gcagtataca aagatgctga tttgtattta ttagactctc cttttggata cctagatgtt 1740
ttaacagaaa aagaaatatt tgaaagctgt gtctgtaaac tgatggctaa caaaactagg 1800
attttggtca cttctaaaat ggaacattta aagaaagctg acaaaatatt aattttgcat 1860
gaaggtagca gctattttta tgggacattt tcagaactcc aaaatctaca gccagacttt 1920
agctcaaaac tcatgggatg tgattctttc gaccaattta gtgcagaaag aagaaattca 1980
atcctaactg agaccttaca ccgtttctca ttagaaggag atgctcctgt ctcctggaca 2040
gaaacaaaaa aacaatcttt taaacagact ggagagtttg gggaaaaaag gaagaattct 2100
attctcaatc caatcaactc tatacgaaaa ttttccattg tgcaaaagac tcccttacaa 2160
atgaatggca tcgaagagga ttctgatgag cctttagaga gaaggctgtc cttagtacca 2220
gattctgagc agggagaggc gatactgcct cgcatcagcg tgatcagcac tggccccacg 2280
cttcaggcac gaaggaggca gtctgtcctg aacctgatga cacactcagt taaccaaggt 2340
cagaacattc accgaaagac aacagcatcc acacgaaaag tgtcactggc ccctcaggca 2400
aacttgactg aactggatat atattcaaga aggttatctc aagaaactgg cttggaaata 2460
agtgaagaaa ttaacgaaga agacttaaag gagtgctttt ttgatgatat ggagagcata 2520
ccagcagtga ctacatggaa cacatacctt cgatatatta ctgtccacaa gagcttaatt 2580
tttgtgctaa tttggtgctt agtaattttt ctggcagagg tggctgcttc tttggttgtg 2640
ctgtggctcc ttggaaacac tcctcttcaa gacaaaggga atagtactca tagtagaaat 2700
aacagctatg cagtgattat caccagcacc agttcgtatt atgtgtttta catttacgtg 2760
ggagtagccg acactttgct tgctatggga ttcttcagag gtctaccact ggtgcatact 2820
ctaatcacag tgtcgaaaat tttacaccac aaaatgttac attctgttct tcaagcacct 2880
atgtcaaccc tcaacacgtt gaaagcaggt gggattctta atagattctc caaagatata 2940
gcaattttgg atgaccttct gcctcttacc atatttgact tcatccagtt gttattaatt 3000
gtgattggag ctatagcagt tgtcgcagtt ttacaaccct acatctttgt tgcaacagtg 3060
ccagtgatag tggcttttat tatgttgaga gcatatttcc tccaaacctc acagcaactc 3120
aaacaactgg aatctgaagg caggagtcca attttcactc atcttgttac aagcttaaaa 3180
ggactatgga cacttcgtgc cttcggacgg cagccttact ttgaaactct gttccacaaa 3240
gctctgaatt tacatactgc caactggttc ttgtacctgt caacactgcg ctggttccaa 3300
atgagaatag aaatgatttt tgtcatcttc ttcattgctg ttaccttcat ttccatttta 3360
acaacaggag aaggagaagg aagagttggt attatcctga ctttagccat gaatatcatg 3420
agtacattgc agtgggctgt aaactccagc atagatgtgg atagcttgat gcgatctgtg 3480
agccgagtct ttaagttcat tgacatgcca acagaaggta aacctaccaa gtcaaccaaa 3540
ccatacaaga atggccaact ctcgaaagtt atgattattg agaattcaca cgtgaagaaa 3600
gatgacatct ggccctcagg gggccaaatg actgtcaaag atctcacagc aaaatacaca 3660
gaaggtggaa atgccatatt agagaacatt tccttctcaa taagtcctgg ccagagggtg 3720
ggcctcttgg gaagaactgg atcagggaag agtactttgt tatcagcttt tttgagacta 3780
ctgaacactg aaggagaaat ccagatcgat ggtgtgtctt gggattcaat aactttgcaa 3840
cagtggagga aagcctttgg agtgatacca cagaaagtat ttattttttc tggaacattt 3900
agaaaaaact tggatcccta tgaacagtgg agtgatcaag aaatatggaa agttgcagat 3960
gaggttgggc tcagatctgt gatagaacag tttcctggga agcttgactt tgtccttgtg 4020
gatgggggct gtgtcctaag ccatggccac aagcagttga tgtgcttggc tagatctgtt 4080
ctcagtaagg cgaagatctt gctgcttgat gaacccagtg ctcatttgga tccagtaaca 4140
taccaaataa ttagaagaac tctaaaacaa gcatttgctg attgcacagt aattctctgt 4200
gaacacagga tagaagcaat gctggaatgc caacaatttt tggtcataga agagaacaaa 4260
gtgcggcagt acgattccat ccagaaactg ctgaacgaga ggagcctctt ccggcaagcc 4320
atcagcccct ccgacagggt gaagctcttt ccccaccgga actcaagcaa gtgcaagtct 4380
aagccccaga ttgctgctct gaaagaggag acagaagaag aggtgcaaga tacaaggctt 4440
tag 4443
<210> 3
<211> 192
<212> DNA
<213> 人
<400> 3
acttcacttc taatggtgat tatgggagaa ctggagcctt cagagggtaa aattaagcac 60
agtggaagaa tttcattctg ttctcagttt tcctggatta tgcctggcac cattaaagaa 120
aatatcatct ttggtgtttc ctatgatgaa tatagataca gaagcgtcat caaagcatgc 180
caactagaag ag 192
<210> 4
<211> 359
<212> DNA
<213> 人
<400> 4
ggatgataat tggaggcaag tgaatcctga gcgtgatttg ataatgacct aataatgatg 60
ggttttattt ccagacttca cttctaatgg tgattatggg agaactggag ccttcagagg 120
gtaaaattaa gcacagtgga agaatttcat tctgttctca gttttcctgg attatgcctg 180
gcaccattaa agaaaatatc atctttggtg tttcctatga tgaatataga tacagaagcg 240
tcatcaaagc atgccaacta gaagaggtaa gaaactatgt gaaaactttt tgattatgca 300
tatgaaccct tcacactacc caaattatat atttggctcc atattcaatc ggttagtct 359
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<400> 5
ggatgataat tggaggcaag tga 23
<210> 6
<211> 24
<212> DNA
<213> 人工序列
<400> 6
agactaaccg attgaatatg gagc 24