本发明涉及一种b-all患者预后风险评估标记物。
背景技术:
b系急性淋巴细胞白血病(acutelymphoblasticleukemia,all)是成人最常见的all类型,危险分层和治疗方式的进步显著改善了患者的预后,但成人b-all复发率高,总体预后仍较差,长期生存仅为30%-40%。目前的危险度分层根据年龄,初诊白细胞计数,染色体核型,中枢神经系统受累以及对初始治疗的反应等将患者分为标危和高危。但值得注意的是,标危患者中仍有部分患者复发,提示目前的危险度分层仍有待精准化,因此新的预后相关分子标记物的发现和验证对于更精确的危险度分层十分必要,且可能提供治疗靶点。
人类diaph1基因(ncbi编号:nm_001079812)位于5q31.3,编码成蛋白mdia,属于rho效应蛋白,主要与肌动蛋白聚合作用、稳定微管有关,从而影响细胞的形态以及黏附、迁移、分裂等功能,并参与疾病的发生发展。家系研究发现,人类diaph1纯合失活突变与多种神经系统疾病相关,包括小头畸形、早发癫痫、视力障碍、智力障碍等。
技术实现要素:
本发明的目的是提供一种b-all患者预后风险评估标记物。
本发明提供了用于检测diaph1基因的产品在制备试剂盒中的应用;所述试剂盒的用途为如下(a1)-(a4)中的至少一种:
(a1)b系急性淋巴细胞白血病患者预后风险评估;
(a2)b系急性淋巴细胞白血病患者预后复发率评估;
(a3)b系急性淋巴细胞白血病患者预后无复发生存率评估;
(a4)b系急性淋巴细胞白血病分层诊断。
本发明还保护用于检测diaph1基因突变的产品在制备试剂盒中的应用;所述试剂盒的用途为如下(a1)-(a4)中的至少一种:
(a1)b系急性淋巴细胞白血病患者预后风险评估;
(a2)b系急性淋巴细胞白血病患者预后复发率评估;
(a3)b系急性淋巴细胞白血病患者预后无复发生存率评估;
(a4)b系急性淋巴细胞白血病分层诊断。
本发明还保护一种试剂盒,包括用于检测diaph1基因的产品;所述试剂盒的用途为如下(a1)-(a4)中的至少一种:
(a1)b系急性淋巴细胞白血病患者预后风险评估;
(a2)b系急性淋巴细胞白血病患者预后复发率评估;
(a3)b系急性淋巴细胞白血病患者预后无复发生存率评估;
(a4)b系急性淋巴细胞白血病分层诊断。
本发明还保护一种试剂盒,包括用于检测diaph1基因突变的产品;所述试剂盒的用途为如下(a1)-(a4)中的至少一种:
(a1)b系急性淋巴细胞白血病患者预后风险评估;
(a2)b系急性淋巴细胞白血病患者预后复发率评估;
(a3)b系急性淋巴细胞白血病患者预后无复发生存率评估;
(a4)b系急性淋巴细胞白血病分层诊断。
本发明还保护diaph1基因作为靶标在b系急性淋巴细胞白血病患者预后风险评估中的应用。
本发明还保护diaph1基因作为靶标在b系急性淋巴细胞白血病患者预后复发率评估中的应用。
本发明还保护diaph1基因作为靶标在b系急性淋巴细胞白血病患者预后无复发生存率评估中的应用。
本发明还保护一种b系急性淋巴细胞白血病患者预后风险评估方法,包括如下步骤:检测待测患者单核细胞dna中diaph1基因突变情况,根据diaph1基因突变情况进行患者预后风险评估。
所述方法中,如果待测患者单核细胞dna中diaph1基因发生突变,待测患者与diaph1基因未发生突变的患者相比,预后复发率高、无复发生存率低。
本发明还保护一种b系急性淋巴细胞白血病患者预后复发率评估方法,包括如下步骤:检测待测患者单核细胞dna中diaph1基因突变情况,根据diaph1基因突变情况进行患者预后复发率评估。
所述方法中,如果待测患者单核细胞dna中diaph1基因发生突变,待测患者与diaph1基因未发生突变的患者相比,预后复发率高。
本发明还保护一种b系急性淋巴细胞白血病患者预后无复发生存率评估方法,包括如下步骤:检测待测患者单核细胞dna中diaph1基因突变情况,根据diaph1基因突变情况进行患者预后无复发生存率评估。
所述方法中,如果待测患者单核细胞dna中diaph1基因发生突变,待测患者与diaph1基因未发生突变的患者相比,无复发生存率低。
以上任一所述diaph1基因全长如序列表的序列1所示,diaph1基因编码区序列如序列表的序列2所示,diaph1基因编码的蛋白质(diaph1蛋白)如序列表的序列3所示。
以上任一所述diaph1基因突变包括单核苷酸变异、小片段插入缺失和拷贝数变异。
以上任一所述diaph1基因突变具体可为如下(b1)-(b5)中的任一种:
(b1)编码野生型diaph1蛋白(序列表的序列3)第817位氨基酸残基的密码子由编码s的密码子突变为编码p的密码子;
(b2)编码野生型diaph1蛋白(序列表的序列3)第58位氨基酸残基的密码子由编码a的密码子突变为编码v的密码子;
(b3)编码野生型diaph1蛋白(序列表的序列3)第658位氨基酸残基的密码子由编码s的密码子突变为编码p的密码子;
(b4)编码野生型diaph1蛋白(序列表的序列3)第725位氨基酸残基的密码子由编码g的密码子突变为编码r的密码子;
(b5)编码野生型diaph1蛋白(序列表的序列3)第749位氨基酸残基的密码子由编码p的密码子突变为编码s的密码子;
以上任一所述diaph1基因突变具体可为如下(c1)-(c5)中的任一种:
(c1)与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第2449位核苷酸由t突变为c;
(c2)与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第173位核苷酸由c突变为t;
(c3)与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第1972位核苷酸由t突变为c;
(c4)与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第2173位核苷酸由g突变为a;
(c5)与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第2245位核苷酸由c突变为t。
本发明通过研究发现diaph1基因突变是成人b-all患者累计复发率(cir)和无复发生存率(rfs)的独立危险因素。本发明可能在b-all的分层诊断和预后评估中发挥重要作用。
附图说明
图1为患者累计复发率(cir)和无复发生存率(rfs)统计结果。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
完全缓解(cr)定义为骨髓原始淋巴细胞<5%,中性粒细胞>1.0×109/l,血细胞>100×109/l,无髓外复发,持续4周以上。
复发定义为完全缓解的患者出现骨髓原始细胞>5%或髓外白血病(参照文献:j.c.alvarnas,p.a.brown,p.aoun,k.k.ballen,n.bellam,w.blum,etal.,acutelymphoblasticleukemia,j.natl.compr.canc.netw.jnccn10(2012)858–914.)。
diaph1基因全长如序列表的序列1所示,diaph1基因编码区序列如序列表的序列2所示,diaph1基因编码序列3所示的蛋白质。
实施例1、diaph1基因突变与b-all患者预后风险评估
一、研究对象
收集2007年4月至2015年12月北京大学人民医院初诊为b-all的226例患者作为研究组。入选标准:①年龄≥14岁;②符合b-all标准诊断(参照who关于前体b和t细胞肿瘤分类标准);③均为初诊,未进行任何相关治疗。患者或患者监护人(若患者年龄<18岁)均签署知情同意书。本研究获得北京大学人民医院医学伦理会批准,遵循赫尔辛基宣言。患者情况观察截止时间为2016年4月30日。
二、治疗方案
所有患者接受诱导化疗(共1-2个疗程),若患者达完全缓解,给予巩固化疗2疗程;2疗程巩固化疗后,根据患者意愿,部分患者再进行0-2个疗程巩固化疗后行造血干细胞移植,其它未移植的患者继续接受巩固化疗1-1.5年,后继续进行维持化疗至少1年。
226例患者中,共203例患者达到完全缓解。完全缓解的患者中,123例患者进行造血干细胞移植,80例患者未进行移植。
1个疗程的诱导化疗方案为:长春新碱1.5mg/m2/天,在治疗第1、8、15和22天给予;柔红霉素45mg/m2/天,在治疗第1-3天和第15-17天给予;环磷酰胺800mg/m2/天,在治疗第1天和第15天给予;泼尼松60mg/m2/天,在治疗第1-19天给予;左旋门冬酰胺酶10,000u/m2/天,在治疗第19-28天给予。
1个疗程的巩固化疗方案为:甲氨蝶呤1g/m2/天,在治疗第1天给予;阿糖胞苷6g/m2/天,在治疗第2-7天给予;环磷酰胺600mg/m2/天,在治疗第1-3天给予;柔红霉素50mg/m2/天,在治疗第4-5天给予;长春新碱2mg/m2/天,在治疗第4天给予;地塞米松40mg/天,在治疗第1-4天和第11-14天给予;甲氨蝶呤和左旋门冬酰胺酶(甲氨蝶呤1g/m2/天,在治疗第1天给予;左旋门冬酰胺酶10,000u/m2/天,在治疗第2-8天给予)或cam(环磷酰胺800mg/m2/天,在治疗第1天给予;阿糖胞苷100/m2/天,在治疗第1-7天给予;6-巯基嘌呤75mg/m2/天,在治疗第1-7天给予;)交替使用。
维持化疗方案为:6-巯基嘌呤50mg/m2/天,每天1次;甲氨蝶呤mtx20mg/m2/天,每周1次。
中枢神经系统白血病预防:患者在诱导和巩固化疗期间接受8-10次三联药物(甲氨蝶呤、阿糖胞苷和地塞米松)鞘内注射(参照文献:yanch,jiangq,wangj,xulp,liudh,jiangh,chenh,zhangxh,liuky,huangxj.superiorsurvivalofunmanipulatedhaploidenticalhematopoieticstemcelltransplantationcomparedwithchemotherapyaloneusedaspost-remissiontherapyinadultswithstandard-riskacutelymphoblasticleukemiainfirstcompleteremission.biolbloodmarrowtransplant.2014sep;20(9):1314-21.)。
123例(54%)患者接受异基因造血干细胞移植,34例(28%)hla全相合,87例(71%)hla半相合(1个hla抗原不合4例,2个hla抗原不合20例,3个hla抗原不合63例),1例(1%)非血缘hla全相合,1例(1%)自体移植。hla全合移植患者及自体移植患者,预处理方案包括:阿糖胞苷(ara-c),环磷酰胺(ctx),白舒菲(bu)以及甲环己亚硝脲(meccnu)。对hla不合/单倍体移植患者或非血缘hla全相合移植患者,预处理方案加用抗人胸腺球蛋白(atg)。所有供者均接受rhg-csf5μg/(kg·d),连续皮下注射5-6天。第4天采集骨髓,有核细胞要求达3-4×108/kg;第5-6天应用cobe血细胞分离机采集外周血干细胞,循环总量约10l,总单个核细胞达3-4×108/kg;非血缘供者不采集骨髓,第5-6天应用cobe血细胞分离机采集外周血干细胞,循环总量约10l,总单个核细胞达6-8×108/kg。所有采集物根据供受者abo血型相合程度进行必要的去红和/或去浆处理后立即回输给患者。移植物抗宿主病预防采用环孢素,骁悉和短程环磷酰胺联合方案(参照文献:huangxj,liudh,liuky,xulp,chenh,hanw,chenyh,zhangxh,ludp.treatmentofacuteleukemiawithunmanipulatedhla-mismatched/haploidenticalbloodandbonemarrowtransplantation.biolbloodmarrowtransplant.2009feb;15(2):257-65.)。
三、测序研究方案
1、标本采集
226例患者均在初诊时进行标本采集,其中203例完全缓解的患者均在首次完全缓解时再次进行标本采集。采集方法为:采集患者骨髓4ml,加入edta抗凝,应用密度梯度离心法提取单个核细胞。采用美国invitrogen公司dnazol提取单个核细胞总dna。
2、对步骤1得到的样本进行测序分析,具体如下:
(1)配对样本:从203例完全缓解患者的样本中,随机抽取104对样本(初诊期+完全缓解期),其中8对样本进行全基因组测序(wgs)测序分析,13对样本进行全外显子组测序(wes)分析,88对样本进行目标靶区测序(trs)分析。这其中,5对样本同时做了wes和trs用于验证。
(2)仅初诊样本:226例中的其余患者初诊期样本(共122例样本)仅进行目标靶区测序(trs)分析。
全基因组测序(wgs):取总量0.5μg以上的dna样品建库。利用covaris破碎仪将基因组dna随机打断成长度为350bp的片段,经末端修复、磷酸化以及加a尾后,片段两端分别连接接头,制备成dna文库。文库构建完成后,利用美国bcekman公司的ampurexpsystem进行纯化,随后使用agilent2100对文库的insertsize进行检测,insertsize符合预期后,使用q-pcr方法对文库的有效浓度(3nmol/l)进行准确定量,以保证文库质量。利用美国hiseqxpecluster试剂盒聚集样本,然后进行illuminahiseqpe150测序。
全外显子组测序(wes)和目标靶区测序(trs):取总量0.6μg以上的dna样品建库。wes测序文库通过美国agilent公司的agilentsureselecthumanallexon试剂盒构建,trs由agilentsureselecthumancustomdesignpanel(310个基因,表1)构建。样本由美国covaris公司hydrodynamicshearingsystem生成180-280bp的片段。经末端修复、加a尾和连接接头后进行pcr。然后利用生物素标记的探针进行杂交,用链霉素磁珠捕获外显子组区域。对捕获的区域加上标签后进行测序。产物纯化、库检、聚集及测序同wgs。
表1设计面板的310个基因
测序数据质量控制:高通量测序得到的原始图像数据经碱基识别分析转化为原始测序序列,结果以fastq文件格式存储,其中包含测序序列的序列信息以及其对应的测序质量信息。测序得到的原始数据中会有少量序列包含接头信息、低质量碱基或未检出的碱基,对后续信息分析造成很大干扰。为了保证信息分析质量,必须对原始数据进行精细过滤,得到无污染的序列用于后续分析。数据过滤主要包括成对去除以下三种情况的序列:1)、含有接头序列的序列;2)、单端序列中n(n表示无法确定碱基信息)的碱基个数超过该条序列碱基总数的10%的序列;3)、单端序列中低质量(质量值低于5)碱基数超过该条序列长度比例的50%的序列。
序列比对及加工:有效测序数据通过bwa软件(参照文献:lih,durbinr.fastandaccurateshortreadalignmentwithburrows-wheelertransform[j].bioinformatics,2009,25(14):1754-1760.)比对到参考基因组,得到bam格式的最初的比对结果。利用samtools(参照文献:lih,handsakerb,wysokera,etal.thesequencealignment/mapformatandsamtools[j].bioinformatics,2009,25(16):2078-2079.)、picard(http://broadinstitute.github.io/picard/)和gatk软件(参照文献:depristoma,bankse,poplinr,etal.aframeworkforvariationdiscoveryandgenotypingusingnext-generationdnasequencingdata[j].natgenet,2011,43(5):491-498.)整理bam文件,并进行标记重复、局部重新排列、碱基质量再校准等处理,从而得到bam格式的最终比对结果。利用比对到基因组上的有效数据进行测序覆盖度和深度的统计(表2)。
表2测序深度和覆盖度统计
3、将步骤2得到的结果进行分析
(1)配对样本分析:利用mutect软件(参照文献:cibulskisk,lawrencems,cartersl,etal.sensitivedetectionofsomaticpointmutationsinimpureandheterogeneouscancersamples[j].natbiotechnol,2013,31(3):213-219.)检测单核苷酸变异(snvs)。strelka软件检测插入缺失(indels)(参照文献:saundersct,wongws,swamys,etal.strelka:accuratesomaticsmall-variantcallingfromsequencedtumor-normalsamplepairs[j].bioinformatics,2012,28(14):1811-1817.)。control-freec软件检测拷贝数变异(参照文献:boevav,popovat,bleakleyk,etal.control-freec:atoolforassessingcopynumberandalleliccontentusingnext-generationsequencingdata[j].bioinformatics,2012,28(3):423-425.)。annovar软件(参照文献:wangk,lim,hakonarsonh.annovar:functionalannotationofgeneticvariantsfromhigh-throughputsequencingdata[j].nucleicacidsres,2010,38(16):e164.)对检测的体细胞突变进行注释。利用千人基因组数据库(参照文献:abecasisgr,autona,brooksld,etal.anintegratedmapofgeneticvariationfrom1,092humangenomes[j].nature,2012,491(7422):56-65.)或exac数据库(参照文献:lekm,karczewskikj,minikelev,etal.analysisofprotein-codinggeneticvariationin60,706humans[j].nature,2016,536(7616):285-291.)过滤掉人群中频率大于0.01的变异位点,去除个体间多样性位点,保留频率低于0.01的变异位点。music软件(参照文献:deesnd,zhangq,kandothc,etal.music:identifyingmutationalsignificanceincancergenomes[j].genomeres,2012,22(8):1589-1598.)用于检测高频突变基因,gistic软件(beroukhimr,getzg,nghiemphul,etal.assessingthesignificanceofchromosomalaberrationsincancer:methodologyandapplicationtoglioma[j].procnatlacadsciusa,2007,104(50):20007-20012.)。
(2)仅初诊样本分析:利用samtools检测单核苷酸多态性,再通过以下步骤进行snvs过滤:1)、比对千人基因组数据库或exac数据库,过滤掉人群中频率大于0.01的变异位点;2)、过滤掉在构建的88例正常人群trs数据库中的多态性位点。
88例正常人群trs数据库为步骤2中88对用于目标靶区测序(trs)分析的配对样本中的缓解期样本数据组成的数据库。
采用spss19.0,graphadprism5.0和r统计软件进行数据分析。运用kaplan-meier法计算生存率,log-rank检验进行生存分析,建立cox比例风险回归模型对diaph1基因突变情况及其他可能影响预后的因素进行多因素分析,研究diaph1基因突变对累积复发率(cir)和无复发生存率(rfs)等预后指标的影响。p>0.1变量从模型中去除,以p<0.05为差异有统计学意义。
四、研究结果
高频基因突变显示,在226例患者中,共有diaph1突变(均为点突变)阳性患者8例,占4%,为首次在成人b-all报道的高频突变基因。
8例diaph1突变阳性患者具体突变情况如下:
3例:与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第2449位核苷酸由t突变为c,与野生型diaph1蛋白(序列表的序列3)的区别在于:第817位氨基酸由s突变为p;
2例:与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第173位核苷酸由c突变为t,与野生型diaph1蛋白(序列表的序列3)的区别在于:第58位氨基酸由a突变为v;
1例:与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第1972位核苷酸由t突变为c,与野生型diaph1蛋白(序列表的序列3)的区别在于:第658位氨基酸由s突变为p;
1例:与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第2173位核苷酸由g突变为a,与野生型diaph1蛋白(序列表的序列3)的区别在于:第725位氨基酸由g突变为r;
1例:与野生型diaph1基因的编码区(序列表的序列2)的区别在于:第2245位核苷酸由c突变为t,与野生型diaph1蛋白(序列表的序列3)的区别在于:第749位氨基酸由p突变为s。
把获得完全缓解的患者纳入生存分析。总共203例患者获得完全缓解,其中diaph1突变阳性患者7例。临床资料提示,7例diaph1突变阳性患者均出现复发,其中接受移植患者2例,截至随访终点仍然存活;未接受移植患者5例,4例死亡。diaph1野生型患者复发65例,其中接受移植患者121例,截至随访时间存活99例;未接受移植患者75例,19例死亡。
单因素分析提示,diaph1突变型患者5年cir为100%,5年rfs为0%;diaph1野生型患者5年cir为47%,5年rfs为50%。diaph1突变型患者5年cir更高(100%,95%可信区间[59,100%]vs.47%,95%可信区间[40,54%];p=<0.001)以及更差的5年rfs(0,95%可信区间[0,41%]vs.50%,95%可信区间[43,57%];p=<0.001)(图1)。
纳入diaph1突变、年龄(按照年龄对患者进行分组,分为大于等于35岁或小于35岁)、性别、mrd、白细胞计数(按照初诊时白细胞计数对患者进行分组,分为大于等于30×109/l或小于30×109/l)、ikzf1缺失、bcr-abl1、mll重排和治疗方式(是否移植)预后相关因素,多因素分析显示,diaph1突变是cir(hr=4.3[1.7,11.0];p=0.002)和rfs(hr=4.1[1.8,9.2];p=0.001)的独立危险因素。其他因素中,造血干细胞移植是cir(hr=0.2[0.1-0.4];p<0.001)和rfs(hr=0.2[0.1-0.4];p<0.001)的保护性因素,mll重排是cir(hr=5.3[2.8-10.3];p<0.001)和rfs(hr=5.2[2.2-12.2];p<0.001)的独立危险因素(表3)。而年龄、性别、mrd、白细胞计数、ikzf1缺失、bcr-abl1等因素对预后无影响。
表3203例患者cir和rfs多因素分析
结果表明,diaph1基因突变是成人b-all患者cir和rfs的独立危险因素。本发明可能在b-all的分层诊断和预后评估中发挥重要作用。
sequencelisting
<110>北京大学人民医院
<120>一种b-all患者预后风险评估标记物
<160>3
<210>1
<211>5760
<212>dna
<213>人(homosapiens)
<400>1
attcatgaggcgcgcgcagcccggcatgctaatgaggcggggcgcggcggctggctaaag60
agcgactgggcggcggcgggcgcggagctgccaggcgggagcggcgtaggcgcggggtcg120
ccggccagcgtgaaccgggacatggagccgcccggcgggagcctggggcccggccgcggg180
acccgggacaagaagaagggccggagcccagatgagctgccctcggcgggcggcgacggc240
ggcaaatctaagaaatttctggagagatttaccagcatgagaattaagaaggagaaggaa300
aagcccaattctgctcatagaaattcttctgcatcatatggggatgatcccacagcacag360
tcattgcaagatgtttcagatgaacaagtgctggttctctttgaacagatgctgctggat420
atgaacctgaatgaggagaaacagcaacctttgagggagaaggacatcatcatcaagagg480
gagatggtgtcccaatacttgtacacctccaaggctggcatgagccagaaggagagctct540
aagtctgccatgatgtatattcaggagttgaggtcaggcttgcgggatatgcctctgctc600
agctgcctggagtcccttcgtgtgtctctcaacaacaaccctgtcagttgggtgcaaaca660
tttggtgctgaaggcttggcctccttattggacattcttaaacgacttcatgatgagaaa720
gaagagactgctgggagttacgatagccggaacaagcatgagatcattcgctgcttgaaa780
gcttttatgaacaacaagtttggaatcaagaccatgttggagacagaagaaggaatccta840
ctgctggtcagagccatggatcctgctgttcccaacatgatgattgatgcagctaagctg900
ctttctgctctttgtattctaccgcagccagaggacatgaatgaaagggttttggaggca960
atgacagaaagagctgagatggatgaagtggaacgtttccagccgctgctggatggatta1020
aaaagtggaaccactattgcactgaaggttggatgcctacagctgatcaatgctctcatc1080
acaccagcggaggaacttgacttccgagttcacatcagaagtgaactgatgcgtttgggg1140
ctacatcaggtgttgcaggaccttcgagagattgaaaatgaagatatgagagtgcaacta1200
aatgtgtttgatgaacaaggggaagaggattcctatgacctgaagggacggctggatgac1260
attcgcatggagatggatgactttaatgaagtctttcagattctcttaaacacagtgaag1320
gattcaaaggcagagccacacttcctttccatcctgcagcacttactcttggtccgaaat1380
gactatgaggccagacctcagtactataagttgattgaagaatgtatttcccagatagtt1440
ctgcacaagaacggggctgatcctgacttcaagtgccggcacctccagattgagattgag1500
ggattaattgatcaaatgattgataagacaaaggtggagaaatctgaagccaaagctgca1560
gagctggaaaagaagttggactcagagttaacagcccgacatgagctacaggtggaaatg1620
aaaaagatggaaagtgactttgagcagaagcttcaagatcttcagggagaaaaagatgca1680
ctgcattctgaaaagcagcaaattgccacagagaaacaggacctggaagcagaggtgtcc1740
cagctcacaggagaggttgccaagctgacaaaggaactggaagatgccaagaaagaaatg1800
gcttccctctctgcggcagctattactgtacctccttctgttcctagtcgtgctcctgtt1860
ccccctgcccctcctttacctggtgactctggcactattattccaccaccacctgctcct1920
ggggatagtaccactcctcctcctcctcctcctcctcctcctcctccacctcctttgcct1980
gggggtgtttgcatctcctcacccccttctttacctggaggtactgctatctctccaccc2040
cctcctttgtctggggatgctaccatccctccaccccctcctttgcctgagggtgttggc2100
atcccttcaccctcttctttgcctggaggtactgccatccccccacctcctcctttgcct2160
gggagtgctagaatccccccaccaccacctcctttgcctgggagtgctggaattcccccc2220
ccacctcctcccttgcctggagaagcaggaatgccacctcctcctccccctcttcctggt2280
ggtcctggaatccctccacctcctccatttcccggaggccctggcattcctccacctcca2340
cccggaatgggtatgcctccacctcccccatttggatttggagttcctgcagccccagtt2400
ctgccatttggattaacccccaaaaagctttataagccagaggtgcagctccggaggcca2460
aactggtccaagcttgtggctgaggacctctcccaggactgcttctggacaaaggtgaag2520
gaggaccgctttgagaacaatgaacttttcgccaaacttacccttaccttctctgcccag2580
accaagacttccaaagccaagaaggatcaagaaggtggagaagaaaagaaatctgtgcaa2640
aagaaaaaagtaaaagagttaaaggtgttggattcaaagacagcccagaatctctcaatc2700
tttttgggttccttccgcatgccctatcaagagattaagaatgtcatcctggaggtgaat2760
gaggctgttctgactgagtctatgatccagaacctcattaagcaaatgccagagccagag2820
cagttaaaaatgctttctgaactgaaggatgaatatgatgacctggctgagtcagagcag2880
tttggcgtggtgatgggcactgtgccccgactgcggcctcgcctcaatgccattctcttc2940
aagctacaattcagcgagcaagtggagaatatcaagccagagattgtgtctgtcactgct3000
gcatgtgaggagttacgtaagagtgagagcttttccaatctcctagagattaccttgctt3060
gttggaaattacatgaatgctggctccagaaatgctggtgcttttggcttcaatatcagc3120
ttcctctgtaagcttcgagacaccaagtccacagatcagaagatgacgttgttacacttc3180
ttggctgagttgtgtgagaatgactatcccgatgtcctcaagtttccagacgagcttgcc3240
catgtggagaaagccagccgagtttctgctgaaaacttgcaaaagaacctagatcagatg3300
aagaaacaaatttctgatgtggaacgtgatgttcagaatttcccagctgccacagatgaa3360
aaagacaagtttgttgaaaaaatgaccagctttgtgaaggatgcacaggaacagtataac3420
aagctgcggatgatgcattctaacatggagaccctctataaggagctgggcgagtacttc3480
ctctttgaccccaagaagttgtctgttgaagaatttttcatggatcttcacaattttcgg3540
aatatgtttttgcaagcagtcaaggagaaccagaagcggcgggagacagaagaaaagatg3600
aggcgagcaaaactagccaaggagaaggcagagaaggagcggctagagaagcagcagaag3660
agagagcaactcatagacatgaatgcagagggcgatgagacaggtgtgatggacagtctt3720
ctagaagccctgcagtcaggggcagcattccgacggaagagagggccccgtcaagccaac3780
aggaaggccgggtgtgcagtcacatctctgctagcttcggagctgaccaaggatgatgcc3840
atggctgctgttcctgccaaggtgtccaagaacagtgagacattccccacaatccttgag3900
gaagccaaggagttggttggccgtgcaagctaatgtgggtcctgtgaccgcggcagctcc3960
tcagcggagccgcagactgtcctgccctgcagcatgtgcctaaaggctcaaggggatatt4020
cctctggggtggccactcccaccaccctgaccctgtctttctctctggcctgctgctctc4080
tcaacatcacatacagcttcagctgcctggaggccagaaggaaagggcagtgcaggggag4140
gcctgagcccgacttagccagccctggctgttgtattaccaaagcagggtccatgtttgc4200
tgccttaaccctgtctcctctctgttactcagagggcctcatctcagacaaggcccagcc4260
tgctttttctcagccctgactttctaatgggctttcccccctaggtcagtcttgctggat4320
ttgtgcttttcttttgtggtttctctggccctgagaatagcatggggcttgtaaaccttt4380
gggctagatccctcctttcattgctgttgtctctgctcttccctctcctggctgtggtta4440
tttattattagtggtgtggcactgggagctgctcctaaggaagcagggagcaaatcccac4500
ctttaccccaccttcctgggaaaggcctccaaagcaaaggatctggaccagtttccctgc4560
tgtgctgtggcccaggccagagcctgtgggcaggcaggcagggcatagcgacagtgtggg4620
acctgcccccagcttctgccacgctttatgcccttgcctctctggacgctctgcaccaac4680
cccaggctactgagccaccttccctcctcatgccttccctgagctttggtgcatctcatc4740
tggactatgggttgtactgtgaccatcccaacacctcaccctctgtctacaaggaaatgg4800
gaggtggagcctcctggctgagaaattgttttgcaaatggatctatttttgtatgaaaaa4860
aaaaatttttttaaagaaaactgttccttccccctttcccctccataatgtaagaagctt4920
tggtggcaggttacagagttctgggatttcttctcacaggcccaatcctgaatgtgcccc4980
tggaccttctggacccttgagtccaaggcagatcctctctcccagggaatccgacacagg5040
aggaaccccttctctggttgagctgggccaggcctaagagtagcaggaactctaagacca5100
cagagttttttataaatgtataaatgtatcaagccaaatgtgcagatgctaactggacat5160
tctggggaactgggcaccaggagtgccttcatacactgtaccccagctctcttctaaaag5220
agaagtgggtgggcacactgaactgtttggtggccccaaccacaggaagctgcaattctc5280
tggcttagggtgatacttttgccctccttgtgcccctctcagctttccatccccagctag5340
gaagaaagaatggcactcttgggcttggcccagaattagagttattagagcaagagagag5400
cttaggaagcatgagggcaactatagtgaggccttattgccaggagggagggttttggtt5460
gctggcgcttgtgtataaaggggcaagagcagctcctttggactattcctgggaggactc5520
tgatgcagggcgtctgttgctcccctgggtcacctcctccctgctcgctgacatctgggg5580
ctttgaccctttcttttttaatctacttttgctaagatgcatttaataaaaaaaaagaga5640
gagagagagaggtgtgagggacaaaatgcaaacctatttcccttgcctcataggcttctg5700
ggatgtcatcacctccagtttgttggttttgtttccaactgttaataaagcattgaaaca5760
<210>2
<211>3792
<212>dna
<213>人(homosapiens)
<400>2
atggagccgcccggcgggagcctggggcccggccgcgggacccgggacaagaagaagggc60
cggagcccagatgagctgccctcggcgggcggcgacggcggcaaatctaagaaatttctg120
gagagatttaccagcatgagaattaagaaggagaaggaaaagcccaattctgctcataga180
aattcttctgcatcatatggggatgatcccacagcacagtcattgcaagatgtttcagat240
gaacaagtgctggttctctttgaacagatgctgctggatatgaacctgaatgaggagaaa300
cagcaacctttgagggagaaggacatcatcatcaagagggagatggtgtcccaatacttg360
tacacctccaaggctggcatgagccagaaggagagctctaagtctgccatgatgtatatt420
caggagttgaggtcaggcttgcgggatatgcctctgctcagctgcctggagtcccttcgt480
gtgtctctcaacaacaaccctgtcagttgggtgcaaacatttggtgctgaaggcttggcc540
tccttattggacattcttaaacgacttcatgatgagaaagaagagactgctgggagttac600
gatagccggaacaagcatgagatcattcgctgcttgaaagcttttatgaacaacaagttt660
ggaatcaagaccatgttggagacagaagaaggaatcctactgctggtcagagccatggat720
cctgctgttcccaacatgatgattgatgcagctaagctgctttctgctctttgtattcta780
ccgcagccagaggacatgaatgaaagggttttggaggcaatgacagaaagagctgagatg840
gatgaagtggaacgtttccagccgctgctggatggattaaaaagtggaaccactattgca900
ctgaaggttggatgcctacagctgatcaatgctctcatcacaccagcggaggaacttgac960
ttccgagttcacatcagaagtgaactgatgcgtttggggctacatcaggtgttgcaggac1020
cttcgagagattgaaaatgaagatatgagagtgcaactaaatgtgtttgatgaacaaggg1080
gaagaggattcctatgacctgaagggacggctggatgacattcgcatggagatggatgac1140
tttaatgaagtctttcagattctcttaaacacagtgaaggattcaaaggcagagccacac1200
ttcctttccatcctgcagcacttactcttggtccgaaatgactatgaggccagacctcag1260
tactataagttgattgaagaatgtatttcccagatagttctgcacaagaacggggctgat1320
cctgacttcaagtgccggcacctccagattgagattgagggattaattgatcaaatgatt1380
gataagacaaaggtggagaaatctgaagccaaagctgcagagctggaaaagaagttggac1440
tcagagttaacagcccgacatgagctacaggtggaaatgaaaaagatggaaagtgacttt1500
gagcagaagcttcaagatcttcagggagaaaaagatgcactgcattctgaaaagcagcaa1560
attgccacagagaaacaggacctggaagcagaggtgtcccagctcacaggagaggttgcc1620
aagctgacaaaggaactggaagatgccaagaaagaaatggcttccctctctgcggcagct1680
attactgtacctccttctgttcctagtcgtgctcctgttccccctgcccctcctttacct1740
ggtgactctggcactattattccaccaccacctgctcctggggatagtaccactcctcct1800
cctcctcctcctcctcctcctcctccacctcctttgcctgggggtgtttgcatctcctca1860
cccccttctttacctggaggtactgctatctctccaccccctcctttgtctggggatgct1920
accatccctccaccccctcctttgcctgagggtgttggcatcccttcaccctcttctttg1980
cctggaggtactgccatccccccacctcctcctttgcctgggagtgctagaatcccccca2040
ccaccacctcctttgcctgggagtgctggaattccccccccacctcctcccttgcctgga2100
gaagcaggaatgccacctcctcctccccctcttcctggtggtcctggaatccctccacct2160
cctccatttcccggaggccctggcattcctccacctccacccggaatgggtatgcctcca2220
cctcccccatttggatttggagttcctgcagccccagttctgccatttggattaaccccc2280
aaaaagctttataagccagaggtgcagctccggaggccaaactggtccaagcttgtggct2340
gaggacctctcccaggactgcttctggacaaaggtgaaggaggaccgctttgagaacaat2400
gaacttttcgccaaacttacccttaccttctctgcccagaccaagacttccaaagccaag2460
aaggatcaagaaggtggagaagaaaagaaatctgtgcaaaagaaaaaagtaaaagagtta2520
aaggtgttggattcaaagacagcccagaatctctcaatctttttgggttccttccgcatg2580
ccctatcaagagattaagaatgtcatcctggaggtgaatgaggctgttctgactgagtct2640
atgatccagaacctcattaagcaaatgccagagccagagcagttaaaaatgctttctgaa2700
ctgaaggatgaatatgatgacctggctgagtcagagcagtttggcgtggtgatgggcact2760
gtgccccgactgcggcctcgcctcaatgccattctcttcaagctacaattcagcgagcaa2820
gtggagaatatcaagccagagattgtgtctgtcactgctgcatgtgaggagttacgtaag2880
agtgagagcttttccaatctcctagagattaccttgcttgttggaaattacatgaatgct2940
ggctccagaaatgctggtgcttttggcttcaatatcagcttcctctgtaagcttcgagac3000
accaagtccacagatcagaagatgacgttgttacacttcttggctgagttgtgtgagaat3060
gactatcccgatgtcctcaagtttccagacgagcttgcccatgtggagaaagccagccga3120
gtttctgctgaaaacttgcaaaagaacctagatcagatgaagaaacaaatttctgatgtg3180
gaacgtgatgttcagaatttcccagctgccacagatgaaaaagacaagtttgttgaaaaa3240
atgaccagctttgtgaaggatgcacaggaacagtataacaagctgcggatgatgcattct3300
aacatggagaccctctataaggagctgggcgagtacttcctctttgaccccaagaagttg3360
tctgttgaagaatttttcatggatcttcacaattttcggaatatgtttttgcaagcagtc3420
aaggagaaccagaagcggcgggagacagaagaaaagatgaggcgagcaaaactagccaag3480
gagaaggcagagaaggagcggctagagaagcagcagaagagagagcaactcatagacatg3540
aatgcagagggcgatgagacaggtgtgatggacagtcttctagaagccctgcagtcaggg3600
gcagcattccgacggaagagagggccccgtcaagccaacaggaaggccgggtgtgcagtc3660
acatctctgctagcttcggagctgaccaaggatgatgccatggctgctgttcctgccaag3720
gtgtccaagaacagtgagacattccccacaatccttgaggaagccaaggagttggttggc3780
cgtgcaagctaa3792
<210>3
<211>1263
<212>prt
<213>人(homosapiens)
<400>3
metgluproproglyglyserleuglyproglyargglythrargasp
151015
lyslyslysglyargserproaspgluleuproseralaglyglyasp
202530
glyglylysserlyslyspheleugluargphethrsermetargile
354045
lyslysglulysglulysproasnseralahisargasnserserala
505560
sertyrglyaspaspprothralaglnserleuglnaspvalserasp
65707580
gluglnvalleuvalleuphegluglnmetleuleuaspmetasnleu
859095
asngluglulysglnglnproleuargglulysaspileileilelys
100105110
argglumetvalserglntyrleutyrthrserlysalaglymetser
115120125
glnlysgluserserlysseralametmettyrileglngluleuarg
130135140
serglyleuargaspmetproleuleusercysleugluserleuarg
145150155160
valserleuasnasnasnprovalsertrpvalglnthrpheglyala
165170175
gluglyleualaserleuleuaspileleulysargleuhisaspglu
180185190
lysglugluthralaglysertyraspserargasnlyshisgluile
195200205
ileargcysleulysalaphemetasnasnlyspheglyilelysthr
210215220
metleugluthrglugluglyileleuleuleuvalargalametasp
225230235240
proalavalproasnmetmetileaspalaalalysleuleuserala
245250255
leucysileleuproglnprogluaspmetasngluargvalleuglu
260265270
alametthrgluargalaglumetaspgluvalgluargpheglnpro
275280285
leuleuaspglyleulysserglythrthrilealaleulysvalgly
290295300
cysleuglnleuileasnalaleuilethrproalaglugluleuasp
305310315320
pheargvalhisileargsergluleumetargleuglyleuhisgln
325330335
valleuglnaspleuarggluilegluasngluaspmetargvalgln
340345350
leuasnvalpheaspgluglnglyglugluaspsertyraspleulys
355360365
glyargleuaspaspileargmetglumetaspasppheasngluval
370375380
pheglnileleuleuasnthrvallysaspserlysalagluprohis
385390395400
pheleuserileleuglnhisleuleuleuvalargasnasptyrglu
405410415
alaargproglntyrtyrlysleuilegluglucysileserglnile
420425430
valleuhislysasnglyalaaspproaspphelyscysarghisleu
435440445
glnilegluilegluglyleuileaspglnmetileasplysthrlys
450455460
valglulysserglualalysalaalagluleuglulyslysleuasp
465470475480
sergluleuthralaarghisgluleuglnvalglumetlyslysmet
485490495
gluseraspphegluglnlysleuglnaspleuglnglyglulysasp
500505510
alaleuhisserglulysglnglnilealathrglulysglnaspleu
515520525
glualagluvalserglnleuthrglygluvalalalysleuthrlys
530535540
gluleugluaspalalyslysglumetalaserleuseralaalaala
545550555560
ilethrvalproproservalproserargalaprovalproproala
565570575
proproleuproglyaspserglythrileileproproproproala
580585590
proglyaspserthrthrpropropropropropropropropropro
595600605
proproproleuproglyglyvalcysileserserproproserleu
610615620
proglyglythralaileserproproproproleuserglyaspala
625630635640
thrileproproproproproleuprogluglyvalglyileproser
645650655
proserserleuproglyglythralaileproproproproproleu
660665670
proglyseralaargileproproproproproproleuproglyser
675680685
alaglyileproproproproproproleuproglyglualaglymet
690695700
proproproproproproleuproglyglyproglyilepropropro
705710715720
propropheproglyglyproglyileproproproproproglymet
725730735
glymetpropropropropropheglypheglyvalproalaalapro
740745750
valleupropheglyleuthrprolyslysleutyrlysprogluval
755760765
glnleuargargproasntrpserlysleuvalalagluaspleuser
770775780
glnaspcysphetrpthrlysvallysgluaspargphegluasnasn
785790795800
gluleuphealalysleuthrleuthrpheseralaglnthrlysthr
805810815
serlysalalyslysaspglngluglyglygluglulyslysserval
820825830
glnlyslyslysvallysgluleulysvalleuaspserlysthrala
835840845
glnasnleuserilepheleuglyserpheargmetprotyrglnglu
850855860
ilelysasnvalileleugluvalasnglualavalleuthrgluser
865870875880
metileglnasnleuilelysglnmetprogluprogluglnleulys
885890895
metleusergluleulysaspglutyraspaspleualagluserglu
900905910
glnpheglyvalvalmetglythrvalproargleuargproargleu
915920925
asnalaileleuphelysleuglnphesergluglnvalgluasnile
930935940
lysprogluilevalservalthralaalacysglugluleuarglys
945950955960
sergluserpheserasnleuleugluilethrleuleuvalglyasn
965970975
tyrmetasnalaglyserargasnalaglyalapheglypheasnile
980985990
serpheleucyslysleuargaspthrlysserthraspglnlysmet
99510001005
thrleuleuhispheleualagluleucysgluasnasptyrpro
101010151020
aspvalleulyspheproaspgluleualahisvalglulysala
102510301035
serargvalseralagluasnleuglnlysasnleuaspglnmet
104010451050
lyslysglnileseraspvalgluargaspvalglnasnphepro
105510601065
alaalathraspglulysasplysphevalglulysmetthrser
107010751080
phevallysaspalaglngluglntyrasnlysleuargmetmet
108510901095
hisserasnmetgluthrleutyrlysgluleuglyglutyrphe
110011051110
leupheaspprolyslysleuservalglugluphephemetasp
111511201125
leuhisasnpheargasnmetpheleuglnalavallysgluasn
113011351140
glnlysargarggluthrgluglulysmetargargalalysleu
114511501155
alalysglulysalaglulysgluargleuglulysglnglnlys
116011651170
arggluglnleuileaspmetasnalagluglyaspgluthrgly
117511801185
valmetaspserleuleuglualaleuglnserglyalaalaphe
119011951200
argarglysargglyproargglnalaasnarglysalaglycys
120512101215
alavalthrserleuleualasergluleuthrlysaspaspala
122012251230
metalaalavalproalalysvalserlysasnsergluthrphe
123512401245
prothrileleugluglualalysgluleuvalglyargalaser
125012551260