本申请含有已经呈ascii格式以电子方式提交并且在此通过引用整体并入的的序列表。在2017年7月10日创建的所述ascii拷贝命名为50474-127wo2_sequence_listing_7.10.17_st25并且大小为216,092字节。
本发明总体上涉及用于诊断、治疗癌症(例如肺癌)和提供癌症(例如肺癌)预后的方法。
发明背景
癌症仍然是对人健康最致命的威胁之一。尽管最近在治疗方面取得了进展,但肺癌尤其在美国是男性和女性癌症相关死亡的主要原因。大多数肺癌是非小细胞肺癌(nsclc),并且最常见的是腺瘤或鳞状亚型。最近的研究已经确定了这些适应症背后的点突变模式(imielinski等cell.150(6):1107-1120,2012),但尽管与各种细胞途径相关的已鉴定的突变的数量越来越多,缺乏对这些突变对这些细胞途径的性质和影响的全面理解。
因此,本领域存在未满足的需求,以开发用于癌症(诸如肺癌)的有效诊断和治疗策略。
技术实现要素:
本发明提供用于诊断、治疗(例如,肺癌(例如,非小细胞肺癌(nsclc))和头颈癌)和提供所述癌症的预后的组合物和方法。
在一个方面,本发明的特征在于诊断受试者中的癌症的方法,该方法包括:(a)测定获自所述受试者的样品中选自由以下组成的组的至少一种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种)基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl;(b)将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有癌症的受试者。
在另一个方面,本发明的特征在于鉴定患有为nrf2依赖性癌症的癌症的受试者的方法,该方法包括:(a)测定获自所述受试者的样品中选自由以下组成的组的至少一种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种)基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl;(b)将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较;和(c)确定所述受试者的癌症是否是nrf2依赖性癌症,其中所述样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有nrf2依赖性癌症的受试者。在任一前述方面的一些实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少两种(例如,2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在一些实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少三种(例如,3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在一些实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少四种(例如,4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在一些实施方案中,测定获自受试者的样品中的akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl的表达水平。
在一些实施方案中,测定akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、kynu、cabyr、slc7a11、trim16l、akr1c4、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn或nqo1中的至少一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种和21种)的表达水平。在一些实施方案中,测定akr1b10、akr1c2、me1、kynu、cabyr、trim16l、akr1c4、cyp4f11、rspo3、akr1b15、nr0b1和akr1c3的一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种或12种)的表达水平。
在一些实施方案中,(a)样品中至少两种基因的表达水平是样品的至少两种基因的平均值(例如,平均值或中值);(b)所述至少两个基因的参照照表达水平是所述参照的至少两个基因的平均值(例如,平均值或中值);以及(c)将样品的所述至少两个基因的平均值(例如,平均值或中值)与所述参照的至少两个基因的平均值进行比较。
在一些实施方案中,参照表达水平是受试者群体中所述至少一种基因的平均表达水平。在一些实施方案中,受试者群体是共享共同种族性的受试者群体。
在一些实施方案中,参照表达水平是患有癌症(例如,肺癌,例如,非小细胞肺癌(nsclc),例如鳞状nsclc)的受试者群体中的至少一种基因的平均表达水平。
在一些实施方案中,表达水平是mrna表达水平。在一些实施方案中,通过pcr、rt-pcr、rna测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mrna表达水平。
在一些实施方案中,表达水平是蛋白质表达水平。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。
在一些实施方案中,任何前述方法还包括测定nrf2的dna序列。在一些实施方案中,通过pcr、外显子组测序(exome-seq)、微阵列分析或全基因组测序确定dna序列。
在另一个方面,本发明的特征在于诊断受试者中的癌症的方法,该方法包括测定获自受试者的样品中的dna序列,其中包含其外显子2的全部或部分缺失的nrf2dna的存在将受试者鉴定为患有癌症。在一些实施方案中,通过pcr、外显子组测序、微阵列分析或全基因组测序确定dna序列。
在另一个方面,本发明的特征在于鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品中的nrf2的mrna表达水平,所述nrf2包含其外显子2的全部或部分缺失,其中包含其外显子2的全部或部分缺失的nrf2的存在将受试者鉴定为患有癌症。在一些实施方案中,通过pcr、rt-pcr、rna测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mrna表达水平。在一些实施方案中,所述方法还包括测定nrf2的dna序列。在一些实施方案中,通过pcr、外显子组测序、微阵列分析或全基因组测序确定dna序列。
在任何前述方面的一些实施方案中,nrf2还包含其外显子3的全部或部分的缺失。
在另一个方面,本发明的特征在于诊断受试者中的癌症的方法,该方法包括测定获自受试者的样品中的nrf2的蛋白质表达水平,所述nrf2包含其neh2结构域的全部或部分缺失,其中包含其neh2结构域的的全部或部分缺失的nrf2的存在将受试者鉴定为患有癌症。
在另一个方面,本发明的特征在于鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品中的nrf2的蛋白质表达水平,所述nrf2包含其neh2结构域的全部或部分缺失,其中包含其neh2结构域的全部或部分缺失的nrf2的存在将受试者鉴定为患有癌症。
在任何前述方面的一些实施方案中,nrf2还包含其neh4结构域的全部或部分的缺失。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。
在一些实施方案中,所述方法还包括向受试者施用治疗有效量的nrf2途径拮抗剂。在一些实施方案中,所述方法还包括向受试者施用治疗有效量的抗癌剂。在其它实施方案中,该方法包括施用抗癌剂和nrf2途径拮抗剂。在一些实施方案中,共同施用抗癌剂和nrf2途径拮抗剂。在一些实施方案中,相继地施用抗癌剂和nrf2途径拮抗剂。在一些实施方案中,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂和免疫疗法。在一些实施方案中,抗血管生成剂是vegf拮抗剂。在一些实施方案中,nrf2途径拮抗剂选自由以下组成的组:creb拮抗剂、creb结合蛋白(cbp)拮抗剂、maf拮抗剂、激活转录因子4(atf4)拮抗剂、蛋白激酶c(pkc)拮抗剂、jun拮抗剂、糖皮质激素受体拮抗剂、ubcm2拮抗剂、hace1拮抗剂、c-myc激动剂、sumo激动剂、keap1激动剂、cul3激动剂或视黄酸受体α(rarα)激动剂。
在一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:向所述受试者施用治疗有效量的nrf2途径拮抗剂,其中以下基因中的至少一种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种)在获自受试者的样品中的表达水平经测定相对于所述至少一种基因的参照表达水平得以升高:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在其它实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少两种(例如,2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在其它实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少三种(例如,3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在其它实施方案中,测定获自受试者的样品中的选自由以下组成的组的至少三种(例如,4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种))基因的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl。在其它实施方案中,测定获自受试者的样品中的akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl的表达水平。
在一些实施方案中,测定akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、kynu、cabyr、slc7a11、trim16l、akr1c4、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn或nqo1中的至少一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种和21种)的表达水平。在其它实施方案中,测定akr1b10、akr1c2、me1、kynu、cabyr、trim16l、akr1c4、cyp4f11、rspo3、akr1b15、nr0b1和akr1c3的一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种或12种)的表达水平。
在一些实施方案中,(a)样品中至少两种基因的表达水平是所述样品的所述至少两种基因的平均值(例如,平均值或中值);(b)所述至少两个基因的参照表达水平是所述参照的所述至少两个基因的平均值(例如,平均值或中值);以及(c)将样品的所述至少两个基因的平均值(例如,平均值或中值)与所述参照的所述至少两个基因的平均值进行比较。在一些实施方案中,参照表达水平是受试者群体中所述至少一种基因的平均表达水平。在一些实施方案中,受试者群体是共享共同种族性的受试者群体。在一些实施方案中,参照表达水平是患有癌症的受试者群体中所述至少一种基因的平均表达水平。
在一些实施方案中,肺癌是非小细胞肺癌(nsclc),例如鳞状nsclc。
在一些实施方案中,表达水平是mrna表达水平。在一些实施方案中,通过pcr、rt-pcr、rna测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mrna表达水平。在一些实施方案中,mrna表达水平通过rna测序来测定。
在一些实施方案中,方法还包括测定nrf2的dna序列(通过pcr、外显子组测序、微阵列分析或全基因组测序)。
在一些实施方案中,表达水平蛋是白质表达水平。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。
在另一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:(a)测定获自受试者的样品中的nrf2的mrna表达水平,所述nrf2包含其外显子2的全部或部分缺失,其中包含其外显子2的全部或部分缺失的nrf2的存在将受试者鉴定为患有癌症;和(b)向受试者施用治疗有效量的nrf2途径拮抗剂。
在一些实施方案中,通过pcr、rt-pcr、rna测序、基因表达谱分析、基因表达系列分析或微阵列分析测定mrna表达水平。在一些实施方案中,mrna表达通过rna测序来测定。在一些实施方案中,方法还包括测定nrf2的dna序列(通过pcr、外显子组测序、微阵列分析或全基因组测序)。
在另一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:(a)测定获自受试者的样品中的nrf2的dna序列,所述nrf2包含其外显子2的全部或部分缺失,其中包含其外显子2的全部或部分缺失的nrf2dna的存在将受试者鉴定为患有癌症;和(b)向受试者施用治疗有效量的nrf2途径拮抗剂。在一些实施方案中,通过pcr、外显子组测序、微阵列分析或全基因组测序确定dna序列。在一些实施方案中,nrf2(例如,mrna或dna)还包含其外显子3的全部或部分的缺失。
在另一个方面,本发明的特征在于治疗患有癌症的受试者的方法,该方法包括:(a)测定获自受试者的样品中的nrf2的蛋白质表达水平,所述nrf2包含其neh2的全部或部分缺失,其中包含其neh2的全部或部分缺失的nrf2蛋白的存在将受试者鉴定为患有癌症;和(b)向受试者施用治疗有效量的nrf2途径拮抗剂。
在一些实施方案中,nrf2蛋白还包含其neh4结构域的全部或部分的缺失。在一些实施方案中,蛋白质表达水平通过蛋白质印迹、免疫组织化学或质谱法测定。在一些实施方案中,方法还包括测定nrf2的dna序列(通过pcr、外显子组测序、微阵列分析或全基因组测序)。
在一些实施方案中,方法包括向受试者施用治疗有效量的抗癌剂。在一些实施方案中,共同施用抗癌剂和nrf2途径拮抗剂。在一些实施方案中,相继地施用抗癌剂和nrf2途径拮抗剂。在一些实施方案中,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂和免疫疗法。在一些实施方案中,抗血管生成剂是vegf拮抗剂。在一些实施方案中,nrf2途径拮抗剂选自由以下组成的组:creb拮抗剂、creb结合蛋白(cbp)拮抗剂、maf拮抗剂、激活转录因子4(atf4)拮抗剂、蛋白激酶c(pkc)拮抗剂、jun拮抗剂、糖皮质激素受体拮抗剂、ubcm2拮抗剂、hace1拮抗剂、c-myc激动剂、sumo激动剂、keap1激动剂、cul3激动剂或视黄酸受体α(rarα)激动剂。
在一些实施方案中,获自受试者的样品是肿瘤样品,例如来自活检样品。在一些实施方案中,样品获自先前未治疗的受试者。在一些实施方案中,受试者患有肺癌(例如,非小细胞肺癌(nsclc),例如鳞状nsclc)或头颈癌(例如,鳞状头颈癌)。
附图说明
图1a是显示经历rna测序、外显子组测序和snp阵列分析的96个肺癌细胞系的图。显示了kras、tp53、keap1、egfr、stk11、nfe2l2和nf1的改变。
图1b是显示nfe2l2(nrf2)基因中的点突变的蛋白质序列表示。
图1c是显示keap1基因中的点突变的蛋白质序列表示。
图1d是keap1/nrf2肽复合物的晶体结构的图像。
图2a是说明突变型(n=25)对比野生型(wt)(n=74)keap1nsclc细胞系中所有基因的平均表达水平的比率以及由差异表达分析产生的相关调整的p值的火山图。指示了显著差异表达的基因(>2倍,p<0.01),并且先前鉴定为nrf2靶标的基因组被鉴定为黑点。
图2b是显示无监督沃德聚类(unsupervisedwardclustering)结果的热图,所述无监督病房聚类结果显示了在nsclc细胞系中与keap1突变相关的27种基因的上调。
图3a是显示无监督沃德聚类结果的热图,所述无监督病房聚类结果显示了nsclc细胞系衍生的keap1基因标签将来自癌症基因组图谱(tcga)的40种keap1突变型肺腺癌中的32种(80%)进行分类。
图3b是显示无监督病房聚类结果的热图,所述无监督沃德聚类结果显示了nsclc细胞系衍生的keap1基因标签将来自tcga的22种keap1突变型肺鳞状细胞癌中的19种(86%)和27种nrf2突变型肺鳞状细胞癌中的27种(100%)进行分类。
图4是显示突变型(n=6)和wt(n=37)nsclc细胞系中keap1基因标签的蛋白质产物的相对丰度的图。
图5是表示在19种肿瘤适应症中看到的复发性剪接改变的频率的热图。
图6显示了从rna测序数据预测的nrf2外显子和剪接点。与两个带注释的refgene转录本一致的预测特征以灰色显示。对应于外显子2(j2,j5)或外显子2+3(j3,j6)的跳跃的经鉴定的外显子-外显子接合点分别以黑色和灰色显示。热图显示log2(x+1)转换后fpkm量表上482个tcga肺鳞状细胞癌(行)中的外显子-外显子接合点(列)的读段证据。
图7是描绘egfr、nrf2、met和ctnnb1中的剪接改变对蛋白质结构的影响的示意图。箭头表示作为剪接改变的结果的框内缺失。
图8a是说明鳞状nsclc中keap1或nrf2中的nrf2剪接改变和突变的相互排斥发生的维恩图。
图8b是显示基于27个候选nrf2靶基因的鳞状nsclc的聚类的热图。针对每个样品指示突变状态和nrf2剪接改变。
图9a是说明头颈癌中keap1或nrf2中的nrf2剪接改变和突变的相互排斥发生的维恩图。
图9b是显示基于27个候选nrf2靶基因的头颈癌的聚类的热图。针对每个样品指示突变状态和nrf2剪接改变。
图10是显示通过rna测序定量的在kms-27和jhh-6细胞中跳过外显子2的接合读段(junctionread)的存在的图。
图11a是显示wt和外显子2缺失的nrf2(δe2nrf2)mrna中的外显子的位置的示意图,所述位置与源自外显子1和外显子3/4的正向和反向引物(分别由右侧朝向和左侧朝向的箭头指示的)相关。
图11b是一系列琼脂糖凝胶图像,其显示通过rt-pcr从正常白细胞、jhh-6细胞和kms-27细胞的总rna扩增的rna产物。用指定的引物扩增nrf2外显子2周围的区域。显示来自野生型nrf2、δe2nrf2和引物二聚体的片段。表明存在δe2nrf2rna的条带在jhh-6和kms-27细胞中是可见的。
图12a是显示来自jhh-6和kms-27细胞的pcr产物的测序结果的图,指示了nrf2中外显子2的缺失。
图12b显示δe2nrf2的核酸和氨基酸序列。
图12c显示野生型nrf2的核酸和氨基酸序列。外显子2序列加阴影。
图13显示蛋白质印迹实验的结果,其显示huh-1、jhh-6和hucct1细胞的磷酸化nrf2、野生型nrf2和δe2nrf2的相对表达。通过sdspage分离来自指定细胞系的蛋白质裂解物。*代表可能的非特异性条带,因为其不被nrf2sirna转染耗尽。
图14a显示蛋白质印迹实验的结果,其显示在λ磷酸酶(λp’tase)存在和不存在的情况下huh-1、jhh-6和hucct1细胞的磷酸化nrf2、野生型nrf2和δe2nrf2的相对表达。使细胞在6孔培养皿中生长,并用100μg/ml环己酰胺(chx)处理指定的时间。将裂解物与缓冲液或400单位λ磷酸酶一起孵育30分钟,然后通过sdspage分离并用nrf2抗体进行蛋白质印迹。
图14b是显示在chx存在的情况下由hucct1细胞(圆圈)、jhh-6细胞(正方形)和huh1细胞(三角形)表达的nrf2蛋白质的稳定性的图。对来自图14a中所示结果的条带强度进行定量并与单相衰减曲线拟合以获得蛋白质半衰期估计,其示于每条曲线旁边。将相对蛋白质表达作为每种细胞系的初始浓度的百分比。
图14c显示蛋白质印迹实验的结果,其显示在用sintc(50nm)或sikeap1(50nm)处理后huh-1、jhh-6和hucct1细胞的nrf2和δe2nrf2的相对表达。使细胞在6孔培养皿中生长,并用100μg/ml环己酰胺(chx)处理指定的时间。将裂解物与400单位λ磷酸酶一起孵育30分钟,然后通过sdspage分离并用nrf2抗体进行蛋白质印迹。
图14d是显示在用sintc(实线)或sikeap1(虚线)转染后在chx存在的情况下由hucct1细胞(圆圈)、jhh-6细胞(正方形)和huh1细胞(三角形)表达的nrf2蛋白质的稳定性的图。对来自图14c中所示结果的条带强度进行定量并将其拟合至单相衰减曲线以获得蛋白质半衰期估计,其示于每条曲线旁边。将相对蛋白质表达作为每种细胞系的初始浓度的百分比。
图15显示蛋白质印迹实验的结果,其表明kms-27细胞表达δe2nrf2。制备来自hcc-1354、kms-27和hucct1细胞的20μg裂解物,并且除hucct1外用λp'tase处理所有细胞。然后将未处理和处理的裂解物进行sdspage,并检测nrf2和肌动蛋白。
图16显示蛋白质印迹实验的结果,其显示nrf2的核定位。将hucct1、huh-1和jhh-6细胞在10cm培养皿中培养,并分成核和细胞溶质级分。通过sdspage分离级分,并观察nrf2。使用hsp90作为细胞溶质标志物以及hdac2作为核标志物来估计核和细胞溶质纯度。
图17a是显示在16个肝细胞癌细胞系(由黑色方块、实心灰色圆圈和空心灰色圆圈表示)中keap1基因标记的27个标签nrf2靶基因(各自显示在x轴上)的表达的图,该图使用在klijn等(natbiotechnol.33(3):306-312,2014)中描述的rna测序数据。。实心灰色圆圈代表突变型keap1肝癌细胞系,而空心灰色圆圈代表jhh-6细胞系。
图17b是显示在18个多发性骨髓瘤细胞系(由黑色方块和空心灰色圆圈表示)中keap1基因标签的27个标签nrf2靶基因(各自显示在x轴上)的表达的图,该图使用在klijn等(natbiotechnol.33(3):306-312,2014)中描述的rna测序数据。。空心灰色圆圈代表kms-27细胞系。
图18a是显示16个肝细胞癌细胞系中nrf2靶基因评分(在整个数据集上测定的27个nrf2靶基因的平均z-评分)的条形图。keap1和nrf2改变分别表示为实心和轮廓框。
图18b是显示18个多发性骨髓瘤细胞系中nrf2靶基因评分(在整个数据集上测定的27个nrf2靶基因的平均z-评分)的条形图。概述框表示nrf2改变。
图19是显示在存在或不存在靶向nrf2的sirna的情况下huh-1、jhh-6和hucct1细胞的活力的条形图。将细胞接种到96孔板中,所述96孔板含有非靶向sirna对照(ntc)或靶向nrf2的sirna(nrf2)。4天后使用celltiter-glo测量活力。活力表示为ntc发光的百分比。
图20是显示转染试剂对huh-1、jhh-6和hucct1细胞的相对nrf2表达的影响的一系列条形图。使细胞在6孔培养皿中生长,并用靶向nrf2的nrf2外显子5的sirna进行转染。48小时后分离总rna,并使用靶向外显子5的taqman探针测量nrf2表达。
图21是一系列条形图,其显示转染试剂对由huh-1细胞(深灰色阴影条)、jhh-6细胞(江灰色阴影条)和hucct1细胞(黑色阴影条)表达的四种充分表征的nrf2靶基因slc7a11、gclc、nr0b1和sgrn的影响。使细胞在6孔培养皿中生长,并用靶向nrf2的nrf2外显子5的sirna或非靶向sirna(ntc)进行转染。48小时后分离总rna,并使用靶向指定的nrf2靶基因的taqman探针测量基因表达。
图22是显示nrf2靶向sirna对huh-1、jhh-6和hucct1细胞中dna片段的影响的一系列代表性facs柱状图。用星形孢菌素处理细胞作为阳性对照。
图23是显示nrf2外显子2和外显子2+3缺失对keap1相互作用的影响的一系列免疫印迹。用表达flag-nrf2、δe2flag-nrf2、δe2+3flag-nrf2或ha-keap1的质粒转染293细胞。转染后48小时,裂解细胞,并使用所示抗体通过蛋白质印迹分析裂解物(顶部凝胶)或抗flag免疫沉淀物。
图24a是列显示环己酰胺对nrf2稳定性的影响的一系免疫印迹。用与图23中所述的相同的质粒转染293种细胞,并用100μg/ml环己酰亚胺(chx)处理指定的时间。裂解细胞并通过sdspage分离,并使用nrf2和抗肌动蛋白抗体进行蛋白质印迹。
图24b是显示keap1表达后随时间推移的截短的nrf2的稳定性的图。
图25是显示各种nrf2靶基因在各种条件下的表达的一系列条形图。如图24a-24b所述处理细胞,但收获总rna,将所述总rna用于使用taqmanrt-pcr分析所示基因的表达。
图26是显示根据keap1和nrf2的突变状态绘制的tcga鳞状nsclc肿瘤中指示的nrf2靶基因的mrna表达水平的一系列图。仅考虑了对于其可获外显子组测序和rna测序数据的样品。排除一个在nrf2和keap1中都具有突变的样品。另外,具有nrf2拷贝数变化│log2(can)│>0.5的证据的样品被排除在外。
图27a是外显子组测序图,其显示了808个癌细胞系中的相对nrf2外显子丰度,显示了作图至外显子2的读段减少。
图27b是显示了1,218个鳞状nsclc肿瘤中外显子读段覆盖的归一化z评分的外显子组测序图。将显示外显子2或外显子2+3的读段计数减少的11个肿瘤与附近的对照区域进行比较。
图28a是显示支持影响nrf2外显子2或外显子2+3的基因组改变的七个肿瘤中的不一致的读段对的基因组位置的示意图。
图28b是显示染色体2的拷贝数分析的一系列图,其显示具有nrf2外显子2(左图)和外显子2+3(右图)局部缺失(focaldeletion)的四个肿瘤样品。箭头指向nrf2外显子2和/或外显子3。靶区域的对数比以黑色显示,对照区域以灰色显示。
图28c是一系列全基因组测序图,其显示在jhh-6细胞、kms-27细胞以及原发性肿瘤中在nrf2外显子2周围以及邻近匹配的dna中存在微缺失。跨越缺失的读段的序列显示为nrf2nrf2。
图29是一系列琼脂糖凝胶图像,其显示从具有磷状nsclc的选定患者的总rna扩增的rna产物。显示通过rt-pcr获得的自患者#58肿瘤组织、患者#64肿瘤组织、患者#63正常组织和患者#63肿瘤组织的扩增产物。用图11a中指定的引物扩增nrf2外显子2周围的区域。显示来自野生型nrf2和δe2nrf2的片段。rt-pcr分析将患者#63鉴定为具有nrf2外显子2的丢失,其与邻近的正常组织相比在肿瘤中强烈富集。
图30是显示通过rna测序定量的跳过外显子2的接合读段在肿瘤和正常细胞中的存在的图。
图31是来自肺鳞状细胞癌(lusc)的tcga样品的突变型keap1基因标签评分的直方图。深灰色直方图代表keap1/nrf2突变型肿瘤,浅灰色直方图代表外显子2/3缺失的肿瘤,中灰色直方图代表keap1/nrf2野生型肿瘤。通过计算基因标签中所有基因的基因表达z评分的总和来测定给定样品的基因标签评分。
图32是来自肺鳞状细胞癌(lusc)、肺腺瘤(luad)和头颈鳞状细胞癌(hnsc)的tcga样品的突变型keap1基因标签评分的一系列直方图。深灰色直方图代表keap1/nrf2突变型肿瘤,浅灰色直方图代表外显子2/3缺失的肿瘤,中灰色直方图代表keap1/nrf2野生型肿瘤。通过计算基因标签中所有基因的基因表达z评分的总和来测定给定样品的基因标签评分。
图33是来自肺鳞状细胞癌(lusc)、肺腺瘤(luad)和头颈鳞状细胞癌(hnsc)的tcga样品的突变型keap1基因标签评分的一系列直方图。深灰色直方图代表肿瘤样品,浅灰色直方图代表正常样品。通过计算基因标签中所有基因的基因表达z评分的总和来测定给定样品的基因标签评分。
图34是显示通过wgs鉴定的jhh-6细胞、kms-26细胞和原发性肿瘤中的缺失的结构的一系列连接读段序列。jhh-6细胞的3'末端、5'末端和连接读段的dna序列分别由seqidno:61-63提供。kms-27细胞的3'末端、5'末端和连接读段的dna序列分别由seqidno:64-66提供。原代肿瘤细胞的3'末端、5'末端和连接读段的dna序列分别由seqidno:67-69提供。
图35是显示nrf2的相对表达的一系列蛋白质印迹。用表达独立的非靶对照(ntc)或三个独立的nrf2shrna序列(sh1、sh2和sh3)的慢病毒感染指定的细胞系,并在嘌呤霉素选择后用(+)或不用(-)500ng/ml多西环素(dox)孵育48小时。
图36是显示在用或不用dox孵育7天后图35中所示细胞系的活力的图。使用celltiter-glo(ctg)atp检测来测量活力。每个圆圈是六个技术重复的平均值,并且将其针对三个独立的ntc+dox的平均百分比活力进行归一化。
图37是显示用dox对比没有dox处理的细胞系的存活力的图。使细胞生长4天,并使用ctgatp测量法测量活力。使用学生氏t检验计算显著性。
图38是显示用nrf2sirna处理后相对于ntc处理后的28种nsclc细胞系的活力的图。将细胞按keap1基因型分组。使用学生氏t检验计算显著性。
图39是蛋白质印迹实验,其显示了nrf2在keap1突变型肿瘤中的表达。给小鼠植入表达nrf2sh10的a549细胞。当肿瘤达到~200mm3时,向饮用水中加入1mg/ml多西环素或5%蔗糖。五天后,将肿瘤提取物印迹以用于nrf2。
图40是显示nrf2在keap1突变型肿瘤中的表达的蛋白质印迹实验。给小鼠植入表达nrf2sh10的h441细胞。当肿瘤达到~200mm3时,向饮用水中加入1mg/ml多西环素或5%蔗糖。五天后,将肿瘤提取物印迹以用于nrf2。
图41a是显示植入keap1突变型肿瘤的小鼠中肿瘤体积的动力学的图。给小鼠植入表达nrf2sh10的a549细胞系。当肿瘤达到~200mm3时,将小鼠随机化至组(每组10只)中,并向饮用水中加入1mg/ml多西环素或5%蔗糖。在28天的时期内测量肿瘤。误差棒代表sem(n=10)。
图41b是显示植入keap1突变型肿瘤的小鼠中肿瘤体积的动力学的图。给小鼠植入表达nrf2sh10的h441细胞系。当肿瘤达到~200mm3时,将小鼠随机化至组(每组10只)中,并向饮用水中加入1mg/ml多西环素或5%蔗糖。在28天的时期内测量肿瘤。误差棒代表sem(n=10)。
图42是显示a549或h441细胞在各种生长条件下的表达的存活力的一系列条形图。将表达ntc或nrf2sh10shrna的a549和h460细胞接种到2d组织培养物处理的塑料皿或超低附着(ula)包被的组织培养板中。然后将它们在环境氧浓度或0.5%氧气(缺氧)中培养5天。通过ctgatp测量评估细胞活力。
图43是一系列照片,其显示用媒介物500ng/mldox或1mm还原型谷胱甘肽(gsh)处理的软琼脂中keap1突变型细胞系(a549、h1437和h460)和keap1野生型细胞系(h1048、h441和calu6)的集落形成。拍摄了该板的代表性区域。
图44是显示图43中所示的每种细胞类型和处理组的定量集落形成的一系列条形图。误差棒表示生物一式三份孔的标准偏差。
图45是显示在
图46是显示来自图45的细胞活力(通过ctgatp测量法定量的)的条形图。每个处理组的左栏代表1,000个细胞培养物,右栏代表5,000个细胞培养物。
图47是显示在含甲基纤维素的组织培养皿中铺板的5,000个、50,000个或500,000个ntc或nrf2sh10shrna表达a549细胞的一系列照片。在500ng/mldox存在或不存在的情况下培养约10天后拍摄细胞。
图48是显示在常规组织培养皿(顶部)或软琼脂(底部)中铺板的表达nrf2sh10shrna的a549细胞的一系列照片。在2mmn-乙酰半胱氨酸(nac)存在或不存在的情况下,用媒介物或500ng/ml多西环素处理细胞。通过ctgatp测量在约5天后测量2d生长的活力,并且在生长约10天后拍摄软琼脂中的细胞照片。
图49是显示在使用2',7'-二氯二氢荧光素二乙酸酯(h2dcf)测量的指定条件下的活性氧种类(ros)水平的条形图。误差棒表示来自一式三份孔的标准偏差。
图50是显示nrf2敲低对slc7a11的表达的影响的蛋白质印迹实验。将表达nrf2sh10的a549细胞用媒介物或500ng/mldox处理指定的时间点,并使用slc7a11和β-肌动蛋白抗体进行印迹。
图51是显示在各种浓度的埃拉斯汀(erastin)下表达ntc1或nrf2sh10的a549细胞摄取胱氨酸的条形图。将表达ntc1或nrf2sh10的a549细胞与载体或dox孵育48小时,然后与0.5uci14c-胱氨酸孵育20分钟。裂解细胞并通过液体闪烁计数测量细胞内胱氨酸。
图52是显示响应于nrf2敲低的a549和h1437细胞中的谷胱甘肽(gsh)水平的条形图。
图53是显示如通过h2dcf测量的响应于shnrf2和/或埃拉斯汀的ros水平升高的直方图。
图54是显示如使用ctgatp测量法测量的约4天后在表达shntc或shnfr2的a549细胞相对于埃拉斯汀的剂量响应的活力的图。
图55a是显示如从图54中显示的剂量反应图推断的埃拉斯汀对keap1野生型细胞系对比keap1突变型细胞系的ic50的图。
图55b是显示作为图54中显示的剂量反应图的曲线下面积的keap1野生型细胞系对比keap1突变型细胞系的活力的图。
图56a是显示谷氨酰胺酶抑制剂bptes对keap1野生型细胞系对比keap1突变型细胞系的ic50的图。
图56b是显示keap1野生型细胞系对比keap1突变型细胞系响应于谷氨酰胺酶抑制剂bptes的活力的图。
图57a是显示谷氨酰胺酶抑制剂丁硫氨酸亚砜亚胺(buthioninesylphoximine)(bso)对keap1野生型细胞系对比keap1突变型细胞系的ic50的图。
图57b是显示keap1野生型细胞系对比keap1突变型细胞系响应于bso的活力的图。
图58是显示在3d甲基纤维素培养皿相对于2d塑料组织培养皿中生长15天的keap1突变型nsclc细胞中每个指定基因的平均grna表达的散点图。用表达包含481个nrf2/keap1靶基因和37个对照基因的grna文库的慢病毒(在1000x覆盖度下0.3moi)感染a549细胞。然后将嘌呤霉素抗性细胞接种到2d塑料组织培养皿中或在甲基纤维素中生长。在不同时间点之后,收集细胞并通过下一代测序鉴定grna。
图59是显示植入裸小鼠(xeno)中的对比在2d塑料组织培养皿中生长15天的keap1突变型nsclc细胞中每个指定基因的平均grna表达的散点图。用表达包含481个nrf2/keap1靶基因和37个对照基因的grna文库的慢病毒(在1000x覆盖下0.3moi)感染a549细胞。然后将嘌呤霉素抗性细胞铺板到2d塑料组织培养皿中或植入裸小鼠中。在不同时间点之后,收集细胞并通过下一代测序鉴定grna。
图60是显示植入裸小鼠(xeno)的对比在3d甲基纤维素培养物中生长15天的keap1突变型nsclc细胞中每个指定基因的平均grna表达的散点图。用表达包含481个nrf2/keap1靶基因和37个对照基因的grna文库的慢病毒(在1000x覆盖下0.3moi)感染a549细胞。然后将嘌呤霉素抗性细胞在甲基纤维素中生长或植入到裸小鼠中。在不同时间点之后,收集细胞并通过下一代测序鉴定grna。
图61是显示响应于利用erb2抗体yw57.88.5的处理的a549异种移植肿瘤体积的动力学的图。
图62是一系列照片,其显示在igf1r抑制剂林西替尼和nvp-aew541存在的情况以及在谷胱甘肽存在或不存在的情况下,在软琼脂(非贴壁依赖性条件)中生长的keap1突变型细胞系和keap1野生型细胞系的集落形成。
具体实施方式
i.引言
本发明提供癌症诸如肺癌(例如,nsclc)或头颈鳞状癌(例如,hnsc)的诊断和伴随治疗方法。本发明至少部分基于以下发现:nrf2中去除外显子2或外显子2+3的剪接变体导致在癌症中赋予nrf2激活的意外机制。nrf2剪接变体通过keap1或nrf2中的突变的互斥机制导致nrf2激活,但产生相似的nrf2靶基因表达谱。在具有导致这些nrf2剪接变体的微缺失的细胞系中,存在nrf2-keap1相互作用的丧失,增加的nrf2稳定化,nrf2转录反应的诱导和nrf2途径依赖性。这发生在3-6%的鳞状nsclc和1-2%的hnsc中,并且导致nrf2靶基因的类似激活和作为keap1突变的对途径的依赖性。
该发现可用于诊断患有癌症的受试者(例如,通过检测nrf2剪接变体或通过检测与nrf2剪接变体的存在一致的基因或蛋白质表达谱)和用于根据此类诊断治疗受试者(例如,通过施用治疗有效量的nrf2途径拮抗剂,例如camp应答元件结合蛋白(creb)结合蛋白(cbp)抑制剂)。
ii.定义
术语“诊断(diagnose)”、“诊断(diagnosing)”或“诊断(diagnosis)”在本文中用于指分子或病理状态、疾病或病症(例如,癌症)的鉴定或分类。例如,“诊断”可以是指特定类型的癌症的鉴别。“诊断”还可以是指例如通过组织病理学标准或通过分子特征(例如,特征在于生物标志物(例如,特定基因或由所述基因编码的蛋白质)中的一种或组合的表达的亚型)进行的癌症的特定亚型的分类。
术语“癌症”和“癌性”是指或描述哺乳动物中的生理学病状,其特征通常在于细胞生长不受调控。该定义包括良性和恶性癌症以及休眠肿瘤或微转移(micrometastatses)。癌症的实例包括但不限于癌、淋巴瘤、胚细胞瘤、胶质母细胞瘤、肉瘤和白血病。癌症可包括例如乳腺癌、鳞状细胞癌、肺癌(包括小细胞肺癌、非小细胞肺癌(nsclc)、肺腺癌和肺鳞状细胞癌(例如、鳞状nsclc))、各种类型的头颈癌(例如、hnsc)、腹膜癌、肝细胞癌、胃癌或胃癌(stomachcancer)(包括胃肠癌)、胰腺癌、卵巢癌、宫颈癌、肝癌、膀胱癌、肝瘤、结肠癌、结直肠癌、子宫内膜癌或子宫癌、唾液腺癌、肾癌或肾癌、肝癌、前列腺癌、外阴癌、甲状腺癌和肝癌、以及b细胞淋巴瘤(包括低级/滤泡性非霍奇金淋巴瘤(nhl)、小淋巴细胞性(sl)nhl、中级/滤泡性nhl、中级弥漫性nhl、高级成免疫细胞性nhl、高级成淋巴细胞性nhl、高级小无核裂细胞性nhl、贮积病nhl(bulkydiseasenhl)、套细胞淋巴瘤、aids相关淋巴瘤和瓦尔登斯特伦氏巨球蛋白血症)、慢性淋巴细胞性白血病(cll)、急性淋巴细胞性白血病(all)、毛细胞性白血病、慢性成髓细胞性白血病和移植后淋巴细胞增殖性疾病(ptld)、以及与瘢痣病(phakomatoses)、水肿(诸如与脑瘤有关的)和梅格斯氏综合征相关的异常血管增殖。
本文中的“患者”或“受试者”是指有资格接受治疗,正在经历或经历过疾病或病症诸如癌症的一种或多种体征、症状或其它指标的任何单个动物(包括例如哺乳动物,诸如狗、猫、马、兔、动物园动物、牛、猪、羊、非人灵长类动物和人),诸如人。作为患者而被包括的是参与临床研究试验但未显示任何疾病临床体征的任何患者,参与流行病学研究的患者或曾用作对照的患者。患者可能先前已经用nrf2途径拮抗剂或另一种药物治疗,或者未经如此治疗。当开始本文的治疗时,患者可能初次接触使用的一种或多种另外的药物,即,患者可能先前在“基线”(即,在本文的治疗方法中施用第一剂量的nrf2途径拮抗剂之前的设定时间点,诸如在治疗开始前筛选受试者的当天)时未使用例如除nrf2途径拮抗剂(例如,vegf拮抗剂或pd-1轴结合拮抗剂)外的疗法进行治疗。这种“首次接触药物真的”患者或受试者通常被认为是用一种或多种此类另外的药物治疗的候选者。
术语“表达的水平”或“表达水平”通常可互换使用,并且通常是指生物样品中生物标志物的量。“表达”通常是指籍以将信息(例如,基因编码的信息和/或表观遗传信息)转换成在细胞中存在和操作的结构的过程。因此,如本文中所用,“表达”可以指转录成多核苷酸、翻译成多肽,或甚至多核苷酸和/或多肽修饰(例如,多肽的翻译后修饰)。转录的多核苷酸、翻译的多肽的片段或多核苷酸和/或多肽修饰(例如,多肽的翻译后修饰),无论它们源自通过可变剪接产生的转录物或降解的转录物还是源自多肽的翻译后加工(例如通过蛋白水解),也应被视为表达的。“表达的基因”包括转录成多核苷酸(作为mrna)然后翻译成多肽的那些基因,以及转录成rna但不翻译成多肽的那些基因(例如,转运rna和核糖体rna)。
术语“生物标志物”和“标志物”在本文中可互换使用,是指dna、rna、蛋白质、碳水化合物或基于糖脂的分子标志物,可通过标准方法(或本文公开的方法)检测其在受试者或患者样品中的表达或存在。此类生物标志物包括但不限于表1中列出的mrna序列及其编码的蛋白质。可以确定此类生物标志物的表达在获自对nrf2途径拮抗剂敏感或作出响应的患者的样品中比参照水平(包括例如,来自患者(例如,患有癌症并将测试其对nrf2途径拮抗剂的响应性的患者)的组/群体的样品中生物标志物的平均(例如,平均值或中位值)表达水平;来自患者(例如,患有癌症并且被鉴定为不响应于nrf2途径拮抗剂的患者)的组/群体的样品中生物标志物的中位表达水平;先前获自个体的样品中的水平;或者来自在原发性肿瘤的情况下接受了利用nrf2途径拮抗剂的先前治疗并且现在可能正在经历转移的患者的样品中的水平)高或低。具有大于或小于至少一种基因(诸如表1中列出的那些基因)的参照表达水平的表达水平的个体,可被鉴定为可能对利用nrf2途径拮抗剂的治疗起反应的受试者/患者。例如,表现出相对于(即,高于或低于)参照水平(诸如平均水平)最极端50%、45%、40%、35%、30%、25%、20%、15%、10%或5%的基因表达水平的受试者/患者可被鉴定为可能响应于nrf2途径拮抗剂治疗的受试者/患者(例如,患有癌症的患者)。
表1.
如本文中所用,除非另有说明,否则术语“abcc2”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然abcc2(atp结合盒亚家族c,成员2)。该术语包括“全长”,未加工的abcc2以及由细胞中的加工产生的abcc2的任何形式。该术语还包括天然存在的abcc2变体,例如剪接变体或等位基因变体。示例性人abcc2的核酸序列示于seqidno:1中。由人abcc2编码的示例性蛋白质的氨基酸序列显于seqidno:33中。
如本文中所用,除非另有说明,否则术语“akr1b10”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然akr1b10(醛-酮还原酶家族1,成员b10)。该术语包括“全长”、未加工的akr1b10以及由细胞中的加工产生的akr1b10的任何形式。该术语还包括天然存在的akr1b10变体,例如剪接变体或等位基因变体。示例性人akr1b10的核苷酸序列示于seqidno:2中。由人akr1b10编码的示例性蛋白质的氨基酸序列示于seqidno:34中。
如本文中所用,除非另有说明,否则术语“akr1b15”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然akr1b15(醛-酮还原酶家族1,成员b15)。该术语包括“全长”、未加工的akr1b15以及由细胞中的加工产生的akr1b15的任何形式。该术语还包括天然存在的akr1b15变体,例如剪接变体或等位基因变体。示例性人akr1b15的核苷酸序列示于seqidno:3中。由人akr1b15编码的示例性蛋白质的氨基酸序列示于seqidno:35中。
如本文中所用,除非另有说明,否则术语“akr1c2”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然akr1c2(醛-酮还原酶家族1,成员c2)。该术语包括“全长”、未加工的akr1c2以及由细胞中的加工产生的akr1c2的任何形式。该术语还包括天然存在的akr1c2变体,例如剪接变体或等位基因变体。示例性人akr1c2的核苷酸序列示于seqidno:4中。由人akr1c2编码的示例性蛋白质的氨基酸序列示于seqidno:36中。
如本文中所用,除非另有说明,否则术语“akr1c3”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然akr1c3(醛-酮还原酶家族1,成员c3)。该术语包括“全长”、未加工的akr1c3以及由细胞中的加工产生的akr1c3的任何形式。该术语还包括天然存在的akr1c3变体,例如剪接变体或等位基因变体。示例性人akr1c3的核苷酸序列示于seqidno:5中。由人akr1c3编码的示例性蛋白质的氨基酸序列示于seqidno:37中。
如本文中所用,除非另有说明,否则术语“akr1c4”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然akr1c4(醛-酮还原酶家族1,成员c4)。该术语包括“全长”、未加工的akr1c4以及由细胞中的加工产生的akr1c4的任何形式。该术语还包括天然存在的akr1c4变体,例如剪接变体或等位基因变体。示例性人akr1c4的核苷酸序列示于seqidno:6中。由人akr1c4编码的示例性蛋白质的氨基酸序列示于seqidno:38中。
如本文中所用,除非另有说明,否则术语“cabyr”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然cabyr(钙结合酪氨酸-(y)-磷酸化调节的)。该术语包括“全长”、未加工的cabyr以及由细胞中的加工产生的cabyr的任何形式。该术语还包括天然存在的cabyr变体,例如剪接变体或等位基因变体。示例性人cabyr的核苷酸序列示于seqidno:7中。由人cabyr编码的示例性蛋白质的氨基酸序列示于seqidno:39中。
如本文中所用,除非另有说明,否则术语“cyp4f11”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然cyp4f11(细胞色素p450,家族4,亚家族f,多肽11)。该术语包括“全长”、未加工的cyp4f11以及由细胞中的加工产生的cyp4f11的任何形式。该术语还包括天然存在的cyp4f11变体,例如剪接变体或等位基因变体。示例性人cyp4f11的核苷酸序列示于seqidno:8中。由人cyp4f11编码的示例性蛋白质的氨基酸序列示于seqidno:40中。
如本文中所用,除非另有说明,否则术语“fech”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然fech(亚铁螯合酶)。该术语包括“全长”、未加工的fech以及由细胞中的加工产生的fech的任何形式。该术语还包括天然存在的fech变体,例如剪接变体或等位基因变体。示例性人fech的核苷酸序列示于seqidno:9中。由人fech编码的示例性蛋白质的氨基酸序列示于seqidno:41中。
如本文中所用,除非另有说明,否则术语“ftl”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然ftl(铁蛋白,轻多肽(lightpolypeptide))。该术语包括“全长”、未加工的ftl以及由细胞中的加工产生的ftl的任何形式。该术语还包括天然存在的ftl变体,例如剪接变体或等位基因变体。示例性人ftl的核苷酸序列示于seqidno:10中。由人ftl编码的示例性蛋白质的氨基酸序列示于seqidno:42中。
如本文中所用,除非另有说明,否则术语“gclm”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然gclm(谷氨酰胺-半胱氨酸连接酶,修饰亚基)。该术语包括“全长”、未加工的gclm以及由细胞中的加工产生的gclm的任何形式。该术语还包括天然存在的gclm变体,例如剪接变体或等位基因变体。示例性人gclm的核苷酸序列示于seqidno:11中。由人gclm编码的示例性蛋白质的氨基酸序列示于seqidno:43中。
如本文中所用,除非另有说明,否则术语“gsr”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然gsr(谷胱甘肽还原酶)。该术语包括“全长”、未加工的gsr以及由细胞中的加工产生的gsr的任何形式。该术语还包括天然存在的gsr变体,例如剪接变体或等位基因变体。示例性人gsr的核苷酸序列示于seqidno:12中。由人gsr编码的示例性蛋白质的氨基酸序列示于seqidno:44中。
如本文中所用,除非另有说明,否则术语“kynu”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然kynu(犬尿氨酸酶)。该术语包括“全长”、未加工的kynu以及由细胞中的加工产生的kynu的任何形式。该术语还包括天然存在的kynu变体,例如剪接变体或等位基因变体。示例性人kynu的核苷酸序列示于seqidno:13中。由人kynu编码的示例性蛋白质的氨基酸序列示于seqidno:45中。
如本文中所用,除非另有说明,否则术语“me1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然me1(苹果酸酶1,nadp(+)-依赖性的,细胞溶质的)。该术语包括“全长”、未加工的me1以及由细胞中的加工产生的me1的任何形式。该术语还包括天然存在的me1变体,例如剪接变体或等位基因变体。示例性人me1的核苷酸序列示于seqidno:14中。由人me1编码的示例性蛋白质的氨基酸序列示于seqidno:46中。
如本文中所用,除非另有说明,否则术语“nfe2l2”或“nrf2”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然nfe2l2或nrf2(核因子,红细胞样2-2)。该术语包括“全长”、未加工的nfe2l2以及由细胞中的加工产生的nfe2l2的任何形式。该术语还包括天然存在的nfe2l2变体,例如剪接变体或等位基因变体。示例性人nfe2l2的核苷酸序列示于seqidno:15中。由人nfe2l2编码的示例性蛋白质的氨基酸序列示于seqidno:47中。
如本文中所用,除非另有说明,否则术语“nqo1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然nqo1(nad(p)h脱氢酶,醌1)。该术语包括“全长”、未加工的nqo1以及由细胞中的加工产生的nqo1的任何形式。该术语还包括天然存在的nqo1变体,例如剪接变体或等位基因变体。示例性人nqo1的核苷酸序列示于seqidno:16中。由人nqo1编码的示例性蛋白质的氨基酸序列示于seqidno:48中。
如本文中所用,除非另有说明,否则术语“nr0b1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然nr0b1(核受体亚家族0,组b,成员1)。该术语包括“全长”、未加工的nr0b1以及由细胞中的加工产生的nr0b1的任何形式。该术语还包括天然存在的nr0b1变体,例如剪接变体或等位基因变体。示例性人nr0b1的核苷酸序列示于seqidno:17中。由人nr0b1编码的示例性蛋白质的氨基酸序列示于seqidno:49中。
如本文中所用,除非另有说明,否则术语“osgin1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然osgin1(氧化应激诱导的生长抑制剂1)。该术语包括“全长”、未加工的osgin1以及由细胞中的加工产生的osgin1的任何形式。该术语还包括天然存在的osgin1变体,例如剪接变体或等位基因变体。示例性人osgin1的核苷酸序列示于seqidno:18中。由人osgin1编码的示例性蛋白质的氨基酸序列示于seqidno:50中。
如本文中所用,除非另有说明,否则术语“pgd”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然pgd(磷酸葡萄糖酸脱氢酶)。该术语包括“全长”、未加工的pgd以及由细胞中的加工产生的pgd的任何形式。该术语还包括天然存在的pgd变体,例如剪接变体或等位基因变体。示例性人pgd的核苷酸序列示于seqidno:19中。由人pgd编码的示例性蛋白质的氨基酸序列示于seqidno:51中。
如本文中所用,除非另有说明,否则术语“rspo3”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然rspo3(r-脊椎蛋白3)。该术语包括“全长”、未加工的rspo3以及由细胞中的加工产生的rspo3的任何形式。该术语还包括天然存在的rspo3变体,例如剪接变体或等位基因变体。示例性人rspo3的核苷酸序列示于seqidno:20中。由人rspo3编码的示例性蛋白质的氨基酸序列示于seqidno:52中。
如本文中所用,除非另有说明,否则术语“slc7a11”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然slc7a11(溶质载体家族7(阴离子型氨基酸转运蛋白轻链,xc-系统),成员11)。该术语包括“全长”、未加工的slc7a11以及由细胞中的加工产生的slc7a11的任何形式。该术语还包括天然存在的slc7a11变体,例如剪接变体或等位基因变体。示例性人slc7a11的核苷酸序列示于seqidno:21中。由人slc7a11编码的示例性蛋白质的氨基酸序列示于seqidno:53中。
如本文中所用,除非另有说明,否则术语“srxn1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然srxn1(硫氧还蛋白1)。该术语包括“全长”、未加工的srxn1以及由细胞中的加工产生的srxn1的任何形式。该术语还包括天然存在的srxn1变体,例如剪接变体或等位基因变体。示例性人srxn1的核苷酸序列示于seqidno:22中。由人srxn1编码的示例性蛋白质的氨基酸序列示于seqidno:54中。
如本文中所用,除非另有说明,否则术语“taldo1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然taldo1(转醛醇酶1)。该术语包括“全长”、未加工的taldo1以及由细胞中的加工产生的taldo1的任何形式。该术语还包括天然存在的taldo1变体,例如剪接变体或等位基因变体。示例性人taldo1的核苷酸序列示于seqidno:23中。由人taldo1编码的示例性蛋白质的氨基酸序列示于seqidno:55中。
如本文中所用,除非另有说明,否则术语“trim16”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然trim16(含三重基序的16)。该术语包括“全长”、未加工的trim16以及由细胞中的加工产生的trim16的任何形式。该术语还包括天然存在的trim16变体,例如剪接变体或等位基因变体。示例性人trim16的核苷酸序列示于seqidno:24中。由人trim16编码的示例性蛋白质的氨基酸序列示于seqidno:56中。
如本文中所用,除非另有说明,否则术语“trim16l”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然trim16l(含三重基序的16-样)。该术语包括“全长”、未加工的trim16l以及由细胞中的加工产生的trim16l的任何形式。该术语还包括天然存在的trim16l变体,例如剪接变体或等位基因变体。示例性人trim16l的核苷酸序列示于seqidno:25中。由人trim16l编码的示例性蛋白质的氨基酸序列示于seqidno:57中。
如本文中所用,除非另有说明,否则术语“txn”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然txn(硫氧还蛋白)。该术语包括“全长”、未加工的txn以及由细胞中的加工产生的txn的任何形式。该术语还包括天然存在的txn变体,例如剪接变体或等位基因变体。示例性人txn的核苷酸序列示于seqidno:26中。由人txn编码的示例性蛋白质的氨基酸序列示于seqidno:58中。
如本文中所用,除非另有说明,否则术语“txnrd1”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然txnrd1(硫氧环蛋白还原酶1)。该术语包括“全长”、未加工的txnrd1以及由细胞中的加工产生的txnrd1的任何形式。该术语还包括天然存在的txnrd1变体,例如剪接变体或等位基因变体。示例性人txnrd1的核苷酸序列示于seqidno:27中。由人txnrd1编码的示例性蛋白质的氨基酸序列示于seqidno:59中。
如本文中所用,除非另有说明,否则术语“ugdh”是指来自任何脊椎动物来源,包括哺乳动物诸如灵长类动物(例如人)和啮齿动物(例如,小鼠和大鼠)的任何天然ugdh(尿苷二磷酸(udp)-葡萄糖-6-脱氢酶)。该术语包括“全长”、未加工的ugdh以及由细胞中的加工产生的ugdh的任何形式。该术语还包括天然存在的ugdh变体,例如剪接变体或等位基因变体。示例性人ugdh的核苷酸序列示于seqidno:28中。由人ugdh编码的示例性蛋白质的氨基酸序列示于seqidno:60中。
术语“样品”和“生物样品”可互换使用,是指从个体(包括体液、身体组织(例如,肿瘤组织)、细胞)或其它来源获得的任何生物样品。体液是例如淋巴液、血清、新鲜全血、外周血单核细胞、冷冻全血、血浆(包括新鲜或冷冻的)、尿液、唾液、精液、滑液和脊髓液。样品还包括乳腺组织、肾组织、结肠组织、脑组织、肌肉组织、滑膜组织、皮肤、毛囊、骨髓和肿瘤组织。从哺乳动物获得组织活检物和体液的方法是本领域熟知的。
“组织样品”或“细胞样品”是指从受试者或个体的组织获得的相似细胞的集合。组织或细胞样品的来源可以是来自新鲜、冷冻和/或保存的器官、组织样品、活检物和/或抽吸物的实体组织;血液或任何血液成分诸如血浆;体液诸如脑脊髓液、羊水、腹膜液或间质液;来自受试者的妊娠或发育中的任何时间的细胞。组织样品也可以是原代或培养的细胞或细胞系。任选地,组织或细胞样品获自疾病组织/器官。组织样品可含有在自然界中不与组织天然混杂的化合物,诸如防腐剂、抗凝血剂、缓冲剂、固定剂、营养物、抗生素等。
如本文所用的“参照样品”、“参照细胞”、“参照组织”、“对照样品”、“对照细胞”或“对照组织”是指用于比较目的的样品、细胞、组织、标准或水平。在一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自同一受试者或个体的身体的健康和/或非患病部分(例如,组织或细胞)。例如,健康和/或非患病细胞或与患病细胞或组织相邻的组织(例如,与肿瘤相邻的细胞或组织)。在另一个实施方案中,参照样品获自同一受试者或个体的身体的未处理组织和/或细胞。在另一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自不是受试者或个体的个体的身体的健康和/或非患病部分(例如,组织或细胞)。在甚至另一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自非受试者或个体的身体的未治疗组织和/或细胞。在另一个实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织获自一种或多种细胞系(例如,一种或多种正常细胞系)。
如本文中所用,短语“鉴定患者(identifyingapatient)”或“鉴定患者(identifiesapatient)”是指使用与表1中所列的基因中的至少一种的水平相关的生成的信息或数据、具有其外显子2或外显子2+3的全部或部分的缺失的nrf2mrna或具有其neh2或neh2+4的全部或部分的缺失的nrf2蛋白在患者样品中的存在,来将患者鉴定或选择为更可能受益于或不太可能受益于包含nrf2途径拮抗剂的疗法。所使用或生成的信息或数据可以为任何形式(书面、口头或电子的)。在一些实施方案中,使用所生成的信息或数据包括传达、呈递、报告、存储、发送、传递、提供、传输、分配或其组合。在一些实施方案中,传达、呈递、报告、存储、发送、传递、提供、传输、分配或其组合是由计算设备、分析器单元或其组合来执行。在一些其它实施方案中,传达、呈递、报告、存储、发送、传递、提供、传输、分配或其组合是由实验室或医学专业人员来执行。在一些实施方案中,信息或数据包括表1中所列的基因中的至少一种的水平与参照水平的比较。在一些实施方案中,信息或数据包括表1中所列的基因中的至少一种存在或不存在于样品中的指示。在一些实施方案中,信息或数据包括nrf2mrna具有其外显子2或外显子2+3的全部或部分的缺失的指示。在一些实施方案中,信息或数据包括nrf2蛋白具有其neh2或neh2+4的全部或部分的缺失的指示。在一些实施方案中,信息或数据包括患者更可能或不太可能响应包含nrf2途径拮抗剂的疗法的指示。
术语“引物”是指单链多核苷酸,其能够与核酸杂交并允许互补核酸聚合(通常通过提供游离的3'-oh基团)。
如本文中所用,术语“治疗(treatment)”(及其语法变化形式,诸如“治疗(treat)”或“治疗(treating)”)是指试图改变所治疗个体的天然病程的临床介入,且可为了预防或在临床病理学过程中而进行。理想的治疗效果包括但不限于防止疾病发生或复发性、减轻症状、减弱疾病的任何直接或间接病理学后果、防止转移、降低疾病进展速度、改善或缓解疾病状态以及缓和或改善预后。在一些实施方案中,本发明的抗体用于延迟疾病的发展或减缓疾病的进展。
如本文中所用,“施用”意指向受试者施用一定剂量的化合物(例如,nrf2途径拮抗剂)的方法。本文所述方法中使用的组合物可以例如通过玻璃体内(例如,通过玻璃体内注射)、通过滴眼、肌内、静脉内、皮内、经皮、动脉内、腹膜内、病灶内、颅内、关节内、前列腺内(intraprostatically)、胸膜内、气管内、鞘内、鼻内、阴道内、直肠内、局部、瘤内、腹膜内、皮下、结膜下、囊内、粘膜、心包内、脐带内、眼内、眶内、口服、局部、透皮、通过吸入、通过注射、通过植入、通过输注、通过连续输注、通过直接局部灌注靶细胞、通过导管、通过灌洗、在乳膏中或在脂质组合物中的途径进行施用。用于本文所述方法中的组合物还可以以全身方式或以局部方式施用。施用方法可以根据各种因素(例如,所施用的化合物或组合物以及所治疗的病状、疾病或病症的严重性)而变化。
试剂(例如,药物制剂)的“有效量”是指以剂量和在需要的时间段内能有效获得所需的治疗或预防结果的量。
本文中的术语“抗体”以最广泛的含义使用,并且包括各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要它们显示出所需的抗原-结合活性。
关于参照多肽序列的“氨基酸序列同一性百分比(%)”定义为在比对序列并且必要时引入间隙以实现最大序列同一性百分比,并且不考虑任何保守性取代作为序列同一性的一部分之后,候选序列中与参照多肽序列中的氨基酸残基相同的氨基酸残基的百分比。用于测定氨基酸序列同一性百分比的目的的比对可以属于本领域中的技能的多种方式实现,所述方式例如使用可公开获得的计算机软件,诸如blast、blast-2、align或megalign(dnastar)软件。本领域技术人员可确定用于比对序列的适当参数,包括在所比较的序列的全长上实现最大对准所需的任何算法。然而,出于本文目的,使用序列比较计算机程序align-2产生氨基酸序列同一性%值。align-2序列比较计算机程序由genentech,inc.创造,且原始码已与用户文件一起在美国版权办公室(u.s.copyrightoffice,washingtond.c.,20559)备案,其中其在美国版权登记号txu510087下登记。align-2程序可从genentech,inc.,southsanfrancisco,calif.公开获得,或者可以从源代码编译。align-2程序应编译用于unix操作系统(包括数字unixv4.0d)上。所有序列比较参数皆由align-2程序设置且不改变。
在align-2用于氨基酸序列比较的情形下,给定氨基酸序列a对于、与或针对给定氨基酸序列b的氨基酸序列同一性%(其可选地表述为对于、与或针对给定的氨基酸序列b具有或包含一定的氨基酸序列同一性%的给定氨基酸序列a)如下计算:
100×分数x/y
其中x为在对a与b进行该程序比对时由序列比对程序align-2评分为相同匹配的氨基酸残基数目,且其中y为b中的氨基酸残基总数。应了解,在氨基酸序列a的长度不等于氨基酸序列b的长度的情况下,a与b的氨基酸序列同一性%将不等于b与a的氨基酸序列同一性%。除非另外特定陈述,否则本文中所使用的所有氨基酸序列同一性%值使用align-2计算机程序如前一段落中所描述而获得。
术语“抗肿瘤的”是指可用于治疗癌症的组合物,其包含至少一种活性治疗剂,例如“抗癌剂”。治疗剂(抗癌剂)的实例包括但不限于,例如,化学治疗剂、生长抑制剂、细胞毒剂、放射治疗中使用的药剂、抗血管生成剂、凋亡剂、抗微管蛋白剂和治疗癌症的其它药剂,诸如抗her-2抗体、抗cd20抗体、表皮生长因子受体(egfr)拮抗剂(例如,酪氨酸激酶抑制剂)、her1/egfr抑制剂(例如厄洛替尼(tarcevatm))、血小板衍生生长因子抑制剂(例如,gleevectm(甲磺酸伊马替尼))、cox-2抑制剂(例如,塞来昔布)、干扰素、细胞因子、拮抗剂(例如,中和抗体),其与一种或多种以下靶标结合:erbb2、erbb3、erbb4、pdgfr-β、blys、april、bcma或一种或多种vegf受体、trail/apo2和其它生物活性和有机化学试剂等等。其组合物也包括在本发明中。
如本文中所用,术语“细胞毒剂”是指抑制或阻止细胞功能和/或导致细胞死亡或破坏的物质。细胞毒剂包括但不限于放射性同位素(例如,at211、i131、i125、y90、re186、re188、sm153、bi212、p32、pb212和lu的放射性同位素);化学治疗剂或药物(例如,甲氨蝶呤、阿霉素、长春花生物碱(长春新碱、长春碱、依托泊苷)、多柔比星、美法仑、丝裂霉素c、苯丁酸氮芥、柔红霉素或其它嵌入剂);生长抑制剂;酶及其片段如溶核酶、抗生素、毒素诸如小分子毒素或细菌、真菌、植物或动物来源的酶促活性毒素,包括其片段和/或变体,以及下文公开的各种抗肿瘤剂或抗癌剂。
“化学治疗剂”是用于治疗癌症的化合物。“化学治疗剂”的实例包括用于治疗癌症的化合物。化学治疗剂的实例包括烷化剂,诸如,例如替莫唑胺(tmz)、烷化剂达卡巴嗪的咪唑四嗪衍生物。化学治疗剂的另外实例包括例如紫杉醇或托泊替康或聚乙二醇化脂质体多柔比星(pld)。化学治疗剂的其它实例包括烷化剂诸如噻替派和
术语“程序化死亡配体1”和“pd-l1”在本文中是指天然序列pd-l1多肽、多肽变体和天然序列多肽和多肽变体的片段。本文所述的pd-l1多肽可以是从多种来源分离的(诸如来自人组织类型或来自另一个来源),或通过重组或合成方法制备的pd-l1多肽。
术语“pd-l1轴结合拮抗剂”是指抑制pd-l1轴结合配偶体与其结合配偶体的一种或多种相互作用,以便去除由在pd-1信号传导轴上发信号引起的t细胞功能障碍,结果恢复或增强t细胞功能的分子。如本文中所用,pd-l1轴结合拮抗剂包括pd-l1结合拮抗剂和pd-1结合拮抗剂以及干扰pd-l1与pd-1之间相互作用的分子(例如,pd-l2-fc融合物)。
如本文所用,“pd-l1结合拮抗剂”是减少、阻断、抑制、消除或干扰由pd-l1与其结合伴侣中的一种或多种(诸如pd-1和/或b7-1)的相互作用所产生的信号传导的分子。在一些实施方案中,pd-l1结合拮抗剂是抑制pd-l1与其结合伴侣的结合的分子。在具体方面,pd-l1结合拮抗剂抑制pd-l1与pd-1和/或b7-1的结合。在一些实施方案中,pd-l1结合拮抗剂包括抗pd-l1抗体及其抗原结合片段、免疫粘附素、融合蛋白、寡肽、小分子拮抗剂、多核苷酸拮抗剂以及减少、阻断、抑制、消除或干扰由pd-l1与其结合伴侣中的一种或多种(诸如pd-1和/或b7-1)的相互作用所产生的信号传导的其它分子。在一个实施方案中,pd-1结合拮抗剂减少由或通过t淋巴细胞上表达的细胞表面蛋白介导的和其它细胞通过pd-1或pd-l1介导的信号传导的负信号,使得功能失调性t细胞成为较少功能失调的。在一些实施方案中,pd-l1结合拮抗剂是抗pd-l1抗体。在具体方面,抗pd-l1抗体是yw243.55.s70。在另一个具体方面,抗pd-l1抗体是mdx-1105。在另一个具体方面,抗pd-l1抗体是阿替珠单抗(atezolizumab)(mpdl3280a)。在另一个具体方面,抗pd-l1抗体是medi4736(阿替珠单抗)。在又一个具体方面,抗pd-l1抗体是msb0010718c(阿维单抗(avelumab))。
如本文所用,“pd-1结合拮抗剂”是减少、阻断、抑制、消除或干扰由pd-1与其结合伴侣中(诸如pd-l1和/或pd-l2)的一种或多种的相互作用所产生的信号传导的分子。在一些实施方案中,pd-1结合拮抗剂是抑制pd-1与其结合伴侣的结合的分子。在具体方面,pd-1结合拮抗剂抑制pd-1与pd-l1和/或pd-l2的结合。例如,pd-l1结合拮抗剂包括抗pd-l1抗体及其抗原结合片段、免疫粘附素、融合蛋白、寡肽、小分子拮抗剂、多核苷酸拮抗剂以及减少、阻断、抑制、消除或干扰由pd-1与pd-l1和/或pd-l2的相互作用所产生的信号传导的其它分子。在一个实施方案中,pd-1结合拮抗剂减少由或通过t淋巴细胞上表达的细胞表面蛋白介导的和其它细胞通过pd-1或pd-l1介导的信号传导的负信号,使得功能失调性t细胞成为较少功能失调的。在一些实施方案中,pd-1结合拮抗剂为抗pd-1抗体。在具体方面,pd-1结合拮抗剂为mdx-1106(纳武单抗)。在另一个具体方面,pd-1结合拮抗剂为mk-3475(派姆单抗)。在另一个具体方面,pd-1结合拮抗剂为ct-011(皮地利珠单抗)。在另一个具体方面,pd-1结合拮抗剂为medi-0680(amp-514)。在另一个具体方面,pd-1结合拮抗剂为pdr001。在另一个具体方面,pd-1结合拮抗剂为本文所述的regn2810。在另一个具体方面,pd-1结合拮抗剂为本文所述的bgb-108。在另一个具体方面,pd-1结合拮抗剂为amp-224。
术语“血管内皮生长因子”或“vegf”是指血管内皮生长因子。术语“vegf”包括其同源物和同种型。术语“vegf”还包括vegf的已知同种型,例如剪接同种型,例如vegf111、vegf121、vegf145、vegf165、vegf189、和vegf206,以及其天然存在的等位基因和加工的形式,包括通过vegf165的纤溶酶裂解产生的110个氨基酸的人血管内皮细胞生长因子,如ferraramol.biol.cell.21:687(2010),leung等,science,246:1306(1989)和houck等,mol.endocrin.,5:1806(1991)中所述。术语“vegf”还指来自非人物种诸如小鼠、大鼠或灵长类动物的vegf。有时,来自特定物种的vegf由诸如人vegf的hvegf、鼠vegf的mvegf等术语表示。术语“vegf”还用于指包含165个氨基酸的人血管内皮细胞生长因子的氨基酸8至109或1至109的多肽的截短形式。可以在本申请中鉴定对vegf的任何此类形式的提及,例如,通过“vegf109”、“vegf(8-109)”、“vegf(1-109)”或“vegf165”。“截短的”天然vegf的氨基酸位置按天然vegf序列中所示进行编号。例如,截短的天然vegf中的氨基酸位置17(甲硫氨酸)也是天然vegf中的位置17(甲硫氨酸)。截短的天然vegf对kdr和flt-1受体具有与天然vegf相当的结合亲和力。如本文中所用,术语“vegf变体”是指vegf多肽,其在天然vegf序列中包含一个或多个氨基酸突变。任选地,一个或多个氨基酸突变包括氨基酸取代。出于本文所述的vegf变体的简化名称的目的,注意数字是指沿着推定的天然vegf的氨基酸序列的氨基酸残基位置(leung等,同上和houck等,同上中提供的)。
如本文中所用,术语“vegf拮抗剂”是指能够结合vegf,降低vegf表达水平,或中和、阻断、抑制、消除、减少或干扰vegf生物活性(包括但不限于,vegf与一种或多种vegf受体的结合、vegf信号传导和vegf介导的血管生成和内皮细胞存活或增殖)的分子。例如,能够中和、阻断、抑制、消除、减少或干扰vegf生物活性的分子可通过与一种或多种vegf受体(vegfr)(例如vegfr1、vegfr2、vegfr3、膜结合的vegf受体(mbvegfr)或可溶性vegf受体(svegfr))结合而发挥其作用。可用于本发明方法的vegf拮抗剂包括特异性结合vegf的多肽、抗vegf抗体及其抗原结合片段、受体分子和与vegf特异性结合,从而隔离其与一种或多种受体的结合的衍生物、融合蛋白(例如,vegf-trap(regeneron))和vegf121-白树霉素(peregrine)。vegf拮抗剂还包括vegf多肽的拮抗剂变体、与编码vegf多肽的核酸分子的至少一个片段互补的反义核碱基寡聚物、与编码vegf多肽的核酸分子的至少一个片段互补的小rna、靶向vegf的核酶、针对vegf的肽体(peptibody)和vegf适体。vegf拮抗剂还包括结合vegfr的多肽、抗vegfr抗体及其抗原结合片段,以及结合vegfr从而阻断、抑制、消除、减少或干扰vegf生物学活性(例如,vegf信号传导)的衍生物,或融合蛋白。vegf拮抗剂还包括与vegf或vegfr结合并且能够阻断、抑制、消除、减少或干扰vegf生物活性的非肽小分子。因此,术语“vegf活性”特别地包括vegf介导的vegf的生物学活性。在某些实施方案中,vegf拮抗剂使vegf的表达水平或生物活性降低或抑制至少10%、20%、30%、40%、50%、60%、70%、80%、90%或更高。在一些实施方案中,vegf特异性拮抗剂抑制的vegf是vegf(8-109)、vegf(1-109)或vegf165。
如本文中所用,vegf拮抗剂可包括但不限于抗vegfr2抗体和相关分子(例如,雷莫芦单抗、tanibirumab、阿普西柏)、抗vegfr1抗体和相关分子(例如,依库单抗(icrucumab)、阿柏西普(vegftrap-eye;
术语“抗vegf抗体”、“与vegf结合的抗体”和“特异性结合vegf的抗体”是指这样的抗体,其能够以足够的亲和力结合vegf,使得该抗体可用作靶向vegf的诊断和/或治疗剂。在一个实施方案中,如例如通过放射免疫测定法(ria)所测量的,抗vegf抗体与不相关的非vegf蛋白的结合程度低于约10%的抗体与vegf结合。在某些实施方案中,与vegf结合的抗体具有≤1μm、≤100nm、≤10nm、≤1nm、≤0.1nm、≤0.01nm或≤0.001nm(例如,10-8m或更小,例如,10-8m至10-13m,例如10-9m至10-13m)的解离常数(kd)。在某些实施方案中,抗vegf抗体与vegf的表位结合,所述表位在不同物种的vegf之间是保守的。
在某些实施方案中,抗vegf抗体可用作靶向和干扰其中涉及vegf活性的疾病或病症的治疗剂。此外,可将抗体进行其它生物活性测定,例如,以评估其作为治疗剂的有效性。此类测定是本领域已知的,并且取决于靶抗原和抗体的预期用途。实例包括huvec抑制测定;肿瘤细胞生长抑制测定(例如,如wo89/06692中所述的);抗体依赖性细胞毒性(adcc)和补体介导的细胞毒性(cdc)测定(美国专利第5,500,362号);和激动活性或造血作用分析(参见wo95/27062)。抗vegf抗体通常不与其它vegf同源物诸如vegf-b或vegf-c结合,也不与其它生长因子诸如pigf、pdgf或bfgf结合。在一个实施方案中,抗vegf抗体是单克隆抗体,其与由杂交瘤atcchb10709产生的单克隆抗vegf抗体a4.6.1结合相同的表位。在另一个实施方案中,抗vegf抗体是根据presta等(1997)cancerres.57:4593-4599产生的重组人源化抗vegf单克隆抗体,包括但不限于称为贝伐单抗(bv;
抗vegf抗体“雷珠单抗”也称为
术语“共施用的”在本文中用于指施用两种或更多种治疗剂,其中至少部分施用在时间上重叠。因此,共同施用包括在停止施用一种或多种其它药剂后继续施用一种或多种药剂时的给药方案。
如本文中所用,“肿瘤”是指所有赘生性细胞生长和增殖(无论恶性的还是良性的)以及所有癌前和癌性细胞和组织。术语“癌症”、“癌性的”、“细胞增殖性疾病”、“增殖性疾病”和“肿瘤”不是如本文所提及的相互排斥的。
iii.方法
a.诊断方法
本文提供了用于诊断受试者中的癌症(例如,肺癌(例如,鳞状nsclc或非鳞状nsclc)或头颈癌(例如,hnsc))的方法。本文还提供了鉴定患有癌症的受试者的方法,所述癌症是nrf2依赖性癌症(例如,肺癌,例如鳞状非小细胞肺癌或非鳞状非小细胞肺癌,或头颈癌))。所述方法中的任何方法可以基于本文提供的生物标志物(例如nrf2(例如,nrf2mrna或nrf2蛋白)的剪接变体)的表达水平,或一种或多种nrf2靶基因的增加的表达。所述方法中的任何方法可进一步包括向受试者施用nrf2途径拮抗剂。所述方法中的任何方法可进一步包括向受试者施用有效量的第二治疗剂(例如,一种或多种(例如,1种、2种、3种或4种或更多种)另外的nrf2途径拮抗剂或一种或多种(例如,1种、2种、3种或4种或更多种)抗癌剂)。
本发明提供了诊断受试者中的癌症的方法,该方法包括:(a)测定获自所述受试者的样品中选自由以下组成的组的至少一种基因(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种基因)的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl;以及将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中样品中所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有癌症的受试者。
本发明还提供了鉴定患有为nrf2依赖性癌症的癌症的受试者的方法,该方法包括测定获自所述受试者的样品中选自由以下组成的组的至少一种基因(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种基因)的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl;将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较;和确定所述受试者的癌症是否是nrf2依赖性癌症,其中所述样品中的所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有nrf2依赖性癌症的受试者。
在任何先前的方法中,测定akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、kynu、cabyr、slc7a11、trim16l、akr1c4、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn或nqo1中的一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种和21种)的表达水平。
在任何前述方法中,测定一种或多种(例如,(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种或12种)新鉴定的nrf2靶基因的表达水平。新鉴定的nrf2靶基因包括akr1b10、akr1c2、me1、kynu、cabyr、trim16l、akr1c4、cyp4f11、rspo3、akr1b15、nr0b1和akr1c3。
本发明还提供了诊断受试者中的癌症的方法,该方法包括测定获自受试者的样品(例如,肿瘤样品)中的nrf2的mrna表达水平,所述nrf2包含其外显子2的全部或部分的缺失,其中包含其外显子2的全部或部分的缺失的nrf2的存在将受试者鉴定为患有癌症。在一些实施方案中,nrf2还包含其外显子3的全部或部分的缺失。可以基于本领域已知的任何合适的标准(包括但不限于dna、mrna、cdna、蛋白质片段和/或基因拷贝数)定性或定量地测定基因(例如,nrf2、keap1、akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1或ftl)的存在和/或表达水平。
本发明还提供了鉴定受试者中的癌症的方法,该方法包括测定获自受试者的样品中的nrf2的蛋白质表达水平,所述nrf2包含其neh2结构域的全部或部分的缺失,其中包含其neh2结构域的全部或部分的缺失的nrf2的存在将受试者鉴定为患有癌症。在一些实施方案中,nrf2还包含其neh4的全部或部分的缺失。
本发明还提供了鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品(例如,肿瘤样品)中的nrf2的mrna表达水平,所述nrf2包含其外显子2的全部或部分的缺失,其中包含其外显子2的全部或部分的缺失的nrf2的存在将受试者鉴定为患有癌症。在一些实施方案中,nrf2还包含其外显子3的全部或部分的缺失。可以基于本领域已知的任何合适的标准(包括但不限于dna、mrna、cdna、蛋白质片段和/或基因拷贝数)定性或定量地测定基因(例如,nrf2、keap1、akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1或ftl)的存在和/或表达水平。
本发明还提供了鉴定患有癌症的受试者的方法,该方法包括测定获自受试者的样品中的nrf2的蛋白质表达水平,所述nrf2包含其neh2结构域的全部或部分的缺失,其中包含其neh2结构域的全部或部分的缺失的nrf2的存在将受试者鉴定为患有癌症。在一些实施方案中,nrf2还包含其neh4结构域的全部或部分的缺失。
可以通过许多方法分析样品中本文所述的各种生物标志物的存在和/或表达水平/量,所述方法中的许多方法是本领域已知的并且是技术人员所理解的,包括但不限于免疫组织化学(“ihc”)、蛋白质印迹分析、免疫沉淀、分子结合测定、elisa、elifa、荧光激活细胞分选(“facs”)、massarray、蛋白质组学、基于定量血液的分析(例如,血清elisa)、生化酶活性测定、原位杂交、荧光原位杂交(fish)、dna分析、rna分析、全基因组测序、大规模平行dna测序(例如,新一代测序)、
在本文所述任何方法的一些实施方案中,可使用下一代测序方法,诸例如frampton等(naturebiotechnology.31(11):1023-1033,2013)(其通过引用整体并入本文)中描述的靶向基因下拉和测序方法对来自临床肿瘤样品的dna进行测序。可将此种下一代测序方法与本文公开的任何方法一起使用以检测各种突变(例如,插入、缺失、碱基取代、局部基因扩增和/或纯合基因缺失),同时允许使用小样品(例如,来自小芯针穿刺活检、细针穿刺和/或细胞块)或固定的样品(例如,福尔马林固定和石蜡包埋(ffpe)的样品)。
在任何前述方法中,生物标志物的存在和/或表达水平/量(例如,nrf2、keap1、akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1或ftl)通过测定生物标志物的蛋白质表达水平来测量。在某些实施方案中,该方法包括在允许生物标志物结合的条件下使生物样品与特异性结合生物标志物的抗体(例如,抗-nrf2抗体)接触,并检测所述抗体与生物标志物之间是否形成复合物。此类方法可为体外或体内方法。可以使用本领域已知的或本文提供的测量蛋白质表达水平的任何方法。例如,在一些实施方案中,使用选自由以下组成的组的方法测定生物标志物的蛋白质表达水平:流式细胞术(例如,荧光激活细胞分选(facstm))、蛋白质印迹、酶联免疫吸附测定(elisa)、免疫沉淀、免疫组织化学(ihc)、免疫荧光、放射免疫测定、斑点印迹、免疫检测方法、hplc、表面等离子体共振、光光谱学、质谱和hplc。在一些实施方案中,在肿瘤细胞中测定生物标志物的蛋白质表达水平。
在一些实施方案中,生物标志物的存在和/或表达水平/量(例如,nrf2、keap1、akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1或ftl)通过测定生物标志物的mrna表达水平来测量。在某些实施方案中,使用方法测定基因的存在和/或表达水平/量,所述方法包括:(a)对样品(诸如受试者癌症样品)进行基因表达谱分析、pcr(例如rt-pcr)、rna测序、微阵列分析、sage、massarray技术或fish;b)测定样品中生物标志物的存在和/或表达水平/量。在一个实施方案中,pcr方法是qrt-pcr。在一个实施方案中,pcr方法是多重-pcr。在一些实施方案中,通过微阵列测量基因表达。在一些实施方案中,通过qrt-pcr测量基因表达。在一些实施方案中,通过多重-pcr测量表达。
用于评估细胞中mrna的方法是众所周知的,包括例如使用互补dna探针的杂交测定(诸如使用对一种或多种基因特异的标记的核糖核酸探针进行的原位杂交、rna印迹和相关技术)和各种核酸扩增测定(诸如使用对一种或多种基因特异的互补引物的rt-pcr,和其它扩增类型检测方法,诸如,例如支链dna、sisba、tma等)。可以使用rna、斑点印迹或pcr分析方便地测定来自哺乳动物的样品的mrna。另外,此类方法可包括一个或多个步骤,其允许测定生物样品中靶mrna的水平(例如,通过同时检查“管家”基因(诸如肌动蛋白家族成员)的比较对照mrna序列的水平)。
在任何方法的一些实施方案中,生物标志物是nrf2(例如,外显子2缺失的nrf2或外显子2+3缺失的nrf2)。在一个实施方案中,使用方法测定生物标志物的表达水平,所述方法包括对样品(例如从患者获得的肿瘤样品)进行wgs分析并测定样品中生物标志物的表达水平。在一些实施方案中,相对于参照测定外显子2缺失的nrf2或外显子2+3缺失的nrf2的存在。在一些实施方案中,所述参照为参照值。在一些实施方案中,所述参照是参照样品(例如,对照细胞系样品、来自非癌症患者的组织样品或野生型nrf2组织样品)。
除了mrna表达分析以外或作为另外一种选择,可以根据上述方法定量其它生物标志物,诸如蛋白质表达。例如,本发明的方法包括测试样品的基因组生物标志物(例如,外显子2缺失的nrf2或外显子2+3缺失的nrf2的存在,或一种或多种nrf2靶基因(akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1或ftl)的上调,并且另外测试样品的蛋白质生物标志物(例如,akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1或ftl中的一种或多种蛋白质的蛋白质转录物)。
在任何方法的一些实施方案中,dna序列可以用作生物标志物。可以根据本领域已知的任何方法定(包括但不限于pcr、外显子组测定(例如,全外显子组测序)、dna微阵列分析、
在一些情况下,样品中基因的表达水平是基因的平均值(例如,平均表达或中位表达),所述基因的参照考表达水平是所述参照的所述基因的平均值(例如,平均表达或中位表达),并且将样品的所述基因的平均值与所述参照的所述基因的平均值进行比较。
在某些实施方案中,与第二样品中的存在/不存在和/或表达水平/量相比,第一样品中生物标志物的存在和/或表达水平/量得以增加或升高。在某些实施方案中,与第二样品中的存在和/或表达水平/量相比,第一样品中生物标志物的存在/不存在和/或表达水平/量得以减少或降低。在某些实施方案中,第二样品是参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织。本文中描述了用于确定基因的存在/不存在和/或表达水平/量的其它公开内容。
在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自同一受试者或个体的单个样品或组合的多个样品,在与获得测试样品的时间不同的一个或多个时间点获得所述样品。在某些实施方案中,在比获得测试样品的时间更早的时间,从同一受试者或个体获得参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织。如果在癌症的初始诊断期间获得参照样品并且随后在癌症变为转移时获得测试样品,则此类参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织可以是有用的。
在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个非患者的健康个体的组合的多个样品。在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个不为所述受试者或个体的患有疾病或病症(例如,癌症)的个体的组合的多个样品。在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个非患者的个体的正常组织或合并的血浆或血清样品。在某些实施方案中,参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织是来自一个或多个不为所述患者的患有疾病或病症(例如,癌症)的个体的肿瘤组织或合并和血浆或血清样品。
在任何方法的一些实施方案中,升高或增加的表达是指通过本领域已知的标准方法(诸如本文所述的那些方法)检测的相较于参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织的生物标志物(例如,蛋白质或核酸(例如,基因(dna或mrna)))水平的约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多中的任一百分比的总体增加。在某些实施方案中,升高的表达是指样品中生物标志物的表达水平/量的增加,其中所述增加为参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织中的相应生物标志物的表达水平/量的至少约1.5倍、1.75倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、75倍或100倍中的任何倍数。在一些实施方案中,升高的表达是指与参照样品、参照细胞、参照组织、对照样品、对照细胞、对照组织或内部对照(例如,管家基因)相比的大于约1.5倍、约1.75倍、约2倍、约2.25倍、约2.5倍、约2.75倍、约3.0倍或约3.25倍的总体增加。
在任何方法的一些实施方案中,降低的表达是指通过本领域已知的标准方法(诸如本文所述的那些方法)检测的相较于参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织的生物标志物(例如,蛋白质或核酸(例如,基因(dna或mrna)))水平的约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多中的任一百分比的总体下降。在某些实施方案中,降低的表达是指样品中生物标志物的表达水平/量的减少,其中所述减少为参照样品、参照细胞、参照组织、对照样品、对照细胞或对照组织中的相应生物标志物的表达水平/量的至少约0.9倍、0.8倍、0.7倍、0.6倍、0.5倍、0.4倍、0.3倍、0.2倍、0.1倍、0.05倍或0.01倍中的任何倍数。
b.治疗方法
本发明提供了用于治疗患有(例如,肺癌(例如,鳞状nsclc或非鳞状nsclc)或头颈癌(例如,hnsc))的患者的方法。在某些情况下,本发明的方法包括向患者施用有效量的nrf2途径拮抗剂。本文所述的或本领域已知的任何nrf2途径拮抗剂均可用于该方法中。在一些情况下,该方法涉及例如,使用本文中、以下实施例中描述的或本领域已知的方法中的任何方法,确定获自患者的样品中nrf2剪接变体(例如,外显子2缺失的nrf2或外显子2+3缺失的nrf2)或nrf2靶基因的存在和/或表达水平,并基于nrf2剪接变体(例如,外显子2缺失的nrf2或外显子2+3缺失的nrf2)或nrf2靶基因的存在和/或表达水平向患者施用nrf2途径拮抗剂。
本发明提供了治疗患有癌症(例如,肺癌(例如,鳞状nsclc或非鳞状nsclc)或头颈癌(例如,hnsc))的受试者的方法,该方法包括测定获自所述受试者的样品中选自由以下组成的组的至少一种基因(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种或27种基因)的表达水平:akr1b10、akr1c2、srxn1、osgin1、fech、gclm、trim16、me1、kynu、cabyr、slc7a11、trim16l、akr1c4、cyp4f11、rspo3、abcc2、akr1b15、nr0b1、ugdh、txnrd1、gsr、akr1c3、taldo1、pgd、txn、nqo1和ftl;以及将所述至少一种基因的表达水平与所述至少一种基因的参照表达水平进行比较,其中样品中所述至少一种基因的表达水平相对于所述至少一种基因的参照表达水平的升高鉴定患有癌症的受试者,以及向所述受试者施用治疗有效量的一种或多种nrf2途径拮抗剂。
本发明还提供了治疗患有癌症(例如,肺癌(例如,鳞状nsclc或非鳞状nsclc)或头颈癌)的受试者的方法,其中测定一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种或12种)新鉴定的nrf2靶基因的表达水平。新鉴定的nrf2靶基因包括akr1b10、akr1c2、me1、kynu、cabyr、trim16l、akr1c4、cyp4f11、rspo3、akr1b15、nr0b1和akr1c3。
在一些情况下,本发明还提供了治疗患有癌症(例如,肺癌(例如,鳞状nsclc或非鳞状nsclc)或头颈癌)的受试者的方法,其中获自受试者的样品中的nrf2的mrna表达水平包含其外显子2的全部或部分的缺失,并且其中包含其外显子2的全部或部分的缺失的nrf2的存在将受试者鉴定为患有癌症;以及向受试者施用治疗有效量的一种或多种nrf2途径拮抗剂。在一些实施方案中,nrf2还包含其外显子3的全部或部分的缺失。
在一些情况下,本发明还提供了治疗患有癌症(例如,肺癌(例如,鳞状nsclc或非鳞状nsclc)或头颈癌(例如,hnsc))的受试者的方法,其中获自受试者的样品中的nrf2蛋白包含其neh2结构域的全部或部分的缺失,并且其中包含其neh2结构域的全部或部分的缺失的nrf2的存在将受试者鉴定为患有癌症;以及向受试者施用治疗有效量的一种或多种nrf2途径拮抗剂。在一些实施方案中,nrf2还包含其neh4结构域的全部或部分的缺失。
在任何前述方法中,nrf2途径拮抗剂可以是本领域已知的或本文描述的任何nrf2途径拮抗剂。
在一些情况下,所述方法还包括向受试者施用有效量的第二治疗剂(例如,一种或多种抗癌剂)。在一些情况下,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂、免疫疗法及其组合。在一些实施方案中,免疫疗法是vegf拮抗剂(例如,抗vegfr2抗体和相关分子(例如,雷莫芦单抗、tanibirumab、阿普西柏)、抗vegfr1抗体和相关分子(例如,依库单抗、阿柏西普(vegftrap-eye;
本文所述方法中使用的组合物(例如,nrf2途径拮抗剂)可以通过任何合适的方法施用,包括例如静脉内、肌内、皮下、皮内、经皮、动脉内、腹膜内、病灶内、颅内、关节内、前列腺内(intraprostatically)、胸膜内、气管内、鞘内、鼻内、阴道内、直肠内、局部、瘤内、腹膜内、结膜下、囊内、粘膜、心包内、脐带内、眼内、眶内、口服、局部、透皮、玻璃体内(例如,通过玻璃体内注射)、通过滴眼、通过吸入、通过注射、通过植入、通过输注、通过连续输注、通过直接局部灌注靶细胞、通过导管、通过灌洗、在乳膏中或在脂质组合物中的途径进行施用。用于本文描述的方法中的组合物还可以全身方式或以局部方式施用。施用方法可以根据各种因素(例如,所施用的化合物或组合物以及所治疗的病状、疾病或病症的严重性)而变化。在一些实施方案中,nrf2途径拮抗剂通过静脉内、肌内、皮下、局部、口服、透皮、腹膜内、眶内、通过植入、通过吸入、鞘内、心室内或鼻内给药。部分地根据施用是短暂的还是长期的,给药可通过任何适合的途径进行,例如通过注射,诸如静脉内或皮下注射。本文设想了各种给药时间表,包括但不限于单次施用或各种时间点内的多次施用、推注施用和脉冲输注。
本文所述的nrf2途径拮抗剂(和任何另外的抗癌剂)可以以符合良好医学实践的方式配制、给药和施用。在此情形下的考虑因素包括所治疗的特定病症、所治疗的特定哺乳动物、各个患者的临床病状、病症的病因、药剂递送部位、施用方法、施用排程和医学从业者已知的其它因素。nrf2途径拮抗剂不必与,但任选地与一种或多种目前用于预防或治疗所述病症的药剂一起配制和/或同时施用。此类其它药剂的有效量取决于制剂中存在的nrd2途径抑制剂的量、病症或治疗的类型,以及上面讨论的其它因素。这些药剂通常以如本文所述的相同剂量以及用如本文所述的施用途径,或以本文所述的剂量的约1%至99%,或以凭经验/临床上确定为适当的任何剂量且通过凭经验/临床上确定为适当的任何途径加以使用。
在一些实施方案中,所述方法还包括向患者施用有效量的第二治疗剂(例如,一种或多种抗癌剂)。在一些实施方案中,抗癌剂选自由以下组成的组:抗血管生成剂、化学治疗剂、生长抑制剂、细胞毒剂、免疫疗法及其组合。
上述此类联合疗法包括联合施用(其中两种或更多种治疗剂(例如,nrf2途径拮抗剂和抗癌剂)包括在相同或分开的制剂中)和单独施用,在该情况下,nrf2途径拮抗剂的施用可以在施用所述另外的抗癌剂之前、同时和/或之后发生。在一个实施方案中,nrf2途径拮抗剂的施用和另外的抗癌剂的施用在彼此的约一个月内,或在约1周、2周或3周内,或在约1天、2天、3天、4天、5天或6天内发生。
c.用于本发明方法的nrf2途径拮抗剂
本文提供了用于治疗或延迟受试者中癌症(例如,肺癌(例如,鳞状nsclc)或头颈癌)的进展的方法,其包括向受试者施用治疗有效量的nrf2途径拮抗剂。任何前述方法可以基于本文提供肿瘤样品(例如含有肿瘤细胞的活检物)的生物标志物的表达水平,例如,nrf2表达或nrf2途径中涉及的任何蛋白质或mrna的表达。
在一些实施方案中,nrf2途径拮抗剂是小分子,例如能够结合nrf2的小分子或调节nrf2的表达、稳定性或活性的蛋白质或基因。
在一些实施方案中,nrf2途径拮抗剂为nrf2激动剂的拮抗剂。nrf2激动剂的实例包括但不限于camp应答元件结合蛋白(creb)、creb结合蛋白(cbp)、maf、激活转录因子4(atf4)、蛋白激酶c(pkc)、jun、糖皮质激素受体、ubcm2,以及含有e6-ap羧基末端结构域和锚定蛋白重复序列的e3遍在蛋白蛋白连接酶1的同源物(hace1)。因此,nrf2途径拮抗剂的实例包括但不限于creb拮抗剂、cbp拮抗剂、maf拮抗剂、atf4拮抗剂、pkc拮抗剂、jun拮抗剂、糖皮质激素受体拮抗剂、ubcm2拮抗剂和hace1拮抗剂,诸如表2中所列的那些。
在一些实施方案中,nrf2途径拮抗剂为nrf2拮抗剂的激动剂。nrf2拮抗剂的实例包括但不限于c-myc、sumo、keap1、cul3、视黄酸受体α(rarα)。因此,nrf2途径拮抗剂的实例包括但不限于c-myc激动剂、sumo、keap1激动剂、cul3激动剂和rarα激动剂,诸如表3中列出的那些。
表2.
表3.
在本发明的一些实施方案中,表2或3中列出的化合物的衍生物也可以作为nrf2途径拮抗剂施用。表2或3中列出的化合物的衍生物是结构与母体化合物不同的小分子,但保留了拮抗nrf2途径的能力。化合物的衍生物可以相对于母体化合物改变其与某些其它分子或蛋白质的相互作用。化合物的衍生物还可包括母体化合物的盐、加合物或其它变体。在本发明的一些实施方案中,可以使用本文所述化合物(例如,表2或3中列出的化合物的任何一种化合物)的任何衍生物代替母体化合物。在一些实施方案中,表2或3中列出的化合物的任何衍生物可用于治疗患有癌症(诸如肺癌)的受试者的方法中。
在一些实施方案中,nrf2途径拮抗剂是抗体(例如,抗-nrf2抗体或针对调节nrf2表达、稳定性或活性的蛋白质或基因(例如表2或3中列出的靶标)的抗体)。在一些实施方案中,抗-nrf2抗体能够抑制nrf2与抗氧化应答元件之间的结合。在一些实施方案中,抗-nrf2抗体能够抑制nrf2与辅助因子(例如,maf、pkc、jun、atf4或cbp)之间的结合。在一些实施方案中,本发明的抗体是选自由以下组成的组的抗体片段:fab、fab’-sh、fv、scfv和(fab’)2片段。在一些实施方案中,所述抗体是人源化抗体。在一些实施方案中,抗体是人抗体。在一些实施方案中,抗体是具有任何上述特性的已知抗体的衍生物。抗体的衍生物包括与其亲本具有约99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%或更低序列同一性的抗体变体。百分比(%)氨基酸序列同一性根据本领域已知的方法测定,包括通过如上所述的align-2来测定。
在一些实施方案中,nrf2途径拮抗剂包括任何下游生物标志物的抑制剂(例如,基因或蛋白质,例如参与铁螯合(例如,铁蛋白、轻多肽(ftl)、铁蛋白、重多肽1(fth)或血红素加氧酶1(hmox1))、gsh利用(例如,谷胱甘肽过氧化物酶2(gpx2)、谷胱甘肽s-转移酶α1(gsta1)、谷胱甘肽s-转移酶α2(gsta2)、谷胱甘肽s-转移酶α3(gsta3)、谷胱甘肽s-转移酶α5(gsta5)、谷胱甘肽s-转移酶mu1(gstm1)、谷胱甘肽s-转移酶mu2(gstm2)、谷胱甘肽s-转移酶mu3(gstm3)或谷胱甘肽s-转移酶pi1(gstp1))、奎宁解毒(例如,nad(p)h脱氢酶、醌1(nqo1))、gsh产生和再生(例如,谷氨酸-半胱氨酸连接酶修饰亚基(gclm)、谷氨酸-半胱氨酸连接酶催化亚基(gclc)、谷胱甘肽还原酶(gsr)或溶质载体家族7(阴离子氨基酸转运蛋白轻链,xc-系统)、成员11(slc7a11或xct))、硫氧还蛋白(txn)的产生、再生和利用(例如,硫氧还蛋白1(txn1)、硫氧还蛋白还原酶1(txnrd1)或过氧化物酶(peroxiredoxin)1(prdx1))、nadph产生(例如,葡萄糖-6-磷酸脱氢酶(g6pd)、磷酸葡萄糖酸脱氢酶(pgd)、细胞溶质中的nadp(+)-依赖性、苹果酸酶(me1)、可溶性的异柠檬酸脱氢酶1(nadp+)(idh1))的基因或蛋白质,或表1的基因或其蛋白质中的任一种)。
在一些实施方案中,nrf2途径拮抗剂包括抑制(例如,通过竞争性结合nrf2上的are结合位点,通过竞争性结合are,或通过其它方式干扰转录辅因子(例如,小的maf蛋白))nrf2与抗氧化应答元件(are)结合的化合物。
在一些实施方案中,nrf2途径拮抗剂包括nrf2相关基因的激动剂或拮抗剂,使得化合物的药理学作用涉及nrf2介导的转录下游的一个或多个途径的下调。此类nrf2相关基因包括例如kelch样ech相关蛋白1(keap1)、外胚层神经皮质1(具有btb结构域)(enc1)、蛋白激酶c、δ(prkcd)、蛋白激酶c、β(prkcb)、多胺调节因子1(pmf1)、cullin3(cul3)、核因子、红细胞2(nfe2)、激活转录因子4(atf4)、血红素加氧酶1(hmox1)、血红素加氧酶2(hmox2)、遍在蛋白c(ubc)、v-maf禽肌肉腱膜纤维肉瘤癌基因同源物k(mafk)、udp葡糖醛酸基转移酶1家族、多肽a6(ugt1a6)、v-maf禽肌肉腱膜纤维肉瘤癌基因同源物f(maff)、creb结合蛋白(crebbp)、v-maf禽肌肉腱膜纤维肉瘤癌基因同源物g(mafg)、camp响应元件结合蛋白1(creb1)、含fxyd结构域的离子转运调节因子2(fxyd2)、jun原癌基因(jun)、小遍在蛋白样修饰剂2(sumo2)、小遍在蛋白样修饰因子1(sumo1)、v-myc禽骨髓细胞瘤病病毒癌基因同源物(myc)、晶体蛋白(crystallin)、ζ(醌还原酶)(cryz)、醛-酮还原酶家族7、成员a2(黄曲霉毒素醛还原酶)(akr7a2)和谷胱甘肽s-转移酶α2(gsta2)。
在一些实施方案中,提供了增加细胞中nrf2泛素化的方法,该方法包括在允许抑制细胞中的nrf2途径的条件下使细胞与nrf2途径的抑制剂接触。可以例如按照已知方法,通过在胰蛋白酶消化后免疫亲和富集泛素化的nrf2,然后进行质谱分析来测定增加的nrf2泛素化。在一些实施方案中,遍在蛋白的增加可以通过将与nrf2途径拮抗剂接触的细胞或细胞群中的野生型nrf2的泛素化与与nrf2途径拮抗剂接触的细胞或细胞群体中的缺失外显子2或外显子2+3的nrf2的泛素化和/或未与nrf2途径拮抗剂接触的细胞或细胞群体中的缺失外显子2或外显子2+3的nrf2的泛素化进行比较来测定。
在本发明的一些实施方案中,nrf2途径拮抗剂是抗坏血酸、鸦胆子苦醇、木犀草素或赭曲霉毒素a。
实施例
实施例1:材料和实验方法
a.突变和拷贝数分析
对于99个nsclc细胞系,kras、lkb1、keap1和nrf2的非同义突变和拷贝数数据获自klijn等(natbiotechnol.33(3):306-312,2015)。对另外13个nsclc细胞系进行拷贝数分析。另外,将外显子组测序应用于104个nsclc细胞系。对于癌症基因组图谱(tcga),使用r软件包cgds-r(cerami等cancerdiscovery.2:401-404,2012;gao等sci.signal.6:11,2013)从cbioportal检索肿瘤突变和拷贝数数据。
b.突变型keap1基因表达标签的rna测序分析和推导
从europeangenome-phenomearchive(登录号egas00001000610)(pmid:25485619)检索99个nsclc细胞系的原始rna测序数据。表4中提供了每种nsclc细胞系中keap1和nrf2的突变。使用gsnap2013-10-10版(wu和nacu.bioinformatics26:873-881,2010)从tcga下载原始rna测序数据并将其与人参照基因组(grch37/hgi9)进行比对,允许最多2个错配(参数:“-m2-n10-b2-i1-n1-w200000-e1--pairmax-rna=200000”)。用源自作图至每个refseq基因的读段的数目的rpkm(每千碱基靶标的读段,并且百万读段已进行了测序)值定量基因表达水平。使用deseqr包(pmid:20979621)测量keap1突变型与keap1野生型细胞系之间的差异基因表达,报告为倍数变化和相关的调整的p值。对于样品和基因在方差上的沃德聚类(使用euclidean距离),使用稳定的计数数据。'nmf’r包用于生成相关的热图。
表4.
c.剪接变体分析
使用可从bioconductor项目网站获得的sgseq软件包(gentleman等genomebiol.5:r80,2004)进行剪接变体的分析。使用参数α=2、psi=0、β=0.2、γ=0.2,从已知癌基因的54个基因组基因座的7,384个tcga样品的bam文件预测外显子和剪接点。将预测的特征在样品之间合并,并且外显子被处理成不相交的外显子箱(exonbin)。将剪接点和外显子箱组装成全基因组剪接图。从图中识别出由两个或更多个可变剪接变体组成的剪接事件。根据fpkm和相对使用率(relativeusage)ψ定量剪接变体。简言之,获得变体在开始和结束时的相对使用率的局部估计值作为与变体相容的片段的分数。使用加权平均值组合事件开始和结束时的估计值,其中权重与跨越边界的片段总数成比例。将分母小于20的相对使用率估计值设为na。为了获得变体在开始和结束时的绝对表达的局部估计值,将相容计数n转换为fpkm(为ni(nxl)x109),其中n是对齐的片段的总数并且l是有效长度(相容片段的允许位置数)。也在来自正常人组织的2,958个基因型-组织表达项目(gtex)样品中定量在tcga样品中检测到的剪接变体(consortium.science.348:648-660,2015)。
d.癌症特异性剪接变体的鉴定
仅考虑内部剪接变体(不涉及可变转录物的开始或结束),并且需要每个剪接变体的开始和结束重叠或延伸属于从ucsc基因组浏览器网站(pruitt等nucleicacidsres.33:d501-504,2005;rosenbloom等nucleicacidsres.43:d670-681,2015)下载的注释ref基因转录物的外显子。保留的内含子被排除在外。考虑包括至少100个癌症样品(总共6,359个癌症样品)的19个tcga适应症,并且选择(i)在至少一个癌症样品中fpkm>2且相对使用率ψ>0.2以及(ii)在>99.9%的gtex样品中fpkm<1和(iii)在>97.5%的gtex样品中fpkm~0的剪接变体。需要在剪接变体的开始和结束时满足基于fpkm的标准。在人工检查后,包括对于其无法估计ψ的满足基于fpkm的标准的变体。
e.靶向配对末端外显子组测序数据的分析
如前所述(frampton等nat.biotechnol.31,1023-1031,2014),类似地对foundationcore中的所有样品进行处理和测序。在使用两种截然不同的方法在整个foundationcore数据集(n=58,707)中筛选nrf2外显子2和外显子2+3缺失。
首先,检查基于不一致读段对和/或拆分读段的重排识别,以寻找nrf2外显子2或外显子2+3丢失的直接证据。虽然这种方法提供了目标缺失的直接证据,但如果断点位于诱饵区域内,则只能通过这种方法发现缺失,因为未捕获nrf2的内含子区域。因此,该方法鉴定了nrf2外显子2或外显子2+3缺失的有限子集,其中断点发生在内含子-外显子边界附近或外显子内。
第二方法利用来自各个诱饵区域的拷贝数对数比数据。使用针对每个样品的特定肿瘤细胞性进行训练的内部算法测定拷贝数对数比值。计算z评分,比较nrf2中与紧邻nrf2的对照多态性捕获区域(n=15;从nrf2的上游~3mb和下游~12mb每隔~1mb均匀地间隔)中的每个外显子的对数比。特别地检查具有和不具有同时发生的外显子3缺失的外显子2缺失。这些在本文中称为目标外显子(eoi)。如果(1)在nrf2中,对eoi,z评分<-2,但对于非eoi,z评分不小于-2并且(2)计算nrf2中非eoi的对数比下降0.2,则识别eoi缺失。nrf2外显子2或外显子2+3缺失与nrf2或keap1中的短变体之间的相互排斥性在肺鳞状细胞癌中被特异性地检查到(n=1,218)。
f.细胞培养
kms-27(rpmi-1640)、jhh-6(williams培养基e)、hucct1(rpmi-1640)和huh-1(dmem)细胞来自jcrb,并且293(emem)细胞来自atcc。在2mm谷氨酰胺和10%fbs存在的情况下,在指定的培养基中培养细胞。
g.蛋白质印迹
用补充有完全无edta蛋白酶抑制剂(roche)和phostop(roche)、磷酸酶抑制剂混合物2(sigma)和磷酸酶抑制剂混合物3(sigma)磷酸酶抑制剂的ripa缓冲液(sigma)制备细胞裂解物。将裂解物在novextris-甘氨酸4-12%梯度凝胶(thermofisher)上运行并转移到iblot硝酸纤维素(invitrogen)上。将印迹在tbst(10mmtrisph8,150mmnacl,0.1%tween-20)中的5%脱脂奶粉(merck)中预孵育,然后在含有抗体的tbst中的5%牛血清白蛋白(sigma)中孵育。使用的二抗是ecl抗兔hrp和ecl抗小鼠hrp(均来自geheathcare)。用化学发光底物试剂盒(proteinsimple)使印迹显色,并用fluorchemhd2成像仪(proteinsimple)进行显现。本研究中使用的抗体针对keap1(cellsignalingg1010)、nrf2(abcamab62352)、hsp90(cellsignaling4877)、hdac2(cellsignaling5113)、β-肌动蛋白(sigmaa2228)、ha(roche11815016001)和flag(sigmaf2426)。λ磷酸酶来自neb(p0753l),并且在这些实验中从裂解缓冲液中省略了磷酸酶抑制剂。
h.细胞活力和dna片段化分析
用dharmafect2试剂(thermofisher)和optimem(gibco)将sirna逆转染到细胞中。转染后4天,使用celltiter-glo试剂(promega)测量细胞的活力,并在envision多标签读数器(perkinelmer)上检测发光。用dharmafect2试剂(thermofisher)和optimem(gibco)将sirna逆转染到细胞中。转染后4天,使用碘化丙啶(pi)(lifetechnologies)染色和流式细胞术,按照公布的方案(riccardi和nicolettinat.protoc.1:1458-1461,2006)测量细胞的凋亡。在染色前24小时将星形孢菌素(1μm)(enzo)加入阳性对照细胞中。靶向nrf2外显子2的sirna具有序列:5’-tggagtaagtcgagaagta-3’(seqidno:29)和5’-acaactagatgaagagaca-3’(seqidno:30)。靶向nrf2外显子5的sirna具有序列:5’-tgacagaagttgacaatta-3’(seqidno:31)和5’-gtaagaagccagatgttaa-3’(seqidno:32),并将其与非靶sirna一起使用作为对照sirna。用bectondickinsonfacscaliber仪器分析染色的细胞。靶向keap1的sirna来自dhamacon(l012453-00)。
根据riccardi等(natureprotocols,1:1458-1461(2006)),通过碘化丙啶(pi)染色定量dna片段化并通过流式细胞术测量。
i.taqman分析
用rneasy试剂盒(qiagen)提取总细胞rna。使用高容量cdna反转录试剂盒(appliedbiosystems)将rna转化为cdna,并使用taqman基因表达预混合试剂(appliedbiosystems)用taqman基因表达引物-探针组(thermofisher)扩增cdna。在quantstudio7flex实时pcr系统上进行taqman扩增/检测。使用的引物-探针组是hs00232352_ml和hs00975961_g1以分别检测nrf2外显子2和5(thermofisher)。使用的nrf2靶基因taqman引物-探针组是:slc7a11(hs00921938_ml)、sgrn(hs00921938_ml)、nr0b1(hs03043658_ml)、gclc(hsooi55249_ml)和gpx2(hs01591589_ml),均来自thermofisher。
j.293转染。
按照制造商的方案推荐,使用lipofectamine2000(thermofisher)和optimem(gibco)将质粒dna转染到细胞中。转染后2-3天制备裂解物。使用的表达质粒是prk5.nrf2、prk5.nrf2.delta.e2、prk5.nrf2.delta.e2,3、prk5.nrf2.flag和prk5.keap1.ha。
k.肿瘤异种移植模型
将11至12周龄雌性c.b-17scid.米色小鼠(charlesriverlaboratories)在右侧腹侧皮下接种每小鼠10x106个a549shrna细胞(于100μl
l.用erbb3抗体处理的a549异种移植物
在第1天通过静脉内施用,用媒介物或50mg/kgyw57.88.5(100mg/kg负荷剂量)处理携带皮下a549肿瘤(75–144mm3)的雌性裸鼠(n=10),每周一次,持续4周(qwkx4)。每周测量肿瘤两次,并且在其肿瘤达到1000mm3的体积的早期终点或在治疗方案的最后一天对每只动物实施安乐死。
实施例2:在keap1和nrf2中具有突变的nsclc细胞系的鉴定
为了鉴定nsclc中keap1和nrf2的突变、拷贝数和杂合性丢失(loh),记录了通过rna测序、外显子组测序或snp阵列分析的113个nsclc细胞系小组(图1a)。在29/113(26%)的细胞系中发现keap1突变,并且在4/113(4%)的细胞系中检测到nrf2突变。除nci-h661细胞系外,所有keap1突变的细胞系均显示突变等位基因的纯合表达,其通常与拷贝中性loh相关。相反,nrf2突变是杂合的并且与loh无关。另外两种细胞系(hcc1534和nci-hi437)通过keap1dna的双等位基因丢失显示没有可检测的keap1mrna。nrf2突变位于keap1界面区域中的先前鉴定的热点中(图1b)(shibata等proc.natl.acad.sci.u.s.a.105:13568-13573,2008),并且包括点突变和框内3-氨基酸缺失。keap1中的突变遍布整个一级序列(图1c),几乎没有明显的热点。然而,当作图至keap1/nrf2肽晶体结构上时(fukutomi等mol.cell.biol.34:832-846,2014),环中的突变聚簇从keap1核心β螺旋推进区域延伸靠近与nrf2相互作用的位点(图1d)。
实施例3:突变型keap1基因标签的鉴定
为了确定keap1突变在nsclc细胞系中的转录后果,鉴定了与野生型keap1细胞系相比在keap1突变型细胞系中显著地差异表达的基因(p<0.01,绝对平均倍数变化>2)。总体而言,keap1突变型细胞系中有27个基因被显著上调(图2a-2b),其中15个先前已被鉴定为来自chip-测序或rna测序研究的nrf2靶基因(chorley等nucleicacidsres.4:7416-7429,2012;hirotsu等nucleicacidsres.40:10228-10239,2012;malhotra等nucleicacidsres.38:5718-5734,2010)。通过使用这些截断值,只有一种基因hspb1被鉴定为被显著下调。
基于这27个基因的表达的230个tcga肺腺癌的无监督聚类导致分成两个主要的组(图3a)。一个组的主要特征是27个标签基因的高表达,并包含43个肿瘤,其中32个(74%)是keap1突变体。另一组以低表达为特征,包含187个肿瘤,其中179个为keap1野生型。令人惊讶的是,通过使用相同的基因组来对肺鳞状细胞癌进行聚类,nrf2以及keap1突变型肿瘤可与nrf2/keap1野生型肿瘤区别开来(图3b),表明nrf2介导了大部分keap1丢失/突变的转录后果。有趣的是,有几个鳞状nsclc肿瘤显示keap1突变型基因的高表达,而在keap1或nrf2中没有任何已知的突变。在keap1突变型细胞系中上调的27个基因当中,蛋白质组学数据可用于较小的细胞系亚组(37个野生型keap1,6个突变型keap1)中的17个细胞系。与突变型keap1细胞系中这些基因的mrna水平升高一致,这17个基因中除一个(slc7a11,其具有低肽覆盖度)外的所有基因的蛋白质靶标也显示相对于野生型细胞系在突变型keap1细胞系中表达增加(图4)。
实施例4:肿瘤样品中nrf2的异常剪接的鉴定
对于大多数具有27个候选nrf2靶基因的高表达的肿瘤,可以通过keap1或nrf2中的突变来解释升高的基因表达。然而,存在一些在keap1或nrf2中缺乏表征的突变的情况下显示候选nrf2靶基因的高表达的肿瘤。癌症相关的转录物改变越来越多地被认为是可能的驱动者事件(driverevent)。因此,假设这些肿瘤中的nrf2途径激活可能是由不被全外显子组测序识别的剪接改变驱动的。分析了54种已知的癌基因以鉴定在来自tcga的癌症样品中被反复观察到、但在来自gtex的正常样品中很少被检测到的剪接变体(参见实施例1)。选择了19种癌症类型,每种类型包括至少100个癌症样品(总共6,359个样品)。在54种被考虑的癌基因中,鉴定了9个复发的候选癌症特异性剪接变体(对于给定的癌症类型,≥2个样品和>1%的样品)。使用与癌症样品中相同的检测标准,在正常对照(总共2,958个样品)中均未检测到这些变体。将具有共有剪接位点的相关变体组合在一起,在四个癌基因中产生了五个独立的改变(图5)。这些改变包括几个良好记录的致癌剪接变体,包括脑癌中的egfrviii、肺腺癌中的met外显子14跳跃和结肠直肠癌中的ctnnb1外显子3缺失(cho等cancerres.71(24):7587-7596,2011;kong-beltran等cancerres.66(1):283-289,2006;iwao等cancerres.58(5):1021-1026,1998)。有趣的是,先前未表征的nrf2中的剪接变体在患有鳞状nsclc(3.3%;16/481)的患者中频繁地被观察到和发生,并且在患有hnsc的患者(1.5%;6/403)以较低的发生率被观察到和发生(图5a)。对肺鳞癌中nrf2剪接变体的更详细分析显示,在同一患者中同时存在两种剪接变体,对应于从两种可变启动子中的任一种转录的mrna中的nrf2外显子2的跳跃(2.1%;10/481)(图6)。在不同组的患者中(1.2%;6/481)同时存在两种另外的剪接变体,对应于从两种可变转录起始中的任一种转录的mrna中的nrf2外显子2和3两者(外显子2+3)的跳跃(图6)。表达缺乏外显子2或外显子2+3的nrf2剪接变体的所有患者也显示出如通过支持外显子2的包含的拆分读段所证明的正常nrf2转录物的表达。外显子2和3均为nrf2编码序列的一部分,并且预测外显子2或外显子2+3的跳跃导致具有n-末端截短或框内缺失的蛋白质同种型(图7)。缺乏外显子2的nrf2转录物的高复发和编码潜力的保持表明这些剪接变体可以呈现赋予选择性优势的功能获得事件。这得到了外显子2编码neh2结构域的发现的支持,所述neh2结构域允许与keap1相互作用(itoh等genesdev.13(1):76-86,1999),其在15%的鳞状肺癌中发生突变。
为了评估观察到的nrf2剪接变体是否可以解释没有keap1或nrf2突变的患者中的nrf2途径激活,观察到nrf2剪接变体和nrf2途径突变的共同发生。在tcga集合中,通过外显子组测序对所述鳞状肺肿瘤中的178个进行了谱分析。在该亚组中,显示外显子2或外显子2+3缺失的10个肿瘤(6%)与48个(27%)显示nrf2或keap1中的突变的肿瘤相互排斥(图8a)。此外,所有外显子-2缺失的肿瘤显示出27个候选nrf2靶基因的高表达(图8b)。对头颈癌进行了类似的观察,其中5个(2%)肿瘤中的nrf2外显子缺失与26个(9%)肿瘤中的nrf2或keap1中的突变相互排斥(图9a-9b)。这些结果表明,外显子2的缺失代表了在鳞状nsclc和头颈肿瘤亚组中激活nrf2的替代机制。重要的是,这些结果表明,除了外显子组测序以外,还考虑了剪接改变,其使被鉴定为具有推定的nrf2途径激活的患者的百分比从27%(48/178)增加至33%(58/178)(在肺鳞癌中)和从9%(26/275)增加至11%(31/275)(在头颈鳞癌中)。
实施例5:细胞系中nrf2剪接缺陷的验证
为了鉴定用于进一步研究的细胞系模型,从大的人癌细胞系小组中分析了rna测序数据中鉴定的剪接变体的读段证据(在klijn等nat.biotechnol.33(3):306-312,2014中描述的)。在611个细胞系中,鉴定出一个多发性骨髓瘤细胞系kms-27和一个肝细胞癌细胞系jhh-6,两者均显示通过接合读段nrf2外显子2的杂合跳跃的证据(图10)。jhh-6和kms-27mrna中通过rt-pcr显示的nrf2外显子2跳跃被验证。使用分别源自外显子1和外显子3/4的一系列正向和反向引物(图11a),证实了从jhh-6和kms-27细胞分离的mrna中的外显子2缺失(δe2nrf2)(图11b)。pcr产物的测序证实了预期的外显子2缺失(图12a-12c)。基于rna测序数据,在jhh-6或kms-27中的nrf2或keap1的编码序列中未检测到点突变(klijn等nat.biotechnol.33(3):306-312,2014)。
由于nrf2/keap1改变在肝细胞癌(10%)中相当常见,但在多发性骨髓瘤(0%)中不常见,因此进一步测试了jhh-6细胞。具体地,测试了nrf2蛋白的外显子2缺失形式的表达。对来自jhh-6细胞以及keap1突变型huh-1系和作为代表性野生型keap1肝癌细胞系的hucct1细胞的全细胞裂解物进行蛋白质印迹。jhh-6细胞中nrf2的水平与在huh-1细胞中看到的水平相当,所述水平远高于野生型keap1hucct1细胞中的水平(图13)。此外,在jhh-6中可检测到与外显子2缺失一致的较小分子量种类,并且其在nfe2l2sirna转染后减少,证实其确实代表nrf2的一种形式。虽然改变的nrf2同种型是可见的,但令人惊讶的是,由于缺乏keap1相互作用基序,其并不更丰富。假设外显子2缺失的nrf2的磷酸化形式可能与野生型nrf2的未磷酸化形式在所用的4-12%凝胶中共迁移。实际上,jhh-6裂解物的去磷酸化显示nrf2的外显子2缺失形式比野生型形式显著更丰富(图14a,中图)。类似地,kms-27细胞表达nrf2的外显子2缺失形式,其是去磷酸化后明显的主要种类(图15)。
使用环己酰亚胺(以消除总蛋白质合成)测试nrf2在三种肝癌细胞系中的稳定性。使用去磷酸化的裂解物以允许更准确地定量总nrf2。实验显示在jhh-6细胞中δe2nrf2的稳定性增加,与huh-1细胞中的nrf2相当,两者均比hucct1细胞中的nrf2更稳定(图14a-14b)。此外当与huh-1细胞相比时,jhh-6细胞中nrf2的外显子2缺失形式还显示出显著的核定位(图16)。
为了确定jhh-6细胞中外显子2的缺失是否使得nrf2难以通过keap1调控,测试了nrf2响应于keap1敲低的稳定性。由于稳定性增加,hucct1细胞中keap1的敲低导致nrf2的稳态水平增加(图14c)。然而,jhh-6细胞中keap1的敲低不影响外显子2缺失的nrf2的水平或稳定性。如所预期的,keap1的敲低不会增加keap1突变型huh-1细胞系中野生型nrf2的稳定性(图14d)。
实施例6:对nrf2的外显子2和/或外显子2+3缺失的评估
使用实施例3中描述的nrf2/keap1基因标签,确定了在16个肝细胞癌细胞系当中,jhh-6细胞显示nrf2靶基因的最高表达(根据rna测序数据),与在表达突变型keap1的细胞系中所见的那些类似(图17a)。类似地,在检查的18个多发性骨髓瘤细胞系中,kms-27细胞显示这些基因的最高表达(图17b)。这些基因的表达可以通过“nrf2靶基因评分”来概括,该评分计算为所检查的611细胞系中各个靶基因的z-评分的平均值。这产生反映给定细胞系中标签基因的过表达程度的每细胞系的单个评分。nrf2靶标评分证实jhh-6细胞显示与表达keap1突变的肝癌细胞系相似的评分(图18a),并且kms-27细胞显示多发性骨髓瘤细胞系中的最高评分(图18b),尽管多发性骨髓瘤显示低的总nrf2靶基因评分(由负值表示的)。
接下来,将表达外显子2缺失的nrf2的jhh-6细胞对nrf2蛋白表达的依赖性与表达野生型nrf2的hucct1细胞进行比较。在jhh-6细胞中敲低nrf2引起细胞活力的显著降低,类似于在突变型keap1肝细胞癌细胞系huh-1中观察到的。相反,nrf2敲低对hucct1细胞的活力具有更加适度的影响(图19)。这不归因于hucct1细胞中的缺陷型nrf2敲低,因为nrf2敲低在所有三种细胞系中同样有效(图20)。nrf2的敲低还导致四种充分表征的nrf2靶基因的表达降低,尽管这在野生型keap1hucct1细胞系中略微降低(图21)。如通过片段化dna的增加所测量的,降低的活力可能至少部分地由凋亡造成(图22)。
为了解决nrf2外显子2的丢失如何影响nrf2受keap1调控的能力,使用293细胞中的瞬时表达。keap1降低了全长nrf2的表达,但对缺乏外显子2或外显子2+3的nrf2的表达具有较小的影响(图23,上图)。正如预期的那样,keap1对全长nrf2表达的抑制作用大部分被蛋白酶体抑制剂mg132消除。全长nrf2和keap1彼此相互作用,而外显子2或外显子2+3的缺失完全消除了keap1结合nrf2的能力(图23,下图)。结果,与野生型nrf2相比,截短的nrf2在keap1表达后保持稳定(图24a-24b),尽管截短形式的nrf2似乎具有略微降低的内在稳定性。然而,改变的nrf2同种型具有转录活性,这可通过它们增加nrf2靶基因表达的能力来判断(图25)。与全长nrf2相比,外显子2-或外显子2+3-缺失的nrf2类似地使大多数基因增加,并且大多数基因对keap1过表达的作用具有抗性。有趣的是,外显子2+3缺失的nrf2在增加gpx2表达方面存在缺陷,这表明这种形式的nrf2的转录激活可能存在细微差异。与该观察结果一致,除了gpx2之外,实施例3中描述的27种靶基因中的22种与外显子2缺失的肿瘤相比在外显子2+3缺失的鳞状肺肿瘤中显示出较低的中值表达(图26)。
实施例7:nrf2外显子2剪接改变的机理分析
对kms-27和jhh-6的外显子组测序数据的分析显示了作图至外显子2的读段的减少,这表明观察到的转录物变体可能是基因组改变的结果(图27a)。jhh-6和kms-27的全基因组测序(wgs)显示这些细胞系具有围绕nrf2外显子2的微缺失,分别跨越4,685和2,981个核苷酸(图27b)。为了研究患者的因果机制,分析了具有高读段覆盖度(>300x)的临床鳞状nsclc肿瘤的大型群组(n=1,218)的靶向配对末端外显子组测序数据。在该数据集中,与附近的对照区域相比,11个肿瘤显示外显子2或外显子2+3的拷贝数减少(材料和方法;图27b)。通过研究靶向测序的确定的基因组区域的对数比,可以理解缺失的局部性质(图28b)。具有不一致读段对的七个肿瘤与包含数千碱基的dna并影响外显子2或外显子2+3的结构变体一致(图28a)。总共有16名患者显示出影响nrf2外显子2或外显子2+3的基因组改变的证据,并且所鉴定的事件与nrf2和keap1中的点突变或插入缺失相互排斥,已知所述点突变或插入缺失可激活该途径。分析了另外一个群组的45个鳞状nsclc肿瘤,其中rna和dna均可获得。rt-pcr分鉴定了具有外显子2丢失的患者,与邻近的正常组织相比所述外显子2丢失在肿瘤中强烈富集(图29)。rna测序分析证实转录物变体在鉴定的肿瘤中表达,但在相邻的正常组织中不存在(图30)。nrf2靶基因的表达也升高至与该途径中具有已知突变的tcga肿瘤中的所述表达相似的程度,而相邻的正常组织显示这些基因的低表达(图31)。最后,全基因组测序证实转录物变体是外显子2周围5,233个核苷酸的体细胞基因组微缺失的结果(图28c)。这些数据表明基因组微缺失是nrf2途径激活的临床相关机制。
这些数据表明,由nrf2调控的一组基因在不同的组织和条件下是保守的。这在使用单个基因标签来鉴定nsclc和hnsc中具有nrf2激活的肿瘤方面具有实用价值(图32)。有趣的是,这种nrf2/keap1标签仅在肿瘤中被激活。肺和头颈肿瘤的匹配正常样品仅显示低nrf2靶基因活性(图33)。这表明与正常组织相比,nrf2途径的抑制可能在显示通路失调的肿瘤中具有选择性益处。
先前已经报道了许多基因(包括egfr和ctnnb1)的导致原癌基因激活的基因内基因组缺失。部分归因于当前基因组技术的限制,此类变体不是常规测定的。特别是,仅通过外显子组测序难以检测到影响个体外显子并且涉及小拷贝数变化的小畸变。因此,基因内缺失仍然是相对未开发的,并且仍在发现新的变体。最近对小细胞肺癌和成人t细胞白血病/淋巴瘤的研究使用全基因组测序鉴定了tp73、ikzf2和card11中的复发性微缺失(george等nature524,47-53:2015;kataoka等nat.genet.47:1304-1315,2015)。在本研究中,作为tcga项目的一部分产生的公开可获得的rna测序数据用于鉴定已知癌基因中的复发转录物改变。由于患者群组之间的差异,很难评估nrf2外显子缺失的一般发生率。例如,当用可用的rna测序数据分析tcga肺鳞癌(n=481)时,我们鉴定出3%(16/481)的具有nrf2外显子2或外显子2+3缺失的患者。当用可用的外显子组-测序数据分析可对其进行体细胞突变识别的患者的亚组(n=178)时,具有nrf2外显子缺失的患者的比例为6%(10/178)。nrf2外显子缺失的计数将具有推定nrf2途径激活的患者的百分比与仅通过外显子组测序评估nrf2或keap1的突变相比,从27%(48/178)增加至33%(58/178)(在肺鳞癌中),以及从9%(26/275)增加至11%(31/275)(在头颈鳞状细胞癌中)(图8a和9a)。来自接受基因组谱分析的患者的真实临床样品的分析表明在1-2%的肺鳞状细胞癌中发生nrf2外显子缺失。然而,后一种分析缺乏灵敏度,因为尚未建立用于确定具有可变肿瘤含量的样品中单外显子缺失的优化标准,并且仅考虑明确的缺失。然而,本文提供的结果与在特定肿瘤适应症(诸如鳞状nsclc和头颈癌)中经常改变该途径的调节的概念一致。还可以通过对完整基因座(包括内含子)的测序或通过组合来自外显子组和rna测序实验的数据来进一步筛选已知的癌基因。
对由wgs鉴定的三个缺失的结构的分析显示断裂点是不同的,但在每种情况下,侧接有缺失的基因组区域显示具有序列同源性的2-6个核苷酸(图34)。jhh-6细胞的3'末端、5'末端和接合读段的dna序列分别由seqidno:61-63提供。kms-27细胞的3'末端、5'末端和接合读段的dna序列分别由seqidno:64-66提供。原代肿瘤细胞的3'末端、5'末端和接合读段的dna序列分别由seqidno:67-69提供。
除点突变以外,nrf2通常还显示基因组扩增。有趣的是,虽然通过rt-pcr分析获得的kms-27细胞中的nrf2缺失产物的强度似乎与野生型nrf2相似,但其在jhh-6细胞中似乎更丰富(图13)。这也反映在wgs读段计数中,这表明与野生型等位基因相比,缺失形式的丰度更高(图27b)。这些结果与jhh-6细胞携带5个拷贝的nrf2基因基因座(通过snp测定检测的)而kms-27细胞携带2个拷贝的观察结果一致。在所分析的tcga样品中nrf2的扩增相当频繁,包括鳞状(4.5%)和腺瘤(2.6%)nsclc、hnsc(12.2%)和肝癌(3.6%),并且代表增加nrf2转录输出的机制。在jhh-6细胞的情况下,这些数据表明缺失的等位基因已被优先扩增,提供了增强该细胞系中的nrf2信号传导的另外机制。然而,在原发性肿瘤中未观察到截短的/剪接的等位基因的优先扩增,表明单独的外显子2或2+3缺失可为克隆选择提供足够的nrf2活性。
外显子2的缺失提供了一种优雅的机制,通过除去与keap1的相互作用位点来增加nrf2活性,同时使基因的其余部分在dna结合和转录激活功能上保持功能完整。实际上,我们的生化分析证实,当缺失外显子2时,keap1结合几乎完全丧失并导致nrf2的稳定化(图23和24)。当考虑在肿瘤中发现的nrf2点突变时,围绕etge高亲和力结合位点的突变导致keap1相互作用的完全丧失,而较低亲和力dlg基序中的突变在其破坏nrf2/keap1复合物的能力方面不同(fukutomi等molcellbiol.34(5):832-846,2014;shibata等proc.natl.acad.sci.usa.105(36):13568-13573,2008)。然而,即使不破坏复合物的点突变也会改变相互作用的性质,诸如阻止keap1介导的nrf2泛素化(shibata等proc.natl.acad.sci.usa.105(36):13568-13573,2008)。虽然在缺失外显子2和3的情况下与keap1的相互作用类似地被消除,但外显子3含有neh4结构域,该结构域先前参与通过与creb(camp应答元件结合蛋白)结合蛋白(cbp)结合而被nrf2转录激活(katoh等genescells.6(10):857-868,2001)。neh4(包含在外显子3中)和neh5(包含在外显子4中)显示出在募集cbp中协同作用。与此一致,观察到与δe2nrf2或nrf2中的肿瘤相关点突变相比,δe2+3nrf2诱导一些nrf2靶基因的能力降低(图25和26)。
在其它基因中也已观察到在人肿瘤中发现的去除与e3连接酶的相互作用的结构域的缺失。例如,222个结直肠肿瘤中的7个显示围绕β-连环蛋白的外显子3的小基因组缺失(234-677bp)(iwao等cancerres.58(5):1021-1026,1998)去除了其e3连接酶β-trcp的相互作用位点(hart等curr.biol.9(4):207-210,1999)。类似地,在前列腺癌中发现的大多数tmprss-erg融合蛋白编码erg的截短形式,这使得它们对泛素化和降解(由spop介导)具有抗性(an等mol.cell.59(6):904-916,2015)。
另外,导致met外显子14跳跃的突变去除了氨基酸残基y1003,所述氨基酸残基是cbl募集和随后泛素化和下调所需的。因此,小的基因内缺失代表了新生癌基因在肿瘤起始和进化过程中逃避正常降解的有效机制。
实施例8:突变型keap1细胞中的nrf2敲低
该实施例提供了keap1突变对不同生长环境下nrf2活性需求的影响的表征,并且表明nrf2活性对于非贴壁依赖性条件下的生长是必需的。
检测了nrf2抑制对野生型以及突变型keap1和nrf2细胞系的结果。建立了在多西环素控制下表达三种独立的nrf2shrna的稳定细胞系,以及三种独立的非靶向对照(ntc)。这些nrf2shrna在五种keap1突变细胞系、两种nrf2突变型细胞系和五种野生型nsclc细胞系中以及永生化但未转化的肺上皮细胞beas2b细胞中有效降低nrf2蛋白水平(图35)。加入多西环素后,大多数细胞系的活力降低至不同程度,其中keap1突变型细胞系通常表现出显著更大的降低(图36和37)。在较大的一小组nsclc细胞系中通过sirna敲低nrf2证实了对细胞活力的基因型依赖性作用(图38)。
表征了肿瘤异种移植物中nrf2敲低的结果。将表达dox诱导型nrf2shrna的keap1突变型a549细胞系和keap1野生型h441细胞系植入雌性scid小鼠的侧腹。在两种肿瘤中,在多西环素处理的小鼠中nrf2被有效地敲低(图39和40)。keap1突变型a549细胞系中的nrf2敲低对肿瘤生长具有显著影响,导致在10个肿瘤中的5个中完全肿瘤消退(图41a)。相反,对keap1野生型h441生长的影响更为温和,导致肿瘤生长减少37%,所有动物均显示出维持的肿瘤负荷(图41b)。
为了理解nrf2敲低对异种移植物肿瘤扩增与塑料上的2d生长之间的差异作用,测试了几种额外的细胞培养环境。在低粘附板和/或低氧(0.5%)中生长的细胞中的nrf2敲低显示出与在塑料上生长的细胞类似的后果(图42)。相反,当在软琼脂(图43和44)中、微图案化塑料薄膜(图45和46)上或甲基纤维素(图47)中培养时,keap1突变型细胞系的生长受到严重损害。软琼脂中的生长用于更详细地表征nrf2敲低的后果。虽然nrf2的敲低完全消除了三种keap1突变型细胞系中的集落形成,但其在h1048和h441(两种野生型keap1nsclc细胞系)中几乎没有影响(图43和44)。评估了谷胱甘肽途径响应于nrf2敲低的作用,因为已经显示该途径介导由高nrf2活性促进的存活性质。虽然添加还原型谷胱甘肽通常会增加所有测试细胞系在软琼脂中形成集落的能力,但其无法挽救nrf2敲低的后果(图43和44)。用n-乙酰基半胱氨酸(nac;图48)观察到类似的阴性结果。如通过测量二氯荧光素染色所测量的,外源性谷胱甘肽能够进入细胞并降低活性氧(ros)水平(图49)。因此,对nrf2活性的要求令人惊讶地独立于谷胱甘肽合成途径。
为了进一步探索谷胱甘肽途径在nrf2响应中的作用,监测了xct谷胱甘肽/半胱氨酸逆向转运蛋白的表达和活性(谷胱甘肽合成中的限速步骤之一)。nrf2敲低后slc7a11表达降低(图50),导致与还原型谷胱甘肽相关(图52)的胱氨酸摄取减少(图51)。nrf2敲低也导致ros水平大幅增加(图53)。为了确定抑制slc7a11表达和胱氨酸摄取是否有助于降低nrf2敲低后的活力,使用埃拉汀(erastin)启动xct功能,这抑制胱氨酸摄取(图51)和增加了氧化应激(图53)。然而,这不足以降低keap1突变型细胞系a549(图54)或大多数其它keap1突变型细胞系(图55)的活力。然而,埃拉汀和nrf2敲低的组合确实导致活力的显著降低(图54)。类似地,谷胱甘肽合酶抑制剂丁硫氨酸亚砜亚胺(bso)或谷氨酰胺酶抑制剂bptes也未显示出对keap1突变型细胞系的优先毒性(图56和57)。这些结果表明补充谷胱甘肽不足以挽救nrf2敲低诱导的致死率,谷胱甘肽的耗尽也不足以杀死keap1突变型细胞系。
为了了解哪些途径由于nrf2激活或keap1丢失而被激活,使用基因库进行crispr筛选,所述基因库在a549细胞中于nrf2敲低后降低和/或在一小组keap1突变型nsclc细胞系中升高。由于在于2d、3d和异种移植物生长条件下进行nrf2敲低后观察到明显的后果,在所有三种环境下进行筛选以确定是否可以鉴定离散的依赖性。对于所有三个条件在15-天的时间点,所有三个筛选表现相似,其中grna仅代表少量显示显著退出的基因(图58-60)。nfe2l2及其结合伴侣mafg,是最重要的基因之一,表明筛选按预期进行。磷酸戊糖途径基因pgd、g6pd和tkt(已知的nrf2靶基因)也显示出强烈的退出。该筛选中的其它强命中是两个生长因子受体基因igf1r和erbb3,以及编码氧化还原信号传导传递的三个组成部分的基因prdx1、txn和txnrd1。
在a549细胞中进行nrf2敲低后erbb3的表达降低(图58-60)。在肿瘤异种移植模型中利用yw57.88.5的处理表明erbb3是a549增殖所需的(图61)。
相对于keap1野生型nsclc细胞系,keap1突变型nsclc细胞中igf1r的表达更高。为了测试igf1r抑制对keap1突变型和keap1野生型细胞的影响,用林西替尼(一种高效且选择性igf1r小分子抑制剂)处理细胞系。当在三种野生型和三种突变型keap1nsclc细胞系中测试时,林西替尼对增殖几乎没有影响。然而,该化合物在抑制a549细胞在软琼脂中的集落生长方面非常有效,具有约20nm的ic50。此外,当针对大的nsclc细胞系小组进行测试时,在keap1突变型细胞系中该化合物的软琼脂中似乎存在选择性生长抑制。当在非贴壁依赖性条件下生长时,对于独立的igf1r抑制剂nvp-aew541也观察到对keap1突变型细胞系的类似选择性作用(图62)。
因此,通过igf1r和erbb3进行信号传导的生长因子是keap1突变型细胞生长的重要介质。
其它实施方案
尽管上述本发明已出于清楚理解的目的通过说明和实施例的方式进行了详细描述,但描述和实施例不应解释为限制本发明的范围。本文引用的所有专利和科学文献的公开内容皆以全文引用的方式明确并入本文。
序列表
<110>genentech,inc.
foundationmedicine,inc.
<120>用于诊断和治疗癌症的方法
<130>50474-127wo2
<150>us62/360,294
<151>2016-07-08
<160>69
<170>patentin3.5版
<210>1
<211>5446
<212>rna
<213>智人
<400>1
uacuuugggaacuggugagucucccugucccuagggcuuuuuagucacauguccauccac60
uguuucaauguaacaugcaucuaggcaagguuaacgauuaaaugguugggaugaaagguc120
auccuuuacggagaacaucagaaugguagauaauuccuguuccacuuucuuugaugaaac180
aaguaaagaagaaacaacacaaucauauuaauagaagagucuucguuccagacgcagucc240
aggaaucaugcuggagaaguucugcaacucuacuuuuuggaauuccucauuccuggacag300
uccggaggcagaccugccacuuuguuuugagcaaacuguucugguguggauucccuuggg360
cuuccuauggcuccuggcccccuggcagcuucuccacguguauaaauccaggaccaagag420
auccucuaccaccaaacucuaucuugcuaagcagguauucguugguuuucuucuuauucu480
agcagccauagagcuggcccuuguacucacagaagacucuggacaagccacagucccugc540
uguucgauauaccaauccaagccucuaccuaggcacauggcuccugguuuugcugaucca600
auacagcagacaaugguguguacagaaaaacuccugguuccugucccuauucuggauucu660
cucgauacucuguggcacuuuccaauuucagacucugauccggacacucuuacaggguga720
caauucuaaucuagccuacuccugccuguucuucaucuccuacggauuccagauccugau780
ccugaucuuuucagcauuuucagaaaauaaugagucaucaaauaauccaucauccauagc840
uucauuccugaguagcauuaccuacagcugguaugacagcaucauucugaaaggcuacaa900
gcguccucugacacucgaggaugucugggaaguugaugaagagaugaaaaccaagacauu960
agugagcaaguuugaaacgcacaugaagagagagcugcagaaagccaggcgggcacucca1020
gagacggcaggagaagagcucccagcagaacucuggagccaggcugccuggcuugaacaa1080
gaaucagagucaaagccaagaugcccuuguccuggaagauguugaaaagaaaaaaaagaa1140
gucugggaccaaaaaagauguuccaaaauccugguugaugaaggcucuguucaaaacuuu1200
cuacauggugcuccugaaaucauuccuacugaagcuagugaaugacaucuucacguuugu1260
gaguccucagcugcugaaauugcugaucuccuuugcaagugaccgugacacauauuugug1320
gauuggauaucucugugcaauccucuuauucacugcggcucucauucagucuuucugccu1380
ucaguguuauuuccaacugugcuucaagcuggguguaaaaguacggacagcuaucauggc1440
uucuguauauaagaaggcauugacccuauccaacuuggccaggaaggaguacaccguugg1500
agaaacagugaaccugaugucuguggaugcccagaagcucauggaugugaccaacuucau1560
gcacaugcuguggucaaguguucuacagauugucuuaucuaucuucuuccuauggagaga1620
guugggacccucagucuuagcagguguuggggugauggugcuuguaaucccaauuaaugc1680
gauacuguccaccaagaguaagaccauucaggucaaaaauaugaagaauaaagacaaacg1740
uuuaaagaucaugaaugagauucuuaguggaaucaagauccugaaauauuuugccuggga1800
accuucauucagagaccaaguacaaaaccuccggaagaaagagcucaagaaccugcuggc1860
cuuuagucaacuacaguguguaguaauauucgucuuccaguuaacuccaguccugguauc1920
uguggucacauuuucuguuuauguccugguggauagcaacaauauuuuggaugcacaaaa1980
ggccuucaccuccauuacccucuucaauauccugcgcuuuccccugagcaugcuucccau2040
gaugaucuccuccaugcuccaggccaguguuuccacagagcggcuagagaaguacuuggg2100
aggggaugacuuggacacaucugccauucgacaugacugcaauuuugacaaagccaugca2160
guuuucugaggccuccuuuaccugggaacaugauucggaagccacaguccgagaugugaa2220
ccuggacauuauggcaggccaacuuguggcugugauaggcccugucggcucugggaaauc2280
cuccuugauaucagccaugcugggagaaauggaaaauguccacgggcacaucaccaucaa2340
gggcaccacugccuaugucccacagcaguccuggauucagaauggcaccauaaaggacaa2400
cauccuuuuuggaacagaguuuaaugaaaagagguaccagcaaguacuggaggccugugc2460
ucuccucccagacuuggaaaugcugccuggaggagauuuggcugagauuggagagaaggg2520
uauaaaucuuagugggggucagaagcagcggaucagccuggccagagcuaccuaccaaaa2580
uuuagacaucuaucuucuagaugacccccugucugcaguggaugcucauguaggaaaaca2640
uauuuuuaauaaggucuugggccccaauggccuguugaaaggcaagacucgacucuuggu2700
uacacauagcaugcacuuucuuccucaaguggaugagauuguaguucuggggaauggaac2760
aauuguagagaaaggauccuacagugcucuccuggccaaaaaaggagaguuugcuaagaa2820
ucugaagacauuucuaagacauacaggcccugaagaggaagccacaguccaugauggcag2880
ugaagaagaagacgaugacuaugggcugauauccaguguggaagagauccccgaagaugc2940
agccuccauaaccaugagaagagagaacagcuuucgucgaacacuuagccgcaguucuag3000
guccaauggcaggcaucugaagucccugagaaacuccuugaaaacucggaaugugaauag3060
ccugaaggaagacgaagaacuagugaaaggacaaaaacuaauuaagaaggaauucauaga3120
aacuggaaaggugaaguucuccaucuaccuggaguaccuacaagcaauaggauuguuuuc3180
gauauucuucaucauccuugcguuugugaugaauucuguggcuuuuauuggauccaaccu3240
cuggcucagugcuuggaccagugacucuaaaaucuucaauagcaccgacuauccagcauc3300
ucagagggacaugagaguuggagucuacggagcucugggauuagcccaagguauauuugu3360
guucauagcacauuucuggagugccuuugguuucguccaugcaucaaauaucuugcacaa3420
gcaacugcugaacaauauccuucgagcaccuaugagauuuuuugacacaacacccacagg3480
ccggauugugaacagguuugccggcgauauuuccacaguggaugacacccugccucaguc3540
cuugcgcagcuggauuacaugcuuccuggggauaaucagcacccuugucaugaucugcau3600
ggccacuccugucuucaccaucaucgucauuccucuuggcauuauuuauguaucuguuca3660
gauguuuuaugugucuaccucccgccagcugaggcgucuggacucugucaccaggucccc3720
aaucuacucucacuucagcgagaccguaucagguuugccaguuauccgugccuuugagca3780
ccagcagcgauuucugaaacacaaugaggugaggauugacaccaaccagaaaugugucuu3840
uuccuggaucaccuccaacagguggcuugcaauucgccuggagcugguugggaaccugac3900
ugucuucuuuucagccuugaugaugguuauuuauagagauacccuaaguggggacacugu3960
uggcuuuguucuguccaaugcacucaauaucacacaaacccugaacuggcuggugaggau4020
gacaucagaaauagagaccaacauuguggcuguugagcgaauaacugaguacacaaaagu4080
ggaaaaugaggcacccugggugacugauaagaggccuccgccagauuggcccagcaaagg4140
caagauccaguuuaacaacuaccaagugcgguaccgaccugagcuggaucugguccucag4200
agggaucacuugugacaucgguagcauggagaagauugguguggugggcaggacaggagc4260
uggaaagucaucccucacaaacugccucuucagaaucuuagaggcugccgguggucagau4320
uaucauugauggaguagauauugcuuccauugggcuccacgaccuccgagagaagcugac4380
caucaucccccaggaccccauccuguucucuggaagccugaggaugaaucucgacccuuu4440
caacaacuacucagaugaggagauuuggaaggccuuggagcuggcucaccucaagucuuu4500
uguggccagccugcaacuuggguuaucccacgaagugacagaggcugguggcaaccugag4560
cauaggccagaggcagcugcugugccugggcagggcucugcuucggaaauccaagauccu4620
gguccuggaugaggccacugcugcgguggaucuagagacagacaaccucauucagacgac4680
cauccaaaacgaguucgcccacugcacagugaucaccaucgcccacaggcugcacaccau4740
cauggacagugacaagguaaugguccuagacaacgggaagauuauagagugcggcagccc4800
ugaagaacugcuacaaaucccuggacccuuuuacuuuauggcuaaggaagcuggcauuga4860
gaaugugaacagcacaaaauucuagcagaaggccccauggguuagaaaaggacuauaaga4920
auaauuucuuauuuaauuuuauuuuuuauaaaauacagaauacauacaaaaguguguaua4980
aaauguacguuuuaaaaaaggauaagugaacacccaugaaccuacuacccagguuaagaa5040
aauaaaugucaccagguacuugagaaaccccucgauugucuaccucgaucguacuuccuu5100
gcuacccaccccucccagggacaaccacuguccugaauuucacgauaauuauuccuuugc5160
cuuucauuucuguuuuaucaccuuuguauguaucuuuaaacaacauauacccuuuuuuac5220
uuauguaaauggacugacucauacugcauacaucuucuaugacuugauucuuuuguucaa5280
uauuauaucugagauucauccauggugaugcaaauaggugcauuauuuuuuuucacugcu5340
cuguagucuggcauuguaugaauacagcacaauguaucaguuuuaauauuggggaucauu5400
agcauuauucucagguuuuuaaaaauuauaagcaguacuacuaugg5446
<210>2
<211>1610
<212>rna
<213>智人
<400>2
acaguagcucacaccuguaaucccagcacuuuggaaggccgaggugggcggaucaccuga60
gcucaggaguuugagaccagccugucucuacuaacaauauaaaaauuagcugggagucac120
ggugggcgccuguaaucccagcuacucgggaggcugaggcaggagaauugcuugaaccca180
ggagacagagguuguagugagcugagaucgcaccacugcacucuagccuuggcaacagug240
caagacugucucaaaaacagcaacagagagcaggacgugagacuucuaccugcucacuca300
gaaucauuucugcaccaaccauggccacguuuguggagcucaguaccaaagccaagaugc360
ccauugugggccugggcacuuggaagucuccucuuggcaaagugaaagaagcagugaagg420
uggccauugaugcaggauaucggcacauugacugugccuaugucuaucagaaugaacaug480
aagugggggaagccauccaagagaagauccaagagaaggcugugaagcgggaggaccugu540
ucaucgucagcaaguuguggcccacuuucuuugagagaccccuugugaggaaagccuuug600
agaagacccucaaggaccugaagcugagcuaucuggacgucuaucuuauucacuggccac660
agggauucaagucuggggaugaccuuuuccccaaagaugauaaagguaaugccaucggug720
gaaaagcaacguucuuggaugccugggaggccauggaggagcugguggaugaggggcugg780
ugaaagcccuuggggucuccaauuucagccacuuccagaucgagaagcucuugaacaaac840
cuggacugaaauauaaaccagugacuaaccagguugagugucacccauaccucacacagg900
agaaacugauccaguacugccacuccaagggcaucaccguuacggccuacagcccccugg960
gcucuccggauagaccuugggccaagccagaagacccuucccugcuggaggaucccaaga1020
uuaaggagauugcugcaaagcacaaaaaaaccgcagcccagguucugauccguuuccaua1080
uccagaggaaugugauugucauccccaagucugugacaccagcacgcauuguugagaaca1140
uucaggucuuugacuuuaaauugagugaugaggagauggcaaccauacucagcuucaaca1200
gaaacuggagggccuguaacguguugcaauccucucauuuggaagacuaucccuucaaug1260
cagaauauugagguugaaucuccuggugagauuauacaggagauucucuuucuucgcuga1320
agugugacuaccuccacucaugucccauuuuagccaagcuuauuuaagaucacagugaac1380
uuaguccuguuauagacgagaaucgaggugcuguuuuagacauuuauuucuguauguuca1440
acuaggaucagaauaucacagaaaagcauggcuugaauaaggaaaugacaauuuuuucca1500
cuuaucugaucagaacaaauguuuauuaagcaucagaaacucugccaacacugaggaugu1560
aaagaucaauaaaaaaaauaauaaucauaaccaacaaaaaaaaaaaaaaa1610
<210>3
<211>1625
<212>rna
<213>智人
<400>3
uccgggcuuccccagacagacagcuggcuuacagggccaccugaagacguuccagggcuc60
cacaggccacugucuucuggaggggaacggaucgacugccggugcgcccagccaaauuca120
acuccugaguccucagucucuagucccgggaagguuucaccgagcugcccuacuccuugu180
accccuucuagcuggccuuagcauagcuacgucagcagcuauuggcacgacugcccugau240
ucaaggagaaacuggacuaauaucacuaucucaacaggaucgaggccaucaagcuacaga300
uggucuuacaaauggaaccccaagugaacucaacuaacaacuuccaccaaggaccccugg360
accaacccguuggcccuuugacuggccuaaagaguucccuucugaaggacacuacaagug420
cagggccccuucuucgccccuauccagcaucucuucucggcaaagugaaagaagcgguga480
agguggccauugaugcagaauaucgccacauugacugugccuauuucuaugagaaucaac540
augaggugggagaagccauccaagagaagauccaagagaaggcugugaugcgggaggacc600
uguucaucgucagcaagguguggcccacuuucuuugagagaccccuugugaggaaagccu660
uugagaagacccucaaggaccugaagcugagcuaucuggacgucuaucuuauucacuggc720
cacagggauucaagacuggggaugacuuuuuccccaaagaugauaaagguaauaugauca780
guggaaaaggaacguucuuggaugccugggaggccauggaggagcugguggacgaggggc840
uggugaaagcccuuggggucucaaauuucaaccacuuccagaucgagaggcucuugaaca900
aaccuggacugaaauauaaaccagugacuaaccagguugagugucacccauaccucacgc960
aggagaaacugauccaguacugccacuccaagggcaucaccguuacggccuacagccccc1020
ugggcucuccggauagaccuugggccaaaccugaggacccuucccugcuggaggauccca1080
agauuaaggagauugcugcaaagcacaaaaaaaccacagcccagguucugauccguuucc1140
auauccagaggaaugugacagugauccccaagucuaugacaccagcacacauuguugaga1200
acauucaggucuuugacuuuaaauugagugaugaggagauggcaaccauacucagcuuca1260
acagaaacuggagggccuuugacuucaaggaauucucucauuuggaggacuuucccuucg1320
augcagaauauugagguugaaucuccuggugagauuacacaggggauucucuuucuucgc1380
ugaagugugacugucuccacucaagaacuauuuuagccaagcuuaucugagaucacagug1440
aacuuuguccuguuguagaccagaauggaggugcuguuuuagacauguauuucuguaugu1500
ucaacuaggauaagaauaucacagaaaagcauggccugaauaagcaaaugacaauuuuuu1560
ccacuuaucugaucugaucaaaugucuguuaagcaccagaaacucugccaacacugagga1620
uguaa1625
<210>4
<211>1098
<212>rna
<213>智人
<400>4
guaagaaacgguugaacuggaugcaauuuuuaucacagcuuguguaagacugccucuguc60
ccuccucucacaugccauugguuaaccagcagacagugugcucaggggcguugccagcuc120
auugcucuuauagccugugagggaggaagaaacauuugcuaaccaggccagugacagaaa180
uggauucgaaauaccagugugugaagcugaaugauggucacuucaugccuguccugggau240
uuggcaccuaugcgccugcagagguuccuaaaaguaaagcucuagaggccgucaaauugg300
caauagaagccggguuccaccauauugauucugcacauguuuacaauaaugaggagcagg360
uuggacuggccauccgaagcaagauugcagauggcagugugaagagagaagacauauucu420
acacuucaaagcuuuggagcaauucccaucgaccagaguugguccgaccagccuuggaaa480
ggucacugaaaaaucuucaauuggacuauguugaccucuaucuuauucauuuuccagugu540
cuguaaaggaggacauagggauuuuaacauggaagaagagcccuaaacauaacuccuaau600
uccuuucuauggaacagaaagcaauuuugaauccauacuuccgugauugcaugucuacaa660
gaaaagagagugcagaauccucaaagccucugccucaaaaacuugaggaaaugacaauca720
ucuccuugaaggcacaaggucuuauuuaugauuccugauuucaccucuugggauguucac780
agacacagaguuucaugaagcugugguguccagaaaaccugcugcacauagggugcacaa840
ugaguuuccaucuucuugccucuuuucaaggggcaagaacucaguccgggaaugucuuaa900
acuacaaaccuucaugggaaaccuuguugcuucugcuuccucucuuuucacacuggaggu960
uuuauuuuugcuuagccaugaauucuugugucauucauaacuuuugucuuaagguacuga1020
aaacuagucaggcuaguuaaugcaaaaggguauauuagauaugauaaugggaaaucaaag1080
ccagggcuacauuaagaa1098
<210>5
<211>1064
<212>rna
<213>智人
<400>5
gcccauuguuuuuguaaucucugaggagaagcagcagcaaacauuugcuagucagacaag60
ugacagggaauggauuccaaacaccaguguguaaagcuaaaugauggccacuucaugccu120
guauugggauuuggcaccuaugcaccuccagagguuccgagaaguaaagcuuuggagguc180
acaaaauuagcaauagaagcuggguuccgccauauagauucugcucauuuauacaauaau240
gaggagcagguuggacuggccauccgaagcaagauugcagauggcagugugaagagagaa300
gacauauucuacacuucaaagcuuugguccacuuuucaucgaccagaguugguccgacca360
gccuuggaaaacucacugaagaaagcucaauuggacuauguugaccucuaucuuauucau420
ucuccaaugucucuaaagguaugcaguuuguaugagcauaaaauugcgcuucugcuguca480
uuauaaacauuguuuaucuggauaguugaacagagcuuuuuauuaggaggauguagggau540
uaucacacagaagaagaaccguaaguggaacaccuaauuuccuuucuuucgaguaaauuu600
ugaauccuacuucucuaaugcacaccuacaagagaagagaguacagcaaccucaaagccu660
cuuccucaaaaacuugaaauuacaauagucucuuucaaggcacugucuuaguuguggcuu720
uugaguccaucucuugggauguucccagacacagaguuucaugcaguuguggugcccaau780
aaaacugcugcacaugugaugcacaaugaguuuccaccaucucuccccauuucaagcuga840
agcagauuugguggaagccacuaugcaugguucuuaaauuagaaacccuuaauguggacu900
ugcaaagcuuuauuauucugcugccucuucuuucacaauagaguuugaagcuguauuuag960
ccaggaauuacuguguaguguauaacuuuugauuuaaaguuacagaaaacuacucaggcu1020
aguuaaugcaaaagaguuuacugaguuauguaaaaugggaaguc1064
<210>6
<211>1192
<212>rna
<213>智人
<400>6
acaggaucugcuuagugaaagaaguggcaagcaauggaucccaaauaucagcguguagag60
cuaaaugauggucacuucaugcccguauugggauuuggcaccuaugcaccuccagagguu120
ccgaggaacagagcuguagaggucaccaaauuagcaauagaagcuggcuuccgccauauu180
gauucugcuuauuuauacaauaaugaggagcagguuggacuggccauccgaagcaagauu240
gcagauggcagugugaagagagaagacauauucuacacuucaaagcuuuggugcacuuuc300
uuucaaccacagaugguccaaccagccuuggaaagcucacugaaaaaacuucaacuggac360
uauguugaccucuaucuucuucauuucccaauggcucucaagccaggugagacgccacua420
ccaaaagaugaaaauggaaaaguaauauucgacacaguggaucucucugccacaugggag480
gucauggagaaguguaaggaugcaggauuggccaaguccaucggggugucaaacuucaac540
ugcaggcagcuggagaugauccucaacaagccaggacucaaguacaagccugucugcaac600
cagguagaaugucauccuuaccucaaccagagcaaacugcuggauuucugcaagucaaaa660
gacauuguucugguugcccacagugcucugggaacccaacgacauaaacuauggguggac720
ccaaacuccccaguucuuuuggaggacccaguucuuugugccuuagcaaagaaacacaaa780
cgaaccccagcccugauugcccugcgcuaccagcugcagcgugggguugugguccuggcc840
aagagcuacaaugagcagcggaucagagagaacauccagguuuuugaauuccaguugaca900
ucagaggauaugaaaguucuagauggucuaaacagaaauuaucgauauguugucauggau960
uuucuuauggaccauccugauuauccauuuucagaugaauauuagcauagaggguguugc1020
acgacaucuagcagaaggcccuguguguggauggugaugcagaggaugucucuaugcugg1080
ugacuggacacacggccucugguuaaaucccuccccuccugcuuggcaacuucagcuagc1140
uagauauauccaugguccagaaagcaaacauaauaaauuuuuaucuugaagu1192
<210>7
<211>1425
<212>rna
<213>智人
<400>7
ggccccgccuccuugaguggugcggagcuuugugaugcggagcuucgugaugcacgcccc60
gaugccugcggggcuauaaaaacgcucgcaagcgccaagucuccucaggagccgccggca120
agggggcaacgaggaagcucuuaagagcgcggccggaaagcaguugaguuacagacaucc180
ugccaaaaugauuucuucaaagcccagacuugucguacccuauggccucaagacucugcu240
cgagggaauuagcagagcuguucucaaaaccaacccaucaaacaucaaccaguuugcagc300
agcuuauuuucaagaacuuacuauguauagagggaauacuacuauggauauaaaagaucu360
gguuaaacaauuucaucagauuaaaguagagaaauggucagaaggaacgacaccacagaa420
gaaauuagaauguuuaaaagaaccaggaaaaacaucuguagaaucuaaaguaccuaccca480
gauggaaaaaucuacagacacagacgaggacaauguaaccagaacagaauauagugacaa540
aaccacccaguuuccaucaguuuaugcugugccaggcacugagcaaacggaagcaguugg600
uggucuuucuuccaaaccagccaccccuaagacuacuaccccacccucaucaccaccucc660
aacagcugucucaccagaguuugccuacgucccagcugacccagcucagcuugcugcuca720
gauguuagcaauggcaacaagugaacgaggacaaccaccaccauguucuaacauguggac780
ccuuuauugucuaacugauaagaaucaacaaggucacccaucaccgccaccugcaccugg840
gccuuuuccccaagcaacccucuauuuaccuaauccuaaggauccacaguuucagcagca900
uccaccaaaagucacuuuuccaacuuaugugaugggcgacaccaagaagaccagugcccc960
accuuuuaucuuaguaggcucaaauguucaggaagcacagggauggaaaccucuuccugg1020
acaugcugucguuucacagucagaugucuugagauauguugcaaugcaagugcccauugc1080
uguuccugcagaugagaaauaccagaaacauacccuaaguccccagaaugcuaauccucc1140
aaguggacaagauguccccaggccaaaaagcccuguuuuccuuucuguugcuuucccagu1200
agaagauguagcuaaaaaaaguucaggaucuggugacaaaugugcucccuuuggaaguua1260
cgguauugcuggggagguaaccgugacuacugcucacaaacgucgcaaagcagaaacuga1320
aaacugauccagaaaugacgcugucugggucaacauuucagggaggagucugccaccagu1380
guaauguaucaauaaacuucaugcaagcauaaaaaaaaaaaaaaa1425
<210>8
<211>1765
<212>rna
<213>智人
<400>8
aucugccuccagcacugcccauccuugccccuuuccacuguccuuggagcuuccugggcc60
cuucccugggccucaggaucccacccuccaucccgucugcccugcaggaugccgcagcug120
agccuguccuggcugggccucgggcccguggcagcauccccguggcugcuucugcugcug180
guugggggcuccuggcuccuggcccgcguccuggccuggaccuacaccuucuaugacaac240
ugccgccgucuccaguguuuuccucaacccccgaaacagaacugguuuuggggacaccag300
ggccuggucacucccacggaagagggcaugaagacauugacccagcuggugaccacauau360
ccccagggcuuuaaguuguggcuggguccuaccuucccccuccucauuuuaugccacccu420
gacaucauccggccuaucaccagugccucagcugcugucgcacccaaggauaugauuuuc480
uauggcuuccugaagcccuggcugggggaugggcuccugcugagugguggugacaagugg540
agccgccaccgucggauguugacgccugccuuccauuucaacaucuugaagccuuauaug600
aagauuuucaacaagagugugaacaucaugcacgacaaguggcagcgccuggccucagag660
ggcagcgccagacuggacauguuugaacacaucagccucaugaccuuggacagucugcag720
aaaugugucuucagcuuugaaagcaauugucaggagaagcccagugaauauauugccgcc780
aucuuggagcucagugccuuuguagaaaagagaaaccagcagauucucuugcacacggac840
uuccuguauuaucucacuccugaugggcagcgcuuccgcagggccugccaccuggugcac900
gacuucacagaugccgucauccaggagcggcgccgcacccuccccacucaggguauugau960
gauuuccucaagaacaaggcaaaguccaagacuuuagacuucauugaugugcuucugcug1020
agcaaggaugaagaugggaaggaauugucugaugaggacauaagagcagaagcugacacc1080
uucauguuugagggccaugacacuacagccaguggucucuccuggguccuauaccaccuu1140
gcaaagcacccagaauaccaggaacagugccggcaagaagugcaagagcuucugaaggac1200
cgugaaccuauagagauugaaugggacgaccuggcccagcugcccuuccugaccaugugc1260
auuaaggagagccugcgguugcaucccccagucccggucaucucccgauguugcacgcag1320
gacuuugugcucccagacggccgcgucauccccaaaggcauugucugccuuaucaauauu1380
aucgggauccauuacaacccaacuguguggccagacccugaggucuacgaccccuuccgu1440
uucaaccaagagaacaucaaggagaggucaccucuggcuuuuauucccuucucggcaggg1500
cccagaaacugcaucgggcaggcguucgccauggcugagaugaaggugguccuggcgcuc1560
acguugcugcacuuccgcauccugccgacccacauugaaccccgcaggaaacccgagcug1620
auauugcgcgcagaggguggacuuuggcugcggguggagccccugggugcgaacucacag1680
ugacugcccuacccacccacccaccuuuguagagucccagaaacaaaacuaugcugacaa1740
aaaaaaaaaaaaaaaaaaaaaaaaa1765
<210>9
<211>7277
<212>rna
<213>智人
<400>9
aggucagggggcuggggacgcgcguggggaucgcuacccggcucggccacugcugggcgg60
acaccugggcgcgccgccgcgggaggagcccggacucgggccgaggcugcccaggcaaug120
cguucacucggcgcaaacauggcugcggcccugcgcgccgcgggcguccugcuccgcgau180
ccgcuggcauccagcagcuggagggucugucagccauggagguggaagucaggugcagcu240
gcagcggccgucaccacagaaacagcccagcaugcccagggugcaaaaccucaaguucaa300
ccgcagaagaggaagccgaaaacuggaauauuaaugcuaaacaugggaggcccugaaacu360
cuuggagauguucacgacuuccuucugagacucuucuuggaccgagaccucaugacacuu420
ccuauucagaauaagcuggcaccauucaucgccaaacgccgaacccccaagauucaagag480
caguaccgcaggauuggaggcggaucccccaucaagauauggacuuccaagcagggagag540
ggcauggugaagcugcuggaugaauugucccccaacacagccccucacaaauacuauauu600
ggauuucgguacguccauccuuuaacagaagaagcaauugaagagauggagagagauggc660
cuagaaagggcuauugcuuucacacaguauccacaguacagcugcuccaccacaggcagc720
agcuuaaaugccauuuacagauacuauaaucaagugggacggaagcccacgaugaagugg780
agcacuauugacagguggcccacacaucaccuccucauccagugcuuugcagaucauauu840
cuaaaggaacuggaccauuuuccacuugagaagagaagcgagguggucauucuguuuucu900
gcucacucacugcccaugucuguggucaacagaggcgacccauauccucaggagguaagc960
gccacuguccaaaaagucauggaaaggcuggaguacugcaaccccuaccgacuggugugg1020
caauccaagguugguccaaugcccugguuggguccucaaacagacgaaucuaucaaaggg1080
cuuugugagagggggaggaagaauauccucuugguuccgauagcauuuaccagugaccau1140
auugaaacgcuguaugagcuggacaucgaguacucucaaguuuuagccaaggagugugga1200
guugaaaacaucagaagagcugagucucuuaauggaaauccauuguucucuaaggcccug1260
gccgacuuggugcauucacacauccagucaaacgagcuguguuccaagcagcugacccug1320
agcuguccgcucugugucaauccugucugcagggagacuaaauccuucuucaccagccag1380
cagcugugacccccgccgguggaccccguggcguuaggcaaaugcccaaccuccagauac1440
cuccgauguggagaggguguuauuuagagaucaaggaaggaagucauccuuccuugauau1500
auauacagccuuuggguacaaauugugugguuucuugaggauuggacucuugauggauuu1560
cuauuuuuauauaacuauacaguaagcauuuguauuuucucucucuagguauaaguuacu1620
aguuuggaauguccaucaggaccuuuaauaaaugaguuaaaaauuugucuuaugagacac1680
accuauuuaaguacagauuuuggcuuuauugcccaaaacccuccugaaaggguacggaga1740
guccccucugugggcuggcagugugaaugagaucuguuuagucucgugcauauaguugcu1800
guuuuuuaaaugaacacaguugaguauuugaagugaauuugaaaaagaaauguuacuuaa1860
ucuuucccuaagcccauggguuacagaaugcuagggaggcaauuugguuaccugcaaugg1920
cugcuuuugccagcgaggccaccauucauuggucaucuugguauuugugugugaaucuca1980
cuuuccucaauguaaaaaggaaucaaguauggauuucagaggugcucuuagauuccccau2040
acacccaaggguaauaaacguguacaaguacaguguucaugauacgugccuuggugggag2100
uccguggugccacagggaaggggcucccacugcuucuggucuccagggacagugcugcug2160
gaaaggcuagugaugagcuucacccuggagcuccucccgggaccuugcaagccucuccau2220
ccagcaucuucucuaucuuaguugaaugccuucuuucugaacauuuguuuuaagaauuau2280
uuuauaaagucaacaauacuuugcuugaauucuuucuuaauuuacgauuuuuuauuauaa2340
aaauguauagugauacaaugggacaugugaagaauacagaaaaguaaccacuuuaaugca2400
auaacuguuaucauaauauuguauuucgugguaguccuuuccuguagauauuuuuaaugc2460
cauuuaaugccauugucaccuuggauuuaugagugaaaaguguuucuaaaaauauagaaa2520
uaaugucagaucagagucugaucuucuauguuuguauuuaaauggauuaaaagauccccg2580
gugguuccaugaagaauuuguaaagaucacuuucucuuuccuccaagcccugaaacuuug2640
uucuucaaaagagcguuucuuuuuuuuuuuuuuuuuagccaguuuauaaaguggaaguau2700
uaggagauucauaaaucuucuauauugagaauuggcuauguuaauaaauauuacaacauc2760
auuaagguuuuagcuaaguuugauucaugcugucuguuaaaucaaaacugaucuaaauca2820
gaauuauuaaaugugaggagcuuuuuuaauacaggaaaagaaacaugucauccacuugag2880
uuaauaguuuuccuacguugaugacagcccucaugaguagcauccacauuuuuaaaauuu2940
caaauugguuuuucuacuaguagauuguguuucuagagaaagauacaaggcauaggugau3000
uguuuaggauuuuccucuagccuuugccauuaccuuuuuggggaugagguucacaguaga3060
cuuugagugaccgucccaccgugaagugaauucucugagcuggugguguggugcuggaag3120
gaagguuauuuuuggagccacucucuccccuuaaggauauuucccaagggccugcuucaa3180
uucuuugaugacuuuagaggugaaaaaauauuuuuauggagaugaugcagaaaacuccaa3240
uucaggagcccuugcgaguauaucugaagcacuuauuugcuaaggaaaccugaauugaua3300
gcaguacugugcugucuggaauaauguccuugauacugaguugggaccagacuggcuuuu3360
auagugacaggcaaagaggaauuuauugagaucacugcucauggcauuuguugcuguaag3420
aaguguugccuuugauuguuacuaaccacggauggguaacggucauacauuaggcuagug3480
uuugguaggacaaaaucuuuuuagagcuuugagaauugucauccuguuggucaacuuuga3540
aauacaaauguuugcccugguaauuagcaaugaacugcuggcaguuucuucagcugugua3600
uauacggaucuggcuuuuaauugaugaaucaacuucuacagaaacuuuugcagggacagu3660
guugaugaggcaguuuagcuugccagggugaugauaaagcccaggucccugcauguauag3720
ugcucuucuaaagaauaugcauucuugaacuacuuaacuuuuuaaaaaucacaauaaauu3780
uuugcacucaaaauuugcuucguaucaggagaaaugaacucauuguuuuguuuuguuuuu3840
uuuuuuuuuuaagauggagucuugcuaugucacccaggcuggagggcaguggugcgaucu3900
cggcucacugcuacuuccaccuccugggcucaagugauccucccaccucagccuccaagu3960
agcugggacuacaggagugcuucaccacgcugggcuacuuuuuuauauuuuuuguagaga4020
ugggguuuugccauguuguccaggcuggucuugaacuccugggcucaagggauucuccug4080
ccucagucucccaaagugcugggauuacaaggaugagccucugcaccuggcccugaacuc4140
auuauuaaaagcccuuuaaaugugaggcugggugccgugccuuacauguguaauuccaau4200
acuuuggaaggccaagguuggaggauugcuugaucccaagaguucaagaccagccugggc4260
aacauagggagacccugacucuacaaaaaauaaaguaaaaauuaacuggguguaguguca4320
caugccuguaguuccagcuacuuaggaggcugaggugguaggauugcuugagcccagcag4380
uuugagguugcagugaggugugauugcaccacugcacuccagccugggugacagaggaag4440
acccugucccaaaaccaaaaaaaagaaaagaaauacagagacugggucauuuacaaagga4500
aagagguuuaauugacucgguucggcuuucugaggaagccuuaggaaauugacaaucaug4560
gcagaaggggaagcagaugucuuacauggcagugagugagagcaagcaaaggggaagagc4620
ccccuuauaaaaccaucagaucucgugagaacuggcugucacaagaacagcaugggggaa4680
cugucuccauguuccaaucuccuuccaccaggucccucccucaacacguggggauuaugg4740
ggauuacaauuugaaaugagauuuggguggggaacagagccaaaucauaucauuccaccc4800
uggccccucccaaaucacauguccuuuuuacauuucaaaaccaaucaugccuucacaaca4860
guccuccagagucuuaacucauuccagcauuaacccaaaaguccaaguucaaagucucau4920
ccaagacaaggcaagucccuucugccugugagccuguaacauuaaaagcaaguuagugac4980
uuccaagauacaaugggaguacagacauugguaaauguucccauuccaaaugggagaaau5040
uggccaaaacacaggggcuacaggccccaugcaccacugcacuccacugugcaagucuga5100
aacccggcagggcacuccuuaaauuuuuuuuuuuuuuuuuugagauggagucucgcucug5160
uugcccaagcuggaguacaguggcacgaucucggcucacugcaaccuccgccucuugggu5220
ucaaaggaucauccugccucagccuccggaguagcugggcuacucaggcgugugccacca5280
ugcccggcuaauuuuuguauuuuuaguagagauggggccugaccauguuggucaggcugg5340
ucucuaauuccugaccucgugauccacccgccucagccucugaaaguguugggauuacag5400
gcgugagccaccauccccggccuacucaauaaaucuuaaaguuccggaauaaucuccuuu5460
gacuccaugucucaccuccaggucacgcugaugcaagaggugggcuaaucuuucuaguaa5520
auuccauauuuaauucaagaaaccauaacuuaaggcauguaaaagagauccuuugcucaa5580
ugugaugccauugugcuuauccaaaguauauuauuauuacccacaaagggugagagauua5640
ggcugcagccauaccccaaguggagugagcagcaagaccugcccccugcucagaguguag5700
augacugggggcaccugcauuccuaggggcucugccguaugagcuccugucgaugcggca5760
aaggaccaccuugcccaacgacagcgggaaggcagaauuuaaagcuggcagcuguaagcg5820
aacgucuaugugugcgcacgggggcacgugaaggcacaggugcaucagccaagaaccucc5880
aauucaccucuuaaccuucucaccucaccugaaaccccuucugccagaauccugaaggug5940
gcccaggaacagggcuccuaacguuagguggaaaugggaaauucauugagaugucacaag6000
cuggaauaagaaaauucugagcucacccggaaacuaaugcccuaaauuaagauuauucag6060
cuucucaauuuuuaauagcaaaauggagaccugaguguggauaacuuuuaguaucugugg6120
gggauccuggaaccaauucccugccaauauagaaggacaacugucuacaguacuugaagu6180
auuauuaacuacauucgccaugcuguauguuagauccccagaacauauuuauccugcaua6240
ucuaaaauuuugaucauuuuacaaacuuucuauuuuuuuugucaauuuucuccagcuaga6300
cacuugugcaauacggcuauuaucugaucuuugccuuaaauguugugcuucuuuuccaua6360
ugcacguauuuugcaaaauauaaaguguguagagcuauauagcacucagccaaguggugg6420
guaccugcaggugcuucagagaaguaaauugaugcugcuaauauuuguugaauggcacga6480
auaugaugagcaauagcagguggugcccuucagccagaccaucgcuccgugcgucugaug6540
caucuugccaaagaguaguucugggaggugguugccucuagagaacacauuccuccuauu6600
cuggggucccgugagagaaagaaaugcuuuugcuuuugaugugggacucuuacuaagccu6660
uucuucagagaaaaggaagugaaaaaugcaccccaugauaaucaguuucuuacaacauac6720
ugugauaguaccggcuucguuguuuuuagcuggaaucauuagcuuccauuuuuagaauaa6780
cagcuauuggcuaaauuaggcuacaguaggccauuaagauggauguuggaauuaaaaaca6840
uuuuuggaaaaaagccugcuuugagccuuuguuauaagcccuuggguagagaucuggguc6900
cuguuucugauuucuugugagccuucacucugacaguuuuguuuccagaaacacacucuu6960
agccugcuccugaaaugggaacagacaggccaacuuccccucuccagucuccccugcggg7020
ucaaagcuuuacuuuccugucauguuaagaaagaauagauuuaaccuugauaauccaugu7080
aguauucuguauuuuuaccuuuuccuuaucugaaaaaaaguguauauauggcauggaauu7140
gauugcacaggcacauggcauguuggcuugugaaccaauuguuaaaauuucaaguuaauc7200
auuaaaauaauaucuuucaaauuaaguuauauuaaaaacaaagguaacauucuaaauuca7260
aaaaaaaaaaaaaaaaa7277
<210>10
<211>889
<212>rna
<213>智人
<400>10
gcaguucggcggucccgcgggucugucucuugcuucaacaguguuuggacggaacagauc60
cggggacucucuuccagccuccgaccgcccuccgauuuccucuccgcuugcaaccuccgg120
gaccaucuucucggccaucuccugcuucugggaccugccagcaccguuuuugugguuagc180
uccuucuugccaaccaaccaugagcucccagauucgucagaauuauuccaccgacgugga240
ggcagccgucaacagccuggucaauuuguaccugcaggccuccuacaccuaccucucucu300
gggcuucuauuucgaccgcgaugauguggcucuggaaggcgugagccacuucuuccgcga360
auuggccgaggagaagcgcgagggcuacgagcgucuccugaagaugcaaaaccagcgugg420
cggccgcgcucucuuccaggacaucaagaagccagcugaagaugagugggguaaaacccc480
agacgccaugaaagcugccauggcccuggagaaaaagcugaaccaggcccuuuuggaucu540
ucaugcccuggguucugcccgcacggacccccaucucugugacuuccuggagacucacuu600
ccuagaugaggaagugaagcuuaucaagaagaugggugaccaccugaccaaccuccacag660
gcuggguggcccggaggcugggcugggcgaguaucucuucgaaaggcucacucucaagca720
cgacuaagagccuucugagcccagcgacuucugaagggccccuugcaaaguaauagggcu780
ucugccuaagccucucccuccagccaauaggcagcuuucuuaacuauccuaacaagccuu840
ggaccaaauggaaauaaagcuuuuugaugcaaaaaaaaaaaaaaaaaaa889
<210>11
<211>5000
<212>rna
<213>智人
<400>11
acccgucgccacgcccgccgcaggccaagggccagucacuugcgggccggcgucccgcag60
cccauucgcgccccgccccugccccgccgcgggaugaguaacgguuacgaagcacuuucu120
cggcuacgauuucugcuuagucauugucuuccaggaaacagcucccucaguuuggaauca180
gcucucccgcugcggccgcaguagccggagccggagccgcagccaccggugccuuccuuu240
cccgccgccgcccagccgccguccggccucccucgggcccgagcgcagaccaggcuccag300
ccgcgcggcgccggcagccucgcgcucccucucgggucucucucgggccucgggcaccgc360
guccuguggggcggccgccugccugcccgcccgcccgcagccccuucgcugcgcggcccc420
ugggcggccgcugccaugggcaccgacagccgcgcggccaaggcgcuccuggcgcgggcc480
cgcacccugcaccugcagacggggaaccugcugaacuggggccgccugcggaagaagugc540
ccguccacgcacagcgaggaggaguuuccagaugucuuggaaugcacuguaucucaugca600
guagaaaagauaaauccugaugaaagagaagaaaugaaaguuucugcaaaacuguucauu660
guagaaucaaacucuucaucaucaacuagaagugcaguugacauggccuguucaguccuu720
ggaguugcacagcuggauucugugaucauugcuucaccuccuauugaagauggaguuaau780
cuuuccuuggagcauuuacagccuuacugggaggaauuagaaaacuuaguucagagcaaa840
aagauuguugccauagguaccucugaucuagacaaaacacaguuggaacagcuguaucag900
ugggcacagguaaaaccaaauaguaaccaaguuaaucuugccuccugcugugugaugcca960
ccagauuugacugcauuugcuaaacaauuugacauacagcuguugacucacaaugaucca1020
aaagaacugcuuucugaagcaaguuuccaagaagcucuucaggaaagcauuccugacauu1080
caagcgcacgagugggugccgcuguggcuacugcgguauucggucauugugaaaaguaga1140
ggaauuaucaaaucaaaaggcuacauuuuacaagcuaaaagaagggguucuuaacugacu1200
uaggagcauaacuuaccuguaauuuccuucaauaugagagaaaauugagauguguaaaaa1260
ucuaguuacugccuguaaauggugucauugaggcagauauucuuucgucauauuugacag1320
uauguugucugucaaguuuuaaauacuuaucuugccuccauaucaauccauucucaugaa1380
ccucuguauugcuuuccuuaaacuauuguuuucuaauugaaauugucuauaaagaaaaua1440
cuugcaauauauuuuuccuuuauuuuuaugacuaauauaaaucaagaaaauuuguuguua1500
gauauauuuuggccuagguaucaggguaauguauauacauauuuuuuauuuccaaaaaaa1560
auucauuaauugcuucuuaacucuuauuauaaccaagcaauuuaauuacaauuguuaaaa1620
cugaaauacuggaagaagauauuuuuccugucauugaugagauauaucagaguaacugga1680
guagcugggauuuacuaguaguguaaauaaaauucacucuucaauacaugaauggaaacu1740
uaaauuuuuuuuuauguguccuugcuuauaguuuagcuguaauaauuuaaccuuguauuc1800
uugugccauauucugucuuuuuauuacuuauaaagacaaaccaaaguaaaucugaaagga1860
gacuagaagcuuugaaauuauuguuuggggguuuuauaaaagcaacuacugucaccucca1920
uccagauucuuuuaaauuauugauccauccauaguauauauugcuacucauucaagaauc1980
cucaauaaguauugaguauuuaccauauguugggauacugugggcucuggagagaggagg2040
gggcaauagagcuaggaauuaagaaucaguugaguaaaauguguaauauuuauuccccau2100
uaauaacugacuaggaaggacuaaaagccagaaaggggaugaaaaaaaaauccuuaauuc2160
agggccgacauuaucuacuuaaacaacuuugagauauggucuuaauuauuuuaaagcaga2220
auaauauaauugaaaguuuauagcuaaaagagacuauauaggucauuuaguauaauucuu2280
cauuaguuuacgaaccacaaaauugcaaauaaauaagcuaugaacuuugauguacacuau2340
aaaucuccuuaauucuauaaauuugugucuguaaccugaauaguuugaaaacuucuuuaa2400
aaaucucuuguauuucauccgggcgcaguggcucacaccuguaaucccagcacuuuggga2460
ggccgaggugggcagaucacgaggucaggaguuugagaccagccugaccaacaugguaaa2520
accccaucucuacuaaaauacaaaaauuggcugggcgugguggcacucgccuguaaucuc2580
agcuacuugggaggcugaggcaggagaaucgcuugaacccgggaggcggagguuacagug2640
agccgagaucacaucacugcacuccagccugggcgacagagcgagacuccaucucaaaaa2700
aaaaaaaaaacucuuguaucucaauauuuuuaaaccacaggccuaaauaaaacuaauuuu2760
gcucaaguuuucucaaccuagggaaaaagaacuaugguuccauauucaaaauaaauauua2820
uagacccuuuuccuaaguaggauuuugugguuuacugauuggguaauuugaucauuaaaa2880
uuaugugaaaucugcccgggcacaccucaugccuguaaucccagcacucugggaggccaa2940
ggcagaugaucaccugaggucaggaguucuagaccagccuggcuaacauggugaaacccu3000
guaucugcuaaaaauacaaaaauuagccaggcgugguggcgggcuccuguaaucccagcu3060
acuuuggaggcgaggcacgagaaucgcuugaaccugggaggcggaguuugcagugagccg3120
agaucacgccauugcacuccagccugggcgacagagcgagacugcgucucaaaaaaaaaa3180
aaaaaagaaaaauuaugugaaaucaugugauuugccugggaaaacuuguuuagauauuga3240
gcuacuuaugccuucuagccuuuauauuaauuguauguaauguuauuaaauauauauaua3300
guucaucuuuacauuuggaaaugcccaacauuuuuuucauauaaguccuuaaacaagcgu3360
ucauuuuauuuuaaaucuauacagugaacuggccaagauauuuuaagagggaacuuuaau3420
aucccauuuauuguuuuuauaacccuggacuuauaaaaauggguuguuugaaggguuauu3480
uugaaagugggggaaaaaaaaacuuaguugcuaauguaucuaaacuucagcagagcuuuu3540
uggugaucuccuaccugcacccucaacucuugacaaagaagcaagacuauagauucauuu3600
ucugaaggggaucauguauggaauuuuuugaugaguuuuuacuuuuaccucucuacucuu3660
gauuuucuauuauugaauacucuuuuaaaacacugauuuuuaaggcuuuauauauguuuu3720
ccaggcugauguucacaucuuuuuuucaugaacuaucagaauauagugaacacuuuucaa3780
auauuuaaggacuuaauguuuaaaaagccauaaaauagagagugguaauacuaccaaaua3840
auuacuuaaaacugaaagcuaaguuaucaauaguuuauauaagagauguuuucugaggag3900
augugcauccagugagaccaagguagaaaguuuauauaauuguuuuuuuuccaguaaaua3960
ugaaaaaaaaagcuguagcuuguuuauuacauguccaaaauacaguggagccuuacuuua4020
acacaauguacuguaacuuggaauuuguucuguuaugagucuaucuugaauucccaucca4080
ugaaacuguagucaccaaaagcaacaaguauuuucacaugauguaaaagaccauacuaug4140
auggccauugcuagaaauugaaucacaaauaauagcuaauaauuuuucauuuuucaaaaa4200
agaucauuuggauagcagcuauguauaaaauggaaaauaaaaaauuauucuauuuugcau4260
gaauaguucagacuuucccauaccacagccaagcaguaacuaaaauuaggaucuuaauuu4320
ucaaugauaaaaggucuaagguucauuuaauuaugcuccuuuaacacugucuuucuagau4380
uuuucacccaguauuuucaaaauuugggaauguaaacaauugauauauuuauuguauguu4440
ggcuagcaguucauccuucugcaaaauaugcauucagagaaaugugaagcuuguuuuaau4500
gaagacuuaaaccauuugugucauuuguguuuucauauucaaauacaccaaauuaaaauu4560
cugaaccuauauuuuucaucauuaacuuccuaauauaccagaacauauaccuuuuucaug4620
uaaaguuggcaaugggauauggcaguuuuauuuuugaaaaauauguaacaugacuuuaau4680
auuuuuauaguuuucagaauuagaaacauaggaagggaaaauguuuuaauuagauaaguc4740
aacuuuuuaugugucuguagugguguacuauaauagcaaauuauaaagcauuauuaaaug4800
uuuauaauaauuuuuaauauuaccuacauuaugaauuuaacuaaaauaaagugugaguug4860
uauauuuuuuaauuggguuguuucaauagcuggaagcauccugaagcauuauauugauuu4920
uugaacuauuugaacucaaacugaguaugauuugaaaauaaauuaauaauuuaaaaacau4980
ccaaaaaaaaaaaaaaaaaa5000
<210>12
<211>2928
<212>rna
<213>智人
<400>12
uccuccugggucuugccuagcggcgggcgcaugcuuagucaccgugaggcugcgcuugcc60
cggggcccgcgccccccuaccccggggaccgcccccgggccgcccgccccacuuggcgcg120
ccacuuccgcgugcauggcccugcugccccgagcccugagcgccggcgcgggaccgagcu180
ggcggcgggcggcgcgcgccuuccgaggcuuccugcugcuucugcccgagcccgcggccc240
ucacgcgcgcccucucccgugccauggccugcaggcaggagccgcagccgcagggcccgc300
cgcccgcugcuggcgccguggccuccuaugacuaccuggugaucgggggcggcucgggcg360
ggcuggccagcgcgcgcagggcggccgagcugggugccagggccgccgugguggagagcc420
acaagcuggguggcacuugcgugaauguuggauguguacccaaaaagguaauguggaaca480
cagcuguccacucugaauucaugcaugaucaugcugauuauggcuuuccaaguugugagg540
guaaauucaauuggcguguuauuaaggaaaagcgggaugccuaugugagccgccugaaug600
ccaucuaucaaaacaaucucaccaagucccauauagaaaucauccguggccaugcagccu660
ucacgagugaucccaagcccacaauagaggucagugggaaaaaguacaccgccccacaca720
uccugaucgccacaggugguaugcccuccaccccucaugagagccagauccccggugcca780
gcuuaggaauaaccagcgauggauuuuuucagcuggaagaauugcccggccgcagcguca840
uuguuggugcagguuacauugcuguggagauggcagggauccugucagcccuggguucua900
agacaucacugaugauacggcaugauaaggggauucaaaccgaugacaagggucauauca960
ucguagacgaauuccagaauaccaacgucaaaggcaucuaugcaguuggggauguaugug1020
gaaaagcucuucuuacuccaguugcaauagcugcuggccgaaaacuugcccaucgacuuu1080
uugaauauaaggaagauuccaaauuagauuauaacaacaucccaacuguggucuucagcc1140
accccccuauugggacagugggacucacggaagaugaagccauucauaaauauggaauag1200
aaaaugugaagaccuauucaacgagcuuuaccccgauguaucacgcaguuaccaaaagga1260
aaacaaaaugugugaugaaaauggucugugcuaacaaggaagaaaaggugguugggaucc1320
auaugcagggacuugggugugaugaaaugcugcaggguuuugcuguugcagugaagaugg1380
gagcaacgaaggcagacuuugacaacacagucgccauucacccuaccucuucagaagagc1440
uggucacacuucguugagaaccaggagacacguguggcgggcagugggacccauagaucu1500
ucugaaaugaaacaaauaaucacauugacuuacuguuugaguuuuauguauuucuuuauu1560
uuaaucaggaucuucugauaguggaaauuuuuaguacauaauagaacuuauuuauggagu1620
uagaaauuuguaguguuauccaggauugauuuucauuugaucacaucucacaguaauuaa1680
uauuuucaaguuuuuuuuuuauuaacagcucugugcuaguuuuuuuuuucuguuuuagcc1740
ucaucccaaauauaaagcuuugugaaguacaauuaacuuaauguacuugaaugaauagaa1800
cuugcuacuuuuuuuuuuuuuuuuuuugagacagaguuuugcucucauugcccaggcugg1860
agugcgguggugcuauuucagcucaccacaaccucugccuccuggguucaagugauucuc1920
cugccuuagccucccgaauagcuggaauuacaggcacgcaccaccaugccugacuaauuu1980
uguauuuuuaguagacaugggguuucuccauguuggucaggcuggucucaaacucccacc2040
uucaggugauccgcccaccucggccuccugaggugcugagauuacaggcgugagccacug2100
ugccagcuugcuaauuuucacagaaguugauggcaauucuucacauguaaacagugccag2160
ugcacagaaccuuuauauauuuuuugaagccaguacugugcucugcauauaacaaagcug2220
cuucaaggaugagaccuuuuucuaaaagcauguaaugugagaagccggccugccuuauuu2280
ucuuuuuucuuuuuuaaugauuaaaaauaguuuguggcaaggcacgguggcucaggccug2340
uaauucuagcacuuugggaggccgaggcaggaggauuacuugagccuacaaguuugaggc2400
cagcaugcacagcauagcaagacugcaucucuacagagaguaaaaaaaauuacccgagug2460
uggugaugugcaucuguaaucucagcuacuugggaggcugaggugagaggaucacuugag2520
cuugggugaggugaggcugcagugaguccugaucaugcugcugcacucaaucuuggacaa2580
cagagcaagacccugucucaaaaaaaaaaaaaaaaaauauauauauauauauauauuauu2640
uuuaugaggugaagugcaucaaacuugggaaagauuugaggaggcugggaaccuccugga2700
aaaccacuccuugaagaaagauaugagagacauuuagaagugauuccugcuuucagaagg2760
agguggauucaaauacaucaaaagucccuuccucugcuaaguguuuauaguucaaugaau2820
aauuucaauauuuguauguguucuugucauuuuauuuuuuucugaaaaacuuccaaaaau2880
uugaaaauaaaauuacagccuuuucuucuuauaaaaaaaaaaaaaaaa2928
<210>13
<211>1774
<212>rna
<213>智人
<400>13
gcaguucuuugaauuucucacccuaagaucuggccuguacauuuucaaggaauucuugag60
agguucuuggagagauucugggagccaaacacuccauugggauccuagcuggaauauaaa120
gaauggcuuaucaguggagaccaucgacaguugagaaaagaagaagcccaaaaaguacaa180
gaaugaaaaucgagaguuuuuagagaacaacuuguaauggagccuucaucucuugagcug240
ccggcugacacagugcagcgcauugcggcugaacucaaaugccacccaacggaugagagg300
guggcucuccaccuagaugaggaagauaagcugaggcacuucagggagugcuuuuauauu360
cccaaaauacaggaucugccuccaguugauuuaucauuagugaauaaagaugaaaaugcc420
aucuauuucuugggaaauucucuuggccuucaaccaaaaaugguuaaaacauaucuugaa480
gaagaacuagauaagugggccaaaauagcagccuauggucaugaaguggggaagcguccu540
uggauuacaggagaugagaguauuguaggccuuaugaaggacauuguaggagccaaugag600
aaagaaauagcccuaaugaaugcuuugacuguaaauuuacaucuucuaauguuaucauuu660
uuuaagccuacgccaaaacgauauaaaauucuucuagaagccaaagccuucccuucugau720
cauuaugcuauugagucacaacuacaacuucacggacuuaacauugaagaaaguaugcgg780
augauaaagccaagagagggggaagaaaccuuaagaauagaggauauccuugaaguaauu840
gagaaggaaggagacucaauugcagugauccuguucaguggggugcauuuuuacacugga900
cagcacuuuaauauuccugccaucacaaaagcuggacaagcgaaggguuguuauguuggc960
uuugaucuagcacaugcaguuggaaauguugaacucuacuuacaugacuggggaguugau1020
uuugccugcugguguuccuacaaguauuuaaaugcaggagcaggaggaauugcuggugcc1080
uucauucaugaaaagcaugcccauacgauuaaaccugcauuagugggaugguuuggccau1140
gaacucagcaccagauuuaagauggauaacaaacugcaguuaaucccuggggucugugga1200
uuccgaauuucaaauccucccauuuuguuggucuguuccuugcaugcuaguuuagagauc1260
uuuaagcaagcgacaaugaaggcauugcggaaaaaaucuguuuugcuaacuggcuaucug1320
gaauaccugaucaagcauaacuauggcaaagauaaagcagcaaccaagaaaccaguugug1380
aacauaauuacuccgucucauguagaggagcgggggugccagcuaacaauaacauuuucu1440
guuccaaacaaagauguuuuccaagaacuagaaaaaagaggagugguuugugacaagcgg1500
aauccaaauggcauucgaguggcuccaguuccucucuauaauucuuuccaugauguuuau1560
aaauuuaccaaucugcucacuucuauacuugacucugcagaaacaaaaaauuagcagugu1620
uuucuagaacaacuuaagcaaauuauacugaaagcugcugugguuauuucaguauuauuc1680
gauuuuuaauuauugaaaguaugucaccauugaccacauguaacuaacaauaaauaauau1740
accuuacagaaaaucugaaaaaaaaaaaaaaaaa1774
<210>14
<211>3519
<212>rna
<213>智人
<400>14
cucacacgccggcucggaugaucuccugccaugacucagcgcuucucgcaggcugcccug60
cuggggacaccggcuucgcucgggccccucccgacgcguccacccccucucgccacccac120
gcccgcccccagccgcugggccuuucccagugcggccgccgccgccacagcugcagucag180
caccgucaccccagcagcauccgccgccugcaccgcgcgugcggcccgccccggccugac240
cccgccgccgaacccggcgccagccauggagcccgaagccccccgucgccgccacaccca300
ucagcgcggcuaccugcugacacggaacccucaccucaacaaggacuuggccuuuacccu360
ggaagagagacagcaauugaacauucauggauuguugccaccuuccuucaacagucagga420
gauccagguucuuagaguaguaaaaaauuucgagcaucugaacucugacuuugacaggua480
ucuucucuuaauggaucuccaagauagaaaugaaaaacucuuuuauagagugcugacauc540
ugacauugagaaauucaugccuauuguuuauacucccacugugggucuggcuugccaaca600
auauaguuugguguuucggaagccaagaggucucuuuauuacuauccacgaucgagggca660
uauugcuucaguucucaaugcauggccagaagaugucaucaaggccauuguggugacuga720
uggagagcguauucuuggcuugggagaccuuggcuguaauggaaugggcaucccuguggg780
uaaauuggcucuauauacagcuugcggagggaugaauccucaagaaugucugccugucau840
ucuggaugugggaaccgaaaaugaggaguuacuuaaagauccacucuacauuggacuacg900
gcagagaagaguaagagguucugaauaugaugauuuuuuggacgaauucauggaggcagu960
uucuuccaaguauggcaugaauugccuuauucaguuugaagauuuugccaaugugaaugc1020
auuucgucuccugaacaaguaucgaaaccaguauugcacauucaaugaugauauucaagg1080
aacagcaucuguugcaguugcaggucuccuugcagcucuucgaauaaccaagaacaaacu1140
gucugaucaaacaauacuauuccaaggagcuggagaggcugcccuagggauugcacaccu1200
gauugugauggccuuggaaaaagaagguuuaccaaaagagaaagccaucaaaaagauaug1260
gcugguugauucaaaaggauuaauaguuaagggacgugcuuccuuaacacaagagaaaga1320
gaaguuugcccaugaacaugaagaaaugaagaaccuagaagccauuguucaagaaauaaa1380
accaacugcccucauaggaguugcugcaauugguggugcauucucagaacaaauucucaa1440
agauauggcugccuucaaugaacggccuauuauuuuugcuuugaguaauccaacuagcaa1500
agcagaauguucugcagagcagugcuacaaaauaaccaagggacgugcaauuuuugccag1560
uggcaguccuuuugauccagucacucuuccaaauggacagacccuauauccuggccaagg1620
caacaauuccuauguguucccuggaguugcucuugguguuguggcguguggauugaggca1680
gaucacagauaauauuuuccucacuacugcugagguuauagcucagcaagugucagauaa1740
acacuuggaagagggucggcuuuauccuccuuugaauaccauuagagauguuucucugaa1800
aauugcagaaaagauugugaaagaugcauaccaagaaaagacagccacaguuuauccuga1860
accgcaaaacaaagaagcauuuguccgcucccagauguauaguacugauuaugaccagau1920
ucuaccugauuguuauucuuggccugaagaggugcagaaaauacagaccaaaguugacca1980
guaggauaauagcaaacauuucuaacucuauuaaugaggucuuuaaaccuuucauaauuu2040
uuaaagguuggaaucuuuuauaaugauucauaagacacuuagauuaagauuuuacuuuaa2100
cagucuaaaaauugauagaagaauaucgauauaaauugggauaaacaucacaugagacaa2160
uuuugcuucacuuugccuucugguuauuuaugguuucugucugaauuauucugccuacgu2220
ucucuuuaaaagcuguuguacguacuacggagaaacucaucauuuuuauacaggacacua2280
augggaagaccaaaauuacuaauaaauugacauaaccaacauuaaaacucauaauuauuu2340
uguugaccauuuuguuaaaaucuacuuuucaaaaaaaaaaagcuagaaaugaaucuaggc2400
guaggugaacuuuugcuaagcagaaauaacacuacuuuguugccuagagaaagauaacuu2460
cucaaguauuuuuauuccaguccuagaucauauauguucuuuugugcaacggaauucuaa2520
caguucuaagagaaagaucacugcuguuuacagcgccuugugcagccuuagauuuuaaua2580
uucuuuugucauuguuacaucucauagaguaaagcucuuauuaccuugauccugagucag2640
aaaucccaccugaaaucaccuuuuuucccccuugaucaaacaucccauccuucagcuacc2700
auacuguugcuacagggauuuuguggacuguggccccugucccgagguuggcaccuucag2760
uucagcacagccugagcagugagaaggucugaaaggagaguauauaguuaagauccuuga2820
gaaagggcugccugaggaacugaccucuuaaagaucucaggaucuuuaagacaacaaguu2880
agguuccuacuggaguuaccugccagaauggccucuuaauuaacucagguaaugaagagc2940
uaacuguguuauaaucaucuugcuuuugccugaauuuggagaaaguauuauaauuaaguu3000
cccaguaucagaaauguccuuacauaagauuaaaauaucuugaugacuaauaccauucua3060
ugagaaagaguaguuauaugcccagacuguauuaauuuacuuuagaaacuaauguuugaa3120
guaauggaaaaaauuuuaaauuauaaagcuaaggugcaauaacauuugcuacuuauuuau3180
agaauuauuugaagaauuuuguuuuugaaguaaugcuuuaaggaguauaagauauucaag3240
auaaauuauacuauaaaaugauuuuauugaaaguugaagguuacacaaauuguuuuaggu3300
augagcagaagagguuaagguauuucuaaagguaacauauagucaagaguuuccucaaaa3360
uaguuauuuggagaagaaucagaaugucuguguauuucuugucuguuucuauguugucuu3420
auagcucugacuaaauguguuuaccuaugcaaaagauuuauuaaagcauagaaaagguga3480
augaauaaaaauauaaaauaauuguccuuuuucuuaaaa3519
<210>15
<211>2917
<212>rna
<213>智人
<400>15
ggcccuuccggggcugcgcggcucccccgccucggugccggcaaaaaugugccuagucac60
ggggccgcucucgggggaacugaggucgccuucgggcugggacccggagccccuucgccg120
cgccccaagaccuccuugagugcgggcugcgacgcgcucaccccgcugggccgucugugg180
gcgcggcuuugcgaagucauccaucucucggaucacucucuggcagccuugagcucucuu240
gaaagcccagccccgggacgagggaggagcgccuuaagugcccagcgggcucagaagccc300
cgacguguggcggcugagccgggccccgcgcacuuucucggccggggagggguucgggcu360
cgggcacccggaguuggccccucguaacgccgcgggaaagugcgggcgagggcaguggac420
ucugaggccggagucggcggcacccggggcuucuaguucggacgcggugcccccuggugg480
cgcucaccgcgcgcguggccuuggcuuccgugacagcgcucgguuggccgucacagcagc540
ccucgguuggcccuuuccugcuuuauagcgugcaaaccucgccgcgccagggccaaggga600
cagguuggagcuguugaucuguugcgcaauugcuauuuuccccagagcggcuuugucuuu660
ggauuuagcguuucagaauugcaauuccaaaauguguaagacgggauauucucuucugug720
cugucaagggacauggauuugauugacauacuuuggaggcaagauauagaucuuggagua780
agucgagaaguauuugacuucagucagcgacggaaagaguaugagcuggaaaaacagaaa840
aaacuugaaaaggaaagacaagaacaacuccaaaaggagcaagagaaagccuuuuucgcu900
caguuacaacuagaugaagagacagguugcccacauucccaaaucagaugcuuuguacuu960
ugaugacugcaugcagcuuuuggcgcagacauucccguuuguagaugacaaugagguuuc1020
uucggcuacguuucagucacuuguuccugauauucccggucacaucgagagcccagucuu1080
cauugcuacuaaucaggcucagucaccugaaacuucuguugcucagguagccccuguuga1140
uuuagacgguaugcaacaggacauugagcaaguuugggaggagcuauuauccauuccuga1200
guuacagugucuuaauauugaaaaugacaagcugguugagacuaccaugguuccaagucc1260
agaagccaaacugacagaaguugacaauuaucauuuuuacucaucuauacccucaaugga1320
aaaagaaguagguaacuguaguccacauuuucuuaaugcuuuugaggauuccuucagcag1380
cauccucuccacagaagaccccaaccaguugacagugaacucauuaaauucagaugccac1440
agucaacacagauuuuggugaugaauuuuauucugcuuucauagcugagcccaguaucag1500
caacagcaugcccucaccugcuacuuuaagccauucacucucugaacuucuaaaugggcc1560
cauugauguuucugaucuaucacuuugcaaagcuuucaaccaaaaccacccugaaagcac1620
agcagaauucaaugauucugacuccggcauuucacuaaacacaagucccaguguggcauc1680
accagaacacucaguggaaucuuccagcuauggagacacacuacuuggccucagugauuc1740
ugaaguggaagagcuagauagugccccuggaagugucaaacagaaugguccuaaaacacc1800
aguacauucuucuggggauaugguacaacccuugucaccaucucaggggcagagcacuca1860
cgugcaugaugcccaaugugagaacacaccagagaaagaauugccuguaaguccugguca1920
ucggaaaaccccauucacaaaagacaaacauucaagccgcuuggaggcucaucucacaag1980
agaugaacuuagggcaaaagcucuccauaucccauucccuguagaaaaaaucauuaaccu2040
cccuguuguugacuucaacgaaaugauguccaaagagcaguucaaugaagcucaacuugc2100
auuaauucgggauauacguaggagggguaagaauaaaguggcugcucagaauugcagaaa2160
aagaaaacuggaaaauauaguagaacuagagcaagauuuagaucauuugaaagaugaaaa2220
agaaaaauugcucaaagaaaaaggagaaaaugacaaaagccuucaccuacugaaaaaaca2280
acucagcaccuuauaucucgaaguuuucagcaugcuacgugaugaagauggaaaaccuua2340
uucuccuagugaauacucccugcagcaaacaagagauggcaauguuuuccuuguucccaa2400
aaguaagaagccagauguuaagaaaaacuagauuuaggaggauuugaccuuuucugagcu2460
aguuuuuuuguacuauuauacuaaaagcuccuacugugaugugaaaugcucauacuuuau2520
aaguaauucuaugcaaaaucauagccaaaacuaguauagaaaauaauacgaaacuuuaaa2580
aagcauuggagugucaguauguugaaucaguaguuucacuuuaacuguaaacaauuucuu2640
aggacaccauuugggcuaguuucuguguaaguguaaauacuacaaaaacuuauuuauacu2700
guucuuaugucauuuguuauauucauagauuuauaugaugauaugacaucuggcuaaaaa2760
gaaauuauugcaaaacuaaccacuauguacuuuuuuauaaauacuguauggacaaaaaau2820
ggcauuuuuuauauuaaauuguuuagcucuggcaaaaaaaaaaaauuuuaagagcuggua2880
cuaauaaaggauuauuaugacuguuaaauuauuaaaa2917
<210>16
<211>2423
<212>rna
<213>智人
<400>16
auccuccgcccagcaccccaggauucaggcguugggucccgcccuuguaggcuguccacc60
ucaaacgggccggacaggauauauaagagagaaugcaccgugcacuacacacgcgacucc120
cacaagguugcagccggagccgcccagcucaccgagagccuaguuccggccagggucgcc180
ccggcaaccacgagcccagccaaucagcgccccggacugcaccagagccauggucggcag240
aagagcacugaucguacuggcucacucagagaggacguccuucaacuaugccaugaagga300
ggcugcugcagcggcuuugaagaagaaaggaugggaggugguggagucggaccucuaugc360
caugaacuucaaucccaucauuuccagaaaggacaucacagguaaacugaaggacccugc420
gaacuuucaguauccugccgagucuguucuggcuuauaaagaaggccaucugagcccaga480
uauuguggcugaacaaaagaagcuggaagccgcagaccuugugauauuccagaguggcau540
ucugcauuucuguggcuuccaagucuuagaaccucaacugacauauagcauugggcacac600
uccagcagacgcccgaauucaaauccuggaaggauggaagaaacgccuggagaauauuug660
ggaugagacaccacuguauuuugcuccaagcagccucuuugaccuaaacuuccaggcagg720
auucuuaaugaaaaaagagguacaggaugaggagaaaaacaagaaauuuggccuuucugu780
gggccaucacuugggcaaguccaucccaacugacaaccagaucaaagcuagaaaaugaga840
uuccuuagccuggauuuccuucuaacauguuaucaaaucuggguaucuuuccaggcuucc900
cugacuugcuuuaguuuuuaagauuuguguuuuucuuuuuccacaaggaauaaaugagag960
ggaaucgacuguauucgugcauuuuuggaucauuuuuaacugauucuuaugauuacuauc1020
auggcauauaaccaaaauccgacugggcucaagaggccacuuagggaaagauguagaaag1080
augcuagaaaaauguucuuuaaaggcaucuacacaauuuaauuccucuuuuuagggcuaa1140
aguuuuaggguacaguuuggcuagguaucauucaacucuccaauguucuauuaaucaccu1200
cucuguaguuuauggcagaagggaauugcucagagaaggaaaagacugaaucuaccugcc1260
cuaagggacuuaacuuguuugguaguuagccaucuaaugcuuguuuaugauauuucuugc1320
uuucaauuacaaagcaguuacuaauaugccuagcacaaguaccacucuuggucagcuuuu1380
guuguuuauauacaguacacagauaccuugaaaggaagagcuaauaaaucucuucuuugc1440
ugcagucaucuacuuuuuuuuuaauuaaaaaaaauuuuuuuuugaagcagucuugcucug1500
uuacccaggcuggagugcaguggugugaucucggcucacugcaaccucugccucccaggu1560
uccagcaauucuccugccucagccucccuaguagcugggaugacaggcgccugccaucau1620
gccugacuaauuuuuguauuuuuaguagagacggcguuucaccauguuggccaggcuggu1680
cucaaacuccugaccucaggugauccgccuaccucagccucccaaagugcugggauuaca1740
ggcgugauccaccacaccuggcccuugcaaucuucuacuuuaagguuugcagagauaaac1800
caauaaauccacaccguacaucugcaauaugaauucaagaaaggaaauaguaccuucaau1860
acuuaaaaauagucuuccacaaaaaauacuuuauuucugaucuauacaaauuuucagaag1920
guuauuuucuuuaucauugcuaaacugaugacuuacuaugggaugggguccagucccaug1980
accuugggguacaauuguaaaccuagaguuuuaucaacuuuggugaacaguuuuggcaua2040
auagucaauuucuacuucuggaagucaucucauuccacuguugguauuauauaauucaag2100
gagaauaugauaaaacacugcccucuuguggugcauugaaagaagagaugagaaaugaug2160
aaaagguugccugaaaaaugggagacagccucuuacuugccaagaaaaugaagggauugg2220
accgagcuggaaaaccuccuuuaccagaugcugacuggcacuggugguuuuugcucucga2280
caguauccacaauagcugacggcuggguguuucaguuugaaaauauuuuguugccuucau2340
cuucacugcaauuuuguguaaauuucucaaagaucugaauuaaauaaauaaaauucauuu2400
cuacagacccacaaaaaaaaaaa2423
<210>17
<211>1591
<212>rna
<213>智人
<400>17
cgggcgccgcgggccauggcgggcgagaaccaccaguggcagggcagcauccucuacaac60
augcuuaugagcgcgaagcaaacgcgcgcggcuccugaggcuccagagacgcggcuggug120
gaucagugcuggggcuguucgugcggcgaugagcccggggugggcagagaggggcugcug180
ggcgggcggaacguggcgcuccuguaccgcugcugcuuuugcgguaaagaccacccacgg240
cagggcagcauccucuacagcaugcugacgagcgcaaagcaaacguacgcggcaccgaag300
gcgcccgaggcgacgcuggguccgugcuggggcuguucgugcggcucugaucccggggug360
ggcagagcggggcuuccgggugggcggcccguggcacuccuguaccgcugcugcuuuugu420
ggugaagaccacccgcggcagggcagcauccucuacagcuugcucacuagcucaaagcaa480
acgcacguggcuccggcagcgcccgaggcacggccagggggcgcguggugggaccgcucc540
uacuucgcgcagaggccaggggguaaagaggcgcuaccaggcgggcgggccacggcgcuu600
cuguaccgcugcugcuuuugcggugaagaccacccgcagcagggcagcacccucuacugc660
gugcccacgagcacaaaucaagcgcaggcggcuccggaggagcggccgagggcccccugg720
ugggacaccuccucuggugcgcugcggccgguggcgcucaagaguccacagguggucugc780
gaggcagccucagcgggccuguugaagacgcugcgcuucgucaaguacuugcccugcuuc840
caggugcugccccuggaccagcagcuggugcuggugcgcaacugcugggcgucccugcuc900
augcuugagcuggcccaggaccgcuugcaguucgagacuguggaagucucggagcccagc960
augcugcagaagauccucaccaccaggcggcgggagaccgggggcaacgagccacugccc1020
gugcccacgcugcagcaccauuuggcaccgccggcggaggccaggaaggugcccuccgcc1080
ucccagguccaagccaucaagugcuuucuuuccaaaugcuggagucugaacaucaguacc1140
aaggaguacgccuaccucaaggggaccgugcucuuuaacccggacgugccgggccugcag1200
ugcgugaaguacauucagggacuccaguggggaacucagcaaauacucagugaacacacc1260
aggaugacgcaccaagggccccaugacagauucaucgaacuuaauaguacccuuuuccug1320
cugagauucaucaaugccaaugucauugcugaacuguucuucaggcccaucaucggcaca1380
gucagcauggaugauaugaugcuggaaaugcucuguacaaagauauaaagucaugugggc1440
cacacaagugcaguagugcaguucaccaugagggaagaauaaagagcugugggcaaaaga1500
guguaaaauauuuuaaaauaaacuuucuuaauauuuuuacaugcagaguauuuuuguauu1560
caauuaaagaaauaauuuuauuccaaaaaaa1591
<210>18
<211>1958
<212>rna
<213>智人
<400>18
acuucccucuggccucucagagccucuuggauccccacaggguaaugggugucccgaucu60
cgcgggggacucugugauccguguuccccugacccuccuagugcacaacuuggccgggcu120
cacugggcuccugcaccacugccugucagguccgcugccagccccaagccccccaccagc180
caugagcuccuccagaaaggaccaccucggcgccagcagcucagagccccucccggucau240
cauuguggguaacggccccucugguaucugccuguccuaccugcucuccggcuacacacc300
cuacacgaagccagaugccauccacccacacccccugcugcagaggaagcucaccgaggc360
cccgggggucuccauccuggaccaggaccuggacuaccuguccgaaggccucgaaggccg420
aucccaaagccccguggcccugcucuuugaugcccuucuacgcccagacacagacuuugg480
gggaaacaugaagucgguccucaccuggaagcaccggaaggagcacgccaucccccacgu540
gguucugggccggaaccuccccgggggagccuggcacuccaucgaaggcuccauggugau600
ccugagccaaggccaguggauggggcucccggaccuggaggucaaggacuggaugcagaa660
gaagcgaagaggucuucgcaacagccgggccacugccggggacaucgcccacuacuacag720
ggacuacguggucaagaagggucuggggcauaacuuuguguccggugcuguagucacagc780
cguggagugggggacccccgaucccagcagcuguggggcccaggacuccagcccccucuu840
ccaggugagcggcuuccugaccaggaaccaggcccagcagcccuucucgcugugggcccg900
caacgugguccucgccacaggcacguucgacagcccggcccggcugggcauccccgggga960
ggcccugcccuucauccaccaugagcugucugcccuggaggccgccacaagggugggugc1020
ggugaccccggccucagacccuguccucaucauuggcgcggggcugucagcggccgacgc1080
gguccucuacgcccgccacuacaacaucccggugauccaugccuuccgccgggccgugga1140
cgacccuggccugguguucaaccagcugcccaagaugcuguaccccgaguaccacaaggu1200
gcaccagaugaugcgggagcaguccauccugucgcccagccccuaugaggguuaccgcag1260
ccuccccaggcaccagcugcugugcuucaaggaagacugccaggccguguuccaggaccu1320
cgagggugucgagaagguguuuggggucucccuggugcugguccucaucggcucccaccc1380
cgaccucuccuuccugccuggggcaggggcugacuuugcaguggauccugaccagccgcu1440
gagcgccaagaggaaccccauugacguggaccccuucaccuaccagagcacccgccagga1500
gggccuguacgccauggggccgcuggccggggacaacuucgugagguuugugcagggggg1560
cgccuuggcuguggccagcucccugcuaaggaaggagaccaggaagccacccuaacacuc1620
ggccagacccgcuggcucccaggcccugagaggacagagaugaccacaucccugcuggau1680
gcaggacccguccaaagaugccccggggaggggugucagcccacguugcuggccuuuggg1740
gucaagaggaguagggaucccaggcugcccuggacuuagaccagugucugaggugguaac1800
agcggccgcaggccaggguuggccuagaccugggauuuguggggaaagcugcugguguga1860
ccagcugagcacccagccaggagaccugcagcccugcgccuuccagaagcaggucccaaa1920
uaaagccagugcccaccugcaaaaaaaaaaaaaaaaaa1958
<210>19
<211>2432
<212>rna
<213>智人
<400>19
auggcccagugagugacucgccaggggcagcccggcucggccucagcgggcggggaacuc60
uuugggggucgagaucucccucguucucuccgacgccucccacccugggggucgccugag120
cucacuuggggcucugugacccuggcccuacggcgucucgggcccagagcuccuucccug180
cgggcccggcccccugcccucucggccgcgcagagcugacaucgcgcugaucggauuggc240
cgucaugggccagaacuuaauucugaacaugaaugaccacggcuuuguggucugugcuuu300
uaauaggacugucuccaaaguugaugauuucuuggccaaugaggcaaagggaaccaaagu360
ggugggugcccagucccugaaagagauggucuccaagcugaagaagccccggcggaucau420
ccuccuggugaaggcugggcaagcuguggaugauuucaucgagaaauugguaccauuguu480
ggauacuggugacaucaucauugacggaggaaauucugaauauagggacaccacaagacg540
gugccgagaccucaaggccaagggaauuuuauuuguggggagcggagucagugguggaga600
ggaaggggcccgguauggcccaucgcucaugccaggagggaacaaagaagcguggcccca660
caucaagaccaucuuccaaggcauugcugcaaaagugggaacuggagaacccugcuguga720
cugggugggagaugagggagcaggccacuucgugaagauggugcacaacgggauagagua780
uggggacaugcagcugaucugugaggcauaccaccugaugaaagacgugcugggcauggc840
gcaggacgagauggcccaggccuuugaggauuggaauaagacagagcuagacucauuccu900
gauugaaaucacagccaauauucucaaguuccaagacaccgauggcaaacaccugcugcc960
aaagaucagggacagcgcggggcagaagggcacagggaaguggaccgccaucuccgcccu1020
ggaauacggcguacccgucacccucauuggagaagcugucuuugcucggugcuuaucauc1080
ucugaaggaugagagaauucaagcuagcaaaaagcugaaggguccccagaaguuccaguu1140
ugauggugauaagaaaucauuccuggaggacauucggaaggcacucuacgcuuccaagau1200
caucucuuacgcucaaggcuuuaugcugcuaaggcaggcagccaccgaguuuggcuggac1260
ucucaauuaugguggcaucgcccugauguggagagggggcugcaucauuagaaguguauu1320
ccuaggaaagauaaaggaugcauuugaucgaaacccggaacuucagaaccuccuacugga1380
cgacuucuuuaagucagcuguugaaaacugccaggacuccuggcggcgggcagucagcac1440
ugggguccaggcuggcauucccaugcccuguuuuaccacugcccucuccuucuaugacgg1500
guacagacaugagaugcuuccagccagccucauccaggcucagcgggauuacuucggggc1560
ucacaccuaugaacucuuggccaaaccagggcaguuuauccacaccaacuggacaggcca1620
ugguggcaccgugucauccucgucauacaaugccugaucaugcugcuccugucacccucc1680
acgauuccacagaccaggacauuccaugugccucauggcacugccaccuggcccuuugcc1740
cuauuuucuguucaguuuuuuaaaaguguuguaagagacuccugaggaagacacacaguu1800
uauuuguaaaguagcucugugagagccaccaugcccucugcccuugccucuugggacuga1860
ccaggagcugcucaugugcgugagagugggaaccaucuccuugcggcaguggcuuccgcg1920
ugccccgugugcuggugcgguucccaucacgcagacaggaaggguguuugcgcacucuga1980
ucaacuggaaccucuguaucaugcggcugaauucccuuuuuccuuuacucaauaaaagcu2040
acaucagacugaugcucuuucuccagauucuuagucucaccucggccacauggagccauu2100
auccccauuggcagaaagauuuuucuuuaaaaaaaaagacuagaauaacacaagaaacca2160
cauuuaggauuaugcuucacucagaggaggcaggcagggaggacacaccaggggcuuuaa2220
uacacugggcauguuuucuuucuccaauugggcaauggguacauggacguucacuguaac2280
gugcuuuuucuuucgucuuuuuuuuuuuuuuuuuuuuuuuugcuccuggcaagcugugcg2340
ugacauucuuuauggcuuuuuguaugucaaauacuucauacuaaacuuucuagagaauua2400
aacuuuaaugaugggcucaaaaaaaaaaaaaa2432
<210>20
<211>4583
<212>rna
<213>智人
<400>20
gcggccgccccggcggcuccuggaaccccgguucgcggcgaugccagccaccccagcgaa60
gccgccgcaguucagugcuuggauaauuugaaaguacaauaguugguuucccuguccacc120
cgccccacuucgcuugccaucacagcacgccuaucggaugugagaggagaagucccgcug180
cucgggcacugucuauauacgccuaacaccuacauauauuuuaaaaacauuaaauauaau240
uaacaaucaaaagaaagaggagaaaggaagggaagcauuacuggguuacuaugcacuugc300
gacugauuucuuggcuuuuuaucauuuugaacuuuauggaauacaucggcagccaaaacg360
ccucccggggaaggcgccagcgaagaaugcauccuaacguuagucaaggcugccaaggag420
gcugugcaacaugcucagauuacaauggauguuugucauguaagcccagacuauuuuuug480
cucuggaaagaauuggcaugaagcagauuggaguaugucucucuucauguccaaguggau540
auuauggaacucgauauccagauauaaauaaguguacaaaaugcaaagcugacugugaua600
ccuguuucaacaaaaauuucugcacaaaauguaaaaguggauuuuacuuacaccuuggaa660
agugccuugacaauugcccagaaggguuggaagccaacaaccauacuauggaguguguca720
guauugugcacugugaggucagugaauggaauccuuggaguccaugcacgaagaagggaa780
aaacauguggcuucaaaagagggacugaaacacggguccgagaaauaauacagcauccuu840
cagcaaaggguaaccugugucccccaacaaaugagacaagaaaguguacagugcaaagga900
agaagugucagaagggagaacgaggaaaaaaaggaagggagaggaaaagaaaaaaaccua960
auaaaggagaaaguaaagaagcaauaccugacagcaaaagucuggaauccagcaaagaaa1020
ucccagagcaacgagaaaacaaacagcagcagaagaagcgaaaaguccaagauaaacaga1080
aaucgguaucagucagcacuguacacuagaggguuccaugagauuauuguagacucauga1140
ugcugcuaucucaaccagaugcccaggacaggugcucuagccauuaggaccacaaaugga1200
caugucaguuauugcucugucuaaacaacauucccaguaguugcuauauucuucauacaa1260
gcauaguuaacaacaaagagccaaaagaucaaagaagggauacuuucagaugguugucuu1320
gugugcuucucugcauuuuuaaaagacaagacauucuuguacauauuaucaauaggcuau1380
aagauguaacaacgaaaugaugacaucuggagaagaaacaucuuuuccuuauaaaaaugu1440
guuuucaagcuguuguuuuaagaagcaaaagauaguucugcaaauucaaagauacaguau1500
cccuucaaaacaaauaggaguucagggaagagaaacauccuucaaaggacaguguuguuu1560
ugaccgggagaucuagagagugcucagaauuagggccuggcauuuggaaucacaggauuu1620
aucaucacagaaacaacuguuuuaagauuaguuccaucacucucauccuguauuuuuaua1680
agaaacacaagagugcauaccagaauugaauauaccauaugggauuggagaaagacaaau1740
guggaagaaaucauagagcuggagacuacuuuugugcuuuacaaaacugugaaggauugu1800
ggucaccuggaacaggucuccaaucuauguuagcacuauguggcucagccucuguuaccc1860
cuuggauuauauaucaaccuguaaacaugugccuguaacuuacuuccaaaaacaaaauca1920
uacuuauuagaagaaaauucugauuuuauagaaaaaaaauagagcaaggagaauauaaca1980
uguuugcaaagucauguguuuucuuucucaaugagggaaaaacaauuuuauuaccugcuu2040
aaugguccaccuggaacuaaaagggauacuauuuucuaacaagguauaucuaguagggga2100
gaaagccaccacaauaaauauauuuguuaauaguuuuucaaguuuuguucacucuguuuu2160
auuguuuguuuuauugagaaauucuuacucuuagagacucaugaauuaagaaagagaauu2220
cugcuaacucagagaaccugguuccuauguaauucagaauauauuacauuucucaguaau2280
auuuguuuuuugaauccaccuuuaucugagccaauggagauuuacuuauagcguauuagg2340
agauauuuauuccauuuucuuauuuuaaucaacauucuaauuauagacacaugggccucc2400
cuagcugauuucacugcucccccuucauugcuuagaaaugggcaucauuucuuguauguc2460
agaucccccugcaucuucaacauuuagucuuuucuucuccauauuuucuaucuguggauc2520
ucuuuaggggauugaagucacccuagcugaaggccucaccaguguuucacagaggacaca2580
gcccaccccuugcaggaggagguaucucugagugugcagcacagaaucgcaugacccacc2640
uuaaccuuccuguugucauggaaggaugcacggcugcucuguccacugugauuccuagcc2700
cucucaagaucacugcuuucugaagaauuugcaaugacucuggcuucuggcugcuuaucu2760
cuggacacccguucuccaccaguuguacaguucauguaaucuacuuggcuuaauugauuu2820
uccacuucucucuuccucuucuaagauauaaacauuuuaaaugauuuauuccuguuucuu2880
auucugguguuucuuuccuugucccuaugagauaagugucucaacucacuaaaucuauuc2940
ccaauguauaaaauaauucuaauuccauuuucagcuaaaacauauauuaccaagaagaaa3000
caaacuuuauccuacagaaugauguuagguagaaauauguccccagguuugagaccuuuc3060
ggaugauuucauauaccaucuuucuucugaguguuacccagucaaguauaaguagccaaa3120
uuauuuuugcacaucuuucuguuucucaugucuucauuuauucaacaagcacuuacuggg3180
aaggucuacaccugcauaggcaaugcuggaaaaaggguuaaguaaaccaggacaugacaa3240
ugguggcaaaugacuaucaggucuucccauguguuugacucaaacuuauuacccuauggu3300
ccuucugacaauggcagaaggucugaauccuugaugcuaaacuuauauaaaaguagaauu3360
auuacaaaggaaaaagaaauaaaaacuaacauucauuuucauauguuggaugaaauauaa3420
augaagaaaaagauaacaucaauuuuaacuguaauucuccauccaccaguaacagauccu3480
uaagacaauagaaucauacaguauucaaaccagcagccuucucaaauuugagcaaaaacu3540
cuaucaaccucugguaaaguuccuacacuagucacagaagguguuaacuuucuacucuga3600
uucugucuccauaaugggguaaacuguugauaguuuaccccaucaacagauggucgguaa3660
auuauugauucgaagaaucgagagagugcagcaacauaaaucuguuaaugucugaucaag3720
cuccugcccuguucuccgaauucagcuucauaauuaagggaaggccuguuuucuauccuc3780
agauuuagguucuaguagcaguuguguaaccacuagugagucacuuaacuccucuggguc3840
cccauuucucaugugcaacaagaaagaggggaacuggagaugaucacucuaguuccagac3900
aagggaacauuucacacuuuguuuacuucagggugaugucccugaguccucauuagugac3960
ugcguccuuuggaaguuaucccaacccugcuuuucucaaaagugaaaauguauaggcucu4020
cagaggagacagauuuaacucugcuucucuaauguuauugaauuaaaagcuguucacauu4080
agugguuauuaaauauugaaauaacacugggaagaaaaagcauauauaaauacagcuaaa4140
aacaagaauagauauucauucucacaaagggagacagcaaagaaaauggaaagugcacug4200
gugcuagcguuagacagcuuguguuaaugucucaauucugcuacuaacugguugcagcuu4260
gugugaccuugggcacauuguaugaucucgcagaauaucaucccaaaucugcaaaaugga4320
auuggcaucaucucuuuugcaagauuguuaugagaauuaaaagguucuucauucaauaua4380
auaauaaauauuuuguauauaaaugaauaucaauuaaaaguuaugacuaauuccacaagu4440
caaacauauaaauuuuauuucuugauucaugauaugugauaguauucauaaaaauguaca4500
ugcaugauaauuucaaggaauaaguauauaugugagaaucauggaaaugaaauuaauaau4560
auuaacuaguaauuaaauuguaa4583
<210>21
<211>9648
<212>rna
<213>智人
<400>21
gguuuguaaugauagggcggcagcagcagcagcagcagcagugguggaacgaggaggugg60
agaauugagagcacgaugcauacacagguguuucugaguaguaauuagaucgcugugaag120
gaaaaagcacaccuuugaguuuucaccugugaacacuauagcgcugagagagacagucug180
aaagcagaggaagacaucgaucaguaacaccaagagacaccaaaguugaaaguuuuguuu240
ucuuucccucuguuuuauuuuucccccgugugucccuacuauggucagaaagccuguugu300
guccaccaucuccaaaggagguuaccugcagggaaauguuaacgggaggcugccuucccu360
gggcaacaaggagccaccugggcaggagaaagugcagcugaagaggaaagucacuuuacu420
gaggggagucuccauuaucauuggcaccaucauuggagcaggaaucuucaucucuccuaa480
gggcgugcuccagaacacgggcagcgugggcaugucucugaccaucuggacggugugugg540
gguccugucacuauuuggagcuuugucuuaugcugaauugggaacaacuauaaagaaauc600
uggaggucauuacacauauauuuuggaagucuuugguccauuaccagcuuuuguacgagu660
cuggguggaacuccucauaauacgcccugcagcuacugcugugauaucccuggcauuugg720
acgcuacauucuggaaccauuuuuuauucaaugugaaaucccugaacuugcgaucaagcu780
cauuacagcugugggcauaacuguagugaugguccuaaauagcaugagugucagcuggag840
cgcccggauccagauuuucuuaaccuuuugcaagcucacagcaauucugauaauuauagu900
cccuggaguuaugcagcuaauuaaaggucaaacgcagaacuuuaaagacgccuuuucagg960
aagagauucaaguauuacgcgguugccacuggcuuuuuauuauggaauguaugcauaugc1020
uggcugguuuuaccucaacuuuguuacugaagaaguagaaaacccugaaaaaaccauucc1080
ccuugcaauauguauauccauggccauugucaccauuggcuaugugcugacaaauguggc1140
cuacuuuacgaccauuaaugcugaggagcugcugcuuucaaaugcaguggcagugaccuu1200
uucugagcggcuacugggaaauuucucauuagcaguuccgaucuuuguugcccucuccug1260
cuuuggcuccaugaacggugguguguuugcugucuccagguuauucuauguugcgucucg1320
agagggucaccuuccagaaauccucuccaugauucauguccgcaagcacacuccucuacc1380
agcuguuauuguuuugcacccuuugacaaugauaaugcucuucucuggagaccucgacag1440
ucuuuugaauuuccucaguuuugccagguggcuuuuuauugggcuggcaguugcugggcu1500
gauuuaucuucgauacaaaugcccagauaugcaucguccuuucaaggugccacuguucau1560
cccagcuuuguuuuccuucacaugccucuucaugguugcccuuucccucuauucggaccc1620
auuuaguacagggauuggcuucgucaucacucugacuggagucccugcguauuaucucuu1680
uauuauaugggacaagaaacccaggugguuuagaauaaugucagagaaaauaaccagaac1740
auuacaaauaauacuggaaguuguaccagaagaagauaaguuaugaacuaauggacuuga1800
gaucuuggcaaucugcccaaggggagacacaaaauagggauuuuuacuucauuuucugaa1860
agucuagagaauuacaacuuuggugauaaacaaaaggagucaguuauuuuuauucauaua1920
uuuuagcauauucgaacuaauuucuaagaaauuuaguuauaacucuauguaguuauagaa1980
agugaauaugcaguuauucuaugagucgcacaauucuugagucucugauaccuaccuauu2040
gggguuaggagaaaagacuagacaauuacuauguggucauucucuacaacauauguuagc2100
acggcaaagaaccuucaaauugaagacugagauuuuucuguauauauggguuuuguaaag2160
augguuuuacacacuauagaugucuauacugugaaaaguguuuucaauucugaaaaaaag2220
cauacaucaugauuauggcaaagaggagagaaagaaauuuauuuuacauugacauugcau2280
ugcuuccccuuagauaccaauuuagauaacaaacacucaugcuuuaauggauuauaccca2340
gagcacuuugaacaaaggucaguggggauuguugaauacauuaaagaagaguuucuaggg2400
gcuacuguuuaugagacacauccaggaguuauguuuaaguaaaaauccuugagaauuuau2460
uaugucagauguuuuuucauucauuaucaggaaguuuuaguuaucugucauuuuuuuuuu2520
ucacaucaguuugaucaggaaaguguauaacacaucuuagagcaagaguuaguuugguau2580
uaaauccucauuagaacaaccaccuguuucacuaauaacuuaccccugaugagucuaucu2640
aaacauaugcauuuuaagccuucaaauuacauuaucaacaugagagaaaucaccaacaaa2700
gaagauguucaaaauaauagucccauaucuguaaucauaucuacaugcaauguuaguaau2760
ucugaaguuuuuuaaauuuauggcuauuuuuacacgaugaugaauuuugacaguuugugc2820
auuuucuuuauacauuuuauauucuucuguuaaaauaucucuucagaugaaacuguccag2880
auuaauuaggaaaaggcauauauuaacauaaaaauugcaaaagaaaugucgcuguaaaua2940
agauuuacaacugauguuucuagaaaauuuccacuucuauaucuaggcuuugucaguaau3000
uuccacaccuuaauuaucauucaacuugcaaaagagacaacugauaagaagaaaauugaa3060
augagaaucuguggauaaguguuuguguucagaagauguuguuuugccaguauuagaaaa3120
uacugugagccgggcaugguggcuuacaucuguaaucccagcacuuugggaggcugaggg3180
gguggaucaccugaggucgggaguucuagaccagccugaccaacauggagaaaccccauc3240
ucuacuaaaaauacaaaauuagcugggcaugguggcacaugcugguaaucucagcuauug3300
aggaggcugaggcaggagaauugcuugaacccgggaggcggagguugcagugagccaaga3360
uugcaccacuguacuccagccugggugacaaagucagacuccaucuccaaaaaaaaaaga3420
uuauauauauauauauauguguguguauguguguguguguguguguguguauauauauau3480
auauauauauacacacacacacacacacuuuuuauauauauauauauauauauauagugg3540
aacuuacaaaugagaguaauauaaugaugaaauuuugaacuguuauuuauaaacaucuaa3600
gguaaaaugguuagucauggccagaguauguuucauccuuuaauuuuuguccauuugaaa3660
auaaggauuuuugaaagaauuauaccaauuaaaauuauuaaaggcaaacauagaauucau3720
aaaaaauuguccaaaguagaaaugaugaccuauaauuuggagcauuuccaauucaguaau3780
uucaauuuugcucuugaaaacauuuaauauauauccaagacugacauuucuuuagcugaa3840
ccuaacguuugggucucugagugaauuuauaauaacuccuuccuuccuuagcauaggguu3900
uucaaaauuugauuuauaauuccuauuuccaguaaauauuguucauuuguccacaucucu3960
cccuaugauauguugcuggagguaagaauuucuuucauauuccuauuuuuuuuuucccca4020
uagacuaggcucauagaauuuaaacaagcaaauuuuccugagcuuuuucuugccaaauga4080
aagaagacugguaaauucucauagagagguuuguguaguucuuggcucuuccugggguua4140
augugcuuauauucacaguggcaaauuggucucagacuuuaauuuauuuauuuuugauuu4200
gaauuucucuuuaaaaguaucaauuuaaaagguaacuagaauuauucuuucucauuuuca4260
aaagugauuuuugcauuauuaaauuucccugccauuguaaugccauuucacgcagaaaaa4320
aagucagccaguaauuaagaaaaaaagugauggagauuaaguaguauuuuggcuuauuuu4380
uaggacucaucaugagaagacacaguuccuuuaaucaggaaauuaauauccauaauuuuc4440
acucaaaauugcaguauguaaagcagauucucaaaaacucuccugaacacuuauuuauau4500
auauguuuuuauauaaguaaaauuuuucucauauuuuuauacgauaugcacacacacaca4560
uacaugcacauacuacuuacuacauguucuguacuuguacuuuguaccaugcauauucaa4620
auguuuauauacauaaguuuauuauaacauaaacaguaaaaguaaugaauacuguuuaaa4680
auaacuaauauaguauuuuuuaauuuuuguggggauggauucucaaauacuugugauuuu4740
aaaagauucuaaagcuaaaacacaacuugauuuuaaaaagaaugauucuccuuacacaau4800
uauaaauauuugcaguaaauauuuuccuuauaauacuguuuugaccccauuuaaaaagua4860
uuagauuauauuccuuugauccaaugaaaacugaaccuuauaaaugguuagcugaaagua4920
gaccuuauucuuguccuucuuuagaagaguaaagauuuguccuagggaagauggcugacu4980
ucgguucccaacaugcguaugcauuuagacuguagcuccucagcccuguggacacaaaau5040
uuggacagcuuauuagguuacguuagcaaugcaugacgguuucuccaacacuaagauauu5100
cacguugaaacagauuuccuguucgucuuaugugucugguaaaauuguuuccccaauuac5160
aauuugacauaucaauagaggguuaacaagaguauaauuacauaacagaauuccucauga5220
acuguaaucagucuacaggaaaaucauuauuuuaucuugauuugcagaugaauauacugc5280
uaagaaagggagcaacucugaccuuuguuaaaguugaucuuuuguaauugagguauaagg5340
uaugaaaagauaaaaaaccgaaggccagagaaucaggaaaugaaagauaguauggacuga5400
agguaacaauauuuuaauguuaugcaauauagucagagaaauauuaaaaauuaguuguuu5460
gcugugcauagguggaucucgcaggaagcuaaugaaaccuaagcuucagugccucucacu5520
uagacauguuccauucgagguccugaaccuaacuuuguauuaggaauucuguacuaauuu5580
uguugaagaagaccagcaaaguuguguacacuucuacccccacaaaaucugcauugucca5640
ugugaguaaaguaaaauaauuccuguuauuuuuuucuguuagaaauaaguauggaggaua5700
uguuuuuaaaaauuuaugaguuaauugaaauauccauauauaacaagugacuuucucaca5760
auauauaugaugugauauauagggagauaguuucacuuucaucauauuuuauacguugau5820
ucugaacuauagaaaaauaauaaaugggauuuuaauuauagcucuuaguugggaaagaaa5880
uauagagagaugugggauuugaaugcccaugaaagacauuuuauuuuacuugaauauauu5940
cuugcuucacuuuacccuccauaauauguuguacauuagugcugaucaaguuuacagagu6000
uacauuuugcuuuccuaaccauucagucaggaauuaaaauauggcauuguauaacaacug6060
ggaagaagcucauaguggauauaaauuagaguagauaaugggucaccuugauagccucug6120
uuuacauuacuuguauaugggcaaaauaauuauuaccuauacguguauuuaagcuuaauu6180
uucauauaaacaguauuuuuaaucuauguuaaaauagauaauaucuaaaagugugaucuc6240
uagguaguccuuaguuuauuaguacuguacuucaaaaagauuuuuaaauagguccggcac6300
gguggcucaugccuguaaucccagcacuuugggaggcugaggcgggcgaaucaccugagg6360
ucaggaguucgagaucagccuggccaacauggugaaacccugucucaacuaaaaauauaa6420
aaauuagccgggcgugguggcaggcgccuguaaucccagcuacucgggaggcugaggcag6480
gagaaucacuugaacccaaggggcagaagcugcaguuagccaagaucgcaucauugcacu6540
ccagccuaggggacaagagcgcgagacuucaucucaaaaaaaaaaaaaaaaaaaaaaaaa6600
gauuuuuaaauaauagcuaaagguaugcucucuaggucauccuuaguuuauuaguacugu6660
acuuaaaaauuauuuuuuaauagucaauuuugggagauaauuauuucuuuccuuauauuu6720
uccaauuaguuggugucuaaaaauaaauguuuugucuaauuuuagaucagguauacauuc6780
acaaaagcauaaaucauagucucacaggaaauucaccaauuuuccauaugucgugagaua6840
acuguccuuucuacaaccucauaacaaugaauuuauauaauuaccuagauuuucuuagug6900
ugaaucuacccauuaguuuuauuuucuugguaguuauuuuuuucccuccucucuguuacu6960
auuggccuuaaaauacacagaggacgguuacaguguccuaauagcuguuacaugugugug7020
uuucagcguacuugaaucaaguguacauuuauaguaccaauaaccgccuuuacagcuuua7080
caguuaacaauucucucacaaaacuguagagcauuaggcaucugagagccauagagggcc7140
aacuuuguuccagagugaacaugcuuuuuuuccucaacauauacacuacugauuuuuuuu7200
aaaaguaugacuuucaagugaauuaauguauugguuaggagaacugcuugcuaaguccuu7260
auuaccucuuguuaaagccucagaaggccgugcugaaagccagaggggaaaaaaagagua7320
augcacagguaucucuuuugcaguggugacuguauuuugaguaccuugugugacagggua7380
uuauuacagcaucuugugggaaaaccuauuaggccuuugcauguuaaagcuguauaauuu7440
guuggguugugaguggucugacuuaaauguguauuauaaaauuuagacaucaaauuuucc7500
uacuaacuaacuuuauuagaugcauacuuggaagcacagucauaucacacugggaggcaa7560
ugcaaugugguuaccugguccuagguuugaacugucuuauuucaaaagauuucugaauua7620
auuuuucccuagaauuucuccuucauuccaaaguacaaacauacuuugaagaaugaaaca7680
gauuguucccaugaauguaugcucauacucgacuagaaacgaucuauguuaaaugacugu7740
guauaugaauuauuucaaguacuaccccaaauaacuuucuuauugcucugaaagaagaaa7800
agcaauguaaaucacuaugauuauugcacaaacaaccagaauucuccaacaauuuuaagu7860
aaucugauccucuucuuggagaaaauuguuaccuaauaguuuuuccuuaugaauguuauu7920
acuacugguauaaaucaaauuucuauaaauuuccuacuuaagucuuaagaacuggguucu7980
uccuuugauguuauucauguucagaaaggaaacaacacuuuacucuuuuaggacaauucc8040
uagaaucuauaguaguaucaggauauauuuugcuuuaaaauauauuuugguuauuuugaa8100
uacagacauuggcuccaaauuuucaucuuugcacaauaguaugacuuuucacuagaacuu8160
cucaacauuugggaacuuugcaaauaugagcaucauauguguuaaggcuguaucauuuaa8220
ugcuaugagauacauuguuuucucccuaugccaaacaggugaacaaacguaguuguuuuu8280
uacugauacuaaauguuggcuaccugugauuuuauaguaugcacaugucagaaaaaggca8340
agacaaauggccucuuguacugaauacuucggcaaacuuauugggucuucauuuucugac8400
agacaggauuugacucaauauuuguagagcuugcguagaauggauuacaugguagugaug8460
cacugguagaaaugguuuuuaguuauugacucagaauucaucucaggaugaaucuuuuau8520
gucuuuuuauuguaagcauaucugaauuuacuuuauaaagaugguuuuagaaagcuuugu8580
cuaaaaauuuggccuaggaaugguaacuucauuuucaguugccaagggguagaaaaauaa8640
uauguguguuguuauguuuauguuaacauauuauuagguacuaucuaugaauguauuuaa8700
auauuuuucauauucugugacaagcauuuauaauuugcaacaaguggaguccauuuagcc8760
cagugggaaagucuuggaacucagguuacccuugaaggauaugcuggcagccaucucuuu8820
gaucugugcuuaaacuguaauuuauagaccagcuaaaucccuaacuuggaucuggaaugc8880
auuaguuaugaccuuguaccauucccagaauuucaggggcaucguggguuuggucuagug8940
auugaaaacacaagaacagagagauccagcugaaaaagagugauccucaauauccuaacu9000
aacugguccucaacucaagcagaguuucuucacucuggcacugugaucaugaaacuuagu9060
agaggggauuguguguauuuuauacaaauuuaauacaaugucuuacauugauaaaauucu9120
uaaagagcaaaacugcauuuuauuucugcauccacauuccaaucauauuagaacuaagau9180
auuuaucuaugaagauauaaauggugcagagagacuuucaucuguggauugcguuguuuc9240
uuaggguuccuagcacugaugccugcacaagcaugugauaugugaaauaaaauggauucu9300
ucuauagcuaaaugaguucccucuggggagaguucugguacugcaaucacaaugccagau9360
gguguuuaugggcuauuuguguaaguaagugguaagaugcuaugaaguaaguguguuugu9420
uuucaucuuauggaaacucuugaugcaugugcuuuuguauggaauaaauuuuggugcaau9480
augaugucauucaacuuugcauugaauugaauuuugguuguauuuauauguauuauaccu9540
gucacgcuucuaguugcuucaaccauuuuauaaccauuuuuguacauauuuuacuugaaa9600
auauuuuaaauggaaauuuaaauaaacauuugauaguuuacauaauaa9648
<210>22
<211>2704
<212>rna
<213>智人
<400>22
cggcaccuggcgagcggagccggagucgggcuggggaccgcggggucgaggccggaccgc60
ggcggggucgggggagaaacgcgcgcugcccuggcacgggcccccccccccggccgcgcg120
gaaugguauggcccggccggaguuaaggccggggggaggcggcgagucccgcggcggcgg180
cgacgauggggcugcgugcaggaggaacgcugggcagggccggcgcgggucggggggcgc240
ccgaggggcccgggccgagcggcggcgcgcagggcggcagcauccacucgggccgcaucg300
ccgcggugcacaacgugccgcugagcgugcucauccggccgcugccguccguguuggacc360
ccgccaaggugcagagccucguggacacgauccgggaggacccagacagcgugcccccca420
ucgauguccucuggaucaaaggggcccagggaggugacuacuucuacuccuuugggggcu480
gccaccgcuacgcggccuaccagcaacugcagcgagagaccauccccgccaagcuugucc540
aguccacucucucagaccuaaggguguaccugggagcauccacaccagacuugcaguagc600
agccuccuuggcaccugcugccaccuucaagagcccagaagacacaccuggccuccagca660
ggcugggccaugcagaagggauagcaggggugcauucucuuugcaccuggcgagaggguc720
ugacucugggcaccccucucaccagcuacaaggccuuggacucacuguacagugugggag780
ccccaguucccaccucugugacaauaggaucauggccuuacccuugaagcauuaccgaga840
aggagaacagagaugggcuugaagagccacgugcugccggcuccaaauucccaaggacaa900
ggaucccucugcauuuuugucuauguaaccucuuauauggacuacauucagcugcaagga960
aaggaaaaccuugauugcagugguuuaaacaaacagaagauuguuuuuccacauagcaug1020
gauucuggagauggguggcuaaugguauugguucaacaacuccacgaagguaggggucac1080
gucuuggauccuuuugccuuaaucucagugcucguuacuucauggucccaagauggcugc1140
uguauccccaagaaucaugucugcguucaaggaaggagggguggaggaagaggaagggcc1200
aaacuagcuggacccgucaccuucuaucagaaaguaaaaccucgucagaagucuguuucc1260
ugcucucucccucugcauaucuucacuuagaugcccuuggcccgagccagcuaccauugc1320
accucuagcugcaaacaaagcuaagacagcagggaacagaauugucauggcugaauagac1380
caaucguguuccaucuacugagacuggcacacugccuccugcaauaaaacugggauccca1440
uuaccaagagagaaaugcagaauuguguaccaguuagcuuuugcuguguaacaaaccauc1500
cccaaacuuggcagcuagaaacaaacccuguauuuucccacaauccuauggguuggcaau1560
uugggcugggcucaacagggcaguucugcugcucacaccugggaucccucauggagcuaa1620
ggucagcuguuaccucagcugggccuggauggucuaggauagccuuacucacuugccugg1680
caggugacaggcuguuggcuggaauugcuugguucuccuccauguggccucuccagcagg1740
cuagcucaggcuuauucacaugauggcuucaggauuccaaagagagugagaguagaagcu1800
gaaagacuucuugaguucuuggccuggaacugggacuaggacagugucacuucugcuaag1860
uucuuuuggucagagcaaaucacaaggcuuuacccagauucaagggaugagaaacagacu1920
acaugucuugaugaggggaaccacaaagagcuuguggccauuuuucaccuaucacaaaua1980
auuuuggauggguauuuauuuggauaaagguauuucccucuucccccuuucucucugucu2040
cauggggccucacucugccaaguuggaaggcacuaagacauuguccuggcccucaggguc2100
uaggggaagagguguuggggcaggaagugagucucuccaugggcuggacccacuguagua2160
ggagugccuccuugucugcacugcugguaugggguuaggccagguaggacauuccagagg2220
ggcuucugaaaaccaagagucccuggggaaagggaacagaguaaggcaggccuuguucuc2280
acugcccucuaagggaacuuggucacucggcacuuuuaagccucaguuucuccaguucaa2340
uaauaaggacaagagcuuuucccaugcauucucuuuccccgggaaaguugacugagguga2400
ccaguaauagaauugaaaagggagagugucuucagugcaauguggcauccuggauugggu2460
cuuggaacaaaaacaggacauuagugggaaaauuggaaaucugaaaaaagucugaauuuu2520
aguuaauauaccaauuucagucucuugguuuugacagauguaccauggugauguaagaug2580
uugaccuugggguaggcugggugaaggguauacaggaacucuuuguacuaucucugcaac2640
uucucuguaaaucuaguaucauuccaaaauaaaaguuuauuuaauuuaaaaaaaaaaaaa2700
aaaa2704
<210>23
<211>1319
<212>rna
<213>智人
<400>23
cgcgcccgucccgucgccgccgccgccgccgcagaccccucggucuugcuaugucgagcu60
cacccgugaagcgucagaggauggaguccgcgcuggaccagcucaagcaguucaccaccg120
ugguggccgacacgggcgacuuccacgccaucgacgaguacaagccccaggaugcuacca180
ccaacccgucccugauccuggccgcagcacagaugcccgcuuaccaggagcugguggagg240
aggcgauugccuauggccggaagcugggcgggucacaagaggaccagauuaaaaaugcua300
uugauaaacuuuuuguguuguuuggagcagaaauacuaaagaagauuccgggccgaguau360
ccacagaaguagacgcaaggcucuccuuugauaaagaugcgaugguggccagagccaggc420
ggcucaucgagcucuacaaggaagcugggaucagcaaggaccgaauucuuauaaagcugu480
caucaaccugggaaggaauucaggcuggaaaggagcucgaggagcagcacggcauccacu540
gcaacaugacguuacucuucuccuucgcccaggcuguggccugugccgaggcggguguga600
cccucaucuccccauuuguugggcgcauccuugauuggcauguggcaaacaccgacaaga660
aauccuaugagccccuggaagacccugggguaaagagugucacuaaaaucuacaacuacu720
acaagaaguuuagcuacaaaaccauugucaugggcgccuccuuccgcaacacgggcgaga780
ucaaagcacuggccggcugugacuuccucaccaucucacccaagcuccugggagagcugc840
ugcaggacaacgccaagcuggugccugugcucucagccaaggcggcccaagccagugacc900
uggaaaaaauccaccuggaugagaagucuuuccguugguugcacaacgaggaccagaugg960
cuguggagaagcucucugacgggauccgcaaguuugccgcugaugcagugaagcuggagc1020
ggaugcugacagaacgaauguucaaugcagagaauggaaaguagcgcaucccugaggcug1080
gacuccagaucugcaccgccggccagcugggaucugacugcacguggcuucugaugaauc1140
uugcguuuuuuacaaauuggagcagggacagaucauagauuucugauuuuauguaaaauu1200
uugccuaauacauuaaagcagucacuuuuccugugcuguuucaaaaaaaaaaaaaaaaaa1260
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa1319
<210>24
<211>2920
<212>rna
<213>智人
<400>24
gauuuauggaaagcaccuggugcguguucugcccucugaggacccugcccuuucccaaaa60
gggguaucuuaagaaggaaaauauggcugcucuuugccggacagcagagucccaguagga120
uuuccauuuuccaaaccugguaucaucuccuaguuggaagaagugguaagcccacgaaca180
caaaugcaggagggagaggugccaagaagcagcgguacacagcaggcacagagacacgug240
gucuucagcagagccuaugggguucagaugauucacauaagaauagaaguuucagggcug300
gaccuggggaggcagccugagccugagccggcuguccugagccugaguacucuagcugcc360
uugucgucaucgcaucuggcugccauccagcgccagcacacaguaaugaguggccgagcu420
uccucugggagggaggaaacaguuaaaaucuugcagcagcugcaaucaucuaggcguggu480
ucucuugucugacuugggcugcacagauccugggccaagggacagaagaaagacagccua540
ggagcagagccucccagauggcugaguuggaucuaauggcuccagggccacugcccaggg600
ccacugcucagcccccagccccucucagcccagacucugggucacccagcccagauucug660
ggucagccagcccaguggaagaagaggacgugggcuccucggagaagcuuggcagggaga720
cggaggaacaggacagcgacucugcagagcagggggauccugcuggugaggggaaagagg780
uccugugugacuucugccuugaugacaccagaagagugaaggcagugaaguccugucuaa840
ccugcauggugaauuacugugaagagcacuugcagccgcaucaggugaacaucaaacugc900
aaagccaccugcugaccgagccagugaaggaccacaacuggcgauacugcccugcccacc960
acagcccacugucugccuucugcugcccugaucagcagugcaucugccaggacuguugcc1020
aggagcacaguggccacaccauagucucccuggaugcagcccgcagggacaaggaggcug1080
aacuccagugcacccaguuagacuuggagcggaaacucaaguugaaugaaaaugccaucu1140
ccaggcuccaggcuaaccaaaagucuguucuggugucggugucagaggucaaagcggugg1200
cugaaaugcaguuuggggaacuccuugcugcugugaggaaggcccaggccaaugugaugc1260
ucuucuuagaggagaaggagcaagcugcgcugagccaggccaacgguaucaaggcccacc1320
uggaguacaggagugccgagauggagaagagcaagcaggagcuggagaggauggcggcca1380
ucagcaacacuguccaguucuuggaggaguacugcaaguuuaagaacacugaagacauca1440
ccuucccuaguguuuacguagggcugaaggauaaacucucgggcauccgcaaaguuauca1500
cggaauccacuguacacuuaauccaguugcuggagaacuauaagaaaaagcuccaggagu1560
uuuccaaggaagaggaguaugacaucagaacucaagugucugccguuguucagcgcaaau1620
auuggacuuccaaaccugagcccagcaccagggaacaguuccuccaauaugcguaugaca1680
ucacguuugacccggacacagcacacaaguaucuccggcugcaggaggagaaccgcaagg1740
ucaccaacaccacgcccugggagcaucccuacccggaccuccccagcagguuccugcacu1800
ggcggcaggugcugucccagcagagucuguaccugcacagguacuauuuugagguggaga1860
ucuucggggcaggcaccuauguuggccugaccugcaaaggcaucgaccggaaaggggagg1920
agcgcaacaguugcauuuccggaaacaacuucuccuggagccuccaauggaacgggaagg1980
aguucacggccugguacagugacauggagaccccacucaaagcuggcccuuuccggaggc2040
ucggggucuauaucgacuucccgggagggauccuuuccuucuauggcguagaguaugaua2100
ccaugacucugguucacaaguuugccugcaaauuuucagaaccagucuaugcugccuucu2160
ggcuuuccaagaaggaaaacgccauccggauuguagaucugggagaggaacccgagaagc2220
cagcaccguccuugguggggacugcucccuagacuccaggagccauaucccagaccuuug2280
ccagcuacagugaugggauuugcauuuuagggugauuugggggcagaaauaacugcugau2340
gguagcuggcuuuugaaauccuauggggucucugaaugaaaacauucuccagcugcucuc2400
uuuugcuccauauggugcuguucucuauguguuugcaguaauucuuuuuuuuuuuuuuga2460
gacggagucucgcacuguugcccaggcuggagagcaguggcgcgaucuuggcucacugca2520
agcuccgccucccgaguucaagcaauucuccugccucagccucccgaguagcugggauua2580
caggugccugccaccacacccagcuaauguuuuguauuuuuaguagagaugggguuucac2640
cauguuggccaggcagaucucaaacuccugaccucgugaugcacccaccucggccuccca2700
aagugcugggauuacaugcgugagccacugcgcccugccuguuuguaguaauuuuuaggc2760
accaaaucucccucaucuucuagugccauucuccucucuguucagguaaaugucacacug2820
ugcccagaauggaugaccaggaaccuuaaagaguggcugaaaagauugcagaguuaucau2880
aauaaauugcuaacuugcguaaaaaaaaaaaaaaaaaaaa2920
<210>25
<211>1982
<212>rna
<213>智人
<400>25
gugccucccggcugguuucugagaucagccacagaaguuaaacuucuuuccagggaagaa60
gggcggggaugucagggcuggagagugcccguguccuucugugugcauugggcuccuucc120
uccuuaauucucugcuuuccacuuuuaggcugaacuccagugcacccaguuagacuugga180
gcggaaacucaaguugaaugaaaaugccaucuccaggcuccaggcuaaccaaaagucugu240
ucuggugucggugucagaggucaaagcaguggcugaaaugcaguuuggggaacuccuugc300
ugcugugaggaaggcccaggccaaugugaugcucuucuuagaggagaaggagcaagcugc360
gcugagccaggccaacgguaucaaggcccaccuggaguacaggagugccgagauggagaa420
gaguaagcaggagcuggagacgauggcggccaucagcaacacuguccaguucuuggagga480
guacugcaaguuuaagaacacugaagacaucaccuucccuaguguuuacauagggcugaa540
ggauaaacucucgggcauccgcaaaguuaucacggaauccacuguacacuuaauccaguu600
gcuggagaacuauaagaaaaagcuccaggaguuuuccaaggaagaggaguaugacaucag660
aacucaagugucugccauuguucagcgcaaauauuggacuuccaaaccugagcccagcac720
cagggaacaguuccuccaauaugugcaugacaucacguucgacccggacacagcacacaa780
guaucuccggcugcaggaggagaaccgcaaggucaccaacaccacgcccugggagcaucc840
cuacccggaccuccccagcagguuccugcacuggcggcaggugcugucccagcagagucu900
guaccugcacagguacuauuuugagguggagaucuucggggcaggcaccuauguuggccu960
gaccugcaaaggcaucgaccagaaaggggaggagcgcagcaguugcauuuccggaaacaa1020
cuucuccuggagccuccaauggaacgggaaggaguucacggccugguacagugacaugga1080
gaccccacucaaagcuggcccuuucuggaggcucggggucuauauugacuucccaggagg1140
gauccuuuccuucuauggcguagaguaugauuccaugacucugguucacaaguuugccug1200
caaguuuucagaaccagucuaugcugccuucuggcuuuccaagaaggaaaacgccauccg1260
gauuguagaucugggagaggaacccgagaagccagcaccguccuugguggggacugcucc1320
cuagacuccaggagccauaucccagaccuuugccagcuacagugaugggauuugcauuuu1380
agggugauuugggggcaaaaauaacugcugaugguagcuggcuuuugaaauccuaugggg1440
ucucugaaugaaaacauucuccagcugcucucuuuugcuccauauggugcuguucucuau1500
guguuugcaguaauucuuuuuuuuuuuuuuuuugagacggagucucgcacuguugcccag1560
gcuggagugcaguggcgugaucuuggcucacugcaagcuccgccucccgaguucaagcaa1620
uucuccugccucagccucccgaguagcugggauuacaggugccugccaccacacccagcu1680
aacguuuuguauuuuuaguagagaugggguuucaccauguuggccaggcagaucucaaac1740
uucugaccucgugaugcacucaccucggccucccaaagugcugggauuacaggcgugagc1800
cacugcgcccugccuguuuguaguaauuuuuaggcaccaaaucucccucaucuucuagug1860
ccauucuccucucuguucagguaaaugucacacugugcccagaauggaugaccaggaacc1920
uucaagaguggcugaaaagauugcagaguuaucauaauaaauugcuaacuugcguauuuc1980
cu1982
<210>26
<211>826
<212>rna
<213>智人
<400>26
cucgcaggcuccaggggcggggcguggccggggcgcagcgacgggcgcggagguccggcc60
gggcgcgcgcgcccccgccacacgcacgccgggcgugccaguuuauaaagggagagagca120
agcagcgagucuugaagcucuguuuggugcuuuggauccauuuccaucgguccuuacagc180
cgcucgucagacuccagcagccaagauggugaagcagaucgagagcaagacugcuuuuca240
ggaagccuuggacgcugcaggugauaaacuuguaguaguugacuucucagccacguggug300
ugggccuugcaaaaugaucaagccuuucuuucaugauguugcuucagagugugaagucaa360
augcaugccaacauuccaguuuuuuaagaagggacaaaaggugggugaauuuucuggagc420
caauaaggaaaagcuugaagccaccauuaaugaauuagucuaaucauguuuucugaaaau480
auaaccagccauuggcuauuuaaaacuuguaauuuuuuuaauuuacaaaaauauaaaaua540
ugaagacauaaacccaguugccaucugcgugacaauaaaacauuaaugcuaacacuuuuu600
aaaaccgucucaugucugaauagcuuucaaaauaaaugugaaauggucauuuaauguauu660
uuccuauauucucaaucacuuuuuaguaaccuuguaggccacugauuauuuuaagauuuu720
aaaaauuauuauugcuaccuuaauguauugcuacaaaaaucucuuguugggggcaaugca780
gguaauaaaguaguauguuguuauuuguaaaaaaaaaaaaaaaaaa826
<210>27
<211>3846
<212>rna
<213>智人
<400>27
agacccucacgugaugacaacagcuagcaaaguucuguagcuacugccuuagggcauagu60
cuaauuucuucaguaaaaacacacuuauuccaaauuugguuccagaauugccuuaaauug120
uuuuugcucuguucuuagguugggggcggcuaugagcaggcagaggauguggugucaccc180
aauuaggagcucucagcuuacgaggcaauuagcauagguugccagggcugcacgaggagu240
ggauuucugcuuugucauucugacucuggcaguuagcccgcccgcucggcgcagggcgug300
gcuucucguagccauuaggaaacagcaacccuuucaccucaguuuucuucacuccggcau360
uugcagcagagcgaaagguggucgaguccugaaggagggccugaugucuucaucauucuc420
aaauucuuaggacggucgggcccuggaaggaacgcucucggaauuggccgcggaaaccga480
ucugcccguuguguuugugaaacagagaaagauaggcggccaugguccaaccuugaagga540
ggcagcccaauauggcaagaaggugaugguccuggacuuugucacucccaccccucuugg600
aacuagauggggucucggaggaacaugugugaauguggguugcauaccuaaaaaacugau660
gcaucaagcagcuuuguuaggacaagcccugcaagacucucgaaauuauggauggaaagu720
cgaggagacaguuaagcaugauugggacagaaugauagaagcuguacagaaucacauugg780
cucuuugaauuggggcuaccgaguagcucugcgggagaaaaaagucgucuaugagaaugc840
uuaugggcaauuuauugguccucacaggauuaaggcaacaaauaauaaaggcaaagaaaa900
aauuuauucagcagagagauuucucauugccacuggugaaagaccacguuacuugggcau960
cccuggugacaaagaauacugcaucagcagugaugaucuuuucuccuugccuuacugccc1020
ggguaagacccugguuguuggagcauccuaugucgcuuuggagugcgcuggauuucuugc1080
ugguauugguuuagacgucacuguuaugguuagguccauucuucuuagaggauuugacca1140
ggacauggccaacaaaauuggugaacacauggaagaacauggcaucaaguuuauaagaca1200
guucguaccaauuaaaguugaacaaauugaagcagggacaccaggccgacucagaguagu1260
agcucaguccaccaauagugaggaaaucauugaaggagaauauaauacggugaugcuggc1320
aauaggaagagaugcuugcacaagaaaaauuggcuuagaaaccguaggggugaagauaaa1380
ugaaaagacuggaaaaauaccugucacagaugaagaacagaccaaugugccuuacaucua1440
ugccauuggcgauauauuggaggauaagguggagcucaccccaguugcaauccaggcagg1500
aagauugcuggcucagaggcucuaugcagguuccacugucaagugugacuaugaaaaugu1560
uccaaccacuguauuuacuccuuuggaauauggugcuuguggccuuucugaggagaaagc1620
uguggagaaguuuggggaagaaaauauugagguuuaccauaguuacuuuuggccauugga1680
auggacgauuccgucaagagauaacaacaaauguuaugcaaaaauaaucuguaauacuaa1740
agacaaugaacguguugugggcuuucacguacuggguccaaaugcuggagaaguuacaca1800
aggcuuugcagcugcgcucaaauguggacugaccaaaaagcagcuggacagcacaauugg1860
aauccacccugucugugcagagguauucacaacauugucugugaccaagcgcucuggggc1920
aagcauccuccaggcuggcugcugagguuaagccccaguguggaugcuguugccaagacu1980
gcaaaccacuggcucguuuccgugcccaaauccaaggcgaaguuuucuagaggguucuug2040
ggcucuuggcaccugcguguccugugcuuaccaccgcccaaggcccccuuggaucucuug2100
gauaggaguuggugaauagaaggcaggcagcaucacacuggggucacugacagacuugaa2160
gcugacauuuggcagggcaucgaagggaugcauccaugaagucaccagucucaagcccau2220
gugguaggcggugauggaacaacugucaaaucaguuuuagcaugaccuuuccuuguggau2280
uuucuuauucucguugucaaguuuucuaggguugaauuuuuuucuuuuuucuccauggug2340
uuaaugauauuagagaugaaaaacguuagcaguugauuuuuguccaaaagcaagucaugg2400
cuagaguauccaugcaaggugucuuguugcauggaagggauaguuuggcucccuuggagg2460
cuauguaggcuugucccgggaaagagaacuguccugcagcugaaauggacuguucuuuac2520
ugaccugcucagcaguuucuucucucauauauucccaaaacaaguacaucugcgaucaac2580
ucuagccaaauuugccccugugugcuacaugauggaugauuauuauuuuaaggucuguuu2640
aggaagggaaauggcuacuuggccagccauugccuggcauuugguaguauaguaugauuc2700
ucaccauuauuugucauggaggcagacauacaccagaaaugggggagaaacaguacauau2760
cuuucugucuuuaguuuauugugugcuggucuaagcaagcugagaucauuugcaauggaa2820
aacacguaacuuguuuaaaaguuuuucugguagcuuuagcuuuaugcuaaaaaaaauaau2880
gacauuggguaucuauuucuuucuaagacuacauuaguaggaaaauaagucuuuucaugc2940
uuaugauuuagcuguuuugugguaauugcuuuuuaaaggaaguuauuaauaucauaaguu3000
auuauuaauauuuugaacacagguggaugugaaggauuuucauuuaaaaaccaagugguu3060
uugacuuuuucuguugaaugaacaacugugccuuguggaauuuuugcagaaguguuuaug3120
cuuuguuagcauuucaacuugcauuauuauaaagagguauuaaugccucaguuauguguu3180
ugucaauguacuggcugaggauucuaucucagcugucuuuucuaacuguguagguugagu3240
uuugaacacgugcuuguggacaucaggccuccugccagcaguucuugaagcuucuuuuuc3300
auuccugcuacucuaccuguauuucucaguugcagcacugaguggucaaaauacauuucu3360
gggccaccucagggaacccaugcaucugccuggcauuuaggcagcagagccccugaccgu3420
cccccacagggcucugccucacguccucaucucauuuggcuguguaaagaaaugggaaaa3480
gggaaaaggagagagcaauugaggcaguugaccauauucaguuuuauuuauuuauuuuua3540
auuuguuuuuuucuccaaguccaccagucucugaaauuagaacaguaggcgguaugagau3600
aaucaggccuaaucauguugugauucucuuuucuuaguggaguggaauguucuaucccca3660
caagaaggauuauaucuuauagacuugucuuguucagauucuguauuuacccauuuuauu3720
gaaacauauacuaaguuccauguauuuuuguuacaaaucuucugaaaaaaaacaaaacaa3780
ugugaaacauuaaaauuaaaaggcauuaauaauauccacgugugccuucuuacugaaaaa3840
aaaaaa3846
<210>28
<211>3013
<212>rna
<213>智人
<400>28
gugaaggaaauagggaccuggcccugggccuuguguagcgggagggggagcuaggaagca60
gcugagggcagaauccaggagggccuggcugcgggggaaugaagccuccgccuucgcagg120
caaaagccuuuaaauacgggcucaggcccgggacucagaguguaacgcguggcagccuga180
gggaggggcgugcgccgagagggagcucagaucgagcggggcgcggguggagaagcugcg240
gcggcgcggcccguaggaaggugcuguccgaacgaucgggauaggagcggucccugcgcu300
ugcugcugggaagugguacaaucauguuugaaauuaagaagaucuguugcaucggugcag360
gcuauguuggaggacccacauguagugucauugcucauauguguccugaaaucaggguaa420
cgguuguugaugucaaugaaucaagaaucaaugcguggaauucuccuacacuuccuauuu480
augagccaggacuaaaagaagugguagaauccugucgaggaaaaaaucuuuuuuuuucua540
ccaauauugaugaugccaucaaagaagcugaucuuguauuuauuucugugcuguccaacc600
cugaguuucuggcagagggaacagccaucaaggaccuaaagaacccagacagaguacuga660
uuggaggggaugaaacuccagagggccagagagcugugcaggcccugugugcuguauaug720
agcacuggguucccagagaaaagauccucaccacuaauacuuggucuucagagcuuucca780
aacuggcagcaaaugcuuuucuugcccagagaauaagcagcauuaacuccauaagugcuc840
ugugugaagcaacaggagcugauguagaagagguagcaacagcgauuggaauggaccaga900
gaauuggaaacaaguuucuaaaagccaguguuggguuuggugggagcuguuuccaaaagg960
auguucugaauuugguuuaucucugugaggcucugaauuugccagaaguagcucguuauu1020
ggcagcaggucauagacaugaaugacuaccagaggaggagguuugcuucccggaucauag1080
auagucuguuuaauacaguaacugauaagaagauagcuauuuugggauuugcauucaaaa1140
aggacacuggugauacaagagaaucuucuaguauauauauuagcaaauauuugauggaug1200
aaggugcacaucuacauauauaugauccaaaaguaccuagggaacaaauaguuguggauc1260
uuucucauccagguguuucagaggaugaccaagugucccggcucgugaccauuuccaagg1320
auccauaugaagcaugugauggugcccaugcuguuguuauuugcacugagugggacaugu1380
uuaaggaauuggauuaugaacgcauucauaaaaaaaugcuaaagccagccuuuaucuucg1440
auggacggcguguccuggaugggcuccacaaugaacuacaaaccauuggcuuccagauug1500
aaacaauuggcaaaaaggugucuucaaagagaauuccauaugcuccuucuggugaaauuc1560
cgaaguuuagucuucaagauccaccuaacaagaaaccuaaaguguagagauugccauuuu1620
uauuugugauuuuuuuuuuuuuuuuuugguacuucaggauagcaaauaucuaucugcuau1680
uaaaugguaaaugaaccaaguguuuuuuuuuguuuuuuuuuugagacagagucucacugu1740
ugcccaggcuggagugcaguggugcaaucucggcucacugcaagcucugcuucccagguu1800
cacgccauucuccuggcucagccucccaaguagcugggacuacaggcacccgccacagug1860
ccuggcuaauuuuuuguauuuuuaguagagacaggguuucaccaugugagccaggauggu1920
cucaaucuccugaccuugugaaccacccgucucggccucccaaagugcugggauuacagg1980
ugugagccaccacgccuggcccaugaaccaaguguuuuuaaggaaacaaaacuauuuuuu2040
uaaucaucagauuuauacuagcuauauggauauuagcauaucugguaauuaugaaucuag2100
aauuuuuuuacauauuuuuauaauacuguuagcucaguuauuggaugagugaaagauaau2160
cauguugguuuuaauagugucaauuuuuguaaaauaaaaauuaaacuucaaacucuuuac2220
uuuauaaauuguccauaggccacacuuuaauaucacauuauaaagggaaggacagucuuc2280
auuccuccugguuauugguuuguuugucauuaaagauauauuuugaauccaugaaauugc2340
uaugcuaaacagccuuuacauguauggucugguuaaaguuccuuuguuccuuuuguuuua2400
auaaaaugugucacugauuuuuuagcucaaaaucaucacuguuaauuuccagucacccca2460
aauaugguuaaaagauuuuuuuuuuaaucaugaagagaaaauuaguagcauuucuuucuc2520
uccccauuauuuauugguuuuccucacuaaucuuuuuuuuuuuaguccaaaagccaaaaa2580
uauuuaucuugguuuuacauuuuaauuuccauucuuaauuguaauuuuuuucuuuaaaua2640
aggaaaccaauauaaucucauguauaaaaacuuaaauauuuuacaaguuacauauagcau2700
cauucuaaaauaagaauuuuuuuuguuuucugucugcuuuuuucuuaugucucuuguuga2760
guuuuauauuuucagugguuauuuuugcuuguguuagaucauuauuaaaauauauccaau2820
gucccuuugauacuugugcucugcugagaauguacaguuugcauuaaacaucccaggucu2880
cauccuucaggaauuuugcaguucaaugagaagagggagacaaauauaaagaugaggaca2940
gaagcaucucuacagaugaaaauuacauaaauaaaacauucuccaucaacaacuaaaaaa3000
aaaaaaaaaaaaa3013
<210>29
<211>19
<212>rna
<213>智人
<400>29
uggaguaagucgagaagua19
<210>30
<211>19
<212>rna
<213>智人
<400>30
acaacuagaugaagagaca19
<210>31
<211>19
<212>rna
<213>智人
<400>31
ugacagaaguugacaauua19
<210>32
<211>19
<212>rna
<213>智人
<400>32
guaagaagccagauguuaa19
<210>33
<211>1545
<212>prt
<213>智人
<400>33
metleuglulysphecysasnserthrphetrpasnserserpheleu
151015
aspserproglualaaspleuproleucysphegluglnthrvalleu
202530
valtrpileproleuglytyrleutrpleuleualaprotrpglnleu
354045
leuhisvaltyrlysserargthrlysargserserthrthrlysleu
505560
tyrleualalysglnvalphevalglypheleuleuileleualaala
65707580
ilegluleualaleuvalleuthrgluaspserglyglnalathrval
859095
proalavalargtyrthrasnproserleutyrleuglythrtrpleu
100105110
leuvalleuleuileglntyrserargglntrpcysvalglnlysasn
115120125
sertrppheleuserleuphetrpileleuserileleucysglythr
130135140
pheglnpheglnthrleuileargthrleuleuglnglyaspasnser
145150155160
asnleualatyrsercysleuphepheilesertyrglypheglnile
165170175
leuileleuilepheseralaphesergluasnasngluserserasn
180185190
asnproserserilealaserpheleuserserilethrtyrsertrp
195200205
tyraspserileileleulysglytyrlysargproleuthrleuglu
210215220
aspvaltrpgluvalaspgluglumetlysthrlysthrleuvalser
225230235240
lysphegluthrhismetlysarggluleuglnlysalaargargala
245250255
leuglnargargglnglulysserserglnglnasnserglyalaarg
260265270
leuproglyleuasnlysasnglnserglnserglnaspalaleuval
275280285
leugluaspvalglulyslyslyslyslysserglythrlyslysasp
290295300
valprolyssertrpleumetlysalaleuphelysthrphetyrmet
305310315320
valleuleulysserpheleuleulysleuvalasnaspilephethr
325330335
phevalserproglnleuleulysleuleuileserphealaserasp
340345350
argaspthrtyrleutrpileglytyrleucysalaileleuleuphe
355360365
thralaalaleuileglnserphecysleuglncystyrpheglnleu
370375380
cysphelysleuglyvallysvalargthralailemetalaserval
385390395400
tyrlyslysalaleuthrleuserasnleualaarglysglutyrthr
405410415
valglygluthrvalasnleumetservalaspalaglnlysleumet
420425430
aspvalthrasnphemethismetleutrpserservalleuglnile
435440445
valleuserilephepheleutrparggluleuglyproservalleu
450455460
alaglyvalglyvalmetvalleuvalileproileasnalaileleu
465470475480
serthrlysserlysthrileglnvallysasnmetlysasnlysasp
485490495
lysargleulysilemetasngluileleuserglyilelysileleu
500505510
lystyrphealatrpgluproserpheargaspglnvalglnasnleu
515520525
arglyslysgluleulysasnleuleualapheserglnleuglncys
530535540
valvalilephevalpheglnleuthrprovalleuvalservalval
545550555560
thrpheservaltyrvalleuvalaspserasnasnileleuaspala
565570575
glnlysalaphethrserilethrleupheasnileleuargphepro
580585590
leusermetleuprometmetilesersermetleuglnalaserval
595600605
serthrgluargleuglulystyrleuglyglyaspaspleuaspthr
610615620
seralailearghisaspcysasnpheasplysalametglnpheser
625630635640
glualaserphethrtrpgluhisaspserglualathrvalargasp
645650655
valasnleuaspilemetalaglyglnleuvalalavalileglypro
660665670
valglyserglylysserserleuileseralametleuglyglumet
675680685
gluasnvalhisglyhisilethrilelysglythrthralatyrval
690695700
proglnglnsertrpileglnasnglythrilelysaspasnileleu
705710715720
pheglythrglupheasnglulysargtyrglnglnvalleugluala
725730735
cysalaleuleuproaspleuglumetleuproglyglyaspleuala
740745750
gluileglyglulysglyileasnleuserglyglyglnlysglnarg
755760765
ileserleualaargalathrtyrglnasnleuaspiletyrleuleu
770775780
aspaspproleuseralavalaspalahisvalglylyshisilephe
785790795800
asnlysvalleuglyproasnglyleuleulysglylysthrargleu
805810815
leuvalthrhissermethispheleuproglnvalaspgluileval
820825830
valleuglyasnglythrilevalglulysglysertyrseralaleu
835840845
leualalyslysglygluphealalysasnleulysthrpheleuarg
850855860
histhrglyproglugluglualathrvalhisaspglysergluglu
865870875880
gluaspaspasptyrglyleuileserservalglugluileproglu
885890895
aspalaalaserilethrmetargarggluasnserpheargargthr
900905910
leuserargserserargserasnglyarghisleulysserleuarg
915920925
asnserleulysthrargasnvalasnserleulysgluaspgluglu
930935940
leuvallysglyglnlysleuilelyslysglupheilegluthrgly
945950955960
lysvallyspheseriletyrleuglutyrleuglnalaileglyleu
965970975
pheserilephepheileileleualaphevalmetasnservalala
980985990
pheileglyserasnleutrpleuseralatrpthrseraspserlys
99510001005
ilepheasnserthrasptyrproalaserglnargaspmetarg
101010151020
valglyvaltyrglyalaleuglyleualaglnglyilepheval
102510301035
pheilealahisphetrpseralapheglyphevalhisalaser
104010451050
asnileleuhislysglnleuleuasnasnileleuargalapro
105510601065
metargphepheaspthrthrprothrglyargilevalasnarg
107010751080
phealaglyaspileserthrvalaspaspthrleuproglnser
108510901095
leuargsertrpilethrcyspheleuglyileileserthrleu
110011051110
valmetilecysmetalathrprovalphethrileilevalile
111511201125
proleuglyileiletyrvalservalglnmetphetyrvalser
113011351140
thrserargglnleuargargleuaspservalthrargserpro
114511501155
iletyrserhisphesergluthrvalserglyleuprovalile
116011651170
argalaphegluhisglnglnargpheleulyshisasngluval
117511801185
argileaspthrasnglnlyscysvalphesertrpilethrser
119011951200
asnargtrpleualaileargleugluleuvalglyasnleuthr
120512101215
valphepheseralaleumetmetvaliletyrargaspthrleu
122012251230
serglyaspthrvalglyphevalleuserasnalaleuasnile
123512401245
thrglnthrleuasntrpleuvalargmetthrsergluileglu
125012551260
thrasnilevalalavalgluargilethrglutyrthrlysval
126512701275
gluasnglualaprotrpvalthrasplysargproproproasp
128012851290
trpproserlysglylysileglnpheasnasntyrglnvalarg
129513001305
tyrargprogluleuaspleuvalleuargglyilethrcysasp
131013151320
ileglysermetglulysileglyvalvalglyargthrglyala
132513301335
glylysserserleuthrasncysleupheargileleugluala
134013451350
alaglyglyglnileileileaspglyvalaspilealaserile
135513601365
glyleuhisaspleuargglulysleuthrileileproglnasp
137013751380
proileleupheserglyserleuargmetasnleuaspprophe
138513901395
asnasntyrseraspglugluiletrplysalaleugluleuala
140014051410
hisleulysserphevalalaserleuglnleuglyleuserhis
141514201425
gluvalthrglualaglyglyasnleuserileglyglnarggln
143014351440
leuleucysleuglyargalaleuleuarglysserlysileleu
144514501455
valleuaspglualathralaalavalaspleugluthraspasn
146014651470
leuileglnthrthrileglnasngluphealahiscysthrval
147514801485
ilethrilealahisargleuhisthrilemetaspserasplys
149014951500
valmetvalleuaspasnglylysileileglucysglyserpro
150515101515
glugluleuleuglnileproglyprophetyrphemetalalys
152015251530
glualaglyilegluasnvalasnserthrlysphe
153515401545
<210>34
<211>316
<212>prt
<213>智人
<400>34
metalathrphevalgluleuserthrlysalalysmetproileval
151015
glyleuglythrtrplysserproleuglylysvallysglualaval
202530
lysvalalaileaspalaglytyrarghisileaspcysalatyrval
354045
tyrglnasngluhisgluvalglyglualaileglnglulysilegln
505560
glulysalavallysarggluaspleupheilevalserlysleutrp
65707580
prothrphephegluargproleuvalarglysalapheglulysthr
859095
leulysaspleulysleusertyrleuaspvaltyrleuilehistrp
100105110
proglnglyphelysserglyaspaspleupheprolysaspasplys
115120125
glyasnalaileglyglylysalathrpheleuaspalatrpgluala
130135140
metglugluleuvalaspgluglyleuvallysalaleuglyvalser
145150155160
asnpheserhispheglnileglulysleuleuasnlysproglyleu
165170175
lystyrlysprovalthrasnglnvalglucyshisprotyrleuthr
180185190
glnglulysleuileglntyrcyshisserlysglyilethrvalthr
195200205
alatyrserproleuglyserproaspargprotrpalalysproglu
210215220
aspproserleuleugluaspprolysilelysgluilealaalalys
225230235240
hislyslysthralaalaglnvalleuileargphehisileglnarg
245250255
asnvalilevalileprolysservalthrproalaargilevalglu
260265270
asnileglnvalpheaspphelysleuseraspgluglumetalathr
275280285
ileleuserpheasnargasntrpargalacysasnvalleuglnser
290295300
serhisleugluasptyrpropheasnalaglutyr
305310315
<210>35
<211>316
<212>prt
<213>智人
<400>35
metalathrphevalgluleuserthrlysalalysmetproileval
151015
glyleuglythrtrpargserleuleuglylysvallysglualaval
202530
lysvalalaileaspalaglutyrarghisileaspcysalatyrphe
354045
tyrgluasnglnhisgluvalglyglualaileglnglulysilegln
505560
glulysalavalmetarggluaspleupheilevalserlysvaltrp
65707580
prothrphephegluargproleuvalarglysalapheglulysthr
859095
leulysaspleulysleusertyrleuaspvaltyrleuilehistrp
100105110
proglnglyphelysthrglyaspaspphepheprolysaspasplys
115120125
glyasnmetileserglylysglythrpheleuaspalatrpgluala
130135140
metglugluleuvalaspgluglyleuvallysalaleuglyvalser
145150155160
asnpheasnhispheglnilegluargleuleuasnlysproglyleu
165170175
lystyrlysprovalthrasnglnvalglucyshisprotyrleuthr
180185190
glnglulysleuileglntyrcyshisserlysglyilethrvalthr
195200205
alatyrserproleuglyserproaspargprotrpalalysproglu
210215220
aspproserleuleugluaspprolysilelysgluilealaalalys
225230235240
hislyslysthrthralaglnvalleuileargphehisileglnarg
245250255
asnvalthrvalileprolyssermetthrproalahisilevalglu
260265270
asnileglnvalpheaspphelysleuseraspgluglumetalathr
275280285
ileleuserpheasnargasntrpargalapheaspphelysgluphe
290295300
serhisleugluaspphepropheaspalaglutyr
305310315
<210>36
<211>323
<212>prt
<213>智人
<400>36
metaspserlystyrglncysvallysleuasnaspglyhisphemet
151015
provalleuglypheglythrtyralaproalagluvalprolysser
202530
lysalaleuglualavallysleualaileglualaglyphehishis
354045
ileaspseralahisvaltyrasnasnglugluglnvalglyleuala
505560
ileargserlysilealaaspglyservallysarggluaspilephe
65707580
tyrthrserlysleutrpserasnserhisargprogluleuvalarg
859095
proalaleugluargserleulysasnleuglnleuasptyrvalasp
100105110
leutyrleuilehispheprovalservallysproglyglugluval
115120125
ileprolysaspgluasnglylysileleupheaspthrvalaspleu
130135140
cysalathrtrpglualametglulyscyslysaspalaglyleuala
145150155160
lysserileglyvalserasnpheasnhisargleuleuglumetile
165170175
leuasnlysproglyleulystyrlysprovalcysasnglnvalglu
180185190
cyshisprotyrpheasnglnarglysleuleuaspphecyslysser
195200205
lysaspilevalleuvalalatyrseralaleuglyserhisargglu
210215220
gluprotrpvalaspproasnserprovalleuleugluaspproval
225230235240
leucysalaleualalyslyshislysargthrproalaleuileala
245250255
leuargtyrglnleuglnargglyvalvalvalleualalyssertyr
260265270
asngluglnargileargglnasnvalglnvalpheglupheglnleu
275280285
thrsergluglumetlysalaileaspglyleuasnargasnvalarg
290295300
tyrleuthrleuaspilephealaglyproproasntyrpropheser
305310315320
aspglutyr
<210>37
<211>323
<212>prt
<213>智人
<400>37
metaspserlyshisglncysvallysleuasnaspglyhisphemet
151015
provalleuglypheglythrtyralaproprogluvalproargser
202530
lysalaleugluvalthrlysleualaileglualaglyphearghis
354045
ileaspseralahisleutyrasnasnglugluglnvalglyleuala
505560
ileargserlysilealaaspglyservallysarggluaspilephe
65707580
tyrthrserlysleutrpserthrphehisargprogluleuvalarg
859095
proalaleugluasnserleulyslysalaglnleuasptyrvalasp
100105110
leutyrleuilehisserprometserleulysproglyglugluleu
115120125
serprothraspgluasnglylysvalilepheaspilevalaspleu
130135140
cysthrthrtrpglualametglulyscyslysaspalaglyleuala
145150155160
lysserileglyvalserasnpheasnargargglnleuglumetile
165170175
leuasnlysproglyleulystyrlysprovalcysasnglnvalglu
180185190
cyshisprotyrpheasnargserlysleuleuaspphecyslysser
195200205
lysaspilevalleuvalalatyrseralaleuglyserglnargasp
210215220
lysargtrpvalaspproasnserprovalleuleugluaspproval
225230235240
leucysalaleualalyslyshislysargthrproalaleuileala
245250255
leuargtyrglnleuglnargglyvalvalvalleualalyssertyr
260265270
asngluglnargileargglnasnvalglnvalpheglupheglnleu
275280285
thralagluaspmetlysalaileaspglyleuaspargasnleuhis
290295300
tyrpheasnseraspserphealaserhisproasntyrprotyrser
305310315320
aspglutyr
<210>38
<211>323
<212>prt
<213>智人
<400>38
metaspprolystyrglnargvalgluleuasnaspglyhisphemet
151015
provalleuglypheglythrtyralaproprogluvalproargasn
202530
argalavalgluvalthrlysleualaileglualaglyphearghis
354045
ileaspseralatyrleutyrasnasnglugluglnvalglyleuala
505560
ileargserlysilealaaspglyservallysarggluaspilephe
65707580
tyrthrserlysleutrpcysthrphepheglnproglnmetvalgln
859095
proalaleugluserserleulyslysleuglnleuasptyrvalasp
100105110
leutyrleuleuhispheprometalaleulysproglygluthrpro
115120125
leuprolysaspgluasnglylysvalilepheaspthrvalaspleu
130135140
seralathrtrpgluvalmetglulyscyslysaspalaglyleuala
145150155160
lysserileglyvalserasnpheasncysargglnleuglumetile
165170175
leuasnlysproglyleulystyrlysprovalcysasnglnvalglu
180185190
cyshisprotyrleuasnglnserlysleuleuaspphecyslysser
195200205
lysaspilevalleuvalalahisseralaleuglythrglnarghis
210215220
lysleutrpvalaspproasnserprovalleuleugluaspproval
225230235240
leucysalaleualalyslyshislysglnthrproalaleuileala
245250255
leuargtyrglnleuglnargglyvalvalvalleualalyssertyr
260265270
asngluglnargilearggluasnileglnvalpheglupheglnleu
275280285
thrsergluaspmetlysvalleuaspglyleuasnargasntyrarg
290295300
tyrvalvalmetasppheleumetasphisproasptyrpropheser
305310315320
aspglutyr
<210>39
<211>493
<212>prt
<213>智人
<400>39
metileserserlysproargleuvalvalprotyrglyleulysthr
151015
leuleugluglyileserargalavalleulysthrasnproserasn
202530
ileasnglnphealaalaalatyrpheglngluleuthrmettyrarg
354045
glyasnthrthrmetaspilelysaspleuvallysglnphehisgln
505560
ilelysvalglulystrpsergluglythrthrproglnlyslysleu
65707580
glucysleulysgluproglylysthrservalgluserlysvalpro
859095
thrglnmetglulysserthraspthraspgluaspasnvalthrarg
100105110
thrglutyrserasplysthrthrglnpheproservaltyralaval
115120125
proglythrgluglnthrglualavalglyglyleuserserlyspro
130135140
alathrprolysthrthrthrproproserserproproprothrala
145150155160
valserprogluphealatyrvalproalaaspproalaglnleuala
165170175
alaglnmetleuglylysvalserserilehisseraspglnserasp
180185190
valleumetvalaspvalalathrsermetprovalvalilelysglu
195200205
valproserserglualaalagluaspvalmetvalalaalaproleu
210215220
valcysserglylysvalleugluvalglnvalvalasnglnthrser
225230235240
valhisvalaspleuglyserglnprolysgluasnglualaglupro
245250255
serthralaserservalproleuglnaspgluglngluproproala
260265270
tyraspglnalaprogluvalthrleuglnalaaspilegluvalmet
275280285
serthrvalhisileserservaltyrasnaspvalprovalthrglu
290295300
glyvalvaltyrilegluglnleuprogluglnilevalileprophe
305310315320
thraspglnvalalacysleulysgluasngluglnserlysgluasn
325330335
gluglnserproargvalserprolysservalvalglulysthrthr
340345350
serglymetserlyslysservalgluservallysleualaglnleu
355360365
glugluasnalalystyrserservaltyrmetglualaglualathr
370375380
alaleuleuseraspthrserleulysglyglnprogluvalproala
385390395400
glnleuleuaspalagluglyalailelysileglyserglulysser
405410415
leuhisleugluvalgluilethrserilevalseraspasnthrgly
420425430
glnglugluserglygluasnservalproglnglumetgluglylys
435440445
provalleuserglyglualaalaglualavalhisserglythrser
450455460
vallysserserserglypropheproproalaprogluglyleuthr
465470475480
alaprogluilegluprogluglygluserthralaglu
485490
<210>40
<211>524
<212>prt
<213>智人
<400>40
metproglnleuserleusertrpleuglyleuglyprovalalaala
151015
serprotrpleuleuleuleuleuvalglyglysertrpleuleuala
202530
argvalleualatrpthrtyrthrphetyraspasncysargargleu
354045
glncyspheproglnproprolysglnasntrpphetrpglyhisgln
505560
glyleuvalthrprothrglugluglymetlysthrleuthrglnleu
65707580
valthrthrtyrproglnglyphelysleutrpleuglyprothrphe
859095
proleuleuileleucyshisproaspileileargproilethrser
100105110
alaseralaalavalalaprolysaspmetilephetyrglypheleu
115120125
lysprotrpleuglyaspglyleuleuleuserglyglyasplystrp
130135140
serarghisargargmetleuthrproalaphehispheasnileleu
145150155160
lysprotyrmetlysilepheasnlysservalasnilemethisasp
165170175
lystrpglnargleualasergluglyseralaargleuaspmetphe
180185190
gluhisileserleumetthrleuaspserleuglnlyscysvalphe
195200205
serphegluserasncysglnglulysproserglutyrilealaala
210215220
ileleugluleuseralaphevalglulysargasnglnglnileleu
225230235240
leuhisthrasppheleutyrtyrleuthrproaspglyglnargphe
245250255
argargalacyshisleuvalhisaspphethraspalavalilegln
260265270
gluargargcysthrleuprothrglnglyileaspasppheleulys
275280285
asnlysalalysserlysthrleuasppheileaspvalleuleuleu
290295300
serlysaspgluaspglylysgluleuseraspgluaspileargala
305310315320
glualaaspthrphemetphegluglyhisaspthrthralasergly
325330335
leusertrpvalleutyrhisleualalyshisproglutyrglnglu
340345350
glncysargglngluvalglngluleuleulysasparggluproile
355360365
gluileglutrpaspaspleualaglnleupropheleuthrmetcys
370375380
ilelysgluserleuargleuhisproprovalprovalileserarg
385390395400
cyscysthrglnaspphevalleuproaspglyargvalileprolys
405410415
glyilevalcysleuileasnileileglyilehistyrasnprothr
420425430
valtrpproaspprogluvaltyrasppropheargpheaspglnglu
435440445
asnilelysgluargserproleualapheilepropheseralagly
450455460
proargasncysileglyglnalaphealametalaglumetlysval
465470475480
valleualaleuthrleuleuhispheargileleuprothrhisthr
485490495
gluproargarglysprogluleuileleuargalagluglyglyleu
500505510
trpleuargvalgluproleuglyalaasnsergln
515520
<210>41
<211>423
<212>prt
<213>智人
<400>41
metargserleuglyalaasnmetalaalaalaleuargalaalagly
151015
valleuleuargaspproleualasersersertrpargvalcysgln
202530
protrpargtrplysserglyalaalaalaalaalavalthrthrglu
354045
thralaglnhisalaglnglyalalysproglnvalglnproglnlys
505560
arglysprolysthrglyileleumetleuasnmetglyglyproglu
65707580
thrleuglyaspvalhisasppheleuleuargleupheleuasparg
859095
aspleumetthrleuproileglnasnlysleualapropheileala
100105110
lysargargthrprolysileglngluglntyrargargileglygly
115120125
glyserproilelysiletrpthrserlysglnglygluglymetval
130135140
lysleuleuaspgluleuserproasnthralaprohislystyrtyr
145150155160
ileglypheargtyrvalhisproleuthrgluglualailegluglu
165170175
metgluargaspglyleugluargalailealaphethrglntyrpro
180185190
glntyrsercysserthrthrglyserserleuasnalailetyrarg
195200205
tyrtyrasnglnvalglyarglysprothrmetlystrpserthrile
210215220
aspargtrpprothrhishisleuleuileglncysphealaasphis
225230235240
ileleulysgluleuasphispheproleuglulysargsergluval
245250255
valileleupheseralahisserleuprometservalvalasnarg
260265270
glyaspprotyrproglngluvalseralathrvalglnlysvalmet
275280285
gluargleuglutyrcysasnprotyrargleuvaltrpglnserlys
290295300
valglyprometprotrpleuglyproglnthraspgluserilelys
305310315320
glyleucysgluargglyarglysasnileleuleuvalproileala
325330335
phethrserasphisilegluthrleutyrgluleuaspileglutyr
340345350
serglnvalleualalysglucysglyvalgluasnileargargala
355360365
gluserleuasnglyasnproleupheserlysalaleualaaspleu
370375380
valhisserhisileglnserasngluleucysserlysglnleuthr
385390395400
leusercysproleucysvalasnprovalcysarggluthrlysser
405410415
phephethrserglnglnleu
420
<210>42
<211>175
<212>prt
<213>智人
<400>42
metserserglnileargglnasntyrserthraspvalglualaala
151015
valasnserleuvalasnleutyrleuglnalasertyrthrtyrleu
202530
serleuglyphetyrpheaspargaspaspvalalaleugluglyval
354045
serhisphephearggluleualagluglulysarggluglytyrglu
505560
argleuleulysmetglnasnglnargglyglyargalaleuphegln
65707580
aspilelyslysproalagluaspglutrpglylysthrproaspala
859095
metlysalaalametalaleuglulyslysleuasnglnalaleuleu
100105110
aspleuhisalaleuglyseralaargthraspprohisleucysasp
115120125
pheleugluthrhispheleuaspglugluvallysleuilelyslys
130135140
metglyasphisleuthrasnleuhisargleuglyglyprogluala
145150155160
glyleuglyglutyrleuphegluargleuthrleulyshisasp
165170175
<210>43
<211>274
<212>prt
<213>智人
<400>43
metglythraspserargalaalalysalaleuleualaargalaarg
151015
thrleuhisleuglnthrglyasnleuleuasntrpglyargleuarg
202530
lyslyscysproserthrhisserglugluleuhisaspcysilegln
354045
lysthrleuasnglutrpserserglnileasnproaspleuvalarg
505560
glupheproaspvalleuglucysthrvalserhisalavalglulys
65707580
ileasnproaspgluarggluglumetlysvalseralalysleuphe
859095
ilevalgluserasnserserserserthrargseralavalaspmet
100105110
alacysservalleuglyvalalaglnleuaspservalileileala
115120125
serproproilegluaspglyvalasnleuserleugluhisleugln
130135140
protyrtrpglugluleugluasnleuvalglnserlyslysileval
145150155160
alaileglythrseraspleuasplysthrglnleugluglnleutyr
165170175
glntrpalaglnvallysproasnserasnglnvalasnleualaser
180185190
cyscysvalmetproproaspleuthralaphealalysglnpheasp
195200205
ileglnleuleuthrhisasnaspprolysgluleuleusergluala
210215220
serpheglnglualaleuglngluserileproaspileglnalahis
225230235240
glutrpvalproleutrpleuleuargtyrservalilevallysser
245250255
argglyileilelysserlysglytyrileleuglnalalysargarg
260265270
glyser
<210>44
<211>522
<212>prt
<213>智人
<400>44
metalaleuleuproargalaleuseralaglyalaglyprosertrp
151015
argargalaalaargalapheargglypheleuleuleuleuproglu
202530
proalaalaleuthrargalaleuserargalametalacysarggln
354045
gluproglnproglnglyproproproalaalaglyalavalalaser
505560
tyrasptyrleuvalileglyglyglyserglyglyleualaserala
65707580
argargalaalagluleuglyalaargalaalavalvalgluserhis
859095
lysleuglyglythrcysvalasnvalglycysvalprolyslysval
100105110
mettrpasnthralavalhissergluphemethisasphisalaasp
115120125
tyrglypheprosercysgluglylyspheasntrpargvalilelys
130135140
glulysargaspalatyrvalserargleuasnalailetyrglnasn
145150155160
asnleuthrlysserhisilegluileileargglyhisalaalaphe
165170175
thrseraspprolysprothrilegluvalserglylyslystyrthr
180185190
alaprohisileleuilealathrglyglymetproserthrprohis
195200205
gluserglnileproglyalaserleuglyilethrseraspglyphe
210215220
pheglnleuglugluleuproglyargservalilevalglyalagly
225230235240
tyrilealavalglumetalaglyileleuseralaleuglyserlys
245250255
thrserleumetilearghisasplysvalleuargserpheaspser
260265270
metileserthrasncysthrglugluleugluasnalaglyvalglu
275280285
valleulyspheserglnvallysgluvallyslysthrleusergly
290295300
leugluvalsermetvalthralavalproglyargleuprovalmet
305310315320
thrmetileproaspvalaspcysleuleutrpalaileglyargval
325330335
proasnthrlysaspleuserleuasnlysleuglyileglnthrasp
340345350
asplysglyhisileilevalaspglupheglnasnthrasnvallys
355360365
glyiletyralavalglyaspvalcysglylysalaleuleuthrpro
370375380
valalailealaalaglyarglysleualahisargleupheglutyr
385390395400
lysgluaspserlysleuasptyrasnasnileprothrvalvalphe
405410415
serhisproproileglythrvalglyleuthrgluaspglualaile
420425430
hislystyrglyilegluasnvallysthrtyrserthrserphethr
435440445
promettyrhisalavalthrlysarglysthrlyscysvalmetlys
450455460
metvalcysalaasnlysgluglulysvalvalglyilehismetgln
465470475480
glyleuglycysaspglumetleuglnglyphealavalalavallys
485490495
metglyalathrlysalaasppheaspasnthrvalalailehispro
500505510
thrserserglugluleuvalthrleuarg
515520
<210>45
<211>465
<212>prt
<213>智人
<400>45
metgluproserserleugluleuproalaaspthrvalglnargile
151015
alaalagluleulyscyshisprothraspgluargvalalaleuhis
202530
leuaspglugluasplysleuarghispheargglucysphetyrile
354045
prolysileglnaspleuproprovalaspleuserleuvalasnlys
505560
aspgluasnalailetyrpheleuglyasnserleuglyleuglnpro
65707580
lysmetvallysthrtyrleugluglugluleuasplystrpalalys
859095
ilealaalatyrglyhisgluvalglylysargprotrpilethrgly
100105110
aspgluserilevalglyleumetlysaspilevalglyalaasnglu
115120125
lysgluilealaleumetasnalaleuthrvalasnleuhisleuleu
130135140
metleuserphephelysprothrprolysargtyrlysileleuleu
145150155160
glualalysalapheproserasphistyralailegluserglnleu
165170175
glnleuhisglyleuasnilegluglusermetargmetilelyspro
180185190
arggluglyglugluthrleuargilegluaspileleugluvalile
195200205
glulysgluglyaspserilealavalileleupheserglyvalhis
210215220
phetyrthrglyglnhispheasnileproalailethrlysalagly
225230235240
glnalalysglycystyrvalglypheaspleualahisalavalgly
245250255
asnvalgluleutyrleuhisasptrpglyvalaspphealacystrp
260265270
cyssertyrlystyrleuasnalaglyalaglyglyilealaglyala
275280285
pheilehisglulyshisalahisthrilelysproalaleuvalgly
290295300
trppheglyhisgluleuserthrargphelysmetaspasnlysleu
305310315320
glnleuileproglyvalcysglypheargileserasnproproile
325330335
leuleuvalcysserleuhisalaserleugluilephelysglnala
340345350
thrmetlysalaleuarglyslysservalleuleuthrglytyrleu
355360365
glutyrleuilelyshisasntyrglylysasplysalaalathrlys
370375380
lysprovalvalasnileilethrproserhisvalglugluarggly
385390395400
cysglnleuthrilethrpheservalproasnlysaspvalphegln
405410415
gluleuglulysargglyvalvalcysasplysargasnproasngly
420425430
ileargvalalaprovalproleutyrasnserphehisaspvaltyr
435440445
lysphethrasnleuleuthrserileleuaspseralagluthrlys
450455460
asn
465
<210>46
<211>572
<212>prt
<213>智人
<400>46
metgluproglualaproargargarghisthrhisglnargglytyr
151015
leuleuthrargasnprohisleuasnlysaspleualaphethrleu
202530
glugluargglnglnleuasnilehisglyleuleuproproserphe
354045
asnserglngluileglnvalleuargvalvallysasnphegluhis
505560
leuasnserasppheaspargtyrleuleuleumetaspleuglnasp
65707580
argasnglulysleuphetyrargvalleuthrseraspileglulys
859095
phemetproilevaltyrthrprothrvalglyleualacysglngln
100105110
tyrserleuvalphearglysproargglyleupheilethrilehis
115120125
aspargglyhisilealaservalleuasnalatrpprogluaspval
130135140
ilelysalailevalvalthraspglygluargileleuglyleugly
145150155160
aspleuglycysasnglymetglyileprovalglylysleualaleu
165170175
tyrthralacysglyglymetasnproglnglucysleuprovalile
180185190
leuaspvalglythrgluasnglugluleuleulysaspproleutyr
195200205
ileglyleuargglnargargvalargglyserglutyraspaspphe
210215220
leuaspgluphemetglualavalserserlystyrglymetasncys
225230235240
leuileglnphegluaspphealaasnvalasnalapheargleuleu
245250255
asnlystyrargasnglntyrcysthrpheasnaspaspileglngly
260265270
thralaservalalavalalaglyleuleualaalaleuargilethr
275280285
lysasnlysleuseraspglnthrileleupheglnglyalaglyglu
290295300
alaalaleuglyilealahisleuilevalmetalaleuglulysglu
305310315320
glyleuprolysglulysalailelyslysiletrpleuvalaspser
325330335
lysglyleuilevallysglyargalaserleuthrglnglulysglu
340345350
lysphealahisgluhisgluglumetlysasnleuglualaileval
355360365
glngluilelysprothralaleuileglyvalalaalaileglygly
370375380
alaphesergluglnileleulysaspmetalaalapheasngluarg
385390395400
proileilephealaleuserasnprothrserlysalaglucysser
405410415
alagluglncystyrlysilethrlysglyargalailephealaser
420425430
glyserpropheaspprovalthrleuproasnglyglnthrleutyr
435440445
proglyglnglyasnasnsertyrvalpheproglyvalalaleugly
450455460
valvalalacysglyleuargglnilethraspasnilepheleuthr
465470475480
thralagluvalilealaglnglnvalserasplyshisleugluglu
485490495
glyargleutyrproproleuasnthrileargaspvalserleulys
500505510
ilealaglulysilevallysaspalatyrglnglulysthralathr
515520525
valtyrprogluproglnasnlysglualaphevalargserglnmet
530535540
tyrserthrasptyraspglnileleuproaspcystyrsertrppro
545550555560
glugluvalglnlysileglnthrlysvalaspgln
565570
<210>47
<211>605
<212>prt
<213>智人
<400>47
metmetaspleugluleuproproproglyleuproserglnglnasp
151015
metaspleuileaspileleutrpargglnaspileaspleuglyval
202530
serarggluvalpheasppheserglnargarglysglutyrgluleu
354045
glulysglnlyslysleuglulysgluargglngluglnleuglnlys
505560
gluglnglulysalaphephealaglnleuglnleuaspglugluthr
65707580
glyglupheleuproileglnproalaglnhisileglnsergluthr
859095
serglyseralaasntyrserglnvalalahisileprolysserasp
100105110
alaleutyrpheaspaspcysmetglnleuleualaglnthrphepro
115120125
phevalaspaspasngluvalserseralathrpheglnserleuval
130135140
proaspileproglyhisilegluserprovalpheilealathrasn
145150155160
glnalaglnserprogluthrservalalaglnvalalaprovalasp
165170175
leuaspglymetglnglnaspilegluglnvaltrpglugluleuleu
180185190
serileprogluleuglncysleuasnilegluasnasplysleuval
195200205
gluthrthrmetvalproserproglualalysleuthrgluvalasp
210215220
asntyrhisphetyrserserileprosermetglulysgluvalgly
225230235240
asncysserprohispheleuasnalaphegluaspserpheserser
245250255
ileleuserthrgluaspproasnglnleuthrvalasnserleuasn
260265270
seraspalathrvalasnthrasppheglyaspgluphetyrserala
275280285
pheilealagluproserileserasnsermetproserproalathr
290295300
leuserhisserleusergluleuleuasnglyproileaspvalser
305310315320
aspleuserleucyslysalapheasnglnasnhisprogluserthr
325330335
alaglupheasnaspseraspserglyileserleuasnthrserpro
340345350
servalalaserprogluhisservalglusersersertyrglyasp
355360365
thrleuleuglyleuseraspsergluvalglugluleuaspserala
370375380
proglyservallysglnasnglyprolysthrprovalhisserser
385390395400
glyaspmetvalglnproleuserproserglnglyglnserthrhis
405410415
valhisaspalaglncysgluasnthrproglulysgluleuproval
420425430
serproglyhisarglysthrprophethrlysasplyshisserser
435440445
argleuglualahisleuthrargaspgluleuargalalysalaleu
450455460
hisilepropheprovalglulysileileasnleuprovalvalasp
465470475480
pheasnglumetmetserlysgluglnpheasnglualaglnleuala
485490495
leuileargaspileargargargglylysasnlysvalalaalagln
500505510
asncysarglysarglysleugluasnilevalgluleugluglnasp
515520525
leuasphisleulysaspglulysglulysleuleulysglulysgly
530535540
gluasnasplysserleuhisleuleulyslysglnleuserthrleu
545550555560
tyrleugluvalphesermetleuargaspgluaspglylysprotyr
565570575
serproserglutyrserleuglnglnthrargaspglyasnvalphe
580585590
leuvalprolysserlyslysproaspvallyslysasn
595600605
<210>48
<211>274
<212>prt
<213>智人
<400>48
metvalglyargargalaleuilevalleualahissergluargthr
151015
serpheasntyralametlysglualaalaalaalaalaleulyslys
202530
lysglytrpgluvalvalgluseraspleutyralametasnpheasn
354045
proileileserarglysaspilethrglylysleulysaspproala
505560
asnpheglntyrproalagluservalleualatyrlysgluglyhis
65707580
leuserproaspilevalalagluglnlyslysleuglualaalaasp
859095
leuvalilepheglnpheproleuglntrppheglyvalproalaile
100105110
leulysglytrpphegluargvalpheileglygluphealatyrthr
115120125
tyralaalamettyrasplysglypropheargserlyslysalaval
130135140
leuserilethrthrglyglyserglysermettyrserleuglngly
145150155160
ilehisglyaspmetasnvalileleutrpproileglnserglyile
165170175
leuhisphecysglypheglnvalleugluproglnleuthrtyrser
180185190
ileglyhisthrproalaaspalaargileglnileleugluglytrp
195200205
lyslysargleugluasniletrpaspgluthrproleutyrpheala
210215220
proserserleupheaspleuasnpheglnalaglypheleumetlys
225230235240
lysgluvalglnaspgluglulysasnlyslyspheglyleuserval
245250255
glyhishisleuglylysserileprothraspasnglnilelysala
260265270
arglys
<210>49
<211>470
<212>prt
<213>智人
<400>49
metalaglygluasnhisglntrpglnglyserileleutyrasnmet
151015
leumetseralalysglnthrargalaalaproglualaprogluthr
202530
argleuvalaspglncystrpglycyssercysglyaspgluprogly
354045
valglyarggluglyleuleuglyglyargasnvalalaleuleutyr
505560
argcyscysphecysglylysasphisproargglnglyserileleu
65707580
tyrsermetleuthrseralalysglnthrtyralaalaprolysala
859095
proglualathrleuglyprocystrpglycyssercysglyserasp
100105110
proglyvalglyargalaglyleuproglyglyargprovalalaleu
115120125
leutyrargcyscysphecysglygluasphisproargglnglyser
130135140
ileleutyrserleuleuthrserserlysglnthrhisvalalapro
145150155160
alaalaproglualaargproglyglyalatrptrpaspargsertyr
165170175
phealaglnargproglyglylysglualaleuproglyglyargala
180185190
thralaleuleutyrargcyscysphecysglygluasphisprogln
195200205
glnglyserthrleutyrcysvalprothrserthrasnglnalagln
210215220
alaalaproglugluargproargalaprotrptrpaspthrserser
225230235240
glyalaleuargprovalalaleulysserproglnvalvalcysglu
245250255
alaalaseralaglyleuleulysthrleuargphevallystyrleu
260265270
procyspheglnvalleuproleuaspglnglnleuvalleuvalarg
275280285
asncystrpalaserleuleumetleugluleualaglnaspargleu
290295300
glnphegluthrvalgluvalsergluprosermetleuglnlysile
305310315320
leuthrthrargargarggluthrglyglyasngluproleuproval
325330335
prothrleuglnhishisleualaproproalaglualaarglysval
340345350
proseralaserglnvalglnalailelyscyspheleuserlyscys
355360365
trpserleuasnileserthrlysglutyralatyrleulysglythr
370375380
valleupheasnproaspvalproglyleuglncysvallystyrile
385390395400
glnglyleuglntrpglythrglnglnileleusergluhisthrarg
405410415
metthrhisglnglyprohisaspargpheilegluleuasnserthr
420425430
leupheleuleuargpheileasnalaasnvalilealagluleuphe
435440445
pheargproileileglythrvalsermetaspaspmetmetleuglu
450455460
metleucysthrlysile
465470
<210>50
<211>560
<212>prt
<213>智人
<400>50
metglylystrpargproargglycyscysargglyasnmetglncys
151015
argglngluvalproalathrleuthrsersergluleupheserthr
202530
argasnglnproglnproglnproglnproleuleualaaspalapro
354045
valprotrpalavalalaserargmetcysleuthrproglyglngly
505560
cysglyhisglnglyglnaspgluglyproleuproalaproserpro
65707580
proproalametserserserarglysasphisleuglyalaserser
859095
sergluproleuprovalileilevalglyasnglyproserglyile
100105110
cysleusertyrleuleuserglytyrthrprotyrthrlysproasp
115120125
alailehisprohisproleuleuglnarglysleuthrglualapro
130135140
glyvalserileleuaspglnaspleuasptyrleusergluglyleu
145150155160
gluglyargserglnserprovalalaleuleupheaspalaleuleu
165170175
argproaspthrasppheglyglyasnmetlysservalleuthrtrp
180185190
lyshisarglysgluhisalaileprohisvalvalleuglyargasn
195200205
leuproglyglyalatrphisserilegluglysermetvalileleu
210215220
serglnglyglntrpmetglyleuproaspleugluvallysasptrp
225230235240
metglnlyslysargargglyleuargasnserargalathralagly
245250255
aspilealahistyrtyrargasptyrvalvallyslysglyleugly
260265270
hisasnphevalserglyalavalvalthralavalglutrpglythr
275280285
proaspprosersercysglyalaglnaspserserproleuphegln
290295300
valserglypheleuthrargasnglnalaglnglnpropheserleu
305310315320
trpalaargasnvalvalleualathrglythrpheaspserproala
325330335
argleuglyileproglyglualaleupropheilehishisgluleu
340345350
seralaleuglualaalathrargvalglyalavalthrproalaser
355360365
aspprovalleuileileglyalaglyleuseralaalaaspalaval
370375380
leutyralaarghistyrasnileprovalilehisalapheargarg
385390395400
alavalaspaspproglyleuvalpheasnglnleuprolysmetleu
405410415
tyrproglutyrhislysvalhisglnmetmetarggluglnserile
420425430
leuserproserprotyrgluglytyrargserleuproarghisgln
435440445
leuleucysphelysgluaspcysglnalavalpheglnaspleuglu
450455460
glyvalglulysvalpheglyvalserleuvalleuvalleuilegly
465470475480
serhisproaspleuserpheleuproglyalaglyalaasppheala
485490495
valaspproaspglnproleuseralalysargasnproileaspval
500505510
aspprophethrtyrglnserthrargglngluglyleutyralamet
515520525
glyproleualaglyaspasnphevalargphevalglnglyglyala
530535540
leualavalalaserserleuleuarglysgluthrarglyspropro
545550555560
<210>51
<211>483
<212>prt
<213>智人
<400>51
metalaglnalaaspilealaleuileglyleualavalmetglygln
151015
asnleuileleuasnmetasnasphisglyphevalvalcysalaphe
202530
asnargthrvalserlysvalaspasppheleualaasnglualalys
354045
glythrlysvalvalglyalaglnserleulysglumetvalserlys
505560
leulyslysproargargileileleuleuvallysalaglyglnala
65707580
valaspasppheileglulysleuvalproleuleuaspthrglyasp
859095
ileileileaspglyglyasnserglutyrargaspthrthrargarg
100105110
cysargaspleulysalalysglyileleuphevalglyserglyval
115120125
serglyglyglugluglyalaargtyrglyproserleumetprogly
130135140
glyasnlysglualatrpprohisilelysthrilepheglnglyile
145150155160
alaalalysvalglythrglygluprocyscysasptrpvalglyasp
165170175
gluglyalaglyhisphevallysmetvalhisasnglyileglutyr
180185190
glyaspmetglnleuilecysglualatyrhisleumetlysaspval
195200205
leuglymetalaglnaspglumetalaglnalaphegluasptrpasn
210215220
lysthrgluleuaspserpheleuilegluilethralaasnileleu
225230235240
lyspheglnaspthraspglylyshisleuleuprolysileargasp
245250255
seralaglyglnlysglythrglylystrpthralaileseralaleu
260265270
glutyrglyvalprovalthrleuileglyglualavalphealaarg
275280285
cysleuserserleulysaspgluargileglnalaserlyslysleu
290295300
lysglyproglnlyspheglnpheaspglyasplyslysserpheleu
305310315320
gluaspilearglysalaleutyralaserlysileilesertyrala
325330335
glnglyphemetleuleuargglnalaalathrglupheglytrpthr
340345350
leuasntyrglyglyilealaleumettrpargglyglycysileile
355360365
argservalpheleuglylysilelysaspalapheaspargasnpro
370375380
gluleuglnasnleuleuleuaspaspphephelysseralavalglu
385390395400
asncysglnaspsertrpargargalavalserthrglyvalglnala
405410415
glyileprometprocysphethrthralaleuserphetyraspgly
420425430
tyrarghisglumetleuproalaserleuileglnalaglnargasp
435440445
tyrpheglyalahisthrtyrgluleuleualalysproglyglnphe
450455460
ilehisthrasntrpthrglyhisglyglythrvalserserserser
465470475480
tyrasnala
<210>52
<211>272
<212>prt
<213>智人
<400>52
methisleuargleuilesertrpleupheileileleuasnphemet
151015
glutyrileglyserglnasnalaserargglyargargglnargarg
202530
methisproasnvalserglnglycysglnglyglycysalathrcys
354045
serasptyrasnglycysleusercyslysproargleuphepheala
505560
leugluargileglymetlysglnileglyvalcysleusersercys
65707580
proserglytyrtyrglythrargtyrproaspileasnlyscysthr
859095
lyscyslysalaaspcysaspthrcyspheasnlysasnphecysthr
100105110
lyscyslysserglyphetyrleuhisleuglylyscysleuaspasn
115120125
cysprogluglyleuglualaasnasnhisthrmetglucysvalser
130135140
ilevalhiscysgluvalserglutrpasnprotrpserprocysthr
145150155160
lyslysglylysthrcysglyphelysargglythrgluthrargval
165170175
arggluileileglnhisproseralalysglyasnleucyspropro
180185190
thrasngluthrarglyscysthrvalglnarglyslyscysglnlys
195200205
glygluargglylyslysglyarggluarglysarglyslysproasn
210215220
lysglygluserlysglualaileproaspserlysserleugluser
225230235240
serlysgluileprogluglnarggluasnlysglnglnglnlyslys
245250255
arglysvalglnasplysglnlysservalservalserthrvalhis
260265270
<210>53
<211>501
<212>prt
<213>智人
<400>53
metvalarglysprovalvalserthrileserlysglyglytyrleu
151015
glnglyasnvalasnglyargleuproserleuglyasnlysglupro
202530
proglyglnglulysvalglnleulysarglysvalthrleuleuarg
354045
glyvalserileileileglythrileileglyalaglyilepheile
505560
serprolysglyvalleuglnasnthrglyservalglymetserleu
65707580
thriletrpthrvalcysglyvalleuserleupheglyalaleuser
859095
tyralagluleuglythrthrilelyslysserglyglyhistyrthr
100105110
tyrileleugluvalpheglyproleuproalaphevalargvaltrp
115120125
valgluleuleuileileargproalaalathralavalileserleu
130135140
alapheglyargtyrileleugluprophepheileglncysgluile
145150155160
progluleualailelysleuilethralavalglyilethrvalval
165170175
metvalleuasnsermetservalsertrpseralaargileglnile
180185190
pheleuthrphecyslysleuthralaileleuileileilevalpro
195200205
glyvalmetglnleuilelysglyglnthrglnasnphelysaspala
210215220
pheserglyargaspserserilethrargleuproleualaphetyr
225230235240
tyrglymettyralatyralaglytrpphetyrleuasnphevalthr
245250255
glugluvalgluasnproglulysthrileproleualailecysile
260265270
sermetalailevalthrileglytyrvalleuthrasnvalalatyr
275280285
phethrthrileasnalaglugluleuleuleuserasnalavalala
290295300
valthrphesergluargleuleuglyasnpheserleualavalpro
305310315320
ilephevalalaleusercyspheglysermetasnglyglyvalphe
325330335
alavalserargleuphetyrvalalaserarggluglyhisleupro
340345350
gluileleusermetilehisvalarglyshisthrproleuproala
355360365
valilevalleuhisproleuthrmetilemetleupheserglyasp
370375380
leuaspserleuleuasnpheleuserphealaargtrpleupheile
385390395400
glyleualavalalaglyleuiletyrleuargtyrlyscysproasp
405410415
methisargprophelysvalproleupheileproalaleupheser
420425430
phethrcysleuphemetvalalaleuserleutyrseraspprophe
435440445
serthrglyileglyphevalilethrleuthrglyvalproalatyr
450455460
tyrleupheileiletrpasplyslysproargtrppheargilemet
465470475480
serglulysilethrargthrleuglnileileleugluvalvalpro
485490495
glugluasplysleu
500
<210>54
<211>137
<212>prt
<213>智人
<400>54
metglyleuargalaglyglythrleuglyargalaglyalaglyarg
151015
glyalaprogluglyproglyproserglyglyalaglnglyglyser
202530
ilehisserglyargilealaalavalhisasnvalproleuserval
354045
leuileargproleuproservalleuaspproalalysvalglnser
505560
leuvalaspthrilearggluaspproaspservalproproileasp
65707580
valleutrpilelysglyalaglnglyglyasptyrphetyrserphe
859095
glyglycyshisargtyralaalatyrglnglnleuglnarggluthr
100105110
ileproalalysleuvalglnserthrleuseraspleuargvaltyr
115120125
leuglyalaserthrproaspleugln
130135
<210>55
<211>337
<212>prt
<213>智人
<400>55
metserserserprovallysargglnargmetgluseralaleuasp
151015
glnleulysglnphethrthrvalvalalaaspthrglyaspphehis
202530
alaileaspglutyrlysproglnaspalathrthrasnproserleu
354045
ileleualaalaalaglnmetproalatyrglngluleuvalgluglu
505560
alailealatyrglyarglysleuglyglyserglngluaspglnile
65707580
lysasnalaileasplysleuphevalleupheglyalagluileleu
859095
lyslysileproglyargvalserthrgluvalaspalaargleuser
100105110
pheasplysaspalametvalalaargalaargargleuilegluleu
115120125
tyrlysglualaglyileserlysaspargileleuilelysleuser
130135140
serthrtrpgluglyileglnalaglylysgluleuglugluglnhis
145150155160
glyilehiscysasnmetthrleuleupheserphealaglnalaval
165170175
alacysalaglualaglyvalthrleuileserprophevalglyarg
180185190
ileleuasptrphisvalalaasnthrasplyslyssertyrglupro
195200205
leugluaspproglyvallysservalthrlysiletyrasntyrtyr
210215220
lyslysphesertyrlysthrilevalmetglyalaserpheargasn
225230235240
thrglygluilelysalaleualaglycysasppheleuthrileser
245250255
prolysleuleuglygluleuleuglnaspasnalalysleuvalpro
260265270
valleuseralalysalaalaglnalaseraspleuglulysilehis
275280285
leuaspglulysserpheargtrpleuhisasngluaspglnmetala
290295300
valglulysleuseraspglyilearglysphealaalaaspalaval
305310315320
lysleugluargmetleuthrgluargmetpheasnalagluasngly
325330335
lys
<210>56
<211>564
<212>prt
<213>智人
<400>56
metalagluleuaspleumetalaproglyproleuproargalathr
151015
alaglnproproalaproleuserproaspserglyserproserpro
202530
aspserglyseralaserprovalgluglugluaspvalglyserser
354045
glulysleuglyarggluthrglugluglnaspseraspseralaglu
505560
glnglyaspproalaglygluglylysgluvalleucysaspphecys
65707580
leuaspaspthrargargvallysalavallyssercysleuthrcys
859095
metvalasntyrcysglugluhisleuglnprohisglnvalasnile
100105110
lysleuglnserhisleuleuthrgluprovallysasphisasntrp
115120125
argtyrcysproalahishisserproleuseralaphecyscyspro
130135140
aspglnglncysilecysglnaspcyscysglngluhisserglyhis
145150155160
thrilevalserleuaspalaalaargargasplysglualagluleu
165170175
glncysthrglnleuaspleugluarglysleulysleuasngluasn
180185190
alaileserargleuglnalaasnglnlysservalleuvalserval
195200205
sergluvallysalavalalaglumetglnpheglygluleuleuala
210215220
alavalarglysalaglnalaasnvalmetleupheleugluglulys
225230235240
gluglnalaalaleuserglnalaasnglyilelysalahisleuglu
245250255
tyrargseralaglumetglulysserlysglngluleugluargmet
260265270
alaalaileserasnthrvalglnpheleugluglutyrcyslysphe
275280285
lysasnthrgluaspilethrpheproservaltyrvalglyleulys
290295300
asplysleuserglyilearglysvalilethrgluserthrvalhis
305310315320
leuileglnleuleugluasntyrlyslyslysleuglnglupheser
325330335
lysglugluglutyraspileargthrglnvalseralavalvalgln
340345350
arglystyrtrpthrserlysprogluproserthrarggluglnphe
355360365
leuglntyralatyraspilethrpheaspproaspthralahislys
370375380
tyrleuargleuglnglugluasnarglysvalthrasnthrthrpro
385390395400
trpgluhisprotyrproaspleuproserargpheleuhistrparg
405410415
glnvalleuserglnglnserleutyrleuhisargtyrtyrpheglu
420425430
valgluilepheglyalaglythrtyrvalglyleuthrcyslysgly
435440445
ileasparglysglyglugluargasnsercysileserglyasnasn
450455460
phesertrpserleuglntrpasnglylysgluphethralatrptyr
465470475480
seraspmetgluthrproleulysalaglypropheargargleugly
485490495
valtyrileasppheproglyglyileleuserphetyrglyvalglu
500505510
tyraspthrmetthrleuvalhislysphealacyslyspheserglu
515520525
provaltyralaalaphetrpleuserlyslysgluasnalailearg
530535540
ilevalaspleuglyglugluproglulysproalaproserleuval
545550555560
glythralapro
<210>57
<211>348
<212>prt
<213>智人
<400>57
metglnpheglygluleuleualaalavalarglysalaglnalaasn
151015
valmetleupheleugluglulysgluglnalaalaleuserglnala
202530
asnglyilelysalahisleuglutyrargseralaglumetglulys
354045
serlysglngluleugluthrmetalaalaileserasnthrvalgln
505560
pheleugluglutyrcyslysphelysasnthrgluaspilethrphe
65707580
proservaltyrileglyleulysasplysleuserglyilearglys
859095
valilethrgluserthrvalhisleuileglnleuleugluasntyr
100105110
lyslyslysleuglnglupheserlysglugluglutyraspilearg
115120125
thrglnvalseralailevalglnarglystyrtrpthrserlyspro
130135140
gluproserthrarggluglnpheleuglntyrvalhisaspilethr
145150155160
pheaspproaspthralahislystyrleuargleuglnglugluasn
165170175
arglysvalthrasnthrthrprotrpgluhisprotyrproaspleu
180185190
proserargpheleuhistrpargglnvalleuserglnglnserleu
195200205
tyrleuhisargtyrtyrphegluvalgluilepheglyalaglythr
210215220
tyrvalglyleuthrcyslysglyileaspglnlysglyglugluarg
225230235240
sersercysileserglyasnasnphesertrpserleuglntrpasn
245250255
glylysgluphethralatrptyrseraspmetgluthrproleulys
260265270
alaglyprophetrpargleuglyvaltyrileasppheproglygly
275280285
ileleuserphetyrglyvalglutyraspsermetthrleuvalhis
290295300
lysphealacyslysphesergluprovaltyralaalaphetrpleu
305310315320
serlyslysgluasnalaileargilevalaspleuglygluglupro
325330335
glulysproalaproserleuvalglythralapro
340345
<210>58
<211>105
<212>prt
<213>智人
<400>58
metvallysglnilegluserlysthralapheglnglualaleuasp
151015
alaalaglyasplysleuvalvalvalasppheseralathrtrpcys
202530
glyprocyslysmetilelysprophephehisserleuserglulys
354045
tyrserasnvalilepheleugluvalaspvalaspaspcysglnasp
505560
valalaserglucysgluvallyscysmetprothrpheglnphephe
65707580
lyslysglyglnlysvalglyglupheserglyalaasnlysglulys
859095
leuglualathrileasngluleuval
100105
<210>59
<211>649
<212>prt
<213>智人
<220>
<221>misc_feature
<222>(648)..(648)
<223>xaa为吡咯烷酮羧酸
<400>59
metglycysalagluglylysalavalalaalaalaalaprothrglu
151015
leuglnthrlysglylysasnglyaspglyargargargseralalys
202530
asphishisproglylysthrleuprogluasnproalaglyphethr
354045
serthralathralaaspserargalaleuleuglnalatyrileasp
505560
glyhisservalvalilepheserargserthrcysthrargcysthr
65707580
gluvallyslysleuphelysserleucysvalprotyrphevalleu
859095
gluleuaspglnthrgluaspglyargalaleugluglythrleuser
100105110
gluleualaalagluthraspleuprovalvalphevallysglnarg
115120125
lysileglyglyhisglyprothrleulysalatyrglngluglyarg
130135140
leuglnlysleuleulysmetasnglyprogluaspleuprolysser
145150155160
tyrasptyraspleuileileileglyglyglyserglyglyleuala
165170175
alaalalysglualaalaglntyrglylyslysvalmetvalleuasp
180185190
phevalthrprothrproleuglythrargtrpglyleuglyglythr
195200205
cysvalasnvalglycysileprolyslysleumethisglnalaala
210215220
leuleuglyglnalaleuglnaspserargasntyrglytrplysval
225230235240
glugluthrvallyshisasptrpaspargmetileglualavalgln
245250255
asnhisileglyserleuasntrpglytyrargvalalaleuargglu
260265270
lyslysvalvaltyrgluasnalatyrglyglnpheileglyprohis
275280285
argilelysalathrasnasnlysglylysglulysiletyrserala
290295300
gluargpheleuilealathrglygluargproargtyrleuglyile
305310315320
proglyasplysglutyrcysileserseraspaspleupheserleu
325330335
protyrcysproglylysthrleuvalvalglyalasertyrvalala
340345350
leuglucysalaglypheleualaglyileglyleuaspvalthrval
355360365
metvalargserileleuleuargglypheaspglnaspmetalaasn
370375380
lysileglygluhismetglugluhisglyilelyspheilearggln
385390395400
phevalproilelysvalgluglnileglualaglythrproglyarg
405410415
leuargvalvalalaglnserthrasnserglugluileileglugly
420425430
glutyrasnthrvalmetleualaileglyargaspalacysthrarg
435440445
lysileglyleugluthrvalglyvallysileasnglulysthrgly
450455460
lysileprovalthraspglugluglnthrasnvalprotyriletyr
465470475480
alaileglyaspileleugluasplysvalgluleuthrprovalala
485490495
ileglnalaglyargleuleualaglnargleutyralaglyserthr
500505510
vallyscysasptyrgluasnvalprothrthrvalphethrproleu
515520525
glutyrglyalacysglyleusergluglulysalavalglulysphe
530535540
glyglugluasnilegluvaltyrhissertyrphetrpproleuglu
545550555560
trpthrileproserargaspasnasnlyscystyralalysileile
565570575
cysasnthrlysaspasngluargvalvalglyphehisvalleugly
580585590
proasnalaglygluvalthrglnglyphealaalaalaleulyscys
595600605
glyleuthrlyslysglnleuaspserthrileglyilehisproval
610615620
cysalagluvalphethrthrleuservalthrlysargserglyala
625630635640
serileleuglnalaglycysxaagly
645
<210>60
<211>494
<212>prt
<213>智人
<400>60
metphegluilelyslysilecyscysileglyalaglytyrvalgly
151015
glyprothrcysservalilealahismetcysprogluileargval
202530
thrvalvalaspvalasngluserargileasnalatrpasnserpro
354045
thrleuproiletyrgluproglyleulysgluvalvalglusercys
505560
argglylysasnleuphepheserthrasnileaspaspalailelys
65707580
glualaaspleuvalpheileservalasnthrprothrlysthrtyr
859095
glymetglylysglyargalaalaaspleulystyrileglualacys
100105110
alaargargilevalglnasnserasnglytyrlysilevalthrglu
115120125
lysserthrvalprovalargalaalagluserileargargilephe
130135140
aspalaasnthrlysproasnleuasnleuglnvalleuserasnpro
145150155160
glupheleualagluglythralailelysaspleulysasnproasp
165170175
argvalleuileglyglyaspgluthrprogluglyglnargalaval
180185190
glnalaleucysalavaltyrgluhistrpvalproargglulysile
195200205
leuthrthrasnthrtrpsersergluleuserlysleualaalaasn
210215220
alapheleualaglnargileserserileasnserileseralaleu
225230235240
cysglualathrglyalaaspvalglugluvalalathralailegly
245250255
metaspglnargileglyasnlyspheleulysalaservalglyphe
260265270
glyglysercyspheglnlysaspvalleuasnleuvaltyrleucys
275280285
glualaleuasnleuprogluvalalaargtyrtrpglnglnvalile
290295300
aspmetasnasptyrglnargargargphealaserargileileasp
305310315320
serleupheasnthrvalthrasplyslysilealaileleuglyphe
325330335
alaphelyslysaspthrglyaspthrarggluserserseriletyr
340345350
ileserlystyrleumetaspgluglyalahisleuhisiletyrasp
355360365
prolysvalproarggluglnilevalvalaspleuserhisprogly
370375380
valsergluaspaspglnvalserargleuvalthrileserlysasp
385390395400
protyrglualacysaspglyalahisalavalvalilecysthrglu
405410415
trpaspmetphelysgluleuasptyrgluargilehislyslysmet
420425430
leulysproalapheilepheaspglyargargvalleuaspglyleu
435440445
hisasngluleuglnthrileglypheglnilegluthrileglylys
450455460
lysvalserserlysargileprotyralaproserglygluilepro
465470475480
lyspheserleuglnaspproproasnlyslysprolysval
485490
<210>61
<211>78
<212>dna
<213>智人
<400>61
aaacctgccataactttcccaagaactgagtactctgtacctgggagtagttggcagatc60
cactggtttctgactgga78
<210>62
<211>78
<212>dna
<213>智人
<400>62
tgtggacctaactagggggagcctaaaataatgttgggactacctagatggtcagaaaga60
atgagccaattaacttct78
<210>63
<211>78
<212>dna
<213>智人
<400>63
aaacctgccataactttcccaagaactgagtactctgtactacctagatggtcagaaaga60
atgagccaattaacttct78
<210>64
<211>79
<212>dna
<213>智人
<400>64
aggttaggtactgaactcatcaggaggctgaggttggaaagtagatttgacaaggttaag60
taaaagaaaggcaaagctg79
<210>65
<211>79
<212>dna
<213>智人
<400>65
attttttcgggttttttttccacttttttccttttgaaattttattatttatttactcat60
tttgagatagggtctcact79
<210>66
<211>79
<212>dna
<213>智人
<400>66
aggttgggtactgaactcatcaggaggctgagtttgaaattttattatttatttactcat60
tttgagatagggtctcact79
<210>67
<211>79
<212>dna
<213>智人
<400>67
cttggttctcctgctactacttctgttgctgctacttgatccttacaggatgtttctata60
ctttacaaaactctttggt79
<210>68
<211>79
<212>dna
<213>智人
<400>68
gtgatggcagtgggcacgcccatatacatttgcatacactctaatataaatgtttacaaa60
catacacacacacacattc79
<210>69
<211>79
<212>dna
<213>智人
<400>69
cttggttctcctgctactacttctgttgctgctacttgatctaatataaatgtttacaaa60
catacacacacacacattc79