异常线粒体DNA、相关的融合转录物及其杂交探针的制作方法

文档序号:11611610阅读:362来源:国知局
异常线粒体DNA、相关的融合转录物及其杂交探针的制造方法与工艺
本申请是申请日为2009年3月27日,申请号为200980114773.x,发明名称为“异常线粒体dna、相关的融合转录物及其杂交探针”的发明专利申请的分案申请。本发明涉及线粒体基因组领域。在一个方面中,本发明涉及线粒体基因组融合转录物和杂交至所述线粒体基因组融合转录物的探针的鉴定和使用。
背景技术
:线粒体基因组线粒体基因组是紧凑但却至关重要的核酸序列。与33亿核酸碱基对(bp)的庞大核基因组(单倍体)相反,线粒体dna或“mtdna”包含16,569个bp的小基因组(anderson等人,1981;andrews等人,1999)。其遗传互补体比核细胞配对物小得多(0.0005%)。然而,个体细胞带有103至104中任意数目的线粒体,这取决于特定的细胞功能(singh和modica-napolitano2002)。在细胞核和线粒体基因组之间一般存在通讯或化学信号转导(sherratt等人,1997)。而且,特定的细胞核组分负责线粒体序列的维持和完整性(croteau等人,1999)。一旦发生受精,由于卵细胞中线粒体的克隆扩充,给定个体中所有mtdna基因组是相同的。然而,诱变事件可引起反映为体细胞突变的序列多样性。这些突变可在全身的不同组织中在已知为异质性的条件下累积。线粒体蛋白质组需要约3,000种核基因来构建、操作和维持线粒体,其中只有37种由线粒体基因组编码,这表明了线粒体对核基因座的严重依赖。线粒体基因组编码24个基因的互补体,包括确保对于电子转移来说重要的其它13个基因的正确翻译的2个rrna和22个trna(参见图1)。除了13种由线粒体基因组供应的多肽,线粒体基因组依赖于70种核编码蛋白以完成对于该重要功能而言必需的氧化和还原反应。核和线粒体蛋白形成跨越内线粒体膜的复合体,并且总体上产生80-90%的细胞代谢所需要的化学燃料腺苷三磷酸或atp。除了产生能量,线粒体在其他代谢途径中也起到了重要作用。线粒体的重要功能是介导细胞死亡或凋亡(参见green和kroemer,2005)。实质上,存在渗透外线粒体膜或另外也渗透内线粒体膜的信号途径。当特定的线粒体蛋白释放到细胞溶胶中时,启动了不可逆的细胞死亡。该过程强调了一些线粒体蛋白具有的多功能作用。这些多任务(multi-tasking)蛋白表明还存在其他可具有替换功能的线粒体蛋白。线粒体融合转录物组线粒体基因组是不同寻常的,因为其是环状无内含子dna分子。所述基因组散布有在特定长度的序列侧翼的重复模体。这些重复模体之间的序列易于在未被充分理解的情况下缺失。考虑到线粒体基因组中的重复模体的数量,存在许多可能的缺失。最有名的例子是4977“常见缺失”。该缺失和一些据称的病症与疾病相关,并且被认为增加衰老的频率(dai等人,2004;ro等人,2003;barron等人,2001;lewis等人,2000;muller-hocker,1998;porteous等人,1998)(图4)。在线粒体基因组领域中目前的观点是线粒体缺失物只是通过诸如反应性氧物质之类的试剂和uvr损害线粒体基因组的有害的副产物(krishnan等人,2008,naturegenetics)。此外,尽管认识到由于缺少细胞修复所必需的基因序列,因此高水平的mtdna缺失可对于细胞产生atp形式的能量的能量产生严重的后果,但是没有预期到这些缺失的线粒体分子可以是下游途径的组分,具有期望的功能作用,并且可能可以更适合被认为是本申请人已经预期的的线粒体的识别的基因的替换天然形式。mtdna的序列动力学是重要的诊断工具。mtdna中的突变通常是正在发生的疾病的初步指示物。例如,已经证实线粒体基因组中的点突变是前列腺中的肿瘤病灶的特征。这种趋势还延伸至和肿瘤组织相邻与远离的表现正常的组织(parr等人,2006)。这表明线粒体突变在恶性转化途径早期发生。例如,3.4kb线粒体缺失的频率在识别良性和恶性前列腺组织中具有优异的实用性(maki等人,2008)。线粒体融合转录物之前在文献中首先在大豆中报道过(morgens等人,1984),然后在患有kearns-sayre综合症(罕见的神经肌肉障碍)的两个患者中报道过(nakase等人,1990)。重要地,这些转录物未被发现和任何人的癌症相关(或未对于和任何人类癌症的相关进行研究)。技术实现要素:本发明的目的是提供异常线粒体dna、及其相关的融合转录物和杂交探针。依照本发明的方面,提供一种和癌症相关的分离的线粒体融合转录物。依照本发明的方面,提供一种线粒体融合蛋白,其对应于上述融合转录物,并且具有seqidno:34至49和52中的任一者所阐述的序列。依照本发明的另一个方面,提供一种编码本发明的融合转录物的分离的mtdna。依照本发明的另一个方面,提供一种杂交探针,其具有和本发明的线粒体融合转录物或者mtdna中的至少一部分互补的核酸序列。依照本发明的另一个方面,提供一种检测哺乳动物中的癌症的方法,该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在和癌症相关的至少一种线粒体融合转录物,所述至少一种杂交探针具有和根据本发明的线粒体融合转录物中的至少一部分互补的核酸序列。依照本发明的另一个方面,提供一种检测哺乳动物中的癌症的方法,该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在和癌症相关的至少一种异常mtdna,所述至少一种杂交探针具有和根据本发明的mtdna中的至少一部分互补的核酸序列。依照本发明的另一个方面,提供一种用于进行测定以检测哺乳动物中存在癌症的试剂盒,所述试剂盒包含和本发明的融合转录物或者mtdna中的至少一部分互补的至少一种杂交探针。依照本发明的另一个方面,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的微阵列以鉴定和癌症相关的那些线粒体融合转录物。依照本发明的另一个方面,提供一种筛选工具,其包含具有10、100或1000种对应于线粒体融合转录物的线粒体dna的微阵列以鉴定和癌症相关的那些线粒体dna。照本发明的另一个方面,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的多重分支dna试样以鉴定和癌症相关的那些线粒体融合转录物。依照本发明的另一个方面,提供一种筛选工具,包含具有10、100或1000种对应于线粒体融合转录物的线粒体dna的多重分支dna试样以鉴定和癌症相关的那些线粒体dna。附图说明现在将参照附图仅通过例子的方式来对本发明的实施方案进行说明,其中:图1是示出线粒体编码基因的示意图。图2示出由3.4kb缺失的损失调用的前列腺样品中的聚腺苷酰化(polyadenalated)融合转录物。图3示出由4977kb常见缺失的损失调用的前列腺样品中的聚腺苷酰化融合转录物。图4示出由线粒体基因组的3.4kb区段的损失调用的乳房样品中的聚腺苷酰化融合转录物。图5a和5b示出基因剪接之前和之后线粒体dna区域的例子。图6a至6g描述了本发明的转录物2、3、8、9、10、11和12在结肠直肠癌肿瘤的鉴定中的结果。图7a至7d描述了本发明的转录物6、8、10和20在肺癌肿瘤的鉴定中的结果。图8a至8g描述了本发明的转录物6、10、11、14、15、16和20在黑色素瘤的鉴定中的结果。图9a至9h描述了本发明的转录物1、2、3、6、11、12、15和20在卵巢癌的鉴定中的结果。图10a-图10b至图18a-图18b描述了本发明的转录物2、3、4、11、12、13、15、16和20在睾丸癌的鉴定中的结果。具体实施方式发明详述本发明提供用于预测、诊断和/或监测癌症的新型线粒体融合转录物和亲代突变的mtdna分子。本发明还提供用于融合转录物和相关的mtdna分子检测的杂交探针以及这种探针的用途。定义除非另外定义,本文中使用的所有技术和科技术语具有和本发明所属领域中的普通技术人员的通常理解相同的意思。如本文中所使用的,“异常”或“突变”包括野生型线粒体dna序列中的任何修饰,所述修饰导致形成融合转录物,并且包括但不限于插入、易位、缺失、复制、重组、重排或其组合。如本文中所定义的,“生物样品”是指含有这样的细胞的组织或体液,从该细胞中可以获得目标分子。例如,生物样品可衍生自组织,例如前列腺、乳房、结肠直肠、肺和皮肤,或衍生自血液、唾液、脑脊液、痰、尿液、黏液、滑液、腹膜液、羊水等。生物样品可以是外科手术样本或活组织检查样本。生物样品可以以得自来源直接使用或者在进行预处理以改变样品的特征后使用。因此,生物样品可以(例如)通过下列方式在使用前进行预处理:从血液中制备血浆或血清、分裂细胞、从固体材料中制备液体、稀释粘性流体、过滤液体、蒸馏液体、浓缩液体、灭活干扰组分、添加试剂等。“连续”转录物是从剪接的基因的开端到末端都保持阅读框的融合转录物。“末端”转录物是在另一剪接的基因的起始终止密码子前导致形成提前终止密码子的融合转录物。如本文中所使用的,“线粒体dna”或“mtdna”是线粒体中存在的dna。如本文中所使用的,表述“线粒体融合转录物”或“融合转录物”是指由于突变的线粒体dna序列的转录而产生的rna转录产物,其中这种突变可包括线粒体缺失和其他大量线粒体dna重排。计算机分析和序列靶向如上所讨论的,线粒体融合转录物已经在大豆中报道过(morgens等人,1984),并在患有罕见的神经肌肉障碍的人中报道过(nakase等人,1990)。然而,并未描述和人类癌症相关的融合转录物。使用从对和癌症相关的人线粒体基因组的大量缺失进行作图、对高频率的这些缺失进行观察、和转录活性的突变的mtdna分子的另一种有机体与另一种疾病类型中的证据获得的知识,申请人假设由于其涉及癌症,因此这些缺失可比dna分子、以及损害和修复过程重要。为了验证该假设,进行线粒体基因组的计算机分析,特定于重复元件,这表明了许多潜在的缺失位点。在鉴定具有非邻近或非串联位置的线粒体序列中的独特重复的这种初始步骤后,使用过滤器以鉴定那些重复,在引发dna分子中的缺失事件后,那些重复将可能重新闭合或重新连接以产生具有可读框(orf)的融合的dna序列。然后选择18个分子的亚型进行靶向以调查是否:1)它们以人的自然生物状态存在;和2)它们和恶性肿瘤相关。这些研究的结果在下文中描述。基因组突变线粒体dna(mtdna)动力学是重要的诊断工具。mtdna中的突变通常是正在发生的疾病的初步指示物,并且起到指示和疾病发作有关的危险因素的生物标记的作用。根据本发明,线粒体基因组中的大量重排突变导致产生给癌症相关的融合转录物。因此,提供编码这种转录物的mtdna和导向其的探针在检测、诊断和监测癌症中的用途。本领域普通技术人员将意识到,本发明的方法中使用的mtdna分子可通过分离天然存在的突变体而衍生到,或可基于本文中所述的任何融合转录物的互补序列。示例性mtdna序列和融合转录物在申请人的美国优先权申请no.61/040,616中有所公开,其通过引用的方式全部并入本文中。突变基因组序列的检测根据本发明的突变mtdna序列可包含导致产生融合转录物的任何修饰。这些修饰的非限制性例子包括插入、易位、缺失、复制、重组、重排或其组合。尽管修饰或改变的大小可以在从只有几个碱基到数千碱基之间变化很大,但是优选地,修饰导致大量缺失或其他大量基因组异常。提取dna以检测存在这种突变可使用本领域已知的方法来进行,然后对线粒体基因组的全部或区域进行扩增,并且可包括线粒体基因组的测序,如currentprotocolsinmolecularbiology中所描述。可选择地,可以使用粗组织匀浆以及不需要对特定目标片段进行扩增的技术。检测突变的步骤可选自本领域普通技术人员已知的任何技术。例如,分析mtdna可包括:通过分支dna选择靶、对mtdna进行测序、通过pcr扩增mtdna、southern、northern、westernsouth-western印迹杂交、变性hplc、杂交至微阵列、生物芯片或基因芯片、分子标记分析、生物传感器、熔融温度特性或上述任何的组合。可以使用对线粒体dna进行测序的任何合适的方式。优选地,在测序前mtdna通过pcr进行扩增。pcr的方法是本领域所熟知的,并且可如mullisandfaloona,1987,methodsenzymol.,155:335中所述那样进行。pcr产物可直接进行测序,或克隆到载体中,然后置于细菌宿主中。dna测序方法的例子在下列文献中找到:brumley,r.l.jr.和smith,l.m.,1991,rapiddnasequencingbyhorizontalultrathingelelectrophoresis,nucleicacidsres.19:4121-4126;和luckey,j.a.,等人,1993,highspeeddnasequencingbycapillarygelelectrophoresis,methodsenzymol.218:154-172。pcr和mtdna测序的联合使用在hopgood,r.,等人,1992,strategiesforautomatedsequencingofhumanmtdnadirectlyfrompcrproducts,biotechniques13:82-92和tanaka,m.等人,1996,automatedsequencingofmtdna,methodsenzymol.264:407-421中找到。选择合适的序列以制备各种引物的方法也是本领域已知的。例如,所述引物可以使用常规固相合成法、利用市售设备来制备,例如所述市售设备得自appliedbiosystemsusainc.(fostercity,california)、dupont,(wilmington,del.)或milligen(bedford,mass.)。根据本发明的方面,为了确定候选物基因组序列,首先鉴定序列缺失的连接点。序列缺失主要通过在待在5’和3’端缺失的序列侧翼的直接和间接重复元件而鉴定。从基因组中除去一段核苷酸、接着连接基因组导致新型连接点的形成。在鉴定连接点后,为了鉴定剪接的基因,测定在连接点侧翼的基因的核苷酸。典型地,剪接的基因包含来自第一基因的起始密码子和第二基因的终止密码子,并且可表达为连续的转录物,即从剪接的基因的开端到末端都保持阅读框的转录物。还可能的是,可以使用所述基因序列内含有的替换起始或终止密码子,如本文中所公开的seqidno:2和seqidno:17所证明。表1中提供一些已知的线粒体缺失,所述线粒体缺失被发现当重排的序列在间接位点重新接合时具有可读框(orf)。下面提供本发明的方法中使用的示例性mtdna分子,其已经被证实在实验室中存活。这些mtdna基于已知线粒体基因组(seqidno:1)的修饰,并且已经被指派融合或“fus”的称号,其中a:b表示第一剪接的基因的最后线粒体核苷酸和第二剪接的基因的第一线粒体核苷酸之间的连接点。括号中提供剪接的基因的鉴定,接着是对应的序列识别号。如下面所提供的,(altmet)和(origmet)分别是指替换和初始翻译的起始位点。fus8469:13447(altmet)(atp合酶f0亚单位8至nadh脱氢酶亚单位)(seqidno:2)fus10744:14124(nadh脱氢酶亚单位4l(nd4l)至nadh脱氢酶亚单位5(nd5))(seqidno:3)fus7974:15496(细胞色素c氧化酶亚单位ii(coii)至细胞色素b(cytb))(seqidno:4)fus7992:15730(细胞色素c氧化酶亚单位ii(coii)至细胞色素b(cytb))(seqidno:5)fus8210:15339(细胞色素c氧化酶亚单位ii(coii)至细胞色素b(cytb))(seqidno:6)fus8828:14896(atp合酶f0亚单位6(腺苷三磷酸酶6)至细胞色素b(cytb))(seqidno:7)fus10665:14856(nadh脱氢酶亚单位4l(nd4l)至细胞色素b(cytb))(seqidno:8)fus6075:13799(细胞色素c氧化酶亚单位i(coi)至nadh脱氢酶亚单位5(nd5))(seqidno:9)fus6325:13989(细胞色素c氧化酶亚单位i(coi)至nadh脱氢酶亚单位5(nd5))(seqidno:10)fus7438:13476(细胞色素c氧化酶亚单位i(coi)至nadh脱氢酶亚单位5(nd5))(seqidno:11)fus7775:13532(细胞色素c氧化酶亚单位ii(coii)至nadh脱氢酶亚单位5(nd5))(seqidno:12)fus8213:13991(细胞色素c氧化酶亚单位ii(coii)至nadh脱氢酶亚单位5(nd5))(seqidno:13)fus9191:12909(atp合酶f0亚单位6(腺苷三磷酸酶6)至nadh脱氢酶亚单位5(nd5))(seqidno:14)fus9574:12972(细胞色素c氧化酶亚单位iii(coiii)至nadh脱氢酶亚单位5(nd5))(seqidno:15)fus10367:12829(nadh脱氢酶亚单位3(nd3)至nadh脱氢酶亚单位5(nd5))(seqidno:16)fus8469:13447(origmet)(atp合酶f0亚单位8至nadh脱氢酶亚单位)(seqidno:17)fus9144:13816((atp合酶f0亚单位6(腺苷三磷酸酶6)至nadh脱氢酶亚单位5(nd5))(seqidno:51)本发明还提供这些序列的变体或片段在预测、诊断和/或监测癌症中的用途。如本文中所使用的,“变体”是指区别于本发明的mtdna序列、但是保持其基本性能的核酸。通常,变体和选择的mtdna序列总的来说非常类似,并且在许多区域中相同。具体而言,本发明的变体包含剪接的基因的连接点的核苷酸中的至少一种,并且还可包含与其相邻的一种或多种核苷酸。在本发明的一个实施方案中,变体序列和本发明的mtdna序列或其互补链中的任一者至少80%、85%、90%、95%、96%、97%、98%或99%相同。在本发明中,“片段”是指为公开的基因组序列或其互补链的一部分的短核酸序列。该部分包括包含剪接的基因的连接点的核苷酸中的至少一者,并且还可包含与其相邻的一种或多种核苷酸。本发明的片段的长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如,片段的“长度至少20nt”旨在包括上面列出的mtdna序列中的任一者的20或更多个连续的碱基。在上下文中,“约”包括在一个末端或两个末端处的特定引述的值、大于或小于数个(5、4、3、2或1)核苷酸的值。这些片段具有的用途包括但不限于作为本文中所讨论的诊断探针和引物。当然,也涵盖更大的片段(例如50、150、500、600、2000个核苷酸)。因此,在本发明的特定实施方案中,mtdna序列选自由下列序列及其片段或变体构成的组:seqidno:2(fus8469:13447;altmet)seqidno:3(fus10744:14124)seqidno:4(fus7974:15496)seqidno:5(fus7992:15730)seqidno:6(fus8210:15339)seqidno:7(fus8828:14896)seqidno:8(fus10665:14856)seqidno:9(fus6075:13799)seqidno:10(fus6325:13989)seqidno:11(fus7438:13476)seqidno:12(fus7775:13532)seqidno:13(fus8213:13991)seqidno:14(fus9191:12909)seqidno:15(fus9574:12972)seqidno:16(fus10367:12829)seqidno:17(fus8469:13447;origmet)seqidno:51(fus9144:13816),和其片段和变体。探针本发明的另一个方面提供能够识别本发明的异常mtdna序列的杂交探针。如本文中所使用的,术语“探针”是指这样的寡核苷酸,由于探针中的至少一个序列和靶区域中的序列互补性,因此所述寡核苷酸和靶核酸中的序列形成双螺旋结构。探针可以根据本领域中已知的方法来进行标记。在鉴定和特定疾病相关的异常mtdna后,例如,杂交至寡核苷酸阵列的mtdna可用于鉴定特定突变,然而,可以使用任何已知的杂交方法。正如本发明的引物一样,探针可以针对本发明的示例性mtdna融合分子或者其片段或变体而直接产生。例如,seqidno:2-17和51中阐述的序列和表1中公开的那些序列可用于设计检测包含目标融合序列的核酸序列的引物或探针。如本领域普通技术人员将理解的,杂交至这些核酸分子的引物或探针可在严格性强的杂交条件或严格性弱的杂交条件下进行,这些条件是本领域普通技术人员已知的,并且在(例如)currentprotocolsinmolecularbiology(johnwiley&sons,newyork(1989)),6.3.1-6.3.6中找到。在本发明的特定实施方案中,本发明的探针含有和包含剪接的基因的连接点的异常mtdna中的至少一部分互补的序列。该部分包含包括在连接点a:b中的核苷酸中的至少一者,并且还可包含与其相邻的一种或多种核苷酸。就此而言,本发明包括将使用包括在连接点a:b中和/或与其相邻的核苷酸来选择mtdna分子的任何合适的靶向机理。本发明涵盖本领域已知的各种类型的探针。例如,探针可以是杂交探针,其和靶核苷酸序列的结合可使用通常的dna结合染料(例如溴化乙锭、green、gold等)来检测。可选择地,探针可引入一种或多种可检测的标记。可检测的标记是这样的分子或部分,其性能或特性可直接或间接检测,并且被选择为使得探针和其靶序列杂交的能力不受影响。标记核酸序列的方法是本领域熟知的(例如参见ausubel等人,(1997&updates)currentprotocolsinmolecularbiology,wiley&sons,newyork)。适用于本发明的探针的标记包括可直接检测的那些,例如放射性同位素、荧光图、化学发光团、酶、胶体颗粒、荧光微粒等。本领域普通技术人员将理解可直接检测的标记可需要附加组分(例如底物、触发试剂、光等),以能够检测所述标记。本发明还涵盖使用间接检测的标记。本发明的探针的长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如,探针的“长度至少20nt”旨在包括和本发明的mtdna序列互补的20或更多个连续的碱基。当然,可优选更大的探针(例如50、150、500、600、2000个核苷酸)。本发明的探针也将杂交至生物样品中的核酸分子,从而使得本发明的方法成为可能。因此,在本发明的一个方面中,提供一种在癌症的检测中使用的杂交探针,其中所述探针和异常mtdna分子的至少一部分互补。在本发明的另一个方面中,提供一种探针以及这种探针在检测结肠直肠癌、肺癌、乳腺癌、卵巢癌、睾丸癌、前列腺癌和/或黑色素瘤皮肤癌中的用途(或使用方法)。测定测量生物样品中异常mtdna的水平可确定受试者中存在一种或多种癌症。因此,本发明包括用于预测、诊断或监测癌症的方法,该方法包括获得一种或多种生物样品,从所述样品中提取mtdna,以及通过下列方法测定样品的异常mtdna:对样品中的一种或多种异常mtdna序列的量进行定量,然后将检测的量和参照值进行比较。如本领域普通技术人员将理解的,参照值基于是否所述方法寻求预测、诊断或监控癌症。因此,参照值可涉及从随时间采集的一种或多种已知的非癌症生物样品、一种或多种已知的癌症生物样品、和/或一种或多种生物样品中收集的mtdna数据。在一个方面中,本发明提供一种检测哺乳动物中的癌症的方法,该方法包括测定来自所述哺乳动物的组织样品中存在上述异常线粒体dna。本发明还提供这样的方法,该方法包括通过使样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品。如本文中所描述的,探针可针对本发明的突变线粒体dna序列而产生。在另一个方面中,本发明提供上述方法,其中所述测定包括:a)使用至少一种探针来进行杂交反应,以允许所述至少一种探针杂交至互补的异常线粒体dna序列;b)通过对杂交至至少一种探针的线粒体dna的量进行定量,来对所述样品中的所述至少一种异常线粒体dna序列的量进行定量;以及c)将所述样品中的线粒体dna的量和至少一种已知参照值进行比较。本发明中还包括用于预测、诊断或监测癌症的方法,该方法包括如下所述的诊断成像测定。本发明的诊断测定可容易地适用于高通量。高通量测定提供下列优点:同时和大量处理多种样品会减少筛选多种样品所需要的时间。因此,本发明涵盖在高通量筛选或测定中使用本发明的核苷酸以检测和/或定量多种测试样品中的靶核苷酸序列。融合转录物本发明还提供在用于预测、诊断和/或监测癌症的方法中使用的融合转录物和相关的杂交探针的鉴定。本领域普通技术人员将意识到这些分子可通过天然存在的转录物的分离、或可选择地通过根据本发明的方法分离的mtdna的重组表达而衍生得到。如所讨论地,这些mtdna典型地包含具有来自第一基因的起始密码子和第二基因的终止密码子的剪接的基因。因此,由其衍生的融合转录物包含和剪接的基因相关的连接点。融合转录物的检测天然存在的融合转录物可从生物样品中提取,并且根据本领域已知的任何合适的方法来鉴定,或者可根据实施例中所述的方法来进行。在本发明的一个实施方案中,稳定的聚腺苷酰化融合转录物使用寡(dt)引物(其使用聚-a尾部靶向转录物)、然后使用针对靶转录物设计的引物对进行rt-pcr来鉴定。下列示例性融合转录物使用这些方法进行检测,并且发现在预测、诊断和/或监测癌症中是有用的,如实施例中所描述。同样,根据本发明的测定和方法,衍生自表1中鉴定的orf序列的融合转录物可在预测、诊断和/或监测癌症中是有用的。seqidno:18(转录物1;8469:13447;altmet)seqidno:19(转录物2;10744:14124)seqidno:20(转录物3;7974:15496)seqidno:21(转录物4;7992:15730)seqidno:22(转录物5;8210:15339)seqidno:23(转录物6;8828:14896)seqidno:24(转录物7;10665:14856)seqidno:25(转录物8;6075:13799)seqidno:26(转录物9;6325:13989)seqidno:27(转录物10;7438:13476)seqidno:28(转录物11;7775:13532)seqidno:29(转录物12;8213:13991)seqidno:30(转录物14;9191:12909)seqidno:31(转录物15;9574:12972)seqidno:32(转录物16;10367:12829)seqidno:33(转录物20;8469:13447;origmet)seqidno:50(转录物13;9144:13816)。此外,和本文中所述的那些特征类似的融合转录物也涵盖在临床肿瘤学领域的应用中。融合转录物还可以通过本领域中已知的重组技术来制备。典型地,该技术包括使用包含目标mtdna序列的表达载体来转化(包括转染、转导或感染)合适的宿主细胞。还提供本文中鉴定的融合转录物的变体或片段。这些序列可坚持上面相对于基因组变体和片段而描述的尺寸限制和百分同一性,或者由本领域普通技术人员合适地确定。另外,下面列出对应于转录物1-16和20的推定的蛋白序列。提供这些编码假设的融合蛋白的序列作为本发明的进一步的实施方案。seqidno:34(转录物1)seqidno:35(转录物2)seqidno:36(转录物3)seqidno:37(转录物4)seqidno:38(转录物5)seqidno:39(转录物6)seqidno:40(转录物7)seqidno:41(转录物8)seqidno:42(转录物9)seqidno:43(转录物10)seqidno:44(转录物11)seqidno:45(转录物12)seqidno:46(转录物14)seqidno:47(转录物15)seqidno:48(转录物16)seqidno:49(转录物20)seqidno:52(转录物13)探针在表征融合转录物后,可以开发引物或探针以在生物样品中靶向转录物。这些引物和探针可使用任何已知的方法(如上述)或下面提供的实施例中所阐述的方法来制备。例如,探针可对于融合转录物而产生,并且检测技术,例如panomicstm的quantigene2.0tm,被用于检测样品中存在转录物。引物和探针可针对本发明的示例性融合转录物或者其片段或变体而直接产生。例如,seqidno:18-33和50中阐述的序列和表1中公开的那些序列可用于设计检测包含目标融合序列的核酸序列的探针。如本领域普通技术人员将理解的,设计杂交至本发明的融合转录物的探针含有和表达剪接的基因的连接点的转录物中的至少一部分互补的序列。该部分包括和表达的连接点互补的核苷酸中的至少一者,并且还可包含与其相邻的一种或多种互补核苷酸。就此而言,本发明包括将使用包括在剪接的基因的连接点中和与其相邻的核苷酸来选择融合转录物的任何合适的靶向机理。本领域中已知的各种类型的探针和标记方法都涵盖以制备转录物探针。这些类型和方法已经相对于基因组序列的检测而在上面描述。本发明的转录物探针的长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,甚至更优选至少约40nt、至少约50nt、至少约75nt或至少约150nt。例如,探针的“长度至少20nt”旨在包括和本发明的mtdna序列互补的20或更多个连续的碱基。当然,可优选更大的探针(例如50、150、500、600、2000个核苷酸)。在一个方面中,本发明提供一种在癌症的检测中使用的杂交探针,其中所述探针和上面提供的线粒体融合转录物的至少一部分互补。在另一个方面中,本发明提供一种探针以及这种探针在检测结肠直肠癌、肺癌、乳腺癌、卵巢癌、睾丸癌、前列腺癌或黑色素瘤皮肤癌中的用途(或使用方法)。测定测量生物样品中线粒体融合转录物的水平可确定受试者中存在一种或多种癌症。因此,本发明提供用于预测、诊断或监测癌症的方法,该方法包括获得一种或多种生物样品,从所述样品中提取线粒体rna,以及通过下列方法测定样品的融合转录物:对样品中的一种或多种融合转录物的量进行定量,然后将检测的量和参照值进行比较。如本领域普通技术人员将理解的,参照值基于是否所述方法寻求预测、诊断或监控癌症。因此,参照值可涉及从随时间采集的一种或多种已知的非癌症生物样品、一种或多种已知的癌症生物样品、和/或一种或多种中生物样品收集的转录物数据。在一个方面中,本发明提供一种检测哺乳动物中的癌症的方法,该方法包括通过使所述样品和至少一种杂交探针杂交来测定来自所述哺乳动物的组织样品中存在本发明的至少一种融合转录物,所述至少一种杂交探针具有和线粒体融合转录物中的至少一部分互补的核酸序列。在另一个方面中,本发明提供上述方法,其中所述测定包括:a)使用至少一种上述探针来进行杂交反应,以允许所述至少一种探针杂交至互补的线粒体融合转录物;b)通过对杂交至所述至少一种探针的所述转录物的量进行定量,来对所述样品中的所述至少一种线粒体融合转录物的量进行定量;以及c)将所述样品中的所述线粒体融合转录物的量和至少一种已知参照值进行比较。如上所讨论的,本发明的诊断测定还可包含本文中所述的诊断方法和筛选工具,并且可容易地适用于高通量。因此,本发明涵盖在高通量筛选或测定中使用本发明的融合转录物和相关的探针以检测和/或定量多种测试样品中的靶核苷酸序列。诊断方法和筛选工具本文中还涵盖了用于诊断特定疾病或鉴定特定线粒体突变的方法和筛选工具。可以使用任何已知的杂交方法来进行这些方法,包括但不限于基于探针/引物的技术,例如分支dna和qpcr、单重和多重的。还可以使用阵列技术,其具有匹配野生型或突变的区域的寡核苷酸探针和对照探针。市售阵列(例如微阵列)或基因芯片是核实后的。这些阵列在玻片或微芯片上含有数千的匹配的和对照的探针对,并且能够非常迅速地对整个基因组进行测序。描述微阵列在基因组和dna序列分析中的用途的综述文献在线可得。设计用于鉴定和给定的生物条件相关的靶的筛选工具可包括和特定疾病或紊乱相关的核酸的特定排列。因此,依照本发明的一个实施方案,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的微阵列以鉴定和一种或多种癌症相关的那些线粒体融合转录物。依照另一个实施方案,提供一种筛选工具,其包含具有10、100或1000种对应于线粒体融合转录物的线粒体dna的微阵列以鉴定和一种或多种癌症相关的那些线粒体dna。在进一步的实施方案中,提供一种筛选工具,其包含具有10、100或1000种线粒体融合转录物的多重分支dna试样以鉴定和一种或多种癌症相关的那些线粒体融合转录物。在本发明的又一个实施方案中,提供一种筛选工具,其包含具有10、100或1000种对应于线粒体融合转录物的线粒体dna的多重分支dna试样以鉴定和一种或多种癌症相关的那些线粒体dna。在临床肿瘤学领域中有用的方案也涵盖在本文中,并且可包括诊断成像技术,例如正电子成像术(pet)、对比磁共振成像术(mri)等。这些诊断方法是本领域普通技术人员熟知的,并且可在癌症的诊断和预测中使用。诊断监测本发明的方法还可包括基于一种或多种测定的结果而推荐监测制度或治疗路线。这允许临床医生通过监测患者的癌症(例如通过在发生起始或随后的突变时识别)或治疗(例如通过在突变稳定时识别)的进展来实施个性化用药,例如癌症的治疗。使用手头的序列变异的分界的知识,所述信息可用于诊断癌症前病症或现有癌症病症。此外,通过对连续样品中的异常mtdna随时间的量进行定量,可以监控癌症病症的进展,例如,为了确定异常是否已经发生改变,可以将通过在一个时间点测定患者的组织以从野生型中检测第一组突变而提供的数据和从随后的测定提供的数据进行比较。如果在并未产生癌症症状的个体中发现突变,突变可以是产生癌症病症的基因易患性的指示。可基于这样的信息在定性的基础上进一步评价疾病易患性的确定或其存在的诊断,所述信息涉及在患者的家族史中癌症病症的流行性(如果有)和存在其他危险因素(例如暴露于环境因素),以及是否患者的细胞也携带另一种突变。生物样品本发明提供用于诊断的试验,所述试验包括获得或收集一种或多种生物样品。在本发明的上下文中,“生物样品”是指含有这样的细胞的组织或体液,从该细胞中可以获得mtdna和mtrna。例如,生物样品可衍生自组织,包括但不限于皮肤、肺、乳房、前列腺、神经、肌肉、心脏、胃、结肠、直肠组织等;或衍生自血液、唾液、脑脊液、痰、尿液、黏液、滑液、腹膜液、羊水等。生物样品可以得自癌症或非癌症组织,并且可以但不限于是外科手术样本或活组织检查样本。生物样品可以以得自来源直接使用或者在进行预处理以改善样品的特征后使用。因此,生物样品可以(例如)通过下列方式在使用前进行预处理:从血液中制备血浆或血清、分裂细胞、从固体材料中制备液体、稀释粘性流体、过滤液体、蒸馏液体、浓缩液体、灭活干扰组分、添加试剂等。本领域普通技术人员将理解,在单次时间可以测定多于一种的样品类型(即用于检测多于一种的癌症)。此外,如果需要一段过程的收集,例如用于随着时间监测癌症,可以单独诊断给定样品,或者和在整个试验期间采集的其他样品一起诊断。就此而言,生物样品可以仅采集一次,或者以规则的间隔(两周、一月、半年或一年)采集。试剂盒本发明提供用于在临床环境下检测癌症的诊断/扫描试剂盒。这些试剂盒可包括一种或多种取样构件并联合根据本发明的一种或多种探针。试剂盒可以任选地包括需要用于进行诊断测定的试剂,例如缓冲剂、盐、检测试剂等。试剂盒中也可以包括其他组分,例如用于生物样品的分离和/或处理的缓冲剂和溶液。所述试剂盒的一种或多种组分可冻干,并且所述试剂盒还可包含适于冻干的组分重建的试剂。如果需要,所述试剂盒还可包含反应容器、混合容器和其他易于制备试样的组件。所述试剂盒还可任选地包括使用说明,其可以以纸的形式或计算机可读形式(例如磁盘、cd、dvd等)提供。在本发明的一个实施方案中,提供一种用于诊断癌症的试剂盒,其包含取样构件和本发明的杂交探针。将通过使用下列实施例描述来对本发明的各方面进行说明。本文中提供的实施例仅起到描述本发明的某些特定实施方案的作用,并且并非旨在以任何方式限制本发明的范围。实施例实施例1:线粒体融合转录物的检测本申请人在pct申请no.pct/ca2007/001711(其全部内容通过引用的方式并入)中之前鉴定的线粒体4977“常见缺失“和3.4kb缺失导致具有活性转录物的独特的可读框,如在前列腺组织中通过寡-dt选择所鉴定的(图2和3)。乳房组织样品的检查也揭示出源自3.4kb缺失的稳定的聚腺苷酰化融合转录物的存在(图4)。用于缺失转录物检测的反转录-pcr方案rna分离cdna合成遵循制造商的说明并使用aurumtm总rna脂肪和纤维组织试剂盒(bio-rad,hercules,ca),从速冻前列腺和乳房组织样品(恶性肿瘤和肿瘤附近的正常样品)中分离总rna。由于在该实验中避免了基因组dna污染,因此在使用本领域通知的方法的条件下包括nda酶i处理步骤。使用nd-1000分光光度计(technologies)来测定rna的数量和质量。从约100g的初始材料中,总rna浓度从100至1000ng/μl之间变化,并且260/280比在1.89至2.10之间。将rna浓度调解至100ng/μl,并且遵循制造商的说明,使用用于rt-pcr的superscripttm第一链合成系统(invitrogen)将2μl的各模板用于第一链dna的合成。为了鉴定稳定的聚腺苷酰化融合转录物,使用寡(dt)引物,其使用聚-a尾部靶向转录物。pcr使用5μl的各cdna模板和iqtmgreensupermix(bio-rad,hercules,ca)在dnaengine2连续荧光检测系统(bio-rad,hercules,ca)上进行实时pcr。靶向4977bp缺失的引物对为:8416f5'-ccttacactattcctcatcac-3'、13637r5'-tgacctgttagggtgagaag-3',并且用于3.4kb缺失的引物对为:nd4lf5'-tcgctcacacctcatatcctc-3'、nd5r5'-tgtgattaggagtagggttagg-3'。反应闪烁液(reactioncocktail)包括:2xgreensupermix(100mmkcl,40mmtris-hcl,ph8.4,0.4mm的各dntp[datp、dctp、dgtp和dttp]、itaqtmdna聚合酶、50units/ml、6mmmgcl2、green1、20nm的荧光素和稳定剂)、250nm的各引物、和双蒸水。pcr循环参数如下:(1)95℃2分钟,(2)95℃30秒,(3)55℃(对于4977bp缺失)和63℃(对于3.4kb缺失)30秒,(4)72℃45秒,(5)板读取,接着进行39个循环的步骤3至5,并且最终在4℃下孵育。除了循环阈值和熔融曲线分析,将样品在琼脂糖凝胶上运行以用于扩增产物的特定可视化(参见图2至4)。图2是示出由线粒体基因组的3.4kb的损失调用的前列腺样品中的聚腺苷酰化融合转录物的琼脂糖凝胶图。图2的说明为:b-空白、泳道1-6为cdna中检测的转录物;泳道7-12为用于泳道1-6中的样品的无反转录酶(rt)对照。图3示出由4977kb常见缺失的损失调用的前列腺样品中的聚腺苷酰化融合转录物。图3的说明为:b-空白、泳道1-6为cdna中检测的转录物;泳道7-12为用于泳道1-6中的样品的无rt对照。图4示出由线粒体基因组的3.4kb的损失调用的乳房样品中的聚腺苷酰化融合转录物。图4的说明为:泳道2-8为来自乳房cdna的转录物;泳道9为阴性对照(水);泳道10和11为用于泳道2和3中的样品的阴性、无rt对照。这些结果证实存在稳定的线粒体融合转录物。实施例2:融合产物的鉴定和靶向设计多种杂交探针以进行检测,并且进一步证实存在源自突变的线粒体基因组(例如3.4kb缺失)的新型转录物。为此,利用用于定量基因表达分析的单重分支dna平台(quantigene2.0tm,panomicstm)。该实施例中列出的特定缺失和序列基于它们和整个mtdna基因组(在seqidno:1中所示)的相对位置。四种转录物(在该实施例中探针被设计用于所述转录物)的核酸序列在本文中被鉴定为如下:转录物1(seqidno:18)、转录物2(seqidno:19)、转录物3(seqidno:20)和转录物4(seqidno:21)。使用基因nd4l(nadh脱氢酶亚单位4l)和nd5(nadh脱氢酶亚单位5)产生3.4kb线粒体基因组缺失的连续转录物的例子。具有和seqidno:19互补的序列的探针被用于检测转录物2。在nd4l中的位置10745-10754和在nd5中的位置14124-14133产生重复元件。3.4kb缺失导致除去nd4l的3'端、全长nd4基因、trna组氨酸、trna丝氨酸2、trna亮氨酸2和nd5的大部分的5'端(参见图5a),从而导致nd4l和nd5用连接点10744(nd4l):14124(nd5)进行基因剪接(图5b)。seqidno:3是以上述方式检测的rna转录物(seqidno:19)的互补的dna序列。类似地,转录物1是腺苷三磷酸酶8与和位置8469:13447相关的nd5之间的融合转录物(seqidno:18)。转录物3和4(分别为seqidno:20和seqidno:21)是分别和核苷酸位置7974:15496与7992:15730相关的coii与cytb之间的融合转录物。表3提供了该实施例中使用的各种序列之间的关系的概述。表3包括检测融合转录物和与检测的融合转录物互补的dna序列。实施例3:应用于前列腺癌使用四种融合转录物,即上面讨论的转录物1至4,分析来自一位患者的两种前列腺组织样品以评价新预计的融合转录物的定量差异。试验结果提供在下面的表2中,其中“homog1”是指患者的冷冻前列腺肿瘤组织的匀浆,“homog2”是指患者的肿瘤附近的冷冻正常前列腺组织的匀浆。这些样品根据生产商的方案(sampleprocessingkitforfreshorfrozenanimaltissues;和2.0reagentsystemusermanual)以25.8mg的homog1和28.9mg的homog2(测定安排示于表5a和5b中)开始进行处理。明显证实的是和正常附近的前列腺组织相比,前列腺癌组织中存在的线粒体融合转录物增加。尽管水平非常低,但是融合转录物存在于正常组织中。探针杂交至靶转录物而产生的相对发光单位(rlu)直接和各转录物的丰富程度成比例。表2还指出从样品采集的读数的变异系数(cv,表示为%cv)。cv包含标准偏差除以平均值。这种在癌症组织中稳定地转录的线粒体基因产物的显著性暗示着疾病演变和发展。实施例4:应用于乳腺癌使用和实施例3相同的方案,但只集中于转录物2,和3.4kb线粒体基因组缺失有关的新型融合转录物,分析两种乳房肿瘤组织样品和两种这些肿瘤附近的无肿瘤组织的样品、以及三种前列腺肿瘤组织样品、一种包含附近的无肿瘤组织的样品。表4中提供了该实施例的结果。具有相应的正常组织切片的前列腺肿瘤组织样品证实和在实施例3中分析的前列腺样品类似的图案,因为较之正常附近的组织,肿瘤组织具有约2倍量的融合转录物。当和附近的无肿瘤组织相比时,乳房肿瘤样品证实融合转录物水平显著地增加。使用以1:100稀释的匀浆进行该分析,因为其在实施例3所引用的试验中最可再生地进行。因此,上面讨论的结果表明了本发明的转录物在前列腺和乳房组织的肿瘤的检测中的应用。实施例5:应用于结肠直肠癌该研究旨在确定本发明的一些转录物在检测结肠直肠癌中的有效性。总共制备19种样品,包括9种对照(良性)组织样品(样品1至9)和10种肿瘤(恶性)组织样品(样品10至19)。将样品根据生产商的建议(sampleprocessingkitforfreshorfrozenanimaltissues;和quantigene2.0reagentsystemusermanual)进行均质化。按照前面实施例中列出的方式制备7种靶转录物和1种持家转录物。转录物的特性概述如下:表7:乳腺癌转录物的特性应注意,转录物2和3和上面涉及实施例3和4所讨论的那些相同。使用约25mg的来自oct块的组织制备匀浆,对于转录物2和4以1:1稀释,对于转录物10和11以1:8稀释。在glomaxtm多检测系统(promega)上测量转录物的量(相对荧光单位rlu)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的rlu值中减去下限来分析计算背景。通过使用式log2arlu-log2hrlu来计算输入rna,其中a是靶融合转录物,并且h是持家转录物。数据分析包括下列步骤:a)确定三次测定的cv(变异系数),如果≤15%则可接受。b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均rlu值。c)从背景rlu的三个值中确定下限(i)。d)从(a)中减去下限(i)。e)计算log2arlu-log2hrlu。结果概述:上述分析的结果示于图6a至6g中,其包括log2arlu-log2hrlu对样品数的图。还示出从各转录物的结果中确定的各roc(接受者工作特征)曲线。转录物2:在正常组(p<0.10)和恶性组(p>0.09)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的3.6129的截断值导致灵敏度为60%,特异度为89%,曲线下面积为0.73,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物3:在正常组(p<0.05)和恶性组(p=0.03)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的4.0813的截断值导致灵敏度为60%,特异度为78%,曲线下面积为0.79,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物8:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-6.0975的截断值导致灵敏度为60%,特异度为89%,曲线下面积为0.76,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物9:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-7.5555的截断值导致灵敏度为60%,特异度为89%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物10:在正常组(p<0.01)和恶性组(p=0.01)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-3.8272的截断值导致灵敏度为90%,特异度为67%,曲线下面积为0.84,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物11:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的3.1753的截断值导致灵敏度为70%,特异度为78%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物12:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的3.2626的截断值导致灵敏度为70%,特异度为78%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。结论:上述结果示出转录物2、3、8、9、10、11和12在结肠直肠癌的检测和辨别恶性与正常结肠直肠组织中的实用性。如上所讨论的,还发现转录物2和3具有在前列腺癌检测中的实用性。还发现转录物2具有在乳腺癌检测中的实用性。还发现转录物11具有在黑色素瘤皮肤癌检测中的实用性。还发现转录物10具有在肺癌和黑色素瘤检测中的实用性。还发现转录物8具有在肺癌检测中的实用性。所述7种转录物中的任一种可以单独或联合用作在临床环境下检测结肠直肠癌的特征的工具。实施例6:应用于肺癌该研究旨在确定本发明的一些转录物在检测肺癌中的有效性。如实施例5中那样,将9种对照(良性)组织样品(样品1至9)和10种肿瘤(恶性)组织样品(样品10至19)。根据生产商的建议(sampleprocessingkitforfreshorfrozenanimaltissues;和quantigene2.0reagentsystemusermanual)进行均质化。将匀浆以1:8稀释,并且在glomaxtm多检测系统(promega)上测量4种靶转录物和1种持家转录物的量(相对荧光单位rlu)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。制备下列转录物用于该实施例:表8:肺癌转录物的特性该实施例中使用的组织样品具有下列特性:表9:肺癌样品的特性样品恶性评论(组织来源)1否间质性肺病2否肺气肿3否动脉瘤4否支气管肺炎,copd5否肝脏中的恶性肿瘤肺部中的起源未知、钙化肉芽肿瘤6否死后12小时尸检,轻度肺气肿7否死后12小时尸检,大b细胞淋巴瘤,肺水肿,肺炎8否肺炎,水肿,肺泡损害9否充血和水肿10是腺癌,非小细胞11是小细胞12是鳞状细胞癌,nsc,肺气肿13是腺癌,肺癌,nsc,转移性癌14是鳞状细胞癌,非小细胞15是混合性鳞状癌和腺癌16是非小细胞癌,鳞状17是小细胞癌18是腺癌,肺癌,nsc19是腺癌,肺癌,nsc,转移性癌根据实施例5中所述的方法来进行数据分析。结果示于图7a、7b、7c和7d中。结果概述:转录物6:在正常组(p<0.1)和恶性组(p=0.06)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-6.5691的截断值导致灵敏度为80%,特异度为71%,曲线下面积为0.77,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物8:在正常组(p<0.05)和恶性组(p=0.02)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-9.6166的截断值导致灵敏度为90%,特异度为86%,曲线下面积为0.86,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物10:在正常组(p<0.01)和恶性组(p=0.01)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-10.6717的截断值导致灵敏度为90%,特异度为86%,曲线下面积为0.89,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物20:在正常组(p<0.1)和恶性组(p=0.1)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的2.5071的截断值导致灵敏度为70%,特异度为71%,曲线下面积为0.74,这表明一般的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。结论:实施例6的结果示出本发明的转录物6、8、10和20在肺癌肿瘤的检测和辨别恶性与正常肺组织中的实用性。这些转录物中的任一种可用于在临床环境下检测或表征肺癌。实施例7:应用于黑色素瘤该研究旨在确定本发明的一些转录物在检测黑色素瘤中的有效性。在该研究中,总共使用14种样品,包括5种对照(良性)组织样品和9种恶性组织样品。将所有样品用福尔马林固定和石蜡包埋(ffpe)。将ffpe组织样品切到管中,并且根据生产商的建议(sampleprocessingkitforffpesamples;和quantigene2.0reagentsystemusermanual)进行均质化,使得在均质化前各样品约20微米。将匀浆以1∶4稀释,并且在glomaxtm多检测系统(promega)上测量7种靶转录物和1种持家转录物的量(相对荧光单位rlu)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。该实施例中使用的14种组织样品具有下列特性:表10:黑色素瘤癌样品的特征样品恶性评论(组织来源)1否乳腺缩小组织(皮肤)2否乳腺缩小组织(皮肤)3否乳腺缩小组织(皮肤)4否乳腺缩小组织(皮肤)5否乳腺缩小组织(皮肤)6是恶性雀斑样(黑色素瘤,原位)不存在侵袭性黑色素瘤7是侵袭性雀斑样黑色素瘤8是结节性雀斑样黑色素瘤,pt3b,恶性雀斑样痣黑素瘤的有关特征9是残余浅表扩散性、侵袭性雀斑样黑色素瘤,clark水平ii10是浅表扩散性恶性黑色素瘤,clark水平ii11是结节性恶性黑色素瘤,clark水平iv12是浅表扩散性恶性黑色素瘤,原位,没有侵袭性证据13是浅表扩散性恶性黑色素瘤,clark水平ii,局部存在垂直相14是浅表扩散性恶性黑色素瘤,原位,clark水平i为该实施例制备下列转录物:表11:黑色素瘤癌转录物的特征如所述,转录物10和11也在实施例5中使用。根据实施例5中描述的方法来进行数据分析。结果示于图8a-8g。结果概述:转录物6:在正常组(p<0.01)和恶性组(p=0.01)的平均值之间存在统计上显著性差异。此外,使用通过roc曲线证实的-5.9531的截断值导致灵敏度为89%,特异度为80%,曲线下面积为0.96,这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物10:在正常组(p<0.05)和恶性组(p=0.05)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-4.7572的截断值导致灵敏度为89%,特异度为40%,曲线下面积为0.82,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物11:在正常组(p<0.05)和恶性组(p=0.02)的平均值之间存在统计上显著性差异。此外,使用通过roc曲线证实的1.6762的截断值导致灵敏度为78%,特异度为100%,曲线下面积为0.89,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物14:在正常组(p<0.05)和恶性组(p=0.05)的平均值之间存在统计上显著性差异。此外,使用通过roc曲线证实的-4.9118的截断值导致灵敏度为89%,特异度为60%,曲线下面积为0.82,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物15:在正常组(p<0.1)和恶性组(p=0.07)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-7.3107的截断值导致灵敏度为100%,特异度为67%,曲线下面积为0.80,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物16:在正常组(p<0.05)和恶性组(p=0.03)的平均值之间存在统计上显著性差异。此外,使用通过roc曲线证实的-10.5963的截断值导致灵敏度为89%,特异度为80%,曲线下面积为0.878,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物20:在正常组(p<0.05)和恶性组(p=0.04)的平均值之间存在统计上显著性差异。此外,使用通过roc曲线证实的-8.3543的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.89,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。结论:实施例7的结果示出本发明的转录物6、10、11、14、15、16和20在恶性黑色素瘤的检测中的实用性。如上所示,还发现转录物10和11具有在结肠直肠癌的检测中的实用性,而转录物6具有在肺癌的检测中的实用性。表6中提供了通过疾病进行的转录物概述。实施例8:应用于卵巢癌该研究旨在确定本发明的一些转录物在检测卵巢癌中的有效性。总共制备20种样品,包括10种对照(良性)组织样品(样品1至10)和10种肿瘤(恶性)组织样品(样品11至20)。根据生产商的建议(sampleprocessingkitforfreshorfrozenanimaltissues;和quantigene2.0reagentsystemusermanual)将样品均质化。以上述实施例中列出的方式制备8种靶转录物和1种持家转录物。该实施例中使用的20种组织样品具有下列特性:表12:卵巢癌样品的特性样品诊断评论1正常卵泡囊肿2正常纤维瘤3正常卵巢没有病理变化4正常卵泡囊肿5正常细胞纤维瘤6正常良性卵泡简单囊肿7正常子宫肌瘤,乳头状体8正常乳头状体和上皮包含性囊肿9正常乳头状体10正常乳头状体,表面包含性囊肿卵泡囊肿11恶性高级、较少分化、严重乳突癌,包括网膜12恶性子宫内膜样腺癌,适度分化,并且具有局部严重分化13恶性严重乳突癌14恶性混合性上皮癌,主要是严重乳突癌15恶性高度:严重的癌症,乳突和固体生长图案16恶性高度(3/3)严重乳突癌17恶性严重乳突癌,高度细胞核分化18恶性严重乳突囊肿钳,级别:iii19恶性较少分化、严重乳突癌20恶性适度分化的腺细胞癌,子宫内膜型,级别1转录物的特性概述如下:表13:卵巢癌转录物的特性应注意,转录物1、2、3、6、11、12、15和20和上面涉及实施例3-7而讨论的那些相同。使用25mg的冷冻组织制备匀浆并以1∶4稀释。在glomaxtm多检测系统(promega)上测量转录物的量(相对荧光单位rlu)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的rlu值中减去下限来分析计算背景。通过使用式log2arlu-log2hrlu来计算输入rna,其中a是靶融合转录物,并且h是持家转录物。数据分析包括下列步骤:a)确定三次测定的cv(变异系数),如果≤15%则可接受。b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均rlu值。c)从背景rlu的三个值中确定下限(i)。d)从(a)中减去下限(i)。e)计算log2arlu-log2hrlu。结果概述:上述分析的结果示于图9a至9h中,其包括log2arlu-log2hrlu对样品数的图。还示出从各转录物的结果中确定的各roc(接受者工作特征)曲线。转录物1:在正常组(p<0.05)和恶性组(p=0.002)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-11.1503的截断值导致灵敏度为90%,特异度为80%,曲线下面积为0.91,这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物2:在正常组(p<0.10)和恶性组(p=0.001)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的0.6962的截断值导致灵敏度为90%,特异度为100%,曲线下面积为0.96,这表明非常良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物3:在正常组(p<0.01)和恶性组(p=0.000)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的0.6754的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物6:在正常组(p<0.01)和恶性组(p=0.007)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-9.6479的截断值导致灵敏度为90%,特异度为70%,曲线下面积为0.86,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物11:在正常组(p<0.01)和恶性组(p=0.000)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-1.3794的截断值导致灵敏度为100%,特异度为90%,曲线下面积为0.99,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物12:在正常组(p<0.01)和恶性组(p=0.001)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-1.2379的截断值导致灵敏度为90%,特异度为100%,曲线下面积为0.96,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物15:在正常组(p<0.05)和恶性组(p=0.023)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-8.6926的截断值导致灵敏度为70%,特异度为80%,曲线下面积为0.80,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物20:在正常组(p<0.01)和恶性组(p=0.000)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的0.6521的截断值导致灵敏度为100%,特异度为100%,曲线下面积为0.76,这表明一般至良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。结论:上述结果示出转录物1、2、3、6、11、12、15和20在卵巢癌的检测和辨别恶性与正常卵巢组织中的中的实用性。还发现转录物1、2和3具有在前列腺癌的检测中的实用性。还发现转录物6具有在黑色素瘤和肺癌的检测中的实用性。还发现转录物11具有在黑色素瘤皮肤癌、结肠直肠癌和睾丸癌的检测中的实用性。还发现转录物12具有在结肠直肠癌和睾丸癌的检测中的实用性。还发现转录物15具有在黑色素瘤和睾丸癌的检测中的实用性。还发现转录物20具有在结肠直肠癌、黑色素瘤、和睾丸癌的检测中的实用性。所述8种转录物中的任一种可以单独或联合用作在临床环境下检测或表征卵巢癌的工具。实施例9:应用于睾丸癌该研究旨在确定本发明的一些转录物在检测睾丸癌中的有效性。总共制备17种样品,包括8种对照(良性)组织样品(样品1至8)和和9种肿瘤(恶性)组织样品(样品9至17)。恶性样品中的5种为非精原细胞瘤(样品9-13),4种为精原细胞瘤(样品14-17)。根据生产商的建议(sampleprocessingkitforfreshorfrozenanimaltissues;和quantigene2.0reagentsystemusermanual)将样品均质化。以上述实施例中列出的方式制备10种靶转录物和1种持家转录物。该实施例中使用的17种组织样品具有下列特性:表14:睾丸癌样品的特性样品通常诊断分层恶性诊断1良性良性2良性良性3良性良性4良性良性5良性良性6良性良性7良性良性8良性良性9恶性非精原细胞瘤10恶性非精原细胞瘤11恶性非精原细胞瘤12恶性非精原细胞瘤13恶性非精原细胞瘤14恶性精原细胞瘤15恶性精原细胞瘤16恶性精原细胞瘤17恶性精原细胞瘤转录物的特性概述如下:表15:睾丸癌转录物的特性转录物id连接位点基因连接210744:14124nd4l:nd537974:15496coii:cytb47992:15730coii:cytb117775:13532coii:nd5128213:13991coii:nd5139144:13816腺苷三磷酸酶6:nd5159574:12972coiii:nd51610367:12829nd3:nd5208469:13447腺苷三磷酸酶8:nd5肽基脯氨酸异构酶b(ppib)n/an/a应注意,转录物2、3、4、7、11、12、15、16和20和上面涉及实施例3-8而讨论的那些相同。使用25mg的冷冻组织制备匀浆并以1∶4稀释。在glomaxtm多检测系统(promega)上测量转录物的量(相对荧光单位rlu)。对于每种转录物,所有样品测定3次。也进行3次背景测量(无模板)。通过从样品的rlu值中减去下限来分析计算背景。通过使用式log2arlu-log2hrlu来计算输入rna,其中a是靶融合转录物,并且h是持家转录物。数据分析包括下列步骤:a)确定三次测定的cv(变异系数),如果≤15%则可接受。b)确定靶融合转录物(a)和持家转录物(h)三次测定的平均rlu值。c)从背景rlu的三个值中确定下限(i)。d)从(a)中减去下限(i)。e)计算log2arlu-log2hrlu。结果概述:上述分析的结果示于图10a-图10b至图18a-图18b中,其包括log2arlu-log2hrlu对样品数的图。还示出从各转录物的结果中确定的各roc(接受者工作特征)曲线。尽管一些转录物辨别良性和恶性睾丸组织,但是其他转录物证实了精原细胞瘤和非精原细胞瘤的肿瘤亚型和/或良性睾丸组织之间的区别。因此预计,联合各类的转录物将不仅促进睾丸癌的检测,还促进将其分类成精原细胞瘤或非精原细胞瘤的亚型。转录物2:在正常组(p<0.05)和恶性精原细胞瘤组(p=0.02)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的1.5621的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.024)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的2.1006的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.90,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物3:在正常组(p<0.05)和恶性精原细胞瘤组(p=0.018)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的0.969的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.969,这表明优异的精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.017)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的1.8181的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.9,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物4:在正常组(p<0.05)和恶性组(p=0.034)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-9.7628的截断值导致灵敏度为67%,特异度为100%,曲线下面积为0.833,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物11:在正常组(p<0.05)和恶性精原细胞瘤组(p=0.016)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的0.732的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.016)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的0.9884的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.90,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物12:在正常组(p<0.1)和恶性精原细胞瘤组(p=0.056)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的1.5361的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.969,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.05)和恶性非精原细胞瘤(p=0.044)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的1.6039的截断值导致灵敏度为100%,特异度为80%,曲线下面积为0.9,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物13:在正常组(p<0.05)和恶性组(p=0.019)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-9.8751的截断值导致灵敏度为87.5%,特异度为78%,曲线下面积为0.875,这表明非常良好的检验精确度。在恶性非精原细胞瘤组(p<0.01)和良性组(p=0.000)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的-13.9519的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.975,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.01)和恶性非精原细胞瘤(p=0.001)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的-15.8501的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物15:在正常组(p<0.1)和恶性组(p=0.065)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-5.4916的截断值导致灵敏度为75%,特异度为89%,曲线下面积为0.835,这表明良好的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物16:在正常组(p<0.05)和恶性组(包括精原细胞瘤和非精原细胞瘤)(p=0.037)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的-6.448的截断值导致灵敏度为89%,特异度为75%,曲线下面积为0.806,这表明良好的检验精确度。在正常(p<0.05)和恶性精原细胞瘤(p=0.037)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的-7.4575的截断值导致灵敏度为100%,特异度为87.5%,曲线下面积为0.938,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。转录物20:在正常组(p<0.01)和恶性精原细胞瘤组(p=0.006)的平均值之间存在统计上显著性差异。使用通过roc曲线证实的1.8364的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。在恶性精原细胞瘤(p<0.01)和恶性非精原细胞瘤(p=0.004)的平均值之间也存在统计上显著性差异。使用通过roc曲线证实的1.6065的截断值导致灵敏度为100%,特异度为100%,曲线下面积为1.00,这表明优异的检验精确度。可以调节选择的阈值以增加用于特定应用的检验的特异度或灵敏度。结论:上述结果示出转录物2、3、4、11、12、13、15、16和20在睾丸癌和睾丸癌亚型的检测以及辨别恶性和正常睾丸组织中的实用性。还发现转录物2具有在前列腺癌、乳腺癌、结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物3具有在前列腺癌、乳腺癌、黑色素瘤结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物4具有在前列腺癌和结肠直肠癌的检测中的实用性。还发现转录物11具有在结肠直肠癌、黑色素瘤和卵巢癌的检测中的实用性。还发现转录物12具有在结肠直肠癌和卵巢癌的检测中的实用性。还发现转录物15具有在黑色素瘤和卵巢癌的检测中的实用性。还发现转录物16具有在黑色素瘤皮肤癌的检测中的实用性。还发现转录物20具有在结肠直肠癌、黑色素瘤和卵巢癌的检测中的实用性。这些9种转录物中的任一种可在临床环境下单独或联合用作检测或表征睾丸癌的工具。在一个方面中,本发明提供一种试剂盒,其进行测定以确定组织样品中存在癌症。所述试剂盒包括进行上述测定所需要的试剂。特别地,试剂盒包括一种或多种容器,所述容器含有一种或多种对应于上述转录物1至17和20的杂交探针。将理解,用于进行测定的试剂可包括任何必需的缓冲盐、盐、检测试剂等。此外,试剂盒可包括任何必需的样品收集装置、容器等以获得需要的组织样品、试剂或材料,从而通过(例如)均质化或核酸提取来制备组织样品,或为了进行受试者的测定或测定。试剂盒还可包括对照组织或样品以建立或确认用于疾病或非疾病组织的可接受的值。尽管已经参照某些特定实施方案来说明了本发明,但是其各种改变对于本领域普通技术人员来说是显而易见的,只要其不偏离在所附权利要求书中所列出的本发明的精神和范围即可。在本申请中提到的所有的文件(文章、手册、专利申请等)都通过引用的方式并入本文。参考文献目录其中,下列文献在上述说明中引用。这些文献的全部内容都通过引用的方式并入本文。表1:已知具有orf的线粒体缺失表6:通过疾病进行的转录物概述序列表<110>mdna生命科学有限公司<120>异常线粒体dna、相关的融合转录物及其杂交探针<130>pw69153sean<140>pct/ca2009/000351<141>2009-03-27<150>61/040,616<151>2008-03-28<160>52<170>patentinversion3.3<210>1<211>16568<212>dna<213>人<400>1gatcacaggtctatcaccctattaaccactcacgggagctctccatgcatttggtatttt60cgtctggggggtatgcacgcgatagcattgcgagacgctggagccggagcaccctatgtc120gcagtatctgtctttgattcctgcctcatcctattatttatcgcacctacgttcaatatt180acaggcgaacatacttactaaagtgtgttaattaattaatgcttgtaggacataataata240acaattgaatgtctgcacagccactttccacacagacatcataacaaaaaatttccacca300aaccccccctcccccgcttctggccacagcacttaaacacatctctgccaaaccccaaaa360acaaagaaccctaacaccagcctaaccagatttcaaattttatcttttggcggtatgcac420ttttaacagtcaccccccaactaacacattattttcccctcccactcccatactactaat480ctcatcaatacaacccccgcccatcctacccagcacacacacaccgctgctaaccccata540ccccgaaccaaccaaaccccaaagacaccccccacagtttatgtagcttacctcctcaaa600gcaatacactgaaaatgtttagacgggctcacatcaccccataaacaaataggtttggtc660ctagcctttctattagctcttagtaagattacacatgcaagcatccccgttccagtgagt720tcaccctctaaatcaccacgatcaaaaggaacaagcatcaagcacgcagcaatgcagctc780aaaacgcttagcctagccacacccccacgggaaacagcagtgattaacctttagcaataa840acgaaagtttaactaagctatactaaccccagggttggtcaatttcgtgccagccaccgc900ggtcacacgattaacccaagtcaatagaagccggcgtaaagagtgttttagatcaccccc960tccccaataaagctaaaactcacctgagttgtaaaaaactccagttgacacaaaatagac1020tacgaaagtggctttaacatatctgaacacacaatagctaagacccaaactgggattaga1080taccccactatgcttagccctaaacctcaacagttaaatcaacaaaactgctcgccagaa1140cactacgagccacagcttaaaactcaaaggacctggcggtgcttcatatccctctagagg1200agcctgttctgtaatcgataaaccccgatcaacctcaccacctcttgctcagcctatata1260ccgccatcttcagcaaaccctgatgaaggctacaaagtaagcgcaagtacccacgtaaag1320acgttaggtcaaggtgtagcccatgaggtggcaagaaatgggctacattttctaccccag1380aaaactacgatagcccttatgaaacttaagggtcgaaggtggatttagcagtaaactaag1440agtagagtgcttagttgaacagggccctgaagcgcgtacacaccgcccgtcaccctcctc1500aagtatacttcaaaggacatttaactaaaacccctacgcatttatatagaggagacaagt1560cgtaacatggtaagtgtactggaaagtgcacttggacgaaccagagtgtagcttaacaca1620aagcacccaacttacacttaggagatttcaacttaacttgaccgctctgagctaaaccta1680gccccaaacccactccaccttactaccagacaaccttagccaaaccatttacccaaataa1740agtataggcgatagaaattgaaacctggcgcaatagatatagtaccgcaagggaaagatg1800aaaaattataaccaagcataatatagcaaggactaacccctataccttctgcataatgaa1860ttaactagaaataactttgcaaggagagccaaagctaagacccccgaaaccagacgagct1920acctaagaacagctaaaagagcacacccgtctatgtagcaaaatagtgggaagatttata1980ggtagaggcgacaaacctaccgagcctggtgatagctggttgtccaagatagaatcttag2040ttcaactttaaatttgcccacagaaccctctaaatccccttgtaaatttaactgttagtc2100caaagaggaacagctctttggacactaggaaaaaaccttgtagagagagtaaaaaattta2160acacccatagtaggcctaaaagcagccaccaattaagaaagcgttcaagctcaacaccca2220ctacctaaaaaatcccaaacatataactgaactcctcacacccaattggaccaatctatc2280accctatagaagaactaatgttagtataagtaacatgaaaacattctcctccgcataagc2340ctgcgtcagattaaaacactgaactgacaattaacagcccaatatctacaatcaaccaac2400aagtcattattaccctcactgtcaacccaacacaggcatgctcataaggaaaggttaaaa2460aaagtaaaaggaactcggcaaatcttaccccgcctgtttaccaaaaacatcacctctagc2520atcaccagtattagaggcaccgcctgcccagtgacacatgtttaacggccgcggtaccct2580aaccgtgcaaaggtagcataatcacttgttccttaaatagggacctgtatgaatggctcc2640acgagggttcagctgtctcttacttttaaccagtgaaattgacctgcccgtgaagaggcg2700ggcataacacagcaagacgagaagaccctatggagctttaatttattaatgcaaacagta2760cctaacaaacccacaggtcctaaactaccaaacctgcattaaaaatttcggttggggcga2820cctcggagcagaacccaacctccgagcagtacatgctaagacttcaccagtcaaagcgaa2880ctactatactcaattgatccaataacttgaccaacggaacaagttaccctagggataaca2940gcgcaatcctattctagagtccatatcaacaatagggtttacgacctcgatgttggatca3000ggacatcccgatggtgcagccgctattaaaggttcgtttgttcaacgattaaagtcctac3060gtgatctgagttcagaccggagtaatccaggtcggtttctatctacttcaaattcctccc3120tgtacgaaaggacaagagaaataaggcctacttcacaaagcgccttcccccgtaaatgat3180atcatctcaacttagtattatacccacacccacccaagaacagggtttgttaagatggca3240gagcccggtaatcgcataaaacttaaaactttacagtcagaggttcaattcctcttctta3300acaacatacccatggccaacctcctactcctcattgtacccattctaatcgcaatggcat3360tcctaatgcttaccgaacgaaaaattctaggctatatacaactacgcaaaggccccaacg3420ttgtaggcccctacgggctactacaacccttcgctgacgccataaaactcttcaccaaag3480agcccctaaaacccgccacatctaccatcaccctctacatcaccgccccgaccttagctc3540tcaccatcgctcttctactatgaacccccctccccatacccaaccccctggtcaacctca3600acctaggcctcctatttattctagccacctctagcctagccgtttactcaatcctctgat3660cagggtgagcatcaaactcaaactacgccctgatcggcgcactgcgagcagtagcccaaa3720caatctcatatgaagtcaccctagccatcattctactatcaacattactaataagtggct3780cctttaacctctccacccttatcacaacacaagaacacctctgattactcctgccatcat3840gacccttggccataatatgatttatctccacactagcagagaccaaccgaacccccttcg3900accttgccgaaggggagtccgaactagtctcaggcttcaacatcgaatacgccgcaggcc3960ccttcgccctattcttcatagccgaatacacaaacattattataataaacaccctcacca4020ctacaatcttcctaggaacaacatatgacgcactctcccctgaactctacacaacatatt4080ttgtcaccaagaccctacttctaacctccctgttcttatgaattcgaacagcataccccc4140gattccgctacgaccaactcatacacctcctatgaaaaaacttcctaccactcaccctag4200cattacttatatgatatgtctccatacccattacaatctccagcattccccctcaaacct4260aagaaatatgtctgataaaagagttactttgatagagtaaataataggagcttaaacccc4320cttatttctaggactatgagaatcgaacccatccctgagaatccaaaattctccgtgcca4380cctatcacaccccatcctaaagtaaggtcagctaaataagctatcgggcccataccccga4440aaatgttggttatacccttcccgtactaattaatcccctggcccaacccgtcatctactc4500taccatctttgcaggcacactcatcacagcgctaagctcgcactgattttttacctgagt4560aggcctagaaataaacatgctagcttttattccagttctaaccaaaaaaataaaccctcg4620ttccacagaagctgccatcaagtatttcctcacgcaagcaaccgcatccataatccttct4680aatagctatcctcttcaacaatatactctccggacaatgaaccataaccaatactaccaa4740tcaatactcatcattaataatcataatagctatagcaataaaactaggaatagccccctt4800tcacttctgagtcccagaggttacccaaggcacccctctgacatccggcctgcttcttct4860cacatgacaaaaactagcccccatctcaatcatataccaaatctctccctcactaaacgt4920aagccttctcctcactctctcaatcttatccatcatagcaggcagttgaggtggattaaa4980ccaaacccagctacgcaaaatcttagcatactcctcaattacccacataggatgaataat5040agcagttctaccgtacaaccctaacataaccattcttaatttaactatttatattatcct5100aactactaccgcattcctactactcaacttaaactccagcaccacgaccctactactatc5160tcgcacctgaaacaagctaacatgactaacacccttaattccatccaccctcctctccct5220aggaggcctgcccccgctaaccggctttttgcccaaatgggccattatcgaagaattcac5280aaaaaacaatagcctcatcatccccaccatcatagccaccatcaccctccttaacctcta5340cttctacctacgcctaatctactccacctcaatcacactactccccatatctaacaacgt5400aaaaataaaatgacagtttgaacatacaaaacccaccccattcctccccacactcatcgc5460ccttaccacgctactcctacctatctccccttttatactaataatcttatagaaatttag5520gttaaatacagaccaagagccttcaaagccctcagtaagttgcaatacttaatttctgta5580acagctaaggactgcaaaaccccactctgcatcaactgaacgcaaatcagccactttaat5640taagctaagcccttactagaccaatgggacttaaacccacaaacacttagttaacagcta5700agcaccctaatcaactggcttcaatctacttctcccgccgccgggaaaaaaggcgggaga5760agccccggcaggtttgaagctgcttcttcgaatttgcaattcaatatgaaaatcacctcg5820gagctggtaaaaagaggcctaacccctgtctttagatttacagtccaatgcttcactcag5880ccattttacctcacccccactgatgttcgccgaccgttgactattctctacaaaccacaa5940agacattggaacactatacctattattcggcgcatgagctggagtcctaggcacagctct6000aagcctccttattcgagccgagctgggccagccaggcaaccttctaggtaacgaccacat6060ctacaacgttatcgtcacagcccatgcatttgtaataatcttcttcatagtaatacccat6120cataatcggaggctttggcaactgactagttcccctaataatcggtgcccccgatatggc6180gtttccccgcataaacaacataagcttctgactcttacctccctctctcctactcctgct6240cgcatctgctatagtggaggccggagcaggaacaggttgaacagtctaccctcccttagc6300agggaactactcccaccctggagcctccgtagacctaaccatcttctccttacacctagc6360aggtgtctcctctatcttaggggccatcaatttcatcacaacaattatcaatataaaacc6420ccctgccataacccaataccaaacgcccctcttcgtctgatccgtcctaatcacagcagt6480cctacttctcctatctctcccagtcctagctgctggcatcactatactactaacagaccg6540caacctcaacaccaccttcttcgaccccgccggaggaggagaccccattctataccaaca6600cctattctgatttttcggtcaccctgaagtttatattcttatcctaccaggcttcggaat6660aatctcccatattgtaacttactactccggaaaaaaagaaccatttggatacataggtat6720ggtctgagctatgatatcaattggcttcctagggtttatcgtgtgagcacaccatatatt6780tacagtaggaatagacgtagacacacgagcatatttcacctccgctaccataatcatcgc6840tatccccaccggcgtcaaagtatttagctgactcgccacactccacggaagcaatatgaa6900atgatctgctgcagtgctctgagccctaggattcatctttcttttcaccgtaggtggcct6960gactggcattgtattagcaaactcatcactagacatcgtactacacgacacgtactacgt7020tgtagcccacttccactatgtcctatcaataggagctgtatttgccatcataggaggctt7080cattcactgatttcccctattctcaggctacaccctagaccaaacctacgccaaaatcca7140tttcactatcatattcatcggcgtaaatctaactttcttcccacaacactttctcggcct7200atccggaatgccccgacgttactcggactaccccgatgcatacaccacatgaaacatcct7260atcatctgtaggctcattcatttctctaacagcagtaatattaataattttcatgatttg7320agaagccttcgcttcgaagcgaaaagtcctaatagtagaagaaccctccataaacctgga7380gtgactatatggatgccccccaccctaccacacattcgaagaacccgtatacataaaatc7440tagacaaaaaaggaaggaatcgaaccccccaaagctggtttcaagccaaccccatggcct7500ccatgactttttcaaaaaggtattagaaaaaccatttcataactttgtcaaagttaaatt7560ataggctaaatcctatatatcttaatggcacatgcagcgcaagtaggtctacaagacgct7620acttcccctatcatagaagagcttatcacctttcatgatcacgccctcataatcattttc7680cttatctgcttcctagtcctgtatgcccttttcctaacactcacaacaaaactaactaat7740actaacatctcagacgctcaggaaatagaaaccgtctgaactatcctgcccgccatcatc7800ctagtcctcatcgccctcccatccctacgcatcctttacataacagacgaggtcaacgat7860ccctcccttaccatcaaatcaattggccaccaatggtactgaacctacgagtacaccgac7920tacggcggactaatcttcaactcctacatacttcccccattattcctagaaccaggcgac7980ctgcgactccttgacgttgacaatcgagtagtactcccgattgaagcccccattcgtata8040ataattacatcacaagacgtcttgcactcatgagctgtccccacattaggcttaaaaaca8100gatgcaattcccggacgtctaaaccaaaccactttcaccgctacacgaccgggggtatac8160tacggtcaatgctctgaaatctgtggagcaaaccacagtttcatgcccatcgtcctagaa8220ttaattcccctaaaaatctttgaaatagggcccgtatttaccctatagcaccccctctac8280cccctctagagcccactgtaaagctaacttagcattaaccttttaagttaaagattaaga8340gaaccaacacctctttacagtgaaatgccccaactaaatactaccgtatggcccaccata8400attacccccatactccttacactattcctcatcacccaactaaaaatattaaacacaaac8460taccacctacctccctcaccaaagcccataaaaataaaaaattataacaaaccctgagaa8520ccaaaatgaacgaaaatctgttcgcttcattcattgcccccacaatcctaggcctacccg8580ccgcagtactgatcattctatttccccctctattgatccccacctccaaatatctcatca8640acaaccgactaatcaccacccaacaatgactaatcaaactaacctcaaaacaaatgataa8700ccatacacaacactaaaggacgaacctgatctcttatactagtatccttaatcattttta8760ttgccacaactaacctcctcggactcctgcctcactcatttacaccaaccacccaactat8820ctataaacctagccatggccatccccttatgagcgggcacagtgattataggctttcgct8880ctaagattaaaaatgccctagcccacttcttaccacaaggcacacctacaccccttatcc8940ccatactagttattatcgaaaccatcagcctactcattcaaccaatagccctggccgtac9000gcctaaccgctaacattactgcaggccacctactcatgcacctaattggaagcgccaccc9060tagcaatatcaaccattaaccttccctctacacttatcatcttcacaattctaattctac9120tgactatcctagaaatcgctgtcgccttaatccaagcctacgttttcacacttctagtaa9180gcctctacctgcacgacaacacataatgacccaccaatcacatgcctatcatatagtaaa9240acccagcccatgacccctaacaggggccctctcagccctcctaatgacctccggcctagc9300catgtgatttcacttccactccataacgctcctcatactaggcctactaaccaacacact9360aaccatataccaatgatggcgcgatgtaacacgagaaagcacataccaaggccaccacac9420accacctgtccaaaaaggccttcgatacgggataatcctatttattacctcagaagtttt9480tttcttcgcaggatttttctgagccttttaccactccagcctagcccctaccccccaatt9540aggagggcactggcccccaacaggcatcaccccgctaaatcccctagaagtcccactcct9600aaacacatccgtattactcgcatcaggagtatcaatcacctgagctcaccatagtctaat9660agaaaacaaccgaaaccaaataattcaagcactgcttattacaattttactgggtctcta9720ttttaccctcctacaagcctcagagtacttcgagtctcccttcaccatttccgacggcat9780ctacggctcaacattttttgtagccacaggcttccacggacttcacgtcattattggctc9840aactttcctcactatctgcttcatccgccaactaatatttcactttacatccaaacatca9900ctttggcttcgaagccgccgcctgatactggcattttgtagatgtggtttgactatttct9960gtatgtctccatctattgatgagggtcttactcttttagtataaatagtaccgttaactt10020ccaattaactagttttgacaacattcaaaaaagagtaataaacttcgccttaattttaat10080aatcaacaccctcctagccttactactaataattattacattttgactaccacaactcaa10140cggctacatagaaaaatccaccccttacgagtgcggcttcgaccctatatcccccgcccg10200cgtccctttctccataaaattcttcttagtagctattaccttcttattatttgatctaga10260aattgccctccttttacccctaccatgagccctacaaacaactaacctgccactaatagt10320tatgtcatccctcttattaatcatcatcctagccctaagtctggcctatgagtgactaca10380aaaaggattagactgaaccgaattggtatatagtttaaacaaaacgaatgatttcgactc10440attaaattatgataatcatatttaccaaatgcccctcatttacataaatattatactagc10500atttaccatctcacttctaggaatactagtatatcgctcacacctcatatcctccctact10560atgcctagaaggaataatactatcgctgttcattatagctactctcataaccctcaacac10620ccactccctcttagccaatattgtgcctattgccatactagtctttgccgcctgcgaagc10680agcggtgggcctagccctactagtctcaatctccaacacatatggcctagactacgtaca10740taacctaaacctactccaatgctaaaactaatcgtcccaacaattatattactaccactg10800acatgactttccaaaaaacacataatttgaatcaacacaaccacccacagcctaattatt10860agcatcatccctctactattttttaaccaaatcaacaacaacctatttagctgttcccca10920accttttcctccgaccccctaacaacccccctcctaatactaactacctgactcctaccc10980ctcacaatcatggcaagccaacgccacttatccagtgaaccactatcacgaaaaaaactc11040tacctctctatactaatctccctacaaatctccttaattataacattcacagccacagaa11100ctaatcatattttatatcttcttcgaaaccacacttatccccaccttggctatcatcacc11160cgatgaggcaaccagccagaacgcctgaacgcaggcacatacttcctattctacacccta11220gtaggctcccttcccctactcatcgcactaatttacactcacaacaccctaggctcacta11280aacattctactactcactctcactgcccaagaactatcaaactcctgagccaacaactta11340atatgactagcttacacaatagcttttatagtaaagatacctctttacggactccactta11400tgactccctaaagcccatgtcgaagcccccatcgctgggtcaatagtacttgccgcagta11460ctcttaaaactaggcggctatggtataatacgcctcacactcattctcaaccccctgaca11520aaacacatagcctaccccttccttgtactatccctatgaggcataattataacaagctcc11580atctgcctacgacaaacagacctaaaatcgctcattgcatactcttcaatcagccacata11640gccctcgtagtaacagccattctcatccaaaccccctgaagcttcaccggcgcagtcatt11700ctcataatcgcccacgggcttacatcctcattactattctgcctagcaaactcaaactac11760gaacgcactcacagtcgcatcataatcctctctcaaggacttcaaactctactcccacta11820atagctttttgatgacttctagcaagcctcgctaacctcgccttaccccccactattaac11880ctactgggagaactctctgtgctagtaaccacgttctcctgatcaaatatcactctccta11940cttacaggactcaacatactagtcacagccctatactccctctacatatttaccacaaca12000caatggggctcactcacccaccacattaacaacataaaaccctcattcacacgagaaaac12060accctcatgttcatacacctatcccccattctcctcctatccctcaaccccgacatcatt12120accgggttttcctcttgtaaatatagtttaaccaaaacatcagattgtgaatctgacaac12180agaggcttacgaccccttatttaccgagaaagctcacaagaactgctaactcatgccccc12240atgtctaacaacatggctttctcaacttttaaaggataacagctatccattggtcttagg12300ccccaaaaattttggtgcaactccaaataaaagtaataaccatgcacactactataacca12360ccctaaccctgacttccctaattccccccatccttaccaccctcgttaaccctaacaaaa12420aaaactcatacccccattatgtaaaatccattgtcgcatccacctttattatcagtctct12480tccccacaacaatattcatgtgcctagaccaagaagttattatctcgaactgacactgag12540ccacaacccaaacaacccagctctccctaagcttcaaactagactacttctccataatat12600tcatccctgtagcattgttcgttacatggtccatcatagaattctcactgtgatatataa12660actcagacccaaacattaatcagttcttcaaatatctactcatcttcctaattaccatac12720taatcttagttaccgctaacaacctattccaactgttcatcggctgagagggcgtaggaa12780ttatatccttcttgctcatcagttgatgatacgcccgagcagatgccaacacagcagcca12840ttcaagcaatcctatacaaccgtatcggcgatatcggtttcatcctcgccttagcatgat12900ttatcctacactccaactcatgagacccacaacaaatagcccttctaaacgctaatccaa12960gcctcaccccactactaggcctcctcctagcagcagcaggcaaatcagcccaattaggtc13020tccacccctgactcccctcagccatagaaggccccaccccagtctcagccctactccact13080caagcactatagttgtagcaggaatcttcttactcatccgcttccaccccctagcagaaa13140atagcccactaatccaaactctaacactatgcttaggcgctatcaccactctgttcgcag13200cagtctgcgcccttacacaaaatgacatcaaaaaaatcgtagccttctccacttcaagtc13260aactaggactcataatagttacaatcggcatcaaccaaccacacctagcattcctgcaca13320tctgtacccacgccttcttcaaagccatactatttatgtgctccgggtccatcatccaca13380accttaacaatgaacaagatattcgaaaaataggaggactactcaaaaccatacctctca13440cttcaacctccctcaccattggcagcctagcattagcaggaatacctttcctcacaggtt13500tctactccaaagaccacatcatcgaaaccgcaaacatatcatacacaaacgcctgagccc13560tatctattactctcatcgctacctccctgacaagcgcctatagcactcgaataattcttc13620tcaccctaacaggtcaacctcgcttccccacccttactaacattaacgaaaataacccca13680ccctactaaaccccattaaacgcctggcagccggaagcctattcgcaggatttctcatta13740ctaacaacatttcccccgcatcccccttccaaacaacaatccccctctacctaaaactca13800cagccctcgctgtcactttcctaggacttctaacagccctagacctcaactacctaacca13860acaaacttaaaataaaatccccactatgcacattttatttctccaacatactcggattct13920accctagcatcacacaccgcacaatcccctatctaggccttcttacgagccaaaacctgc13980ccctactcctcctagacctaacctgactagaaaagctattacctaaaacaatttcacagc14040accaaatctccacctccatcatcacctcaacccaaaaaggcataattaaactttacttcc14100tctctttcttcttcccactcatcctaaccctactcctaatcacataacctattcccccga14160gcaatctcaattacaatatatacaccaacaaacaatgttcaaccagtaactactactaat14220caacgcccataatcatacaaagcccccgcaccaataggatcctcccgaatcaaccctgac14280ccctctccttcataaattattcagcttcctacactattaaagtttaccacaaccaccacc14340ccatcatactctttcacccacagcaccaatcctacctccatcgctaaccccactaaaaca14400ctcaccaagacctcaacccctgacccccatgcctcaggatactcctcaatagccatcgct14460gtagtatatccaaagacaaccatcattccccctaaataaattaaaaaaactattaaaccc14520atataacctcccccaaaattcagaataataacacacccgaccacaccgctaacaatcaat14580actaaacccccataaataggagaaggcttagaagaaaaccccacaaaccccattactaaa14640cccacactcaacagaaacaaagcatacatcattattctcgcacggactacaaccacgacc14700aatgatatgaaaaaccatcgttgtatttcaactacaagaacaccaatgaccccaatacgc14760aaaactaaccccctaataaaattaattaaccactcattcatcgacctccccaccccatcc14820aacatctccgcatgatgaaacttcggctcactccttggcgcctgcctgatcctccaaatc14880accacaggactattcctagccatgcactactcaccagacgcctcaaccgccttttcatca14940atcgcccacatcactcgagacgtaaattatggctgaatcatccgctaccttcacgccaat15000ggcgcctcaatattctttatctgcctcttcctacacatcgggcgaggcctatattacgga15060tcatttctctactcagaaacctgaaacatcggcattatcctcctgcttgcaactatagca15120acagccttcataggctatgtcctcccgtgaggccaaatatcattctgaggggccacagta15180attacaaacttactatccgccatcccatacattgggacagacctagttcaatgaatctga15240ggaggctactcagtagacagtcccaccctcacacgattctttacctttcacttcatcttg15300cccttcattattgcagccctagcaacactccacctcctattcttgcacgaaacgggatca15360aacaaccccctaggaatcacctcccattccgataaaatcaccttccacccttactacaca15420atcaaagacgccctcggcttacttctcttccttctctccttaatgacattaacactattc15480tcaccagacctcctaggcgacccagacaattataccctagccaaccccttaaacacccct15540ccccacatcaagcccgaatgatatttcctattcgcctacacaattctccgatccgtccct15600aacaaactaggaggcgtccttgccctattactatccatcctcatcctagcaataatcccc15660atcctccatatatccaaacaacaaagcataatatttcgcccactaagccaatcactttat15720tgactcctagccgcagacctcctcattctaacctgaatcggaggacaaccagtaagctac15780ccttttaccatcattggacaagtagcatccgtactatacttcacaacaatcctaatccta15840ataccaactatctccctaattgaaaacaaaatactcaaatgggcctgtccttgtagtata15900aactaatacaccagtcttgtaaaccggagatgaaaacctttttccaaggacaaatcagag15960aaaaagtctttaactccaccattagcacccaaagctaagattctaatttaaactattctc16020tgttctttcatggggaagcagatttgggtaccacccaagtattgactcacccatcaacaa16080ccgctatgtatttcgtacattactgccagccaccatgaatattgtacggtaccataaata16140cttgaccacctgtagtacataaaaacccaatccacatcaaaaccccctccccatgcttac16200aagcaagtacagcaatcaaccctcaactatcacacatcaactgcaactccaaagccaccc16260ctcacccactaggataccaacaaacctacccacccttaacagtacatagtacataaagcc16320atttaccgtacatagcacattacagtcaaatcccttctcgtccccatggatgacccccct16380cagataggggtcccttgaccaccatcctccgtgaaatcaatatcccgcacaagagtgcta16440ctctcctcgctccgggcccataacacttgggggtagctaaagtgaactgtatccgacatc16500tggttcctacttcagggtcataaagcctaaatagcccacacgttccccttaaataagaca16560tcacgatg16568<210>2<211>783<212>dna<213>artificial<220><223>cdna<400>2atggcccaccataattacccccatactccttacactattcctcatcacccaactaaaaat60attaaacacaaactaccacctacctccctcaccattggcagcctagcattagcaggaata120cctttcctcacaggtttctactccaaagaccacatcatcgaaaccgcaaacatatcatac180acaaacgcctgagccctatctattactctcatcgctacctccctgacaagcgcctatagc240actcgaataattcttctcaccctaacaggtcaacctcgcttccccacccttactaacatt300aacgaaaataaccccaccctactaaaccccattaaacgcctggcagccggaagcctattc360gcaggatttctcattactaacaacatttcccccgcatcccccttccaaacaacaatcccc420ctctacctaaaactcacagccctcgctgtcactttcctaggacttctaacagccctagac480ctcaactacctaaccaacaaacttaaaataaaatccccactatgcacattttatttctcc540aacatactcggattctaccctagcatcacacaccgcacaatcccctatctaggccttctt600acgagccaaaacctgcccctactcctcctagacctaacctgactagaaaagctattacct660aaaacaatttcacagcaccaaatctccacctccatcatcacctcaacccaaaaaggcata720attaaactttacttcctctctttcttcttcccactcatcctaaccctactcctaatcaca780taa783<210>3<211>300<212>dna<213>artificial<220><223>cdna<400>3atgcccctcatttacataaatattatactagcatttaccatctcacttctaggaatacta60gtatatcgctcacacctcatatcctccctactatgcctagaaggaataatactatcgctg120ttcattatagctactctcataaccctcaacacccactccctcttagccaatattgtgcct180attgccatactagtctttgccgcctgcgaagcagcggtgggcctagccctactagtctca240atctccaacacatatggcctagactacgtacataacctaaccctactcctaatcacataa300<210>4<211>781<212>dna<213>artificial<220><223>cdna<400>4atggcacatgcagcgcaagtaggtctacaagacgctacttcccctatcatagaagagctt60atcacctttcatgatcacgccctcataatcattttccttatctgcttcctagtcctgtat120gcccttttcctaacactcacaacaaaactaactaatactaacatctcagacgctcaggaa180atagaaaccgtctgaactatcctgcccgccatcatcctagtcctcatcgccctcccatcc240ctacgcatcctttacataacagacgaggtcaacgatccctcccttaccatcaaatcaatt300ggccaccaatggtactgaacctacgagtacaccgactacggcggactaatcttcaactcc360tacatacttcccccattattcctagaaccaggcgacccagacaattataccctagccaac420cccttaaacacccctccccacatcaagcccgaatgatatttcctattcgcctacacaatt480ctccgatccgtccctaacaaactaggaggcgtccttgccctattactatccatcctcatc540ctagcaataatccccatcctccatatatccaaacaacaaagcataatatttcgcccacta600agccaatcactttattgactcctagccgcagacctcctcattctaacctgaatcggagga660caaccagtaagctacccttttaccatcattggacaagtagcatccgtactatacttcaca720acaatcctaatcctaataccaactatctccctaattgaaaacaaaatactcaaatgggcc780t781<210>5<211>565<212>dna<213>artificial<220><223>cdna<400>5atggcacatgcagcgcaagtaggtctacaagacgctacttcccctatcatagaagagctt60atcacctttcatgatcacgccctcataatcattttccttatctgcttcctagtcctgtat120gcccttttcctaacactcacaacaaaactaactaatactaacatctcagacgctcaggaa180atagaaaccgtctgaactatcctgcccgccatcatcctagtcctcatcgccctcccatcc240ctacgcatcctttacataacagacgaggtcaacgatccctcccttaccatcaaatcaatt300ggccaccaatggtactgaacctacgagtacaccgactacggcggactaatcttcaactcc360tacatacttcccccattattcctagaaccaggcgacctgcgactcctagccgcagacctc420ctcattctaacctgaatcggaggacaaccagtaagctacccttttaccatcattggacaa480gtagcatccgtactatacttcacaacaatcctaatcctaataccaactatctccctaatt540gaaaacaaaatactcaaatgggcct565<210>6<211>1174<212>dna<213>artificial<220><223>cdna<400>6atggcacatgcagcgcaagtaggtctacaagacgctacttcccctatcatagaagagctt60atcacctttcatgatcacgccctcataatcattttccttatctgcttcctagtcctgtat120gcccttttcctaacactcacaacaaaactaactaatactaacatctcagacgctcaggaa180atagaaaccgtctgaactatcctgcccgccatcatcctagtcctcatcgccctcccatcc240ctacgcatcctttacataacagacgaggtcaacgatccctcccttaccatcaaatcaatt300ggccaccaatggtactgaacctacgagtacaccgactacggcggactaatcttcaactcc360tacatacttcccccattattcctagaaccaggcgacctgcgactccttgacgttgacaat420cgagtagtactcccgattgaagcccccattcgtataataattacatcacaagacgtcttg480cactcatgagctgtccccacattaggcttaaaaacagatgcaattcccggacgtctaaac540caaaccactttcaccgctacacgaccgggggtatactacggtcaatgctctgaaatctgt600ggagcaaaccacagtttcatgcccatattcttgcacgaaacgggatcaaacaacccccta660ggaatcacctcccattccgataaaatcaccttccacccttactacacaatcaaagacgcc720ctcggcttacttctcttccttctctccttaatgacattaacactattctcaccagacctc780ctaggcgacccagacaattataccctagccaaccccttaaacacccctccccacatcaag840cccgaatgatatttcctattcgcctacacaattctccgatccgtccctaacaaactagga900ggcgtccttgccctattactatccatcctcatcctagcaataatccccatcctccatata960tccaaacaacaaagcataatatttcgcccactaagccaatcactttattgactcctagcc1020gcagacctcctcattctaacctgaatcggaggacaaccagtaagctacccttttaccatc1080attggacaagtagcatccgtactatacttcacaacaatcctaatcctaataccaactatc1140tccctaattgaaaacaaaatactcaaatgggcct1174<210>7<211>1294<212>dna<213>artificial<220><223>cdna<400>7atgaacgaaaatctgttcgcttcattcattgcccccacaatcctaggcctacccgccgca60gtactgatcattctatttccccctctattgatccccacctccaaatatctcatcaacaac120cgactaatcaccacccaacaatgactaatcaaactaacctcaaaacaaatgataaccata180cacaacactaaaggacgaacctgatctcttatactagtatccttaatcatttttattgcc240acaactaacctcctcggactcctgcctcactcatttacaccaaccacccaactatctata300aacctagccatgcactactcaccagacgcctcaaccgccttttcatcaatcgcccacatc360actcgagacgtaaattatggctgaatcatccgctaccttcacgccaatggcgcctcaata420ttctttatctgcctcttcctacacatcgggcgaggcctatattacggatcatttctctac480tcagaaacctgaaacatcggcattatcctcctgcttgcaactatagcaacagccttcata540ggctatgtcctcccgtgaggccaaatatcattctgaggggccacagtaattacaaactta600ctatccgccatcccatacattgggacagacctagttcaatgaatctgaggaggctactca660gtagacagtcccaccctcacacgattctttacctttcacttcatcttgcccttcattatt720gcagccctagcaacactccacctcctattcttgcacgaaacgggatcaaacaacccccta780ggaatcacctcccattccgataaaatcaccttccacccttactacacaatcaaagacgcc840ctcggcttacttctcttccttctctccttaatgacattaacactattctcaccagacctc900ctaggcgacccagacaattataccctagccaaccccttaaacacccctccccacatcaag960cccgaatgatatttcctattcgcctacacaattctccgatccgtccctaacaaactagga1020ggcgtccttgccctattactatccatcctcatcctagcaataatccccatcctccatata1080tccaaacaacaaagcataatatttcgcccactaagccaatcactttattgactcctagcc1140gcagacctcctcattctaacctgaatcggaggacaaccagtaagctacccttttaccatc1200attggacaagtagcatccgtactatacttcacaacaatcctaatcctaataccaactatc1260tccctaattgaaaacaaaatactcaaatgggcct1294<210>8<211>1228<212>dna<213>artificial<220><223>cdna<400>8atgcccctcatttacataaatattatactagcatttaccatctcacttctaggaatacta60gtatatcgctcacacctcatatcctccctactatgcctagaaggaataatactatcgctg120ttcattatagctactctcataaccctcaacacccactccctcttagccaatattgtgcct180attgccatactagtctttggcgcctgcctgatcctccaaatcaccacaggactattccta240gccatgcactactcaccagacgcctcaaccgccttttcatcaatcgcccacatcactcga300gacgtaaattatggctgaatcatccgctaccttcacgccaatggcgcctcaatattcttt360atctgcctcttcctacacatcgggcgaggcctatattacggatcatttctctactcagaa420acctgaaacatcggcattatcctcctgcttgcaactatagcaacagccttcataggctat480gtcctcccgtgaggccaaatatcattctgaggggccacagtaattacaaacttactatcc540gccatcccatacattgggacagacctagttcaatgaatctgaggaggctactcagtagac600agtcccaccctcacacgattctttacctttcacttcatcttgcccttcattattgcagcc660ctagcaacactccacctcctattcttgcacgaaacgggatcaaacaaccccctaggaatc720acctcccattccgataaaatcaccttccacccttactacacaatcaaagacgccctcggc780ttacttctcttccttctctccttaatgacattaacactattctcaccagacctcctaggc840gacccagacaattataccctagccaaccccttaaacacccctccccacatcaagcccgaa900tgatatttcctattcgcctacacaattctccgatccgtccctaacaaactaggaggcgtc960cttgccctattactatccatcctcatcctagcaataatccccatcctccatatatccaaa1020caacaaagcataatatttcgcccactaagccaatcactttattgactcctagccgcagac1080ctcctcattctaacctgaatcggaggacaaccagtaagctacccttttaccatcattgga1140caagtagcatccgtactatacttcacaacaatcctaatcctaataccaactatctcccta1200attgaaaacaaaatactcaaatgggcct1228<210>9<211>522<212>dna<213>artificial<220><223>cdna<400>9atgttcgccgaccgttgactattctctacaaaccacaaagacattggaacactataccta60ttattcggcgcatgagctggagtcctaggcacagctctaagcctccttattcgagccgag120ctgggccagccaggcaaccttctaggtaacgaccacatctacaacgttatcgtcacagcc180ctcgctgtcactttcctaggacttctaacagccctagacctcaactacctaaccaacaaa240cttaaaataaaatccccactatgcacattttatttctccaacatactcggattctaccct300agcatcacacaccgcacaatcccctatctaggccttcttacgagccaaaacctgccccta360ctcctcctagacctaacctgactagaaaagctattacctaaaacaatttcacagcaccaa420atctccacctccatcatcacctcaacccaaaaaggcataattaaactttacttcctctct480ttcttcttcccactcatcctaaccctactcctaatcacataa522<210>10<211>582<212>dna<213>artificial<220><223>cdna<400>10atgttcgccgaccgttgactattctctacaaaccacaaagacattggaacactataccta60ttattcggcgcatgagctggagtcctaggcacagctctaagcctccttattcgagccgag120ctgggccagccaggcaaccttctaggtaacgaccacatctacaacgttatcgtcacagcc180catgcatttgtaataatcttcttcatagtaatacccatcataatcggaggctttggcaac240tgactagttcccctaataatcggtgcccccgatatggcgtttccccgcataaacaacata300agcttctgactcttacctccctctctcctactcctgctcgcatctgctatagtggaggcc360ggagcaggaacaggttgaacagtctaccctcccttagcagggaactactcccaccctgga420gccctcctagacctaacctgactagaaaagctattacctaaaacaatttcacagcaccaa480atctccacctccatcatcacctcaacccaaaaaggcataattaaactttacttcctctct540ttcttcttcccactcatcctaaccctactcctaatcacataa582<210>11<211>2208<212>dna<213>artificial<220><223>cdna<400>11atgttcgccgaccgttgactattctctacaaaccacaaagacattggaacactataccta60ttattcggcgcatgagctggagtcctaggcacagctctaagcctccttattcgagccgag120ctgggccagccaggcaaccttctaggtaacgaccacatctacaacgttatcgtcacagcc180catgcatttgtaataatcttcttcatagtaatacccatcataatcggaggctttggcaac240tgactagttcccctaataatcggtgcccccgatatggcgtttccccgcataaacaacata300agcttctgactcttacctccctctctcctactcctgctcgcatctgctatagtggaggcc360ggagcaggaacaggttgaacagtctaccctcccttagcagggaactactcccaccctgga420gcctccgtagacctaaccatcttctccttacacctagcaggtgtctcctctatcttaggg480gccatcaatttcatcacaacaattatcaatataaaaccccctgccataacccaataccaa540acgcccctcttcgtctgatccgtcctaatcacagcagtcctacttctcctatctctccca600gtcctagctgctggcatcactatactactaacagaccgcaacctcaacaccaccttcttc660gaccccgccggaggaggagaccccattctataccaacacctattctgatttttcggtcac720cctgaagtttatattcttatcctaccaggcttcggaataatctcccatattgtaacttac780tactccggaaaaaaagaaccatttggatacataggtatggtctgagctatgatatcaatt840ggcttcctagggtttatcgtgtgagcacaccatatatttacagtaggaatagacgtagac900acacgagcatatttcacctccgctaccataatcatcgctatccccaccggcgtcaaagta960tttagctgactcgccacactccacggaagcaatatgaaatgatctgctgcagtgctctga1020gccctaggattcatctttcttttcaccgtaggtggcctgactggcattgtattagcaaac1080tcatcactagacatcgtactacacgacacgtactacgttgtagcccacttccactatgtc1140ctatcaataggagctgtatttgccatcataggaggcttcattcactgatttcccctattc1200tcaggctacaccctagaccaaacctacgccaaaatccatttcactatcatattcatcggc1260gtaaatctaactttcttcccacaacactttctcggcctatccggaatgccccgacgttac1320tcggactaccccgatgcatacaccacatgaaacatcctatcatctgtaggctcattcatt1380tctctaacagcagtaatattaataattttcatgatttgagaagccttcgcttcgaagcga1440aaagtcctaatagtagaagaaccctccataaacctggagtgactatatggatgcccccca1500ccctaccacacattcgaagaacccgtatacataaaagcaggaatacctttcctcacaggt1560ttctactccaaagaccacatcatcgaaaccgcaaacatatcatacacaaacgcctgagcc1620ctatctattactctcatcgctacctccctgacaagcgcctatagcactcgaataattctt1680ctcaccctaacaggtcaacctcgcttccccacccttactaacattaacgaaaataacccc1740accctactaaaccccattaaacgcctggcagccggaagcctattcgcaggatttctcatt1800actaacaacatttcccccgcatcccccttccaaacaacaatccccctctacctaaaactc1860acagccctcgctgtcactttcctaggacttctaacagccctagacctcaactacctaacc1920aacaaacttaaaataaaatccccactatgcacattttatttctccaacatactcggattc1980taccctagcatcacacaccgcacaatcccctatctaggccttcttacgagccaaaacctg2040cccctactcctcctagacctaacctgactagaaaagctattacctaaaacaatttcacag2100caccaaatctccacctccatcatcacctcaacccaaaaaggcataattaaactttacttc2160ctctctttcttcttcccactcatcctaaccctactcctaatcacataa2208<210>12<211>807<212>dna<213>artificial<220><223>cdna<400>12atggcacatgcagcgcaagtaggtctacaagacgctacttcccctatcatagaagagctt60atcacctttcatgatcacgccctcataatcattttccttatctgcttcctagtcctgtat120gcccttttcctaacactcacaacaaaactaactaatactaacatctcagacgctcaggaa180atagaaaccgcaaacatatcatacacaaacgcctgagccctatctattactctcatcgct240acctccctgacaagcgcctatagcactcgaataattcttctcaccctaacaggtcaacct300cgcttccccacccttactaacattaacgaaaataaccccaccctactaaaccccattaaa360cgcctggcagccggaagcctattcgcaggatttctcattactaacaacatttcccccgca420tcccccttccaaacaacaatccccctctacctaaaactcacagccctcgctgtcactttc480ctaggacttctaacagccctagacctcaactacctaaccaacaaacttaaaataaaatcc540ccactatgcacattttatttctccaacatactcggattctaccctagcatcacacaccgc600acaatcccctatctaggccttcttacgagccaaaacctgcccctactcctcctagaccta660acctgactagaaaagctattacctaaaacaatttcacagcaccaaatctccacctccatc720atcacctcaacccaaaaaggcataattaaactttacttcctctctttcttcttcccactc780atcctaaccctactcctaatcacataa807<210>13<211>786<212>dna<213>artificial<220><223>cdna<400>13atggcacatgcagcgcaagtaggtctacaagacgctacttcccctatcatagaagagctt60atcacctttcatgatcacgccctcataatcattttccttatctgcttcctagtcctgtat120gcccttttcctaacactcacaacaaaactaactaatactaacatctcagacgctcaggaa180atagaaaccgtctgaactatcctgcccgccatcatcctagtcctcatcgccctcccatcc240ctacgcatcctttacataacagacgaggtcaacgatccctcccttaccatcaaatcaatt300ggccaccaatggtactgaacctacgagtacaccgactacggcggactaatcttcaactcc360tacatacttcccccattattcctagaaccaggcgacctgcgactccttgacgttgacaat420cgagtagtactcccgattgaagcccccattcgtataataattacatcacaagacgtcttg480cactcatgagctgtccccacattaggcttaaaaacagatgcaattcccggacgtctaaac540caaaccactttcaccgctacacgaccgggggtatactacggtcaatgctctgaaatctgt600ggagcaaaccacagtttcatgcccatcgtcctagacctaacctgactagaaaagctatta660cctaaaacaatttcacagcaccaaatctccacctccatcatcacctcaacccaaaaaggc720ataattaaactttacttcctctctttcttcttcccactcatcctaaccctactcctaatc780acataa786<210>14<211>1905<212>dna<213>artificial<220><223>cdna<400>14atgaacgaaaatctgttcgcttcattcattgcccccacaatcctaggcctacccgccgca60gtactgatcattctatttccccctctattgatccccacctccaaatatctcatcaacaac120cgactaatcaccacccaacaatgactaatcaaactaacctcaaaacaaatgataaccata180cacaacactaaaggacgaacctgatctcttatactagtatccttaatcatttttattgcc240acaactaacctcctcggactcctgcctcactcatttacaccaaccacccaactatctata300aacctagccatggccatccccttatgagcgggcacagtgattataggctttcgctctaag360attaaaaatgccctagcccacttcttaccacaaggcacacctacaccccttatccccata420ctagttattatcgaaaccatcagcctactcattcaaccaatagccctggccgtacgccta480accgctaacattactgcaggccacctactcatgcacctaattggaagcgccaccctagca540atatcaaccattaaccttccctctacacttatcatcttcacaattctaattctactgact600atcctagaaatcgctgtcgccttaatccaagcctacgttttcacacttctagtaagcctc660tacctacactccaactcatgagacccacaacaaatagcccttctaaacgctaatccaagc720ctcaccccactactaggcctcctcctagcagcagcaggcaaatcagcccaattaggtctc780cacccctgactcccctcagccatagaaggccccaccccagtctcagccctactccactca840agcactatagttgtagcaggaatcttcttactcatccgcttccaccccctagcagaaaat900agcccactaatccaaactctaacactatgcttaggcgctatcaccactctgttcgcagca960gtctgcgcccttacacaaaatgacatcaaaaaaatcgtagccttctccacttcaagtcaa1020ctaggactcataatagttacaatcggcatcaaccaaccacacctagcattcctgcacatc1080tgtacccacgccttcttcaaagccatactatttatgtgctccgggtccatcatccacaac1140cttaacaatgaacaagatattcgaaaaataggaggactactcaaaaccatacctctcact1200tcaacctccctcaccattggcagcctagcattagcaggaatacctttcctcacaggtttc1260tactccaaagaccacatcatcgaaaccgcaaacatatcatacacaaacgcctgagcccta1320tctattactctcatcgctacctccctgacaagcgcctatagcactcgaataattcttctc1380accctaacaggtcaacctcgcttccccacccttactaacattaacgaaaataaccccacc1440ctactaaaccccattaaacgcctggcagccggaagcctattcgcaggatttctcattact1500aacaacatttcccccgcatcccccttccaaacaacaatccccctctacctaaaactcaca1560gccctcgctgtcactttcctaggacttctaacagccctagacctcaactacctaaccaac1620aaacttaaaataaaatccccactatgcacattttatttctccaacatactcggattctac1680cctagcatcacacaccgcacaatcccctatctaggccttcttacgagccaaaacctgccc1740ctactcctcctagacctaacctgactagaaaagctattacctaaaacaatttcacagcac1800caaatctccacctccatcatcacctcaacccaaaaaggcataattaaactttacttcctc1860tctttcttcttcccactcatcctaaccctactcctaatcacataa1905<210>15<211>1545<212>dna<213>artificial<220><223>cdna<400>15atgacccaccaatcacatgcctatcatatagtaaaacccagcccatgacccctaacaggg60gccctctcagccctcctaatgacctccggcctagccatgtgatttcacttccactccata120acgctcctcatactaggcctactaaccaacacactaaccatataccaatgatggcgcgat180gtaacacgagaaagcacataccaaggccaccacacaccacctgtccaaaaaggccttcga240tacgggataatcctatttattacctcagaagtttttttcttcgcaggatttttctgagcc300ttttaccactccagcctagcccctaccccccaattaggagggcactggcccccaacaggc360atcaccccactactaggcctcctcctagcagcagcaggcaaatcagcccaattaggtctc420cacccctgactcccctcagccatagaaggccccaccccagtctcagccctactccactca480agcactatagttgtagcaggaatcttcttactcatccgcttccaccccctagcagaaaat540agcccactaatccaaactctaacactatgcttaggcgctatcaccactctgttcgcagca600gtctgcgcccttacacaaaatgacatcaaaaaaatcgtagccttctccacttcaagtcaa660ctaggactcataatagttacaatcggcatcaaccaaccacacctagcattcctgcacatc720tgtacccacgccttcttcaaagccatactatttatgtgctccgggtccatcatccacaac780cttaacaatgaacaagatattcgaaaaataggaggactactcaaaaccatacctctcact840tcaacctccctcaccattggcagcctagcattagcaggaatacctttcctcacaggtttc900tactccaaagaccacatcatcgaaaccgcaaacatatcatacacaaacgcctgagcccta960tctattactctcatcgctacctccctgacaagcgcctatagcactcgaataattcttctc1020accctaacaggtcaacctcgcttccccacccttactaacattaacgaaaataaccccacc1080ctactaaaccccattaaacgcctggcagccggaagcctattcgcaggatttctcattact1140aacaacatttcccccgcatcccccttccaaacaacaatccccctctacctaaaactcaca1200gccctcgctgtcactttcctaggacttctaacagccctagacctcaactacctaaccaac1260aaacttaaaataaaatccccactatgcacattttatttctccaacatactcggattctac1320cctagcatcacacaccgcacaatcccctatctaggccttcttacgagccaaaacctgccc1380ctactcctcctagacctaacctgactagaaaagctattacctaaaacaatttcacagcac1440caaatctccacctccatcatcacctcaacccaaaaaggcataattaaactttacttcctc1500tctttcttcttcccactcatcctaaccctactcctaatcacataa1545<210>16<211>1629<212>dna<213>artificial<220><223>cdna<400>16ataaacttcgccttaattttaataatcaacaccctcctagccttactactaataattatt60acattttgactaccacaactcaacggctacatagaaaaatccaccccttacgagtgcggc120ttcgaccctatatcccccgcccgcgtccctttctccataaaattcttcttagtagctatt180accttcttattatttgatctagaaattgccctccttttacccctaccatgagccctacaa240acaactaacctgccactaatagttatgtcatccctcttattaatcatcatcctagcccta300agtctggccaacacagcagccattcaagcaatcctatacaaccgtatcggcgatatcggt360ttcatcctcgccttagcatgatttatcctacactccaactcatgagacccacaacaaata420gcccttctaaacgctaatccaagcctcaccccactactaggcctcctcctagcagcagca480ggcaaatcagcccaattaggtctccacccctgactcccctcagccatagaaggccccacc540ccagtctcagccctactccactcaagcactatagttgtagcaggaatcttcttactcatc600cgcttccaccccctagcagaaaatagcccactaatccaaactctaacactatgcttaggc660gctatcaccactctgttcgcagcagtctgcgcccttacacaaaatgacatcaaaaaaatc720gtagccttctccacttcaagtcaactaggactcataatagttacaatcggcatcaaccaa780ccacacctagcattcctgcacatctgtacccacgccttcttcaaagccatactatttatg840tgctccgggtccatcatccacaaccttaacaatgaacaagatattcgaaaaataggagga900ctactcaaaaccatacctctcacttcaacctccctcaccattggcagcctagcattagca960ggaatacctttcctcacaggtttctactccaaagaccacatcatcgaaaccgcaaacata1020tcatacacaaacgcctgagccctatctattactctcatcgctacctccctgacaagcgcc1080tatagcactcgaataattcttctcaccctaacaggtcaacctcgcttccccacccttact1140aacattaacgaaaataaccccaccctactaaaccccattaaacgcctggcagccggaagc1200ctattcgcaggatttctcattactaacaacatttcccccgcatcccccttccaaacaaca1260atccccctctacctaaaactcacagccctcgctgtcactttcctaggacttctaacagcc1320ctagacctcaactacctaaccaacaaacttaaaataaaatccccactatgcacattttat1380ttctccaacatactcggattctaccctagcatcacacaccgcacaatcccctatctaggc1440cttcttacgagccaaaacctgcccctactcctcctagacctaacctgactagaaaagcta1500ttacctaaaacaatttcacagcaccaaatctccacctccatcatcacctcaacccaaaaa1560ggcataattaaactttacttcctctctttcttcttcccactcatcctaaccctactccta1620atcacataa1629<210>17<211>129<212>dna<213>artificial<220><223>cdna<400>17atgccccaactaaatactaccgtatggcccaccataattacccccatactccttacacta60ttcctcatcacccaactaaaaatattaaacacaaactaccacctacctccctcaccattg120gcagcctag129<210>18<211>783<212>rna<213>人<400>18auggcccaccauaauuacccccauacuccuuacacuauuccucaucacccaacuaaaaau60auuaaacacaaacuaccaccuaccucccucaccauuggcagccuagcauuagcaggaaua120ccuuuccucacagguuucuacuccaaagaccacaucaucgaaaccgcaaacauaucauac180acaaacgccugagcccuaucuauuacucucaucgcuaccucccugacaagcgccuauagc240acucgaauaauucuucucacccuaacaggucaaccucgcuuccccacccuuacuaacauu300aacgaaaauaaccccacccuacuaaaccccauuaaacgccuggcagccggaagccuauuc360gcaggauuucucauuacuaacaacauuucccccgcaucccccuuccaaacaacaaucccc420cucuaccuaaaacucacagcccucgcugucacuuuccuaggacuucuaacagcccuagac480cucaacuaccuaaccaacaaacuuaaaauaaaauccccacuaugcacauuuuauuucucc540aacauacucggauucuacccuagcaucacacaccgcacaauccccuaucuaggccuucuu600acgagccaaaaccugccccuacuccuccuagaccuaaccugacuagaaaagcuauuaccu660aaaacaauuucacagcaccaaaucuccaccuccaucaucaccucaacccaaaaaggcaua720auuaaacuuuacuuccucucuuucuucuucccacucauccuaacccuacuccuaaucaca780uaa783<210>19<211>300<212>rna<213>人<400>19augccccucauuuacauaaauauuauacuagcauuuaccaucucacuucuaggaauacua60guauaucgcucacaccucauauccucccuacuaugccuagaaggaauaauacuaucgcug120uucauuauagcuacucucauaacccucaacacccacucccucuuagccaauauugugccu180auugccauacuagucuuugccgccugcgaagcagcggugggccuagcccuacuagucuca240aucuccaacacauauggccuagacuacguacauaaccuaacccuacuccuaaucacauaa300<210>20<211>781<212>rna<213>人<400>20auggcacaugcagcgcaaguaggucuacaagacgcuacuuccccuaucauagaagagcuu60aucaccuuucaugaucacgcccucauaaucauuuuccuuaucugcuuccuaguccuguau120gcccuuuuccuaacacucacaacaaaacuaacuaauacuaacaucucagacgcucaggaa180auagaaaccgucugaacuauccugcccgccaucauccuaguccucaucgcccucccaucc240cuacgcauccuuuacauaacagacgaggucaacgaucccucccuuaccaucaaaucaauu300ggccaccaaugguacugaaccuacgaguacaccgacuacggcggacuaaucuucaacucc360uacauacuucccccauuauuccuagaaccaggcgacccagacaauuauacccuagccaac420cccuuaaacaccccuccccacaucaagcccgaaugauauuuccuauucgccuacacaauu480cuccgauccgucccuaacaaacuaggaggcguccuugcccuauuacuauccauccucauc540cuagcaauaauccccauccuccauauauccaaacaacaaagcauaauauuucgcccacua600agccaaucacuuuauugacuccuagccgcagaccuccucauucuaaccugaaucggagga660caaccaguaagcuacccuuuuaccaucauuggacaaguagcauccguacuauacuucaca720acaauccuaauccuaauaccaacuaucucccuaauugaaaacaaaauacucaaaugggcc780u781<210>21<211>565<212>rna<213>人<400>21auggcacaugcagcgcaaguaggucuacaagacgcuacuuccccuaucauagaagagcuu60aucaccuuucaugaucacgcccucauaaucauuuuccuuaucugcuuccuaguccuguau120gcccuuuuccuaacacucacaacaaaacuaacuaauacuaacaucucagacgcucaggaa180auagaaaccgucugaacuauccugcccgccaucauccuaguccucaucgcccucccaucc240cuacgcauccuuuacauaacagacgaggucaacgaucccucccuuaccaucaaaucaauu300ggccaccaaugguacugaaccuacgaguacaccgacuacggcggacuaaucuucaacucc360uacauacuucccccauuauuccuagaaccaggcgaccugcgacuccuagccgcagaccuc420cucauucuaaccugaaucggaggacaaccaguaagcuacccuuuuaccaucauuggacaa480guagcauccguacuauacuucacaacaauccuaauccuaauaccaacuaucucccuaauu540gaaaacaaaauacucaaaugggccu565<210>22<211>1174<212>rna<213>人<400>22auggcacaugcagcgcaaguaggucuacaagacgcuacuuccccuaucauagaagagcuu60aucaccuuucaugaucacgcccucauaaucauuuuccuuaucugcuuccuaguccuguau120gcccuuuuccuaacacucacaacaaaacuaacuaauacuaacaucucagacgcucaggaa180auagaaaccgucugaacuauccugcccgccaucauccuaguccucaucgcccucccaucc240cuacgcauccuuuacauaacagacgaggucaacgaucccucccuuaccaucaaaucaauu300ggccaccaaugguacugaaccuacgaguacaccgacuacggcggacuaaucuucaacucc360uacauacuucccccauuauuccuagaaccaggcgaccugcgacuccuugacguugacaau420cgaguaguacucccgauugaagcccccauucguauaauaauuacaucacaagacgucuug480cacucaugagcuguccccacauuaggcuuaaaaacagaugcaauucccggacgucuaaac540caaaccacuuucaccgcuacacgaccggggguauacuacggucaaugcucugaaaucugu600ggagcaaaccacaguuucaugcccauauucuugcacgaaacgggaucaaacaacccccua660ggaaucaccucccauuccgauaaaaucaccuuccacccuuacuacacaaucaaagacgcc720cucggcuuacuucucuuccuucucuccuuaaugacauuaacacuauucucaccagaccuc780cuaggcgacccagacaauuauacccuagccaaccccuuaaacaccccuccccacaucaag840cccgaaugauauuuccuauucgccuacacaauucuccgauccgucccuaacaaacuagga900ggcguccuugcccuauuacuauccauccucauccuagcaauaauccccauccuccauaua960uccaaacaacaaagcauaauauuucgcccacuaagccaaucacuuuauugacuccuagcc1020gcagaccuccucauucuaaccugaaucggaggacaaccaguaagcuacccuuuuaccauc1080auuggacaaguagcauccguacuauacuucacaacaauccuaauccuaauaccaacuauc1140ucccuaauugaaaacaaaauacucaaaugggccu1174<210>23<211>1294<212>rna<213>人<400>23augaacgaaaaucuguucgcuucauucauugcccccacaauccuaggccuacccgccgca60guacugaucauucuauuucccccucuauugauccccaccuccaaauaucucaucaacaac120cgacuaaucaccacccaacaaugacuaaucaaacuaaccucaaaacaaaugauaaccaua180cacaacacuaaaggacgaaccugaucucuuauacuaguauccuuaaucauuuuuauugcc240acaacuaaccuccucggacuccugccucacucauuuacaccaaccacccaacuaucuaua300aaccuagccaugcacuacucaccagacgccucaaccgccuuuucaucaaucgcccacauc360acucgagacguaaauuauggcugaaucauccgcuaccuucacgccaauggcgccucaaua420uucuuuaucugccucuuccuacacaucgggcgaggccuauauuacggaucauuucucuac480ucagaaaccugaaacaucggcauuauccuccugcuugcaacuauagcaacagccuucaua540ggcuauguccucccgugaggccaaauaucauucugaggggccacaguaauuacaaacuua600cuauccgccaucccauacauugggacagaccuaguucaaugaaucugaggaggcuacuca660guagacagucccacccucacacgauucuuuaccuuucacuucaucuugcccuucauuauu720gcagcccuagcaacacuccaccuccuauucuugcacgaaacgggaucaaacaacccccua780ggaaucaccucccauuccgauaaaaucaccuuccacccuuacuacacaaucaaagacgcc840cucggcuuacuucucuuccuucucuccuuaaugacauuaacacuauucucaccagaccuc900cuaggcgacccagacaauuauacccuagccaaccccuuaaacaccccuccccacaucaag960cccgaaugauauuuccuauucgccuacacaauucuccgauccgucccuaacaaacuagga1020ggcguccuugcccuauuacuauccauccucauccuagcaauaauccccauccuccauaua1080uccaaacaacaaagcauaauauuucgcccacuaagccaaucacuuuauugacuccuagcc1140gcagaccuccucauucuaaccugaaucggaggacaaccaguaagcuacccuuuuaccauc1200auuggacaaguagcauccguacuauacuucacaacaauccuaauccuaauaccaacuauc1260ucccuaauugaaaacaaaauacucaaaugggccu1294<210>24<211>1228<212>rna<213>人<400>24augccccucauuuacauaaauauuauacuagcauuuaccaucucacuucuaggaauacua60guauaucgcucacaccucauauccucccuacuaugccuagaaggaauaauacuaucgcug120uucauuauagcuacucucauaacccucaacacccacucccucuuagccaauauugugccu180auugccauacuagucuuuggcgccugccugauccuccaaaucaccacaggacuauuccua240gccaugcacuacucaccagacgccucaaccgccuuuucaucaaucgcccacaucacucga300gacguaaauuauggcugaaucauccgcuaccuucacgccaauggcgccucaauauucuuu360aucugccucuuccuacacaucgggcgaggccuauauuacggaucauuucucuacucagaa420accugaaacaucggcauuauccuccugcuugcaacuauagcaacagccuucauaggcuau480guccucccgugaggccaaauaucauucugaggggccacaguaauuacaaacuuacuaucc540gccaucccauacauugggacagaccuaguucaaugaaucugaggaggcuacucaguagac600agucccacccucacacgauucuuuaccuuucacuucaucuugcccuucauuauugcagcc660cuagcaacacuccaccuccuauucuugcacgaaacgggaucaaacaacccccuaggaauc720accucccauuccgauaaaaucaccuuccacccuuacuacacaaucaaagacgcccucggc780uuacuucucuuccuucucuccuuaaugacauuaacacuauucucaccagaccuccuaggc840gacccagacaauuauacccuagccaaccccuuaaacaccccuccccacaucaagcccgaa900ugauauuuccuauucgccuacacaauucuccgauccgucccuaacaaacuaggaggcguc960cuugcccuauuacuauccauccucauccuagcaauaauccccauccuccauauauccaaa1020caacaaagcauaauauuucgcccacuaagccaaucacuuuauugacuccuagccgcagac1080cuccucauucuaaccugaaucggaggacaaccaguaagcuacccuuuuaccaucauugga1140caaguagcauccguacuauacuucacaacaauccuaauccuaauaccaacuaucucccua1200auugaaaacaaaauacucaaaugggccu1228<210>25<211>522<212>rna<213>人<400>25auguucgccgaccguugacuauucucuacaaaccacaaagacauuggaacacuauaccua60uuauucggcgcaugagcuggaguccuaggcacagcucuaagccuccuuauucgagccgag120cugggccagccaggcaaccuucuagguaacgaccacaucuacaacguuaucgucacagcc180cucgcugucacuuuccuaggacuucuaacagcccuagaccucaacuaccuaaccaacaaa240cuuaaaauaaaauccccacuaugcacauuuuauuucuccaacauacucggauucuacccu300agcaucacacaccgcacaauccccuaucuaggccuucuuacgagccaaaaccugccccua360cuccuccuagaccuaaccugacuagaaaagcuauuaccuaaaacaauuucacagcaccaa420aucuccaccuccaucaucaccucaacccaaaaaggcauaauuaaacuuuacuuccucucu480uucuucuucccacucauccuaacccuacuccuaaucacauaa522<210>26<211>582<212>rna<213>人<400>26auguucgccgaccguugacuauucucuacaaaccacaaagacauuggaacacuauaccua60uuauucggcgcaugagcuggaguccuaggcacagcucuaagccuccuuauucgagccgag120cugggccagccaggcaaccuucuagguaacgaccacaucuacaacguuaucgucacagcc180caugcauuuguaauaaucuucuucauaguaauacccaucauaaucggaggcuuuggcaac240ugacuaguuccccuaauaaucggugcccccgauauggcguuuccccgcauaaacaacaua300agcuucugacucuuaccucccucucuccuacuccugcucgcaucugcuauaguggaggcc360ggagcaggaacagguugaacagucuacccucccuuagcagggaacuacucccacccugga420gcccuccuagaccuaaccugacuagaaaagcuauuaccuaaaacaauuucacagcaccaa480aucuccaccuccaucaucaccucaacccaaaaaggcauaauuaaacuuuacuuccucucu540uucuucuucccacucauccuaacccuacuccuaaucacauaa582<210>27<211>2208<212>rna<213>人<400>27auguucgccgaccguugacuauucucuacaaaccacaaagacauuggaacacuauaccua60uuauucggcgcaugagcuggaguccuaggcacagcucuaagccuccuuauucgagccgag120cugggccagccaggcaaccuucuagguaacgaccacaucuacaacguuaucgucacagcc180caugcauuuguaauaaucuucuucauaguaauacccaucauaaucggaggcuuuggcaac240ugacuaguuccccuaauaaucggugcccccgauauggcguuuccccgcauaaacaacaua300agcuucugacucuuaccucccucucuccuacuccugcucgcaucugcuauaguggaggcc360ggagcaggaacagguugaacagucuacccucccuuagcagggaacuacucccacccugga420gccuccguagaccuaaccaucuucuccuuacaccuagcaggugucuccucuaucuuaggg480gccaucaauuucaucacaacaauuaucaauauaaaacccccugccauaacccaauaccaa540acgccccucuucgucugauccguccuaaucacagcaguccuacuucuccuaucucuccca600guccuagcugcuggcaucacuauacuacuaacagaccgcaaccucaacaccaccuucuuc660gaccccgccggaggaggagaccccauucuauaccaacaccuauucugauuuuucggucac720ccugaaguuuauauucuuauccuaccaggcuucggaauaaucucccauauuguaacuuac780uacuccggaaaaaaagaaccauuuggauacauagguauggucugagcuaugauaucaauu840ggcuuccuaggguuuaucgugugagcacaccauauauuuacaguaggaauagacguagac900acacgagcauauuucaccuccgcuaccauaaucaucgcuauccccaccggcgucaaagua960uuuagcugacucgccacacuccacggaagcaauaugaaaugaucugcugcagugcucuga1020gcccuaggauucaucuuucuuuucaccguagguggccugacuggcauuguauuagcaaac1080ucaucacuagacaucguacuacacgacacguacuacguuguagcccacuuccacuauguc1140cuaucaauaggagcuguauuugccaucauaggaggcuucauucacugauuuccccuauuc1200ucaggcuacacccuagaccaaaccuacgccaaaauccauuucacuaucauauucaucggc1260guaaaucuaacuuucuucccacaacacuuucucggccuauccggaaugccccgacguuac1320ucggacuaccccgaugcauacaccacaugaaacauccuaucaucuguaggcucauucauu1380ucucuaacagcaguaauauuaauaauuuucaugauuugagaagccuucgcuucgaagcga1440aaaguccuaauaguagaagaacccuccauaaaccuggagugacuauauggaugcccccca1500cccuaccacacauucgaagaacccguauacauaaaagcaggaauaccuuuccucacaggu1560uucuacuccaaagaccacaucaucgaaaccgcaaacauaucauacacaaacgccugagcc1620cuaucuauuacucucaucgcuaccucccugacaagcgccuauagcacucgaauaauucuu1680cucacccuaacaggucaaccucgcuuccccacccuuacuaacauuaacgaaaauaacccc1740acccuacuaaaccccauuaaacgccuggcagccggaagccuauucgcaggauuucucauu1800acuaacaacauuucccccgcaucccccuuccaaacaacaaucccccucuaccuaaaacuc1860acagcccucgcugucacuuuccuaggacuucuaacagcccuagaccucaacuaccuaacc1920aacaaacuuaaaauaaaauccccacuaugcacauuuuauuucuccaacauacucggauuc1980uacccuagcaucacacaccgcacaauccccuaucuaggccuucuuacgagccaaaaccug2040ccccuacuccuccuagaccuaaccugacuagaaaagcuauuaccuaaaacaauuucacag2100caccaaaucuccaccuccaucaucaccucaacccaaaaaggcauaauuaaacuuuacuuc2160cucucuuucuucuucccacucauccuaacccuacuccuaaucacauaa2208<210>28<211>807<212>rna<213>人<400>28auggcacaugcagcgcaaguaggucuacaagacgcuacuuccccuaucauagaagagcuu60aucaccuuucaugaucacgcccucauaaucauuuuccuuaucugcuuccuaguccuguau120gcccuuuuccuaacacucacaacaaaacuaacuaauacuaacaucucagacgcucaggaa180auagaaaccgcaaacauaucauacacaaacgccugagcccuaucuauuacucucaucgcu240accucccugacaagcgccuauagcacucgaauaauucuucucacccuaacaggucaaccu300cgcuuccccacccuuacuaacauuaacgaaaauaaccccacccuacuaaaccccauuaaa360cgccuggcagccggaagccuauucgcaggauuucucauuacuaacaacauuucccccgca420ucccccuuccaaacaacaaucccccucuaccuaaaacucacagcccucgcugucacuuuc480cuaggacuucuaacagcccuagaccucaacuaccuaaccaacaaacuuaaaauaaaaucc540ccacuaugcacauuuuauuucuccaacauacucggauucuacccuagcaucacacaccgc600acaauccccuaucuaggccuucuuacgagccaaaaccugccccuacuccuccuagaccua660accugacuagaaaagcuauuaccuaaaacaauuucacagcaccaaaucuccaccuccauc720aucaccucaacccaaaaaggcauaauuaaacuuuacuuccucucuuucuucuucccacuc780auccuaacccuacuccuaaucacauaa807<210>29<211>786<212>rna<213>人<400>29auggcacaugcagcgcaaguaggucuacaagacgcuacuuccccuaucauagaagagcuu60aucaccuuucaugaucacgcccucauaaucauuuuccuuaucugcuuccuaguccuguau120gcccuuuuccuaacacucacaacaaaacuaacuaauacuaacaucucagacgcucaggaa180auagaaaccgucugaacuauccugcccgccaucauccuaguccucaucgcccucccaucc240cuacgcauccuuuacauaacagacgaggucaacgaucccucccuuaccaucaaaucaauu300ggccaccaaugguacugaaccuacgaguacaccgacuacggcggacuaaucuucaacucc360uacauacuucccccauuauuccuagaaccaggcgaccugcgacuccuugacguugacaau420cgaguaguacucccgauugaagcccccauucguauaauaauuacaucacaagacgucuug480cacucaugagcuguccccacauuaggcuuaaaaacagaugcaauucccggacgucuaaac540caaaccacuuucaccgcuacacgaccggggguauacuacggucaaugcucugaaaucugu600ggagcaaaccacaguuucaugcccaucguccuagaccuaaccugacuagaaaagcuauua660ccuaaaacaauuucacagcaccaaaucuccaccuccaucaucaccucaacccaaaaaggc720auaauuaaacuuuacuuccucucuuucuucuucccacucauccuaacccuacuccuaauc780acauaa786<210>30<211>1905<212>rna<213>人<400>30augaacgaaaaucuguucgcuucauucauugcccccacaauccuaggccuacccgccgca60guacugaucauucuauuucccccucuauugauccccaccuccaaauaucucaucaacaac120cgacuaaucaccacccaacaaugacuaaucaaacuaaccucaaaacaaaugauaaccaua180cacaacacuaaaggacgaaccugaucucuuauacuaguauccuuaaucauuuuuauugcc240acaacuaaccuccucggacuccugccucacucauuuacaccaaccacccaacuaucuaua300aaccuagccauggccauccccuuaugagcgggcacagugauuauaggcuuucgcucuaag360auuaaaaaugcccuagcccacuucuuaccacaaggcacaccuacaccccuuauccccaua420cuaguuauuaucgaaaccaucagccuacucauucaaccaauagcccuggccguacgccua480accgcuaacauuacugcaggccaccuacucaugcaccuaauuggaagcgccacccuagca540auaucaaccauuaaccuucccucuacacuuaucaucuucacaauucuaauucuacugacu600auccuagaaaucgcugucgccuuaauccaagccuacguuuucacacuucuaguaagccuc660uaccuacacuccaacucaugagacccacaacaaauagcccuucuaaacgcuaauccaagc720cucaccccacuacuaggccuccuccuagcagcagcaggcaaaucagcccaauuaggucuc780caccccugacuccccucagccauagaaggccccaccccagucucagcccuacuccacuca840agcacuauaguuguagcaggaaucuucuuacucauccgcuuccacccccuagcagaaaau900agcccacuaauccaaacucuaacacuaugcuuaggcgcuaucaccacucuguucgcagca960gucugcgcccuuacacaaaaugacaucaaaaaaaucguagccuucuccacuucaagucaa1020cuaggacucauaauaguuacaaucggcaucaaccaaccacaccuagcauuccugcacauc1080uguacccacgccuucuucaaagccauacuauuuaugugcuccggguccaucauccacaac1140cuuaacaaugaacaagauauucgaaaaauaggaggacuacucaaaaccauaccucucacu1200ucaaccucccucaccauuggcagccuagcauuagcaggaauaccuuuccucacagguuuc1260uacuccaaagaccacaucaucgaaaccgcaaacauaucauacacaaacgccugagcccua1320ucuauuacucucaucgcuaccucccugacaagcgccuauagcacucgaauaauucuucuc1380acccuaacaggucaaccucgcuuccccacccuuacuaacauuaacgaaaauaaccccacc1440cuacuaaaccccauuaaacgccuggcagccggaagccuauucgcaggauuucucauuacu1500aacaacauuucccccgcaucccccuuccaaacaacaaucccccucuaccuaaaacucaca1560gcccucgcugucacuuuccuaggacuucuaacagcccuagaccucaacuaccuaaccaac1620aaacuuaaaauaaaauccccacuaugcacauuuuauuucuccaacauacucggauucuac1680ccuagcaucacacaccgcacaauccccuaucuaggccuucuuacgagccaaaaccugccc1740cuacuccuccuagaccuaaccugacuagaaaagcuauuaccuaaaacaauuucacagcac1800caaaucuccaccuccaucaucaccucaacccaaaaaggcauaauuaaacuuuacuuccuc1860ucuuucuucuucccacucauccuaacccuacuccuaaucacauaa1905<210>31<211>1545<212>rna<213>人<400>31augacccaccaaucacaugccuaucauauaguaaaacccagcccaugaccccuaacaggg60gcccucucagcccuccuaaugaccuccggccuagccaugugauuucacuuccacuccaua120acgcuccucauacuaggccuacuaaccaacacacuaaccauauaccaaugauggcgcgau180guaacacgagaaagcacauaccaaggccaccacacaccaccuguccaaaaaggccuucga240uacgggauaauccuauuuauuaccucagaaguuuuuuucuucgcaggauuuuucugagcc300uuuuaccacuccagccuagccccuaccccccaauuaggagggcacuggcccccaacaggc360aucaccccacuacuaggccuccuccuagcagcagcaggcaaaucagcccaauuaggucuc420caccccugacuccccucagccauagaaggccccaccccagucucagcccuacuccacuca480agcacuauaguuguagcaggaaucuucuuacucauccgcuuccacccccuagcagaaaau540agcccacuaauccaaacucuaacacuaugcuuaggcgcuaucaccacucuguucgcagca600gucugcgcccuuacacaaaaugacaucaaaaaaaucguagccuucuccacuucaagucaa660cuaggacucauaauaguuacaaucggcaucaaccaaccacaccuagcauuccugcacauc720uguacccacgccuucuucaaagccauacuauuuaugugcuccggguccaucauccacaac780cuuaacaaugaacaagauauucgaaaaauaggaggacuacucaaaaccauaccucucacu840ucaaccucccucaccauuggcagccuagcauuagcaggaauaccuuuccucacagguuuc900uacuccaaagaccacaucaucgaaaccgcaaacauaucauacacaaacgccugagcccua960ucuauuacucucaucgcuaccucccugacaagcgccuauagcacucgaauaauucuucuc1020acccuaacaggucaaccucgcuuccccacccuuacuaacauuaacgaaaauaaccccacc1080cuacuaaaccccauuaaacgccuggcagccggaagccuauucgcaggauuucucauuacu1140aacaacauuucccccgcaucccccuuccaaacaacaaucccccucuaccuaaaacucaca1200gcccucgcugucacuuuccuaggacuucuaacagcccuagaccucaacuaccuaaccaac1260aaacuuaaaauaaaauccccacuaugcacauuuuauuucuccaacauacucggauucuac1320ccuagcaucacacaccgcacaauccccuaucuaggccuucuuacgagccaaaaccugccc1380cuacuccuccuagaccuaaccugacuagaaaagcuauuaccuaaaacaauuucacagcac1440caaaucuccaccuccaucaucaccucaacccaaaaaggcauaauuaaacuuuacuuccuc1500ucuuucuucuucccacucauccuaacccuacuccuaaucacauaa1545<210>32<211>1629<212>rna<213>人<400>32auaaacuucgccuuaauuuuaauaaucaacacccuccuagccuuacuacuaauaauuauu60acauuuugacuaccacaacucaacggcuacauagaaaaauccaccccuuacgagugcggc120uucgacccuauaucccccgcccgcgucccuuucuccauaaaauucuucuuaguagcuauu180accuucuuauuauuugaucuagaaauugcccuccuuuuaccccuaccaugagcccuacaa240acaacuaaccugccacuaauaguuaugucaucccucuuauuaaucaucauccuagcccua300agucuggccaacacagcagccauucaagcaauccuauacaaccguaucggcgauaucggu360uucauccucgccuuagcaugauuuauccuacacuccaacucaugagacccacaacaaaua420gcccuucuaaacgcuaauccaagccucaccccacuacuaggccuccuccuagcagcagca480ggcaaaucagcccaauuaggucuccaccccugacuccccucagccauagaaggccccacc540ccagucucagcccuacuccacucaagcacuauaguuguagcaggaaucuucuuacucauc600cgcuuccacccccuagcagaaaauagcccacuaauccaaacucuaacacuaugcuuaggc660gcuaucaccacucuguucgcagcagucugcgcccuuacacaaaaugacaucaaaaaaauc720guagccuucuccacuucaagucaacuaggacucauaauaguuacaaucggcaucaaccaa780ccacaccuagcauuccugcacaucuguacccacgccuucuucaaagccauacuauuuaug840ugcuccggguccaucauccacaaccuuaacaaugaacaagauauucgaaaaauaggagga900cuacucaaaaccauaccucucacuucaaccucccucaccauuggcagccuagcauuagca960ggaauaccuuuccucacagguuucuacuccaaagaccacaucaucgaaaccgcaaacaua1020ucauacacaaacgccugagcccuaucuauuacucucaucgcuaccucccugacaagcgcc1080uauagcacucgaauaauucuucucacccuaacaggucaaccucgcuuccccacccuuacu1140aacauuaacgaaaauaaccccacccuacuaaaccccauuaaacgccuggcagccggaagc1200cuauucgcaggauuucucauuacuaacaacauuucccccgcaucccccuuccaaacaaca1260aucccccucuaccuaaaacucacagcccucgcugucacuuuccuaggacuucuaacagcc1320cuagaccucaacuaccuaaccaacaaacuuaaaauaaaauccccacuaugcacauuuuau1380uucuccaacauacucggauucuacccuagcaucacacaccgcacaauccccuaucuaggc1440cuucuuacgagccaaaaccugccccuacuccuccuagaccuaaccugacuagaaaagcua1500uuaccuaaaacaauuucacagcaccaaaucuccaccuccaucaucaccucaacccaaaaa1560ggcauaauuaaacuuuacuuccucucuuucuucuucccacucauccuaacccuacuccua1620aucacauaa1629<210>33<211>129<212>rna<213>人<400>33augccccaacuaaauacuaccguauggcccaccauaauuacccccauacuccuuacacua60uuccucaucacccaacuaaaaauauuaaacacaaacuaccaccuaccucccucaccauug120gcagccuag129<210>34<211>261<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(261)..(261)<223>xaa可以是任何天然存在的氨基酸<400>34metalahishisasntyrprohisthrprotyrthrileprohishis151015prothrlysasnilelyshislysleuproprothrserleuthrile202530glyserleualaleualaglymetpropheleuthrglyphetyrser354045lysasphisileilegluthralaasnmetsertyrthrasnalatrp505560alaleuserilethrleuilealathrserleuthrseralatyrser65707580thrargmetileleuleuthrleuthrglyglnproargpheprothr859095leuthrasnileasngluasnasnprothrleuleuasnproilelys100105110argleualaalaglyserleuphealaglypheleuilethrasnasn115120125ileserproalaserpropheglnthrthrileproleutyrleulys130135140leuthralaleualavalthrpheleuglyleuleuthralaleuasp145150155160leuasntyrleuthrasnlysleulysmetlysserproleucysthr165170175phetyrpheserasnmetleuglyphetyrproserilethrhisarg180185190thrileprotyrleuglyleuleuthrserglnasnleuproleuleu195200205leuleuaspleuthrtrpleuglulysleuleuprolysthrileser210215220glnhisglnileserthrserileilethrserthrglnlysglymet225230235240ilelysleutyrpheleuserphephepheproleuileleuthrleu245250255leuleuilethrxaa260<210>35<211>100<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(100)..(100)<223>xaa可以是任何天然存在的氨基酸<400>35metproleuiletyrmetasnilemetleualaphethrileserleu151015leuglymetleuvaltyrargserhisleumetserserleuleucys202530leugluglymetmetleuserleupheilemetalathrleumetthr354045leuasnthrhisserleuleualaasnilevalproilealametleu505560valphealaalacysglualaalavalglyleualaleuleuvalser65707580ileserasnthrtyrglyleuasptyrvalhisasnleuthrleuleu859095leuilethrxaa100<210>36<211>261<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(261)..(261)<223>xaa可以是任何天然存在的氨基酸<400>36metalahisalaalaglnvalglyleuglnaspalathrserproile151015metglugluleuilethrphehisasphisalaleumetileilephe202530leuilecyspheleuvalleutyralaleupheleuthrleuthrthr354045lysleuthrasnthrasnileseraspalaglnglumetgluthrval505560trpthrileleuproalaileileleuvalleuilealaleuproser65707580leuargileleutyrmetthraspgluvalasnaspproserleuthr859095ilelysserileglyhisglntrptyrtrpthrtyrglutyrthrasp100105110tyrglyglyleuilepheasnsertyrmetleuproproleupheleu115120125gluproglyaspproaspasntyrthrleualaasnproleuasnthr130135140proprohisilelysproglutrptyrpheleuphealatyrthrile145150155160leuargservalproasnlysleuglyglyvalleualaleuleuleu165170175serileleuileleualametileproileleuhismetserlysgln180185190glnsermetmetpheargproleuserglnserleutyrtrpleuleu195200205alaalaaspleuleuileleuthrtrpileglyglyglnprovalser210215220tyrprophethrileileglyglnvalalaservalleutyrphethr225230235240thrileleuileleumetprothrileserleuilegluasnlysmet245250255leulystrpalaxaa260<210>37<211>189<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(189)..(189)<223>xaa可以是任何天然存在的氨基酸<400>37metalahisalaalaglnvalglyleuglnaspalathrserproile151015metglugluleuilethrphehisasphisalaleumetileilephe202530leuilecyspheleuvalleutyralaleupheleuthrleuthrthr354045lysleuthrasnthrasnileseraspalaglnglumetgluthrval505560trpthrileleuproalaileileleuvalleuilealaleuproser65707580leuargileleutyrmetthraspgluvalasnaspproserleuthr859095ilelysserileglyhisglntrptyrtrpthrtyrglutyrthrasp100105110tyrglyglyleuilepheasnsertyrmetleuproproleupheleu115120125gluproglyaspleuargleuleualaalaaspleuleuileleuthr130135140trpileglyglyglnprovalsertyrprophethrileileglygln145150155160valalaservalleutyrphethrthrileleuileleumetprothr165170175ileserleuilegluasnlysmetleulystrpalaxaa180185<210>38<211>392<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(392)..(392)<223>xaa可以是任何天然存在的氨基酸<400>38metalahisalaalaglnvalglyleuglnaspalathrserproile151015metglugluleuilethrphehisasphisalaleumetileilephe202530leuilecyspheleuvalleutyralaleupheleuthrleuthrthr354045lysleuthrasnthrasnileseraspalaglnglumetgluthrval505560trpthrileleuproalaileileleuvalleuilealaleuproser65707580leuargileleutyrmetthraspgluvalasnaspproserleuthr859095ilelysserileglyhisglntrptyrtrpthrtyrglutyrthrasp100105110tyrglyglyleuilepheasnsertyrmetleuproproleupheleu115120125gluproglyaspleuargleuleuaspvalaspasnargvalvalleu130135140proileglualaproileargmetmetilethrserglnaspvalleu145150155160hissertrpalavalprothrleuglyleulysthraspalailepro165170175glyargleuasnglnthrthrphethralathrargproglyvaltyr180185190tyrglyglncyssergluilecysglyalaasnhisserphemetpro195200205metpheleuhisgluthrglyserasnasnproleuglyilethrser210215220hisserasplysilethrphehisprotyrtyrthrilelysaspala225230235240leuglyleuleuleupheleuleuserleumetthrleuthrleuphe245250255serproaspleuleuglyaspproaspasntyrthrleualaasnpro260265270leuasnthrproprohisilelysproglutrptyrpheleupheala275280285tyrthrileleuargservalproasnlysleuglyglyvalleuala290295300leuleuleuserileleuileleualametileproileleuhismet305310315320serlysglnglnsermetmetpheargproleuserglnserleutyr325330335trpleuleualaalaaspleuleuileleuthrtrpileglyglygln340345350provalsertyrprophethrileileglyglnvalalaservalleu355360365tyrphethrthrileleuileleumetprothrileserleuileglu370375380asnlysmetleulystrpalaxaa385390<210>39<211>432<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(432)..(432)<223>xaa可以是任何天然存在的氨基酸<400>39metasngluasnleuphealaserpheilealaprothrileleugly151015leuproalaalavalleuileileleupheproproleuleuilepro202530thrserlystyrleuileasnasnargleuilethrthrglnglntrp354045leuilelysleuthrserlysglnmetmetthrmethisasnthrlys505560glyargthrtrpserleumetleuvalserleuileilepheileala65707580thrthrasnleuleuglyleuleuprohisserphethrprothrthr859095glnleusermetasnleualamethistyrserproaspalaserthr100105110alapheserserilealahisilethrargaspvalasntyrglytrp115120125ileileargtyrleuhisalaasnglyalasermetphepheilecys130135140leupheleuhisileglyargglyleutyrtyrglyserpheleutyr145150155160sergluthrtrpasnileglyileileleuleuleualathrmetala165170175thralaphemetglytyrvalleuprotrpglyglnmetserphetrp180185190glyalathrvalilethrasnleuleuseralaileprotyrilegly195200205thraspleuvalglntrpiletrpglyglytyrservalaspserpro210215220thrleuthrargphephethrphehispheileleupropheileile225230235240alaalaleualathrleuhisleuleupheleuhisgluthrglyser245250255asnasnproleuglyilethrserhisserasplysilethrphehis260265270protyrtyrthrilelysaspalaleuglyleuleuleupheleuleu275280285serleumetthrleuthrleupheserproaspleuleuglyasppro290295300aspasntyrthrleualaasnproleuasnthrproprohisilelys305310315320proglutrptyrpheleuphealatyrthrileleuargservalpro325330335asnlysleuglyglyvalleualaleuleuleuserileleuileleu340345350alametileproileleuhismetserlysglnglnsermetmetphe355360365argproleuserglnserleutyrtrpleuleualaalaaspleuleu370375380ileleuthrtrpileglyglyglnprovalsertyrprophethrile385390395400ileglyglnvalalaservalleutyrphethrthrileleuileleu405410415metprothrileserleuilegluasnlysmetleulystrpalaxaa420425430<210>40<211>410<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(410)..(410)<223>xaa可以是任何天然存在的氨基酸<400>40metproleuiletyrmetasnilemetleualaphethrileserleu151015leuglymetleuvaltyrargserhisleumetserserleuleucys202530leugluglymetmetleuserleupheilemetalathrleumetthr354045leuasnthrhisserleuleualaasnilevalproilealametleu505560valpheglyalacysleuileleuglnilethrthrglyleupheleu65707580alamethistyrserproaspalaserthralapheserserileala859095hisilethrargaspvalasntyrglytrpileileargtyrleuhis100105110alaasnglyalasermetphepheilecysleupheleuhisilegly115120125argglyleutyrtyrglyserpheleutyrsergluthrtrpasnile130135140glyileileleuleuleualathrmetalathralaphemetglytyr145150155160valleuprotrpglyglnmetserphetrpglyalathrvalilethr165170175asnleuleuseralaileprotyrileglythraspleuvalglntrp180185190iletrpglyglytyrservalaspserprothrleuthrargphephe195200205thrphehispheileleupropheileilealaalaleualathrleu210215220hisleuleupheleuhisgluthrglyserasnasnproleuglyile225230235240thrserhisserasplysilethrphehisprotyrtyrthrilelys245250255aspalaleuglyleuleuleupheleuleuserleumetthrleuthr260265270leupheserproaspleuleuglyaspproaspasntyrthrleuala275280285asnproleuasnthrproprohisilelysproglutrptyrpheleu290295300phealatyrthrileleuargservalproasnlysleuglyglyval305310315320leualaleuleuleuserileleuileleualametileproileleu325330335hismetserlysglnglnsermetmetpheargproleuserglnser340345350leutyrtrpleuleualaalaaspleuleuileleuthrtrpilegly355360365glyglnprovalsertyrprophethrileileglyglnvalalaser370375380valleutyrphethrthrileleuileleumetprothrileserleu385390395400ilegluasnlysmetleulystrpalaxaa405410<210>41<211>174<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(174)..(174)<223>xaa可以是任何天然存在的氨基酸<400>41metphealaaspargtrpleupheserthrasnhislysaspilegly151015thrleutyrleuleupheglyalatrpalaglyvalleuglythrala202530leuserleuleuileargalagluleuglyglnproglyasnleuleu354045glyasnasphisiletyrasnvalilevalthralaleualavalthr505560pheleuglyleuleuthralaleuaspleuasntyrleuthrasnlys65707580leulysmetlysserproleucysthrphetyrpheserasnmetleu859095glyphetyrproserilethrhisargthrileprotyrleuglyleu100105110leuthrserglnasnleuproleuleuleuleuaspleuthrtrpleu115120125glulysleuleuprolysthrileserglnhisglnileserthrser130135140ileilethrserthrglnlysglymetilelysleutyrpheleuser145150155160phephepheproleuileleuthrleuleuleuilethrxaa165170<210>42<211>194<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(194)..(194)<223>xaa可以是任何天然存在的氨基酸<400>42metphealaaspargtrpleupheserthrasnhislysaspilegly151015thrleutyrleuleupheglyalatrpalaglyvalleuglythrala202530leuserleuleuileargalagluleuglyglnproglyasnleuleu354045glyasnasphisiletyrasnvalilevalthralahisalapheval505560metilephephemetvalmetproilemetileglyglypheglyasn65707580trpleuvalproleumetileglyalaproaspmetalapheproarg859095metasnasnmetserphetrpleuleuproproserleuleuleuleu100105110leualaseralametvalglualaglyalaglythrglytrpthrval115120125tyrproproleualaglyasntyrserhisproglyalaleuleuasp130135140leuthrtrpleuglulysleuleuprolysthrileserglnhisgln145150155160ileserthrserileilethrserthrglnlysglymetilelysleu165170175tyrpheleuserphephepheproleuileleuthrleuleuleuile180185190thrxaa<210>43<211>736<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(736)..(736)<223>xaa可以是任何天然存在的氨基酸<400>43metphealaaspargtrpleupheserthrasnhislysaspilegly151015thrleutyrleuleupheglyalatrpalaglyvalleuglythrala202530leuserleuleuileargalagluleuglyglnproglyasnleuleu354045glyasnasphisiletyrasnvalilevalthralahisalapheval505560metilephephemetvalmetproilemetileglyglypheglyasn65707580trpleuvalproleumetileglyalaproaspmetalapheproarg859095metasnasnmetserphetrpleuleuproproserleuleuleuleu100105110leualaseralametvalglualaglyalaglythrglytrpthrval115120125tyrproproleualaglyasntyrserhisproglyalaservalasp130135140leuthrilepheserleuhisleualaglyvalserserileleugly145150155160alaileasnpheilethrthrileileasnmetlysproproalamet165170175thrglntyrglnthrproleuphevaltrpservalleuilethrala180185190valleuleuleuleuserleuprovalleualaalaglyilethrmet195200205leuleuthraspargasnleuasnthrthrphepheaspproalagly210215220glyglyaspproileleutyrglnhisleuphetrpphepheglyhis225230235240progluvaltyrileleuileleuproglypheglymetileserhis245250255ilevalthrtyrtyrserglylyslysglupropheglytyrmetgly260265270metvaltrpalametmetserileglypheleuglypheilevaltrp275280285alahishismetphethrvalglymetaspvalaspthrargalatyr290295300phethrseralathrmetileilealaileprothrglyvallysval305310315320phesertrpleualathrleuhisglyserasnmetlystrpserala325330335alavalleutrpalaleuglypheilepheleuphethrvalglygly340345350leuthrglyilevalleualaasnserserleuaspilevalleuhis355360365aspthrtyrtyrvalvalalahisphehistyrvalleusermetgly370375380alavalphealailemetglyglypheilehistrppheproleuphe385390395400serglytyrthrleuaspglnthrtyralalysilehisphethrile405410415metpheileglyvalasnleuthrphepheproglnhispheleugly420425430leuserglymetproargargtyrserasptyrproaspalatyrthr435440445thrtrpasnileleuserservalglyserpheileserleuthrala450455460valmetleumetilephemetiletrpglualaphealaserlysarg465470475480lysvalleumetvalglugluprosermetasnleuglutrpleutyr485490495glycysproproprotyrhisthrpheglugluprovaltyrmetlys500505510alaglymetpropheleuthrglyphetyrserlysasphisileile515520525gluthralaasnmetsertyrthrasnalatrpalaleuserilethr530535540leuilealathrserleuthrseralatyrserthrargmetileleu545550555560leuthrleuthrglyglnproargpheprothrleuthrasnileasn565570575gluasnasnprothrleuleuasnproilelysargleualaalagly580585590serleuphealaglypheleuilethrasnasnileserproalaser595600605propheglnthrthrileproleutyrleulysleuthralaleuala610615620valthrpheleuglyleuleuthralaleuaspleuasntyrleuthr625630635640asnlysleulysmetlysserproleucysthrphetyrpheserasn645650655metleuglyphetyrproserilethrhisargthrileprotyrleu660665670glyleuleuthrserglnasnleuproleuleuleuleuaspleuthr675680685trpleuglulysleuleuprolysthrileserglnhisglnileser690695700thrserileilethrserthrglnlysglymetilelysleutyrphe705710715720leuserphephepheproleuileleuthrleuleuleuilethrxaa725730735<210>44<211>269<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(269)..(269)<223>xaa可以是任何天然存在的氨基酸<400>44metalahisalaalaglnvalglyleuglnaspalathrserproile151015metglugluleuilethrphehisasphisalaleumetileilephe202530leuilecyspheleuvalleutyralaleupheleuthrleuthrthr354045lysleuthrasnthrasnileseraspalaglnglumetgluthrala505560asnmetsertyrthrasnalatrpalaleuserilethrleuileala65707580thrserleuthrseralatyrserthrargmetileleuleuthrleu859095thrglyglnproargpheprothrleuthrasnileasngluasnasn100105110prothrleuleuasnproilelysargleualaalaglyserleuphe115120125alaglypheleuilethrasnasnileserproalaserprophegln130135140thrthrileproleutyrleulysleuthralaleualavalthrphe145150155160leuglyleuleuthralaleuaspleuasntyrleuthrasnlysleu165170175lysmetlysserproleucysthrphetyrpheserasnmetleugly180185190phetyrproserilethrhisargthrileprotyrleuglyleuleu195200205thrserglnasnleuproleuleuleuleuaspleuthrtrpleuglu210215220lysleuleuprolysthrileserglnhisglnileserthrserile225230235240ilethrserthrglnlysglymetilelysleutyrpheleuserphe245250255phepheproleuileleuthrleuleuleuilethrxaa260265<210>45<211>262<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(262)..(262)<223>xaa可以是任何天然存在的氨基酸<400>45metalahisalaalaglnvalglyleuglnaspalathrserproile151015metglugluleuilethrphehisasphisalaleumetileilephe202530leuilecyspheleuvalleutyralaleupheleuthrleuthrthr354045lysleuthrasnthrasnileseraspalaglnglumetgluthrval505560trpthrileleuproalaileileleuvalleuilealaleuproser65707580leuargileleutyrmetthraspgluvalasnaspproserleuthr859095ilelysserileglyhisglntrptyrtrpthrtyrglutyrthrasp100105110tyrglyglyleuilepheasnsertyrmetleuproproleupheleu115120125gluproglyaspleuargleuleuaspvalaspasnargvalvalleu130135140proileglualaproileargmetmetilethrserglnaspvalleu145150155160hissertrpalavalprothrleuglyleulysthraspalailepro165170175glyargleuasnglnthrthrphethralathrargproglyvaltyr180185190tyrglyglncyssergluilecysglyalaasnhisserphemetpro195200205ilevalleuaspleuthrtrpleuglulysleuleuprolysthrile210215220serglnhisglnileserthrserileilethrserthrglnlysgly225230235240metilelysleutyrpheleuserphephepheproleuileleuthr245250255leuleuleuilethrxaa260<210>46<211>635<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(635)..(635)<223>xaa可以是任何天然存在的氨基酸<400>46metasngluasnleuphealaserpheilealaprothrileleugly151015leuproalaalavalleuileileleupheproproleuleuilepro202530thrserlystyrleuileasnasnargleuilethrthrglnglntrp354045leuilelysleuthrserlysglnmetmetthrmethisasnthrlys505560glyargthrtrpserleumetleuvalserleuileilepheileala65707580thrthrasnleuleuglyleuleuprohisserphethrprothrthr859095glnleusermetasnleualametalaileproleutrpalaglythr100105110valilemetglypheargserlysilelysasnalaleualahisphe115120125leuproglnglythrprothrproleuileprometleuvalileile130135140gluthrileserleuleuileglnprometalaleualavalargleu145150155160thralaasnilethralaglyhisleuleumethisleuileglyser165170175alathrleualametserthrileasnleuproserthrleuileile180185190phethrileleuileleuleuthrileleugluilealavalalaleu195200205ileglnalatyrvalphethrleuleuvalserleutyrleuhisser210215220asnsertrpaspproglnglnmetalaleuleuasnalaasnproser225230235240leuthrproleuleuglyleuleuleualaalaalaglylysserala245250255glnleuglyleuhisprotrpleuproseralametgluglyprothr260265270provalseralaleuleuhisserserthrmetvalvalalaglyile275280285pheleuleuileargphehisproleualagluasnserproleuile290295300glnthrleuthrleucysleuglyalailethrthrleuphealaala305310315320valcysalaleuthrglnasnaspilelyslysilevalalapheser325330335thrserserglnleuglyleumetmetvalthrileglyileasngln340345350prohisleualapheleuhisilecysthrhisalaphephelysala355360365metleuphemetcysserglyserileilehisasnleuasnasnglu370375380glnaspilearglysmetglyglyleuleulysthrmetproleuthr385390395400serthrserleuthrileglyserleualaleualaglymetprophe405410415leuthrglyphetyrserlysasphisileilegluthralaasnmet420425430sertyrthrasnalatrpalaleuserilethrleuilealathrser435440445leuthrseralatyrserthrargmetileleuleuthrleuthrgly450455460glnproargpheprothrleuthrasnileasngluasnasnprothr465470475480leuleuasnproilelysargleualaalaglyserleuphealagly485490495pheleuilethrasnasnileserproalaserpropheglnthrthr500505510ileproleutyrleulysleuthralaleualavalthrpheleugly515520525leuleuthralaleuaspleuasntyrleuthrasnlysleulysmet530535540lysserproleucysthrphetyrpheserasnmetleuglyphetyr545550555560proserilethrhisargthrileprotyrleuglyleuleuthrser565570575glnasnleuproleuleuleuleuaspleuthrtrpleuglulysleu580585590leuprolysthrileserglnhisglnileserthrserileilethr595600605serthrglnlysglymetilelysleutyrpheleuserphephephe610615620proleuileleuthrleuleuleuilethrxaa625630635<210>47<211>515<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(515)..(515)<223>xaa可以是任何天然存在的氨基酸<400>47metthrhisglnserhisalatyrhismetvallysproserprotrp151015proleuthrglyalaleuseralaleuleumetthrserglyleuala202530mettrpphehisphehissermetthrleuleumetleuglyleuleu354045thrasnthrleuthrmettyrglntrptrpargaspvalthrargglu505560serthrtyrglnglyhishisthrproprovalglnlysglyleuarg65707580tyrglymetileleupheilethrsergluvalphephephealagly859095phephetrpalaphetyrhisserserleualaprothrproglnleu100105110glyglyhistrpproprothrglyilethrproleuleuglyleuleu115120125leualaalaalaglylysseralaglnleuglyleuhisprotrpleu130135140proseralametgluglyprothrprovalseralaleuleuhisser145150155160serthrmetvalvalalaglyilepheleuleuileargphehispro165170175leualagluasnserproleuileglnthrleuthrleucysleugly180185190alailethrthrleuphealaalavalcysalaleuthrglnasnasp195200205ilelyslysilevalalapheserthrserserglnleuglyleumet210215220metvalthrileglyileasnglnprohisleualapheleuhisile225230235240cysthrhisalaphephelysalametleuphemetcysserglyser245250255ileilehisasnleuasnasngluglnaspilearglysmetglygly260265270leuleulysthrmetproleuthrserthrserleuthrileglyser275280285leualaleualaglymetpropheleuthrglyphetyrserlysasp290295300hisileilegluthralaasnmetsertyrthrasnalatrpalaleu305310315320serilethrleuilealathrserleuthrseralatyrserthrarg325330335metileleuleuthrleuthrglyglnproargpheprothrleuthr340345350asnileasngluasnasnprothrleuleuasnproilelysargleu355360365alaalaglyserleuphealaglypheleuilethrasnasnileser370375380proalaserpropheglnthrthrileproleutyrleulysleuthr385390395400alaleualavalthrpheleuglyleuleuthralaleuaspleuasn405410415tyrleuthrasnlysleulysmetlysserproleucysthrphetyr420425430pheserasnmetleuglyphetyrproserilethrhisargthrile435440445protyrleuglyleuleuthrserglnasnleuproleuleuleuleu450455460aspleuthrtrpleuglulysleuleuprolysthrileserglnhis465470475480glnileserthrserileilethrserthrglnlysglymetilelys485490495leutyrpheleuserphephepheproleuileleuthrleuleuleu500505510ilethrxaa515<210>48<211>543<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(543)..(543)<223>xaa可以是任何天然存在的氨基酸<400>48metasnphealaleuileleumetileasnthrleuleualaleuleu151015leumetileilethrphetrpleuproglnleuasnglytyrmetglu202530lysserthrprotyrglucysglypheaspprometserproalaarg354045valprophesermetlysphepheleuvalalailethrpheleuleu505560pheaspleugluilealaleuleuleuproleuprotrpalaleugln65707580thrthrasnleuproleumetvalmetserserleuleuleuileile859095ileleualaleuserleualaasnthralaalaileglnalaileleu100105110tyrasnargileglyaspileglypheileleualaleualatrpphe115120125ileleuhisserasnsertrpaspproglnglnmetalaleuleuasn130135140alaasnproserleuthrproleuleuglyleuleuleualaalaala145150155160glylysseralaglnleuglyleuhisprotrpleuproseralamet165170175gluglyprothrprovalseralaleuleuhisserserthrmetval180185190valalaglyilepheleuleuileargphehisproleualagluasn195200205serproleuileglnthrleuthrleucysleuglyalailethrthr210215220leuphealaalavalcysalaleuthrglnasnaspilelyslysile225230235240valalapheserthrserserglnleuglyleumetmetvalthrile245250255glyileasnglnprohisleualapheleuhisilecysthrhisala260265270phephelysalametleuphemetcysserglyserileilehisasn275280285leuasnasngluglnaspilearglysmetglyglyleuleulysthr290295300metproleuthrserthrserleuthrileglyserleualaleuala305310315320glymetpropheleuthrglyphetyrserlysasphisileileglu325330335thralaasnmetsertyrthrasnalatrpalaleuserilethrleu340345350ilealathrserleuthrseralatyrserthrargmetileleuleu355360365thrleuthrglyglnproargpheprothrleuthrasnileasnglu370375380asnasnprothrleuleuasnproilelysargleualaalaglyser385390395400leuphealaglypheleuilethrasnasnileserproalaserpro405410415pheglnthrthrileproleutyrleulysleuthralaleualaval420425430thrpheleuglyleuleuthralaleuaspleuasntyrleuthrasn435440445lysleulysmetlysserproleucysthrphetyrpheserasnmet450455460leuglyphetyrproserilethrhisargthrileprotyrleugly465470475480leuleuthrserglnasnleuproleuleuleuleuaspleuthrtrp485490495leuglulysleuleuprolysthrileserglnhisglnileserthr500505510serileilethrserthrglnlysglymetilelysleutyrpheleu515520525serphephepheproleuileleuthrleuleuleuilethrxaa530535540<210>49<211>43<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(43)..(43)<223>xaa可以是任何天然存在的氨基酸<400>49metproglnleuasnthrthrvaltrpprothrmetilethrpromet151015leuleuthrleupheleuilethrglnleulysmetleuasnthrasn202530tyrhisleuproproserproleualaalaxaa3540<210>50<211>951<212>rna<213>人<400>50augaacgaaaaucuguucgcuucauucauugcccccacaauccuaggccuacccgccgca60guacugaucauucuauuucccccucuauugauccccaccuccaaauaucucaucaacaac120cgacuaaucaccacccaacaaugacuaaucaaacuaaccucaaaacaaaugauaaccaua180cacaacacuaaaggacgaaccugaucucuuauacuaguauccuuaaucauuuuuauugcc240acaacuaaccuccucggacuccugccucacucauuuacaccaaccacccaacuaucuaua300aaccuagccauggccauccccuuaugagcgggcacagugauuauaggcuuucgcucuaag360auuaaaaaugcccuagcccacuucuuaccacaaggcacaccuacaccccuuauccccaua420cuaguuauuaucgaaaccaucagccuacucauucaaccaauagcccuggccguacgccua480accgcuaacauuacugcaggccaccuacucaugcaccuaauuggaagcgccacccuagca540auaucaaccauuaaccuucccucuacacuuaucaucuucacaauucuaauucuacugacu600auccuagaaaucgcugucacuuuccuaggacuucuaacagcccuagaccucaacuaccua660accaacaaacuuaaaauaaaauccccacuaugcacauuuuauuucuccaacauacucgga720uucuacccuagcaucacacaccgcacaauccccuaucuaggccuucuuacgagccaaaac780cugccccuacuccuccuagaccuaaccugacuagaaaagcuauuaccuaaaacaauuuca840cagcaccaaaucuccaccuccaucaucaccucaacccaaaaaggcauaauuaaacuuuac900uuccucucuuucuucuucccacucauccuaacccuacuccuaaucacauaa951<210>51<211>951<212>dna<213>artificial<220><223>cdna<400>51atgaacgaaaatctgttcgcttcattcattgcccccacaatcctaggcctacccgccgca60gtactgatcattctatttccccctctattgatccccacctccaaatatctcatcaacaac120cgactaatcaccacccaacaatgactaatcaaactaacctcaaaacaaatgataaccata180cacaacactaaaggacgaacctgatctcttatactagtatccttaatcatttttattgcc240acaactaacctcctcggactcctgcctcactcatttacaccaaccacccaactatctata300aacctagccatggccatccccttatgagcgggcacagtgattataggctttcgctctaag360attaaaaatgccctagcccacttcttaccacaaggcacacctacaccccttatccccata420ctagttattatcgaaaccatcagcctactcattcaaccaatagccctggccgtacgccta480accgctaacattactgcaggccacctactcatgcacctaattggaagcgccaccctagca540atatcaaccattaaccttccctctacacttatcatcttcacaattctaattctactgact600atcctagaaatcgctgtcactttcctaggacttctaacagccctagacctcaactaccta660accaacaaacttaaaataaaatccccactatgcacattttatttctccaacatactcgga720ttctaccctagcatcacacaccgcacaatcccctatctaggccttcttacgagccaaaac780ctgcccctactcctcctagacctaacctgactagaaaagctattacctaaaacaatttca840cagcaccaaatctccacctccatcatcacctcaacccaaaaaggcataattaaactttac900ttcctctctttcttcttcccactcatcctaaccctactcctaatcacataa951<210>52<211>317<212>prt<213>artificial<220><223>推定的蛋白序列<220><221>misc_feature<222>(317)..(317)<223>xaa可以是任何天然存在的氨基酸<400>52metasngluasnleuphealaserpheilealaprothrileleugly151015leuproalaalavalleuileileleupheproproleuleuilepro202530thrserlystyrleuileasnasnargleuilethrthrglnglntrp354045leuilelysleuthrserlysglnmetmetthrmethisasnthrlys505560glyargthrtrpserleumetleuvalserleuileilepheileala65707580thrthrasnleuleuglyleuleuprohisserphethrprothrthr859095glnleusermetasnleualametalaileproleutrpalaglythr100105110valilemetglypheargserlysilelysasnalaleualahisphe115120125leuproglnglythrprothrproleuileprometleuvalileile130135140gluthrileserleuleuileglnprometalaleualavalargleu145150155160thralaasnilethralaglyhisleuleumethisleuileglyser165170175alathrleualametserthrileasnleuproserthrleuileile180185190phethrileleuileleuleuthrileleugluilealavalthrphe195200205leuglyleuleuthralaleuaspleuasntyrleuthrasnlysleu210215220lysmetlysserproleucysthrphetyrpheserasnmetleugly225230235240phetyrproserilethrhisargthrileprotyrleuglyleuleu245250255thrserglnasnleuproleuleuleuleuaspleuthrtrpleuglu260265270lysleuleuprolysthrileserglnhisglnileserthrserile275280285ilethrserthrglnlysglymetilelysleutyrpheleuserphe290295300phepheproleuileleuthrleuleuleuilethrxaa305310315当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1