本发明涉及用于在动物细胞中导入并持续表达外源基因的载体。
背景技术:
从外部将任意基因导入至包括人类细胞在内的动物细胞中并在该细胞中持续表达的技术是在使用生物技术的各种行业中所必需的技术。例如,为了大量生产工业用的作为医药品使用的人类单克隆抗体,使免疫球蛋白的h链和l链的基因以同等水平持续表达的技术是必要的。另外,在先天性代谢疾病的基因治疗中,将治疗用基因导入人类的组织细胞并在体内长时间稳定表达的技术是必要的。
1.关于细胞重编程技术
近年来,使用基因将正常组织细胞的性质进行转换而制作有用细胞的细胞重编程技术备受瞩目,然而,在动物细胞中导入基因并持续表达的技术成为即使在细胞重编程中也不可缺少的基础技术。例如,通过将被称为oct4、sox2、klf4、c-myc或被称为oct4、sox2、nanog、lin28的4个基因进行组合并导入人类正常成纤维细胞,使该基因持续表达21天,可以制作人类诱导多能干细胞(ips细胞)(专利文献1、专利文献2、非专利文献1、非专利文献2)。同时,通过在人类的成纤维细胞中导入被称为foxa3、hnf1a、hnf4a的3个基因并使之持续表达14天,可以制作肝细胞(非专利文献3)。此外,也有报道指出,通过在人类的成纤维细胞中导入被称为ascl1、brn2、myt1l、lmx1a、foxa2的5个基因并使之持续表达24天,可以制作多巴胺能神经元(dopaminergicneuron)(非专利文献4)。如上所述,在各种细胞重编程中,可以同时向细胞导入多个基因并进行表达并在对于重编程而言必要的期间维持其表达的技术被认为是必要的。
已知在活体内也可以诱导细胞重编程。例如,已有报道指出,在小鼠的心肌梗塞模型中,将gata4、mef2c、tbx5这3个基因或者gata4、hand2、mef2c、tbx5这4个基因向梗塞部位投药,浸润的成纤维细胞变化成为心肌细胞(非专利文献5、非专利文献6),因此,期待细胞重编程技术将来成为心肌梗塞或脊髓损伤等再生医疗的基础。
2.细胞重编程效率的提高
另外,假定在体外将细胞重编程用于医疗,期望作为材料的细胞可以在不实施侵袭的情况下从人体采取,并且可以在不被活体外的微生物污染的状态下采取。满足这些条件的细胞几乎仅限于外周血中的单核细胞,期望有适用于这些细胞的基因导入载体。
一般而言,借助由外部导入的基因将动物细胞重编程的效率非常低,然而,将该基因全部搭载于一个载体上,通过向细胞一次性导入使之表达,可提高其效率(专利文献3、专利文献4、非专利文献7、非专利文献8)。
此外,还已知通过增加在细胞重编程中使用的基因的数目,也会提高其效率。例如,已知在将小鼠成纤维细胞转换成诱导多能干细胞(ips细胞)的技术中,通过向oct4、sox2、klf4、c-myc这4个基因追加brg1和baf155这2个基因,共计使用6个基因,转换效率提高5倍(非专利文献9)。另外,已知在将人类成纤维细胞重编程为运动神经的技术中,通过向被称为lhx3、ascl1、brn2、myt1l的4个基因追加被称为hb9、isl1、ngn2的3个基因,共计使用7个基因,重编程效率提高100倍(非专利文献10)。
增加细胞重编程中使用的基因的数目,则不得不搭载的基因的大小也增大。以制作ips细胞的情况为例,klf4、oct4、sox2、c-myc这4个基因合计为4,774个碱基对,然而,如果追加上述brg1(5,040个碱基对)和baf155(3,318个碱基对)这2个基因,则合计为13,132个碱基对(非专利文献9)。此外,如果向klf4、oct4、sox2、c-myc这4个基因追加编码染色质重构因子的chd1基因(5,133个碱基对),则合计为9,907个碱基对,染色质重构因子在胚胎干细胞中特异性表达,预测将加速ips细胞的初始化;如果追加编码dna去甲基化酶的tet1基因(6,429个碱基对),则合计为11,203个碱基对。此外,在将人类成纤维细胞重编程为运动神经的技术中使用的lhx3、ascl1、brn2、myt1l、hb9、isl1、ngn2这7个基因合计为9,887个碱基对(非专利文献10)。
如上所述,为了提高细胞重编程的效率,期望使用至少6个以上的基因,并且期望可以一次性搭载所有这些基因的载体。另外,导入的外源基因的大小共计为5,000个碱基以上,因而期望即使是8,000个碱基以上也能进行表达的载体。
另外,在本说明书中,载体是指以包含外源基因的核酸作为成分,可以将该核酸导入动物细胞并表达该基因的基因重组病毒或非病毒性的核酸·高分子物质复合体。
另外,已知在使外源基因表达而进行动物细胞的重编程的情况下,该基因的表达水平对通过重编程制作的细胞的性质产生很大影响。例如,已知在使被称为oct4、sox2、klf4、c-myc的4个基因在小鼠成纤维细胞中表达的情况下,在该基因表达弱的情况下产生ips细胞,与之相对,在该基因表达强的情况下产生与ips细胞性质完全不同的细胞(非专利文献11)。因此,在使由外部导入的基因表达而对包括人类细胞在内的动物细胞进行重编程的技术中,能够根据目的将该基因的表达设定为最适水平的载体是必要的。
3.重编程用基因的去除
进一步地,为了使通过由外部导入基因进行细胞重编程而制作的细胞完全发挥其功能,将该重编程用基因从该细胞完全去除是必要的。另外,在将制作的人类细胞作为再生医疗的材料使用时,为了确保安全性,将该基因从该细胞完全去除也是必要的。例如,在使用oct4、sox2、klf4、c-myc这4个基因制作的诱导多能干细胞(ips细胞)中,因为这4个基因维持表达时不能发挥多能性,所以,相比至少完全抑制其表达,更期望的是需要从该细胞完全去除(专利文献1、专利文献2、专利文献3、非专利文献1、非专利文献2、非专利文献7)。另外,已知制作ips细胞时使用的c-myc基因若残留在该ips细胞中,则使该ips细胞再分化而制作的组织细胞会以高频率发生癌变(非专利文献12)。因此,为了确保安全性,需要将该c-myc基因从ips细胞完全去除。
如上所述,在细胞重编程中必要的基因表达技术必须兼顾下述矛盾的性质:一方面为了实现重编程而期望最适水平的持续的基因表达;另一方面要求一旦重编程完成可简单且完全地去除。
4.避免先天免疫机制激活的重要性
现在,就用于动物细胞的几乎所有的基因导入、表达载体而言,以感染动物的病毒或使用大肠杆菌等微生物制造的质粒dna作为材料使用。但是,为了击退由外部侵入的病原体,动物细胞具备先天免疫机制(非专利文献13),从细胞外导入的源自病毒或微生物的核酸作为异物被识别,激活先天免疫机制。先天免疫机制的激活程度超过一定水平,则通过细胞凋亡诱导细胞死亡,导致重编程效率降低。另外,通过先天免疫机制的激活诱导干扰素或炎性细胞因子的表达时,在活体内引起炎症。为了防止此类不期望的反应,在进行细胞重编程的基因导入、表达技术中,要求避免先天免疫机制的激活。特别是对于在前述1.所述的包括活体内的细胞重编程在内的再生医疗的应用中,该性质很重要。
5.理想的用于细胞重编程的基因导入、表达系统
通过以上的探讨,为了将使用基因对包括人类细胞在内的动物细胞进行重编程的技术进行进一步改良而应用于产业中,如上述1.~4.所探讨的,至少满足以下5个条件的基因导入、表达技术是必要的。
(1)可将外源基因有效导入包括人类外周血细胞在内的动物细胞。
(2)可在必要的任意期间持续表达该基因。
(3)在该基因表达时,可避免细胞所具有的先天免疫机制。
(4)即使导入的外源基因长度合计为5,000个碱基以上、期望为8,000个碱基以上,仍可表达。
(5)可同时表达至少6个、期望为8个以上的该基因。
而且,进一步强烈期望还实现以下方面。
(6)可调节该基因的表达水平。特别是,在导入基因为多个的情况下,优选可分别调节各基因的表达水平。
另外,尤其在将基因导入细胞应用于移植技术的情况下,以下方面也成为极重要的要点。
(7)在该基因变为不需要时,可通过简单的方法去除。
6.向动物细胞导入多个基因的技术
这是向包括人类细胞在内的动物细胞由外部导入多个基因并在该细胞中持续表达的技术,作为已报道的可使用于细胞重编程的技术,已知有以下3种:
(1)将该基因插入存在于细胞核内的基因组dna中的方法;
(2)将该基因搭载于在细胞核内可与基因组dna独立且稳定地存在的dna中的方法;
(3)将该基因搭载于存在于细胞质的rna中的方法。
6-1.将多个基因插入细胞核内的基因组dna中的方法
就使用慢病毒载体(非专利文献8、非专利文献14)、转座子(非专利文献15、非专利文献16)、非同源重组、同源重组等将外源基因插入存在于细胞核内的基因组dna中的方法而言,该基因可与基因组dna同等且稳定地存在。但是,一旦被插入基因组dna,为了仅将该基因从基因组dna选择性地去除,除了需要将序列特异性重组酶导入细胞等繁杂的操作之外,并不能在所有细胞中确实地去除(非专利文献15)。另外,向基因组dna插入外源基因需要宿主细胞的dna复制,因此,向血液细胞等增殖能力低的细胞导入基因的效率极低。进一步地,已知通过将外源基因随机插入基因组dna引起宿主的基因破坏或异常激活的被称为“插入突变”的现象,因此,为了进行医疗应用,尚存在安全性的顾虑(非专利文献17)。
6-2.在细胞核内将多个基因搭载于与基因组dna独立的dna中的方法
作为在细胞核内将外源基因搭载于可与基因组dna独立且稳定存在的dna中的方法,已知使用搭载epstein-barr病毒的基因组的复制起点的环状dna的方法(非专利文献18);以及使用包含直链巨大dna的人工染色体的方法(非专利文献19)。这些dna分子在人类细胞的细胞核内持续且稳定地维持复制,然而,该机制依赖于宿主细胞基因组dna进行复制的机制。因此,不能仅特异性地抑制搭载外源基因的dna的复制,而且尚未报道将该dna从细胞主动去除的技术。另外,为了将该dna分子导入细胞核内,宿主细胞的分裂是必要的,因此,向血液细胞等增殖能力低的细胞导入基因的效率极低。另外,已知细胞核内的环状dna高频率地并入该细胞的基因组dna,因此,不能排除插入突变的危险性(非专利文献20)。
6-3.由同一载体dna表达多个基因的技术
另外,在如上述6-1.和6-2.所记载的将dna作为基因表达的平台使用的情况下,由同一载体dna表达多个基因的技术是必要的。作为该技术,已知有以下3种:1)将多个独立的基因简单地连接后进行表达的方法;2)使用被称为内部核糖体进入位点(ires)的rna结构,由一条信使rna(mrna)表达多个蛋白质的方法;3)将多个蛋白质通过2a肽连接而表达融合蛋白的方法。
就将多个独立的基因进行连接的方法而言,已知由于基因间的相互干扰而使得基因表达受到强烈抑制(非专利文献21)。为了防止上述情况,需要在基因之间插入被称为绝缘子的结构,在使载体dna的大小变大的同时,结构也变得复杂。就该方法而言,报道了将4个基因搭载于1个dna分子中使之表达的实例(非专利文献22),然而,尚未报道将5个以上基因同时表达的实例。
就使用ires序列由一条信使rna(mrna)表达多个蛋白质的方法而言,置于ires序列下游的蛋白质的翻译效率比置于ires序列上游的蛋白质的翻译效率低,有时为10%以下(非专利文献23)。另外,因为ires序列的大小较大且结构复杂,所以,使用ires序列的方法主要用于同时表达2个蛋白质。
2a肽是在正单链rna病毒中发现的由18至22个氨基酸残基构成的结构,多个蛋白质通过2a肽连接而成的融合蛋白在合成时自动断开,分解为原来的多个蛋白质。就该技术而言,在断开后产生的各蛋白质的n末端残留有1个脯氨酸,c末端残留有17至21个氨基酸残基,这些多余的氨基酸残基具有对该蛋白质的功能产生影响的可能性(非专利文献24)。另外,在2a肽部位的断开效率受到融合蛋白结构的巨大影响,因此,为了高效制作多个蛋白质,付出劳动来试错是必要的(非专利文献25)。就通过2a肽连接多个蛋白质的方法而言,报道了同时表达4个蛋白质的实例(非专利文献8)以及同时表达5个蛋白质的实例(非专利文献16)。另外,也报道了将ires序列与2a肽组合而表达4个蛋白质的实例(非专利文献14)。
6-4.将多个基因搭载于存在于细胞质的rna中的方法
如前述6-1.~6-3.所记载的,就将dna作为基因表达平台使用的目前的基因导入、表达技术而言,报道了使用4个至5个基因的细胞重编程。但是,限于将dna作为基因表达的平台使用,不能容易地同时搭载6个以上基因,并且不能容易地通过简单的方法实现基因的去除,也尚未报道可全部满足前述5.所示的理想的重编程中所要求的5个条件的技术。
另一方面,作为将rna作为平台将多个基因由外部导入包括人类细胞在内的动物细胞并表达并将细胞进行重编程的技术,报道了使用正链rna的技术(非专利文献26、非专利文献27);以及使用负链rna的技术(专利文献3、专利文献4、专利文献5、专利文献6、非专利文献7、非专利文献28、非专利文献29、非专利文献30)。
6-4-1.使用正链rna的方法
作为使用可在细胞质中稳定存在的正链rna对细胞进行重编程的技术,已报道了使用源自委内瑞拉马脑炎病毒(veev)的正单链基因组rna的技术(非专利文献26)。就该技术而言,通过将veev的基因组rna3ˊ侧的结构基因替换成编码由2a肽连接的蛋白质的基因,实现了4个蛋白质的表达。该系统引起非常强的干扰素表达的诱导,必须与抗干扰素物质(源自痘苗病毒的b18r蛋白质)进行组合(非专利文献26)。另外,基因导入的效率依赖于进行组合的基因导入试剂,重编程的可能性被限定于成纤维细胞等贴壁细胞。搭载外源基因的rna是不稳定的,因此,b18r蛋白质被从培养基去除而消失。
作为使用正链rna对细胞进行重编程的技术,也报道了使用化学合成的信使rna(mrna)的技术(非专利文献27)。因为该现有技术是将各自分别搭载最多5个外源基因的多个mrna混合,然后使用基因导入试剂导入细胞,所以基因表达是瞬时的,因此,每天向该细胞重新进行导入是必要的。另外,基因导入的可能性限于成纤维细胞等贴壁细胞。在该技术中还强烈激活先天免疫机制,因此,与抗干扰素物质(源自痘苗病毒的b18r蛋白质)进行组合是必要的(非专利文献27)。
6-4-2.使用负链rna的方法
作为使用负链rna对细胞进行重编程的技术,作为现有技术已报道了在作为一种副粘病毒的仙台病毒野生株中将分别搭载外源基因的载体混合使用的方法(专利文献5、非专利文献28、非专利文献29);以及同时搭载3个基因的方法(专利文献6、非专利文献30)。就使用这些负链rna的基因表达系统而言,因为缺失f基因,野生型病毒的自主复制能力减弱,外源基因分别作为单独的基因表达盒被搭载。没有记载关于先天免疫机制的激活,然而,已知作为材料的仙台病毒具有强烈的干扰素诱导能力(非专利文献31),因此,预测该载体也具有基于此的先天免疫机制激活能力。另外,报道了在野生型病毒的基因组中导入温度敏感型突变,使培养温度升高可以去除载体(专利文献6、非专利文献29、非专利文献30)。已报道了使用基于野生型仙台病毒的载体可表达的基因的大小为3078个碱基对(大肠杆菌β-半乳糖苷酶)(非专利文献32)至3450个碱基对(klf4、oct4、sox2这3个基因的合计)(专利文献6、非专利文献30)。
另外,作为使用负链rna对细胞进行重编程的技术,已报道了基于持续感染突变仙台病毒的技术(专利文献3、专利文献4、非专利文献7)。在该技术中,在成为载体材料的病毒基因组中,已确认与长期持续性相关的多个点突变,显示这些突变与避免先天免疫机制激活(干扰素表达的降低)相关。另外,通过从病毒基因组删除3个基因后搭载新基因,可使4个外源基因同时表达。进一步地,报道了通过用小干扰rna(shortinterferingrna,sirna)抑制编码rna依赖性rna合成酶的l基因的表达,主动将载体从细胞去除。就基于持续感染突变仙台病毒的载体而言,报道了可表达的基因的大小为4774个碱基对(klf4、oct4、sox2、c-myc这4个基因的合计)(专利文献3、专利文献4、非专利文献7)。
7.多个基因导入技术的今后的课题
就前述6-4.所述的将rna作为基因表达平台使用的目前的基因导入、表达技术而言,报道了使用4个至5个基因的细胞重编程。其中,前述6-4-2.所述的缺失持续表达型仙台病毒载体具有最优异的性质,然而,已报道的可搭载的基因的数目为最多4个。另外,就将rna病毒作为材料的技术而言,很难使基因表达水平发生变化。
如前述6.所述,由外部将多个基因导入包括人类细胞在内的动物细胞并在该细胞中持续表达的技术的目标是针对使用基因将正常组织细胞的性质进行转换并制作有用细胞的细胞重编程进行优化,进行各种改良。但是,完全满足如前述5.所示的理想的重编程所要求的5个条件的技术迄今未见报道。
现有技术文献
专利文献
专利文献1:wo2007/069666
专利文献2:wo2008/118820
专利文献3:wo2010/134526
专利文献4:wo2012/063817
专利文献5:wo2010/008054
专利文献6:wo2012/029770
专利文献7:美国专利第8,326,547号说明书
专利文献8:美国专利第8,401,798号说明书
专利文献9:美国专利第7,561,973号说明书
非专利文献
非专利文献1:takahashi等,cell,131,861-872,2007
非专利文献2:yu等,science,318,1917-1920,2007
非专利文献3:huang等,cellstemcell,14,370-384,2014
非专利文献4:son等,cellstemcell,9,205-218,2011
非专利文献5:qian等,nature,485,593-598,2012
非专利文献6:song等,nature,485,599-604,2012
非专利文献7:nishimura等,j.biol.chem.,286,4760-4771,2011
非专利文献8:carey等,proc.natl.acad.sci.usa,106,157-162,2009
非专利文献9:singhal等,cell,141,943-955,2010
非专利文献10:son等,cellstemcell,9,205-218,2011
非专利文献11:tonge等,nature,516,192-197,2014
非专利文献12:miura等,naturebiotechnology,27,743-745,2009
非专利文献13:randall,j.genvirol.,89,1-47,2008
非专利文献14:sommer等,stemcells,28,64-74,2010
非专利文献15:kaji等,nature,458,771-775,2009
非专利文献16:grabundzjia等,nuc.acidsres.,41,1829-1847,2013
非专利文献17:hacein-bey-abina等,science,302,415-419,2003
非专利文献18:wu等,proc.natl.acad.sci.usa,111,10678-10683,2014
非专利文献19:hiratsuka等,plosone,6,e25961,2011
非专利文献20:hurley等,j.virol.,65,1245-1254,1991
非专利文献21:yahata等,j.mol.biol.,374,580-590,2007
非专利文献22:nishiumi等,cellstruct.funct.,34,47-59,2009
非专利文献23:balvay等,biochi.biophys.acta,1789,542-557,2009
非专利文献24:felipe等,trendsbiotech.,24,68-75,2006
非专利文献25:lengler等,anal.biochem.,343,116-124,2005
非专利文献26:yoshioka等,cellstemcell,13,246-254,2013
非专利文献27:warren等,cellstemcell,7,1-13,2010
非专利文献28:fusaki等,proc.jpn.acad.ser.b85,348-362,2009
非专利文献29:ban等,proc.natl.acad.sci.usa,108,14234-14239,2011
非专利文献30:fujie等,plosone,9,e113052,2014
非专利文献31:hua等,j.leukocytebiol.,60,125-128,1996
非专利文献32:sakai等,febslett.,456,221-226,1999
非专利文献33:kondo等,j.biol.chem.,268,21924-21930,1993
非专利文献34:ward等,proc.natl.acad.sci.usa,108,331-336,2011
非专利文献35:saito等,nature,454,523-527,2008
非专利文献36:vabret等,plosone,7,e33502,2012
非专利文献37:rehwinkel等,cell,140,397-408,2010
非专利文献38:shioda等,nuc.acidsres.,14,1545-1563,1986
非专利文献39:vidal等,j.virol.,64,239-246,1990
非专利文献40:irie等,j.virol.,86,7136-7145,2012
非专利文献41:kato等,emboj.,16,578-587,1997
非专利文献42:tapparel等,j.virol.,72,3117-3128,1998
非专利文献43:park等,proc.natl.acad.sci.usa,88,5537-5541,1991
非专利文献44:harty等,j.virol.,69,5128-5131,1995
非专利文献45:willenbrink等,j.virol.,68,8413-8417,1994
非专利文献46:sharp等,nuc.acidsres.,15,1281-1295,1987
非专利文献47:guigo等,j.mol.biol.,253,51-60,1995
非专利文献48:vabret等,j.virol.,88,4161-4172,2014
非专利文献49:raab等,syst.synth.biol.,4,215-225,2010
非专利文献50:alan,h.,gene,56,125-135,1987
非专利文献51:kuo等,j.virol.,62,4439-4444,1988
非专利文献52:sengupta等,j.biol.chem.,264,14246-14255,1989
非专利文献53:melton等,nuc.acidsres.,12,7035-7056,1984
非专利文献54:hampel,a.等,biochemistry,28,4929-4933,1989
非专利文献55:tuschl等,genesdev.,13,3191-3197,1999
非专利文献56:chang等,j.bacteriol.,134,1141-1156,1978
非专利文献57:garcin等,emboj.,14,6087-6094,1995
非专利文献58:gotoh等,virology,171,434-443,1989
非专利文献59:lopez等,mol.microbiol.,33,188-199,1999
非专利文献60:kozak,cell,44,283-292,1986
非专利文献61:kozak,mol.cellbiol.,7,3438-3445,1987
非专利文献62:vara等,gene,33,197-206,1985
非专利文献63:nakajima等,biosci.biotechnol.biochem.,68,565-570,2004
非专利文献64:ai等,biochemistry,46,5904-5910,2007
非专利文献65:drocourt等,nuc.acidsres.,18,4009,1990
非专利文献66:kogure等,nat.biotechnol.,24,577-581,2006
非专利文献67:gritz等,gene,25,179-188,1983
非专利文献68:studier等,j.mol.biol.,189,113-130,1986
非专利文献69:nawa等,biol.pharm.bull,21,893-898,1998
非专利文献70:karasawa等,biochem.j.,381,307-312,2004
非专利文献71:yoneyama等,natureimmunol.,5,730-737,2004
非专利文献72:sakaguchi等,microbiol.immunol.,55,760-767,2011
非专利文献73:jia等,j.immunol.,183,4241-4248,2009
非专利文献74:studier等,j.mol.biol.,189,113-130,1986
非专利文献75:akagi等,proc.natl.acad.sci.usa,100,13567-13572,2003
非专利文献76:hatsuzawa等,j.biol.chem.,265,22075-22078,1990
非专利文献77:boshart等,cell,41,521-530,1985
非专利文献78:taira等,arch.virol.,140,187-194,1995
非专利文献79:takebe等,mol.cellbiol.,8,466-472,1988
非专利文献80:recillas-targa等,proc.natl.acad.sci.usa,99,6883-6888,2002
非专利文献81:fujita等,cell,41,489-496,1985
非专利文献82:yi和lemon,j.virol.,77,3557-3568,2003
非专利文献83:you和rice,j.virol.,82,184-195,2008
非专利文献84:chromikova等,cytotechnology,67,343-356,2015
非专利文献85:brandlein和vollmers,histol.histopathol.,19,897-905,2004
非专利文献86:okada等,microbiol.immunol.,49,447-459,2005
非专利文献87:lewis等,naturebiotech.,32,191-198,2014
非专利文献88:wurm.,naturebiotech.,22,1393-1398,2004
技术实现要素:
发明所要解决的技术问题
如上所述,本发明所要解决的技术问题之一是开发为了使用基因将包括人类细胞在内的动物细胞进行重编程而所期望的基因导入、表达技术以及用于该技术的载体。进一步地,本发明提供可搭载不限于重编程基因的全长为5,000个碱基以上或至少6个以上的外源基因并且在动物细胞中既不激活先天免疫机制又可持续表达的载体。同时,本发明还提供用于在载体上搭载6个以上外源基因的有效方法。
并且,本发明提供特别是对于重编程技术而言所期望的满足以下(1)~(5)的条件、优选进一步满足包括(6)、(7)的条件的基因导入、表达技术。
(1)可将外源基因有效导入包括人类外周血细胞在内的动物细胞。
(2)可在必要的任意期间持续表达该基因。
(3)在该基因表达时,可避免细胞所具有的先天免疫机制。
(4)即使导入的外源基因长度合计为5,000个碱基以上、期望为8,000个碱基以上,仍可表达。
(5)可同时表达至少6个、期望为8个以上的该基因。
(6)可调节该基因的表达水平。特别是,在导入基因为多个的情况下,可分别调节。
另外,特别是在应用于移植技术的情况下,以下方面也成为重要的要点。
(7)在该基因变为不需要时,可通过简单的方法去除基因表达系统。解决技术问题的技术手段
如背景技术的6-1.~6-3.所述,在将dna作为基因表达的平台使用的情况下,具备作为本发明所要解决的技术问题所显示的理想的重编程所要求的全部5个条件、更优选全部7个条件,这在原理上是极为困难的。另一方面,如6-4.所述,在将rna作为基因表达的平台使用的情况下,在将可搭载于同一载体上的基因数的上限提高至6个以上且将全基因长度提高至5,000个碱基以上的同时,如何避免源自病毒的rna引起细胞内的先天免疫机制激活的问题,成为最大的课题。
在此,本发明将源自不激活先天免疫机制的动物细胞的mrna作为材料使用,首先设计将这些rna与rna依赖性rna合成酶识别的转录起始信号、转录终止信号、复制起点组合的负单链rna。接着,将编码rna依赖性rna合成酶等转录和复制必需的4个蛋白质的基因进行结构优化,使之不被先天免疫机制作为异物识别,然后搭载于该负单链rna上。进一步地,开发使用5种限制性酶将10个基因按照设计进行结合的新方法,将与这10个基因互补的crna搭载于上述负单链rna上。
通过将经上述方法完成的负单链rna作为基因表达的平台使用,成功搭载至少10个外源基因(合计大小为至少13,500个碱基),并且既不激活先天免疫机制又可长时间持续表达。进一步地,通过改变基因表达所必需的n蛋白或c蛋白的表达效率,可以使搭载的基因的表达在最大80倍的范围内进行调节。如上所述,通过尽可能排除具有源自病毒的结构的rna,成功地制作了大幅超过使用rna病毒的基因组的现有基因表达系统的能力界限的新的基因表达系统。
进一步地,在具有本发明所制作的搭载外源基因的负单链rna的细胞中,按照专利文献3和非专利文献33、非专利文献7所记载的方法,通过表达副粘病毒的外膜蛋白和基质蛋白,将该rna分子进行包封,制作了具有导入其它细胞的活性的颗粒。在包括人类血液细胞在内的各种动物细胞中,该颗粒在将先天免疫机制的激活抑制为低的同时,可以持续表达搭载于该rna分子上的10个基因。进一步地,通过将与搭载于该rna分子上的经结构优化的rna依赖性rna合成酶的基因互补的sirna导入该细胞,可将搭载外源基因的rna分子去除。通过上述方法,确认除了可解决“发明所要解决的技术问题”中所示的(1)~(5)的5个技术问题之外,解决了还包含前述优选情况的技术问题(6)、(7)在内的全部7个技术问题,从而完成了本发明。
本发明中使用的rna分子缺失用于先天免疫机制作为“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pathogen-associatedmolecularpattern,pamp)”进行识别所必需的特异性结构,因此,显示难以被先天免疫机制捕捉的“隐身(stealth)性”。因此,以后将该rna分子称为“具有隐身性的rna”,将使用该rna作为材料的基因表达系统称为“隐身型rna基因表达系统”,将包封该基因表达系统并具有将该基因表达系统导入动物细胞的活性的构建体称为“隐身型rna载体”。
也就是说,本发明如下。
[1]一种隐身型rna基因表达系统,所述隐身型rna基因表达系统是由包含下述(1)~(8)的rna序列的负单链rna(a)、单链rna结合蛋白(b)和rna依赖性rna合成酶(c)构成的不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性rna的目标rna序列;
(2)构成非编码区的源自在动物细胞中表达的mrna的rna序列;
(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的rna序列;
(6)编码该酶的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;
(7)编码调节该酶活性的蛋白质的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;
(8)编码前述单链rna结合蛋白的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列。
此处,典型的导入对象细胞是人类细胞,因此其优选情况可记载如下。
[1’]一种隐身型rna基因表达系统,其是由包含下述(1)~(8)的rna序列的负单链rna(a)、单链rna结合蛋白(b)和rna依赖性rna合成酶(c)构成的不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性rna的目标rna序列;
(2)构成非编码区的源自人类mrna的rna序列;
(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的rna序列;
(6)编码该酶的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;
(7)编码调节该酶活性的蛋白质的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;
(8)编码前述单链rna结合蛋白的rna序列,并且是针对人类细胞进行了密码子优化的rna序列。
[2]如前述[1]所记载的隐身型rna基因表达系统,其中,前述(1)的目标rna序列是包含至少6个基因或全长为5000个碱基以上长度的rna序列。
此处,目标rna序列是可包含7~10个基因且全长为5,000~15,000个碱基长度的rna序列。
[3]如前述[1]或[2]所记载的隐身型rna基因表达系统,其中,前述(2)的rna序列是人类基因的mrna序列中的5~49个碱基长度的rna序列。
此处,作为前述人类基因的mrna序列,优选为人类管家基因的mrna序列,更优选为人类管家基因的mrna序列中的非编码区序列,例如可使用表1所记载的rna序列或其中的连续的5~49个碱基长度的部分序列,或者将其多个连接使用。
[4]如前述[1]~[3]中任一项所记载的隐身型rna基因表达系统,其特征在于,由相同或不同序列构成的前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的各基因序列的3ˊ末端侧和/或5ˊ末端侧。
[5]如前述[1]~[4]中任一项所记载的隐身型rna基因表达系统,其特征在于,
前述(6)的rna序列所编码的rna依赖性rna合成酶是源自属于副粘病毒科的rna病毒的l蛋白和p蛋白;
前述(7)的rna序列所编码的调节该酶活性的蛋白质是源自与该rna病毒相同的病毒的c蛋白;
前述(8)的rna序列所编码的单链rna结合蛋白是源自与该rna病毒相同的病毒的np蛋白;并且
前述(3)~(5)的rna序列中的任一者都是包含源自与该rna病毒相同的病毒的基因组序列中的转录起始信号、转录终止信号和复制起点的rna序列。
[6]如前述[5]所记载的隐身型rna基因表达系统,其中,编码前述l蛋白、p蛋白、c蛋白和np蛋白的rna序列针对人类细胞进行了优化,并且其gc含量被调节在50~60%的范围内。
[7]如前述[6]所记载的隐身型rna基因表达系统,其中,前述属于副粘病毒科的rna病毒是选自于仙台病毒、人副流感病毒和新城疫病毒中的任一者的rna病毒。
[8]如前述[1]~[7]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(3)的转录起始信号序列是选自于3ˊ-ucccacuuuc-5ˊ(序列号1)、3ˊ-ucccuauuuc-5ˊ(序列号2)、3ˊ-ucccacuuac-5ˊ(序列号3)、3ˊ-uccuaauuuc-5ˊ(序列号7)和3ˊ-ugcccaucuuc-5ˊ(序列号9)中的任一者所示的rna序列的rna序列;前述(4)的转录终止信号序列是选自于3ˊ-aauucuuuuu-5ˊ(序列号4)、3ˊ-cauucuuuuu-5ˊ(序列号5)、3ˊ-uauucuuuuu-5ˊ(序列号6)和3ˊ-uuauucuuuuu-5ˊ(序列号8)中的任一者所示的rna序列的rna序列。
[9]如前述[4]~[8]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的各基因序列的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的rna序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标rna序列中所包含的各基因序列的5ˊ末端侧相邻接的rna序列的更5ˊ末端侧。
[10]如前述[7]~[9]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(5)的包含复制起点的rna序列包含下述序列:
(a)3ˊ-uggucuguucuc-5ˊ(序列号11)或3ˊ-ugguuuguucuc-5ˊ(序列号12)所示的rna序列;
(b)3ˊ-gagaacagacca-5ˊ(序列号13)或3ˊ-gagaacaaacca-5ˊ(序列号14)所示的rna序列;
(c)3ˊ-(cnnnnn)3-5ˊ(序列号15)所示的rna序列;
(d)3ˊ-(nnnnng)3-5ˊ(序列号16)所示的rna序列。
[11]如前述[10]所记载的隐身型rna基因表达系统,其特征在于,前述(a)的rna序列位于负单链rna(a)的3ˊ末端,并且前述(b)的rna序列位于5ˊ末端。
[12]如前述[10]或[11]所记载的隐身型rna基因表达系统,其特征在于,前述(c)的rna序列从负单链rna(a)的3ˊ末端起第79个碱基开始,并且前述(d)的rna序列从5ˊ末端起第96个碱基开始。
[13]如前述[10]~[12]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(5)的包含复制起点的rna序列进一步在负单链rna(a)的3ˊ末端起第97~116个碱基的位置包含(e)3ˊ-aaagaaacgacgguuuca-5ˊ(序列号17)的rna序列或具有与其相同碱基长度的18个碱基长度的rna序列。
[14]一种不使先天免疫机制激活的隐身型rna载体,其中,该隐身型rna载体为包含构成前述[1]~[13]所记载的隐身型rna基因表达系统的复合体、具有将该复合体导入动物细胞的活性的rna载体。
[15]如前述[14]所记载的隐身型rna载体,其中,该隐身型rna载体形成对动物细胞具有感染能力的病毒颗粒。
[16]导入前述[14]或[15]所记载的隐身型rna载体的动物细胞。
[17]一种隐身型rna,所述隐身型rna是包含下述(1)~(8)的rna序列的负单链rna(a),并且可以与单链rna结合蛋白(b)和rna依赖性rna合成酶(c)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性rna的目标rna序列;
(2)构成非编码区的先天免疫机制不能识别的rna序列;
(3)rna依赖性rna合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的rna序列;
(6)编码该酶的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;
(7)编码调节该酶活性的蛋白质的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;
(8)编码单链rna结合蛋白的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列。
本发明还包括以下实施方式。
[17’]一种隐身型rna,所述隐身型rna是包含下述(1)~(8)的rna序列的负单链rna(a),并且可以与单链rna结合蛋白(b)和rna依赖性rna合成酶(c)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性rna的目标rna序列;
(2)构成非编码区的源自在动物细胞中表达的mrna的rna序列;
(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的rna序列;
(6)编码该酶的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;
(7)编码调节该酶活性的蛋白质的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;
(8)编码前述单链rna结合蛋白的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列。
[17”]一种隐身型rna,所述隐身型rna是包含下述(1)~(8)的rna序列的负单链rna(a),并且可以与单链rna结合蛋白(b)和rna依赖性rna合成酶(c)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性rna的目标rna序列;
(2)构成非编码区的源自人类mrna的rna序列;
(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的rna序列;
(6)编码该酶的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;
(7)编码调节该酶活性的蛋白质的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;
(8)编码前述单链rna结合蛋白的rna序列,并且是针对人类细胞进行了密码子优化的rna序列。
[18]如前述[17]所记载的隐身型rna,其中,在前述负单链rna(a)的3ˊ末端侧和5ˊ末端侧包含前述(5)的包含rna依赖性rna合成酶所识别的复制起点的rna序列,并且是分别与3ˊ末端侧的rna序列和5ˊ末端侧的rna序列互补的rna序列。
[19]如前述[17]或[18]所记载的隐身型rna,其特征在于,前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的rna序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标rna序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的rna序列的更5ˊ末端侧。
[20]如前述[17]~[19]中任一项所记载的隐身型rna,其特征在于,前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的rna序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标rna序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的rna序列的更5ˊ末端侧;进一步地,在其两端构成具有多个可通过限制性酶进行酶切的限制性酶酶切位点的盒结构,多个该盒结构结合在一起。
[21]一种重构隐身型rna基因表达系统的方法,所述方法是包括下述(1)~(5)的步骤的方法:
(1)准备表达t7rna聚合酶的大肠杆菌的步骤;
(2)将搭载前述[1]~[13]中任一项所记载的负单链rna(a)以及至少编码rna依赖性rna合成酶和rna结合活性蛋白的rna的大肠杆菌用载体、以及表达编码rna结合活性蛋白的dna的大肠杆菌用载体导入(1)的大肠杆菌宿主内的转化步骤;
(3)在(2)的转化大肠杆菌内,形成负单链rna与rna结合活性蛋白的复合体的步骤,该负单链rna包含通过t7rna聚合酶使之表达的外源基因rna;
(4)准备表达rna依赖性rna合成酶的动物细胞的步骤;
(5)将由(3)得到的负单链rna与rna结合活性蛋白的复合体导入(4)的动物细胞宿主内,重构由负单链rna、rna结合活性蛋白和rna依赖性rna合成酶的复合体所构成的隐身型rna基因表达系统的步骤。
[22]一种串联型盒,所述串联型盒是具有2个克隆位点a、b的基于dna的串联型盒,其中,
该串联型盒从5ˊ末端侧开始依次由(1)多聚化部位a、(2)转录起始信号a、(3)非编码序列a1、(4)克隆位点a、(5)非编码区a2、(6)转录终止信号a、(7)转录起始信号b、(8)非编码序列b1、(9)克隆位点b、(10)非编码区b2、(11)转录终止信号b和(12)多聚化部位b构成;
前述(1)多聚化部位a和(12)多聚化部位b分别包含限制性酶识别序列和/或部位特异性重组酶识别序列,彼此为相同或不同的dna;
前述(2)转录起始信号a和(7)转录起始信号b在被转录为rna的情况下分别包含rna依赖性rna合成酶所识别的转录起始信号,彼此为相同或不同的dna;
前述(3)非编码序列a1、(5)非编码区a2、(8)非编码序列b1和(10)非编码区b2在被转录为rna的情况下分别成为不被宿主细胞的先天免疫机制识别的rna,彼此为相同或不同的dna;
前述(4)克隆位点a和(9)克隆位点b分别包含一个以上的限制性酶识别序列和/或部位特异性重组酶识别序列,彼此为相同或不同的dna;
前述(6)转录终止信号a和(11)转录终止信号b在被转录为rna的情况下分别包含rna依赖性rna合成酶所识别的转录终止信号,彼此为相同或不同的dna。
[23]如前述[22]所记载的串联型盒,其中,
前述(4)克隆位点a从5ˊ末端侧开始依次包含限制性酶a识别序列和限制性酶c识别序列,
前述(9)克隆位点b从5ˊ末端侧开始依次包含限制性酶d识别序列和限制性酶b识别序列,
其中,限制性酶a和限制性酶d是产生相同序列的单链突出末端的限制性酶,限制性酶c和限制性酶b是产生相同序列的单链突出末端的限制性酶。
[24]如前述[22]或[23]所记载的串联型盒,其中,前述(1)多聚化部位a和(12)多聚化部位b中的任一者都是包含产生nn或nnn表示的序列的任意单链突出末端的限制性酶识别序列的dna。
[25]如前述[22]~[24]中任一项所记载的串联型盒,其中,
前述(3)非编码序列a1、(5)非编码区a2、(8)非编码序列b1和(10)非编码区b2分别为与源自在动物细胞表达的mrna的rna序列的部分序列相对应的相同或不同的cdna;
在前述(4)克隆位点a和(9)克隆位点b中插入相同或不同的源自人类的基因。
发明效果
本发明的隐身型rna基因表达系统因为难以被先天免疫机制捕捉,所以细胞毒性极低,可搭载10个基因并导入各种组织细胞,可在必要的期间始终持续表达。另外,在本发明中被称为可避免先天免疫机制或不被免疫机制识别时,是指导入的基因或为此目的的载体等不实质性地刺激宿主的先天免疫。具体而言,是指将干扰素β诱导能力作为指标,将正常细胞中ifn-βmrna的表达量设为1.0时,为30以下,优选为20以下,更优选为10以下。
另外,隐身型rna基因表达系统在细胞质发挥功能,因此,如果使用将该基因表达系统包封的隐身型rna载体,导入不具有增殖能力且没有进行细胞分裂的外周血细胞,可以表达搭载基因。进一步地,能够以最大80倍的倍率选择表达强度不同的基因表达系统,可在成为不需要时通过抑制rna依赖性rna合成酶的活性而简单地去除。因此,本技术对于使用迄今为止不可能的6个以上基因,将包括人类细胞在内的动物细胞的性质有效地进行重编程的目的而言是最合适的。
例如,可以考虑将人类外周血细胞作为材料,应用在所谓不含动物成分(xeno-free)、不使用饲养细胞(feeder-free)的困难条件下,有效制作在再生医疗的临床应用中使用的高质量的ips细胞。另外,也可应用于被称为直接重编程的技术,使用6个以上基因由人类的组织细胞(血液、皮肤、胎盘等)制作神经细胞、神经干细胞、干细胞、胰β细胞等的有用基因。进一步地,因为引起细胞死亡或炎症的可能性低,所以也期待应用于使用也包括巨大基因在内的各种基因的基因治疗或利用活体内的重编程的再生医疗。
隐身型rna基因表达系统因为可同时搭载多个基因并以一定的比例表达,在由多个亚基构成的生物医药品的制造中也发挥效果。例如,在生产人类免疫球蛋白g的情况下,在同一细胞同时表达各亚基是必要的。此外,在生产人类免疫球蛋白g的情况下,期望h链和l链以1:1的比例在同一细胞同时表达;而在生产人类免疫球蛋白m的情况下,期望h链:l链:μ链以1:1:0.2的比例在同一细胞同时表达,隐身型rna基因表达系统可容易地满足这样的要求。
进一步地,隐身型rna基因表达系统可以改变基因表达的水平,因此,可容易地实现在生物医药品制造中必需的强基因表达。就迄今为止的使用动物细胞的生物医药品制造工序而言,必须建立并入染色体的基因的拷贝数增加的稳定细胞株,这是必须耗费大量时间和劳动的过程,然而,如果采用隐身型rna基因表达系统,则不需要耗费这样的劳动。
另外,隐身型rna基因表达系统对于抑制在生物医药品的制造中成为问题的基因突变也发挥效果。近年来,已报道了引起rna病毒基因组突变的主要原因是细胞质的腺苷脱氨酶(作用于rna的腺苷脱氨酶,adar1)(非专利文献39)。adar1通过先天免疫机制的激活而被诱导,因此,就隐身型rna基因表达系统而言,可将adar1的诱导抑制至最小限度,从而抑制基因突变。
隐身型rna基因表达系统对于由多个亚基构成的药物研发靶标蛋白的表达而言也是最合适的。例如,为了表达药物研发靶标酶nadph氧化酶(nox2),同时表达gp91phox、p22phox、rac、p47phox、p67phox、p40phox这6个亚基是必要的,而隐身型rna基因表达系统可容易地实现。进一步地,如果使用隐身型rna载体,即使在因为不引起细胞分裂而使基因导入和表达困难的原代培养血管内皮细胞或神经细胞等靶标细胞中,也可表达药物研发靶标蛋白,可容易地实现目的。
另外,因为隐身型rna基因表达系统或隐身型rna载体引起细胞毒性或炎症的可能性低,所以,作为通过活体内的基因表达得到治疗效果的基因治疗平台的应用是可能的。特别是,因为可以搭载就以往的基因导入、表达载体而言不可能的血友病a的致病基因产物血液凝固因子viii的cdna(7053个碱基)或杜氏肌肉营养不良症的致病基因产物肌养蛋白(dystrophin)的cdna(11058个碱基)等巨大的基因并且持续表达,所以被期待作为这些疾病的基因治疗用载体而使用。
进一步地,本发明中,因为为了在载体上搭载6个以上、优选8个以上的外源基因而开发的使用串联型盒连接法的串联型盒是基于dna构建的,所以该方法不仅可应用于本发明的隐身型rna载体,还可广泛应用于普通的dna表达载体等。
附图说明
图1是表示负单链rna分子的结构的图,该负单链rna分子是将源自在动物细胞中表达的mrna的rna与rna依赖性rna合成酶所识别的转录起始信号、转录终止信号、复制起点进行组合而制作的。
图2是表示负单链rna分子复制时必需的核酸的3ˊ末端和5ˊ末端的结构的图。
图3是表示负单链rna分子复制时必需的核酸的3ˊ末端的结构的图。
图4是表示负单链rna分子复制时必需的核酸的5ˊ末端的结构的图。
图5是源自rna病毒的mrna中的密码子适应指数(codonadaptationindex)的解析。
图6是源自rna病毒的mrna中的gc含量的解析。
图7是表示在隐身型rna基因表达系统中搭载的外源基因cdna的设计方法的图。
图8是表示将2个外源基因cdna进行结合的方法的图。
图9是表示将10个外源基因cdna进行结合的方法的图。
图10是表示构建用于制作搭载10个外源基因的隐身型rna基因表达系统的模板cdna的方法的图。
图11是表示用于由模板cdna重构隐身型rna基因表达系统的第一方法的图。
图12是表示用于由模板cdna重构隐身型rna基因表达系统的第二方法的图。
图13是表示搭载10个外源基因cdna的隐身型rna基因表达系统的基因组结构的图。
图14是表示搭载10个外源基因cdna的隐身型rna基因表达系统的基因表达活性的图。
图15是表示通过与图13不同的方法将核酸的碱基序列进行优化而制作的搭载10个外源基因cdna的隐身型rna基因表达系统的基因组结构的图。
图16是表示通过改变n、c、pols(p)基因的布局而制作的搭载10个外源基因cdna的隐身型rna基因表达系统的基因组结构的图。
图17是表示隐身型rna载体的干扰素诱导活性的图。
图18是表示为了完全避免先天免疫活性诱导能力而搭载附加因子的隐身型rna基因表达系统的基因组结构的图。
图19是表示来自于搭载附加因子的隐身型rna载体的干扰素诱导能力的图。
图20是表示具有不同基因表达水平的隐身型rna基因表达系统的结构的图(以正链rna序列进行标注)。
图21是表示c基因缺失或翻译抑制的隐身型rna基因表达系统的基因组结构和基因表达的图。
图22是表示隐身型rna基因表达系统的包装信号(packagingsignal)的活性的图。
图23是表示将隐身型rna基因表达系统从细胞去除的图。
图24是表示迄今为止所制作的隐身型rna载体的基因组结构的图。
图25是表示由搭载6个初始化基因的隐身型rna载体制作诱导多能干细胞(ips细胞)的效率的图。
图26是表示通过隐身型rna基因表达系统表达免疫球蛋白m的图。
图27是表示通过隐身型rna基因表达系统表达双重特异性抗体的图。
具体实施方式
1.本发明的“隐身型rna基因表达系统”的构成要素
本发明使用的rna分子显示难以被先天免疫机制捕捉的“隐身性”。因此,在本发明中,将该rna分子称为“具有隐身性的rna”,将使用该rna作为材料的基因表达系统称为“隐身型rna基因表达系统”,将包封该表达系统并具有将该基因表达系统导入动物细胞的活性的构建体称为“隐身型rna载体”。
在本发明中,所谓隐身型rna基因表达系统是指由包含以下(1)~(8)的rna序列的负单链rna(a)、单链rna结合蛋白(b)和rna依赖性rna合成酶(c)构成,并且不使先天免疫机制激活的复合体。所谓隐身型rna载体是指包含该复合体并且具有将该复合体导入动物细胞的活性的颗粒。另外,在本发明中,在标注负单链rna的rna序列时,在指编码蛋白质的序列的情况下,是指反义链一侧的rna序列。
(1)编码任意蛋白质或功能性rna的目标rna序列;
(2)构成非编码区的先天免疫机制不能识别的rna序列;
(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的rna序列;
(6)编码该酶的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;
(7)编码调节该酶活性的蛋白质的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;
(8)编码前述单链rna结合蛋白的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列。
(以下,基因rna也有被简称为基因的情况)。
此处,优选(2)的rna具有5~49个碱基长度,作为(1)的被导入的外源基因rna各自的3ˊ末端侧和5ˊ末端侧的非编码区进行配置。
另外,(1)的导入的外源基因rna的个数即使小于6个(例如1~5个),总碱基长度即使小于5,000个碱基长度,当然都可作为隐身型rna基因表达系统发挥功能,然而,本发明的rna基因表达系统特别是在包含下述rna的情况下发挥显著效果:外源基因rna的个数为6个以上,优选为8个以上,更优选为10个以上的基因;并且总碱基长度为5,000个碱基长度,优选为8,000个碱基长度,更优选为10,000个碱基长度。
另外,在本申请说明书中,被称为基因或基因材料时,包括负链rna或cdna以及与其互补的正链rna或cdna。也就是说,通过转录或逆转录可以合成的上述任一基因或基因材料的物质都包含于本发明中。
2.本发明的隐身型rna表达系统的构成要素
2-1.用于外源基因rna导入的串联型盒的制作
本发明的隐身型rna基因表达系统中的外源基因rna在其3ˊ末端和5ˊ末端的非编码区具有5~49个碱基的相同或不同的“(1)不被先天免疫机制识别的rna”,在其更外侧的3ˊ末端和5ˊ末端分别设置有(3)的“转录起始信号”和(4)的“转录终止信号”,在最外侧的两端设置有多聚化部位,从而可成为盒。
通过使用如下所示的基于dna的串联型盒,可容易地构建在本发明的隐身型rna基因表达系统中所使用的负单链rna。
本发明的串联型盒从5ˊ末端侧开始依次由(1)多聚化部位a、(2)转录起始信号a、(3)非编码序列a1、(4)克隆位点a、(5)非编码区a2、(6)转录终止信号a、(7)转录起始信号b、(8)非编码序列b1、(9)克隆位点b、(10)非编码区b2、(11)转录终止信号b和(12)多聚化部位b构成。作为示意性示出该串联型盒的图,可列举图7的下图。
上述多聚化部位a和b可彼此相同或不同,只要是可用于该盒的多聚化、或可用于与其它核酸结合的序列,可使用任意序列。作为多聚化部位的优选实例,可列举限制性酶识别序列和部位特异性重组酶的识别序列。作为优选的限制性酶的实例,可列举具有在切面生成如nn或nnn所示序列的任意的单链突出端的性质的sapi、bbsi、bbvi、bcodi、bfuai、bsai、bsmbi、bsmfi、btgzi、eari、foki、hgai、sfani。另外,作为其它优选实例,可列举在识别序列内部具有不规则序列的alwni、bgli、bstapi、bstxi、draiii、sfii等。另外,在利用同源重组的情况下,作为重组酶的识别序列,可列举attb1和attb2等序列。进一步地,在利用gibson组装系统(gibsonassemblysystem,newenglandbiolabs,inc)的情况下,以成为连接对象的其它串联型盒的末端部与重叠序列成为相同序列作为前提,作为多聚化部位可使用任意的15个碱基以上的序列。
转录起始信号a和b彼此可相同或不同,只要在转录为rna的情况下作为rna依赖性rna合成酶所识别的转录起始信号具有功能,可以是任何序列。rna依赖性rna合成酶所识别的转录起始信号的实例由下文的段落具体记载。优选可列举序列号1~3的序列。
非编码序列a1、a2、b1和b2彼此可相同或不同。只要在转录为rna的情况下是上述定义的“不被先天免疫机制识别的rna”,可以是任何序列,可列举的优选实例为5~49个碱基长度的表1所披露的各序列。
只要可以将所期望的外源基因插入,克隆位点a和b可以是任何序列。优选一个克隆位点包含1个或2个以上的限制性酶识别序列,或包含1个或2个以上的部位特异性重组酶的识别序列。作为克隆位点的优选实例,可列举:包含acc65i识别位点和sali识别位点的序列;包含acc65i识别位点和xhoi识别位点的序列;包含bsiwi识别位点和sali识别位点的序列;以及包含bsiwi识别位点和xhoi识别位点的序列。
转录终止信号a和b彼此可相同或不同,只要在转录为rna的情况下作为rna依赖性rna合成酶所识别的转录终止信号具有功能,可以是任何序列。rna依赖性rna合成酶所识别的转录终止信号的实例由下文的段落具体记载。优选可列举序列号4~6的序列。
在一个该串联型盒中,可插入至少2个外源基因。将5个插入2个外源基因的盒进行连接而得的盒多聚体成为承载有10个外源基因的盒多聚体。在下述实施例中,利用将这样的串联型盒进行多聚化而制作承载有4、6或10个外源基因的dna片段,将之亚克隆至质粒中。进一步通过与源自病毒的rna依赖性rna合成酶基因和rna结合蛋白基因组合,构建本发明所期望的rna表达系统。
2-2.rna依赖性rna合成酶以及该酶所识别的转录起始信号和转录终止信号
“rna依赖性rna合成酶”以及该酶所识别的转录起始信号和转录终止信号优选选自于源自相同负链rna病毒的序列,典型地为源自属于副粘病毒科的病毒的基因组的序列。属于副粘病毒科的病毒的基因组的“rna依赖性rna合成酶”、“该酶所识别的转录起始信号”与“该酶所识别的转录终止信号”的组合是为了全部具有相同的基本结构,也可使用源自任何病毒的序列的组合。
在本发明的实施例中,作为“rna依赖性rna合成酶”选择仙台病毒的l蛋白(rna合成酶的大亚基poll)和p蛋白(rna合成酶的小亚基pols)的组合;作为“rna依赖性rna合成酶所识别的转录起始信号的rna”选择“3ˊ-ucccacuuuc-5ˊ(序列号1)”;作为“rna依赖性rna合成酶所识别的转录终止信号的rna”选择“3ˊ-aauucuuuuu-5ˊ(序列号4)”,将转录起始信号和转录终止信号分别配置在各基因的3ˊ侧和5ˊ侧(图1)。并且,作为“调节rna合成酶活性的蛋白质”使用仙台病毒的c蛋白(c);另外,作为“单链rna结合蛋白”使用仙台病毒的np蛋白(n)。
另外,在本说明书所公开的技术中,rna主要以负链的单链rna的实施方式被使用,只要没有特别注释,rna序列作为负链的序列信息从3ˊ末端侧开始进行公开。但是,构成本说明书的一部分的序列表的序列信息遵照指南从5ˊ末端侧开始记载。
在作为“rna依赖性rna合成酶”选择仙台病毒的l蛋白和p蛋白的组合的情况下,作为转录起始信号,除了“3ˊ-ucccacuuuc-5ˊ(序列号1)”、“3ˊ-ucccuauuuc-5ˊ(序列号2)”、“3ˊ-ucccacuuac-5ˊ(序列号3)”之外,可使用与这些序列具有同等功能的rna。另外,对于转录终止信号也同样,除了“3ˊ-aauucuuuuu-5ˊ(序列号4)”、“3ˊ-cauucuuuuu-5ˊ(序列号5)”、“3ˊ-uauucuuuuu-5ˊ(序列号6)”之外,可使用与这些序列具有同等功能的rna。另外,在作为“rna依赖性rna合成酶”选择人类副流感病毒3型的l蛋白和p蛋白的组合的情况下,作为转录起始信号,可使用“3ˊ-uccuaauuuc-5ˊ(序列号7)”或具有同等功能的rna;作为转录终止信号,可使用“3ˊ-uuauucuuuuu-5ˊ(序列号8)”或具有同等功能的rna。进一步地,在作为“rna依赖性rna合成酶”选择新城疫病毒的l蛋白和p蛋白的组合的情况下,作为转录起始信号可使用“3ˊ-ugcccaucuuc-5ˊ(序列号9)”或具有同等功能的rna;作为转录终止信号可使用“3ˊ-aaucuuuuuu-5ˊ(序列号10)”或具有同等功能的rna。
2-3.用于本发明的隐身型rna基因表达系统的复制功能的要素
作为用于本发明的隐身型rna基因表达系统的复制功能的必需要素是具有rna依赖性rna合成酶所识别的复制起点以及所谓3ˊ末端侧的(cnnnnn)3-和5ˊ末端侧的(nnnnng)3-的结构的序列。
在本发明的实施例中,作为“rna依赖性rna合成酶”选择仙台病毒的l蛋白和p蛋白的组合,因此,作为“包含rna依赖性rna合成酶所识别的复制起点的rna”选择存在于仙台病毒基因组3ˊ末端的114个碱基的rna以及存在于仙台病毒基因组5ˊ末端的96个碱基的rna。在此结构中,在隐身型rna基因表达系统的复制功能中所必需的要素如下(图2、图3、图4)。
(1)存在于基因组3ˊ末端的“3ˊ-uggucuguucuc-5ˊ(序列号11)”或具有同等功能的12个碱基的rna序列(例如,“3ˊ-ugguuuguucuc-5ˊ(序列号12)”);
(2)存在于基因组5ˊ末端的“3ˊ-gagaacagacca-5ˊ(序列号13)”或具有同等功能的12个碱基的rna序列(例如,“3ˊ-gagaacaaacca-5ˊ(序列号14)”);
(3)具有从基因组3ˊ末端起第79个碱基开始的所谓“3ˊ-(cnnnnn)3-5ˊ(序列号15)”的结构的18个碱基的rna序列;
(4)具有从基因组5ˊ末端起第96个碱基开始的所谓“3ˊ-(nnnnng)3-5ˊ(序列号16)”的结构的18个碱基的rna序列。
其中,(1)和(2)是彼此互补的序列,因为基因组rna的3ˊ末端与反基因组rna(与基因组rna互补的rna)的3ˊ末端相同,所以被认为是rna依赖性rna合成酶所识别的复制起点。另外,(3)和(4)功能尚不清楚,然而已知其是在由rna依赖性rna合成酶进行的单链rna复制中必需的序列(非专利文献42)。
2-4.负单链rna中颗粒化所必需的包装信号(packagingsignal)区
另外,在本发明中,首次将作为负单链rna中用于颗粒化的包装信号的区域确定为从基因组3ˊ末端起第97个碱基至第114个碱基的区域。
如实施例18(图22)所示,将该区域(标记为“序列d”)全部去除并不影响包装细胞内的基因表达,然而,得到隐身型rna载体的颗粒化效率极为低下这一结果。
上述结果显示,该18个碱基的序列或该18个碱基长的区域或其一部分是用于摄入至病毒样颗粒所必需的序列或区域。
于是,进一步尝试将该18个碱基的序列用从下述“表1”所列举的源自管家基因的mrna的部分序列中任意选择的序列进行置换(图3的(5),序列号75),确认颗粒化效率没有变化。
因此,从基因组3ˊ末端起第97~114个碱基的18个碱基长度或其一部分长度的区域被认为是在负单链rna中用于颗粒化的包装中所必需的。也就是说,虽然该区域在以负单链rna为模板的转录和复制中不是必需的,但是,可以说该区域是用于将隐身型rna基因表达系统摄入至病毒样颗粒所必需的“包装信号区域”。
(5)与从基因组3ˊ末端起第97~114个碱基的“3ˊ-aaagaaacgacgguuuca-5ˊ(序列号17)”对应的18个碱基长度的rna,或者该rna的至少连续8个碱基以上、优选10个碱基以上、更优选15个碱基以上长度的任意rna。
对于缺失上述(5)的18个碱基长度或其部分区域的隐身型rna基因表达系统而言,即使宿主细胞经同种或不同种病毒感染,导致产生包含该隐身型rna基因表达系统的病毒样颗粒的可能性极低。
因此,在将本发明的隐身型rna基因表达系统作为感染性颗粒以及作为隐身型rna基因表达载体使用的情况下,该18个碱基长度或其部分区域是必需的区域,然而,在极力排除病毒样颗粒的混入而力争确保安全性的生物医药品制造中,反倒成为应该排除的序列。
2-5.负单链rna基因表达的模板的构建
已知将“作为rna依赖性rna合成酶所识别的转录起始信号的rna”、“作为rna依赖性rna合成酶所识别的转录终止信号的rna”以及存在于负单链rna3ˊ末端和5ˊ末端的“包含rna依赖性rna合成酶所识别的复制起点的rna”组合、并在转录起始信号与转录终止信号之间搭载了任意外源基因的rna分子在反式(trans)提供的源自病毒的rna依赖性rna合成酶等必要因子的存在下,成为转录和复制的模板(非专利文献43、非专利文献44、非专利文献45)。例如,将源自仙台病毒的转录起始信号、转录终止信号和复制起点组合、并搭载了大肠杆菌的氯霉素乙酰转移酶(cat)基因作为外源基因的具有上述结构的负单链rna显示在经仙台病毒感染的细胞中成为转录和复制的模板,制造cat(非专利文献43、非专利文献44)。另外,具有同样结构的负单链rna在稳定表达仙台病毒的np(单链rna结合蛋白)、p(rna依赖性rna合成酶的小亚基)和l(rna依赖性rna合成酶的大亚基)蛋白的细胞中显示连续地进行持续复制(非专利文献45)。
这些报道显示,本发明所制作的负单链rna成为基因表达的模板,然而,在这种情况下,转录和复制的活性依赖于由包含病毒基因的细胞反式提供的np、p、l蛋白,因此不能成为在任意细胞中都可进行基因表达的通用型基因表达系统。因此,接下来尝试在具有前述2-3.(图1)所示的结构、由不被先天免疫机制识别的成分构成的rna分子中搭载转录和复制所必需的基因。
3.关于避免动物细胞中先天免疫机制激活(pamp)的知识
3-1.关于源自病毒的rna的pamp
动物细胞所具有的先天免疫机制识别存在于侵入细胞内的病毒的基因组rna或病毒基因的mrna中的“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pamp)”而被激活。迄今为止,pamp的结构在c型肝炎病毒和人类免疫缺陷病毒中被确认。就c型肝炎病毒而言,报道了存在于基因组3ˊ末端的非编码区的富含尿嘧啶(uridine)的序列为pamp(非专利文献35)。另一方面,就人类免疫缺陷病毒而言,报道了在由gag、pol、env这3个基因转录而来的mrna中存在的腺嘌呤含量高的区域为pamp(非专利文献36)。此外,就仙台病毒而言,已知存在于感染细胞中的比600个碱基长度长的长链rna片段被检测出具有强pamp活性(非专利文献37),在f、hn、l的各基因的非编码区也存在具有作为pamp发挥功能的可能性的高级二级结构(非专利文献38)。因此,预测几乎所有源自病毒的rna都包含pamp。
3-2.对源自病毒的rna进行优化的探讨
通过将编码rna病毒基因组中的蛋白质的区域的密码子针对人类细胞进行优化而破坏pamp结构以避免先天免疫机制激活的这种尝试以前已多次进行。例如,报道了因为在由人类免疫缺陷病毒(hiv)的gag、pol、env各基因转录而来的各mrna中分别存在pamp,所以,如果使任一基因保持原样在动物细胞中表达,则诱导干扰素,然而,针对人类细胞进行优化后表达的gag、pol、env蛋白中的任一种都可抑制干扰素诱导(非专利文献36)。另外,已知在猴免疫缺陷病毒(siv)中,与hiv一样,在gag、pol、env的mrna中也存在pamp,通过将包含各基因的pamp的区域的密码子针对人类细胞进行优化,可降低干扰素诱导能力(非专利文献48)。但是,就仅将siv基因组序列中的包含pol基因的pamp的区域的密码子进行优化而言,siv的干扰素诱导能力几乎没有变化。因此,除了pol基因的优化之外,还将包含gag基因的pamp的区域的密码子进行优化,则病毒的复制能力降低至1%以下,显示病毒的转录、复制功能严重受损的结果(非专利文献48)。该结果显示,siv的pol基因和gag基因不仅编码pol蛋白和gag蛋白,在编码蛋白质的核酸序列本身中也存在病毒转录或复制的功能所必需的信息。
另外,对于c型肝炎病毒基因组3ˊ末端的非编码区中的包含pamp的区域,也报道了破坏该区域将使其病毒复制能力受损(非专利文献82、非专利文献83)。
这些结果显示,rna病毒基因组中的“包含pamp的区域”同时对病毒复制等功能而言是必需区域的可能性高。
如上所述,因为尚未知晓有既不损伤rna病毒的功能又从基因组核酸中将具有pamp功能的结构去除的普遍方法,所以,将针对人类细胞对病毒rna中包含pamp的区域的密码子进行优化的技术应用于rna病毒载体反倒成为否定性的结果。
3-3.源自病毒的先天免疫抑制因子的利用
就将rna病毒的基因组或合成rna作为基因表达的平台使用的现有技术而言,并非将作为pamp被识别的结构探明并将该结构去除,而是在各种病毒所具备的拮抗先天免疫机制的因子的作用下,抑制由pamp导致的先天免疫机制的激活,减弱细胞毒性。例如,在非专利文献26和非专利文献27中作为必需构成要素而使用的b18r蛋白是在痘苗病毒的基因组dna中编码的干扰素结合蛋白,具有通过抑制干扰素的活性而抑制先天免疫机制激活的功能。
另外,就在专利文献3、专利文献4、非专利文献7中记载的基于仙台病毒的载体而言,与rna依赖性rna合成酶(l蛋白和p蛋白)的突变一起,源自仙台病毒的v蛋白的表达也承担抑制先天免疫机制的作用。v蛋白是以由仙台病毒的p基因区域转录而来的mrna制作的蛋白质之一,具有与p蛋白相同的n末端(317个氨基酸残基)以及具有v蛋白所固有的结构的碱基性c末端(67个氨基酸残基)(非专利文献39)。v蛋白经由转录因子irf-3的抑制而抑制先天免疫机制的激活(非专利文献40)。另外,已知就在p基因的碱基序列中人工导入突变而制作的v蛋白缺失的仙台病毒而言,抑制先天免疫机制激活的功能丧失,容易从感染个体中被排除(非专利文献40、非专利文献41)。
如上所述,在并用源自病毒的先天免疫抑制因子的情况下,产生了导入外源基因的细胞即使感染其它种病原微生物也不会激活先天免疫机制的安全性方面的顾虑。例如,就稳定维持仙台病毒载体的基因组的细胞而言,因为v蛋白恒定表达,所以,在活体的组织细胞使用该载体的情况下,存在该细胞即使感染别的病毒也不能激活先天免疫机制的可能性。因此,期望有借助不依赖于通过源自病毒的因子来抑制先天免疫机制的方法来避免先天免疫机制激活的技术。
4.本发明的rna基因表达系统中用于避免pamp的方法
4-1.非编码区序列中的“不被先天免疫机制识别的rna”
掌控本发明的关键在于对可避免动物细胞所具有的先天免疫机制激活的rna的选择。另外,本发明中提及避免先天免疫机制激活时,以干扰素β诱导能力作为指标,在将正常细胞中ifn-βmrna的表达量设为1.0时,为30以下,优选为20以下,更优选为10以下,这一点如上所述。
因此,在本发明中,作为“不被先天免疫机制识别的rna”的材料,使用源自人类等动物细胞表达的mrna的rna序列,其中,选择了源自在广泛的人类细胞中表达的管家基因的mrna。该mrna在几乎所有人类细胞中都较大量地表达,不包含被人类先天免疫机制识别的基序。进一步地,从该mrna的不编码蛋白质的非编码区选择不形成高级二级结构的5个碱基至49个碱基的rna(表1),配置在搭载于载体上的各基因的5ˊ侧非编码区和3ˊ侧非编码区(图1)。
即使在本发明的非编码区序列中“不被先天免疫机制识别的rna”的“源自在动物细胞中表达的mrna的rna序列”中,下述表1所列举的源自管家基因的mrna的部分序列中的任一序列都可作为特别优选的序列使用。作为这样的优选序列的其它实例,也可优选使用源自白蛋白基因等在活体内大量表达的基因的mrna的rna序列的部分序列。
如上所述,在本发明的实施例中,考虑到应用于再生医疗而选择源自在人类细胞中表达的mrna的非编码区序列,使用了其部分序列,然而,作为“不被先天免疫机制识别的rna”,不限于实施例或表1所列举的来自于源自人类mrna的非编码区序列的序列。例如,在optimumgen基因设计系统(专利文献7,genscriptusa,inc.)中,为了求出基准cai值,可使用从所采用的在人类中表达量高的人类mrna组中适当选择的人类mrna所具有的非编码序列的部分序列。此外,如果载体不被所使用的宿主细胞的先天免疫机制识别,那么,也可以是mrna以外的人类rna、在其它动物种的细胞中表达的rna、非天然的合成rna。
表1
4-2.rna载体基因组3ˊ末端和5ˊ末端区域中“不被先天免疫机制识别的rna”的置换
如图2、图3和图4所示,在构成本发明的隐身型rna载体的基因组rna序列中,在3ˊ末端区域和5ˊ末端区域,除了前述2-2.~2-3.等所示的与转录、复制等相关的必需构成要素以外,还存在任意的功能不明的序列区域,在这些序列中,在多个位置存在可以置换为源自管家基因的mrna的部分序列等的“不被先天免疫机制识别的rna”的区域。
例如,如图3的实施例所示,在存在于天然病毒基因组3ˊ末端的结构中,将(1)至(6)的区域置换为包含表1的源自管家基因的mrna的部分序列的无同源性的其它碱基序列是可能的,隐身型rna基因表达系统的3ˊ变体1至3ˊ变体6中的任一种都可进行稳定的基因表达以及载体颗粒的产生。另外,如图4的实施例所示,在存在于天然病毒基因组5ˊ末端的结构中,将(1)至(4)的区域使用无同源性的其它碱基序列进行置换或插入是可能的,隐身型rna基因表达系统的5ˊ变体1至5ˊ变体5中的任一种也都可进行稳定的基因表达。
并且,可以认为,通过将这些位置的序列置换成表1的源自管家基因的mrna的部分序列等“不被先天免疫机制识别的rna”,进一步抑制干扰素诱导能力的可能性很高。
5.用于避免由转录、复制中所必需的蛋白质引起的先天免疫机制激活(pamp)的方法
5-1.成为编码转录、复制中所必需的蛋白质的基因中的pamp结构的指标的值的探讨
在本发明的实施例中,作为“rna依赖性rna合成酶”选定仙台病毒的l蛋白(rna合成酶的大亚基,poll)和p蛋白(rna合成酶的小亚基,pols);作为“调节rna合成酶活性的蛋白质”选定仙台病毒的c蛋白(c);作为“单链rna结合蛋白”选定仙台病毒的np蛋白(n)。这些蛋白质对于由负单链rna进行转录和复制是必需的,然而,在编码它们的仙台病毒的基因组rna或mrna中,存在如非专利文献37所示的“对于病原微生物而言的特征性分子模式(pamp)”的可能性高。因此,为了构建不激活先天免疫机制的隐身型rna基因表达系统,从编码这些蛋白质的rna去除具有pamp可能性的结构是必要的。
虽然在构成仙台病毒的基因组rna或mrna中确实存在pamp活性,然而,尚不清楚实际上在哪个区域存在pamp活性。但是,具有pamp活性的rna似乎与在宿主细胞中表达的rna具有明显不同的结构。因此,首先,为了探讨源自rna病毒的mrna与人类细胞的mrna在结构上的不同,将编码区的密码子适应指数(cai)作为指标进行比较。cai是由在某生物种的细胞中编码最强烈表达的100个蛋白质的mrna的密码子的出现频率得到的指示偏离的指标,在cai=1.0的情况下,表示密码子使用频率与这100种mrna相同(非专利文献46)。经过“optimumgen基因设计系统(专利文献7,genscriptusa,inc.)解析的结果,任意选择的151个人类mrna编码区的cai平均值为0.778,与之相对,仙台病毒的7种mrna中的cai平均值为0.704,同属于副粘病毒科的麻疹病毒的7种mrna中的cai平均值为0.697,得到副粘病毒的mrna的cai显著低于人类细胞的mrna的平均cai这一结果(图5)。另外,在作为参考而解析的大肠杆菌中表达的任意11种mrna中,cai的平均值为0.698(图5)。由此,在人类细胞中使用的情况下,副粘病毒的mrna偏向于与原核生物大肠杆菌的mrna相比拟的结构,这可以认为存在作为pamp被识别的可能性。
另外,为了从另一观点来探讨源自rna病毒的mrna与人类细胞的mrna在结构上的不同,计算了编码区的gc含量。其结果是,源自天然副粘病毒的rna的gc含量平均值为47.7%至48.5%,显著低于人类mrna编码区的gc含量平均值56.3%(非专利文献47)(图6)。考虑到rna病毒的基因组gc含量较低且腺嘌呤和尿嘧啶多的序列成为pamp的可能性高(非专利文献43),可以认为,gc含量也有成为暗示pamp的存在的指标的可能性。
5-2.源自仙台病毒的与转录、复制相关的基因的“密码子优化”应用实验
用于使这样的cai值和gc含量接近于人类细胞mrna平均值的“密码子优化”对于源自病毒的编码区中的pamp结构的破坏和pamp的避免是有效的,这已由如前述3-2.所示的hiv、siv和肝炎病毒等得到证实。
然而,前述3-2.中还示出若在这些病毒中对转录、复制所必需的基因的序列内的pamp区域进行“密码子优化”,将同时大幅损害复制能力这样的结果。由此,在转录、复制中所必需的基因的序列内的pamp结构在转录、复制中承担必需的二级结构的作用的可能性高,这可以说是现有的技术常识。
一般而言,综合考虑病毒基因组各种功能紧密地装配到一起,则从这样的现有知识来看,可以认为在仙台病毒的情况下,也与这些病毒基因组一样,转录、复制中所必需的基因序列内的pamp结构对于病毒功能很重要的可能性高。也就是说,高度预测在将用于在本发明的rna基因表达系统中使用的源自仙台病毒的“rna依赖性rna合成酶”等的与转录、复制相关的蛋白质的编码区中的密码子针对人类细胞进行优化的情况下,即使可避免pamp,本来的转录、复制能力也将同时大幅受损。
在这样的状况下,本发明人特意将编码“rna依赖性rna合成酶”、“rna结合蛋白”等与转录、复制相关的蛋白质的rna全部针对人类细胞进行了密码子优化。
在本发明中,作为“rna依赖性rna合成酶”使用仙台病毒的l蛋白(rna合成酶的大亚基,poll)和p蛋白(rna合成酶的小亚基,pols),作为“调节rna合成酶活性的蛋白质”使用仙台病毒的c蛋白(c),作为“单链rna结合蛋白”使用仙台病毒的np蛋白(n),所以,以从编码上述蛋白质的rna中去除pamp为目的,通过作为密码子优化法而被广泛使用的程序之一“optimumgen基因设计系统(专利文献7,genscriptusa,inc.)”进行了密码子优化。其结果是,任一cai值都变为0.86至0.88,显示为接近于编码在人类细胞中高表达的蛋白质的mrna的数值。
以下,以表2来表示利用“optimumgen基因设计系统(也被称为oggds法)”对仙台病毒的l、p、c和n蛋白基因进行密码子优化的应用结果。
表2
在上述表2中,为了进一步从另一观点来解析优化的rna的结构,对于密码子优化后的rna,与cai值一起计算了gc含量。其结果是,相对于优化前rna的gc含量为44.0%至50.1%,优化后rna的gc含量升高为52.5%至55.5%,接近于人类mrna编码区的gc含量平均值56.3%(非专利文献47)(表2)(图6)。就rna病毒而言,已知腺嘌呤和尿嘧啶多的序列成为pamp的可能性高(非专利文献36),通过密码子优化的方法使源自病毒的rna的结构接近于人类mrna的结构,同时也强烈暗示具有pamp活性的区域被去除的可能性。
并且,在本发明中,实际上通过该方法构建了将针对人类细胞进行优化的编码源自仙台病毒的np蛋白、p蛋白、c蛋白、l蛋白的rna与10个外源基因一起搭载的rna载体(图13)(实施例8),使之在hela细胞内表达进行验证的结果是(实施例9),确认10个外源基因全部以可观察到的充足的量进行表达。另外,确认该rna载体可避免人类成纤维细胞内的inf-β诱导(实施例13,图17)。
以上结果显示,本发明的搭载了针对人类细胞进行优化的源自仙台病毒的与转录、复制相关的基因rna的rna载体是显示作为具备pamp避免效果的优异的隐身型rna载体而发挥功能的rna载体。
另外,该结果还显示,在仙台病毒的情况下,存在于转录、复制所必需的基因序列内的pamp结构并不是在所有转录、复制中所必需的结构,即使对于实施实验的本发明人而言,这也是预料之外的惊人结果。
5-3.密码子优化方法的探讨
根据前述表2的结果,暗示为了进行用于去除具有pamp活性的区域而抑制诱导先天免疫反应的“密码子优化”,“cai值”和“gc含量”这2种数值范围的设定是重要条件。因此,为了探讨2个条件中哪一个是比较本质的条件,进行了应用其它密码子优化方法的实验。作为密码子优化方法,除了上述oggds法之外,还提议有geneoptimizer程序(非专利文献49)和genegps表达优化技术(专利文献8、专利文献9)等各种方法,因此,通过该追加实验,可以确认即便使用上述oggds法以外的方法,也可达到同样的效果。
因此,将与oggds法同样被广泛使用的“密码子优化”方法genegps表达优化技术(genegpsexpressionoptimizationtechnology,以下也称为ggeot法)的密码子优化方法应用于编码仙台病毒的np蛋白、p蛋白、c蛋白、l蛋白的模板dna,同样地制作了可搭载10个外源基因的rna载体(图15)。在通过实施例9的方法进行验证时,确认该载体是与通过oggds法进行优化的隐身型rna载体一样可避免诱导先天免疫反应的隐身型rna载体(数据未显示)。
通过oggds法优化与通过ggeot法优化使用了完全不同的算法,将通过这两种方法进行优化的核酸的碱基序列进行比较,两者的一致性为77%~80%,可看出为了进行密码子优化选择了非常不同的碱基(表4)。
综上,为了将编码“rna依赖性rna合成酶”、“调节rna合成酶活性的蛋白质”、“单链rna结合蛋白”的基因制成隐身型rna基因表达系统而进行的优化方法并不依赖于特定的密码子优化法,已证实,无论基于何种算法的密码子优化方法都可作为本发明的密码子优化法使用。
以下,以表3来表示对仙台病毒的l、p、c和n蛋白基因通过ggeot法进行密码子优化后的gc含量和cai值的值与上述表2所示的使用oggds法的值进行对比的表。另外,因为在ggeot法中没有“cai值”的计算程序,所以,按照oggds法的“cai值”的计算程序进行计算。
另外,表4示出了分别对于l、p、c和n蛋白基因的原始序列、应用oggds后的序列和应用ggeot后的序列之间的同源性(一致性)的值。
表3
表4
5-4.用于“密码子优化”的必需指标
cai作为估计在人类细胞内的mrna翻译效率的指标之一使用(非专利文献46),然而,就本发明而言,将密码子优化作为从源自病毒的rna去除具有pamp活性的结构的一种手段来使用,不必获得翻译效率的升高也是可以的。
另外,cai是“指示与某生物种的细胞中编码最强烈表达的100个蛋白质的mrna的密码子的出现频率偏离的指标”,然而,并未有指示选择作为标准的100个蛋白质的客观基准。在本发明中,在将通过在源自人类的培养细胞内抑制同等的先天免疫反应诱导的可实现10个基因表达的oggds法的优化与通过ggeot法的优化进行比较的情况下,在后者的cai值(通过oggds法进行计算)的情况下,显示优化后与优化前几乎没有变化的结果(表3)。
另一方面,对于gc含量,无论使用哪种优化法都显示51%以上、最大为约60%的值。由此可知,作为表示去除具有pamp活性的结构的可能性的指标,gc含量比cai值更为有效。也就是说,作为用于抑制先天免疫反应诱导的“隐身型rna基因表达系统”的“密码子优化”中的指标,gc含量是最佳指标,源自病毒的蛋白质的密码子优化后的gc含量如果至少为50.0%以上,期望为52.0%以上,则推测有去除具有pamp活性的结构的可能性。
综上所述,本发明中在提及用于rna基因表达系统的“密码子优化”时,是指将编码rna基因表达系统所必需的蛋白质的全部碱基序列调节为gc含量为50~60%,优选为52~56%。
另外,由密码子优化导致的碱基序列改变的结果,存在于p基因区域的编码c蛋白和v蛋白的序列消失,由进行优化的p基因也不表达c蛋白和v蛋白。编码c蛋白和v蛋白的rna即使完全被去除仍可进行基因表达,因此不是必需的,然而,特别是在c蛋白的情况下,用于适当地调节本发明rna载体的表达量是重要的,因此优选在序列中添加如前所述进行优化的c蛋白基因rna。根据需要,对于v蛋白rna,也可进行适当的同样的密码子优化并添加至序列中。
6.本发明中用于将多个外源基因搭载于隐身型rna上的方法(转录盒连接法)
6-1.将6个以上基因搭载于同一载体上的方法的探讨
接着,探讨使用简单的方法将6个以上(例如10个)外源基因搭载于隐身型rna上的方法。另外,rna分子本身不能通过基因重组进行操作,因此,包括在5-4.中优化的源自病毒的基因的搭载在内,全部以cdna进行构建,将此cdna作为模板,通过源自t7噬菌体的t7rna聚合酶等dna依赖性rna合成酶制作rna。
为了最简单地制作搭载10个基因的dna分子,可以考虑在各个基因的cdna的上游和下游导入各基因固有的限制性酶酶切位点并将经此限制性酶酶切的cdna依次插入的方法。但是,在此情况下,除了至少需要20个不同的限制性酶之外,为了进行基因的组合或者变更基因在隐身型rna上的位置,还必须将cdna全部重新制作,这是不现实的。
6-2.各搭载2个基因的“串联型转录盒”的制作
就本发明而言,如前述2-1.(图1)所述,采用制作各搭载2个基因的“串联型转录盒”并将它们多个进行连接的方法,此时,花费工夫使得搭载的基因全部设计为具有相同结构并且可搭载于隐身型rna上的任何位置(图7)。就该设计方法而言,在搭载的基因的5ˊ上游侧设定为限制性酶a,在3ˊ下游测设定为限制性酶b,分别设定限制性酶酶切位点,此处将经酶切的cdna插入成为模板的dna分子。在被插入的模板dna中,除了由限制性酶a和限制性酶b识别的序列之外,还设定由限制性酶c和限制性酶d识别的序列。选择这些限制性酶的组合,使得经限制性酶a酶切的dna片段和经限制性酶d酶切的dna片段都可以进行共价结合,并且经限制性酶b酶切的dna片段和经限制性酶c酶切的dna片段都可以进行共价结合。这样的组合存在多个,除了实施例所列举的acc65i和bsiwi、xhoi和sali的组合以外,还可以考虑有xbai和spei或nhei的组合、bamhi和bglii的组合等。在这种情况下,对于搭载的基因的cdna,其结构上的制约为内部不包含限制性酶a、限制性酶b、限制性酶c、限制性酶d的识别序列。通过使用这样的限制性酶的组合,首先制作各搭载2个cdna的dna片段(图8)。
6-3.“转录盒”连接法
接着,将5个如上所述制作的连接2个cdna的dna片段连接在一起,制作搭载共计10个cdna的dna(图7、图8、图9)。就实施例而言,将在上述6-2.中制作的连接有2个cdna的dna片段用被称为sapi的限制性酶酶切后进行分离。由sapi酶切的dna的切面在5ˊ侧具有3个碱基突出的结构,通过将这3个碱基的序列任意设定,可选择4×4×4=64种切面(图7)(图9)。因此,可以将5个dna片段按照设计正确结合并作为一个dna分子回收(图9)。此时,对于搭载的基因的cdna,设计成除了不包含限制性酶a、限制性酶b、限制性酶c、限制性酶d的识别序列之外,还不包含sapi的识别序列(图7)。
这样的具有在切面生成如nn或nnn表示的序列中的任意的单链突出端的性质的限制性酶并不限于sapi,通过bbsi、bbvi、bcodi、bfuai、bsai、bsmbi、bsmfi、btgzi、eari、foki、hgai、sfani等多种限制性酶也可得到同样结果。另外,在识别序列内部具有不规则序列的alwni、bgli、bstapi、bstxi、draiii、sfii等也可得到同样效果。另外,此阶段不必利用使用限制性酶的克隆也是可以的,也可利用使用同源重组的方法(in-fusionhd克隆系统(takara-bio,inc.)或gibson组装系统(newenglandbiolabs,inc.))。另外,将10个cdna结合后组装至环状质粒dna中的阶段即使不使用实施例所示的通过同源重组组装至pdonr-221等的方法(gatewaysystem(lifetechnologies,inc.)),也可借助使用通常的t4dna连接酶进行共价结合的方法。另外,通过如图9所示的方法,可制作搭载1个至10个任意基因的dna分子。
6-4.外源基因表达量的调节
一般而言,已知在包含分别编码一组rna依赖性rna合成酶(pols、poll)、单链rna结合蛋白(n)、调节rna合成酶活性的蛋白质(c)的基因的负链单链rna基因表达系统中,在插入多个外源基因的情况下,越接近上游的3ˊ末端侧,表达量越多。本发明的隐身型rna基因表达系统也具有同样的倾向。就本发明而言,可以将多个外源基因按照任意顺序组装成盒状,因此,可以简单地使各个基因按照想要获得的表达量依次排列。另外,由各个基因制作的蛋白质的表达量通过改变翻译效率来进行调节也是可能的(图20)。
7.隐身型rna的合成
接着,将上述6.所制作的连接10个cdna的dna片段与按照前述5.所记载的方法针对人类细胞进行密码子优化(以下称为“人源化”,在各蛋白质的缩写前附加h进行标记)的编码单链rna结合蛋白的基因(hn)、编码调节rna合成酶活性的蛋白质的基因(hc)、编码rna依赖性rna合成酶的基因(hpoll、hpols)进行连接,制作用于合成隐身型rna的环状模板cdna(图10)。隐身型rna的结构可以通过rna聚合酶所识别的启动子的位置从负链和正链中进行选择。此处,将与由搭载于隐身型rna上的基因表达的mrna为相同方向的rna定义为正链,将与mrna为互补方向的rna定义为负链,在图10中例示了用于使用t7rna聚合酶合成负链rna的模板的制作。从t7启动子(非专利文献50)的下游侧配置为了酶切rna而制作正确末端的源自人类d型肝炎病毒的反基因组的核酶(非专利文献51)和t7rna聚合酶的转录终止信号(非专利文献50),使之可合成与隐身型rna全长相当的rna。在rna合成中使用的酶并不限于t7rna聚合酶,如果是可在大肠杆菌或动物细胞中使用的dna依赖性rna聚合酶,可使用任何种类的酶。例如,源自大肠杆菌t3噬菌体的t3rna聚合酶(非专利文献52)或源自沙门氏菌sp6噬菌体的sp6rna聚合酶(非专利文献53)也可以与这些酶所识别的启动子和转录终止位点组合进行使用。另外,核酶是为了正确酶切rna的3ˊ末端而使用,并不限于实施例的源自人类d型肝炎病毒的反基因组的核酶,也可使用源自人类d型肝炎病毒的基因组的核酶(非专利文献51)或者烟草环斑病毒的发夹状核酶(非专利文献54),进一步也可使用可在细胞内对rna进行酶切的小抑制rna(sirna)(专利文献55)。
另外,与隐身型rna全长互补的cdna被克隆至具有源自p15a的复制起点的质粒(非专利文献56)。由于在大肠杆菌中是以低拷贝数的状态维持,具有源自p15a的复制起点的质粒不仅对于使大dna片段在大肠杆菌中稳定地保持是有利的,而且在用于重构隐身型rna基因表达系统的方法2中,使该质粒与具有源自cole1的复制起点的n蛋白表达质粒在大肠杆菌中共存是可能的(非专利文献56)。就实施例而言,在具有源自p15a的复制起点的质粒上搭载氨苄青霉素抗性,在具有源自cole1的复制起点的质粒上搭载卡那霉素抗性,通过氨苄青霉素和卡那霉素的双重选择将2个质粒维持在同一大肠杆菌内,然而,抗生素的组合并不限于该示例。另外,质粒的组合也可使用具有源自f因子的复制起点替代源自p15a的复制起点的质粒、具有源自puc的复制起点替代源自cole1的复制起点的质粒。
8.隐身型rna基因表达系统的重构
8-1.现有形式的重构法
由负单链rna以及与该rna结合的蛋白质构成的隐身型rna基因表达系统的重构可通过两种方法进行。第一种方法是通过已知作为已经具有负单链rna基因组的病毒以及利用该病毒的载体的重构法的技术,将与负单链rna互补的正单链rna使用t7rna聚合酶在动物细胞内表达,同时,通过使np(n)、p(pols)、l(poll)这3个蛋白质在该细胞内表达而重构正链rna的隐身型rna基因表达系统(图11)(非专利文献57、专利文献3)。就该方法而言,优点是仅通过使用稳定地表达t7rna聚合酶的动物细胞,将作为材料的质粒dna导入细胞便可重构,十分便利。另一方面,已知因为是将包含用于合成正单链rna的模板cdna的质粒与搭载有表达np、p、l这3个蛋白质的基因的3个质粒同时导入细胞,所以这些dna分子之间经常发生基因重组,在想要制作的负单链rna结构中插入突变(非专利文献57)。另外,在专利文献3的实施例中,为了提高重构效率,进一步追加表达m、f、hn蛋白的质粒。
8-2.本发明开发的重构法
就第二种方法而言,首先在大肠杆菌中制作负单链rna和具有单链rna结合能力的np蛋白(n)的复合体,将该复合体导入表达p(pols)蛋白和l(poll)蛋白的动物细胞,重构隐身型rna基因表达系统(图12)。在该方法中,首先,分别通过t7rna聚合酶由在大肠杆菌中可共存的2个质粒合成编码n蛋白的mrna和隐身型rna,通过在大肠杆菌内同时表达单链rna结合蛋白(n)和隐身型rna来制作复合体。将从天然存在的rna病毒分离的rna-蛋白质复合体作为材料重构rna病毒的方法在非专利文献58中公开,然而,就此次开发的方法而言,将通过基因重组技术合成的隐身型rna作为材料进行重构成为可能。与第一种方法相比,此方法具有步骤较多且复杂的缺点,然而,通过使用与同源重组相关的基因(reca)和编码rna分解酶的基因(rnasee)被破坏的大肠杆菌(非专利文献59),可以在没有在基因组rna中引入突变的情况下重构隐身型rna基因表达系统。
也就是说,本发明开发的隐身型rna基因表达系统的重构法是在表达t7rna聚合酶的宿主细胞内事先制作负单链rna与具有单链rna结合能力的蛋白质(例如np蛋白(n))的复合体,将该复合体导入表达rna依赖性rna合成酶(例如p(pols)蛋白和l(poll)蛋白)的动物细胞来重构隐身型rna基因表达系统的方法。作为宿主细胞优选使用reca基因和rnasee基因被破坏且表达t7rna聚合酶的大肠杆菌。
接着,使用按照上述7.所记载的方法合成的搭载10个基因的隐身型rna,通过前述8.所记载的任一种方法构建隐身型rna基因表达系统(图13)。如此操作制作的具有负单链rna的基因表达系统可持续地表达所搭载的全部10个基因,这可通过稳定地表达3种耐药性特性(嘌呤霉素抗性、博来霉素抗性、潮霉素抗性)、4种荧光蛋白(egfp、e2-crimson、ebfp2、keima-red)、3种萤光素酶(萤火虫萤光素酶、海肾萤光素酶、夜光海萤(cypridinanoctiluca)萤光素酶)进行确认(图14)。
8-3.隐身型rna基因表达系统中rna结合蛋白(hn、hc、hpol)基因的连接顺序
在本发明的隐身型rna基因表达系统中,编码单链rna结合蛋白的基因(hn)、编码调节rna合成酶活性的蛋白质的基因(hc)、编码rna依赖性rna合成酶的基因(hpols)在隐身型rna上的位置并不限定于如图13所示的从3ˊ末端侧开始的所谓hn-hc-hpols的顺序。例如,即使替换为如hn-hpols-hc或hpols-hn-hc这样的顺序,也可构建隐身型rna基因表达系统(图16)。
8-4.隐身型rna基因表达系统中的源自病毒的蛋白质基因中的突变的必要性
另外,在该隐身型rna基因表达系统中,在由编码单链rna结合蛋白的人源化基因(hn)、编码调节rna合成酶活性的蛋白质的人源化基因(hc)、编码rna依赖性rna合成酶的人源化基因(hpols、hpoll)表达的蛋白质中,不需要存在特别的突变。
如前述3-3.所述,在现有技术中,作为避免先天免疫机制的方法,导入对源自病毒的rna依赖性rna合成酶基因等的pamp活性进行抑制的突变作为最有效的方法而被使用。
但是,在本发明中,借助前述5.所示的方法将源自病毒的蛋白质基因通过全部密码子优化来去除pamp活性,因此,不需要事先向源自病毒的蛋白质中导入蛋白质水平的突变。例如,即使是在使用表达源自作为已知具有强干扰素诱导能力的野生型副粘病毒的仙台病毒z株的np、p、c和l蛋白的基因的情况下,也可通过前述5.所示的方法进行优化,从而可作为隐身型rna基因表达系统的材料使用。例如,作为在图16中以“hpol”表示的表达l蛋白的基因,将源自z株的基因序列针对人类细胞进行优化而使用。
9.对于先天免疫机制诱导活性的验证
9-1.与现有技术避免先天免疫机制激活的效果的比较
接着,对于基因导入时诱导先天免疫机制的活性,为了将搭载隐身型rna基因表达系统的隐身型rna载体与现有技术进行比较,制作了非专利文献7的图1b所描述的作为现有技术的持续表达型仙台病毒载体以及搭载完全相同的4个基因(keima-red、杀稻瘟菌素s抗性基因、egfp、kusabira-orange)的隐身型rna载体。使用这2种载体向人类原代培养成纤维细胞中导入基因,将24小时后的干扰素βmrna的量用real-timepcr法进行定量(图17)。其结果是,就隐身型rna载体而言,尽管没有搭载抑制先天免疫机制的v基因,诱导也被控制在正常细胞中的干扰素βmrna的量的5倍以内。另一方面,就现有技术而言,即使保有v基因,仍观察到正常细胞47倍的诱导(图17)。从该结果可知,就隐身型rna基因表达系统而言,即使在不存在抑制先天免疫机制的因子的条件下,也可避免先天免疫机制的激活。
9-2.进一步的先天免疫机制激活的避免
诱导先天免疫机制的活性也受到保有隐身型rna基因表达系统的细胞的种类以及来自于隐身型rna基因表达系统的基因表达的强度的影响。例如,源自人类的hela细胞中几乎不诱导干扰素β,与之相对,同样源自人类的293细胞中则强烈诱导。另外,为了制造生物医药品,基因表达越强,干扰素β的诱导也越强。在使用隐身型rna基因表达系统制造生物医药品的情况下,由干扰素诱导的细胞质的腺苷脱氨酶(作用于rna的腺苷脱氨酶,adar1)的活性所造成的rna基因组的突变(非专利文献39)成为问题,因此,期望进一步抑制在隐身型rna基因表达系统中残存的先天免疫机制诱导活性。
此目标可通过在隐身型rna基因表达系统中追加搭载抑制先天免疫机制的因子而实现(图18、图19)。作为这样的因子,可列举存在于细胞质中的“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pamp)”受体rig-i的缺失变体(rig-ic)(非专利文献71)、仙台病毒v蛋白的c末端区域(非专利文献72)、蛋白酶体的构成成分psma7(非专利文献73)等。
10.基因表达水平的调节
接着,探讨了通过调节搭载于该载体上的与转录、复制相关的因子的表达,在隐身型rna基因表达系统中的基因表达水平会怎样发生变化(图20、图21)。另外,在图20中以正链rna序列进行标记。各个因子的表达可通过改变由mrna翻译为蛋白质的效率进行调节。另外,使翻译效率变化最简单的方法是变更紧接翻译起始密码子(aug)上游的5ˊ非编码序列。认为在动物细胞中翻译效率最高的是恰好在aug前方具有所谓5ˊ-ccacc-3ˊ(序列号18)的结构的情况(非专利文献60)。另一方面,通过在5ˊ上游侧插入短编码区,可使翻译效率降低(非专利文献61)。在实施例中,制作将rna依赖性rna聚合酶(hpols和hpoll)的表达控制为一定水平并将单链rna结合蛋白(hn)和调节rna合成酶活性的蛋白质(hc)的表达分别抑制为40%和23%的载体,将所搭载的萤火虫萤光素酶的表达进行比较(图20)。其结果是,通过抑制hn和hc中任一种的表达,所搭载的萤光素酶基因的表达升高,通过将hn和hc的表达抑制进行组合,观察到最大79倍的基因表达的升高。
这样的基因表达水平的调节可仅通过对调节rna合成酶活性的蛋白质(hc)的表达水平进行调节来进行(图21)。在此情况下,即使缺失hc基因,也可重构隐身型rna基因表达系统,因为基因表达水平成为最大,所以hc基因并不是隐身型rna基因表达系统的必需要素。但是,搭载基因的表达过强,则细胞增殖被强烈抑制,因此,将hc蛋白表达为适当水平并实现符合目标的基因表达是具有实用性的。
作为基因表达系统中的重要性质,可列举可以根据目的选择最适当的表达水平。例如,在细胞重编程中,转录因子的表达过强,则诱导细胞死亡。另外,在生物医药品的制造中,表达弱,则生产效率降低。一般来说,在使用rna病毒的基因表达系统中改变载体的表达水平是困难的,然而,隐身型rna基因表达系统可以通过微调节各个构成成分的表达平衡,根据使用目的来自由地改变表达强度。
接着,将如此完成的隐身型rna基因表达系统封入内部,尝试制作可向各种动物细胞导入隐身型rna基因表达系统的载体颗粒。使用在细胞质中具有隐身型rna基因表达系统的bhk细胞,使用强srα启动子使副粘病毒的m、f、hn这3种蛋白质表达,则在细胞的培养上清液中检测到具有基因导入活性的载体颗粒。其感染价约为107感染单元/ml,得到与现有形式的持续表达型仙台病毒载体同等的高活性。此载体颗粒通过f和hn蛋白的活性吸附在细胞表面,可通过膜之间的融合将内容物,即隐身型rna基因表达系统导入细胞质中。此过程不需要细胞分裂,因此,不进行细胞分裂的细胞也可进行基因导入。
另外,可导入的细胞的细胞特异性、种特异性由所使用的f和hn蛋白的来源决定,然而,在使用仙台病毒的f和hn蛋白的情况下,可以向包括外周血的血液细胞在内的非常广范的人类细胞和动物细胞中进行基因导入。
11.载体的去除
另外,就现有技术的持续表达型仙台病毒载体而言,通过以sirna抑制rna依赖性rna聚合酶的活性,成功地迅速去除了载体(专利文献3、非专利文献7)。因此,探讨了在隐身型rna基因表达系统中可否以同样的方法去除(图23)。隐身型rna基因表达系统所具有的人源化rna依赖性rna聚合酶(hpoll)的碱基序列与现有技术的持续表达型仙台病毒载体不同,因此,合成了三种新sirna,探讨其活性。其结果是,确认使用三种中的一种sirna(目标序列为序列号46),可与现有技术同样地去除(图23)。如上所述,可知本发明的隐身型rna基因表达系统可应用以往的持续表达型仙台病毒载体所使用的通过rnai去除载体的方法。同样地,也可应用使用microrna(mirna)的去除方法,例如,如专利文献3所记载的,通过在外源基因的3ˊ非编码区或5ˊ非编码区插入microrna(mirna)的目标序列,与内源性mirna反应而去除也是可能的。
12.本发明的隐身型rna表达系统的用途
在本发明的隐身型rna表达系统中使用的负单链隐身性rna载体中,可搭载源自人类的基因等任意基因6个以上,进一步可达10个,可搭载长度为5,000个碱基长度,进一步可达15,000个碱基长度。
并且,因为具有可在人类细胞等动物细胞中避免先天免疫机制激活的隐身性,并且载体的去除也可简单地进行,所以,可以考虑必须同时导入多个基因的细胞重编程技术、包含巨大基因的基因治疗、再生医疗、生物医药品的制造等广泛的用途。
具体而言,可以考虑以下实施方式。
(1)在高效率地制作使用于再生医疗的临床用高品质ips细胞的技术中的应用。
在搭载用于对人类细胞等动物细胞进行重编程的6个以上基因,例如用于ips细胞转换的山中4因子(klf4、oct4、sox2、c-myc)+brg1+baf155这6个基因的情况下,成为13,132个碱基长度。另外,在搭载oct4、klf4、sox2、c-myc、nanog、lin28这6个基因的情况下,成为7,000个碱基长度。
实际上,将这6个基因搭载于本发明的隐身性rna载体上(图25)并在人类胎儿成纤维细胞中使之表达时,得到实现超过40%的初始化效率这样的结果(实施例21)。另外,确认此时山中4因子(klf4、oct4、sox2、c-myc)的搭载顺序可适当改变(数据未显示)。
另外,将人类外周血细胞作为材料,在不含动物成分(xeno-free)、不使用饲养细胞(feeder-free)的条件下进行同样实验的结果是,同样地,也可得到比现有方法进行更高初始化的结果(数据未显示)。
另外,在klf4、oct4、sox2、c-myc这4个基因上,搭载编码染色质重构因子的chd1基因(合计9,907个碱基长度),进一步追加编码dna去甲基化酶的tet1基因(合计11,203个碱基长度),也可提高初始化效率。
作为其它可能的组合,进一步使将2种卵母细胞特异性组蛋白组合的8个基因在人类体细胞中表达,高效率地制作人类ips细胞是可能的。
(2)利用直接重编程技术从人类组织细胞(血液、皮肤、胎盘等)制作神经细胞、神经干细胞、干细胞、胰脏β细胞等的有用基因的再生医疗中的应用。
例如,在将人类成纤维细胞重编程为运动神经的技术中,在被称为lhx3、ascl1、brn2、myt1l的4个基因上追加被称为hb9、isl1、ngn2的3个基因,合计可搭载7个基因(9,887个碱基长度)。
(3)由多个亚基构成的生物医药品的制造。
本发明对于用于生产作为巨大基因、并且需要亚基在同一细胞中同时表达、并且还需要调节各亚基的表达量的免疫球蛋白g、m是有用的。
实际上,在本发明的隐身性rna载体上搭载人类免疫球蛋白的h(μ)链基因、l(κ、λ)链基因以及j基因(图24),使用bhk细胞制造了人类免疫球蛋白m(实施例22)。此时,通过在搭载基因的顺序上下功夫,成功使h链:l链:μ链以约为1:1:0.2的比例进行表达。
另外,在本发明的隐身性rna载体上搭载人类免疫球蛋白的4个cdna(2个h链和2个l链),成功表达了人类双重特异性抗体(实施例23)。
(4)在由多个亚基构成的药物研发靶标蛋白质的表达中的应用。
例如,通过将gp91phox、p22phox、rac、p47phox、p67phox、p40phox这6个亚基搭载于本发明的隐身性rna载体上并使之同时表达,可表达药物研发靶标酶nadph氧化酶(nox2)。
(5)在疾病的致病基因是巨大基因的情况下,在本发明的隐身性rna载体中搭载这些巨大基因使之持续表达,作为这些疾病的基因治疗用载体的应用。
具体而言,可将血友病a的致病基因产物血液凝固因子viii的cdna(7053个碱基长度)或杜氏肌肉营养不良症的致病基因产物肌养蛋白的cdna(11058个碱基长度)搭载于本发明的隐身性rna载体上(图24)来使用。
实施例
以下通过实施例对本发明进行更为详细的说明,然而,本发明并不限定于这些实施例。
本发明中的其它用语和概念是以该技术领域中惯常使用的用语的意思为基础的用语和概念,为了实施本发明而使用的各种技术,除了特别明示其出处的技术之外,基于公知的文献,只要是本领域技术人员就可容易且确实地实施。另外,各种分析等根据使用的分析仪器或试剂、试剂盒的使用明书、目录等所记载的方法进行。
另外,本说明书中引用的现有技术文献、专利公报和专利申请说明书中的记载内容作为本发明的记载内容而被参考。
实施例1:搭载10个外源基因的dna片段的制作(1)
通过pcr以使之成为acc65i-cdna-xhoi的结构的方式对以下基因进行扩增后进行亚克隆(图7)。
1)萤火虫萤光素酶(fireflyluciferase):(genbank登录号ay738224);
2)海肾萤光素酶(renillaluciferase):(genbank登录号ay738228);
3)增强型绿色荧光蛋白(egfp):(genbank登录号u55761);
4)嘌呤霉素抗性基因(针对人类细胞进行密码子优化并合成):非专利文献62,序列号47;
5)夜光海萤萤光素酶:非专利文献63(genbank登录号ab177531);
6)e2-crimson:源自pe2-crimson(clontechlaboratories,inc.),序列号48;
7)增强型蓝色荧光蛋白2(ebfp2):非专利文献64(genbank登录号ef517318);
8)博来霉素抗性基因(针对人类细胞进行密码子优化并合成):非专利文献65,序列号49;
9)dkeima-red:非专利文献66(genbank登录号ab209968);
10)潮霉素b抗性基因(针对人类细胞进行密码子优化并合成):非专利文献67,序列号50。
实施例2:搭载10个外源基因的dna片段的制作(2)
接着,制作以下质粒。
另外,本实施例中使用的核酸都是dna片段,对于序列号1或序列号4等在序列表中作为负链rna序列被指定的序列是指对应的dna序列。在使用dna片段的其它实施例中也同样如此。
1)质粒#1:
在质粒litmus38i(newenglandbiolab,inc.)的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-attb1(序列号51)-序列号1-序列号24-acc65i酶切位点-sali酶切位点-序列号25-序列号4-ctt-序列号1-序列号26-bsiwi酶切位点-xhoi酶切位点-序列号27-序列号4-sapi酶切位点。
2)质粒#2:
在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号28-acc65i酶切位点-sali酶切位点-序列号29-序列号4-ctt-序列号1-序列号30-bsiwi酶切位点-xhoi酶切位点-序列号31-序列号4-sapi酶切位点。
3)质粒#3:
在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号32-acc65i酶切位点-sali酶切位点-序列号33-序列号4-ctt-序列号1-序列号34-bsiwi酶切位点-xhoi酶切位点-序列号35-序列号4-sapi酶切位点。
4)质粒#4:
在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号36-acc65i酶切位点-sali酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-bsiwi酶切位点-xhoi酶切位点-序列号39-序列号4-sapi酶切位点。
5)质粒#5:
在litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号36-acc65i酶切位点-sali酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-bsiwi酶切位点-xhoi酶切位点-序列号39-序列号4-attb2(序列号52)-sapi酶切位点。
实施例3:搭载10个外源基因的dna片段的制作(3)(参见图8)
接着,制作以下质粒。
1)质粒#1c
在质粒#1的acc65i-sali之间克隆包含萤火虫萤光素酶基因的acc65i-xhoi片段,制作质粒#1b。进一步地,在质粒#1b的bsiwi-xhoi之间克隆包含海肾萤光素酶基因的acc65i-xhoi片段,制作质粒#1c。
2)质粒#2c
在质粒#2的acc65i-sali之间克隆包含egfp基因的acc65i-xhoi片段,制作质粒#2b。进一步地,在质粒#2b的bsiwi-xhoi之间克隆包含嘌呤霉素抗性基因的acc65i-xhoi片段,制作质粒#2c。
3)质粒#3c
在质粒#3的acc65i-sali之间克隆包含夜光海萤萤光素酶基因的acc65i-xhoi片段,制作质粒#3b。进一步地,在质粒#3b的bsiwi-xhoi之间克隆包含e2-crimson基因的acc65i-xhoi片段,制作质粒#3c。
4)质粒#4c
在质粒#4的acc65i-sali之间克隆包含ebfp2基因的acc65i-xhoi片段,制作质粒#4b。进一步地,在质粒#4b的bsiwi-xhoi之间克隆包含博来霉素抗性基因的acc65i-xhoi片段,制作质粒#4c。
5)质粒#5c
在质粒#5的acc65i-sali之间克隆包含dkeima-red基因的acc65i-xhoi片段,制作质粒#5b。进一步地,在质粒#5b的bsiwi-xhoi之间克隆包含潮霉素b抗性基因的acc65i-xhoi片段,制作质粒#5c。
实施例4:搭载10个外源基因的dna片段的制作(4)(参见图9)
将从质粒#1c使用sapi切出的包含萤火虫萤光素酶基因和海肾萤光素酶基因的dna片段100ng、从质粒#2c使用sapi切出的包含egfp基因和嘌呤霉素抗性基因的dna片段100ng、从质粒#3c使用sapi切出的包含夜光海萤萤光素酶基因和e2-crimson基因的dna片段100ng、从质粒#4c使用sapi切出的包含ebfp2基因和博来霉素抗性基因的dna片段100ng、从质粒#5c使用sapi切出的包含dkeima-red基因和潮霉素b抗性基因的dna片段100ng,共计500ng,溶解于5μlh2o中,混合5μlligation-conveniencekit(nippongeneco.,ltd.),使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#6(pdonr-221,lifetechnologies,inc.)(150ng)和2μlbpclonase2(lifetechnologies,inc.),使之在25℃反应2小时,然后导入大肠杆菌dh-5α,分离卡那霉素抗性菌落,制作质粒#7。
实施例5:制造搭载10个外源基因的隐身型rna的模板dna的制作(参见图10)
质粒#8是将具有p15a的复制起点的质粒pacyc177(非专利文献56)的卡那霉素抗性基因使用pdonr-221的包含attb1-氯霉素抗性基因-attb2的dna片段进行置换而制作的。在通过optimumgen基因设计系统优化的包含hn-hc-hpols的dna(序列号53)的5ˊ侧依次连接attb1、t7终止子和hdv核酶的dna片段由genscript公司合成。同样地,合成了在通过optimumgen基因设计系统优化的包含hpoll的dna(序列号54)的3ˊ侧连接t7启动子和attb2的dna。将使用bamhi和xmai切出的依次包含attb1-t7终止子-hdv核酶-hn-hc-hpols的dna片段100ng、使用xmai和noti从质粒#7切出的包含10个基因的dna片段100ng、使用noti和sali切出的依次包含hpoll-t7启动子-attb2的dna片段100ng,共计300ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#8(150ng)和2μlbpclonase2,使之在25℃反应16小时,然后导入大肠杆菌hst-08(takarabioco.),分离氨苄青霉素抗性菌落,制作成为合成负链隐身型rna的模板的质粒#9b。
合成正链隐身型rna的模板dna是将t7启动子与t7终止子互换而制作的。具体而言,将依次包含attb1-t7启动子-hn-hc-hpols的dna片段100ng、使用xmai和noti从质粒#7切出的包含10个基因的dna片段100ng、使用noti和sali切出的依次包含hpoll-hdv核酶-t7终止子-attb2的dna片段100ng,共计300ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#8(150ng)和2μlbpclonase2,使之在25℃反应16小时,然后导入大肠杆菌hst-08,分离氨苄青霉素抗性菌落,制作成为合成正链隐身型rna的模板的质粒#9a。
实施例6:搭载10个外源基因的隐身型rna基因表达系统的重构(方法1)(参见图11)
方法1根据专利文献3和非专利文献7所描述的方法进行。
具体而言,作为bhk/t7/151m(se)细胞,按照以下方法制作稳定表达t7rna聚合酶和m蛋白的源自仓鼠的bhk-21细胞。bhk-21细胞从日本理化学研究所生物资源中心获得。将t7rna聚合酶基因(非专利文献74)针对动物细胞进行密码子优化后合成的cdna(序列号77)搭载于反转录病毒载体pcx4neo(非专利文献75,genbank登录号ab086385)上,导入bhk-21细胞后,通过包含800μg/mlg-418的含有10%fcs的dmem培养基进行选择,得到bhk/t7细胞。接着,将仙台病毒温度敏感型突变株clone151株的m基因(genbank登录号nm_011046)搭载于反转录病毒载体pcx4pur(非专利文献75,genbank登录号ab086386)上,导入bhk-21/t7细胞后,通过包含200μg/ml嘌呤霉素的含有10%fcs的dmem培养基进行选择,得到bhk/t7/151m(se)细胞。
重构中使用的表达载体通过以下方法制作。np蛋白表达质粒pcmv-np、p蛋白表达质粒pcmv-p、l蛋白表达质粒pcmv-l、小鼠弗林蛋白酶(furin)表达质粒pcmv-furin是将仙台病毒z株的np基因、p基因、l基因(genbank登录号m30202.1)和小鼠弗林蛋白酶cdna(非专利文献76,genbank登录号nm_011046)连接至巨细胞病毒的立即早期基因(immediateearlygene)的增强子、启动子(非专利文献77)下游而制作的。f和hn蛋白表达质粒psrd-hn-fmut(非专利文献78)是将仙台病毒z株的f和hn基因连接至srα启动子(非专利文献79)下游的质粒。pmkit-151m是在srα启动子的下游连接仙台病毒温度敏感型突变株clone151株的m基因而制作的。
将稳定表达m蛋白的bhk/t7/151m(se)细胞按照5×105细胞/孔接种于6孔板,培养24小时后洗净。将质粒#9a、np蛋白表达质粒pcmv-np、p蛋白表达质粒pcmv-p、l蛋白表达质粒pcmv-l、f和hn蛋白表达质粒psrd-hn-fmut、小鼠弗林蛋白酶表达质粒pcmv-furin分别按照2μg、1μg、1μg、1μg、2μg、20ng的量的比例悬浮于300μloptimem(lifetechnologies,inc.)中,将与包含10μllipofectamineltx(lifetechnologies,inc.)的300μloptimem混合并在室温放置20分钟的培养基添加至细胞,培养4小时。将细胞再度洗净后,添加含有10%fcs的dmem培养基,进一步在32℃培养3天。之后,将细胞移至包含300μg/ml潮霉素b的含有10%fcs的dmem培养基继续培养,分离bhk/#9a细胞。通过egfp和keima-red的表达确认了引起隐身型rna基因表达系统重构的事实。
实施例7:搭载10个外源基因的隐身型rna基因表达系统的重构(方法2)(参见图12)
作为reca和rnasee的双重缺失突变株的大肠杆菌e-aist7株是依次将大肠杆菌bl21(de3)株(非专利文献68)的rnasee基因和reca基因破坏进行制作的。在rnasee基因中,将rnaseec末端的缺失突变(rne131)导入(非专利文献59),在reca基因中将完全缺失突变导入。基因破坏使用genebridgesgmbh公司的quick&easy大肠杆菌基因缺失试剂盒(e.coligenedeletionkit),根据该试剂盒的实验规程进行。使用大肠杆菌表达单链rna结合蛋白(n)的质粒#10,是通过在质粒pet-24a(+)(merckkgaa)上搭载针对大肠杆菌进行密码子优化的n基因(en)(序列号55)进行制作的。
在大肠杆菌e-aist7株中导入质粒#9b和质粒#10,通过氨苄青霉素和卡那霉素进行选择,制作e-aist7/n/9b株。将e-aist7/n/9b株在30℃培养,当达到od600=0.3时,加入0.5mmiptg,诱导t7rna聚合酶的表达,培养3小时,回收大肠杆菌。将回收的菌悬浮于10ml10%蔗糖、50mmtris-hcl(ph7.5)、2mmmgcl2中,加入150千单位重组溶菌酶(rlysozome)(merckkgaa)和25单位全能核酸酶(benzonase)(merckkgaa)后,在30℃处理30分钟,回收原生质体。将原生质体使用50mmtris-hcl(ph7.5)、2mmmgcl2、50mmchaps进行破坏后,将4,500rpm10分钟的离心上清液使用beckmansw41ti转子以25,000rpm离心60分钟,将rna-n蛋白复合体作为沉淀物进行回收。进一步将rna-n蛋白复合体悬浮于28%氯化铯溶液,使用beckmansw41ti转子以37,000rpm离心45小时,纯化了rna-n蛋白复合体。
将bhk/t7/151m(se)细胞以5×105细胞/孔接种于6孔板,培养24小时后,将p蛋白表达质粒pcmv-p、l蛋白表达质粒pcmv-l各1μg通过lipofectamineltx导入。再经24小时后,将5μgrna-n蛋白复合体与10μlpro-deliverin试剂(ozbiosciences)混合,导入细胞。从24小时后开始,将细胞移至包含300μg/ml潮霉素b的含有10%fcs的dmem培养基中继续培养,分离bhk/#9a2细胞。通过egfp和keima-red的表达确认了引起隐身型rna基因表达系统重构的事实。
实施例8:搭载10个外源基因的隐身型rna载体#1的制作
对于5.0×105个bhk/#9a细胞(或bhk/#9a2细胞),将作为基因缺失表达质粒的pmkit-151m、psrd-hn-fmut、pcmv-furin按照2μg、2μg、30ng的比例使用脂质体转染试剂ltx进行导入,4小时后洗净细胞后,加入含有10%fcs的dmem培养基,进一步在32℃培养4天。之后,回收包含隐身型rna载体#1(图13)的培养上清液,使用0.45μm的过滤器过滤后,如果需要,可通过超离心法浓缩载体。将载体悬浮液在液氮中急速冷冻,在-80℃保存。载体的活性使用源自猴肾脏的llcmk2细胞由抗np蛋白抗体通过间接荧光抗体法进行检测(非专利文献7)。由此方法得到的隐身型rna载体的感染价为约107感染单元/ml,得到与现有形式的持续表达型仙台病毒载体同等或其以上的活性。
实施例9:通过搭载10个外源基因的隐身型rna载体的基因表达(参见图14)
将实施例8制作的隐身型rna载体#1以感染复数(moi)=3感染hela细胞,通过包含100μg/ml潮霉素b的含有10%fcs的dmem培养基进行选择,建立hela/#9细胞。该细胞的抗药性能通过嘌呤霉素(1.5μg/ml)、博来霉素(100μg/ml)、潮霉素b(100μg/ml)、g418(800μg/ml)、杀稻瘟菌素s(10μg/ml)进行选择,生存率通过菌落分析进行测定。阴性对照的hela细胞对这些抗生素都具有敏感性,与之相对,hela/#9细胞对嘌呤霉素、博来霉素、潮霉素b选择性地显示抗性,确认对这3种试剂表达抗性特性(图14,上部)。
hela/#9细胞中的荧光蛋白表达通过流式细胞仪(gallios,beckmancoulter)进行计测。各荧光蛋白的观察条件如下。ebfp2:激发405nm,检测450nm;keima-red:激发405nm,检测620nm;egfp:激发488nm,检测530nm;e2-crimson:激发638nm,检测660nm。与不保有载体的hela细胞相比,确认hela/#9细胞表达4个荧光蛋白(图14,中部)。
hela/#9细胞中的萤光素酶表达使用以下试剂通过冷光仪(promega,corp.)检验发光。萤火虫萤光素酶和海肾萤光素酶:双荧光素酶报告基因检测系统(dual-luciferasereporterassaysystem)(promega,corp.);夜光海萤萤光素酶:biolux海萤萤光素酶分析试剂盒(cypridinaluciferaseassaykit)(newenglandbiolabs,inc.)。不保有载体的hela细胞未检验到任一种萤光素酶的活性,然而,hela/#9细胞检验到萤光素酶的高活性(图14,下段)。
实施例10:搭载10个外源基因的隐身型rna载体#2(图15)的制作
除了将在模板cdna制作中使用的hn、hc、hpols、hpoll基因通过genegps表达优化技术进行优化并将hn、hc、hpols这3个基因按照hn-hpols-hc的顺序搭载之外,使用与实施例8所记载的方法同样的方法制作载体,并按照实施例9所记载的方法进行验证。在包含hn-hpols-hc的dna(序列号78)的5ˊ侧依次连接attb1和t7启动子的dna片段由dna2.0公司合成。同样地,在包含hpoll的dna(序列号79)的3ˊ侧连接hdv核酶、t7终止子和attb2的dna片段由dna2.0公司合成。
实施例11:搭载10个外源基因的隐身型rna载体#3、#4(图16)的制作
除了将使用optimumgen基因设计系统优化的hn、hc、hpols这3个基因按照hn-hpols-hc的顺序(#3)或按照hpols-hn-hc的顺序(#4)进行搭载之外,使用与实施例8所记载的方法同样的方法制作载体,并按照实施例9所记载的方法进行验证。在包含hn-hpols-hc的dna(序列号80)的5ˊ侧依次连接attb1和t7启动子的dna片段、在包含hpols-hn-hc的dna(序列号81)的5ˊ侧依次连接attb1和t7启动子的dna片段以及在包含hpoll的dna(序列号82)的3ˊ侧连接hdv核酶、t7终止子和attb2的dna片段由genscript公司合成。
实施例12:搭载4个外源基因的隐身型rna载体#5的制作
杀稻瘟菌素s抗性基因(非专利文献69)(序列号56)和kusabira-orange基因(非专利文献70)(genbank登录号ab128819)以使之成为acc65i-cdna-xhoi的结构的方式进行pcr扩增后亚克隆(图7)。质粒#5d,在litmus38i的apai酶切位点与stui酶切位点之间克隆具有下述结构的dna。但是,与质粒#5的sapi酶切切面不同:sapi酶切位点-序列号1-序列号36-acc65i酶切位点-sali酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-bsiwi酶切位点-xhoi酶切位点-序列号39-序列号4-attb2-sapi酶切位点。
在质粒#1的acc65i-sali之间克隆包含dkeima-red基因的acc65i-xhoi片段,制作质粒#1d。进一步地,在质粒#1d的bsiwi-xhoi之间克隆包含杀稻瘟菌素s抗性基因的acc65i-xhoi片段,制作质粒#1e。同时,在质粒#5d的acc65i-sali之间克隆包含egfp基因的acc65i-xhoi片段,制作质粒#5e。进一步地,在质粒#5e的bsiwi-xhoi之间克隆包含kusabira-orange基因的acc65i-xhoi片段,制作质粒#5f。
将使用sapi从质粒#1e切出的包含dkeima-red基因和杀稻瘟菌素s抗性基因的dna片段100ng、使用sapi从质粒#5f切出的包含egfp基因和kusabira-orange基因的dna片段100ng,合计200ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#6(150ng)和2μlbpclonase2,使之在25℃反应2小时,之后导入大肠杆菌dh-5α,分离卡那霉素抗性菌落,制作质粒#11。利用从质粒#11使用xmai和noti切出的包含4个基因的dna片段的隐身型rna载体#5的制作根据实施例5~实施例8所记载的方法进行。
实施例13:通过隐身型rna载体的ifn-β基因的诱导(图17)
缺失持续表达型仙台病毒载体sevdp(kr/bsr/egfp/ko)记载于非专利文献7。将通过实施例12制作的隐身型rna载体#5和sevdp(kr/bsr/egfp/ko)载体一起以moi=3感染源自原代培养的人类皮肤成纤维细胞。在此条件下,任一载体都可导入约80%的细胞。在载体感染后第24小时,使用isogen试剂盒(nippongeneco.,ltd.)提取细胞总rna,使用脱氧核糖核酸酶(deoxyribonuclease)(rt级)(nippongeneco.,ltd.)分解基因组dna。接着,将该rna作为模板,使用用于rt-pcr的superscriptiii合成系统(superscriptiiisynthesissystemforrt-pcr)(lifetechnologies,inc.)和oligo(dt)20,通过反转录反应进行第一链cdna合成。进一步地,使用ssoadvanced通用型sybrgreen预混液(ssoadvanceduniversalsybrgreensupermix)(bio-rad),将第一链cdna作为模板,使用内参基因或干扰素β基因的基因特异性引物(gsp)和cfx96实时系统(real-timesystem)(bio-rad)通过实时pcr法进行ifn-βmrna的表达量的解析。
实施例14:搭载6个外源基因的隐身型rna基因表达系统#6、#7、#8、#9、#10的制作(图20、图22)
质粒#2d是在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆有具有以下结构的dna。但是,与质粒#2相比,由sapi酶切的切面的序列是不同的:sapi酶切位点-序列号1-序列号28-acc65i酶切位点-sali酶切位点-序列号29-序列号4-ctt-序列号1-序列号30-bsiwi酶切位点-xhoi酶切位点-序列号31-序列号4-sapi酶切位点。
在质粒#2d的acc65i-sali之间克隆包含egfp基因的acc65i-xhoi片段,制作质粒#2e。进一步地,在质粒#2e的bsiwi-xhoi之间克隆包含嘌呤霉素抗性基因的acc65i-xhoi片段,制作质粒#2f。
将从质粒#1c由sapi切出的包含萤火虫萤光素酶基因和海肾萤光素酶基因的dna片段100ng、从质粒#2f由sapi切出的包含egpf基因和嘌呤霉素抗性基因的dna片段100ng、从质粒#5c由sapi切出的包含dkeima-red基因和潮霉素b抗性基因的dna片段100ng,共计300ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#6(150ng)和2μlbpclonase2,使之在25℃反应2小时,之后导入大肠杆菌dh-5α,分离卡那霉素抗性菌落,制作质粒#12。使用从质粒#12由xmai和noti切出的包含6个基因的dna片段的隐身型rna基因表达系统#6、#7、#8(图20)(实施例16)和#9、#10(图22)(实施例18)的制作根据实施例5、实施例6和实施例8所记载的方法进行。
实施例15:搭载5个外源基因的隐身型rna基因表达系统#11、#12、#13、#14、#15的制作(图18)
除了在实施例14的质粒#12所搭载的基因中去除萤火虫萤光素酶并且将嘌呤霉素抗性基因置换为源自质粒pbr322的四环素抗性基因(genbank登录号j01749.1)以外,搭载5个基因的质粒#13按照实施例14所记载的方法进行制作。
将这5个外源基因搭载于将hn、hc、hpols这3个基因按照hn-hpols-hc的顺序搭载的隐身型rna载体#3上(图16),制作搭载5个外源基因的隐身型rna基因表达系统#11。进一步地,在此隐身型rna基因表达系统的xmai部位插入包含密码子优化的rig-ic的基因盒(序列号83)、包含密码子优化的仙台病毒v蛋白的c末端区域的基因盒(序列号84)、包含密码子优化的蛋白酶体的构成成分psma7的基因盒(序列号85),制作搭载5个外源基因的隐身型rna基因表达系统#12、#13、#14。同时,搭载5个外源基因的隐身型rna基因表达系统#15是将hn-hpols-hc基因中的hpols基因的一部分置换成未优化的仙台病毒z株的p基因(序列号86),使v蛋白进行表达的基因表达系统。
由包含这些隐身型rna基因表达系统的细胞依照实施例8制作隐身型rna载体,导入源自人类的293细胞,测定干扰素诱导能力。就图19而言,与作为代表例的隐身型rna载体#11和#12进行比较,显示通过追加rig-ic基因,由隐身型rna载体残存的干扰素β的诱导几乎完全被抑制。
实施例16:n蛋白和c蛋白表达效率的变化对于搭载于隐身型rna基因表达系统上的外源基因的表达所产生的影响的解析(参见图20)
在pgl4.12(promega公司)(genbank登录号ay738224)所编码的萤火虫萤光素酶cdna的翻译起始密码子(aug)上游插入对应于序列号56、序列号57、序列号58的rna序列,使用cmv启动子使之在hela细胞中表达,使用双荧光素酶报告基因检测系统检测萤光素酶的活性(图20)。其结果可知,如果在原本的翻译起始密码子上游将其它起始密码子置入错误读码框,则与原本的蛋白质翻译序列错位,翻译效率降低。
接着,检测了将hnmrna和hcmrna的翻译起始密码子5ˊ上游侧的碱基序列进行改变的隐身型rna基因表达系统#6、#7、#8的基因表达能力。就隐身型rna基因表达系统#6而言,hnmrna和hcmrna的翻译起始密码子(aug)5ˊ上游侧是被认为是翻译效率最高的所谓“kozak序列(序列号57)”。就隐身型rna基因表达系统#7而言,hnmrna的翻译起始密码子5ˊ上游侧被置换为“kozak序列(序列号57)”(非专利文献60)、hcmrna的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至23%的序列号59的碱基序列。同时,就隐身型rna基因表达系统#8而言,hnmrna的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至40%的序列号58的碱基序列、hcmrna的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至23%的序列号59的碱基序列。就此实验而言,在稳定地保有隐身型rna基因表达系统#6、#7、#8的bhk/t7/151m(se)细胞中,使用双荧光素酶报告基因检测系统检测萤光素酶的活性(图20)。
实施例17:搭载5个外源基因的隐身型rna基因表达系统#16、#17的制作(图21)
将hn、hc、hpols这3个基因按照hn-hpols-hc的顺序进行搭载,搭载5个外源基因的隐身型rna基因表达系统#11记载于实施例15。此载体的hc基因改变了5ˊ侧非翻译区域的序列,翻译效率降低至23%(图21)。隐身型rna基因表达系统#16是从#11去除hc基因的基因表达系统。隐身型rna基因表达系统#17是将#11的hc基因的5ˊ非翻译序列变为kozak序列,翻译效率成为100%的基因表达系统。
由图21所示的egfp表达可知,隐身型rna基因表达系统的基因表达水平可通过改变hc基因的翻译效率进行调节。另外,hc基因不是隐身型rna基因表达系统重构所必需的要素,然而,如果没有hc基因,则外源基因表达变为非常强,因此,细胞增殖受到抑制。因此,通过使hc基因表达为某种水平,可得到实用性水平的基因表达,这是现实性的。
实施例18:位于隐身型rna基因表达系统的基因组3ˊ侧的包装信号对于载体颗粒产生所施加的影响的解析(参见图22)
隐身型rna基因表达系统#9是从隐身型rna基因表达系统#6(图20)删除基因组rna3ˊ侧的序列d(序列号17)的基因表达系统。同时,隐身型rna基因表达系统#10是从隐身型rna基因表达系统#7(图20)删除基因组rna3ˊ侧的序列d(序列号17)的基因表达系统。在稳定地保有这些隐身型rna基因表达系统的bhk/t7/151m(se)细胞中,按照实施例5所记载的方法表达m、f、hn的各蛋白质,从上清液回收的隐身型rna载体的基因导入能力经由使用llcmk2细胞的抗np蛋白抗体通过间接荧光抗体法进行检测(非专利文献7)。
进一步地,试图从列举于表1中的源自管家基因的mrna的部分序列进行任意选择,对这18个碱基序列进行置换(图2的(5)(序列号75)),确认颗粒化效率没有变化(数据未显示)。
由此可知,可以认为从基因组3ˊ末端起第97~114个碱基的18个碱基长度或其一部分长度的区域对于负单链rna中用于颗粒化的包装是必需的。无论如何,该位置的18个碱基长度或其一部分长度的区域对于以负单链rna作为模板的转录和复制不是必需的,然而,可以说,隐身型rna基因表达系统是为了摄入病毒样颗粒所必需的“包装信号区域”。
实施例19:将保有隐身型rna基因表达系统的hela细胞使用sirna处理时的萤光素酶活性的经时变化(参见图23)
从隐身型rna基因表达系统#6(图20)制作隐身型rna载体#6,将基因导入hela细胞,通过潮霉素b进行选择,建立hela/#3细胞株。将hela/#3细胞按照1.0×104/孔接种于48孔板,第二天,将以poll基因的靶序列(序列号46)作为靶标的sirna与导入试剂rnaimax(lifetechnologies,inc.)混合后导入,使最终浓度为100nm。萤光素酶活性经时测定的结果,4次独立实施的实验的每一次都表明萤光素酶的活性10天被抑制至约0.1%,隐身型rna基因表达系统被高效率地从细胞去除。
实施例20:搭载大基因的隐身型rna载体的制作(参见图24)
搭载各种外源基因的隐身型rna载体的制作可与实施例1~实施例2同样地各由2个基因制造“转录盒”,与实施例3~实施例5同样地依次连接“转录盒”,按照与实施例6或实施例7以及实施例8同样的方法进行制作。可作为如此大的外源基因搭载的外源基因的名称及其碱基序列如下。人类klf4:序列号60;人类oct4:序列号61;人类sox2:序列号62;人类c-myc:序列号63;人类brg1:序列号64;人类baf155:序列号65;人类免疫球蛋白g的h链:序列号66;人类免疫球蛋白g的l链:序列号67;人类免疫球蛋白m克隆2g9的h链:序列号68;人类免疫球蛋白m克隆2g9的l链:序列号69;人类免疫球蛋白m的j链:序列号70;人类血液凝固因子viii:序列号71;人类肌养蛋白:序列号72。
将这些基因作为外源基因搭载的rna表达系统可按照基于上述各实施例所记载的步骤的方法导入目标细胞。并且,通过在同一细胞中同时表达多个外源基因,使得对于细胞重编程等导入细胞而言加入所期望的变更成为可能。
实施例21:通过搭载6个初始化基因的隐身型rna载体的诱导多能干细胞(ips细胞)的诱导(图25)
可以认为,可搭载6个以上基因并确实地表达的所谓隐身型rna载体的特征是,对所谓将人类的体细胞进行初始化并转换成ips细胞的细胞重编程是特别有效的。因此,向作为用于制作人类诱导多能干细胞的方法最初被报告的klf4、oct4、sox2、c-myc的4个初始化基因的组合(专利文献1、非专利文献1)中,追加具有补全性功能的初始化基因nanog和lin28(专利文献2、非专利文献2),制作同时表达合计6个初始化基因的隐身型rna载体,在与迄今为止被报告的ips细胞的制作技术中初始化效率最高的“同时搭载4个初始化基因(klf4、oct4、sox2、c-myc)的持续表达型仙台病毒载体”(专利文献3、专利文献4、非专利文献7)(图25a)之间,对细胞的初始化活性进行比较。
搭载6个初始化基因的隐身型rna载体#23(图25b)是使用实施例14所示的方法依次结合人类klf4(序列号60)、人类oct4(序列号61)、人类sox2(序列号62)、人类c-myc(序列号63)、人类nanog(序列号87)、人类lin28(序列号88),组装至图16的隐身型rna载体#3,按照实施例6和实施例8进行制作。
ips细胞的制作按照专利文献3进行。具体而言,将作为源自人类胎儿成纤维细胞的tig3细胞以1.0×105细胞/孔接种于12孔板,第二天,将搭载klf4、oct4、sox2、c-myc的持续表达用仙台病毒载体(图25a)以及搭载klf4、oct4、sox2、c-myc、nanog、lin28的隐身型rna载体(图25b)分别以感染复数(moi)=3的条件加入培养基中,通过在室温放置2小时后在37℃培养一夜进行感染。将经丝裂霉素c处理的mef作为饲养细胞,在涂覆明胶的培养皿上进行准备,将上述载体感染细胞在其上接种,在诱导多能干细胞用培养基stemfitak03(ajinomoto,co.,inc.)中进行培养。在基因导入后第11天,使用alexafluor488标记抗tra-1-60抗原抗体(merck-millipore)进行染色,对从1×104个tig-3细胞中出现的tra-1-60阳性的ips细胞克隆数进行计数(图25c)。其结果是,由搭载4因子载体出现的ips细胞为85个克隆(初始化效率0.85%),与之相对,同时搭载6因子载体出现4290个克隆(初始化效率42.9%)的ips细胞克隆,显示同时搭载6个基因的隐身型rna载体的有效性。另外,此实施例所使用的基因的合计碱基长度为7.0kb,是使用现有的rna载体的方法不可能实现的大小。
实施例22:通过同时表达人类免疫球蛋白m(igm)的h链、l链、j链的免疫球蛋白m的产生(图26)
在生物医药品制造的技术领域中,作为必须使多个多肽同时表达的代表性制品有抗体医药品。可以表达h链和l链并制造的免疫球蛋白g(igg)的商业生产技术已经被确立,然而,必须使编码h链、l链、j链的3个基因同时表达的igm的制造迄今为止仍然是不容易的(非专利文献84)。已知在igm中存在具有igg所没有的强抗肿瘤活性的抗体(非专利文献85),igm的制造法的确立具有产业上的重大意义。因此,尝试通过将编码人igm的h链、l链、j链的3个基因搭载于隐身型rna载体上并使之同时表达,制造了分子量为950k道尔顿的igm。
就实施例22而言,选择与人类免疫缺陷病毒(hiv)感染细胞发生反应的人类单克隆igm抗体9f11和2g9(非专利文献86)作为材料,将9f11抗体的h链基因(序列号89)和l链基因(序列号90)、j链基因(序列号70)、潮霉素b抗性基因(序列号50)、或者2g9抗体的h链基因(序列号68)和l链基因(序列号69)、j链基因(序列号70)、潮霉素b抗性基因(序列号50)依照实施例12按照上述顺序进行连接,搭载于图20的隐身型rna载体#8上,得到隐身型rna载体#23和#20。接着,以moi=3的条件对在蛋白质制造用的无血清培养基opti-prosfm(lifetechnologies,inc.)中驯化的源自仓鼠的bhk细胞进行基因导入,通过添加100μg/ml潮霉素b进行选择。更换新培养基后,在24小时回收,回收该培养上清液。
将培养上清液中的人igm的量使用抗人igmelisa试剂盒(bethyllaboratories,inc.)进行定量,在导入2g9的基因组的情况下,检测出9.17μg/mligm;在导入9f11的基因组的情况下,检测出11.15μg/mligm。未导入基因的bhk细胞的培养上清液中的igm在检测限以下。如果将上述量以每个细胞每天的表达效率(pg/细胞/天)进行换算,则2g9为16.38pg/细胞/天、9f11为19.91pg/细胞/天(图26)。
接着,将包含300ng和100ngigm的培养上清液使用4~20%梯度凝胶(bio-rad)通过sds聚丙烯酰胺电泳进行解析,使用生物安全考马斯亮蓝g250染剂(biosafecoomasieg250stain)(bio-rad)进行染色。其结果是,非还原状态在与天然的人igm相同的970k道尔顿的位置检测到条带,同时,还原状态在分子量75k道尔顿的h链和25k道尔顿的l链的位置检测到条带,表明得到与天然相同的21条多肽结合的igm分子。
在非专利文献84中,记载了使用cho-dg44细胞和hek293细胞通过甲氨蝶呤进行基因扩增的结果得到的igm稳定表达细胞4个克隆的解析结果,然而,表达效率为25.00、3.59、4.60、0.21pg/细胞/天。由此表明,如果使用隐身型rna载体,可容易地实现与通过需要数月的基因扩增而实现的igm的表达同等或较高水平的生产。
实施例23:通过同时表达4个cdna的人类双重特异性抗体的产生(图27)
可识别2个不同抗原的双重特异性抗体作为将迄今为止的抗体医药品的可能性大幅扩展的分子,在生物医药品技术领域中最近备受瞩目。双重特异性抗体是在识别抗原a的h链(a)和l链(a)以及识别抗原b的h链(b)和l链(b)构成的四聚体中导入突变使h链(a)和l链(b)或者h链(b)和l链(a)难以结合,且导入突变使得与h链(a)之间或h链(b)之间的结合相比,h链(a)与h链(b)的结合变强,在此基础上,使编码h链(a)、l链(a)、h链(b)、l链(b)的4个基因同时表达而进行制作(非专利文献87)。将这样的4个基因同时导入细胞后,基因扩增,得到同时高表达4个多肽的细胞株是极为困难的,因此,通常通过瞬时基因表达进行生产。就本实施例而言,在非专利文献87所记载的双重特异性抗体中,尝试制作同时识别her2和上皮细胞增殖因子受体(egfr)的hedesignlk。
将非专利文献87公开的抗her2抗体的h链hc1(vhvrd1ch1crd2)基因(序列号91)和l链lc1(vlvrd1cλcrd2)基因(序列号92)以及抗egfr抗体的h链hc2(vhvrd2ch1wt)基因(序列号93)和l链lc2(vlvrd2cκwt)基因(序列号94)与egfp基因和潮霉素b抗性基因一起,按照实施例14进行连接,搭载于隐身型rna载体#8上(图20),制作隐身型rna载体#24。同时,为了比较,将仅表达抗her2抗体的h链和l链的载体#25(图27b)以及仅表达抗egfr抗体的h链和l链的载体#26(图27c)按照实施例12进行制作。
使用这些载体,按照实施例22的方法向经opti-prosfm(lifetechnologies,inc.)驯化的源自仓鼠的bhk细胞中导入基因,将稳定表达细胞的培养上清液中的人igg的量使用抗人iggelisa试剂盒(bethyllaboratories,inc.)进行定量。其结果是,与制作四聚体的活性低的仅有hc1和lc1的组合(12.93pg/细胞/天)、或hc2和lc2的组合(14.02pg/细胞/天)相比,在同时搭载hc1、lc1、hc2、lc2这4个基因的情况下,观察到显著高(37.45pg/细胞/天)的抗体产生,暗示双重特异性抗体被高效率地产生。同时,此表达水平与使用基因扩增在cho细胞中建立的一般性的细胞株的基因表达水平(最大约为90pg/细胞/天)(非专利文献88)是可比的。由此暗示,作为用于可以将通过现有方法难以得到稳定表达细胞株的双重特异性抗体稳定地产生的方法,隐身型rna载体是非常有效的。另外,此实施例中使用的基因的合计碱基长度为6.7k个碱基,是使用现有的rna载体的方法不能实现的大小。
工业实用性
本发明是在包含诱导多能干细胞(ips细胞)的制作在内的人类细胞重编程、蛋白质医药品的制造、使用包含巨大基因的各种基因的基因治疗、药物研发靶标分子的表达等众多产业领域中有用的技术。
序列表
<110>国立研究开发法人产业技术综合研究所
常磐-生物株式会社
<120>使用具有隐身性的rna的基因表达系统以及包含该rna的基因导入、表达载体
<130>sju5167979wo
<150>jp2015-007288
<151>2015-01-16
<160>94
<170>patentinversion3.5
<210>1
<211>10
<212>rna
<213>人工序列
<220>
<223>仙台病毒转录起始信号,负链序列
<400>1
cuuucacccu10
<210>2
<211>10
<212>rna
<213>人工序列
<220>
<223>仙台病毒转录起始信号,负链序列
<400>2
cuuuaucccu10
<210>3
<211>10
<212>rna
<213>人工序列
<220>
<223>仙台病毒转录起始信号,负链序列
<400>3
cauucacccu10
<210>4
<211>10
<212>rna
<213>人工序列
<220>
<223>仙台病毒转录终止信号,负链序列
<400>4
uuuuucuuaa10
<210>5
<211>10
<212>rna
<213>人工序列
<220>
<223>仙台病毒转录终止信号,负链序列
<400>5
uuuuucuuac10
<210>6
<211>10
<212>rna
<213>人工序列
<220>
<223>仙台病毒转录终止信号,负链序列
<400>6
uuuuucuuau10
<210>7
<211>10
<212>rna
<213>人工序列
<220>
<223>人类副流感病毒iii转录起始信号,负链序列
<400>7
cuuuaauccu10
<210>8
<211>11
<212>rna
<213>人工序列
<220>
<223>人类副流感病毒iii转录终止信号
<400>8
uuuuucuuauu11
<210>9
<211>11
<212>rna
<213>人工序列
<220>
<223>新城疫病毒转录起始信号,负链序列
<400>9
cuucuacccgu11
<210>10
<211>10
<212>rna
<213>人工序列
<220>
<223>新城疫病毒转录终止信号,负链序列
<400>10
uuuuuucuaa10
<210>11
<211>12
<212>rna
<213>人工序列
<220>
<223>仙台病毒基因组rna3'末端复制起点,负链序列
<400>11
cucuugucuggu12
<210>12
<211>12
<212>rna
<213>人工序列
<220>
<223>仙台病毒基因组rna3'末端复制起点,负链序列
<400>12
cucuuguuuggu12
<210>13
<211>12
<212>rna
<213>人工序列
<220>
<223>仙台病毒基因组rna5'末端复制起点,负链序列
<400>13
accagacaagag12
<210>14
<211>12
<212>rna
<213>人工序列
<220>
<223>仙台病毒基因组rna5'末端复制起点,负链序列
<400>14
accaaacaagag12
<210>15
<211>18
<212>rna
<213>人工序列
<220>
<223>仙台病毒(cnnnnn)3-盒,负链序列
<220>
<221>misc_feature
<222>(1)..(5)
<223>n为a、c、g或u
<220>
<221>misc_feature
<222>(7)..(11)
<223>n为a、c、g或u
<220>
<221>misc_feature
<222>(13)..(17)
<223>n为a、c、g或u
<400>15
nnnnncnnnnncnnnnnc18
<210>16
<211>18
<212>rna
<213>人工序列
<220>
<223>仙台病毒(nnnnng)3-盒,负链序列
<220>
<221>misc_feature
<222>(2)..(6)
<223>n为a、c、g或u
<220>
<221>misc_feature
<222>(8)..(12)
<223>n为a、c、g或u
<220>
<221>misc_feature
<222>(14)..(18)
<223>n为a、c、g或u
<400>16
gnnnnngnnnnngnnnnn18
<210>17
<211>18
<212>rna
<213>人工序列
<220>
<223>仙台病毒包装信号,负链序列
<400>17
acuuuggcagcaaagaaa18
<210>18
<211>5
<212>rna
<213>人工序列
<220>
<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400>18
ccacc5
<210>19
<211>27
<212>dna
<213>人工序列
<220>
<223>源自人类真核翻译延长因子1α-1的非编码序列
<400>19
acgaggcctcagtttgtctacttggtc27
<210>20
<211>24
<212>dna
<213>人工序列
<220>
<223>源自人类羟甲基胆素合酶的非编码序列
<400>20
cctcagtgccccattctcactgct24
<210>21
<211>30
<212>dna
<213>人工序列
<220>
<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400>21
ggagccgcaccttgtcatgtaccatcaata30
<210>22
<211>15
<212>dna
<213>人工序列
<220>
<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400>22
tctcccctcctcaca15
<210>23
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类线粒体核糖体蛋白l32的非编码序列
<400>23
taatagcccacttactcctgaatctttaa29
<210>24
<211>30
<212>dna
<213>人工序列
<220>
<223>源自人类β-肌动蛋白的非编码序列
<400>24
cgttacaccctttcttgacaaaacctaact30
<210>25
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类β-肌动蛋白的非编码序列
<400>25
cttcccccttttttgtcccccaacttgag29
<210>26
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类磷酸甘油酸激酶1的非编码序列
<400>26
cgacctctctccccagctgtatttccaaa29
<210>27
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类磷酸甘油酸激酶1的非编码序列
<400>27
aggctctgttccacatatatttccacttc29
<210>28
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类肽基脯氨酰异构酶a的非编码序列
<400>28
accgccgaggaaaaccgtgtactattagc29
<210>29
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类肽基脯氨酰异构酶a的非编码序列
<400>29
gtttgacttgtgttttatcttaaccacca29
<210>30
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类微管蛋白α-1b的非编码序列
<400>30
tgtctgctcctgtcgccttcgcctcctaa29
<210>31
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类微管蛋白β-1的非编码序列
<400>31
agcactgccatctcttccagcaccatcag29
<210>32
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类转铁蛋白受体的非编码序列
<400>32
cccaactcctataattccctatcttttag29
<210>33
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类真核翻译延长因子2的非编码序列
<400>33
gatgtccaaactaattttaacaaacgcat29
<210>34
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类泛素c的非编码序列
<400>34
gtatcagcagaaggacattttaggacggg29
<210>35
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类转铁蛋白受体的非编码序列
<400>35
gagttacttcctatcaagccagtacgtgc29
<210>36
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类tata盒结合蛋白的非编码序列
<400>36
ctaggaaaaaattgaatagtgagacgagt29
<210>37
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类核纤层蛋白b2的非编码序列
<400>37
cagaaccccccaccctacatttgccttgg29
<210>38
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类α-肌动蛋白,心肌1的非编码序列
<400>38
cgccgacgaaccccctgaagctgtgccaa29
<210>39
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类α-肌动蛋白,心肌1的非编码序列
<400>39
gatgccttctctctccatctaccttccag29
<210>40
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类微管蛋白β-1的非编码序列
<400>40
gacaggcagaaagcagagaagggccagga29
<210>41
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类微管蛋白β-1的非编码序列
<400>41
caccccccaaaatgctctgcagcctctct29
<210>42
<211>29
<212>dna
<213>人工序列
<220>
<223>源自人类1-酰基甘油-3-磷酸o-酰基转移酶1的非编码序列
<400>42
ccaacctcccactcccacctcccctccat29
<210>43
<211>21
<212>dna
<213>人工序列
<220>
<223>源自人类1-酰基甘油-3-磷酸o-酰基转移酶1的非编码序列
<400>43
ccactcttgacccccacctcc21
<210>44
<211>13
<212>dna
<213>人工序列
<220>
<223>源自人类微管蛋白α-1b的非编码序列
<400>44
taaagctttctgg13
<210>45
<211>46
<212>dna
<213>人工序列
<220>
<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400>45
agccgcaccttgtcatgtaccatcaataaagtaccctgtgctcaac46
<210>46
<211>19
<212>rna
<213>人工序列
<220>
<223>用于hpoll抑制的sirna靶序列
<400>46
gggacagaugagauuucuu19
<210>47
<211>600
<212>dna
<213>人工序列
<220>
<223>密码子优化的嘌呤霉素抗性基因
<400>47
atgaccgagtacaagcctaccgtgcggctggccacaagggatgacgtgcctcgggccgtg60
aggaccctggccgccgctttcgccgactaccccgccacaagacacaccgtggacccagac120
agacacatcgagagggtgaccgagctgcaggagctgttcctgaccagagtgggcctggac180
atcggaaaggtgtgggtggccgacgacggcgccgccgtggctgtgtggacaacccccgag240
tccgtggaggccggcgctgtgttcgctgagatcggacctcggatggccgagctgagcgga300
agcagactggccgcccagcagcagatggagggcctgctggctcctcacagacctaaggag360
ccagcttggttcctggctaccgtgggcgtgtcccctgatcaccagggcaagggcctgggc420
agcgccgtggtgctgcctggagtggaggccgccgagcgcgccggagtgcctgcttttctg480
gagaccagcgcccctcgcaacctgccattctatgagagactgggcttcaccgtgacagct540
gacgtggaggtgcctgagggccccagaacatggtgtatgacccggaagcctggcgcctga600
<210>48
<211>678
<212>dna
<213>人工序列
<220>
<223>e2-crimson荧光蛋白基因
<400>48
atggatagcactgagaacgtcatcaagcccttcatgcgcttcaaggtgcacatggagggc60
tccgtgaacggccacgagttcgagatcgagggcgtgggcgagggcaagccctacgagggc120
acccagaccgccaagctgcaagtgaccaagggcggccccctgcccttcgcctgggacatc180
ctgtccccccagttcttctacggctccaaggcgtacatcaagcaccccgccgacatcccc240
gactacctcaagcagtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgag300
gacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcaccctcatctac360
cacgtgaagttcatcggcgtgaacttcccctccgacggccccgtaatgcagaagaagact420
ctgggctgggagccctccactgagcgcaactacccccgcgacggcgtgctgaagggcgag480
aaccacatggcgctgaagctgaagggcggcggccactacctgtgtgagttcaagtccatc540
tacatggccaagaagcccgtgaagctgcccggctaccactacgtggactacaagctcgac600
atcacctcccacaacgaggactacaccgtggtggagcagtacgagcgcgccgaggcccgc660
caccacctgttccagtag678
<210>49
<211>375
<212>dna
<213>人工序列
<220>
<223>密码子优化的博来霉素抗性基因
<400>49
atggctaagctgaccagcgccgtgcccgtgctgacagcgagggacgtggctggagctgtg60
gagttctggacagacaggctgggcttcagcagggacttcgtggaggacgacttcgccggc120
gtggtgagggacgacgtgaccctgttcatcagcgccgtgcaggaccaggtggtgcccgac180
aacacactggcttgggtgtgggtgaggggactggatgagctgtatgctgagtggtctgag240
gtggtgagcaccaacttcagggatgcttctggacctgctatgacagagattggagagcag300
ccttggggaagagagtttgccctgagggaccctgctggaaactgcgtgcactttgtggct360
gaggagcaggactga375
<210>50
<211>1026
<212>dna
<213>人工序列
<220>
<223>密码子优化的潮霉素抗性基因
<400>50
atgaagaagcccgagctgaccgctaccagcgtggagaagttcctgatcgagaagttcgac60
agcgtgagcgacctgatgcagctgagcgagggcgaggagagcagggccttcagcttcgac120
gtgggcggcaggggctacgtgctgagggtgaacagctgcgccgacggcttctacaaggac180
agatacgtgtacagacactttgctagcgccgccctgcccatccctgaggtgctggacatt240
ggagagttcagcgagagcctgacctactgcatcagcaggagagctcagggagtgaccctg300
caggacctgcctgagacagagctgcctgccgtgctgcagcctgtggctgaggctatggat360
gctattgctgccgcagacctgagccagaccagcggatttggacccttcggccctcagggt420
atcggacagtacaccacctggagggacttcatctgcgccatcgccgacccccacgtgtac480
cactggcagaccgtgatggatgacaccgtgagcgcctctgtggctcaggccctggatgag540
ctgatgctgtgggctgaggactgccctgaggtgaggcacctggtgcacgccgacttcggc600
agcaacaacgtgctgaccgacaacggcaggatcaccgccgtgatcgactggagcgaggcc660
atgttcggcgacagccagtacgaggtggccaacatcttcttctggaggccctggctggcc720
tgcatggagcagcagaccaggtactttgagaggaggcaccctgagctggctggaagccca780
aggctgagggcttacatgctgaggattggactggaccagctgtaccagagcctggtggac840
ggcaacttcgacgatgctgcttgggctcagggaaggtgcgatgctatcgtgaggagcgga900
gctggcaccgtgggaaggacccagattgctaggaggagcgccgccgtgtggacagatgga960
tgcgtggaggtgctggctgactctggaaaccgtaggcctagcacccgaccaagagctaag1020
gagtga1026
<210>51
<211>25
<212>dna
<213>人工序列
<220>
<223>重组序列attb1
<400>51
acaagtttgtacaaaaaagcaggct25
<210>52
<211>25
<212>dna
<213>人工序列
<220>
<223>重组序列attb2
<400>52
acccagctttcttgtacaaagtggt25
<210>53
<211>4212
<212>dna
<213>人工序列
<220>
<223>包含hn基因、hc基因和hpols基因的dna片段
<400>53
accagacaagagtttaagagatatgtatccttttaaattttcttaagaaaaacttagggt60
gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120
tggctggcctgctgtcaaccttcgataccttttcaagtaggaggagcgagtcaatcaaca180
aatctgggggcggagctgtcatccctggacagcggtccaccgtgtctgtcttcgtgctgg240
gcccctctgtgacagacgatgccgacaagctgttcatcgccaccacatttctggctcaca300
gtctggacacagataaacagcattcacagagaggcgggtttctggtgagcctgctggcta360
tggcatacagctccccagaactgtatctgactaccaacggagtgaatgccgacgtgaagt420
acgtgatctataacattgagaaggaccccaaaaggactaagaccgatggcttcatcgtga480
agacacgggatatggaatacgagagaacaactgagtggctgttcgggcctatggtgaaca540
agagcccactgtttcagggacagcgagacgcagctgaccccgataccctgctgcaaatct600
acggctatcctgcctgcctgggggctatcattgtccaagtgtggatcgtcctggtgaaag660
caattacctctagtgccggcctgcggaaggggttctttaaccgcctggaggctttccgac720
aggatggaacagtgaagggcgcactggtctttaccggcgaaacagtggagggaatcggct780
ctgtcatgagaagtcagcagtcactggtcagcctgatggtggaaactctggtcaccatga840
acacagccagaagtgacctgaccacactggagaaaaacatccagattgtggggaattaca900
tcagggatgccggcctggccagcttcatgaataccatcaagtatggggtggaaacaaaga960
tggcagccctgactctgtccaacctgagacccgacatcaacaagctgcggagcctgattg1020
atacctacctgtctaagggccccagggcccctttcatctgtattctgaaagacccagtgc1080
acggggagtttgctccaggaaactaccccgcactgtggtcctatgcaatgggcgtggccg1140
tggtccagaataaggccatgcagcagtacgtcactggccgcacctatctggacatggaaa1200
tgtttctgctggggcaggccgtggctaaagatgccgagagcaagatcagcagcgccctgg1260
aggacgagctgggagtcacagatactgccaaggggcgactgcggcaccatctggcaaacc1320
tgtccggaggcgacggagcatatcacaaacctacagggggaggcgctatcgaagtggcac1380
tggataatgccgacattgatctggagactaaggcacatgcagaccaggatgctcgcggat1440
ggggaggagattccggcgaaagatgggccaggcaggtgtctggcgggcactttgtcactc1500
tgcatggcgctgagcgactggaggaagagaccaatgacgaagatgtgagtgacatcgagc1560
ggagaattgctatgcgactggcagaaaggcgccaggaggactcagccacccatggggatg1620
agggacggaacaatggagtggaccatgacgaagatgatgacgccgccgcagtcgcaggca1680
ttggaggaatttgaggatctacgaggcctcagtttgtctacttggtcttaagaaaaactt1740
agggtgaaagcctcagtgccccattctcactgctactagaggagcccaccatgcccagct1800
ttctgaagaagattctgaaactgagaggacgaagacaggaagatgagtctcgaagtcgga1860
tgctgtccgacagctccatgctgtcttgcagggtgaaccagctgactagcgagggaaccg1920
aagctggctcaaccacacccagcacactgcctaaagaccaggccctgctgatcgagccaa1980
aggtccgggctaaggaaaaatcccagcaccggagacccaagatcattgatcaggtgaggc2040
gcgtcgagagtctgggggaacaggcatcacagcggcagaaacatatgctggagaccctga2100
tcaacaaaatctacacaggccctctgggggaggaactggtgcagactctgtatctgagaa2160
tctgggccatggaggaaaccccagagtctctgaaaatcctgcagatgcgcgaagacattc2220
gagatcaggtcctgaagatgaaaacagagagatggctgaggactctgattaggggcgaaa2280
agaccaaactgaaggatttccagaagcggtacgaggaagtgcacccctatctgatgaaag2340
agaaggtggaacaggtcatcatggaagaggcttggtcactggcagctcatattgtgcagg2400
agtaatgactcgacggagccgcaccttgtcatgtaccatcaatattaagaaaaacttagg2460
gtgaaagtctcccctcctcacacctagagccgccaccatggaccaggacgcttttattct2520
gaaggaggattctgaagtggaacgggaggcaccagggggaagggagagtctgagtgatgt2580
cattggcttcctggacgccgtgctgagctccgagccaacagatatcggaggggaccggag2640
ctggctgcacaacactattaataccccccaggggcctggaagtgcacatagagccaagtc2700
agagggcgaaggggaggtgtcaacacccagcactcaggataacaggtctggggaggaatc2760
cagagtctctggaaggaccagtaagcctgaagcagaggcccacgctggcaacctggacaa2820
acagaatatccatcgagcttttggaggccggaccgggacaaactctgtgagtcaggacct2880
gggagatgggggagactctggcatcctggaaaacccccctaatgagcgcggctaccctcg2940
atccgggattgaagatgagaatagggagatggccgctcacccagataagcgaggagaaga3000
ccaggcagagggactgcctgaggaagtgcggggctcaaccagcctgccagacgaaggaga3060
gggaggagcctccaacaatggccggtctatggaacctgggtctagtcattccgctagagt3120
gacaggcgtgctggtcattccttctccagagctggaggaagcagtcctgcggagaaacaa3180
gaggcgcccaaccaattccggatctaaaccactgaccccagcaacagtgcccggcacacg3240
gagcccacccctgaacagatataatagtaccgggtcacctccaggaaagcccccttctac3300
acaggatgagcacatcaacagtggggacactccagctgtgcgggtcaaggatagaaaacc3360
acccattggaactcggagcgtgagcgactgcccagcaaacggaagacctatccaccccgg3420
cctggagactgattccaccaagaaaggaattggcgaaaatacctcaagcatgaaggagat3480
ggccacactgctgactagcctgggcgtgatccagtccgcacaggaattcgagagcagccg3540
ggacgccagttacgtctttgctcgacgggcactgaaatcagccaactatgctgagatgac3600
cttcaacgtgtgcggcctgattctgagcgccgaaaagagttcagctagaaaagtggatga3660
gaataagcagctgctgaaacagatccaggaaagcgtcgagtccttcagagacatctacaa3720
gaggttttcagaatatcagaaagagcagaacagcctgctgatgtctaatctgagtacact3780
gcacatcattactgataggggaggcaagaccgataacacagacagcctgacacgcagccc3840
ttccgtgttcgctaagtccaaagagaataagactaaagcaacccgctttgacccctccat3900
ggaaactctggaggatatgaagtacaaacctgacctgatccgggaagatgagtttaggga3960
cgaaattcgcaacccagtgtatcaggaacgcgatactgagccccgagcatcaaatgccag4020
cagactgctgccctccaaggagaaacctaccatgcattctctgaggctggtcatcgaaag4080
ctccccactgagccgcgctgagaaggtggcatacgtcaaatctctgagtaagtgcaaaac4140
cgaccaggaggtgaaggctgtgatggaactggtggaggaagacattgaatctctgacaaa4200
ctaaatcccggg4212
<210>54
<211>6884
<212>dna
<213>人工序列
<220>
<223>包含hpoll基因的dna片段
<400>54
gcggccgcttaagaaaaacttagggtgaatgtaaagctttctggccaccatggacgggca60
ggagtcatcccagaatccttccgatatcctgtatcccgaatgtcatctgaactcacctat120
tgtgcgaggcaaaatcgcccagctgcacgtgctgctggacgtgaaccagccatataggct180
gaaggacgattccatcattaatatcacaaagcataagattcgcaacggcgggctgtctcc240
cagacagatcaagatcaggagtctgggcaaggccctgcagagaactatcaaggatctgga300
caggtacacattcgagccttacccaacttattctcaggaactgctgcggctggacattcc360
agagatctgcgataaaatccggagcgtgttcgccgtcagtgaccggctgaccagagagct420
gagctccggcttccaggatctgtggctgaatatcttcaagcagctggggaacatcgaggg480
acgcgaaggctatgatccactgcaggacattggcacaatccccgagattactgacaaata540
ctcacgcaaccgatggtatcggcccttcctgacctggtttagcatcaaatacgacatgag600
gtggatgcagaagacccgccccggaggacctctggatacaagtaactcacacaatctgct660
ggagtgcaagagctacacactggtgacttatggagatctgattatgatcctgaacaagct720
gactctgaccggctacatcctgacccccgaactggtgctgatgtattgtgacgtggtcga780
gggaagatggaacatgagcgccgctggccatctggacaagaagtccattggcatcacaag840
caagggggaggaactgtgggaactggtggacagcctgttctctagtctgggagaggaaat900
ctataatgtcattgccctgctggagcctctgagcctggctctgattcagctgaacgatcc960
agtgatccccctgcgcggcgcattcatgcgacacgtcctgaccgagctgcaggccgtgct1020
gacctccagggatgtctacacagacgcagaggccgatactatcgtggaatccctgctggc1080
tatctttcatgggacatctattgacgagaaggcagaaatcttcagtttctttaggacctt1140
tggacacccctcactggaggccgtgacagcagccgataaagtccgcgctcatatgtacgc1200
acagaaggccatcaaactgaagactctgtatgaatgccacgccgtgttctgtaccatcat1260
tatcaatggctaccgggagagacacggaggacagtggccaccttgcgattttcctgacca1320
cgtgtgcctggaactgcgcaacgctcaggggtccaatactgcaatctcttacgagtgtgc1380
cgtggacaactataccagcttcattggattcaaatttcgcaagtttatcgagccacagct1440
ggatgaagacctgaccatctacatgaaagataaggcactgagcccccggaaggaagcctg1500
ggacagcgtgtaccctgattcaaatctgtactataaagccccagagagcgaggaaacacg1560
gagactgatcgaggtgttcattaatgacgaaaactttaatcccgaggaaattatcaacta1620
cgtcgaaagcggggactggctgaaagatgagaagttcaacattagctattccctgaaaga1680
gaaggaaatcaagcaggaaggaagactgtttgccaaaatgacatacaagatgagggctgt1740
gcaggtcctggcagagactctgctggccaaaggaatcggcgagctgttctccgaaaacgg1800
gatggtgaaaggagagattgacctgctgaagaggctgaccacactgtctgtgagtggcgt1860
ccctcgcaccgatagcgtgtataacaattccaaatcaagcgagaagaggaatgaagggat1920
gaagaaaaagaactctggcgggtattgggacgagaaaaagaggagtcgccacgaattcaa1980
ggccacagactcctctactgatggctacgagactctgagctgctttctgactaccgatct2040
gaaaaagtattgtctgaattggcgcttcgaaagcaccgctctgtttgggcagcgatgcaa2100
tgagatcttcggcttcaagaccttcttcaactggatgcatcccgtgctggagagatgcac2160
catctacgtgggcgacccttattgtccagtcgccgataggatgcaccgccagctgcagga2220
tcatgctgacagcgggattttcatccacaaccctaggggaggcatcgagggatactgtca2280
gaagctgtggaccctgatttcaatcagcgcaattcatctggctgcagtgcgggtcggagt2340
gagagtcagtgccatggtgcagggcgacaatcaggctatcgcagtcacttcaagagtgcc2400
cgtcgcccagacctataagcagaaaaagaaccacgtgtataaggagattacaaagtattt2460
cggcgctctgaggcacgtgatgtttgatgtcgggcatgagctgaaactgaatgaaactat2520
catcagttcaaagatgttcgtgtactccaagagaatctactatgacggcaaaatcctgcc2580
acagtgcctgaaggcactgacacggtgcgtgttctggtctgagactctggtcgatgaaaa2640
cagatccgcctgctctaatatctccacttctattgccaaggctatcgagaacggctactc2700
ccccatcctggggtactgtattgccctgtataaaacctgccagcaggtgtgcatctcact2760
gggcatgaccattaatcccacaatcagccctactgtgcgagaccagtacttcaaagggaa2820
gaactggctgcgatgcgctgtgctgatcccagcaaacgtcgggggattcaattatatgag2880
tacctcaaggtgttttgtgcgcaacatcggggaccctgcagtcgccgctctggctgatct2940
gaagcgattcattcgggccgatctgctggacaaacaggtgctgtaccgcgtgatgaatca3000
ggagcctggagatagctcctttctggactgggcttctgatccctatagttgcaacctgcc3060
tcacagccagtccatcacaactattatcaagaatatcaccgcaaggtctgtgctgcaaga3120
aagtcccaaccctctgctgagcgggctgttcacagagacttccggagaggaagacctgaa3180
tctggcttcctttctgatggatcgaaaagtgatcctgccacgggtcgcacatgaaatcct3240
gggaaactctctgaccggcgtgcgggaggcaatcgcaggaatgctggacaccacaaagag3300
tctggtgagatctagtgtcaaaaagggcgggctgtcatacggcatcctgaggcgcctggt3360
gaattacgacctgctgcagtatgaaaccctgacaagaactctgaggaaacccgtgaagga3420
taacatcgagtacgaatatatgtgcagcgtggagctggcagtcggactgagacagaagat3480
gtggattcacctgacatacgggaggcctatccatggactggagactccagatcccctgga3540
actgctgaggggcaccttcatcgaggggtcagaagtgtgcaagctgtgccgcagcgaggg3600
agcagaccctatctacacctggttttatctgccagataatattgatctggacaccctgac3660
aaacggatgtcctgctattcgcatcccatacttcggctctgctacagacgagcgaagtga3720
agcacagctgggctatgtgcggaatctgagcaaacctgccaaggcagccattcggatcgc3780
tatggtgtatacctgggcatatgggacagatgagatttcttggatggaagctgcactgat3840
cgcacagacaagagccaacctgagtctggagaatctgaagctgctgactccagtgtctac3900
tagtaccaacctgtcccacaggctgaaagacacagccactcagatgaagttctcaagcgc3960
aactctggtgcgcgccagccggttcatcaccatcagcaacgacaatatggctctgaaaga4020
ggcaggagaatctaaggatacaaatctggtgtaccagcagatcatgctgactggcctgag4080
cctgttcgagtttaacatgcgctataaaaaggggtccctgggaaagcctctgatcctgca4140
cctgcatctgaacaatggctgctgtattatggagtccccacaggaagccaatatcccacc4200
ccggtctaccctggacctggagattacacaggaaaacaacaagctgatctatgatcctga4260
cccactgaaggatgtggacctggaactgttctccaaagtgcgggacgtggtccacaccgt4320
cgatatgacatactggagcgacgatgaagtgatcagagccacctccatttgcaccgccat4380
gacaatcgctgacacaatgagccagctggatcgggacaacctgaaggaaatgattgctct4440
ggtgaacgacgatgacgtgaatagcctgattaccgagttcatggtcatcgatgtcccact4500
gttctgttccacatttggaggcatcctggtgaatcagtttgcctactctctgtatggact4560
gaacattcgaggccgggaggaaatctggggccacgtggtccgcatcctgaaagacaccag4620
ccatgcagtgctgaaggtcctgtcaaatgccctgagccaccccaaaattttcaagcggtt4680
ttggaacgcaggagtggtcgagccagtgtacggacccaacctgagcaatcaggataagat4740
cctgctggccctgtcagtgtgcgaatatagcgtggacctgttcatgcacgattggcaggg4800
gggagtgcccctggagatcttcatctgtgataatgaccctgatgtcgctgacatgcgacg4860
gtcctctttcctggcacgccatctggcctacctgtgctccgtggcagaaatcagccggga4920
cggaccacgactggagagtatgaactcactggagaggctggaaagcctgaagtcctacct4980
ggagctgactttcctggatgaccccgtgctgcgctattctcagctgaccggcctggtcat5040
caaggtctttcctagtaccctgacatacatccggaaaagttcaattaaggtgctgagaac5100
cagggggattggagtgcccgaggtcctggaagactgggatcctgaagctgacaatgcact5160
gctggatggcattgccgctgagatccagcagaacattccactgggacaccagacacgcgc5220
cccattttggggactgcgagtgtcaaagagccaggtcctgcgcctgcgagggtacaaaga5280
gatcaccagaggcgaaattgggagaagcggcgtggggctgacactgccattcgacggccg5340
gtatctgtcccatcagctgagactgtttgggatcaattccacatcttgcctgaaggccct5400
ggaactgacttacctgctgtcccccctggtggacaaagataaggacagactgtacctggg5460
agagggcgctggggcaatgctgtcttgctatgacgctaccctgggcccttgtatcaacta5520
ctataattccggcgtgtactcttgtgatgtcaacgggcagagagagctgaatatctaccc5580
agccgaagtggctctggtcgggaaaaagctgaacaatgtgacctcactgggacagagggt5640
gaaggtcctgttcaacggaaatcccggcagcacatggattggaaacgacgagtgcgaagc5700
cctgatctggaacgagctgcagaatagctccattggcctggtgcactgtgacatggaagg5760
cggggatcataaggatgaccaggtggtcctgcacgagcattacagcgtgattaggatcgc5820
ctatctggtcggcgatcgcgacgtggtcctgatctccaaaattgctcctaggctggggac5880
tgactggacccgccagctgtctctgtacctgcgatattgggatgaagtgaatctgatcgt5940
cctgaagactagtaacccagcctcaaccgaaatgtacctgctgagtaggcaccccaaatc6000
agacattatcgaggattccaagaccgtgctggcttctctgctgccactgagcaaggagga6060
cagcatcaagatcgaaaagtggattctgatcgagaaagccaaggctcacgaatgggtgac6120
cagagagctgagagaagggtctagttcaagcggaatgctgcggccttaccatcaggccct6180
gcagacattcggctttgagccaaacctgtataagctgagcagagacttcctgtccacaat6240
gaacattgctgatactcataattgcatgatcgcattcaacagggtgctgaaggacaccat6300
ttttgagtgggcccggatcacagaatccgataaaagactgaagctgacaggaaaatacga6360
cctgtatcctgtgcgcgattctggcaaactgaagactgtgagtagaaggctggtcctgtc6420
atggatcagtctgtcaatgagcactcggctggtgaccgggagtttcccagaccagaagtt6480
tgaagccagactgcagctgggaatcgtgtctctgtcctctagggagattcgcaatctgcg6540
agtcatcactaaaaccctgctggaccgcttcgaagatattatccacagcatcacttaccg6600
atttctgaccaaagagattaagatcctgatgaaaattctgggagccgtgaagatgtttgg6660
cgctcggcagaacgagtacaccactgtgattgacgacggcagcctgggcgacattgaacc6720
ttacgattcctcctaaaccggtagccgcaccttgtcatgtaccatcaataaagtaccctg6780
tgctcaacgaagtcttggactgatccatatgacaatagtaagaaaaacttacaagaagac6840
aagaaaatttaaaagaatacatatctcttaaactcttgtctggt6884
<210>55
<211>1575
<212>dna
<213>人工序列
<220>
<223>用于在大肠杆菌中表达的密码子优化的n基因
<400>55
atggcaggtttactcagcacgttcgacacttttagcagcagacgcagcgagagcatcaac60
aaatccggtggtggcgcggtgatccctggtcagcgctctaccgtgagcgtgtttattctg120
ggcccgtctgtcaccgatgatgccgataagctgttcattgccaccacctttctggcccac180
agcctggacacggacaaacagcactctcaacgtggcggtttcctggtttcgttgctggcg240
atggcgtatagcagcccggagctgtacttgaccaccaacggcgtgaacgcggatgtgaag300
tatgtgatttacaacatcgagaaagatccgaagcgtacgaaaaccgacggttttatcgtt360
aagacccgcgatatggaatacgagcgtaccacggagtggctgttcggtccgatggtcaat420
aagagcccgctgttccaaggccagcgcgacgcagcggacccggacaccctgctgcagatc480
tatggctaccctgcgtgtctgggcgcgatcattgttcaagtatggatcgttctggtcaag540
gcgattaccagcagcgcaggtctgcgtaagggctttttcaatcgcctggaggcgttccgt600
caggatggcaccgtgaaaggtgcactggtttttaccggtgaaaccgtcgaaggtattggc660
tctgttatgcgttcccagcagagcttggtcagcctgatggttgagactctggttacgatg720
aatactgcccgcagcgatctgacgaccctggagaaaaacattcaaattgtcggcaactac780
atccgtgatgcgggtctggcatccttcatgaatacgatcaaatatggcgtggaaacgaag840
atggcggccttgaccctgtccaatctgcgtccggacattaacaaattgcgtagcctgatt900
gacacgtacctgagcaaaggtccgcgtgccccgttcatctgcattctgaaagatccagtt960
cacggtgagttcgcaccgggtaactatccggccctgtggagctatgcaatgggcgtggct1020
gtcgtccagaacaagagcatgcagcagtacgttacgggtcgtacctacctggatatggag1080
atgtttctgctgggtcaagcagttgcaaaagacgcggagtccaaaatcagcagcgccctg1140
gaggacgagttgggtgtcaccgacaccgcgaaggaacgtctgcgtcatcatctggctaat1200
ctgagcggtggtgatggcgcgtaccacaagccgacgggtggtggtgctatcgaagttgcg1260
ctggataatgcggacatcgatttggaaactgaagcacacgcggatcaagacgcgcgtggc1320
tggggtggtgatagcggcgaacgctgggcgcgtcaagtgtcgggcggtcactttgtgacc1380
ctgcatggtgcggagcgtctggaagaagaaaccaatgatgaggacgttagcgatattgag1440
cgccgtattgctatgcgcctggcggaacgtcgtcaagaggacagcgctacgcacggtgac1500
gagggccgcaacaatggcgtcgaccatgaagaggacgacgacgctgcagccgcagcgggt1560
attggtggcatctaa1575
<210>56
<211>423
<212>dna
<213>人工序列
<220>
<223>杀稻瘟菌素s抗性基因
<400>56
atgaagaccttcaatattagccagcaggacctggagctggtggaggtggccaccgagaaa60
atcaccatgctgtacgaggacaataagcaccacgtgggggccgccattcgcaccaagaca120
ggcgagatcatcagcgccgtgcacatcgaggcctacatcggccgggtgaccgtgtgcgcc180
gaggccatcgccatcggctccgccgtgtccaacggccagaaggattttgataccattgtg240
gccgtgaggcacccatacagcgacgaggtggatcggagcatccgggtggtgtccccttgc300
gggatgtgcagagagctgatttccgattacgcccctgactgcttcgtgctgatcgagatg360
aatgggaagctggtgaaaacaacaatcgaggagctgatccccctgaagtataccaggaac420
tga423
<210>57
<211>5
<212>rna
<213>人工序列
<220>
<223>kozak序列
<400>57
ccacc5
<210>58
<211>42
<212>dna
<213>人工序列
<220>
<223>5'非编码序列#1
<400>58
ccaccatgaaattgccagaagactgacactagagccgccacc42
<210>59
<211>21
<212>dna
<213>人工序列
<220>
<223>5'非编码序列#2
<400>59
caccatggcccaggcttcata21
<210>60
<211>1440
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类klf4基因
<400>60
atgcgacagcctcctggcgaatccgatatggccgtctccgatgctctgctgccttctttc60
tctacttttgcctctggacctgctggcagggagaagacactgcgacaggcaggagctccc120
aacaatcgatggcgggaggaactgtctcacatgaaaagactgccccctgtcctgcctggg180
aggccatacgacctggccgctgcaaccgtggccacagatctggagtccggaggagctgga240
gcagcttgcggaggaagcaacctggcaccactgcctcggagagaaaccgaggaattcaac300
gatctgctggacctggattttatcctgtctaatagtctgacccacccaccagagtccgtc360
gcagcaacagtgagctcctctgcatctgccagttcaagctcctctccaagttcaagcggc420
ccagcttcagcacccagcacttgttccttcacctaccccattcgggcagggaatgaccct480
ggagtggccccagggggaacaggagggggactgctgtatggcagagaatctgcacctcca540
cccactgcccctttcaacctggctgacatcaatgatgtctcaccaagcggaggatttgtg600
gcagagctgctgaggcccgaactggatcctgtctatattcctccacagcagcctcagccc660
cctggaggaggactgatgggcaagttcgtgctgaaagcctccctgtctgctccaggcagc720
gagtacgggagtccctcagtcatcagcgtgtccaagggatctcctgacggaagtcaccca780
gtggtcgtggcaccatataacggaggcccacccaggacttgccccaagatcaagcaggaa840
gctgtgtcctcttgtacccatctgggggcaggacctccactgagcaatggccaccgcccc900
gctgcacatgactttcctctggggcgacagctgccttcccggaccacaccaaccctggga960
ctggaggaagtgctgagttcacgcgattgccacccagccctgcctctgccccctgggttc1020
cacccacatcccggacctaactacccaagctttctgccagaccagatgcagccacaggtg1080
ccacccctgcactatcaggagctgatgcctccaggaagttgtatgcccgaggaaccaaag1140
ccaaaacggggcaggcgcagctggcctagaaagaggactgctacccatacatgcgattac1200
gcaggctgtgggaagacttataccaaaagctcccacctgaaggcccatctgagaacacac1260
actggcgagaaaccttaccactgcgactgggatggatgtggctggaagttcgctcgctcc1320
gacgaactgacacgccattatcgaaagcacactgggcatcgaccattccagtgccagaaa1380
tgtgaccgggcattttctagaagtgatcatctggccctgcacatgaaacggcatttttga1440
<210>61
<211>1083
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类oct4基因
<400>61
atggccggacacctggcttcagattttgccttctcaccaccacctgggggagggggcgac60
ggacctgggggacccgaacctggatgggtggaccccagaacctggctgagctttcaggga120
ccccctggcgggccaggaatcggccctggcgtgggacctggctccgaggtctgggggatt180
ccaccctgccctccaccctacgaattctgcggaggcatggcttattgtggaccacaagtg240
ggagtcggactggtgcctcaggggggactggagacatctcagcctgagggagaagcagga300
gtgggagtcgagagcaactccgatggcgctagtcccgaaccttgcaccgtgactccaggg360
gcagtcaagctggagaaggaaaaactggagcagaatcccgaggaatcccaggacatcaag420
gctctgcagaaagagctggaacagtttgcaaagctgctgaagcagaaacgcattaccctg480
ggctacacacaggccgatgtggggctgactctgggagtgctgttcggcaaagtcttttcc540
cagaccacaatctgccgattcgaggcactgcagctgagcttcaagaacatgtgtaaactg600
aggcccctgctgcagaagtgggtggaggaagccgacaacaatgagaatctgcaggaaatc660
tgcaaagcagaaacactggtgcaggccaggaagcgcaaacgaactagcattgagaaccgg720
gtcagaggcaacctggaaaatctgtttctgcagtgcccaaagcccacactgcagcagatc780
agccacattgcccagcagctggggctggagaaagatgtggtccgggtgtggttctgtaat840
cggagacagaagggaaaaaggagctcctctgactatgctcagcgcgaggatttcgaagcc900
gctggctctccttttagtggcgggccagtgagtttccccctggcacctgggccacacttt960
ggaactcctggatacggctcaccacatttcaccgccctgtatagttcagtgcccttccct1020
gagggagaagcttttcctccagtgtctgtcactaccctgggctcaccaatgcatagcaac1080
tga1083
<210>62
<211>954
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类sox基因
<400>62
atgtataatatgatggaaaccgaactgaagccacctggaccacagcagacaagcggggga60
ggggggggaaactcaacagcagcagcagccggcgggaaccagaagaatagtccagacaga120
gtgaaaaggcccatgaacgcattcatggtctggtcccgaggccagcggagaaagatggcc180
caggagaaccccaaaatgcacaatagtgaaatctcaaagcggctgggggccgagtggaaa240
ctgctgagcgagactgaaaagagaccttttattgacgaagcaaaacgactgcgggccctg300
cacatgaaggagcatcctgattacaaatatcgcccaaggcgcaagaccaaaacactgatg360
aagaaagacaagtacaccctgcccggaggactgctggctcctgggggaaacagcatggca420
tccggagtgggagtcggagctggactgggagcaggagtgaatcagaggatggactcatat480
gcccacatgaacgggtggagcaatggaagttactcaatgatgcaggatcagctgggctat540
ccccagcaccctggactgaacgctcatggcgccgctcagatgcagcctatgcatcgctac600
gatgtgtctgcactgcagtataacagtatgactagctcccagacctacatgaatggctct660
cctacctacagcatgtcctattctcagcagggcacaccagggatggccctgggatctatg720
ggcagtgtggtcaagtccgaagcttctagttcaccccctgtggtcacaagctcctctcac780
tcccgcgccccatgccaggctggggacctgcgagatatgatctctatgtacctgccagga840
gcagaggtgccagaaccagcagcaccctcaagactgcacatgagccagcattatcagtcc900
ggccctgtcccagggacagctattaatggcactctgcccctgagccatatgtga954
<210>63
<211>1320
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类c-myc基因
<400>63
atgcccctgaatgtgagctttactaacagaaactacgacctggactacgacagcgtgcag60
ccctatttttattgtgacgaagaagagaacttctaccagcagcagcagcagagcgagctg120
cagccacctgcaccttccgaggacatttggaagaaatttgaactgctgcctacaccaccc180
ctgtctccaagtcggagaagcggcctgtgctcacccagctatgtggccgtcactcctttc240
agcctgcgaggggacaatgatggaggaggaggatccttttctacagccgatcagctggag300
atggtgactgaactgctggggggagacatggtcaaccagagcttcatttgcgatccagac360
gatgagacttttatcaagaatatcatcatccaggactgtatgtggtcaggcttcagcgcc420
gctgcaaagctggtgtctgaaaaactggcaagttaccaggccgctcgcaaagatagtggg480
tcacctaacccagccagaggccactccgtgtgctctacaagctccctgtacctgcaggac540
ctgagcgcagccgcttccgagtgtattgatccctccgtggtcttcccctatcctctgaat600
gactctagttcacccaagagttgtgcatcacaggacagctccgccttttcaccttctagt660
gatagcctgctgtcaagcactgagtcctctccacagggcagcccagaacccctggtgctg720
catgaggaaacccctccaaccacaagttcagattccgaggaggagcaggaggacgaagag780
gaaatcgatgtggtctctgtggagaagcggcaggctccaggaaaaagaagcgaatccgga840
tctccaagtgcaggaggacactccaagccacctcattctcccctggtgctgaaaaggtgc900
cacgtctccacccaccagcataactacgcagccccaccctctacaagaaaggactatccc960
gctgcaaagagggtgaaactggatagcgtgcgcgtcctgcgacagatcagtaacaatagg1020
aagtgtacttcacctcgcagctccgacaccgaggaaaacgtgaaaaggcgcacccataat1080
gtcctggagcgccagcgacggaatgaactgaagcgatccttctttgccctgcgggatcag1140
attcctgagctggaaaacaatgagaaggctccaaaagtggtcattctgaagaaagccaca1200
gcttatatcctgtctgtgcaggccgaggaacagaagctgatcagtgaggaagacctgctg1260
cggaaaagaagggagcagctgaagcacaaactggaacagctgagaaacagctgcgcctga1320
<210>64
<211>5040
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类brg1基因
<400>64
atgagcaccccagaccctcctctgggcggcacacctagaccaggcccaagccctggacca60
gggccaagccccggcgctatgctgggaccatcccccggacctagccccggctccgcacat120
tctatgatgggacctagtcctggaccaccctcagcaggacacccaatcccaacacaggga180
ccagggggctacccacaggataatatgcaccagatgcataagccaatggagtcaatgcac240
gaaaaaggcatgagcgacgatcccaggtataaccagatgaagggcatgggaatgagatcc300
ggagggcacgcaggaatgggccctccaccctctcctatggaccagcatagccagggatac360
ccttccccactgggcggatctgagcacgctagctccccagtgcctgcaagcggaccttct420
agtggcccacagatgtcaagcggccccggcggcgcccctctggatggagctgacccacag480
gcactggggcagcagaacagaggcccaacccccttcaatcagaaccagctgcaccagctg540
cgcgcccagatcatggcttacaagatgctggcaaggggccagcctctgccagaccatctg600
cagatggcagtccagggcaagcgaccaatgcctggaatgcagcagcagatgcccacactg660
cctccacccagtgtgtcagccactggaccagggcccggccctggaccagggcccggccct720
ggaccagggccggctcctccaaattattccagaccacacggaatgggagggccaaacatg780
ccccctccagggccatctggagtgccccctggaatgcctgggcagccacccggcggacct840
ccaaagccttggccagagggacctatggccaacgccgctgcaccaacctctacaccccag900
aagctgatccctccccagcctacaggcaggcccagtcctgcaccacccgcagtccctcca960
gcagctagcccagtgatgccccctcagactcagagccccggccagcctgctcagccagca1020
cccatggtcccactgcaccagaagcagagccgcatcacccctattcagaaaccacgaggc1080
ctggatcccgtggagattctgcaggaacgcgagtaccgactgcaggcccgaattgctcat1140
aggatccaggaactggagaatctgcccggatccctggccggggatctgagaactaaggcc1200
accatcgagctgaaagctctgcggctgctgaactttcagaggcagctgagacaggaggtg1260
gtcgtgtgcatgaggagagacaccgcactggaaacagccctgaatgcaaaagcctataag1320
cggtccaaacgccagtctctgcgagaggctaggattacagaaaagctggagaaacagcag1380
aagatcgaacaggagaggaagcggcgccagaaacaccaggagtacctgaacagtattctg1440
cagcacgccaaagacttcaaggaatatcatagatcagtcaccggcaaaatccagaagctg1500
acaaaagctgtggcaacttaccatgctaataccgaacgggagcagaagaaagaaaacgag1560
cgcattgaaaaggagcgaatgcgaaggctgatggccgaggatgaggaaggctatcggaag1620
ctgatcgatcagaagaaagacaaacgcctggcatacctgctgcagcagactgacgagtat1680
gtcgccaacctgaccgaactggtgagacagcacaaggcagcccaggtggctaaggagaag1740
aaaaagaaaaagaaaaagaaaaaggcagaaaatgcagagggacagaccccagcaatcgga1800
cctgatggagagccactggacgaaacaagtcagatgtcagatctgcccgtcaaagtgatc1860
cacgtggagtccggaaaaatcctgactgggaccgacgctcctaaggcagggcagctggag1920
gcttggctggaaatgaaccctggctacgaggtggcaccacgcagcgactccgaggaatct1980
ggcagtgaggaagaagaggaggaagaggaagaggaacagccacaggctgcacagccaccc2040
acactgcctgtcgaggagaagaagaagatccctgatccagacagtgacgatgtctcagag2100
gtggatgcaaggcacatcattgaaaatgccaagcaggacgtggacgatgagtatggagtg2160
tctcaggccctggctagagggctgcagagttactatgcagtcgcccatgctgtgaccgag2220
cgggtcgataagcagagcgccctgatggtcaatggcgtgctgaagcagtaccagatcaag2280
ggactggagtggctggtgtccctgtataacaataacctgaacggcatcctggctgacgaa2340
atgggcctgggaaaaacaatccagactattgcactgatcacctacctgatggagcacaag2400
agaatcaatggaccctttctgatcattgtgcctctgagcacactgtccaactgggcttac2460
gagttcgacaagtgggcaccctccgtcgtgaaggtgagctataaaggatccccagccgct2520
agacgggcttttgtcccccagctgcggtctgggaagttcaacgtgctgctgaccacatac2580
gagtacatcattaaggataagcatattctggccaagatccgctggaaatacatgatcgtg2640
gacgagggacacaggatgaagaatcaccattgcaaactgacacaggtcctgaacactcat2700
tatgtggcacctcgccgactgctgctgacagggactccactgcagaataagctgcccgag2760
ctgtgggccctgctgaactttctgctgccaactattttcaagtcatgtagcaccttcgag2820
cagtggtttaatgcccccttcgctatgacaggcgaaaaggtggatctgaacgaggaagag2880
actatcctgatcattaggagactgcacaaggtcctgcggccctttctgctgcggcgcctg2940
aagaaagaagtggaggcccagctgcctgaaaaggtcgagtacgtgatcaaatgcgacatg3000
tctgccctgcagagagtcctgtatcggcatatgcaggctaaaggggtgctgctgacagat3060
ggcagcgagaaggacaagaaaggcaagggcggcaccaaaacactgatgaatactattatg3120
cagctgcgcaagatctgtaaccacccatacatgttccagcatattgaagagtccttttct3180
gagcacctgggcttcactggagggatcgtgcagggactggatctgtatagggcatctggg3240
aagtttgagctgctggacaggattctgcccaagctgagagccaccaaccataaagtgctg3300
ctgttctgccagatgacttccctgatgaccatcatggaggattactttgcctatcggggc3360
ttcaagtacctgcgcctggatggaactaccaaagctgaggaccgcgggatgctgctgaag3420
accttcaacgagcctggctccgaatatttcatttttctgctgtctactagggccggcgga3480
ctgggactgaatctgcagtcagctgacaccgtgatcattttcgatagcgactggaaccct3540
caccaggatctgcaggctcaggacagagcacatcggatcggccagcagaatgaggtccgc3600
gtgctgcgactgtgcaccgtcaacagcgtggaagagaagattctggcagccgctaagtac3660
aaactgaacgtggatcagaaagtcatccaggccggaatgtttgaccagaagtcctctagt3720
cacgagcgaagggccttcctgcaggctatcctggagcacgaggagcaggacgaatctcgc3780
cattgtagtaccgggagtggctcagcaagcttcgcacatacagctcctccacccgcagga3840
gtgaatcctgacctggaggagcctcccctgaaggaagaggacgaggtcccagacgatgaa3900
accgtgaaccagatgatcgctcgacacgaagaggaattcgatctgtttatgcggatggat3960
ctggacagacggcgcgaggaagcccggaatcccaagaggaaacctagactgatggaggaa4020
gacgagctgcccagctggatcattaaggacgatgccgaagtggagcgcctgacctgcgag4080
gaagaggaagagaaaatgttcggaaggggatcccggcaccgaaaggaggtggattactcc4140
gactctctgacagaaaaacagtggctgaagaaaattacaggaaaggatatccatgacact4200
gcatcaagcgtggcccgaggactgcagtttcagagggggctgcagttctgtactcgcgca4260
agcaaggccattgaagaggggaccctggaagagatcgaagaggaagtgaggcagaagaaa4320
tcctctcgaaagaggaaaagagattccgacgccggcagttcaacccctacaacttctaca4380
cggagtcgcgacaaggacgatgagagcaagaagcagaagaaacgaggaaggccccctgct4440
gaaaagctgagcccaaatccacccaacctgaccaagaaaatgaagaaaattgtcgatgcc4500
gtgatcaagtacaaagacagctcctctggccgccagctgagtgaggtgtttattcagctg4560
ccttcaagaaaagaactgccagagtactatgaactgatccggaagcctgtggatttcaag4620
aaaattaaggagagaatccggaatcacaaatacaggtccctgaacgatctggaaaaggac4680
gtgatgctgctgtgtcagaatgcccagacttttaacctggaggggtctctgatctacgaa4740
gacagtatcgtgctgcagtcagtcttcaccagcgtgagacagaagattgaaaaagaggac4800
gatagtgagggcgaggaatcagaggaagaggaagagggcgaagaggaaggaagtgaatca4860
gagagccggtccgtcaaggtgaaaatcaagctggggagaaaagagaaggctcaggaccgg4920
ctgaaagggggccgaaggagaccttcacggggcagccgcgcaaagccagtcgtgtccgac4980
gatgactctgaggaggagcaggaagaggataggtctggcagtggatcagaagaggactga5040
<210>65
<211>3318
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类baf155基因
<400>65
atggcagctgcagccggcggagggggccccggcacagccgtgggagctactggatccgga60
atcgctgcagcagctgcaggactggctgtgtaccggagaaaagacggagggcctgcaaca120
aagttctgggaatctccagagactgtgtcccagctggactctgtgcgggtctggctgggg180
aaacactacaagaaatatgtgcatgcagatgcccctacaaacaagactctggctggcctg240
gtggtccagctgctgcagttccaggaggatgcatttggaaagcacgtgaccaatccagct300
tttacaaaactgcccgcaaagtgcttcatggactttaaggcaggcggagccctgtgtcat360
atcctgggagccgcttacaaatacaagaacgagcagggatggcgacgattcgacctgcag420
aatccctccaggatggatagaaacgtggaaatgttcatgaacatcgagaagaccctggtc480
cagaacaattgcctgacacggcctaacatctacctgatcccagacattgatctgaaactg540
gccaacaagctgaaggacatcattaagcgccaccagggaaccttcacagatgagaaaagt600
aaagcttcacaccatatctacccttatagctcctctcaggacgatgaggaatggctgcgg660
ccagtgatgcgcaaagagaagcaggtgctggtccactggggcttttaccccgactcctat720
gatacctgggtccattctaacgacgtggatgccgaaatcgaggatccccctattccagag780
aaaccctggaaggtgcacgtcaagtggatcctggacactgatattttcaacgagtggatg840
aatgaggaagactacgaagtcgatgagaaccggaaacctgtgtcatttcggcagcgcatc900
agcacaaagaatgaggaacctgtgcgatctccagagcgaagggacaggaaggctagtgca960
aacgcccgaaaaaggaagcatagcccatccccaccccctccaactcctaccgagagtcgc1020
aagaaatcaggaaagaaagggcaggccagtctgtatggcaaaagacggtcacagaaggag1080
gaagacgaacaggaggatctgacaaaggacatggaggatcctactccagtgcccaacatt1140
gaggaagtggtcctgcccaagaacgtcaatctgaagaaagactctgaaaatactcctgtc1200
aagggcggcaccgtggcagacctggatgagcaggatgaggaaacagtgactgcaggaggg1260
aaagaagacgaggatccagccaagggggaccagtctaggagtgtggacctgggcgaagat1320
aacgtgaccgagcagacaaatcacatcattatccccagctacgcctcctggttcgactat1380
aactgcatccatgtgattgaacgccgagctctgccagagttctttaacggcaaaaataag1440
agcaaaacacccgagatctacctggcctatcgcaactttatgattgatacttaccgactg1500
aatcctcaggagtatctgaccagcacagcttgcaggagaaacctgaccggagacgtgtgt1560
gccgtcatgagggtgcacgctttcctggaacagtgggggctggtcaactaccaggtggat1620
cccgagagcagacctatggccatgggccctcctcccactccacactttaatgtcctggct1680
gacaccccatcaggactggtgcccctgcatctgagaagccctcaggtcccagcagcccag1740
cagatgctgaacttcccagagaagaacaaggagaagcccgtggacctgcagaactttggc1800
ctgcgaaccgatatctacagcaagaaaacactggccaaaagcaagggagcttccgcagga1860
cgagagtggactgaacaggagaccctgctgctgctggaagccctggagatgtataaagac1920
gattggaataaggtctctgaacacgtgggcagtaggacccaggatgagtgtatcctgcat1980
ttcctgagactgccaattgaagacccctacctggagaactctgatgcaagtctgggacct2040
ctggcctatcagcctgtgccattctcacagagcgggaatccagtcatgagcacagtggct2100
tttctggcatccgtggtggaccccagagtggcatccgctgcagcaaaggctgcactggag2160
gaattctctagagtccgggaggaagtgcccctggaactggtggaggcacacgtcaagaaa2220
gtgcaggaggcagctcgcgccagcggaaaggtggaccctacatacgggctggagagttca2280
tgcatcgccggaactgggcccgatgaacctgagaaactggaaggggccgaggaagagaag2340
atggaggctgaccctgatggccagcagccagaaaaagccgagaacaaggtggaaaatgag2400
accgacgagggggataaggctcaggatggcgaaaacgagaaaaatagcgaaaaggagcag2460
gactcagaagtgagcgaggatactaaatccgaagagaaggaaaccgaagagaacaaagag2520
ctgactgacacctgtaaggaaagggagagtgatacaggcaagaaaaaggtcgaacacgag2580
atctcagagggaaatgtcgcaaccgcagcagctgcagcactggcttctgctgcaacaaaa2640
gcaaagcatctggccgctgtggaagagagaaaaattaagagtctggtcgccctgctggtg2700
gaaacccagatgaaaaagctggagatcaagctgcggcacttcgaggagctggagacaatt2760
atggaccgcgaaaaggaggccctggaacagcagagacagcagctgctgaccgagcggcag2820
aactttcacatggaacagctgaagtacgccgagctgcgcgctcgacagcagatggagcag2880
cagcagcatgggcagaatccacagcaggcacaccagcattccggcggacctggcctggct2940
ccactgggcgcagcaggacaccccggcatgatgcctcatcagcagccccctccatatcct3000
ctgatgcaccatcagatgccccctccccaccctccccagccaggccagatccccggccct3060
ggatctatgatgcctggccagcacatgcctggaaggatgatcccaactgtggctgcaaac3120
attcatccatccggatctggacctacccctcccggcatgcctccaatgccaggaaacatt3180
ctgggaccaagagtgccactgaccgcaccaaatggcatgtaccctccccctccccagcag3240
cagcctccaccccctccacccgctgacggcgtgcctccaccccctgcacccggaccaccc3300
gccagcgccgctccttga3318
<210>66
<211>1431
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类免疫球蛋白gh链基因
<400>66
atggattggacttggagattcctgttcgtcgtcgcagcagcaaccggcgtgcagagccag60
atgcaggtcgtgcagagcggggcagaagtgaagaaaccaggcagctccgtcactgtgagt120
tgcaaggcctcaggcgggaccttcagcaactacgcaatctcctgggtgcggcaggccccc180
ggacagggactggaatggatgggaggcatcattcccctgttcggaactcctacctattct240
cagaattttcagggccgcgtgacaatcactgctgataagagtacctcaacagcacacatg300
gagctgatttctctgcgaagtgaagacactgctgtgtactattgcgcaaccgaccggtac360
agacaggccaacttcgatagggctcgcgtggggtggtttgacccttgggggcagggaacc420
ctggtcacagtgtctagtgcatctaccaagggaccaagtgtgtttccactggccccctca480
agcaaaagcacttccggaggaaccgcagctctgggatgtctggtgaaggattatttccca540
gagcccgtcacagtgtcatggaacagcggagcactgaccagcggggtccatacatttccc600
gctgtgctgcagtcctctggcctgtactccctgagttcagtggtcaccgtccctagctcc660
tctctggggactcagacctatatctgcaacgtgaatcacaagccttctaatacaaaagtg720
gacaagaaggtggaaccaaagagttgtgacaaaacacatacttgccccccttgtcctgca780
ccagagctgctgggaggaccaagcgtgttcctgtttccacccaagcccaaagataccctg840
atgattagcaggacaccagaagtcacttgcgtggtcgtggacgtgtcccacgaggatccc900
gaagtcaagttcaactggtacgtggacggcgtcgaggtgcataatgctaagaccaaaccc960
agagaggagcagtacaattcaacctatcgggtcgtgagcgtcctgacagtgctgcaccag1020
gattggctgaacggcaaagagtataagtgcaaagtgtctaataaggcactgcccgcccct1080
atcgagaaaacaattagcaaggctaaagggcagcctagagaaccacaggtgtataccctg1140
cctccaagcagggatgagctgacaaagaaccaggtctccctgacttgtctggtgaaaggg1200
ttctatcccagtgacattgcagtggagtgggaatcaaatggacagcctgaaaacaattac1260
aagaccacaccccctgtgctggactccgatggatctttctttctgtattccaagctgact1320
gtggacaaatctcggtggcagcagggcaacgtcttttcttgtagtgtgatgcatgaggcc1380
ctgcacaatcattacacacagaagtcactgagcctgtcccccggcaaatga1431
<210>67
<211>708
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类免疫球蛋白gl链基因
<400>67
atggcttgggcactgctgctgctgacactgctgacacaggatactgggtcttgggcacag60
agcgcactgacacagcctgcttccgtgtccggctctcctgggcagtctatcaccattagt120
tgcaccgggacaaacaatgacgtgggaagttacaacctggtctcatggtatcagcagcac180
ccaggcaaggcccccaaaatcatgatctacgaggtgtccaagcggccaagtggggtctca240
aaccggttcagcggatcaaaaagcggcaatacagcctcactgactatcagcggactgcag300
gcagaggacgaagccgattactattgctgttcctacgctggctcttatacagtggtcttc360
ggcgggggaactaagctgaccgtgctggggcagcctaaagccgctccatctgtgactctg420
tttccccctagctccgaggaactgcaggctaataaggcaaccctggtgtgtctgattagc480
gacttctaccccggagctgtgacagtcgcctggaaggctgattctagtcccgtgaaagca540
ggggtcgagaccacaactcctagcaagcagtccaacaacaagtacgcagcctcaagctat600
ctgtccctgactccagaacagtggaagtctcacaggtcctattcttgccaggtgacccat660
gagggcagtaccgtggaaaaaacagtcgcccccactgaatgttcctga708
<210>68
<211>1773
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类免疫球蛋白mh链基因
<400>68
atggaactgggcctgagatgggtctttctggtcgctatcctggagggagtgcagtgtgaa60
gtgcagctggtcgagtctggcgggggactggtgaaaccaggcggatctctgcgactgagt120
tgcgcagcttcaggcttcaccttcagcacttactcaatgaactgggtccgacaggccccc180
ggcaagggactggaatgggtgagctccatctctagttcaagctcctacatctactatgct240
gacagcgtgaaagggcgattcactatctctcgggataacgcaaagaatagtctgtatctg300
cagatgaattcactgagagccgaggacacagctgtctactattgtgccagggatctgctg360
attgctgtggcaggacactggggacaggggaccctggtgacagtctctagtggcagcgcc420
tccgctccaactctgttccccctggtgtcctgcgaaaactctcctagtgacacctcaagc480
gtggcagtcggatgtctggcccaggacttcctgccagatagcatcacattttcctggaag540
tacaaaaacaacagtgatatttcctctactcgcggctttccctctgtgctgcgaggaggc600
aaatatgcagccaccagtcaggtcctgctgccttcaaaggacgtgatgcaggggacagat660
gagcacgtggtctgcaaagtgcagcatcccaacggaaataaggagaagaacgtcccactg720
cccgtgatcgctgagctgccacctaaggtgagcgtcttcgtgccacccagagacgggttc780
tttggaaatcccagaaagagcaaactgatctgtcaggccaccggctttagccctaggcag840
attcaggtgtcctggctgcgcgaagggaagcaggtcggatccggcgtgaccacagatcag900
gtccaggcagaagccaaggagtctgggcccactacctacaaagtgacctctacactgact960
atcaaggagagtgactggctgtcacagagcatgttcacctgccgggtggatcatagagga1020
ctgacatttcagcagaatgccagttcaatgtgtgtccctgaccaggataccgctatcagg1080
gtgttcgcaattcctccaagcttcgcttccatttttctgactaagtccaccaaactgaca1140
tgcctggtcaccgacctgacaacttatgattctgtgaccatcagttggacacgccagaac1200
ggcgaagccgtgaagacccacacaaacatttccgagtctcatcccaatgcaaccttcagc1260
gccgtgggcgaagcttccatctgcgaggacgattggaatagcggggagcggtttacttgt1320
accgtgacacacactgacctgccttcaccactgaagcagaccattagccgacctaaaggc1380
gtcgccctgcatcggccagatgtgtacctgctgccccctgcaagagaacagctgaacctg1440
agggagagcgccaccatcacatgtctggtgaccggattcagccctgcagacgtctttgtg1500
cagtggatgcagcgaggacagccactgtcccctgaaaagtacgtgacatctgcaccaatg1560
cctgagccacaggccccaggcagatattttgctcactccattctgacagtgtctgaggaa1620
gagtggaacactggggagacttatacctgcgtggtcgctcatgaagcactgccaaatagg1680
gtcactgagcgcaccgtggacaagagcactgggaaacccaccctgtataacgtctcactg1740
gtcatgagcgatacagccggaacttgttattga1773
<210>69
<211>711
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类免疫球蛋白ml链基因
<400>69
atggacatgcgagtgcctgctcagctgctgggactgctgctgctgtggctgcccgataca60
agatgcgacattcagatgactcagagcccaagctccctgagtgcctcagtgggagaccgg120
gtcaccatcacatgcagagcttcacagggcattagcaactacctggcatggtatcagcag180
aagccaggcaaagtgcccaagctgctgatctacgcagcttccaccctgcagtctggggtg240
cccagtcgattcagcggatccggatctggaacagactttactctgaccatttctagtctg300
cagcctgaggatgtggctacttactattgccagaaatacaattctgcaccatataccttc360
ggccaggggacaaaactggagatcaagaggacagtggcagccccctctgtcttcattttt420
ccccctagcgacgaacagctgaagtccggcaccgcttccgtggtctgtctgctgaacaat480
ttttaccctcgcgaagccaaagtgcagtggaaggtcgataacgctctgcagagtggcaat540
tcacaggagagcgtgactgaacaggactccaaagattctacctatagtctgtcaagcaca600
ctgactctgagcaaggcagattacgagaagcacaaactgtatgcctgcgaagtgacacat660
caggggctgtcctctcctgtcactaagtccttcaacagaggagagtgttga711
<210>70
<211>480
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类免疫球蛋白mj链基因
<400>70
atgaagaaccatctgctgttttggggagtgctggctgtgtttatcaaggctgtccatgtg60
aaggctcaggaagacgagagaattgtgctggtggacaacaagtgcaaatgtgctagaatc120
acctccaggatcattcgcagctccgaggaccctaacgaagacatcgtggagcgaaatatt180
cggatcattgtcccactgaacaatcgcgaaaatatttctgatcccaccagtcctctgcgg240
acaagattcgtgtaccacctgagtgacctgtgcaagaaatgtgatcccacagaggtggaa300
ctggacaaccagatcgtcaccgcaacacagtcaaatatttgcgacgaagatagcgccact360
gagacctgctacacttatgataggaacaagtgttacaccgcagtggtccctctggtgtat420
ggaggagaaactaaaatggtcgagacagccctgactccagacgcttgttatcccgattga480
<210>71
<211>7056
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类凝固因子viii基因
<400>71
atgcagattgaactgtccacctgtttcttcctgtgcctgctgagattttgtttttccgct60
actcgcagatactacctgggggctgtggaactgtcttgggattacatgcagagtgacctg120
ggagagctgccagtggacgcacgatttccacctcgggtgccaaagtcattcccctttaac180
acaagcgtggtctacaagaagaccctgttcgtggagttcaccgatcacctgttcaatatc240
gctaagccccggccaccctggatgggactgctggggcctaccatccaggcagaggtgtac300
gacaccgtggtcattacactgaaaaacatggcatcacacccagtgagcctgcatgccgtc360
ggagtgtcttactggaaggctagtgagggcgcagaatatgacgatcagacctctcagaga420
gagaaggaagacgataaagtgtttcccggcgggagccatacatatgtctggcaggtgctg480
aaggagaacggcccaatggctagcgaccccctgtgcctgacctactcatatctgagccac540
gtggacctggtgaaggatctgaatagcggactgatcggcgccctgctggtgtgcagggag600
ggatccctggctaaagaaaagacacagactctgcataagttcattctgctgttcgccgtg660
tttgacgaggggaaatcctggcactctgaaaccaagaactcactgatgcaggaccgagat720
gcagctagcgcacgagcctggcccaaaatgcacacagtcaacggctacgtgaatagatca780
ctgcctgggctgatcggatgccacaggaagtctgtctattggcatgtgatcgggatggga840
accacaccagaggtccacagcattttcctggaagggcatacctttctggtgcgcaaccac900
cgacaggcttccctggagatctctcccattacattcctgactgcacagaccctgctgatg960
gatctgggccagttcctgctgttttgccacatcagctcccaccagcatgatgggatggag1020
gcttacgtcaaagtggactcctgtcctgaggaaccacagctgcggatgaagaacaatgag1080
gaagccgaagactatgacgatgacctgacagactctgagatggatgtggtcaggttcgat1140
gacgataacagcccctcctttatccagattcgcagcgtcgccaagaaacaccctaagacc1200
tgggtgcattacatcgcagccgaggaagaggactgggattatgctcctctggtgctggca1260
ccagacgatagaagttacaaatcacagtatctgaacaatggccctcagcggattgggaga1320
aagtacaagaaagtgcgattcatggcatacacagatgaaacttttaagaccagagaggcc1380
atccagcacgaaagcggcattctggggccactgctgtacggagaagtgggcgacactctg1440
ctgatcatcttcaagaaccaggccagccggccctacaatatctatcctcatggaattacc1500
gatgtcagaccactgtactcccggagactgcccaaaggagtgaagcacctgaaagacttc1560
cccatcctgcctggcgaaatcttcaagtataagtggaccgtcacagtggaggatggccca1620
actaagtccgaccccagatgcctgaccaggtactattctagtttcgtgaacatggaaagg1680
gatctggcctctgggctgatcggaccactgctgatttgttacaaagagagtgtggatcag1740
aggggcaaccagatcatgtcagacaagcgcaatgtcattctgttcagcgtgtttgacgag1800
aatcgctcctggtatctgaccgaaaacatccagcgattcctgccaaatcccgctggcgtg1860
cagctggaggatcccgaatttcaggcatcaaacatcatgcatagcattaatggctacgtg1920
ttcgacagtctgcagctgtcagtctgcctgcacgaggtggcttactggtatatcctgagc1980
attggggcacagacagatttcctgagcgtcttcttttccggatacacttttaaacataag2040
atggtgtacgaggacactctgaccctgttcccattttctggcgagaccgtgtttatgagt2100
atggaaaaccccggactgtggatcctgggctgccacaactccgatttcaggaatcgcgga2160
atgactgccctgctgaaagtgtcaagctgtgacaagaataccggcgactactatgaggat2220
tcctacgaagacatctctgcttatctgctgagtaaaaacaatgcaattgagccacgctct2280
tttagtcagaactctaggcaccccagtacccgccagaagcagttcaacgccactaccatc2340
cctgagaatgatattgaaaaaacagacccatggtttgctcatcggactcctatgccaaag2400
atccagaacgtgagcagcagcgatctgctgatgctgctgagacagagccccactcctcac2460
gggctgtcactgagcgacctgcaggaggcaaagtacgaaaccttctcagacgatccaagc2520
cccggagccatcgattccaacaattccctgtctgagatgacccacttccggccacagctg2580
caccattccggggacatggtgtttacacccgagtctggactgcagctgagactgaacgaa2640
aaactgggcacaactgctgcaacagagctgaagaaactggactttaaggtgtcaagcact2700
agcaacaatctgatctccaccattccctctgataacctggccgctgggacagacaatact2760
tcctctctgggacctccatcaatgcctgtgcactacgatagccagctggacaccacactg2820
ttcggcaagaaaagttcacctctgaccgagtctggaggcccactgagtctgtcagaagag2880
aacaatgattcaaaactgctggagagcggactgatgaactcccaggaaagctcctggggc2940
aagaacgtgagcagcaccgagtccgggcggctgtttaaaggaaagagagcccatggccct3000
gctctgctgactaaagacaacgctctgttcaaggtgagcatctccctgctgaagaccaac3060
aaaacaagcaacaattccgcaactaatcggaagacccacatcgatggcccatccctgctg3120
attgagaactctcccagtgtctggcagaatatcctggagtctgacacagagttcaagaag3180
gtcactccactgattcatgatcggatgctgatggacaagaatgctaccgcactgagactg3240
aaccacatgagcaataagactacctcaagcaaaaacatggagatggtgcagcagaagaaa3300
gaaggacctatcccccctgatgcacagaatccagacatgagcttctttaaaatgctgttc3360
ctgcctgagtccgcccgctggattcagcgaacacacggcaagaactctctgaatagtggc3420
caggggccttccccaaaacagctggtctctctgggcccagagaagagtgtggaagggcag3480
aactttctgtccgagaaaaataaggtggtcgtgggaaagggcgaattcaccaaagatgtc3540
ggcctgaaggagatggtgttcccctcctctaggaatctgtttctgactaacctggacaat3600
ctgcacgagaacaatacccataaccaggaaaagaaaatccaggaagagattgagaagaaa3660
gaaacactgatccaggagaacgtcgtgctgccccagattcacacagtgactggcaccaag3720
aacttcatgaaaaatctgtttctgctgtctacccgccagaatgtcgagggcagttacgac3780
ggggcctatgctcctgtgctgcaggattttcgcagtctgaacgactcaactaatcgaacc3840
aagaaacacaccgcccatttcagcaagaaaggggaagaggaaaacctggaagggctggga3900
aatcagacaaaacagatcgtggagaagtacgcttgcacaactagaattagcccaaacaca3960
tcccagcagaatttcgtgactcagaggagcaagcgcgccctgaaacagtttaggctgccc4020
ctggaggaaactgagctggaaaagcgcatcattgtggacgatacatctactcagtggagc4080
aagaacatgaagcatctgaccccctccaccctgacacagatcgattataacgagaaagaa4140
aagggcgccattacccagtcacctctgagcgactgtctgacacgatcacacagcatccca4200
caggccaaccggtctcccctgcctattgctaaggtgagttcattccctagcatcaggcca4260
atctacctgacccgcgtgctgtttcaggataatagctcccatctgcctgcagcctcatat4320
aggaagaaagacagcggggtgcaggagtctagtcacttcctgcagggagcaaagaaaaac4380
aatctgtccctggccatcctgacactggagatgactggggatcagcgcgaagtcggctca4440
ctggggacaagcgccactaactccgtgacctacaagaaagtcgaaaatacagtgctgcca4500
aagcccgacctgcctaagacatctggaaaagtcgagctgctgccaaaagtgcatatctat4560
cagaaggatctgtttcccactgaaacctccaacggatctcctggccacctggacctggtg4620
gagggaagcctgctgcaggggaccgagggagcaatcaaatggaacgaagccaatcggccc4680
ggcaaggtccctttcctgagagtggccaccgagtcaagcgccaagacaccctccaaactg4740
ctggatcctctggcttgggacaatcattacggcacccagatcccaaaggaggaatggaaa4800
tctcaggagaagagtcccgaaaaaactgccttcaagaaaaaggacaccattctgtccctg4860
aacgcttgcgaatctaatcacgcaatcgctgcaattaacgaggggcagaacaagcccgag4920
atcgaagtgacatgggccaagcagggacgaactgagcggctgtgcagccagaacccaccc4980
gtgctgaagagacatcagagggagattacaaggaccacactgcagtccgatcaggaggaa5040
atcgactacgacgatactatttctgtggagatgaaaaaggaagacttcgatatctatgac5100
gaggatgaaaatcagagtcctagatcattccagaaaaagaccaggcattactttattgcc5160
gctgtggagcgcctgtgggattatgggatgtcctctagtcctcacgtcctgcgaaaccgg5220
gcccagtccggatctgtgccacagttcaaaaaggtcgtgttccaggagtttactgacggc5280
agctttacccagccactgtaccggggggagctgaatgaacacctgggactgctgggacca5340
tatatccgagctgaggtcgaagataacattatggtgacattccgaaatcaggcatcacgg5400
ccctacagcttttattcaagcctgatctcctacgaggaagaccagcgacagggcgctgaa5460
ccccggaagaacttcgtcaagcctaacgagacaaagacttacttctggaaggtgcagcac5520
catatggcccctaccaaagacgaattcgattgcaaggcatgggcctatttttctgacgtg5580
gacctggagaaggacgtgcacagtggactgatcggccctctgctggtgtgccataccaac5640
acactgaatccagcacacggccggcaggtcacagtgcaggaattcgctctgttctttaca5700
atctttgatgagactaagagctggtacttcactgagaacatggaacgcaattgccgagcc5760
ccatgtaacattcagatggaggaccccactttcaaggaaaactacagatttcacgccatc5820
aatggctatattatggataccctgcccggcctggtcatggctcaggaccagagaatcagg5880
tggtatctgctgagcatgggctccaacgagaatatccactccattcatttctctgggcat5940
gtctttacagtgcggaaaaaggaggaatataaaatggccctgtataacctgtatcccgga6000
gtcttcgagactgtggaaatgctgccttccaaggcaggcatctggagagtggagtgcctg6060
attggagaacacctgcatgccggcatgtccaccctgtttctggtgtactctaacaagtgt6120
cagacacctctgggaatggcaagtggccatatcagggatttccagattaccgcatccgga6180
cagtacggacagtgggcaccaaagctggcccgcctgcactatagtgggtcaatcaatgcc6240
tggagtaccaaagagcccttctcatggattaaggtggacctgctggcccctatgatcatt6300
cacgggatcaaaacacagggagctaggcagaagttctcctctctgtatatcagtcagttt6360
atcatcatgtattcactggatggaaaaaagtggcagacctaccgcgggaatagcactgga6420
accctgatggtcttctttgggaacgtggacagttcaggaatcaagcataacattttcaat6480
cctccaatcattgcccggtacatcagactgcaccccacccattattctattcggagtaca6540
ctgagaatggaactgatgggctgcgatctgaacagctgttccatgcctctggggatggag6600
agtaaggctatctcagacgcacagattaccgccagctcctatttcaccaacatgtttgcc6660
acatggtctcccagtaaagctagactgcacctgcagggcagaagcaatgcctggaggcct6720
caggtcaacaatccaaaggagtggctgcaggtggattttcagaagaccatgaaagtcaca6780
ggcgtgactacccagggggtcaaaagcctgctgacttccatgtacgtgaaggagttcctg6840
atctctagttcacaggacggccaccagtggaccctgttctttcagaacggaaaagtcaag6900
gtgttccagggcaatcaggatagctttacacctgtcgtgaactccctggacccccctctg6960
ctgactaggtatctgcgcatccatccacagtcctgggtgcatcagattgctctgcgaatg7020
gaagtgctggggtgcgaagctcaggacctgtattga7056
<210>72
<211>11058
<212>dna
<213>人工序列
<220>
<223>密码子优化的人类肌养蛋白基因
<400>72
atgctgtggtgggaagaggtcgaggattgctacgagagagaagatgtccagaagaagact60
tttactaaatgggtcaacgctcagttctcaaaattcggcaagcagcatatcgagaacctg120
tttagcgacctgcaggatgggcggagactgctggacctgctggagggactgactggccag180
aaactgcccaaagaaaagggctctaccagagtgcacgccctgaacaatgtcaataaggct240
ctgagggtgctgcagaacaataacgtggatctggtcaatatcgggagcaccgacattgtg300
gatggaaaccacaagctgacactgggcctgatctggaatatcattctgcattggcaggtg360
aaaaatgtcatgaagaacatcatggccggcctgcagcagacaaacagcgagaagattctg420
ctgtcctgggtgaggcagtctactcgcaattaccctcaagtgaatgtcatcaacttcacc480
acaagctggtccgacggactggccctgaacgctctgattcactcccatcgcccagacctg540
ttcgattggaattccgtggtctgccagcagtctgccacccagaggctggagcacgccttt600
aacatcgctcgctatcagctgggcattgagaagctgctggacccagaagacgtggatact660
acctaccccgacaagaagtccatcctgatgtatattacaagtctgttccaggtgctgcca720
cagcaggtcagcatcgaggccattcaggaagtggagatgctgccccggccccctaaagtc780
accaaggaggaacactttcagctgcaccatcagatgcattacagtcagcagatcaccgtg840
agcctggctcagggatatgagcgaaccagctccccaaaaccccggttcaagtcctacgca900
tatacacaggccgcttacgtgacaacttctgacccaactagatcccctttcccatctcag960
catctggaggctcccgaagacaagtcttttggctctagtctgatggaaagtgaggtgaac1020
ctggataggtatcagactgccctggaggaagtcctgagttggctgctgtcagccgaggat1080
accctgcaggctcagggcgagatcagcaacgacgtggaagtggtcaaggatcagttccac1140
acacatgaggggtacatgatggacctgactgcccaccaggggagagtgggaaatatcctg1200
cagctggggtcaaaactgattggaaccggcaagctgagcgaggatgaggaaacagaggtg1260
caggaacagatgaatctgctgaactcccggtgggagtgcctgagagtggccagtatggaa1320
aagcagtcaaatctgcatagggtcctgatggacctgcagaatcagaaactgaaggagctg1380
aacgattggctgaccaagacagaggaaaggacccgcaaaatggaggaggagcccctggga1440
ccagacctggaggatctgaagcggcaggtgcagcagcacaaagtcctgcaggaagacctg1500
gaacaggagcaggtgagagtcaacagcctgacacacatggtggtcgtggtggacgagtca1560
agcggagatcatgctactgccgccctggaggagcagctgaaggtgctgggcgatcgctgg1620
gcaaatatctgtaggtggactgaggaccgctgggtgctgctgcaggatattctgctgaag1680
tggcagcggctgaccgaggagcagtgcctgttcagcgcctggctgtccgaaaaagaggac1740
gcagtgaacaagatccacaccacaggctttaaggatcagaatgagatgctgtcctctctg1800
cagaaactggcagtgctgaaggccgacctggagaagaaaaagcagagcatggggaaactg1860
tactccctgaagcaggatctgctgtctacactgaaaaacaagagtgtgactcagaagacc1920
gaggcatggctggacaatttcgccagatgttgggataacctggtgcagaaactggagaag1980
tccaccgcacagatctcccaggccgtgactaccacacagcctagcctgacccagactacc2040
gtcatggagacagtgacaactgtcaccacacgcgaacagattctggtgaagcatgcacag2100
gaggagctgccaccacctccaccacagaaaaagcggcagatcaccgtggactccgagatt2160
cgaaagcggctggacgtggacatcactgaactgcactcttggattaccaggagtgaggcc2220
gtgctgcagagcccagaattcgctatctttcgcaaggaggggaatttctccgatctgaaa2280
gagaaggtgaacgctattgaaagagagaaagcagaaaagtttaggaaactgcaggacgcc2340
tctcgcagtgctcaggcactggtggagcagatggtcaatgaaggagtgaacgccgattca2400
atcaagcaggctagcgagcagctgaactccaggtggattgaattctgccagctgctgagc2460
gagcgcctgaactggctggaataccagaataacatcattgccttctacaatcagctgcag2520
cagctggaacagatgactaccacagccgagaactggctgaaaatccagcccactacccct2580
tcagagccaacagccatcaagagccagctgaagatttgtaaagacgaagtgaatagactg2640
tctggcctgcagcctcagattgagaggctgaagatccagagtattgccctgaaagaaaag2700
gggcagggaccaatgtttctggacgctgatttcgtggccttcaccaaccacttcaagcag2760
gtcttttccgacgtgcaggctcgcgaaaaagagctgcagacaatcttcgatactctgcct2820
ccaatgcgataccaggagactatgtctgccattcggacctgggtgcagcagtctgaaaca2880
aagctgagtatccctcagctgtcagtcactgactatgagattatggaacagcggctggga2940
gagctgcaggctctgcagagttcactgcaggaacagcagtcaggactgtactatctgagc3000
acaactgtgaaagagatgtcaaaaaaggccccatccgaaatctctcgcaagtaccagagc3060
gagtttgaagagattgaaggacgatggaaaaagctgagctcccagctggtggagcattgt3120
cagaagctggaggagcagatgaataagctgcgcaaaatccagaaccacattcagacactg3180
aaaaagtggatggccgaggtggacgtgttcctgaaggaagagtggcctgctctgggcgat3240
tctgagatcctgaaaaagcagctgaagcagtgccggctgctggtgagtgacatccagacc3300
attcagccaagtctgaattcagtcaacgagggcgggcagaaaatcaagaacgaagctgag3360
cccgaatttgcaagcagactggagacagaactgaaggagctgaatactcagtgggaccat3420
atgtgccagcaggtgtacgccaggaaagaagctctgaagggaggcctggagaaaaccgtc3480
tccctgcagaaggatctgtctgagatgcacgaatggatgacacaggccgaagaggaatac3540
ctggagcgggacttcgaatataagactccagatgagctgcagaaagccgtggaggaaatg3600
aagagagcaaaagaggaagcccagcagaaggaggctaaagtgaagctgctgacagaaagc3660
gtgaactccgtcatcgcacaggctccacctgtggcacaggaggccctgaaaaaggagctg3720
gaaactctgaccacaaattaccagtggctgtgcacccggctgaacggcaaatgcaagaca3780
ctggaggaagtgtgggcatgctggcatgagctgctgtcctatctggaaaaggccaacaag3840
tggctgaacgaggtggaattcaaactgaagactaccgagaacatccccggcggagccgag3900
gaaattagcgaggtgctggactccctggaaaatctgatgcgccacagcgaggataatcct3960
aaccagatccgaattctggcacagactctgaccgacggaggcgtgatggatgaactgatc4020
aatgaggaactggagacctttaactccagatggagggagctgcatgaggaagctgtgagg4080
cgccagaaactgctggaacagtctatccagagtgcacaggagacagaaaagtccctgcac4140
ctgatccaggagtctctgactttcattgacaagcagctggctgcatacattgctgacaaa4200
gtggatgccgctcagatgccccaggaggcacagaagatccagtctgatctgaccagtcac4260
gaaatttcactggaggaaatgaaaaagcataaccagggcaaggaggcagcccagagagtc4320
ctgtcccagatcgacgtggcacagaaaaagctgcaggacgtgagcatgaaattccgactg4380
tttcagaagccagccaatttcgagctgcggctgcaggaaagcaagatgatcctggacgag4440
gtgaaaatgcatctgcccgccctggaaaccaagtcagtcgagcaggaagtggtccagagc4500
cagctgaatcactgcgtgaacctgtataagtcactgagcgaggtcaagtccgaggtggaa4560
atggtcatcaagaccggaaggcagattgtgcagaaaaagcagacagagaacccaaaggag4620
ctggacgaacgcgtgaccgccctgaaactgcactataatgagctgggcgctaaagtcaca4680
gagagaaagcagcagctggaaaagtgtctgaaactgagccggaagatgagaaaagagatg4740
aacgtgctgaccgaatggctggctgcaaccgacatggagctgacaaagaggtccgccgtg4800
gaagggatgcccagcaatctggattccgaggtcgcttggggaaaagcaacccagaaggag4860
atcgaaaaacagaaggtgcacctgaagtctattacagaggtcggggaagccctgaaaacc4920
gtgctgggaaaaaaggagacactggtggaagacaagctgtctctgctgaatagtaactgg4980
atcgccgtcacaagccgcgctgaggaatggctgaacctgctgctggagtaccagaaacac5040
atggaaacttttgaccagaatgtggatcatattactaagtggatcattcaggccgacacc5100
ctgctggatgagagcgagaagaagaagccccagcagaaagaggacgtgctgaagcggctg5160
aaagctgaactgaacgatatccgacctaaggtggactctacacgggatcaggccgctaat5220
ctgatggccaaccgaggggaccactgccgaaagctggtggagccacagatcagcgaactg5280
aaccacagattcgcagccatctcccataggattaagaccggaaaagcttctattcccctg5340
aaggagctggaacagtttaattccgatatccagaaactgctggagcctctggaggccgaa5400
attcagcagggcgtgaatctgaaagaggaagacttcaacaaggatatgaatgaggacaac5460
gaagggactgtgaaagagctgctgcagcgcggagacaacctgcagcagcgaatcaccgat5520
gagcgcaagcgagaggaaatcaaaattaagcagcagctgctgcagaccaaacataatgcc5580
ctgaaggacctgaggagtcagcgacggaagaaagctctggagatctcacaccagtggtat5640
cagtataagcgccaggctgacgatctgctgaaatgcctggacgatattgagaagaaactg5700
gcatccctgcccgagcctagggacgaacgcaaaatcaaggagattgatagagaactgcag5760
aagaaaaaggaggaactgaacgcagtgagaaggcaggccgagggactgtctgaagacggc5820
gctgcaatggccgtggagcctacccagatccagctgtccaagcggtggagagagattgaa5880
tctaaattcgcacagtttcgccgactgaattttgcccagatccatactgtcagggaggaa5940
accatgatggtcatgacagaggacatgccactggaaatctcatacgtgcccagcacatat6000
ctgactgagattacccacgtcagccaggccctgctggaggtggaacagctgctgaacgct6060
cccgacctgtgcgcaaaggacttcgaggatctgtttaaacaggaagaaagtctgaagaat6120
atcaaagactcactgcagcagtctagtgggcggattgatatcattcacagtaaaaagact6180
gccgctctgcagtcagctacccctgtggagagagtcaagctgcaggaagcactgagtcag6240
ctggacttccagtgggagaaggtgaacaaaatgtataaggaccgacagggacggtttgat6300
agatcagtcgagaagtggcggagattccattacgatatcaaaatcttcaaccagtggctg6360
actgaggcagaacagttcctgcgcaaaacccagatccccgagaattgggaacacgccaaa6420
tacaagtggtatctgaaggagctgcaggacggcattgggcagagacagaccgtggtcagg6480
acactgaacgccactggagaggaaatcattcagcagtcaagcaagaccgacgctagcatc6540
ctgcaggagaaactgggctccctgaatctgcgctggcaggaagtgtgcaaacagctgagc6600
gataggaaaaagcgcctggaggaacagaagaacatcctgtccgaattccagcgggacctg6660
aatgagtttgtgctgtggctggaggaagccgataacatcgcttccattcccctggagcct6720
ggcaaagaacagcagctgaaagagaagctggaacaggtcaagctgctggtggaggaactg6780
cctctgcggcaggggatcctgaagcagctgaatgaaaccggaggaccagtgctggtctcc6840
gccccaatttctcccgaggaacaggacaagctggagaacaagctgaagcagacaaacctg6900
cagtggatcaaggtgtctagagcactgcctgagaaacagggcgagatcgaagcccagatt6960
aaggacctggggcagctggagaaaaagctggaagatctggaggaacagctgaaccatctg7020
ctgctgtggctgagcccaatcaggaatcagctggagatctacaatcagccaaaccaggaa7080
ggacccttcgacgtgcaggagacagaaatcgctgtgcaggcaaagcagcccgatgtcgag7140
gaaattctgtccaaaggccagcacctgtataaagagaagcccgccacccagcctgtgaaa7200
cgcaagctggaggacctgtcctctgaatggaaagctgtcaacaggctgctgcaggagctg7260
cgcgcaaagcagccagatctggcccctggcctgacaactatcggagctagtccaacacag7320
actgtgaccctggtcacccagcccgtggtcacaaaagaaactgccatttcaaagctggag7380
atgcctagttcactgatgctggaggtgccagcactggccgacttcaacagggcctggacc7440
gaactgacagactggctgtctctgctggatcaggtcatcaagagtcagcgcgtgatggtc7500
ggcgacctggaggatattaatgaaatgatcatcaagcagaaggccaccatgcaggatctg7560
gagcagaggcgcccacagctggaggaactgatcacagcagcccagaatctgaaaaacaag7620
actagcaaccaggaggccaggactatcattaccgaccgaatcgaacggattcagaatcag7680
tgggatgaggtgcaggaacacctgcagaatcgacggcagcagctgaacgagatgctgaag7740
gactctacccagtggctggaggcaaaagaggaagcagaacaggtgctgggacaggctcgc7800
gcaaaactggagagttggaaggaagggccctacactgtggacgcaatccagaaaaagatt7860
acagagactaaacagctggccaaggatctgcggcagtggcagaccaatgtggatgtcgct7920
aacgacctggcactgaaactgctgagagactatagcgccgacgatacaaggaaggtgcac7980
atgatcactgagaatattaacgcttcatggaggagcatccataagcgagtgtccgagcgg8040
gaagctgcactggaggaaacccaccgcctgctgcagcagttccctctggacctggagaag8100
tttctggcatggctgactgaggccgaaaccacagctaacgtgctgcaggacgccaccaga8160
aaagagaggctgctggaagattccaaaggagtgaaggagctgatgaagcagtggcaggat8220
ctgcagggcgagatcgaagctcacaccgacgtgtaccataatctggatgagaactcccag8280
aagattctgaggagtctggaaggctcagacgatgccgtgctgctgcagagaaggctggac8340
aatatgaactttaagtggtctgagctgcggaaaaagtctctgaacatcagaagtcacctg8400
gaagccagctccgatcagtggaaaagactgcatctgtcactgcaggagctgctggtgtgg8460
ctgcagctgaaggacgatgagctgagcaggcaggctcctatcgggggagacttcccagca8520
gtccagaagcagaatgatgtgcacagagcctttaaaagggagctgaaaacaaaggaacca8580
gtgatcatgagcacactggagactgtcagaattttcctgactgaacagcctctggagggc8640
ctggaaaagctgtaccaggagccaagggaactgccacccgaggaacgcgcacagaacgtg8700
acccgactgctgcgaaagcaggctgaggaagtcaatacagagtgggaaaaactgaacctg8760
cactccgccgactggcagcgcaagatcgatgagaccctggaacgactgcaggagctgcag8820
gaagcaacagacgagctggatctgaagctgaggcaggccgaagtgatcaaaggatcttgg8880
cagcccgtcggcgatctgctgattgacagtctgcaggatcatctggagaaagtgaaggct8940
ctgcggggggagatcgcaccactgaaggaaaatgtgagccacgtcaacgacctggccaga9000
cagctgactaccctgggaattcagctgtcaccctataatctgagcacactggaggatctg9060
aacactcggtggaagctgctgcaggtggcagtcgaggacagggtgcgccagctgcacgaa9120
gcacatagagatttcggccctgcctcccagcactttctgtccacatctgtgcagggacca9180
tgggagagggccatctctcctaacaaggtgccctactatattaaccacgagactcagaca9240
acttgctgggaccatcccaagatgaccgaactgtaccagagcctggccgatctgaataac9300
gtgcgcttttccgcatatcgaaccgccatgaaactgcgccgactgcagaaggccctgtgc9360
ctggacctgctgagtctgtcagccgcttgcgacgccctggatcagcataatctgaagcag9420
aacgaccagcccatggatatcctgcagatcattaactgtctgaccacaatctacgatcgg9480
ctggagcaggaacacaataacctggtgaatgtccctctgtgcgtggacatgtgcctgaat9540
tggctgctgaacgtctatgataccggcagaacagggcgaatccgggtgctgagcttcaag9600
actggcatcatttccctgtgcaaagctcatctggaggacaagtacaggtatctgttcaaa9660
caggtggcatctagtaccggcttttgcgaccagcggagactgggactgctgctgcacgat9720
agcatccagattcccaggcagctgggagaggtggctagcttcggcggatccaacatcgaa9780
ccctccgtccgctcttgcttccagtttgccaataacaagcctgagattgaagcagccctg9840
tttctggactggatgcggctggagcctcagagcatggtctggctgccagtgctgcacaga9900
gtcgctgcagccgagacagctaaacatcaggcaaagtgcaacatctgtaaagaatgccct9960
atcattggcttcagatacaggtccctgaagcactttaattacgatatctgtcagtcttgc10020
ttctttagtggcagagtggccaaagggcacaagatgcattaccccatggtcgagtattgt10080
acccctactacctctggggaagacgtgcgggattttgccaaggtgctgaaaaacaagttc10140
cggaccaaaagatactttgctaagcatccccggatgggatatctgcctgtgcagacagtc10200
ctggagggcgacaatatggaaactcccgtgaccctgatcaacttctggcctgtcgatagc10260
gcccccgcttcaagccctcagctgagtcacgacgatacccattcacgaattgagcactac10320
gcctcccggctggctgagatggaaaatagtaacggctcatatctgaatgacagcatctcc10380
cctaacgagtctattgacgatgaacacctgctgatccagcattactgccagagtctgaat10440
caggatagcccactgtcccagcctaggtcaccagcccagatcctgatttctctggagagt10500
gaggaacggggggagctggaaagaatcctggctgacctggaggaagagaatcggaacctg10560
caggcagagtatgatagactgaagcagcagcacgaacataaaggactgtcaccactgccc10620
agccctccagagatgatgcccacctcacctcagagcccacgggacgctgagctgatcgca10680
gaagccaagctgctgagacagcacaaaggacgcctggaagcccgaatgcagattctggag10740
gatcacaacaagcagctggaaagccagctgcatcgactgcgacagctgctggagcagcca10800
caggctgaagcaaaagtgaatggcacaactgtctcctctccctctaccagtctgcagcgg10860
agtgacagttcacagcctatgctgctgagagtggtcggatcacagacatcagacagcatg10920
ggcgaagaggatctgctgagcccccctcaggatacctccacaggcctggaagaagtgatg10980
gagcagctgaataactccttcccatccagcagaggcagaaataccccaggaaaaccaatg11040
agagaggacactatgtga11058
<210>73
<211>12
<212>dna
<213>人工序列
<220>
<223>人类atp合酶线粒体fo复合体b1亚基mrna的一部分
<400>73
gctacctggact12
<210>74
<211>18
<212>dna
<213>人工序列
<220>
<223>人类atp合酶线粒体fo复合体b1亚基mrna的一部分
<400>74
gcagcaggccaggcacag18
<210>75
<211>18
<212>dna
<213>人工序列
<220>
<223>人类肽基脯氨酰异构酶a(亲环素a)mrna的一部分
<400>75
tggcctcccaaactgctg18
<210>76
<211>12
<212>dna
<213>人工序列
<220>
<223>人类核糖体蛋白大亚基p1(rplp1)mrna的一部分
<400>76
cagccctacact12
<210>77
<211>2652
<212>dna
<213>人工序列
<220>
<223>t7rna聚合酶cdna
<400>77
atgaacaccatcaacatcgcaaaaaacgactttagtgacatcgaactggctgctatcccc60
ttcaatactctggctgaccattacggggagcgactggccagagagcagctggctctggag120
cacgaaagctacgagatgggggaagcccgattccggaagatgtttgagcggcagctgaaa180
gctggagaagtggcagacaacgccgctgcaaagccactgattaccacactgctgcccaaa240
atgatcgccagaattaatgattggttcgaggaagtgaaggcaaaaagaggcaagaggcct300
accgccttccagtttctgcaggagatcaagccagaagcagtggcctacatcaccatcaag360
actaccctggcatgcctgacaagcgccgacaacacaactgtgcaggctgtcgcatccgcc420
atcgggagggctattgaggacgaagcacgctttggaagaatcagggatctggaggccaag480
cacttcaagaagaacgtggaggagcagctgaacaagcgggtgggacacgtctacaagaag540
gccttcatgcaggtggtcgaggccgacatgctgtcaaagggactgctgggaggagaggca600
tggagctcctggcacaaagaagatagcatccatgtgggggtcaggtgcatcgagatgctg660
attgaatctaccggaatggtgagtctgcaccgacagaacgcaggagtggtcggacaggac720
tctgagacaatcgaactggctcccgagtacgctgaagcaattgccactagagctggggca780
ctggccggaatcagtcccatgttccagccttgcgtggtgccccctaagccatggactggc840
atcaccggaggcgggtactgggctaatgggcggagacccctggcactggtgaggacacac900
agcaagaaagccctgatgcgctacgaggatgtctatatgcctgaagtgtataaggccatc960
aacattgctcagaatacagcatggaaaattaacaagaaagtgctggctgtcgcaaatgtg1020
atcactaagtggaaacattgtcctgtggaggacatcccagccattgaaagggaggaactg1080
cctatgaagccagaggacatcgatatgaacccagaagccctgaccgcttggaaacgagcc1140
gctgcagccgtgtatagaaaggatcgcgcccgaaaatccaggcgcatttctctggagttc1200
atgctggaacaggccaacaagtttgctaatcataaagcaatctggttcccttacaacatg1260
gactggcgggggagagtctatgccgtgtccatgttcaacccacagggaaatgatatgaca1320
aagggcctgctgactctggctaagggcaaacccattggaaaggagggctactattggctg1380
aaaatccacggagcaaattgcgcaggagtggacaaggtgccattcccagagcggatcaag1440
ttcatcgaggaaaaccatgaaaatattatggcctgtgctaagtctcccctggagaacaca1500
tggtgggccgaacaggatagtcctttctgctttctggccttctgttttgagtacgctggg1560
gtgcagcaccatggactgagttataattgctcactgcccctggcctttgacggctcttgt1620
agtgggatccagcacttctccgcaatgctgcgggatgaggtcggaggcagagccgtgaac1680
ctgctgccttctgagactgtgcaggacatctacggcattgtcgccaagaaagtgaatgag1740
atcctgcaggcagacgccattaacggaaccgataatgaggtggtcaccgtcacagatgaa1800
aacactggcgagatctctgaaaaggtgaaactggggaccaaggctctggcaggacagtgg1860
ctggcacatggagtcacccgctcagtgacaaagcgaagcgtgatgacactggcttacggc1920
agcaaagagttcgggtttagacagcaggtgctggaagacaccatccagcccgccattgat1980
tccgggaagggacccatgtttacacagcctaaccaggctgcaggctatatggccaagctg2040
atctgggagtcagtgagcgtcactgtggtcgccgctgtggaagctatgaattggctgaag2100
tccgccgccaaactgctggctgcagaggtgaaggacaagaaaactggcgaaattctgagg2160
aaacgctgcgccgtccactgggtgaccccagatgggttccccgtgtggcaggagtacaag2220
aaacctatccagacccggctgaacctgatgttcctgggccagtttagactgcagccaaca2280
atcaacactaataaggacagtgagattgatgctcataaacaggaatcaggaattgcacca2340
aattttgtgcacagccaggacggctcccatctgaggaagaccgtggtctgggctcacgag2400
aaatatggcatcgaatccttcgcactgattcatgactcttttgggacaatccccgccgat2460
gccgctaatctgttcaaggctgtccgcgagactatggtggacacctacgaaagttgtgat2520
gtgctggccgacttctatgatcagtttgctgaccagctgcacgagtcacagctggataag2580
atgcctgccctgcccgctaagggcaacctgaacctgagggacattctggagtctgatttc2640
gcattcgcttga2652
<210>78
<211>4242
<212>dna
<213>人工序列
<220>
<223>hn-hpols-hccdna
<400>78
accagacaagagtttaagagatatgtatccttttaaattttcttaagaaaaacttagggt60
gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120
tggccggccttctgtccactttcgacacctttagctcacggcgctccgagtccatcaaca180
agtccggcggtggagccgtgatccctggacagcgctccactgtctccgtgttcgtcctcg240
ggccgtcggtgaccgacgacgccgacaagctgttcatcgccactactttcctcgctcatt300
ccctggataccgataagcagcactcccagcgcggaggttttttggtgtctctcctggcaa360
tggcctactcgtccccggagctgtacctgacaactaacggagtgaacgcggacgtgaaat420
acgtgatctacaacatcgaaaaggacccgaagcggaccaagaccgacggtttcattgtca480
agactcgggatatggagtacgagaggaccaccgagtggcttttcggcccaatggtcaaca540
agagcccgctgttccaaggacagcgggacgccgcggaccccgacaccctgctgcaaatct600
acggctaccctgcttgcctgggagccatcatcgtccaagtctggattgtgctcgtgaagg660
ccattaccagctccgccggtctgagaaaggggtttttcaaccgcctggaggcgttcagac720
aggacggcaccgtgaagggggcactggtgttcaccggcgaaaccgtggaaggaatcggct780
cagtgatgcggtcccagcagtccctggtgtcgctgatggtggaaactctcgtgaccatga840
acacggcccggtcggacctgaccaccctggagaagaacatccagattgtgggcaactaca900
ttcgggatgccggactcgctagcttcatgaacactattaagtacggagtggaaaccaaga960
tggccgccctgactctctccaacctgaggcccgatatcaacaagctgcgctcgctgatcg1020
atacctacctgtcaaaggggcccagggccccattcatttgcatacttaaagaccctgtgc1080
acggagagttcgcccctggaaactatcccgctctgtggagctacgcaatgggagtggccg1140
tggtgcagaacaaggccatgcagcaatacgtcaccgggaggacctatctcgatatggaga1200
tgttcctgctggggcaggccgtggcgaaggacgcagaaagcaaaatctcgtcggcccttg1260
aagatgaactgggtgtcactgacaccgcgaagggcagactcagacaccacttggccaacc1320
tcagcggaggagatggagcttaccacaagccgactgggggtggagcgattgaagtcgccc1380
tggataacgccgacatcgaccttgagactaaggcgcatgcggaccaggacgccaggggat1440
ggggcggggacagcggcgaacgctgggcccgccaagtgtccggcggtcacttcgtgacct1500
tgcatggcgcggagcgcctggaagaggaaaccaatgatgaggacgtgtcagacatcgaaa1560
gacggatcgccatgcgactggctgaacggcgccaggaggattccgcgacgcacggggacg1620
agggacggaacaatggagtggaccacgacgaagatgacgacgccgcagccgtggccggaa1680
tcggcggaatctagcggtttatttattgatccttatttattcaaagatctacgaggcctc1740
agtttgtctacttggtcttaagaaaaacttagggtgaaagcctcagtgccccattctcac1800
tgctactagtcgccaacatggaccaggacgcattcattctgaaagaagattcagaagtcg1860
aacgcgaagcccccggtggaagggagtctctcagcgacgtgatcggattcctggacgccg1920
tgctgtcatcggaaccgaccgacattgggggagacaggtcgtggctgcacaacactatca1980
acaccccgcaagggcctggctccgcgcatcgggccaagtcggagggagaaggagaagtgt2040
caaccccgagcacccaggacaaccgctcaggggaagagtccagagtctccggtagaacgt2100
caaagcctgaagccgaggcccatgccggaaacctggataagcagaacattcaccgggcct2160
ttggtggccgcaccgggacaaactccgtgtcgcaagacctgggcgatggcggcgattccg2220
gtatcctggagaatcccccaaacgagaggggatacccaagatccggaatcgaggacgaaa2280
accgggaaatggcagcccaccctgataagcggggcgaagatcaggccgaaggcctgcctg2340
aggaggtccggggatcgacctccttgcctgacgaaggggaaggcggcgcctcgaacaacg2400
gccggtcaatggagcccggcagctcccattccgctcgggtcactggagtcctcgtgattc2460
cttccccggaactggaggaagccgtgctgaggcggaacaagcggcggccgaccaactccg2520
gatcaaagcctctgactcccgccaccgtgcccggaactaggtccccgcccctgaaccgat2580
acaactcgaccgggtcaccacccggaaagccgccgtccacccaagacgagcacatcaaca2640
gcggggacactccggccgtgcgcgtgaaggaccggaagccacccatcggcactcggagcg2700
tgtctgactgtcctgcgaatggtagacccatccaccctggcctggaaaccgactccacca2760
agaagggaataggggagaacacctccagcatgaaggagatggctactctgctcacctcgc2820
ttggcgtgatccagtccgcgcaagagttcgaatccagccgcgacgcctcctacgtgttcg2880
cgcggcgcgccctgaagtccgcgaactacgccgagatgactttcaacgtgtgcggattga2940
tcctgtccgcggaaaagagctccgcaagaaaagtggacgagaacaagcagctgctcaagc3000
agatccaggagagcgtggagtccttccgcgacatctacaaacgcttctccgagtatcaga3060
aggagcagaactcccttctcatgtccaacctgtccacccttcacatcatcactgatcggg3120
gtggaaagacggataacaccgattcgttgacccgctccccgagcgtgttcgccaagtcca3180
aagagaacaagactaaggccaccagatttgatccttcgatggaaaccctggaggacatga3240
agtacaagcccgacctcattcgggaggacgaattccgggacgagatcagaaacccggtgt3300
accaagagagggacaccgaaccccgcgctagcaatgctagccgcctcctgccgtcaaagg3360
agaagccaaccatgcactcgctgcggctggtcattgaaagctctcccctgtcccgcgcgg3420
aaaaggtcgcctacgtgaaaagcctctcgaagtgcaagaccgaccaggaagtgaaggccg3480
tgatggaactggtggaggaggacatcgaatccctcaccaattgaaccggtgtcgacggag3540
ccgcaccttgtcatgtaccatcaatattaagaaaaacttagggtgaaagtctcccctcct3600
cacacctaggagaccaccatgcccagctttctcaagaagattttgaaacttcggggacga3660
cgccaggaggacgagtcgcggagccggatgctttccgattcctcaatgttgtcatgccgc3720
gtgaatcagctgacatcagaagggacggaagccggatcgacgacgccctcgactttgccg3780
aaagaccaggcattgctgatcgagccgaaagtccgcgcgaaagaaaagtcgcagcaccga3840
aggcccaagattatcgatcaagtgagaagggtcgaatcccttggtgagcaggcgagccag3900
agacaaaaacatatgcttgaaacgctgatcaacaagatttacaccgggcctcttggagaa3960
gagctggtgcagacactctatcttcggatttgggcgatggaagagactccggaatcgctg4020
aagatcctccaaatgagagaggacattcgcgatcaggtactgaagatgaaaaccgaaaga4080
tggttgaggactctcatcaggggcgagaaaacaaagttgaaagacttccaaaagcgatac4140
gaggaggtgcatccctatctcatgaaggaaaaggtagaacaggtcattatggaggaggcg4200
tggtcactcgccgcacacatcgtgcaagagtgataacccggg4242
<210>79
<211>6884
<212>dna
<213>人工序列
<220>
<223>hpollcdna
<400>79
gcggccgcttaagaaaaacttagggtgaatgtaaagctttctggccaccatggacggtca60
ggaatcaagccagaatccgtccgacatcctctacccggagtgccatcttaacagcccgat120
cgtacgcgggaagatcgcacagcttcacgtcctgttggatgtcaatcagccgtacagatt180
gaaagatgactcaatcattaacattaccaagcacaagattcgaaatggaggtttgtcacc240
tcggcagattaaaatccggtcactggggaaggcgcttcagaggaccatcaaagaccttga300
ccgctacaccttcgagccctacccgacgtactcccaagaacttttgcggctcgacatccc360
ggagatctgcgataagatccggtcggtgtttgccgtatccgataggcttacgcgcgagtt420
gtcgtcggggttccaagacctctggctcaatatctttaaacagcttgggaatatcgaagg480
ccgagaaggctacgacccgcttcaggatatcggcacgattcccgagatcaccgacaaata540
ctcaaggaatcgatggtacagacccttccttacatggttctcaatcaaatacgatatgag600
gtggatgcagaaaactaggccgggagggcctcttgacacgagcaattcgcataacctctt660
ggagtgtaagtcctacacgctggtgacgtacggcgaccttatcatgattttgaacaaact720
cacgcttacggggtacatcttgacaccagaattggtacttatgtactgtgacgtagtgga780
aggaaggtggaacatgtcagcagcgggccacctcgacaagaagtccatcggaattacttc840
caaaggggaggaattgtgggagttggtggactcgttgtttagcagccttggtgaggagat900
ctacaacgtaatcgcccttttggagccgctttcactcgcgttgatccaactcaacgatcc960
cgtcattcctttgcggggtgcgtttatgagacacgtactgactgagcttcaggcagtgtt1020
gacatcgagagatgtctacacggatgccgaagcggatactatcgtggagtcactccttgc1080
aatcttccacggcaccagcatcgacgagaaagctgaaatctttagcttctttcggacttt1140
cgggcacccctcacttgaagccgtcaccgcggctgacaaagtacgggcgcacatgtacgc1200
gcagaaggcgattaaacttaagacgttgtacgagtgccatgctgtgttctgcacaatcat1260
tattaatggttacagagagcggcacgggggtcagtggcccccttgcgactttccagacca1320
cgtctgcttggagctcagaaatgcacagggttcgaacacggcgatcagctacgaatgtgc1380
ggtggacaactatactagcttcatcgggttcaaattcaggaaattcatcgaaccacagct1440
ggacgaagacctgactatctacatgaaggataaggcgctgtcaccgaggaaagaagcatg1500
ggatagcgtgtaccccgactcaaatttgtactataaagcgccagagtccgaggagacacg1560
gcggttgattgaggtgttcattaacgatgagaattttaacccagaagagatcatcaacta1620
tgtcgagtcgggcgactggctcaaggacgagaagttcaacatctcgtactccttgaaaga1680
aaaagaaatcaagcaggaggggcgactgttcgctaagatgacatacaagatgcgagccgt1740
gcaagtcttggcggaaaccttgttggcaaaggggatcggagaattgttctcggaaaacgg1800
aatggtcaagggagagatcgaccttttgaaacgcctgacaaccttgtcggtctcgggagt1860
cccgcgcactgactcggtgtataacaacagcaagtcctcggagaagcgaaacgaggggat1920
gaagaagaagaattcaggtggatactgggacgagaaaaagagatccaggcatgagttcaa1980
ggccacagactcgtcaacggatggttatgaaacgctttcgtgcttcctgacgaccgatct2040
caaaaagtactgcctcaactggcggttcgaaagcacagcactttttgggcagagatgtaa2100
cgaaatctttgggtttaagaccttctttaactggatgcaccccgtcttggagcggtgcac2160
aatctacgtaggagatccatactgtccggtggctgaccgaatgcataggcaactccagga2220
ccatgcggattccggaattttcatccacaacccgagaggaggaatcgaggggtattgcca2280
gaaactctggaccctgatttcgattagcgcgattcaccttgctgcggtgcgagtgggggt2340
cagggtgtcagcgatggtgcagggagataatcaggcaatcgcggtcacttcgcgagtgcc2400
ggtcgcgcagacgtacaaacagaagaaaaatcatgtatacaaggaaatcaccaagtactt2460
tggggctctgcggcacgtcatgtttgacgtgggacacgagttgaaacttaatgaaacgat2520
catcagctcgaaaatgtttgtatacagcaagagaatttactacgacggaaagattctccc2580
gcagtgcttgaaggctctgactcgatgtgtattctggagcgaaacgctggtcgatgaaaa2640
caggtcagcatgtagcaatatctcgacatcgatcgcaaaagcgattgaaaatggttattc2700
gccaattttgggatactgtatcgcgctttacaaaacgtgtcagcaagtgtgtatctcgct2760
gggtatgaccattaaccccaccatttcgcctacggtgcgggatcagtacttcaagggaaa2820
gaattggctgaggtgcgcggtgttgatcccagcaaatgtgggaggttttaactatatgtc2880
cacgtcacgatgctttgtccggaatatcggtgatccagccgtggccgctctggccgattt2940
gaaaagattcatccgagctgacttgctcgacaagcaggtgttgtatcgggtgatgaatca3000
ggagccgggtgactcctcatttttggattgggcgtccgacccgtactcgtgcaatctgcc3060
gcactcccaatcgatcaccactatcatcaagaacatcacagccaggtcagtgttgcaaga3120
aagcccgaatcctctgttgtcaggtctcttcacagagacttcgggggaggaagatttgaa3180
cttggcgtcgtttctcatggatcgcaaggtgatcctcccacgggtcgcgcatgagatcct3240
tggaaacagcctgacaggggtgcgagaagcgattgcgggcatgttggatactacgaagag3300
cctcgtccgctcctccgtgaaaaagggaggactctcgtacgggatcttgcggagacttgt3360
caattacgacttgctccagtatgagacgctgacaaggacactgaggaaacccgtgaagga3420
caatatcgaatacgaatacatgtgctcagtggaattggccgtggggctgaggcaaaagat3480
gtggatccacctgacatacggacgcccgatccacggactggagacacctgaccctcttga3540
gttgttgagggggacgttcatcgaagggtcggaggtctgcaaactctgtagatcggaggg3600
agccgaccccatctacacgtggttttatctccccgataatattgatcttgacacacttac3660
aaatggatgccctgcgattagaatcccgtatttcgggtcagcaacggacgagaggtccga3720
ggctcagcttgggtacgtgcgcaaccttagcaagcccgcgaaagccgccatcagaatcgc3780
tatggtgtatacgtgggcctacgggaccgatgaaatttcatggatggaagccgcgctcat3840
tgctcagacaagagcgaatctctcgctggaaaatctgaagctcctgacacccgtatcaac3900
atccacgaacctttcccatcggttgaaagacaccgccacccagatgaagttttcctcggc3960
aacgctcgtcagggcgtcacgcttcatcacgatctcgaatgataacatggcgcttaaaga4020
agccggagagtcgaaagacacgaacctcgtctatcaacagatcatgttgactggactgtc4080
gctttttgagttcaatatgaggtacaagaagggatcgctcggcaaacctctcatcctcca4140
cttgcacctcaataacgggtgctgcatcatggagtcacctcaagaggcgaacatcccgcc4200
tagaagcacattggacttggagattacacaagagaataacaaactcatctacgatcccga4260
tcccctcaaggatgtggaccttgaacttttctcgaaagtacgcgatgtcgtccacaccgt4320
tgacatgacatattggtccgacgacgaggtaatccgcgcaacctcgatctgcaccgcgat4380
gacaatcgcagacaccatgtcccagcttgaccgggataaccttaaggagatgattgcgct4440
ggtcaatgacgacgacgtaaactcgctgattacggagttcatggtcatcgacgtgcctct4500
cttctgcagcacattcggaggcatcctggtcaaccagttcgcctacagcctttatggtct4560
taacatccgaggaagagaagagatttgggggcacgtggtgagaatcttgaaggacacgtc4620
ccatgcggtacttaaggtgctgagcaacgccctcagccaccccaaaatttttaagagatt4680
ttggaatgccggggtggtggaacctgtgtacggacccaatctttcgaatcaagacaaaat4740
cctgcttgcactcagcgtctgtgagtattccgtggaccttttcatgcacgattggcaagg4800
gggagtccccttggaaatcttcatctgcgacaatgaccccgacgtggcggatatgcggag4860
atcgtcatttcttgctcgccatcttgcatacttgtgctccgtagcagagatctcacggga4920
cgggcctcgcctggagtcaatgaactcattggaacggctcgaatccctgaaatcgtacct4980
cgaattgactttcctggacgatccggtccttaggtattcgcagctcactgggcttgtaat5040
caaggtatttccctcgacattgacgtacatcaggaagtcgtccattaaagtattgcgcac5100
tcgcgggatcggcgtaccggaagtgcttgaggattgggacccggaggcggataacgcatt5160
gctcgatggtatcgctgcggagattcagcagaatatccccctcgggcatcagaccagagc5220
tcccttttgggggctgcgggtatcgaaaagccaggtcctccgactgaggggatacaaaga5280
gattaccagaggagagattgggagatcaggagtcggattgacacttccgtttgacggacg5340
ctatctctcccaccaactgcgcctctttgggattaactcgacttcgtgcctcaaggccct5400
tgagcttacgtatctcctgtccccgttggtggacaaggacaaagaccgcttgtatctggg5460
ggaaggggcgggtgcaatgctttcgtgttacgatgcgacgcttggtccgtgcattaacta5520
ttacaactcgggagtgtactcgtgtgacgtcaacggccaaagagaattgaatatctaccc5580
agcagaggtagcgctcgtgggaaagaaactgaacaatgtcacctcactcggacagcgcgt5640
gaaggtgctcttcaatggtaaccccggatcgacgtggattggtaatgatgagtgcgaagc5700
tttgatttggaacgaactccaaaattcctcgattggattggtgcactgtgacatggaggg5760
aggggaccacaaggatgatcaagtagtactccacgagcactacagcgtgattcggatcgc5820
ttatttggtgggcgatcgggacgtcgtactcatctccaagatcgcccctcgactgggaac5880
agactggactcgccaattgtccctctacctccgctactgggatgaagtcaatcttatcgt5940
ccttaagacatcgaacccggcttcgactgaaatgtacctcctcagcagacaccccaagtc6000
ggacatcattgaggatagcaaaacagtactcgcgtcactgctccccctctcgaaggagga6060
ttccattaagatcgagaaatggattctcatcgagaaagcaaaggcccatgaatgggtaac6120
gagagagctgcgcgagggaagctcgtcatcgggcatgcttagaccctaccaccaggcgct6180
gcagacttttggattcgaacccaatctgtataaacttagccgcgacttcctcagcaccat6240
gaacatcgctgacacacataactgcatgatcgctttcaaccgggtactcaaagacacgat6300
ttttgagtgggccagaatcacggagtcggacaagcggctgaaacttacagggaagtacga6360
cctttatcccgtcagagacagcggtaaactgaaaacagtgtccagaagactggttctgtc6420
atggatctcactgtcaatgagcacgcgattggtcacgggttcgttccctgatcaaaagtt6480
tgaggcgagactccaattgggcattgtctcgctctcgtcaagagagatcaggaacctccg6540
agtcattactaaaacgctcctcgacagattcgaggacattattcacagcatcacttatcg6600
atttttgacgaaggagatcaagatccttatgaagattctcggtgccgtgaaaatgttcgg6660
ggcgagacaaaatgagtacacaacagtcattgatgacggttcgctcggagatatcgagcc6720
atacgatagctcgtgaaccggtagccgcaccttgtcatgtaccatcaataaagtaccctg6780
tgctcaacgaagtcttggactgatccatatgacaatagtaagaaaaacttacaagaagac6840
aagaaaatttaaaagaatacatatctcttaaactcttgtctggt6884
<210>80
<211>4248
<212>dna
<213>人工序列
<220>
<223>hn-hpols-hccdna
<400>80
accaaacaagagaaaaaacatgtatgggatatgtaatgaagtttaagaaaaacttagggt60
gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120
tggctggcctgctgtcaaccttcgataccttttcaagtaggaggagcgagtcaatcaaca180
aatctgggggcggagctgtcatccctggacagcggtccaccgtgtctgtcttcgtgctgg240
gcccctctgtgacagacgatgccgacaagctgttcatcgccaccacatttctggctcaca300
gtctggacacagataaacagcattcacagagaggcgggtttctggtgagcctgctggcta360
tggcatacagctccccagaactgtatctgactaccaacggagtgaatgccgacgtgaagt420
acgtgatctataacattgagaaggaccccaaaaggactaagaccgatggcttcatcgtga480
agacacgggatatggaatacgagagaacaactgagtggctgttcgggcctatggtgaaca540
agagcccactgtttcagggacagcgagacgcagctgaccccgataccctgctgcaaatct600
acggctatcctgcctgcctgggggctatcattgtccaagtgtggatcgtcctggtgaaag660
caattacctctagtgccggcctgcggaaggggttctttaaccgcctggaggctttccgac720
aggatggaacagtgaagggcgcactggtctttaccggcgaaacagtggagggaatcggct780
ctgtcatgagaagtcagcagtcactggtcagcctgatggtggaaactctggtcaccatga840
acacagccagaagtgacctgaccacactggagaaaaacatccagattgtggggaattaca900
tcagggatgccggcctggccagcttcatgaataccatcaagtatggggtggaaacaaaga960
tggcagccctgactctgtccaacctgagacccgacatcaacaagctgcggagcctgattg1020
atacctacctgtctaagggccccagggcccctttcatctgtattctgaaagacccagtgc1080
acggggagtttgctccaggaaactaccccgcactgtggtcctatgcaatgggcgtggccg1140
tggtccagaataaggccatgcagcagtacgtcactggccgcacctatctggacatggaaa1200
tgtttctgctggggcaggccgtggctaaagatgccgagagcaagatcagcagcgccctgg1260
aggacgagctgggagtcacagatactgccaaggggcgactgcggcaccatctggcaaacc1320
tgtccggaggcgacggagcatatcacaaacctacagggggaggcgctatcgaagtggcac1380
tggataatgccgacattgatctggagactaaggcacatgcagaccaggatgctcgcggat1440
ggggaggagattccggcgaaagatgggccaggcaggtgtctggcgggcactttgtcactc1500
tgcatggcgctgagcgactggaggaagagaccaatgacgaagatgtgagtgacatcgagc1560
ggagaattgctatgcgactggcagaaaggcgccaggaggactcagccacccatggggatg1620
agggacggaacaatggagtggaccatgacgaagatgatgacgccgccgcagtcgcaggca1680
ttggaggaatttgacggtttatttattgatccttatttattcaaagatctacgaggcctc1740
agtttgtctacttggtcttaagaaaaacttagggtgaaagcctcagtgccccattctcac1800
tgctactagtcgccaccatggaccaggacgcttttattctgaaggaggattctgaagtgg1860
aacgggaggcaccagggggaagggagagtctgagtgatgtcattggcttcctggacgccg1920
tgctgagctccgagccaacagatatcggaggggaccggagctggctgcacaacactatta1980
ataccccccaggggcctggaagtgcacatagagccaagtcagagggcgaaggggaggtgt2040
caacacccagcactcaggataacaggtctggggaggaatccagagtctctggaaggacca2100
gtaagcctgaagcagaggcccacgctggcaacctggacaaacagaatatccatcgagctt2160
ttggaggccggaccgggacaaactctgtgagtcaggacctgggagatgggggagactctg2220
gcatcctggaaaacccccctaatgagcgcggctaccctcgatccgggattgaagatgaga2280
atagggagatggccgctcacccagataagcgaggagaagaccaggcagagggactgcctg2340
aggaagtgcggggctcaaccagcctgccagacgaaggagagggaggagcctccaacaatg2400
gccggtctatggaacctgggtctagtcattccgctagagtgacaggcgtgctggtcattc2460
cttctccagagctggaggaagcagtcctgcggagaaacaagaggcgcccaaccaattccg2520
gatctaaaccactgaccccagcaacagtgcccggcacacggagcccacccctgaacagat2580
ataatagtaccgggtcacctccaggaaagcccccttctacacaggatgagcacatcaaca2640
gtggggacactccagctgtgcgggtcaaggatagaaaaccacccattggaactcggagcg2700
tgagcgactgcccagcaaacggaagacctatccaccccggcctggagactgattccacca2760
agaaaggaattggcgaaaatacctcaagcatgaaggagatggccacactgctgactagcc2820
tgggcgtgatccagtccgcacaggaattcgagagcagccgggacgccagttacgtctttg2880
ctcgacgggcactgaaatcagccaactatgctgagatgaccttcaacgtgtgcggcctga2940
ttctgagcgccgaaaagagttcagctagaaaagtggatgagaataagcagctgctgaaac3000
agatccaggaaagcgtcgagtccttcagagacatctacaagaggttttcagaatatcaga3060
aagagcagaacagcctgctgatgtctaatctgagtacactgcacatcattactgataggg3120
gaggcaagaccgataacacagacagcctgacacgcagcccttccgtgttcgctaagtcca3180
aagagaataagactaaagcaacccgctttgacccctccatggaaactctggaggatatga3240
agtacaaacctgacctgatccgggaagatgagtttagggacgaaattcgcaacccagtgt3300
atcaggaacgcgatactgagccccgagcatcaaatgccagcagactgctgccctccaagg3360
agaaacctaccatgcattctctgaggctggtcatcgaaagctccccactgagccgcgctg3420
agaaggtggcatacgtcaaatctctgagtaagtgcaaaaccgaccaggaggtgaaggctg3480
tgatggaactggtggaggaagacattgaatctctgacaaactaagtcgacggagccgcac3540
cttgtcatgtaccatcaatattaagaaaaacttagggtgaaagtctcccctcctcacacc3600
taggaccatggcccaggcttcataatgcccagctttctgaagaagattctgaaactgaga3660
ggacgaagacaggaagatgagtctcgaagtcggatgctgtccgacagctccatgctgtct3720
tgcagggtgaaccagctgactagcgagggaaccgaagctggctcaaccacacccagcaca3780
ctgcctaaagaccaggccctgctgatcgagccaaaggtccgggctaaggaaaaatcccag3840
caccggagacccaagatcattgatcaggtgaggcgcgtcgagagtctgggggaacaggca3900
tcacagcggcagaaacatatgctggagaccctgatcaacaaaatctacacaggccctctg3960
ggggaggaactggtgcagactctgtatctgagaatctgggccatggaggaaaccccagag4020
tctctgaaaatcctgcagatgcgcgaagacattcgagatcaggtcctgaagatgaaaaca4080
gagagatggctgaggactctgattaggggcgaaaagaccaaactgaaggatttccagaag4140
cggtacgaggaagtgcacccctatctgatgaaagagaaggtggaacaggtcatcatggaa4200
gaggcttggtcactggcagctcatattgtgcaggagtaatgacccggg4248
<210>81
<211>4242
<212>dna
<213>人工序列
<220>
<223>hpols-hn-hccdna
<400>81
accagacaagagtttaagagatatgtatccttttaaattttcttaagaaaaacttagggt60
gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120
tggaccaggacgcattcattctgaaagaagattcagaagtcgaacgcgaagcccccggtg180
gaagggagtctctcagcgacgtgatcggattcctggacgccgtgctgtcatcggaaccga240
ccgacattgggggagacaggtcgtggctgcacaacactatcaacaccccgcaagggcctg300
gctccgcgcatcgggccaagtcggagggagaaggagaagtgtcaaccccgagcacccagg360
acaaccgctcaggggaagagtccagagtctccggtagaacgtcaaagcctgaagccgagg420
cccatgccggaaacctggataagcagaacattcaccgggcctttggtggccgcaccggga480
caaactccgtgtcgcaagacctgggcgatggcggcgattccggtatcctggagaatcccc540
caaacgagaggggatacccaagatccggaatcgaggacgaaaaccgggaaatggcagccc600
accctgataagcggggcgaagatcaggccgaaggcctgcctgaggaggtccggggatcga660
cctccttgcctgacgaaggggaaggcggcgcctcgaacaacggccggtcaatggagcccg720
gcagctcccattccgctcgggtcactggagtcctcgtgattccttccccggaactggagg780
aagccgtgctgaggcggaacaagcggcggccgaccaactccggatcaaagcctctgactc840
ccgccaccgtgcccggaactaggtccccgcccctgaaccgatacaactcgaccgggtcac900
cacccggaaagccgccgtccacccaagacgagcacatcaacagcggggacactccggccg960
tgcgcgtgaaggaccggaagccacccatcggcactcggagcgtgtctgactgtcctgcga1020
atggtagacccatccaccctggcctggaaaccgactccaccaagaagggaataggggaga1080
acacctccagcatgaaggagatggctactctgctcacctcgcttggcgtgatccagtccg1140
cgcaagagttcgaatccagccgcgacgcctcctacgtgttcgcgcggcgcgccctgaagt1200
ccgcgaactacgccgagatgactttcaacgtgtgcggattgatcctgtccgcggaaaaga1260
gctccgcaagaaaagtggacgagaacaagcagctgctcaagcagatccaggagagcgtgg1320
agtccttccgcgacatctacaaacgcttctccgagtatcagaaggagcagaactcccttc1380
tcatgtccaacctgtccacccttcacatcatcactgatcggggtggaaagacggataaca1440
ccgattcgttgacccgctccccgagcgtgttcgccaagtccaaagagaacaagactaagg1500
ccaccagatttgatccttcgatggaaaccctggaggacatgaagtacaagcccgacctca1560
ttcgggaggacgaattccgggacgagatcagaaacccggtgtaccaagagagggacaccg1620
aaccccgcgctagcaatgctagccgcctcctgccgtcaaaggagaagccaaccatgcact1680
cgctgcggctggtcattgaaagctctcccctgtcccgcgcggaaaaggtcgcctacgtga1740
aaagcctctcgaagtgcaagaccgaccaggaagtgaaggccgtgatggaactggtggagg1800
aggacatcgaatccctcaccaattgaaccggtagatctacgaggcctcagtttgtctact1860
tggtcttaagaaaaacttagggtgaaagcctcagtgccccattctcactgctactagtcg1920
ccaacatggccggccttctgtccactttcgacacctttagctcacggcgctccgagtcca1980
tcaacaagtccggcggtggagccgtgatccctggacagcgctccactgtctccgtgttcg2040
tcctcgggccgtcggtgaccgacgacgccgacaagctgttcatcgccactactttcctcg2100
ctcattccctggataccgataagcagcactcccagcgcggaggttttttggtgtctctcc2160
tggcaatggcctactcgtccccggagctgtacctgacaactaacggagtgaacgcggacg2220
tgaaatacgtgatctacaacatcgaaaaggacccgaagcggaccaagaccgacggtttca2280
ttgtcaagactcgggatatggagtacgagaggaccaccgagtggcttttcggcccaatgg2340
tcaacaagagcccgctgttccaaggacagcgggacgccgcggaccccgacaccctgctgc2400
aaatctacggctaccctgcttgcctgggagccatcatcgtccaagtctggattgtgctcg2460
tgaaggccattaccagctccgccggtctgagaaaggggtttttcaaccgcctggaggcgt2520
tcagacaggacggcaccgtgaagggggcactggtgttcaccggcgaaaccgtggaaggaa2580
tcggctcagtgatgcggtcccagcagtccctggtgtcgctgatggtggaaactctcgtga2640
ccatgaacacggcccggtcggacctgaccaccctggagaagaacatccagattgtgggca2700
actacattcgggatgccggactcgctagcttcatgaacactattaagtacggagtggaaa2760
ccaagatggccgccctgactctctccaacctgaggcccgatatcaacaagctgcgctcgc2820
tgatcgatacctacctgtcaaaggggcccagggccccattcatttgcatacttaaagacc2880
ctgtgcacggagagttcgcccctggaaactatcccgctctgtggagctacgcaatgggag2940
tggccgtggtgcagaacaaggccatgcagcaatacgtcaccgggaggacctatctcgata3000
tggagatgttcctgctggggcaggccgtggcgaaggacgcagaaagcaaaatctcgtcgg3060
cccttgaagatgaactgggtgtcactgacaccgcgaagggcagactcagacaccacttgg3120
ccaacctcagcggaggagatggagcttaccacaagccgactgggggtggagcgattgaag3180
tcgccctggataacgccgacatcgaccttgagactaaggcgcatgcggaccaggacgcca3240
ggggatggggcggggacagcggcgaacgctgggcccgccaagtgtccggcggtcacttcg3300
tgaccttgcatggcgcggagcgcctggaagaggaaaccaatgatgaggacgtgtcagaca3360
tcgaaagacggatcgccatgcgactggctgaacggcgccaggaggattccgcgacgcacg3420
gggacgagggacggaacaatggagtggaccacgacgaagatgacgacgccgcagccgtgg3480
ccggaatcggcggaatctagcggtttatttattgatccttatttattcaagtcgacggag3540
ccgcaccttgtcatgtaccatcaatattaagaaaaacttagggtgaaagtctcccctcct3600
cacacctaggagaccaccatgcccagctttctgaagaagattctgaaactgagaggacga3660
agacaggaagatgagtctcgaagtcggatgctgtccgacagctccatgctgtcttgcagg3720
gtgaaccagctgactagcgagggaaccgaagctggctcaaccacacccagcacactgcct3780
aaagaccaggccctgctgatcgagccaaaggtccgggctaaggaaaaatcccagcaccgg3840
agacccaagatcattgatcaggtgaggcgcgtcgagagtctgggggaacaggcatcacag3900
cggcagaaacatatgctggagaccctgatcaacaaaatctacacaggccctctgggggag3960
gaactggtgcagactctgtatctgagaatctgggccatggaggaaaccccagagtctctg4020
aaaatcctgcagatgcgcgaagacattcgagatcaggtcctgaagatgaaaacagagaga4080
tggctgaggactctgattaggggcgaaaagaccaaactgaaggatttccagaagcggtac4140
gaggaagtgcacccctatctgatgaaagagaaggtggaacaggtcatcatggaagaggct4200
tggtcactggcagctcatattgtgcaggagtaatgacccggg4242
<210>82
<211>6884
<212>dna
<213>人工序列
<220>
<223>hpollcdna
<400>82
gcggccgcttaagaaaaacttagggtgaatgtaaagctttctggccaccatggacggaca60
ggaatctagccagaatcccagcgacatcctgtatcccgagtgccacctgaatagcccaat120
cgtgagaggaaaaatcgcccagctgcacgtgctgctggacgtgaaccagccatataggct180
gaaggacgattccatcattaatatcacaaagcataagattcgcaacggcgggctgtctcc240
ccgccagattaagatccgaagtctgggcaaagccctgcagcgcactatcaaagatctgga300
ccgatacaccttcgagccttacccaacatatagccaggaactgctgaggctggacattcc360
agagatctgcgataagatccgcagcgtgtttgctgtctccgaccggctgaccagagagct420
gagctccggcttccaggatctgtggctgaatatcttcaagcagctggggaacatcgaggg480
aagagaaggctatgatccactgcaggacattggcaccatccccgagattacagacaagta540
ctctcgcaaccgatggtataggcccttcctgacctggtttagtatcaagtacgacatgcg600
atggatgcagaaaacacggcccggaggccctctggatacttccaactctcacaatctgct660
ggagtgcaaaagctacacactggtgacttatggagatctggtcatgatcctgaataagct720
gactctgaccggctacattctgacccccgaactggtgctgatgtattgtgacgtggtcga780
gggaagatggaacatgagcgccgctggccatctggacaagaagagcattggcatcaccag840
taagggggaggaactgtgggaactggtggactccctgttctctagtctgggagaggaaat900
ctataatgtgattgccctgctggagcctctgtctctggctctgattcagctgaacgatcc960
agtgatccccctgcggggcgccttcatgagacacgtcctgaccgagctgcagaccgtgct1020
gacaagcagggatgtctacactgacgcagaggccgataccatcgtggaatccctgctggc1080
aatctttcatgggacatctattgacgagaaggccgaaatcttcagtttctttcggacatt1140
tggacacccctcactggaggccgtgactgcagccgataaggtcagagctcatatgtacgc1200
acagaaagccatcaagctgaaaaccctgtatgaatgccacgccgtgttctgcaccatcat1260
tatcaatggctaccgggagagacacgggggacagtggccaccttgcgattttcctgacca1320
cgtgtgcctggaactgcgcaacgctcaggggtcaaatactgcaatcagctacgagtgtgc1380
cgtggacaactataccagcttcattggattcaagtttagaaagttcatcgagccacagct1440
ggatgaagacctgaccatctacatgaaggataaagcactgtcccccaggaaagaagcctg1500
ggactccgtgtatcctgattctaatctgtactataaggccccagagtctgaggaaacacg1560
gagactgatcgaggtgttcattaatgacgaaaactttaatcccgaggaaattatcaacta1620
cgtggagagcggggactggctgaaggatgaggaattcaacattagttattcactgaagga1680
gaaagaaatcaagcaggaaggacgcctgtttgccaagatgacatacaaaatgcgagctgt1740
gcaggtcctggcagagactctgctggccaagggaatcggcgagctgttctccgaaaatgg1800
gatggtgaagggagagattgacctgctgaaacgactgaccacactgagcgtgtccggcgt1860
ccctcggaccgatagcgtgtataacaattcaaagtcaagcgagaaaaggaacgaggggat1920
ggaaaacaaaaattctggcgggtattgggacgagaagaaaaggagtcgccacgaattcaa1980
ggccaccgactcctctacagatggctacgagactctgagttgctttctgactaccgatct2040
gaagaaatattgtctgaattggcggttcgaatctaccgctctgtttgggcagagatgcaa2100
tgagatcttcggcttcaagaccttcttcaactggatgcatcccgtgctggagagatgcac2160
catctacgtgggcgacccttattgtccagtcgctgataggatgcaccgccagctgcagga2220
tcatgcagactccgggattttcatccacaaccctaggggaggcatcgagggatactgtca2280
gaagctgtggaccctgatttctatcagtgccattcatctggctgcagtgcgggtcggagt2340
gagagtctccgctatggtgcagggcgacaatcaggctatcgcagtcacctctcgcgtgcc2400
cgtcgctcagacatataaacagaagaaaaaccacgtgtacgaggaaattacaaagtattt2460
cggcgcactgcggcacgtgatgtttgatgtcgggcatgagctgaaactgaatgaaactat2520
catcagttcaaagatgttcgtgtactccaaaagaatctactatgacggcaagatcctgcc2580
acagtgcctgaaggccctgactaaatgcgtgttctggagcgagaccctggtcgatgaaaa2640
caggtcagcttgcagcaatatctcaactagcattgccaaagctatcgagaacggctacag2700
ccccatcctggggtactgtattgccctgtataagacctgccagcaggtgtgcatctcact2760
gggcatgactattaatcccaccatcagccctacagtgagagaccagtacttcaaggggaa2820
aaactggctgaggtgcgctgtgctgatccccgcaaacgtcgggggattcaattatatgtc2880
cacctctaggtgttttgtgcgcaacatcggggaccctgcagtcgccgctctggctgatct2940
gaaacgattcattcgggccgatctgctggacaagcaggtgctgtaccgcgtgatgaatca3000
ggagcctggagatagctcctttctggactgggcaagcgatccctattcctgcaacctgcc3060
tcacagtcagtcaatcacaactattatcaagaatatcaccgccaggagcgtgctgcagga3120
atcccccaaccctctgctgagcgggctgttcacagagacttccggagaggaagacctgaa3180
tctggccagcttcctgatggatagaaaagtgatcctgccaagggtcgcccatgaaatcct3240
gggaaacagcctgaccggcgtgagagaggcaatcgccggaatgctggacaccacaaagtc3300
tctggtgcgagccagtgtccggaaaggaggactgagctacggcatcctgaggcgcctggt3360
gaattacgacctgctgcagtatgaaaccctgacaagaactctgaggaagcccgtgaaaga3420
taacatcgagtacgaatatatgtgcagcgtggagctggcagtcggactgcgacagaagat3480
gtggattcacctgacttacgggcgacctatccacggcctggagaccccagatcccctgga3540
actgctgaggggcattttcatcgaggggtcagaagtgtgcaagctgtgccgcagcgaggg3600
agctgaccctatctacacctggttttatctgccagataatattgatctggacaccctgac3660
aaacggatgtcctgcaattcgcatcccatacttcggctctgctacagacgagagaagtga3720
agcacagctgggctatgtgaggaatctgagcaagcctgccaaagcagccattcggatcgc3780
tatggtgtatacctgggcatatgggaccgatgagattagctggatggaagctgcactgat3840
cgcacagacacgcgccaacctgtccctggagaatctgaagctgctgactccagtgagcac3900
ttccaccaacctgtcccaccggctgaaggacacagccactcagatgaaattctctagtgc3960
aaccctggtgcgcgccagccggttcatcacaatcagcaacgacaatatggctctgaagga4020
ggcaggagaatctaaagatacaaatctggtgtaccagcagatcatgctgactggcctgag4080
tctgttcgagtttaacatgcgctacaagaaggggtcactgggaaagcctctgatcctgca4140
cctgcatctgaacaatggctgctgtattatggagtccccacaggaagccaatatcccacc4200
ccggtctacactggacctggagattactcaggaaaacaataagctgatctatgatcctga4260
cccactgaaagatgtggacctggaactgttctccaaggtgagggacgtggtccacactgt4320
cgatatgacctactggagcgacgatgaagtgatccgcgccacctccatttgcactgccat4380
gaccatcgctgacacaatgtcccagctggatcgggacaacctgaaggaaatgattgctct4440
ggtgaacgacgatgacgtgaattctctgattaccgagttcatggtcatcgatgtcccact4500
gttctgttcaacatttggaggcatcctggtgaatcagtttgcctacagcctgtatggact4560
gaacattcgaggccgggaggaaatctggggccacgtggtcagaatcctgaaggacacctc4620
ccatgcagtgctgaaagtcctgtctaatgccctgagtcaccccaagattttcaaaaggtt4680
ttggaacgcaggagtggtcgagccagtgtacggacccaacctgtctaatcaggataagat4740
cctgctggctctgtcagtgtgcgaatatagcgtggacctgttcatgcacgattggcaggg4800
gggagtgcccctggagatcttcatctgtgataatgaccctgatgtcgcagacatgcggcg4860
gagcagcttcctggcacgccatctggcctacctgtgctccctggccgaaatctctagaga4920
tggccccaggctggagtccatgaactctctggagcggctggaaagtctgaaatcatacct4980
ggagctgactttcctggatgaccccgtgctgagatatagccagctgaccggcctggtcat5040
caaggtctttccttccaccctgacatacatccggaagtccagcatcaaggtgctgagaac5100
cagggggatcggagtgcccgaggtcctggaagactgggatcctgaagctgacaatgcact5160
gctggatggcattgccgctgagatccagcagaacattccactgggacaccagacacgggc5220
cccattttggggactgagagtgtctaaaagtcaggtcctgcgcctgcgagggtacaagga5280
gatcaccaggggcgaaattgggcgcagtggagtgggactgacactgccattcgacggcag5340
gtatctgtcacatcagctgcgcctgtttgggatcaactcaactagctgcctgaaggccct5400
ggaactgacctacctgctgagccccctggtggacaaggataaagacagactgtacctggg5460
agagggcgctggggcaatgctgagctgctatgacgctaccctgggcccttgtatcaacta5520
ctataattcaggcgtgtactcctgtgatgtcaacgggcagcgcgagctgaatatctaccc5580
agccgaagtggctctggtcgggaagaaactgaacaatgtgacctctctgggacagcgggt5640
gaaggtcctgttcaacggaaatcccggcagtacatggattggaaacgacgagtgcgaagc5700
cctgatctggaacgagctgcagaatagttcaattggcctggtgcactgtgacatggaagg5760
cggggatcataaagatgaccaggtggtcctgcacgagcattacagcgtgattcgaatcgc5820
ttatctggtcggcgatcgggacgtggtcctgatctcaaagattgcacctcgactggggac5880
agactggactcggcagctgagcctgtacctgagatattgggatgaagtgaatctgatcgt5940
cctgaaaacctccaacccagcctctacagaaatgtacctgctgagtaggcaccccaagtc6000
agacattatcgaggattccaaaaccgtgctggcttctctgctgccactgagtaaggagga6060
ctcaattaagatcgaaaaatggattctgatcgagaaggccaaagctcacgaatgggtgac6120
cagagagctgagggaagggagctcctctagtggaatgctgaggccttaccatcaggccct6180
gcagacattcggctttgagccaaacctgtataagctgagccgcgacttcctgtccactat6240
gaacattgctgatacccataattgcatgatcgcattcaaccgggtgctgaaagacacaat6300
ttttgagtgggccaggatcactgaaagcgataagcgcctgaaactgacaggaaagtacga6360
cctgtatcctgtgcgcgatagcggcaagctgaaaactatcagtagaaggctggtgctgtc6420
atggatttccctgtctatgagtacacggctggtcactgggtccttcccagaccagaaatt6480
tgaagccagactgcagctgggaatcgtgtctctgtcaagcagggagattcgcaatctgcg6540
agtcatcactaagaccctgctggacagattcgaagatattatccacagcatcacatacag6600
atttctgactaaggagatcaagatcctgatgaagattctgggagccgtgaaaatgtttgg6660
cgctcggcagaacgagtacaccactgtgattgatgatggcagcctgggggacattgaacc6720
ctacgactcctcctaaaccggtagccgcaccttgtcatgtaccatcaataaagtaccctg6780
tgctcaacgaagtcttggactgatccatatgacaatagtaagaaaaacttacaagaagac6840
aagaaaatttaaaagaatacatatctcttaaactcttgtctggt6884
<210>83
<211>2237
<212>dna
<213>人工序列
<220>
<223>hrig-iccdna
<400>83
ccggtagcagaaatagactgggaagatgcacaacttaagaaaaacttagggtgaaagcct60
gcgacaaaacctcctccttttccaagtgtaccaccatggaatgtcagaacctgtcagaaa120
actcctgtccccccagcgaagtgtcagatactaacctgtactcccctttcaagccacgga180
attaccagctggagctggccctgcccgctatgaagggcaaaaacaccatcatttgcgctc240
ctaccggatgtggcaagacattcgtgtctctgctgatttgtgaacaccatctgaagaaat300
ttcctcaggggcagaagggaaaagtggtcttctttgccaaccagatcccagtgtatgagc360
agcagaagagtgtcttctcaaaatactttgaacgacacggctatcgggtgacaggcatca420
gcggggcaactgccgagaatgtgcccgtcgagcagattgtggaaaacaatgacatcatta480
tcctgaccccacagatcctggtgaacaatctgaagaaagggaccattccctcactgagca540
tcttcacactgatgatttttgacgagtgccacaatacatctaagcagcatccttacaaca600
tgatcatgttcaactatctggatcagaaactgggagggagctccggaccactgcctcagg660
tcatcggcctgacagcaagcgtgggagtcggagacgccaagaacactgacgaggctctgg720
attacatctgcaagctgtgcgcttctctggatgcaagtgtgattgccactgtcaagcaca780
atctggaggaactggagcaggtggtctacaagcctcagaaattctttaggaaggtggaaa840
gcaggatctccgataagttcaaatatattatcgcacagctgatgcgggacaccgagagcc900
tggccaagagaatctgtaaagatctggaaaacctgtcccagattcagaatagagagtttg960
ggactcagaagtatgaacagtggattgtgaccgtccagaaagcctgcatggtgttccaga1020
tgccagacaaggatgaagaaagtcgaatctgtaaggccctgttcctgtatacctcacacc1080
tgcggaagtataacgacgctctgattatctcagagcatgcaagaatgaaggacgccctgg1140
attacctgaaagatttctttagcaatgtgagggccgctggcttcgacgagatcgaacagg1200
atctgactcagaggtttgaggaaaagctccaggagctggaatccgtgtctcgcgacccaa1260
gcaacgagaatcccaaactggaagatctgtgcttcatcctccaggaggaatatcacctga1320
acccagagaccattacaatcctgtttgtgaagaccagagctctggtggacgcactgaaaa1380
actggattgaagggaatcctaagctgtccttcctgaaaccaggaatcctgactggcaggg1440
ggaagaccaaccagaatactggaatgaccctgcccgctcagaagtgcattctggacgcct1500
tcaaggccagcggagatcataacattctgatcgccacatctgtggctgacgagggcattg1560
atatcgcccagtgtaacctggtcatcctgtacgaatatgtgggcaatgtcattaagatga1620
tccagactcggggaagaggcagggctcgcggctcaaagtgcttcctgctgaccagcaatg1680
caggcgtgatcgagaaggaacagattaacatgtataaggagaagatgatgaacgacagta1740
ttctgaggctccagacatgggatgaggccgtgttccgcgaaaagattctgcacatccaga1800
ctcatgagaagttcatccgcgactcccaggaaaagccaaaacccgtgcctgataaggaga1860
acaagaaactgctgtgccgaaagtgtaaagctctggcatgctacaccgcagacgtgcggg1920
tcatcgaggaatgtcactatacagtgctgggcgatgccttcaaggagtgctttgtctccc1980
ggccacatcccaagcctaaacagttctctagttttgaaaagcgcgctaaaatcttctgcg2040
cacgacagaattgttctcacgactggggcatccacgtgaagtacaaaaccttcgagattc2100
ccgtcattaagatcgagtcttttgtggtcgaagatatcgccacaggagtgcagactctgt2160
atagtaagtggaaagattttcattttgagaagattccctttgacccagcagagatgtcta2220
agtaactcgaccccggg2237
<210>84
<211>317
<212>dna
<213>人工序列
<220>
<223>hv-独特区cdna
<400>84
ccggtagcagaaatagactgggaagatgcacaacttaagaaaaacttagggtgaaagcct60
gcgacaaaacctcctccttttccaagtgtaccaccatgggccaccgacgggaacatatca120
tctacgagcgggatgggtatatcgtggacgaatcttggtgcaatccagtctgtagtcgca180
ttcgaatcattcccagaagggagctgtgcgtgtgtaaaacctgtcctaaggtctgcaaac240
tgtgtagggacgatatccagtgcatgcgccccgaccctttctgtagagaaatttttagga300
gctgactcgaccccggg317
<210>85
<211>857
<212>dna
<213>人工序列
<220>
<223>hpsma7cdna
<400>85
ccggtagcagaaatagactgggaagatgcacaacttaagaaaaacttagggtgaaagcct60
gcgacaaaacctcctccttttccaagtgtaccaccatgagttacgatagagcaatcacag120
tgttctcccccgatggacatctgtttcaggtcgagtatgcccaggaagccgtcaaaaaag180
ggtccactgccgtgggggtccgaggacgggacatcgtggtcctgggggtggagaagaaat240
ctgtcgcaaagctccaggatgaacgcaccgtgcgaaaaatttgcgccctggacgataacg300
tctgtatggccttcgctggcctgacagcagacgcacgaatcgtgattaatagagccaggg360
tcgagtgccagagccaccgcctgactgtggaggaccccgtgactgtcgaatacatcacca420
ggtatattgccagcctgaagcagcggtacacccagtccaacggccggagacccttcggga480
tcagcgccctgattgtgggattcgactttgatggcacacccagactgtaccagacagacc540
cttcaggcacttatcatgcctggaaagctaacgcaatcggacggggcgctaagagcgtga600
gagagttcctggagaagaactacaccgatgaggctattgaaaccgacgatctgaccatca660
agctggtcatcaaggccctgctggaggtggtccagtctggagggaagaacatcgaactgg720
cagtgatgaggcgcgaccagagtctgaagatcctgaatcccgaggaaattgagaaatatg780
tggctgagattgagaaagaaaaggaggagaatgagaaaaagaaacagaagaaagccagtt840
gataactcgaccccggg857
<210>86
<211>1707
<212>dna
<213>人工序列
<220>
<223>hpolscdna
<400>86
atggaccaggacgcattcattctgaaagaagattcagaagtcgaacgcgaagcccccggt60
ggaagggagtctctcagcgacgtgatcggattcctggacgccgtgctgtcatcggaaccg120
accgacattgggggagacaggtcgtggctgcacaacactatcaacaccccgcaagggcct180
ggctccgcgcatcgggccaagtcggagggagaaggagaagtgtcaaccccgagcacccag240
gacaaccgctcaggggaagagtccagagtctccggtagaacgtcaaagcctgaagccgag300
gcccatgccggaaacctggataagcagaacattcaccgggcctttggtggccgcaccggg360
acaaactccgtgtcgcaagacctgggcgatggcggcgattccggtatcctggagaatccc420
ccaaacgagaggggatacccaagatccggaatcgaggacgaaaaccgggaaatggcagcc480
caccctgataagcggggcgaagatcaggccgaaggcctgcctgaggaggtccggggatcg540
acctccttgcctgacgaaggggaaggcggcgcctcgaacaacggccggtcaatggagccc600
ggcagctcccattccgctcgggtcactggagtcctcgtgattccttccccggaactggag660
gaagccgtgctgaggcggaacaagcggcggccgaccaactccggatcaaagcctctgact720
cccgccaccgtgcccggaactaggtccccgcccctgaaccgatacaactcgaccgggtca780
ccacccggaaagccgccgtccacccaagacgagcacatcaacagcggggacactccggcc840
gtgcgcgtgaaggaccggaagccacccatcggcactcggagcgtgtctgactgtcctgcg900
aatggtagacccatccaccctggcctggaaaccgactcaacaaaaaagggcataggagag960
aacacatcatctatgaaagagatggctacattgttgacgagtcttggtgtaatccagtct1020
gctcaagaattcgaatcatcccgagacgcgagttatgtgtttgcaagacgtgccctaaag1080
tctgcaaactatgcagagatgacattcaatgtatgcggcctgatcctttctgccgagaaa1140
tcttccgctcgtaaagtggacgagaacaagcagctgctcaagcagatccaggagagcgtg1200
gagtccttccgcgacatctacaaacgcttctccgagtatcagaaggagcagaactccctt1260
ctcatgtccaacctgtccacccttcacatcatcactgatcggggtggaaagacggataac1320
accgattcgttgacccgctccccgagcgtgttcgccaagtccaaagagaacaagactaag1380
gccaccagatttgatccttcgatggaaaccctggaggacatgaagtacaagcccgacctc1440
attcgggaggacgaattccgggacgagatcagaaacccggtgtaccaagagagggacacc1500
gaaccccgcgctagcaatgctagccgcctcctgccgtcaaaggagaagccaaccatgcac1560
tcgctgcggctggtcattgaaagctctcccctgtcccgcgcggaaaaggtcgcctacgtg1620
aaaagcctctcgaagtgcaagaccgaccaggaagtgaaggccgtgatggaactggtggag1680
gaggacatcgaatccctcaccaattga1707
<210>87
<211>918
<212>dna
<213>人工序列
<220>
<223>人类nanogcdna
<400>87
atgagtgtggatccagcttgtccccaaagcttgccttgctttgaagcatccgactgtaaa60
gaatcttcacctatgcctgtgatttgtgggcctgaagaaaactatccatccttgcaaatg120
tcttctgctgagatgcctcacacggagactgtctctcctcttccttcctccatggatctg180
cttattcaggacagccctgattcttccaccagtcccaaaggcaaacaacccacttctgca240
gagaagagtgtcgcaaaaaaggaagacaaggtcccggtcaagaaacagaagaccagaact300
gtgttctcttccacccagctgtgtgtactcaatgatagatttcagagacagaaatacctc360
agcctccagcagatgcaagaactctccaacatcctgaacctcagctacaaacaggtgaag420
acctggttccagaaccagagaatgaaatctaagaggtggcagaaaaacaactggccgaag480
aatagcaatggtgtgacgcagaaggcctcagcacctacctaccccagcctttactcttcc540
taccaccagggatgcctggtgaacccgactgggaaccttccaatgtggagcaaccagacc600
tggaacaattcaacctggagcaaccagacccagaacatccagtcctggagcaaccactcc660
tggaacactcagacctggtgcacccaatcctggaacaatcaggcctggaacagtcccttc720
tataactgtggagaggaatctctgcagtcctgcatgcagttccagccaaattctcctgcc780
agtgacttggaggctgccttggaagctgctggggaaggccttaatgtaatacagcagacc840
actaggtattttagtactccacaaaccatggatttattcctaaactactccatgaacatg900
caacctgaagacgtgtga918
<210>88
<211>630
<212>dna
<213>人工序列
<220>
<223>人类lin28cdna
<400>88
atgggctccgtgtccaaccagcagtttgcaggtggctgcgccaaggcggcagaagaggcg60
cccgaggaggcgccggaggacgcggcacgggcggcggacgagcctcagctgctgcacggt120
gcgggcatctgtaagtggttcaacgtgcgcatggggttcggcttcctgtccatgaccgcc180
cgcgccggggtcgcgctcgaccccccagtggatgtctttgtgcaccagagtaagctgcac240
atggaagggttccggagcttgaaggagggtgaggcagtggagttcacctttaagaagtca300
gccaagggtctggaatccatccgtgtcaccggacctggtggagtattctgtattgggagt360
gagaggcggccaaaaggaaagagcatgcagaagcgcagatcaaaaggagacaggtgctac420
aactgtggaggtctagatcatcatgccaaggaatgcaagctgccaccccagcccaagaag480
tgccacttctgccagagcatcagccatatggtagcctcatgtccgctgaaggcccagcag540
ggccctagtgcacagggaaagccaacctactttcgagaggaagaagaagaaatccacagc600
cctaccctgctcccggaggcacagaattga630
<210>89
<211>1800
<212>dna
<213>人工序列
<220>
<223>人类igm9f11重链cdna
<400>89
atgtcagtgtcatttctgatttttctgccagtcctggggctgccttggggggtcctgtca60
caggtccagctgcagcagtccgggccaggactggtgaaacctgctcagacactgtccctg120
acttgcgcaatcagtggcgactcagtgagctccaactctgctacctggaattggattaga180
cagagtccactgaggggactggagtggctgggacggacatactatagaagcaaatggtac240
aacgactatgccgtgagcgtcaagtcccggatcaccattaaccctgatacaagcaagaat300
cagttctccctgcagctgaattctgtcaccccagaagacacagcagtgtactattgtgcc360
agggagaactactatggatccggccgctacaattggttcgatccttgggggcagggaaca420
ctggtgactgtctctagtggaagcgcatccgccccaaccctgtttcccctggtgagctgc480
gaaaactctcccagtgacacatcaagcgtggctgtcggctgtctggcacaggacttcctg540
cctgattcaatcacttttagctggaagtacaaaaacaattcagacatcagcagcaccaga600
ggctttccatctgtgctgagaggcgggaaatatgccgctacaagccaggtcctgctgccc660
tccaaggacgtgatgcagggaactgatgagcacgtggtctgcaaagtgcagcatcccaac720
ggcaataaggagaagaacgtcccactgcccgtgatcgctgagctgccacctaaggtgtcc780
gtcttcgtgccaccccgagacggattctttggcaatccccggaagtctaaactgatctgt840
caggccaccgggttttcacctagacagattcaggtgagctggctgagggaaggaaagcag900
gtcggctctggggtgaccacagatcaggtccaggctgaagcaaaggagagcgggccaact960
acctacaaagtgacctccacactgactatcaaggagtctgactggctgtcacagagcatg1020
ttcacatgcagggtggatcaccgcggcctgacttttcagcagaatgcaagttcaatgtgt1080
gtccccgaccaggataccgccatcagggtgttcgctattcctccatctttcgccagtatt1140
tttctgaccaagtccacaaaactgacttgcctggtcacagacctgacaacttatgattcc1200
gtgactatctcttggacccgccagaacggcgaagccgtgaagacccacacaaacatttcc1260
gagtctcatcccaatgcaaccttctctgccgtgggcgaagctagtatctgcgaggacgat1320
tggaatagcggggagcggttcacctgtaccgtgacacacactgacctgcctagtccactg1380
aagcagaccatttcacgccctaaaggcgtcgccctgcatcgaccagatgtgtacctgctg1440
ccacctgcccgcgaacagctgaacctgcgagagagtgctaccatcacatgtctggtgacc1500
ggcttctcccccgctgatgtctttgtgcagtggatgcagcgaggacagccactgagccct1560
gaaaagtacgtgacatccgcacccatgcctgagccacaggcacctggcagatattttgcc1620
cacagtattctgactgtgtcagaggaagagtggaacaccggggagacttatacctgcgtg1680
gtcgcccatgaagctctgccaaatcgagtcaccgagcggacagtggacaagagcacaggg1740
aaacccactctgtataacgtcagtctggtcatgtcagatactgccggaacctgttattga1800
<210>90
<211>714
<212>dna
<213>人工序列
<220>
<223>人类igm9f11轻链cdna
<400>90
atggatatgcgagtgcccgctcagctgctgggactgctgctgctgtggttccccggatca60
agatgcgacattcagatgactcagagcccaagctccgtgtctgcaagtgtcggcgaccga120
gtgaccatcacatgcagagcctcccaggggatttctagttggctggcttggtatcagcag180
aagccagggaaagctcccaagctgctgatctatgatgcatcaagcctgcagagtggagtg240
ccctcacgattctcaggcagcgggtccggaaccgactttactctgaccatttcctctctg300
cagcctgaggatttcgcaacatactattgccagcaggccaacagcttcccactgaccttt360
ggcgggggaacaaaagtggagatcaagaggactgtcgccgctccctctgtgttcattttt420
ccccctagtgacgaacagctgaaaagcggcacagcttccgtggtctgtctgctgaacaat480
ttttaccctcgcgaagcaaaagtccagtggaaggtggataacgccctgcagtctgggaat540
agtcaggagtcagtgactgaacaggacagcaaagattccacctattctctgagttcaaca600
ctgactctgtccaaggctgactacgagaagcacaaactgtatgcatgcgaagtcacacat660
cagggactgagctcccctgtgactaagtctttcaatagaggcgagtgttgataa714
<210>91
<211>1410
<212>dna
<213>人工序列
<220>
<223>人类igghc1重链cdna
<400>91
atggattggacttggagattcctcttcgtcgtagcagcagctacaggtgtccagtccgag60
gtgcagctggtggaatcaggggggggactggtgcagcctggagggtcactgcgactgtct120
tgtgccgcttctgggttcacttttaccgactacacaatggattgggtgcgcaaggcacct180
ggcaagggactggagtgggtcgctgatgtgaacccaaatagcggcgggtccatctacaac240
caggagttcaagggccggttcaccctgtccgtggaccgatctaaaaacaccctgtatctg300
cagatgaatagcctgcgagctgaagatactgcagtgtactattgcgcccggaatctgggc360
cccagcttctactttgactattggggacagggcactctggtcaccgtgagctccgctagt420
acaaagggcccttcagtgttcccactggcaccctctagtaaatccacatctggaggcact480
gccgctctggggtgtctggtgaaggactacttcccagagcccgtcaccgtgtcttggaac540
agtggggcactgactagcggagtcgcaaccggacctgccgtgctgcagtcaagcggactg600
tactccctgtcctctgtggtcaccgtcccaagttcaagcctgggcactcagacctatatc660
tgcaacgtgaatcacaagccaagtaatacaaaagtggacaagaaagtggagcccaagtct720
tgtgataaaacacatacttgccccccttgtcctgcaccagaactgctggggggaccctcc780
gtgttcctgtttccacccaagcctaaagataccctgatgattagcaggaccccagaggtc840
acatgcgtggtcgtggacgtgagccacgaggaccccgaagtcaagtttaactggtacgtg900
gacggcgtcgaagtgcataatgctaagacaaaacccagggaggaacagtacaacagcacc960
tatcgcgtcgtgtccgtcctgacagtgctgcatcaggattggctgaacggaaaagagtat1020
aagtgcaaagtgtccaataaggcactgcccgcccctatcgagaaaacaatttctaaggcc1080
aaaggccagcctagagaaccacaggtgtataccctgcctccatccagggatgaactgaca1140
aagaaccaggtctctctgacttgtctggtgaaaggcttctatccctcagatattgctgtg1200
gagtgggaaagcaatgggcagcctgagaacaattacaagaccacaccccctgtgctggac1260
tcagatgggagcttctttctgtattctaagctgaccgtggacaaaagtcggtggcagcag1320
ggaaatgtctttagttgttcagtgatgcacgaagcactgcacaaccattacactcagaaa1380
tcactgtcactgtcccctggcaagtgataa1410
<210>92
<211>702
<212>dna
<213>人工序列
<220>
<223>人类igglc1轻链cdna
<400>92
atggcttgggctctgctgctgctgacactgctgacccaggatacaggatcttgggctcgc60
attcagatgacccagtcccctagttctctgtccgcctctgtgggcgacagggtcaccatc120
acatgcaaggctagccaggacgtgagcattggagtcgcatggtatcaggataagccaggc180
aaagcacccaagctgctgatctatagtgcctcataccggtataccggggtgcccagcaga240
ttcagcggatccgggtctggaacagactttactctgaccattagctccctgcagccagag300
gatttcgccacatactattgccagcagtactatatctacccctatacatttggccagggg360
actaaagtggaaattaagggccagcctaaagccgctccatccgtcactctgttcccccct420
tctagtgaggaactgcaggctaacaaggccaccctggtgtgctacatctctgacttttat480
cctggggcagtgaccgtcgcatggaaggctgattcaagccccgtgaaagctggagtcgag540
accacaactcctagcaagcagtccaacaacaagtacgcagcctggtcttatctgagtctg600
acaccagaacagtggaaaagccaccggagttactcatgtcaggtcactcacgaaggcagc660
actgtggaaaaaactgtggctcctaccgaatgttcttgataa702
<210>93
<211>1416
<212>dna
<213>人工序列
<220>
<223>人类igghc2重链cdna
<400>93
atggattggacatggcgctttctgttcgtcgtcgcagccgcaaccggagtgcagtctcag60
gtgcagctggtgcagtcaggagccgaggtgaagaaacctggcgcctccgtcaaagtgtct120
tgcaaggctagtgggtacactttcacctctcactggatgcattgggtgagatatgcccct180
gggcagggactggagtggatcggagaattcaacccaagcaatggaaggactaactacaac240
gagaagtttaaatctaaggctacaatgactgtggataccagtacaaacactgcatatatg300
gagctgagctccctgaggtcagaggacaccgccgtgtactattgcgcaagccgggactac360
gattatgacggaagatacttcgattattggggccaggggacactggtcaccgtgagcagc420
gccagcaccaaaggccctagcgtgtttccactggctccctcaagcaagagtacctcagga480
gggacagccgctctgggatgtctggtgaaggactacttcccagagcccgtcaccgtgtct540
tggaacagtggagcactgacaagcggcgtccacacttttcctgccgtgctgcagtcctct600
gggctgtactccctgagttcagtggtcaccgtcccaagctcctctctgggaacccagaca660
tatatctgcaacgtgaatcacaaaccaagtaatacaaaggtggacaagaaggtggaaccc720
aaaagctgtgacaagactcatacctgcccaccttgtcctgcaccagagctgctgggagga780
ccaagcgtgttcctgtttccacccaaacctaaggataccctgatgattagccgcactcca840
gaagtcacctgcgtggtcgtggacgtgagccacgaggaccccgaagtcaagtttaactgg900
tacgtggacggcgtcgaggtgcataatgccaaaacaaagcccagggaggaacagtacaac960
tccacttatcgcgtcgtgtctgtcctgaccgtgctgcaccaggattggctgaacggcaag1020
gaatataaatgcaaggtgtctaacaaggccctgcccgcccctatcgagaagacaattagc1080
aaagcaaagggccagcccagagagccacaggtgtataccctgcctcccagccgggacgag1140
ctgaccaaaaaccaggtctctctgacatgtctggtgaagggattctatcccagcgacatt1200
gctgtggagtgggaatccaatggccagcctgagaacaattacaagaccacaccccctgtg1260
ctggattcagacggcagcttctttctgtatagtaaactgaccgtggacaagtcacgatgg1320
cagcaggggaatgtctttagctgttccgtgatgcatgaagcactgcataatcactacacc1380
cagaaatcactgtcactgagcccaggaaaataatga1416
<210>94
<211>696
<212>dna
<213>人工序列
<220>
<223>人类igglc2轻链cdna
<400>94
atggcttgggctctgctgctgctgaccctgctgacccaggacaccgggagttgggctgac60
atccagatgacccagtccccttcttccctgagtgcatcagtgggcgaccgggtcaccatc120
acatgcagcgccagctcctctgtgacatacatgtattggtatcagagaaagccaggaaaa180
gctcccaagctgctgatctacgatacttctaacctggcaagtggcgtgccaagcaggttc240
agcggatccggatctggaactgactacacttttaccatcagttcactgcagcccgaggat300
attgccacctactattgccagcagtggagctcccacatcttcacatttggccaggggact360
aaagtggaaattaaggggcagcctaaagccgctccaagcgtcacactgttccccccttct420
agtgaggaactgcaggctaataaggccaccctggtgtgcctgatctccgacttttatcct480
ggggccgtgacagtcgcctggaaggctgattcaagccccgtgaaagctggagtcgagacc540
acaactcctagcaagcagtccaacaacaagtatgcagcctcctcttacctgtccctgacc600
cccgaacagtggaaatctcatcggagttactcatgtcaggtcactcacgaagggagcact660
gtggaaaaaaccgtcgcaccaaccgaatgttcataa696