使用具有隐身性的RNA的基因表达系统以及包含该RNA的基因导入、表达载体的制作方法

文档序号:11446068阅读:390来源:国知局
使用具有隐身性的RNA的基因表达系统以及包含该RNA的基因导入、表达载体的制造方法与工艺

本发明涉及用于在动物细胞中导入并持续表达外源基因的载体。



背景技术:

从外部将任意基因导入至包括人类细胞在内的动物细胞中并在该细胞中持续表达的技术是在使用生物技术的各种行业中所必需的技术。例如,为了大量生产工业用的作为医药品使用的人类单克隆抗体,使免疫球蛋白的h链和l链的基因以同等水平持续表达的技术是必要的。另外,在先天性代谢疾病的基因治疗中,将治疗用基因导入人类的组织细胞并在体内长时间稳定表达的技术是必要的。

1.关于细胞重编程技术

近年来,使用基因将正常组织细胞的性质进行转换而制作有用细胞的细胞重编程技术备受瞩目,然而,在动物细胞中导入基因并持续表达的技术成为即使在细胞重编程中也不可缺少的基础技术。例如,通过将被称为oct4、sox2、klf4、c-myc或被称为oct4、sox2、nanog、lin28的4个基因进行组合并导入人类正常成纤维细胞,使该基因持续表达21天,可以制作人类诱导多能干细胞(ips细胞)(专利文献1、专利文献2、非专利文献1、非专利文献2)。同时,通过在人类的成纤维细胞中导入被称为foxa3、hnf1a、hnf4a的3个基因并使之持续表达14天,可以制作肝细胞(非专利文献3)。此外,也有报道指出,通过在人类的成纤维细胞中导入被称为ascl1、brn2、myt1l、lmx1a、foxa2的5个基因并使之持续表达24天,可以制作多巴胺能神经元(dopaminergicneuron)(非专利文献4)。如上所述,在各种细胞重编程中,可以同时向细胞导入多个基因并进行表达并在对于重编程而言必要的期间维持其表达的技术被认为是必要的。

已知在活体内也可以诱导细胞重编程。例如,已有报道指出,在小鼠的心肌梗塞模型中,将gata4、mef2c、tbx5这3个基因或者gata4、hand2、mef2c、tbx5这4个基因向梗塞部位投药,浸润的成纤维细胞变化成为心肌细胞(非专利文献5、非专利文献6),因此,期待细胞重编程技术将来成为心肌梗塞或脊髓损伤等再生医疗的基础。

2.细胞重编程效率的提高

另外,假定在体外将细胞重编程用于医疗,期望作为材料的细胞可以在不实施侵袭的情况下从人体采取,并且可以在不被活体外的微生物污染的状态下采取。满足这些条件的细胞几乎仅限于外周血中的单核细胞,期望有适用于这些细胞的基因导入载体。

一般而言,借助由外部导入的基因将动物细胞重编程的效率非常低,然而,将该基因全部搭载于一个载体上,通过向细胞一次性导入使之表达,可提高其效率(专利文献3、专利文献4、非专利文献7、非专利文献8)。

此外,还已知通过增加在细胞重编程中使用的基因的数目,也会提高其效率。例如,已知在将小鼠成纤维细胞转换成诱导多能干细胞(ips细胞)的技术中,通过向oct4、sox2、klf4、c-myc这4个基因追加brg1和baf155这2个基因,共计使用6个基因,转换效率提高5倍(非专利文献9)。另外,已知在将人类成纤维细胞重编程为运动神经的技术中,通过向被称为lhx3、ascl1、brn2、myt1l的4个基因追加被称为hb9、isl1、ngn2的3个基因,共计使用7个基因,重编程效率提高100倍(非专利文献10)。

增加细胞重编程中使用的基因的数目,则不得不搭载的基因的大小也增大。以制作ips细胞的情况为例,klf4、oct4、sox2、c-myc这4个基因合计为4,774个碱基对,然而,如果追加上述brg1(5,040个碱基对)和baf155(3,318个碱基对)这2个基因,则合计为13,132个碱基对(非专利文献9)。此外,如果向klf4、oct4、sox2、c-myc这4个基因追加编码染色质重构因子的chd1基因(5,133个碱基对),则合计为9,907个碱基对,染色质重构因子在胚胎干细胞中特异性表达,预测将加速ips细胞的初始化;如果追加编码dna去甲基化酶的tet1基因(6,429个碱基对),则合计为11,203个碱基对。此外,在将人类成纤维细胞重编程为运动神经的技术中使用的lhx3、ascl1、brn2、myt1l、hb9、isl1、ngn2这7个基因合计为9,887个碱基对(非专利文献10)。

如上所述,为了提高细胞重编程的效率,期望使用至少6个以上的基因,并且期望可以一次性搭载所有这些基因的载体。另外,导入的外源基因的大小共计为5,000个碱基以上,因而期望即使是8,000个碱基以上也能进行表达的载体。

另外,在本说明书中,载体是指以包含外源基因的核酸作为成分,可以将该核酸导入动物细胞并表达该基因的基因重组病毒或非病毒性的核酸·高分子物质复合体。

另外,已知在使外源基因表达而进行动物细胞的重编程的情况下,该基因的表达水平对通过重编程制作的细胞的性质产生很大影响。例如,已知在使被称为oct4、sox2、klf4、c-myc的4个基因在小鼠成纤维细胞中表达的情况下,在该基因表达弱的情况下产生ips细胞,与之相对,在该基因表达强的情况下产生与ips细胞性质完全不同的细胞(非专利文献11)。因此,在使由外部导入的基因表达而对包括人类细胞在内的动物细胞进行重编程的技术中,能够根据目的将该基因的表达设定为最适水平的载体是必要的。

3.重编程用基因的去除

进一步地,为了使通过由外部导入基因进行细胞重编程而制作的细胞完全发挥其功能,将该重编程用基因从该细胞完全去除是必要的。另外,在将制作的人类细胞作为再生医疗的材料使用时,为了确保安全性,将该基因从该细胞完全去除也是必要的。例如,在使用oct4、sox2、klf4、c-myc这4个基因制作的诱导多能干细胞(ips细胞)中,因为这4个基因维持表达时不能发挥多能性,所以,相比至少完全抑制其表达,更期望的是需要从该细胞完全去除(专利文献1、专利文献2、专利文献3、非专利文献1、非专利文献2、非专利文献7)。另外,已知制作ips细胞时使用的c-myc基因若残留在该ips细胞中,则使该ips细胞再分化而制作的组织细胞会以高频率发生癌变(非专利文献12)。因此,为了确保安全性,需要将该c-myc基因从ips细胞完全去除。

如上所述,在细胞重编程中必要的基因表达技术必须兼顾下述矛盾的性质:一方面为了实现重编程而期望最适水平的持续的基因表达;另一方面要求一旦重编程完成可简单且完全地去除。

4.避免先天免疫机制激活的重要性

现在,就用于动物细胞的几乎所有的基因导入、表达载体而言,以感染动物的病毒或使用大肠杆菌等微生物制造的质粒dna作为材料使用。但是,为了击退由外部侵入的病原体,动物细胞具备先天免疫机制(非专利文献13),从细胞外导入的源自病毒或微生物的核酸作为异物被识别,激活先天免疫机制。先天免疫机制的激活程度超过一定水平,则通过细胞凋亡诱导细胞死亡,导致重编程效率降低。另外,通过先天免疫机制的激活诱导干扰素或炎性细胞因子的表达时,在活体内引起炎症。为了防止此类不期望的反应,在进行细胞重编程的基因导入、表达技术中,要求避免先天免疫机制的激活。特别是对于在前述1.所述的包括活体内的细胞重编程在内的再生医疗的应用中,该性质很重要。

5.理想的用于细胞重编程的基因导入、表达系统

通过以上的探讨,为了将使用基因对包括人类细胞在内的动物细胞进行重编程的技术进行进一步改良而应用于产业中,如上述1.~4.所探讨的,至少满足以下5个条件的基因导入、表达技术是必要的。

(1)可将外源基因有效导入包括人类外周血细胞在内的动物细胞。

(2)可在必要的任意期间持续表达该基因。

(3)在该基因表达时,可避免细胞所具有的先天免疫机制。

(4)即使导入的外源基因长度合计为5,000个碱基以上、期望为8,000个碱基以上,仍可表达。

(5)可同时表达至少6个、期望为8个以上的该基因。

而且,进一步强烈期望还实现以下方面。

(6)可调节该基因的表达水平。特别是,在导入基因为多个的情况下,优选可分别调节各基因的表达水平。

另外,尤其在将基因导入细胞应用于移植技术的情况下,以下方面也成为极重要的要点。

(7)在该基因变为不需要时,可通过简单的方法去除。

6.向动物细胞导入多个基因的技术

这是向包括人类细胞在内的动物细胞由外部导入多个基因并在该细胞中持续表达的技术,作为已报道的可使用于细胞重编程的技术,已知有以下3种:

(1)将该基因插入存在于细胞核内的基因组dna中的方法;

(2)将该基因搭载于在细胞核内可与基因组dna独立且稳定地存在的dna中的方法;

(3)将该基因搭载于存在于细胞质的rna中的方法。

6-1.将多个基因插入细胞核内的基因组dna中的方法

就使用慢病毒载体(非专利文献8、非专利文献14)、转座子(非专利文献15、非专利文献16)、非同源重组、同源重组等将外源基因插入存在于细胞核内的基因组dna中的方法而言,该基因可与基因组dna同等且稳定地存在。但是,一旦被插入基因组dna,为了仅将该基因从基因组dna选择性地去除,除了需要将序列特异性重组酶导入细胞等繁杂的操作之外,并不能在所有细胞中确实地去除(非专利文献15)。另外,向基因组dna插入外源基因需要宿主细胞的dna复制,因此,向血液细胞等增殖能力低的细胞导入基因的效率极低。进一步地,已知通过将外源基因随机插入基因组dna引起宿主的基因破坏或异常激活的被称为“插入突变”的现象,因此,为了进行医疗应用,尚存在安全性的顾虑(非专利文献17)。

6-2.在细胞核内将多个基因搭载于与基因组dna独立的dna中的方法

作为在细胞核内将外源基因搭载于可与基因组dna独立且稳定存在的dna中的方法,已知使用搭载epstein-barr病毒的基因组的复制起点的环状dna的方法(非专利文献18);以及使用包含直链巨大dna的人工染色体的方法(非专利文献19)。这些dna分子在人类细胞的细胞核内持续且稳定地维持复制,然而,该机制依赖于宿主细胞基因组dna进行复制的机制。因此,不能仅特异性地抑制搭载外源基因的dna的复制,而且尚未报道将该dna从细胞主动去除的技术。另外,为了将该dna分子导入细胞核内,宿主细胞的分裂是必要的,因此,向血液细胞等增殖能力低的细胞导入基因的效率极低。另外,已知细胞核内的环状dna高频率地并入该细胞的基因组dna,因此,不能排除插入突变的危险性(非专利文献20)。

6-3.由同一载体dna表达多个基因的技术

另外,在如上述6-1.和6-2.所记载的将dna作为基因表达的平台使用的情况下,由同一载体dna表达多个基因的技术是必要的。作为该技术,已知有以下3种:1)将多个独立的基因简单地连接后进行表达的方法;2)使用被称为内部核糖体进入位点(ires)的rna结构,由一条信使rna(mrna)表达多个蛋白质的方法;3)将多个蛋白质通过2a肽连接而表达融合蛋白的方法。

就将多个独立的基因进行连接的方法而言,已知由于基因间的相互干扰而使得基因表达受到强烈抑制(非专利文献21)。为了防止上述情况,需要在基因之间插入被称为绝缘子的结构,在使载体dna的大小变大的同时,结构也变得复杂。就该方法而言,报道了将4个基因搭载于1个dna分子中使之表达的实例(非专利文献22),然而,尚未报道将5个以上基因同时表达的实例。

就使用ires序列由一条信使rna(mrna)表达多个蛋白质的方法而言,置于ires序列下游的蛋白质的翻译效率比置于ires序列上游的蛋白质的翻译效率低,有时为10%以下(非专利文献23)。另外,因为ires序列的大小较大且结构复杂,所以,使用ires序列的方法主要用于同时表达2个蛋白质。

2a肽是在正单链rna病毒中发现的由18至22个氨基酸残基构成的结构,多个蛋白质通过2a肽连接而成的融合蛋白在合成时自动断开,分解为原来的多个蛋白质。就该技术而言,在断开后产生的各蛋白质的n末端残留有1个脯氨酸,c末端残留有17至21个氨基酸残基,这些多余的氨基酸残基具有对该蛋白质的功能产生影响的可能性(非专利文献24)。另外,在2a肽部位的断开效率受到融合蛋白结构的巨大影响,因此,为了高效制作多个蛋白质,付出劳动来试错是必要的(非专利文献25)。就通过2a肽连接多个蛋白质的方法而言,报道了同时表达4个蛋白质的实例(非专利文献8)以及同时表达5个蛋白质的实例(非专利文献16)。另外,也报道了将ires序列与2a肽组合而表达4个蛋白质的实例(非专利文献14)。

6-4.将多个基因搭载于存在于细胞质的rna中的方法

如前述6-1.~6-3.所记载的,就将dna作为基因表达平台使用的目前的基因导入、表达技术而言,报道了使用4个至5个基因的细胞重编程。但是,限于将dna作为基因表达的平台使用,不能容易地同时搭载6个以上基因,并且不能容易地通过简单的方法实现基因的去除,也尚未报道可全部满足前述5.所示的理想的重编程中所要求的5个条件的技术。

另一方面,作为将rna作为平台将多个基因由外部导入包括人类细胞在内的动物细胞并表达并将细胞进行重编程的技术,报道了使用正链rna的技术(非专利文献26、非专利文献27);以及使用负链rna的技术(专利文献3、专利文献4、专利文献5、专利文献6、非专利文献7、非专利文献28、非专利文献29、非专利文献30)。

6-4-1.使用正链rna的方法

作为使用可在细胞质中稳定存在的正链rna对细胞进行重编程的技术,已报道了使用源自委内瑞拉马脑炎病毒(veev)的正单链基因组rna的技术(非专利文献26)。就该技术而言,通过将veev的基因组rna3ˊ侧的结构基因替换成编码由2a肽连接的蛋白质的基因,实现了4个蛋白质的表达。该系统引起非常强的干扰素表达的诱导,必须与抗干扰素物质(源自痘苗病毒的b18r蛋白质)进行组合(非专利文献26)。另外,基因导入的效率依赖于进行组合的基因导入试剂,重编程的可能性被限定于成纤维细胞等贴壁细胞。搭载外源基因的rna是不稳定的,因此,b18r蛋白质被从培养基去除而消失。

作为使用正链rna对细胞进行重编程的技术,也报道了使用化学合成的信使rna(mrna)的技术(非专利文献27)。因为该现有技术是将各自分别搭载最多5个外源基因的多个mrna混合,然后使用基因导入试剂导入细胞,所以基因表达是瞬时的,因此,每天向该细胞重新进行导入是必要的。另外,基因导入的可能性限于成纤维细胞等贴壁细胞。在该技术中还强烈激活先天免疫机制,因此,与抗干扰素物质(源自痘苗病毒的b18r蛋白质)进行组合是必要的(非专利文献27)。

6-4-2.使用负链rna的方法

作为使用负链rna对细胞进行重编程的技术,作为现有技术已报道了在作为一种副粘病毒的仙台病毒野生株中将分别搭载外源基因的载体混合使用的方法(专利文献5、非专利文献28、非专利文献29);以及同时搭载3个基因的方法(专利文献6、非专利文献30)。就使用这些负链rna的基因表达系统而言,因为缺失f基因,野生型病毒的自主复制能力减弱,外源基因分别作为单独的基因表达盒被搭载。没有记载关于先天免疫机制的激活,然而,已知作为材料的仙台病毒具有强烈的干扰素诱导能力(非专利文献31),因此,预测该载体也具有基于此的先天免疫机制激活能力。另外,报道了在野生型病毒的基因组中导入温度敏感型突变,使培养温度升高可以去除载体(专利文献6、非专利文献29、非专利文献30)。已报道了使用基于野生型仙台病毒的载体可表达的基因的大小为3078个碱基对(大肠杆菌β-半乳糖苷酶)(非专利文献32)至3450个碱基对(klf4、oct4、sox2这3个基因的合计)(专利文献6、非专利文献30)。

另外,作为使用负链rna对细胞进行重编程的技术,已报道了基于持续感染突变仙台病毒的技术(专利文献3、专利文献4、非专利文献7)。在该技术中,在成为载体材料的病毒基因组中,已确认与长期持续性相关的多个点突变,显示这些突变与避免先天免疫机制激活(干扰素表达的降低)相关。另外,通过从病毒基因组删除3个基因后搭载新基因,可使4个外源基因同时表达。进一步地,报道了通过用小干扰rna(shortinterferingrna,sirna)抑制编码rna依赖性rna合成酶的l基因的表达,主动将载体从细胞去除。就基于持续感染突变仙台病毒的载体而言,报道了可表达的基因的大小为4774个碱基对(klf4、oct4、sox2、c-myc这4个基因的合计)(专利文献3、专利文献4、非专利文献7)。

7.多个基因导入技术的今后的课题

就前述6-4.所述的将rna作为基因表达平台使用的目前的基因导入、表达技术而言,报道了使用4个至5个基因的细胞重编程。其中,前述6-4-2.所述的缺失持续表达型仙台病毒载体具有最优异的性质,然而,已报道的可搭载的基因的数目为最多4个。另外,就将rna病毒作为材料的技术而言,很难使基因表达水平发生变化。

如前述6.所述,由外部将多个基因导入包括人类细胞在内的动物细胞并在该细胞中持续表达的技术的目标是针对使用基因将正常组织细胞的性质进行转换并制作有用细胞的细胞重编程进行优化,进行各种改良。但是,完全满足如前述5.所示的理想的重编程所要求的5个条件的技术迄今未见报道。

现有技术文献

专利文献

专利文献1:wo2007/069666

专利文献2:wo2008/118820

专利文献3:wo2010/134526

专利文献4:wo2012/063817

专利文献5:wo2010/008054

专利文献6:wo2012/029770

专利文献7:美国专利第8,326,547号说明书

专利文献8:美国专利第8,401,798号说明书

专利文献9:美国专利第7,561,973号说明书

非专利文献

非专利文献1:takahashi等,cell,131,861-872,2007

非专利文献2:yu等,science,318,1917-1920,2007

非专利文献3:huang等,cellstemcell,14,370-384,2014

非专利文献4:son等,cellstemcell,9,205-218,2011

非专利文献5:qian等,nature,485,593-598,2012

非专利文献6:song等,nature,485,599-604,2012

非专利文献7:nishimura等,j.biol.chem.,286,4760-4771,2011

非专利文献8:carey等,proc.natl.acad.sci.usa,106,157-162,2009

非专利文献9:singhal等,cell,141,943-955,2010

非专利文献10:son等,cellstemcell,9,205-218,2011

非专利文献11:tonge等,nature,516,192-197,2014

非专利文献12:miura等,naturebiotechnology,27,743-745,2009

非专利文献13:randall,j.genvirol.,89,1-47,2008

非专利文献14:sommer等,stemcells,28,64-74,2010

非专利文献15:kaji等,nature,458,771-775,2009

非专利文献16:grabundzjia等,nuc.acidsres.,41,1829-1847,2013

非专利文献17:hacein-bey-abina等,science,302,415-419,2003

非专利文献18:wu等,proc.natl.acad.sci.usa,111,10678-10683,2014

非专利文献19:hiratsuka等,plosone,6,e25961,2011

非专利文献20:hurley等,j.virol.,65,1245-1254,1991

非专利文献21:yahata等,j.mol.biol.,374,580-590,2007

非专利文献22:nishiumi等,cellstruct.funct.,34,47-59,2009

非专利文献23:balvay等,biochi.biophys.acta,1789,542-557,2009

非专利文献24:felipe等,trendsbiotech.,24,68-75,2006

非专利文献25:lengler等,anal.biochem.,343,116-124,2005

非专利文献26:yoshioka等,cellstemcell,13,246-254,2013

非专利文献27:warren等,cellstemcell,7,1-13,2010

非专利文献28:fusaki等,proc.jpn.acad.ser.b85,348-362,2009

非专利文献29:ban等,proc.natl.acad.sci.usa,108,14234-14239,2011

非专利文献30:fujie等,plosone,9,e113052,2014

非专利文献31:hua等,j.leukocytebiol.,60,125-128,1996

非专利文献32:sakai等,febslett.,456,221-226,1999

非专利文献33:kondo等,j.biol.chem.,268,21924-21930,1993

非专利文献34:ward等,proc.natl.acad.sci.usa,108,331-336,2011

非专利文献35:saito等,nature,454,523-527,2008

非专利文献36:vabret等,plosone,7,e33502,2012

非专利文献37:rehwinkel等,cell,140,397-408,2010

非专利文献38:shioda等,nuc.acidsres.,14,1545-1563,1986

非专利文献39:vidal等,j.virol.,64,239-246,1990

非专利文献40:irie等,j.virol.,86,7136-7145,2012

非专利文献41:kato等,emboj.,16,578-587,1997

非专利文献42:tapparel等,j.virol.,72,3117-3128,1998

非专利文献43:park等,proc.natl.acad.sci.usa,88,5537-5541,1991

非专利文献44:harty等,j.virol.,69,5128-5131,1995

非专利文献45:willenbrink等,j.virol.,68,8413-8417,1994

非专利文献46:sharp等,nuc.acidsres.,15,1281-1295,1987

非专利文献47:guigo等,j.mol.biol.,253,51-60,1995

非专利文献48:vabret等,j.virol.,88,4161-4172,2014

非专利文献49:raab等,syst.synth.biol.,4,215-225,2010

非专利文献50:alan,h.,gene,56,125-135,1987

非专利文献51:kuo等,j.virol.,62,4439-4444,1988

非专利文献52:sengupta等,j.biol.chem.,264,14246-14255,1989

非专利文献53:melton等,nuc.acidsres.,12,7035-7056,1984

非专利文献54:hampel,a.等,biochemistry,28,4929-4933,1989

非专利文献55:tuschl等,genesdev.,13,3191-3197,1999

非专利文献56:chang等,j.bacteriol.,134,1141-1156,1978

非专利文献57:garcin等,emboj.,14,6087-6094,1995

非专利文献58:gotoh等,virology,171,434-443,1989

非专利文献59:lopez等,mol.microbiol.,33,188-199,1999

非专利文献60:kozak,cell,44,283-292,1986

非专利文献61:kozak,mol.cellbiol.,7,3438-3445,1987

非专利文献62:vara等,gene,33,197-206,1985

非专利文献63:nakajima等,biosci.biotechnol.biochem.,68,565-570,2004

非专利文献64:ai等,biochemistry,46,5904-5910,2007

非专利文献65:drocourt等,nuc.acidsres.,18,4009,1990

非专利文献66:kogure等,nat.biotechnol.,24,577-581,2006

非专利文献67:gritz等,gene,25,179-188,1983

非专利文献68:studier等,j.mol.biol.,189,113-130,1986

非专利文献69:nawa等,biol.pharm.bull,21,893-898,1998

非专利文献70:karasawa等,biochem.j.,381,307-312,2004

非专利文献71:yoneyama等,natureimmunol.,5,730-737,2004

非专利文献72:sakaguchi等,microbiol.immunol.,55,760-767,2011

非专利文献73:jia等,j.immunol.,183,4241-4248,2009

非专利文献74:studier等,j.mol.biol.,189,113-130,1986

非专利文献75:akagi等,proc.natl.acad.sci.usa,100,13567-13572,2003

非专利文献76:hatsuzawa等,j.biol.chem.,265,22075-22078,1990

非专利文献77:boshart等,cell,41,521-530,1985

非专利文献78:taira等,arch.virol.,140,187-194,1995

非专利文献79:takebe等,mol.cellbiol.,8,466-472,1988

非专利文献80:recillas-targa等,proc.natl.acad.sci.usa,99,6883-6888,2002

非专利文献81:fujita等,cell,41,489-496,1985

非专利文献82:yi和lemon,j.virol.,77,3557-3568,2003

非专利文献83:you和rice,j.virol.,82,184-195,2008

非专利文献84:chromikova等,cytotechnology,67,343-356,2015

非专利文献85:brandlein和vollmers,histol.histopathol.,19,897-905,2004

非专利文献86:okada等,microbiol.immunol.,49,447-459,2005

非专利文献87:lewis等,naturebiotech.,32,191-198,2014

非专利文献88:wurm.,naturebiotech.,22,1393-1398,2004



技术实现要素:

发明所要解决的技术问题

如上所述,本发明所要解决的技术问题之一是开发为了使用基因将包括人类细胞在内的动物细胞进行重编程而所期望的基因导入、表达技术以及用于该技术的载体。进一步地,本发明提供可搭载不限于重编程基因的全长为5,000个碱基以上或至少6个以上的外源基因并且在动物细胞中既不激活先天免疫机制又可持续表达的载体。同时,本发明还提供用于在载体上搭载6个以上外源基因的有效方法。

并且,本发明提供特别是对于重编程技术而言所期望的满足以下(1)~(5)的条件、优选进一步满足包括(6)、(7)的条件的基因导入、表达技术。

(1)可将外源基因有效导入包括人类外周血细胞在内的动物细胞。

(2)可在必要的任意期间持续表达该基因。

(3)在该基因表达时,可避免细胞所具有的先天免疫机制。

(4)即使导入的外源基因长度合计为5,000个碱基以上、期望为8,000个碱基以上,仍可表达。

(5)可同时表达至少6个、期望为8个以上的该基因。

(6)可调节该基因的表达水平。特别是,在导入基因为多个的情况下,可分别调节。

另外,特别是在应用于移植技术的情况下,以下方面也成为重要的要点。

(7)在该基因变为不需要时,可通过简单的方法去除基因表达系统。解决技术问题的技术手段

如背景技术的6-1.~6-3.所述,在将dna作为基因表达的平台使用的情况下,具备作为本发明所要解决的技术问题所显示的理想的重编程所要求的全部5个条件、更优选全部7个条件,这在原理上是极为困难的。另一方面,如6-4.所述,在将rna作为基因表达的平台使用的情况下,在将可搭载于同一载体上的基因数的上限提高至6个以上且将全基因长度提高至5,000个碱基以上的同时,如何避免源自病毒的rna引起细胞内的先天免疫机制激活的问题,成为最大的课题。

在此,本发明将源自不激活先天免疫机制的动物细胞的mrna作为材料使用,首先设计将这些rna与rna依赖性rna合成酶识别的转录起始信号、转录终止信号、复制起点组合的负单链rna。接着,将编码rna依赖性rna合成酶等转录和复制必需的4个蛋白质的基因进行结构优化,使之不被先天免疫机制作为异物识别,然后搭载于该负单链rna上。进一步地,开发使用5种限制性酶将10个基因按照设计进行结合的新方法,将与这10个基因互补的crna搭载于上述负单链rna上。

通过将经上述方法完成的负单链rna作为基因表达的平台使用,成功搭载至少10个外源基因(合计大小为至少13,500个碱基),并且既不激活先天免疫机制又可长时间持续表达。进一步地,通过改变基因表达所必需的n蛋白或c蛋白的表达效率,可以使搭载的基因的表达在最大80倍的范围内进行调节。如上所述,通过尽可能排除具有源自病毒的结构的rna,成功地制作了大幅超过使用rna病毒的基因组的现有基因表达系统的能力界限的新的基因表达系统。

进一步地,在具有本发明所制作的搭载外源基因的负单链rna的细胞中,按照专利文献3和非专利文献33、非专利文献7所记载的方法,通过表达副粘病毒的外膜蛋白和基质蛋白,将该rna分子进行包封,制作了具有导入其它细胞的活性的颗粒。在包括人类血液细胞在内的各种动物细胞中,该颗粒在将先天免疫机制的激活抑制为低的同时,可以持续表达搭载于该rna分子上的10个基因。进一步地,通过将与搭载于该rna分子上的经结构优化的rna依赖性rna合成酶的基因互补的sirna导入该细胞,可将搭载外源基因的rna分子去除。通过上述方法,确认除了可解决“发明所要解决的技术问题”中所示的(1)~(5)的5个技术问题之外,解决了还包含前述优选情况的技术问题(6)、(7)在内的全部7个技术问题,从而完成了本发明。

本发明中使用的rna分子缺失用于先天免疫机制作为“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pathogen-associatedmolecularpattern,pamp)”进行识别所必需的特异性结构,因此,显示难以被先天免疫机制捕捉的“隐身(stealth)性”。因此,以后将该rna分子称为“具有隐身性的rna”,将使用该rna作为材料的基因表达系统称为“隐身型rna基因表达系统”,将包封该基因表达系统并具有将该基因表达系统导入动物细胞的活性的构建体称为“隐身型rna载体”。

也就是说,本发明如下。

[1]一种隐身型rna基因表达系统,所述隐身型rna基因表达系统是由包含下述(1)~(8)的rna序列的负单链rna(a)、单链rna结合蛋白(b)和rna依赖性rna合成酶(c)构成的不使先天免疫机制激活的复合体:

(1)编码任意蛋白质或功能性rna的目标rna序列;

(2)构成非编码区的源自在动物细胞中表达的mrna的rna序列;

(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;

(4)该酶所识别的转录终止信号序列;

(5)包含该酶所识别的复制起点的rna序列;

(6)编码该酶的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;

(7)编码调节该酶活性的蛋白质的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;

(8)编码前述单链rna结合蛋白的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列。

此处,典型的导入对象细胞是人类细胞,因此其优选情况可记载如下。

[1’]一种隐身型rna基因表达系统,其是由包含下述(1)~(8)的rna序列的负单链rna(a)、单链rna结合蛋白(b)和rna依赖性rna合成酶(c)构成的不使先天免疫机制激活的复合体:

(1)编码任意蛋白质或功能性rna的目标rna序列;

(2)构成非编码区的源自人类mrna的rna序列;

(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;

(4)该酶所识别的转录终止信号序列;

(5)包含该酶所识别的复制起点的rna序列;

(6)编码该酶的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;

(7)编码调节该酶活性的蛋白质的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;

(8)编码前述单链rna结合蛋白的rna序列,并且是针对人类细胞进行了密码子优化的rna序列。

[2]如前述[1]所记载的隐身型rna基因表达系统,其中,前述(1)的目标rna序列是包含至少6个基因或全长为5000个碱基以上长度的rna序列。

此处,目标rna序列是可包含7~10个基因且全长为5,000~15,000个碱基长度的rna序列。

[3]如前述[1]或[2]所记载的隐身型rna基因表达系统,其中,前述(2)的rna序列是人类基因的mrna序列中的5~49个碱基长度的rna序列。

此处,作为前述人类基因的mrna序列,优选为人类管家基因的mrna序列,更优选为人类管家基因的mrna序列中的非编码区序列,例如可使用表1所记载的rna序列或其中的连续的5~49个碱基长度的部分序列,或者将其多个连接使用。

[4]如前述[1]~[3]中任一项所记载的隐身型rna基因表达系统,其特征在于,由相同或不同序列构成的前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的各基因序列的3ˊ末端侧和/或5ˊ末端侧。

[5]如前述[1]~[4]中任一项所记载的隐身型rna基因表达系统,其特征在于,

前述(6)的rna序列所编码的rna依赖性rna合成酶是源自属于副粘病毒科的rna病毒的l蛋白和p蛋白;

前述(7)的rna序列所编码的调节该酶活性的蛋白质是源自与该rna病毒相同的病毒的c蛋白;

前述(8)的rna序列所编码的单链rna结合蛋白是源自与该rna病毒相同的病毒的np蛋白;并且

前述(3)~(5)的rna序列中的任一者都是包含源自与该rna病毒相同的病毒的基因组序列中的转录起始信号、转录终止信号和复制起点的rna序列。

[6]如前述[5]所记载的隐身型rna基因表达系统,其中,编码前述l蛋白、p蛋白、c蛋白和np蛋白的rna序列针对人类细胞进行了优化,并且其gc含量被调节在50~60%的范围内。

[7]如前述[6]所记载的隐身型rna基因表达系统,其中,前述属于副粘病毒科的rna病毒是选自于仙台病毒、人副流感病毒和新城疫病毒中的任一者的rna病毒。

[8]如前述[1]~[7]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(3)的转录起始信号序列是选自于3ˊ-ucccacuuuc-5ˊ(序列号1)、3ˊ-ucccuauuuc-5ˊ(序列号2)、3ˊ-ucccacuuac-5ˊ(序列号3)、3ˊ-uccuaauuuc-5ˊ(序列号7)和3ˊ-ugcccaucuuc-5ˊ(序列号9)中的任一者所示的rna序列的rna序列;前述(4)的转录终止信号序列是选自于3ˊ-aauucuuuuu-5ˊ(序列号4)、3ˊ-cauucuuuuu-5ˊ(序列号5)、3ˊ-uauucuuuuu-5ˊ(序列号6)和3ˊ-uuauucuuuuu-5ˊ(序列号8)中的任一者所示的rna序列的rna序列。

[9]如前述[4]~[8]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的各基因序列的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的rna序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标rna序列中所包含的各基因序列的5ˊ末端侧相邻接的rna序列的更5ˊ末端侧。

[10]如前述[7]~[9]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(5)的包含复制起点的rna序列包含下述序列:

(a)3ˊ-uggucuguucuc-5ˊ(序列号11)或3ˊ-ugguuuguucuc-5ˊ(序列号12)所示的rna序列;

(b)3ˊ-gagaacagacca-5ˊ(序列号13)或3ˊ-gagaacaaacca-5ˊ(序列号14)所示的rna序列;

(c)3ˊ-(cnnnnn)3-5ˊ(序列号15)所示的rna序列;

(d)3ˊ-(nnnnng)3-5ˊ(序列号16)所示的rna序列。

[11]如前述[10]所记载的隐身型rna基因表达系统,其特征在于,前述(a)的rna序列位于负单链rna(a)的3ˊ末端,并且前述(b)的rna序列位于5ˊ末端。

[12]如前述[10]或[11]所记载的隐身型rna基因表达系统,其特征在于,前述(c)的rna序列从负单链rna(a)的3ˊ末端起第79个碱基开始,并且前述(d)的rna序列从5ˊ末端起第96个碱基开始。

[13]如前述[10]~[12]中任一项所记载的隐身型rna基因表达系统,其特征在于,前述(5)的包含复制起点的rna序列进一步在负单链rna(a)的3ˊ末端起第97~116个碱基的位置包含(e)3ˊ-aaagaaacgacgguuuca-5ˊ(序列号17)的rna序列或具有与其相同碱基长度的18个碱基长度的rna序列。

[14]一种不使先天免疫机制激活的隐身型rna载体,其中,该隐身型rna载体为包含构成前述[1]~[13]所记载的隐身型rna基因表达系统的复合体、具有将该复合体导入动物细胞的活性的rna载体。

[15]如前述[14]所记载的隐身型rna载体,其中,该隐身型rna载体形成对动物细胞具有感染能力的病毒颗粒。

[16]导入前述[14]或[15]所记载的隐身型rna载体的动物细胞。

[17]一种隐身型rna,所述隐身型rna是包含下述(1)~(8)的rna序列的负单链rna(a),并且可以与单链rna结合蛋白(b)和rna依赖性rna合成酶(c)一起形成不使先天免疫机制激活的复合体:

(1)编码任意蛋白质或功能性rna的目标rna序列;

(2)构成非编码区的先天免疫机制不能识别的rna序列;

(3)rna依赖性rna合成酶所识别的转录起始信号序列;

(4)该酶所识别的转录终止信号序列;

(5)包含该酶所识别的复制起点的rna序列;

(6)编码该酶的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;

(7)编码调节该酶活性的蛋白质的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;

(8)编码单链rna结合蛋白的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列。

本发明还包括以下实施方式。

[17’]一种隐身型rna,所述隐身型rna是包含下述(1)~(8)的rna序列的负单链rna(a),并且可以与单链rna结合蛋白(b)和rna依赖性rna合成酶(c)一起形成不使先天免疫机制激活的复合体:

(1)编码任意蛋白质或功能性rna的目标rna序列;

(2)构成非编码区的源自在动物细胞中表达的mrna的rna序列;

(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;

(4)该酶所识别的转录终止信号序列;

(5)包含该酶所识别的复制起点的rna序列;

(6)编码该酶的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;

(7)编码调节该酶活性的蛋白质的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列;

(8)编码前述单链rna结合蛋白的rna序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的rna序列。

[17”]一种隐身型rna,所述隐身型rna是包含下述(1)~(8)的rna序列的负单链rna(a),并且可以与单链rna结合蛋白(b)和rna依赖性rna合成酶(c)一起形成不使先天免疫机制激活的复合体:

(1)编码任意蛋白质或功能性rna的目标rna序列;

(2)构成非编码区的源自人类mrna的rna序列;

(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;

(4)该酶所识别的转录终止信号序列;

(5)包含该酶所识别的复制起点的rna序列;

(6)编码该酶的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;

(7)编码调节该酶活性的蛋白质的rna序列,并且是针对人类细胞进行了密码子优化的rna序列;

(8)编码前述单链rna结合蛋白的rna序列,并且是针对人类细胞进行了密码子优化的rna序列。

[18]如前述[17]所记载的隐身型rna,其中,在前述负单链rna(a)的3ˊ末端侧和5ˊ末端侧包含前述(5)的包含rna依赖性rna合成酶所识别的复制起点的rna序列,并且是分别与3ˊ末端侧的rna序列和5ˊ末端侧的rna序列互补的rna序列。

[19]如前述[17]或[18]所记载的隐身型rna,其特征在于,前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的rna序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标rna序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的rna序列的更5ˊ末端侧。

[20]如前述[17]~[19]中任一项所记载的隐身型rna,其特征在于,前述(2)的rna序列被配置为邻接于前述(1)的目标rna序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的rna序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标rna序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的rna序列的更5ˊ末端侧;进一步地,在其两端构成具有多个可通过限制性酶进行酶切的限制性酶酶切位点的盒结构,多个该盒结构结合在一起。

[21]一种重构隐身型rna基因表达系统的方法,所述方法是包括下述(1)~(5)的步骤的方法:

(1)准备表达t7rna聚合酶的大肠杆菌的步骤;

(2)将搭载前述[1]~[13]中任一项所记载的负单链rna(a)以及至少编码rna依赖性rna合成酶和rna结合活性蛋白的rna的大肠杆菌用载体、以及表达编码rna结合活性蛋白的dna的大肠杆菌用载体导入(1)的大肠杆菌宿主内的转化步骤;

(3)在(2)的转化大肠杆菌内,形成负单链rna与rna结合活性蛋白的复合体的步骤,该负单链rna包含通过t7rna聚合酶使之表达的外源基因rna;

(4)准备表达rna依赖性rna合成酶的动物细胞的步骤;

(5)将由(3)得到的负单链rna与rna结合活性蛋白的复合体导入(4)的动物细胞宿主内,重构由负单链rna、rna结合活性蛋白和rna依赖性rna合成酶的复合体所构成的隐身型rna基因表达系统的步骤。

[22]一种串联型盒,所述串联型盒是具有2个克隆位点a、b的基于dna的串联型盒,其中,

该串联型盒从5ˊ末端侧开始依次由(1)多聚化部位a、(2)转录起始信号a、(3)非编码序列a1、(4)克隆位点a、(5)非编码区a2、(6)转录终止信号a、(7)转录起始信号b、(8)非编码序列b1、(9)克隆位点b、(10)非编码区b2、(11)转录终止信号b和(12)多聚化部位b构成;

前述(1)多聚化部位a和(12)多聚化部位b分别包含限制性酶识别序列和/或部位特异性重组酶识别序列,彼此为相同或不同的dna;

前述(2)转录起始信号a和(7)转录起始信号b在被转录为rna的情况下分别包含rna依赖性rna合成酶所识别的转录起始信号,彼此为相同或不同的dna;

前述(3)非编码序列a1、(5)非编码区a2、(8)非编码序列b1和(10)非编码区b2在被转录为rna的情况下分别成为不被宿主细胞的先天免疫机制识别的rna,彼此为相同或不同的dna;

前述(4)克隆位点a和(9)克隆位点b分别包含一个以上的限制性酶识别序列和/或部位特异性重组酶识别序列,彼此为相同或不同的dna;

前述(6)转录终止信号a和(11)转录终止信号b在被转录为rna的情况下分别包含rna依赖性rna合成酶所识别的转录终止信号,彼此为相同或不同的dna。

[23]如前述[22]所记载的串联型盒,其中,

前述(4)克隆位点a从5ˊ末端侧开始依次包含限制性酶a识别序列和限制性酶c识别序列,

前述(9)克隆位点b从5ˊ末端侧开始依次包含限制性酶d识别序列和限制性酶b识别序列,

其中,限制性酶a和限制性酶d是产生相同序列的单链突出末端的限制性酶,限制性酶c和限制性酶b是产生相同序列的单链突出末端的限制性酶。

[24]如前述[22]或[23]所记载的串联型盒,其中,前述(1)多聚化部位a和(12)多聚化部位b中的任一者都是包含产生nn或nnn表示的序列的任意单链突出末端的限制性酶识别序列的dna。

[25]如前述[22]~[24]中任一项所记载的串联型盒,其中,

前述(3)非编码序列a1、(5)非编码区a2、(8)非编码序列b1和(10)非编码区b2分别为与源自在动物细胞表达的mrna的rna序列的部分序列相对应的相同或不同的cdna;

在前述(4)克隆位点a和(9)克隆位点b中插入相同或不同的源自人类的基因。

发明效果

本发明的隐身型rna基因表达系统因为难以被先天免疫机制捕捉,所以细胞毒性极低,可搭载10个基因并导入各种组织细胞,可在必要的期间始终持续表达。另外,在本发明中被称为可避免先天免疫机制或不被免疫机制识别时,是指导入的基因或为此目的的载体等不实质性地刺激宿主的先天免疫。具体而言,是指将干扰素β诱导能力作为指标,将正常细胞中ifn-βmrna的表达量设为1.0时,为30以下,优选为20以下,更优选为10以下。

另外,隐身型rna基因表达系统在细胞质发挥功能,因此,如果使用将该基因表达系统包封的隐身型rna载体,导入不具有增殖能力且没有进行细胞分裂的外周血细胞,可以表达搭载基因。进一步地,能够以最大80倍的倍率选择表达强度不同的基因表达系统,可在成为不需要时通过抑制rna依赖性rna合成酶的活性而简单地去除。因此,本技术对于使用迄今为止不可能的6个以上基因,将包括人类细胞在内的动物细胞的性质有效地进行重编程的目的而言是最合适的。

例如,可以考虑将人类外周血细胞作为材料,应用在所谓不含动物成分(xeno-free)、不使用饲养细胞(feeder-free)的困难条件下,有效制作在再生医疗的临床应用中使用的高质量的ips细胞。另外,也可应用于被称为直接重编程的技术,使用6个以上基因由人类的组织细胞(血液、皮肤、胎盘等)制作神经细胞、神经干细胞、干细胞、胰β细胞等的有用基因。进一步地,因为引起细胞死亡或炎症的可能性低,所以也期待应用于使用也包括巨大基因在内的各种基因的基因治疗或利用活体内的重编程的再生医疗。

隐身型rna基因表达系统因为可同时搭载多个基因并以一定的比例表达,在由多个亚基构成的生物医药品的制造中也发挥效果。例如,在生产人类免疫球蛋白g的情况下,在同一细胞同时表达各亚基是必要的。此外,在生产人类免疫球蛋白g的情况下,期望h链和l链以1:1的比例在同一细胞同时表达;而在生产人类免疫球蛋白m的情况下,期望h链:l链:μ链以1:1:0.2的比例在同一细胞同时表达,隐身型rna基因表达系统可容易地满足这样的要求。

进一步地,隐身型rna基因表达系统可以改变基因表达的水平,因此,可容易地实现在生物医药品制造中必需的强基因表达。就迄今为止的使用动物细胞的生物医药品制造工序而言,必须建立并入染色体的基因的拷贝数增加的稳定细胞株,这是必须耗费大量时间和劳动的过程,然而,如果采用隐身型rna基因表达系统,则不需要耗费这样的劳动。

另外,隐身型rna基因表达系统对于抑制在生物医药品的制造中成为问题的基因突变也发挥效果。近年来,已报道了引起rna病毒基因组突变的主要原因是细胞质的腺苷脱氨酶(作用于rna的腺苷脱氨酶,adar1)(非专利文献39)。adar1通过先天免疫机制的激活而被诱导,因此,就隐身型rna基因表达系统而言,可将adar1的诱导抑制至最小限度,从而抑制基因突变。

隐身型rna基因表达系统对于由多个亚基构成的药物研发靶标蛋白的表达而言也是最合适的。例如,为了表达药物研发靶标酶nadph氧化酶(nox2),同时表达gp91phox、p22phox、rac、p47phox、p67phox、p40phox这6个亚基是必要的,而隐身型rna基因表达系统可容易地实现。进一步地,如果使用隐身型rna载体,即使在因为不引起细胞分裂而使基因导入和表达困难的原代培养血管内皮细胞或神经细胞等靶标细胞中,也可表达药物研发靶标蛋白,可容易地实现目的。

另外,因为隐身型rna基因表达系统或隐身型rna载体引起细胞毒性或炎症的可能性低,所以,作为通过活体内的基因表达得到治疗效果的基因治疗平台的应用是可能的。特别是,因为可以搭载就以往的基因导入、表达载体而言不可能的血友病a的致病基因产物血液凝固因子viii的cdna(7053个碱基)或杜氏肌肉营养不良症的致病基因产物肌养蛋白(dystrophin)的cdna(11058个碱基)等巨大的基因并且持续表达,所以被期待作为这些疾病的基因治疗用载体而使用。

进一步地,本发明中,因为为了在载体上搭载6个以上、优选8个以上的外源基因而开发的使用串联型盒连接法的串联型盒是基于dna构建的,所以该方法不仅可应用于本发明的隐身型rna载体,还可广泛应用于普通的dna表达载体等。

附图说明

图1是表示负单链rna分子的结构的图,该负单链rna分子是将源自在动物细胞中表达的mrna的rna与rna依赖性rna合成酶所识别的转录起始信号、转录终止信号、复制起点进行组合而制作的。

图2是表示负单链rna分子复制时必需的核酸的3ˊ末端和5ˊ末端的结构的图。

图3是表示负单链rna分子复制时必需的核酸的3ˊ末端的结构的图。

图4是表示负单链rna分子复制时必需的核酸的5ˊ末端的结构的图。

图5是源自rna病毒的mrna中的密码子适应指数(codonadaptationindex)的解析。

图6是源自rna病毒的mrna中的gc含量的解析。

图7是表示在隐身型rna基因表达系统中搭载的外源基因cdna的设计方法的图。

图8是表示将2个外源基因cdna进行结合的方法的图。

图9是表示将10个外源基因cdna进行结合的方法的图。

图10是表示构建用于制作搭载10个外源基因的隐身型rna基因表达系统的模板cdna的方法的图。

图11是表示用于由模板cdna重构隐身型rna基因表达系统的第一方法的图。

图12是表示用于由模板cdna重构隐身型rna基因表达系统的第二方法的图。

图13是表示搭载10个外源基因cdna的隐身型rna基因表达系统的基因组结构的图。

图14是表示搭载10个外源基因cdna的隐身型rna基因表达系统的基因表达活性的图。

图15是表示通过与图13不同的方法将核酸的碱基序列进行优化而制作的搭载10个外源基因cdna的隐身型rna基因表达系统的基因组结构的图。

图16是表示通过改变n、c、pols(p)基因的布局而制作的搭载10个外源基因cdna的隐身型rna基因表达系统的基因组结构的图。

图17是表示隐身型rna载体的干扰素诱导活性的图。

图18是表示为了完全避免先天免疫活性诱导能力而搭载附加因子的隐身型rna基因表达系统的基因组结构的图。

图19是表示来自于搭载附加因子的隐身型rna载体的干扰素诱导能力的图。

图20是表示具有不同基因表达水平的隐身型rna基因表达系统的结构的图(以正链rna序列进行标注)。

图21是表示c基因缺失或翻译抑制的隐身型rna基因表达系统的基因组结构和基因表达的图。

图22是表示隐身型rna基因表达系统的包装信号(packagingsignal)的活性的图。

图23是表示将隐身型rna基因表达系统从细胞去除的图。

图24是表示迄今为止所制作的隐身型rna载体的基因组结构的图。

图25是表示由搭载6个初始化基因的隐身型rna载体制作诱导多能干细胞(ips细胞)的效率的图。

图26是表示通过隐身型rna基因表达系统表达免疫球蛋白m的图。

图27是表示通过隐身型rna基因表达系统表达双重特异性抗体的图。

具体实施方式

1.本发明的“隐身型rna基因表达系统”的构成要素

本发明使用的rna分子显示难以被先天免疫机制捕捉的“隐身性”。因此,在本发明中,将该rna分子称为“具有隐身性的rna”,将使用该rna作为材料的基因表达系统称为“隐身型rna基因表达系统”,将包封该表达系统并具有将该基因表达系统导入动物细胞的活性的构建体称为“隐身型rna载体”。

在本发明中,所谓隐身型rna基因表达系统是指由包含以下(1)~(8)的rna序列的负单链rna(a)、单链rna结合蛋白(b)和rna依赖性rna合成酶(c)构成,并且不使先天免疫机制激活的复合体。所谓隐身型rna载体是指包含该复合体并且具有将该复合体导入动物细胞的活性的颗粒。另外,在本发明中,在标注负单链rna的rna序列时,在指编码蛋白质的序列的情况下,是指反义链一侧的rna序列。

(1)编码任意蛋白质或功能性rna的目标rna序列;

(2)构成非编码区的先天免疫机制不能识别的rna序列;

(3)前述rna依赖性rna合成酶所识别的转录起始信号序列;

(4)该酶所识别的转录终止信号序列;

(5)包含该酶所识别的复制起点的rna序列;

(6)编码该酶的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;

(7)编码调节该酶活性的蛋白质的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列;

(8)编码前述单链rna结合蛋白的rna序列,并且是进行了结构优化使先天免疫机制不能识别的rna序列。

(以下,基因rna也有被简称为基因的情况)。

此处,优选(2)的rna具有5~49个碱基长度,作为(1)的被导入的外源基因rna各自的3ˊ末端侧和5ˊ末端侧的非编码区进行配置。

另外,(1)的导入的外源基因rna的个数即使小于6个(例如1~5个),总碱基长度即使小于5,000个碱基长度,当然都可作为隐身型rna基因表达系统发挥功能,然而,本发明的rna基因表达系统特别是在包含下述rna的情况下发挥显著效果:外源基因rna的个数为6个以上,优选为8个以上,更优选为10个以上的基因;并且总碱基长度为5,000个碱基长度,优选为8,000个碱基长度,更优选为10,000个碱基长度。

另外,在本申请说明书中,被称为基因或基因材料时,包括负链rna或cdna以及与其互补的正链rna或cdna。也就是说,通过转录或逆转录可以合成的上述任一基因或基因材料的物质都包含于本发明中。

2.本发明的隐身型rna表达系统的构成要素

2-1.用于外源基因rna导入的串联型盒的制作

本发明的隐身型rna基因表达系统中的外源基因rna在其3ˊ末端和5ˊ末端的非编码区具有5~49个碱基的相同或不同的“(1)不被先天免疫机制识别的rna”,在其更外侧的3ˊ末端和5ˊ末端分别设置有(3)的“转录起始信号”和(4)的“转录终止信号”,在最外侧的两端设置有多聚化部位,从而可成为盒。

通过使用如下所示的基于dna的串联型盒,可容易地构建在本发明的隐身型rna基因表达系统中所使用的负单链rna。

本发明的串联型盒从5ˊ末端侧开始依次由(1)多聚化部位a、(2)转录起始信号a、(3)非编码序列a1、(4)克隆位点a、(5)非编码区a2、(6)转录终止信号a、(7)转录起始信号b、(8)非编码序列b1、(9)克隆位点b、(10)非编码区b2、(11)转录终止信号b和(12)多聚化部位b构成。作为示意性示出该串联型盒的图,可列举图7的下图。

上述多聚化部位a和b可彼此相同或不同,只要是可用于该盒的多聚化、或可用于与其它核酸结合的序列,可使用任意序列。作为多聚化部位的优选实例,可列举限制性酶识别序列和部位特异性重组酶的识别序列。作为优选的限制性酶的实例,可列举具有在切面生成如nn或nnn所示序列的任意的单链突出端的性质的sapi、bbsi、bbvi、bcodi、bfuai、bsai、bsmbi、bsmfi、btgzi、eari、foki、hgai、sfani。另外,作为其它优选实例,可列举在识别序列内部具有不规则序列的alwni、bgli、bstapi、bstxi、draiii、sfii等。另外,在利用同源重组的情况下,作为重组酶的识别序列,可列举attb1和attb2等序列。进一步地,在利用gibson组装系统(gibsonassemblysystem,newenglandbiolabs,inc)的情况下,以成为连接对象的其它串联型盒的末端部与重叠序列成为相同序列作为前提,作为多聚化部位可使用任意的15个碱基以上的序列。

转录起始信号a和b彼此可相同或不同,只要在转录为rna的情况下作为rna依赖性rna合成酶所识别的转录起始信号具有功能,可以是任何序列。rna依赖性rna合成酶所识别的转录起始信号的实例由下文的段落具体记载。优选可列举序列号1~3的序列。

非编码序列a1、a2、b1和b2彼此可相同或不同。只要在转录为rna的情况下是上述定义的“不被先天免疫机制识别的rna”,可以是任何序列,可列举的优选实例为5~49个碱基长度的表1所披露的各序列。

只要可以将所期望的外源基因插入,克隆位点a和b可以是任何序列。优选一个克隆位点包含1个或2个以上的限制性酶识别序列,或包含1个或2个以上的部位特异性重组酶的识别序列。作为克隆位点的优选实例,可列举:包含acc65i识别位点和sali识别位点的序列;包含acc65i识别位点和xhoi识别位点的序列;包含bsiwi识别位点和sali识别位点的序列;以及包含bsiwi识别位点和xhoi识别位点的序列。

转录终止信号a和b彼此可相同或不同,只要在转录为rna的情况下作为rna依赖性rna合成酶所识别的转录终止信号具有功能,可以是任何序列。rna依赖性rna合成酶所识别的转录终止信号的实例由下文的段落具体记载。优选可列举序列号4~6的序列。

在一个该串联型盒中,可插入至少2个外源基因。将5个插入2个外源基因的盒进行连接而得的盒多聚体成为承载有10个外源基因的盒多聚体。在下述实施例中,利用将这样的串联型盒进行多聚化而制作承载有4、6或10个外源基因的dna片段,将之亚克隆至质粒中。进一步通过与源自病毒的rna依赖性rna合成酶基因和rna结合蛋白基因组合,构建本发明所期望的rna表达系统。

2-2.rna依赖性rna合成酶以及该酶所识别的转录起始信号和转录终止信号

“rna依赖性rna合成酶”以及该酶所识别的转录起始信号和转录终止信号优选选自于源自相同负链rna病毒的序列,典型地为源自属于副粘病毒科的病毒的基因组的序列。属于副粘病毒科的病毒的基因组的“rna依赖性rna合成酶”、“该酶所识别的转录起始信号”与“该酶所识别的转录终止信号”的组合是为了全部具有相同的基本结构,也可使用源自任何病毒的序列的组合。

在本发明的实施例中,作为“rna依赖性rna合成酶”选择仙台病毒的l蛋白(rna合成酶的大亚基poll)和p蛋白(rna合成酶的小亚基pols)的组合;作为“rna依赖性rna合成酶所识别的转录起始信号的rna”选择“3ˊ-ucccacuuuc-5ˊ(序列号1)”;作为“rna依赖性rna合成酶所识别的转录终止信号的rna”选择“3ˊ-aauucuuuuu-5ˊ(序列号4)”,将转录起始信号和转录终止信号分别配置在各基因的3ˊ侧和5ˊ侧(图1)。并且,作为“调节rna合成酶活性的蛋白质”使用仙台病毒的c蛋白(c);另外,作为“单链rna结合蛋白”使用仙台病毒的np蛋白(n)。

另外,在本说明书所公开的技术中,rna主要以负链的单链rna的实施方式被使用,只要没有特别注释,rna序列作为负链的序列信息从3ˊ末端侧开始进行公开。但是,构成本说明书的一部分的序列表的序列信息遵照指南从5ˊ末端侧开始记载。

在作为“rna依赖性rna合成酶”选择仙台病毒的l蛋白和p蛋白的组合的情况下,作为转录起始信号,除了“3ˊ-ucccacuuuc-5ˊ(序列号1)”、“3ˊ-ucccuauuuc-5ˊ(序列号2)”、“3ˊ-ucccacuuac-5ˊ(序列号3)”之外,可使用与这些序列具有同等功能的rna。另外,对于转录终止信号也同样,除了“3ˊ-aauucuuuuu-5ˊ(序列号4)”、“3ˊ-cauucuuuuu-5ˊ(序列号5)”、“3ˊ-uauucuuuuu-5ˊ(序列号6)”之外,可使用与这些序列具有同等功能的rna。另外,在作为“rna依赖性rna合成酶”选择人类副流感病毒3型的l蛋白和p蛋白的组合的情况下,作为转录起始信号,可使用“3ˊ-uccuaauuuc-5ˊ(序列号7)”或具有同等功能的rna;作为转录终止信号,可使用“3ˊ-uuauucuuuuu-5ˊ(序列号8)”或具有同等功能的rna。进一步地,在作为“rna依赖性rna合成酶”选择新城疫病毒的l蛋白和p蛋白的组合的情况下,作为转录起始信号可使用“3ˊ-ugcccaucuuc-5ˊ(序列号9)”或具有同等功能的rna;作为转录终止信号可使用“3ˊ-aaucuuuuuu-5ˊ(序列号10)”或具有同等功能的rna。

2-3.用于本发明的隐身型rna基因表达系统的复制功能的要素

作为用于本发明的隐身型rna基因表达系统的复制功能的必需要素是具有rna依赖性rna合成酶所识别的复制起点以及所谓3ˊ末端侧的(cnnnnn)3-和5ˊ末端侧的(nnnnng)3-的结构的序列。

在本发明的实施例中,作为“rna依赖性rna合成酶”选择仙台病毒的l蛋白和p蛋白的组合,因此,作为“包含rna依赖性rna合成酶所识别的复制起点的rna”选择存在于仙台病毒基因组3ˊ末端的114个碱基的rna以及存在于仙台病毒基因组5ˊ末端的96个碱基的rna。在此结构中,在隐身型rna基因表达系统的复制功能中所必需的要素如下(图2、图3、图4)。

(1)存在于基因组3ˊ末端的“3ˊ-uggucuguucuc-5ˊ(序列号11)”或具有同等功能的12个碱基的rna序列(例如,“3ˊ-ugguuuguucuc-5ˊ(序列号12)”);

(2)存在于基因组5ˊ末端的“3ˊ-gagaacagacca-5ˊ(序列号13)”或具有同等功能的12个碱基的rna序列(例如,“3ˊ-gagaacaaacca-5ˊ(序列号14)”);

(3)具有从基因组3ˊ末端起第79个碱基开始的所谓“3ˊ-(cnnnnn)3-5ˊ(序列号15)”的结构的18个碱基的rna序列;

(4)具有从基因组5ˊ末端起第96个碱基开始的所谓“3ˊ-(nnnnng)3-5ˊ(序列号16)”的结构的18个碱基的rna序列。

其中,(1)和(2)是彼此互补的序列,因为基因组rna的3ˊ末端与反基因组rna(与基因组rna互补的rna)的3ˊ末端相同,所以被认为是rna依赖性rna合成酶所识别的复制起点。另外,(3)和(4)功能尚不清楚,然而已知其是在由rna依赖性rna合成酶进行的单链rna复制中必需的序列(非专利文献42)。

2-4.负单链rna中颗粒化所必需的包装信号(packagingsignal)区

另外,在本发明中,首次将作为负单链rna中用于颗粒化的包装信号的区域确定为从基因组3ˊ末端起第97个碱基至第114个碱基的区域。

如实施例18(图22)所示,将该区域(标记为“序列d”)全部去除并不影响包装细胞内的基因表达,然而,得到隐身型rna载体的颗粒化效率极为低下这一结果。

上述结果显示,该18个碱基的序列或该18个碱基长的区域或其一部分是用于摄入至病毒样颗粒所必需的序列或区域。

于是,进一步尝试将该18个碱基的序列用从下述“表1”所列举的源自管家基因的mrna的部分序列中任意选择的序列进行置换(图3的(5),序列号75),确认颗粒化效率没有变化。

因此,从基因组3ˊ末端起第97~114个碱基的18个碱基长度或其一部分长度的区域被认为是在负单链rna中用于颗粒化的包装中所必需的。也就是说,虽然该区域在以负单链rna为模板的转录和复制中不是必需的,但是,可以说该区域是用于将隐身型rna基因表达系统摄入至病毒样颗粒所必需的“包装信号区域”。

(5)与从基因组3ˊ末端起第97~114个碱基的“3ˊ-aaagaaacgacgguuuca-5ˊ(序列号17)”对应的18个碱基长度的rna,或者该rna的至少连续8个碱基以上、优选10个碱基以上、更优选15个碱基以上长度的任意rna。

对于缺失上述(5)的18个碱基长度或其部分区域的隐身型rna基因表达系统而言,即使宿主细胞经同种或不同种病毒感染,导致产生包含该隐身型rna基因表达系统的病毒样颗粒的可能性极低。

因此,在将本发明的隐身型rna基因表达系统作为感染性颗粒以及作为隐身型rna基因表达载体使用的情况下,该18个碱基长度或其部分区域是必需的区域,然而,在极力排除病毒样颗粒的混入而力争确保安全性的生物医药品制造中,反倒成为应该排除的序列。

2-5.负单链rna基因表达的模板的构建

已知将“作为rna依赖性rna合成酶所识别的转录起始信号的rna”、“作为rna依赖性rna合成酶所识别的转录终止信号的rna”以及存在于负单链rna3ˊ末端和5ˊ末端的“包含rna依赖性rna合成酶所识别的复制起点的rna”组合、并在转录起始信号与转录终止信号之间搭载了任意外源基因的rna分子在反式(trans)提供的源自病毒的rna依赖性rna合成酶等必要因子的存在下,成为转录和复制的模板(非专利文献43、非专利文献44、非专利文献45)。例如,将源自仙台病毒的转录起始信号、转录终止信号和复制起点组合、并搭载了大肠杆菌的氯霉素乙酰转移酶(cat)基因作为外源基因的具有上述结构的负单链rna显示在经仙台病毒感染的细胞中成为转录和复制的模板,制造cat(非专利文献43、非专利文献44)。另外,具有同样结构的负单链rna在稳定表达仙台病毒的np(单链rna结合蛋白)、p(rna依赖性rna合成酶的小亚基)和l(rna依赖性rna合成酶的大亚基)蛋白的细胞中显示连续地进行持续复制(非专利文献45)。

这些报道显示,本发明所制作的负单链rna成为基因表达的模板,然而,在这种情况下,转录和复制的活性依赖于由包含病毒基因的细胞反式提供的np、p、l蛋白,因此不能成为在任意细胞中都可进行基因表达的通用型基因表达系统。因此,接下来尝试在具有前述2-3.(图1)所示的结构、由不被先天免疫机制识别的成分构成的rna分子中搭载转录和复制所必需的基因。

3.关于避免动物细胞中先天免疫机制激活(pamp)的知识

3-1.关于源自病毒的rna的pamp

动物细胞所具有的先天免疫机制识别存在于侵入细胞内的病毒的基因组rna或病毒基因的mrna中的“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pamp)”而被激活。迄今为止,pamp的结构在c型肝炎病毒和人类免疫缺陷病毒中被确认。就c型肝炎病毒而言,报道了存在于基因组3ˊ末端的非编码区的富含尿嘧啶(uridine)的序列为pamp(非专利文献35)。另一方面,就人类免疫缺陷病毒而言,报道了在由gag、pol、env这3个基因转录而来的mrna中存在的腺嘌呤含量高的区域为pamp(非专利文献36)。此外,就仙台病毒而言,已知存在于感染细胞中的比600个碱基长度长的长链rna片段被检测出具有强pamp活性(非专利文献37),在f、hn、l的各基因的非编码区也存在具有作为pamp发挥功能的可能性的高级二级结构(非专利文献38)。因此,预测几乎所有源自病毒的rna都包含pamp。

3-2.对源自病毒的rna进行优化的探讨

通过将编码rna病毒基因组中的蛋白质的区域的密码子针对人类细胞进行优化而破坏pamp结构以避免先天免疫机制激活的这种尝试以前已多次进行。例如,报道了因为在由人类免疫缺陷病毒(hiv)的gag、pol、env各基因转录而来的各mrna中分别存在pamp,所以,如果使任一基因保持原样在动物细胞中表达,则诱导干扰素,然而,针对人类细胞进行优化后表达的gag、pol、env蛋白中的任一种都可抑制干扰素诱导(非专利文献36)。另外,已知在猴免疫缺陷病毒(siv)中,与hiv一样,在gag、pol、env的mrna中也存在pamp,通过将包含各基因的pamp的区域的密码子针对人类细胞进行优化,可降低干扰素诱导能力(非专利文献48)。但是,就仅将siv基因组序列中的包含pol基因的pamp的区域的密码子进行优化而言,siv的干扰素诱导能力几乎没有变化。因此,除了pol基因的优化之外,还将包含gag基因的pamp的区域的密码子进行优化,则病毒的复制能力降低至1%以下,显示病毒的转录、复制功能严重受损的结果(非专利文献48)。该结果显示,siv的pol基因和gag基因不仅编码pol蛋白和gag蛋白,在编码蛋白质的核酸序列本身中也存在病毒转录或复制的功能所必需的信息。

另外,对于c型肝炎病毒基因组3ˊ末端的非编码区中的包含pamp的区域,也报道了破坏该区域将使其病毒复制能力受损(非专利文献82、非专利文献83)。

这些结果显示,rna病毒基因组中的“包含pamp的区域”同时对病毒复制等功能而言是必需区域的可能性高。

如上所述,因为尚未知晓有既不损伤rna病毒的功能又从基因组核酸中将具有pamp功能的结构去除的普遍方法,所以,将针对人类细胞对病毒rna中包含pamp的区域的密码子进行优化的技术应用于rna病毒载体反倒成为否定性的结果。

3-3.源自病毒的先天免疫抑制因子的利用

就将rna病毒的基因组或合成rna作为基因表达的平台使用的现有技术而言,并非将作为pamp被识别的结构探明并将该结构去除,而是在各种病毒所具备的拮抗先天免疫机制的因子的作用下,抑制由pamp导致的先天免疫机制的激活,减弱细胞毒性。例如,在非专利文献26和非专利文献27中作为必需构成要素而使用的b18r蛋白是在痘苗病毒的基因组dna中编码的干扰素结合蛋白,具有通过抑制干扰素的活性而抑制先天免疫机制激活的功能。

另外,就在专利文献3、专利文献4、非专利文献7中记载的基于仙台病毒的载体而言,与rna依赖性rna合成酶(l蛋白和p蛋白)的突变一起,源自仙台病毒的v蛋白的表达也承担抑制先天免疫机制的作用。v蛋白是以由仙台病毒的p基因区域转录而来的mrna制作的蛋白质之一,具有与p蛋白相同的n末端(317个氨基酸残基)以及具有v蛋白所固有的结构的碱基性c末端(67个氨基酸残基)(非专利文献39)。v蛋白经由转录因子irf-3的抑制而抑制先天免疫机制的激活(非专利文献40)。另外,已知就在p基因的碱基序列中人工导入突变而制作的v蛋白缺失的仙台病毒而言,抑制先天免疫机制激活的功能丧失,容易从感染个体中被排除(非专利文献40、非专利文献41)。

如上所述,在并用源自病毒的先天免疫抑制因子的情况下,产生了导入外源基因的细胞即使感染其它种病原微生物也不会激活先天免疫机制的安全性方面的顾虑。例如,就稳定维持仙台病毒载体的基因组的细胞而言,因为v蛋白恒定表达,所以,在活体的组织细胞使用该载体的情况下,存在该细胞即使感染别的病毒也不能激活先天免疫机制的可能性。因此,期望有借助不依赖于通过源自病毒的因子来抑制先天免疫机制的方法来避免先天免疫机制激活的技术。

4.本发明的rna基因表达系统中用于避免pamp的方法

4-1.非编码区序列中的“不被先天免疫机制识别的rna”

掌控本发明的关键在于对可避免动物细胞所具有的先天免疫机制激活的rna的选择。另外,本发明中提及避免先天免疫机制激活时,以干扰素β诱导能力作为指标,在将正常细胞中ifn-βmrna的表达量设为1.0时,为30以下,优选为20以下,更优选为10以下,这一点如上所述。

因此,在本发明中,作为“不被先天免疫机制识别的rna”的材料,使用源自人类等动物细胞表达的mrna的rna序列,其中,选择了源自在广泛的人类细胞中表达的管家基因的mrna。该mrna在几乎所有人类细胞中都较大量地表达,不包含被人类先天免疫机制识别的基序。进一步地,从该mrna的不编码蛋白质的非编码区选择不形成高级二级结构的5个碱基至49个碱基的rna(表1),配置在搭载于载体上的各基因的5ˊ侧非编码区和3ˊ侧非编码区(图1)。

即使在本发明的非编码区序列中“不被先天免疫机制识别的rna”的“源自在动物细胞中表达的mrna的rna序列”中,下述表1所列举的源自管家基因的mrna的部分序列中的任一序列都可作为特别优选的序列使用。作为这样的优选序列的其它实例,也可优选使用源自白蛋白基因等在活体内大量表达的基因的mrna的rna序列的部分序列。

如上所述,在本发明的实施例中,考虑到应用于再生医疗而选择源自在人类细胞中表达的mrna的非编码区序列,使用了其部分序列,然而,作为“不被先天免疫机制识别的rna”,不限于实施例或表1所列举的来自于源自人类mrna的非编码区序列的序列。例如,在optimumgen基因设计系统(专利文献7,genscriptusa,inc.)中,为了求出基准cai值,可使用从所采用的在人类中表达量高的人类mrna组中适当选择的人类mrna所具有的非编码序列的部分序列。此外,如果载体不被所使用的宿主细胞的先天免疫机制识别,那么,也可以是mrna以外的人类rna、在其它动物种的细胞中表达的rna、非天然的合成rna。

表1

4-2.rna载体基因组3ˊ末端和5ˊ末端区域中“不被先天免疫机制识别的rna”的置换

如图2、图3和图4所示,在构成本发明的隐身型rna载体的基因组rna序列中,在3ˊ末端区域和5ˊ末端区域,除了前述2-2.~2-3.等所示的与转录、复制等相关的必需构成要素以外,还存在任意的功能不明的序列区域,在这些序列中,在多个位置存在可以置换为源自管家基因的mrna的部分序列等的“不被先天免疫机制识别的rna”的区域。

例如,如图3的实施例所示,在存在于天然病毒基因组3ˊ末端的结构中,将(1)至(6)的区域置换为包含表1的源自管家基因的mrna的部分序列的无同源性的其它碱基序列是可能的,隐身型rna基因表达系统的3ˊ变体1至3ˊ变体6中的任一种都可进行稳定的基因表达以及载体颗粒的产生。另外,如图4的实施例所示,在存在于天然病毒基因组5ˊ末端的结构中,将(1)至(4)的区域使用无同源性的其它碱基序列进行置换或插入是可能的,隐身型rna基因表达系统的5ˊ变体1至5ˊ变体5中的任一种也都可进行稳定的基因表达。

并且,可以认为,通过将这些位置的序列置换成表1的源自管家基因的mrna的部分序列等“不被先天免疫机制识别的rna”,进一步抑制干扰素诱导能力的可能性很高。

5.用于避免由转录、复制中所必需的蛋白质引起的先天免疫机制激活(pamp)的方法

5-1.成为编码转录、复制中所必需的蛋白质的基因中的pamp结构的指标的值的探讨

在本发明的实施例中,作为“rna依赖性rna合成酶”选定仙台病毒的l蛋白(rna合成酶的大亚基,poll)和p蛋白(rna合成酶的小亚基,pols);作为“调节rna合成酶活性的蛋白质”选定仙台病毒的c蛋白(c);作为“单链rna结合蛋白”选定仙台病毒的np蛋白(n)。这些蛋白质对于由负单链rna进行转录和复制是必需的,然而,在编码它们的仙台病毒的基因组rna或mrna中,存在如非专利文献37所示的“对于病原微生物而言的特征性分子模式(pamp)”的可能性高。因此,为了构建不激活先天免疫机制的隐身型rna基因表达系统,从编码这些蛋白质的rna去除具有pamp可能性的结构是必要的。

虽然在构成仙台病毒的基因组rna或mrna中确实存在pamp活性,然而,尚不清楚实际上在哪个区域存在pamp活性。但是,具有pamp活性的rna似乎与在宿主细胞中表达的rna具有明显不同的结构。因此,首先,为了探讨源自rna病毒的mrna与人类细胞的mrna在结构上的不同,将编码区的密码子适应指数(cai)作为指标进行比较。cai是由在某生物种的细胞中编码最强烈表达的100个蛋白质的mrna的密码子的出现频率得到的指示偏离的指标,在cai=1.0的情况下,表示密码子使用频率与这100种mrna相同(非专利文献46)。经过“optimumgen基因设计系统(专利文献7,genscriptusa,inc.)解析的结果,任意选择的151个人类mrna编码区的cai平均值为0.778,与之相对,仙台病毒的7种mrna中的cai平均值为0.704,同属于副粘病毒科的麻疹病毒的7种mrna中的cai平均值为0.697,得到副粘病毒的mrna的cai显著低于人类细胞的mrna的平均cai这一结果(图5)。另外,在作为参考而解析的大肠杆菌中表达的任意11种mrna中,cai的平均值为0.698(图5)。由此,在人类细胞中使用的情况下,副粘病毒的mrna偏向于与原核生物大肠杆菌的mrna相比拟的结构,这可以认为存在作为pamp被识别的可能性。

另外,为了从另一观点来探讨源自rna病毒的mrna与人类细胞的mrna在结构上的不同,计算了编码区的gc含量。其结果是,源自天然副粘病毒的rna的gc含量平均值为47.7%至48.5%,显著低于人类mrna编码区的gc含量平均值56.3%(非专利文献47)(图6)。考虑到rna病毒的基因组gc含量较低且腺嘌呤和尿嘧啶多的序列成为pamp的可能性高(非专利文献43),可以认为,gc含量也有成为暗示pamp的存在的指标的可能性。

5-2.源自仙台病毒的与转录、复制相关的基因的“密码子优化”应用实验

用于使这样的cai值和gc含量接近于人类细胞mrna平均值的“密码子优化”对于源自病毒的编码区中的pamp结构的破坏和pamp的避免是有效的,这已由如前述3-2.所示的hiv、siv和肝炎病毒等得到证实。

然而,前述3-2.中还示出若在这些病毒中对转录、复制所必需的基因的序列内的pamp区域进行“密码子优化”,将同时大幅损害复制能力这样的结果。由此,在转录、复制中所必需的基因的序列内的pamp结构在转录、复制中承担必需的二级结构的作用的可能性高,这可以说是现有的技术常识。

一般而言,综合考虑病毒基因组各种功能紧密地装配到一起,则从这样的现有知识来看,可以认为在仙台病毒的情况下,也与这些病毒基因组一样,转录、复制中所必需的基因序列内的pamp结构对于病毒功能很重要的可能性高。也就是说,高度预测在将用于在本发明的rna基因表达系统中使用的源自仙台病毒的“rna依赖性rna合成酶”等的与转录、复制相关的蛋白质的编码区中的密码子针对人类细胞进行优化的情况下,即使可避免pamp,本来的转录、复制能力也将同时大幅受损。

在这样的状况下,本发明人特意将编码“rna依赖性rna合成酶”、“rna结合蛋白”等与转录、复制相关的蛋白质的rna全部针对人类细胞进行了密码子优化。

在本发明中,作为“rna依赖性rna合成酶”使用仙台病毒的l蛋白(rna合成酶的大亚基,poll)和p蛋白(rna合成酶的小亚基,pols),作为“调节rna合成酶活性的蛋白质”使用仙台病毒的c蛋白(c),作为“单链rna结合蛋白”使用仙台病毒的np蛋白(n),所以,以从编码上述蛋白质的rna中去除pamp为目的,通过作为密码子优化法而被广泛使用的程序之一“optimumgen基因设计系统(专利文献7,genscriptusa,inc.)”进行了密码子优化。其结果是,任一cai值都变为0.86至0.88,显示为接近于编码在人类细胞中高表达的蛋白质的mrna的数值。

以下,以表2来表示利用“optimumgen基因设计系统(也被称为oggds法)”对仙台病毒的l、p、c和n蛋白基因进行密码子优化的应用结果。

表2

在上述表2中,为了进一步从另一观点来解析优化的rna的结构,对于密码子优化后的rna,与cai值一起计算了gc含量。其结果是,相对于优化前rna的gc含量为44.0%至50.1%,优化后rna的gc含量升高为52.5%至55.5%,接近于人类mrna编码区的gc含量平均值56.3%(非专利文献47)(表2)(图6)。就rna病毒而言,已知腺嘌呤和尿嘧啶多的序列成为pamp的可能性高(非专利文献36),通过密码子优化的方法使源自病毒的rna的结构接近于人类mrna的结构,同时也强烈暗示具有pamp活性的区域被去除的可能性。

并且,在本发明中,实际上通过该方法构建了将针对人类细胞进行优化的编码源自仙台病毒的np蛋白、p蛋白、c蛋白、l蛋白的rna与10个外源基因一起搭载的rna载体(图13)(实施例8),使之在hela细胞内表达进行验证的结果是(实施例9),确认10个外源基因全部以可观察到的充足的量进行表达。另外,确认该rna载体可避免人类成纤维细胞内的inf-β诱导(实施例13,图17)。

以上结果显示,本发明的搭载了针对人类细胞进行优化的源自仙台病毒的与转录、复制相关的基因rna的rna载体是显示作为具备pamp避免效果的优异的隐身型rna载体而发挥功能的rna载体。

另外,该结果还显示,在仙台病毒的情况下,存在于转录、复制所必需的基因序列内的pamp结构并不是在所有转录、复制中所必需的结构,即使对于实施实验的本发明人而言,这也是预料之外的惊人结果。

5-3.密码子优化方法的探讨

根据前述表2的结果,暗示为了进行用于去除具有pamp活性的区域而抑制诱导先天免疫反应的“密码子优化”,“cai值”和“gc含量”这2种数值范围的设定是重要条件。因此,为了探讨2个条件中哪一个是比较本质的条件,进行了应用其它密码子优化方法的实验。作为密码子优化方法,除了上述oggds法之外,还提议有geneoptimizer程序(非专利文献49)和genegps表达优化技术(专利文献8、专利文献9)等各种方法,因此,通过该追加实验,可以确认即便使用上述oggds法以外的方法,也可达到同样的效果。

因此,将与oggds法同样被广泛使用的“密码子优化”方法genegps表达优化技术(genegpsexpressionoptimizationtechnology,以下也称为ggeot法)的密码子优化方法应用于编码仙台病毒的np蛋白、p蛋白、c蛋白、l蛋白的模板dna,同样地制作了可搭载10个外源基因的rna载体(图15)。在通过实施例9的方法进行验证时,确认该载体是与通过oggds法进行优化的隐身型rna载体一样可避免诱导先天免疫反应的隐身型rna载体(数据未显示)。

通过oggds法优化与通过ggeot法优化使用了完全不同的算法,将通过这两种方法进行优化的核酸的碱基序列进行比较,两者的一致性为77%~80%,可看出为了进行密码子优化选择了非常不同的碱基(表4)。

综上,为了将编码“rna依赖性rna合成酶”、“调节rna合成酶活性的蛋白质”、“单链rna结合蛋白”的基因制成隐身型rna基因表达系统而进行的优化方法并不依赖于特定的密码子优化法,已证实,无论基于何种算法的密码子优化方法都可作为本发明的密码子优化法使用。

以下,以表3来表示对仙台病毒的l、p、c和n蛋白基因通过ggeot法进行密码子优化后的gc含量和cai值的值与上述表2所示的使用oggds法的值进行对比的表。另外,因为在ggeot法中没有“cai值”的计算程序,所以,按照oggds法的“cai值”的计算程序进行计算。

另外,表4示出了分别对于l、p、c和n蛋白基因的原始序列、应用oggds后的序列和应用ggeot后的序列之间的同源性(一致性)的值。

表3

表4

5-4.用于“密码子优化”的必需指标

cai作为估计在人类细胞内的mrna翻译效率的指标之一使用(非专利文献46),然而,就本发明而言,将密码子优化作为从源自病毒的rna去除具有pamp活性的结构的一种手段来使用,不必获得翻译效率的升高也是可以的。

另外,cai是“指示与某生物种的细胞中编码最强烈表达的100个蛋白质的mrna的密码子的出现频率偏离的指标”,然而,并未有指示选择作为标准的100个蛋白质的客观基准。在本发明中,在将通过在源自人类的培养细胞内抑制同等的先天免疫反应诱导的可实现10个基因表达的oggds法的优化与通过ggeot法的优化进行比较的情况下,在后者的cai值(通过oggds法进行计算)的情况下,显示优化后与优化前几乎没有变化的结果(表3)。

另一方面,对于gc含量,无论使用哪种优化法都显示51%以上、最大为约60%的值。由此可知,作为表示去除具有pamp活性的结构的可能性的指标,gc含量比cai值更为有效。也就是说,作为用于抑制先天免疫反应诱导的“隐身型rna基因表达系统”的“密码子优化”中的指标,gc含量是最佳指标,源自病毒的蛋白质的密码子优化后的gc含量如果至少为50.0%以上,期望为52.0%以上,则推测有去除具有pamp活性的结构的可能性。

综上所述,本发明中在提及用于rna基因表达系统的“密码子优化”时,是指将编码rna基因表达系统所必需的蛋白质的全部碱基序列调节为gc含量为50~60%,优选为52~56%。

另外,由密码子优化导致的碱基序列改变的结果,存在于p基因区域的编码c蛋白和v蛋白的序列消失,由进行优化的p基因也不表达c蛋白和v蛋白。编码c蛋白和v蛋白的rna即使完全被去除仍可进行基因表达,因此不是必需的,然而,特别是在c蛋白的情况下,用于适当地调节本发明rna载体的表达量是重要的,因此优选在序列中添加如前所述进行优化的c蛋白基因rna。根据需要,对于v蛋白rna,也可进行适当的同样的密码子优化并添加至序列中。

6.本发明中用于将多个外源基因搭载于隐身型rna上的方法(转录盒连接法)

6-1.将6个以上基因搭载于同一载体上的方法的探讨

接着,探讨使用简单的方法将6个以上(例如10个)外源基因搭载于隐身型rna上的方法。另外,rna分子本身不能通过基因重组进行操作,因此,包括在5-4.中优化的源自病毒的基因的搭载在内,全部以cdna进行构建,将此cdna作为模板,通过源自t7噬菌体的t7rna聚合酶等dna依赖性rna合成酶制作rna。

为了最简单地制作搭载10个基因的dna分子,可以考虑在各个基因的cdna的上游和下游导入各基因固有的限制性酶酶切位点并将经此限制性酶酶切的cdna依次插入的方法。但是,在此情况下,除了至少需要20个不同的限制性酶之外,为了进行基因的组合或者变更基因在隐身型rna上的位置,还必须将cdna全部重新制作,这是不现实的。

6-2.各搭载2个基因的“串联型转录盒”的制作

就本发明而言,如前述2-1.(图1)所述,采用制作各搭载2个基因的“串联型转录盒”并将它们多个进行连接的方法,此时,花费工夫使得搭载的基因全部设计为具有相同结构并且可搭载于隐身型rna上的任何位置(图7)。就该设计方法而言,在搭载的基因的5ˊ上游侧设定为限制性酶a,在3ˊ下游测设定为限制性酶b,分别设定限制性酶酶切位点,此处将经酶切的cdna插入成为模板的dna分子。在被插入的模板dna中,除了由限制性酶a和限制性酶b识别的序列之外,还设定由限制性酶c和限制性酶d识别的序列。选择这些限制性酶的组合,使得经限制性酶a酶切的dna片段和经限制性酶d酶切的dna片段都可以进行共价结合,并且经限制性酶b酶切的dna片段和经限制性酶c酶切的dna片段都可以进行共价结合。这样的组合存在多个,除了实施例所列举的acc65i和bsiwi、xhoi和sali的组合以外,还可以考虑有xbai和spei或nhei的组合、bamhi和bglii的组合等。在这种情况下,对于搭载的基因的cdna,其结构上的制约为内部不包含限制性酶a、限制性酶b、限制性酶c、限制性酶d的识别序列。通过使用这样的限制性酶的组合,首先制作各搭载2个cdna的dna片段(图8)。

6-3.“转录盒”连接法

接着,将5个如上所述制作的连接2个cdna的dna片段连接在一起,制作搭载共计10个cdna的dna(图7、图8、图9)。就实施例而言,将在上述6-2.中制作的连接有2个cdna的dna片段用被称为sapi的限制性酶酶切后进行分离。由sapi酶切的dna的切面在5ˊ侧具有3个碱基突出的结构,通过将这3个碱基的序列任意设定,可选择4×4×4=64种切面(图7)(图9)。因此,可以将5个dna片段按照设计正确结合并作为一个dna分子回收(图9)。此时,对于搭载的基因的cdna,设计成除了不包含限制性酶a、限制性酶b、限制性酶c、限制性酶d的识别序列之外,还不包含sapi的识别序列(图7)。

这样的具有在切面生成如nn或nnn表示的序列中的任意的单链突出端的性质的限制性酶并不限于sapi,通过bbsi、bbvi、bcodi、bfuai、bsai、bsmbi、bsmfi、btgzi、eari、foki、hgai、sfani等多种限制性酶也可得到同样结果。另外,在识别序列内部具有不规则序列的alwni、bgli、bstapi、bstxi、draiii、sfii等也可得到同样效果。另外,此阶段不必利用使用限制性酶的克隆也是可以的,也可利用使用同源重组的方法(in-fusionhd克隆系统(takara-bio,inc.)或gibson组装系统(newenglandbiolabs,inc.))。另外,将10个cdna结合后组装至环状质粒dna中的阶段即使不使用实施例所示的通过同源重组组装至pdonr-221等的方法(gatewaysystem(lifetechnologies,inc.)),也可借助使用通常的t4dna连接酶进行共价结合的方法。另外,通过如图9所示的方法,可制作搭载1个至10个任意基因的dna分子。

6-4.外源基因表达量的调节

一般而言,已知在包含分别编码一组rna依赖性rna合成酶(pols、poll)、单链rna结合蛋白(n)、调节rna合成酶活性的蛋白质(c)的基因的负链单链rna基因表达系统中,在插入多个外源基因的情况下,越接近上游的3ˊ末端侧,表达量越多。本发明的隐身型rna基因表达系统也具有同样的倾向。就本发明而言,可以将多个外源基因按照任意顺序组装成盒状,因此,可以简单地使各个基因按照想要获得的表达量依次排列。另外,由各个基因制作的蛋白质的表达量通过改变翻译效率来进行调节也是可能的(图20)。

7.隐身型rna的合成

接着,将上述6.所制作的连接10个cdna的dna片段与按照前述5.所记载的方法针对人类细胞进行密码子优化(以下称为“人源化”,在各蛋白质的缩写前附加h进行标记)的编码单链rna结合蛋白的基因(hn)、编码调节rna合成酶活性的蛋白质的基因(hc)、编码rna依赖性rna合成酶的基因(hpoll、hpols)进行连接,制作用于合成隐身型rna的环状模板cdna(图10)。隐身型rna的结构可以通过rna聚合酶所识别的启动子的位置从负链和正链中进行选择。此处,将与由搭载于隐身型rna上的基因表达的mrna为相同方向的rna定义为正链,将与mrna为互补方向的rna定义为负链,在图10中例示了用于使用t7rna聚合酶合成负链rna的模板的制作。从t7启动子(非专利文献50)的下游侧配置为了酶切rna而制作正确末端的源自人类d型肝炎病毒的反基因组的核酶(非专利文献51)和t7rna聚合酶的转录终止信号(非专利文献50),使之可合成与隐身型rna全长相当的rna。在rna合成中使用的酶并不限于t7rna聚合酶,如果是可在大肠杆菌或动物细胞中使用的dna依赖性rna聚合酶,可使用任何种类的酶。例如,源自大肠杆菌t3噬菌体的t3rna聚合酶(非专利文献52)或源自沙门氏菌sp6噬菌体的sp6rna聚合酶(非专利文献53)也可以与这些酶所识别的启动子和转录终止位点组合进行使用。另外,核酶是为了正确酶切rna的3ˊ末端而使用,并不限于实施例的源自人类d型肝炎病毒的反基因组的核酶,也可使用源自人类d型肝炎病毒的基因组的核酶(非专利文献51)或者烟草环斑病毒的发夹状核酶(非专利文献54),进一步也可使用可在细胞内对rna进行酶切的小抑制rna(sirna)(专利文献55)。

另外,与隐身型rna全长互补的cdna被克隆至具有源自p15a的复制起点的质粒(非专利文献56)。由于在大肠杆菌中是以低拷贝数的状态维持,具有源自p15a的复制起点的质粒不仅对于使大dna片段在大肠杆菌中稳定地保持是有利的,而且在用于重构隐身型rna基因表达系统的方法2中,使该质粒与具有源自cole1的复制起点的n蛋白表达质粒在大肠杆菌中共存是可能的(非专利文献56)。就实施例而言,在具有源自p15a的复制起点的质粒上搭载氨苄青霉素抗性,在具有源自cole1的复制起点的质粒上搭载卡那霉素抗性,通过氨苄青霉素和卡那霉素的双重选择将2个质粒维持在同一大肠杆菌内,然而,抗生素的组合并不限于该示例。另外,质粒的组合也可使用具有源自f因子的复制起点替代源自p15a的复制起点的质粒、具有源自puc的复制起点替代源自cole1的复制起点的质粒。

8.隐身型rna基因表达系统的重构

8-1.现有形式的重构法

由负单链rna以及与该rna结合的蛋白质构成的隐身型rna基因表达系统的重构可通过两种方法进行。第一种方法是通过已知作为已经具有负单链rna基因组的病毒以及利用该病毒的载体的重构法的技术,将与负单链rna互补的正单链rna使用t7rna聚合酶在动物细胞内表达,同时,通过使np(n)、p(pols)、l(poll)这3个蛋白质在该细胞内表达而重构正链rna的隐身型rna基因表达系统(图11)(非专利文献57、专利文献3)。就该方法而言,优点是仅通过使用稳定地表达t7rna聚合酶的动物细胞,将作为材料的质粒dna导入细胞便可重构,十分便利。另一方面,已知因为是将包含用于合成正单链rna的模板cdna的质粒与搭载有表达np、p、l这3个蛋白质的基因的3个质粒同时导入细胞,所以这些dna分子之间经常发生基因重组,在想要制作的负单链rna结构中插入突变(非专利文献57)。另外,在专利文献3的实施例中,为了提高重构效率,进一步追加表达m、f、hn蛋白的质粒。

8-2.本发明开发的重构法

就第二种方法而言,首先在大肠杆菌中制作负单链rna和具有单链rna结合能力的np蛋白(n)的复合体,将该复合体导入表达p(pols)蛋白和l(poll)蛋白的动物细胞,重构隐身型rna基因表达系统(图12)。在该方法中,首先,分别通过t7rna聚合酶由在大肠杆菌中可共存的2个质粒合成编码n蛋白的mrna和隐身型rna,通过在大肠杆菌内同时表达单链rna结合蛋白(n)和隐身型rna来制作复合体。将从天然存在的rna病毒分离的rna-蛋白质复合体作为材料重构rna病毒的方法在非专利文献58中公开,然而,就此次开发的方法而言,将通过基因重组技术合成的隐身型rna作为材料进行重构成为可能。与第一种方法相比,此方法具有步骤较多且复杂的缺点,然而,通过使用与同源重组相关的基因(reca)和编码rna分解酶的基因(rnasee)被破坏的大肠杆菌(非专利文献59),可以在没有在基因组rna中引入突变的情况下重构隐身型rna基因表达系统。

也就是说,本发明开发的隐身型rna基因表达系统的重构法是在表达t7rna聚合酶的宿主细胞内事先制作负单链rna与具有单链rna结合能力的蛋白质(例如np蛋白(n))的复合体,将该复合体导入表达rna依赖性rna合成酶(例如p(pols)蛋白和l(poll)蛋白)的动物细胞来重构隐身型rna基因表达系统的方法。作为宿主细胞优选使用reca基因和rnasee基因被破坏且表达t7rna聚合酶的大肠杆菌。

接着,使用按照上述7.所记载的方法合成的搭载10个基因的隐身型rna,通过前述8.所记载的任一种方法构建隐身型rna基因表达系统(图13)。如此操作制作的具有负单链rna的基因表达系统可持续地表达所搭载的全部10个基因,这可通过稳定地表达3种耐药性特性(嘌呤霉素抗性、博来霉素抗性、潮霉素抗性)、4种荧光蛋白(egfp、e2-crimson、ebfp2、keima-red)、3种萤光素酶(萤火虫萤光素酶、海肾萤光素酶、夜光海萤(cypridinanoctiluca)萤光素酶)进行确认(图14)。

8-3.隐身型rna基因表达系统中rna结合蛋白(hn、hc、hpol)基因的连接顺序

在本发明的隐身型rna基因表达系统中,编码单链rna结合蛋白的基因(hn)、编码调节rna合成酶活性的蛋白质的基因(hc)、编码rna依赖性rna合成酶的基因(hpols)在隐身型rna上的位置并不限定于如图13所示的从3ˊ末端侧开始的所谓hn-hc-hpols的顺序。例如,即使替换为如hn-hpols-hc或hpols-hn-hc这样的顺序,也可构建隐身型rna基因表达系统(图16)。

8-4.隐身型rna基因表达系统中的源自病毒的蛋白质基因中的突变的必要性

另外,在该隐身型rna基因表达系统中,在由编码单链rna结合蛋白的人源化基因(hn)、编码调节rna合成酶活性的蛋白质的人源化基因(hc)、编码rna依赖性rna合成酶的人源化基因(hpols、hpoll)表达的蛋白质中,不需要存在特别的突变。

如前述3-3.所述,在现有技术中,作为避免先天免疫机制的方法,导入对源自病毒的rna依赖性rna合成酶基因等的pamp活性进行抑制的突变作为最有效的方法而被使用。

但是,在本发明中,借助前述5.所示的方法将源自病毒的蛋白质基因通过全部密码子优化来去除pamp活性,因此,不需要事先向源自病毒的蛋白质中导入蛋白质水平的突变。例如,即使是在使用表达源自作为已知具有强干扰素诱导能力的野生型副粘病毒的仙台病毒z株的np、p、c和l蛋白的基因的情况下,也可通过前述5.所示的方法进行优化,从而可作为隐身型rna基因表达系统的材料使用。例如,作为在图16中以“hpol”表示的表达l蛋白的基因,将源自z株的基因序列针对人类细胞进行优化而使用。

9.对于先天免疫机制诱导活性的验证

9-1.与现有技术避免先天免疫机制激活的效果的比较

接着,对于基因导入时诱导先天免疫机制的活性,为了将搭载隐身型rna基因表达系统的隐身型rna载体与现有技术进行比较,制作了非专利文献7的图1b所描述的作为现有技术的持续表达型仙台病毒载体以及搭载完全相同的4个基因(keima-red、杀稻瘟菌素s抗性基因、egfp、kusabira-orange)的隐身型rna载体。使用这2种载体向人类原代培养成纤维细胞中导入基因,将24小时后的干扰素βmrna的量用real-timepcr法进行定量(图17)。其结果是,就隐身型rna载体而言,尽管没有搭载抑制先天免疫机制的v基因,诱导也被控制在正常细胞中的干扰素βmrna的量的5倍以内。另一方面,就现有技术而言,即使保有v基因,仍观察到正常细胞47倍的诱导(图17)。从该结果可知,就隐身型rna基因表达系统而言,即使在不存在抑制先天免疫机制的因子的条件下,也可避免先天免疫机制的激活。

9-2.进一步的先天免疫机制激活的避免

诱导先天免疫机制的活性也受到保有隐身型rna基因表达系统的细胞的种类以及来自于隐身型rna基因表达系统的基因表达的强度的影响。例如,源自人类的hela细胞中几乎不诱导干扰素β,与之相对,同样源自人类的293细胞中则强烈诱导。另外,为了制造生物医药品,基因表达越强,干扰素β的诱导也越强。在使用隐身型rna基因表达系统制造生物医药品的情况下,由干扰素诱导的细胞质的腺苷脱氨酶(作用于rna的腺苷脱氨酶,adar1)的活性所造成的rna基因组的突变(非专利文献39)成为问题,因此,期望进一步抑制在隐身型rna基因表达系统中残存的先天免疫机制诱导活性。

此目标可通过在隐身型rna基因表达系统中追加搭载抑制先天免疫机制的因子而实现(图18、图19)。作为这样的因子,可列举存在于细胞质中的“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pamp)”受体rig-i的缺失变体(rig-ic)(非专利文献71)、仙台病毒v蛋白的c末端区域(非专利文献72)、蛋白酶体的构成成分psma7(非专利文献73)等。

10.基因表达水平的调节

接着,探讨了通过调节搭载于该载体上的与转录、复制相关的因子的表达,在隐身型rna基因表达系统中的基因表达水平会怎样发生变化(图20、图21)。另外,在图20中以正链rna序列进行标记。各个因子的表达可通过改变由mrna翻译为蛋白质的效率进行调节。另外,使翻译效率变化最简单的方法是变更紧接翻译起始密码子(aug)上游的5ˊ非编码序列。认为在动物细胞中翻译效率最高的是恰好在aug前方具有所谓5ˊ-ccacc-3ˊ(序列号18)的结构的情况(非专利文献60)。另一方面,通过在5ˊ上游侧插入短编码区,可使翻译效率降低(非专利文献61)。在实施例中,制作将rna依赖性rna聚合酶(hpols和hpoll)的表达控制为一定水平并将单链rna结合蛋白(hn)和调节rna合成酶活性的蛋白质(hc)的表达分别抑制为40%和23%的载体,将所搭载的萤火虫萤光素酶的表达进行比较(图20)。其结果是,通过抑制hn和hc中任一种的表达,所搭载的萤光素酶基因的表达升高,通过将hn和hc的表达抑制进行组合,观察到最大79倍的基因表达的升高。

这样的基因表达水平的调节可仅通过对调节rna合成酶活性的蛋白质(hc)的表达水平进行调节来进行(图21)。在此情况下,即使缺失hc基因,也可重构隐身型rna基因表达系统,因为基因表达水平成为最大,所以hc基因并不是隐身型rna基因表达系统的必需要素。但是,搭载基因的表达过强,则细胞增殖被强烈抑制,因此,将hc蛋白表达为适当水平并实现符合目标的基因表达是具有实用性的。

作为基因表达系统中的重要性质,可列举可以根据目的选择最适当的表达水平。例如,在细胞重编程中,转录因子的表达过强,则诱导细胞死亡。另外,在生物医药品的制造中,表达弱,则生产效率降低。一般来说,在使用rna病毒的基因表达系统中改变载体的表达水平是困难的,然而,隐身型rna基因表达系统可以通过微调节各个构成成分的表达平衡,根据使用目的来自由地改变表达强度。

接着,将如此完成的隐身型rna基因表达系统封入内部,尝试制作可向各种动物细胞导入隐身型rna基因表达系统的载体颗粒。使用在细胞质中具有隐身型rna基因表达系统的bhk细胞,使用强srα启动子使副粘病毒的m、f、hn这3种蛋白质表达,则在细胞的培养上清液中检测到具有基因导入活性的载体颗粒。其感染价约为107感染单元/ml,得到与现有形式的持续表达型仙台病毒载体同等的高活性。此载体颗粒通过f和hn蛋白的活性吸附在细胞表面,可通过膜之间的融合将内容物,即隐身型rna基因表达系统导入细胞质中。此过程不需要细胞分裂,因此,不进行细胞分裂的细胞也可进行基因导入。

另外,可导入的细胞的细胞特异性、种特异性由所使用的f和hn蛋白的来源决定,然而,在使用仙台病毒的f和hn蛋白的情况下,可以向包括外周血的血液细胞在内的非常广范的人类细胞和动物细胞中进行基因导入。

11.载体的去除

另外,就现有技术的持续表达型仙台病毒载体而言,通过以sirna抑制rna依赖性rna聚合酶的活性,成功地迅速去除了载体(专利文献3、非专利文献7)。因此,探讨了在隐身型rna基因表达系统中可否以同样的方法去除(图23)。隐身型rna基因表达系统所具有的人源化rna依赖性rna聚合酶(hpoll)的碱基序列与现有技术的持续表达型仙台病毒载体不同,因此,合成了三种新sirna,探讨其活性。其结果是,确认使用三种中的一种sirna(目标序列为序列号46),可与现有技术同样地去除(图23)。如上所述,可知本发明的隐身型rna基因表达系统可应用以往的持续表达型仙台病毒载体所使用的通过rnai去除载体的方法。同样地,也可应用使用microrna(mirna)的去除方法,例如,如专利文献3所记载的,通过在外源基因的3ˊ非编码区或5ˊ非编码区插入microrna(mirna)的目标序列,与内源性mirna反应而去除也是可能的。

12.本发明的隐身型rna表达系统的用途

在本发明的隐身型rna表达系统中使用的负单链隐身性rna载体中,可搭载源自人类的基因等任意基因6个以上,进一步可达10个,可搭载长度为5,000个碱基长度,进一步可达15,000个碱基长度。

并且,因为具有可在人类细胞等动物细胞中避免先天免疫机制激活的隐身性,并且载体的去除也可简单地进行,所以,可以考虑必须同时导入多个基因的细胞重编程技术、包含巨大基因的基因治疗、再生医疗、生物医药品的制造等广泛的用途。

具体而言,可以考虑以下实施方式。

(1)在高效率地制作使用于再生医疗的临床用高品质ips细胞的技术中的应用。

在搭载用于对人类细胞等动物细胞进行重编程的6个以上基因,例如用于ips细胞转换的山中4因子(klf4、oct4、sox2、c-myc)+brg1+baf155这6个基因的情况下,成为13,132个碱基长度。另外,在搭载oct4、klf4、sox2、c-myc、nanog、lin28这6个基因的情况下,成为7,000个碱基长度。

实际上,将这6个基因搭载于本发明的隐身性rna载体上(图25)并在人类胎儿成纤维细胞中使之表达时,得到实现超过40%的初始化效率这样的结果(实施例21)。另外,确认此时山中4因子(klf4、oct4、sox2、c-myc)的搭载顺序可适当改变(数据未显示)。

另外,将人类外周血细胞作为材料,在不含动物成分(xeno-free)、不使用饲养细胞(feeder-free)的条件下进行同样实验的结果是,同样地,也可得到比现有方法进行更高初始化的结果(数据未显示)。

另外,在klf4、oct4、sox2、c-myc这4个基因上,搭载编码染色质重构因子的chd1基因(合计9,907个碱基长度),进一步追加编码dna去甲基化酶的tet1基因(合计11,203个碱基长度),也可提高初始化效率。

作为其它可能的组合,进一步使将2种卵母细胞特异性组蛋白组合的8个基因在人类体细胞中表达,高效率地制作人类ips细胞是可能的。

(2)利用直接重编程技术从人类组织细胞(血液、皮肤、胎盘等)制作神经细胞、神经干细胞、干细胞、胰脏β细胞等的有用基因的再生医疗中的应用。

例如,在将人类成纤维细胞重编程为运动神经的技术中,在被称为lhx3、ascl1、brn2、myt1l的4个基因上追加被称为hb9、isl1、ngn2的3个基因,合计可搭载7个基因(9,887个碱基长度)。

(3)由多个亚基构成的生物医药品的制造。

本发明对于用于生产作为巨大基因、并且需要亚基在同一细胞中同时表达、并且还需要调节各亚基的表达量的免疫球蛋白g、m是有用的。

实际上,在本发明的隐身性rna载体上搭载人类免疫球蛋白的h(μ)链基因、l(κ、λ)链基因以及j基因(图24),使用bhk细胞制造了人类免疫球蛋白m(实施例22)。此时,通过在搭载基因的顺序上下功夫,成功使h链:l链:μ链以约为1:1:0.2的比例进行表达。

另外,在本发明的隐身性rna载体上搭载人类免疫球蛋白的4个cdna(2个h链和2个l链),成功表达了人类双重特异性抗体(实施例23)。

(4)在由多个亚基构成的药物研发靶标蛋白质的表达中的应用。

例如,通过将gp91phox、p22phox、rac、p47phox、p67phox、p40phox这6个亚基搭载于本发明的隐身性rna载体上并使之同时表达,可表达药物研发靶标酶nadph氧化酶(nox2)。

(5)在疾病的致病基因是巨大基因的情况下,在本发明的隐身性rna载体中搭载这些巨大基因使之持续表达,作为这些疾病的基因治疗用载体的应用。

具体而言,可将血友病a的致病基因产物血液凝固因子viii的cdna(7053个碱基长度)或杜氏肌肉营养不良症的致病基因产物肌养蛋白的cdna(11058个碱基长度)搭载于本发明的隐身性rna载体上(图24)来使用。

实施例

以下通过实施例对本发明进行更为详细的说明,然而,本发明并不限定于这些实施例。

本发明中的其它用语和概念是以该技术领域中惯常使用的用语的意思为基础的用语和概念,为了实施本发明而使用的各种技术,除了特别明示其出处的技术之外,基于公知的文献,只要是本领域技术人员就可容易且确实地实施。另外,各种分析等根据使用的分析仪器或试剂、试剂盒的使用明书、目录等所记载的方法进行。

另外,本说明书中引用的现有技术文献、专利公报和专利申请说明书中的记载内容作为本发明的记载内容而被参考。

实施例1:搭载10个外源基因的dna片段的制作(1)

通过pcr以使之成为acc65i-cdna-xhoi的结构的方式对以下基因进行扩增后进行亚克隆(图7)。

1)萤火虫萤光素酶(fireflyluciferase):(genbank登录号ay738224);

2)海肾萤光素酶(renillaluciferase):(genbank登录号ay738228);

3)增强型绿色荧光蛋白(egfp):(genbank登录号u55761);

4)嘌呤霉素抗性基因(针对人类细胞进行密码子优化并合成):非专利文献62,序列号47;

5)夜光海萤萤光素酶:非专利文献63(genbank登录号ab177531);

6)e2-crimson:源自pe2-crimson(clontechlaboratories,inc.),序列号48;

7)增强型蓝色荧光蛋白2(ebfp2):非专利文献64(genbank登录号ef517318);

8)博来霉素抗性基因(针对人类细胞进行密码子优化并合成):非专利文献65,序列号49;

9)dkeima-red:非专利文献66(genbank登录号ab209968);

10)潮霉素b抗性基因(针对人类细胞进行密码子优化并合成):非专利文献67,序列号50。

实施例2:搭载10个外源基因的dna片段的制作(2)

接着,制作以下质粒。

另外,本实施例中使用的核酸都是dna片段,对于序列号1或序列号4等在序列表中作为负链rna序列被指定的序列是指对应的dna序列。在使用dna片段的其它实施例中也同样如此。

1)质粒#1:

在质粒litmus38i(newenglandbiolab,inc.)的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-attb1(序列号51)-序列号1-序列号24-acc65i酶切位点-sali酶切位点-序列号25-序列号4-ctt-序列号1-序列号26-bsiwi酶切位点-xhoi酶切位点-序列号27-序列号4-sapi酶切位点。

2)质粒#2:

在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号28-acc65i酶切位点-sali酶切位点-序列号29-序列号4-ctt-序列号1-序列号30-bsiwi酶切位点-xhoi酶切位点-序列号31-序列号4-sapi酶切位点。

3)质粒#3:

在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号32-acc65i酶切位点-sali酶切位点-序列号33-序列号4-ctt-序列号1-序列号34-bsiwi酶切位点-xhoi酶切位点-序列号35-序列号4-sapi酶切位点。

4)质粒#4:

在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号36-acc65i酶切位点-sali酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-bsiwi酶切位点-xhoi酶切位点-序列号39-序列号4-sapi酶切位点。

5)质粒#5:

在litmus38i的apai酶切位点与stui酶切位点之间克隆具有以下结构的dna:sapi酶切位点-序列号1-序列号36-acc65i酶切位点-sali酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-bsiwi酶切位点-xhoi酶切位点-序列号39-序列号4-attb2(序列号52)-sapi酶切位点。

实施例3:搭载10个外源基因的dna片段的制作(3)(参见图8)

接着,制作以下质粒。

1)质粒#1c

在质粒#1的acc65i-sali之间克隆包含萤火虫萤光素酶基因的acc65i-xhoi片段,制作质粒#1b。进一步地,在质粒#1b的bsiwi-xhoi之间克隆包含海肾萤光素酶基因的acc65i-xhoi片段,制作质粒#1c。

2)质粒#2c

在质粒#2的acc65i-sali之间克隆包含egfp基因的acc65i-xhoi片段,制作质粒#2b。进一步地,在质粒#2b的bsiwi-xhoi之间克隆包含嘌呤霉素抗性基因的acc65i-xhoi片段,制作质粒#2c。

3)质粒#3c

在质粒#3的acc65i-sali之间克隆包含夜光海萤萤光素酶基因的acc65i-xhoi片段,制作质粒#3b。进一步地,在质粒#3b的bsiwi-xhoi之间克隆包含e2-crimson基因的acc65i-xhoi片段,制作质粒#3c。

4)质粒#4c

在质粒#4的acc65i-sali之间克隆包含ebfp2基因的acc65i-xhoi片段,制作质粒#4b。进一步地,在质粒#4b的bsiwi-xhoi之间克隆包含博来霉素抗性基因的acc65i-xhoi片段,制作质粒#4c。

5)质粒#5c

在质粒#5的acc65i-sali之间克隆包含dkeima-red基因的acc65i-xhoi片段,制作质粒#5b。进一步地,在质粒#5b的bsiwi-xhoi之间克隆包含潮霉素b抗性基因的acc65i-xhoi片段,制作质粒#5c。

实施例4:搭载10个外源基因的dna片段的制作(4)(参见图9)

将从质粒#1c使用sapi切出的包含萤火虫萤光素酶基因和海肾萤光素酶基因的dna片段100ng、从质粒#2c使用sapi切出的包含egfp基因和嘌呤霉素抗性基因的dna片段100ng、从质粒#3c使用sapi切出的包含夜光海萤萤光素酶基因和e2-crimson基因的dna片段100ng、从质粒#4c使用sapi切出的包含ebfp2基因和博来霉素抗性基因的dna片段100ng、从质粒#5c使用sapi切出的包含dkeima-red基因和潮霉素b抗性基因的dna片段100ng,共计500ng,溶解于5μlh2o中,混合5μlligation-conveniencekit(nippongeneco.,ltd.),使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#6(pdonr-221,lifetechnologies,inc.)(150ng)和2μlbpclonase2(lifetechnologies,inc.),使之在25℃反应2小时,然后导入大肠杆菌dh-5α,分离卡那霉素抗性菌落,制作质粒#7。

实施例5:制造搭载10个外源基因的隐身型rna的模板dna的制作(参见图10)

质粒#8是将具有p15a的复制起点的质粒pacyc177(非专利文献56)的卡那霉素抗性基因使用pdonr-221的包含attb1-氯霉素抗性基因-attb2的dna片段进行置换而制作的。在通过optimumgen基因设计系统优化的包含hn-hc-hpols的dna(序列号53)的5ˊ侧依次连接attb1、t7终止子和hdv核酶的dna片段由genscript公司合成。同样地,合成了在通过optimumgen基因设计系统优化的包含hpoll的dna(序列号54)的3ˊ侧连接t7启动子和attb2的dna。将使用bamhi和xmai切出的依次包含attb1-t7终止子-hdv核酶-hn-hc-hpols的dna片段100ng、使用xmai和noti从质粒#7切出的包含10个基因的dna片段100ng、使用noti和sali切出的依次包含hpoll-t7启动子-attb2的dna片段100ng,共计300ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#8(150ng)和2μlbpclonase2,使之在25℃反应16小时,然后导入大肠杆菌hst-08(takarabioco.),分离氨苄青霉素抗性菌落,制作成为合成负链隐身型rna的模板的质粒#9b。

合成正链隐身型rna的模板dna是将t7启动子与t7终止子互换而制作的。具体而言,将依次包含attb1-t7启动子-hn-hc-hpols的dna片段100ng、使用xmai和noti从质粒#7切出的包含10个基因的dna片段100ng、使用noti和sali切出的依次包含hpoll-hdv核酶-t7终止子-attb2的dna片段100ng,共计300ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#8(150ng)和2μlbpclonase2,使之在25℃反应16小时,然后导入大肠杆菌hst-08,分离氨苄青霉素抗性菌落,制作成为合成正链隐身型rna的模板的质粒#9a。

实施例6:搭载10个外源基因的隐身型rna基因表达系统的重构(方法1)(参见图11)

方法1根据专利文献3和非专利文献7所描述的方法进行。

具体而言,作为bhk/t7/151m(se)细胞,按照以下方法制作稳定表达t7rna聚合酶和m蛋白的源自仓鼠的bhk-21细胞。bhk-21细胞从日本理化学研究所生物资源中心获得。将t7rna聚合酶基因(非专利文献74)针对动物细胞进行密码子优化后合成的cdna(序列号77)搭载于反转录病毒载体pcx4neo(非专利文献75,genbank登录号ab086385)上,导入bhk-21细胞后,通过包含800μg/mlg-418的含有10%fcs的dmem培养基进行选择,得到bhk/t7细胞。接着,将仙台病毒温度敏感型突变株clone151株的m基因(genbank登录号nm_011046)搭载于反转录病毒载体pcx4pur(非专利文献75,genbank登录号ab086386)上,导入bhk-21/t7细胞后,通过包含200μg/ml嘌呤霉素的含有10%fcs的dmem培养基进行选择,得到bhk/t7/151m(se)细胞。

重构中使用的表达载体通过以下方法制作。np蛋白表达质粒pcmv-np、p蛋白表达质粒pcmv-p、l蛋白表达质粒pcmv-l、小鼠弗林蛋白酶(furin)表达质粒pcmv-furin是将仙台病毒z株的np基因、p基因、l基因(genbank登录号m30202.1)和小鼠弗林蛋白酶cdna(非专利文献76,genbank登录号nm_011046)连接至巨细胞病毒的立即早期基因(immediateearlygene)的增强子、启动子(非专利文献77)下游而制作的。f和hn蛋白表达质粒psrd-hn-fmut(非专利文献78)是将仙台病毒z株的f和hn基因连接至srα启动子(非专利文献79)下游的质粒。pmkit-151m是在srα启动子的下游连接仙台病毒温度敏感型突变株clone151株的m基因而制作的。

将稳定表达m蛋白的bhk/t7/151m(se)细胞按照5×105细胞/孔接种于6孔板,培养24小时后洗净。将质粒#9a、np蛋白表达质粒pcmv-np、p蛋白表达质粒pcmv-p、l蛋白表达质粒pcmv-l、f和hn蛋白表达质粒psrd-hn-fmut、小鼠弗林蛋白酶表达质粒pcmv-furin分别按照2μg、1μg、1μg、1μg、2μg、20ng的量的比例悬浮于300μloptimem(lifetechnologies,inc.)中,将与包含10μllipofectamineltx(lifetechnologies,inc.)的300μloptimem混合并在室温放置20分钟的培养基添加至细胞,培养4小时。将细胞再度洗净后,添加含有10%fcs的dmem培养基,进一步在32℃培养3天。之后,将细胞移至包含300μg/ml潮霉素b的含有10%fcs的dmem培养基继续培养,分离bhk/#9a细胞。通过egfp和keima-red的表达确认了引起隐身型rna基因表达系统重构的事实。

实施例7:搭载10个外源基因的隐身型rna基因表达系统的重构(方法2)(参见图12)

作为reca和rnasee的双重缺失突变株的大肠杆菌e-aist7株是依次将大肠杆菌bl21(de3)株(非专利文献68)的rnasee基因和reca基因破坏进行制作的。在rnasee基因中,将rnaseec末端的缺失突变(rne131)导入(非专利文献59),在reca基因中将完全缺失突变导入。基因破坏使用genebridgesgmbh公司的quick&easy大肠杆菌基因缺失试剂盒(e.coligenedeletionkit),根据该试剂盒的实验规程进行。使用大肠杆菌表达单链rna结合蛋白(n)的质粒#10,是通过在质粒pet-24a(+)(merckkgaa)上搭载针对大肠杆菌进行密码子优化的n基因(en)(序列号55)进行制作的。

在大肠杆菌e-aist7株中导入质粒#9b和质粒#10,通过氨苄青霉素和卡那霉素进行选择,制作e-aist7/n/9b株。将e-aist7/n/9b株在30℃培养,当达到od600=0.3时,加入0.5mmiptg,诱导t7rna聚合酶的表达,培养3小时,回收大肠杆菌。将回收的菌悬浮于10ml10%蔗糖、50mmtris-hcl(ph7.5)、2mmmgcl2中,加入150千单位重组溶菌酶(rlysozome)(merckkgaa)和25单位全能核酸酶(benzonase)(merckkgaa)后,在30℃处理30分钟,回收原生质体。将原生质体使用50mmtris-hcl(ph7.5)、2mmmgcl2、50mmchaps进行破坏后,将4,500rpm10分钟的离心上清液使用beckmansw41ti转子以25,000rpm离心60分钟,将rna-n蛋白复合体作为沉淀物进行回收。进一步将rna-n蛋白复合体悬浮于28%氯化铯溶液,使用beckmansw41ti转子以37,000rpm离心45小时,纯化了rna-n蛋白复合体。

将bhk/t7/151m(se)细胞以5×105细胞/孔接种于6孔板,培养24小时后,将p蛋白表达质粒pcmv-p、l蛋白表达质粒pcmv-l各1μg通过lipofectamineltx导入。再经24小时后,将5μgrna-n蛋白复合体与10μlpro-deliverin试剂(ozbiosciences)混合,导入细胞。从24小时后开始,将细胞移至包含300μg/ml潮霉素b的含有10%fcs的dmem培养基中继续培养,分离bhk/#9a2细胞。通过egfp和keima-red的表达确认了引起隐身型rna基因表达系统重构的事实。

实施例8:搭载10个外源基因的隐身型rna载体#1的制作

对于5.0×105个bhk/#9a细胞(或bhk/#9a2细胞),将作为基因缺失表达质粒的pmkit-151m、psrd-hn-fmut、pcmv-furin按照2μg、2μg、30ng的比例使用脂质体转染试剂ltx进行导入,4小时后洗净细胞后,加入含有10%fcs的dmem培养基,进一步在32℃培养4天。之后,回收包含隐身型rna载体#1(图13)的培养上清液,使用0.45μm的过滤器过滤后,如果需要,可通过超离心法浓缩载体。将载体悬浮液在液氮中急速冷冻,在-80℃保存。载体的活性使用源自猴肾脏的llcmk2细胞由抗np蛋白抗体通过间接荧光抗体法进行检测(非专利文献7)。由此方法得到的隐身型rna载体的感染价为约107感染单元/ml,得到与现有形式的持续表达型仙台病毒载体同等或其以上的活性。

实施例9:通过搭载10个外源基因的隐身型rna载体的基因表达(参见图14)

将实施例8制作的隐身型rna载体#1以感染复数(moi)=3感染hela细胞,通过包含100μg/ml潮霉素b的含有10%fcs的dmem培养基进行选择,建立hela/#9细胞。该细胞的抗药性能通过嘌呤霉素(1.5μg/ml)、博来霉素(100μg/ml)、潮霉素b(100μg/ml)、g418(800μg/ml)、杀稻瘟菌素s(10μg/ml)进行选择,生存率通过菌落分析进行测定。阴性对照的hela细胞对这些抗生素都具有敏感性,与之相对,hela/#9细胞对嘌呤霉素、博来霉素、潮霉素b选择性地显示抗性,确认对这3种试剂表达抗性特性(图14,上部)。

hela/#9细胞中的荧光蛋白表达通过流式细胞仪(gallios,beckmancoulter)进行计测。各荧光蛋白的观察条件如下。ebfp2:激发405nm,检测450nm;keima-red:激发405nm,检测620nm;egfp:激发488nm,检测530nm;e2-crimson:激发638nm,检测660nm。与不保有载体的hela细胞相比,确认hela/#9细胞表达4个荧光蛋白(图14,中部)。

hela/#9细胞中的萤光素酶表达使用以下试剂通过冷光仪(promega,corp.)检验发光。萤火虫萤光素酶和海肾萤光素酶:双荧光素酶报告基因检测系统(dual-luciferasereporterassaysystem)(promega,corp.);夜光海萤萤光素酶:biolux海萤萤光素酶分析试剂盒(cypridinaluciferaseassaykit)(newenglandbiolabs,inc.)。不保有载体的hela细胞未检验到任一种萤光素酶的活性,然而,hela/#9细胞检验到萤光素酶的高活性(图14,下段)。

实施例10:搭载10个外源基因的隐身型rna载体#2(图15)的制作

除了将在模板cdna制作中使用的hn、hc、hpols、hpoll基因通过genegps表达优化技术进行优化并将hn、hc、hpols这3个基因按照hn-hpols-hc的顺序搭载之外,使用与实施例8所记载的方法同样的方法制作载体,并按照实施例9所记载的方法进行验证。在包含hn-hpols-hc的dna(序列号78)的5ˊ侧依次连接attb1和t7启动子的dna片段由dna2.0公司合成。同样地,在包含hpoll的dna(序列号79)的3ˊ侧连接hdv核酶、t7终止子和attb2的dna片段由dna2.0公司合成。

实施例11:搭载10个外源基因的隐身型rna载体#3、#4(图16)的制作

除了将使用optimumgen基因设计系统优化的hn、hc、hpols这3个基因按照hn-hpols-hc的顺序(#3)或按照hpols-hn-hc的顺序(#4)进行搭载之外,使用与实施例8所记载的方法同样的方法制作载体,并按照实施例9所记载的方法进行验证。在包含hn-hpols-hc的dna(序列号80)的5ˊ侧依次连接attb1和t7启动子的dna片段、在包含hpols-hn-hc的dna(序列号81)的5ˊ侧依次连接attb1和t7启动子的dna片段以及在包含hpoll的dna(序列号82)的3ˊ侧连接hdv核酶、t7终止子和attb2的dna片段由genscript公司合成。

实施例12:搭载4个外源基因的隐身型rna载体#5的制作

杀稻瘟菌素s抗性基因(非专利文献69)(序列号56)和kusabira-orange基因(非专利文献70)(genbank登录号ab128819)以使之成为acc65i-cdna-xhoi的结构的方式进行pcr扩增后亚克隆(图7)。质粒#5d,在litmus38i的apai酶切位点与stui酶切位点之间克隆具有下述结构的dna。但是,与质粒#5的sapi酶切切面不同:sapi酶切位点-序列号1-序列号36-acc65i酶切位点-sali酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-bsiwi酶切位点-xhoi酶切位点-序列号39-序列号4-attb2-sapi酶切位点。

在质粒#1的acc65i-sali之间克隆包含dkeima-red基因的acc65i-xhoi片段,制作质粒#1d。进一步地,在质粒#1d的bsiwi-xhoi之间克隆包含杀稻瘟菌素s抗性基因的acc65i-xhoi片段,制作质粒#1e。同时,在质粒#5d的acc65i-sali之间克隆包含egfp基因的acc65i-xhoi片段,制作质粒#5e。进一步地,在质粒#5e的bsiwi-xhoi之间克隆包含kusabira-orange基因的acc65i-xhoi片段,制作质粒#5f。

将使用sapi从质粒#1e切出的包含dkeima-red基因和杀稻瘟菌素s抗性基因的dna片段100ng、使用sapi从质粒#5f切出的包含egfp基因和kusabira-orange基因的dna片段100ng,合计200ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#6(150ng)和2μlbpclonase2,使之在25℃反应2小时,之后导入大肠杆菌dh-5α,分离卡那霉素抗性菌落,制作质粒#11。利用从质粒#11使用xmai和noti切出的包含4个基因的dna片段的隐身型rna载体#5的制作根据实施例5~实施例8所记载的方法进行。

实施例13:通过隐身型rna载体的ifn-β基因的诱导(图17)

缺失持续表达型仙台病毒载体sevdp(kr/bsr/egfp/ko)记载于非专利文献7。将通过实施例12制作的隐身型rna载体#5和sevdp(kr/bsr/egfp/ko)载体一起以moi=3感染源自原代培养的人类皮肤成纤维细胞。在此条件下,任一载体都可导入约80%的细胞。在载体感染后第24小时,使用isogen试剂盒(nippongeneco.,ltd.)提取细胞总rna,使用脱氧核糖核酸酶(deoxyribonuclease)(rt级)(nippongeneco.,ltd.)分解基因组dna。接着,将该rna作为模板,使用用于rt-pcr的superscriptiii合成系统(superscriptiiisynthesissystemforrt-pcr)(lifetechnologies,inc.)和oligo(dt)20,通过反转录反应进行第一链cdna合成。进一步地,使用ssoadvanced通用型sybrgreen预混液(ssoadvanceduniversalsybrgreensupermix)(bio-rad),将第一链cdna作为模板,使用内参基因或干扰素β基因的基因特异性引物(gsp)和cfx96实时系统(real-timesystem)(bio-rad)通过实时pcr法进行ifn-βmrna的表达量的解析。

实施例14:搭载6个外源基因的隐身型rna基因表达系统#6、#7、#8、#9、#10的制作(图20、图22)

质粒#2d是在质粒litmus38i的apai酶切位点与stui酶切位点之间克隆有具有以下结构的dna。但是,与质粒#2相比,由sapi酶切的切面的序列是不同的:sapi酶切位点-序列号1-序列号28-acc65i酶切位点-sali酶切位点-序列号29-序列号4-ctt-序列号1-序列号30-bsiwi酶切位点-xhoi酶切位点-序列号31-序列号4-sapi酶切位点。

在质粒#2d的acc65i-sali之间克隆包含egfp基因的acc65i-xhoi片段,制作质粒#2e。进一步地,在质粒#2e的bsiwi-xhoi之间克隆包含嘌呤霉素抗性基因的acc65i-xhoi片段,制作质粒#2f。

将从质粒#1c由sapi切出的包含萤火虫萤光素酶基因和海肾萤光素酶基因的dna片段100ng、从质粒#2f由sapi切出的包含egpf基因和嘌呤霉素抗性基因的dna片段100ng、从质粒#5c由sapi切出的包含dkeima-red基因和潮霉素b抗性基因的dna片段100ng,共计300ng,溶解于5μlh2o中,混合5μlligation-conveniencekit,使之在16℃反应60分钟。纯化后,溶解于7μlh2o中,加入1μl质粒#6(150ng)和2μlbpclonase2,使之在25℃反应2小时,之后导入大肠杆菌dh-5α,分离卡那霉素抗性菌落,制作质粒#12。使用从质粒#12由xmai和noti切出的包含6个基因的dna片段的隐身型rna基因表达系统#6、#7、#8(图20)(实施例16)和#9、#10(图22)(实施例18)的制作根据实施例5、实施例6和实施例8所记载的方法进行。

实施例15:搭载5个外源基因的隐身型rna基因表达系统#11、#12、#13、#14、#15的制作(图18)

除了在实施例14的质粒#12所搭载的基因中去除萤火虫萤光素酶并且将嘌呤霉素抗性基因置换为源自质粒pbr322的四环素抗性基因(genbank登录号j01749.1)以外,搭载5个基因的质粒#13按照实施例14所记载的方法进行制作。

将这5个外源基因搭载于将hn、hc、hpols这3个基因按照hn-hpols-hc的顺序搭载的隐身型rna载体#3上(图16),制作搭载5个外源基因的隐身型rna基因表达系统#11。进一步地,在此隐身型rna基因表达系统的xmai部位插入包含密码子优化的rig-ic的基因盒(序列号83)、包含密码子优化的仙台病毒v蛋白的c末端区域的基因盒(序列号84)、包含密码子优化的蛋白酶体的构成成分psma7的基因盒(序列号85),制作搭载5个外源基因的隐身型rna基因表达系统#12、#13、#14。同时,搭载5个外源基因的隐身型rna基因表达系统#15是将hn-hpols-hc基因中的hpols基因的一部分置换成未优化的仙台病毒z株的p基因(序列号86),使v蛋白进行表达的基因表达系统。

由包含这些隐身型rna基因表达系统的细胞依照实施例8制作隐身型rna载体,导入源自人类的293细胞,测定干扰素诱导能力。就图19而言,与作为代表例的隐身型rna载体#11和#12进行比较,显示通过追加rig-ic基因,由隐身型rna载体残存的干扰素β的诱导几乎完全被抑制。

实施例16:n蛋白和c蛋白表达效率的变化对于搭载于隐身型rna基因表达系统上的外源基因的表达所产生的影响的解析(参见图20)

在pgl4.12(promega公司)(genbank登录号ay738224)所编码的萤火虫萤光素酶cdna的翻译起始密码子(aug)上游插入对应于序列号56、序列号57、序列号58的rna序列,使用cmv启动子使之在hela细胞中表达,使用双荧光素酶报告基因检测系统检测萤光素酶的活性(图20)。其结果可知,如果在原本的翻译起始密码子上游将其它起始密码子置入错误读码框,则与原本的蛋白质翻译序列错位,翻译效率降低。

接着,检测了将hnmrna和hcmrna的翻译起始密码子5ˊ上游侧的碱基序列进行改变的隐身型rna基因表达系统#6、#7、#8的基因表达能力。就隐身型rna基因表达系统#6而言,hnmrna和hcmrna的翻译起始密码子(aug)5ˊ上游侧是被认为是翻译效率最高的所谓“kozak序列(序列号57)”。就隐身型rna基因表达系统#7而言,hnmrna的翻译起始密码子5ˊ上游侧被置换为“kozak序列(序列号57)”(非专利文献60)、hcmrna的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至23%的序列号59的碱基序列。同时,就隐身型rna基因表达系统#8而言,hnmrna的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至40%的序列号58的碱基序列、hcmrna的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至23%的序列号59的碱基序列。就此实验而言,在稳定地保有隐身型rna基因表达系统#6、#7、#8的bhk/t7/151m(se)细胞中,使用双荧光素酶报告基因检测系统检测萤光素酶的活性(图20)。

实施例17:搭载5个外源基因的隐身型rna基因表达系统#16、#17的制作(图21)

将hn、hc、hpols这3个基因按照hn-hpols-hc的顺序进行搭载,搭载5个外源基因的隐身型rna基因表达系统#11记载于实施例15。此载体的hc基因改变了5ˊ侧非翻译区域的序列,翻译效率降低至23%(图21)。隐身型rna基因表达系统#16是从#11去除hc基因的基因表达系统。隐身型rna基因表达系统#17是将#11的hc基因的5ˊ非翻译序列变为kozak序列,翻译效率成为100%的基因表达系统。

由图21所示的egfp表达可知,隐身型rna基因表达系统的基因表达水平可通过改变hc基因的翻译效率进行调节。另外,hc基因不是隐身型rna基因表达系统重构所必需的要素,然而,如果没有hc基因,则外源基因表达变为非常强,因此,细胞增殖受到抑制。因此,通过使hc基因表达为某种水平,可得到实用性水平的基因表达,这是现实性的。

实施例18:位于隐身型rna基因表达系统的基因组3ˊ侧的包装信号对于载体颗粒产生所施加的影响的解析(参见图22)

隐身型rna基因表达系统#9是从隐身型rna基因表达系统#6(图20)删除基因组rna3ˊ侧的序列d(序列号17)的基因表达系统。同时,隐身型rna基因表达系统#10是从隐身型rna基因表达系统#7(图20)删除基因组rna3ˊ侧的序列d(序列号17)的基因表达系统。在稳定地保有这些隐身型rna基因表达系统的bhk/t7/151m(se)细胞中,按照实施例5所记载的方法表达m、f、hn的各蛋白质,从上清液回收的隐身型rna载体的基因导入能力经由使用llcmk2细胞的抗np蛋白抗体通过间接荧光抗体法进行检测(非专利文献7)。

进一步地,试图从列举于表1中的源自管家基因的mrna的部分序列进行任意选择,对这18个碱基序列进行置换(图2的(5)(序列号75)),确认颗粒化效率没有变化(数据未显示)。

由此可知,可以认为从基因组3ˊ末端起第97~114个碱基的18个碱基长度或其一部分长度的区域对于负单链rna中用于颗粒化的包装是必需的。无论如何,该位置的18个碱基长度或其一部分长度的区域对于以负单链rna作为模板的转录和复制不是必需的,然而,可以说,隐身型rna基因表达系统是为了摄入病毒样颗粒所必需的“包装信号区域”。

实施例19:将保有隐身型rna基因表达系统的hela细胞使用sirna处理时的萤光素酶活性的经时变化(参见图23)

从隐身型rna基因表达系统#6(图20)制作隐身型rna载体#6,将基因导入hela细胞,通过潮霉素b进行选择,建立hela/#3细胞株。将hela/#3细胞按照1.0×104/孔接种于48孔板,第二天,将以poll基因的靶序列(序列号46)作为靶标的sirna与导入试剂rnaimax(lifetechnologies,inc.)混合后导入,使最终浓度为100nm。萤光素酶活性经时测定的结果,4次独立实施的实验的每一次都表明萤光素酶的活性10天被抑制至约0.1%,隐身型rna基因表达系统被高效率地从细胞去除。

实施例20:搭载大基因的隐身型rna载体的制作(参见图24)

搭载各种外源基因的隐身型rna载体的制作可与实施例1~实施例2同样地各由2个基因制造“转录盒”,与实施例3~实施例5同样地依次连接“转录盒”,按照与实施例6或实施例7以及实施例8同样的方法进行制作。可作为如此大的外源基因搭载的外源基因的名称及其碱基序列如下。人类klf4:序列号60;人类oct4:序列号61;人类sox2:序列号62;人类c-myc:序列号63;人类brg1:序列号64;人类baf155:序列号65;人类免疫球蛋白g的h链:序列号66;人类免疫球蛋白g的l链:序列号67;人类免疫球蛋白m克隆2g9的h链:序列号68;人类免疫球蛋白m克隆2g9的l链:序列号69;人类免疫球蛋白m的j链:序列号70;人类血液凝固因子viii:序列号71;人类肌养蛋白:序列号72。

将这些基因作为外源基因搭载的rna表达系统可按照基于上述各实施例所记载的步骤的方法导入目标细胞。并且,通过在同一细胞中同时表达多个外源基因,使得对于细胞重编程等导入细胞而言加入所期望的变更成为可能。

实施例21:通过搭载6个初始化基因的隐身型rna载体的诱导多能干细胞(ips细胞)的诱导(图25)

可以认为,可搭载6个以上基因并确实地表达的所谓隐身型rna载体的特征是,对所谓将人类的体细胞进行初始化并转换成ips细胞的细胞重编程是特别有效的。因此,向作为用于制作人类诱导多能干细胞的方法最初被报告的klf4、oct4、sox2、c-myc的4个初始化基因的组合(专利文献1、非专利文献1)中,追加具有补全性功能的初始化基因nanog和lin28(专利文献2、非专利文献2),制作同时表达合计6个初始化基因的隐身型rna载体,在与迄今为止被报告的ips细胞的制作技术中初始化效率最高的“同时搭载4个初始化基因(klf4、oct4、sox2、c-myc)的持续表达型仙台病毒载体”(专利文献3、专利文献4、非专利文献7)(图25a)之间,对细胞的初始化活性进行比较。

搭载6个初始化基因的隐身型rna载体#23(图25b)是使用实施例14所示的方法依次结合人类klf4(序列号60)、人类oct4(序列号61)、人类sox2(序列号62)、人类c-myc(序列号63)、人类nanog(序列号87)、人类lin28(序列号88),组装至图16的隐身型rna载体#3,按照实施例6和实施例8进行制作。

ips细胞的制作按照专利文献3进行。具体而言,将作为源自人类胎儿成纤维细胞的tig3细胞以1.0×105细胞/孔接种于12孔板,第二天,将搭载klf4、oct4、sox2、c-myc的持续表达用仙台病毒载体(图25a)以及搭载klf4、oct4、sox2、c-myc、nanog、lin28的隐身型rna载体(图25b)分别以感染复数(moi)=3的条件加入培养基中,通过在室温放置2小时后在37℃培养一夜进行感染。将经丝裂霉素c处理的mef作为饲养细胞,在涂覆明胶的培养皿上进行准备,将上述载体感染细胞在其上接种,在诱导多能干细胞用培养基stemfitak03(ajinomoto,co.,inc.)中进行培养。在基因导入后第11天,使用alexafluor488标记抗tra-1-60抗原抗体(merck-millipore)进行染色,对从1×104个tig-3细胞中出现的tra-1-60阳性的ips细胞克隆数进行计数(图25c)。其结果是,由搭载4因子载体出现的ips细胞为85个克隆(初始化效率0.85%),与之相对,同时搭载6因子载体出现4290个克隆(初始化效率42.9%)的ips细胞克隆,显示同时搭载6个基因的隐身型rna载体的有效性。另外,此实施例所使用的基因的合计碱基长度为7.0kb,是使用现有的rna载体的方法不可能实现的大小。

实施例22:通过同时表达人类免疫球蛋白m(igm)的h链、l链、j链的免疫球蛋白m的产生(图26)

在生物医药品制造的技术领域中,作为必须使多个多肽同时表达的代表性制品有抗体医药品。可以表达h链和l链并制造的免疫球蛋白g(igg)的商业生产技术已经被确立,然而,必须使编码h链、l链、j链的3个基因同时表达的igm的制造迄今为止仍然是不容易的(非专利文献84)。已知在igm中存在具有igg所没有的强抗肿瘤活性的抗体(非专利文献85),igm的制造法的确立具有产业上的重大意义。因此,尝试通过将编码人igm的h链、l链、j链的3个基因搭载于隐身型rna载体上并使之同时表达,制造了分子量为950k道尔顿的igm。

就实施例22而言,选择与人类免疫缺陷病毒(hiv)感染细胞发生反应的人类单克隆igm抗体9f11和2g9(非专利文献86)作为材料,将9f11抗体的h链基因(序列号89)和l链基因(序列号90)、j链基因(序列号70)、潮霉素b抗性基因(序列号50)、或者2g9抗体的h链基因(序列号68)和l链基因(序列号69)、j链基因(序列号70)、潮霉素b抗性基因(序列号50)依照实施例12按照上述顺序进行连接,搭载于图20的隐身型rna载体#8上,得到隐身型rna载体#23和#20。接着,以moi=3的条件对在蛋白质制造用的无血清培养基opti-prosfm(lifetechnologies,inc.)中驯化的源自仓鼠的bhk细胞进行基因导入,通过添加100μg/ml潮霉素b进行选择。更换新培养基后,在24小时回收,回收该培养上清液。

将培养上清液中的人igm的量使用抗人igmelisa试剂盒(bethyllaboratories,inc.)进行定量,在导入2g9的基因组的情况下,检测出9.17μg/mligm;在导入9f11的基因组的情况下,检测出11.15μg/mligm。未导入基因的bhk细胞的培养上清液中的igm在检测限以下。如果将上述量以每个细胞每天的表达效率(pg/细胞/天)进行换算,则2g9为16.38pg/细胞/天、9f11为19.91pg/细胞/天(图26)。

接着,将包含300ng和100ngigm的培养上清液使用4~20%梯度凝胶(bio-rad)通过sds聚丙烯酰胺电泳进行解析,使用生物安全考马斯亮蓝g250染剂(biosafecoomasieg250stain)(bio-rad)进行染色。其结果是,非还原状态在与天然的人igm相同的970k道尔顿的位置检测到条带,同时,还原状态在分子量75k道尔顿的h链和25k道尔顿的l链的位置检测到条带,表明得到与天然相同的21条多肽结合的igm分子。

在非专利文献84中,记载了使用cho-dg44细胞和hek293细胞通过甲氨蝶呤进行基因扩增的结果得到的igm稳定表达细胞4个克隆的解析结果,然而,表达效率为25.00、3.59、4.60、0.21pg/细胞/天。由此表明,如果使用隐身型rna载体,可容易地实现与通过需要数月的基因扩增而实现的igm的表达同等或较高水平的生产。

实施例23:通过同时表达4个cdna的人类双重特异性抗体的产生(图27)

可识别2个不同抗原的双重特异性抗体作为将迄今为止的抗体医药品的可能性大幅扩展的分子,在生物医药品技术领域中最近备受瞩目。双重特异性抗体是在识别抗原a的h链(a)和l链(a)以及识别抗原b的h链(b)和l链(b)构成的四聚体中导入突变使h链(a)和l链(b)或者h链(b)和l链(a)难以结合,且导入突变使得与h链(a)之间或h链(b)之间的结合相比,h链(a)与h链(b)的结合变强,在此基础上,使编码h链(a)、l链(a)、h链(b)、l链(b)的4个基因同时表达而进行制作(非专利文献87)。将这样的4个基因同时导入细胞后,基因扩增,得到同时高表达4个多肽的细胞株是极为困难的,因此,通常通过瞬时基因表达进行生产。就本实施例而言,在非专利文献87所记载的双重特异性抗体中,尝试制作同时识别her2和上皮细胞增殖因子受体(egfr)的hedesignlk。

将非专利文献87公开的抗her2抗体的h链hc1(vhvrd1ch1crd2)基因(序列号91)和l链lc1(vlvrd1cλcrd2)基因(序列号92)以及抗egfr抗体的h链hc2(vhvrd2ch1wt)基因(序列号93)和l链lc2(vlvrd2cκwt)基因(序列号94)与egfp基因和潮霉素b抗性基因一起,按照实施例14进行连接,搭载于隐身型rna载体#8上(图20),制作隐身型rna载体#24。同时,为了比较,将仅表达抗her2抗体的h链和l链的载体#25(图27b)以及仅表达抗egfr抗体的h链和l链的载体#26(图27c)按照实施例12进行制作。

使用这些载体,按照实施例22的方法向经opti-prosfm(lifetechnologies,inc.)驯化的源自仓鼠的bhk细胞中导入基因,将稳定表达细胞的培养上清液中的人igg的量使用抗人iggelisa试剂盒(bethyllaboratories,inc.)进行定量。其结果是,与制作四聚体的活性低的仅有hc1和lc1的组合(12.93pg/细胞/天)、或hc2和lc2的组合(14.02pg/细胞/天)相比,在同时搭载hc1、lc1、hc2、lc2这4个基因的情况下,观察到显著高(37.45pg/细胞/天)的抗体产生,暗示双重特异性抗体被高效率地产生。同时,此表达水平与使用基因扩增在cho细胞中建立的一般性的细胞株的基因表达水平(最大约为90pg/细胞/天)(非专利文献88)是可比的。由此暗示,作为用于可以将通过现有方法难以得到稳定表达细胞株的双重特异性抗体稳定地产生的方法,隐身型rna载体是非常有效的。另外,此实施例中使用的基因的合计碱基长度为6.7k个碱基,是使用现有的rna载体的方法不能实现的大小。

工业实用性

本发明是在包含诱导多能干细胞(ips细胞)的制作在内的人类细胞重编程、蛋白质医药品的制造、使用包含巨大基因的各种基因的基因治疗、药物研发靶标分子的表达等众多产业领域中有用的技术。

序列表

<110>国立研究开发法人产业技术综合研究所

常磐-生物株式会社

<120>使用具有隐身性的rna的基因表达系统以及包含该rna的基因导入、表达载体

<130>sju5167979wo

<150>jp2015-007288

<151>2015-01-16

<160>94

<170>patentinversion3.5

<210>1

<211>10

<212>rna

<213>人工序列

<220>

<223>仙台病毒转录起始信号,负链序列

<400>1

cuuucacccu10

<210>2

<211>10

<212>rna

<213>人工序列

<220>

<223>仙台病毒转录起始信号,负链序列

<400>2

cuuuaucccu10

<210>3

<211>10

<212>rna

<213>人工序列

<220>

<223>仙台病毒转录起始信号,负链序列

<400>3

cauucacccu10

<210>4

<211>10

<212>rna

<213>人工序列

<220>

<223>仙台病毒转录终止信号,负链序列

<400>4

uuuuucuuaa10

<210>5

<211>10

<212>rna

<213>人工序列

<220>

<223>仙台病毒转录终止信号,负链序列

<400>5

uuuuucuuac10

<210>6

<211>10

<212>rna

<213>人工序列

<220>

<223>仙台病毒转录终止信号,负链序列

<400>6

uuuuucuuau10

<210>7

<211>10

<212>rna

<213>人工序列

<220>

<223>人类副流感病毒iii转录起始信号,负链序列

<400>7

cuuuaauccu10

<210>8

<211>11

<212>rna

<213>人工序列

<220>

<223>人类副流感病毒iii转录终止信号

<400>8

uuuuucuuauu11

<210>9

<211>11

<212>rna

<213>人工序列

<220>

<223>新城疫病毒转录起始信号,负链序列

<400>9

cuucuacccgu11

<210>10

<211>10

<212>rna

<213>人工序列

<220>

<223>新城疫病毒转录终止信号,负链序列

<400>10

uuuuuucuaa10

<210>11

<211>12

<212>rna

<213>人工序列

<220>

<223>仙台病毒基因组rna3'末端复制起点,负链序列

<400>11

cucuugucuggu12

<210>12

<211>12

<212>rna

<213>人工序列

<220>

<223>仙台病毒基因组rna3'末端复制起点,负链序列

<400>12

cucuuguuuggu12

<210>13

<211>12

<212>rna

<213>人工序列

<220>

<223>仙台病毒基因组rna5'末端复制起点,负链序列

<400>13

accagacaagag12

<210>14

<211>12

<212>rna

<213>人工序列

<220>

<223>仙台病毒基因组rna5'末端复制起点,负链序列

<400>14

accaaacaagag12

<210>15

<211>18

<212>rna

<213>人工序列

<220>

<223>仙台病毒(cnnnnn)3-盒,负链序列

<220>

<221>misc_feature

<222>(1)..(5)

<223>n为a、c、g或u

<220>

<221>misc_feature

<222>(7)..(11)

<223>n为a、c、g或u

<220>

<221>misc_feature

<222>(13)..(17)

<223>n为a、c、g或u

<400>15

nnnnncnnnnncnnnnnc18

<210>16

<211>18

<212>rna

<213>人工序列

<220>

<223>仙台病毒(nnnnng)3-盒,负链序列

<220>

<221>misc_feature

<222>(2)..(6)

<223>n为a、c、g或u

<220>

<221>misc_feature

<222>(8)..(12)

<223>n为a、c、g或u

<220>

<221>misc_feature

<222>(14)..(18)

<223>n为a、c、g或u

<400>16

gnnnnngnnnnngnnnnn18

<210>17

<211>18

<212>rna

<213>人工序列

<220>

<223>仙台病毒包装信号,负链序列

<400>17

acuuuggcagcaaagaaa18

<210>18

<211>5

<212>rna

<213>人工序列

<220>

<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列

<400>18

ccacc5

<210>19

<211>27

<212>dna

<213>人工序列

<220>

<223>源自人类真核翻译延长因子1α-1的非编码序列

<400>19

acgaggcctcagtttgtctacttggtc27

<210>20

<211>24

<212>dna

<213>人工序列

<220>

<223>源自人类羟甲基胆素合酶的非编码序列

<400>20

cctcagtgccccattctcactgct24

<210>21

<211>30

<212>dna

<213>人工序列

<220>

<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列

<400>21

ggagccgcaccttgtcatgtaccatcaata30

<210>22

<211>15

<212>dna

<213>人工序列

<220>

<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列

<400>22

tctcccctcctcaca15

<210>23

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类线粒体核糖体蛋白l32的非编码序列

<400>23

taatagcccacttactcctgaatctttaa29

<210>24

<211>30

<212>dna

<213>人工序列

<220>

<223>源自人类β-肌动蛋白的非编码序列

<400>24

cgttacaccctttcttgacaaaacctaact30

<210>25

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类β-肌动蛋白的非编码序列

<400>25

cttcccccttttttgtcccccaacttgag29

<210>26

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类磷酸甘油酸激酶1的非编码序列

<400>26

cgacctctctccccagctgtatttccaaa29

<210>27

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类磷酸甘油酸激酶1的非编码序列

<400>27

aggctctgttccacatatatttccacttc29

<210>28

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类肽基脯氨酰异构酶a的非编码序列

<400>28

accgccgaggaaaaccgtgtactattagc29

<210>29

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类肽基脯氨酰异构酶a的非编码序列

<400>29

gtttgacttgtgttttatcttaaccacca29

<210>30

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类微管蛋白α-1b的非编码序列

<400>30

tgtctgctcctgtcgccttcgcctcctaa29

<210>31

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类微管蛋白β-1的非编码序列

<400>31

agcactgccatctcttccagcaccatcag29

<210>32

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类转铁蛋白受体的非编码序列

<400>32

cccaactcctataattccctatcttttag29

<210>33

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类真核翻译延长因子2的非编码序列

<400>33

gatgtccaaactaattttaacaaacgcat29

<210>34

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类泛素c的非编码序列

<400>34

gtatcagcagaaggacattttaggacggg29

<210>35

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类转铁蛋白受体的非编码序列

<400>35

gagttacttcctatcaagccagtacgtgc29

<210>36

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类tata盒结合蛋白的非编码序列

<400>36

ctaggaaaaaattgaatagtgagacgagt29

<210>37

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类核纤层蛋白b2的非编码序列

<400>37

cagaaccccccaccctacatttgccttgg29

<210>38

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类α-肌动蛋白,心肌1的非编码序列

<400>38

cgccgacgaaccccctgaagctgtgccaa29

<210>39

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类α-肌动蛋白,心肌1的非编码序列

<400>39

gatgccttctctctccatctaccttccag29

<210>40

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类微管蛋白β-1的非编码序列

<400>40

gacaggcagaaagcagagaagggccagga29

<210>41

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类微管蛋白β-1的非编码序列

<400>41

caccccccaaaatgctctgcagcctctct29

<210>42

<211>29

<212>dna

<213>人工序列

<220>

<223>源自人类1-酰基甘油-3-磷酸o-酰基转移酶1的非编码序列

<400>42

ccaacctcccactcccacctcccctccat29

<210>43

<211>21

<212>dna

<213>人工序列

<220>

<223>源自人类1-酰基甘油-3-磷酸o-酰基转移酶1的非编码序列

<400>43

ccactcttgacccccacctcc21

<210>44

<211>13

<212>dna

<213>人工序列

<220>

<223>源自人类微管蛋白α-1b的非编码序列

<400>44

taaagctttctgg13

<210>45

<211>46

<212>dna

<213>人工序列

<220>

<223>源自人类3-磷酸甘油醛脱氢酶的非编码序列

<400>45

agccgcaccttgtcatgtaccatcaataaagtaccctgtgctcaac46

<210>46

<211>19

<212>rna

<213>人工序列

<220>

<223>用于hpoll抑制的sirna靶序列

<400>46

gggacagaugagauuucuu19

<210>47

<211>600

<212>dna

<213>人工序列

<220>

<223>密码子优化的嘌呤霉素抗性基因

<400>47

atgaccgagtacaagcctaccgtgcggctggccacaagggatgacgtgcctcgggccgtg60

aggaccctggccgccgctttcgccgactaccccgccacaagacacaccgtggacccagac120

agacacatcgagagggtgaccgagctgcaggagctgttcctgaccagagtgggcctggac180

atcggaaaggtgtgggtggccgacgacggcgccgccgtggctgtgtggacaacccccgag240

tccgtggaggccggcgctgtgttcgctgagatcggacctcggatggccgagctgagcgga300

agcagactggccgcccagcagcagatggagggcctgctggctcctcacagacctaaggag360

ccagcttggttcctggctaccgtgggcgtgtcccctgatcaccagggcaagggcctgggc420

agcgccgtggtgctgcctggagtggaggccgccgagcgcgccggagtgcctgcttttctg480

gagaccagcgcccctcgcaacctgccattctatgagagactgggcttcaccgtgacagct540

gacgtggaggtgcctgagggccccagaacatggtgtatgacccggaagcctggcgcctga600

<210>48

<211>678

<212>dna

<213>人工序列

<220>

<223>e2-crimson荧光蛋白基因

<400>48

atggatagcactgagaacgtcatcaagcccttcatgcgcttcaaggtgcacatggagggc60

tccgtgaacggccacgagttcgagatcgagggcgtgggcgagggcaagccctacgagggc120

acccagaccgccaagctgcaagtgaccaagggcggccccctgcccttcgcctgggacatc180

ctgtccccccagttcttctacggctccaaggcgtacatcaagcaccccgccgacatcccc240

gactacctcaagcagtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgag300

gacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcaccctcatctac360

cacgtgaagttcatcggcgtgaacttcccctccgacggccccgtaatgcagaagaagact420

ctgggctgggagccctccactgagcgcaactacccccgcgacggcgtgctgaagggcgag480

aaccacatggcgctgaagctgaagggcggcggccactacctgtgtgagttcaagtccatc540

tacatggccaagaagcccgtgaagctgcccggctaccactacgtggactacaagctcgac600

atcacctcccacaacgaggactacaccgtggtggagcagtacgagcgcgccgaggcccgc660

caccacctgttccagtag678

<210>49

<211>375

<212>dna

<213>人工序列

<220>

<223>密码子优化的博来霉素抗性基因

<400>49

atggctaagctgaccagcgccgtgcccgtgctgacagcgagggacgtggctggagctgtg60

gagttctggacagacaggctgggcttcagcagggacttcgtggaggacgacttcgccggc120

gtggtgagggacgacgtgaccctgttcatcagcgccgtgcaggaccaggtggtgcccgac180

aacacactggcttgggtgtgggtgaggggactggatgagctgtatgctgagtggtctgag240

gtggtgagcaccaacttcagggatgcttctggacctgctatgacagagattggagagcag300

ccttggggaagagagtttgccctgagggaccctgctggaaactgcgtgcactttgtggct360

gaggagcaggactga375

<210>50

<211>1026

<212>dna

<213>人工序列

<220>

<223>密码子优化的潮霉素抗性基因

<400>50

atgaagaagcccgagctgaccgctaccagcgtggagaagttcctgatcgagaagttcgac60

agcgtgagcgacctgatgcagctgagcgagggcgaggagagcagggccttcagcttcgac120

gtgggcggcaggggctacgtgctgagggtgaacagctgcgccgacggcttctacaaggac180

agatacgtgtacagacactttgctagcgccgccctgcccatccctgaggtgctggacatt240

ggagagttcagcgagagcctgacctactgcatcagcaggagagctcagggagtgaccctg300

caggacctgcctgagacagagctgcctgccgtgctgcagcctgtggctgaggctatggat360

gctattgctgccgcagacctgagccagaccagcggatttggacccttcggccctcagggt420

atcggacagtacaccacctggagggacttcatctgcgccatcgccgacccccacgtgtac480

cactggcagaccgtgatggatgacaccgtgagcgcctctgtggctcaggccctggatgag540

ctgatgctgtgggctgaggactgccctgaggtgaggcacctggtgcacgccgacttcggc600

agcaacaacgtgctgaccgacaacggcaggatcaccgccgtgatcgactggagcgaggcc660

atgttcggcgacagccagtacgaggtggccaacatcttcttctggaggccctggctggcc720

tgcatggagcagcagaccaggtactttgagaggaggcaccctgagctggctggaagccca780

aggctgagggcttacatgctgaggattggactggaccagctgtaccagagcctggtggac840

ggcaacttcgacgatgctgcttgggctcagggaaggtgcgatgctatcgtgaggagcgga900

gctggcaccgtgggaaggacccagattgctaggaggagcgccgccgtgtggacagatgga960

tgcgtggaggtgctggctgactctggaaaccgtaggcctagcacccgaccaagagctaag1020

gagtga1026

<210>51

<211>25

<212>dna

<213>人工序列

<220>

<223>重组序列attb1

<400>51

acaagtttgtacaaaaaagcaggct25

<210>52

<211>25

<212>dna

<213>人工序列

<220>

<223>重组序列attb2

<400>52

acccagctttcttgtacaaagtggt25

<210>53

<211>4212

<212>dna

<213>人工序列

<220>

<223>包含hn基因、hc基因和hpols基因的dna片段

<400>53

accagacaagagtttaagagatatgtatccttttaaattttcttaagaaaaacttagggt60

gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120

tggctggcctgctgtcaaccttcgataccttttcaagtaggaggagcgagtcaatcaaca180

aatctgggggcggagctgtcatccctggacagcggtccaccgtgtctgtcttcgtgctgg240

gcccctctgtgacagacgatgccgacaagctgttcatcgccaccacatttctggctcaca300

gtctggacacagataaacagcattcacagagaggcgggtttctggtgagcctgctggcta360

tggcatacagctccccagaactgtatctgactaccaacggagtgaatgccgacgtgaagt420

acgtgatctataacattgagaaggaccccaaaaggactaagaccgatggcttcatcgtga480

agacacgggatatggaatacgagagaacaactgagtggctgttcgggcctatggtgaaca540

agagcccactgtttcagggacagcgagacgcagctgaccccgataccctgctgcaaatct600

acggctatcctgcctgcctgggggctatcattgtccaagtgtggatcgtcctggtgaaag660

caattacctctagtgccggcctgcggaaggggttctttaaccgcctggaggctttccgac720

aggatggaacagtgaagggcgcactggtctttaccggcgaaacagtggagggaatcggct780

ctgtcatgagaagtcagcagtcactggtcagcctgatggtggaaactctggtcaccatga840

acacagccagaagtgacctgaccacactggagaaaaacatccagattgtggggaattaca900

tcagggatgccggcctggccagcttcatgaataccatcaagtatggggtggaaacaaaga960

tggcagccctgactctgtccaacctgagacccgacatcaacaagctgcggagcctgattg1020

atacctacctgtctaagggccccagggcccctttcatctgtattctgaaagacccagtgc1080

acggggagtttgctccaggaaactaccccgcactgtggtcctatgcaatgggcgtggccg1140

tggtccagaataaggccatgcagcagtacgtcactggccgcacctatctggacatggaaa1200

tgtttctgctggggcaggccgtggctaaagatgccgagagcaagatcagcagcgccctgg1260

aggacgagctgggagtcacagatactgccaaggggcgactgcggcaccatctggcaaacc1320

tgtccggaggcgacggagcatatcacaaacctacagggggaggcgctatcgaagtggcac1380

tggataatgccgacattgatctggagactaaggcacatgcagaccaggatgctcgcggat1440

ggggaggagattccggcgaaagatgggccaggcaggtgtctggcgggcactttgtcactc1500

tgcatggcgctgagcgactggaggaagagaccaatgacgaagatgtgagtgacatcgagc1560

ggagaattgctatgcgactggcagaaaggcgccaggaggactcagccacccatggggatg1620

agggacggaacaatggagtggaccatgacgaagatgatgacgccgccgcagtcgcaggca1680

ttggaggaatttgaggatctacgaggcctcagtttgtctacttggtcttaagaaaaactt1740

agggtgaaagcctcagtgccccattctcactgctactagaggagcccaccatgcccagct1800

ttctgaagaagattctgaaactgagaggacgaagacaggaagatgagtctcgaagtcgga1860

tgctgtccgacagctccatgctgtcttgcagggtgaaccagctgactagcgagggaaccg1920

aagctggctcaaccacacccagcacactgcctaaagaccaggccctgctgatcgagccaa1980

aggtccgggctaaggaaaaatcccagcaccggagacccaagatcattgatcaggtgaggc2040

gcgtcgagagtctgggggaacaggcatcacagcggcagaaacatatgctggagaccctga2100

tcaacaaaatctacacaggccctctgggggaggaactggtgcagactctgtatctgagaa2160

tctgggccatggaggaaaccccagagtctctgaaaatcctgcagatgcgcgaagacattc2220

gagatcaggtcctgaagatgaaaacagagagatggctgaggactctgattaggggcgaaa2280

agaccaaactgaaggatttccagaagcggtacgaggaagtgcacccctatctgatgaaag2340

agaaggtggaacaggtcatcatggaagaggcttggtcactggcagctcatattgtgcagg2400

agtaatgactcgacggagccgcaccttgtcatgtaccatcaatattaagaaaaacttagg2460

gtgaaagtctcccctcctcacacctagagccgccaccatggaccaggacgcttttattct2520

gaaggaggattctgaagtggaacgggaggcaccagggggaagggagagtctgagtgatgt2580

cattggcttcctggacgccgtgctgagctccgagccaacagatatcggaggggaccggag2640

ctggctgcacaacactattaataccccccaggggcctggaagtgcacatagagccaagtc2700

agagggcgaaggggaggtgtcaacacccagcactcaggataacaggtctggggaggaatc2760

cagagtctctggaaggaccagtaagcctgaagcagaggcccacgctggcaacctggacaa2820

acagaatatccatcgagcttttggaggccggaccgggacaaactctgtgagtcaggacct2880

gggagatgggggagactctggcatcctggaaaacccccctaatgagcgcggctaccctcg2940

atccgggattgaagatgagaatagggagatggccgctcacccagataagcgaggagaaga3000

ccaggcagagggactgcctgaggaagtgcggggctcaaccagcctgccagacgaaggaga3060

gggaggagcctccaacaatggccggtctatggaacctgggtctagtcattccgctagagt3120

gacaggcgtgctggtcattccttctccagagctggaggaagcagtcctgcggagaaacaa3180

gaggcgcccaaccaattccggatctaaaccactgaccccagcaacagtgcccggcacacg3240

gagcccacccctgaacagatataatagtaccgggtcacctccaggaaagcccccttctac3300

acaggatgagcacatcaacagtggggacactccagctgtgcgggtcaaggatagaaaacc3360

acccattggaactcggagcgtgagcgactgcccagcaaacggaagacctatccaccccgg3420

cctggagactgattccaccaagaaaggaattggcgaaaatacctcaagcatgaaggagat3480

ggccacactgctgactagcctgggcgtgatccagtccgcacaggaattcgagagcagccg3540

ggacgccagttacgtctttgctcgacgggcactgaaatcagccaactatgctgagatgac3600

cttcaacgtgtgcggcctgattctgagcgccgaaaagagttcagctagaaaagtggatga3660

gaataagcagctgctgaaacagatccaggaaagcgtcgagtccttcagagacatctacaa3720

gaggttttcagaatatcagaaagagcagaacagcctgctgatgtctaatctgagtacact3780

gcacatcattactgataggggaggcaagaccgataacacagacagcctgacacgcagccc3840

ttccgtgttcgctaagtccaaagagaataagactaaagcaacccgctttgacccctccat3900

ggaaactctggaggatatgaagtacaaacctgacctgatccgggaagatgagtttaggga3960

cgaaattcgcaacccagtgtatcaggaacgcgatactgagccccgagcatcaaatgccag4020

cagactgctgccctccaaggagaaacctaccatgcattctctgaggctggtcatcgaaag4080

ctccccactgagccgcgctgagaaggtggcatacgtcaaatctctgagtaagtgcaaaac4140

cgaccaggaggtgaaggctgtgatggaactggtggaggaagacattgaatctctgacaaa4200

ctaaatcccggg4212

<210>54

<211>6884

<212>dna

<213>人工序列

<220>

<223>包含hpoll基因的dna片段

<400>54

gcggccgcttaagaaaaacttagggtgaatgtaaagctttctggccaccatggacgggca60

ggagtcatcccagaatccttccgatatcctgtatcccgaatgtcatctgaactcacctat120

tgtgcgaggcaaaatcgcccagctgcacgtgctgctggacgtgaaccagccatataggct180

gaaggacgattccatcattaatatcacaaagcataagattcgcaacggcgggctgtctcc240

cagacagatcaagatcaggagtctgggcaaggccctgcagagaactatcaaggatctgga300

caggtacacattcgagccttacccaacttattctcaggaactgctgcggctggacattcc360

agagatctgcgataaaatccggagcgtgttcgccgtcagtgaccggctgaccagagagct420

gagctccggcttccaggatctgtggctgaatatcttcaagcagctggggaacatcgaggg480

acgcgaaggctatgatccactgcaggacattggcacaatccccgagattactgacaaata540

ctcacgcaaccgatggtatcggcccttcctgacctggtttagcatcaaatacgacatgag600

gtggatgcagaagacccgccccggaggacctctggatacaagtaactcacacaatctgct660

ggagtgcaagagctacacactggtgacttatggagatctgattatgatcctgaacaagct720

gactctgaccggctacatcctgacccccgaactggtgctgatgtattgtgacgtggtcga780

gggaagatggaacatgagcgccgctggccatctggacaagaagtccattggcatcacaag840

caagggggaggaactgtgggaactggtggacagcctgttctctagtctgggagaggaaat900

ctataatgtcattgccctgctggagcctctgagcctggctctgattcagctgaacgatcc960

agtgatccccctgcgcggcgcattcatgcgacacgtcctgaccgagctgcaggccgtgct1020

gacctccagggatgtctacacagacgcagaggccgatactatcgtggaatccctgctggc1080

tatctttcatgggacatctattgacgagaaggcagaaatcttcagtttctttaggacctt1140

tggacacccctcactggaggccgtgacagcagccgataaagtccgcgctcatatgtacgc1200

acagaaggccatcaaactgaagactctgtatgaatgccacgccgtgttctgtaccatcat1260

tatcaatggctaccgggagagacacggaggacagtggccaccttgcgattttcctgacca1320

cgtgtgcctggaactgcgcaacgctcaggggtccaatactgcaatctcttacgagtgtgc1380

cgtggacaactataccagcttcattggattcaaatttcgcaagtttatcgagccacagct1440

ggatgaagacctgaccatctacatgaaagataaggcactgagcccccggaaggaagcctg1500

ggacagcgtgtaccctgattcaaatctgtactataaagccccagagagcgaggaaacacg1560

gagactgatcgaggtgttcattaatgacgaaaactttaatcccgaggaaattatcaacta1620

cgtcgaaagcggggactggctgaaagatgagaagttcaacattagctattccctgaaaga1680

gaaggaaatcaagcaggaaggaagactgtttgccaaaatgacatacaagatgagggctgt1740

gcaggtcctggcagagactctgctggccaaaggaatcggcgagctgttctccgaaaacgg1800

gatggtgaaaggagagattgacctgctgaagaggctgaccacactgtctgtgagtggcgt1860

ccctcgcaccgatagcgtgtataacaattccaaatcaagcgagaagaggaatgaagggat1920

gaagaaaaagaactctggcgggtattgggacgagaaaaagaggagtcgccacgaattcaa1980

ggccacagactcctctactgatggctacgagactctgagctgctttctgactaccgatct2040

gaaaaagtattgtctgaattggcgcttcgaaagcaccgctctgtttgggcagcgatgcaa2100

tgagatcttcggcttcaagaccttcttcaactggatgcatcccgtgctggagagatgcac2160

catctacgtgggcgacccttattgtccagtcgccgataggatgcaccgccagctgcagga2220

tcatgctgacagcgggattttcatccacaaccctaggggaggcatcgagggatactgtca2280

gaagctgtggaccctgatttcaatcagcgcaattcatctggctgcagtgcgggtcggagt2340

gagagtcagtgccatggtgcagggcgacaatcaggctatcgcagtcacttcaagagtgcc2400

cgtcgcccagacctataagcagaaaaagaaccacgtgtataaggagattacaaagtattt2460

cggcgctctgaggcacgtgatgtttgatgtcgggcatgagctgaaactgaatgaaactat2520

catcagttcaaagatgttcgtgtactccaagagaatctactatgacggcaaaatcctgcc2580

acagtgcctgaaggcactgacacggtgcgtgttctggtctgagactctggtcgatgaaaa2640

cagatccgcctgctctaatatctccacttctattgccaaggctatcgagaacggctactc2700

ccccatcctggggtactgtattgccctgtataaaacctgccagcaggtgtgcatctcact2760

gggcatgaccattaatcccacaatcagccctactgtgcgagaccagtacttcaaagggaa2820

gaactggctgcgatgcgctgtgctgatcccagcaaacgtcgggggattcaattatatgag2880

tacctcaaggtgttttgtgcgcaacatcggggaccctgcagtcgccgctctggctgatct2940

gaagcgattcattcgggccgatctgctggacaaacaggtgctgtaccgcgtgatgaatca3000

ggagcctggagatagctcctttctggactgggcttctgatccctatagttgcaacctgcc3060

tcacagccagtccatcacaactattatcaagaatatcaccgcaaggtctgtgctgcaaga3120

aagtcccaaccctctgctgagcgggctgttcacagagacttccggagaggaagacctgaa3180

tctggcttcctttctgatggatcgaaaagtgatcctgccacgggtcgcacatgaaatcct3240

gggaaactctctgaccggcgtgcgggaggcaatcgcaggaatgctggacaccacaaagag3300

tctggtgagatctagtgtcaaaaagggcgggctgtcatacggcatcctgaggcgcctggt3360

gaattacgacctgctgcagtatgaaaccctgacaagaactctgaggaaacccgtgaagga3420

taacatcgagtacgaatatatgtgcagcgtggagctggcagtcggactgagacagaagat3480

gtggattcacctgacatacgggaggcctatccatggactggagactccagatcccctgga3540

actgctgaggggcaccttcatcgaggggtcagaagtgtgcaagctgtgccgcagcgaggg3600

agcagaccctatctacacctggttttatctgccagataatattgatctggacaccctgac3660

aaacggatgtcctgctattcgcatcccatacttcggctctgctacagacgagcgaagtga3720

agcacagctgggctatgtgcggaatctgagcaaacctgccaaggcagccattcggatcgc3780

tatggtgtatacctgggcatatgggacagatgagatttcttggatggaagctgcactgat3840

cgcacagacaagagccaacctgagtctggagaatctgaagctgctgactccagtgtctac3900

tagtaccaacctgtcccacaggctgaaagacacagccactcagatgaagttctcaagcgc3960

aactctggtgcgcgccagccggttcatcaccatcagcaacgacaatatggctctgaaaga4020

ggcaggagaatctaaggatacaaatctggtgtaccagcagatcatgctgactggcctgag4080

cctgttcgagtttaacatgcgctataaaaaggggtccctgggaaagcctctgatcctgca4140

cctgcatctgaacaatggctgctgtattatggagtccccacaggaagccaatatcccacc4200

ccggtctaccctggacctggagattacacaggaaaacaacaagctgatctatgatcctga4260

cccactgaaggatgtggacctggaactgttctccaaagtgcgggacgtggtccacaccgt4320

cgatatgacatactggagcgacgatgaagtgatcagagccacctccatttgcaccgccat4380

gacaatcgctgacacaatgagccagctggatcgggacaacctgaaggaaatgattgctct4440

ggtgaacgacgatgacgtgaatagcctgattaccgagttcatggtcatcgatgtcccact4500

gttctgttccacatttggaggcatcctggtgaatcagtttgcctactctctgtatggact4560

gaacattcgaggccgggaggaaatctggggccacgtggtccgcatcctgaaagacaccag4620

ccatgcagtgctgaaggtcctgtcaaatgccctgagccaccccaaaattttcaagcggtt4680

ttggaacgcaggagtggtcgagccagtgtacggacccaacctgagcaatcaggataagat4740

cctgctggccctgtcagtgtgcgaatatagcgtggacctgttcatgcacgattggcaggg4800

gggagtgcccctggagatcttcatctgtgataatgaccctgatgtcgctgacatgcgacg4860

gtcctctttcctggcacgccatctggcctacctgtgctccgtggcagaaatcagccggga4920

cggaccacgactggagagtatgaactcactggagaggctggaaagcctgaagtcctacct4980

ggagctgactttcctggatgaccccgtgctgcgctattctcagctgaccggcctggtcat5040

caaggtctttcctagtaccctgacatacatccggaaaagttcaattaaggtgctgagaac5100

cagggggattggagtgcccgaggtcctggaagactgggatcctgaagctgacaatgcact5160

gctggatggcattgccgctgagatccagcagaacattccactgggacaccagacacgcgc5220

cccattttggggactgcgagtgtcaaagagccaggtcctgcgcctgcgagggtacaaaga5280

gatcaccagaggcgaaattgggagaagcggcgtggggctgacactgccattcgacggccg5340

gtatctgtcccatcagctgagactgtttgggatcaattccacatcttgcctgaaggccct5400

ggaactgacttacctgctgtcccccctggtggacaaagataaggacagactgtacctggg5460

agagggcgctggggcaatgctgtcttgctatgacgctaccctgggcccttgtatcaacta5520

ctataattccggcgtgtactcttgtgatgtcaacgggcagagagagctgaatatctaccc5580

agccgaagtggctctggtcgggaaaaagctgaacaatgtgacctcactgggacagagggt5640

gaaggtcctgttcaacggaaatcccggcagcacatggattggaaacgacgagtgcgaagc5700

cctgatctggaacgagctgcagaatagctccattggcctggtgcactgtgacatggaagg5760

cggggatcataaggatgaccaggtggtcctgcacgagcattacagcgtgattaggatcgc5820

ctatctggtcggcgatcgcgacgtggtcctgatctccaaaattgctcctaggctggggac5880

tgactggacccgccagctgtctctgtacctgcgatattgggatgaagtgaatctgatcgt5940

cctgaagactagtaacccagcctcaaccgaaatgtacctgctgagtaggcaccccaaatc6000

agacattatcgaggattccaagaccgtgctggcttctctgctgccactgagcaaggagga6060

cagcatcaagatcgaaaagtggattctgatcgagaaagccaaggctcacgaatgggtgac6120

cagagagctgagagaagggtctagttcaagcggaatgctgcggccttaccatcaggccct6180

gcagacattcggctttgagccaaacctgtataagctgagcagagacttcctgtccacaat6240

gaacattgctgatactcataattgcatgatcgcattcaacagggtgctgaaggacaccat6300

ttttgagtgggcccggatcacagaatccgataaaagactgaagctgacaggaaaatacga6360

cctgtatcctgtgcgcgattctggcaaactgaagactgtgagtagaaggctggtcctgtc6420

atggatcagtctgtcaatgagcactcggctggtgaccgggagtttcccagaccagaagtt6480

tgaagccagactgcagctgggaatcgtgtctctgtcctctagggagattcgcaatctgcg6540

agtcatcactaaaaccctgctggaccgcttcgaagatattatccacagcatcacttaccg6600

atttctgaccaaagagattaagatcctgatgaaaattctgggagccgtgaagatgtttgg6660

cgctcggcagaacgagtacaccactgtgattgacgacggcagcctgggcgacattgaacc6720

ttacgattcctcctaaaccggtagccgcaccttgtcatgtaccatcaataaagtaccctg6780

tgctcaacgaagtcttggactgatccatatgacaatagtaagaaaaacttacaagaagac6840

aagaaaatttaaaagaatacatatctcttaaactcttgtctggt6884

<210>55

<211>1575

<212>dna

<213>人工序列

<220>

<223>用于在大肠杆菌中表达的密码子优化的n基因

<400>55

atggcaggtttactcagcacgttcgacacttttagcagcagacgcagcgagagcatcaac60

aaatccggtggtggcgcggtgatccctggtcagcgctctaccgtgagcgtgtttattctg120

ggcccgtctgtcaccgatgatgccgataagctgttcattgccaccacctttctggcccac180

agcctggacacggacaaacagcactctcaacgtggcggtttcctggtttcgttgctggcg240

atggcgtatagcagcccggagctgtacttgaccaccaacggcgtgaacgcggatgtgaag300

tatgtgatttacaacatcgagaaagatccgaagcgtacgaaaaccgacggttttatcgtt360

aagacccgcgatatggaatacgagcgtaccacggagtggctgttcggtccgatggtcaat420

aagagcccgctgttccaaggccagcgcgacgcagcggacccggacaccctgctgcagatc480

tatggctaccctgcgtgtctgggcgcgatcattgttcaagtatggatcgttctggtcaag540

gcgattaccagcagcgcaggtctgcgtaagggctttttcaatcgcctggaggcgttccgt600

caggatggcaccgtgaaaggtgcactggtttttaccggtgaaaccgtcgaaggtattggc660

tctgttatgcgttcccagcagagcttggtcagcctgatggttgagactctggttacgatg720

aatactgcccgcagcgatctgacgaccctggagaaaaacattcaaattgtcggcaactac780

atccgtgatgcgggtctggcatccttcatgaatacgatcaaatatggcgtggaaacgaag840

atggcggccttgaccctgtccaatctgcgtccggacattaacaaattgcgtagcctgatt900

gacacgtacctgagcaaaggtccgcgtgccccgttcatctgcattctgaaagatccagtt960

cacggtgagttcgcaccgggtaactatccggccctgtggagctatgcaatgggcgtggct1020

gtcgtccagaacaagagcatgcagcagtacgttacgggtcgtacctacctggatatggag1080

atgtttctgctgggtcaagcagttgcaaaagacgcggagtccaaaatcagcagcgccctg1140

gaggacgagttgggtgtcaccgacaccgcgaaggaacgtctgcgtcatcatctggctaat1200

ctgagcggtggtgatggcgcgtaccacaagccgacgggtggtggtgctatcgaagttgcg1260

ctggataatgcggacatcgatttggaaactgaagcacacgcggatcaagacgcgcgtggc1320

tggggtggtgatagcggcgaacgctgggcgcgtcaagtgtcgggcggtcactttgtgacc1380

ctgcatggtgcggagcgtctggaagaagaaaccaatgatgaggacgttagcgatattgag1440

cgccgtattgctatgcgcctggcggaacgtcgtcaagaggacagcgctacgcacggtgac1500

gagggccgcaacaatggcgtcgaccatgaagaggacgacgacgctgcagccgcagcgggt1560

attggtggcatctaa1575

<210>56

<211>423

<212>dna

<213>人工序列

<220>

<223>杀稻瘟菌素s抗性基因

<400>56

atgaagaccttcaatattagccagcaggacctggagctggtggaggtggccaccgagaaa60

atcaccatgctgtacgaggacaataagcaccacgtgggggccgccattcgcaccaagaca120

ggcgagatcatcagcgccgtgcacatcgaggcctacatcggccgggtgaccgtgtgcgcc180

gaggccatcgccatcggctccgccgtgtccaacggccagaaggattttgataccattgtg240

gccgtgaggcacccatacagcgacgaggtggatcggagcatccgggtggtgtccccttgc300

gggatgtgcagagagctgatttccgattacgcccctgactgcttcgtgctgatcgagatg360

aatgggaagctggtgaaaacaacaatcgaggagctgatccccctgaagtataccaggaac420

tga423

<210>57

<211>5

<212>rna

<213>人工序列

<220>

<223>kozak序列

<400>57

ccacc5

<210>58

<211>42

<212>dna

<213>人工序列

<220>

<223>5'非编码序列#1

<400>58

ccaccatgaaattgccagaagactgacactagagccgccacc42

<210>59

<211>21

<212>dna

<213>人工序列

<220>

<223>5'非编码序列#2

<400>59

caccatggcccaggcttcata21

<210>60

<211>1440

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类klf4基因

<400>60

atgcgacagcctcctggcgaatccgatatggccgtctccgatgctctgctgccttctttc60

tctacttttgcctctggacctgctggcagggagaagacactgcgacaggcaggagctccc120

aacaatcgatggcgggaggaactgtctcacatgaaaagactgccccctgtcctgcctggg180

aggccatacgacctggccgctgcaaccgtggccacagatctggagtccggaggagctgga240

gcagcttgcggaggaagcaacctggcaccactgcctcggagagaaaccgaggaattcaac300

gatctgctggacctggattttatcctgtctaatagtctgacccacccaccagagtccgtc360

gcagcaacagtgagctcctctgcatctgccagttcaagctcctctccaagttcaagcggc420

ccagcttcagcacccagcacttgttccttcacctaccccattcgggcagggaatgaccct480

ggagtggccccagggggaacaggagggggactgctgtatggcagagaatctgcacctcca540

cccactgcccctttcaacctggctgacatcaatgatgtctcaccaagcggaggatttgtg600

gcagagctgctgaggcccgaactggatcctgtctatattcctccacagcagcctcagccc660

cctggaggaggactgatgggcaagttcgtgctgaaagcctccctgtctgctccaggcagc720

gagtacgggagtccctcagtcatcagcgtgtccaagggatctcctgacggaagtcaccca780

gtggtcgtggcaccatataacggaggcccacccaggacttgccccaagatcaagcaggaa840

gctgtgtcctcttgtacccatctgggggcaggacctccactgagcaatggccaccgcccc900

gctgcacatgactttcctctggggcgacagctgccttcccggaccacaccaaccctggga960

ctggaggaagtgctgagttcacgcgattgccacccagccctgcctctgccccctgggttc1020

cacccacatcccggacctaactacccaagctttctgccagaccagatgcagccacaggtg1080

ccacccctgcactatcaggagctgatgcctccaggaagttgtatgcccgaggaaccaaag1140

ccaaaacggggcaggcgcagctggcctagaaagaggactgctacccatacatgcgattac1200

gcaggctgtgggaagacttataccaaaagctcccacctgaaggcccatctgagaacacac1260

actggcgagaaaccttaccactgcgactgggatggatgtggctggaagttcgctcgctcc1320

gacgaactgacacgccattatcgaaagcacactgggcatcgaccattccagtgccagaaa1380

tgtgaccgggcattttctagaagtgatcatctggccctgcacatgaaacggcatttttga1440

<210>61

<211>1083

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类oct4基因

<400>61

atggccggacacctggcttcagattttgccttctcaccaccacctgggggagggggcgac60

ggacctgggggacccgaacctggatgggtggaccccagaacctggctgagctttcaggga120

ccccctggcgggccaggaatcggccctggcgtgggacctggctccgaggtctgggggatt180

ccaccctgccctccaccctacgaattctgcggaggcatggcttattgtggaccacaagtg240

ggagtcggactggtgcctcaggggggactggagacatctcagcctgagggagaagcagga300

gtgggagtcgagagcaactccgatggcgctagtcccgaaccttgcaccgtgactccaggg360

gcagtcaagctggagaaggaaaaactggagcagaatcccgaggaatcccaggacatcaag420

gctctgcagaaagagctggaacagtttgcaaagctgctgaagcagaaacgcattaccctg480

ggctacacacaggccgatgtggggctgactctgggagtgctgttcggcaaagtcttttcc540

cagaccacaatctgccgattcgaggcactgcagctgagcttcaagaacatgtgtaaactg600

aggcccctgctgcagaagtgggtggaggaagccgacaacaatgagaatctgcaggaaatc660

tgcaaagcagaaacactggtgcaggccaggaagcgcaaacgaactagcattgagaaccgg720

gtcagaggcaacctggaaaatctgtttctgcagtgcccaaagcccacactgcagcagatc780

agccacattgcccagcagctggggctggagaaagatgtggtccgggtgtggttctgtaat840

cggagacagaagggaaaaaggagctcctctgactatgctcagcgcgaggatttcgaagcc900

gctggctctccttttagtggcgggccagtgagtttccccctggcacctgggccacacttt960

ggaactcctggatacggctcaccacatttcaccgccctgtatagttcagtgcccttccct1020

gagggagaagcttttcctccagtgtctgtcactaccctgggctcaccaatgcatagcaac1080

tga1083

<210>62

<211>954

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类sox基因

<400>62

atgtataatatgatggaaaccgaactgaagccacctggaccacagcagacaagcggggga60

ggggggggaaactcaacagcagcagcagccggcgggaaccagaagaatagtccagacaga120

gtgaaaaggcccatgaacgcattcatggtctggtcccgaggccagcggagaaagatggcc180

caggagaaccccaaaatgcacaatagtgaaatctcaaagcggctgggggccgagtggaaa240

ctgctgagcgagactgaaaagagaccttttattgacgaagcaaaacgactgcgggccctg300

cacatgaaggagcatcctgattacaaatatcgcccaaggcgcaagaccaaaacactgatg360

aagaaagacaagtacaccctgcccggaggactgctggctcctgggggaaacagcatggca420

tccggagtgggagtcggagctggactgggagcaggagtgaatcagaggatggactcatat480

gcccacatgaacgggtggagcaatggaagttactcaatgatgcaggatcagctgggctat540

ccccagcaccctggactgaacgctcatggcgccgctcagatgcagcctatgcatcgctac600

gatgtgtctgcactgcagtataacagtatgactagctcccagacctacatgaatggctct660

cctacctacagcatgtcctattctcagcagggcacaccagggatggccctgggatctatg720

ggcagtgtggtcaagtccgaagcttctagttcaccccctgtggtcacaagctcctctcac780

tcccgcgccccatgccaggctggggacctgcgagatatgatctctatgtacctgccagga840

gcagaggtgccagaaccagcagcaccctcaagactgcacatgagccagcattatcagtcc900

ggccctgtcccagggacagctattaatggcactctgcccctgagccatatgtga954

<210>63

<211>1320

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类c-myc基因

<400>63

atgcccctgaatgtgagctttactaacagaaactacgacctggactacgacagcgtgcag60

ccctatttttattgtgacgaagaagagaacttctaccagcagcagcagcagagcgagctg120

cagccacctgcaccttccgaggacatttggaagaaatttgaactgctgcctacaccaccc180

ctgtctccaagtcggagaagcggcctgtgctcacccagctatgtggccgtcactcctttc240

agcctgcgaggggacaatgatggaggaggaggatccttttctacagccgatcagctggag300

atggtgactgaactgctggggggagacatggtcaaccagagcttcatttgcgatccagac360

gatgagacttttatcaagaatatcatcatccaggactgtatgtggtcaggcttcagcgcc420

gctgcaaagctggtgtctgaaaaactggcaagttaccaggccgctcgcaaagatagtggg480

tcacctaacccagccagaggccactccgtgtgctctacaagctccctgtacctgcaggac540

ctgagcgcagccgcttccgagtgtattgatccctccgtggtcttcccctatcctctgaat600

gactctagttcacccaagagttgtgcatcacaggacagctccgccttttcaccttctagt660

gatagcctgctgtcaagcactgagtcctctccacagggcagcccagaacccctggtgctg720

catgaggaaacccctccaaccacaagttcagattccgaggaggagcaggaggacgaagag780

gaaatcgatgtggtctctgtggagaagcggcaggctccaggaaaaagaagcgaatccgga840

tctccaagtgcaggaggacactccaagccacctcattctcccctggtgctgaaaaggtgc900

cacgtctccacccaccagcataactacgcagccccaccctctacaagaaaggactatccc960

gctgcaaagagggtgaaactggatagcgtgcgcgtcctgcgacagatcagtaacaatagg1020

aagtgtacttcacctcgcagctccgacaccgaggaaaacgtgaaaaggcgcacccataat1080

gtcctggagcgccagcgacggaatgaactgaagcgatccttctttgccctgcgggatcag1140

attcctgagctggaaaacaatgagaaggctccaaaagtggtcattctgaagaaagccaca1200

gcttatatcctgtctgtgcaggccgaggaacagaagctgatcagtgaggaagacctgctg1260

cggaaaagaagggagcagctgaagcacaaactggaacagctgagaaacagctgcgcctga1320

<210>64

<211>5040

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类brg1基因

<400>64

atgagcaccccagaccctcctctgggcggcacacctagaccaggcccaagccctggacca60

gggccaagccccggcgctatgctgggaccatcccccggacctagccccggctccgcacat120

tctatgatgggacctagtcctggaccaccctcagcaggacacccaatcccaacacaggga180

ccagggggctacccacaggataatatgcaccagatgcataagccaatggagtcaatgcac240

gaaaaaggcatgagcgacgatcccaggtataaccagatgaagggcatgggaatgagatcc300

ggagggcacgcaggaatgggccctccaccctctcctatggaccagcatagccagggatac360

ccttccccactgggcggatctgagcacgctagctccccagtgcctgcaagcggaccttct420

agtggcccacagatgtcaagcggccccggcggcgcccctctggatggagctgacccacag480

gcactggggcagcagaacagaggcccaacccccttcaatcagaaccagctgcaccagctg540

cgcgcccagatcatggcttacaagatgctggcaaggggccagcctctgccagaccatctg600

cagatggcagtccagggcaagcgaccaatgcctggaatgcagcagcagatgcccacactg660

cctccacccagtgtgtcagccactggaccagggcccggccctggaccagggcccggccct720

ggaccagggccggctcctccaaattattccagaccacacggaatgggagggccaaacatg780

ccccctccagggccatctggagtgccccctggaatgcctgggcagccacccggcggacct840

ccaaagccttggccagagggacctatggccaacgccgctgcaccaacctctacaccccag900

aagctgatccctccccagcctacaggcaggcccagtcctgcaccacccgcagtccctcca960

gcagctagcccagtgatgccccctcagactcagagccccggccagcctgctcagccagca1020

cccatggtcccactgcaccagaagcagagccgcatcacccctattcagaaaccacgaggc1080

ctggatcccgtggagattctgcaggaacgcgagtaccgactgcaggcccgaattgctcat1140

aggatccaggaactggagaatctgcccggatccctggccggggatctgagaactaaggcc1200

accatcgagctgaaagctctgcggctgctgaactttcagaggcagctgagacaggaggtg1260

gtcgtgtgcatgaggagagacaccgcactggaaacagccctgaatgcaaaagcctataag1320

cggtccaaacgccagtctctgcgagaggctaggattacagaaaagctggagaaacagcag1380

aagatcgaacaggagaggaagcggcgccagaaacaccaggagtacctgaacagtattctg1440

cagcacgccaaagacttcaaggaatatcatagatcagtcaccggcaaaatccagaagctg1500

acaaaagctgtggcaacttaccatgctaataccgaacgggagcagaagaaagaaaacgag1560

cgcattgaaaaggagcgaatgcgaaggctgatggccgaggatgaggaaggctatcggaag1620

ctgatcgatcagaagaaagacaaacgcctggcatacctgctgcagcagactgacgagtat1680

gtcgccaacctgaccgaactggtgagacagcacaaggcagcccaggtggctaaggagaag1740

aaaaagaaaaagaaaaagaaaaaggcagaaaatgcagagggacagaccccagcaatcgga1800

cctgatggagagccactggacgaaacaagtcagatgtcagatctgcccgtcaaagtgatc1860

cacgtggagtccggaaaaatcctgactgggaccgacgctcctaaggcagggcagctggag1920

gcttggctggaaatgaaccctggctacgaggtggcaccacgcagcgactccgaggaatct1980

ggcagtgaggaagaagaggaggaagaggaagaggaacagccacaggctgcacagccaccc2040

acactgcctgtcgaggagaagaagaagatccctgatccagacagtgacgatgtctcagag2100

gtggatgcaaggcacatcattgaaaatgccaagcaggacgtggacgatgagtatggagtg2160

tctcaggccctggctagagggctgcagagttactatgcagtcgcccatgctgtgaccgag2220

cgggtcgataagcagagcgccctgatggtcaatggcgtgctgaagcagtaccagatcaag2280

ggactggagtggctggtgtccctgtataacaataacctgaacggcatcctggctgacgaa2340

atgggcctgggaaaaacaatccagactattgcactgatcacctacctgatggagcacaag2400

agaatcaatggaccctttctgatcattgtgcctctgagcacactgtccaactgggcttac2460

gagttcgacaagtgggcaccctccgtcgtgaaggtgagctataaaggatccccagccgct2520

agacgggcttttgtcccccagctgcggtctgggaagttcaacgtgctgctgaccacatac2580

gagtacatcattaaggataagcatattctggccaagatccgctggaaatacatgatcgtg2640

gacgagggacacaggatgaagaatcaccattgcaaactgacacaggtcctgaacactcat2700

tatgtggcacctcgccgactgctgctgacagggactccactgcagaataagctgcccgag2760

ctgtgggccctgctgaactttctgctgccaactattttcaagtcatgtagcaccttcgag2820

cagtggtttaatgcccccttcgctatgacaggcgaaaaggtggatctgaacgaggaagag2880

actatcctgatcattaggagactgcacaaggtcctgcggccctttctgctgcggcgcctg2940

aagaaagaagtggaggcccagctgcctgaaaaggtcgagtacgtgatcaaatgcgacatg3000

tctgccctgcagagagtcctgtatcggcatatgcaggctaaaggggtgctgctgacagat3060

ggcagcgagaaggacaagaaaggcaagggcggcaccaaaacactgatgaatactattatg3120

cagctgcgcaagatctgtaaccacccatacatgttccagcatattgaagagtccttttct3180

gagcacctgggcttcactggagggatcgtgcagggactggatctgtatagggcatctggg3240

aagtttgagctgctggacaggattctgcccaagctgagagccaccaaccataaagtgctg3300

ctgttctgccagatgacttccctgatgaccatcatggaggattactttgcctatcggggc3360

ttcaagtacctgcgcctggatggaactaccaaagctgaggaccgcgggatgctgctgaag3420

accttcaacgagcctggctccgaatatttcatttttctgctgtctactagggccggcgga3480

ctgggactgaatctgcagtcagctgacaccgtgatcattttcgatagcgactggaaccct3540

caccaggatctgcaggctcaggacagagcacatcggatcggccagcagaatgaggtccgc3600

gtgctgcgactgtgcaccgtcaacagcgtggaagagaagattctggcagccgctaagtac3660

aaactgaacgtggatcagaaagtcatccaggccggaatgtttgaccagaagtcctctagt3720

cacgagcgaagggccttcctgcaggctatcctggagcacgaggagcaggacgaatctcgc3780

cattgtagtaccgggagtggctcagcaagcttcgcacatacagctcctccacccgcagga3840

gtgaatcctgacctggaggagcctcccctgaaggaagaggacgaggtcccagacgatgaa3900

accgtgaaccagatgatcgctcgacacgaagaggaattcgatctgtttatgcggatggat3960

ctggacagacggcgcgaggaagcccggaatcccaagaggaaacctagactgatggaggaa4020

gacgagctgcccagctggatcattaaggacgatgccgaagtggagcgcctgacctgcgag4080

gaagaggaagagaaaatgttcggaaggggatcccggcaccgaaaggaggtggattactcc4140

gactctctgacagaaaaacagtggctgaagaaaattacaggaaaggatatccatgacact4200

gcatcaagcgtggcccgaggactgcagtttcagagggggctgcagttctgtactcgcgca4260

agcaaggccattgaagaggggaccctggaagagatcgaagaggaagtgaggcagaagaaa4320

tcctctcgaaagaggaaaagagattccgacgccggcagttcaacccctacaacttctaca4380

cggagtcgcgacaaggacgatgagagcaagaagcagaagaaacgaggaaggccccctgct4440

gaaaagctgagcccaaatccacccaacctgaccaagaaaatgaagaaaattgtcgatgcc4500

gtgatcaagtacaaagacagctcctctggccgccagctgagtgaggtgtttattcagctg4560

ccttcaagaaaagaactgccagagtactatgaactgatccggaagcctgtggatttcaag4620

aaaattaaggagagaatccggaatcacaaatacaggtccctgaacgatctggaaaaggac4680

gtgatgctgctgtgtcagaatgcccagacttttaacctggaggggtctctgatctacgaa4740

gacagtatcgtgctgcagtcagtcttcaccagcgtgagacagaagattgaaaaagaggac4800

gatagtgagggcgaggaatcagaggaagaggaagagggcgaagaggaaggaagtgaatca4860

gagagccggtccgtcaaggtgaaaatcaagctggggagaaaagagaaggctcaggaccgg4920

ctgaaagggggccgaaggagaccttcacggggcagccgcgcaaagccagtcgtgtccgac4980

gatgactctgaggaggagcaggaagaggataggtctggcagtggatcagaagaggactga5040

<210>65

<211>3318

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类baf155基因

<400>65

atggcagctgcagccggcggagggggccccggcacagccgtgggagctactggatccgga60

atcgctgcagcagctgcaggactggctgtgtaccggagaaaagacggagggcctgcaaca120

aagttctgggaatctccagagactgtgtcccagctggactctgtgcgggtctggctgggg180

aaacactacaagaaatatgtgcatgcagatgcccctacaaacaagactctggctggcctg240

gtggtccagctgctgcagttccaggaggatgcatttggaaagcacgtgaccaatccagct300

tttacaaaactgcccgcaaagtgcttcatggactttaaggcaggcggagccctgtgtcat360

atcctgggagccgcttacaaatacaagaacgagcagggatggcgacgattcgacctgcag420

aatccctccaggatggatagaaacgtggaaatgttcatgaacatcgagaagaccctggtc480

cagaacaattgcctgacacggcctaacatctacctgatcccagacattgatctgaaactg540

gccaacaagctgaaggacatcattaagcgccaccagggaaccttcacagatgagaaaagt600

aaagcttcacaccatatctacccttatagctcctctcaggacgatgaggaatggctgcgg660

ccagtgatgcgcaaagagaagcaggtgctggtccactggggcttttaccccgactcctat720

gatacctgggtccattctaacgacgtggatgccgaaatcgaggatccccctattccagag780

aaaccctggaaggtgcacgtcaagtggatcctggacactgatattttcaacgagtggatg840

aatgaggaagactacgaagtcgatgagaaccggaaacctgtgtcatttcggcagcgcatc900

agcacaaagaatgaggaacctgtgcgatctccagagcgaagggacaggaaggctagtgca960

aacgcccgaaaaaggaagcatagcccatccccaccccctccaactcctaccgagagtcgc1020

aagaaatcaggaaagaaagggcaggccagtctgtatggcaaaagacggtcacagaaggag1080

gaagacgaacaggaggatctgacaaaggacatggaggatcctactccagtgcccaacatt1140

gaggaagtggtcctgcccaagaacgtcaatctgaagaaagactctgaaaatactcctgtc1200

aagggcggcaccgtggcagacctggatgagcaggatgaggaaacagtgactgcaggaggg1260

aaagaagacgaggatccagccaagggggaccagtctaggagtgtggacctgggcgaagat1320

aacgtgaccgagcagacaaatcacatcattatccccagctacgcctcctggttcgactat1380

aactgcatccatgtgattgaacgccgagctctgccagagttctttaacggcaaaaataag1440

agcaaaacacccgagatctacctggcctatcgcaactttatgattgatacttaccgactg1500

aatcctcaggagtatctgaccagcacagcttgcaggagaaacctgaccggagacgtgtgt1560

gccgtcatgagggtgcacgctttcctggaacagtgggggctggtcaactaccaggtggat1620

cccgagagcagacctatggccatgggccctcctcccactccacactttaatgtcctggct1680

gacaccccatcaggactggtgcccctgcatctgagaagccctcaggtcccagcagcccag1740

cagatgctgaacttcccagagaagaacaaggagaagcccgtggacctgcagaactttggc1800

ctgcgaaccgatatctacagcaagaaaacactggccaaaagcaagggagcttccgcagga1860

cgagagtggactgaacaggagaccctgctgctgctggaagccctggagatgtataaagac1920

gattggaataaggtctctgaacacgtgggcagtaggacccaggatgagtgtatcctgcat1980

ttcctgagactgccaattgaagacccctacctggagaactctgatgcaagtctgggacct2040

ctggcctatcagcctgtgccattctcacagagcgggaatccagtcatgagcacagtggct2100

tttctggcatccgtggtggaccccagagtggcatccgctgcagcaaaggctgcactggag2160

gaattctctagagtccgggaggaagtgcccctggaactggtggaggcacacgtcaagaaa2220

gtgcaggaggcagctcgcgccagcggaaaggtggaccctacatacgggctggagagttca2280

tgcatcgccggaactgggcccgatgaacctgagaaactggaaggggccgaggaagagaag2340

atggaggctgaccctgatggccagcagccagaaaaagccgagaacaaggtggaaaatgag2400

accgacgagggggataaggctcaggatggcgaaaacgagaaaaatagcgaaaaggagcag2460

gactcagaagtgagcgaggatactaaatccgaagagaaggaaaccgaagagaacaaagag2520

ctgactgacacctgtaaggaaagggagagtgatacaggcaagaaaaaggtcgaacacgag2580

atctcagagggaaatgtcgcaaccgcagcagctgcagcactggcttctgctgcaacaaaa2640

gcaaagcatctggccgctgtggaagagagaaaaattaagagtctggtcgccctgctggtg2700

gaaacccagatgaaaaagctggagatcaagctgcggcacttcgaggagctggagacaatt2760

atggaccgcgaaaaggaggccctggaacagcagagacagcagctgctgaccgagcggcag2820

aactttcacatggaacagctgaagtacgccgagctgcgcgctcgacagcagatggagcag2880

cagcagcatgggcagaatccacagcaggcacaccagcattccggcggacctggcctggct2940

ccactgggcgcagcaggacaccccggcatgatgcctcatcagcagccccctccatatcct3000

ctgatgcaccatcagatgccccctccccaccctccccagccaggccagatccccggccct3060

ggatctatgatgcctggccagcacatgcctggaaggatgatcccaactgtggctgcaaac3120

attcatccatccggatctggacctacccctcccggcatgcctccaatgccaggaaacatt3180

ctgggaccaagagtgccactgaccgcaccaaatggcatgtaccctccccctccccagcag3240

cagcctccaccccctccacccgctgacggcgtgcctccaccccctgcacccggaccaccc3300

gccagcgccgctccttga3318

<210>66

<211>1431

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类免疫球蛋白gh链基因

<400>66

atggattggacttggagattcctgttcgtcgtcgcagcagcaaccggcgtgcagagccag60

atgcaggtcgtgcagagcggggcagaagtgaagaaaccaggcagctccgtcactgtgagt120

tgcaaggcctcaggcgggaccttcagcaactacgcaatctcctgggtgcggcaggccccc180

ggacagggactggaatggatgggaggcatcattcccctgttcggaactcctacctattct240

cagaattttcagggccgcgtgacaatcactgctgataagagtacctcaacagcacacatg300

gagctgatttctctgcgaagtgaagacactgctgtgtactattgcgcaaccgaccggtac360

agacaggccaacttcgatagggctcgcgtggggtggtttgacccttgggggcagggaacc420

ctggtcacagtgtctagtgcatctaccaagggaccaagtgtgtttccactggccccctca480

agcaaaagcacttccggaggaaccgcagctctgggatgtctggtgaaggattatttccca540

gagcccgtcacagtgtcatggaacagcggagcactgaccagcggggtccatacatttccc600

gctgtgctgcagtcctctggcctgtactccctgagttcagtggtcaccgtccctagctcc660

tctctggggactcagacctatatctgcaacgtgaatcacaagccttctaatacaaaagtg720

gacaagaaggtggaaccaaagagttgtgacaaaacacatacttgccccccttgtcctgca780

ccagagctgctgggaggaccaagcgtgttcctgtttccacccaagcccaaagataccctg840

atgattagcaggacaccagaagtcacttgcgtggtcgtggacgtgtcccacgaggatccc900

gaagtcaagttcaactggtacgtggacggcgtcgaggtgcataatgctaagaccaaaccc960

agagaggagcagtacaattcaacctatcgggtcgtgagcgtcctgacagtgctgcaccag1020

gattggctgaacggcaaagagtataagtgcaaagtgtctaataaggcactgcccgcccct1080

atcgagaaaacaattagcaaggctaaagggcagcctagagaaccacaggtgtataccctg1140

cctccaagcagggatgagctgacaaagaaccaggtctccctgacttgtctggtgaaaggg1200

ttctatcccagtgacattgcagtggagtgggaatcaaatggacagcctgaaaacaattac1260

aagaccacaccccctgtgctggactccgatggatctttctttctgtattccaagctgact1320

gtggacaaatctcggtggcagcagggcaacgtcttttcttgtagtgtgatgcatgaggcc1380

ctgcacaatcattacacacagaagtcactgagcctgtcccccggcaaatga1431

<210>67

<211>708

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类免疫球蛋白gl链基因

<400>67

atggcttgggcactgctgctgctgacactgctgacacaggatactgggtcttgggcacag60

agcgcactgacacagcctgcttccgtgtccggctctcctgggcagtctatcaccattagt120

tgcaccgggacaaacaatgacgtgggaagttacaacctggtctcatggtatcagcagcac180

ccaggcaaggcccccaaaatcatgatctacgaggtgtccaagcggccaagtggggtctca240

aaccggttcagcggatcaaaaagcggcaatacagcctcactgactatcagcggactgcag300

gcagaggacgaagccgattactattgctgttcctacgctggctcttatacagtggtcttc360

ggcgggggaactaagctgaccgtgctggggcagcctaaagccgctccatctgtgactctg420

tttccccctagctccgaggaactgcaggctaataaggcaaccctggtgtgtctgattagc480

gacttctaccccggagctgtgacagtcgcctggaaggctgattctagtcccgtgaaagca540

ggggtcgagaccacaactcctagcaagcagtccaacaacaagtacgcagcctcaagctat600

ctgtccctgactccagaacagtggaagtctcacaggtcctattcttgccaggtgacccat660

gagggcagtaccgtggaaaaaacagtcgcccccactgaatgttcctga708

<210>68

<211>1773

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类免疫球蛋白mh链基因

<400>68

atggaactgggcctgagatgggtctttctggtcgctatcctggagggagtgcagtgtgaa60

gtgcagctggtcgagtctggcgggggactggtgaaaccaggcggatctctgcgactgagt120

tgcgcagcttcaggcttcaccttcagcacttactcaatgaactgggtccgacaggccccc180

ggcaagggactggaatgggtgagctccatctctagttcaagctcctacatctactatgct240

gacagcgtgaaagggcgattcactatctctcgggataacgcaaagaatagtctgtatctg300

cagatgaattcactgagagccgaggacacagctgtctactattgtgccagggatctgctg360

attgctgtggcaggacactggggacaggggaccctggtgacagtctctagtggcagcgcc420

tccgctccaactctgttccccctggtgtcctgcgaaaactctcctagtgacacctcaagc480

gtggcagtcggatgtctggcccaggacttcctgccagatagcatcacattttcctggaag540

tacaaaaacaacagtgatatttcctctactcgcggctttccctctgtgctgcgaggaggc600

aaatatgcagccaccagtcaggtcctgctgccttcaaaggacgtgatgcaggggacagat660

gagcacgtggtctgcaaagtgcagcatcccaacggaaataaggagaagaacgtcccactg720

cccgtgatcgctgagctgccacctaaggtgagcgtcttcgtgccacccagagacgggttc780

tttggaaatcccagaaagagcaaactgatctgtcaggccaccggctttagccctaggcag840

attcaggtgtcctggctgcgcgaagggaagcaggtcggatccggcgtgaccacagatcag900

gtccaggcagaagccaaggagtctgggcccactacctacaaagtgacctctacactgact960

atcaaggagagtgactggctgtcacagagcatgttcacctgccgggtggatcatagagga1020

ctgacatttcagcagaatgccagttcaatgtgtgtccctgaccaggataccgctatcagg1080

gtgttcgcaattcctccaagcttcgcttccatttttctgactaagtccaccaaactgaca1140

tgcctggtcaccgacctgacaacttatgattctgtgaccatcagttggacacgccagaac1200

ggcgaagccgtgaagacccacacaaacatttccgagtctcatcccaatgcaaccttcagc1260

gccgtgggcgaagcttccatctgcgaggacgattggaatagcggggagcggtttacttgt1320

accgtgacacacactgacctgccttcaccactgaagcagaccattagccgacctaaaggc1380

gtcgccctgcatcggccagatgtgtacctgctgccccctgcaagagaacagctgaacctg1440

agggagagcgccaccatcacatgtctggtgaccggattcagccctgcagacgtctttgtg1500

cagtggatgcagcgaggacagccactgtcccctgaaaagtacgtgacatctgcaccaatg1560

cctgagccacaggccccaggcagatattttgctcactccattctgacagtgtctgaggaa1620

gagtggaacactggggagacttatacctgcgtggtcgctcatgaagcactgccaaatagg1680

gtcactgagcgcaccgtggacaagagcactgggaaacccaccctgtataacgtctcactg1740

gtcatgagcgatacagccggaacttgttattga1773

<210>69

<211>711

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类免疫球蛋白ml链基因

<400>69

atggacatgcgagtgcctgctcagctgctgggactgctgctgctgtggctgcccgataca60

agatgcgacattcagatgactcagagcccaagctccctgagtgcctcagtgggagaccgg120

gtcaccatcacatgcagagcttcacagggcattagcaactacctggcatggtatcagcag180

aagccaggcaaagtgcccaagctgctgatctacgcagcttccaccctgcagtctggggtg240

cccagtcgattcagcggatccggatctggaacagactttactctgaccatttctagtctg300

cagcctgaggatgtggctacttactattgccagaaatacaattctgcaccatataccttc360

ggccaggggacaaaactggagatcaagaggacagtggcagccccctctgtcttcattttt420

ccccctagcgacgaacagctgaagtccggcaccgcttccgtggtctgtctgctgaacaat480

ttttaccctcgcgaagccaaagtgcagtggaaggtcgataacgctctgcagagtggcaat540

tcacaggagagcgtgactgaacaggactccaaagattctacctatagtctgtcaagcaca600

ctgactctgagcaaggcagattacgagaagcacaaactgtatgcctgcgaagtgacacat660

caggggctgtcctctcctgtcactaagtccttcaacagaggagagtgttga711

<210>70

<211>480

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类免疫球蛋白mj链基因

<400>70

atgaagaaccatctgctgttttggggagtgctggctgtgtttatcaaggctgtccatgtg60

aaggctcaggaagacgagagaattgtgctggtggacaacaagtgcaaatgtgctagaatc120

acctccaggatcattcgcagctccgaggaccctaacgaagacatcgtggagcgaaatatt180

cggatcattgtcccactgaacaatcgcgaaaatatttctgatcccaccagtcctctgcgg240

acaagattcgtgtaccacctgagtgacctgtgcaagaaatgtgatcccacagaggtggaa300

ctggacaaccagatcgtcaccgcaacacagtcaaatatttgcgacgaagatagcgccact360

gagacctgctacacttatgataggaacaagtgttacaccgcagtggtccctctggtgtat420

ggaggagaaactaaaatggtcgagacagccctgactccagacgcttgttatcccgattga480

<210>71

<211>7056

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类凝固因子viii基因

<400>71

atgcagattgaactgtccacctgtttcttcctgtgcctgctgagattttgtttttccgct60

actcgcagatactacctgggggctgtggaactgtcttgggattacatgcagagtgacctg120

ggagagctgccagtggacgcacgatttccacctcgggtgccaaagtcattcccctttaac180

acaagcgtggtctacaagaagaccctgttcgtggagttcaccgatcacctgttcaatatc240

gctaagccccggccaccctggatgggactgctggggcctaccatccaggcagaggtgtac300

gacaccgtggtcattacactgaaaaacatggcatcacacccagtgagcctgcatgccgtc360

ggagtgtcttactggaaggctagtgagggcgcagaatatgacgatcagacctctcagaga420

gagaaggaagacgataaagtgtttcccggcgggagccatacatatgtctggcaggtgctg480

aaggagaacggcccaatggctagcgaccccctgtgcctgacctactcatatctgagccac540

gtggacctggtgaaggatctgaatagcggactgatcggcgccctgctggtgtgcagggag600

ggatccctggctaaagaaaagacacagactctgcataagttcattctgctgttcgccgtg660

tttgacgaggggaaatcctggcactctgaaaccaagaactcactgatgcaggaccgagat720

gcagctagcgcacgagcctggcccaaaatgcacacagtcaacggctacgtgaatagatca780

ctgcctgggctgatcggatgccacaggaagtctgtctattggcatgtgatcgggatggga840

accacaccagaggtccacagcattttcctggaagggcatacctttctggtgcgcaaccac900

cgacaggcttccctggagatctctcccattacattcctgactgcacagaccctgctgatg960

gatctgggccagttcctgctgttttgccacatcagctcccaccagcatgatgggatggag1020

gcttacgtcaaagtggactcctgtcctgaggaaccacagctgcggatgaagaacaatgag1080

gaagccgaagactatgacgatgacctgacagactctgagatggatgtggtcaggttcgat1140

gacgataacagcccctcctttatccagattcgcagcgtcgccaagaaacaccctaagacc1200

tgggtgcattacatcgcagccgaggaagaggactgggattatgctcctctggtgctggca1260

ccagacgatagaagttacaaatcacagtatctgaacaatggccctcagcggattgggaga1320

aagtacaagaaagtgcgattcatggcatacacagatgaaacttttaagaccagagaggcc1380

atccagcacgaaagcggcattctggggccactgctgtacggagaagtgggcgacactctg1440

ctgatcatcttcaagaaccaggccagccggccctacaatatctatcctcatggaattacc1500

gatgtcagaccactgtactcccggagactgcccaaaggagtgaagcacctgaaagacttc1560

cccatcctgcctggcgaaatcttcaagtataagtggaccgtcacagtggaggatggccca1620

actaagtccgaccccagatgcctgaccaggtactattctagtttcgtgaacatggaaagg1680

gatctggcctctgggctgatcggaccactgctgatttgttacaaagagagtgtggatcag1740

aggggcaaccagatcatgtcagacaagcgcaatgtcattctgttcagcgtgtttgacgag1800

aatcgctcctggtatctgaccgaaaacatccagcgattcctgccaaatcccgctggcgtg1860

cagctggaggatcccgaatttcaggcatcaaacatcatgcatagcattaatggctacgtg1920

ttcgacagtctgcagctgtcagtctgcctgcacgaggtggcttactggtatatcctgagc1980

attggggcacagacagatttcctgagcgtcttcttttccggatacacttttaaacataag2040

atggtgtacgaggacactctgaccctgttcccattttctggcgagaccgtgtttatgagt2100

atggaaaaccccggactgtggatcctgggctgccacaactccgatttcaggaatcgcgga2160

atgactgccctgctgaaagtgtcaagctgtgacaagaataccggcgactactatgaggat2220

tcctacgaagacatctctgcttatctgctgagtaaaaacaatgcaattgagccacgctct2280

tttagtcagaactctaggcaccccagtacccgccagaagcagttcaacgccactaccatc2340

cctgagaatgatattgaaaaaacagacccatggtttgctcatcggactcctatgccaaag2400

atccagaacgtgagcagcagcgatctgctgatgctgctgagacagagccccactcctcac2460

gggctgtcactgagcgacctgcaggaggcaaagtacgaaaccttctcagacgatccaagc2520

cccggagccatcgattccaacaattccctgtctgagatgacccacttccggccacagctg2580

caccattccggggacatggtgtttacacccgagtctggactgcagctgagactgaacgaa2640

aaactgggcacaactgctgcaacagagctgaagaaactggactttaaggtgtcaagcact2700

agcaacaatctgatctccaccattccctctgataacctggccgctgggacagacaatact2760

tcctctctgggacctccatcaatgcctgtgcactacgatagccagctggacaccacactg2820

ttcggcaagaaaagttcacctctgaccgagtctggaggcccactgagtctgtcagaagag2880

aacaatgattcaaaactgctggagagcggactgatgaactcccaggaaagctcctggggc2940

aagaacgtgagcagcaccgagtccgggcggctgtttaaaggaaagagagcccatggccct3000

gctctgctgactaaagacaacgctctgttcaaggtgagcatctccctgctgaagaccaac3060

aaaacaagcaacaattccgcaactaatcggaagacccacatcgatggcccatccctgctg3120

attgagaactctcccagtgtctggcagaatatcctggagtctgacacagagttcaagaag3180

gtcactccactgattcatgatcggatgctgatggacaagaatgctaccgcactgagactg3240

aaccacatgagcaataagactacctcaagcaaaaacatggagatggtgcagcagaagaaa3300

gaaggacctatcccccctgatgcacagaatccagacatgagcttctttaaaatgctgttc3360

ctgcctgagtccgcccgctggattcagcgaacacacggcaagaactctctgaatagtggc3420

caggggccttccccaaaacagctggtctctctgggcccagagaagagtgtggaagggcag3480

aactttctgtccgagaaaaataaggtggtcgtgggaaagggcgaattcaccaaagatgtc3540

ggcctgaaggagatggtgttcccctcctctaggaatctgtttctgactaacctggacaat3600

ctgcacgagaacaatacccataaccaggaaaagaaaatccaggaagagattgagaagaaa3660

gaaacactgatccaggagaacgtcgtgctgccccagattcacacagtgactggcaccaag3720

aacttcatgaaaaatctgtttctgctgtctacccgccagaatgtcgagggcagttacgac3780

ggggcctatgctcctgtgctgcaggattttcgcagtctgaacgactcaactaatcgaacc3840

aagaaacacaccgcccatttcagcaagaaaggggaagaggaaaacctggaagggctggga3900

aatcagacaaaacagatcgtggagaagtacgcttgcacaactagaattagcccaaacaca3960

tcccagcagaatttcgtgactcagaggagcaagcgcgccctgaaacagtttaggctgccc4020

ctggaggaaactgagctggaaaagcgcatcattgtggacgatacatctactcagtggagc4080

aagaacatgaagcatctgaccccctccaccctgacacagatcgattataacgagaaagaa4140

aagggcgccattacccagtcacctctgagcgactgtctgacacgatcacacagcatccca4200

caggccaaccggtctcccctgcctattgctaaggtgagttcattccctagcatcaggcca4260

atctacctgacccgcgtgctgtttcaggataatagctcccatctgcctgcagcctcatat4320

aggaagaaagacagcggggtgcaggagtctagtcacttcctgcagggagcaaagaaaaac4380

aatctgtccctggccatcctgacactggagatgactggggatcagcgcgaagtcggctca4440

ctggggacaagcgccactaactccgtgacctacaagaaagtcgaaaatacagtgctgcca4500

aagcccgacctgcctaagacatctggaaaagtcgagctgctgccaaaagtgcatatctat4560

cagaaggatctgtttcccactgaaacctccaacggatctcctggccacctggacctggtg4620

gagggaagcctgctgcaggggaccgagggagcaatcaaatggaacgaagccaatcggccc4680

ggcaaggtccctttcctgagagtggccaccgagtcaagcgccaagacaccctccaaactg4740

ctggatcctctggcttgggacaatcattacggcacccagatcccaaaggaggaatggaaa4800

tctcaggagaagagtcccgaaaaaactgccttcaagaaaaaggacaccattctgtccctg4860

aacgcttgcgaatctaatcacgcaatcgctgcaattaacgaggggcagaacaagcccgag4920

atcgaagtgacatgggccaagcagggacgaactgagcggctgtgcagccagaacccaccc4980

gtgctgaagagacatcagagggagattacaaggaccacactgcagtccgatcaggaggaa5040

atcgactacgacgatactatttctgtggagatgaaaaaggaagacttcgatatctatgac5100

gaggatgaaaatcagagtcctagatcattccagaaaaagaccaggcattactttattgcc5160

gctgtggagcgcctgtgggattatgggatgtcctctagtcctcacgtcctgcgaaaccgg5220

gcccagtccggatctgtgccacagttcaaaaaggtcgtgttccaggagtttactgacggc5280

agctttacccagccactgtaccggggggagctgaatgaacacctgggactgctgggacca5340

tatatccgagctgaggtcgaagataacattatggtgacattccgaaatcaggcatcacgg5400

ccctacagcttttattcaagcctgatctcctacgaggaagaccagcgacagggcgctgaa5460

ccccggaagaacttcgtcaagcctaacgagacaaagacttacttctggaaggtgcagcac5520

catatggcccctaccaaagacgaattcgattgcaaggcatgggcctatttttctgacgtg5580

gacctggagaaggacgtgcacagtggactgatcggccctctgctggtgtgccataccaac5640

acactgaatccagcacacggccggcaggtcacagtgcaggaattcgctctgttctttaca5700

atctttgatgagactaagagctggtacttcactgagaacatggaacgcaattgccgagcc5760

ccatgtaacattcagatggaggaccccactttcaaggaaaactacagatttcacgccatc5820

aatggctatattatggataccctgcccggcctggtcatggctcaggaccagagaatcagg5880

tggtatctgctgagcatgggctccaacgagaatatccactccattcatttctctgggcat5940

gtctttacagtgcggaaaaaggaggaatataaaatggccctgtataacctgtatcccgga6000

gtcttcgagactgtggaaatgctgccttccaaggcaggcatctggagagtggagtgcctg6060

attggagaacacctgcatgccggcatgtccaccctgtttctggtgtactctaacaagtgt6120

cagacacctctgggaatggcaagtggccatatcagggatttccagattaccgcatccgga6180

cagtacggacagtgggcaccaaagctggcccgcctgcactatagtgggtcaatcaatgcc6240

tggagtaccaaagagcccttctcatggattaaggtggacctgctggcccctatgatcatt6300

cacgggatcaaaacacagggagctaggcagaagttctcctctctgtatatcagtcagttt6360

atcatcatgtattcactggatggaaaaaagtggcagacctaccgcgggaatagcactgga6420

accctgatggtcttctttgggaacgtggacagttcaggaatcaagcataacattttcaat6480

cctccaatcattgcccggtacatcagactgcaccccacccattattctattcggagtaca6540

ctgagaatggaactgatgggctgcgatctgaacagctgttccatgcctctggggatggag6600

agtaaggctatctcagacgcacagattaccgccagctcctatttcaccaacatgtttgcc6660

acatggtctcccagtaaagctagactgcacctgcagggcagaagcaatgcctggaggcct6720

caggtcaacaatccaaaggagtggctgcaggtggattttcagaagaccatgaaagtcaca6780

ggcgtgactacccagggggtcaaaagcctgctgacttccatgtacgtgaaggagttcctg6840

atctctagttcacaggacggccaccagtggaccctgttctttcagaacggaaaagtcaag6900

gtgttccagggcaatcaggatagctttacacctgtcgtgaactccctggacccccctctg6960

ctgactaggtatctgcgcatccatccacagtcctgggtgcatcagattgctctgcgaatg7020

gaagtgctggggtgcgaagctcaggacctgtattga7056

<210>72

<211>11058

<212>dna

<213>人工序列

<220>

<223>密码子优化的人类肌养蛋白基因

<400>72

atgctgtggtgggaagaggtcgaggattgctacgagagagaagatgtccagaagaagact60

tttactaaatgggtcaacgctcagttctcaaaattcggcaagcagcatatcgagaacctg120

tttagcgacctgcaggatgggcggagactgctggacctgctggagggactgactggccag180

aaactgcccaaagaaaagggctctaccagagtgcacgccctgaacaatgtcaataaggct240

ctgagggtgctgcagaacaataacgtggatctggtcaatatcgggagcaccgacattgtg300

gatggaaaccacaagctgacactgggcctgatctggaatatcattctgcattggcaggtg360

aaaaatgtcatgaagaacatcatggccggcctgcagcagacaaacagcgagaagattctg420

ctgtcctgggtgaggcagtctactcgcaattaccctcaagtgaatgtcatcaacttcacc480

acaagctggtccgacggactggccctgaacgctctgattcactcccatcgcccagacctg540

ttcgattggaattccgtggtctgccagcagtctgccacccagaggctggagcacgccttt600

aacatcgctcgctatcagctgggcattgagaagctgctggacccagaagacgtggatact660

acctaccccgacaagaagtccatcctgatgtatattacaagtctgttccaggtgctgcca720

cagcaggtcagcatcgaggccattcaggaagtggagatgctgccccggccccctaaagtc780

accaaggaggaacactttcagctgcaccatcagatgcattacagtcagcagatcaccgtg840

agcctggctcagggatatgagcgaaccagctccccaaaaccccggttcaagtcctacgca900

tatacacaggccgcttacgtgacaacttctgacccaactagatcccctttcccatctcag960

catctggaggctcccgaagacaagtcttttggctctagtctgatggaaagtgaggtgaac1020

ctggataggtatcagactgccctggaggaagtcctgagttggctgctgtcagccgaggat1080

accctgcaggctcagggcgagatcagcaacgacgtggaagtggtcaaggatcagttccac1140

acacatgaggggtacatgatggacctgactgcccaccaggggagagtgggaaatatcctg1200

cagctggggtcaaaactgattggaaccggcaagctgagcgaggatgaggaaacagaggtg1260

caggaacagatgaatctgctgaactcccggtgggagtgcctgagagtggccagtatggaa1320

aagcagtcaaatctgcatagggtcctgatggacctgcagaatcagaaactgaaggagctg1380

aacgattggctgaccaagacagaggaaaggacccgcaaaatggaggaggagcccctggga1440

ccagacctggaggatctgaagcggcaggtgcagcagcacaaagtcctgcaggaagacctg1500

gaacaggagcaggtgagagtcaacagcctgacacacatggtggtcgtggtggacgagtca1560

agcggagatcatgctactgccgccctggaggagcagctgaaggtgctgggcgatcgctgg1620

gcaaatatctgtaggtggactgaggaccgctgggtgctgctgcaggatattctgctgaag1680

tggcagcggctgaccgaggagcagtgcctgttcagcgcctggctgtccgaaaaagaggac1740

gcagtgaacaagatccacaccacaggctttaaggatcagaatgagatgctgtcctctctg1800

cagaaactggcagtgctgaaggccgacctggagaagaaaaagcagagcatggggaaactg1860

tactccctgaagcaggatctgctgtctacactgaaaaacaagagtgtgactcagaagacc1920

gaggcatggctggacaatttcgccagatgttgggataacctggtgcagaaactggagaag1980

tccaccgcacagatctcccaggccgtgactaccacacagcctagcctgacccagactacc2040

gtcatggagacagtgacaactgtcaccacacgcgaacagattctggtgaagcatgcacag2100

gaggagctgccaccacctccaccacagaaaaagcggcagatcaccgtggactccgagatt2160

cgaaagcggctggacgtggacatcactgaactgcactcttggattaccaggagtgaggcc2220

gtgctgcagagcccagaattcgctatctttcgcaaggaggggaatttctccgatctgaaa2280

gagaaggtgaacgctattgaaagagagaaagcagaaaagtttaggaaactgcaggacgcc2340

tctcgcagtgctcaggcactggtggagcagatggtcaatgaaggagtgaacgccgattca2400

atcaagcaggctagcgagcagctgaactccaggtggattgaattctgccagctgctgagc2460

gagcgcctgaactggctggaataccagaataacatcattgccttctacaatcagctgcag2520

cagctggaacagatgactaccacagccgagaactggctgaaaatccagcccactacccct2580

tcagagccaacagccatcaagagccagctgaagatttgtaaagacgaagtgaatagactg2640

tctggcctgcagcctcagattgagaggctgaagatccagagtattgccctgaaagaaaag2700

gggcagggaccaatgtttctggacgctgatttcgtggccttcaccaaccacttcaagcag2760

gtcttttccgacgtgcaggctcgcgaaaaagagctgcagacaatcttcgatactctgcct2820

ccaatgcgataccaggagactatgtctgccattcggacctgggtgcagcagtctgaaaca2880

aagctgagtatccctcagctgtcagtcactgactatgagattatggaacagcggctggga2940

gagctgcaggctctgcagagttcactgcaggaacagcagtcaggactgtactatctgagc3000

acaactgtgaaagagatgtcaaaaaaggccccatccgaaatctctcgcaagtaccagagc3060

gagtttgaagagattgaaggacgatggaaaaagctgagctcccagctggtggagcattgt3120

cagaagctggaggagcagatgaataagctgcgcaaaatccagaaccacattcagacactg3180

aaaaagtggatggccgaggtggacgtgttcctgaaggaagagtggcctgctctgggcgat3240

tctgagatcctgaaaaagcagctgaagcagtgccggctgctggtgagtgacatccagacc3300

attcagccaagtctgaattcagtcaacgagggcgggcagaaaatcaagaacgaagctgag3360

cccgaatttgcaagcagactggagacagaactgaaggagctgaatactcagtgggaccat3420

atgtgccagcaggtgtacgccaggaaagaagctctgaagggaggcctggagaaaaccgtc3480

tccctgcagaaggatctgtctgagatgcacgaatggatgacacaggccgaagaggaatac3540

ctggagcgggacttcgaatataagactccagatgagctgcagaaagccgtggaggaaatg3600

aagagagcaaaagaggaagcccagcagaaggaggctaaagtgaagctgctgacagaaagc3660

gtgaactccgtcatcgcacaggctccacctgtggcacaggaggccctgaaaaaggagctg3720

gaaactctgaccacaaattaccagtggctgtgcacccggctgaacggcaaatgcaagaca3780

ctggaggaagtgtgggcatgctggcatgagctgctgtcctatctggaaaaggccaacaag3840

tggctgaacgaggtggaattcaaactgaagactaccgagaacatccccggcggagccgag3900

gaaattagcgaggtgctggactccctggaaaatctgatgcgccacagcgaggataatcct3960

aaccagatccgaattctggcacagactctgaccgacggaggcgtgatggatgaactgatc4020

aatgaggaactggagacctttaactccagatggagggagctgcatgaggaagctgtgagg4080

cgccagaaactgctggaacagtctatccagagtgcacaggagacagaaaagtccctgcac4140

ctgatccaggagtctctgactttcattgacaagcagctggctgcatacattgctgacaaa4200

gtggatgccgctcagatgccccaggaggcacagaagatccagtctgatctgaccagtcac4260

gaaatttcactggaggaaatgaaaaagcataaccagggcaaggaggcagcccagagagtc4320

ctgtcccagatcgacgtggcacagaaaaagctgcaggacgtgagcatgaaattccgactg4380

tttcagaagccagccaatttcgagctgcggctgcaggaaagcaagatgatcctggacgag4440

gtgaaaatgcatctgcccgccctggaaaccaagtcagtcgagcaggaagtggtccagagc4500

cagctgaatcactgcgtgaacctgtataagtcactgagcgaggtcaagtccgaggtggaa4560

atggtcatcaagaccggaaggcagattgtgcagaaaaagcagacagagaacccaaaggag4620

ctggacgaacgcgtgaccgccctgaaactgcactataatgagctgggcgctaaagtcaca4680

gagagaaagcagcagctggaaaagtgtctgaaactgagccggaagatgagaaaagagatg4740

aacgtgctgaccgaatggctggctgcaaccgacatggagctgacaaagaggtccgccgtg4800

gaagggatgcccagcaatctggattccgaggtcgcttggggaaaagcaacccagaaggag4860

atcgaaaaacagaaggtgcacctgaagtctattacagaggtcggggaagccctgaaaacc4920

gtgctgggaaaaaaggagacactggtggaagacaagctgtctctgctgaatagtaactgg4980

atcgccgtcacaagccgcgctgaggaatggctgaacctgctgctggagtaccagaaacac5040

atggaaacttttgaccagaatgtggatcatattactaagtggatcattcaggccgacacc5100

ctgctggatgagagcgagaagaagaagccccagcagaaagaggacgtgctgaagcggctg5160

aaagctgaactgaacgatatccgacctaaggtggactctacacgggatcaggccgctaat5220

ctgatggccaaccgaggggaccactgccgaaagctggtggagccacagatcagcgaactg5280

aaccacagattcgcagccatctcccataggattaagaccggaaaagcttctattcccctg5340

aaggagctggaacagtttaattccgatatccagaaactgctggagcctctggaggccgaa5400

attcagcagggcgtgaatctgaaagaggaagacttcaacaaggatatgaatgaggacaac5460

gaagggactgtgaaagagctgctgcagcgcggagacaacctgcagcagcgaatcaccgat5520

gagcgcaagcgagaggaaatcaaaattaagcagcagctgctgcagaccaaacataatgcc5580

ctgaaggacctgaggagtcagcgacggaagaaagctctggagatctcacaccagtggtat5640

cagtataagcgccaggctgacgatctgctgaaatgcctggacgatattgagaagaaactg5700

gcatccctgcccgagcctagggacgaacgcaaaatcaaggagattgatagagaactgcag5760

aagaaaaaggaggaactgaacgcagtgagaaggcaggccgagggactgtctgaagacggc5820

gctgcaatggccgtggagcctacccagatccagctgtccaagcggtggagagagattgaa5880

tctaaattcgcacagtttcgccgactgaattttgcccagatccatactgtcagggaggaa5940

accatgatggtcatgacagaggacatgccactggaaatctcatacgtgcccagcacatat6000

ctgactgagattacccacgtcagccaggccctgctggaggtggaacagctgctgaacgct6060

cccgacctgtgcgcaaaggacttcgaggatctgtttaaacaggaagaaagtctgaagaat6120

atcaaagactcactgcagcagtctagtgggcggattgatatcattcacagtaaaaagact6180

gccgctctgcagtcagctacccctgtggagagagtcaagctgcaggaagcactgagtcag6240

ctggacttccagtgggagaaggtgaacaaaatgtataaggaccgacagggacggtttgat6300

agatcagtcgagaagtggcggagattccattacgatatcaaaatcttcaaccagtggctg6360

actgaggcagaacagttcctgcgcaaaacccagatccccgagaattgggaacacgccaaa6420

tacaagtggtatctgaaggagctgcaggacggcattgggcagagacagaccgtggtcagg6480

acactgaacgccactggagaggaaatcattcagcagtcaagcaagaccgacgctagcatc6540

ctgcaggagaaactgggctccctgaatctgcgctggcaggaagtgtgcaaacagctgagc6600

gataggaaaaagcgcctggaggaacagaagaacatcctgtccgaattccagcgggacctg6660

aatgagtttgtgctgtggctggaggaagccgataacatcgcttccattcccctggagcct6720

ggcaaagaacagcagctgaaagagaagctggaacaggtcaagctgctggtggaggaactg6780

cctctgcggcaggggatcctgaagcagctgaatgaaaccggaggaccagtgctggtctcc6840

gccccaatttctcccgaggaacaggacaagctggagaacaagctgaagcagacaaacctg6900

cagtggatcaaggtgtctagagcactgcctgagaaacagggcgagatcgaagcccagatt6960

aaggacctggggcagctggagaaaaagctggaagatctggaggaacagctgaaccatctg7020

ctgctgtggctgagcccaatcaggaatcagctggagatctacaatcagccaaaccaggaa7080

ggacccttcgacgtgcaggagacagaaatcgctgtgcaggcaaagcagcccgatgtcgag7140

gaaattctgtccaaaggccagcacctgtataaagagaagcccgccacccagcctgtgaaa7200

cgcaagctggaggacctgtcctctgaatggaaagctgtcaacaggctgctgcaggagctg7260

cgcgcaaagcagccagatctggcccctggcctgacaactatcggagctagtccaacacag7320

actgtgaccctggtcacccagcccgtggtcacaaaagaaactgccatttcaaagctggag7380

atgcctagttcactgatgctggaggtgccagcactggccgacttcaacagggcctggacc7440

gaactgacagactggctgtctctgctggatcaggtcatcaagagtcagcgcgtgatggtc7500

ggcgacctggaggatattaatgaaatgatcatcaagcagaaggccaccatgcaggatctg7560

gagcagaggcgcccacagctggaggaactgatcacagcagcccagaatctgaaaaacaag7620

actagcaaccaggaggccaggactatcattaccgaccgaatcgaacggattcagaatcag7680

tgggatgaggtgcaggaacacctgcagaatcgacggcagcagctgaacgagatgctgaag7740

gactctacccagtggctggaggcaaaagaggaagcagaacaggtgctgggacaggctcgc7800

gcaaaactggagagttggaaggaagggccctacactgtggacgcaatccagaaaaagatt7860

acagagactaaacagctggccaaggatctgcggcagtggcagaccaatgtggatgtcgct7920

aacgacctggcactgaaactgctgagagactatagcgccgacgatacaaggaaggtgcac7980

atgatcactgagaatattaacgcttcatggaggagcatccataagcgagtgtccgagcgg8040

gaagctgcactggaggaaacccaccgcctgctgcagcagttccctctggacctggagaag8100

tttctggcatggctgactgaggccgaaaccacagctaacgtgctgcaggacgccaccaga8160

aaagagaggctgctggaagattccaaaggagtgaaggagctgatgaagcagtggcaggat8220

ctgcagggcgagatcgaagctcacaccgacgtgtaccataatctggatgagaactcccag8280

aagattctgaggagtctggaaggctcagacgatgccgtgctgctgcagagaaggctggac8340

aatatgaactttaagtggtctgagctgcggaaaaagtctctgaacatcagaagtcacctg8400

gaagccagctccgatcagtggaaaagactgcatctgtcactgcaggagctgctggtgtgg8460

ctgcagctgaaggacgatgagctgagcaggcaggctcctatcgggggagacttcccagca8520

gtccagaagcagaatgatgtgcacagagcctttaaaagggagctgaaaacaaaggaacca8580

gtgatcatgagcacactggagactgtcagaattttcctgactgaacagcctctggagggc8640

ctggaaaagctgtaccaggagccaagggaactgccacccgaggaacgcgcacagaacgtg8700

acccgactgctgcgaaagcaggctgaggaagtcaatacagagtgggaaaaactgaacctg8760

cactccgccgactggcagcgcaagatcgatgagaccctggaacgactgcaggagctgcag8820

gaagcaacagacgagctggatctgaagctgaggcaggccgaagtgatcaaaggatcttgg8880

cagcccgtcggcgatctgctgattgacagtctgcaggatcatctggagaaagtgaaggct8940

ctgcggggggagatcgcaccactgaaggaaaatgtgagccacgtcaacgacctggccaga9000

cagctgactaccctgggaattcagctgtcaccctataatctgagcacactggaggatctg9060

aacactcggtggaagctgctgcaggtggcagtcgaggacagggtgcgccagctgcacgaa9120

gcacatagagatttcggccctgcctcccagcactttctgtccacatctgtgcagggacca9180

tgggagagggccatctctcctaacaaggtgccctactatattaaccacgagactcagaca9240

acttgctgggaccatcccaagatgaccgaactgtaccagagcctggccgatctgaataac9300

gtgcgcttttccgcatatcgaaccgccatgaaactgcgccgactgcagaaggccctgtgc9360

ctggacctgctgagtctgtcagccgcttgcgacgccctggatcagcataatctgaagcag9420

aacgaccagcccatggatatcctgcagatcattaactgtctgaccacaatctacgatcgg9480

ctggagcaggaacacaataacctggtgaatgtccctctgtgcgtggacatgtgcctgaat9540

tggctgctgaacgtctatgataccggcagaacagggcgaatccgggtgctgagcttcaag9600

actggcatcatttccctgtgcaaagctcatctggaggacaagtacaggtatctgttcaaa9660

caggtggcatctagtaccggcttttgcgaccagcggagactgggactgctgctgcacgat9720

agcatccagattcccaggcagctgggagaggtggctagcttcggcggatccaacatcgaa9780

ccctccgtccgctcttgcttccagtttgccaataacaagcctgagattgaagcagccctg9840

tttctggactggatgcggctggagcctcagagcatggtctggctgccagtgctgcacaga9900

gtcgctgcagccgagacagctaaacatcaggcaaagtgcaacatctgtaaagaatgccct9960

atcattggcttcagatacaggtccctgaagcactttaattacgatatctgtcagtcttgc10020

ttctttagtggcagagtggccaaagggcacaagatgcattaccccatggtcgagtattgt10080

acccctactacctctggggaagacgtgcgggattttgccaaggtgctgaaaaacaagttc10140

cggaccaaaagatactttgctaagcatccccggatgggatatctgcctgtgcagacagtc10200

ctggagggcgacaatatggaaactcccgtgaccctgatcaacttctggcctgtcgatagc10260

gcccccgcttcaagccctcagctgagtcacgacgatacccattcacgaattgagcactac10320

gcctcccggctggctgagatggaaaatagtaacggctcatatctgaatgacagcatctcc10380

cctaacgagtctattgacgatgaacacctgctgatccagcattactgccagagtctgaat10440

caggatagcccactgtcccagcctaggtcaccagcccagatcctgatttctctggagagt10500

gaggaacggggggagctggaaagaatcctggctgacctggaggaagagaatcggaacctg10560

caggcagagtatgatagactgaagcagcagcacgaacataaaggactgtcaccactgccc10620

agccctccagagatgatgcccacctcacctcagagcccacgggacgctgagctgatcgca10680

gaagccaagctgctgagacagcacaaaggacgcctggaagcccgaatgcagattctggag10740

gatcacaacaagcagctggaaagccagctgcatcgactgcgacagctgctggagcagcca10800

caggctgaagcaaaagtgaatggcacaactgtctcctctccctctaccagtctgcagcgg10860

agtgacagttcacagcctatgctgctgagagtggtcggatcacagacatcagacagcatg10920

ggcgaagaggatctgctgagcccccctcaggatacctccacaggcctggaagaagtgatg10980

gagcagctgaataactccttcccatccagcagaggcagaaataccccaggaaaaccaatg11040

agagaggacactatgtga11058

<210>73

<211>12

<212>dna

<213>人工序列

<220>

<223>人类atp合酶线粒体fo复合体b1亚基mrna的一部分

<400>73

gctacctggact12

<210>74

<211>18

<212>dna

<213>人工序列

<220>

<223>人类atp合酶线粒体fo复合体b1亚基mrna的一部分

<400>74

gcagcaggccaggcacag18

<210>75

<211>18

<212>dna

<213>人工序列

<220>

<223>人类肽基脯氨酰异构酶a(亲环素a)mrna的一部分

<400>75

tggcctcccaaactgctg18

<210>76

<211>12

<212>dna

<213>人工序列

<220>

<223>人类核糖体蛋白大亚基p1(rplp1)mrna的一部分

<400>76

cagccctacact12

<210>77

<211>2652

<212>dna

<213>人工序列

<220>

<223>t7rna聚合酶cdna

<400>77

atgaacaccatcaacatcgcaaaaaacgactttagtgacatcgaactggctgctatcccc60

ttcaatactctggctgaccattacggggagcgactggccagagagcagctggctctggag120

cacgaaagctacgagatgggggaagcccgattccggaagatgtttgagcggcagctgaaa180

gctggagaagtggcagacaacgccgctgcaaagccactgattaccacactgctgcccaaa240

atgatcgccagaattaatgattggttcgaggaagtgaaggcaaaaagaggcaagaggcct300

accgccttccagtttctgcaggagatcaagccagaagcagtggcctacatcaccatcaag360

actaccctggcatgcctgacaagcgccgacaacacaactgtgcaggctgtcgcatccgcc420

atcgggagggctattgaggacgaagcacgctttggaagaatcagggatctggaggccaag480

cacttcaagaagaacgtggaggagcagctgaacaagcgggtgggacacgtctacaagaag540

gccttcatgcaggtggtcgaggccgacatgctgtcaaagggactgctgggaggagaggca600

tggagctcctggcacaaagaagatagcatccatgtgggggtcaggtgcatcgagatgctg660

attgaatctaccggaatggtgagtctgcaccgacagaacgcaggagtggtcggacaggac720

tctgagacaatcgaactggctcccgagtacgctgaagcaattgccactagagctggggca780

ctggccggaatcagtcccatgttccagccttgcgtggtgccccctaagccatggactggc840

atcaccggaggcgggtactgggctaatgggcggagacccctggcactggtgaggacacac900

agcaagaaagccctgatgcgctacgaggatgtctatatgcctgaagtgtataaggccatc960

aacattgctcagaatacagcatggaaaattaacaagaaagtgctggctgtcgcaaatgtg1020

atcactaagtggaaacattgtcctgtggaggacatcccagccattgaaagggaggaactg1080

cctatgaagccagaggacatcgatatgaacccagaagccctgaccgcttggaaacgagcc1140

gctgcagccgtgtatagaaaggatcgcgcccgaaaatccaggcgcatttctctggagttc1200

atgctggaacaggccaacaagtttgctaatcataaagcaatctggttcccttacaacatg1260

gactggcgggggagagtctatgccgtgtccatgttcaacccacagggaaatgatatgaca1320

aagggcctgctgactctggctaagggcaaacccattggaaaggagggctactattggctg1380

aaaatccacggagcaaattgcgcaggagtggacaaggtgccattcccagagcggatcaag1440

ttcatcgaggaaaaccatgaaaatattatggcctgtgctaagtctcccctggagaacaca1500

tggtgggccgaacaggatagtcctttctgctttctggccttctgttttgagtacgctggg1560

gtgcagcaccatggactgagttataattgctcactgcccctggcctttgacggctcttgt1620

agtgggatccagcacttctccgcaatgctgcgggatgaggtcggaggcagagccgtgaac1680

ctgctgccttctgagactgtgcaggacatctacggcattgtcgccaagaaagtgaatgag1740

atcctgcaggcagacgccattaacggaaccgataatgaggtggtcaccgtcacagatgaa1800

aacactggcgagatctctgaaaaggtgaaactggggaccaaggctctggcaggacagtgg1860

ctggcacatggagtcacccgctcagtgacaaagcgaagcgtgatgacactggcttacggc1920

agcaaagagttcgggtttagacagcaggtgctggaagacaccatccagcccgccattgat1980

tccgggaagggacccatgtttacacagcctaaccaggctgcaggctatatggccaagctg2040

atctgggagtcagtgagcgtcactgtggtcgccgctgtggaagctatgaattggctgaag2100

tccgccgccaaactgctggctgcagaggtgaaggacaagaaaactggcgaaattctgagg2160

aaacgctgcgccgtccactgggtgaccccagatgggttccccgtgtggcaggagtacaag2220

aaacctatccagacccggctgaacctgatgttcctgggccagtttagactgcagccaaca2280

atcaacactaataaggacagtgagattgatgctcataaacaggaatcaggaattgcacca2340

aattttgtgcacagccaggacggctcccatctgaggaagaccgtggtctgggctcacgag2400

aaatatggcatcgaatccttcgcactgattcatgactcttttgggacaatccccgccgat2460

gccgctaatctgttcaaggctgtccgcgagactatggtggacacctacgaaagttgtgat2520

gtgctggccgacttctatgatcagtttgctgaccagctgcacgagtcacagctggataag2580

atgcctgccctgcccgctaagggcaacctgaacctgagggacattctggagtctgatttc2640

gcattcgcttga2652

<210>78

<211>4242

<212>dna

<213>人工序列

<220>

<223>hn-hpols-hccdna

<400>78

accagacaagagtttaagagatatgtatccttttaaattttcttaagaaaaacttagggt60

gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120

tggccggccttctgtccactttcgacacctttagctcacggcgctccgagtccatcaaca180

agtccggcggtggagccgtgatccctggacagcgctccactgtctccgtgttcgtcctcg240

ggccgtcggtgaccgacgacgccgacaagctgttcatcgccactactttcctcgctcatt300

ccctggataccgataagcagcactcccagcgcggaggttttttggtgtctctcctggcaa360

tggcctactcgtccccggagctgtacctgacaactaacggagtgaacgcggacgtgaaat420

acgtgatctacaacatcgaaaaggacccgaagcggaccaagaccgacggtttcattgtca480

agactcgggatatggagtacgagaggaccaccgagtggcttttcggcccaatggtcaaca540

agagcccgctgttccaaggacagcgggacgccgcggaccccgacaccctgctgcaaatct600

acggctaccctgcttgcctgggagccatcatcgtccaagtctggattgtgctcgtgaagg660

ccattaccagctccgccggtctgagaaaggggtttttcaaccgcctggaggcgttcagac720

aggacggcaccgtgaagggggcactggtgttcaccggcgaaaccgtggaaggaatcggct780

cagtgatgcggtcccagcagtccctggtgtcgctgatggtggaaactctcgtgaccatga840

acacggcccggtcggacctgaccaccctggagaagaacatccagattgtgggcaactaca900

ttcgggatgccggactcgctagcttcatgaacactattaagtacggagtggaaaccaaga960

tggccgccctgactctctccaacctgaggcccgatatcaacaagctgcgctcgctgatcg1020

atacctacctgtcaaaggggcccagggccccattcatttgcatacttaaagaccctgtgc1080

acggagagttcgcccctggaaactatcccgctctgtggagctacgcaatgggagtggccg1140

tggtgcagaacaaggccatgcagcaatacgtcaccgggaggacctatctcgatatggaga1200

tgttcctgctggggcaggccgtggcgaaggacgcagaaagcaaaatctcgtcggcccttg1260

aagatgaactgggtgtcactgacaccgcgaagggcagactcagacaccacttggccaacc1320

tcagcggaggagatggagcttaccacaagccgactgggggtggagcgattgaagtcgccc1380

tggataacgccgacatcgaccttgagactaaggcgcatgcggaccaggacgccaggggat1440

ggggcggggacagcggcgaacgctgggcccgccaagtgtccggcggtcacttcgtgacct1500

tgcatggcgcggagcgcctggaagaggaaaccaatgatgaggacgtgtcagacatcgaaa1560

gacggatcgccatgcgactggctgaacggcgccaggaggattccgcgacgcacggggacg1620

agggacggaacaatggagtggaccacgacgaagatgacgacgccgcagccgtggccggaa1680

tcggcggaatctagcggtttatttattgatccttatttattcaaagatctacgaggcctc1740

agtttgtctacttggtcttaagaaaaacttagggtgaaagcctcagtgccccattctcac1800

tgctactagtcgccaacatggaccaggacgcattcattctgaaagaagattcagaagtcg1860

aacgcgaagcccccggtggaagggagtctctcagcgacgtgatcggattcctggacgccg1920

tgctgtcatcggaaccgaccgacattgggggagacaggtcgtggctgcacaacactatca1980

acaccccgcaagggcctggctccgcgcatcgggccaagtcggagggagaaggagaagtgt2040

caaccccgagcacccaggacaaccgctcaggggaagagtccagagtctccggtagaacgt2100

caaagcctgaagccgaggcccatgccggaaacctggataagcagaacattcaccgggcct2160

ttggtggccgcaccgggacaaactccgtgtcgcaagacctgggcgatggcggcgattccg2220

gtatcctggagaatcccccaaacgagaggggatacccaagatccggaatcgaggacgaaa2280

accgggaaatggcagcccaccctgataagcggggcgaagatcaggccgaaggcctgcctg2340

aggaggtccggggatcgacctccttgcctgacgaaggggaaggcggcgcctcgaacaacg2400

gccggtcaatggagcccggcagctcccattccgctcgggtcactggagtcctcgtgattc2460

cttccccggaactggaggaagccgtgctgaggcggaacaagcggcggccgaccaactccg2520

gatcaaagcctctgactcccgccaccgtgcccggaactaggtccccgcccctgaaccgat2580

acaactcgaccgggtcaccacccggaaagccgccgtccacccaagacgagcacatcaaca2640

gcggggacactccggccgtgcgcgtgaaggaccggaagccacccatcggcactcggagcg2700

tgtctgactgtcctgcgaatggtagacccatccaccctggcctggaaaccgactccacca2760

agaagggaataggggagaacacctccagcatgaaggagatggctactctgctcacctcgc2820

ttggcgtgatccagtccgcgcaagagttcgaatccagccgcgacgcctcctacgtgttcg2880

cgcggcgcgccctgaagtccgcgaactacgccgagatgactttcaacgtgtgcggattga2940

tcctgtccgcggaaaagagctccgcaagaaaagtggacgagaacaagcagctgctcaagc3000

agatccaggagagcgtggagtccttccgcgacatctacaaacgcttctccgagtatcaga3060

aggagcagaactcccttctcatgtccaacctgtccacccttcacatcatcactgatcggg3120

gtggaaagacggataacaccgattcgttgacccgctccccgagcgtgttcgccaagtcca3180

aagagaacaagactaaggccaccagatttgatccttcgatggaaaccctggaggacatga3240

agtacaagcccgacctcattcgggaggacgaattccgggacgagatcagaaacccggtgt3300

accaagagagggacaccgaaccccgcgctagcaatgctagccgcctcctgccgtcaaagg3360

agaagccaaccatgcactcgctgcggctggtcattgaaagctctcccctgtcccgcgcgg3420

aaaaggtcgcctacgtgaaaagcctctcgaagtgcaagaccgaccaggaagtgaaggccg3480

tgatggaactggtggaggaggacatcgaatccctcaccaattgaaccggtgtcgacggag3540

ccgcaccttgtcatgtaccatcaatattaagaaaaacttagggtgaaagtctcccctcct3600

cacacctaggagaccaccatgcccagctttctcaagaagattttgaaacttcggggacga3660

cgccaggaggacgagtcgcggagccggatgctttccgattcctcaatgttgtcatgccgc3720

gtgaatcagctgacatcagaagggacggaagccggatcgacgacgccctcgactttgccg3780

aaagaccaggcattgctgatcgagccgaaagtccgcgcgaaagaaaagtcgcagcaccga3840

aggcccaagattatcgatcaagtgagaagggtcgaatcccttggtgagcaggcgagccag3900

agacaaaaacatatgcttgaaacgctgatcaacaagatttacaccgggcctcttggagaa3960

gagctggtgcagacactctatcttcggatttgggcgatggaagagactccggaatcgctg4020

aagatcctccaaatgagagaggacattcgcgatcaggtactgaagatgaaaaccgaaaga4080

tggttgaggactctcatcaggggcgagaaaacaaagttgaaagacttccaaaagcgatac4140

gaggaggtgcatccctatctcatgaaggaaaaggtagaacaggtcattatggaggaggcg4200

tggtcactcgccgcacacatcgtgcaagagtgataacccggg4242

<210>79

<211>6884

<212>dna

<213>人工序列

<220>

<223>hpollcdna

<400>79

gcggccgcttaagaaaaacttagggtgaatgtaaagctttctggccaccatggacggtca60

ggaatcaagccagaatccgtccgacatcctctacccggagtgccatcttaacagcccgat120

cgtacgcgggaagatcgcacagcttcacgtcctgttggatgtcaatcagccgtacagatt180

gaaagatgactcaatcattaacattaccaagcacaagattcgaaatggaggtttgtcacc240

tcggcagattaaaatccggtcactggggaaggcgcttcagaggaccatcaaagaccttga300

ccgctacaccttcgagccctacccgacgtactcccaagaacttttgcggctcgacatccc360

ggagatctgcgataagatccggtcggtgtttgccgtatccgataggcttacgcgcgagtt420

gtcgtcggggttccaagacctctggctcaatatctttaaacagcttgggaatatcgaagg480

ccgagaaggctacgacccgcttcaggatatcggcacgattcccgagatcaccgacaaata540

ctcaaggaatcgatggtacagacccttccttacatggttctcaatcaaatacgatatgag600

gtggatgcagaaaactaggccgggagggcctcttgacacgagcaattcgcataacctctt660

ggagtgtaagtcctacacgctggtgacgtacggcgaccttatcatgattttgaacaaact720

cacgcttacggggtacatcttgacaccagaattggtacttatgtactgtgacgtagtgga780

aggaaggtggaacatgtcagcagcgggccacctcgacaagaagtccatcggaattacttc840

caaaggggaggaattgtgggagttggtggactcgttgtttagcagccttggtgaggagat900

ctacaacgtaatcgcccttttggagccgctttcactcgcgttgatccaactcaacgatcc960

cgtcattcctttgcggggtgcgtttatgagacacgtactgactgagcttcaggcagtgtt1020

gacatcgagagatgtctacacggatgccgaagcggatactatcgtggagtcactccttgc1080

aatcttccacggcaccagcatcgacgagaaagctgaaatctttagcttctttcggacttt1140

cgggcacccctcacttgaagccgtcaccgcggctgacaaagtacgggcgcacatgtacgc1200

gcagaaggcgattaaacttaagacgttgtacgagtgccatgctgtgttctgcacaatcat1260

tattaatggttacagagagcggcacgggggtcagtggcccccttgcgactttccagacca1320

cgtctgcttggagctcagaaatgcacagggttcgaacacggcgatcagctacgaatgtgc1380

ggtggacaactatactagcttcatcgggttcaaattcaggaaattcatcgaaccacagct1440

ggacgaagacctgactatctacatgaaggataaggcgctgtcaccgaggaaagaagcatg1500

ggatagcgtgtaccccgactcaaatttgtactataaagcgccagagtccgaggagacacg1560

gcggttgattgaggtgttcattaacgatgagaattttaacccagaagagatcatcaacta1620

tgtcgagtcgggcgactggctcaaggacgagaagttcaacatctcgtactccttgaaaga1680

aaaagaaatcaagcaggaggggcgactgttcgctaagatgacatacaagatgcgagccgt1740

gcaagtcttggcggaaaccttgttggcaaaggggatcggagaattgttctcggaaaacgg1800

aatggtcaagggagagatcgaccttttgaaacgcctgacaaccttgtcggtctcgggagt1860

cccgcgcactgactcggtgtataacaacagcaagtcctcggagaagcgaaacgaggggat1920

gaagaagaagaattcaggtggatactgggacgagaaaaagagatccaggcatgagttcaa1980

ggccacagactcgtcaacggatggttatgaaacgctttcgtgcttcctgacgaccgatct2040

caaaaagtactgcctcaactggcggttcgaaagcacagcactttttgggcagagatgtaa2100

cgaaatctttgggtttaagaccttctttaactggatgcaccccgtcttggagcggtgcac2160

aatctacgtaggagatccatactgtccggtggctgaccgaatgcataggcaactccagga2220

ccatgcggattccggaattttcatccacaacccgagaggaggaatcgaggggtattgcca2280

gaaactctggaccctgatttcgattagcgcgattcaccttgctgcggtgcgagtgggggt2340

cagggtgtcagcgatggtgcagggagataatcaggcaatcgcggtcacttcgcgagtgcc2400

ggtcgcgcagacgtacaaacagaagaaaaatcatgtatacaaggaaatcaccaagtactt2460

tggggctctgcggcacgtcatgtttgacgtgggacacgagttgaaacttaatgaaacgat2520

catcagctcgaaaatgtttgtatacagcaagagaatttactacgacggaaagattctccc2580

gcagtgcttgaaggctctgactcgatgtgtattctggagcgaaacgctggtcgatgaaaa2640

caggtcagcatgtagcaatatctcgacatcgatcgcaaaagcgattgaaaatggttattc2700

gccaattttgggatactgtatcgcgctttacaaaacgtgtcagcaagtgtgtatctcgct2760

gggtatgaccattaaccccaccatttcgcctacggtgcgggatcagtacttcaagggaaa2820

gaattggctgaggtgcgcggtgttgatcccagcaaatgtgggaggttttaactatatgtc2880

cacgtcacgatgctttgtccggaatatcggtgatccagccgtggccgctctggccgattt2940

gaaaagattcatccgagctgacttgctcgacaagcaggtgttgtatcgggtgatgaatca3000

ggagccgggtgactcctcatttttggattgggcgtccgacccgtactcgtgcaatctgcc3060

gcactcccaatcgatcaccactatcatcaagaacatcacagccaggtcagtgttgcaaga3120

aagcccgaatcctctgttgtcaggtctcttcacagagacttcgggggaggaagatttgaa3180

cttggcgtcgtttctcatggatcgcaaggtgatcctcccacgggtcgcgcatgagatcct3240

tggaaacagcctgacaggggtgcgagaagcgattgcgggcatgttggatactacgaagag3300

cctcgtccgctcctccgtgaaaaagggaggactctcgtacgggatcttgcggagacttgt3360

caattacgacttgctccagtatgagacgctgacaaggacactgaggaaacccgtgaagga3420

caatatcgaatacgaatacatgtgctcagtggaattggccgtggggctgaggcaaaagat3480

gtggatccacctgacatacggacgcccgatccacggactggagacacctgaccctcttga3540

gttgttgagggggacgttcatcgaagggtcggaggtctgcaaactctgtagatcggaggg3600

agccgaccccatctacacgtggttttatctccccgataatattgatcttgacacacttac3660

aaatggatgccctgcgattagaatcccgtatttcgggtcagcaacggacgagaggtccga3720

ggctcagcttgggtacgtgcgcaaccttagcaagcccgcgaaagccgccatcagaatcgc3780

tatggtgtatacgtgggcctacgggaccgatgaaatttcatggatggaagccgcgctcat3840

tgctcagacaagagcgaatctctcgctggaaaatctgaagctcctgacacccgtatcaac3900

atccacgaacctttcccatcggttgaaagacaccgccacccagatgaagttttcctcggc3960

aacgctcgtcagggcgtcacgcttcatcacgatctcgaatgataacatggcgcttaaaga4020

agccggagagtcgaaagacacgaacctcgtctatcaacagatcatgttgactggactgtc4080

gctttttgagttcaatatgaggtacaagaagggatcgctcggcaaacctctcatcctcca4140

cttgcacctcaataacgggtgctgcatcatggagtcacctcaagaggcgaacatcccgcc4200

tagaagcacattggacttggagattacacaagagaataacaaactcatctacgatcccga4260

tcccctcaaggatgtggaccttgaacttttctcgaaagtacgcgatgtcgtccacaccgt4320

tgacatgacatattggtccgacgacgaggtaatccgcgcaacctcgatctgcaccgcgat4380

gacaatcgcagacaccatgtcccagcttgaccgggataaccttaaggagatgattgcgct4440

ggtcaatgacgacgacgtaaactcgctgattacggagttcatggtcatcgacgtgcctct4500

cttctgcagcacattcggaggcatcctggtcaaccagttcgcctacagcctttatggtct4560

taacatccgaggaagagaagagatttgggggcacgtggtgagaatcttgaaggacacgtc4620

ccatgcggtacttaaggtgctgagcaacgccctcagccaccccaaaatttttaagagatt4680

ttggaatgccggggtggtggaacctgtgtacggacccaatctttcgaatcaagacaaaat4740

cctgcttgcactcagcgtctgtgagtattccgtggaccttttcatgcacgattggcaagg4800

gggagtccccttggaaatcttcatctgcgacaatgaccccgacgtggcggatatgcggag4860

atcgtcatttcttgctcgccatcttgcatacttgtgctccgtagcagagatctcacggga4920

cgggcctcgcctggagtcaatgaactcattggaacggctcgaatccctgaaatcgtacct4980

cgaattgactttcctggacgatccggtccttaggtattcgcagctcactgggcttgtaat5040

caaggtatttccctcgacattgacgtacatcaggaagtcgtccattaaagtattgcgcac5100

tcgcgggatcggcgtaccggaagtgcttgaggattgggacccggaggcggataacgcatt5160

gctcgatggtatcgctgcggagattcagcagaatatccccctcgggcatcagaccagagc5220

tcccttttgggggctgcgggtatcgaaaagccaggtcctccgactgaggggatacaaaga5280

gattaccagaggagagattgggagatcaggagtcggattgacacttccgtttgacggacg5340

ctatctctcccaccaactgcgcctctttgggattaactcgacttcgtgcctcaaggccct5400

tgagcttacgtatctcctgtccccgttggtggacaaggacaaagaccgcttgtatctggg5460

ggaaggggcgggtgcaatgctttcgtgttacgatgcgacgcttggtccgtgcattaacta5520

ttacaactcgggagtgtactcgtgtgacgtcaacggccaaagagaattgaatatctaccc5580

agcagaggtagcgctcgtgggaaagaaactgaacaatgtcacctcactcggacagcgcgt5640

gaaggtgctcttcaatggtaaccccggatcgacgtggattggtaatgatgagtgcgaagc5700

tttgatttggaacgaactccaaaattcctcgattggattggtgcactgtgacatggaggg5760

aggggaccacaaggatgatcaagtagtactccacgagcactacagcgtgattcggatcgc5820

ttatttggtgggcgatcgggacgtcgtactcatctccaagatcgcccctcgactgggaac5880

agactggactcgccaattgtccctctacctccgctactgggatgaagtcaatcttatcgt5940

ccttaagacatcgaacccggcttcgactgaaatgtacctcctcagcagacaccccaagtc6000

ggacatcattgaggatagcaaaacagtactcgcgtcactgctccccctctcgaaggagga6060

ttccattaagatcgagaaatggattctcatcgagaaagcaaaggcccatgaatgggtaac6120

gagagagctgcgcgagggaagctcgtcatcgggcatgcttagaccctaccaccaggcgct6180

gcagacttttggattcgaacccaatctgtataaacttagccgcgacttcctcagcaccat6240

gaacatcgctgacacacataactgcatgatcgctttcaaccgggtactcaaagacacgat6300

ttttgagtgggccagaatcacggagtcggacaagcggctgaaacttacagggaagtacga6360

cctttatcccgtcagagacagcggtaaactgaaaacagtgtccagaagactggttctgtc6420

atggatctcactgtcaatgagcacgcgattggtcacgggttcgttccctgatcaaaagtt6480

tgaggcgagactccaattgggcattgtctcgctctcgtcaagagagatcaggaacctccg6540

agtcattactaaaacgctcctcgacagattcgaggacattattcacagcatcacttatcg6600

atttttgacgaaggagatcaagatccttatgaagattctcggtgccgtgaaaatgttcgg6660

ggcgagacaaaatgagtacacaacagtcattgatgacggttcgctcggagatatcgagcc6720

atacgatagctcgtgaaccggtagccgcaccttgtcatgtaccatcaataaagtaccctg6780

tgctcaacgaagtcttggactgatccatatgacaatagtaagaaaaacttacaagaagac6840

aagaaaatttaaaagaatacatatctcttaaactcttgtctggt6884

<210>80

<211>4248

<212>dna

<213>人工序列

<220>

<223>hn-hpols-hccdna

<400>80

accaaacaagagaaaaaacatgtatgggatatgtaatgaagtttaagaaaaacttagggt60

gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120

tggctggcctgctgtcaaccttcgataccttttcaagtaggaggagcgagtcaatcaaca180

aatctgggggcggagctgtcatccctggacagcggtccaccgtgtctgtcttcgtgctgg240

gcccctctgtgacagacgatgccgacaagctgttcatcgccaccacatttctggctcaca300

gtctggacacagataaacagcattcacagagaggcgggtttctggtgagcctgctggcta360

tggcatacagctccccagaactgtatctgactaccaacggagtgaatgccgacgtgaagt420

acgtgatctataacattgagaaggaccccaaaaggactaagaccgatggcttcatcgtga480

agacacgggatatggaatacgagagaacaactgagtggctgttcgggcctatggtgaaca540

agagcccactgtttcagggacagcgagacgcagctgaccccgataccctgctgcaaatct600

acggctatcctgcctgcctgggggctatcattgtccaagtgtggatcgtcctggtgaaag660

caattacctctagtgccggcctgcggaaggggttctttaaccgcctggaggctttccgac720

aggatggaacagtgaagggcgcactggtctttaccggcgaaacagtggagggaatcggct780

ctgtcatgagaagtcagcagtcactggtcagcctgatggtggaaactctggtcaccatga840

acacagccagaagtgacctgaccacactggagaaaaacatccagattgtggggaattaca900

tcagggatgccggcctggccagcttcatgaataccatcaagtatggggtggaaacaaaga960

tggcagccctgactctgtccaacctgagacccgacatcaacaagctgcggagcctgattg1020

atacctacctgtctaagggccccagggcccctttcatctgtattctgaaagacccagtgc1080

acggggagtttgctccaggaaactaccccgcactgtggtcctatgcaatgggcgtggccg1140

tggtccagaataaggccatgcagcagtacgtcactggccgcacctatctggacatggaaa1200

tgtttctgctggggcaggccgtggctaaagatgccgagagcaagatcagcagcgccctgg1260

aggacgagctgggagtcacagatactgccaaggggcgactgcggcaccatctggcaaacc1320

tgtccggaggcgacggagcatatcacaaacctacagggggaggcgctatcgaagtggcac1380

tggataatgccgacattgatctggagactaaggcacatgcagaccaggatgctcgcggat1440

ggggaggagattccggcgaaagatgggccaggcaggtgtctggcgggcactttgtcactc1500

tgcatggcgctgagcgactggaggaagagaccaatgacgaagatgtgagtgacatcgagc1560

ggagaattgctatgcgactggcagaaaggcgccaggaggactcagccacccatggggatg1620

agggacggaacaatggagtggaccatgacgaagatgatgacgccgccgcagtcgcaggca1680

ttggaggaatttgacggtttatttattgatccttatttattcaaagatctacgaggcctc1740

agtttgtctacttggtcttaagaaaaacttagggtgaaagcctcagtgccccattctcac1800

tgctactagtcgccaccatggaccaggacgcttttattctgaaggaggattctgaagtgg1860

aacgggaggcaccagggggaagggagagtctgagtgatgtcattggcttcctggacgccg1920

tgctgagctccgagccaacagatatcggaggggaccggagctggctgcacaacactatta1980

ataccccccaggggcctggaagtgcacatagagccaagtcagagggcgaaggggaggtgt2040

caacacccagcactcaggataacaggtctggggaggaatccagagtctctggaaggacca2100

gtaagcctgaagcagaggcccacgctggcaacctggacaaacagaatatccatcgagctt2160

ttggaggccggaccgggacaaactctgtgagtcaggacctgggagatgggggagactctg2220

gcatcctggaaaacccccctaatgagcgcggctaccctcgatccgggattgaagatgaga2280

atagggagatggccgctcacccagataagcgaggagaagaccaggcagagggactgcctg2340

aggaagtgcggggctcaaccagcctgccagacgaaggagagggaggagcctccaacaatg2400

gccggtctatggaacctgggtctagtcattccgctagagtgacaggcgtgctggtcattc2460

cttctccagagctggaggaagcagtcctgcggagaaacaagaggcgcccaaccaattccg2520

gatctaaaccactgaccccagcaacagtgcccggcacacggagcccacccctgaacagat2580

ataatagtaccgggtcacctccaggaaagcccccttctacacaggatgagcacatcaaca2640

gtggggacactccagctgtgcgggtcaaggatagaaaaccacccattggaactcggagcg2700

tgagcgactgcccagcaaacggaagacctatccaccccggcctggagactgattccacca2760

agaaaggaattggcgaaaatacctcaagcatgaaggagatggccacactgctgactagcc2820

tgggcgtgatccagtccgcacaggaattcgagagcagccgggacgccagttacgtctttg2880

ctcgacgggcactgaaatcagccaactatgctgagatgaccttcaacgtgtgcggcctga2940

ttctgagcgccgaaaagagttcagctagaaaagtggatgagaataagcagctgctgaaac3000

agatccaggaaagcgtcgagtccttcagagacatctacaagaggttttcagaatatcaga3060

aagagcagaacagcctgctgatgtctaatctgagtacactgcacatcattactgataggg3120

gaggcaagaccgataacacagacagcctgacacgcagcccttccgtgttcgctaagtcca3180

aagagaataagactaaagcaacccgctttgacccctccatggaaactctggaggatatga3240

agtacaaacctgacctgatccgggaagatgagtttagggacgaaattcgcaacccagtgt3300

atcaggaacgcgatactgagccccgagcatcaaatgccagcagactgctgccctccaagg3360

agaaacctaccatgcattctctgaggctggtcatcgaaagctccccactgagccgcgctg3420

agaaggtggcatacgtcaaatctctgagtaagtgcaaaaccgaccaggaggtgaaggctg3480

tgatggaactggtggaggaagacattgaatctctgacaaactaagtcgacggagccgcac3540

cttgtcatgtaccatcaatattaagaaaaacttagggtgaaagtctcccctcctcacacc3600

taggaccatggcccaggcttcataatgcccagctttctgaagaagattctgaaactgaga3660

ggacgaagacaggaagatgagtctcgaagtcggatgctgtccgacagctccatgctgtct3720

tgcagggtgaaccagctgactagcgagggaaccgaagctggctcaaccacacccagcaca3780

ctgcctaaagaccaggccctgctgatcgagccaaaggtccgggctaaggaaaaatcccag3840

caccggagacccaagatcattgatcaggtgaggcgcgtcgagagtctgggggaacaggca3900

tcacagcggcagaaacatatgctggagaccctgatcaacaaaatctacacaggccctctg3960

ggggaggaactggtgcagactctgtatctgagaatctgggccatggaggaaaccccagag4020

tctctgaaaatcctgcagatgcgcgaagacattcgagatcaggtcctgaagatgaaaaca4080

gagagatggctgaggactctgattaggggcgaaaagaccaaactgaaggatttccagaag4140

cggtacgaggaagtgcacccctatctgatgaaagagaaggtggaacaggtcatcatggaa4200

gaggcttggtcactggcagctcatattgtgcaggagtaatgacccggg4248

<210>81

<211>4242

<212>dna

<213>人工序列

<220>

<223>hpols-hn-hccdna

<400>81

accagacaagagtttaagagatatgtatccttttaaattttcttaagaaaaacttagggt60

gaaagtatccaccctgaggagcaggttccagatccttttctttgctgccaaagtccacca120

tggaccaggacgcattcattctgaaagaagattcagaagtcgaacgcgaagcccccggtg180

gaagggagtctctcagcgacgtgatcggattcctggacgccgtgctgtcatcggaaccga240

ccgacattgggggagacaggtcgtggctgcacaacactatcaacaccccgcaagggcctg300

gctccgcgcatcgggccaagtcggagggagaaggagaagtgtcaaccccgagcacccagg360

acaaccgctcaggggaagagtccagagtctccggtagaacgtcaaagcctgaagccgagg420

cccatgccggaaacctggataagcagaacattcaccgggcctttggtggccgcaccggga480

caaactccgtgtcgcaagacctgggcgatggcggcgattccggtatcctggagaatcccc540

caaacgagaggggatacccaagatccggaatcgaggacgaaaaccgggaaatggcagccc600

accctgataagcggggcgaagatcaggccgaaggcctgcctgaggaggtccggggatcga660

cctccttgcctgacgaaggggaaggcggcgcctcgaacaacggccggtcaatggagcccg720

gcagctcccattccgctcgggtcactggagtcctcgtgattccttccccggaactggagg780

aagccgtgctgaggcggaacaagcggcggccgaccaactccggatcaaagcctctgactc840

ccgccaccgtgcccggaactaggtccccgcccctgaaccgatacaactcgaccgggtcac900

cacccggaaagccgccgtccacccaagacgagcacatcaacagcggggacactccggccg960

tgcgcgtgaaggaccggaagccacccatcggcactcggagcgtgtctgactgtcctgcga1020

atggtagacccatccaccctggcctggaaaccgactccaccaagaagggaataggggaga1080

acacctccagcatgaaggagatggctactctgctcacctcgcttggcgtgatccagtccg1140

cgcaagagttcgaatccagccgcgacgcctcctacgtgttcgcgcggcgcgccctgaagt1200

ccgcgaactacgccgagatgactttcaacgtgtgcggattgatcctgtccgcggaaaaga1260

gctccgcaagaaaagtggacgagaacaagcagctgctcaagcagatccaggagagcgtgg1320

agtccttccgcgacatctacaaacgcttctccgagtatcagaaggagcagaactcccttc1380

tcatgtccaacctgtccacccttcacatcatcactgatcggggtggaaagacggataaca1440

ccgattcgttgacccgctccccgagcgtgttcgccaagtccaaagagaacaagactaagg1500

ccaccagatttgatccttcgatggaaaccctggaggacatgaagtacaagcccgacctca1560

ttcgggaggacgaattccgggacgagatcagaaacccggtgtaccaagagagggacaccg1620

aaccccgcgctagcaatgctagccgcctcctgccgtcaaaggagaagccaaccatgcact1680

cgctgcggctggtcattgaaagctctcccctgtcccgcgcggaaaaggtcgcctacgtga1740

aaagcctctcgaagtgcaagaccgaccaggaagtgaaggccgtgatggaactggtggagg1800

aggacatcgaatccctcaccaattgaaccggtagatctacgaggcctcagtttgtctact1860

tggtcttaagaaaaacttagggtgaaagcctcagtgccccattctcactgctactagtcg1920

ccaacatggccggccttctgtccactttcgacacctttagctcacggcgctccgagtcca1980

tcaacaagtccggcggtggagccgtgatccctggacagcgctccactgtctccgtgttcg2040

tcctcgggccgtcggtgaccgacgacgccgacaagctgttcatcgccactactttcctcg2100

ctcattccctggataccgataagcagcactcccagcgcggaggttttttggtgtctctcc2160

tggcaatggcctactcgtccccggagctgtacctgacaactaacggagtgaacgcggacg2220

tgaaatacgtgatctacaacatcgaaaaggacccgaagcggaccaagaccgacggtttca2280

ttgtcaagactcgggatatggagtacgagaggaccaccgagtggcttttcggcccaatgg2340

tcaacaagagcccgctgttccaaggacagcgggacgccgcggaccccgacaccctgctgc2400

aaatctacggctaccctgcttgcctgggagccatcatcgtccaagtctggattgtgctcg2460

tgaaggccattaccagctccgccggtctgagaaaggggtttttcaaccgcctggaggcgt2520

tcagacaggacggcaccgtgaagggggcactggtgttcaccggcgaaaccgtggaaggaa2580

tcggctcagtgatgcggtcccagcagtccctggtgtcgctgatggtggaaactctcgtga2640

ccatgaacacggcccggtcggacctgaccaccctggagaagaacatccagattgtgggca2700

actacattcgggatgccggactcgctagcttcatgaacactattaagtacggagtggaaa2760

ccaagatggccgccctgactctctccaacctgaggcccgatatcaacaagctgcgctcgc2820

tgatcgatacctacctgtcaaaggggcccagggccccattcatttgcatacttaaagacc2880

ctgtgcacggagagttcgcccctggaaactatcccgctctgtggagctacgcaatgggag2940

tggccgtggtgcagaacaaggccatgcagcaatacgtcaccgggaggacctatctcgata3000

tggagatgttcctgctggggcaggccgtggcgaaggacgcagaaagcaaaatctcgtcgg3060

cccttgaagatgaactgggtgtcactgacaccgcgaagggcagactcagacaccacttgg3120

ccaacctcagcggaggagatggagcttaccacaagccgactgggggtggagcgattgaag3180

tcgccctggataacgccgacatcgaccttgagactaaggcgcatgcggaccaggacgcca3240

ggggatggggcggggacagcggcgaacgctgggcccgccaagtgtccggcggtcacttcg3300

tgaccttgcatggcgcggagcgcctggaagaggaaaccaatgatgaggacgtgtcagaca3360

tcgaaagacggatcgccatgcgactggctgaacggcgccaggaggattccgcgacgcacg3420

gggacgagggacggaacaatggagtggaccacgacgaagatgacgacgccgcagccgtgg3480

ccggaatcggcggaatctagcggtttatttattgatccttatttattcaagtcgacggag3540

ccgcaccttgtcatgtaccatcaatattaagaaaaacttagggtgaaagtctcccctcct3600

cacacctaggagaccaccatgcccagctttctgaagaagattctgaaactgagaggacga3660

agacaggaagatgagtctcgaagtcggatgctgtccgacagctccatgctgtcttgcagg3720

gtgaaccagctgactagcgagggaaccgaagctggctcaaccacacccagcacactgcct3780

aaagaccaggccctgctgatcgagccaaaggtccgggctaaggaaaaatcccagcaccgg3840

agacccaagatcattgatcaggtgaggcgcgtcgagagtctgggggaacaggcatcacag3900

cggcagaaacatatgctggagaccctgatcaacaaaatctacacaggccctctgggggag3960

gaactggtgcagactctgtatctgagaatctgggccatggaggaaaccccagagtctctg4020

aaaatcctgcagatgcgcgaagacattcgagatcaggtcctgaagatgaaaacagagaga4080

tggctgaggactctgattaggggcgaaaagaccaaactgaaggatttccagaagcggtac4140

gaggaagtgcacccctatctgatgaaagagaaggtggaacaggtcatcatggaagaggct4200

tggtcactggcagctcatattgtgcaggagtaatgacccggg4242

<210>82

<211>6884

<212>dna

<213>人工序列

<220>

<223>hpollcdna

<400>82

gcggccgcttaagaaaaacttagggtgaatgtaaagctttctggccaccatggacggaca60

ggaatctagccagaatcccagcgacatcctgtatcccgagtgccacctgaatagcccaat120

cgtgagaggaaaaatcgcccagctgcacgtgctgctggacgtgaaccagccatataggct180

gaaggacgattccatcattaatatcacaaagcataagattcgcaacggcgggctgtctcc240

ccgccagattaagatccgaagtctgggcaaagccctgcagcgcactatcaaagatctgga300

ccgatacaccttcgagccttacccaacatatagccaggaactgctgaggctggacattcc360

agagatctgcgataagatccgcagcgtgtttgctgtctccgaccggctgaccagagagct420

gagctccggcttccaggatctgtggctgaatatcttcaagcagctggggaacatcgaggg480

aagagaaggctatgatccactgcaggacattggcaccatccccgagattacagacaagta540

ctctcgcaaccgatggtataggcccttcctgacctggtttagtatcaagtacgacatgcg600

atggatgcagaaaacacggcccggaggccctctggatacttccaactctcacaatctgct660

ggagtgcaaaagctacacactggtgacttatggagatctggtcatgatcctgaataagct720

gactctgaccggctacattctgacccccgaactggtgctgatgtattgtgacgtggtcga780

gggaagatggaacatgagcgccgctggccatctggacaagaagagcattggcatcaccag840

taagggggaggaactgtgggaactggtggactccctgttctctagtctgggagaggaaat900

ctataatgtgattgccctgctggagcctctgtctctggctctgattcagctgaacgatcc960

agtgatccccctgcggggcgccttcatgagacacgtcctgaccgagctgcagaccgtgct1020

gacaagcagggatgtctacactgacgcagaggccgataccatcgtggaatccctgctggc1080

aatctttcatgggacatctattgacgagaaggccgaaatcttcagtttctttcggacatt1140

tggacacccctcactggaggccgtgactgcagccgataaggtcagagctcatatgtacgc1200

acagaaagccatcaagctgaaaaccctgtatgaatgccacgccgtgttctgcaccatcat1260

tatcaatggctaccgggagagacacgggggacagtggccaccttgcgattttcctgacca1320

cgtgtgcctggaactgcgcaacgctcaggggtcaaatactgcaatcagctacgagtgtgc1380

cgtggacaactataccagcttcattggattcaagtttagaaagttcatcgagccacagct1440

ggatgaagacctgaccatctacatgaaggataaagcactgtcccccaggaaagaagcctg1500

ggactccgtgtatcctgattctaatctgtactataaggccccagagtctgaggaaacacg1560

gagactgatcgaggtgttcattaatgacgaaaactttaatcccgaggaaattatcaacta1620

cgtggagagcggggactggctgaaggatgaggaattcaacattagttattcactgaagga1680

gaaagaaatcaagcaggaaggacgcctgtttgccaagatgacatacaaaatgcgagctgt1740

gcaggtcctggcagagactctgctggccaagggaatcggcgagctgttctccgaaaatgg1800

gatggtgaagggagagattgacctgctgaaacgactgaccacactgagcgtgtccggcgt1860

ccctcggaccgatagcgtgtataacaattcaaagtcaagcgagaaaaggaacgaggggat1920

ggaaaacaaaaattctggcgggtattgggacgagaagaaaaggagtcgccacgaattcaa1980

ggccaccgactcctctacagatggctacgagactctgagttgctttctgactaccgatct2040

gaagaaatattgtctgaattggcggttcgaatctaccgctctgtttgggcagagatgcaa2100

tgagatcttcggcttcaagaccttcttcaactggatgcatcccgtgctggagagatgcac2160

catctacgtgggcgacccttattgtccagtcgctgataggatgcaccgccagctgcagga2220

tcatgcagactccgggattttcatccacaaccctaggggaggcatcgagggatactgtca2280

gaagctgtggaccctgatttctatcagtgccattcatctggctgcagtgcgggtcggagt2340

gagagtctccgctatggtgcagggcgacaatcaggctatcgcagtcacctctcgcgtgcc2400

cgtcgctcagacatataaacagaagaaaaaccacgtgtacgaggaaattacaaagtattt2460

cggcgcactgcggcacgtgatgtttgatgtcgggcatgagctgaaactgaatgaaactat2520

catcagttcaaagatgttcgtgtactccaaaagaatctactatgacggcaagatcctgcc2580

acagtgcctgaaggccctgactaaatgcgtgttctggagcgagaccctggtcgatgaaaa2640

caggtcagcttgcagcaatatctcaactagcattgccaaagctatcgagaacggctacag2700

ccccatcctggggtactgtattgccctgtataagacctgccagcaggtgtgcatctcact2760

gggcatgactattaatcccaccatcagccctacagtgagagaccagtacttcaaggggaa2820

aaactggctgaggtgcgctgtgctgatccccgcaaacgtcgggggattcaattatatgtc2880

cacctctaggtgttttgtgcgcaacatcggggaccctgcagtcgccgctctggctgatct2940

gaaacgattcattcgggccgatctgctggacaagcaggtgctgtaccgcgtgatgaatca3000

ggagcctggagatagctcctttctggactgggcaagcgatccctattcctgcaacctgcc3060

tcacagtcagtcaatcacaactattatcaagaatatcaccgccaggagcgtgctgcagga3120

atcccccaaccctctgctgagcgggctgttcacagagacttccggagaggaagacctgaa3180

tctggccagcttcctgatggatagaaaagtgatcctgccaagggtcgcccatgaaatcct3240

gggaaacagcctgaccggcgtgagagaggcaatcgccggaatgctggacaccacaaagtc3300

tctggtgcgagccagtgtccggaaaggaggactgagctacggcatcctgaggcgcctggt3360

gaattacgacctgctgcagtatgaaaccctgacaagaactctgaggaagcccgtgaaaga3420

taacatcgagtacgaatatatgtgcagcgtggagctggcagtcggactgcgacagaagat3480

gtggattcacctgacttacgggcgacctatccacggcctggagaccccagatcccctgga3540

actgctgaggggcattttcatcgaggggtcagaagtgtgcaagctgtgccgcagcgaggg3600

agctgaccctatctacacctggttttatctgccagataatattgatctggacaccctgac3660

aaacggatgtcctgcaattcgcatcccatacttcggctctgctacagacgagagaagtga3720

agcacagctgggctatgtgaggaatctgagcaagcctgccaaagcagccattcggatcgc3780

tatggtgtatacctgggcatatgggaccgatgagattagctggatggaagctgcactgat3840

cgcacagacacgcgccaacctgtccctggagaatctgaagctgctgactccagtgagcac3900

ttccaccaacctgtcccaccggctgaaggacacagccactcagatgaaattctctagtgc3960

aaccctggtgcgcgccagccggttcatcacaatcagcaacgacaatatggctctgaagga4020

ggcaggagaatctaaagatacaaatctggtgtaccagcagatcatgctgactggcctgag4080

tctgttcgagtttaacatgcgctacaagaaggggtcactgggaaagcctctgatcctgca4140

cctgcatctgaacaatggctgctgtattatggagtccccacaggaagccaatatcccacc4200

ccggtctacactggacctggagattactcaggaaaacaataagctgatctatgatcctga4260

cccactgaaagatgtggacctggaactgttctccaaggtgagggacgtggtccacactgt4320

cgatatgacctactggagcgacgatgaagtgatccgcgccacctccatttgcactgccat4380

gaccatcgctgacacaatgtcccagctggatcgggacaacctgaaggaaatgattgctct4440

ggtgaacgacgatgacgtgaattctctgattaccgagttcatggtcatcgatgtcccact4500

gttctgttcaacatttggaggcatcctggtgaatcagtttgcctacagcctgtatggact4560

gaacattcgaggccgggaggaaatctggggccacgtggtcagaatcctgaaggacacctc4620

ccatgcagtgctgaaagtcctgtctaatgccctgagtcaccccaagattttcaaaaggtt4680

ttggaacgcaggagtggtcgagccagtgtacggacccaacctgtctaatcaggataagat4740

cctgctggctctgtcagtgtgcgaatatagcgtggacctgttcatgcacgattggcaggg4800

gggagtgcccctggagatcttcatctgtgataatgaccctgatgtcgcagacatgcggcg4860

gagcagcttcctggcacgccatctggcctacctgtgctccctggccgaaatctctagaga4920

tggccccaggctggagtccatgaactctctggagcggctggaaagtctgaaatcatacct4980

ggagctgactttcctggatgaccccgtgctgagatatagccagctgaccggcctggtcat5040

caaggtctttccttccaccctgacatacatccggaagtccagcatcaaggtgctgagaac5100

cagggggatcggagtgcccgaggtcctggaagactgggatcctgaagctgacaatgcact5160

gctggatggcattgccgctgagatccagcagaacattccactgggacaccagacacgggc5220

cccattttggggactgagagtgtctaaaagtcaggtcctgcgcctgcgagggtacaagga5280

gatcaccaggggcgaaattgggcgcagtggagtgggactgacactgccattcgacggcag5340

gtatctgtcacatcagctgcgcctgtttgggatcaactcaactagctgcctgaaggccct5400

ggaactgacctacctgctgagccccctggtggacaaggataaagacagactgtacctggg5460

agagggcgctggggcaatgctgagctgctatgacgctaccctgggcccttgtatcaacta5520

ctataattcaggcgtgtactcctgtgatgtcaacgggcagcgcgagctgaatatctaccc5580

agccgaagtggctctggtcgggaagaaactgaacaatgtgacctctctgggacagcgggt5640

gaaggtcctgttcaacggaaatcccggcagtacatggattggaaacgacgagtgcgaagc5700

cctgatctggaacgagctgcagaatagttcaattggcctggtgcactgtgacatggaagg5760

cggggatcataaagatgaccaggtggtcctgcacgagcattacagcgtgattcgaatcgc5820

ttatctggtcggcgatcgggacgtggtcctgatctcaaagattgcacctcgactggggac5880

agactggactcggcagctgagcctgtacctgagatattgggatgaagtgaatctgatcgt5940

cctgaaaacctccaacccagcctctacagaaatgtacctgctgagtaggcaccccaagtc6000

agacattatcgaggattccaaaaccgtgctggcttctctgctgccactgagtaaggagga6060

ctcaattaagatcgaaaaatggattctgatcgagaaggccaaagctcacgaatgggtgac6120

cagagagctgagggaagggagctcctctagtggaatgctgaggccttaccatcaggccct6180

gcagacattcggctttgagccaaacctgtataagctgagccgcgacttcctgtccactat6240

gaacattgctgatacccataattgcatgatcgcattcaaccgggtgctgaaagacacaat6300

ttttgagtgggccaggatcactgaaagcgataagcgcctgaaactgacaggaaagtacga6360

cctgtatcctgtgcgcgatagcggcaagctgaaaactatcagtagaaggctggtgctgtc6420

atggatttccctgtctatgagtacacggctggtcactgggtccttcccagaccagaaatt6480

tgaagccagactgcagctgggaatcgtgtctctgtcaagcagggagattcgcaatctgcg6540

agtcatcactaagaccctgctggacagattcgaagatattatccacagcatcacatacag6600

atttctgactaaggagatcaagatcctgatgaagattctgggagccgtgaaaatgtttgg6660

cgctcggcagaacgagtacaccactgtgattgatgatggcagcctgggggacattgaacc6720

ctacgactcctcctaaaccggtagccgcaccttgtcatgtaccatcaataaagtaccctg6780

tgctcaacgaagtcttggactgatccatatgacaatagtaagaaaaacttacaagaagac6840

aagaaaatttaaaagaatacatatctcttaaactcttgtctggt6884

<210>83

<211>2237

<212>dna

<213>人工序列

<220>

<223>hrig-iccdna

<400>83

ccggtagcagaaatagactgggaagatgcacaacttaagaaaaacttagggtgaaagcct60

gcgacaaaacctcctccttttccaagtgtaccaccatggaatgtcagaacctgtcagaaa120

actcctgtccccccagcgaagtgtcagatactaacctgtactcccctttcaagccacgga180

attaccagctggagctggccctgcccgctatgaagggcaaaaacaccatcatttgcgctc240

ctaccggatgtggcaagacattcgtgtctctgctgatttgtgaacaccatctgaagaaat300

ttcctcaggggcagaagggaaaagtggtcttctttgccaaccagatcccagtgtatgagc360

agcagaagagtgtcttctcaaaatactttgaacgacacggctatcgggtgacaggcatca420

gcggggcaactgccgagaatgtgcccgtcgagcagattgtggaaaacaatgacatcatta480

tcctgaccccacagatcctggtgaacaatctgaagaaagggaccattccctcactgagca540

tcttcacactgatgatttttgacgagtgccacaatacatctaagcagcatccttacaaca600

tgatcatgttcaactatctggatcagaaactgggagggagctccggaccactgcctcagg660

tcatcggcctgacagcaagcgtgggagtcggagacgccaagaacactgacgaggctctgg720

attacatctgcaagctgtgcgcttctctggatgcaagtgtgattgccactgtcaagcaca780

atctggaggaactggagcaggtggtctacaagcctcagaaattctttaggaaggtggaaa840

gcaggatctccgataagttcaaatatattatcgcacagctgatgcgggacaccgagagcc900

tggccaagagaatctgtaaagatctggaaaacctgtcccagattcagaatagagagtttg960

ggactcagaagtatgaacagtggattgtgaccgtccagaaagcctgcatggtgttccaga1020

tgccagacaaggatgaagaaagtcgaatctgtaaggccctgttcctgtatacctcacacc1080

tgcggaagtataacgacgctctgattatctcagagcatgcaagaatgaaggacgccctgg1140

attacctgaaagatttctttagcaatgtgagggccgctggcttcgacgagatcgaacagg1200

atctgactcagaggtttgaggaaaagctccaggagctggaatccgtgtctcgcgacccaa1260

gcaacgagaatcccaaactggaagatctgtgcttcatcctccaggaggaatatcacctga1320

acccagagaccattacaatcctgtttgtgaagaccagagctctggtggacgcactgaaaa1380

actggattgaagggaatcctaagctgtccttcctgaaaccaggaatcctgactggcaggg1440

ggaagaccaaccagaatactggaatgaccctgcccgctcagaagtgcattctggacgcct1500

tcaaggccagcggagatcataacattctgatcgccacatctgtggctgacgagggcattg1560

atatcgcccagtgtaacctggtcatcctgtacgaatatgtgggcaatgtcattaagatga1620

tccagactcggggaagaggcagggctcgcggctcaaagtgcttcctgctgaccagcaatg1680

caggcgtgatcgagaaggaacagattaacatgtataaggagaagatgatgaacgacagta1740

ttctgaggctccagacatgggatgaggccgtgttccgcgaaaagattctgcacatccaga1800

ctcatgagaagttcatccgcgactcccaggaaaagccaaaacccgtgcctgataaggaga1860

acaagaaactgctgtgccgaaagtgtaaagctctggcatgctacaccgcagacgtgcggg1920

tcatcgaggaatgtcactatacagtgctgggcgatgccttcaaggagtgctttgtctccc1980

ggccacatcccaagcctaaacagttctctagttttgaaaagcgcgctaaaatcttctgcg2040

cacgacagaattgttctcacgactggggcatccacgtgaagtacaaaaccttcgagattc2100

ccgtcattaagatcgagtcttttgtggtcgaagatatcgccacaggagtgcagactctgt2160

atagtaagtggaaagattttcattttgagaagattccctttgacccagcagagatgtcta2220

agtaactcgaccccggg2237

<210>84

<211>317

<212>dna

<213>人工序列

<220>

<223>hv-独特区cdna

<400>84

ccggtagcagaaatagactgggaagatgcacaacttaagaaaaacttagggtgaaagcct60

gcgacaaaacctcctccttttccaagtgtaccaccatgggccaccgacgggaacatatca120

tctacgagcgggatgggtatatcgtggacgaatcttggtgcaatccagtctgtagtcgca180

ttcgaatcattcccagaagggagctgtgcgtgtgtaaaacctgtcctaaggtctgcaaac240

tgtgtagggacgatatccagtgcatgcgccccgaccctttctgtagagaaatttttagga300

gctgactcgaccccggg317

<210>85

<211>857

<212>dna

<213>人工序列

<220>

<223>hpsma7cdna

<400>85

ccggtagcagaaatagactgggaagatgcacaacttaagaaaaacttagggtgaaagcct60

gcgacaaaacctcctccttttccaagtgtaccaccatgagttacgatagagcaatcacag120

tgttctcccccgatggacatctgtttcaggtcgagtatgcccaggaagccgtcaaaaaag180

ggtccactgccgtgggggtccgaggacgggacatcgtggtcctgggggtggagaagaaat240

ctgtcgcaaagctccaggatgaacgcaccgtgcgaaaaatttgcgccctggacgataacg300

tctgtatggccttcgctggcctgacagcagacgcacgaatcgtgattaatagagccaggg360

tcgagtgccagagccaccgcctgactgtggaggaccccgtgactgtcgaatacatcacca420

ggtatattgccagcctgaagcagcggtacacccagtccaacggccggagacccttcggga480

tcagcgccctgattgtgggattcgactttgatggcacacccagactgtaccagacagacc540

cttcaggcacttatcatgcctggaaagctaacgcaatcggacggggcgctaagagcgtga600

gagagttcctggagaagaactacaccgatgaggctattgaaaccgacgatctgaccatca660

agctggtcatcaaggccctgctggaggtggtccagtctggagggaagaacatcgaactgg720

cagtgatgaggcgcgaccagagtctgaagatcctgaatcccgaggaaattgagaaatatg780

tggctgagattgagaaagaaaaggaggagaatgagaaaaagaaacagaagaaagccagtt840

gataactcgaccccggg857

<210>86

<211>1707

<212>dna

<213>人工序列

<220>

<223>hpolscdna

<400>86

atggaccaggacgcattcattctgaaagaagattcagaagtcgaacgcgaagcccccggt60

ggaagggagtctctcagcgacgtgatcggattcctggacgccgtgctgtcatcggaaccg120

accgacattgggggagacaggtcgtggctgcacaacactatcaacaccccgcaagggcct180

ggctccgcgcatcgggccaagtcggagggagaaggagaagtgtcaaccccgagcacccag240

gacaaccgctcaggggaagagtccagagtctccggtagaacgtcaaagcctgaagccgag300

gcccatgccggaaacctggataagcagaacattcaccgggcctttggtggccgcaccggg360

acaaactccgtgtcgcaagacctgggcgatggcggcgattccggtatcctggagaatccc420

ccaaacgagaggggatacccaagatccggaatcgaggacgaaaaccgggaaatggcagcc480

caccctgataagcggggcgaagatcaggccgaaggcctgcctgaggaggtccggggatcg540

acctccttgcctgacgaaggggaaggcggcgcctcgaacaacggccggtcaatggagccc600

ggcagctcccattccgctcgggtcactggagtcctcgtgattccttccccggaactggag660

gaagccgtgctgaggcggaacaagcggcggccgaccaactccggatcaaagcctctgact720

cccgccaccgtgcccggaactaggtccccgcccctgaaccgatacaactcgaccgggtca780

ccacccggaaagccgccgtccacccaagacgagcacatcaacagcggggacactccggcc840

gtgcgcgtgaaggaccggaagccacccatcggcactcggagcgtgtctgactgtcctgcg900

aatggtagacccatccaccctggcctggaaaccgactcaacaaaaaagggcataggagag960

aacacatcatctatgaaagagatggctacattgttgacgagtcttggtgtaatccagtct1020

gctcaagaattcgaatcatcccgagacgcgagttatgtgtttgcaagacgtgccctaaag1080

tctgcaaactatgcagagatgacattcaatgtatgcggcctgatcctttctgccgagaaa1140

tcttccgctcgtaaagtggacgagaacaagcagctgctcaagcagatccaggagagcgtg1200

gagtccttccgcgacatctacaaacgcttctccgagtatcagaaggagcagaactccctt1260

ctcatgtccaacctgtccacccttcacatcatcactgatcggggtggaaagacggataac1320

accgattcgttgacccgctccccgagcgtgttcgccaagtccaaagagaacaagactaag1380

gccaccagatttgatccttcgatggaaaccctggaggacatgaagtacaagcccgacctc1440

attcgggaggacgaattccgggacgagatcagaaacccggtgtaccaagagagggacacc1500

gaaccccgcgctagcaatgctagccgcctcctgccgtcaaaggagaagccaaccatgcac1560

tcgctgcggctggtcattgaaagctctcccctgtcccgcgcggaaaaggtcgcctacgtg1620

aaaagcctctcgaagtgcaagaccgaccaggaagtgaaggccgtgatggaactggtggag1680

gaggacatcgaatccctcaccaattga1707

<210>87

<211>918

<212>dna

<213>人工序列

<220>

<223>人类nanogcdna

<400>87

atgagtgtggatccagcttgtccccaaagcttgccttgctttgaagcatccgactgtaaa60

gaatcttcacctatgcctgtgatttgtgggcctgaagaaaactatccatccttgcaaatg120

tcttctgctgagatgcctcacacggagactgtctctcctcttccttcctccatggatctg180

cttattcaggacagccctgattcttccaccagtcccaaaggcaaacaacccacttctgca240

gagaagagtgtcgcaaaaaaggaagacaaggtcccggtcaagaaacagaagaccagaact300

gtgttctcttccacccagctgtgtgtactcaatgatagatttcagagacagaaatacctc360

agcctccagcagatgcaagaactctccaacatcctgaacctcagctacaaacaggtgaag420

acctggttccagaaccagagaatgaaatctaagaggtggcagaaaaacaactggccgaag480

aatagcaatggtgtgacgcagaaggcctcagcacctacctaccccagcctttactcttcc540

taccaccagggatgcctggtgaacccgactgggaaccttccaatgtggagcaaccagacc600

tggaacaattcaacctggagcaaccagacccagaacatccagtcctggagcaaccactcc660

tggaacactcagacctggtgcacccaatcctggaacaatcaggcctggaacagtcccttc720

tataactgtggagaggaatctctgcagtcctgcatgcagttccagccaaattctcctgcc780

agtgacttggaggctgccttggaagctgctggggaaggccttaatgtaatacagcagacc840

actaggtattttagtactccacaaaccatggatttattcctaaactactccatgaacatg900

caacctgaagacgtgtga918

<210>88

<211>630

<212>dna

<213>人工序列

<220>

<223>人类lin28cdna

<400>88

atgggctccgtgtccaaccagcagtttgcaggtggctgcgccaaggcggcagaagaggcg60

cccgaggaggcgccggaggacgcggcacgggcggcggacgagcctcagctgctgcacggt120

gcgggcatctgtaagtggttcaacgtgcgcatggggttcggcttcctgtccatgaccgcc180

cgcgccggggtcgcgctcgaccccccagtggatgtctttgtgcaccagagtaagctgcac240

atggaagggttccggagcttgaaggagggtgaggcagtggagttcacctttaagaagtca300

gccaagggtctggaatccatccgtgtcaccggacctggtggagtattctgtattgggagt360

gagaggcggccaaaaggaaagagcatgcagaagcgcagatcaaaaggagacaggtgctac420

aactgtggaggtctagatcatcatgccaaggaatgcaagctgccaccccagcccaagaag480

tgccacttctgccagagcatcagccatatggtagcctcatgtccgctgaaggcccagcag540

ggccctagtgcacagggaaagccaacctactttcgagaggaagaagaagaaatccacagc600

cctaccctgctcccggaggcacagaattga630

<210>89

<211>1800

<212>dna

<213>人工序列

<220>

<223>人类igm9f11重链cdna

<400>89

atgtcagtgtcatttctgatttttctgccagtcctggggctgccttggggggtcctgtca60

caggtccagctgcagcagtccgggccaggactggtgaaacctgctcagacactgtccctg120

acttgcgcaatcagtggcgactcagtgagctccaactctgctacctggaattggattaga180

cagagtccactgaggggactggagtggctgggacggacatactatagaagcaaatggtac240

aacgactatgccgtgagcgtcaagtcccggatcaccattaaccctgatacaagcaagaat300

cagttctccctgcagctgaattctgtcaccccagaagacacagcagtgtactattgtgcc360

agggagaactactatggatccggccgctacaattggttcgatccttgggggcagggaaca420

ctggtgactgtctctagtggaagcgcatccgccccaaccctgtttcccctggtgagctgc480

gaaaactctcccagtgacacatcaagcgtggctgtcggctgtctggcacaggacttcctg540

cctgattcaatcacttttagctggaagtacaaaaacaattcagacatcagcagcaccaga600

ggctttccatctgtgctgagaggcgggaaatatgccgctacaagccaggtcctgctgccc660

tccaaggacgtgatgcagggaactgatgagcacgtggtctgcaaagtgcagcatcccaac720

ggcaataaggagaagaacgtcccactgcccgtgatcgctgagctgccacctaaggtgtcc780

gtcttcgtgccaccccgagacggattctttggcaatccccggaagtctaaactgatctgt840

caggccaccgggttttcacctagacagattcaggtgagctggctgagggaaggaaagcag900

gtcggctctggggtgaccacagatcaggtccaggctgaagcaaaggagagcgggccaact960

acctacaaagtgacctccacactgactatcaaggagtctgactggctgtcacagagcatg1020

ttcacatgcagggtggatcaccgcggcctgacttttcagcagaatgcaagttcaatgtgt1080

gtccccgaccaggataccgccatcagggtgttcgctattcctccatctttcgccagtatt1140

tttctgaccaagtccacaaaactgacttgcctggtcacagacctgacaacttatgattcc1200

gtgactatctcttggacccgccagaacggcgaagccgtgaagacccacacaaacatttcc1260

gagtctcatcccaatgcaaccttctctgccgtgggcgaagctagtatctgcgaggacgat1320

tggaatagcggggagcggttcacctgtaccgtgacacacactgacctgcctagtccactg1380

aagcagaccatttcacgccctaaaggcgtcgccctgcatcgaccagatgtgtacctgctg1440

ccacctgcccgcgaacagctgaacctgcgagagagtgctaccatcacatgtctggtgacc1500

ggcttctcccccgctgatgtctttgtgcagtggatgcagcgaggacagccactgagccct1560

gaaaagtacgtgacatccgcacccatgcctgagccacaggcacctggcagatattttgcc1620

cacagtattctgactgtgtcagaggaagagtggaacaccggggagacttatacctgcgtg1680

gtcgcccatgaagctctgccaaatcgagtcaccgagcggacagtggacaagagcacaggg1740

aaacccactctgtataacgtcagtctggtcatgtcagatactgccggaacctgttattga1800

<210>90

<211>714

<212>dna

<213>人工序列

<220>

<223>人类igm9f11轻链cdna

<400>90

atggatatgcgagtgcccgctcagctgctgggactgctgctgctgtggttccccggatca60

agatgcgacattcagatgactcagagcccaagctccgtgtctgcaagtgtcggcgaccga120

gtgaccatcacatgcagagcctcccaggggatttctagttggctggcttggtatcagcag180

aagccagggaaagctcccaagctgctgatctatgatgcatcaagcctgcagagtggagtg240

ccctcacgattctcaggcagcgggtccggaaccgactttactctgaccatttcctctctg300

cagcctgaggatttcgcaacatactattgccagcaggccaacagcttcccactgaccttt360

ggcgggggaacaaaagtggagatcaagaggactgtcgccgctccctctgtgttcattttt420

ccccctagtgacgaacagctgaaaagcggcacagcttccgtggtctgtctgctgaacaat480

ttttaccctcgcgaagcaaaagtccagtggaaggtggataacgccctgcagtctgggaat540

agtcaggagtcagtgactgaacaggacagcaaagattccacctattctctgagttcaaca600

ctgactctgtccaaggctgactacgagaagcacaaactgtatgcatgcgaagtcacacat660

cagggactgagctcccctgtgactaagtctttcaatagaggcgagtgttgataa714

<210>91

<211>1410

<212>dna

<213>人工序列

<220>

<223>人类igghc1重链cdna

<400>91

atggattggacttggagattcctcttcgtcgtagcagcagctacaggtgtccagtccgag60

gtgcagctggtggaatcaggggggggactggtgcagcctggagggtcactgcgactgtct120

tgtgccgcttctgggttcacttttaccgactacacaatggattgggtgcgcaaggcacct180

ggcaagggactggagtgggtcgctgatgtgaacccaaatagcggcgggtccatctacaac240

caggagttcaagggccggttcaccctgtccgtggaccgatctaaaaacaccctgtatctg300

cagatgaatagcctgcgagctgaagatactgcagtgtactattgcgcccggaatctgggc360

cccagcttctactttgactattggggacagggcactctggtcaccgtgagctccgctagt420

acaaagggcccttcagtgttcccactggcaccctctagtaaatccacatctggaggcact480

gccgctctggggtgtctggtgaaggactacttcccagagcccgtcaccgtgtcttggaac540

agtggggcactgactagcggagtcgcaaccggacctgccgtgctgcagtcaagcggactg600

tactccctgtcctctgtggtcaccgtcccaagttcaagcctgggcactcagacctatatc660

tgcaacgtgaatcacaagccaagtaatacaaaagtggacaagaaagtggagcccaagtct720

tgtgataaaacacatacttgccccccttgtcctgcaccagaactgctggggggaccctcc780

gtgttcctgtttccacccaagcctaaagataccctgatgattagcaggaccccagaggtc840

acatgcgtggtcgtggacgtgagccacgaggaccccgaagtcaagtttaactggtacgtg900

gacggcgtcgaagtgcataatgctaagacaaaacccagggaggaacagtacaacagcacc960

tatcgcgtcgtgtccgtcctgacagtgctgcatcaggattggctgaacggaaaagagtat1020

aagtgcaaagtgtccaataaggcactgcccgcccctatcgagaaaacaatttctaaggcc1080

aaaggccagcctagagaaccacaggtgtataccctgcctccatccagggatgaactgaca1140

aagaaccaggtctctctgacttgtctggtgaaaggcttctatccctcagatattgctgtg1200

gagtgggaaagcaatgggcagcctgagaacaattacaagaccacaccccctgtgctggac1260

tcagatgggagcttctttctgtattctaagctgaccgtggacaaaagtcggtggcagcag1320

ggaaatgtctttagttgttcagtgatgcacgaagcactgcacaaccattacactcagaaa1380

tcactgtcactgtcccctggcaagtgataa1410

<210>92

<211>702

<212>dna

<213>人工序列

<220>

<223>人类igglc1轻链cdna

<400>92

atggcttgggctctgctgctgctgacactgctgacccaggatacaggatcttgggctcgc60

attcagatgacccagtcccctagttctctgtccgcctctgtgggcgacagggtcaccatc120

acatgcaaggctagccaggacgtgagcattggagtcgcatggtatcaggataagccaggc180

aaagcacccaagctgctgatctatagtgcctcataccggtataccggggtgcccagcaga240

ttcagcggatccgggtctggaacagactttactctgaccattagctccctgcagccagag300

gatttcgccacatactattgccagcagtactatatctacccctatacatttggccagggg360

actaaagtggaaattaagggccagcctaaagccgctccatccgtcactctgttcccccct420

tctagtgaggaactgcaggctaacaaggccaccctggtgtgctacatctctgacttttat480

cctggggcagtgaccgtcgcatggaaggctgattcaagccccgtgaaagctggagtcgag540

accacaactcctagcaagcagtccaacaacaagtacgcagcctggtcttatctgagtctg600

acaccagaacagtggaaaagccaccggagttactcatgtcaggtcactcacgaaggcagc660

actgtggaaaaaactgtggctcctaccgaatgttcttgataa702

<210>93

<211>1416

<212>dna

<213>人工序列

<220>

<223>人类igghc2重链cdna

<400>93

atggattggacatggcgctttctgttcgtcgtcgcagccgcaaccggagtgcagtctcag60

gtgcagctggtgcagtcaggagccgaggtgaagaaacctggcgcctccgtcaaagtgtct120

tgcaaggctagtgggtacactttcacctctcactggatgcattgggtgagatatgcccct180

gggcagggactggagtggatcggagaattcaacccaagcaatggaaggactaactacaac240

gagaagtttaaatctaaggctacaatgactgtggataccagtacaaacactgcatatatg300

gagctgagctccctgaggtcagaggacaccgccgtgtactattgcgcaagccgggactac360

gattatgacggaagatacttcgattattggggccaggggacactggtcaccgtgagcagc420

gccagcaccaaaggccctagcgtgtttccactggctccctcaagcaagagtacctcagga480

gggacagccgctctgggatgtctggtgaaggactacttcccagagcccgtcaccgtgtct540

tggaacagtggagcactgacaagcggcgtccacacttttcctgccgtgctgcagtcctct600

gggctgtactccctgagttcagtggtcaccgtcccaagctcctctctgggaacccagaca660

tatatctgcaacgtgaatcacaaaccaagtaatacaaaggtggacaagaaggtggaaccc720

aaaagctgtgacaagactcatacctgcccaccttgtcctgcaccagagctgctgggagga780

ccaagcgtgttcctgtttccacccaaacctaaggataccctgatgattagccgcactcca840

gaagtcacctgcgtggtcgtggacgtgagccacgaggaccccgaagtcaagtttaactgg900

tacgtggacggcgtcgaggtgcataatgccaaaacaaagcccagggaggaacagtacaac960

tccacttatcgcgtcgtgtctgtcctgaccgtgctgcaccaggattggctgaacggcaag1020

gaatataaatgcaaggtgtctaacaaggccctgcccgcccctatcgagaagacaattagc1080

aaagcaaagggccagcccagagagccacaggtgtataccctgcctcccagccgggacgag1140

ctgaccaaaaaccaggtctctctgacatgtctggtgaagggattctatcccagcgacatt1200

gctgtggagtgggaatccaatggccagcctgagaacaattacaagaccacaccccctgtg1260

ctggattcagacggcagcttctttctgtatagtaaactgaccgtggacaagtcacgatgg1320

cagcaggggaatgtctttagctgttccgtgatgcatgaagcactgcataatcactacacc1380

cagaaatcactgtcactgagcccaggaaaataatga1416

<210>94

<211>696

<212>dna

<213>人工序列

<220>

<223>人类igglc2轻链cdna

<400>94

atggcttgggctctgctgctgctgaccctgctgacccaggacaccgggagttgggctgac60

atccagatgacccagtccccttcttccctgagtgcatcagtgggcgaccgggtcaccatc120

acatgcagcgccagctcctctgtgacatacatgtattggtatcagagaaagccaggaaaa180

gctcccaagctgctgatctacgatacttctaacctggcaagtggcgtgccaagcaggttc240

agcggatccggatctggaactgactacacttttaccatcagttcactgcagcccgaggat300

attgccacctactattgccagcagtggagctcccacatcttcacatttggccaggggact360

aaagtggaaattaaggggcagcctaaagccgctccaagcgtcacactgttccccccttct420

agtgaggaactgcaggctaataaggccaccctggtgtgcctgatctccgacttttatcct480

ggggccgtgacagtcgcctggaaggctgattcaagccccgtgaaagctggagtcgagacc540

acaactcctagcaagcagtccaacaacaagtatgcagcctcctcttacctgtccctgacc600

cccgaacagtggaaatctcatcggagttactcatgtcaggtcactcacgaagggagcact660

gtggaaaaaaccgtcgcaccaaccgaatgttcataa696

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1