白蛋白启动子驱动的白蛋白表达载体的制作方法

文档序号:17188838发布日期:2019-03-22 21:45阅读:316来源:国知局
本发明属于基因工程
技术领域
:,公开了白蛋白启动子驱动的表达载体,具体的,公开了用于人细胞中高效表达重组人血清白蛋白的人血清白蛋白启动子驱动的表达载体,更具体地,公开了人血清白蛋白启动子驱动外源人血清白蛋白基因和筛选标记同时表达的双顺反子载体及其在人细胞中高效表达重组人血清白蛋白的应用。技术背景人血清白蛋白(humanserumalbumin,hsa)是人体血液中的主要的、含量最丰富的可溶性蛋白,其含量大约占血清总蛋白的一半[1]。人血清白蛋白主要的生理功能包括:1,增加血容量和维持血浆胶体渗透压;调节组织与血管之间水分的动态平衡;2,运输及解毒功能:白蛋白能结合阴离子也能结合阳离子,可以输送不同的物质,包括脂肪酸、胆固醇、甲状腺激素等,也可以将有毒物质输送到解毒器官;3,营养供给:组织蛋白和血浆蛋白可互相转化,在氮代谢障碍时,白蛋白可作为氮源为组织提供营养。人血清白蛋白在医学临床中的使用已经有70多年了。主要可以用于:1,失血创伤、烧伤引起的休克;2,脑水肿及损伤引起的颅压升高;3,肝硬化及肾病引起的水肿或腹水;4,低蛋白血症的防治;5,新生儿高胆红素血症;6,用于心肺分流术、烧伤的辅助治疗、血液透析的辅助治疗和成人呼吸窘迫综合征等。药用hsa来源于人血血液提取[2]。但是在我国,由于采浆量的限制,导致hsa供不应求,价格将持续攀升。采用血源制备hsa还存在着血源可能存在潜在的疾病或病毒污染、批次间差异大等问题。因此通过基因工程的方法生产hsa的策略成为产业内的关注焦点和趋势。通过dna重组技术,从酵母和水稻中生产hsa已经取得了巨大的成功[3],部分产品已经获得政府药监部门的临床实验批准[4]。但是上述重组hsa用于替代血源白蛋白用作临床药物仍面临巨大挑战。由于人血清白蛋白系人体内的重要功能分子,理论上,从人细胞产生的重组人血清白蛋白将是最好的、最可能成功取代血源白蛋白用于临床的。但是目前尚无用于人细胞中表达的高效表达载体。人血清白蛋白主要由肝脏产生,肾脏也有一些表达[1,2]。人血白蛋白基因在发育的过程中呈现出逐渐升高,成年后在肝脏中呈现非常稳定地表达的特点。在特定生理和病理的条件下,白蛋白表达能够对细胞所处的营养、压力等环境变化产生一定的响应而发生改变。在白蛋白基因上游的调控区域存在启动子和多个正向和负向顺式调控元件,这些元件和细胞内多种不同的信号传导分子等反式作用因子相互作用,从而调节白蛋白的表达[5,6]。在小鼠中,白蛋白基因上游包括启动子、增强子、远端增强子等顺式元件已经被详细的鉴定出。这些元件包括接近第一个内含子的启动子和增强子元件,在转录起始位点上游1.7kb处有一个增强子,在上游6-7kb的地方还有一个远端增强子。在基因上游到更远端,则存在一些负向调控的元件[7,8]。由白蛋白基因启动子及其临近的含有tata盒、肝核因子(hepaticnuclearfactor1,hnf1)和核因子y(nuclearfactory,nf-y)结合位点,组成了启动白蛋白基因表达的核心区域,这一区域主要以激活白蛋基因的表达为主[7]。由于白蛋白基因在肝细胞中稳定、持久和高水平的表达。因此该包含白蛋白启动子的区域可能是外源基因在人细胞中稳定高效持久表达时的理想启动子[7,9]。本发明中,申请人构建了白蛋白启动子驱动的表达载体用于在哺乳动物细胞,特别是人细胞中高水平表达人血清白蛋白。技术实现要素:本发明的一个目的是提供一种白蛋白启动子驱动的表达载体,利用该载体表达人血清白蛋白。本发明的又一个目的是提供一种表达细胞,该细胞能表达人血清白蛋白。本发明的又一个目的是提供一种生产人血清白蛋白的方法。本发明的再一个目的是提供人血清白蛋白启动子的应用。为了实现上述目的,本发明采用的技术方案如下:在一个方面,本发明提供了一种白蛋白启动子驱动的表达载体,其特征在于:所述表达载体包含表达框,所述表达框依次包括白蛋白启动子及其第一个内含子、白蛋白基因、内核糖体进入位点序列ires、第二基因。如本文中所使用的,以下术语及短语应具有下文所述的含义。除非另有定义,否则本文中所使用的所有技术及科学术语均具有与本领域技术人员通常所了解相同的含义。除非本文另外明确指示,否则单数形式“一”(种/个)及“该”或“所述包括复数个指示物。术语“包含”以包涵性开放意义使用,此意谓可包括其它要素、元件。本发明中,“表达框”意指启动子元件与有效连接的其他转录和翻译调节控制元件的组合。可以将异源基因序列插入到表达框中以用于表达所述基因序列的目的。表达框能够指导转录,该转录导致产生关于所需基因产物的mrna。将表达框插入到载体中以产生表达载体,这样的表达载体指导异源蛋白质在宿主细胞中的表达。“启动子”由两个基本部分(核心启动子和近端启动子)组成。启动子位于给定基因编码序列的上游。核心启动子被定义为能够指导给定基因的精确转录起始的最小核苷酸序列。真核生物中的核心启动子负责指导通过rna聚合酶ii复合物的起始。一般将核心启动子描绘为跨越转录起始位点(inr)的序列,更具体而言inr上游和下游5至45个核苷酸的序列(总长度70-90个核苷酸)。在本发明中,采用的是“白蛋白启动子”,优选地是人血清白蛋白启动子。人血清白蛋白主要由肝脏产生,肾脏也有一些表达[1,2]。人血白蛋白基因在发育的过程中呈现出逐渐升高,成年后在肝脏中呈现非常稳定地表达的特点。在特定生理和病理的条件下,白蛋白表达能够对细胞所处的营养、压力等环境变化产生一定的响应而发生改变。在白蛋白基因上游的调控区域存在启动子和多个正向和负向顺式调控元件,这些元件和细胞内多种不同的信号传导分子等反式作用因子相互作用,从而调节白蛋白的表达[5,6]。在小鼠中,白蛋白基因上游包括启动子、增强子、远端增强子等顺式元件已经被详细的鉴定出。这些元件包括接近第一个内含子的启动子和增强子元件,在转录起始位点上游1.7kb处有一个增强子,在上游6-7kb的地方还有一个远端增强子。在基因上游到更远端,则存在一些负向调控的元件[7,8]。由白蛋白基因启动子及其临近的含有tata盒、肝核因子(hepaticnuclearfactor1,hnf1)和核因子y(nuclearfactory,nf-y)结合位点,组成了启动白蛋白基因表达的核心区域,这一区域主要以激活白蛋基因的表达为主[7]。由于白蛋白基因在肝细胞中稳定、持久和高水平的表达。因此该包含白蛋白启动子的区域可能是外源基因在人细胞中稳定高效持久表达时的理想启动子[7,9]。此外,除人血清白蛋白启动子之外的其他血清白蛋白启动子也可以用于本发明的构思,并没有超出本发明的保护范围。在本发明中,人血清白蛋白启动子及其第一个内含子具有如seqidno.1所示的核苷酸序列,及其变体。该变体与seqidno:1具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由碱基的取代、缺失或添加所致。“白蛋白”是哺乳动物血浆中天然存在的蛋白质,其中它是丰度最高的蛋白质。它在维持血液的所需渗透压,以及另外在血流中各种物质的运输中具有重要的作用。来自许多物种的白蛋白已经得以表征,它们享有高度的序列和结构同源性。“血清白蛋白”,即serumalbumin,合成于肝脏,是脊椎动物血浆中含量最丰富的蛋白质。不同来源的血清白蛋白的氨基酸序列及其空间结构非常保守,它具有结合和运输内源性与外源性物质的性质,维持血液胶体渗透压,清除自由基,抑制血小板聚集和抗凝血等生理功能。在本发明中,白蛋白可以选自人白蛋白、非人灵长类白蛋白(诸如黑猩猩的白蛋白、大猩猩的白蛋白或猕猴的白蛋白、啮齿类的白蛋白(诸如仓鼠白蛋白、豚鼠的白蛋白、小鼠的白蛋白和大鼠的白蛋白)、牛科的白蛋白(例如奶牛白蛋白)、马科的白蛋白诸如马的白蛋白或驴的白蛋白、犬科的白蛋白、猫科的白蛋白、兔的白蛋白、山羊的白蛋白、绵羊的白蛋白、鸡的白蛋白和猪的白蛋白。特别优选成熟形式的白蛋白,且本领域技术人员能够使用公开可得的信息诸如蛋白质数据库和/或通过使用信号肽识别软件诸如signalp来鉴定成熟形式。优选signalp4.0版。优选地,本发明的白蛋白是人血清白蛋白。然而应该理解,本发明并不限于人血清白蛋白,来自其他动物的白蛋白也适用于本发明,在本发明覆盖的保护范围之内。人血清白蛋白是由585个氨基酸组成的单链蛋白质,分子量为67kda。成熟的人血清白蛋白是一个心形分子,由3个结构相似的α-螺旋结构域组成,在血浆中其浓度约为42g/l,约占血浆总蛋白的60%。在体液中人血清白蛋白可以运输脂肪酸、胆色素、氨基酸、类固醇激素、金属离子和许多治疗分子等:同时维持血液正常的渗透压。在临床上人血清白蛋白可用于治疗休克与烧伤,用于补充因手术、意外事故或大出血所致的血液丢失,也可以作为血浆增容剂。优选地,本发明的人血清白蛋白基因具有seqidno.2所示的核苷酸序列或其变体序列,本发明的人血清白蛋白具有seqidno.6所示的氨基酸序列或其变体序列。术语“变体”是指在亲本白蛋白基因或白蛋白的在一个或多个(数个)位置处包含改变(即取代、插入、和/或缺失)的基因或多肽。取代是指用不同的碱基或氨基酸来取代原来占据位置的碱基或氨基酸;缺失是指去除原来占据位置的碱基或氨基酸;而插入是指增加新的碱基或氨基酸。在本发明中,优选地,变体人血清白蛋白基因与seqidno:2具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由碱基的取代、缺失或添加所致。在本发明中,优选地,变体人血清白蛋白与seqidno:6具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的氨基酸序列。所述的差异由氨基酸的取代、缺失或添加所致。在本发明的一个实施方式中,本发明表达载体包含一个白蛋白基因和一个标记基因,构成双顺反子。本发明不限于双顺反子,在本发明的一个实施方式中,本发明表达载体包含一个以上白蛋白基因和/或标记基因,构成三顺或多顺反子。“内部核糖体进入位点(internalribosomeentrysite,缩写ires)”是最早在1988年从脊髓灰质炎病毒(poliovirus,pv)和脑心肌炎病毒(encephalomyocarditisvirus,emcv)的rna基因组中发现的一段核酸序列,一般来讲,ires通常位于rna病毒基因组的5’非翻译区(utr)。ires能够允许mrna翻译机器从mrna中间的ires位置起始翻译,这样病毒蛋白的翻译就可以不依赖于5’帽子结构。在ires序列从病毒rna中发现之后,从细胞mrna中也发现存在ires,而且发现这些ires主要存在于参与细胞应对压力和其它生存过程的基因的mrna中[10]。ires序列的存在能够使蛋白质翻译起始不依赖于信使rna(mrna)5’端的帽结构,使得直接从mrna中间起始翻译成为可能。因而ires序列提供了一种从一条mrna同时独立表达而非融合表达几个基因的产物的策略。依据这个特点可以设计含有几个基因,基因间含有ires的多顺反子表达载体,如双顺反子载体(bicistronicmrna)中第一个基因依赖于5‘帽子结构,第二个基因则依赖于ires起始翻译,从而从一个mrna合成二个蛋白[10,11]。通常ires前后的两个蛋白的表达是成比例的,因此可以根据其中一个报告基因的表达情况来反映另外一个基因的表达情况[12]。也可以据此设计含有三个基因和二个ires序列串联的多顺反子载体,第一个基因由信使rna5’端的帽结构起始翻译,后二个基因则由ires起始翻译。这个方法在许多情形下非常重要。基于ires的病毒和非病毒载体已经成功地用于临床前和临床的多基因联合治疗,也是基础研究中基因操作常用的有力工具[13,14]。常用的方式为目的基因依赖于5’帽子结构起始翻译,而筛选标记依赖于ires起始翻译。基于ires的载体的表达策略明显优于二个基因分别采用不同的启动子进行表达的策略。在二个启动子分别驱动目的基因和筛选基因表达时,由于存在不同启动子间的竞争,有可能导致二者之一被选择性的表达,或者一个基因表达量高,而另一个则不被表达或表达量低。ires载体则能够实现目的基因和筛选标记基因以相对稳定的强度进行表达。治疗性重组蛋白质药物(比如重组单克隆抗体或酶类)的大规模生产通常都是在中国仓鼠卵巢细胞(chinesehamsterovary,cho)中实现的。通过向cho细胞基因组中导入包含目的基因和筛选标记基因的表达框,并从细胞群中筛选出稳定插入了含有目的基因和筛选标记基因的表达框的细胞,从而建立稳定表达目的蛋白的细胞株[15,16]。从大量不含目的基因表达框的细胞群体中获得稳定和高水平表达目的蛋白的细胞株,依赖于筛选标记基因的选择和有效的筛选方法。在工业上基于二氢叶酸还原酶的-mtx筛选(dihydrofolatereductase(dhfr)-basedmethotrexate(mtx)selection)或者基于谷氨酰胺合成酶(glutaminesynthetase)-msx筛选[17](gs-basedmethioninesulfoximine(msx)selection)是二种目前使用的主要筛选系统。二种方法各有利弊,相对来说gs-msx筛选系统更加先进一些。dhfr筛选系统因为其能够通过基因扩增从而得到高表达水平而使用广泛。但是其缺陷是需要经过不同浓度的多轮mtx筛选,因而耗时很长[18]。gs筛选系统只需一轮msx筛选,因此节约时间。依赖gs的系统除了在gs-knockout的cho中可以不需msx进行筛选之外,也可以在未经gs敲除的细胞中利用msx进行筛选[19]。另外,由于gs能够将细胞代谢氨基酸时产生的氨重新转化为谷氨酰胺,从而消除氨在培养液中的积累并消除由氨积累带来的ph改变和毒性,因此给细胞生长带了正面的影响[20]。因而,谷氨酰胺合成酶筛选系统是一个更具优势的筛选系统[21-23]。在本发明中,ires序列具有如seqidno.3所示的核苷酸序列,及其变体。该变体与seqidno:3具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由氨基酸的取代、缺失或添加所致。在一个实施方式中,本发明的表达载体包含一个ires。在另一个实施方式中,本发明包含两个或两个以上的ires,由此构成三顺或多顺反子。“标记基因”,原本是基因工程的专属名词,但是现在它已经成为一种基本的实验工具,广泛应用于分子生物学、细胞生物学、发育生物学等方面的研究。标记基因是一种已知功能或已知序列的基因,能够起着特异性标记的作用,基于其活性能够判断标记基因的表达与否。在基因工程意义上来说,它是重组dna载体的重要标记,通常用来检验转化成功与否;在基因定位意义上来说,它是对目的基因进行标志的工具,通常用来检测目的基因在细胞中的定位。活性的检测,可以是直接检测标识蛋白质的活性其自身,也可以通过介由色素这类因标识蛋白质的活性发生的代谢物来间接进行检测。检测可以是化学检测(包括酶反应的检测)、物理检测(包括行为分析的检测)或检测者的感官检测(包括利用视觉、触觉、嗅觉、听觉、味觉的检测)的任意一种。在本发明中,标记基因或标识蛋白质的种类只要是利用该领域公知的方法能够检测其活性就没有特别限制。优选为检测时保有转化体判断标记物的宿主,即对于转化体的侵袭性低的标识蛋白质。例如,可以是药物抗性蛋白、荧光蛋白质、色素合成蛋白质、发光蛋白质、外部分泌蛋白质、控制外部形态的蛋白质等。通过药物抗性基因以及荧光标记基因是常用的和有效的筛选方法。在发明的一些实施方式,标记基因是药物抗性基因,优选地,药物标记基因选自人谷氨酰胺合成酶基因、卡那霉素抗性基因(nptii)、四环素抗性基因(tetr)、新霉素磷酸转移酶基因(npt)、嘌呤霉素抗性基,优选地,为人谷氨酰胺合成酶基因。在本发明中,人谷氨酰胺合成酶基因具有如seqidno.4所示的核苷酸序列及其变体。该变体与seqidno:4具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由碱基的取代、缺失或添加所致。在本发明中,人谷氨酰胺合成酶具有如seqidno.7所示的氨基酸序列及其变体。该变体与seqidno:7具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由氨基酸的取代、缺失或添加所致。应该理解,本发明并不限于人谷氨酰胺合成酶基因,本领域技术人员能够根据需要选择其他合适的药物抗性基因,并在本发明的保护范围之内。在本发明的一些实施方式中,标记基因是荧光标记基因,优选地,是绿色荧光蛋白或红色荧光蛋白。绿色荧光蛋白或红色荧光蛋白是重要而广泛的用于监测遗传转化的可视筛选标记[24,25]。绿色荧光蛋白(greenfluorescentprotein,gfp)是从维多利亚多管发光水母(aequoreavictoria)中获得的具有发射绿色荧光的蛋白,其基因可以在其它物种中进行异源表达。通过不断的突变和筛选,逐渐得到在激发光波长、发射光波长、荧光强度等多方面更加适合应用的荧光蛋白种类。研究结果显示gfp对于细胞没有毒性,不需要底物或辅助因子。由于gfp可以直接观察而无需外源底物,使得遗传转化的观察简单和实时。利用gfp的优点可以实现对目的蛋白在组织和细胞中的定位,或者通过绿色荧光蛋白对细胞实施分析和分选,而经典的药物筛选不仅需要使用药物,花费较长时间(数周甚至几个月)来淘汰阴性群体而获得高产细胞。另外药物处理也会给目的高产细胞带来较大的损伤。使用gfp作为筛选标记或报告系统只需要通过观察和物理分离或者流式细胞仪进行筛选,从而能够从大量的阴性细胞群体中快速高效的获得阳性细胞[24-26],基本不会对细胞产生损伤。在本发明中,绿色荧光蛋白基因具有如seqidno.5所示的核苷酸序列及其变体。该变体与seqidno:5具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由碱基的取代、缺失或添加所致。在本发明中,绿色荧光蛋白具有如seqidno.8所示的氨基酸序列及其变体。该变体与seqidno:8具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的核苷酸序列。所述的差异由氨基酸的取代、缺失或添加所致。应该理解,本发明并不限于绿色荧光蛋白基因,本领域技术人员能够根据需要选择其他合适的荧光基因,并在本发明的保护范围之内。在一些实施方式中,本发明的表达载体还包含其他调节控制元件。驱动目标蛋白质产物表达的元件称为“调节控制元件”,调节控制元件包括转录激活子和增强子、转录起始和终止元件、翻译起始和终止元件、以及分泌信号前导序列等等。对于这些元件中的每一种事必须首先独立地进行任何优化。一旦独个元件进行了优化,它们就必须进行装配和测试,以确保给定元件的装配是相容的并且能够指导所需重组蛋白质产物的有效表达。白蛋白基因上游包括启动子、增强子、远端增强子等顺式元件已经被详细的鉴定出。这些元件包括接近第一个内含子的启动子和增强子元件,在转录起始位点上游1.7kb处有一个增强子,在上游6-7kb的地方还有一个远端增强子。在基因上游到更远端,则存在一些负向调控的元件[7,8]。由白蛋白基因启动子及其临近的含有tata盒、肝核因子(hepaticnuclearfactor1,hnf1)和核因子y(nuclearfactory,nf-y)结合位点,组成了启动白蛋白基因表达的核心区域,这一区域主要以激活白蛋基因的表达为主[7]。在一些实施方式中,表达载体还可以包含如上所述的一种或多种元件。在元件的各种组合的装配中,还重要的是这些元件是“有效连接的(operablylinked)”。“有效连接的”是指各种元件之间以这样的方式的功能性连接,所述方式保留了各个元件的功能以及组合的元件的功能,因为许多转录和翻译功能是从一个元件到下一个元件进行处理的结果。因此,“有效连接的”意指,各种元件的核酸序列是相连接和邻接的,并且在需要时邻接地进行连接以保持合适的编码蛋白质的读码框。“载体(vector)”指在基因工程重组dna技术中将dna片段(目的基因)转移至受体细胞的一种能自我复制和/或表达的dna分子。载体的必备条件:①在宿主细胞中能保存下来并能大量复制,且对受体细胞无害,不影响受体细胞正常的生命活动。②有多个限制酶(restrictionenzymes)切点,而且每种酶的切点最好只有一个,如大肠杆菌pbr322就有多种限制酶的单一识别位点,可适于多种限制酶切割的dna插入。③含有复制起始位点,能够独立复制;通过复制进行基因扩增,否则可能会使重组dna丢失。④有一定的标记基因,便于进行筛选。如大肠杆菌的pbr322质粒携带氨苄青霉素抗性基因和四环素抗性基因,就可以作为筛选的标记基因。一般来说,天然载体往往不能满足上述要求,因此需要根据不同的目的和需要,对运载体进行人工改建。现在所使用的质粒载体几乎都是经过改建的。⑤载体dna分子大小应合适,以便操作。载体的类型有质粒载体、噬菌体载体、柯斯质粒载体、m13噬菌体载体、噬菌粒载体、病毒载体等。本发明的载体包括但限于上述载体,优选地的,本发明的载体是病毒载体。质粒和噬菌体载体只能在细菌中繁殖,不能满足真核dna重组需要。感染动物的病毒可改造用作动物细胞的载体。由于动物细胞的培养和操作较复杂、花费也较多,因而病毒载体构建时一般都把细菌质粒复制起始序列放置其中。使载体及其携带的外来序列能方便地在细菌中繁殖和克隆,然后再引入真核细胞。在本发明中,病毒载体可选自例如逆转录病毒、慢病毒与腺病毒。优选地,载体是逆转录病毒或慢病毒载体。慢病毒载体(lentiviralvectors,lvs)是一类依赖逆转录病毒的感染和复制特性而发展起来的基因转移传递系统[27]。慢病毒载体是在慢病毒基因组(如hiv病毒,humanimmunodeficiencyvirus,hiv)中“挖除”关键病毒基因(如病毒毒粒蛋白和逆转录酶编码基因)而代之以目的基因。在病毒产生环节,通过向病毒包装细胞中反式提供hiv病毒毒粒蛋白和逆转录酶的编码基因,以实现病毒颗粒组装。这种以反式提供的病毒毒粒蛋白实现的病毒颗粒组装只能够实现一次病毒包装。形成的病毒颗粒为假病毒,因其基因组遗传物质组成中缺少关键病毒毒粒蛋白基因和逆转录酶基因。形成的病毒颗粒在感染新的宿主以后可以实现其包含目的基因的基因组核酸片段整合进宿主基因组。因为缺少病毒结构蛋白、毒粒蛋白和逆转录酶,因此并不能进行第二次基因组的复制和病毒颗粒的组装。相比较其它的基因传递系统,慢病毒载体具有比较明显的优势,包括慢病毒载体能够不可逆的整合到宿主细胞的基因组dna中,随着基因组复制而复制,从而能够实现目的基因表达始终维持在一定水平,经多代细胞分裂后子代细胞中仍然含有目的基因;慢病毒滴度高,感染效率高;通过多方面的改造,慢病毒载体的载体容量能够包装大的基因片段;载体系统由于去除了较多的病毒基因及其产物,免疫原性比较低,安全性高。另外,在病毒包装体系中,慢病毒载体能和很多不同的异源包膜糖蛋白组合形成不同假型病毒,实现对不同类型宿主细胞的感染,以及处于不同状态的细胞,如增殖细胞和静息细胞[27,28]。慢病毒载体除了以病毒包装的形式传递基因之外,也可以通过电转等高效转染方式,以较低的几率将目的基因插入目的细胞的基因组中。尽管本发明的实施例中提供了慢病毒载体,应该理解,本领域技术人员根据情况能够选择合适的病毒载体,实现本发明的目的,其在本发明的保护范围之内。在本发明的第二个方面,本发明提供了一种表达细胞,所述表达细胞包含前面所述的表达载体。在本发明中,表达细胞是哺乳动物表达细胞。如本文所用到的,术语“哺乳动物”包括任何人类或非人类哺乳动物,非人类哺乳动物包括但不限于猪科、绵羊、牛科、啮齿目、有蹄类、猪、羊、羔羊、山羊、牛、鹿、骡子、马、灵长类(例如猴子)、狗、猫、大鼠和小鼠。术语“细胞”包括任何细胞,例如但不限于,本文所述的任何人类或非人类哺乳动物细胞。细胞可以是常规细胞或非常规细胞(例如转化的细胞、确立细胞、或得自病变组织样本的细胞)。细胞可以是体细胞,比如成纤维细胞或角化细胞。优选的细胞为干细胞,例如但不限于胚胎干细胞、胎儿干细胞、成体干细胞和多能干细胞诸如诱导的多能干细胞。特别优选的细胞为人胚胎干细胞、人胎儿干细胞、人成体干细胞和人多能干细胞诸如诱导的人多能干细胞。在本发明的实施方式中,细胞为人细胞,优选地,是人肾细胞或肝细胞。然而,本领域技术人员应该理解,本发明并不限于人肾细胞或肝细胞。在本发明的第三个方面,本发明提供了一种生产人血清白蛋白的方法,该方法包括在允许人血清白蛋白表达的条件下,培养表达细胞以表达人血清白蛋白,及回收所述人血清白蛋白。所述的条件是本领域技术人员所熟知的,其中所用的材料、试剂、仪器、设备,以及用量、时间、温度、压力等各种生产参数都是本领域技术人员熟知并能根据实际情况进行调整,以获得最佳的生产条件。在本发明的第四个方面,本发明提供了人血清白蛋白,所述人血清白蛋白由前面所述的表达载体或前面所述的表达细胞表达得到,或由前面所述的方法制备而得。在本发明的再一个方面,本发明提供了白蛋白启动子在表达白蛋白中的应用,该应用包括构建包含白蛋白启动子的表达载体。优选地,所述白蛋白启动子是人血清白蛋白启动子,所述白蛋白是人血清白蛋白。本发明具有显著的进步:(1)本发明的载体填补了技术空白药用hsa的一个来源是从人血液提取,但是由于采浆量的限制导致hsa供不应求,价格将持续攀升,采用血源制备hsa还存在着血源可能存在潜在的疾病或病毒污染、批次间差异大等问题。从酵母、芽孢杆菌和水稻中生产hsa用于替代血源白蛋白用于临床药物也仍面临巨大挑战。因此,理论上从人细胞产生的重组人血清白蛋白将是最好的、最可能成功取代血源白蛋白用于临床的。但是目前尚无用于人细胞中表达的高效表达载体。本发明正是克服了种种困难与障碍,首次构建了以人血白蛋基因的启动子驱动外源基因表达的载体并成功实现了利用该载体在人细胞中表达外源重组人血白蛋白,填补了技术空白。该载体还克服了目的基因与筛选标记分用不同启动子的载体系统中在筛选时的高假阳性率和表达不均衡的问题,对现有技术具有里程碑式的贡献。(2)本发明的载体具有优异的效果本发明的两种载体,一种表达载体以工业上常用的人谷氨酰胺合成酶基因作为筛选标记,另外一种载体以绿色荧光蛋白作为筛选标记。以人谷氨酰胺合成酶基因作为筛选标记载体可以在谷氨酰胺合成酶缺陷或敲除的哺乳动物细胞中进行高产细胞株的筛选,或者在含有谷氨酰胺合成酶缺陷的哺乳动物细胞中利用谷氨酰胺合成酶的抑制剂msx进行筛选。以绿色荧光蛋白作为筛选标记的则可以利用绿色荧光蛋白进行快速的高产细胞株筛选。经实施例证明了这二种载体都能够在人细胞中表达目的蛋白(人血清白蛋白)和筛选标记。利用该载体在人细胞中成功高效表达重组人血清白蛋白,分泌到培养液中的白蛋白达到750mg/l,纯度超过90%。本发明能在工业上大规模生产人血清白蛋白,具有广泛的应用价值。(3)本发明克服了长期以来的技术问题或技术偏见首选,白蛋白是肝脏表达的血清白蛋白,占肝脏新合成蛋白的5-10%,它只能由分化成熟的肝脏细胞合成,其他组织细胞中的白蛋白基因处于关闭状态。这表明,白蛋白启动子是细胞特异性的,只在肝中起作用,没有通用性,所以不被人想到用于重组表达载体的启动子。此外,众所知周,人细胞由于其特殊性而难以工业化培养,即便能工业化,代价非常高昂,因此无法产业化,更无法盈利。因此,本领域技术人员不曾想到人细胞中表达重组白蛋白,更没有成功先例。本发明解决了人们一直渴望解决但始终不敢去尝试或未能获得成功的技术难题,成功构建了以人血白蛋基因的启动子驱动外源基因表达的载体并成功实现了利用该载体在人细胞中表达外源重组人血白蛋白。附图说明图1是lenti801慢病毒载体中表达框的连接顺序。图2是lenti802慢病毒载体中表达框的连接顺序。图3是lenti801在人肾细胞hek293瞬时表达筛选标记基因人谷氨酰胺合成酶的检测结果。图4是病毒感染后c3a细胞核gfp阳性细胞。图5是经流式细胞仪分选以后的gfp阳性稳定细胞株。图6是稳定细胞株表达的目的蛋白-人血白蛋白的考马斯亮蓝染色检测结果。图7是稳定细胞株基因组中存在外源人血白蛋白启动子和外源人血白蛋白基因的pcr检测策略。图8是稳定细胞株基因组中存在外源人血白蛋白启动子和外源人血白蛋白基因的检测结果。具体实施方式下面通过详细的实施例对本申请进行进一步的阐述,应该理解,下述实施例仅是为了用于说明本申请,并不对
发明内容进行限定。实施例中所用仪器、设备、试剂均可通过各种渠道获得,例如购买得到,或可以制备而得。实施例1:人血清白蛋白启动子驱动人血白蛋白和人谷氨酰胺合成酶表达的双顺反子慢病毒载体(halbpro-halb-ires-hgs)lenti801的构建全基因合成表达框的dna片段,该表达框片段从5‘端到3’端依次包含:人血清白蛋白启动子(halbpro)-人血清白蛋白基因的第一个内含子-人血清白蛋白基因(halb)-ires-人谷氨酰胺合成酶基因(hgs)。该片段通过重组连接到经xhoi和sali酶切的载体pgk-h2bmcherry(addgene#27217)中,替换载体原有的pgk启动子和插入基因。最终获得慢病毒载体lenti801,参见图1:lenti801慢病毒载体中表达框的连接顺序。实施例2:人血清白蛋白启动子驱动人血白蛋白和绿色荧光蛋白的双顺反子慢病毒载体(halbpro-halb-ires-gfp)lenti802构建全合成表达框的核酸片段,该片段从5‘端到3’端依次包含:人血清白蛋白启动子(halbpro)-人血清白蛋白基因的第一个内含子-人血清白蛋白基因(halb)-ires-绿色荧光蛋白(gfp)。该片段通过重组连接到经xhoi和sali酶切的载体pgk-h2bmcherry(addgene#27217)中,替换载体原有的pgk启动子和插入基因。最终获得慢病毒载体lenti802,参见图2:lenti802慢病毒载体中表达框的连接顺序。实施例3:lenti801和lenti802在人hek293中瞬时表达人血白蛋白的免疫印迹检测1、第1天,于12-孔细胞培养孔中种6×105个hek293或c3a细胞,细胞培养液为1mldmem(gibco)+10%fbs(gibco)。置37℃二氧化碳培养箱培养12-16小时。2、第2天,取1.5ml灭菌ep管,向其中加入2μglenti801(或lenti802)载体dna,加入50μl的opti-mem,静置5分钟。同时在另一只1.5ml灭菌ep管中,加入50μlopti-mem(gibco),向其中加入6μl脂质体转染试剂fugenhd(roche),静置5分钟。3、将步骤2中的二管混合物合并,用移液枪轻柔混匀内容物,室温静置20分钟。4、从培养箱将细胞培养板取出,将合并的dna和fugenhd脂质体溶液均匀地滴加到12-孔中的细胞中,稍加混匀,将细胞放回到培养箱继续培养。5、第3天,12-16小时后,用充分预热的1ml新鲜dmem+10%fbs替换12-孔中含有转染试剂-dna混合物的培养基,置培养箱中继续培养再继续培养36小时。6、第4天,转染后48h,去除培养孔中的原来培养基,用1ml充分预热的无血清rpmi1640洗涤细胞2次,加入1ml无血清dmem到细胞培养孔内,放回到培养箱中继续培养24小时。7、取细胞培养液1000rpm离心3min,转移培养液上清置1.5ml管中。上清于4℃冰箱保存,2周内使用,或负80℃冰箱长期保存。8、取20μl培养液上清,加2.5μl5xsds上样缓冲液,90℃加热变性3min。样品经常规sds-page电泳分离后,用常规westernblotting检测人血清白蛋白。实施例4:lenti801和lenti802在人hek293中启动标记基因表达1、参照实施例3步骤1-5完成细胞转染。用荧光显微镜观察荧光蛋白基因是否表达。2、取出细胞,吸除细胞培养液。用1ml磷酸缓冲液洗培养孔中额细胞。加入200μl1xsds上样缓冲液到细胞培养孔中裂解细胞。3、将细胞裂解液转移到1.5ml管中,12000rpm离心15min,去除沉淀。取25μl裂解液,90℃3min。样品上sds-page电泳后,用westernblotting技术检测人谷氨酰胺合成酶基因的表达。结果如图3所示,lenti801在人肾细胞hek293瞬时表达筛选标记基因人谷氨酰胺合成酶的检测结果。实施例5:转染293t细胞制备慢病毒采用的慢病毒包装系统为pax2和vsv-g,293t为包装细胞,培养基为dmem(gibco)+10%fbs(gibco)。1、第1天,于6-孔细胞培养孔中种1.3×106个293t细胞,细胞培养液为2ml。置37℃二氧化碳培养箱培养12-16小时。2、第2天,取1.5ml灭菌ep管,加入1.6μglenti802(或lenti801),1.2μgpax2,0.8μgvsv-g载体dna,加入100μl的opti-mem,静置5分钟。在另一只1.5ml灭菌ep管中,加入100μlopti-mem(gibco),向其中加入10.8μl脂质体转染试剂fugenehd(roche),静置5分钟。3、将步骤2中的二管混合物合并,用移液枪轻柔混匀内容物,室温静置20分钟。4、从培养箱将细胞培养板取出,将dna溶液和fugenhd脂质体溶液均匀地滴加到6-孔中的293t细胞的培养基中,稍加混匀,将细胞放回到细胞培养箱继续培养。5、12-16小时后,用充分预热的2ml培养基替换6-孔中含有转染试剂-dna混合物的培养基,将细胞放回培养箱中继续培养再继续培养36小时。6、第4天,转染后48h,收集含病毒的上清。将上清用0.45μm的滤器过滤到灭菌的离心管中。病毒置4℃冰箱保存,2周内使用。实施例6:慢病毒感染人肝癌细胞系hepg2/c3a建立稳定细胞株。1、第1天,用含10%fbs的rpmi1640培养细胞至对数生长期的hepg2/c3a细胞,经胰酶消化计数后,每24-孔接种5×104个细胞,每孔细胞培养液500μl,置细胞培养箱中培养12-16小时。2、第2天:从培养箱中取出细胞,向细胞培养液中加入0.5μl8mg/mlpolybrene(sigma),轻柔混匀。再向细胞中加入实施例5中收集的慢病毒200μl,混匀。放回到细胞培养箱中继续培养。3、第3天:感染后16-24小时后更换新鲜培养液,吸出含慢病毒颗粒的培养液,重新向培养孔添加500μldmem+10%fbs培养液,继续培养。4、第4天:按常规细胞传代操作扩增细胞。如图4所示,是病毒感染后c3a细胞核gfp阳性细胞。如图5所示,是经流式细胞仪分选以后的gfp阳性稳定细胞株。实施例7:稳定细胞株中人血清白蛋白的考马斯亮蓝检测1接种细胞6x105于rpm1640+10%fbs于12-孔中,隔天换液,培养至细胞长满整个培养孔底部。2去除培养基,用充分预热的1ml的pbs洗2次。然后再加入没有任何添加的1mlrpmi1640培养基,置细胞培养箱培养24小时。3取上清20μl,行sds-page进行考马斯亮蓝染色;另外取10μl进行westernblot检测。图6是稳定细胞株表达的目的蛋白人血白蛋白的考马斯亮蓝染色检测结果,证实了本发明构建的由人血清白蛋白启动子驱动的用于在人细胞中表达人血清白蛋白基因的载体成功的在人肝细胞中高效表达外源重组人血清白蛋白,同时该载体克服了人血清白蛋白与筛选标记分用不同启动子的载体系统中在筛选时的假阳性细胞克隆频率高和表达不均衡的问题。实施例8:稳定细胞株基因组中人血白蛋白基因启动子和人血白蛋白cds序列的检测在人肝细胞基因组dna中,人血白蛋白基因alb是以多个外显子被多个内含子分隔开的形式存在,只有在经基因转录后得到的mrna中才有完整的连续的alb蛋白编码序列(cds)存在。通过本专利实施例3-6获得的稳定细胞株的基因组dna的特征在于,alb基因的启动子、alb的第一个内含子以及全部alb的cds(编码序列)、ires序列和筛选标记基因是以连续的形式整合于细胞基因组中的一个或多个位置。图7为通过慢病毒感染制备的稳定细胞株的基因组中外源人血白蛋白启动子和外源人血白蛋白基因的检测策略,利用该策略,可以检测该特征核酸片段的存在。采用alb基因启动子的起始端的正向引物和白蛋白基因中间或末端的反向引物,以hepg2/c3alenti802细胞的基因组dna为模板,通过dna聚合酶链式反应(pcr),可扩增到相应大小的dna片段,并且可对pcr扩增的dna片段采用上述任意一引物进行dna常规测序,测的序列与载体lenti802中所包含的人血白蛋白启动子以及人血白蛋白基因相同(或反向互补)。具体实施操作:1,收集1×106个细胞,按常规细胞基因组提取方法提取细胞的基因组dna。2,以引物802genomalbpro1f(seqidno.9)分别和引物802genom1451-1421r(seqidno.10)及引物802genom2421r(seqidno.11)配对,对提取的基因组dna进行pcr扩增。扩增产物经常规dna琼脂糖凝胶电泳分离,将分别得到1.45kb(引物802genomalbpro1f和802genom1451-1421r)和2.42kb的片段(引物802genomalbpro1f和802genom2421r)产物。pcr扩增反应体系(表1):表1基因组dna模板(稀释成50ng/ul)1μl(50ng左右)正向引物0.75μl反向引物0.75μldntp5μl(每种200um)高保真dna聚合酶(koddna聚合酶)1μl2×kod缓冲液12.5μlh2o4μl总体积25μlpcr仪扩增的程序为:参见表2表2检测所用的引物序列如下:表3802genomalbpro1f(seqidno.9)5atagtaaaaaagacacagaagccctaaaatatg3802genom1451-1421r(seqidno.10)5tacttggcaaggtccgccctgtcatcagcac3802genom2421r(seqidno.11)5ttataagcctaaggcagcttgacttgcagcaacaag3检测策略:采用人血白蛋白启动子5’端引物和人血白蛋白3’端引物,扩增产物包含启动子0.59kb和白蛋白基因1.83kb,共为2.42kb。采用人血白蛋白启动子5’端和白蛋白中间位置的3’端引物,扩增产物包含启动子和人血白蛋白n端编码序列,共1.45kb。检测结果如图8所示,这是通过pcr检测慢病毒感染制备的稳定细胞株基因组中存在外源人血白蛋白启动子和外源人血白蛋白基因的检测结果。泳道1(依次从左到右)为dna标记物;泳道2为以802genomalbpro1f(seqidno.9)与802genom2421r(seqidno.11)为引物对得到包含启动子和白蛋白基因的扩增产物;泳道3为以802genomalbpro1f(seqidno.9)与802genom1451-1421r(seqidno.10)为引物对,得到的包含启动子和人血白蛋白n端编码序列的扩增产物。可见,在稳定细胞株的基因组中检测到存在有外源人血白蛋白启动子和外源人血白蛋白基因核苷酸片段。参考文献1.campbell,p.n.andn.e.stone,thesynthesisofserumalbuminandtissueproteinsinslicesofratliverandlivertumour.biochemj,1957.66(1):p.19-31.2.raoufinia,r.,etal.,overviewofalbuminanditspurificationmethods.advpharmbull,2016.6(4):p.495-507.3.chen,z.,etal.,quantitationoftheresidualdnafromrice-derivedrecombinanthumanserumalbumin.analbiochem,2014.450:p.4-10.4.chen,z.,etal.,humanserumalbuminfromrecombinantdnatechnology:challengesandstrategies.biochimbiophysacta,2013.1830(12):p.5515-25.5.iseki,k.,etal.,diverseregulationsofalbumingeneexpressionbyhepatocytegrowthfactorinhepg2humanhepatomacellsandprimarycultureofrathepatocytes.intjoncol,2000.16(6):p.1141-5.6.liu,d.andj.zempleni,transcriptionalregulationofthealbumingenedependsontheremovalofhistonemethylationmarksbythefad-dependentmonoamineoxidaselysine-specificdemethylase1inhepg2humanhepatocarcinomacells.jnutr,2014.144(7):p.997-1001.7.vorachek,w.r.,etal.,distantenhancersstimulatethealbuminpromoterthroughcomplexproximalbindingsites.jbiolchem,2000.275(37):p.29031-41.8.frain,m.,etal.,bindingofaliver-specificfactortothehumanalbumingenepromoterandenhancer.molcellbiol,1990.10(3):p.991-9.9.kajiyama,y.,j.tian,andj.locker,characterizationofdistantenhancersandpromotersinthealbumin-alpha-fetoproteinlocusduringactiveandsilencedexpression.jbiolchem,2006.281(40):p.30122-31.10.licursi,m.,etal.,invitroandinvivocomparisonofviralandcellularinternalribosomeentrysitesforbicistronicvectorexpression.genether,2011.18(6):p.631-6.11.li,t.andj.zhang,stableexpressionofthreegenesfromatricistronicretroviralvectorcontainingapicornavirusand9-ntcellularinternalribosomeentrysiteelements.jvirolmethods,2004.115(2):p.137-44.12.saleh,m.,aretroviralvectorthatallowsefficientco-expressionoftwogenesandtheversatilityofalternateselectionmarkers.humgenether,1997.8(8):p.979-83.13.ngoi,s.m.,a.c.chien,andc.g.lee,exploitinginternalribosomeentrysitesingenetherapyvectordesign.currgenether,2004.4(1):p.15-31.14.yeo,j.h.m.,mariati,andy.yang,anires-mediatedtricistronicvectorforefficientgenerationofstable,high-levelmonoclonalantibodyproducingchodg44celllines.methodsmolbiol,2018.1827:p.335-349.15.keen,m.j.andn.t.rapson,developmentofaserum-freeculturemediumforthelargescaleproductionofrecombinantproteinfromachinesehamsterovarycellline.cytotechnology,1995.17(3):p.153-63.16.borth,n.,etal.,comparisonoftheproductionofahumanmonoclonalantibodyagainsthiv-1byheterohybridomacellsandrecombinantchocells:aflowcytometricstudy.cytotechnology,1996.22(1-3):p.129-38.17.enosawa,s.,etal.,long-termcultureofglutaminesynthetase-transfectedhepg2cellsincirculatoryflowbioreactorfordevelopmentofabioartificialliver.celltransplant,2000.9(5):p.711-5.18.ng,s.k.,generationofhigh-expressingcellsbymethotrexateamplificationofdestabilizeddihydrofolatereductaseselectionmarker.methodsmolbiol,2012.801:p.161-72.19.fan,l.,etal.,improvingtheefficiencyofchocelllinegenerationusingglutaminesynthetasegeneknockoutcells.biotechnolbioeng,2012.109(4):p.1007-15.20.noh,s.m.,s.shin,andg.m.lee,comprehensivecharacterizationofglutaminesynthetase-mediatedselectionfortheestablishmentofrecombinantchocellsproducingmonoclonalantibodies.scirep,2018.8(1):p.5361.21.tang,n.h.,etal.,ammoniametabolismcapacityofhepg2cellswithhighexpressionofhumanglutaminesynthetase.hepatobiliarypancreatdisint,2008.7(6):p.621-7.22.xu,p.,etal.,effectsofglutamineandasparagineonrecombinantantibodyproductionusingcho-gscelllines.biotechnolprog,2014.30(6):p.1457-68.23.tang,n.,etal.,stableoverexpressionofarginaseiandornithinetranscarbamylaseinhepg2cellsimprovesitsammoniadetoxification.jcellbiochem,2012.113(2):p.518-27.24.meng,y.g.,etal.,greenfluorescentproteinasasecondselectablemarkerforselectionofhighproducingclonesfromtransfectedchocells.gene,2000.242(1-2):p.201-7.25.shimizu,t.,etal.,asimpleandefficientpurificationoftransducedcellsbyusinggreenfluorescentproteingeneasaselectionmarker.actapaediatrjpn,1998.40(6):p.586-92.26.mosser,d.d.,etal.,useofadicistronicexpressioncassetteencodingthegreenfluorescentproteinforthescreeningandselectionofcellsexpressinginduciblegeneproducts.biotechniques,1997.22(1):p.150-4,156,158-61.27.trono,d.,lentiviralvectors:turningadeadlyfoeintoatherapeuticagent.genether,2000.7(1):p.20-3.28.han,l.,etal.,therapeuticeffectofrecombinantlentiviralvectorcontainingsuccinatedehydrogenaseiron-sulfurproteinonthetreatmentofexperimentalautoimmunitymyocarditis.medhypotheses,2016.93:p.97-101.序列表<110>上海安民生物技术有限公司<120>白蛋白启动子驱动的白蛋白表达载体<130>l18100174f<160>11<170>siposequencelisting1.0<210>1<211>579<212>dna<213>人工序列(artificialsequence)<400>1atagtaaaaaagacacagaagccctaaaatatgtatgtatgtatatgtgtgtgtgcatgc60gtgagtacttgtgtgtaaatttttcattatctataggtaaaagcacacttggaattagca120atagatgcaatttgggacttaactctttcagtatgtcttatttctaagcaaagtatttag180tttggttagtaattactaaacactgagaactaaattgcaaacaccaagaactaaaatgtt240caagtgggaaattacagttaaataccatggtaatgaataaaaggtacaaatcgtttaaac300tcttatgtaaaatttgataagatgttttacacaactttaatacattgacaaggtcttgtg360gagaaaacagttccagatggtaaatatacacaagggatttagtcaaacaattttttggca420agaatattatgaattttgtaatcggttggcagccaatgaaatacaaagatgagtctagtt480aataatctacaattattggttaaagaagtatattagtgctaatttccctccgtttgtcct540agcttttctcttctgtcaaccccacacgcctttggcaca579<210>2<211>1830<212>dna<213>人工序列(artificialsequence)<400>2atgaagtgggtaacctttatttcccttctttttctctttagctcggcttattccaggggt60gtgtttcgtcgagatgcacacaagagtgaggttgctcatcggtttaaagatttgggagaa120gaaaatttcaaagccttggtgttgattgcctttgctcagtatcttcagcagtgtccattt180gaagatcatgtaaaattagtgaatgaagtaactgaatttgcaaaaacatgtgttgctgat240gagtcagctgaaaattgtgacaaatcacttcataccctttttggagacaaattatgcaca300gttgcaactcttcgtgaaacctatggtgaaatggctgactgctgtgcaaaacaagaacct360gagagaaatgaatgcttcttgcaacacaaagatgacaacccaaacctcccccgattggtg420agaccagaggttgatgtgatgtgcactgcttttcatgacaatgaagagacatttttgaaa480aaatacttatatgaaattgccagaagacatccttacttttatgccccggaactccttttc540tttgctaaaaggtataaagctgcttttacagaatgttgccaagctgctgataaagctgcc600tgcctgttgccaaagctcgatgaacttcgggatgaagggaaggcttcgtctgccaaacag660agactcaagtgtgccagtctccaaaaatttggagaaagagctttcaaagcatgggcagta720gctcgcctgagccagagatttcccaaagctgagtttgcagaagtttccaagttagtgaca780gatcttaccaaagtccacacggaatgctgccatggagatctgcttgaatgtgctgatgac840agggcggaccttgccaagtatatctgtgaaaatcaagattcgatctccagtaaactgaag900gaatgctgtgaaaaacctctgttggaaaaatcccactgcattgccgaagtggaaaatgat960gagatgcctgctgacttgccttcattagctgctgattttgttgaaagtaaggatgtttgc1020aaaaactatgctgaggcaaaggatgtcttcctgggcatgtttttgtatgaatatgcaaga1080aggcatcctgattactctgtcgtgctgctgctgagacttgccaagacatatgaaaccact1140ctagagaagtgctgtgccgctgcagatcctcatgaatgctatgccaaagtgttcgatgaa1200tttaaacctcttgtggaagagcctcagaatttaatcaaacaaaattgtgagctttttgag1260cagcttggagagtacaaattccagaatgcgctattagttcgttacaccaagaaagtaccc1320caagtgtcaactccaactcttgtagaggtctcaagaaacctaggaaaagtgggcagcaaa1380tgttgtaaacatcctgaagcaaaaagaatgccctgtgcagaagactatctatccgtggtc1440ctgaaccagttatgtgtgttgcatgagaaaacgccagtaagtgacagagtcaccaaatgc1500tgcacagaatccttggtgaacaggcgaccatgcttttcagctctggaagtcgatgaaaca1560tacgttcccaaagagtttaatgctgaaacattcaccttccatgcagatatatgcacactt1620tctgagaaggagagacaaatcaagaaacaaactgcacttgttgagctcgtgaaacacaag1680cccaaggcaacaaaagagcaactgaaagctgttatggatgatttcgcagcttttgtagag1740aagtgctgcaaggctgacgataaggagacctgctttgccgaggagggtaaaaaacttgtt1800gctgcaagtcaagctgccttaggcttataa1830<210>3<211>587<212>dna<213>人工序列(artificialsequence)<400>3gccgcccctctccctcccccccccctaacgttactggccgaagccgcttggaataaggcc60ggtgtgcgtttgtctatatgttattttccaccatattgccgtcttttggcaatgtgaggg120cccggaaacctggccctgtcttcttgacgagcattcctaggggtctttcccctctcgcca180aaggaatgcaaggtctgttgaatgtcgtgaaggaagcagttcctctggaagcttcttgaa240gacaaacaacgtctgtagcgaccctttgcaggcagcggaaccccccacctggcgacaggt300gcctctgcggccaaaagccacgtgtataagatacacctgcaaaggcggcacaaccccagt360gccacgttgtgagttggatagttgtggaaagagtcaaatggctctcctcaagcgtattca420acaaggggctgaaggatgcccagaaggtaccccattgtatgggatctgatctggggcctc480ggtacacatgctttacatgtgtttagtcgaggttaaaaaaacgtctaggccccccgaacc540acggggacgtggttttcctttgaaaaacacgatgataatatggccac587<210>4<211>1122<212>dna<213>人工序列(artificialsequence)<400>4atgaccacctcagcaagttcccacttaaataaaggcatcaagcaggtgtacatgtccctg60cctcagggtgagaaagtccaggccatgtatatctggatcgatggtactggagaaggactg120cgctgcaagacccggaccctggacagtgagcccaagtgtgtggaagagttgcctgagtgg180aatttcgatggctctagtactttacagtctgagggttccaacagtgacatgtatctcgtg240cctgctgccatgtttcgggaccccttccgtaaggaccctaacaagctggtgttatgtgaa300gttttcaagtacaatcgaaggcctgcagagaccaatttgaggcacacctgtaaacggata360atggacatggtgagcaaccagcacccctggtttggcatggagcaggagtataccctcatg420gggacagatgggcacccctttggttggccttccaacggcttcccagggccccagggtcca480tattactgtggtgtgggagcagacagagcctatggcagggacatcgtggaggcccattac540cgggcctgcttgtatgctggagtcaagattgcggggactaatgccgaggtcatgcctgcc600cagtgggaatttcagattggaccttgtgaaggaatcagcatgggagatcatctctgggtg660gcccgtttcatcttgcatcgtgtgtgtgaagactttggagtgatagcaacctttgatcct720aagcccattcctgggaactggaatggtgcaggctgccataccaacttcagcaccaaggcc780atgcgggaggagaatggtctgaagtacatcgaggaggccattgagaaactaagcaagcgg840caccagtaccacatccgtgcctatgatcccaagggaggcctggacaatgcccgacgtcta900actggattccatgaaacctccaacatcaacgacttttctgctggtgtagccaatcgtagc960gccagcatacgcattccccggactgttggccaggagaagaagggttactttgaagatcgt1020cgcccctctgccaactgcgaccccttttcggtgacagaagccctcatccgcacgtgtctt1080ctcaatgaaaccggcgatgagcccttccagtacaaaaattaa1122<210>5<211>720<212>dna<213>人工序列(artificialsequence)<400>5atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggac60ggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctac120ggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccacc180ctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaag240cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttc300ttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctg360gtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcac420aagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaac480ggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgcc540gaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccac600tacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtc660ctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa720<210>6<211>609<212>prt<213>人工序列(artificialsequence)<400>6metlystrpvalthrpheileserleuleupheleupheserserala151015tyrserargglyvalpheargargaspalahislyssergluvalala202530hisargphelysaspleuglyglugluasnphelysalaleuvalleu354045ilealaphealaglntyrleuglnglncysprophegluasphisval505560lysleuvalasngluvalthrgluphealalysthrcysvalalaasp65707580gluseralagluasncysasplysserleuhisthrleupheglyasp859095lysleucysthrvalalathrleuarggluthrtyrglyglumetala100105110aspcyscysalalysglngluprogluargasnglucyspheleugln115120125hislysaspaspasnproasnleuproargleuvalargprogluval130135140aspvalmetcysthralaphehisaspasnglugluthrpheleulys145150155160lystyrleutyrgluilealaargarghisprotyrphetyralapro165170175gluleuleuphephealalysargtyrlysalaalaphethrglucys180185190cysglnalaalaasplysalaalacysleuleuprolysleuaspglu195200205leuargaspgluglylysalaserseralalysglnargleulyscys210215220alaserleuglnlyspheglygluargalaphelysalatrpalaval225230235240alaargleuserglnargpheprolysalagluphealagluvalser245250255lysleuvalthraspleuthrlysvalhisthrglucyscyshisgly260265270aspleuleuglucysalaaspaspargalaaspleualalystyrile275280285cysgluasnglnaspserileserserlysleulysglucyscysglu290295300lysproleuleuglulysserhiscysilealagluvalgluasnasp305310315320glumetproalaaspleuproserleualaalaaspphevalgluser325330335lysaspvalcyslysasntyralaglualalysaspvalpheleugly340345350metpheleutyrglutyralaargarghisproasptyrservalval355360365leuleuleuargleualalysthrtyrgluthrthrleuglulyscys370375380cysalaalaalaaspprohisglucystyralalysvalpheaspglu385390395400phelysproleuvalglugluproglnasnleuilelysglnasncys405410415gluleuphegluglnleuglyglutyrlyspheglnasnalaleuleu420425430valargtyrthrlyslysvalproglnvalserthrprothrleuval435440445gluvalserargasnleuglylysvalglyserlyscyscyslyshis450455460proglualalysargmetprocysalagluasptyrleuservalval465470475480leuasnglnleucysvalleuhisglulysthrprovalserasparg485490495valthrlyscyscysthrgluserleuvalasnargargprocysphe500505510seralaleugluvalaspgluthrtyrvalprolysglupheasnala515520525gluthrphethrphehisalaaspilecysthrleuserglulysglu530535540argglnilelyslysglnthralaleuvalgluleuvallyshislys545550555560prolysalathrlysgluglnleulysalavalmetaspasppheala565570575alaphevalglulyscyscyslysalaaspasplysgluthrcysphe580585590alaglugluglylyslysleuvalalaalaserglnalaalaleugly595600605leu<210>7<211>373<212>prt<213>人工序列(artificialsequence)<400>7metthrthrseralaserserhisleuasnlysglyilelysglnval151015tyrmetserleuproglnglyglulysvalglnalamettyriletrp202530ileaspglythrglygluglyleuargcyslysthrargthrleuasp354045sergluprolyscysvalglugluleuproglutrpasnpheaspgly505560serserthrleuglnsergluglyserasnseraspmettyrleuval65707580proalaalametpheargaspprophearglysaspproasnlysleu859095valleucysgluvalphelystyrasnargargproalagluthrasn100105110leuarghisthrcyslysargilemetaspmetvalserasnglnhis115120125protrppheglymetgluglnglutyrthrleumetglythraspgly130135140hispropheglytrpproserasnglypheproglyproglnglypro145150155160tyrtyrcysglyvalglyalaaspargalatyrglyargaspileval165170175glualahistyrargalacysleutyralaglyvallysilealagly180185190thrasnalagluvalmetproalaglntrpglupheglnileglypro195200205cysgluglyilesermetglyasphisleutrpvalalaargpheile210215220leuhisargvalcysgluasppheglyvalilealathrpheasppro225230235240lysproileproglyasntrpasnglyalaglycyshisthrasnphe245250255serthrlysalametargglugluasnglyleulystyrilegluglu260265270alaileglulysleuserlysarghisglntyrhisileargalatyr275280285aspprolysglyglyleuaspasnalaargargleuthrglyphehis290295300gluthrserasnileasnasppheseralaglyvalalaasnargser305310315320alaserileargileproargthrvalglyglnglulyslysglytyr325330335phegluaspargargproseralaasncysasppropheservalthr340345350glualaleuileargthrcysleuleuasngluthrglyaspglupro355360365pheglntyrlysasn370<210>8<211>239<212>prt<213>人工序列(artificialsequence)<400>8metvalserlysglyglugluleuphethrglyvalvalproileleu151015valgluleuaspglyaspvalasnglyhislyspheservalsergly202530gluglygluglyaspalathrtyrglylysleuthrleulyspheile354045cysthrthrglylysleuprovalprotrpprothrleuvalthrthr505560leuthrtyrglyvalglncyspheserargtyrproasphismetlys65707580glnhisaspphephelysseralametprogluglytyrvalglnglu859095argthrilephephelysaspaspglyasntyrlysthrargalaglu100105110vallysphegluglyaspthrleuvalasnargilegluleulysgly115120125ileaspphelysgluaspglyasnileleuglyhislysleuglutyr130135140asntyrasnserhisasnvaltyrilemetalaasplysglnlysasn145150155160glyilelysvalasnphelysilearghisasnilegluaspglyser165170175valglnleualaasphistyrglnglnasnthrproileglyaspgly180185190provalleuleuproaspasnhistyrleuserthrglnseralaleu195200205serlysaspproasnglulysargasphismetvalleuleugluphe210215220valthralaalaglyilethrleuglymetaspgluleutyrlys225230235<210>9<211>33<212>dna<213>人工序列(artificialsequence)<400>9atagtaaaaaagacacagaagccctaaaatatg33<210>10<211>31<212>dna<213>人工序列(artificialsequence)<400>10tacttggcaaggtccgccctgtcatcagcac31<210>11<211>36<212>dna<213>人工序列(artificialsequence)<400>11ttataagcctaaggcagcttgacttgcagcaacaag36当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1