本发明属于分子生物技术领域,具体涉及一种全基因合成的方法。
背景技术:
全基因合成在合成生物学中具有关键的作用,包括异源蛋白表达、基因改造和修饰以及全基因组合成等。通过基因合成,不仅可以根据序列获得自然界中存在却难以获取的基因,也可以对密码子进行优化,或者随意对基因进行改造。基因合成方法的进步极大地提升了人们对基因和蛋白的操作能力。
基因合成主要由两种方式介导:连接酶和pcr。pcr介导的全基因合成是使用最为广泛的方法,其主要包括以下几个步骤:首先设计合成覆盖目的基因的相邻末端重叠的寡核苷酸,在第一阶段pcr中,dna延伸合成全长的目的基因,在第二阶段pcr中,采用最外侧的一对引物,富集目的基因,最后通过酶切连接,将目的基因克隆至质粒载体中。许多报道的方法均在此基础上改进,包括热动力平衡/内向外的方法(tbio)、传统热平衡方法(tbc)、改进的pcr介导的合成(ips)等。另外,有报道采用一步法(onestepmethod)进行基因合成,然而,该方法需要较多的参数优化,包括dna聚合酶、引物浓度和退火温度方面,过程繁琐。
传统的全基因合成方法通常需要至少三天的时间才能完成,需要繁琐的操作而且技术门槛较高,增加了成本。总之,目前已报道的各类全基因合成方法中尚无一种高效率、可以在一天内完成、在合成目的基因的同时能将基因构建至质粒载体中的方法。
技术实现要素:
本发明旨在提供一种快速、有效、低成本的全基因合成方法,以满足高通量全基因合成、基因功能研究、蛋白质的表达。具体来说,主要用于较长的基因合成,长度可达1638bp,能在全基因合成的同时将基因整合至质粒载体中。
为了达到上述目的,本发明提供了一种快速有效,基于单管反向pcr的全基因合成方法,命名为strp(singletubereversepcr-basedgenesynthesis,strp)法。具体的技术方案为:
全基因合成方法包括如下步骤:
(1)strp法合成基因的引物设计:设计覆盖目的基因全长的寡核苷酸即引物;
(2)酶链聚合反应:将所有步骤(1)设计的引物按照进行一定倍数的稀释,进行混合;把质粒载体和一定量的混合引物混合在一管中进行pcr反应;在一轮pcr中分两个阶段进行,第一个阶段10个循环,寡核苷酸互相退火延伸,形成长片段;第二个阶段20个循环,长片段以质粒载体为模板进行退火、成指数反向pcr方式延伸、扩增,得到含有全长目的基因的线性质粒,通过一轮pcr反应,可以同时合成目的基因并将目的基因整合到质粒载体中;
(3)dpni酶消化及转化:采用dpni酶消化步骤(2)得到的pcr产物以去除pcr产物即线性质粒中的质粒载体;将dpni酶消化后的产物转化大肠杆菌感受态细胞并涂于含氨卞青霉素的lb琼脂平板皿上培养;
(4)菌落pcr筛选及测序验证:挑选在步骤(3)制备的含氨卞青霉素的lb琼脂平板皿上长出的菌落,进行菌落pcr,电泳,筛选长度正确的克隆,检测是否得到目的基因;
(5)通过原核表达验证合成的基因是否具有功能。采用异丙基硫代半乳糖苷(iptg)诱导的方式,验证合成基因在bl21(de3)中的表达。
进一步地,所述步骤(1)具体操作如下:从数据库调取基因序列,根据大肠杆菌密码子偏好性,对编码序列进行优化,手动或在线软件设计覆盖目的基因全长的寡核苷酸即引物,包括2个最外侧引物,通过聚丙烯酰胺凝胶电泳(sds-page)纯化寡核苷酸,根据tm值设置相邻引物之间的重叠区,使相邻引物末端能够在pcr反应时相连,质粒载体插入位点一侧与一个最外侧的引物3’端序列同源,质粒载体插入位点另一侧与另一个最外侧的引物3’端序列同源。
进一步地,所述步骤(2)pcr条件如下:pcr体系为:1×缓冲液,40pmol~2pmol混合引物即步骤(1)设计的引物,0.4mmdntp,1mmmgso4,1u高保真dna聚合酶和1ng~50ng质粒载体;
pcr反应包括两个阶段,第一阶段反应条件:94℃预变性2min;98℃变性10s,60℃退火30s,68℃延伸(2kb/min),10个循环;第一阶段过程中,引物即寡核苷酸互相退火延伸,形成不同的长片段,部分长片段由最外侧引物和寡核苷酸退火延伸而成,所以该部分长片段包括含有与质粒载体插入位点一侧同源序列的长片段以及含有与质粒载体插入位点另一侧同源序列的长片段;
第二阶段反应条件:98℃变性10s,60℃退火30s,68℃延伸(2kb/min),20个循环;然后保持68℃充分延伸,第二阶段过程中,含有与质粒载体插入位点一侧同源序列的长片段及含有与质粒载体插入位点另一侧同源序列的长片段与质粒载体部分序列发生互补,即这两种长片段作为大引物以质粒载体为模板,其他长片段和dntp能够在这两种长片段3’端以反向pcr的方式进行退火延伸,得到含有目的基因全长的线性质粒。
步骤(3)所述的转化如下:从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的lb培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的lb琼脂平板皿上,37℃培养过夜。第三日晚在含氨卞青霉素的lb琼脂平板皿上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的lb培养基中。37℃,220rpm摇床培养过夜。
进一步地,所述步骤(4)具体如下:取若干灭菌的pcr管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从步骤(3)制备的含氨卞青霉素的lb琼脂平板皿上挑取菌落即转化子,溶解到pcr管中,制成菌液;整个过程需要在超净工作台中进行;取5μl所得菌液作为模板,加入含有dna聚合酶、dntp及引物的pcr混合液中,通过pcr扩增目的基因,电泳,筛选长度正确的克隆,检测是否得到目的片段。
进一步地,所述步骤(5)具体如下:将测序正确的质粒即合成的目的基因转入bl21(de3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的lb培养基中,37℃,220rpm,摇床培养,约3h,当od600达到0.6时,以1:100的比例转入500ml补充有抗生素的lb培养基中,继续37℃,220rpm,摇床培养至od600达到0.6,加入0.5mm的异丙基硫代半乳糖苷(iptg)进行诱导,37℃诱导4h或者25℃诱导过夜。
所述目的基因包括egfp基因、rfp基因、烟草花叶蚀刻病毒蛋白酶基因。理论上,strp可以在一轮pcr中可以合成更长的dna片段。通过strp法,能够合成一条长度达到1638bp的基因,挑取19个克隆,通过菌落pcr筛选得到8个阳性克隆,全部送去测序,如图4所示,结果表明,都有不同程度的突变,最少的有1处突变,可以选择突变最少的重组子,通过点突变的方式对其进行了修正,成功地合成了该1638bp基因。
本发明提出一种有效快捷的全基因合成方法——strp法。strp法与传统的基因合成方法有很大的不同,在原理上,传统的方法依赖于第一轮pcr中全长基因的形成,是采用一个正向pcr的扩增方式,再通过第二轮pcr来富集全长基因,而strp法是通过长片段反向pcr延伸,得到包含目的基因的线性质粒,线性质粒的修复是在大肠杆菌中完成的,而且strp法在一轮pcr中可以得到比较长的片段。在实验操作上,strp法可以在一轮pcr中,在合成目的基因的同时将其整合到质粒载体中,不需要胶回收、酶切、连接等繁琐的步骤,一天内即可完成,极大地节省了时间。strp法可作为一种有效而简单的全基因合成方法,可以被用来作为一种高通量克隆工具以满足日益增长的对基因组研究和蛋白质改造的研究需求。
附图说明
图1为strp法进行全基因合成的策略示意图.
图2为通过对pcr过程中所使用的引物浓度进行优化,以及通过菌落pcr进行筛选阳性克隆实验图片。
图3为通过原核表达验证所合成基因的功能实验图片。
图4为1638bp基因合成电泳结果实验图片。
图5为全基因合成中错误的修正策略示意图。
具体实施方式
下面将结合具体实施例来详细说明本发明,在此以本发明的示意性实施例及说明用来解释本发明,但并不作为对本发明的限定。
本发明的技术原理是:
(1)strp法合成基因的引物设计:设计覆盖目的基因全长的寡核苷酸即引物;从uniprot数据库(http://www.uniprot.org/)调取基因序列,根据大肠杆菌密码子偏好性,利用jcat在线软件(http://www.jcat.de/)对编码序列进行优化,手动或在线软件设计引物,包括2个最外侧引物,根据tm值设置相邻引物之间的重叠区,使相邻引物末端在pcr反应时能够相连,一个最外侧引物3’端与质粒载体插入位点一侧序列同源,另一个最外侧引物3’端与质粒载体插入位点另一侧序列同源。
(2)酶链聚合反应:如图1所示的反应原理:箭头方向为5’-3’方向。相邻寡核苷酸之间有15bp~25bp的重叠区,一条最外侧引物3’端序列与质粒载体插入位点一侧序列同源,另一条最外侧引物3’端序列与质粒载体插入位点另一侧序列同源,pcr产物经dpni酶消化后,转化至大肠杆菌。
详细操作步骤:将所有步骤(1)设计的引物按照进行一定倍数的稀释,进行混合;把质粒载体和一定量的混合引物混合在一管中进行pcr反应;
pcr体系为:1×缓冲液,40pmol~2pmol混合引物即步骤(1)设计的引物,0.4mmdntp,1mmmgso4,1udna聚合酶和1ng~50ng质粒载体;
pcr反应包括两个阶段。第一阶段反应条件:94℃预变性2min;98℃变性10s,60℃退火30s,68℃延伸(2kb/min),10个循环;第一阶段过程中,引物即寡核苷酸互相退火延伸,形成不同的长片段,部分长片段由最外侧引物和寡核苷酸退火延伸而成,所以该部分长片段包括含有与质粒载体插入位点一侧同源序列的长片段以及含有与质粒载体插入位点另一侧同源序列的长片段;
第二阶段反应条件:98℃变性10s,60℃退火30s,68℃延伸(2kb/min),20个循环;然后保持68℃充分延伸,第二阶段过程中,含有与质粒载体插入位点一侧同源序列的长片段及含有与质粒载体插入位点另一侧同源序列的长片段与质粒载体部分序列发生互补,即这两种长片段作为大引物以质粒载体为模板,因为相邻引物末端有重叠区,其他长片段和dntp能够在这两种长片段3’端以反向pcr的方式进行退火、成指数反向pcr方式延伸、扩增,得到含有目的基因全长的线性质粒。通过一轮pcr反应,可以同时合成目的基因并将目的基因整合到质粒载体上;
(3)dpni酶消化及转化:采用dpni酶消化以去除pcr产物即线性质粒中的质粒载体;然后从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的lb培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的lb琼脂平板皿上,37℃培养过夜。第三日晚在平板上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的lb培养基中,37℃,220rpm摇床培养过夜;
(4)菌落pcr筛选及测序验证:取若干灭菌的pcr管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从步骤(3)制备的含氨卞青霉素的lb琼脂平板皿上挑取菌落即转化子,溶解到pcr管中,制成菌液;整个过程需要在超净工作台中进行;取5μl所得菌液作为模板,加入含有dna聚合酶、dntp及引物的pcr混合液中,通过pcr扩增目的基因,电泳,筛选长度正确的克隆,检测是否得到目的片段;
(5)通过原核表达验证合成的基因是否具有功能。
将测序正确的质粒即合成的目的基因转入bl21(de3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的lb培养基中,37℃,220rpm,摇床培养约3h,当od600达到0.6时,以1:100的比例转入500ml补充有抗生素的lb培养基中,继续37℃,220rpm,摇床培养至od600达到0.6,加入0.5mm的异丙基硫代半乳糖苷(iptg)进行诱导,37℃诱导4h或者25℃诱导过夜;
按上述技术原理,现提供下面几个实施例加以说明。
实施例1
strp法合成700bp左右的基因并同时构建至表达载体中
从uniprot数据库(http://www.uniprot.org/)调取增强型绿色荧光蛋白(egfp,239aa)、红色荧光蛋白(rfp,231aa)及烟草花叶蚀刻病毒蛋白酶(tevprotease,238aa)基因序列。按照大肠杆菌密码子偏好性,利用jcat在线软件(http://www.jcat.de/)对编码序列进行优化。最初,合成egfp的引物采用手动设计,包括2条最外侧引物,每条引物长度为59bp,相邻引物末端有15bp的重叠,一条最外侧的引物3’端序列与质粒载体插入位点一侧同源,另一条最外侧的引物3’端序列与质粒载体插入位点另一侧同源,同源区tm值为70℃。
所有的寡核苷酸即合成egfp的引物与质粒载体混合在一管中进行pcr反应,基因合成在一轮pcr中完成,理论上pcr包括两个阶段:第一阶段,寡核苷酸互相退火延伸,形成长片段;第二阶段,长片段、dntp与质粒载体退火、成指数反向pcr方式延伸、扩增得到含有全长目的基因的线性质粒。通过一轮pcr反应,可以同时合成目的基因并将目的基因整合到质粒载体中。pcr产物经dpni酶处理后直接转化到大肠杆菌dh5α感受态细胞中,得到修复。rfp基因与tev蛋白酶基因的引物是通过在线软件设计。覆盖rfp基因的相邻引物之间的重叠区tm值为70℃,rfp基因的引物由dnaworks在线软件设计(http://helixweb.nih.gov/dnaworks/),覆盖tev蛋白酶基因的相邻引物重叠区tm值为60℃,由genedesign在线软件设计(http://54.235.254.95/gd/)。rfp基因与tev蛋白酶基因同样用strp法合成。如图2所示,通过对pcr过程中所使用的引物浓度进行优化,以及通过菌落pcr进行筛选阳性克隆。a为egfp基因合成的引物浓度优化,星号标记为目标产物。b为rfp基因合成的引物浓度优化,星号标记为目标产物。c是采用最外侧的引物,通过菌落pcr筛选阳性的egfp克隆。所有挑取的克隆均能扩增出来目标条带。上述三种基因合成所设计的引物见表1。
表1
得到的基因序列如下:
egfp基因序列(717bp)
atggtgagcaaaggcgaagaactgtttaccggcgtggtgccgattctggtggaactggatggcgatgtgaacggccataaatttagcgtgagcggcgaaggcgaaggcgatgcgacctatggcaaactgaccctgaaatttatttgcaccaccggcaaactgccggtgccgtggccgaccctggtgaccaccctgacctatggcgtgcagtgctttagccgttatccggatcatatgaaacagcatgatttttttaaaagcgcgatgccggaaggctatgtgcaggaacgtaccattttttttaaagatgatggcaactataaaacccgtgcggaagtgaaatttgaaggcgataccctggtgaaccgtattgaactgaaaggcattgattttaaagaagatggcaacattctgggccataaactggaatataactataacagccataacgtgtatattatggcggataaacagaaaaacggcattaaagtgaactttaaaattcgtcataacattgaagatggcagcgtgcagctggcggatcattatcagcagaacaccccgattggcgatggcccggtgctgctgccggataaccattatctgagcacccagagcgcgctgagcaaagatccgaacgaaaaacgtgatcatatggtgctgctggaatttgtgaccgcggcgggcattaccctgggcatggatgaactgtataaa
rfp基因序列(693bp)
atgaacagcctgattaaagaaaacatgcgtatgatggtggtgatggaaggcagcgtgaacggctatcagtttaaatgcaccggcgaaggcgatggcaacccgtatatgggcacccagaccatgcgtattaaagtggtggaaggcggcccgctgccgtttgcgtttgatattctggcgaccagctttatgtatggcagcaaaacctttattaaacataccaaaggcattccggatttttttaaacagagctttccggaaggctttacctgggaacgtgtgacccgttatgaagatggcggcgtgtttaccgtgatgcaggataccagcctggaagatggctgcctggtgtatcatgcgaaagtgaccggcgtgaactttccgagcaacggcgcggtgatgcagaaaaaaaccaaaggctgggaaccgaacaccgaaatgctgtatccggcggatggcggcctgcgtggctatagccagatggcgctgaacgtggatggcggcggctatctgagctgcagctttgaaaccacctatcgtagcaaaaaaaccgtggaaaactttaaaatgccgggctttcattttgtggatcatcgtctggaacgtctggaagaaagcgataaagaaatgtttgtggtgcagcatgaacatgcggtggcgaaattttgcgatctgccgagcaaactgggccgtctg
tev基因(747bp)
atgggcagccatcatcatcatcatcatcatcatggcgaaagcctgtttaaaggcccgcgtgattataacccgattagcagcaccatttgccatctgaccaacgaaagcgatggccataccaccagcctgtatggcattggctttggcccgtttattattaccaacaaacatctgtttcgtcgtaacaacggcaccctgctggtgcagagcctgcatggcgtgtttaaagtgaaaaacaccaccaccctgcagcagcatctgattgatggccgtgatatgattattattcgtatgccgaaagattttccgccgtttccgcagaaactgaaatttcgtgaaccgcagcgtgaagaacgtatttgcctggtgaccaccaactttcagaccaaaagcatgagcagcatggtgagcgataccagctgcacctttccgagcagcgatggcattttttggaaacattggattcagaccaaagatggccagtgcggcagcccgctggtgagcacccgtgatggctttattgtgggcattcatagcgcgagcaactttaccaacaccaacaactattttaccagcgtgccgaaaaactttatggaactgctgaccaaccaggaagcgcagcagtgggtgagcggctggcgtctgaacgcggatagcgtgctgtggggcggccataaagtgtttatggtgaaaccggaagaaccgtttcagccggtgaaagaagcgacccagctgatgaacgaactg
实施例2
用strp法合成1638bp的基因
strp法可以合成较长的基因,通过strp法,本实施例设计表2所示引物,用strp法和表2所示的引物合成了一条1638bp的基因,挑取19个克隆,通过菌落pcr筛选得到8个阳性克隆。
表2
8个克隆全部送去测序,结果表明,都有不同程度的突变,最少的有1处突变,见表3,编号f-8所示。本实施例选择突变最少的f-8,通过点突变的方式对其进行了修正,成功地合成了该1638bp基因。
表3
如图4所示,1638bp基因合成电泳结果,a为引物浓度优化。b为菌落pcr筛选结果,星号标记为目的基因。
该1638bp基因序列如下:
ls基因序列(1638bp)
atgcgtcgcagtggtaattacaacccgtcacgttgggatgtgaattttatccaatccctgctgagcgattacaaagaggacaaacacgtcattcgggcaagcgaactggttacactggttaaaatggaactggaaaaagaaacagaccaaattcgccaattagagctgattgacgacttacagcgcatggggctgagcgatcactttcagaatgagttcaaagagattctgtcatctatctatctggaccaccattactataaaaacccttttccgaaagaggaacgtgatctgtatagcacaagcctggcctttcggttactgcgtgagcatggcttccaagtagcacaagaggtattcgatagcttcaagaatgaagagggcgagttcaaagaatcactgtccgatgatactcgtggcttattacaactgtatgaagcgagctttctgctgaccgagggggagacgactctggaaagcgcacgggaatttgcgaccaaattcttagaagagaaagtaaatgaaggcggcgtagatggcgatctgttaacccgcatcgcgtattctctggacattccgttacactggcgtattaaacggccaaacgcgccggtgtggattgagtggtatcgcaaacgtccagacatgaacccggtggtgctggaattagcaattttagacttaaacatcgtgcaggctcaatttcaggaagaactgaaagaatcttttcgctggtggcgcaacaccggcttcgttgaaaaattaccgtttgcgcgcgatcgtctggttgaatgttatttctggaataccggcattatcgaaccgcgccagcacgcgagcgcccgtattatgatgggtaaggtcaatgcgctgattactgtcattgacgatatttacgatgtatacggcactctggaagaactggagcagtttacagatttaatccgccggtgggacatcaatagcatcgaccagctgccagattacatgcagctgtgttttctggcgctgaataactttgtggacgacacctcttatgacgtcatgaaagaaaaaggcgtgaatgttatcccttatctgcgtcagagttgggtggatctggccgataaatatatggttgaggcacgctggttctacggtgggcacaaaccgagtttagaagaatatctggagaactcatggcagagtatcagtgggccatgcatgctgacgcatatcttctttcgcgtcacggattcatttaccaaggagacggtcgattccttatataaataccatgacctggttcgttggtcatctttcgtcctgcggctggcggacgatctgggtacgtctgtggaagaggtgtctcgtggggatgttccgaaatccttacagtgctacatgtccgattataacgcaagtgaagctgaagctcgcaaacatgtgaagtggctgatcgccgaagtgtggaagaagatgaacgctgaacgtgtttccaaggatagtccgtttggtaaggattttattggttgcgccgttgatctgggtcgtatggcccagctgatgtatcataacggtgatggtcatgggacccagcatcctattattcatcagcagatgacgcgtaccctgtttgaacctttcgccctcgagtga
实施例3
通过重叠pcr方法进行错误修复
合成基因中的错误通常是在寡核苷酸化学合成和pcr介导基因拼接过程中引入的。前者是错误的主要的来源。寡核苷酸化学合成的正确率通常在98.5%-99.5%之间,很难达到100%,其中碱基缺失和插入是最常发生的错误。采用hplc或者page纯化寡核苷酸,可以在最大程度上减少基因合成中错误的引入。在挑取几个克隆经过测序之后,最理想的情况是合成基因序列完全正确,如果没有正确的基因,可以选择突变最少的进行错误修正,这通常是利用点突变或者称为重叠pcr法完成。如图5所示,在strp法合成的基因中,错误修正通过点突变的方法可以很容易地在质粒载体上完成,从已有寡核苷酸中,在突变位点相应的位置选取引物对(1和2),以质粒载体为模板,进行错误修正。
用于点突变修正的引物直接从已合成的寡核苷酸中选取,无需重新设计合成引物。简单来说,合成基因经过测序之后,选择突变最少的合成基因进行错误修正。以突变位点处的寡核苷酸作为引物对,以该合成基因为模板,用高保真酶进行pcr扩增,pcr产物经电泳检测后,直接用dpni酶消化,去除模板。
取5μl消化产物做转化,随机挑几个克隆测序。从-70℃冰箱取出含有大肠杆菌感受态细胞的离心管,在超净台上冰浴,待其融化后,加入5μl酶切产物,冰浴30min;将离心管从冰浴取出并迅速转到42℃水浴热激90s,然后转冰浴2min;向每个离心管加入500μl的lb培养基,于37℃,200rpm摇床培养45min以上,涂于含氨卞青霉素的lb琼脂平板皿上,37℃培养过夜。第三日晚在平板上随机挑两个单克隆,分别接种到5ml含有100μg/ml氨苄青霉素钠的lb培养基中,37℃,220rpm摇床培养过夜;
取若干灭菌的pcr管,写好标记,在每管中加入10μl超纯水;然后用灭菌枪头或牙签随机从含氨卞青霉素的lb琼脂平板皿上挑取菌落即转化子,溶解到pcr管中,制成菌液;整个过程需要在超净工作台中进行;将混有菌体的pcr混合物置于pcr仪中,按常规条件扩增,筛选长度正确的克隆,电泳检测是否得到目的片段;选择序列完全正确的合成基因进行下一步应用。
实施例4
通过原核表达验证基因功能
将测序正确的质粒即合成的目的基因转入bl21(de3)感受态细胞,在固体平板上培养;次日,在固体平板上挑取单菌落,接种到5ml补充有抗生素的lb培养基中,37℃,220rpm,摇床培养,约3h,当od600达到0.6时,以1:100的比例转入500ml补充有抗生素的lb培养基中,继续37℃,220rpm,摇床培养,约3h,至od600达到0.6,加入0.5mm的iptg进行诱导,37℃诱导4h或者25℃诱导过夜。
因为egfp、rfp构建在pet表达载体中,可以直接通过异源表达观察荧光来验证基因功能。表达宿主均为bl21(de3)。转化egfp的菌液经25℃诱导过夜之后,得到图3a所示的绿色菌液,而转化rfp的菌液经过30℃诱导过夜之后,如图3b所示菌液变为粉红色。
以上实施例的说明只适用于帮助理解本发明的原理;本说明书内容不应理解为对本发明的限制。
序列表
<110>广州医科大学附属第三医院
<120>一种全基因合成方法
<130>2017
<160>104
<170>siposequencelisting1.0
<210>1
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>1
ctgcccagccggcgatggccatggtgagcaaaggcgaagaactgtttaccggcgtggtg59
<210>2
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>2
aatttatggccgttcacatcgccatccagttccaccagaatcggcaccacgccggtaaa59
<210>3
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>3
gaacggccataaatttagcgtgagcggcgaaggcgaaggcgatgcgacctatggcaaac59
<210>4
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>4
cggcaccggcagtttgccggtggtgcaaataaatttcagggtcagtttgccataggtcg59
<210>5
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>5
aaactgccggtgccgtggccgaccctggtgaccaccctgacctatggcgtgcagtgctt59
<210>6
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>6
ttttaaaaaaatcatgctgtttcatatgatccggataacggctaaagcactgcacgcca59
<210>7
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>7
atgatttttttaaaagcgcgatgccggaaggctatgtgcaggaacgtaccatttttttt59
<210>8
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>8
tcaaatttcacttccgcacgggttttatagttgccatcatctttaaaaaaaatggtacg59
<210>9
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>9
ggaagtgaaatttgaaggcgataccctggtgaaccgtattgaactgaaaggcattgatt59
<210>10
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>10
gttatattccagtttatggcccagaatgttgccatcttctttaaaatcaatgcctttca59
<210>11
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>11
aaactggaatataactataacagccataacgtgtatattatggcggataaacagaaaaa59
<210>12
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>12
catcttcaatgttatgacgaattttaaagttcactttaatgccgtttttctgtttatcc59
<210>13
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>13
ataacattgaagatggcagcgtgcagctggcggatcattatcagcagaacaccccgatt59
<210>14
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>14
gtgctcagataatggttatccggcagcagcaccgggccatcgccaatcggggtgttctg59
<210>15
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>15
ccattatctgagcacccagagcgcgctgagcaaagatccgaacgaaaaacgtgatcata59
<210>16
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>16
gcccagggtaatgcccgccgcggtcacaaattccagcagcaccatatgatcacgttttt59
<210>17
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>17
ggcattaccctgggcatggatgaactgtataaataaatggatatcggaattaattcgga59
<210>18
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>18
ggccgcaagcttgtcgacggagctcgaattcggatccgaattaattccgatatccat57
<210>19
<211>717
<212>dna
<213>未知(unknown)
<400>19
atggtgagcaaaggcgaagaactgtttaccggcgtggtgccgattctggtggaactggat60
ggcgatgtgaacggccataaatttagcgtgagcggcgaaggcgaaggcgatgcgacctat120
ggcaaactgaccctgaaatttatttgcaccaccggcaaactgccggtgccgtggccgacc180
ctggtgaccaccctgacctatggcgtgcagtgctttagccgttatccggatcatatgaaa240
cagcatgatttttttaaaagcgcgatgccggaaggctatgtgcaggaacgtaccattttt300
tttaaagatgatggcaactataaaacccgtgcggaagtgaaatttgaaggcgataccctg360
gtgaaccgtattgaactgaaaggcattgattttaaagaagatggcaacattctgggccat420
aaactggaatataactataacagccataacgtgtatattatggcggataaacagaaaaac480
ggcattaaagtgaactttaaaattcgtcataacattgaagatggcagcgtgcagctggcg540
gatcattatcagcagaacaccccgattggcgatggcccggtgctgctgccggataaccat600
tatctgagcacccagagcgcgctgagcaaagatccgaacgaaaaacgtgatcatatggtg660
ctgctggaatttgtgaccgcggcgggcattaccctgggcatggatgaactgtataaa717
<210>20
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>20
tacgcatgttttctttaatcaggctgttcatcatatgtatatctccttcttaaagttaa59
<210>21
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>21
gattaaagaaaacatgcgtatgatggtggtgatggaaggcagcgtgaacggctatcagt59
<210>22
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>22
ccatatacgggttgccatcgccttcgccggtgcatttaaactgatagccgttcacgctg59
<210>23
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>23
cgatggcaacccgtatatgggcacccagaccatgcgtattaaagtggtggaaggcggcc59
<210>24
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>24
taaagctggtcgccagaatatcaaacgcaaacggcagcgggccgccttccaccacttta59
<210>25
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>25
tattctggcgaccagctttatgtatggcagcaaaacctttattaaacataccaaaggca59
<210>26
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>26
taaagccttccggaaagctctgtttaaaaaaatccggaatgcctttggtatgtttaata59
<210>27
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>27
gagctttccggaaggctttacctgggaacgtgtgacccgttatgaagatggcggcgtgt59
<210>28
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>28
ggcagccatcttccaggctggtatcctgcatcacggtaaacacgccgccatcttcataa59
<210>29
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>29
cagcctggaagatggctgcctggtgtatcatgcgaaagtgaccggcgtgaactttccga59
<210>30
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>30
cccagcctttggtttttttctgcatcaccgcgccgttgctcggaaagttcacgccggtc59
<210>31
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>31
gaaaaaaaccaaaggctgggaaccgaacaccgaaatgctgtatccggcggatggcggcc59
<210>32
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>32
cgccatccacgttcagcgccatctggctatagccacgcaggccgccatccgccggatac59
<210>33
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>33
ggcgctgaacgtggatggcggcggctatctgagctgcagctttgaaaccacctatcgta59
<210>34
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>34
gaaagcccggcattttaaagttttccacggtttttttgctacgataggtggtttcaaag59
<210>35
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>35
ctttaaaatgccgggctttcattttgtggatcatcgtctggaacgtctggaagaaagcg59
<210>36
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>36
ccaccgcatgttcatgctgcaccacaaacatttctttatcgctttcttccagacgttcc59
<210>37
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>37
gcagcatgaacatgcggtggcgaaattttgcgatctgccgagcaaactgggccgtctgt59
<210>38
<211>693
<212>dna
<213>未知(unknown)
<400>38
atgaacagcctgattaaagaaaacatgcgtatgatggtggtgatggaaggcagcgtgaac60
ggctatcagtttaaatgcaccggcgaaggcgatggcaacccgtatatgggcacccagacc120
atgcgtattaaagtggtggaaggcggcccgctgccgtttgcgtttgatattctggcgacc180
agctttatgtatggcagcaaaacctttattaaacataccaaaggcattccggattttttt240
aaacagagctttccggaaggctttacctgggaacgtgtgacccgttatgaagatggcggc300
gtgtttaccgtgatgcaggataccagcctggaagatggctgcctggtgtatcatgcgaaa360
gtgaccggcgtgaactttccgagcaacggcgcggtgatgcagaaaaaaaccaaaggctgg420
gaaccgaacaccgaaatgctgtatccggcggatggcggcctgcgtggctatagccagatg480
gcgctgaacgtggatggcggcggctatctgagctgcagctttgaaaccacctatcgtagc540
aaaaaaaccgtggaaaactttaaaatgccgggctttcattttgtggatcatcgtctggaa600
cgtctggaagaaagcgataaagaaatgtttgtggtgcagcatgaacatgcggtggcgaaa660
ttttgcgatctgccgagcaaactgggccgtctg693
<210>39
<211>50
<212>dna
<213>人工序列(artificialsequence)
<400>39
gtttaactttaagaaggagatatacatatgggcagccatcatcatcatca50
<210>40
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>40
tcacgcgggcctttaaacaggctttcgccatgatgatgatgatgatgatgatggctgcc59
<210>41
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>41
gtttaaaggcccgcgtgattataacccgattagcagcaccatttgccatctgaccaacg59
<210>42
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>42
agccaatgccatacaggctggtggtatggccatcgctttcgttggtcagatggcaaatg59
<210>43
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>43
gcctgtatggcattggctttggcccgtttattattaccaacaaacatctgtttcgtcgt59
<210>44
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>44
cgccatgcaggctctgcaccagcagggtgccgttgttacgacgaaacagatgtttgttg59
<210>45
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>45
cagagcctgcatggcgtgtttaaagtgaaaaacaccaccaccctgcagcagcatctgat59
<210>46
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>46
aatctttcggcatacgaataataatcatatcacggccatcaatcagatgctgctgcagg59
<210>47
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>47
gattattattcgtatgccgaaagattttccgccgtttccgcagaaactgaaatttcgtg59
<210>48
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>48
gtggtcaccaggcaaatacgttcttcacgctgcggttcacgaaatttcagtttctgcgg59
<210>49
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>49
cgtatttgcctggtgaccaccaactttcagaccaaaagcatgagcagcatggtgagcga59
<210>50
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>50
ttccaaaaaatgccatcgctgctcggaaaggtgcagctggtatcgctcaccatgctgct59
<210>51
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>51
cagcgatggcattttttggaaacattggattcagaccaaagatggccagtgcggcagcc59
<210>52
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>52
gctatgaatgcccacaataaagccatcacgggtgctcaccagcgggctgccgcactggc59
<210>53
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>53
ctttattgtgggcattcatagcgcgagcaactttaccaacaccaacaactattttacca59
<210>54
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>54
gttggtcagcagttccataaagtttttcggcacgctggtaaaatagttgttggtgttgg59
<210>55
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>55
ctttatggaactgctgaccaaccaggaagcgcagcagtgggtgagcggctggcgtctga59
<210>56
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>56
caccataaacactttatggccgccccacagcacgctatccgcgttcagacgccagccgc59
<210>57
<211>59
<212>dna
<213>人工序列(artificialsequence)
<400>57
cggccataaagtgtttatggtgaaaccggaagaaccgtttcagccggtgaaagaagcga59
<210>58
<211>44
<212>dna
<213>人工序列(artificialsequence)
<400>58
ctattacagttcgttcatcagctgggtcgcttctttcaccggct44
<210>59
<211>747
<212>dna
<213>未知(unknown)
<400>59
atgggcagccatcatcatcatcatcatcatcatggcgaaagcctgtttaaaggcccgcgt60
gattataacccgattagcagcaccatttgccatctgaccaacgaaagcgatggccatacc120
accagcctgtatggcattggctttggcccgtttattattaccaacaaacatctgtttcgt180
cgtaacaacggcaccctgctggtgcagagcctgcatggcgtgtttaaagtgaaaaacacc240
accaccctgcagcagcatctgattgatggccgtgatatgattattattcgtatgccgaaa300
gattttccgccgtttccgcagaaactgaaatttcgtgaaccgcagcgtgaagaacgtatt360
tgcctggtgaccaccaactttcagaccaaaagcatgagcagcatggtgagcgataccagc420
tgcacctttccgagcagcgatggcattttttggaaacattggattcagaccaaagatggc480
cagtgcggcagcccgctggtgagcacccgtgatggctttattgtgggcattcatagcgcg540
agcaactttaccaacaccaacaactattttaccagcgtgccgaaaaactttatggaactg600
ctgaccaaccaggaagcgcagcagtgggtgagcggctggcgtctgaacgcggatagcgtg660
ctgtggggcggccataaagtgtttatggtgaaaccggaagaaccgtttcagccggtgaaa720
gaagcgacccagctgatgaacgaactg747
<210>60
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>60
ctgcccagccggcgatggccatgcgtcgcagtggtaattacaacccgtcacgttggg57
<210>61
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>61
ctttgtaatcgctcagcagggattggataaaattcacatcccaacgtgacgggttgt57
<210>62
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>62
tgctgagcgattacaaagaggacaaacacgtcattcgggcaagcgaactggttacac57
<210>63
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>63
gaatttggtctgtttctttttccagttccattttaaccagtgtaaccagttcgcttg57
<210>64
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>64
aagaaacagaccaaattcgccaattagagctgattgacgacttacagcgcatggggc57
<210>65
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>65
acagaatctctttgaactcattctgaaagtgatcgctcagccccatgcgctgtaagt57
<210>66
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>66
agttcaaagagattctgtcatctatctatctggaccaccattactataaaaaccctt57
<210>67
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>67
ccaggcttgtgctatacagatcacgttcctctttcggaaaagggtttttatagtaat57
<210>68
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>68
tgtatagcacaagcctggcctttcggttactgcgtgagcatggcttccaagtagcac57
<210>69
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>69
actcgccctcttcattcttgaagctatcgaatacctcttgtgctacttggaagccat57
<210>70
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>70
agaatgaagagggcgagttcaaagaatcactgtccgatgatactcgtggcttattac57
<210>71
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>71
tctccccctcggtcagcagaaagctcgcttcatacagttgtaataagccacgagtat57
<210>72
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>72
tgctgaccgagggggagacgactctggaaagcgcacgggaatttgcgaccaaattct57
<210>73
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>73
gatcgccatctacgccgccttcatttactttctcttctaagaatttggtcgcaaatt57
<210>74
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>74
gcggcgtagatggcgatctgttaacccgcatcgcgtattctctggacattccgttac57
<210>75
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>75
caatccacaccggcgcgtttggccgtttaatacgccagtgtaacggaatgtccagag57
<210>76
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>76
acgcgccggtgtggattgagtggtatcgcaaacgtccagacatgaacccggtggtgc57
<210>77
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>77
gagcctgcacgatgtttaagtctaaaattgctaattccagcaccaccgggttcatgt57
<210>78
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>78
ttaaacatcgtgcaggctcaatttcaggaagaactgaaagaatcttttcgctggtgg57
<210>79
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>79
cgcgcaaacggtaatttttcaacgaagccggtgttgcgccaccagcgaaaagattct57
<210>80
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>80
aaaaattaccgtttgcgcgcgatcgtctggttgaatgttatttctggaataccggca57
<210>81
<211>36
<212>dna
<213>人工序列(artificialsequence)
<400>81
ctggcgcggttcgataatgccggtattccagaaata36
<210>82
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>82
attatcgaaccgcgccagcacgcgagcgcccgtattatgatgggtaaggtcaatgcg57
<210>83
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>83
gccgtatacatcgtaaatatcgtcaatgacagtaatcagcgcattgaccttacccat57
<210>84
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>84
atttacgatgtatacggcactctggaagaactggagcagtttacagatttaatccgc57
<210>85
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>85
gtaatctggcagctggtcgatgctattgatgtcccaccggcggattaaatctgtaaa57
<210>86
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>86
gaccagctgccagattacatgcagctgtgttttctggcgctgaataactttgtggac57
<210>87
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>87
attcacgcctttttctttcatgacgtcataagaggtgtcgtccacaaagttattcag57
<210>88
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>88
aaagaaaaaggcgtgaatgttatcccttatctgcgtcagagttgggtggatctggcc57
<210>89
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>89
cccaccgtagaaccagcgtgcctcaaccatatatttatcggccagatccacccaact57
<210>90
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>90
cgctggttctacggtgggcacaaaccgagtttagaagaatatctggagaactcatgg57
<210>91
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>91
gaagatatgcgtcagcatgcatggcccactgatactctgccatgagttctccagata57
<210>92
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>92
atgctgacgcatatcttctttcgcgtcacggattcatttaccaaggagacggtcgat57
<210>93
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>93
agatgaccaacgaaccaggtcatggtatttatataaggaatcgaccgtctccttggt57
<210>94
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>94
ctggttcgttggtcatctttcgtcctgcggctggcggacgatctgggtacgtctgtg57
<210>95
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>95
ctgtaaggatttcggaacatccccacgagacacctcttccacagacgtacccagatc57
<210>96
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>96
gttccgaaatccttacagtgctacatgtccgattataacgcaagtgaagctgaagct57
<210>97
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>97
cttccacacttcggcgatcagccacttcacatgtttgcgagcttcagcttcacttgc57
<210>98
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>98
atcgccgaagtgtggaagaagatgaacgctgaacgtgtttccaaggatagtccgttt57
<210>99
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>99
acgacccagatcaacggcgcaaccaataaaatccttaccaaacggactatccttgga57
<210>100
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>100
cgccgttgatctgggtcgtatggcccagctgatgtatcataacggtgatggtcatgg57
<210>101
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>101
tacgcgtcatctgctgatgaataataggatgctgggtcccatgaccatcaccgttat57
<210>102
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>102
catcagcagatgacgcgtaccctgtttgaacctttcgccctcgagtgaatggatatc57
<210>103
<211>36
<212>dna
<213>人工序列(artificialsequence)
<400>103
ggatccgaattaattccgatatccattcactcgagg36
<210>104
<211>1638
<212>dna
<213>未知(unknown)
<400>104
atgcgtcgcagtggtaattacaacccgtcacgttgggatgtgaattttatccaatccctg60
ctgagcgattacaaagaggacaaacacgtcattcgggcaagcgaactggttacactggtt120
aaaatggaactggaaaaagaaacagaccaaattcgccaattagagctgattgacgactta180
cagcgcatggggctgagcgatcactttcagaatgagttcaaagagattctgtcatctatc240
tatctggaccaccattactataaaaacccttttccgaaagaggaacgtgatctgtatagc300
acaagcctggcctttcggttactgcgtgagcatggcttccaagtagcacaagaggtattc360
gatagcttcaagaatgaagagggcgagttcaaagaatcactgtccgatgatactcgtggc420
ttattacaactgtatgaagcgagctttctgctgaccgagggggagacgactctggaaagc480
gcacgggaatttgcgaccaaattcttagaagagaaagtaaatgaaggcggcgtagatggc540
gatctgttaacccgcatcgcgtattctctggacattccgttacactggcgtattaaacgg600
ccaaacgcgccggtgtggattgagtggtatcgcaaacgtccagacatgaacccggtggtg660
ctggaattagcaattttagacttaaacatcgtgcaggctcaatttcaggaagaactgaaa720
gaatcttttcgctggtggcgcaacaccggcttcgttgaaaaattaccgtttgcgcgcgat780
cgtctggttgaatgttatttctggaataccggcattatcgaaccgcgccagcacgcgagc840
gcccgtattatgatgggtaaggtcaatgcgctgattactgtcattgacgatatttacgat900
gtatacggcactctggaagaactggagcagtttacagatttaatccgccggtgggacatc960
aatagcatcgaccagctgccagattacatgcagctgtgttttctggcgctgaataacttt1020
gtggacgacacctcttatgacgtcatgaaagaaaaaggcgtgaatgttatcccttatctg1080
cgtcagagttgggtggatctggccgataaatatatggttgaggcacgctggttctacggt1140
gggcacaaaccgagtttagaagaatatctggagaactcatggcagagtatcagtgggcca1200
tgcatgctgacgcatatcttctttcgcgtcacggattcatttaccaaggagacggtcgat1260
tccttatataaataccatgacctggttcgttggtcatctttcgtcctgcggctggcggac1320
gatctgggtacgtctgtggaagaggtgtctcgtggggatgttccgaaatccttacagtgc1380
tacatgtccgattataacgcaagtgaagctgaagctcgcaaacatgtgaagtggctgatc1440
gccgaagtgtggaagaagatgaacgctgaacgtgtttccaaggatagtccgtttggtaag1500
gattttattggttgcgccgttgatctgggtcgtatggcccagctgatgtatcataacggt1560
gatggtcatgggacccagcatcctattattcatcagcagatgacgcgtaccctgtttgaa1620
cctttcgccctcgagtga1638