本发明一般涉及神经生物学,并且更具体地涉及顺行(anterograde)跨单级突触神经(monosynaptic transneuronal)示踪系统。
背景技术:
绘制大脑连接组对了解大脑是如何工作来说是必不可少的。作为神经功能的基本单位,神经环路在宏观结构/功能和微分子/信号环路间起到桥梁的作用。然而,许多特定的功能神经环路的结构,包括组件,连接和分布,仍有待阐明。新的示踪技术和示踪工具,特别是病毒示踪工具,有助于发现新的环路和揭示已知的典型环路的新功能。
病毒示踪工具已经用于神经科学研究。狂犬病病毒(RV)和伪狂犬病病毒(PRV)的衍生病毒示踪工具有能力追踪神经环路去标记输入神经网络(1)。重组水泡口炎病毒(VSV)用于顺行或逆行跨突触环路示踪(2,3)。人单纯疱疹病毒1型(HSV-1)毒株H129(H129)是一个潜在的顺行跨突触神经环路的示踪工具(4,5)。
然而,跨多级突触病毒示踪工具在确定直接或非直接投射靶标时引起不可避免的模糊。因此,迫切需要的是开发顺行跨单级突触神经示踪系统,为了明确地确定直接投射靶标。
技术实现要素:
本发明提供了顺行跨单级突触(monosynaptic transneuronal)病毒示踪系统,用于绘制在一个特定的脑核团的特殊类型神经元的直接后突触靶标。在一个实施例中,所述顺行跨单级突触病毒示踪系统包括H129衍生的重组缺陷型病毒,其包含整合的第一表达盒含有第一启动子、第一荧光蛋白编码序列,和抗性肽编码序列,其中第一表达盒代替整个或部分胸腺嘧啶核苷激酶(TK)基因序列,产生的H129衍生的重组缺陷型病毒丧失了TK功能(H129-ΔTK-tdT);和AAV9衍生的重组AAV9辅助病毒(AAV9-TK-GFP和AAV9-DIO-TK-GFP),可补偿TK,其包含整合的第二表达盒含有第二启动子、TK编码序列,连接子肽编码序列,和第二荧光蛋白编码序列,其中第二表达盒的TK表达使H129衍生的重组缺陷型HSV-1病毒复制;其中所述第一和第二荧光蛋白编码序列,编码不同的荧光蛋白。
通过如下结合附图对优选实施例的详细描述,本发明的目的和优点是显而易见的。
附图说明
本发明的优选实施方案现在将参考附图进行说明,其中类似的附图标记表示相同的元件。
图1、(a)H129-wt基因组的结构示意图;(b)H129-G1基因组结构示意图;(c)H129-ΔTK-tdT基因组结构示意图;(d)构建pUS-F6;(e)构建H129-G1;(f)H129-G1单克隆PCR验证结果;(g)伴随病毒复制的GFP表达的GFP信号和导致的细胞病变效果;(h)Western Blot检测病毒蛋白;(i)VERO细胞中H129-wt和H129-G1生长曲线;(j)鼠胚海马神经元和VERO细胞中H129-G1和H129-ΔTK-tdT生长曲线。
图2、(a)辅助病毒AAV9-TK-GFP基因组的结构示意图;(b)辅助病毒AAV9-DIO-TK-GFP基因组的结构示意图。
图3、用本发明的一个实施例的顺行跨单级神经病毒示踪系统绘制野生小鼠来自VPM的直接投射。
图4、用本发明的一个实施例的顺行跨单级神经病毒示踪系统绘制DAT-Cre小鼠来自VTA-DA神经元的直接投射。
图5、用本发明的一个实施例的顺行跨单级神经病毒示踪系统绘制PV-Cre小鼠来自nRT-PV神经元的直接投射。
具体实施方式
可以通过引用以下的本发明的某些实施例的详细描述而更容易地理解本发明。
在本申请中,为了更充分地描述本发明所涉及领域状态,当出版物被引用,这些出版物的公开内容的全部经引用而并入本申请。
除非另有说明,在本发明的实践将采用分子生物学(包括重组技术),微生物学,细胞生物学,生物化学,核酸化学和免疫学的现有技术,这些是在本领域的技能之内。这些技术在文献中已有完全解释,如分子克隆:实验室说明书,第三版(Sambrook和Russel,2001年);分子生物学当代程序(FM Ausubel等主编,1987年,包括补充至2001年)。
单纯疱疹病毒1型(HSV-1)是一种普遍存在的、条件致病病原。其自然神经嗜性和跨神经突触的传播能力使其成为潜在的神经环路示踪工具。
HSV-1毒株McIntyre-B逆行传播,而HSV-1毒株H129优先顺行跨神经突触传播[7-9]。许多研究在不同的途径和不同的动物模型中的应用了这种病毒[7,10-13]。特别是,表达遗传改变的荧光蛋白(FP)的H129的研发促使了探索该病毒株在顺行神经环路中的示踪[14,15]。然而,由于有限的标记强度,这些H129衍生的示踪工具无法让突触环路可视化,也无法显示神经元形态的细节[14,15]。
腺相关病毒(AAV)感染人类和其他灵长类动物。该病毒是一个小的(病毒颗粒直径约20nm),复制缺陷型,无囊膜病毒。AAV基因组是单链脱氧核糖核酸(DNA),大约4700个碱基长。基因组包括在DNA链的两端的反向末端重复序列(ITRS),和两个开放阅读框(ORF):rep和cap。前者是由四个重叠基因组成,编码Rep蛋白的,为腺病毒生命周期相关的所需,后者包含重叠的衣壳蛋白的核苷酸序列:VP1、VP2、VP3,相互作用在一起形成二十面体对称的衣壳。
本发明提供顺行跨单级神经(monosynaptic transneuronal)病毒示踪系统,用于绘制在任一给定脑核团的特定神经类型的直接后突触靶标。简而言之,所述顺行跨单级突触病毒示踪系统包括H129衍生的重组缺陷型HSV-1病毒,和AAV9衍生的重组AAV9辅助病毒。所述H129衍生的重组缺陷型HSV-1病毒包含整合的第一表达盒含有第一启动子、第一荧光蛋白编码序列,和抗性肽编码序列,其中第一表达盒代替整个或部分胸腺嘧啶核苷激酶(TK)基因序列,产生的H129衍生的重组缺陷型HSV-1病毒H129丧失TK功能。所述AAV9衍生的重组AAV9辅助病毒包含整合的第二表达盒含有第二启动子、TK编码序列,连接子肽编码序列,和第二荧光蛋白编码序列,其中第二表达盒的TK表达使H129衍生的重组缺陷型HSV-1病毒复制。
在一些实施例中,所述第一和第二启动子是选自CMV启动子,SV40启动子,CAG启动子,EF1a启动子,TH(tyrosine hydroxylase)启动子和Syn1启动子。所述第一和第二神经元细胞特异性启动子可以是相同或不同的。在一些实施例中,第一启动子是神经元细胞特异性的。
在一些实施例中,适用于本发明的荧光蛋白编码序列可以是在目前或将来可用的任何荧光基因。荧光基因可以是野生型的或重组衍生,只要他们的荧光强度不降低。例如,所述荧光蛋白编码序列包括GFP(green fluorescent protein),eGFP(enhanced green fluorescent protein),mGFP(membrane bound form of EGFP),sfGFP(superfolder green fluorescent protein),EYFP(enhanced yellow fluorescent protein),ECFP(enhanced cyan fluorescent protein),EBFP2(enhanced blue fluorescent protein 2),tdTomato,MRFP(monomer red fluorescent protein,mCherry,Ypet,mKO,mkate,等等。所述第一和第二荧光蛋白编码序列编码不同的荧光蛋白。
在一些实施例中,所述抗性肽编码序列包括ZeoR(zeocin),AmpR(ampicillin)和CamR(chloramphenicol)。
在一些实施例中,所述连接子肽编码序列编码一个连接子多肽,其含有至少两个相邻氨基酸,他们间的肽键形成是非常低效的。在一些实施例中,所述连接子多肽含有的至少两个相邻氨基酸是甘氨酸和脯氨酸。当连接子多肽编码序列位于TK编码序列和第二荧光蛋白编码序列之间,他们被转录成一个单一转录子。当所述单一转录子被翻译时,TK和第二荧光蛋白生成为分离的蛋白(不是一个融合蛋白),由于连接子多肽阻碍肽键形成。
在一些实施例中,单纯疱疹病毒1型(HSV-1)毒株H129具有一个基因组(GenBank GU734772.1)。如图1(a)所示,H129-wt具有典型的单纯疱疹病毒的结构,包括一个单一的长序列和一个单一的短序列,每个独特组件两端分别是反向重复序列,因此可以形成4个同分异构体[16,17]。
在一些实施例中,AAV9具有一个基因组(addgene number 20298)。
如图1(c)所示,示例性H129衍生的重组缺陷型HSV-1病毒为H129-ΔTK-tdT,其包括整合的第一表达盒,含有CMVpromoter-tdtomato-ZeoR;其中第一表达盒替代TK(UL23)基因。作为一个例子,所述第一表达盒在HSV-1基因组的46617至47747替代TK(UL23)基因。所述第一表达盒中第一荧光蛋白编码序列由SEQ ID NO 1代表,编码由SEQ ID NO 2代表的tdtomato。所述第一表达盒中抗性肽编码序列由SEQ ID NO 3代表,编码由SEQ ID NO 4代表的ZeoR。
在一些实施例中,使用荧光蛋白,连接子多肽,抗性肽和TK的变体;“变体”的定义为一个多肽与一个由序列号代表的氨基酸序列有至少90%,优选95%,更优选98%,甚至更优选99%的同一性,只要变体中的变化不影响其功能。
在一些实施例中,所述H129衍生的重组缺陷型HSV-1病毒进一步含有BAC序列。BAC序列为在细菌中的遗传操作提供便利。一个示例性BAC核苷酸序列由SEQ ID NO 5代表。在一些实施例中,一个功能性BAC变体与SEQ ID NO 5有至少90%,优选95%,更优选98%,甚至更优选99%的同一性。在一些实施例中,BAC序列位于HSV-1基因组的46616-46617间。
如图2(a)所示,示例性AAV9衍生的重组AAV9辅助病毒包括整合的第二表达盒,EF1apromoter-TK-2A-GFP(命名为AAV-TK-GFP);其中表达盒插入在AAV9基因组的BamHI和EcoRI间。TK编码序列由SEQ ID NO 6代表,编码由SEQ ID NO 7代表的TK。连接子多肽编码序列由SEQ ID NO 8代表,编码由SEQ ID NO 9代表的2A。第二荧光蛋白多肽编码序列由SEQ ID NO 10代表,编码由SEQ ID NO 11代表的GFP。对于TK-2A-GFP,示例性核苷酸序列由SEQ ID NO 12代表,示例性氨基酸序列由SEQ ID NO 13代表。
如图2(b)所示,另一个示例性AAV9衍生的重组AAV9辅助病毒包括整合的第二表达盒,EF1apromoter-loxp2272-loxp-TK-2A-GFP-loxp2272-loxp(其中两对loxp,分别反向;命名为AAV-DIO-TK-GFP);其中表达盒插入在AAV9基因组的AscI和NheI间。一个示例性loxp核苷酸序列由SEQ ID NO 14代表。在一些实施例中,一个功能性loxp变体与SEQ ID NO 14有至少90%,优选95%,更优选98%,甚至更优选99%的同一性。TK编码序列由SEQ ID NO 6代表,编码由SEQ ID NO 7代表的TK。连接子多肽编码序列由SEQ ID NO 8代表,编码由SEQ ID NO 9代表的2A。第二荧光蛋白多肽编码序列由SEQ ID NO 10代表,编码由SEQ ID NO 11代表的GFP。对于TK-2A-GFP,示例性核苷酸序列由SEQ ID NO 12代表,示例性氨基酸序列由SEQ ID NO 13代表。
实施例
提供下面实施例的唯一目的是说明本发明的原理;它们决不旨在限制或缩小本发明的范围
实施例1
细胞和细胞培养
VERO-E6细胞(VERO,ATCC#CRL-1586)培养在Dulbecco培养基(DMEM)(含10%胎牛血清(FBS)和青霉素-链霉素(100单位/毫升青霉素和100μg/mL链霉素、Gibco))。
沿用常规程序,分离和培养来源于小鼠胚胎的海马神经元[20,21]。简而言之,在胚胎18.5天(E18.5)从C57BL/6小鼠的幼崽中解剖出海马,切片,进一步用胰酶/DNA酶I在37℃消化15分钟。分离的神经元用无菌汉克平衡盐溶液洗涤(HBSS)洗涤,悬浮和培养在添加了2%B27,glutamax(25μm)和青霉素-链霉素(100单位/毫升和100微克/毫升)(GIBCO)神经基本培养基中。每隔一天换一次培养基。
实施例2
构建H129-G1
将HSV-1-H129基因组(GenBank GU734772.1)克隆至带有绿色荧光蛋白基因的细菌人工染色体(BAC)上,得到H129-G1(如图1b所示)。如附图1(d)和(e)所示,具体主要步骤如下:
(2.1)提取H129-wt病毒基因组DNA
用野生型H129-wt病毒[22]以感染复数为1的病毒量感染VERO细胞,感染12小时后,刮下细胞,离心收集细胞沉淀,用solution I(10mM Tris,10mM EDTA,pH 8.0)溶液清洗一遍,再用0.5ml的solution I溶液(包含有0.25mg Proteinase K/ml(美国Roche公司);0.6%十二烷基硫酸钠(SDS)(国药集团);终浓度为1M的氯化钠)重悬细胞沉淀,50℃孵育2小时,加入终浓度为10mg/ml的RNase I(日本TaKaRa公司)37℃孵育1小时,最后再用酚氯仿(1:1)进行抽提获得核酸(DNA)沉淀,干燥后用一定量的无菌去离子水(100ul)重悬核酸沉淀。这样溶解后的DNA中含有大量的野生型的H129-wt病毒基因组DNA。
(2.2)PCR分别扩增左右同源臂
以野生型H129-wt病毒基因组为模版PCR分别扩增左右同源重组臂,其中左臂(L-arm)序列全长1605bp,位于HSV-1-H129基因组(GenBank:GU734772.1)中的No.45011-46616,右臂(R-arm)序列全长1953bp,位于基因组中的No.46617-48570。PCR反应体系(PrimeStar DNA Polymerase,TaKaRa公司)的总体积为50μl,包含10μl 5×buffer,4μl dNTP,1.5μl正向引物,1.5μl反向引物,0.5μl PrimeStar酶,1μl模板,和31.5μl水。其中左臂正向引物序列为:5’-cgggatccagactgacacattaaaaaacac-3’(SEQ ID NO 15),左臂反向引物序列:为5’-cccaagcttataacttcgtataatgtatgctatacgaagttataacacggaaggagacaataccg-3’(SEQ ID NO 16),右臂正向引物序列为5’-cccaagcttataacttcgtataatgtatgctatacgaagttattcagttagcctcccccatctc-3’(SEQ ID NO 17),右臂反向引物序列为:5’-cgggatcccttcggacctcgcgggggccgc-3’(SEQ ID NO 18)。扩增条件为:1)94℃2min;2)98℃15s;3)55℃15s;4)72℃2min;5)72℃10min;6)16℃10min;步骤2-4循环30次。然后将PCR产物进行1%琼脂糖(西班牙Biowest公司)凝胶电泳,纯化左右同源重组臂,纯化步骤完全按照试剂盒(美国omega公司)说明书来做。
(2.3)连接左右同源臂
将纯化后的左右臂DNA分别用限制性内切酶BamHI(TaKaRa公司)进行单酶切,酶切反应的总体积为50μl,DNA量为2μg,37度水浴反应约4小时后,再用1%琼脂糖凝胶电泳进行纯化,所得酶切纯化后的左右同源臂DNA直接进行连接反应,其连接反应总体积为10μl,包含1μl T4DNA Ligase(TaKaRa公司),1μl 10X buffer,8μl左右臂DNA(浓度比为1:1,16℃反应约4小时后,PCR扩增全长的左臂和右臂(L+R),其PCR扩增反应总体积为50μl,包含10μl 5×buffer,4μl dNTP,1.5μl左臂正向引物(5’-cgggatccagactgacacattaaaaaacac-3(SEQ ID NO 13)),1.5μl右臂反向引物(5’-cgggatcccttcggacctcgcgggggccgc-3’(SEQ ID NO 14)),0.5μl PrimeStar酶,1ul模板,31.5μl水。扩增条件为:1)94℃2min;2)98℃15s;3)55℃15s;4)72℃3min;5)72℃10min;6)16℃10min;步骤2-4循环30次。用1%琼脂糖凝胶电泳纯化全长同源重组臂(L+R)DNA片段。
(2.4)构建pUS-F6
将上述纯化的全长同源重组臂(L+R)DNA片段和环状pUS-F5(SEQ ID NO 59)载体分别用HindⅢ(TaKaRa公司)内切酶进行单酶切;酶切反应的总体积为50μl,包含2μg DNA,37℃水浴反应约4小时后,再用1%琼脂糖凝胶电泳,分别进行纯化;所得纯化的线性pUS-F5载体和L+R DNA片段进行连接反应,其连接反应总体积为10μl,包含1μl T4DNA Ligase(TaKaRa公司),1μl 10X buffer,4μl L+R DNA片段和4μl线性pUS-F5载体;16℃反应约4小时后直接转化进感受态E.coli DN5α细胞中,37℃过夜培养,PCR鉴定及测序,连接成功的带有左右臂同源序列的pUS-F5质粒命名为pUS-F6.
(2.5)pUS-F6的线性化
使用质粒抽提试剂盒(美国Promega公司)提取pUS-F6质粒,得到环状的pUS-F6质粒后,接着用限制性内切酶为BamHI进行单酶切反应;酶切反应的总体积为50μl,包含2μg DNA,平行设置4管酶切反应,37℃水浴反应约4小时后,直接向每管酶切反应中加入2倍的无水乙醇和20μl的醋酸钠(3M),混匀后放-80℃大约10分钟,用少量的(20μl)无菌去离子水重悬DNA沉淀,最后使用NanoDrop 2000(美国Thermo Scientific公司)测定其浓度。
(2.6)将线性化pUS-F6质粒DNA转染至293T细胞
转染前一天将细胞接种于6孔板后孵育过夜,转染当天细胞达到50-80%融合度。将2μg线性化pUS-F6质粒DNA与不含血清和抗生素的DMEM培养基(美国GIBCO公司)混匀,再加入10μl转染试剂(SuperFect Transfection Reagent,德国Qiagen公司),室温孵育10-15分钟,将转染混合液加入6孔板,培养3-4小时后,PBS清洗一次,加入DMEM完全培养基(GIBCO),CO2培养箱中于37℃培养。
(2.7)H129-wt病毒的感染
上述步骤(2.6)的质粒转染5-6小时后,用H129-wt病毒感染293T细胞,感染复数为1-3(MOI=1-3),即刻放入37℃,5%的CO2培养箱(Thermo Scientific)中培养。
(2.8)流式细胞分选
上述步骤(2.7)中病毒感染后24小时,在倒置荧光显微镜下(日本Nikon公司)观察绿色荧光蛋白的表达情况,若阳性率大于1℅即可准备细胞的分选。首先用胰酶(GIBCO)消化293T细胞,PBS清洗一遍,然后用灭菌处理的300目滤膜过滤细胞悬浮液,将流过300目滤膜的293T细胞进行流式分选,GFP表达阳性的293T细胞单独分选出来,与铺好的VERO细胞共培养。
(2.9)H129-G1重组病毒基因组DNA的制备
上述步骤(2.8)中流式分选GFP阳性的293T细胞与VERO细胞共培养大约48小时后,观察绿色荧光蛋白的表达情况。当GFP阳性率大于20℅,H129-G1重组病毒基因组DNA通过上述步骤(2.1)所描述的方法制备。
(2.10)H129-G1感染性单克隆的初步筛选和鉴定
将上述步骤(2.9)中制备的H129-G1重组病毒DNA电转化(1.6/1.8kv,25uF,200Ω,1mm)进感受态细胞DH10B(美国Invitrogen公司)中,涂布在含有氯霉素抗性(科密欧公司)的LB平板,37℃中培养36-48小时。PCR鉴定单克隆,所有的PCR反应条件参照上述步骤(2.2),鉴定的序列为H129-wt的基因,包括UL3、UL14、UL26、UL37、UL38、UL50、US3、US8和US12,它们的引物分别是UL3-F:TCGGTTTGAAAGGCATCG(SEQ ID NO 22),UL3-R:GACAAGGTCGCCATCTGCT(SEQ ID NO 23);UL14-F:
GGGCACGCGAGACTATCAGAG(SEQ ID NO 24),UL14-R:TCATTCGCCATCGGGATAGTC(SEQ ID NO 25);UL26-F:ATGGAGGAGCCCCTACCAGA(SEQ ID NO 26),UL26-R:
TACCAAAGACCGGGGCGAAT(SEQ ID NO 27);UL37-F:
TGGTAACTAGTTAACGGCAAGTCCG(SEQ ID NO 28),UL37-R:
ATGCCGGGACTTAAGTGGCCGTATA(SEQ ID NO 29);UL38-F:
ATGAAGACCAATCCGCTACCCGCA(SEQ ID NO 30),UL38-R:
AACACTCGCGTTTCGGGTTTCAGT(SEQ ID NO 31);UL50-F:
ATGAGTCAGTGGGGATCCGG(SEQ ID NO 32),UL50-R:CCCGGAACGAACCCCAAGCT(SEQ ID NO 33);US3-F:GCCAACGACCACATCCCT(SEQ ID NO 34),US3R:
CAGCGGCAAACAAAGCAG(SEQ ID NO 35);US8-F:GGGGTTTCTTCTCGGTGTTTG(SEQ ID NO 36),US8-R:GCGGTGCTGATGGTAATGTG(SEQ ID NO 37);US12-F:
AAATTGCCCTAGCACAGGGG(SEQ ID NO 38),US12-R:GGTCTCTCCGGCGCACATAA(SEQ ID NO 39),以H129-wt阳性对照,鉴定结果如图1(f)所示。
(2.11)拯救克隆化H129-G1感染性病毒
转染前一天将VERO细胞传代至6孔板,待细胞融合度为80%左右。以上述步骤(2.10)中鉴定的H129-G1感染性单克隆的DNA转染VERO细胞。转染混合液的制备如下:2μg环状H129-G1DNA,10μl SuperFect Transfection Reagent,和无血清和抗生素的DMEM培养基配成100μl混合液,室温放置5-10分钟后,再加入600μl无血清和抗生素的DMEM稀释成转染混合液。去掉细胞培养基,用预热的PBS洗一遍细胞,然后直接加上转染混合液,置于细胞培养箱培养。2-3小时后,吸去转染混合液,用PBS清洗一次,最后加入DMEM完全培养基;H129-G1感染性单克隆转染后48小时后开始出现细胞病变现象,置于倒置荧光显微镜下观察,发现病变处都可以观察到绿色荧光,说明我们的感染性单克隆的拯救是成功的,如图2(b)所示。然后继续培养直到细胞全部病变后,收集细胞培养液,即获得H129-G1重组病毒,加入1%的DMSO于-80℃冻存。
(2.12)检测重组病毒蛋白表达
VERO细胞种在100mm培养皿中后,在37℃,5%CO2条件下培养,待细胞完全贴壁后,分别用H129-wt病毒和H129-G1病毒以MOI=1感染细胞。37℃、5%CO2培养箱中吸附2h后,用含2%胎牛血清的MEM培养基替换培养皿中的病毒接种液,感染24小时后,用胰酶消化细胞,收集细胞在1000rmp离心5分钟。用预冷的PBS洗涤细胞一遍,继续离心去掉上清液。收集细胞沉淀放入液氮中冰冻10秒,作为检测样品,准备进行Western Blot实验。
Western Blot实验的操作如下:往细胞沉淀中加入50μl裂解缓冲液,利用超声破碎细胞,接着测定蛋白含量,加入5x上样Buffer,按照同等蛋白量上样(20μg),进行SDS-聚丙稀酰胺凝胶(PAGE)电泳。之后进行转膜反应,先用甲醇处理尼龙膜2分钟,然后在转膜缓冲液中浸泡15分钟后,开始转膜。转膜条件为恒流200mA,90分钟(美国Bio-Red公司)。转膜完毕后,即刻用TBST液洗膜3分钟,再用5%的牛奶/TBST封闭1小时。接着用TBST洗膜3次后,分别孵育gD和gB特异性的单克隆抗体(美国Abcam公司),洗膜后孵育二抗后并再次洗膜。最后进行化学发光显影(美国Alpha公司),结果如图1(h)所示。
(2.13)H129-wt和重组病毒H129-G1的生长曲线对比
将VERO细胞传代至6孔板(美国corning公司),细胞融合度为60-80%。待细胞完全贴壁后,用H129-wt和H129-G1感染复数MOI为0.1的病毒量分别感染细胞(此时设为感染后0小时)。孵育2小时后换掉培养基。用DMEM完全培养基开始培养感染后的细胞;然后分别在病毒感染后不同时间点2,6,12,24,36,48h收取样本并保存于-80℃。当所有的病毒样品收集完成后按照以下步骤测定每个样本的病毒滴度。
病毒滴度测定步骤如下:将VERO细胞传代至12孔板,待细胞长满,用培养基梯度稀释H129-wt和H129-G1病毒,每个浓度做3个重复,吸去12孔板里的培养基,PBS清洗一次,每孔加200μl病毒液。1~1.5h后,吸去病毒液,PBS清洗3次,再补加2ml完全培养基(含2%FBS)培养24~48h,密切观察,直至最低浓度出现的噬斑数不再增加。弃去培养基,每孔中加入300μl染色剂,孵育后,用双蒸水反复洗,然后数空斑计算滴度,结果如图1(i)所示。
实施例3
构建H129-△Tk-td
基于H129-BAC(H129-G1)同源重组改造得到H129-△Tk-td。图1(c)显示H129-△Tk-td的结构构造。
(3.1)Cassette构建
通过PCR、酶切、连接、转化将tdtomato克隆至载体pRK-zeo(SEQ ID NO 40),构建Cassette CMVpromoter-tdtomato-ZeoR,正向引物为F:gcgtcgacatggtgagcaagggcgaggag-(SEQ ID NO 41),反向引物为R:cgggatccttacttgtacagctcgtccatg(SEQ ID NO 42)。PCR反应体系(PrimeStar DNA Polymerase,TaKaRa公司)的总体积为50μl,包含10μl 5×buffer,4μl dNTP,1.5μl正向引物,1.5μl反向引物,0.5μl PrimeStar酶,1μl模板,和31.5μl水。扩增条件为:1)95℃2min;2)98℃15s;3)55℃15s;4)72℃1m30s;5)72℃10min;6)16℃10min;步骤2-4循环30次。然后将PCR产物进行1%琼脂糖(西班牙Biowest公司)凝胶电泳,纯化左右同源重组臂,纯化步骤完全按照试剂盒(美国omega公司)说明书来做。
将上述纯化的PCR产物和pRK-zeo载体(SEQ ID NO 40)分别用Sal I和Not I(TaKaRa公司)限制性内切酶进行双酶切;酶切反应的总体积为50μl,包含2μg DNA,37℃水浴反应约4小时后,再用1%琼脂糖凝胶电泳,分别进行纯化;所得酶切纯化后的载体和PCR产物直接进行连接反应,其连接反应总体积为10μl,包含1μl T4DNA Ligase(TaKaRa公司),1μl10X buffer,5μl PCR产物和3μl线性pRK-zeo载体;16℃反应约4小时后直接转化进感受态E.coli DN5α细胞中,37℃过夜培养,PCR鉴定及测序.
(3.2)含有H129-G1的活化大肠杆菌细胞的制备
(i)将含有H129-G1的E.coli DY380在含有相应抗性的LB固体平板上划线,32℃培养过夜;
(ii)挑取单克隆放入5ml LB培养基中培养,摇床,32℃培养过夜;
(iii)以1:100的比例将其转移到100ml液体培养基中,摇床,32℃培养,OD600值在0.4-0.6左右(0.55-0.6最佳),大约需要3小时;
(iv)42℃水浴15分钟;
(v)取出细菌悬浮液置于冰上10分钟左右;
(vi)4000rpm,4℃,10分钟,离心去上清;
(vii)用超纯水重悬细菌沉淀,4000rpm,4℃,10分钟,离心去上清;
(viii)用含有10﹪的甘油重悬细菌沉淀,4000rpm,4℃,10分钟,离心去上清;
(ix)重复步骤(viii)一遍。
(x)800μl含有10﹪的甘油的纯净水重悬细菌沉淀,以80μl每管分装细菌悬浮液,液氮处理冷冻,放入-80℃冻存备用。
(3.3)PCR扩增各cassette
PCR的反应体系(PrimeStar DNA Polymerase,日本TaKaRa公司)总体积为50μl,包括10μl 5×buffer,4μl dNTP,1.5μl正向引物,1.5μl反向引物,0.5μl PrimeStar酶,1μl模板,31.5μl水。引物序列如下表1所示。扩增条件为:1)95℃2min,2)98℃15s,3)55℃15s,4)72℃3min,5)72℃10min,6)16℃10min,步骤2-4循环30次。然后将PCR产物进行1%琼脂糖(西班牙Biowest公司)凝胶电泳,纯化步骤完全按照试剂盒(美国Omega公司)说明书,最后用去离子水来洗脱DNA。
表1. PCR扩增cassette的正向和反向引物序列
(3.4)电转化Cassette CMV-tdtomato-zeo和同源重组得到H129-△Tk-td
将300ng的Cassette DNA(约5-15μl)加入步骤(3.2)制备的含有H129-G1的活化大肠杆菌细胞中混匀;电击条件为:1.6/1.8kv,25uF,200Ω;电击完毕后迅速加入培养基混匀细菌并转移到1.5ml的EP管中在32℃培养1-2小时;将细菌均匀的涂布在固体LB平板(含有相应筛选抗性),32℃培养36-48h;挑取单克隆进行PCR验证;正向引物(F)为:acctctgaaagaggaacttgg(SEQ ID NO 45);反向引物(R)为:gtcaacagcgtgccgcagatc(SEQ ID NO 46)。
(3.5)拯救H129-△Tk-td病毒
将鉴定正确的含有H129-△Tk-td单克隆细菌细胞分别接种200ml的LB培养基,32℃培养过夜,然后用试剂盒(购自MN公司)提取DNA,按照说明书操作,最后用100μl去离子水溶解.转染前一天将VERO细胞传代至6孔板,待细胞融合度为80%左右。以上述提取的DNA转染VERO细胞。转染混合液的制备如下:2μg环状H129-△Tk-td DNA,10μl SuperFect Transfection Reagent,和无血清和抗生素的DMEM培养基配成100μl混合液,室温放置5-10分钟后,再加入600μl无血清和抗生素的DMEM稀释成转染混合液。去掉细胞培养基,用预热的PBS洗一遍细胞,然后直接加上转染混合液,置于细胞培养箱培养。2-3小时后,吸去转染混合液,用PBS清洗一次,最后加入DMEM完全培养基;H129-△Tk-td感染性单克隆转染后48小时后开始出现细胞病变现象,置于倒置荧光显微镜下观察,发现病变处都可以观察到绿色荧光,说明我们的感染性单克隆的拯救是成功的。然后继续培养直到细胞全部病变后,收集细胞培养液,即获得H129-△Tk-td重组病毒,加入1%的DMSO于-80℃冻存。
(3.6)H129-△Tk-td和H129-G1在VERO细胞和神经元(体外)中生长对比
生长曲线对比的操作参照步骤(2.13)。现参照图1(j),图示H129-G1和H129-△Tk-td在VERO细胞和神经元中生长曲线。H129-G1,H129-△Tk-td感染VERO细胞和神经元的MOI为0.02,在指定的时间的上清液中的子代病毒,由空斑形成试验标准检测。所显示的是从3个独立实验的平均值(标准差)。
实施例4
构建AAV-TK-2A-GFP
AAV-TK-2A-GFP的构建在AAV载体(addgene编号20298)的BamH Ⅰ和EcoR Ⅰ之间插入TK-2A-GFP序列。
PCR反应体系(PrimeStar DNA Polymerase,TaKaRa公司)总体积为50μl,包括10μl 5×buffer,4μl dNTP,1.5μl正向引物,1.5μl反向引物,0.5μl PrimeStar酶,1μl模版,31.5μl H2O。扩增条件为:1)95℃2min,2)98℃15s,3)55℃15s,4)72℃2min,5)72℃10min,6)16℃10min,步骤2-4循环30次。然后将PCR产物进行1%琼脂糖(西班牙Biowest公司)凝胶电泳,纯化步骤完全按照试剂盒(美国Omega公司)说明书来做。引物序列如下:正向引物:cgggatccatggcttcgtacccctgccatc(SEQ ID NO 47);反向引物:cggaattcttacttgtacagctcgtccatg(SEQ ID NO 48)。
将上述纯化的PCR产物和AAV载体分别用BamH Ⅰ和EcoR Ⅰ(TaKaRa公司)限制性内切酶进行双酶切;酶切反应的总体积为50μl,包含2μg DNA,37℃水浴反应约4小时后,再用1%琼脂糖凝胶电泳,分别进行纯化;所得酶切纯化后的载体和PCR产物直接进行连接反应,其连接反应总体积为10μl,包含1μl T4DNA Ligase(TaKaRa公司),1μl 10X buffer,5μl PCR产物和3μl线性AAV载体;16℃反应约4小时后直接转化进感受态E.coli DN5α细胞中,37℃过夜培养,PCR鉴定及测序。
实施例5
构建AAV-DIO-TK-2A-GFP
AAV-DIO-TK-2A-GFP的构建在AAV载体(addgene编号20298)的Asc Ⅰ和Nhe Ⅰ之间插入TK-2A-GFP序列。
PCR反应体系(PrimeStar DNA Polymerase,TaKaRa公司)总体积为50μl,包括10μl 5×buffer,4μl dNTP,1.5μl Tk-F,1.5μl Tk-R,1.5μl GFP-F,1.5μl GFP-R,0.5μl PrimeStar酶,1μl每个模版,27.5μl H2O。扩增条件为:1)95℃2min,2)98℃15s,3)55℃15s,4)72℃2min,5)72℃10min,6)16℃10min,步骤2-4循环30次。然后将PCR产物进行1%琼脂糖(西班牙Biowest公司)凝胶电泳,纯化步骤完全按照试剂盒(美国Omega公司)说明书来做。引物序列如下:Tk-F:ctagctagc atggcttcgtacccctgccatc(SEQ ID NO 49);Tk-R:attctcctcgacgtcaccgcatgttagcagacttcc tctgccctcgttagcctcccccatctcccg(SEQ ID NO 50);GFP-F:ggaagtctgctaacatgcggtgacgtcgaggagaat cctggcccagtgagcaagggcgaggagctg(SEQ ID NO 51):GFP-R:ttggcgcgccttacttgtacagctcgtccatg(SEQ ID NO 52)。
将上述纯化的PCR产物和AAV载体分别用Asc Ⅰ和Nhe Ⅰ(TaKaRa公司)限制性内切酶进行双酶切;酶切反应的总体积为50μl,包含2μg DNA,37℃水浴反应约4小时后,再用1%琼脂糖凝胶电泳,分别进行纯化;所得酶切纯化后的载体和PCR产物直接进行连接反应,其连接反应总体积为10μl,包含1μl T4DNA Ligase(TaKaRa公司),1μl 10X buffer,5μl PCR产物和3μl线性AAV载体;16℃反应约4小时后直接转化进感受态E.coli DN5α细胞中,37℃过夜培养,PCR鉴定及测序。
实施例6
AAV辅助病毒的包装
质粒AAV-DIO-TK-2A-GFP和AAV-TK-2A-GFP提供给和元生物技术(上海)有限公司包装,病毒滴度约为AAV-DIO-TK-2A-GFP:1X1013v.g./ml
AAV-TK-2A-GFP:5X1012v.g./ml。
实施例7
脑内注射病毒
用立体定位系统,在BSL-2动物实验室,按照批准的SOP,对成年野生型C57BL/6,DAT-Cre小鼠和PV-Cre小鼠进行脑内注射病毒。DAT-Cre转基因小鼠在多巴胺(DA)神经元中特异表达Cre重组酶,表达受多巴胺转运体(DAT)启动子的控制;PV Cre转基因小鼠在PV(光伏)中间神经元表达Cre重组酶。都是C57BL/6背景。麻醉动物的脑内注射病毒用到机动立体定向器(Stoelting Co.)。根据小鼠脑地图,用内外侧(ML),前后(AP)和背腹(DV)与Bregma的距离测定小鼠核的确切位置(7)(8)。当有注明时,Alexa Fluor 594共轭霍乱毒素B亚单位(CTB)(Invitrogen)是随着注入病毒。
脑内注射病毒,应用到8-10周龄的雄性小鼠时,没有随机化或致盲。病毒注射后每天监测动物,如果观察到严重的疾病,实验将被终止,动物将被排除在外。
实施例8
检查神经环路示踪
利用切片机(HM550,Thermo)冰冻切片获得冠状脑切片,厚度40μm。一抗是兔抗红色荧光蛋白的多克隆抗体(Takara,猫。#632496),二抗是Alexa Fluor 594耦合的羊抗兔IgG(H+L)抗体(Invitrogen,#R37117);tdTomato信号由一抗和二抗进行放大。细胞核染色用Hoechst染料33342(Thermo Fisher Scientific,#H3570),神经元细胞用兔抗NeuN染色(Abcam,#ab104225)和Alexa Fluor 647标记的羊抗兔抗体(Life Technologies,#A-21245)。使用尼康的A1R MP+激光共聚焦显微镜配备高分辨率快速振镜扫描得到图像。
实施例9
双光子荧光显微光学切片成像(fMOST)
fMOST成像标本嵌入9100甲基丙烯酸甲酯(MMA,Electron Microscopy Sciences),如前所述([24])。简而言之,PFA固定的动物大脑用0.01M PBS冲洗12h,用一系列醇(50%,75%,95%,100%和100%的乙醇,每个浓度2h)完全脱水,接着浸泡在二甲苯两次(每次2h)以至透明。然后渗透标本,转移到明胶胶囊和浸渍在聚合溶液中。最后,带试样的胶囊被封闭和保存在干燥室,暗处,4℃,72h。聚合完成后,使用fMOST系统全脑成像,数据采集率的像素大小为0.5μm×0.5μm×1μm[25,26]。最后,对获得的数据集的图像叠加转化为大数据,应用Amira软件(Visage Software,USA)进行三维图像重建[27]。
实施例10
H129-G1和H129-ΔTK-tdT的生长比较
为了生长曲线,用感染复数为0.01的H129-G1和H129-ΔTK-tdT感染鼠胎海马神经元和VERO细胞。在所示感染后时间点,用标准噬斑形成法测定上清中病毒滴度(图1(j))。显示的是来自3个独立实验的平均值±标准方差。H129-ΔTK-tdT在VERO细胞中显示轻度生长延迟,但是在培养的海马神经元中,有严重受损的复制动力学。
实施例11
绘制野生型小鼠来自VPM的直接投射
现参照图3,用本发明一个实施例的顺行跨单级突触病毒示踪系统绘制野生型小鼠来自VPM的直接投射,其中所述顺行跨单级突触病毒示踪系统包括AAV9-TK-GFP和H129-ΔTK-tdT。(a)为了Cre-独立单级突触示踪,实验设计的时间线示意图。(b-c)对照组,单独辅助病毒和缺陷型病毒。AAV9-TK-GFP(3.5x108v.g.,350nl)和H129-ΔTK-tdT(5x105pfu,250nl),单独注射到野生型C57BL/6的VMP。照片在感染后21天(b)和10天(c)。注射区域用白色箭头头标示。(d)H129-ΔTK-tdT传播的起始神经元。AAV9-TK-GFP和H129-ΔTK-tdT在第1和22天顺序地注射到野生型C57BL/6的VMP。第25天获取脑组织;脑切片用Hoechst33342和抗dsRed抗体染色。注射点的放大形象(d1),代表区域进一步放大(d2)。白色箭头头标示tdT和GFP双表达的神经元。(e-f)示踪VPM支配的脑区。第32天,VPM支配的脑区的代表性示踪形象,包括nRT(e1)和S1(f1-3)。被AAV9-TK-GFP标记的VPM投射纤维同样存在(e2)。
为了确认H129-ΔTK-tdT特异性单级突触顺行示踪能力,AAV9-TK-GFP(3.5x108v.g.,350nl)和H129-ΔTK-tdT(5x105pfu,250nl),注射到野生型C57BL/6的VMP(图3a)。当单独注射时,VPM中的神经元相应的标记上GFP或tdT(图3b-c)。标记细胞的位置和分布局限在注射点,表明TK缺失阻止H129-ΔTK-tdT跨神经传播。为了顺行单级突触示踪,AAV9-TK-GFP注射到VPM(第一天),接着21天后(第22天)注射H129-ΔTK-tdT到同一位点。注射H129-ΔTK-tdT三天后(第25天),在注射位点观察到双表达GFP和tdT的神经元。这些双标记的神经元是始发细胞,在其中AAV9-TK-GFP辅助病毒提供TK,补充和帮助H129-ΔTK-tdT产生病毒示踪颗粒(图3d)。产生的病毒示踪颗粒传播到下一个,并且是唯一的下一个顺行神经元。到H129-ΔTK-tdT感染后10天(第32天),tdT标记的神经元在nRT检测到(图3(e1)),表明H129-ΔTK-tdT从VPM到nRT神经元的通过一个突触的顺行传播。基于内在的GFP信号,可以看见起源于注射的VPM的轴突纤维(图3(e2))。在S1,稀疏但清晰TdT标记的神经元可观察到(图3(f)),其中少数GFP标记的纤维也同样存在。因此,H129-ΔTK-tdT和AAV9-TK-GFP构成一个新的顺行单级突触示踪系统。为更好地可视化,跨突触的tdT信号由抗体染色放大。
实施例12
绘制DAT-Cre小鼠来自VTA-DA神经元的直接投射
现参照图4,用本发明一个实施例的顺行跨单级突触病毒示踪系统绘制DAT-Cre小鼠来自VTA-DA神经元的直接投射,其中所述顺行跨单级突触病毒示踪系统包括AAV9-DIO-TK-GFP和H129-ΔTK-tdT。(a)为了Cre依赖单级突触示踪,实验设计的时间线示意图。(b)在VTA中来自DA神经元的直接投射的示意图。DA神经元,多巴胺能神经元;VTA,中脑腹侧被盖区;Hipp CA3,在海马的CA3区;mPFC,前额叶皮质;NAc,内侧前额叶皮质;Amy,杏仁核。(c-d)对照组,单独辅助病毒和缺陷型病毒。AAV9-DIO-TK-GFP(109v.g.,350nl)和H129-ΔTK-tdT(106pfu,250nl),单独注射到DAT-Cre小鼠的VTA。照片在感染后21天(c)和10天(d)。注射区域用白色箭头头标示。(e)H129-ΔTK-tdT传播的起始神经元。AAV9-DIO-TK-GFP和H129-ΔTK-tdT在第1和22天顺序地注射到DAT-Cre小鼠的VTA。第25天获取脑组织;脑切片用Hoechst33342和抗dsRed抗体染色。注射点的放大形象(e1),代表区域进一步放大(e2和e3)。白色箭头头标示tdT和GFP双表达的神经元。(f-h)示踪由VTA-DA神经元支配的脑区。第32天,VTA-DA神经元支配的脑区的代表性示踪形象。代表性形象有Hipp(f1和f4),Amy(f4-5),mPFC(g)和NAc(h);框内区域用更高放大显示。
H129-ΔTK-tdT与AAV9-DIO-TK-GFP结合使用,绘制Cre表达的神经元的直接后突触靶标(图4(a))。为了这个目的,我们使用DAT Cre转基因小鼠,多巴胺转运体(DAT)启动子控制下在多巴胺(DA)神经元中特异性表达Cre重组酶。AAV9-DIO-TK-GFP和H129-ΔTK-tdT顺序地注射到VTA,目标DA神经元,其直接投射到Hipp CA3,mPFC,NAc和Amy(图4(b))[28]。注射AAV9-DIO-TK-GFP或者H129-ΔTK-tdT到VTA,导致只在VTA内标记神经元(图4(c)-(d))。当两个表达顺序注射时,共表达GFP和tdT的神经元在VTA观察到(图4(a),(c))。由于AAV9-DIO-TK-GFP只在Cre表达的细胞中表达GFP和TK,含有AAV9-DIO-TK-GFP和H129-ΔTK-tdT的黄色神经元代表DA神经元,从此顺行表达示踪开始。与已知VTA-DA神经元投射规律吻合,H129-ΔTK-tdT成功地在Amy,Hipp-CA3,mPFC和NAc中传播和标记神经元(图4(f)-(g))。
实施例13
绘制PV-Cre小鼠来自nRT-PV神经元的直接投射
现参照图5,用本发明一个实施例的顺行跨单级突触病毒示踪系统绘制PV-Cre小鼠来自nRT-PV神经元的直接投射,其中所述顺行跨单级突触病毒示踪系统包括AAV9-DIO-TK-GFP和H129-ΔTK-tdT。(a)来自nRT-PV直接投射的图示。PV神经元,小白蛋白神经元;nRT,丘脑网状核;PF,丘脑束旁核;PAG、中脑导水管周围灰质;RMC,红核大细胞部;VM,腹内侧核;Po,丘脑后核群;VP,腹后核;RPC,红核,小细胞部分。(b-c)对照组,单独辅助病毒和缺陷型病毒。AAV9-DIO-TK-GFP(109v.g.,350nl)和H129-ΔTK-tdT(106pfu,250nl),单独注射到PV-Cre小鼠的nRT-PV。照片在感染后21天(b)和10天(c)。注射区域用白色箭头头标示。(d)病毒传播的起始神经元。AAV9-DIO-TK-GFP和H129-ΔTK-tdT在第1和22天顺序地注射到PV-Cre小鼠的nRT-PV。第25天获取图像。显示nRT注射点的图像,代表区域进一步放大(d1)。白色箭头标示tdT和GFP双表达的神经元。(f-j)由nRT-PV神经元支配的脑区的代表图像。由nRT-PV神经元支配的脑区的代表图像在第32天获得。显示VP,VM,Po(f)、PF(g)、PAG(h)、RPC(i)和RMC(j)的代表性图像,框内区域相应放大。这在PV-Cre转基因小鼠上验证了这种单级突触病毒示踪系统。
尽管本发明参照特异的实施方式来描述,但是将被理解的是,实施例是说明性的,本发明的范围并不局限于此。本发明的替代实施例对本发明涉及的领域的普通技术人员将变得显而易见。这样的替代实施例都被认为是包含在本发明的精神和范围之内。因此,本发明的范围由所附的权利要求被描述,由前面的描述所支持。
参考文献
1. Nassi JJ,Cepko CL,Born RT,Beier KT.2015.Neuroanatomy goes viral!Front Neuroanat 9:80.
2. Beier KT,Saunders AB,Oldenburg IA,Sabatini BL,Cepko CL.2013.Vesicular stomatitis virus with the rabies virus glycoprotein directs retrograde transsynaptic transport among neurons in vivo.Front Neural Circuits 7:11.
3. Beier KT,Saunders A,Oldenburg IA,Miyamichi K,Akhtar N,Luo L,Whelan SP,Sabatini B,Cepko CL.2011.Anterograde or retrograde transsynaptic labeling of CNS neurons with vesicular stomatitis virus vectors.Proc Natl Acad Sci U S A 108:15414-15419.
4. McGovern AE,Driessen AK,Simmons DG,Powell J,Davis-Poynter N,Farrell MJ,Mazzone SB.2015.Distinct brainstem and forebrain circuits receiving tracheal sensory neuron inputs revealed using a novel conditional anterograde transsynaptic viral tracing system.J Neurosci 35:7041-7055.
5. Lo L,Anderson DJ.2011.A Cre-dependent,anterograde transsynaptic viral tracer for mapping output pathways of genetically marked neurons.Neuron 72:938-950.
6. Zemanick MC,Strick PL,Dix RD.1991.Direction of transneuronal transport of herpes simplex virus 1in the primate motor system is strain-dependent.Proc Natl Acad Sci U S A 88:8048-8051.
7. LaVail JH,Topp KS,Giblin PA,Garner JA.1997.Factors that contribute to the transneuronal spread of herpes simplex virus.J Neurosci Res 49:485-496.
8. Sun N,Cassell MD,Perlman S.1996.Anterograde,transneuronal transport of herpes simplex virus type 1strain H129in the murine visual system.J Virol 70:5405-5413.
9. Barnett EM,Evans GD,Sun N,Perlman S,Cassell MD.1995.Anterograde tracing of trigeminal afferent pathways from the murine tooth pulp to cortex using herpes simplex virus type 1.J Neurosci 15:2972-2984.
10. Rinaman L,Schwartz G.2004.Anterograde transneuronal viral tracing of central viscerosensory pathways in rats.Journal of Neuroscience 24:2782-2786.
11. Kelly RM,Strick PL.2003.Cerebellar loops with motor cortex and prefrontal cortex of a nonhuman primate.J Neurosci 23:8432-8444.
12. Archin NM,Atherton SS.2002.Rapid spread of a neurovirulent strain of HSV-1through the CNS of BALB/c mice following anterior chamber inoculation.J Neurovirol 8:122-135.
13. Beier KT,Mundell NA,Pan YA,Cepko CL.2016.Anterograde or Retrograde Transsynaptic Circuit Tracing in Vertebrates with Vesicular Stomatitis Virus Vectors.Curr Protoc Neurosci 74:12621-212627.
14. McGovern AE,Davis-Poynter N,Rakoczy J,Phipps S,Simmons DG,Mazzone SB.2012.Anterograde neuronal circuit tracing using a genetically modified herpes simplex virus expressing EGFP.J Neurosci Methods 209:158-167.
15. Balakrishnan B,Jayandharan GR.2014.Basic biology of adeno-associated virus(AAV)vectors used in gene therapy.Curr Gene Ther 14:86-100.
16. Wadsworth S,Jacob RJ,Roizman B.1975.Anatomy of herpes simplex virus DNA.II.Size,composition,and arrangement of inverted terminal repetitions.J Virol 15:1487-1497.
17. Delius H,Clements JB.1976.A partial denaturation map of herpes simplex virus type 1DNA:evidence for inversions of the unique DNA regions.J Gen Virol 33:125-133.
18. He B,Chou J,Brandimarti R,Mohr I,Gluzman Y,Roizman B.1997.Suppression of the phenotype of gamma(1)34.5-herpes simplex virus 1:failure of activated RNA-dependent protein kinase to shut off protein synthesis is associated with a deletion in the domain of the alpha47 gene.J Virol 71:6049-6054.
19. Seibenhener ML,Wooten MW.2012.Isolation and culture of hippocampal neurons from prenatal mice.J Vis Exp doi:10.3791/3634.
20. Park JW,Vahidi B,Taylor AM,Rhee SW,Jeon NL.2006.Microfluidic culture platform for neuroscience research.Nat Protoc 1:2128-2136.
21. Szpara ML,Parsons L,Enquist LW.2010.Sequence variability in clinical and laboratory isolates of herpes simplex virus 1 reveals new mutations.J Virol 84:5303-5313.
22. Paxinos G,Franklin KBJ.2003.The Mouse Brain in Stereotaxic Coordinates.Academic Press.
23. Zhou J-N,Ni R-J.2017.The Tree Shrew(Tupaia belangeri chinensis)Brain in Stereotaxic Coordinates.Springer Singapore.
24. Xiong H,Zhou Z,Zhu M,Lv X,Li A,Li S,Li L,Yang T,Wang S,Yang Z,Xu T,Luo Q,Gong H,Zeng S.2014.Chemical reactivation of quenched fluorescent protein molecules enables resin-embedded fluorescence microimaging.Nat Commun 5:3992.
25. Zheng T,Yang Z,Li A,Lv X,Zhou Z,Wang X,Qi X,Li S,Luo Q,Gong H,Zeng S.2013.Visualization of brain circuits using two-photon fluorescence micro-optical sectioning tomography.Opt Express 21:9839-9850.
26. Xiong HQ,Zhou ZQ,Zhu MQ,Lv XH,Li AA,Li SW,Li LH,Yang T,Wang SM,Yang ZQ,Xu TH,Luo QM,Gong H,Zeng SQ.2014.Chemical reactivation of quenched fluorescent protein molecules enables resin-embedded fluorescence microimaging.Nature Communications 5.
27. Gong H,Zeng SQ,Yan C,Lv XH,Yang ZQ,Xu TH,Feng Z,Ding WX,Qi XL,Li AA,Wu JP,Luo QM.2013.Continuously tracing brain-wide long-distance axonal projections in mice at a one-micron voxel resolution.Neuroimage 74:87-98.
28. Kuan L,Li Y,Lau C,Feng D,Bernard A,Sunkin SM,Zeng H,Dang C,Hawrylycz M,Ng L.2015.Neuroinformatics of the Allen Mouse Brain Connectivity Atlas.Methods 73:4-17。
SEQUENCE LISTING
<110> Wuhan Institute of Virology, Chinese Academy of Sciences
中国科学院武汉病毒研究所
<120> ANTEROGRADE MONOSYNAPTIC TRANSNEURONAL TRACER SYSTEM
顺行跨单级突触神经示踪系统
<130> 1003.P002
<160> 52
<170> PatentIn version 3.5
<210> 1
<211> 1431
<212> DNA
<213> Artificial Sequence
<220>
<223> tdtomato
<400> 1
atggtgagca agggcgagga ggtcatcaaa gagttcatgc gcttcaaggt gcgcatggag 60
ggctccatga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggcacccaga ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcat gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc 240
cccgattaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gtctggtgac cgtgacccag gactcctccc tgcaggacgg cacgctgatc 360
tacaaggtga agatgcgcgg caccaacttc ccccccgacg gccccgtaat gcagaagaag 420
accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccacc aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagacc 540
atctacatgg ccaagaagcc cgtgcaactg cccggctact actacgtgga caccaagctg 600
gacatcacct cccacaacga ggactacacc atcgtggaac agtacgagcg ctccgagggc 660
cgccaccacc tgttcctggg gcatggcacc ggcagcaccg gcagcggcag ctccggcacc 720
gcctcctccg aggacaacaa catggccgtc atcaaagagt tcatgcgctt caaggtgcgc 780
atggagggct ccatgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc 840
tacgagggca cccagaccgc caagctgaag gtgaccaagg gcggccccct gcccttcgcc 900
tgggacatcc tgtcccccca gttcatgtac ggctccaagg cgtacgtgaa gcaccccgcc 960
gacatccccg attacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg 1020
aacttcgagg acggcggtct ggtgaccgtg acccaggact cctccctgca ggacggcacg 1080
ctgatctaca aggtgaagat gcgcggcacc aacttccccc ccgacggccc cgtaatgcag 1140
aagaagacca tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg 1200
aagggcgaga tccaccaggc cctgaagctg aaggacggcg gccactacct ggtggagttc 1260
aagaccatct acatggccaa gaagcccgtg caactgcccg gctactacta cgtggacacc 1320
aagctggaca tcacctccca caacgaggac tacaccatcg tggaacagta cgagcgctcc 1380
gagggccgcc accacctgtt cctgtacggc atggacgagc tgtacaagta a 1431
<210> 2
<211> 476
<212> PRT
<213> Artificial Sequence
<220>
<223> tdtomato
<400> 2
Met Val Ser Lys Gly Glu Glu Val Ile Lys Glu Phe Met Arg Phe Lys
1 5 10 15
Val Arg Met Glu Gly Ser Met Asn Gly His Glu Phe Glu Ile Glu Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys
35 40 45
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
50 55 60
Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile
65 70 75 80
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
85 90 95
Val Met Asn Phe Glu Asp Gly Gly Leu Val Thr Val Thr Gln Asp Ser
100 105 110
Ser Leu Gln Asp Gly Thr Leu Ile Tyr Lys Val Lys Met Arg Gly Thr
115 120 125
Asn Phe Pro Pro Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
130 135 140
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145 150 155 160
Glu Ile His Gln Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val
165 170 175
Glu Phe Lys Thr Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
180 185 190
Tyr Tyr Tyr Val Asp Thr Lys Leu Asp Ile Thr Ser His Asn Glu Asp
195 200 205
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ser Glu Gly Arg His His Leu
210 215 220
Phe Leu Gly His Gly Thr Gly Ser Thr Gly Ser Gly Ser Ser Gly Thr
225 230 235 240
Ala Ser Ser Glu Asp Asn Asn Met Ala Val Ile Lys Glu Phe Met Arg
245 250 255
Phe Lys Val Arg Met Glu Gly Ser Met Asn Gly His Glu Phe Glu Ile
260 265 270
Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys
275 280 285
Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu
290 295 300
Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala
305 310 315 320
Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp
325 330 335
Glu Arg Val Met Asn Phe Glu Asp Gly Gly Leu Val Thr Val Thr Gln
340 345 350
Asp Ser Ser Leu Gln Asp Gly Thr Leu Ile Tyr Lys Val Lys Met Arg
355 360 365
Gly Thr Asn Phe Pro Pro Asp Gly Pro Val Met Gln Lys Lys Thr Met
370 375 380
Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu
385 390 395 400
Lys Gly Glu Ile His Gln Ala Leu Lys Leu Lys Asp Gly Gly His Tyr
405 410 415
Leu Val Glu Phe Lys Thr Ile Tyr Met Ala Lys Lys Pro Val Gln Leu
420 425 430
Pro Gly Tyr Tyr Tyr Val Asp Thr Lys Leu Asp Ile Thr Ser His Asn
435 440 445
Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ser Glu Gly Arg His
450 455 460
His Leu Phe Leu Tyr Gly Met Asp Glu Leu Tyr Lys
465 470 475
<210> 3
<211> 472
<212> DNA
<213> Artificial Sequence
<220>
<223> ZeoR including an EM7 promoter
<400> 3
caagtttcga ggtcgagtgt cagtcctgct cctcggccac gaagtgcacg cagttgccgg 60
ccgggtcgcg cagggcgaac tcccgccccc acggctgctc gccgatctcg gtcatggccg 120
gcccggaggc gtcccggaag ttcgtggaca cgacctccga ccactcggcg tacagctcgt 180
ccaggccgcg cacccacacc caggccaggg tgttgtccgg caccacctgg tcctggaccg 240
cgctgatgaa cagggtcacg tcgtcccgga ccacaccggc gaagtcgtcc tccacgaagt 300
cccgggagaa cccgagccgg tcggtccaga actcgaccgc tccggcgacg tcgcgcgcgg 360
tgagcaccgg aacggcactg gtcaacttgg ccatggttta gttcctcacc ttgtcgtatt 420
atactatgcc gatatactat gccgatgatt aattgtcaac acggtccgtt cc 472
<210> 4
<211> 124
<212> PRT
<213> Artificial Sequence
<220>
<223> ZeoR
<400> 4
Met Ala Lys Leu Thr Ser Ala Val Pro Val Leu Thr Ala Arg Asp Val
1 5 10 15
Ala Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp
20 25 30
Phe Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu
35 40 45
Phe Ile Ser Ala Val Gln Asp Gln Val Val Pro Asp Asn Thr Leu Ala
50 55 60
Trp Val Trp Val Arg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu
65 70 75 80
Val Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu
85 90 95
Ile Gly Glu Gln Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro Ala
100 105 110
Gly Asn Cys Val His Phe Val Ala Glu Glu Gln Asp
115 120
<210> 5
<211> 10094
<212> DNA
<213> Artificial Sequence
<220>
<223> BAC
<400> 5
cgctcagaag aactcgtcaa gaaggcgata gaaggcgatg cgctgcgaat cgggagcggc 60
gataccgtaa agcacgagga agcggtcagc ccattcgccg ccaagctctt cagcaatatc 120
acgggtagcc aacgctatgt cctgatagcg gtccgccaca cccagccggc cacagtcgat 180
gaatccagaa aagcggccat tttccaccat gatattcggc aagcaggcat cgtcatgggt 240
cacgacgaga tcctcgccgt cgggcatgct cgccttgagc ctggcgaaca gttcggctgg 300
cgcgagcccc tgatgctctt cgtccagatc atcctgatcg acaagaccgg cttccatccg 360
agtacgtgct cgctcgatgc gatgtttcgc ttggtggtcg aatgggcagg tagccggatc 420
aagcgtatgc agccgccgca ttgcatcagc catgatggat actttctcgg caggagcaag 480
gtgagatgac aggagatcct gccccggcac ttcgcccaat agcagccagt cccttcccgc 540
ttcagtgaca acgtcgagca cagctgcgca aggaacgccc gtcgtggcca gccacgatag 600
ccgcgctgcc tcgtcttgca gttcattcag ggcaccggac aggtcggtct tgacaaaaag 660
aaccgggcgc ccctgcgctg acagccggaa cacggcggca tcagagcagc cgattgtctg 720
ttgtgcccag tcatagccga atagcctctc cacccaagcg gccggagaac ctgcgtgcaa 780
tccatcttgt tcaatcattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa 840
tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 900
aacgtctcat tttcgccaaa agttggccca gggcttcccg gtatcaacag ggacaccagg 960
atttatttat tctgcgaagt gatcttccgt cacaggtatt tattcgcgat aagctcatgg 1020
agcggcgtaa ccgtcgcaca ggaaggacag agaaagcgcg gatctgggaa gtgacggaca 1080
gaacggtcag gacctggatt ggggaggcgg ttgccgccgc tgctgctgac ggtgtgacgt 1140
tctctgttcc ggtcacacca catacgttcc gccattccta tgcgatgcac atgctgtatg 1200
ccggtatacc gctgaaagtt ctgcaaagcc tgatgggaca taagtccatc agttcaacgg 1260
aagtctacac gaaggttttt gcgctggatg tggctgcccg gcaccgggtg cagtttgcga 1320
tgccggagtc tgatgcggtt gcgatgctga aacaattatc ctgagaataa atgccttggc 1380
ctttatatgg aaatgtggaa ctgagtggat atgctgtttt tgtctgttaa acagagaagc 1440
tggctgttat ccactgagaa gcgaacgaaa cagtcgggaa aatctcccat tatcgtagag 1500
atccgcatta ttaatctcag gagcctgtgt agcgtttata ggaagtagtg ttctgtcatg 1560
atgcctgcaa gcggtaacga aaacgatttg aatatgcctt caggaacaat agaaatcttc 1620
gtgcggtgtt acgttgaagt ggagcggatt atgtcagcaa tggacagaac aacctaatga 1680
acacagaacc atgatgtggt ctgtcctttt acagccagta gtgctcgccg cagtcgagcg 1740
acagggcgaa gccctcgagt gagcgaggaa gcaccaggga acagcactta tatattctgc 1800
ttacacacga tgcctgaaaa aacttccctt ggggttatcc acttatccac ggggatattt 1860
ttataattat tttttttata gtttttagat cttctttttt agagcgcctt gtaggccttt 1920
atccatgctg gttctagaga aggtgttgtg acaaattgcc ctttcagtgt gacaaatcac 1980
cctcaaatga cagtcctgtc tgtgacaaat tgcccttaac cctgtgacaa attgccctca 2040
gaagaagctg ttttttcaca aagttatccc tgcttattga ctctttttta tttagtgtga 2100
caatctaaaa acttgtcaca cttcacatgg atctgtcatg gcggaaacag cggttatcaa 2160
tcacaagaaa cgtaaaaata gcccgcgaat cgtccagtca aacgacctca ctgaggcggc 2220
atatagtctc tcccgggatc aaaaacgtat gctgtatctg ttcgttgacc agatcagaaa 2280
atctgatggc accctacagg aacatgacgg tatctgcgag atccatgttg ctaaatatgc 2340
tgaaatattc ggattgacct ctgcggaagc cagtaaggat atacggcagg cattgaagag 2400
tttcgcgggg aaggaagtgg ttttttatcg ccctgaagag gatgccggcg atgaaaaagg 2460
ctatgaatct tttccttggt ttatcaaacg tgcgcacagt ccatccagag ggctttacag 2520
tgtacatatc aacccatatc tcattccctt ctttatcggg ttacagaacc ggtttacgca 2580
gtttcggctt agtgaaacaa aagaaatcac caatccgtat gccatgcgtt tatacgaatc 2640
cctgtgtcag tatcgtaagc cggatggctc aggcatcgtc tctctgaaaa tcgactggat 2700
catagagcgt taccagctgc ctcaaagtta ccagcgtatg cctgacttcc gccgccgctt 2760
cctgcaggtc tgtgttaatg agatcaacag cagaactcca atgcgcctct catacattga 2820
gaaaaagaaa ggccgccaga cgactcatat cgtattttcc ttccgcgata tcacttccat 2880
gacgacagga tagtctgagg gttatctgtc acagatttga gggtggttcg tcacatttgt 2940
tctgacctac tgagggtaat ttgtcacagt tttgctgttt ccttcagcct gcatggattt 3000
tctcatactt tttgaactgt aatttttaag gaagccaaat ttgagggcag tttgtcacag 3060
ttgatttcct tctctttccc ttcgtcatgt gacctgatat cgggggttag ttcgtcatca 3120
ttgatgaggg ttgattatca cagtttatta ctctgaattg gctatccgcg tgtgtacctc 3180
tacctggagt ttttcccacg gtggatattt cttcttgcgc tgagcgtaag agctatctga 3240
cagaacagtt cttctttgct tcctcgccag ttcgctcgct atgctcggtt acacggctgc 3300
ggcgagcgct agtgataata agtgactgag gtatgtgctc ttcttatctc cttttgtagt 3360
gttgctctta ttttaaacaa ctttgcggtt ttttgatgac tttgcgattt tgttgttgct 3420
ttgcagtaaa ttgcaagatt taataaaaaa acgcaaagca atgattaaag gatgttcaga 3480
atgaaactca tggaaacact taaccagtgc ataaacgctg gtcatgaaat gacgaaggct 3540
atcgccattg cacagtttaa tgatgacagc ccggaagcga ggaaaataac ccggcgctgg 3600
agaataggtg aagcagcgga tttagttggg gtttcttctc aggctatcag agatgccgag 3660
aaagcagggc gactaccgca cccggatatg gaaattcgag gacgggttga gcaacgtgtt 3720
ggttatacaa ttgaacaaat taatcatatg cgtgatgtgt ttggtacgcg attgcgacgt 3780
gctgaagacg tatttccacc ggtgatcggg gttgctgccc ataaaggtgg cgtttacaaa 3840
acctcagttt ctgttcatct tgctcaggat ctggctctga aggggctacg tgttttgctc 3900
gtggaaggta acgaccccca gggaacagcc tcaatgtatc acggatgggt accagatctt 3960
catattcatg cagaagacac tctcctgcct ttctatcttg gggaaaagga cgatgtcact 4020
tatgcaataa agcccacttg ctggccgggg cttgacatta ttccttcctg tctggctctg 4080
caccgtattg aaactgagtt aatgggcaaa tttgatgaag gtaaactgcc caccgatcca 4140
cacctgatgc tccgactggc cattgaaact gttgctcatg actatgatgt catagttatt 4200
gacagcgcgc ctaacctggg tatcggcacg attaatgtcg tatgtgctgc tgatgtgctg 4260
attgttccca cgcctgctga gttgtttgac tacacctccg cactgcagtt tttcgatatg 4320
cttcgtgatc tgctcaagaa cgttgatctt aaagggttcg agcctgatgt acgtattttg 4380
cttaccaaat acagcaatag taatggctct cagtccccgt ggatggagga gcaaattcgg 4440
gatgcctggg gaagcatggt tctaaaaaat gttgtacgtg aaacggatga agttggtaaa 4500
ggtcagatcc ggatgagaac tgtttttgaa caggccattg atcaacgctc ttcaactggt 4560
gcctggagaa atgctctttc tatttgggaa cctgtctgca atgaaatttt cgatcgtctg 4620
attaaaccac gctgggagat tagataatga agcgtgcgcc tgttattcca aaacatacgc 4680
tcaatactca accggttgaa gatacttcgt tatcgacacc agctgccccg atggtggatt 4740
cgttaattgc gcgcgtagga gtaatggctc gcggtaatgc cattactttg cctgtatgtg 4800
gtcgggatgt gaagtttact cttgaagtgc tccggggtga tagtgttgag aagacctctc 4860
gggtatggtc aggtaatgaa cgtgaccagg agctgcttac tgaggacgca ctggatgatc 4920
tcatcccttc ttttctactg actggtcaac agacaccggc gttcggtcga agagtatctg 4980
gtgtcataga aattgccgat gggagtcgcc gtcgtaaagc tgctgcactt accgaaagtg 5040
attatcgtgt tctggttggc gagctggatg atgagcagat ggctgcatta tccagattgg 5100
gtaacgatta tcgcccaaca agtgcttatg aacgtggtca gcgttatgca agccgattgc 5160
agaatgaatt tgctggaaat atttctgcgc tggctgatgc ggaaaatatt tcacgtaaga 5220
ttattacccg ctgtatcaac accgccaaat tgcctaaatc agttgttgct cttttttctc 5280
accccggtga actatctgcc cggtcaggtg atgcacttca aaaagccttt acagataaag 5340
aggaattact taagcagcag gcatctaacc ttcatgagca gaaaaaagct ggggtgatat 5400
ttgaagctga agaagttatc actcttttaa cttctgtgct taaaacgtca tctgcatcaa 5460
gaactagttt aagctcacga catcagtttg ctcctggagc gacagtattg tataagggcg 5520
ataaaatggt gcttaacctg gacaggtctc gtgttccaac tgagtgtata gagaaaattg 5580
aggccattct taaggaactt gaaaagccag caccctgatg cgaccacgtt ttagtctacg 5640
tttatctgtc tttacttaat gtcctttgtt acaggccaga aagcataact ggcctgaata 5700
ttctctctgg gcccactgtt ccacttgtat cgtcggtctg ataatcagac tgggaccacg 5760
gtcccactcg tatcgtcggt ctgattatta gtctgggacc acggtcccac tcgtatcgtc 5820
ggtctgatta ttagtctggg accacggtcc cactcgtatc gtcggtctga taatcagact 5880
gggaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca tggtcccact 5940
cgtatcgtcg gtctgattat tagtctggga ccacggtccc actcgtatcg tcggtctgat 6000
tattagtctg gaaccacggt cccactcgta tcgtcggtct gattattagt ctgggaccac 6060
ggtcccactc gtatcgtcgg tctgattatt agtctgggac cacgatccca ctcgtgttgt 6120
cggtctgatt atcggtctgg gaccacggtc ccacttgtat tgtcgatcag actatcagcg 6180
tgagactacg attccatcaa tgcctgtcaa gggcaagtat tgacatgtcg tcgtaacctg 6240
tagaacggag taacctcggt gtgcggttgt atgcctgctg tggattgctg ctgtgtcctg 6300
cttatccaca acattttgcg cacggttatg tggacaaaat acctggttac ccaggccgtg 6360
ccggcacgtt aaccgggctg catccgatgc aagtgtgtcg ctgtcgagta caggtgttgg 6420
ccgttgtgcc cggacgggag atcgagtccc gtgatcggat cgccaagata tgcgacaatt 6480
ttgctattag caaagtagcc cgggatatgg agcagttgtt ggccaccaaa aatttggaga 6540
agccactgga gcagccggag aatgggtaca cctacaaggc cacctggttc atgcagttcc 6600
gggcggtcct gtggcgatcc tggctgtcgg tgctcaagga accactcctc gtaaaagtgc 6660
gacttattca gacaacggtg agtggttcca gtggaaacaa atgatataac gcttacaatt 6720
cttggaaaca aattcgctag attttagtta gaattgcctg attccacacc cttcttagtt 6780
tttttcaatg agatgtatag tttatagttt tgcagaaaat aaataaattt catttaactc 6840
gcgaacatgt tgaagatatg aatattaatg agatgcgagt aacattttaa tttgcagatg 6900
gttgccatct tgattggcct catctttttg ggccaacaac tcacgcaagt gggcgtgatg 6960
aatatcaacg gagccatctt cctcttcctg accaacatga cctttcaaaa cgtctttgcc 7020
acgataaatg taagtcttgt ttagaataca tttgcatatt aataatttac taactttcta 7080
atgaatcgat ggccggccta gtcttctacg tagacttatt gtcttaatta acaattcggc 7140
gcagcaccat ggcctgaaat aacctctgaa agaggaactt ggttaggtac cttctgaggc 7200
ggaaagaacc agctgtggaa tgtgtgtcag ttagacattg attattgact agttattaat 7260
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 7320
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 7380
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 7440
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 7500
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 7560
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atggtgatgc 7620
ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga tttccaagtc 7680
tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg gactttccaa 7740
aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta cggtgggagg 7800
tctatataag cagagctcgt ttagtgaacc gtcagatcgc ctggagacgc catccacgct 7860
gttttgacct ccatagaaga caccgggacc gatccagcct ccgcggccgg gaacggtgca 7920
ttggaacgcg gattccccgt gccaagagtg acgtaagtac cgcctataga gtctataggc 7980
ccaccccctt ggcttcgtta gaacgcggct acaattaata cataacctta tgtatcatac 8040
acatacgatt taggtgacac tatagaataa catccacttt gcctttctct ccacaggtgt 8100
ccactcccag gtccaactgc acctcggttc taagcttgcc gccatggact acaaggacga 8160
cgatgacaag gggtcgagcg tcgacatggt gagcaagggc gaggaggtca tcaaagagtt 8220
catgcgcttc aaggtgcgca tggagggctc catgaacggc cacgagttcg agatcgaggg 8280
cgagggcgag ggccgcccct acgagggcac ccagaccgcc aagctgaagg tgaccaaggg 8340
cggccccctg cccttcgcct gggacatcct gtccccccag ttcatgtacg gctccaaggc 8400
gtacgtgaag caccccgccg acatccccga ttacaagaag ctgtccttcc ccgagggctt 8460
caagtgggag cgcgtgatga acttcgagga cggcggtctg gtgaccgtga cccaggactc 8520
ctccctgcag gacggcacgc tgatctacaa ggtgaagatg cgcggcacca acttcccccc 8580
cgacggcccc gtaatgcaga agaagaccat gggctgggag gcctccaccg agcgcctgta 8640
cccccgcgac ggcgtgctga agggcgagat ccaccaggcc ctgaagctga aggacggcgg 8700
ccactacctg gtggagttca agaccatcta catggccaag aagcccgtgc aactgcccgg 8760
ctactactac gtggacacca agctggacat cacctcccac aacgaggact acaccatcgt 8820
ggaacagtac gagcgctccg agggccgcca ccacctgttc ctggggcatg gcaccggcag 8880
caccggcagc ggcagctccg gcaccgcctc ctccgaggac aacaacatgg ccgtcatcaa 8940
agagttcatg cgcttcaagg tgcgcatgga gggctccatg aacggccacg agttcgagat 9000
cgagggcgag ggcgagggcc gcccctacga gggcacccag accgccaagc tgaaggtgac 9060
caagggcggc cccctgccct tcgcctggga catcctgtcc ccccagttca tgtacggctc 9120
caaggcgtac gtgaagcacc ccgccgacat ccccgattac aagaagctgt ccttccccga 9180
gggcttcaag tgggagcgcg tgatgaactt cgaggacggc ggtctggtga ccgtgaccca 9240
ggactcctcc ctgcaggacg gcacgctgat ctacaaggtg aagatgcgcg gcaccaactt 9300
cccccccgac ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct ccaccgagcg 9360
cctgtacccc cgcgacggcg tgctgaaggg cgagatccac caggccctga agctgaagga 9420
cggcggccac tacctggtgg agttcaagac catctacatg gccaagaagc ccgtgcaact 9480
gcccggctac tactacgtgg acaccaagct ggacatcacc tcccacaacg aggactacac 9540
catcgtggaa cagtacgagc gctccgaggg ccgccaccac ctgttcctgt acggcatgga 9600
cgagctgtac aagtaaggat cccaagtttc gaggtcgagt gtcagtcctg ctcctcggcc 9660
acgaagtgca cgcagttgcc ggccgggtcg cgcagggcga actcccgccc ccacggctgc 9720
tcgccgatct cggtcatggc cggcccggag gcgtcccgga agttcgtgga cacgacctcc 9780
gaccactcgg cgtacagctc gtccaggccg cgcacccaca cccaggccag ggtgttgtcc 9840
ggcaccacct ggtcctggac cgcgctgatg aacagggtca cgtcgtcccg gaccacaccg 9900
gcgaagtcgt cctccacgaa gtcccgggag aacccgagcc ggtcggtcca gaactcgacc 9960
gctccggcga cgtcgcgcgc ggtgagcacc ggaacggcac tggtcaactt ggccatggtt 10020
tagttcctca ccttgtcgta ttatactatg ccgatatact atgccgatga ttaattgtca 10080
acacggtccg ttcc 10094
<210> 6
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> TK
<400> 6
atggcttcgt acccctgcca tcaacacgcg tctgcgttcg accaggctgc gcgttctcgc 60
ggccatagca accgacgtac ggcgttgcgc cctcgccggc aacaagaagc cacggaagtc 120
cgcctggagc agaaaatgcc cacgctactg cgggtttata tagacggtcc tcacgggatg 180
gggaaaacca ccaccacgca actgctggtg gccctgggtt cgcgcgacga tatcgtctac 240
gtacccgagc cgatgactta ctggcaggtg ctgggggctt ccgagacaat cgcgaacatc 300
tacaccacac aacaccgcct cgaccagggt gagatatcgg ccggggacgc ggcggtggta 360
atgacaagcg cccagataac aatgggcatg ccttatgccg tgaccgacgc cgttctggct 420
cctcatatcg ggggggaggc tgggagctca catgccccgc ccccggccct caccctcatc 480
ttcgaccgcc atcccatcgc cgccctcctg tgttacccgg ccgcgcgata ccttatgggc 540
agcatgaccc cccaggccgt gctggcgttc gtggccctca tcccgccgac cttgcccggc 600
acaaacatcg tgttgggggc ccttccggag gacagacaca tcgaccgcct ggccaaacgc 660
cagcgccccg gcgagcggct tgacctggct atgctggccg cgattcgccg cgtttacgag 720
ctgcttgcca atacggtgcg gtatctgcag ggcggcgggt cgtggcggga ggattgggga 780
cagctttcgg ggacggccgt gccgccccag ggtgccgagc cccagagcaa cgcgggccca 840
cgaccccata tcggggacac gttatttacc ctgtttcggg cccccgagtt gctggccccc 900
aacggcgacc tgtataacgt gtttgcctgg gccttggacg tcttggccaa acgcctccgt 960
cccatgcacg tctttatcct ggattacgac caatcgcccg ccggctgccg ggacgccctg 1020
ctgcaactta cctccgggat ggtccagacc cacgtcacca cccccggctc cataccgacg 1080
atctgcgacc tggcgcgcac gtttgcccgg gagatggggg aggctaactg a 1131
<210> 7
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> TK
<400> 7
Met Ala Ser Tyr Pro Cys His Gln His Ala Ser Ala Phe Asp Gln Ala
1 5 10 15
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg
20 25 30
Arg Gln Gln Glu Ala Thr Glu Val Arg Leu Glu Gln Lys Met Pro Thr
35 40 45
Leu Leu Arg Val Tyr Ile Asp Gly Pro His Gly Met Gly Lys Thr Thr
50 55 60
Thr Thr Gln Leu Leu Val Ala Leu Gly Ser Arg Asp Asp Ile Val Tyr
65 70 75 80
Val Pro Glu Pro Met Thr Tyr Trp Gln Val Leu Gly Ala Ser Glu Thr
85 90 95
Ile Ala Asn Ile Tyr Thr Thr Gln His Arg Leu Asp Gln Gly Glu Ile
100 105 110
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gln Ile Thr Met
115 120 125
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Ile Gly
130 135 140
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu Ile
145 150 155 160
Phe Asp Arg His Pro Ile Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg
165 170 175
Tyr Leu Met Gly Ser Met Thr Pro Gln Ala Val Leu Ala Phe Val Ala
180 185 190
Leu Ile Pro Pro Thr Leu Pro Gly Thr Asn Ile Val Leu Gly Ala Leu
195 200 205
Pro Glu Asp Arg His Ile Asp Arg Leu Ala Lys Arg Gln Arg Pro Gly
210 215 220
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala Ile Arg Arg Val Tyr Glu
225 230 235 240
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gln Gly Gly Gly Ser Trp Arg
245 250 255
Glu Asp Trp Gly Gln Leu Ser Gly Thr Ala Val Pro Pro Gln Gly Ala
260 265 270
Glu Pro Gln Ser Asn Ala Gly Pro Arg Pro His Ile Gly Asp Thr Leu
275 280 285
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu
290 295 300
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg
305 310 315 320
Pro Met His Val Phe Ile Leu Asp Tyr Asp Gln Ser Pro Ala Gly Cys
325 330 335
Arg Asp Ala Leu Leu Gln Leu Thr Ser Gly Met Val Gln Thr His Val
340 345 350
Thr Thr Pro Gly Ser Ile Pro Thr Ile Cys Asp Leu Ala Arg Thr Phe
355 360 365
Ala Arg Glu Met Gly Glu Ala Asn
370 375
<210> 8
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> 2A
<400> 8
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg ccca 54
<210> 9
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> 2A
<400> 9
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 10
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> GFP
<400> 10
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 11
<211> 239
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP
<400> 11
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 12
<211> 1902
<212> DNA
<213> Artificial Sequence
<220>
<223> TK-2A-GFP
<400> 12
atggcttcgt acccctgcca tcaacacgcg tctgcgttcg accaggctgc gcgttctcgc 60
ggccatagca accgacgtac ggcgttgcgc cctcgccggc aacaagaagc cacggaagtc 120
cgcctggagc agaaaatgcc cacgctactg cgggtttata tagacggtcc tcacgggatg 180
gggaaaacca ccaccacgca actgctggtg gccctgggtt cgcgcgacga tatcgtctac 240
gtacccgagc cgatgactta ctggcaggtg ctgggggctt ccgagacaat cgcgaacatc 300
tacaccacac aacaccgcct cgaccagggt gagatatcgg ccggggacgc ggcggtggta 360
atgacaagcg cccagataac aatgggcatg ccttatgccg tgaccgacgc cgttctggct 420
cctcatatcg ggggggaggc tgggagctca catgccccgc ccccggccct caccctcatc 480
ttcgaccgcc atcccatcgc cgccctcctg tgttacccgg ccgcgcgata ccttatgggc 540
agcatgaccc cccaggccgt gctggcgttc gtggccctca tcccgccgac cttgcccggc 600
acaaacatcg tgttgggggc ccttccggag gacagacaca tcgaccgcct ggccaaacgc 660
cagcgccccg gcgagcggct tgacctggct atgctggccg cgattcgccg cgtttacgag 720
ctgcttgcca atacggtgcg gtatctgcag ggcggcgggt cgtggcggga ggattgggga 780
cagctttcgg ggacggccgt gccgccccag ggtgccgagc cccagagcaa cgcgggccca 840
cgaccccata tcggggacac gttatttacc ctgtttcggg cccccgagtt gctggccccc 900
aacggcgacc tgtataacgt gtttgcctgg gccttggacg tcttggccaa acgcctccgt 960
cccatgcacg tctttatcct ggattacgac caatcgcccg ccggctgccg ggacgccctg 1020
ctgcaactta cctccgggat ggtccagacc cacgtcacca cccccggctc cataccgacg 1080
atctgcgacc tggcgcgcac gtttgcccgg gagatggggg aggctaacga gggcagagga 1140
agtctgctaa catgcggtga cgtcgaggag aatcctggcc caatggtgag caagggcgag 1200
gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 1260
aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 1320
ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 1380
tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 1440
tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 1500
tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 1560
aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 1620
aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 1680
aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 1740
acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 1800
gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 1860
gccgccggga tcactctcgg catggacgag ctgtacaagt aa 1902
<210> 13
<211> 633
<212> PRT
<213> Artificial Sequence
<220>
<223> TK-2A-GFP
<400> 13
Met Ala Ser Tyr Pro Cys His Gln His Ala Ser Ala Phe Asp Gln Ala
1 5 10 15
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg
20 25 30
Arg Gln Gln Glu Ala Thr Glu Val Arg Leu Glu Gln Lys Met Pro Thr
35 40 45
Leu Leu Arg Val Tyr Ile Asp Gly Pro His Gly Met Gly Lys Thr Thr
50 55 60
Thr Thr Gln Leu Leu Val Ala Leu Gly Ser Arg Asp Asp Ile Val Tyr
65 70 75 80
Val Pro Glu Pro Met Thr Tyr Trp Gln Val Leu Gly Ala Ser Glu Thr
85 90 95
Ile Ala Asn Ile Tyr Thr Thr Gln His Arg Leu Asp Gln Gly Glu Ile
100 105 110
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gln Ile Thr Met
115 120 125
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Ile Gly
130 135 140
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu Ile
145 150 155 160
Phe Asp Arg His Pro Ile Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg
165 170 175
Tyr Leu Met Gly Ser Met Thr Pro Gln Ala Val Leu Ala Phe Val Ala
180 185 190
Leu Ile Pro Pro Thr Leu Pro Gly Thr Asn Ile Val Leu Gly Ala Leu
195 200 205
Pro Glu Asp Arg His Ile Asp Arg Leu Ala Lys Arg Gln Arg Pro Gly
210 215 220
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala Ile Arg Arg Val Tyr Glu
225 230 235 240
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gln Gly Gly Gly Ser Trp Arg
245 250 255
Glu Asp Trp Gly Gln Leu Ser Gly Thr Ala Val Pro Pro Gln Gly Ala
260 265 270
Glu Pro Gln Ser Asn Ala Gly Pro Arg Pro His Ile Gly Asp Thr Leu
275 280 285
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu
290 295 300
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg
305 310 315 320
Pro Met His Val Phe Ile Leu Asp Tyr Asp Gln Ser Pro Ala Gly Cys
325 330 335
Arg Asp Ala Leu Leu Gln Leu Thr Ser Gly Met Val Gln Thr His Val
340 345 350
Thr Thr Pro Gly Ser Ile Pro Thr Ile Cys Asp Leu Ala Arg Thr Phe
355 360 365
Ala Arg Glu Met Gly Glu Ala Asn Glu Gly Arg Gly Ser Leu Leu Thr
370 375 380
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Ser Lys Gly Glu
385 390 395 400
Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp
405 410 415
Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala
420 425 430
Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu
435 440 445
Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln
450 455 460
Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys
465 470 475 480
Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys
485 490 495
Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp
500 505 510
Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp
515 520 525
Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn
530 535 540
Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe
545 550 555 560
Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His
565 570 575
Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp
580 585 590
Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu
595 600 605
Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile
610 615 620
Thr Leu Gly Met Asp Glu Leu Tyr Lys
625 630
<210> 14
<211> 7266
<212> DNA
<213> Artificial Sequence
<220>
<223> loxp
<400> 14
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaagct ttgcaaagat ggataaagtt 180
ttaaacagag aggaatcttt gcagctaatg gaccttctag gtcttgaaag gagtgggaat 240
tggctccggt gcccgtcagt gggcagagcg cacatcgccc acagtccccg agaagttggg 300
gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa actgggaaag 360
tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt atataagtgc 420
agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac aggtaagtgc 480
cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat ggcccttgcg tgccttgaat 540
tacttccact ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 600
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 660
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 720
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 780
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 840
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 900
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 960
ggcctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 1020
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 1080
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 1140
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 1200
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1260
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1320
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1380
gtggttcaaa gtttttttct tccatttcag gtgtcgtgag gtaccggatc ctctagagtc 1440
gactccggaa taacttcgta taggatactt tatacgaagt tatgcagaat ggtagctgga 1500
ttgtagctgc tattagcaat atgaaacctc ttaataactt cgtatagcat acattatacg 1560
aagttatggc gcgccctatt acttgtacag ctcgtccatg ccgagagtga tcccggcggc 1620
ggtcacgaac tccagcagga ccatgtgatc gcgcttctcg ttggggtctt tgctcagggc 1680
ggactggtag ctcaggtagt ggttgtcggg cagcagcacg gggccgtcgc cgatgggggt 1740
gttctgctgg tagtggtcgg cgagctgcac gctgccgtcc tcgatgttgt ggcggatctt 1800
gaagttcacc ttgatgccgt tcttctgctt gtcggccatg atatagacgt tgtggctgtt 1860
gtagttgtac tccagcttgt gccccaggat gttgccgtcc tccttgaagt cgatgccctt 1920
cagctcgatg cggttcacca gggtgtcgcc ctcgaacttc acctcggcgc gggtcttgta 1980
gttgccgtcg tccttgaaga agatggtgcg ctcctggacg tagccttcgg gcatggcgga 2040
cttgaagaag tcgtgctgct tcatgtggtc ggggtagcgg gcgaagcact gcaggccgta 2100
gccgaaggtg gtcacgaggg tgggccaggg cacgggcagc ttgccggtgg tgcagatgaa 2160
cttcagggtc agcttgccgt aggtggcatc gccctcgccc tcgccggaca cgctgaactt 2220
gtggccgttt acgtcgccgt ccagctcgac caggatgggc accaccccgg tgaacagctc 2280
ctcgcccttg ctcaccatgg tggcggccgc tggcacggct ccggcctcgg cttcgtcttc 2340
gacgagagtc tcgacctcga tctccgttcc gccgatgttc agtttggtgg ttttgcggat 2400
atctccgtga atcaatatgt gctcgtggat caggacgcgc aggtagtgtc ccaacaaccc 2460
ccaacaattt ttactcatca gatcaataat cgtgtgacct acggtggagc catagacgct 2520
caggacgcca aaaccttcgg gccccaaaat gaagagaatt gggaacatac cccagctcac 2580
gaaaaacagc catgccatgc cggtcacgac ctggcggcac cgaccctttg gcacagtatg 2640
ataaccctcg atatatgctt tggcggcgtg aaaaaatgtg ttcgcgccat agcacaatcc 2700
aagacaaaag aagatgactt taacatagcc ggttgccatg gcgctggtag ccccccacac 2760
gatagtcccg atgtctgaga caaggagtcc catggttctc ctgctgtagt cgttgctcag 2820
gccggtgagg ttgctcaggc ggataaggat gacaggacaa gtgagcagcc actctgcata 2880
gcgcagccac tgcacccggt gtcctgtggc aaggtagagc atagagggat tcttaaactc 2940
aaaaaagaac tcgagaatca ccttaaccat ttcaatggcg cacacataga tctcctccca 3000
gccgcatgta gatttccagg tttggtaggc atagaacatc agcagcaaaa tgctgaatcc 3060
tgctgcaagc cactgcagga catttgacgc ggtctgagcg ccgttcgtgc cgcgagattc 3120
aatccatccg gcacagtaac attgatcctc agggaccagg acggacccgt tcaccaccac 3180
aggattagta acgaacaaaa gttcgcgtcc gacggcagac aaagcgccgc catagtccat 3240
ggtggctagc ataacttcgt ataaagtatc ctatacgaag ttatttgcct taacccagaa 3300
attatcactg ttattcttta gaatggtgca aagaataact tcgtataatg tatgctatac 3360
gaagttatga attcgatatc aagcttatcg ataatcaacc tctggattac aaaatttgtg 3420
aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 3480
taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 3540
aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg 3600
tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc 3660
tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct 3720
gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt 3780
cggggaaatc atcgtccttt ccttggctgc tcgcctatgt tgccacctgg attctgcgcg 3840
ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc 3900
tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct 3960
ccctttgggc cgcctccccg catcgatacc gagcgctgct cgagagatct acgggtggca 4020
tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc cagtgcccac 4080
cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt ccttctataa 4140
tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga caacctgtag 4200
ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt ggctcactgc 4260
aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt tgttgggatt 4320
ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac ggggtttcac 4380
catattggcc aggctggtct ccaactccta atctcaggtg atctacccac cttggcctcc 4440
caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtccttc tgattttgta 4500
ggtaaccacg tgcggaccga gcggccgcag gaacccctag tgatggagtt ggccactccc 4560
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4620
tttgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg 4680
cggtattttc tccttacgca tctgtgcggt atttcacacc gcatacgtca aagcaaccat 4740
agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4800
ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 4860
ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4920
ttagtgcttt acggcacctc gaccccaaaa aacttgattt gggtgatggt tcacgtagtg 4980
ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 5040
gtggactctt gttccaaact ggaacaacac tcaaccctat ctcgggctat tcttttgatt 5100
tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 5160
ttaacgcgaa ttttaacaaa atattaacgt ttacaatttt atggtgcact ctcagtacaa 5220
tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 5280
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 5340
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 5400
tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 5460
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 5520
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 5580
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 5640
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 5700
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 5760
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 5820
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 5880
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 5940
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 6000
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 6060
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 6120
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 6180
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 6240
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 6300
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 6360
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 6420
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 6480
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 6540
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 6600
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 6660
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 6720
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 6780
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 6840
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 6900
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 6960
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 7020
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 7080
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 7140
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 7200
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 7260
acatgt 7266
<210> 15
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 15
cgggatccag actgacacat taaaaaacac 30
<210> 16
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 16
cccaagctta taacttcgta taatgtatgc tatacgaagt tataacacgg aaggagacaa 60
taccg 65
<210> 17
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 17
cccaagctta taacttcgta taatgtatgc tatacgaagt tattcagtta gcctccccca 60
tctc 64
<210> 18
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 18
cgggatccct tcggacctcg cgggggccgc 30
<210> 19
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 19
cgggatccag actgacacat taaaaaacac 30
<210> 20
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 20
cgggatccct tcggacctcg cgggggccgc 30
<210> 21
<211> 9193
<212> DNA
<213> Artificial Sequence
<220>
<223> pUS-F5
<400> 21
aagcttttat ctaatctccc agcgtggttt aatcagacga tcgaaaattt cattgcagac 60
aggttcccaa atagaaagag catttctcca ggcaccagtt gaagagcgtt gatcaatggc 120
ctgttcaaaa acagttctca tccggatctg acctttacca acttcatccg tttcacgtac 180
aacatttttt agaaccatgc ttccccaggc atcccgaatt tgctcctcca tccacgggga 240
ctgagagcca ttactattgc tgtatttggt aagcaaaata cgtacatcag gctcgaaccc 300
tttaagatca acgttcttga gcagatcacg aagcatatcg aaaaactgca gtgcggaggt 360
gtagtcaaac aactcagcag gcgtgggaac aatcagcaca tcagcagcac atacgacatt 420
aatcgtgccg atacccaggt taggcgcgct gtcaataact atgacatcat agtcatgagc 480
aacagtttca atggccagtc ggagcatcag gtgtggatcg gtgggcagtt taccttcatc 540
aaatttgccc attaactcag tttcaatacg gtgcagagcc agacaggaag gaataatgtc 600
aagccccggc cagcaagtgg gctttattgc ataagtgaca tcgtcctttt ccccaagata 660
gaaaggcagg agagtgtctt ctgcatgaat atgaagatct ggtacccatc cgtgatacat 720
tgaggctgtt ccctgggggt cgttaccttc cacgagcaaa acacgtagcc ccttcagagc 780
cagatcctga gcaagatgaa cagaaactga ggttttgtaa acgccacctt tatgggcagc 840
aaccccgatc accggtggaa atacgtcttc agcacgtcgc aatcgcgtac caaacacatc 900
acgcatatga ttaatttgtt caattgtata accaacacgt tgctcaaccc gtcctcgaat 960
ttccatatcc gggtgcggta gtcgccctgc tttctcggca tctctgatag cctgagaaga 1020
aaccccaact aaatccgctg cttcacctat tctccagcgc cgggttattt tcctcgcttc 1080
cgggctgtca tcattaaact gtgcaatggc gatagccttc gtcatttcat gaccagcgtt 1140
tatgcactgg ttaagtgttt ccatgagttt cattctgaac atcctttaat cattgctttg 1200
cgttttttta ttaaatcttg caatttactg caaagcaaca acaaaatcgc aaagtcatca 1260
aaaaaccgca aagttgttta aaataagagc aacactacaa aaggagataa gaagagcaca 1320
tacctcagtc acttattatc actagcgctc gccgcagccg tgtaaccgag catagcgagc 1380
gaactggcga ggaagcaaag aagaactgtt ctgtcagata gctcttacgc tcagcgcaag 1440
aagaaatatc caccgtggga aaaactccag gtagaggtac acacgcggat agccaattca 1500
gagtaataaa ctgtgataat caaccctcat caatgatgac gaactaaccc ccgatatcag 1560
gtcacatgac gaagggaaag agaaggaaat caactgtgac aaactgccct caaatttggc 1620
ttccttaaaa attacagttc aaaaagtatg agaaaatcca tgcaggctga aggaaacagc 1680
aaaactgtga caaattaccc tcagtaggtc agaacaaatg tgacgaacca ccctcaaatc 1740
tgtgacagat aaccctcaga ctatcctgtc gtcatggaag tgatatcgcg gaaggaaaat 1800
acgatatgag tcgtctggcg gcctttcttt ttctcaatgt atgagaggcg cattggagtt 1860
ctgctgttga tctcattaac acagacctgc aggaagcggc ggcggaagtc aggcatacgc 1920
tggtaacttt gaggcagctg gtaacgctct atgatccagt cgattttcag agagacgatg 1980
cctgagccat ccggcttacg atactgacac agggattcgt ataaacgcat ggcatacgga 2040
ttggtgattt cttttgtttc actaagccga aactgcgtaa accggttctg taacccgata 2100
aagaagggaa tgagatatgg gttgatatgt acactgtaaa gccctctgga tggactgtgc 2160
gcacgtttga taaaccaagg aaaagattca tagccttttt catcgccggc atcctcttca 2220
gggcgataaa aaaccacttc cttccccgcg aaactcttca atgcctgccg tatatcctta 2280
ctggcttccg cagaggtcaa tccgaatatt tcagcatatt tagcaacatg gatctcgcag 2340
ataccgtcat gttcctgtag ggtgccatca gattttctga tctggtcaac gaacagatac 2400
agcatacgtt tttgatcccg ggagagacta tatgccgcct cagtgaggtc gtttgactgg 2460
acgattcgcg ggctattttt acgtttcttg tgattgataa ccgctgtttc cgccatgaca 2520
gatccatgtg aagtgtgaca agtttttaga ttgtcacact aaataaaaaa gagtcaataa 2580
gcagggataa ctttgtgaaa aaacagcttc ttctgagggc aatttgtcac agggttaagg 2640
gcaatttgtc acagacagga ctgtcatttg agggtgattt gtcacactga aagggcaatt 2700
tgtcacaaca ccttctctag aaccagcatg gataaaggcc tacaaggcgc tctaaaaaag 2760
aagatctaaa aactataaaa aaaataatta taaaaatatc cccgtggata agtggataac 2820
cccaagggaa gttttttcag gcatcgtgtg taagcagaat atataagtgc tgttccctgg 2880
tgcttcctcg ctcactcgag ggcttcgccc tgtcgctcga ctgcggcgag cactactggc 2940
tgtaaaagga cagaccacat catggttctg tgttcattag gttgttctgt ccattgctga 3000
cataatccgc tccacttcaa cgtaacaccg cacgaagatt tctattgttc ctgaaggcat 3060
attcaaatcg ttttcgttac cgcttgcagg catcatgaca gaacactact tcctataaac 3120
gctacacagg ctcctgagat taataatgcg gatctctacg ataatgggag attttcccga 3180
ctgtttcgtt cgcttctcag tggataacag ccagcttctc tgtttaacag acaaaaacag 3240
catatccact cagttccaca tttccatata aaggccaagg catttattct caggataatt 3300
gtttcagcat cgcaaccgca tcagactccg gcatcgcaaa ctgcacccgg tgccgggcag 3360
ccacatccag cgcaaaaacc ttcgtgtaga cttccgttga actgatggac ttatgtccca 3420
tcaggctttg cagaactttc agcggtatac cggcatacag catgtgcatc gcataggaat 3480
ggcggaacgt atgtggtgtg accggaacag agaacgtcac accgtcagca gcagcggcgg 3540
caaccgcctc cccaatccag gtcctgaccg ttctgtccgt cacttcccag atccgcgctt 3600
tctctgtcct tcctgtgcga cggttacgcc gctccatgag cttatcgcga ataaatacct 3660
gtgacggaag atcacttcgc agaataaata aatcctggtg tccctgttga taccgggaag 3720
ccctgggcca acttttggcg aaaatgagac gttgatcggc acgtaagagg ttccaacttt 3780
caccataatg aaataagatc actaccgggc gtattttttg agttatcgag attttcagga 3840
gctaaggaag ctaaaatgga gaaaaaaatc actggatata ccaccaccgt tgatatatcc 3900
caatggcatc gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac 3960
cagaccgttc agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag 4020
ttttatccgg cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt 4080
atggcaatga aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt 4140
ttccatgagc aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg 4200
cagtttctac acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc 4260
cctaaagggt ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc 4320
agttttgatt taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc 4380
aaatattata cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc 4440
gtttgtgatg gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag 4500
tggcagggcg gggcgtaatt tttttaaggc agttattggt gcccttaaac gcctggttgc 4560
tacgcctgaa taagtgataa taagcggatg aatggcagaa attcgatgat aagctgtcaa 4620
acatgagaat tggtcgacca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 4680
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 4740
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctc ccggctcgta 4800
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 4860
acgccaagcg cgcaattaac cctcactaaa gggaacaaaa gctgggtacc gggccccccc 4920
tcgaggtcga cggtatcgcg attgaagcgt gcgcctgtta ttccaaaaca tacgctcaat 4980
actcaaccgg ttgaagatac ttcgttatcg acaccagctg ccccgatggt ggattcgtta 5040
attgcgcgcg taggagtaat ggctcgcggt aatgccatta ctttgcctgt atgtggtcgg 5100
gatgtgaagt ttactcttga agtgctccgg ggtgatagtg ttgagaagac ctctcgggta 5160
tggtcaggta atgaacgtga ccaggagctg cttactgagg acgcactgga tgatctcatc 5220
ccttcttttc tactgactgg tcaacagaca ccggcgttcg gtcgaagagt atctggtgtc 5280
atagaaattg ccgatgggag tcgccgtcgt aaagctgctg cacttaccga aagtgattat 5340
cgtgttctgg ttggcgagct ggatgatgag cagatggctg cattatccag attgggtaac 5400
gattatcgcc caacaagtgc ttatgaacgt ggtcagcgtt atgcaagccg attgcagaat 5460
gaatttgctg gaaatatttc tgcgctggct gatgcggaaa atatttcacg taagattatt 5520
acccgctgta tcaacaccgc caaattgcct aaatcagttg ttgctctttt ttctcacccc 5580
ggtgaactat ctgcccggtc aggtgatgca cttcaaaaag cctttacaga taaagaggaa 5640
ttacttaagc agcaggcatc taaccttcat gagcagaaaa aagctggggt gatatttgaa 5700
gctgaagaag ttatcactct tttaacttct gtgcttaaaa cgtcatctgc atcaagaact 5760
agtttaagct cacgacatca gtttgctcct ggagcgacag tattgtataa gggcgataaa 5820
atggtgctta acctggacag gtctcgtgtt ccaactgagt gtatagagaa aattgaggcc 5880
attcttaagg aacttgaaaa gccagcaccc tgatgcgacc acgttttagt ctacgtttat 5940
ctgtctttac ttaatgtcct ttgttacagg ccagaaagca taactggcct gaatattctc 6000
tctgggccca ctgttccact tgtatcgtcg gtctgataat cagactggga ccacggtccc 6060
actcgtatcg tcggtctgat tattagtctg ggaccacggt cccactcgta tcgtcggtct 6120
gattattagt ctgggaccac ggtcccactc gtatcgtcgg tctgataatc agactgggac 6180
cacggtccca ctcgtatcgt cggtctgatt attagtctgg gaccatggtc ccactcgtat 6240
cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 6300
gtctggaacc acggtcccac tcgtatcgtc ggtctgatta ttagtctggg accacggtcc 6360
cactcgtatc gtcggtctga ttattagtct gggaccacga tcccactcgt gttgtcggtc 6420
tgattatcgg tctgggacca cggtcccact tgtattgtcg atcagactat cagcgtgaga 6480
ctacgattcc atcaatgcct gtcaagggca agtattgaca tgtcgtcgta acctgtagaa 6540
cggagtaacc tcggtgtgcg gttgtatgcc tgctgtggat tgctgctgtg tcctgcttat 6600
ccacaacatt ttgcgcacgg ttatgtggac aaaatacctg gttacccagg ccgtgccggc 6660
acgttaaccg ggctgcatcc gatgcaagtg tgtcgctgtc gagtacaggt gttggccgtt 6720
gtgcccggac gggagatcga gtcccgtgat cggatcgcca agatatgcga caattttgct 6780
attagcaaag tagcccggga tatggagcag ttgttggcca ccaaaaattt ggagaagcca 6840
ctggagcagc cggagaatgg gtacacctac aaggccacct ggttcatgca gttccgggcg 6900
gtcctgtggc gatcctggct gtcggtgctc aaggaaccac tcctcgtaaa agtgcgactt 6960
attcagacaa cggtgagtgg ttccagtgga aacaaatgat ataacgctta caattcttgg 7020
aaacaaattc gctagatttt agttagaatt gcctgattcc acacccttct tagttttttt 7080
caatgagatg tatagtttat agttttgcag aaaataaata aatttcattt aactcgcgaa 7140
catgttgaag atatgaatat taatgagatg cgagtaacat tttaatttgc agatggttgc 7200
catcttgatt ggcctcatct ttttgggcca acaactcacg caagtgggcg tgatgaatat 7260
caacggagcc atcttcctct tcctgaccaa catgaccttt caaaacgtct ttgccacgat 7320
aaatgtaagt cttgtttaga atacatttgc atattaataa tttactaact ttctaatgaa 7380
tcgatggccg gcctagtctt ctacgtagac ttattgtctt aattaacaat tcggcgcagc 7440
accatggcct gaaataacct ctgaaagagg aacttggtta ggtaccttct gaggcggaaa 7500
gaaccagctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg 7560
cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg 7620
ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc 7680
gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca 7740
tggctgacta atttttttat ttatgcagag gccgaggccg cctcggcctc tgagctattc 7800
cagaagtagt gaggaggctt ttttggaggc ctaggatcga tccaccggtc gccaccatgg 7860
tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 7920
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 7980
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 8040
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 8100
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 8160
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 8220
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 8280
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 8340
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 8400
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 8460
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 8520
tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtaaagcg 8580
gccgcctgca gcttaagacc ggtaagctag cttacgcgtg ctagcgggcc cgttaacttg 8640
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 8700
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat 8760
gtctggatct taattaacca gcgatcgcat cgattcgatt taggtgttca cctcagagct 8820
gccagttttt atgagggagg cccgaagtcg atggcaagtg tagcggtcac gctgcgcgta 8880
accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtcccattc gccattcagg 8940
ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 9000
aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 9060
cgttgtaaaa cgacggccag tgagcgcgcg taatacgact cactataggg cgaattggag 9120
ctccaccgcg gtggcggccg ctctagaact agtggatcga tcccccgggc tgcaggaatt 9180
cgatatcaag ctt 9193
<210> 22
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 22
tcggtttgaa aggcatcg 18
<210> 23
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 23
gacaaggtcg ccatctgct 19
<210> 24
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 24
gggcacgcga gactatcaga g 21
<210> 25
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 25
tcattcgcca tcgggatagt c 21
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 26
atggaggagc ccctaccaga 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 27
taccaaagac cggggcgaat 20
<210> 28
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 28
tggtaactag ttaacggcaa gtccg 25
<210> 29
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 29
atgccgggac ttaagtggcc gtata 25
<210> 30
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 30
atgaagacca atccgctacc cgca 24
<210> 31
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 31
aacactcgcg tttcgggttt cagt 24
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 32
atgagtcagt ggggatccgg 20
<210> 33
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 33
cccggaacga accccaagct 20
<210> 34
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 34
gccaacgacc acatccct 18
<210> 35
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 35
cagcggcaaa caaagcag 18
<210> 36
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 36
ggggtttctt ctcggtgttt g 21
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 37
gcggtgctga tggtaatgtg 20
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 38
aaattgccct agcacagggg 20
<210> 39
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 39
ggtctctccg gcgcacataa 20
<210> 40
<211> 5977
<212> DNA
<213> Artificial Sequence
<220>
<223> pRK-zeo
<400> 40
ttcgagctcg cccgacattg attattgact agttattaat agtaatcaat tacggggtca 60
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 120
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 180
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 240
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 300
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 360
tacatctacg tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat 420
gggcgtggat agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat 480
gggagtttgt tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc 540
ccattgacgc aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctcgt 600
ttagtgaacc gtcagatcgc ctggagacgc catccacgct gttttgacct ccatagaaga 660
caccgggacc gatccagcct ccgcggccgg gaacggtgca ttggaacgcg gattccccgt 720
gccaagagtg acgtaagtac cgcctataga gtctataggc ccaccccctt ggcttcgtta 780
gaacgcggct acaattaata cataacctta tgtatcatac acatacgatt taggtgacac 840
tatagaataa catccacttt gcctttctct ccacaggtgt ccactcccag gtccaactgc 900
acctcggttc taagcttgcc gccatggact acaaggacga cgatgacaag gggtcgagcg 960
tcgacgtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 1020
acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 1080
acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca 1140
ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga 1200
agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 1260
tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 1320
tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 1380
acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga 1440
acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg 1500
ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 1560
actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg 1620
tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagg 1680
cggccgcgac ctgcaggcgc agaactggta ggtatggaag atccctcgag gatcccaagt 1740
ttcgaggtcg agtgtcagtc ctgctcctcg gccacgaagt gcacgcagtt gccggccggg 1800
tcgcgcaggg cgaactcccg cccccacggc tgctcgccga tctcggtcat ggccggcccg 1860
gaggcgtccc ggaagttcgt ggacacgacc tccgaccact cggcgtacag ctcgtccagg 1920
ccgcgcaccc acacccaggc cagggtgttg tccggcacca cctggtcctg gaccgcgctg 1980
atgaacaggg tcacgtcgtc ccggaccaca ccggcgaagt cgtcctccac gaagtcccgg 2040
gagaacccga gccggtcggt ccagaactcg accgctccgg cgacgtcgcg cgcggtgagc 2100
accggaacgg cactggtcaa cttggccatg gtttagttcc tcaccttgtc gtattatact 2160
atgccgatat actatgccga tgattaattg tcaacacggt ccgttccgaa ttcataggta 2220
ggtaaatcga tggccgccat ggcccaactt gtttattgca gcttataatg gttacaaata 2280
aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 2340
tttgtccaaa ctcatcaatg tatcttatca tgtctggatc gggaattaat tcggcgcagc 2400
accatggcct gaaataacct ctgaaagagg aacttggtta ggtaccttct gaggcggaaa 2460
gaaccagctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg 2520
cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg 2580
ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc 2640
gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca 2700
tggctgacta atttttttta tttatgcaga ggccgaggcc gcctcggcct gtgagctatt 2760
ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc tgttaacagc 2820
ttggcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 2880
aatcgccttg cagcacatcc ccccttcgcc acctggcgta atagcgaaga ggcccgcacc 2940
gatcgccctt cccaacagtt gcgtagcctg aatggcgaat ggcgcctgat gcggtatttt 3000
ctccttacgc atctgtgcgg tatttcacac cgcatacgtc aaagcaacca tagtacgcgc 3060
cctgtacggg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 3120
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 3180
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 3240
tacggcacct cgaccccaaa aaacttgatt tgggtgatgg ttcacgtagt gggccatcgc 3300
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 3360
tgttccaaac tggaacaaca ctcaacccta tctcgggcta ttcttttgat ttataaggga 3420
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 3480
attttaacaa aatattaacg tttacaattt tatggtgcac tctcagtaca atctgctctg 3540
atgccgcata gttaagccaa ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg 3600
acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 3660
cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 3720
gaaacgcgcg aggcagtatt cttgaagacg aaagggcctc gtgatacgcc tatttttata 3780
ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt 3840
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 3900
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 3960
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 4020
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 4080
ggaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 4140
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgtg atgacgccgg 4200
gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 4260
agccacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 4320
aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 4380
gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 4440
ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgccag cagcaatggc 4500
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 4560
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 4620
tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc 4680
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 4740
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 4800
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 4860
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 4920
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 4980
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 5040
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 5100
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 5160
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 5220
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 5280
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 5340
caccgaactg agatacctac agcgtgagca ttgagaaagc gccacgcttc ccgaagggag 5400
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 5460
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 5520
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 5580
ggccttttta cggttcctgg ccttttggtg gccttttgct cacatgttct ttcctgcgtt 5640
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 5700
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg 5760
caaaccgcct ctccccgcgc gttggccgat tcattaatcc agctggcacg acaggtttcc 5820
cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttacctca ctcattaggc 5880
accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 5940
acaatttcac acaggaaaca gctatgacca tgattac 5977
<210> 41
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 41
gcgtcgacat ggtgagcaag ggcgaggag 29
<210> 42
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 42
cgggatcctt acttgtacag ctcgtccatg 30
<210> 43
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 43
aggtaccttc tgaggcggaa agaaccagct gtggaatgtg tgtcagttag acattgatta 60
ttgactagtt attaatag 78
<210> 44
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 44
gtggcgtgaa actcccgcac ctcttcggca agcgccttgt agaagcgcgt ggaacggacc 60
gtgttgacaa ttaatc 76
<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 45
acctctgaaa gaggaacttg g 21
<210> 46
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 46
gtcaacagcg tgccgcagat c 21
<210> 47
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 47
cgggatccat ggcttcgtac ccctgccatc 30
<210> 48
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 48
cggaattctt acttgtacag ctcgtccatg 30
<210> 49
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 49
ctagctagca tggcttcgta cccctgccat c 31
<210> 50
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 50
attctcctcg acgtcaccgc atgttagcag acttcctctg ccctcgttag cctcccccat 60
ctcccg 66
<210> 51
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 51
ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg gcccagtgag caagggcgag 60
gagctg 66
<210> 52
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 52
ttggcgcgcc ttacttgtac agctcgtcca tg 32