本发明属于核酸测定或检验方法的技术领域,具体是涉及一种基于引物延伸的核酸靶序列捕获测序文库制备方法。
背景技术:
近年来崛起的新一代高通量dna测序技术能够并行地对数十亿的dna片段进行序列测定以及量化,为基础生物医学研究和临床检测提供了一个强大的工具;高通量dna测序技术的发展也带动了另一项重要的技术的兴起——靶序列捕获测序;靶序列捕获测序是首先通过一些靶向方法提取我们所关心目标基因的dna片段制备成靶序列测序文库,然后通过高通量测序对其进行分析,例如外显子组(exome)捕获测序捕获和测定占大约30mb的全部外显子序列;因为这种测序并不是该物种基因组的首次测序,故称为靶向重测序(targetedresequencing);靶向测序技术对于庞大的人类或高等生物的基因组,可以成千上万倍地提高测序的效率,极大地提高样本的通量,使高通量测序更加有效地用于生物医学领域;目前已经发展了多种靶序列捕获策略,主要包括固相芯片捕获、液相探针捕获、分子倒置探针(molecularinversionprobes)以及乳液pcr(raindance)等。
固相芯片捕获方法是先将靶序列探针(50-70mer)用dna芯片平行合成技术原位合成在玻璃片上,然后将制备好的测序文库杂交到芯片上;经过条件严谨洗涤,所得到的捕获产物经pcr扩增后测序;通常经过固相芯片捕获,大概50%-60%的序列可以比对到靶序列区域。
液相捕获方法是先用原位芯片或常规方法合成超长的靶探针(150-210mer),然后将其通过t7rna启动子进行体外转录扩增,产生生物素化的rna探针;该探针可以在试管中进行杂交和富集,相对固相捕获要方便的多;目前这两个方法已被广泛地应用于连锁分析或关联分析所需的大样本研究。
固相芯片捕获和液相捕获是目前最主要的靶序列测序文库制备方法,但是它们在技术上仍然存在一定的局限性;首先,无论是固相芯片捕获还是液相捕获都需要首先将样品dna通过连接法制备成测序文库,测序文库制备的步骤繁琐难以自动化、耗时耗力。测序文库制备的步骤主要包括:将基因组dna片段化,将片段化的dna末端修补齐,在dna聚合酶的作用下在3’末端加上一个腺苷酸,然后通过dna连接酶在dna片段的两端连接含有通用引物序列的接头序列,最后通过一对通用引物扩增dna片段;然后将制备好的测序文库和靶序列探针杂交,捕获出靶序列。同时,由于测序文库制备的步骤多并且每一步反应后都需要进行纯化,测序文库的制备依赖于起始dna的量,通常需要100ng以上。然而,目前的研究或诊断常常需要分析极少量的细胞甚至单个细胞或者游离dna,例如分析循环肿瘤细胞和循环肿瘤dna需要灵敏度更高的靶向测序文库制备方法。
另外,靶序列的捕获探针昂贵,杂交捕获的效率有限(通常50%-60%的捕获效率);因此该方法的通量低、灵敏度受到一定程度的限制,对于需要高通量的大规模基因组计划或诊疗测序来说不是最适宜的方法。
基于分子倒置探针(mip)或padlock的核酸检测是nilsson等1994年发明的一种目标区域检测方法(nilssonm,etal.1994,science265:2085–2088),配合芯片检测技术和高通量检测技术,该方法可以同时多个目标区域。但其主要的缺点在于探针捕获的区域受限制,捕获区域一般40-170bp;超过170bp,捕获的效率很低。目前高通量测序的读长可以到达2×250bp;另外在传统的mip或padlock探针也不能对捕获的dna片段进行准确的定量,捕获长度受限以及不能准确定量会限制mip或padlock探针的应用。
技术实现要素:
针对现有技术中存在的上述不足,本发明提供了一种基于长链分子倒置探针的核酸靶向捕获测序文库制备方法。该核酸靶序列捕获测序文库制备方法是通过一个带有公共序列连接子以及dna连接酶将分别对应靶向序列的两个探针连接起来,形成一个长链的mip探针,将多个这样制备的连接产物合成并纯化得到长达200多碱基的长链mip探针池,然后通过探针与基因组dna杂交、dna聚合酶延伸以及dna连接酶闭合得到捕获的目标产物,然后通过长链mip探针的公共测序引物区域,用一对公共引物将复制有靶序列的探针进行pcr扩增,获得靶序列的dna测序文库。
为了解决上述技术问题,本发明采用了如下技术方案:
基于长链分子倒置探针的核酸靶向捕获测序文库制备方法,该方法包括如下步骤:
a)根据目标靶序列设计并合成带有部分公共序列、随机分子标签和靶向序列的捕获探针区域a,带有部分公共序列、随机分子标签和靶向序列的捕获探针区域b以及带有公共序列的连接子c;
b)在连接酶反应体系里加入磷酸化的探针a,b以及公共序列的连接子c,同时加入dna连接酶,使a和b在c的桥接作用下连接;
c)合并多个针对不同靶区的连接混合物,通过变性电泳或核酸纯化试剂盒分离和纯化连接的产物,得到长链分子倒置探针;
d)将长链分子倒置探针与待测的样品的dna或cdna混合,杂交,在缓冲液中加入dna聚合酶、dna连接酶、dntp和含mg2+的缓冲液延伸长链分子倒置探针,在dna连接酶的作用下形成闭合的分子;
e)加入核酸外切酶降解没有环化的dna分子;
f)用和长链分子倒置探针的公共序列区域对应的引物进行pcr扩增,得到靶向区域的测序文库。
进一步,所述待测的dna或rna样品设置为基因组dna、线粒体dna、游离dna、cdna、总rna、信使rna、长非编码rna、小rna和rna逆转录产物。
进一步,所述针对目标靶序列设计并合成与靶序列互补的捕获探针a以及和靶序列互补的捕获探针b,a和b之间的距离大于100bp,小于400bp,a或b探针互补区域的长度在15-35碱基。
进一步,所述针对目标靶序列设计并合成与靶序列互补的捕获探针a以及和靶序列互补的捕获探针b,探针a的3’端带有公共的序列,公共的序列长度20-60碱基以及探针b的5’端带有公共的序列,公共的序列长度20-60碱基。
进一步,所述针对目标靶序列设计并合成与靶序列互补的捕获探针a以及和靶序列互补的捕获探针b,探针a和b的公共的序列和靶区特异性序列之间带有简并性碱基构成的随机分子标签(nnnn),随机分子标签的序列长度为2-14碱基,最适3-8碱基。
进一步,所述针对目标靶序列设计并合成与靶序列互补的捕获探针a以及和靶序列互补的捕获探针b,通过一个与探针a和b的公共序列的部分区域互补的连接子、dna连接酶来连接。
进一步,所述针对目标靶序列设计并合成与靶序列互补的捕获探针a以及和靶序列互补的捕获探针b,通过一个与探针a和b的公共序列的部分区域互补的连接子、dna连接酶来连接,连接之后通过dna变性的凝胶电泳分离、纯化单链dna或采用核酸纯化试剂盒纯化连接dna产物。
进一步,所述长链分子倒置探针制备所述dna连接酶包括各种dna连接酶,如t4dna连接酶、taqdna连接酶、e.colidna连接酶等。
进一步,所述基于长链分子倒置探针dna测序文库制备所述dna连接酶包括各种dna连接酶,如ampligase连接酶、taqdna连接酶等,dna聚合酶包括高保真dna聚合酶pfudna聚合酶,phusiondna聚合酶,q5dna聚合酶等。
进一步,针对目标靶序列设计并合成与靶序列互补的捕获探针a以及和靶序列互补的捕获探针b,通过一个与探针a和b的公共序列的部分区域互补的连接子、dna连接酶来连接,所述公共序列是来自人工设计的序列或序列取自非靶标序列,可以含有测序接头的部分序列。
本发明通过具有公共序列的连接子和连接酶将靶区特异性序列探针连接制备了长链分子倒置探针,极大的拓宽了捕获区域的长度,提高了捕获效率和捕获区域的选择性,具有高通量、数字化定量、高特异性、高灵敏度、操作方便、操作成本低、适用范围广。
与现有技术相比,本发明具有如下优点:
1、传统的mip或padlock探针一般是60-80碱基的长度,捕获区域一般40-170bp,最适为165bp;超过170bp,捕获的效率很低;由于捕获效率低,所需要的起始dna也高,一般需要500ng的dna;不同mip探针捕获效率不一,造成捕获的产物的均一性很差;另外在传统的mip或padlock探针也不能对捕获的dna片段进行准确的定量,捕获长度受限以及不能准确定量会限制mip或padlock探针的应用。本发明核酸靶序列捕获测序文库的制备方法通过连接子将带有特异性序列的探针a和b连接起来,形成了长达200多碱基的长链探针。本发明制备出的这种超长的长链mip探针,(1)能够有效地打破传统的探针捕获区域长度的限制,能够有效地捕获100-400bp的目标区域;(2)由于可以在更大的目标区域进行捕获,可以更灵活地选择最适合的杂交位点,不同探针捕获的效率更均一;(3)在特异区域和公共区域之间设计有2个随机的分子标签序列(a探针和b探针部分一个),能够用较短的随机序列有效地产生更多组合分子标签(例如,a探针部分有一个5碱基随机序列nnnnn,b探针部分有1个5碱基随机序列nnnnn,总共有410组合),也避免了太长随机序列会引发非特异性的延伸。
2、本发明核酸靶序列捕获测序文库的制备方法具有以下优点:
1)捕获区域的长度宽:一个探针可以捕获200-400bp的区域,可以同时在一个反应里对上千个不同的基因区域进行定向的捕获。
2)高灵敏度:由于探针更长,其捕获效率大大提高,起始dna的量仅需要10ng甚至更低。
3)可以数字化评估捕获dna的数目。
4)操作成本低:一次制备的捕获探针可用于上千个样品。
5)适用范围广:适用于几个到几千个靶基因。
附图说明
图1为本发明核酸靶序列捕获测序文库制备方法中长链捕获探针的制备方法和流程示意图;
图2为本发明核酸靶序列捕获测序文库制备方法中采用长链探针的dna靶向测序文库的制备流程图。
序列表的序列描述:
seqidno.1~50:捕获探针a1~a50的序列:
靶区特异性序列-aannnncc-agatcggaagagcacacgtctgaactccagtcac
seqidno.51~100:捕获探针b1~b50序列:
acactctttccctacacgacgctcttccgatct-aannnncc-靶区特异性序列
seqidno.101:公共序列a序列:
pi-acaaaggtaagtcaagtgactcttgatgtttgtctcatca
seqidno.102:与公共序列部分反向互补的b序列:
gtagggaaagagtgttgatgagacaaacatcaagagtcacttgacttacctttgtgtgactggagttcaga-nh2
seqidno.103:公共序列c序列:
pi-acaaaggtaagtcaagtgacattgttagatgtagttaagtttgtcttcttgatgtttgtctcatca
seqidno.104:与公共序列部分反向互补的d序列:
gtcgtgtagggaaagagtgtgtgactggagttcagacgt-nh2
seqidno.105:与公共序列部分反向互补的e序列:
gtcacttgacttacctttgtgtgactggagttcagacgtgtgctcttccga-nh2
seqidno.106:与公共序列部分反向互补的f序列:
tcggaagagcgtcgtgtagggaaagagtgttgatgagacaaacatcaaga-nh2
seqidno.107:公共引物g序列:
aagcagaagacggcatacgagatcggtctcggcattcctgctgaaccgctcttccgatct
seqidno.107:带有样品index的公共引物h序列:
caagcagaagacggcatacgagat-index-gtgactggagttcagacgtgtgctcttc
seqidno.108:公共引物pe1.0序列:
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细地描述。
图1所示为本发明长链mip探针的制备方法,有3种具体的制备流程。如图2所示为制备的长链mip探针的结构示意图(a上图)以及靶区(例如外显子)的捕获设计图(a下面3个图)。基于长链分子倒置探针的核酸靶向捕获测序文库制备方法,该方法包括如下步骤:1)长链探针制备流程
(a)第1种长链探针制备流程:过程如图1中(i)所示,根据目标靶序列设计并分别合成探针a1-a50和b1-b50的oligo序列以及公共序列a序列(pi-acaaaggtaagtcaagtgactcttgatgtttgtctcatca)和与公共序列部分反向互补的b序列:(gtagggaaagagtgttgatgagacaaacatcaagagtcacttgacttacctttgtgtgactggagttcaga-nh2)。将a1和b1合并通过t4核苷酸激酶反应磷酸化a1和b1(记为a1-b1),依次类推,a2和b2合并磷酸化,…,an和bn合并磷酸化。将公共序列a序列和与公共序列部分反向互补的b序列合并,退火,使之中间的互补序列之间形成双链,两边为黏末端。将退火好的a序列和b序列分配至50个反应管里,分别加入磷酸化的a1-b1混合物、磷酸化的a2-b2混合物、磷酸化的a3-b3混合物、…、an-bn混合物,加入t4dna连接酶以及反应缓冲液进行连接反应。反应完毕,用dna纯化试剂盒或xp磁珠纯化和浓缩连接产物。连接产物可以进一步用尿素-page凝胶电泳分离纯化。
(b)第2种长链探针制备流程:过程如图1中(ii)所示,根据目标靶序列设计并分别合成探针a1-a50和b1-b50的oligo序列以及与公共序列部分反向互补的d序列:gtcgtgtagggaaagagtgtgtgactggagttcagacgt-nh2。将a1和b1合并通过t4核苷酸激酶反应磷酸化a1和b1(记为a1-b1),依次类推,a2和b2合并磷酸化,…,an和bn合并磷酸化。将公共序列d序列分别加入a1-b1、a2-b2、…、an-bn,退火,使d序列与a序列以及b的公共序列区域互补,加入t4dna连接酶以及反应缓冲液进行连接反应。反应完毕,用dna纯化试剂盒或xp磁珠纯化和浓缩连接产物。连接产物可以进一步用尿素-page凝胶电泳分离纯化。
(c)第3种长链探针制备流程:过程如图1中(iii)所示,根据目标靶序列设计并分别合成探针a1-a50和b1-b50的oligo序列以及公共序列c序列,与公共序列部分反向互补的e序列、与公共序列部分反向互补的f序列。将a1和b1合并通过t4核苷酸激酶反应磷酸化a1和b1(记为a1-b1),依次类推,a2和b2合并磷酸化,…,an和bn合并磷酸化。将序列c、序列e和序列f的混合物分别加入a1-b1、a2-b2、…、an-bn等反应管,退火,加入t4dna连接酶以及反应缓冲液进行连接反应。反应完毕,用dna纯化试剂盒或xp磁珠纯化和浓缩连接产物。连接产物可以进一步用尿素-page凝胶电泳分离纯化。
2)目标区域捕获流程
a)将上述方法制备的dna长链探针和基因组dna杂交,每个探针的分子数目和基因组拷贝数之比在100:1到100000:1之间。捕获探针两端上有靶特异性序列与基因组dna的靶序列区域杂交,杂交条件为95℃杂交变性5分钟,然后再56℃杂交4小时到48小时,杂交反应液为amligasedna连接酶反应缓冲液。
b)在上述杂交反应液中加入dna聚合酶、dna连接酶amligase、dntp和含mg2+的缓冲液,在56℃反应1小时到4小时。杂交的捕获探针的3’末端以目标区域dna为模板进行dna合成,当探针延伸至探针的5’末端时,dna连接酶会封闭缺口,形成一个封闭的单链环状dna。之后加入dna外切酶i和dna外切酶iii,在37℃时进行dna消化反应去除所有线性的dna,反应时间为60-90分钟。
c)以捕获探针延伸和环化产物为模板,用公共引物a和b进行文库pcr扩增,扩增产物即为靶序列捕获测序文库;本实施例以上述收集的25ul上清液做为模板进行pcr扩增,反应体系为:phusiondna聚合酶反应缓冲液、洗脱的dna、公共的pe1.0引物(aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct),然后加入具有样品标签的引物序列(caagcagaagacggcatacgagat-xxxxxx-gtgactggagttcagacgtgtgctcttc)和公共引物pe1.0,进行pcr反应,pcr循环条件为:98℃,2分钟;98℃,20秒,58℃,20秒,72℃,30秒;循环12个循环。这样不同的样品按以上条件进行靶向目标序列扩增,扩增的pcr产物被不同的样品编码序列所编码;合并不同的样品扩增产物,用0.8xp磁珠进行纯化,得到目标pcr产物(400-500bp)。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
序列表
<110>重庆市肿瘤研究所
<120>基于长链分子倒置探针的核酸靶向捕获测序文库制备方法
<160>109
<170>siposequencelisting1.0
<210>1
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>1
tgcttgctaaaaacccagtacgtaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>2
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>2
ataatcagctggcttcaactccaaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>3
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>3
tggtagactggggagaactacaaaaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>4
<211>72
<212>dna
<213>人工序列(artificialsequence)
<400>4
tgaatctgatttttatgctaatattttggcaannnnccagatcggaagagcacacgtctg60
aactccagtcac72
<210>5
<211>62
<212>dna
<213>人工序列(artificialsequence)
<400>5
cccagtggtatgtgggagttaannnnccagatcggaagagcacacgtctgaactccagtc60
ac62
<210>6
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>6
gcgttatacctttgccctgagaannnnccagatcggaagagcacacgtctgaactccagt60
cac63
<210>7
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>7
acaagaaagagcagatgaggttgaaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>8
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>8
acattgattagactgttgaaattgctaannnnccagatcggaagagcacacgtctgaact60
ccagtcac68
<210>9
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>9
tagttgaactacaggtttttttgttgtaannnnccagatcggaagagcacacgtctgaac60
tccagtcac69
<210>10
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>10
acaaaaagtaagaactagcaagactaggaannnnccagatcggaagagcacacgtctgaa60
ctccagtcac70
<210>11
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>11
aatcagaagccctttgagagtggaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>12
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>12
aaagacctattagacacagagaacaaannnnccagatcggaagagcacacgtctgaactc60
cagtcac67
<210>13
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>13
gcaggcaatatctggaacttctcaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>14
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>14
tgctcacagaaggaggactccaannnnccagatcggaagagcacacgtctgaactccagt60
cac63
<210>15
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>15
taccgaaagaccaaaaatcagaactaataannnnccagatcggaagagcacacgtctgaa60
ctccagtcac70
<210>16
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>16
agttttatagatgacgattccttctgtgaannnnccagatcggaagagcacacgtctgaa60
ctccagtcac70
<210>17
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>17
ccccagaagctgattctctgtcaannnnccagatcggaagagcacacgtctgaactccag60
tcac64
<210>18
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>18
gccagcactcttattttaactcctaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>19
<211>61
<212>dna
<213>人工序列(artificialsequence)
<400>19
cgttgagctgttgccacctaannnnccagatcggaagagcacacgtctgaactccagtca60
c61
<210>20
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>20
tttgtcttccaagtagctaatgaaaggaannnnccagatcggaagagcacacgtctgaac60
tccagtcac69
<210>21
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>21
tggtttatgttcttgcagaggagaaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>22
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>22
aaatcacagttttggaggtagctaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>23
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>23
gagcaagcctcagtcaattaatacaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>24
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>24
agaagaatcaggaagtcagtttgaaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>25
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>25
cgattggtcaggtagacagcagaannnnccagatcggaagagcacacgtctgaactccag60
tcac64
<210>26
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>26
atgtttctactgaagctctgcaaaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>27
<211>72
<212>dna
<213>人工序列(artificialsequence)
<400>27
atgccaactgatattacaaaataatattgaaannnnccagatcggaagagcacacgtctg60
aactccagtcac72
<210>28
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>28
acggacttgctatttactgatcaaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>29
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>29
ctgctactaaaacggagcaaaaaannnnccagatcggaagagcacacgtctgaactccag60
tcac64
<210>30
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>30
ctgacataagaaagaacaaaatggacaaannnnccagatcggaagagcacacgtctgaac60
tccagtcac69
<210>31
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>31
gggttttcatacagctagcggaannnnccagatcggaagagcacacgtctgaactccagt60
cac63
<210>32
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>32
cacagctgccccaaagtgtaaaaannnnccagatcggaagagcacacgtctgaactccag60
tcac64
<210>33
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>33
cctgcaacttgttacacaaatcaaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>34
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>34
tggtcaaccagaaagaataaatactaannnnccagatcggaagagcacacgtctgaactc60
cagtcac67
<210>35
<211>72
<212>dna
<213>人工序列(artificialsequence)
<400>35
ccattctgatgaggtatataatgattcaggaannnnccagatcggaagagcacacgtctg60
aactccagtcac72
<210>36
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>36
tgcgttgaggaacttgtgactaannnnccagatcggaagagcacacgtctgaactccagt60
cac63
<210>37
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>37
tcagtaaagtaattaaggaaaacaacgaaannnnccagatcggaagagcacacgtctgaa60
ctccagtcac70
<210>38
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>38
ttgctgacattcagagtgaagaaaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>39
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>39
gcaagtggaaaatctgtccaggaannnnccagatcggaagagcacacgtctgaactccag60
tcac64
<210>40
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>40
cgtactccagaacatttaatatcccaaannnnccagatcggaagagcacacgtctgaact60
ccagtcac68
<210>41
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>41
ttcacctacgtctagacaaaatgtaannnnccagatcggaagagcacacgtctgaactcc60
agtcac66
<210>42
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>42
tctctctcaatttcaacaagacaaacaaannnnccagatcggaagagcacacgtctgaac60
tccagtcac69
<210>43
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>43
tgttctacttactccaaagattcagaaannnnccagatcggaagagcacacgtctgaact60
ccagtcac68
<210>44
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>44
ggaaatggttttgtcaaattcaagaattaannnnccagatcggaagagcacacgtctgaa60
ctccagtcac70
<210>45
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>45
attcagtagacttggtatgctaacaaaannnnccagatcggaagagcacacgtctgaact60
ccagtcac68
<210>46
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>46
tctgttctccctctataggtatggtaaannnnccagatcggaagagcacacgtctgaact60
ccagtcac68
<210>47
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>47
acagtatgagaaaagtctcgtttttaannnnccagatcggaagagcacacgtctgaactc60
cagtcac67
<210>48
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>48
tccattttatcaagtttctgctacaagaannnnccagatcggaagagcacacgtctgaac60
tccagtcac69
<210>49
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>49
aacattgatggacatggctctgaaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>50
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>50
acaactccaatcaagcagtagctaannnnccagatcggaagagcacacgtctgaactcca60
gtcac65
<210>51
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>51
acactctttccctacacgacgctcttccgatctaannnnccgtgcattttggtcttctgt60
tttgc65
<210>52
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>52
acactctttccctacacgacgctcttccgatctaannnncctgatctttaactgttctgg60
gtcac65
<210>53
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>53
acactctttccctacacgacgctcttccgatctaannnnccgctccaccctataattctg60
aacct65
<210>54
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>54
acactctttccctacacgacgctcttccgatctaannnncctccagagtatatacattct60
cactgaatta70
<210>55
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>55
acactctttccctacacgacgctcttccgatctaannnnccttaaaataacctaagggat60
ttgctttg68
<210>56
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>56
acactctttccctacacgacgctcttccgatctaannnnccaacaccacaaagagataag60
tcaggt66
<210>57
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>57
acactctttccctacacgacgctcttccgatctaannnnccatccttaatgatcagggca60
tttct65
<210>58
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>58
acactctttccctacacgacgctcttccgatctaannnnccagtagatgtgctttttgat60
gtctg65
<210>59
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>59
acactctttccctacacgacgctcttccgatctaannnnccatgtgcattgagagttttt60
atactagtg69
<210>60
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>60
acactctttccctacacgacgctcttccgatctaannnncctggcttataaaatattaat60
gtgcttctgt70
<210>61
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>61
acactctttccctacacgacgctcttccgatctaannnncccagttgtagatacctctga60
agaagatag69
<210>62
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>62
acactctttccctacacgacgctcttccgatctaannnnccagtggaaccaaatgatact60
gatcc65
<210>63
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>63
acactctttccctacacgacgctcttccgatctaannnncctggagaaaatacccctatt60
gcat64
<210>64
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>64
acactctttccctacacgacgctcttccgatctaannnnccgcagcatcttgaatctcat60
acagac66
<210>65
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>65
acactctttccctacacgacgctcttccgatctaannnnccgaagcctctgaaagtggac60
tgg63
<210>66
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>66
acactctttccctacacgacgctcttccgatctaannnncctgaagaatgcaggtttaat60
atccact67
<210>67
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>67
acactctttccctacacgacgctcttccgatctaannnnccatggtactttaattttgtc60
actttgtgt69
<210>68
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>68
acactctttccctacacgacgctcttccgatctaannnnccagcaaaatgtaataaggaa60
aaactacag69
<210>69
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>69
acactctttccctacacgacgctcttccgatctaannnnccactgactttcaatcccaga60
aaagtct67
<210>70
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>70
acactctttccctacacgacgctcttccgatctaannnnccttcccatggaaaagaatca60
agatgt66
<210>71
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>71
acactctttccctacacgacgctcttccgatctaannnnccactgtcaatccagactctg60
aagaa65
<210>72
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>72
acactctttccctacacgacgctcttccgatctaannnncccacaggtgataaacaagca60
acc63
<210>73
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>73
acactctttccctacacgacgctcttccgatctaannnnccattacatgaacaaatgggc60
aggac65
<210>74
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>74
acactctttccctacacgacgctcttccgatctaannnnccgtgttgaaattgtaaatac60
cttggca67
<210>75
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>75
acactctttccctacacgacgctcttccgatctaannnnccacctagccaaaaggcagaa60
atta64
<210>76
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>76
acactctttccctacacgacgctcttccgatctaannnnccttctgaggaatgcagagat60
gctg64
<210>77
<211>61
<212>dna
<213>人工序列(artificialsequence)
<400>77
acactctttccctacacgacgctcttccgatctaannnnccgaagtggggtttaggggct60
t61
<210>78
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>78
acactctttccctacacgacgctcttccgatctaannnnccagaaaatcataatgataaa60
actgtaagtg70
<210>79
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>79
acactctttccctacacgacgctcttccgatctaannnnccagaatttgatggcagtgat60
tcaagta67
<210>80
<211>62
<212>dna
<213>人工序列(artificialsequence)
<400>80
acactctttccctacacgacgctcttccgatctaannnnccgttgcgaaagctcaagaag60
ca62
<210>81
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>81
acactctttccctacacgacgctcttccgatctaannnncctgatcagaaaccagaagaa60
ttgc64
<210>82
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>82
acactctttccctacacgacgctcttccgatctaannnncccaacccgaacgtgatgaaa60
aga63
<210>83
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>83
acactctttccctacacgacgctcttccgatctaannnnccaccttgaattagcatgtga60
gacca65
<210>84
<211>69
<212>dna
<213>人工序列(artificialsequence)
<400>84
acactctttccctacacgacgctcttccgatctaannnnccttgaaagttaaagtacatg60
aaaatgtag69
<210>85
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>85
acactctttccctacacgacgctcttccgatctaannnnccaacttctgtgagtcagact60
tcatt65
<210>86
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>86
acactctttccctacacgacgctcttccgatctaannnncctcatctctccgaaaaacaa60
gatact66
<210>87
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>87
acactctttccctacacgacgctcttccgatctaannnncctgcaaatgcatacccacaa60
act63
<210>88
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>88
acactctttccctacacgacgctcttccgatctaannnnccagccagtggtaaaatcgtt60
tgtg64
<210>89
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>89
acactctttccctacacgacgctcttccgatctaannnncctgtagcacgcattcacata60
agg63
<210>90
<211>65
<212>dna
<213>人工序列(artificialsequence)
<400>90
acactctttccctacacgacgctcttccgatctaannnnccgggaagcttcataagtcag60
tctca65
<210>91
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>91
acactctttccctacacgacgctcttccgatctaannnncccagaccagctcacaagaga60
aga63
<210>92
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>92
acactctttccctacacgacgctcttccgatctaannnnccaagggagtgttagaggaat60
ttga64
<210>93
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>93
acactctttccctacacgacgctcttccgatctaannnnccaggtggttcttcagaaaat60
aatcact67
<210>94
<211>63
<212>dna
<213>人工序列(artificialsequence)
<400>94
acactctttccctacacgacgctcttccgatctaannnnccacaggcttcacctaaaaac60
gta63
<210>95
<211>61
<212>dna
<213>人工序列(artificialsequence)
<400>95
acactctttccctacacgacgctcttccgatctaannnnccactgccaagtcatgccaca60
c61
<210>96
<211>71
<212>dna
<213>人工序列(artificialsequence)
<400>96
acactctttccctacacgacgctcttccgatctaannnncctggtctatagacttttgag60
aaataaaactg71
<210>97
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>97
acactctttccctacacgacgctcttccgatctaannnnccacattcactgaaaattgta60
aagcct66
<210>98
<211>62
<212>dna
<213>人工序列(artificialsequence)
<400>98
acactctttccctacacgacgctcttccgatctaannnnccagggtctgcaacaaaggca60
ta62
<210>99
<211>68
<212>dna
<213>人工序列(artificialsequence)
<400>99
acactctttccctacacgacgctcttccgatctaannnnccggaaaaatcttcaagcaat60
ttagcagt68
<210>100
<211>62
<212>dna
<213>人工序列(artificialsequence)
<400>100
acactctttccctacacgacgctcttccgatctaannnncctacaggcagaccaaccaaa60
gt62
<210>101
<211>40
<212>dna
<213>人工序列(artificialsequence)
<400>101
acaaaggtaagtcaagtgactcttgatgtttgtctcatca40
<210>102
<211>71
<212>dna
<213>人工序列(artificialsequence)
<400>102
gtagggaaagagtgttgatgagacaaacatcaagagtcacttgacttacctttgtgtgac60
tggagttcaga71
<210>103
<211>66
<212>dna
<213>人工序列(artificialsequence)
<400>103
acaaaggtaagtcaagtgacattgttagatgtagttaagtttgtcttcttgatgtttgtc60
tcatca66
<210>104
<211>39
<212>dna
<213>人工序列(artificialsequence)
<400>104
gtcgtgtagggaaagagtgtgtgactggagttcagacgt39
<210>105
<211>51
<212>dna
<213>人工序列(artificialsequence)
<400>105
gtcacttgacttacctttgtgtgactggagttcagacgtgtgctcttccga51
<210>106
<211>50
<212>dna
<213>人工序列(artificialsequence)
<400>106
tcggaagagcgtcgtgtagggaaagagtgttgatgagacaaacatcaaga50
<210>107
<211>60
<212>dna
<213>人工序列(artificialsequence)
<400>107
aagcagaagacggcatacgagatcggtctcggcattcctgctgaaccgctcttccgatct60
<210>108
<211>54
<212>dna
<213>人工序列(artificialsequence)
<400>108
caagcagaagacggcatacgagatndgtgactggagttcagacgtgtgctcttc54
<210>109
<211>58
<212>dna
<213>人工序列(artificialsequence)
<400>109
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct58