本发明涉及一种制备二代测序接头的方法,属于分子生物学领域。
背景技术
在illumina测序平台中,接头是二代测序建库中必要的元素,目前官方的接头包含多种类型,序列中包含了p5与p7扩增引物结合序列、read1和read2测序引物结合序列、样本标签序列、分子标签序列等,并且带有用于a/t连接的3’-dt尾。
目前常于p7端设计单链分子标签用于给建库中的目标分子添加标签,使生信分析过程可以捕获到更精细的分子信息,降低变异分析的背景噪音。
另外,也可以通过双链分子标签,结合单链分子标签,通过生信将变异分析的背景噪音降得更低,使测序分析结果更加精准可靠。
但是,目前没有较好的双链标签添加方法方便于文库构建。
1、目前接头通常不含单链分子标签、或仅含有单链分子标签二不含双链标签,生物信息分析降噪效果有限;
2、如capp-seq技术中含有双链标签,但是标签数较低,对生物信息分析的改进有限。
技术实现要素:
本发明的目的在于提供一种制备二代测序接头的方法,以解决上述问题。
本发明采用了如下技术方案:
一种制备二代测序接头的方法,其特征在于,包括:
步骤一:合成接头序列,接头序列包含第一序列和第二序列,
其中,所述第二序列包括:限制性内切酶的保护碱基和随机碱基的双链分子标签,
步骤二:接头序列退火,混匀第一序列和第二序列,在退火体系中按退火程序退火形成双链,
步骤三:补齐步骤二中所形成的双链的接头,
步骤四:酶切回收接头,
第一序列的序列如下:
5-a*a*tgatacggcgaccaccgagatctacactctttccctacacgac-gctcttccgat*c*t-3,
第二序列的序列如下:
5-nnnnannnncccagtag*a*tcggaagagcacacgtctgaactccagtcacnnnn-nnnnnnnn-atctcgtatgccgtcttctgct*t*g-3,
第二序列中,第1至4位为限制性内切酶的保护碱基,
第6位至第9位是四个随机碱基的双链分子标签,
第50位至第53位是四个随机碱基的单链分子标签,
第54位至第61位是6-8个碱基的样本标签。
进一步,本发明的制备二代测序接头的方法,还具有这样的特征:其中,所述第二序列中还具有随机碱基的单链分子标签。
进一步,本发明的制备二代测序接头的方法,还具有这样的特征:其中,所述第二序列中还具有样本标签。
进一步,本发明的制备二代测序接头的方法,还具有这样的特征:其中,所述第二序列中还具有限制性内切酶bmri的酶切位点。
进一步,本发明的制备二代测序接头的方法,还具有这样的特征:步骤三中,采用t4dna聚合酶延伸补平步骤二中的退火产物。
进一步,本发明的制备二代测序接头的方法,还具有这样的特征:步骤四中,采用限制性内切酶bmri酶切步骤三中的延伸产物,并采用上海翊圣生物科技有限公司的hieffngs™smarterdnacleanbeads纯化回收接头,去除50bp以内的残余双链小片段,保留接头。
发明的有益效果
本发明的制备二代测序接头的方法,具有以下优势:
1.接头中含有更长的双链分子标签,为生信分析提供更好的信息基础;而现有的产品通常不带双链分子标签、罗氏的带2bp的双链分子标签。
2.可以有效、较经济实惠地合成获得;
3.适用于illuminahi-seq、mi-seq等测序平台。
具体实施方式
以下通过具体实例来说明本发明的具体实施方式。
步骤一:合成接头序列。合成以下两种序列:
序列1:
5-a*a*tgatacggcgaccaccgagatctacactctttccctacacgac-gctcttccgat*c*t-3
序列2:
5-nnnn-annnncccagt-ag*a*tcggaagagc-acacgtctgaactccagtcac-nnnn-nnnnnnnn-atctcgtatgccgtcttctgct*t*g-3
序列中“*”为保护性修饰;
第1至第4位的碱基为限制性内切酶的保护碱基,在其它的实施方式中,5’端的保护性碱基,可选的碱基数为0-10个,具体碱基可变,具体根据实际案例设计而定;
第6位至第9位是四个随机碱基的双链分子标签,
第50位至第53位是四个随机碱基的单链分子标签,
第54位至第61位是6-8个碱基的样本标签。每次合成固定碱基的序列,次序列可变;
第10位至第15位的碱基为限制性内切酶bmri的酶切位点。
步骤二:接头序列退火。
步骤三:延伸补齐接头。采用t4dna聚合酶延伸补平步骤二中的退火产物。
步骤四:酶切回收3’-dt尾接头。采用限制性内切酶bmri酶切步骤三中的延伸产物,并采用上海翊圣生物科技有限公司的hieffngs™smarterdnacleanbeads纯化回收接头,去除50bp以内的残余双链小片段,保留接头。
双链分子标签接头制备示例:
1、合成接头序列:
序列1:
5-a*a*tgatacggcgaccaccgagatctacactctttccctacacgac-gctcttccgat*c*t-3
序列2:
5-tttc-annnncccagt-ag*a*tcggaagagc-acacgtctgaactccagtcac-nnnn-nnnnnnnn-atctcgtatgccgtcttctgct*t*g-3
2、接头序列退火:
1:1混匀序列1和序列2,在退火体系中按退火程序退火形成双链,形成以下结构:
3、延伸补齐接头:
利用t4dna聚合酶延伸补齐接头序列,如下:
4、酶切回收3’-dt尾接头:
利用bmri限制性内切酶酶切上述接头,并利用上海翊圣生物科技有限公司的hieffngs™smarterdnacleanbeads纯化回收接头,接头如下:
本发明所提供的接头制备方法,回收效率在40%~80%。
序列表
<110>翌圣生物科技(上海)有限公司
<120>一种制备二代测序接头的方法
<160>6
<170>siposequencelisting1.0
<210>1
<211>58
<212>dna
<213>artificialsequence
<400>1
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct58
<210>2
<211>85
<212>dna
<213>artificialsequence
<220>
<221>misc_feature
<222>(1)..(4)
<223>nisa,c,g,ort
<220>
<221>misc_feature
<222>(6)..(9)
<223>nisa,c,g,ort
<220>
<221>misc_feature
<222>(50)..(61)
<223>nisa,c,g,ort
<400>2
nnnnannnncccagtagatcggaagagcacacgtctgaactccagtcacnnnnnnnnnnn60
natctcgtatgccgtcttctgcttg85
<210>3
<211>85
<212>dna
<213>artificialsequence
<220>
<221>misc_feature
<222>(6)..(9)
<223>nisa,c,g,ort
<220>
<221>misc_feature
<222>(50)..(61)
<223>nisa,c,g,ort
<400>3
tttcannnncccagtagatcggaagagcacacgtctgaactccagtcacnnnnnnnnnnn60
natctcgtatgccgtcttctgcttg85
<210>4
<211>73
<212>dna
<213>artificialsequence
<220>
<221>misc_feature
<222>(65)..(68)
<223>nisa,c,g,ort
<400>4
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctac60
tgggnnnntgaaa73
<210>5
<211>69
<212>dna
<213>artificialsequence
<220>
<221>misc_feature
<222>(65)..(68)
<223>nisa,c,g,ort
<400>5
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctac60
tgggnnnnt69
<210>6
<211>78
<212>dna
<213>artificialsequence
<220>
<221>misc_feature
<222>(1)..(4)
<223>nisa,c,g,ort
<220>
<221>misc_feature
<222>(45)..(54)
<223>nisa,c,g,ort
<400>6
nnnncccagtagatcggaagagcacacgtctgaactccagtcacnnnnnnnnnnatctcg60
tatgccgtcttctgcttg78