一种单分子荧光基因测序方法与流程

文档序号:24408368发布日期:2021-03-26 18:17阅读:401来源:国知局
一种单分子荧光基因测序方法与流程

1.本发明涉及基因测序技术领域,具体涉及一种单分子荧光基因测序方法。


背景技术:

2.基因测序技术是指识别特定dna片段的碱基序列,即腺嘌呤(a)、胸腺嘧啶(t)、胞嘧啶(c)与鸟嘌呤(g)的序列排列方式。目前基因测序市场主要以二代测序技术为主,典型代表为illumina低、中、高测序平台、thermal fisher公司的ion torrent测序平台。相较于传统一代测序方法,二代测序具有高通量低成本的突出特点,尽管准确度不如传统测序方法,但是由于海量数据的分析,可以得到超出序列本身的信息,因此也是目前测序市场中的主流测序技术。但是由于扩增因而测序覆盖度受gc组分影响,读长较短不适合从头组装等研究。三代基因测序以单分子、长读长、无pcr偏好性等为主要优势,典型代表为pacbio的单分子荧光实时测序和oxford公司的nanopore技术。pacbio公司的技术主要是利用零模波导纳米孔技术提高信噪比实现对待测dna片段的边合成边测序,nanopore技术主要是对dna或rna模板通过纳米孔产生的电信号变化对碱基进行实时测序。前者由于检测要求较高,设备成本和测序成本一直非常高,并且通量受限于目前已有的纳米加工技术,后者结构简单、测序读长长,但是准确度相对较低。


技术实现要素:

3.为了克服已有得技术问题,本发明提供了一种结构简单,具有高时间分辨率、高空间分辨率的荧光测序成像方法。
4.为实现上述目的,本发明采用以下具体技术方案:
5.一种单分子荧光基因测序方法,使用脉冲激光器对单链聚合延伸过程中的核酸进行频率扫描,通过不同碱基出现的频次以及前后碱基的类别,实现对被测碱基的判别;
6.其中,所述脉冲激光器的每个扫描周期内,四种不同波长的激光器依次分别单独激发;四种碱基的四个聚合延伸时间中的最小值,大于所述脉冲激光器的扫描周期。
7.优选地,所述四种不同波长的激光器,分别对应四种不同激发波长的荧光染料,该四种不同激发波长的荧光染料分别对应修饰四种碱基。
8.优选地,所述脉冲激光器组的功率小于dna聚合酶、dna分子的光损伤阈值,或者,所述脉冲激光器组的功率小于rna聚合酶、rna分子的光损伤阈值。
9.优选地,所述脉冲激光器的每个扫描周期内,四种不同波长的激光器的扫描时间相等。
10.优选地,激发过程中每种荧光分子扫描工程中出现的次数n和不同碱基聚合延伸时间与扫描周期之间的碱基判别准则为:
[0011][0012][0013]
其中,ta、tt、tg、tc分别为四种碱基a、t、g、c在dna聚合酶的作用下与被测dna单链聚合延伸的聚合延伸时间。
[0014]
优选地,所述频率扫描过程中每种荧光信号出现的次数n和不同碱基聚合延伸时间与扫描周期t之间的碱基判别准则为:
[0015]
碱基类别与数量判别准则a0<n≤2ta/taa2ta/t<n≤3ta/taaa3ta/t<n≤4ta/taaa
……
a
m
mta/t<n≤(m+1)ta/tu0<n≤2tu/tuu2tu/t<n≤3tu/tuuu3tu/t<n≤4tu/tuuu
……
u
m
mtu/t<n≤(m+1)tu/tg0<n≤2tg/t
gg2tg/t<n≤3tg/tggg3tg/t<n≤4tg/tggg
……
g
m
mtg/t<n≤(m+1)tg/tc0<n≤2tc/tcc2tc/t<n≤3tc/tccc3tc/t<n≤4tc/tccc
……
c
m
mtc/t<n≤(m+1)tc/t
[0016]
其中,ta、tu、tg、tc分别为四种碱基a、u、g、c在rna聚合酶的作用下与被测rna单链聚合延伸的聚合延伸时间。
[0017]
优选地,测序步骤为:
[0018]
s1、四种标记不同荧光分子的dntps混合液加入到测序芯片上;
[0019]
s2、四种激光器扫描成像,记录不同种类的荧光信号;
[0020]
s3、对不同时刻的荧光信号进行解码,根据碱基种类与数目。
[0021]
优选地,四种不同波长的所述激光器为单波长激光器,其发射波长分别激发一种荧光标记物并产生荧光;四种不同碱基的5’端末端磷酸修饰有四种不同荧光标记物。
[0022]
优选地,根据前述的单分子荧光基因测序方法,在所述脉冲激光器一个完整的扫描周期内产生空白信号,该信号在计算荧光信号次数统计上归类到前后相邻两个碱基,即前后相邻两个碱基在原来荧光信号次数的基础上加一。
[0023]
本发明能取得以下技术效果:
[0024]
本发明采用脉冲激光扫描的照明方式可以有效降低激光光强对传统三代单分子实时测序中连续照明对dna聚合酶的光损伤,并且脉冲扫描时间选择小于聚合延伸时间,因此在atgc循环测序过程中后一个碱基开始检测前,对前一个碱基的重复测量可以提高测序准确率。
附图说明
[0025]
图1是本发明的一种基因测序方法的光学成像系统结构示意图。
[0026]
图2是本发明实施例的基因测序方法的流程示意图。
[0027]
脉冲激光器组1、反射镜2、二向色性滤光片组件3、4

f光学系统4、四通道带通滤光片5、准直滤光片6、成像物镜7、准直透镜8、准直图像传感器9、准直透镜组10、后端滤光片11、后端准直透镜12、筒镜13、测序图像传感器14、测序芯片15、测序采集图像16,激光脉冲图17,针孔101。
具体实施方式
[0028]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,而不构成对本发明的限制。
[0029]
下面将对本发明提供的一种单分子荧光基因测序方法进行详细说明。
[0030]
本发明提出了一种新型的基于频率扫描的单分子实时基因测序技术(frequency

sweeping single molecule real

time sequencing,f

smrts),该方法主要是基于标记荧
光分子碱基扫描图像时间差值解码技术(time

difference decoding,tdd)。
[0031]
本发明的测序原理如下:
[0032]
采用多个波长的激光组扫描的方式,相邻脉冲的时间间隔小于每种单核苷酸聚合延伸最短时间,通过atgc循环检测实现对未知碱基的识别,通过对不同碱基出现频次以及前后碱基类别的数据判断分析,最终实现高时间、高空间分辨率的单分子实时测序,该方法利用不同时刻荧光分子碱基扫描产生的荧光信号并解码的方式获得测序结果的技术称为时间差解码技术。
[0033]
图1示出了本发明的一种基因测序方法的光学成像系统结构示意图。
[0034]
如图1所示,脉冲激光器组1具体为四个不同波长的单脉冲激光器,用于激发荧光信号,波长的选择分别对应不同的脱氧核糖核苷三磷酸(dntps),设定四种激光器的波长及其对应的关系分别为λ1>λ2>λ3>λ4。四种激光器按照波长大小依次顺序排布。
[0035]
荧光信号进入光路的方式有如下两种情况:
[0036]
情况一:波长按照从小到大顺序,发射波长λ1的发射激光通过反射镜2进入光路中,其余波长的发射激光通过二向色性滤光片组件3进入光路系统中,二向色性滤光片组件3的选择为带通滤光片,需要满足发射波长激光高反射,同时在发射波长以上的波段可以实现高透过率的长波带通。
[0037]
情况二:波长按照从大到小顺序,最短发射波长λ4通过一组反射镜2进入光路中,其余波长的发射激光通过二向色性滤光片组件3进入光路系统中,二向色性滤光片组件3的选择为带通滤光片,需要满足发射波长激光高反射,同时在发射波长以下的波段可以实现高透过率的短波带通。
[0038]
上述两种情况的顺序排布对于滤光片的选择比较容易实现,但是不仅仅局限与上述排布方式,随机排布的形式对于滤光片的选择需要多通道滤光片,针对不同的光路设计需要选择不同的滤光片结构。
[0039]
为保证光场均匀分布以及与测序芯片15成像视场匹配,在脉冲激光器组1与二向色性滤光片组件3的光路之间分别加入4

f光学系统4。
[0040]
在本发明的一个优选实施例中,在激发光光路上,四种激发光再通过一个45

设置的四通道带通滤光片5,反射至上方成像物镜7照射到测序芯片15上;在荧光光路上,激发产生的荧光信号透过四通道带通滤光片5和后端成像系统进入测序图像传感器14进行成像。
[0041]
在本发明的一个优选实施例中,为了保证测序光路的准直,在光学系统加入了光学对准系统。例如,在上端荧光光路的四通道带通滤光片5与成像物镜7中间,设置与四通道带通滤光片5平行的准直滤光片6,在准直滤光片6右侧设置准直透镜8及准直图像传感器9;激发光通过该准直滤光片6和一个准直透镜8将入射激光中部分光入射到准直图像传感器9上。
[0042]
在本发明的一个优选实施例中,后端成像系统主要包括一个准直透镜组10、一个后端滤光片11和一个后端准直透镜12、筒镜13以及测序图像传感器14;为了实现高频滤光提高成像质量在透镜组中间加入针孔101,该针孔101设置在准直透镜组10的两组透镜的前后共焦点上;后端滤光片11实现对背景噪声进行滤波,为了实现宽场成像在测序图像传感器14前加入一个筒镜。激发产生的荧光信号通过后端成像系统进入测序图像传感器14进行成像。在本发明的一个实施例中,通过提供如下技术方案实现光学系统基因测序目的:
[0043]
磷酸段修饰的四种碱基a、t、g、c在dna聚合酶的作用下与被测dna单链聚合延伸,上一个碱基聚合结束时至下一个碱基聚合开始前为一个碱基的完整聚合延伸时间,四种碱基的时间分别设定为ta、tt、tg和tc;在四种碱基磷酸段修饰不同的荧光分子(比如alexa fluor系列荧光染料),分别对应四种不同的激发波长,每种激光器的脉冲时间相等,四种激光器分别单独激发,扫描周期设定为t,每种激光器的脉冲时间分别为0.25t。
[0044]
类似的,rna的测序也可以使用该方法,磷酸段修饰的四种碱基a、u、g、c在rna聚合酶的作用下与被测rna单链聚合延伸,四种碱基对应四种不同的激发波长,augc的循环扫描实现对碱基的识别。
[0045]
为了保证每个碱基在聚合延伸过程中每种激光脉冲都可以对碱基荧光分子扫描一遍,因此测序过程中需要满足条件:t≤min(ta,tt,tg,tc)。激发过程中记录每个荧光分子在扫描过程中出现的次数n,四种碱基a、t、g、c的聚合延伸时间分别为ta、tt、tg、tc,由于扫描周期小于每种碱基的聚合延伸时间,因此单个碱基的出现次数可能会大于1,统计碱基数量时需要根据前后周期信号的变化来进行,因此确定不同碱基的判别遵循以下原则:
[0046]
碱基类别与数量判别准则a0<n≤2ta/taa2ta/t<n≤3ta/taaa3ta/t<n≤4ta/taaa
……
a
m
mta/t<n≤(m+1)ta/tt0<n≤2tt/ttt2tt/t<n≤3tt/tttt3tt/t<n≤4tt/tttt
……
t
m
mtt/t<n≤(m+1)tt/tg0<n≤2tg/tgg2tg/t<n≤3tg/tggg3tg/t<n≤4tg/tggg
……
g
m
mtg/t<n≤(m+1)tg/tc0<n≤2tc/tcc2tc/t<n≤3tc/tccc3tc/t<n≤4tc/tccc
……
c
m
mtc/t<n≤(m+1)tc/t
[0047]
rna测序的判别规则与dna测序过程的原理基本相同,只是将碱基u的聚合延伸时间tu替代dna的测序过程碱基u的聚合延伸时间tt,再次不再赘述。
[0048]
脉冲激光器在扫描过程中,相邻两个碱基的交界面会出现在下一个碱基对应的脉冲激光器扫描之前,所以通常会在一个完整的扫描周期中产生空白信号,在上述判别准则的基础上,为了避免测序误差,该空白信号归类到前后两个碱基,即空白信号相邻两个碱基对应的次数在原来基础上加一。
[0049]
本实施例利用多通道二向色镜与多通道截止滤光片,在高数值孔径、宽视场物镜成像系统内,并借助高速、高灵敏单光子scmos成像系统,通过atgc循环检测实现对未知碱基的识别。
[0050]
实施例
[0051]
图2示出了发明实施例的基因测序方法的流程示意图。
[0052]
选择一条待测dna单链,不失一般性,碱基的顺序随机分布如下:aggctatgcaaaatcggagcg;a、t、g、c四种碱基上分别在磷酸段标记alexa fluor 488,alexa fluor 532,alexa fluor 594和alexa fluor 647四种不同的荧光分子,对应中心激发波长分别为496nm,532nm,590nm和650nm,发射中心波长分别为519nm,553nm,617nm,665nm。测序过程中根据四种碱基上荧光信号确定待测碱基,脉冲激光器的扫描顺序保持不变,实施例中为a

t

g

c循环测序,设定扫描周期t为0.6s,四种不同碱基在dna聚合酶的作用下的聚合延伸时间分别为:ta=1s,tt=1.2s,tg=0.8s,tc=1.5s。扫描时间的选择和dna聚合酶的时间满足上述提到的四种激光器扫描周期小于四种碱基中最小的聚合延伸时间,不失一般性。
[0053]
根据上述四种荧光分子的激发波长,四种脉冲激光器分别为波长为496nm,532nm,590nm和650nm的窄线宽激光器,激光器的功率选择低于上述四种荧光分子以及dna聚合酶的损伤阈值,反射镜2为400

750nm波长范围高发射平面发射镜,二向色性滤光片组件3分别为反射波段496
±
10nm,532
±
10nm和590
±
10nm,透射波段510

750nm,550

750nm,610

750nm的二向色性长波通滤光片,四通道带通滤光片5为反射中心波长496nm,532nm,590nm,650nm(同荧光分子激发波长),透射519nm,553nm,617nm,665nm(同荧光分子的最大发射波长),带宽20nm的四通道带通滤光片,显微物镜7放大倍数40
×
,数值孔径0.55,针孔101直径100μm,测序图像传感器14为scmos或emccd相机,准直图像传感器9为cmos或ccd相机,光学系统中的透镜主要取决于系统的整体尺寸。
[0054]
本发明的测序步骤如下:
[0055]
步骤一:将四种标记不同荧光分子的dntps混合液加入到测序芯片上;
[0056]
步骤二:使用四种激光器对四种标记不同荧光分子扫描成像,记录不同种类的荧光信号;
[0057]
步骤三:对不同时刻的荧光信号进行解码,根据上述碱基判别原则确定简介种类与数目。
[0058]
在本实施例中,对脉冲激光器激发的荧光信号扫描后进行荧光信号成像,对每次产生的荧光信号进行记录,统计碱基出现的次数n,图像传感器记录的荧光信号对应的碱基初步序列为:
[0059]
aagggcccttaattggcccaaaaaattccgggaagccgg
[0060]
如上述所,ta/t=1.667,tt/t=2,tg/t=1.333,tc/t=2.5,根据碱基判别准则可以得到上述初步得到的碱基序列对应的实际被测序列之间的对应关系:
[0061]
上述表格中第一行对应的碱基为图像传感器通过荧光信号的不同记录的信号,第二行为相同碱基出现的次数统计,需要注意的是,在第17个扫描周期时,激光器在扫描范围
内没有荧光信号的产生,这主要是由于上一个碱基在扫描结束至下一个碱基扫描开始前这段时间内,按照上述a

t

g

c先后循环顺序四种脉冲激光器在扫描过程中,相邻两个碱基的交界面出现在下一个碱基对应的脉冲激光器扫描之前,实施例中c、a两个碱基交界面出现在a对应激光器扫描结束后,在该扫描周期内没有荧光信号,空白信号的产生不会影响碱基种类但可能会影响碱基数目,上述空白信号归类到前、后两个碱基上,即在原来的基础上的数量上均加1,这样可以减少由激光器扫描顺序不同引起的误差。
[0062]
通过上面表格得到的被测序列为:aggctatgcaaaatcggagcg,与待测序列完全一致。
[0063]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0064]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
[0065]
以上本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所作出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1