特异性分子标签UMI组及其应用的制作方法

文档序号:21172012发布日期:2020-06-20 17:13阅读:5683来源:国知局
特异性分子标签UMI组及其应用的制作方法
本发明涉及生物测序领域,具体而言,涉及一种特异性分子标签umi组及其应用。
背景技术
:随着二代测序(ngs)成本的下降,对于人类疾病的研究正在向研究范围更广、测序深度更高的方向逐渐发展。高深度测序可以提高检测灵敏度,更好地检测低频突变,从而获取更加全面和准确的基因变异信息,因此对于疾病尤其是癌症的研究具有重要意义。但是高深度测序将会导致更多的重复测序数据,因此,能够在dna分子去重和错误校正中发挥重要作用的umi就更为至关重要。umi(特异性分子标签,uniquemolecularidentifiers)是一段随机化或特定的核苷酸短序列,在建库的过程中通过连接的方式导入,从而如同分子条形码一般特异性地标识每个模板。该方法不仅能够精准定量起始的分子数,还能够削减测序及文库制备产生的错误以及pcr扩增所造成的不均一性,用以在高通量测序的海量数据中区分同一来源的dna片段,并且通过同一来源的多条dna片段的互相比对,可以有效分辨文库构建过程中引入的假阳突变,从而可更加有效检测超低丰度突变。然而,目前市面上使用的umi均为随机序列umi,这种类型umi具有生产便利的特点,但是具有以下缺陷和不足之处:1.对dna分子的去重效果较差;2.对umi序列本身的测序错误不能有效进行校正,假阳突变的校正效果差;3.商品化产品成本昂贵。有鉴于此,特提出本发明。技术实现要素:本发明的第一目的在于提供一种特异性分子标签umi组,以缓解现有技术中假阳率高的技术问题。本发明的第二目的在于提供一种含有umi分子标签的建库接头组。本发明的第三目的在于提供特异性分子标签umi组或建库接头组的应用。本发明的第四目的在于提供一种测序用试剂盒。本发明的第五目的在于提供一种测序方法。为了实现本发明的上述目的,特采用以下技术方案:特异性分子标签umi组,所述特异性分子标签umi组包括umi分子标签,所述umi分子标签正义链序列如seqidno.1-48所示:含有umi分子标签的建库接头组,所述建库接头组包括上述特异性分子标签umi组。进一步地,建库接头由接头序列和umi分子标签连接而成;优选地,所述接头序列的正义链如seqidno.49所示:5'-acactctttccctacacgacgctcttccgatct-3’(seqidno.49);优选地,所述接头序列的反义链如seqidno.50所示:5'-agatcggaagagcacacgtctgaactccagtcac-3’(seqidno.50)。进一步地,所述建库接头由正义链和反义链构成,其中,建库接头的正义链包括接头序列的正义链和umi分子标签的正义链,建库接头的反义链包括接头序列的反义链和umi分子标签的反义链。进一步地,umi分子标签的正义链连接在接头序列的正义链的3’端;优选地,umi分子标签的反义链连接在接头序列的反义链的5’端。进一步地,所述建库接头还含有二硫键连接的碱基,所述碱基用于与目标序列互补连接。上述特异性分子标签umi组或建库接头组在基因测序中的应用;优选地,所述应用包括测序中的文库构建应用。上述特异性分子标签umi组或建库接头组在制备测序用试剂盒中的应用。一种测序用试剂盒,所述试剂盒包括上述特异性分子标签umi组或建库接头组。一种测序方法,包括如下步骤:利用上述建库接头组进行文库构建。进一步地,将建库接头组连接目标序列,再pcr引入index完成文库构建,依次通过靶向捕获、富集得到杂交捕获文库,进行测序。与现有技术相比,本发明的有益效果为:1)本发明提供的特异性分子标签umi组,包括48条互不重复、固定长度6bp的umi分子标签,并且任意两个umi分子标签的序列之间存在3个或以上位点的碱基不同。相较于传统的随机序列umi技术,可以对pcr或测序过程中造成的umi序列本身的测序错误进行有效的校正,避免假阳性检出,对假阳背景优化显著性提升;2)本申请的特异性分子标签umi组序列一直,相比于随机umi,降低了测序下机后生信分析的难度,操作简便;3)本申请的特异性分子标签umi组的成本低,极大降低了测序的成本;4)本申请的特异性分子标签umi组可以连接接头序列组成建库接头组,用于测序过程,同时可以制备成试剂盒的产品形式,方便使用。附图说明为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明提供的mgs建库流程图;图2为本发明实施例3中假阳性检测数目比对结果;图3为本发明实施例3中假阳性去除效率比对结果。具体实施方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。除非另有说明,本文中所用的专业与科学术语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法或材料也可应用于本发明中。本发明首先提供特异性分子标签umi组,包括umi分子标签,umi分子标签正义链序列如seqidno.1-48所示。本发明提供的48条umi分子标签为48条互不重复的、固定长度6bp的umi分子标签,并且任意两个umi分子标签的序列之间存在3个或以上位点的碱基不同。该特异性分子标签umi组适用于带umi分子标签的ngs检测,相较于传统的随机序列umi技术,可以对于pcr或测序过程中造成的umi序列本身的测序错误(pcr和illumina测序仪的官方错误率为0.1%)进行有效的校正,从而使umi对假阳背景的优化作用上发挥的作用显著性提升,同时,该特异性分子标签umi组的成本低,极大降低了测序的成本。本发明提供的特异性分子标签umi组适用于illumina所有型号的测序仪。需要说明的是,本发明umi分子标签可以由正义链和反义链构成,合成时可以单链分别制备或双链共同制备,正义链和反义链完全互补。根据本领域常规的技术手段,将本发明提供的特异性分子标签umi组标记目标序列的实现方式均属于本发明的保护范围。本发明还保护含有umi分子标签的建库接头组,该建库接头组包括本发明提供的特异性分子标签umi组。优选地,建库接头由接头序列和umi分子标签连接而成,本发明提供了48种umi分子标签,可以得到48种建库接头。需要说明的是,接头序列可以为本领域常用的接头序列,在此不做特定的限定。需要说明的是,接头序列的正义链和反义链可以为部分互补,其中,具体地,接头序列可以为illumina官网公布的接头序列,进一步的,接头序列的正义链可以为:5'-acactctttccctacacgacgctcttccgatct-3’(seqidno.49);接头序列的反义链可以为:5'-agatcggaagagcacacgtctgaactccagtcac-3’(seqidno.50)。优选地,每一条建库接头由正义链和反义链构成,其中,建库接头的正义链包括接头序列的正义链和umi分子标签的正义链,建库接头的反义链包括接头序列的反义链和umi分子标签的反义链。在优选地实施方式中,umi分子标签的正义链连接在接头序列的正义链的3’端,umi分子标签的反义链连接在接头序列的反义链的5’端。接头序列的正义链和反义链为部分互补时,umi分子标签连接于接头序列的互补端。在优选地实施方式中,建库接头还含有二硫键连接的t碱基,所述t碱基用于与目标序列互补连接。例如,目标序列经末端修复和“a”连接修饰后,建库接头通过二硫键连接的碱基为“t”碱基,两者通过a-t互补连接。例如,以本发明提供的umi1为例(具体可参见图1中),建库接头的正义链和反义链如下:正义链:5'-acactctttccctacacgacgctcttccgatctaaccta*t-3’(seqidno.51)。上述序列中,下划线代表umi1分子标签序列,*表示二硫键,t与目标序列5’端相连,与目标序列反义链3’端上的a互补。反义链:5'-taggttagatcggaagagcacacgtctgaactccagtcac-3’(seqidno.52)。本发明还保护上述特异性分子标签umi组或建库接头组在基因测序或制备测序用试剂盒中的应用。其中,基因测序优选为文库构建的过程。本发明还保护一种测序用试剂盒,试剂盒包括特异性分子标签umi组或建库接头组。本发明最后提供一种测序方法,利用本发明提供的建库接头组进行文库构建。在优选地实施方式中,将建库接头组连接目标序列,再pcr引入index完成文库构建,依次通过靶向捕获、富集得到杂交捕获文库,进行测序。以mgs建库为例,具体流程如图1所示,目标序列经末端修复加a后,连接带umi分子标签的截短型y接头(即本发明中的建库接头组),再用pcr引入index,文库构建完成,再通过靶向捕获得到目标基因,捕获后经pcr富集,得到杂交捕获文库,进行测序。下面通过具体的实施例进一步说明本发明,但是,应当理解为,这些实施例仅仅是用于更详细地说明之用,而不应理解为用于以任何形式限制本发明。实施例1umi接头设计和生产设计48条长度为6bp的umi序列,保证任意两条umi的碱基差异个数≥3bp,umi分子标签的正义链具体序列如seqidno.1-48所示。在illumina官网公布的接头序列的正义链3’端“加入”设计的umi序列,反义链的5’端加入该umi的反向互补序列,得到建库接头。以本发明提供的umi1为例,建库接头的正义链和反义链如下:正义链:5'-acactctttccctacacgacgctcttccgatctaaccta*t-3’(seqidno.51)。上述序列中,下划线代表umi1分子标签序列,*表示二硫键,t与目标序列5’端a相连。反义链:5'-taggttagatcggaagagcacacgtctgaactccagtcac-3’(seqidno.52)。下划线代表umi序列,*表示二硫键,t与目标序列3’端a相连。将上述建库接头序列中的umi1分子标签替换为本发明提供的其余umi分子标签序列,即可得到其余的建库接头。交由invitrogen进行oligo合成;使用碧云天“annealingbufferfordnaoligos”buffer进行溶解;溶解后的每一条建库接头的正义链和反义链oligo等体积混合,使用以下程序进行退火连接:95℃10min,关闭pcr仪30min,冰上10min;退火产物根据合适的比例进行混合,稀释至合适浓度,得到建库接头组,即可应用于ngs流程中。实施例2建库接头组应用于ngs建库2.1样本准备取一个新的pcr管,根据游离dna提取结果,计算游离dna投入体积,加入nuclease-freewater补足体积至50μl。2.2末端修复和“a”连接在冰盒上或冰上,按照表1配制末端修复和“a”连接反应混合液,涡旋混匀,瞬时离心,置于冰上。表1.末端修复和“a”连接反应混合液成分组分体积/反应cfdna50μlendrepair&a-tailingbuffer7μlendrepair&a-tailingenzymemix3μl总体积60μl分别取10μl末端修复和“a”连接反应混合液分装至2.1中含有50μl样本的pcr管中,涡旋混匀,瞬时离心。按照表2设置pcr仪运行程序,提前运行pcr程序至4℃,放入样本后,盖上pcr仪盖子,点击“skipstep”跳过第1步,继续运行程序。表2.末端修复和“a”连接反应条件2.3接头连接在冰盒上或冰上,按照表3配制接头连接反应混合液,涡旋混匀,瞬时离心,置于冰上。表3.接头连接反应混合液成分组分体积/反应末端修复和“a”连接反应产物60μl建库接头组(单加)5μlligationbuffer30μldnaligase10μlnuclease-freewater5μl总体积110μl向末端修复和“a”连接反应产物中加入5μl建库接头组,然后加入45μl接头连接反应混合液,涡旋混匀,瞬时离心。按照表4设置pcr仪运行程序,提前运行pcr程序至4℃,放入样本后,盖上pcr仪盖子,点击“skipstep”跳过第1步,继续运行程序。表4.接头连接反应条件步骤孵育温度孵育时间14℃∞220℃15min34℃∞2.4接头连接产物纯化2.4.1取一个新的1.5ml低吸附离心管,分装88μl已室温平衡的ampurexpbeads至离心管中。待ligation完成后,取出pcr管,瞬时离心,转移至上述88μlampurexpbeads,涡旋混匀,室温孵育5min。2.4.2瞬时离心,离心管置于磁力架上吸附5min,待液体澄清,弃去上清。注意:不要丢掉含有目的dna的磁珠。2.4.3保持离心管位于磁力架上,加入200μl新鲜配制的80%乙醇,孵育30s,缓慢弃去上清。注意:80%乙醇现用现配。2.4.4使用80%乙醇重复一次清洗磁珠的步骤。2.4.5瞬时离心,离心管置于磁力架上,用10μl移液器弃净上清液,室温干燥3-5min。注意:肉眼观察磁珠是否干燥,若磁珠干燥,立即进入下一步,勿使磁珠过干。2.4.6向离心管中加入22μlnuclease-freewater,涡旋混匀,室温孵育5min。2.4.7瞬时离心,置于磁力架上至液体澄清,吸取20μl上清至新的1.5mlpcr管中,置于冰上。2.5文库富集在冰盒上或冰上,按照表5配制文库富集反应混合液,涡旋混匀,瞬时离心,置于冰上。表5.文库富集反应混合液成分体积/反应纯化后的接头连接产物20μlkapahifihotstartreadymix,2×25μlidtudiprimermix5μl总体积50μl分装30μl文库富集反应混合液至含有样本的pcr管中,涡旋混匀,瞬时离心,随后pcr进行文库富集。2.6文库富集产物纯化2.6.1取一个新的1.5ml低吸附离心管,分装已室温平衡的ampurexpbeads至离心管中。2.6.2amplification结束后,取出pcr管,瞬时离心,转移至上述已室温平衡的ampurexpbead中,涡旋混匀。2.6.3瞬时离心,离心管置于磁力架上吸附5min,待液体澄清,弃去上清。2.6.4保持离心管位于磁力架上,加入200μl新鲜配制的80%乙醇,孵育30s,缓慢弃去上清。2.6.5使用80%乙醇重复一次清洗磁珠的步骤。2.6.6瞬时离心,离心管置于磁力架上,用10μl移液器弃净上清液,室温干燥3-5min。2.6.7向离心管中加入30μlnuclease-freewater,涡旋混匀,室温孵育5min。2.6.8瞬时离心,置于磁力架上至液体澄清,吸取28μl上清至新的1.5ml离心管中,即得到文库,该文库样本可置于-20℃保存或用于杂交捕获。2.7文库定量取1μl文库样本用于qubit定量。2.8文库杂交2.8.1按照qubit定量结果,各取1μg预文库进行混合,加入新的1.5ml低吸附离心管中。2.8.2上述离心管中分别加入5μlcothumandna(1mg/ml)和5μlhypercapuniversalblockingoligos,涡旋混匀,瞬时离心。2.8.3将1.5ml离心管置于真空浓缩仪中,60℃烘干。2.8.4待样本干燥后,取出离心管,加入7.5μl2×hybridizationbuffer和3μlhybridizationcomponenta,涡旋混匀,瞬时离心。2.8.5将上述液体转入含有4.5μl探针的pcr管中,涡旋混匀,短暂离心后进行杂交。2.9洗涤捕获磁珠2.9.1取适量capturebeads至新的1.5ml低吸附离心管中,置于磁力架,待液体澄清,弃上清。2.9.2每份磁珠加入100μl的1×beadwashbuffer,多份磁珠加入多份1×beadwashbuffer(如1份磁珠加100μl,4份磁珠加400μl),涡旋10s,充分混匀,瞬时离心,置于磁力架上,待液体澄清,弃去上清。2.9.3每份磁珠加入100μl的1×beadwashbuffer,多份磁珠加入多份1×beadwashbuffer(如1份磁珠加100μl,4份磁珠加400μl),涡旋混匀,瞬时离心,置于磁力架上,待液体澄清,弃去上清。每个反应capturebeads需加入50μl的1×beadwashbuffer重悬,分装50μl磁珠到新的pcr管中。2.9.4置于磁力架上,待液体澄清,弃去上清。2.9.5瞬时离心,放入磁力架,用10μl移液器吸头弃去上清。2.10探针和捕获磁珠结合将杂交文库转移至上述准备的capturebeads中,涡旋混匀,置于pcr仪上,47℃孵育15min。2.11洗涤捕获磁珠和文库加入100μl1×washbufferi、180μl1×stringentwashbuffer等到带磁珠的杂交捕获体系中进行洗涤。2.12捕获文库富集分别取30μl捕获文库扩增反应混合液分装至含有杂交样本的pcr管中,涡旋混匀,按照表6设置pcr运行程序。表6.捕获文库扩增反应条件2.13捕获文库富集后纯化瞬时离心纯化捕获文库。2.14文库qc取1μl终文库样本用于qubit定量,取1μl终文库样本用于4200分析。2.15上机测序按照《sd-sop-b.ngs002nextseq550ar测序仪使用、维护保养操作规程》进行上机操作。实施例3性能验证以idt商品化随机umi作为对照,使用国际上被广泛认可的horizon阳性标准品hd786(稀释7倍)和coriell阴性标准品na12878对本发明的性能进行验证,比较其假阳性检出率和突变检出结果一致性。详细结果如下:3.1阴性标准品的假阳去除结果鉴于阴性标准品不存在体细胞突变,以af突变频率<1%作为本试验假阳性评判标准,本实验针对阴性标准品na12878进行检测分析,分别采用自制umi接头组和随机umi接头组(各设置2组平行重复,分别命名为na2878-1、na12878-2)(本实验采用idt公司的随机umi接头组)。假阳性检测数目比对结果如图2所示,假阳性去除效率比对结果如图3所示,结果表明自制umi接头组假阳检出数目显著低于idtumi接头组,假阳性去除效率高于idtumi接头组。因此,自制umi接头组性能优于idtumi接头组。3.2阳性标准品的检出率结果将horizen阳性标准品hd786稀释7倍(为满足检出限需求,对原始样本稀释,稀释后大部分位点突变丰度在0.5%-1%之间),设定5个平行,使用上述实验方法建库并测序,结果显示9个snv/indel位点和2个fusion共11个已知突变中,在相同条件下,自制umi接头和idt商品化接头均检出,无一漏检,检出一致率达100%。证明自制umi的可信度和准确度。表7.阳性标准品h786突变检出结果如下:备注:表中百分比表示该突变位点的检出丰度,如位点未检出则报0,有数值则表明检出。将coriell阴性标准品na12878使用上述实验方法建库并测序,结果显示在自制umi接头和idt商品化接头中均无somatic突变检出,结果均显示为阴性,一致率达100%。具体结果如下表8所示:samplena12878-idtna12878-1na12878-2na12878-3na12878-4na12878-5检测结果阴性阴性阴性阴性阴性阴性备注:阴性:无体细胞(somatic)突变检出实施例4临床试验为证明本申请自制umi的广泛适用性,该部分以胸水、血液和脑脊液等多种不同类型的10例临床样本为检测基础,突变类型包括cnv、snv和indel,使用实施例2的实验方法建库并测序。结果表明:6例为临床阳性样本,共含有15个snv/indel位点和6个cnv突变,在自制umi接头和idt商品化接头均检出,无一漏检,检出率100%。4例阴性临床样本在自制umi接头中均无体细胞突变检出,结果均显示为阴性,无假阳性检出,假阳性率100%,而idt商品化组则检出1例假阳性。具体结果如下表9所示:备注:cnv:拷贝数变异、snv:点突变、indel:插入或缺失突变;copies:cnv的单位;阴性:无somatic突变检出尽管已用具体实施例来说明和描述了本发明,然而应意识到,在不背离本发明的精神和范围的情况下可以作出许多其它的更改和修改。因此,这意味着在所附权利要求中包括属于本发明范围内的所有这些变化和修改。sequencelisting<110>江苏先声医学诊断有限公司南京先声医学检验有限公司江苏先声医疗器械有限公司<120>特异性分子标签umi组及其应用<160>52<170>patentinversion3.5<210>1<211>6<212>dna<213>人工序列<400>1aaccta6<210>2<211>6<212>dna<213>人工序列<400>2aactgc6<210>3<211>6<212>dna<213>人工序列<400>3aagact6<210>4<211>6<212>dna<213>人工序列<400>4aagcag6<210>5<211>6<212>dna<213>人工序列<400>5aatggt6<210>6<211>6<212>dna<213>人工序列<400>6acatac6<210>7<211>6<212>dna<213>人工序列<400>7accgga6<210>8<211>6<212>dna<213>人工序列<400>8agatcg6<210>9<211>6<212>dna<213>人工序列<400>9agcgtg6<210>10<211>6<212>dna<213>人工序列<400>10agtaca6<210>11<211>6<212>dna<213>人工序列<400>11atcacg6<210>12<211>6<212>dna<213>人工序列<400>12attcga6<210>13<211>6<212>dna<213>人工序列<400>13caccac6<210>14<211>6<212>dna<213>人工序列<400>14cagttc6<210>15<211>6<212>dna<213>人工序列<400>15catgcc6<210>16<211>6<212>dna<213>人工序列<400>16ccaaca6<210>17<211>6<212>dna<213>人工序列<400>17ccattg6<210>18<211>6<212>dna<213>人工序列<400>18ccgaag6<210>19<211>6<212>dna<213>人工序列<400>19cctctt6<210>20<211>6<212>dna<213>人工序列<400>20cgagta6<210>21<211>6<212>dna<213>人工序列<400>21cgctga6<210>22<211>6<212>dna<213>人工序列<400>22cgctga6<210>23<211>6<212>dna<213>人工序列<400>23ctgtct6<210>24<211>6<212>dna<213>人工序列<400>24ctgtct6<210>25<211>6<212>dna<213>人工序列<400>25gaactt6<210>26<211>6<212>dna<213>人工序列<400>26gacacc6<210>27<211>6<212>dna<213>人工序列<400>27gagaga6<210>28<211>6<212>dna<213>人工序列<400>28gatgtg6<210>29<211>6<212>dna<213>人工序列<400>29gatgtg6<210>30<211>6<212>dna<213>人工序列<400>30gcagct6<210>31<211>6<212>dna<213>人工序列<400>31gcctgt6<210>32<211>6<212>dna<213>人工序列<400>32gctcca6<210>33<211>6<212>dna<213>人工序列<400>33gtaatc6<210>34<211>6<212>dna<213>人工序列<400>34gtcgac6<210>35<211>6<212>dna<213>人工序列<400>35gttagt6<210>36<211>6<212>dna<213>人工序列<400>36taagga6<210>37<211>6<212>dna<213>人工序列<400>37tactag6<210>38<211>6<212>dna<213>人工序列<400>38tagcca6<210>39<211>6<212>dna<213>人工序列<400>39tatcgc6<210>40<211>6<212>dna<213>人工序列<400>40tcaagt6<210>41<211>6<212>dna<213>人工序列<400>41tcgctc6<210>42<211>6<212>dna<213>人工序列<400>42tctaac6<210>43<211>6<212>dna<213>人工序列<400>43tcttga6<210>44<211>6<212>dna<213>人工序列<400>44tgcata6<210>45<211>6<212>dna<213>人工序列<400>45tgtccg6<210>46<211>6<212>dna<213>人工序列<400>46tgtgtt6<210>47<211>6<212>dna<213>人工序列<400>47ttacct6<210>48<211>6<212>dna<213>人工序列<400>48ttcggt6<210>49<211>33<212>dna<213>人工序列<400>49acactctttccctacacgacgctcttccgatct33<210>50<211>34<212>dna<213>人工序列<400>50agatcggaagagcacacgtctgaactccagtcac34<210>51<211>40<212>dna<213>人工序列<400>51acactctttccctacacgacgctcttccgatctaacctat40<210>52<211>40<212>dna<213>人工序列<400>52taggttagatcggaagagcacacgtctgaactccagtcac40当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1