一种检测测序平台索引序列污染的方法及引物与流程

文档序号:11246382阅读:662来源:国知局
一种检测测序平台索引序列污染的方法及引物与流程
本申请涉及核酸测序领域,特别是涉及一种检测测序平台索引序列污染的方法及引物。
背景技术
:在核酸测序过程中,特别是对于一些测序量比较大的基因组,通常需要构建多个子文库,每个子文库包含一个或多个索引序列(英文为index),根据不同的索引序列对测序结果进行数据拆分,以得到完整的基因组序列。但是,在数据拆分时,偶尔会出现index污染,也就是说,出现了额外的,并非设计在各子文库中的索引序列,这就意味着测序平台存在索引序列污染。索引序列的污染直接影响数据拆分结果,影响测序结果的准确性。因此,需要尽量找出被污染的子文库,重新构建子文库以进行测序。现有的index污染检测方法,通常包括两种,第一,通过操作人员回顾操作记录单,直接监控、分析建库过程中的某个子文库是否引入了其它index文库,造成index污染;第二,将出现index污染的lane(测序通道)所上机的各个子文库,分别采用不同的lane(测序通道)再次上机测序,根据测序结果判断是哪个子文库出现了index污染。第一种方法,容易因为人为记忆偏差或者操作失误无记录,导致无法清楚或准确的找到index污染源。第二种方法,虽然可以准确的判断是哪个子文库出现了index污染;但是,一方面再次测序需要耗费昂贵的测序试剂,检测成本高;另一方面,再次测序存在至少1-2天的时间延缓,而且再次测序的过程不仅容易造成后续进一步的index污染扩大。技术实现要素:本申请的目的是提供一种新的检测测序平台索引序列污染的方法和引物。本申请采用了以下技术方案:本申请的一方面公开了一种检测测序平台索引序列污染的方法,包括采用污染索引序列的特异性引物,对存在污染的测序通道的所有子文库分别进行pcr扩增,根据pcr扩增结果中是否有特异性扩增,判断相应的子文库是否存在索引序列污染,从而检测出测序平台索引序列的污染源。需要说明的是,本申请的检测方法,直接采用污染索引序列的特异性引物,对各子文库进行pcr扩增检测;可以理解,如果子文库存在索引序列污染,则特异性引物就可以扩增出相应的片段;因此,检查各子文库的pcr扩增结果是否有特异性扩增,就可以判断该子文库是否存在索引序列污染,从而检测出测序平台索引序列的污染源。本申请的检测方法只需要对各子文库进行pcr扩增即可实现检测,一方面,pcr扩增成本低,另一方面,pcr扩增可以很快的知道测序平台索引序列污染的结果,找到污染源。还需要说明的是,pcr检测索引序列污染,相对于重新进行一次测序检测索引序列污染而言,pcr扩增检测1-3小时内就可以获知结果,不存在测序检测至少1-2天的时间延缓。可以理解,这是在已经合成了污染索引序列的特异性引物的前提下的;如果污染索引序列是首次出现,则需要先设计并合成索引序列的特异性引物,这个过程也需要时间,存在时间延缓;但是,一旦合成了污染索引序列的特异性引物,以后再次出现相同的索引序列污染,则可以采用本申请的方法,快速的获得检测结果。优选的,污染索引序列的特异性引物包括上游引物和下游引物,上游引物和下游引物中的其中一条引物为测序平台通用引物或者测序平台通用引物的其中部分,另一条引物的3’末端具有污染索引序列的序列或其反向互补序列。需要说明的是,本申请的特异性引物,实际上就是针对污染索引序列而设计的特异性引物,该特异性引物,仅对污染索引序列有扩增,而对其它索引序列或者非索引序列没有扩增;因此,只要子文库中存在污染索引序列,就可以被本申请的方法检测到。可以理解,索引序列或者污染索引序列是在连接在子文库的待测样品dna片段两端的,因此,特异性引物只要其上游引物和下游引物中的中一条引物的3’末端为污染索引序列的序列或其反向互补序列,就可以保障特异性引物,只对存在索引序列污染的子文库进行特异性pcr扩增。优选的,上游引物为seqidno.1所示序列,下游引物为seqidno.2所示序列;seqidno.1:5’-aatgatacggcgaccaccgagatc-3’seqidno.2:5’-gacggcatacgagatttnx-3’下游引物的3’末端的nx为污染索引序列的序列,x为污染索引序列的长度,通常x为6-10。需要说明的是,上游引物为seqidno.1所示序列,下游引物为seqidno.2所示序列,只是本申请的一种具体检测方法中所特别设计的特异性引物,通过seqidno.1所示序列和seqidno.2所示序列的引物,能够对本申请具体实现方式中的测序平台进行索引序列污染检测。可以理解,对于不同的测序平台,或者不同的实验室采用的测序通用引物不同,本申请的污染索引序列的特异性引物的具体序列也可以相应的改变,不只限于seqidno.1所示序列和seqidno.2所示序列的引物。此外,本申请的一种具体检测方法中索引序列和污染索引序列的长度都是6bp,即x=6。优选的,pcr扩增为实时荧光pcr。需要说明的是,实时荧光pcr扩增具有快速、灵敏度高、特异性强等优点,因此,本申请优选采用实时荧光pcr对索引序列污染进行检测,尤其优选采用荧光染料实时荧光pcr。还需要说明的是,采用污染索引序列的特异性引物,对子文库进行pcr扩增时,插入片段也是会被扩增的,而插入片段大小不一,是一个跨度范围,因此,如果采用常规pcr和凝胶电泳检测,可以看到多条带或一条弥散带,这属于正常现象。采用荧光染料实时荧光pcr检测时,只要有扩增就会产生荧光信号,而插入片段的扩增或者插入片段的大小不一,并不会影响本申请的索引序列污染检测。本申请的另一面公开了一种检测测序平台索引序列污染的引物,该引物为污染索引序列的特异性引物,用于对受污染的测序通道的子文库进行pcr扩增,以检测污染索引序列的来源;该引物包括上游引物和下游引物,上游引物和下游引物中的其中一条引物为测序平台通用引物或者测序平台通用引物的其中部分,另一条引物的3’末端为污染索引序列的序列或其反向互补序列。优选的,本申请的检测测序平台索引序列污染的引物,其上游引物为seqidno.1所示序列,下游引物为seqidno.2所示序列。本申请的再一面公开了一种检测测序平台索引序列污染的试剂盒,该试剂盒中包含了本申请的检测测序平台索引序列污染的引物。需要说明的是,本申请的引物,可以用于测序平台索引序列污染检测,因此,为了使用方便,完全可以将引物干粉或高浓度溶液作为试剂盒的一部分,用于测序平台索引序列污染检测;当然,结合不同的检测方法,例如实时荧光pcr,试剂盒中还可以包含相关的反应试剂,在此不做具体限定。优选的,本申请的试剂盒采用本申请的检测测序平台索引序列污染的方法,对测序平台的索引序列污染进行检测。本申请的再一面还公开了一种检测测序平台索引序列污染的系统或装置,该系统或装置采用本申请的方法,对测序平台的索引序列污染进行检测。需要说明的是,本申请的测序平台索引序列污染的检测方法,其中分析判断部分,完全可以整合到相应的检测系统或装置中,例如将本申请的方法整合到实时荧光pcr系统中,可以根据污染索引序列特异性引物的实时荧光pcr扩增结果,直接输出测序平台索引序列污染结果,作为专门检测测序平台索引序列污染的系统。当然,除实时荧光pcr系统以外,还可以将本申请的方法整合到其它系统或装置中,对测序平台的索引序列污染进行检测,在此不做具体限定。本申请的有益效果在于:本申请的测序平台索引序列污染检测方法,为测序平台索引序列污染的检测提供了一种全新的方案和思路,能够快速对索引序列污染来源进行特异性检测,且成本低、准确度高、操作简单方便,易于推广和使用。附图说明图1是本申请实施例中87号索引序列特异性引物,对whtrdrpep00000082的五个子文库的实时荧光pcr检测结果;图2是本申请实施例中87号索引序列特异性引物,对whhumsoitaaeraapei-205文库,和其它205文库的实时荧光pcr检测结果。具体实施方式本申请检测测序平台索引序列污染的方法,是在对测序数据进行拆分时,发现存在索引序列污染的情况下使用的。本申请的检测方法,能够在出现索引序列污染的时候,准确的找到索引序列污染源,即准确的找到具体是哪个子文库存在索引序列污染,这对后续研究具有重要意义。下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。实施例本例以测序文库whtrdrpep00000082为例进行试验,测序平台采用illuminahiseq平台。whtrdrpep00000082在试验设计中,理论上应该仅包含201、202、203、204和205号共5个index的文库;但是,在一次测序数据拆分时发现,测序结果中不仅有201、202、203、204和205这5个index,还含有2.17%比例的87号index,数据拆分结果如表1所示,这意味着五个子文库中有某个子文库存在87号索引序列污染。表1whtrdrpep00000082文库的index拆分结果样品索引序列0mismatch1mismatchtotalreadsbasesindex87atgagg2.11%0.06%2.17%4458446802520280201atcacg17.04%0.35%17.40%35795615644321070011202cgatgt20.42%0.62%21.04%43293453779282154011203ttaggc20.99%0.68%21.67%44580695802452510011204tgacca22.08%0.60%22.69%46678174840207132011205acagtg13.13%0.78%13.91%28618041515124738011总计95.77%3.10%98.87%20342442436616396320因此,本例根据87号索引序列,设计了其特异性引物,特异性引物的上游引物为illuminahiseq测序平台通用引物的部分序列,下游引物的5’端部分也是通用引物序列,3’末端具有污染索引序列即87号索引序列的序列。具体的,本例的上游引物为seqidno.1所示序列,下游引物为seqidno.2所示序列;seqidno.1:5’-aatgatacggcgaccaccgagatc-3’seqidno.2:5’-gacggcatacgagatttnx-3’下游引物中,3’末端的nx本例具体为“cctcat”,即x=6,“cctcat”就是87号索引序列。以上引物由深圳华大基因合成。采用以上引物分别对201、202、203、204和205这5个文库进行qpcr检测,确认污染源。qpcr反应体系10μl,具体包括:dna样品1μl、10×buffer1μl、mgso40.1μl、tween20100×0.1μl、dmso0.5μl、h2o3.35μl、betaine2μl、dntps0.8μl、probe0.25μl、rox0.2μl、上游引物0.3μl、下游引物0.3μl、taq酶0.1μl。反应条件为:95℃预变性10s,然后进入循环:95℃变性30s、60℃退火30s、72℃延伸45s,循环结束后4℃待机。在延伸时收集荧光信号。设置一个阳性对照和一个阴性对照,阳性对照为87号索引序列构建的文库,阴性对照为去离子水。检测结果如图1所示,图1为87号索引序列特异性引物,对whtrdrpep00000082的五个子文库的实时荧光pcr检测结果,图中,positive曲线为阳性对照的扩增曲线,testsamples-205为whhumsoitaaeraapei-205文库的扩增曲线,testsamples为其它四个文库的曲线,negative为阴性对照的曲线。结果显示,5个子文库进行中,仅whhumsoitaaeraapei-205文库检测结果为阳性,其余四个子文库的检测结果都为阴性;因此,判断whhumsoitaaeraapei-205文库为87号索引序的污染源。为了确认到底是whhumsoitaaeraapei-205文库存在索引序列污染,还是特异性引物对205文库产生了非特异性扩增。本例分别对疑似污染的whhumsoitaaeraapei-205文库,和其它205文库,再次进行了实时荧光pcr检测,反应体系和条件同前面。检测结果如图2所示,图2为87号索引序列特异性引物,对whhumsoitaaeraapei-205文库,和其它205文库的实时荧光pcr检测结果,图中,positive-205为whhumsoitaaeraapei-205文库的扩增曲线,test-205为其它205文库的曲线。结果显示,whhumsoitaaeraapei-205文库可以采用设计的87号索引序列特异性引物扩增出来,而其他205号index文库则无法扩增,证实污染来自whhumsoitaaeraapei-205文库,而不是非特异性扩增。此外,本例还按照现有的索引序列污染检测方法,将201、202、203、204和205号共5个子文库,分别采用不同的lane再次上机测序,检测具体是哪个子文库存在87号索引序列污染。结果显示,的确是205文库存在87号索引序污染,而其它四个子文库没有索引序列污染,这与本例的检测结果吻合,可见,本例的检测测序平台索引序列污染的方法和引物,能够快速、准确、低成本的对索引序列污染进行检测。以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属
技术领域
的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1