基于二代测序技术检测血液微卫星不稳定的方法与流程

文档序号:17335464发布日期:2019-04-05 22:26阅读:399来源:国知局
基于二代测序技术检测血液微卫星不稳定的方法与流程
本发明通常涉及基因检测领域,具体地涉及基于二代测序技术检测血液微卫星不稳定(msi)的方法。
背景技术
:在原核和真核基因组中,广泛分布着许多短而串联重复dna序列(1-6碱基),即微卫星序列(microsatellite,ms)。而在dna复制过程中,这些序列常发生小范围的碱基缺失,插入或者替换,呈现不稳定性,即为微卫星不稳定性(microsatelliteinstability,msi)。msi现象于1993年被jacobs等人在结直肠癌中首次发现。因其与癌症发生有关,可用于癌症检测(williamr.jacobs,etal,science,1993,260:816-818)。2016年ronaldjhause等人利用基因组全外显子测序技术,分析了18中癌症5930个基因组,发现其中14种癌症患者癌细胞中发生msi,其中子宫内膜癌msi频率最高为30%,胃癌与结肠癌为19%(classificationandcharacterizationofmicrosatelliteinstabilityacross18cancertypes)。根据造成结直肠癌msi分子机制的不同可分为两类:(i)偶发性msi结直肠癌(sporadiccrc),常由mlh1启动子区域高dna甲基化造成mmr功能缺陷引起msi;(ii)遗传非息肉病性结直肠癌(hnpcc),又称lynch综合症,由于生殖细胞中携带有mmr基因突变,因而mmr功能易缺陷导致msi结直肠癌出现。根据结直肠癌中msi被检测出的频率可以将其分为三类,微卫星稳定(mss),微卫星低不稳定(msi-l)及微卫星高不稳定(msi-h)(frequentinactivationofptenbypromoterhypermethylationinmicrosatelliteinstability-highsporadiccolorectalcancers)。nccn结直肠癌指南中提到msi检测应在所有结直肠癌史的病人中进行,可以作为结直肠癌预后的良好的标志物;并且msi-h的结直肠癌ii期病人有较好的预后(https://www.nccn.org/professionals/physician_gls/pdf/colon.pdf)。fda在2017年7月批准了免疫化疗药物nivolumab用于转移性结直肠癌的患者(https://www.cancer.gov/news-events/cancer-currents-blog/2017/nivolumab-fda-colorectal),而2018年7月又批准了ipilimumab与nivolumab联合用于治疗12岁以上的msi-h/错配修复缺失(dmmr)的转移性及直肠癌患者(https://www.fda.gov/drugs/informationondrugs/approveddrugs/ucm613227.htm)。可见msi检测对于癌症患者的重要性。而目前基于ngs检测msi的方法现在有很多,主要方法可以归为通过比较组织及对照的微卫星序列(ms)的长度大小分布差异或多态性差异两种。虽然效果很明显,但都是基于组织来进行检测,对于血液样本并没有非常好的结果;而对于msi-pcr技术等临床金标准检测来说,同样只适用于针对组织样本来进行msi检测,对于血液样本检测msi就完全区分不开。技术实现要素:为了解决至少部分上述技术问题,本发明提供一种基于二代测序技术检测血液微卫星不稳定的方法,其可以不依赖于肿瘤组织,只抽取患者血液即可完成检测。具体地,本发明包括以下内容。一种基于二代测序技术检测血液微卫星不稳定的方法,其包括以下步骤:(1)具有差异的测序序列长度分布的确定步骤:在利用相同的引物和/或探针获得的同一样本的血浆dna的二代测序数据和血液白细胞dna的二代测序数据中,分别确定同一待测微卫星位点对应的各序列的长度以及不同长度分配的序列个数,通过比较确定两组二代测序数据中具有差异的测序序列长度及其个数;(2)判定范围窗口的确定步骤:在已知基因组中确定所述引物和/或探针对应的序列长度l,同时在所述已知基因组中确定所述引物和/或探针对应的待测微卫星位点的长度l’,将长度为x的待分析序列的判定范围窗口定义为l-l’<x<l+l’;(3)稳定性判定步骤:在所述判定范围窗口内,如果具有差异的测序序列长度的序列个数大于2且具有差异的测序序列长度的个数占所述判定范围窗口内总的序列长度个数的50%以上,则将待测微卫星位点判定为不稳定,反之判定为稳定。在某些实施方案中,基于二代测序技术检测血液微卫星不稳定的方法进一步包括重复步骤(1)-(3),从而判定多个待测微卫星位点的稳定性,统计稳定的待测微卫星位点的个数和不稳定的待测微卫星位点的个数,如果不稳定的待测微卫星位点的个数为总的待测微卫星位点个数的30%以上,则认为所述样本为微卫星高频不稳定,即msi-h;反之则认为所述样本为微卫星稳定,即mss。在某些实施方案中,步骤(1)包括:(1-1)确定数据来源及整理引物或探针序列;(1-2)在血浆dna的二代测序数据中,利用针对微卫星位点的引物或探针序列提取出目的片段测序序列组成集合a;(1-3)在血液白细胞dna的二代测序数据中,利用微卫星位点的引物或探针序列提取出目的片段测序序列组成集合b;(1-4)统计集合a中提取的测序序列长度和每个长度分配的测序序列数,作为集合a’,同时统计集合b中提取的测序序列长度及每个长度分配的测序序列数,作为集合b’;(1-5)比较集合a’和集合b’的结果,除去针对同一待测微卫星位点具有相同测序序列长度的数据,得到集合a’与b’中待测微卫星位点所特有的测序序列长度作为具有差异的测序序列长度分布。在某些实施方案中,所述数据来源为扩增子测序,且所述多个待测微卫星位点的数量为5以上,例如,7以上、10以上等。在某些实施方案中,所述数据来源为探针捕获测序,且所述多个待测微卫星位点的数量对应于探针种类。在某些实施方案中,在步骤(1-2)和步骤(1-3)中,当引物或探针序列完全匹配(即,100%匹配)时才提取出目的片段测序序列。在某些实施方案中,所述多个待测微卫星位点包括bat25、bat26、mono27、nr21和nr24,或者多个待测微卫星位点由bat25、bat26、mono27、nr21和nr24组成,即只有这五个位点。在某些实施方案中,所述引物用于扩增bat25、bat26、mono27、nr21和nr24组成的组中的引物对,例如序列为seqidno:1-10的引物。在某些实施方案,所述待测微卫星位点不稳定是指在待测微卫星位点包括碱基缺失、插入或替换。在某些实施方案中,步骤(1)中的二代测序数据不包括来源于组织样本的数据。本发明的方法不仅可以通过血液直接检测微卫星不稳定,而且与组织检测的msi-pcr“金标准”方法也有较高的一致性,为临床解决了检测需要穿刺取样、病人需承受取样痛苦的实际问题,同时也提出了一种可以作为动态监测msi变化的技术手段。附图说明图1.本发明一种示例性基于二代测序技术检测血液微卫星不稳定的方法的流程图。具体实施方式现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。关于本文中所使用的“和/或”,包括所述事物的任一或全部组合。本发明的基于二代测序技术检测血液微卫星不稳定的方法至少包括以下3个步骤:步骤(1):具有差异的测序序列长度分布的确定步骤:在利用相同的引物和/或探针获得的同一样本的血浆dna的二代测序数据和血液白细胞dna的二代测序数据中,分别确定同一待测微卫星位点对应的各序列的长度以及不同长度分配的序列个数,通过比较确定两组二代测序数据中具有差异的测序序列长度及其个数。为了避免由于试剂不同而引起检测结果不准确的情况,本发明使用相同的引物和/或探针,其是指在获得血浆dna的二代测序数据时使用的引物和/或探针与在获得血液白细胞dna的二代测序数据时使用的引物和/或探针是相同的。同时,为了避免由于个体差异引起检测结果不准确的问题,本发明采用同一样本的血浆dna和血液白细胞dna样品数据。本发明的测序序列长度分布是指测序序列长度情况以及不同长度的序列的个数等情况。具有差异的测序序列长度是指从血浆dna的二代测序数据中提取出的与血液白细胞dna的二代测序数据中相对应的序列的长度发生改变的序列碱基数。确定具有差异的测序序列长度分布的具体步骤不特别限定。可通过任何方式进行。在某些实施方案中,该步骤包括:(1-1)确定数据来源及整理引物或探针序列;(1-2)在血浆dna的二代测序数据中,利用针对微卫星位点的引物或探针序列提取出目的片段测序序列组成集合a;(1-3)在血液白细胞dna的二代测序数据中,利用微卫星位点的引物或探针序列提取出目的片段测序序列组成集合b;(1-4)统计集合a中提取的测序序列长度和每个长度分配的测序序列数,作为集合a’,同时统计集合b中提取的测序序列长度及每个长度分配的测序序列数,作为集合b’;(1-5)比较集合a’和集合b’的结果,除去针对同一待测微卫星位点具有相同测序序列长度的数据,得到集合a’与b’中待测微卫星位点所特有的测序序列长度作为具有差异的测序序列长度分布。步骤(2):判定范围窗口的确定步骤:在已知基因组中确定引物和/或探针对应的序列长度l,同时在已知基因组中确定该引物和/或探针对应的待测微卫星位点的长度l’,将长度为x的待分析序列的判定范围窗口定义为l-l’<x<l+l’。其中已知基因组是指来源于个体物种的全基因组,可使用目前已知的任何数据库中记载的数据。例如,来源于hg19:http://hgdownload.soe.ucsc.edu/goldenpath/hg19/bigzips/的基因组等。待测微卫星位点的长度l’一般是指该微卫星位点中重复序列的长度。步骤(3):稳定性判定步骤:在判定范围窗口内,如果具有差异的测序序列长度的序列个数大于2且具有差异的测序序列长度的个数占所述判定范围窗口内总的序列长度个数的50%以上,则将待测微卫星位点判定为不稳定,反之判定为稳定。本发明通过包括上述步骤(1)-(3)在内的过程可以判定单个待测微卫星位点的稳定性。优选地,本发明通过重复上述过程可以判定多个测微卫星位点的稳定性。更优选地,进一步统计稳定的待测微卫星位点的个数和不稳定的待测微卫星位点的个数,并基于这些待测微卫星位点的稳定性情况对样本进行分类。即,如果不稳定的待测微卫星位点的个数为总的待测微卫星位点个数的30%以上,则认为样本为微卫星高频不稳定,即msi-h;反之则认为所述样本为微卫星稳定,即mss。实施例1选取10例已知通过3730阅微试剂盒(专利号:zl201110152226.x)组织验证msi结果的相应的血浆及白细胞样本(3例msi-h高频不稳定型,7例mss稳定型)的二代扩增子测序数据,进行以下检测方法。以1例高频不稳定msi-h的实施例sample1举例说明具体检测方法。1.确定数据中所用到的微卫星位点的5个生物标志物,分别为bat25、bat26、mono27、nr21及nr24,并对5个标志物确定相应的扩增引物序列,如下:bat25引物:引物1:tctgcattttaactatggctc(seqidno:1)引物2:ctcgcctccaagaatgtaagt(seqidno:2)bat26引物:引物1:ctgcggtaatcaagtttttag(seqidno:3)引物2:aaccattcaacatttttaaccc(seqidno:4)mono27引物:引物1:gaaatggtgggaacccag(seqidno:5)引物2:ggtggatcaaatttcacttgg(seqidno:6)nr21引物:引物1:gagtcgctggcacagttcta(seqidno:7)引物2:ctggtcactcgcgtttacaa(seqidno:8)nr24引物:引物1:attgtgccattgcattccaa(seqidno:9)引物2:gtgtcttgctgaattttacctcctgac(seqidno:10)2.根据上述5对引物序列,在sample1的血浆dna测序序列中严格提取出bat25、bat26、mono27、nr21及nr24相应的目的片段(含引物序列)测序序列集合a。3.根据上述5对引物序列,在sample1的血液白细胞dna测序序列中严格提取出bat25、bat26、mono27、nr21及nr24相应的目的片段(含引物序列)测序序列集合b。4.以bat25为例,统计集合a中提取的bat25的测序序列长度及每个长度分配的测序序列数,作为集合a’。5.统计集合b中提取的bat25的测序序列长度及每个长度分配的测序序列数,作为集合b’。6.比较步骤4与步骤5的结果,对于bat25均去掉其相应的共有的测序序列长度,得到bat25的集合a’与b’特有的测序序列长度分布。7.计bat25正反引物扩增下来的参考基因组(hg19:http://hgdownload.soe.ucsc.edu/goldenpath/hg19/bigzips/)长度为125bp,参考基因组(hg19:http://hgdownload.soe.ucsc.edu/goldenpath/hg19/bigzips/)上的微卫星位点的长度为25bp,定义判定微卫星位点是否稳定的范围窗口为100<x<150。8.在步骤7所定义的判定窗口内,有4个集合a’特有测序序列长度的序列支持数大于2且集合a’特有测序序列长度的个数占窗口内总测序序列长度个数的100%,认为该微卫星位点不稳定。9.对于bat26、mono27、nr21及nr24均分别重复方法步骤2-8。其中bat26的判定窗口内有0个集合a’特有测序序列长度的序列支持数大于2且集合a’特有测序序列长度的个数占窗口内总测序序列长度个数的0%,认为该微卫星位点稳定;mono27的判定窗口内有1个集合a’特有测序序列长度的序列支持数大于2且集合a’特有测序序列长度的个数占窗口内总测序序列长度个数的33.33%,认为该微卫星位点稳定;nr21的判定窗口内有6个集合a’特有测序序列长度的序列支持数大于2且集合a’特有测序序列长度的个数占窗口内总测序序列长度个数的100%,认为该微卫星位点不稳定;nr24的判定窗口内有2个集合a’特有测序序列长度的序列支持数大于2且集合a’特有测序序列长度的个数占窗口内总测序序列长度个数的55.56%,认为该微卫星位点不稳定。10.统计稳定的微卫星位点的个数及不稳定的微卫星位点的个数,其中不稳定的微卫星位点为bat25、nr21及nr24,3个;稳定的微卫星位点为bat26及mono27,2个。不稳定的微卫星位点的个数占总微卫星位点个数的60%,则认为该样本为微卫星高频不稳定,即msi-h。判定结果与阅微试剂盒msi-pcr组织验证结果一致。实施例2-10实施例2-10分别以选取的另外9例已知通过3730阅微试剂盒(专利号:zl201110152226.x)组织验证msi结果的相应的血浆及白细胞样本(3例msi-h高频不稳定型,7例mss稳定型)的二代扩增子测序数据为对象,重复上述步骤1-10。结果如表1所示。表1样本id验证结果预测结果sample1msi-h+--++sample2mss-----sample3mss---+-sample4mss-----sample5mss-----sample6mss-----sample7mss-----sample8mss-----sample9msi-h--+++sample10msi-h+--+-注:msi-pcr验证结果与预测结果统计,其中“+”代表不稳定,“-”代表稳定。在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。sequencelisting<110>元码基因科技(北京)股份有限公司<120>基于二代测序技术检测血液微卫星不稳定的方法<130>1804721cn<160>10<170>patentinversion3.3<210>1<211>21<212>dna<213>人工序列<400>1tctgcattttaactatggctc21<210>2<211>21<212>dna<213>人工序列<400>2ctcgcctccaagaatgtaagt21<210>3<211>21<212>dna<213>人工序列<400>3ctgcggtaatcaagtttttag21<210>4<211>22<212>dna<213>人工序列<400>4aaccattcaacatttttaaccc22<210>5<211>18<212>dna<213>人工序列<400>5gaaatggtgggaacccag18<210>6<211>21<212>dna<213>人工序列<400>6ggtggatcaaatttcacttgg21<210>7<211>20<212>dna<213>人工序列<400>7gagtcgctggcacagttcta20<210>8<211>20<212>dna<213>人工序列<400>8ctggtcactcgcgtttacaa20<210>9<211>20<212>dna<213>人工序列<400>9attgtgccattgcattccaa20<210>10<211>27<212>dna<213>人工序列<400>10gtgtcttgctgaattttacctcctgac27当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1