用于地中海贫血突变型基因检测的引物组、试剂盒、其应用及文库构建方法与流程

文档序号:15937112发布日期:2018-11-14 02:34阅读:414来源:国知局
本发明涉及地中海贫血检测
技术领域
,具体涉及用于地中海贫血突变型基因检测的引物组、试剂盒、其应用及文库构建方法。
背景技术
地中海贫血(以下简称地贫)是一种常见的溶血性单基因遗传病,多发于中东、中亚、非洲、东南亚和中国南方等地区。导致地贫的分子机理是:珠蛋白基因发生缺陷使其编码的肽链一种或几种合成减少或缺失,致使血红蛋白的组成成分比例失衡,进而导致血红蛋白不稳定。根据缺陷的珠蛋白基因种类不同,地贫主要分为α地贫和β地贫。α地贫是由于α珠蛋白基因的缺失或者突变导致α珠蛋白肽链合成受到抑制而引起的溶血性贫血疾病。α珠蛋白基因簇位于16p13.3,每条染色体各有2个α珠蛋白基因,一对染色体共有4个α珠蛋白基因。α珠蛋白基因的缺失或突变是产生α地贫的最常见原因,α地贫主要包括缺失型和非缺失型。β地贫是由于β珠蛋白基因突变导致β珠蛋白肽链缺陷或合成不足而引起的遗传性溶血性贫血疾病。β珠蛋白基因位于β珠蛋白基因簇,该基因簇定位于染色体11p15,β地贫的分子病理具有高度异质性,主要为β珠蛋白基因点突变、小的缺失或插入。地贫患者长期贫血会导致脏器功能减退、导致心功能衰竭、肝脾肿大等,影响患者的生长发育,目前国内外尚无有效的治疗方法,只能通过定期输血等方法维持生命,给患者自身及家庭和社会带来沉重的负担。控制地贫,预防是关键,通过对地贫高发人群的地贫筛查和婚育指导可有效降低重型地贫的发生率。目前地贫有多种筛查方法,但基因检测是诊断地贫的金标准,基因检测能够大大提高地贫检测的准确性,减少地贫的漏检率,这对地贫的诊治和预防有重要意义。地贫常用基因检测方法包括:pcr-aso(pcr反应结合寡核苷酸探针进行斑点杂交),其优点是成本低,缺点是操作复杂、需要配套相应设备,只能检测15-20种已知突变;pcr-arms(等位基因特异性扩增法),其优点是实验操作简单、成本低,缺点是检测突变种类少;pcr-rdb(pcr反应-反向点杂交),其优点是成本低,缺点是只能检测15-20种已知突变、实验操作复杂;实时荧光定量pcr(real-timepcr),其优点是快速检测多种突变类型,缺点是仅能针对常见热点突变进行检测;pcr反应结合测序方法(pcr-sequencing),其优点是检测多种突变类型、结果准确且可以发现新的突变类型,缺点是检测成本高、需要配套相应设备;gap-pcr(跨越断裂点的pcr扩增法),其优点是实验操作简单、成本低且目前最常用,缺点是只用于缺失型检测。据珠蛋白数据库统计,全球已发现地贫类型超过300种,我国常规检测23-27种的地贫检测技术存在约2%-5%的漏检。上述各种地贫基因检测方法均有不同程度的缺点,例如,gap-pcr方法只能检测缺失型;各种突变型的检测方法中,pcr-arms可检测突变的种类少,pcr-aso、pcr-rdb和实时荧光定量pcr方法虽然检测成本低,能够快速检测多种突变类型,但仅能针对常见热点突变进行检测(例如检测国内15-20种突变类型),无法检测其他罕见突变型及新突变,存在一定的漏检率。而pcr反应结合测序方法不仅可以检测多种突变类型,还可以发现新的突变类型,在检测结果方面不失为最优选择,但也同样存在成本高的缺点。技术实现要素:本发明提供一种用于地中海贫血突变型基因检测的引物组、试剂盒、其应用及文库构建方法,能够同时检测多种突变类型,并能够发现新的突变类型;而且检测成本大幅下降,通量大幅提高。根据第一方面,一种实施例中提供一种用于地中海贫血突变型基因检测的引物组,该引物组包括如下引物序列:hba1-f:caagcataaaccctggcgcgc(seqidno:1);hba1-r:catgcctggcacgtttgctgag(seqidno:2);hba2-f:caagcataaaccctggcgcgc(seqidno:3);hba2-r:ccattgttggcacattccgggata(seqidno:4);hbb1-f:taagccagtgccagaagagcc(seqidno:5);hbb1-r:caatcattcgtctgtttcccattc(seqidno:6);hbb2-f:tttcagggcaataatgatacaatg(seqidno:7);和hbb2-r:gcactgacctcccacattcc(seqidno:8)。根据第二方面,一种实施例中提供一种用于地中海贫血突变型基因检测的标签引物组,该标签引物组中每一条引物均包括核心引物序列和连接在上述核心引物序列5’端的引物标签序列,上述引物标签序列包括一段若干碱基的序列片段,不同的引物标签序列具有互不相同的序列片段,上述核心引物序列包括如下序列:hba1-f:caagcataaaccctggcgcgc(seqidno:1);hba1-r:catgcctggcacgtttgctgag(seqidno:2);hba2-f:caagcataaaccctggcgcgc(seqidno:3);hba2-r:ccattgttggcacattccgggata(seqidno:4);hbb1-f:taagccagtgccagaagagcc(seqidno:5);hbb1-r:caatcattcgtctgtttcccattc(seqidno:6);hbb2-f:tttcagggcaataatgatacaatg(seqidno:7);和hbb2-r:gcactgacctcccacattcc(seqidno:8)。进一步地,上述标签序列是6-10个碱基的随机序列,优选8个碱基的随机序列。根据第三方面,一种实施例中提供一种用于地中海贫血突变型基因检测的试剂盒,该试剂盒包括第一方面的引物组或第二方面的标签引物组;任选的,该试剂盒还包括如下组分中的任意一项或多项:pcr扩增试剂组分;文库构建试剂组分;和文库测序试剂组分。进一步地,上述pcr扩增试剂组分包括pcr反应缓冲液、dntps、dna聚合酶、mg2+中的一种或多种;上述文库构建试剂组分包括末端修复试剂组分、加a尾反应试剂组分、文库接头序列、线性核酸消化酶、核酸片段化酶及其缓冲液中的一种或多种;文库测序试剂组分包括测序引物或探针、测序芯片中的一种或多种。进一步地,上述末端修复试剂组分包括末端修复缓冲液和末端修复酶混合物中的至少一种,优选地,上述末端修复酶混合物包括t4多核苷酸激酶、klenow片段、t4dna聚合酶。进一步地,上述加a尾反应试剂组分包括datp、datp缓冲液和taqdna聚合酶中的至少一种。进一步地,上述线性核酸消化酶包括核酸外切酶i和核酸外切酶iii中的至少一种。进一步地,上述核酸片段化酶包括转座酶,优选tn5转座酶。根据第四方面,一种实施例中提供一种第一方面的引物组或第二方面的标签引物组或第三方面的试剂盒在构建用于检测地中海贫血突变型基因的测序文库中的用途。根据第五方面,一种实施例中提供一种用于检测地中海贫血突变型基因的测序文库的构建方法,该包括:采用第一方面的引物组或第二方面的标签引物组对待检测核酸样本进行pcr扩增的步骤。进一步地,上述方法还包括:对上述pcr扩增的产物连接测序接头的步骤。进一步地,上述对上述pcr扩增的产物连接测序接头具体是,通过转座酶接头包埋复合体在上述pcr扩增的产物两端或一端连接测序接头。利用本发明的引物组或标签引物组,能够同时检测多种突变类型,并能够发现新的突变类型;而且通过与第二代测序技术结合,使得检测成本大幅下降,通量大幅提高,具有明显的成本优势,利于地中海贫血突变型基因检测的普及应用。附图说明图1示出了本发明实施例中引物标签(primerindex)和接头标签(adaptorindex)标记后的pcr产物示意图;图2示出了本发明实施例中测序数据分类流程图,包括文库区分:根据文库标签序列将测序读长分到每个文库中;样本区分:在文库内根据不同的引物标签将测序读长分到每个样本中;位点区分:根据引物序列将样本内的读长分到hba1、hba2、hbb基因;图3示出了本发明实施例1中部分样本电泳检测结果,图中1-13分别表示样品的编号;图4示出了本发明实施例2中部分样本电泳检测结果,图中1-8分别表示样品的编号。具体实施方式下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。对于本领域技术人员而言,详细描述某些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。1.引物设计由于地贫基因突变情况复杂,既有大片段的基因缺失和重复,又有序列相似程度很高的假基因和同源基因;同时要兼顾第二代测序技术读长较短的因素,pcr扩增片段的大小不超过1kb,这给引物设计造成了极大的困难。本发明针对α珠蛋白基因和β珠蛋白基因分别设计pcr引物。具体设计方法如下:对hba1、hba2、hbb基因(分别为两个α珠蛋白基因和一个β珠蛋白基因)序列进行生物信息学分析,将ithanet数据库中三个基因的所有已知突变与小片段缺失重复坐标信息列入分析范围(共计超过1000种突变与小片段缺失重复),并将hba基因序列相似度很高的假基因ψα1、ψα2以及β珠蛋白基因簇中的其他基因列入生物信息学分析范围,找出hba1、hba2、hbb基因的保守和特异序列,然后设计引物。将设计得到的引物序列进行全基因组比对(blast)分析,除精确比对到目标hba1、hba2、hbb基因外,在基因组的其它位置无精确比对的引物作为候选引物,然后再挑选扩增片段小于1kb的引物对作为确定的引物对。最后确定的引物为:hba1和hba2各一对引物,hbb基因由于需测序片段较长,用两对引物分别扩增一部分,保证每对引物扩增片段的长度小于1kb。hba1、hba2、hbb基因对应的引物如下表1所示,即本发明的“引物组”。表1使用本发明的引物扩增可检测hba1、hba2、hbb三个基因范围内的超过1000种已知突变与小片段缺失重复,并可发现新的突变类型。2.引物标签的设计及使用本发明采用引物标签(primerindex)标记的dna分子标签技术,将多样本pcr产物分别以不同的引物标签标记,在文库构建环节将多个样本混合(pooling)成一个文库;同时结合第二代测序技术的文库标签或称接头标签(adaptorindex),使得一次上机测序可检测数千份样本。最终,每个样本的检测结果通过双重标签找回,从而达到检测通量大幅提高的目的,同时实验操作相对较简单。根据表1中设计好的引物序列,结合引物标签设计原理设计并筛选引物标签序列,如下表2示出了一些示例性的引物标签序列。表2编号序列编号序列编号序列t01ctgctactt09gtgatgatt17tgcgtcatt02gactatctt10gacacactt18tagacgatt03tctgatatt11tatgtactt19ctgtgactt04gcatatgtt12catgctgtt20agtgtcatt05tgatatctt13tgcgtactt21ctcagagtt06tgactcatt14atatgactt22gctcatctt07acgactatt15catcacatt23atgtgagtt08cgacacatt16cacacgatt24cgatagat需要说明的是,表2示出的仅仅是一些示例性的引物标签序列,本发明的引物标签序列并不限于此。在一些实施方案中,标签序列可以是6-10个碱基的随机序列,优选8个碱基的随机序列(即nnnnnnnn,其中每个n可以是a、t、g、c中的任意一个)。本发明中,引物标签序列与表1中的引物序列组合(例如将引物标签序列连接在表1中的引物序列的5’端),即可以形成本发明的“标签引物组”,这些标签引物组中的每一标签引物,例如可以是表2中任意一个引物标签序列连接在表1中的任意一个引物序列的5’端所形成的序列(例如将t01号标签与hba1-f引物组合,可命名为t01-hba1-f)。标签序列与引物序列两两组合,每一条标签序列与全部的引物序列组合,即t01-hba1-f、t01-hba1-r、t01-hba2-f、t01-hba2-r、t01-hbb1-f、t01-hbb1-r、t01-hbb2-f、t01-hbab-r称为一套标签引物,每一个样本需进行的4个pcr反应用同一套标签引物完成。使用时,通过pcr在每个样本的pcr产物两端同时引入引物标签序列;把多个带有不同引物标签序列的pcr产物混合在一起,可以用于构建测序文库。当需要构建多个测序文库时,可通过添加带有不同文库标签(或称接头标签),来标记各个测序文库,并得到经引物标签和文库标签双重标记后的测序文库(如图1)。文库构建完毕后,将带有不同文库标签标记的多个测序文库混合在一起同时进行上机测序(不同文库标签标记的测序文库之间的引物标签可以相同)。测序结果出来后,通过对测序结果中文库标签和引物标签序列信息的筛选,可获得每个样本的dna序列信息。3.信息分析方法样本测序完成后,首先根据文库标签和引物标签序列将测序数据分配到每个样本,然后根据本发明的引物序列将已分配到样本的测序数据继续分配到该样本的每个扩增子。将已分配至每个样本的每个扩增子的测序数据用bwa软件比对到参考序列中,然后用samtools找出其中的snp和小插入删除(indel)组成,根据质量值对找出的snp和小插入删除进行过滤,将过滤后的snp和小插入删除比对到地贫突变数据库中,得到地贫突变型分析的最终结果输出。4.检测流程引物标签设计完成后,即可用于未知样本的地贫基因突变检测,其检测过程包括:dna提取、pcr扩增、pcr产物混合与建库、上机测序以及结果分析。(1)样本dna提取采用磁珠法从外周血中自动化提取dna,要求dna浓度大于30ng/μl,体积为100μl,260nm/280nm检测为1.8-2.0。(2)pcr扩增将若干套标签引物对应到96孔pcr反应板中,每批实验平行进行hba1、hba2、hbb1、hbb2基因的检测,即每套标签对应一个样本,每个样本需要进行4个pcr反应,扩增hba1、hba2、hbb1、hbb2这4个基因位点。(3)建库与测序经标签引物pcr扩增得到的产物进行混合,将每一组样本的pcr产物(一批提取dna样品的所有pcr产物,其引物标签组合各不相同)混合到一个ep管中,经纯化后按照第二代测序技术的文库制备流程进行文库构建,确定文库raw-cluster密度,保证平均测序深度达1000乘以上,然后上机测序。(4)结果分析测序完成后,对数据进行分析,数据分析过程主要包括以下部分:1)测序数据的分类根据文库标签、引物标签和引物序列将测序数据分配到对应样本中的每个位点,其中hbb1和hbb2需要将测得的读长混合作为一个位点hbb输出,如图2所示,包括:文库区分:根据文库标签序列将测序读长分到每个文库中;样本区分:在文库内根据不同的引物标签将测序读长分到每个样本中;位点区分:根据引物序列将样本内的读长分到hba1、hba2、hbb基因。2)突变分析将测得的读长分别比对到hba1、hba2、hbb基因的参考序列,找出与参考序列不一致的点即为突变点,作为结果输出。基于本发明的引物组和标签引物组,本发明还提供一种用于地中海贫血突变型基因检测的试剂盒,该试剂盒包括本发明的引物组或本发明的标签引物组。此外,根据不同的测序平台和/或应用场景,可能需要一些其他的组分,例如在需要pcr扩增的建库方法中,需要pcr扩增试剂组分;在片段化的核酸两端加接头的建库方法中,可能需要末端修复试剂组分、加a尾反应试剂组分以及文库接头序列;在通过酶打断法建库的方法中,可能需要核酸片段化酶;在需要环化的建库方法中,可能需要线性核酸消化酶来消化未环化的多余核酸片段。因此,本发明的试剂盒还可以包括如下组分中的任意一项或多项:pcr扩增试剂组分;文库构建试剂组分;和文库测序试剂组分。其中,pcr扩增试剂组分可以包括pcr反应缓冲液、dntps、dna聚合酶、mg2+中的一种或多种;文库构建试剂组分可以包括末端修复试剂组分(例如末端修复缓冲液和末端修复酶混合物中的至少一种,其中末端修复酶混合物例如t4多核苷酸激酶、klenow片段、t4dna聚合酶的混合物)、加a尾反应试剂组分(例如datp、datp缓冲液和taqdna聚合酶中的至少一种)、文库接头序列、线性核酸消化酶(例如核酸外切酶i和核酸外切酶iii中的至少一种)、核酸片段化酶(例如核酸片段化酶包括转座酶,优选tn5转座酶)及其缓冲液中的一种或多种;文库测序试剂组分包括测序引物或探针、测序芯片中的一种或多种。相应地,本发明还提供本发明的引物组或标签引物组或试剂盒在构建用于检测地中海贫血突变型基因的测序文库中的用途。相应地,本发明还提供一种用于检测地中海贫血突变型基因的测序文库的构建方法,包括:采用本发明的引物组或标签引物组对待检测核酸样本进行pcr扩增的步骤。还可以包括:对pcr扩增的产物连接测序接头的步骤。例如,通过转座酶接头包埋复合体在pcr扩增的产物两端或一端连接测序接头。以下通过实施例详细说明本发明的技术方案和效果,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。本发明实施例中采用的样本来自均中山大学附属第五医院,所有病人都填写了书面知情同意书,授权使用他们的样本。实施例1本实施例对经sanger测序后结果已知(包括无突变、常见突变、罕见突变和新发现突变)的23份样本进行检测,检测结果全部与已知结果相符(符合率100%)。结果表明,本发明能够准确检测出地贫基因突变的情况,具有高通量、低成本和准确等优势。具体实施按以下步骤操作:1.样本提取使用kingfisher自动提取仪从23份血样中提取dna。主要步骤如下:取出3个kingfisher自动提取仪配套的深孔板及1个浅孔板,根据说明书分别加入一定量配套的试剂并标记,将所有已加好试剂的孔板按要求置于相应的位置,选定程序“bioeasy_200μlblooddna_kf.msz”程序,按下“star”执行该程序进行核酸提取。程序结束后收集100μl左右的洗脱产物即为提取的dna,作为下一步pcr中的模板2.pcr扩增把样本提取步骤中所得的23份dna依次编号1-23,用23套标签引物(表1、2)分别扩增23份dna样本,其中第24套标签引物为不添加模板的阴性对照。pcr反应在96孔板中进行,每个样本需进行4个pcr反应,因此一共需1个96孔板,在一个96孔板上分区域完成所有的pcr反应,实验的同时,记录下每个样本对应的引物标签编号。pcr反应体系如下表3所示:表3pcr程序如下:95℃10min;95℃30s→60℃1min(30个循环);15℃∞。pcr反应在appliedbiosystemsveritithermalcyclerpcr仪上运行。pcr完成后,取2μlpcr产物经2.0%的琼脂糖凝胶电泳,结果如图3所示,展示部分样本(1-13号)的hba1、hba2、hbb1、hbb2这4个基因位点的pcr反应结果。3.pcr产物混合和纯化从剩余的pcr产物中,每个孔各取10μl混合到一个5mlep管中,振荡混匀,从中取300μl混合产物经qiagendnapurificationkit过柱纯化(具体纯化步骤详见说明书),纯化所得的37.5μl产物,经nanodrop8000(thermofisherscientific公司)测定浓度为94.47ng/μl。4.文库构建文库构建采用illumina公司nexteraxtdnasamplepreparationkit(货号为fc-131-1096)的试剂盒。(1)取出96-wellhardshelltcyplate,命名为nta,在本次建库需用的孔内加入10μltd缓冲液。(2)再加入5μl总计100ng的dna(上述步骤中的pcr产物用td缓冲液稀释至20ng/μl后加入5μl至上述反应孔)。(3)再加入5μlatm至nta反应孔中,盖上封口膜(microseal'b'adhesivefilm)。(4)将nta板280g20℃离心1分钟后,置于pcr仪上运行如下程序:55℃5min,降至10℃(当样品达到10℃时立即进行下一步骤)。(5)小心的移除封口膜,加入5μlnt缓冲液至nta反应孔中,轻轻吹打5次,然后盖上封口膜(microseal'b'adhesivefilm)。(6)将nta板280g20℃离心1分钟后,室温静置5分钟。(7)反应完成后,将产物吸出至一个新的1.5mlep管中,用1.5倍体积的ampurexp磁珠进行纯化,溶15μl的eb。经荧光定量pcr(qpcr)检测到文库浓度结果为12.32nm。5.hiseq4000测序以qpcr所测浓度为准,按要求稀释进行hiseq4000pe-101程序测序,具体操作流程详见操作说明书。6.结果分析下机数据按照上述分析流程进行地贫突变型分析。整个过程由计算机完成。所得结果与已知结果100%相符,如表4所示,列出了所有的23份样本测得的结果与已知结果的对比,n表示结果无异常突变,异常突变的样本均列出了突变点的基因坐标、突变碱基以及该突变对应的地贫型别命名;s24显示无读段(noreads),表示阴性对照没有得到测序数据,与预期值相符。表4实施例2本实施例采用多重pcr的方式,对实施例1中的23份样本进行检测,检测结果全部与已知结果相符(符合率100%)。结果表明,本发明能够准确检测出地贫基因突变的情况,具有高通量、低成本和准确等优势。具体实施按以下步骤操作:1.样本提取与实施例1相同。2.pcr扩增把样本提取步骤中所得的23份dna依次编号1-23,用23套标签引物(表1、2)分别扩增23份dna样本,其中第24套标签引物为不添加模板的阴性对照。pcr反应在96孔板中进行,采用多重pcr的方式,将hba1与hbb1两个基因的扩增在同一管中完成,hba2与hbb2两个基因的扩增在同一管中完成;每个样本需进行2个pcr反应,在一个96孔板上分区域完成所有的pcr反应,实验的同时,记录下每个样本对应的引物标签编号。pcr反应体系如下表5所示:表5pcr程序如下:95℃10min;95℃30s→62℃1min(35个循环);15℃∞。pcr反应在appliedbiosystemsveritithermalcyclerpcr仪上运行。pcr完成后,取2μlpcr产物经2.0%的琼脂糖凝胶电泳,部分结果如图4所示,可清晰的分辨出每个反应孔中均有大小不同的两个条带。3.pcr产物混合和纯化与实施例1相同。纯化所得的37.5μl产物,经nanodrop8000(thermofisherscientific公司)测定浓度为82.39ng/μl。4.文库构建与实施例1相同。全部反应完成后,经荧光定量pcr(qpcr)检测到文库浓度结果为9.78nm。5.hiseq4000测序以qpcr所测浓度为准,按要求稀释进行hiseq4000pe-101程序测序,具体操作流程详见操作说明书。6.结果分析下机数据按照上述分析流程进行地贫突变型分析。整个过程由计算机完成。所得结果与已知结果100%相符,如表6所示。表6以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属
技术领域
的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。sequencelisting<110>深圳华大临床检验中心有限公司<120>用于地中海贫血突变型基因检测的引物组、试剂盒、其应用及文库构建方法<130>17i25208<160>8<170>patentinversion3.3<210>1<211>21<212>dna<213>人工序列<400>1caagcataaaccctggcgcgc21<210>2<211>22<212>dna<213>人工序列<400>2catgcctggcacgtttgctgag22<210>3<211>21<212>dna<213>人工序列<400>3caagcataaaccctggcgcgc21<210>4<211>24<212>dna<213>人工序列<400>4ccattgttggcacattccgggata24<210>5<211>21<212>dna<213>人工序列<400>5taagccagtgccagaagagcc21<210>6<211>24<212>dna<213>人工序列<400>6caatcattcgtctgtttcccattc24<210>7<211>24<212>dna<213>人工序列<400>7tttcagggcaataatgatacaatg24<210>8<211>20<212>dna<213>人工序列<400>8gcactgacctcccacattcc20当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1