一种检测遗传性心肌病的探针及其应用的制作方法

文档序号:14733190发布日期:2018-06-19 19:55阅读:179来源:国知局

本发明涉及基因测序技术领域,尤其涉及一种检测遗传性心肌病的探针及其应用。



背景技术:

高通量测序技术(High-throughput sequencing)又称新一代测序技术("Next-generation"sequencing technology),以能一次并行对几十万到几百万DNA分子进行序列测定和一般读长较短等为标志。然而全基因组测序的成本和分析的复杂程度还是让科研人员和临床医生倍感困难,目标序列捕获技术的出现,缓解了上述问题,目标序列捕获测序是针对已知的特定基因组区域设计探针捕获后进行测序。目标序列捕获的一种重要的方法是根据核酸分子碱基互补杂交原理发展的。即根据目标基因组序列,设计与之完全互补的探针,将这些探针固定在某些支持物上(用于分离),然后打断基因组DNA,加上接头(用于测序)后与探针杂交,洗脱未杂交上的DNA,回收目标DNA片段,可以直接建库进行DNA测序。

遗传性心肌病主要包括肥厚型心肌病(HCM)、致心律失常性右室心肌病(ARVC/D)、左室心肌致密化不全(LVNC)、心脏离子通道疾病和遗传性心肌淀粉样变。心脏离子通道疾病包括长QT间期综合征(LQTS)、Brugada综合征(BrS)、儿茶酚胺敏感的多形性室速(CPVT)和短QT间期综合征(SQTS)。心肌病患者可因恶性室性心律失常猝死,随着年龄增长,心肌病患者容易进展为心力衰竭,因此心肌病的早期诊断和风险筛查尤为关键。

在测序技术飞速发展的同时,精准医学这一概念作为个体化医学的新型表述形式也开始被正式提出并得到重视。精准医疗是以个体化医疗为基础、随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。其本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对于大样本人群与特定疾病类型进行生物标记物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病的不同状态和过程进行精确分类,最终实现对于疾病和特定患者进行个性化精准治疗的目的,提高疾病诊治与预防的效益。精准医学一被提出,即在心血管疾病诊断领域得到应用,通过对遗传性心血管疾病患者进行基因检测,筛查相关的基因突变位点,研究这些位点及其编码的生物分子或蛋白的结构和功能,可以进一步探究发病原因及机制,实现临床上的精确诊断。

CN105506115A公开一种通过靶向高通量半导体测序技术检测遗传性心肌病致病基因突变的DNA文库及其应用。具体来说,根据80个遗传性心肌病致病基因,设计引物池,对样本基因组DNA进行超多重PCR扩增,扩增产物利用高通量半导体测序技术进行测序,寻找致病突变,为临床诊断提供遗传学和分子生物学的理论依据,但该发明的高通量测序深度较低,工作量太大,准确度低,费时费力。

现有技术使用全外显子组测序的方法进行测序时,人类外显子组较大,测序所需数据量较大,时间较长,测序深度低导致灵敏度低,低频位点和特殊区域的漏检率较高,因此部分基因突变无法有效检出,因此,提供一种基于目标基因捕获的准确度高、简洁高效的检测体系及探针,对于遗传性心肌病的早期诊断和治疗具有重要意义。



技术实现要素:

针对现有技术的不足及实际的需求,本发明提供一种检测遗传性心肌病的探针及其应用,通过筛选整合与遗传性心肌病相关的目的基因的外显子区域并针对目的基因的相关区域设计探针,并建立一套能够准确且可靠的检测基因突变的体系,测序深度高,简洁灵敏,组装成试剂盒后用于制备检测遗传性心肌病的试剂和药物,具有广阔的应用前景和市场价值。

为达此目的,本发明采用以下技术方案:

第一方面,本发明提供一组探针,包括分别特异性识别多个目的基因的多个探针,且每个探针至少满足下列条件之一:

(1)根据目的基因的外显子及外显子内含子交界处进行设计;

(2)所述探针的长度为50-200bp,优选为60-150bp;

(3)去除含有未知碱基序列的探针;

(4)当多个探针之间属于重复序列的比例不小于50%时,去除所述多个探针;

(5)保证每个探针5’端碱基为T;

(6)含有生物素标记。

本发明中,所述重复序列的比例例如可以是50%、52%、53%、55%、58%、60%、62%、65%、68%、70%、72%、75%、78%、80%、82%、85%、88%、90%、92%、95%、98%或100%。

根据本发明,所述目的基因为选自下列的至少一种:MYBPC3、MYH7、MYH6、TNNT2、TNNI3、GAA、JPH2、CAV3、DES、ACTC1、ACTN2、ACTA1、MYL3、TCAP、TPM1、VCL、TTN、MYLK3、MYPN、ABCC9、LMNA、PKP2、DTNA、DSC2、DSG2、JUP、DSP、RYR2、CASQ2、AKAP9、ANK2、CACNA1C、CACNA2D1、CACNB2、CALM1、KCNE1、KCNE2、KCNE3、KCNQ1、KCNJ2、KCNJ5、KCNJ8、KCNH2、SCN4B、SCN5A、SNTA1、TRPM4、CALM2、BRAF、PTPN11、SOS1、GPD1L、TRDN和SCN1B。

为了评估受检者遗传性心肌病的患病风险,辅助医生进行诊断与治疗,本发明中,发明人充分研究了遗传性心肌病的发病机制与基因组的关系,广泛阅读相关文献,总结筛选与遗传性心肌病相关的目的基因,包括MYBPC3、MYH7、MYH6、TNNT2等导致心肌病的基因,AKAP9、ANK2、CACNA1C等导致离子通道病的基因。

本发明中,根据设计原则设计了1301条序列,总大小为1.8Mb,所述探针的捕获区域为第一方面所述基因的全部外显子和/或外显子内含子交接区域。上述探针是一段具有生物素标记的DNA序列,可以和目的基因杂交,再通过链霉亲和素标记的磁珠与含有生物素的探针结合,即可完成目标基因区域的靶向富集。

第二方面,本发明提供一种试剂盒,包含第一方面所述的探针。

第三方面,本发明提供一种如第一方面所述的探针和/或如第二方面所述的试剂盒用于检测基因突变。

第四方面,本发明提供一种检测基因突变的方法,包括如下步骤:

(1)提取人基因组DNA并进行片段化后构建基因组文库;

(2)根据第一方面所述的基因设计捕获探针并对步骤(1)构建的文库进行杂交捕获;

(3)对步骤(2)捕获的目的基因进行高通量测序和生物信息学分析,得到所述基因突变的结果。

优选地,提取基因组DNA可任选能够有效提取基因组DNA的试剂盒,本发明中使用康为世纪公司的DNA提取试剂盒(AllPure DNA/RNA/Protein Kit)。

优选地,构建基因组文库可任选能有效构建基因组文库的试剂盒,本发明使用KAPA公司的建库试剂盒(KAPA Library Prep Kit)。

优选地,杂交捕获可任选能有效实现杂交捕获的试剂盒,本发明中使用罗氏公司的辅助试剂盒(SeqCap EZ Accessory Kit v2)。

优选地,高通量测序可任选能准确完成高通量测序的平台,本发明中选择Illumina公司的NextSeq 500测序平台。

优选地,步骤(1)所述片段化的长度为150-250bp。

其中,步骤(3)所述生物信息学分析包括以下流程:

(1’)数据质控;

(2’)数据过滤:

(3’)比对:

(4’)突变识别。

优选地,步骤(2’)所述数据过滤的步骤包括:

去除adapter数据;去除primer数据;去除低质量数据。

优选地,步骤(3’)所述比对的步骤包括:

与参考基因组进行比对,找出基因突变。

优选地,步骤(4’)所述突变识别的标准包括:

a)如果一个变异位点的检出次数≤20%的测序深度,则放弃该候选位点;

b)候选突变位点上至少有一条可信度序列,否则该候选位点被去除;

c)突变位点人群频率≤1%,否则该候选位点被去除。

本发明提供了一种基于高通量测序检测人类基因组突变的方法,其是提取血液和组织样本中的基因组DNA双链核酸样本,将样本基于高通量测序进行上机测序,得到血液和组织样本的核酸序列,所得到的核酸序列进行自动化处理,与人类基因组标准序列进行自动比对并注释,找出致病突变,最后根据注释文献结合受检者的临床信息及家族遗传信息判断是否患有遗传性心肌病。

其中,遗传性心肌病风险评估包括下述指标:

(1)突变位点识别;

(2)临床信息比对;

(3)突变与疾病共分离分析。

作为优选技术方法,所述检测基因突变的方法,具体包括如下步骤:

(1)提取人基因组DMA并进行片段化为150-250bp后构建基因组文库;

(2)根据第一方面所述的基因设计捕获探针并对步骤(1)构建的文库进行杂交捕获;

(3)对步骤(2)捕获的目的基因进行高通量测序和生物信息学分析;

其中,生物信息学分析包括以下流程:

(1’)数据质控;

(2’)数据过滤:

去除adapter数据;去除primer数据;去除低质量数据;

(3’)比对:

与参考基因组进行比对,找出基因突变;

(4’)突变识别:

a)如果一个变异位点的检出次数≤20%的测序深度,则放弃该候选位点;

b)候选突变位点上至少有一条可信度序列,否则该候选位点被去除;

c)突变位点人群频率≤1%,否则该候选位点被去除。

第五方面,本发明提供一种如第一方面所述的探针和/或如第二方面所述的试剂盒用于制备检测遗传性心肌病的试剂和/或药物的用途。

与现有技术相比,本发明具有如下有益效果:

(1)本发明提供了与遗传性心肌病相关的目的基因,并选取目的基因的特定区域设计探针,进行高通量测序并分析结果,所得到的检测结果与全外显子检测结果一致性较高;

(2)本发明采用目标序列捕获技术,检测所需数据量仅为全外显子组测序数据量的1%,平均有效测序深度为全外显子组测序的2-5倍,灵敏度远高于全外显子组测序方法。

附图说明

图1是本发明的全外显子捕获探针和1.8MB捕获探针的针对MYBPC3的34号外显子区域的测序深度图。

具体实施方式

为更进一步阐述本发明所采取的技术手段及其效果,以下结合附图并通过具体实施方式来进一步说明本发明的技术方案,但本发明并非局限在实施例范围内。

实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。

实施例1 1.8Mb区域捕获探针的设计与合成

本实施例提供一组探针,根据如下目的基因进行设计,所述目的基因包括:MYBPC3、MYH7、MYH6、TNNT2、TNNI3、GAA、JPH2、CAV3、DES、ACTC1、ACTN2、ACTA1、MYL3、TCAP、TPM1、VCL、TTN、MYLK3、MYPN、ABCC9、LMNA、PKP2、DTNA、DSC2、DSG2、JUP、DSP、RYR2、CASQ2、AKAP9、ANK2、CACNA1C、CACNA2D1、CACNB2、CALM1、KCNE1、KCNE2、KCNE3、KCNQ1、KCNJ2、KCNJ5、KCNJ8、KCNH2、SCN4B、SCN5A、SNTA1、TRPM4、CALM2、BRAF、PTPN11、SOS1、GPD1L、TRDN和SCN1B;

所述探针满足下列条件:

(1)根据目的基因的外显子及外显子内含子交界处进行设计;

(2)所述探针的长度为50-200bp;

(3)去除含有未知碱基序列的探针;

(4)当多个探针之间属于重复序列的比例不小于50%时,去除所述多个探针;

(5)保证每个探针5’端碱基为T;

(6)含有生物素标记;

由于设计得到的探针组,共包含探针1301条,例如所在11号染色体(Chr11)的区域1范围(47352956~47353267)内MYBPC3基因34号外显子起始位置为47352956,终止位置为47353267,为了覆盖到外显子内含子交接区域,在34号外显子的两侧再延伸10bp设计探针,则探针区域为47352946~47353277。所有探针首尾相接覆盖人类基因组编码区外显子1.8Mb目标区域,所有探针均具有生物素标记;所述捕获探针集合具有唯一性;所述目标区域举例如表1所示,捕获基因列表及外显子区域见表2,所述捕获探针进行部分列举,具体如下;

表1目标区域举例

表2

列举的部分序列为根据11号染色体(Chr11)的区域1范围(47352956~47353267)内MYBPC3基因34号外显子进行设计,为了覆盖到外显子内含子交接区域,在34号外显子的两侧再延伸10bp设计探针,则探针区域为47352946~47353277,具体涉及探针如下:

探针1(SEQ ID NO.1):

bio-TATTGAGAAGAGTGAGTTCTCTGTGACTGCACTTATCTTTTATTGCCCAATAAACATTGGGAAGACATAGCAGGCCAGAAAGGCCTGTCCCCAGACATTGTTTCTTGAGGCCACCCTCCTTTTACCCCAAAGATCCAGGGGCTTCCTTCAGGAGCCCTGTGGACCAGTCTGTGCAACACCCAC;

探针2(SEQ ID NO.2):

bio-TCAGGACTGCCCGACAACTGCCCTGCTGATCCCCCATCGCAGCACAGGAGACACACTTGTCACACATACATCCAACAGTAGGGAGGGGTTTCCCCAACTTCCCTCCAGGCTCCTGGCACGGGGCTGGCATCCGGTTGTACCTGCAACACA.

实施例2检测基因突变

1、DNA提取及片段化:从20份携带已知剪切位点突变(外显子与内含子交界区域突变)的血液样本中使用核酸提取剂试剂盒(康为世纪生物科技有限公司)提取人基因组DNA,在Covaris S2仪器(购自美国Covaris公司)上进行片段化,得到150-250bp的DNA双链核酸片段的混合物;

2、构建基因组文库

使用KAPA公司的建库试剂盒(KAPA Library Prep Kit),具体操作方法参照说明书;

3、杂交捕获

使用实施例1合成的目标序列捕获探针混合物捕获单链的DNA产物,使用罗氏公司的辅助试剂盒(SeqCap EZ Accessory Kit v2);

4、高通量测序

选择Illumina公司的NextSeq 500测序平台,测序读长150bp;

5、生物信息学分析

(1)数据质控;

(2)数据过滤:

去除adapter数据;去除primer数据;去除低质量数据;

(3)比对:

与参考基因组进行比对,找出基因突变;

(4)突变识别:

a)如果一个变异位点的检出次数≤20%的测序深度,则放弃该候选位点;

b)候选突变位点上至少有一条可信度序列,否则该候选位点被去除;

c)突变位点人群频率≤1%,否则该候选位点被去除。

对比例1全外显子捕获探针检测

与实施例2相比,除捕获探针采用全外显子捕获探针外,其他条件与实施例2相同;

实施例2和对比例1的检出结果如下表3;

表3突变检出结果对比

从表3中可以看出,在相同的实验条件下,捕获探针检测的灵敏性高于全外显子检测。

以人类基因组DNA中的MYBPC3基因为例,全外显子捕获探针和目标序列捕获探针的测序深度图如图1所示;

由图1可知,相同数据量的情况下全外显子测序的测序深度较低,因此突变检出灵敏度较低,而靶向捕获探针测序可以很好的提高测序深度,提高检出效率。

实施例3遗传性心肌病风险的判定

取A、B、C、D、E五位受检者血液样本按照实施例2方法进行检测,通过生物信息分析后得到如表4所示:

表4

通过下述三个步骤判定受检者遗传性心肌病风险:

1、进行变异位点识别:2、5、8三个突变由于人群频率高于1%被排除,3号突变由于检出次数不足该位点测序深度的20%被排除,其余突变被认为是可能的阳性位点。

2、临床信息比对:

①对于受检者A,有文献报道受检者携带的1号基因突变会导致肥厚型心肌病(HCM),结合受检者存在劳动性呼吸困难、心肌增厚的临床表型,判定该突变与受检者临床表型相符;

②对于受检者B,有文献报道受检者携带的4号基因突变会导致长QT综合征3型(LQTS3),结合受检者存在QT间期延长的临床表型,判定该突变与受检者临床表型相符;

③对于受检者C,其所携带的6号突变目前没有报道,但是突变可能导致的疾病与受检者QT间期延长的临床表型相符;

④对于受检者D,有文献报道受检者携带的7号基因突变会导致儿茶酚氨源性室性心动过速(CPVT),结合受检者的临床表型,判定该突变与受检者临床表型相符;

⑤对于受检者E,有文献报道受检者携带的9号基因突变会导致马凡综合征2型(MFS2),结合受检者存在主动脉扩张、蜘蛛趾、颧骨发育不全等临床表型,判定该突变与受检者临床表型相符。

3、突变与疾病共分离分析:以受检者A家系研究为例,采集受检者A直系亲属(父亲、母亲、爷爷、奶奶、姥姥、老爷)的血液进行1号基因突变定点分析,结果显示受检者母亲和姥姥携带此突变,父亲、奶奶、爷爷未携带,同时临床信息显示受检者的母亲和姥姥均为肥厚型心肌病患者,表明受检者携带的1号基因突变是一个致病突变。因此,判定受检者携带一个导致肥厚型心肌病的基因突变,患肥厚型心肌病的风险极高。

综上所述,本发明提供一种检测遗传性心肌病的基因及其探针,通过筛选整合与遗传性心肌病相关的目的基因的外显子区域并针对目的基因的相关区域设计探针,并建立一套能够准确且可靠的检测基因突变的体系,测序深度高,简洁灵敏,组装成试剂盒后用于制备检测遗传性心肌病的试剂和药物,具有广阔的应用前景和市场价值。

申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

序列表

<110> 北京乐普基因科技股份有限公司

<120> 一种检测遗传性心肌病的探针及其应用

<130> 2018

<141> 2018-02-11

<160> 2

<170> SIPOSequenceListing 1.0

<210> 1

<211> 183

<212> DNA

<213> 人工合成序列()

<400> 1

tattgagaag agtgagttct ctgtgactgc acttatcttt tattgcccaa taaacattgg 60

gaagacatag caggccagaa aggcctgtcc ccagacattg tttcttgagg ccaccctcct 120

tttaccccaa agatccaggg gcttccttca ggagccctgt ggaccagtct gtgcaacacc 180

cac 183

<210> 2

<211> 150

<212> DNA

<213> 人工合成序列()

<400> 2

tcaggactgc ccgacaactg ccctgctgat cccccatcgc agcacaggag acacacttgt 60

cacacataca tccaacagta gggaggggtt tccccaactt ccctccaggc tcctggcacg 120

gggctggcat ccggttgtac ctgcaacaca 150

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1