一种诊断腓骨肌萎缩症的探针组合、试剂盒及应用的制作方法

文档序号:29495153发布日期:2022-04-06 14:58阅读:485来源:国知局
一种诊断腓骨肌萎缩症的探针组合、试剂盒及应用的制作方法

1.本发明属于基因检测技术领域,具体地,涉及一种诊断腓骨肌萎缩症的探针组合、试剂盒及应用。


背景技术:

2.腓骨肌萎缩症(charcot-marie-tooth disease,cmt)是一组最常见的,具有高度临床和遗传异质性的遗传性周围神经病,其总体发病率约为1/2500。根据正中神经运动传导速度(midian motor nerve conduction velocity,mncv),cmt可以进一步细分为脱髓鞘型(cmt1,mncv≤38m/s),轴索型(cmt2,mncv》38m/s)和中间型(icmt,25m/s《mncv《45m/s)三种。迄今为止,已经有超过100个基因被鉴定和cmt相关,其中:pmp22是cmt1型最常见的基因,其次为mpz;mfn2是cmt2型最常见的基因而gjb1是cmt中间型最常见基因。据文献报导,pmp22、gjb1、mpz和mfn2是4种最常见基因,占所有确诊的cmt的90%以上。
3.尽管全外显子测序在临床上已经被广泛利用,cmt的分子诊断仍然面临着许多挑战:(1)gjb1基因的3

utr区域的突变也可导致cmt1x表型。(2)pmp22大片段重复突变可以和其他的点突变共同存在,产生共同致病效应(double trouble effect),单一检测pmp22基因拷贝数变异或者cmt致病基因的点突变都可能导致漏诊。(3)部分复杂型遗传性周围神经病可以以cmt样表现为唯一症状,包括:转甲状腺素淀粉样多神经病变(familial amyloid polyneuropathy,fap)、遗传性痉挛性截瘫(hereditary spastic paraplegia,hsp)和gne肌病。
4.因此,本领域亟需一种能够检测多种与cmt相关基因的变异情况的试剂盒,以辅助cmt精准诊断。


技术实现要素:

5.为了解决上述技术问题中的至少一个,本发明采用的技术方案如下
6.本发明第一方面提供一种用于对目标基因进行snp/indel变异检测的探针组合的设计方法,包括以下步骤:
7.s1,将目标基因的每个外显子及其两端50bp作为第一探针区间,针对至少一个所述第一探针区间设计一个或多个探针;
8.s2,针对目标基因除所述第一探针区间以外的区域设计探针:以100bp为滑动窗口,当窗口中有2个以上致病突变位点时,将该窗口作为第二探针区间,针对至少个所述第二探针区间设计一个或多个探针;
9.s3,若s1~s2设计的探针gc含量高于80%的,若探针靶向的探针区间具有人群突变频率为20%~80%的snp位点,则将突变碱基作为探针碱基,若无相关突变位点的,则随机将探针中的5个g或c碱基改变为a或t。
10.本发明的第三方面提供一种用于对目标基因进行拷贝数变异检测的探针组合的设计方法,针对所述目标基因,每间隔1~3k,设置1个200bp第三探针区间,并针对至少一个
no.323~339所示的探针;靶向gla基因的探针组合包括seq id no.340~368所示的探针;靶向prps1基因的探针组合包括seq id no.369~387所示的探针;靶向ttr基因的探针组合包括seq id no.151~169所示的探针。
20.在本发明的一些实施方案中,所述用于诊断腓骨肌萎缩症的探针组合还包括用于分析pmp22基因拷贝数变异的探针组合,所述用于分析pmp22基因拷贝数变异的探针组合利用本发明第二方面所述的设计方法设计得到。
21.在本发明的一些方案中,所述用于分析pmp22基因拷贝数变异的探针组合包括靶向chr17:14100991-14101127、chr17:14133516-14133640、chr17:14171563-14171695、chr17:14235680-14235802、chr17:14285014-14285146、chr17:14312221-14312359、chr17:14343889-14344015、chr17:14409890-14410024、chr17:14457954-14458086、chr17:14492312-14492444、chr17:14531113-14531265、chr17:14596178-14596308、chr17:14646877-14646999、chr17:14655667-14655843、chr17:14735456-14735580、chr17:14780118-14780242、chr17:14800953-14801085、chr17:14850608-14850734、chr17:14898767-14898911、chr17:14939853-14939975、chr17:14979111-14979257、chr17:15018350-15018500、chr17:15065290-15065416、chr17:15133696-15133826、chr17:15136057-15136181、chr17:15141300-15141426、chr17:15142280-15142454、chr17:15144794-15144916、chr17:15148220-15148342、chr17:15150538-15150664、chr17:15152985-15153107、chr17:15155327-15155469、chr17:15157779-15157901、chr17:15158695-15158833中的至少一个区间的一个或多个探针。
22.在本发明的一些实施方案中,靶向chr17:14100991-14101127的探针组合包括seq id no.41~42所示的探针;靶向chr17:14133516-14133640的探针组合包括seq id no.43~44所示的探针;靶向chr17:14171563-14171695的探针组合包括seq id no.45~46所示的探针;靶向chr17:14235680-14235802的探针组合包括seq id no.47~48所示的探针;靶向chr17:14285014-14285146的探针组合包括seq id no.49~50所示的探针;靶向chr17:14312221-14312359的探针组合包括seq id no.51~52所示的探针;靶向chr17:14343889-14344015的探针组合包括seq id no.53~54所示的探针;靶向chr17:14409890-14410024的探针组合包括seq id no.55~56所示的探针;靶向chr17:14457954-14458086的探针组合包括seq id no.57~58所示的探针;靶向chr17:14492312-14492444的探针组合包括seq id no.59~60所示的探针;靶向chr17:14531113-14531265的探针组合包括seq id no.61~62所示的探针;靶向chr17:14596178-14596308的探针组合包括seq id no.63~64所示的探针;靶向chr17:14646877-14646999的探针组合包括seq id no.65~66所示的探针;靶向chr17:14655667-14655843的探针组合包括seq id no.67~68所示的探针;靶向chr17:14735456-14735580的探针组合包括seq id no.69~70所示的探针;靶向chr17:14780118-14780242的探针组合包括seq id no.71~72所示的探针;靶向chr17:14800953-14801085的探针组合包括seq id no.73~74所示的探针;靶向chr17:14850608-14850734的探针组合包括seq id no.75~76所示的探针;靶向chr17:14898767-14898911的探针组合包括seq id no.77~78所示的探针;靶向chr17:14939853-14939975的探针组合包括seq id no.79~80所示的探针;靶向chr17:14979111-14979257的探针组合包括seq id no.81~82所示的探针;靶向chr17:15018350-15018500的探针组合包括seq id no.83~84所示的探针;靶
向chr17:15065290-15065416的探针组合包括seq id no.85~86所示的探针;靶向chr17:15133696-15133826的探针组合包括seq id no.130~131所示的探针;靶向chr17:15136057-15136181的探针组合包括seq id no.132~133所示的探针;靶向chr17:15141300-15141426的探针组合包括seq id no.134~135所示的探针;靶向chr17:15142280-15142454的探针组合包括seq id no.136~137所示的探针;靶向chr17:15144794-15144916的探针组合包括seq id no.138~139所示的探针;靶向chr17:15148220-15148342的探针组合包括seq id no.140~141所示的探针;靶向chr17:15150538-15150664的探针组合包括seq id no.142~143所示的探针;靶向chr17:15152985-15153107的探针组合包括seq id no.144~145所示的探针;靶向chr17:15155327-15155469的探针组合包括seq id no.146~147所示的探针;靶向chr17:15157779-15157901的探针组合包括seq id no.148~149所示的探针;靶向chr17:15158695-15158833的探针组合包括seq id no.150所示的探针。
23.本发明第四方面提供一种用于诊断腓骨肌萎缩症相关基因进行变异检测的试剂盒,所述试剂盒包括本发明第三方面任一所述的探针组合。
24.在本发明的一些实施方案中,所述用于诊断腓骨肌萎缩症的试剂盒还包括基因组dna提取试剂、末端修复试剂、末端加“a”试剂、核酸扩增试剂和/或纯化试剂。
25.本发明第四方面提供一种本发明第三方面任一所述的探针组合在制备适用于以下方法诊断腓骨肌萎缩症的试剂盒中的应用,所述方法包括以下步骤:
26.s101,获得个体的基因组dna样本;
27.s102,利用所述探针组合进行富集并进行高通量测序;
28.s103,根据高通量测序数据诊断个体是否患有腓骨肌萎缩症。
29.在本发明的,可以利用任意高通量测序平台进行高通量测序。
30.在本发明的一些实施方案中,所述变异包括snp/indel变异以及cnv变异。
31.在本发明的一些实施方案中,利用以下步骤进行snp/indel分析:
32.对高通量测序数据进行质控,得到clean reads,利用基因比对软件将clean reads比对到参考基因组上,得到最初比对结果,优选地,对比对结果任选地经过包括但不限于去重复、局部重比对、碱基质量值样本校正处理,得到最终比对结果,其中,如果一个或一对read(s)在基因上可以有多个比对位置,则从中选择一个最好(mq值最高)的,如果有两个或以上最好的比对位置,则从中随机选择一个;进一步地,根据最终比对结果进行snp/indel分析。
33.在本发明的一些实施方案中,利用以下步骤进行cnv分析:
34.任选地,利用reads进行cnv分析,具体地,利用reads深度(reads depth)进行cnv分析;任选地,利用allele balance进行cnv分析;任选地,综合利用reads进行cnv分析的结果和利用allele balance进行cnv分析的结果。
35.在本发明的一些实施方案中,所述诊断为辅助诊断,需要结合人体其他临床表征或检测数据由专业医生进行最终判断。
36.本发明的有益效果
37.相对于现有技术,本发明具有以下有益效果:
38.本发明的探针设计方法不仅针对目标基因的外显子进行设计,还针对外显子两端
50bp进行设计,并且还针对目标基因的非编码区域尤其是基因调控区进行探针设计,相较于只对编码区捕获的探针设计更为全面,能够显著提高目标基因变异检测的精准度,并进而助力疾病精准辅助诊断。
39.根据本发明的探针设计方法,设计一个包含所有已知cmt致病基因和部分常见复杂性周围神经病致病基因的的探针组合,能良好覆盖gjb1基因的非编码区域,并且能够检测常见基因如pmp22基因拷贝数变异,提高cmt精准诊断率,减轻患者的时间和经济负担。
40.通常由于探针捕获的波动性与人为操作、仪器波动、试剂批次等因素影响较为密切,不能保证每个批次的结果的波动在一定范围内,会不定向偏差。本发明提出了allele balance的cnv分析方法,通常使用高通量捕获的突变其突变丰度在一个恒定的范围内,并不会由于人为影响导致其有较大的变化。
具体实施方式
41.除非另有说明、从上下文暗示或属于现有技术的惯例,否则本技术中所有的份数和百分比都基于重量,且所用的测试和表征方法都是与本技术的提交日期同步的。在适用的情况下,本技术中涉及的任何专利、专利申请或公开的内容全部结合于此作为参考,且其等价的同族专利也引入作为参考。如果现有技术中披露的具体术语的定义与本技术中提供的任何定义不一致,则以本技术中提供的术语定义为准。
42.术语“包含”,“包括”,“具有”以及它们的派生词不排除任何其它的组分、步骤或过程的存在,且与这些其它的组分、步骤或过程是否在本技术中披露无关。为消除任何疑问,除非明确说明,否则本技术中所有使用术语“包含”,“包括”,或“具有”的组合物可以包含任何附加的添加剂、辅料或化合物。相反,出来对操作性能所必要的那些,术语“基本上由
……
组成”将任何其他组分、步骤或过程排除在任何该术语下文叙述的范围之外。术语“由
……
组成”不包括未具体描述或列出的任何组分、步骤或过程。除非明确说明,否则术语“或”指列出的单独成员或其任何组合。
43.为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。
44.实施例
45.以下例子在此用于示范本发明的优选实施方案。本领域内的技术人员会明白,下述例子中披露的技术代表发明人发现的可以用于实施本发明的技术,因此可以视为实施本发明的优选方案。但是本领域内的技术人员根据本说明书应该明白,这里所公开的特定实施例可以做很多修改,仍然能得到相同的或者类似的结果,而非背离本发明的精神或范围。
46.除非另有定义,所有在此使用的技术和科学的术语,和本发明所属领域内的技术人员所通常理解的意思相同,在此公开引用及他们引用的材料都将以引用的方式被并入。
47.那些本领域内的技术人员将意识到或者通过常规试验就能了解许多这里所描述的发明的特定实施方案的许多等同技术。这些等同将被包含在权利要求书中。
48.下述实施例中未作具体说明的分子生物学实验方法,均按照《分子克隆实验指南》(第四版)(j.萨姆布鲁克、m.r.格林,2017)一书中所列的具体方法进行,或者按照试剂盒和产品说明书进行。其他实验方法,如无特殊说明,均为常规方法。下述实施例中所用的仪器设备,如无特殊说明,均为实验室常规仪器设备;下述实施例中所用的试验材料,如无特殊
说明,均为自常规生化试剂商店购买得到的。
49.实施例1探针设计
50.本实施例利用以下方法设计cmt相关基因检测的特异性探针:
51.1)探针覆盖外显子区域及和外显子两端50bp;
52.2)针对外显子以外的调控区域,以100bp为滑动窗口,当一个窗口中有2个及2个以上已知致病突变时,保留该区间,并设计相关探针;
53.3)探针设计使用叠瓦式,参考区间中的每个碱基至少有3条以上探针对其进行覆盖;
54.4)针对存在cnv的目标基因,每间隔1~3k,增加1个200bp cnv-plus探针区间,该探针区间需包含gnomad人群数据库中,东亚人群突变频率为20%~80%的snp位点且该区间在基因组上无相似序列(以200bp为滑动窗口,进行全基因组比对,无90%以上相似度的序列),如间隔1~3k内无符合要求的snp位点,则取距离上个最近区间2k位置设计一个200bp大小的区间,并设计探针;
55.5)对于设计探针gc含量高于80%的,如探针区域有人群突变频率为20%~80%的snp位点的将突变碱基作为探针碱基,如无相关突变位点的,随机将探针中的5个g或c碱基改变为a或t。
56.根据以上设计原则,发明人针对pmp22、gjb1、mfn2、mpz、gdap1、morc2、sord、nefh、hspb1、nefl、pmp2、gla、prps1、ttr基因设计探针,并针对pmp22基因设计cnv-plus探针,得到靶向以下区间的探针:
57.chr17:14100991-14101127、chr17:14133516-14133640、chr17:14171563-14171695、chr17:14235680-14235802、chr17:14285014-14285146、chr17:14312221-14312359、chr17:14343889-14344015、chr17:14409890-14410024、chr17:14457954-14458086、chr17:14492312-14492444、chr17:14531113-14531265、chr17:14596178-14596308、chr17:14646877-14646999、chr17:14655667-14655843、chr17:14735456-14735580、chr17:14780118-14780242、chr17:14800953-14801085、chr17:14850608-14850734、chr17:14898767-14898911、chr17:14939853-14939975、chr17:14979111-14979257、chr17:15018350-15018500、chr17:15065290-15065416、chr17:15133696-15133826、chr17:15136057-15136181、chr17:15141300-15141426、chr17:15142280-15142454、chr17:15144794-15144916、chr17:15148220-15148342、chr17:15150538-15150664、chr17:15152985-15153107、chr17:15155327-15155469、chr17:15157779-15157901、chr17:15158695-15158833
58.由此,设计探针序列如表1所示(基因顺序与前述不同,但本领域知悉,基因的顺序的描述不影响本发明公开的实质内容,不影响本发明的实际保护范围)。
59.表1探针信息
60.61.62.63.64.65.66.67.68.69.70.71.72.73.[0074][0075]
注:探针名称中“_”后面的内容表示探针靶向的基因或者片段,如“15981_pmp22”表示该探针靶向pmp22基因,“15989_chr17:15148220-15148342”表示该探针靶向chr17:15148220-15148342片段。
[0076]
实施例2目标区域捕获测序
[0077]
本实施例使用了实施例1提供捕获探针组,并且基于液相杂交的序列捕获技术对靶序列进行富集。液相杂交技术路线是:(1)制备杂交探针库,(2)使用探针对目标基因进行富集,(3)将富集后的dna序列用高通量测序仪进行测序。
[0078]
使用液相杂交技术能对目标基因进行有效富集,降低样本量的要求,同时也能更好地控制测序成本。该文库构建方法包括如下步骤:
[0079]
1.dna提取和打断
[0080]
使用qiaamp dna blood mini kit提取4个外周血样本中dna。
[0081]
使用bioruptor pico dna打断仪,待冷循环仪温度降至4℃后,设置参数on 30s,off 30s为1个循环,每10循环为一轮,共进行3轮,每组结束后将样品置于振荡器上充分混匀,短暂离心后进行下一轮打断。
[0082]
取1μl样品使用qsep 100进行片段检测,正常打断后样品检测主峰约在150bp-200bp。
[0083]
2.末端修复
[0084]
预先从-20℃保存的试剂盒中取出10
×
t4 pnk buffer和natural dntp mix,将其置于冰上融化并用vortex充分混匀直至buffer中没有任何固体不溶物,将酶从-20℃冰箱
取出置于-20℃冰盒上。
[0085]
在1.5ml的离心管中分别配制末端修复反应体系,如表2所示。
[0086]
表2末端修复反应体系
[0087]
试剂体积/μl来自1的样品4110
×
t4 pnk buffer510mm dntp mix1t4 dna polymerase1t4 pnk1klenow fragment1共计100
[0088]
20℃温浴30min。反应后产物用ampure xp磁珠进行纯化,溶解于20μl te中。
[0089]
3.末端加“a”(a-tailing)
[0090]
在1.5ml的离心管中分别配制末端加“a”反应体系,如表3所示。
[0091]
表3末端加“a”体系
[0092]
试剂体积/μl来自2的样品19.510
×
blue buffer2.51mm datp2.5klenow(3
’‑5’
exo-)0.5共计25
[0093]
37℃温浴30min。反应后产物使用ampure xp磁珠进行纯化,溶解于25μl te中。
[0094]
4.接头(adapter)连接
[0095]
在1.5ml的离心管中配制adapters连接反应体系,如表4所示。
[0096]
表4 adapter连接体系
[0097][0098][0099]
20℃温浴15min,反应后产物使用ampure xp磁珠进行纯化,溶解于21μl te中。
[0100]
5.pcr扩增加index
[0101]
增加index的pcr反应体系及反应条件如表5所示:
[0102]
表5加index的pcr反应体系
[0103]
试剂体积/μl来自步骤4的样品21
hifi mix25index primers 12index primers 22total50
[0104]
在pcr仪中运行下列程序:
[0105][0106]
反应后产物使用ampure xp磁珠进行纯化。溶解于50μl te中。使用nanodrop1000检测pcr产物浓度。使用qubit 3.0进行文库定量,文库浓度》25ng/μl参考为合格文库。使用qsep 100检测,文库主峰要在220-320bp左右,主峰前后无杂峰。
[0107]
6.杂交
[0108]
将hyb block及hyb buffer从冰箱取出,冰上融化,融化后将hyb buffer置于金属浴上65℃预热。
[0109]
按照表6体系将样品文库与hyb block混匀,标记为b。
[0110]
表6杂交体系
[0111]
组分用量样品文库600nghyb block5μl
[0112]
将hyb buffer置于室温融化,未加热前会有沉淀出现,混匀后置于65℃水浴锅内预热,完全溶解后(无沉淀及浑浊物)取20μl hyb buffer置于新的200μl pcr管内,盖好管盖,标记为a,继续置于65℃水浴锅内孵育待用。
[0113]
取5μl rnase block与2μl probe置于200μl pcr管内,轻轻吸打混匀,短暂离心后置于冰上待用,标记为c。
[0114]
设置pcr仪参数,heat lid 100℃,95℃,5min;65℃,hold;
[0115]
将pcr管b置于pcr仪上,运行以上程序。
[0116]
pcr仪温度降至65℃时,将pcr管a置于pcr仪上孵育,盖上pcr仪热盖;5min后,将c置于pcr上孵育,盖上pcr仪热盖;将pcr管c放置入pcr仪2min后,把移液器调至13μl,从pcr管a中吸取13μl hyb buffer移至pcr管c中,吸取全部pcr管b中样品移至pcr管c中,轻轻吸打10次,充分混匀,避免产生大量气泡,密封管盖,盖上pcr仪热盖,65℃孵育过夜(8-16h)。
[0117]
7.捕获
[0118]
提前分装wash buffer 2(每个捕获需要1.8ml),并置于thermomixer上65℃预热。
[0119]
保持杂交产物pcr管c在pcr仪上,将杂交后pcr管c的产物加入到200μlbiotin-bed中,用移液器吸打6次混匀,置于旋转混匀仪上(10rpm/min)室温结合30min后将离心管置于磁力架上2min,然后移除上清液。
[0120]
向离心管内加入500μl的wash buffer 1,轻轻吸打6次混匀,重悬磁珠,并于漩涡
混合仪上振荡5s混匀样品,室温下孵育样品15min。
[0121]
加入500μl的65℃预热的wash buffer 2,涡旋混匀5s,置于thermomixer上65℃孵育10min,转速800转/min进行清洗。
[0122]
短暂离心,将离心管放于磁力架上2min,移除上清。重复洗2次清洗,共计3次。最后一次彻底移除除wash buffer2(可用10μl移液器移除残留)。
[0123]
向离心管中加入25μl nuclease-free water,从磁力架上取下离心管,轻轻吸打6次重悬磁珠待用。
[0124]
8.富集
[0125]
获后需要对dna文库进行富集,根据表7配制混合物(mix)。
[0126]
表7富集mix体系
[0127][0128][0129]
pcr扩增体系如下:
[0130][0131]
将pcr产物纯化后,文库使用qubit dsdna hs assay kit进行定量,使用qsep 100进行文库片段长度测定,文库长度约在220-320bp之间。捕获好的文库通过高通量测序仪(illumina novaseq 6000system)进行测序。
[0132]
9.测序数据分析
[0133]
9.1数据质控
[0134]
测序得到的原始图像数据经basecalling转化为序列数据,即为raw data或raw reads,结果以fastq文件格式存储(文件名:*.fq)。raw data中会包含接头信息,低质量碱基,未测出的碱基(以n表示),这些信息会对后续的信息分析造成很大的干扰,分析前需要将这些干扰信息去除掉,最终得到的数据即为有效数据,即为clean data或clean reads。原始数据过滤方法如下:
[0135]
(1)过滤掉含有接头序列的reads;
[0136]
(2)当单端测序read中含有的n的含量超过该条read长度比例的10%时,需要去除此对paired reads;
[0137]
(3)当单端测序read中含有的低质量(碱基质量值小于5)碱基数超过该条read长度比例的50%时,需要去除此对pairedreads。经过对测序数据的严格过滤,得到高质量的cleandata。对产出数据进行统计,包括测序read数量,数据产量,测序错误率,q20含量,q30含量,gc含量等。
[0138]
9.2比对
[0139]
有效测序数据通过bwa比对到参考基因组(ucsc hg19),得到bam格式的最初的比对结果。bam文件再用picard和gatk进行去重复(duplicate removal)、局部重比对(local realignment)、碱基质量值重校正(basequality recalibration)等处理,从而得到bam格式的最终比对结果。如果一个或一对read(s)在基因上可以有多个比对位置,bwa的处理策略是从中选择一个最好的(mq值最高的),如果有两个或以上“最好”的比对位置,则从中随机选择一个。这种多重比对(multiple hit)的处理对snp、indel以及cnv等的检测有重要影响。通常检测snp或indel的时候要使用高质量的比对(alignment)。
[0140]
9.3 indel变异检测
[0141]
最终的bam文件用gatk进行snp/indel(小于50bp的小片段)的检测。
[0142]
9.4基因的cnv变异检测
[0143]
9.4.1利用reads进行cnv分析
[0144]
评估bed区间的gc含量、捕获效率。对低捕获效率的目标区间(对区间平均深度进行排序,位于末位百分之五的区间)进行过滤,不加入cnv评估的区间分析。
[0145]
标准化数据量:每次检测样本,计算捕获区间reads数,当reads数是正常对照样本的70%~130%则进行下一步分析。如reads数大于130%,则使用seqtk抽取相应数据量数据后,进行进一步分析。
[0146]
reads depth判定:使用由上述步骤9.2比对产生的bam文件,统计所有待分析样本无相似序列bed区间内的reads数目。
[0147]
利用贝塔二项分布来描述特定区域正常样本和对照样本的覆盖度比值,用隐马尔可夫模型来预测cnv情况。
[0148]
9.4.2利用allele balance进行cnv分析
[0149]
针对每个基因选取目标区域内的所有snp。对snp进行以下过滤:保留非基因组重复区域及基因座控制区(locus control region,lcr)的单核苷酸突变,gq》=20,dp》=10,allele balance》0.2的snp。
[0150]
计算筛选出样本的杂合度:杂合snp数量/总过滤后snp数量。当杂合度《0.1,判定为del;如杂合度≥0.1,删除allele balanc≥0.9的snp,对剩余snp的allele balance根据表8计算得分(score):
[0151]
表8根据allele balance计算得分
[0152][0153][0154]
对所有位点的snp求和:获得∑score,进行表9所示判定:其中使用snp数量作为主要质控参数,当snp数量不满足需求时,作为未知(unkonw)。
[0155]
表9根据snp判定
[0156][0157]
9.4.3cnv复核校验
[0158]
根据reads depth判定结果及allele balance∑score进行综合判定,如表10所示。
[0159]
表10综合判定结果
[0160]
∑score判定结果reads depth判定结果综合判定结果dupdupdup+dupnormaldupdupdelunkonwnormaldupnormalnormalnormalnormalnormaldelnormaldeldupunkonwdelnormaldeldeldeldel+unkonwdupdup-unkonwnormalnormalunkonwdeldel-[0161]
实施例3样本检测
[0162]
选取20例样本利用实施例2所示方法进行检测,同时使用wes、mlpa对样本的pmp22基因cnv进行平行比较实验。wes使用试剂盒为:sureselect人全外显子v7外显子组;mlpa使用试剂盒为:mrc-holland p405检测试剂盒。
[0163]
结果如表11所示,显示实施例2方法检测结果与mlpa符合率为100%,并且高于单纯基于reads depth分析的结果。
[0164]
表11样本检测结果
[0165]
[0166][0167]
在本发明提及的所有文献都在本技术中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所附权利要求书所限定的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1