组合物及其在序列测定和变异检测中的用图

文档序号:9682210
组合物及其在序列测定和变异检测中的用图
【技术领域】
[0001] 本发明涉及生物医学领域,具体地,本发明涉及一包含探针的组合物及其用途、 CNV变异检测方法以及同时进行多种变异检测的方法及装置。
【背景技术】
[0002] 我国是一个出生缺陷高发国家,根据卫生部最新统计,每年新增出生缺陷数约90 万例(占全国1600万出生人口总数的5. 6% ),其中30%在出生前后死亡,40%造成终生残 疾,只有30%可以治愈或纠正。出生缺陷对我国经济每年造成千亿损失,如我国每年仅仅因 神经管缺陷造成的直接经济损失超过2亿元、每年新出生的唐氏综合征生命周期的总经济 负担超过100亿元、新发先天性心脏病生命周期的总经济负担超过126亿元。出生缺陷正 成为我国婴儿死亡的主要原因(占总死亡率的19% )、儿童残疾的重要原因和医疗卫生系 统的巨大负担。孕前遗传检测及推广是有效预防及减少以上数据的方式。
[0003] 近年来新一代超高通量测序技术及目标区域捕获技术发展,突破了当前孕前遗传 检测在单基因、小人群中进行的局限。

【发明内容】

[0004] 本发明一方面提供了一个组合物,该组合物包含探针,所述探针固定在固相载体 上或者游离于溶液中,所述探针至少能够覆盖以下15个基因中的5个基因的每个基因区 域的至少一部分:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、 CYP21A2、GAA和PKHD1。这15个基因,与12种我国高发遗传病相关,包括地中海贫血(α、 β /ΗΒΑ1、ΗΒΑ2、ΗΒΒ),遗传性耳聋(GJB2、SLC26A4),脊髓性肌肉萎缩症(SMN1),丙尿酮症 (ΡΑΗ),糖原累积病II型(GAA),半乳糖血症(GALT),甲型血友病(F8),乙型血友病(F9), 肝豆状核变性(ATP7B),先天性肾上腺皮质增生症(CYP21A2),进行性假肥大性肌营养不良 (DMD),常染色体隐性多囊肾(PKHD1)。至少一部分,比如各基因的外显子区域、和/或基因 与外显子相连的上下游30bp的内含子区域,和/或全基因区域,利于后续与该基因相关的 单核苷酸突变、结构变异以及剪切突变的检测。
[0005] 本发明的另一方面提供了上述组合物在测定以下15个基因中的至少5个基因的 每个基因序列的至少一部分中的用途:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、 PAH、F8、F9、ATP7B、CYP21A2、GAA和PKHD1。获得序列后,可用于进一步序列变异检测,确定 变异类型利于检测或者辅助检测上述疾病。
[0006] 本发明的另一方面还提供了一种检测CNV的方法,该方法包括:A.对待测样本进 行目标区域捕获,对所述目标区域进行测序,获得测序数据;B.将所述测序数据与参考序 列进行比对,获得比对结果;C.设定滑动长度L1和窗口大小L2对所述目标区域进行切分, 获得多个窗口,基于所述比对结果,计算每个窗口的测序深度,依据所述每个窗口所在的窗 口大小和/或所在的滑动长度区域大小确定每个窗口的平均测序深度,所述多个窗口的长 度总和覆盖所述目标区域的一部分、全部的一次或者全部的多次,所述每个窗口的测序深 度为比对上该窗口的测序数据的量与该窗口大小的比值;D.判断所述窗口与对照样本的 相应窗口的平均测序深度的差异程度,差异显著则判定存在所述CNV ;其中,A是利用本发 明一方面提供的组合物进行的,L1和L2为自然数,L1和L2为定值或者为变化数值。
[0007] 本发明又一方面提供了一种同时检测多种基因变异的方法,所述多种基因变异包 括点突变、CNV和倒位中的至少两种,该方法包括:(i)对待测样本进行目标区域捕获,对所 述目标区域进行测序,获得测序数据;(ii)基于(i)中的测序数据,同时检测多种基因变异 检测;其中,(i)的进行利用了本发明一方面的组合物。
[0008] 本发明的又一方面还提供了一种检测CNV的装置,该装置包括:A1.测序单元,用 于对待测样本进行目标区域捕获,对所述目标区域进行测序,获得测序数据,所述测序是利 用本发明一方面的组合物进行的;B1.比对单元,与所述测序单元连接,用于将所述测序数 据与参考序列进行比对,获得比对结果;C1.窗口平均测序深度确定单元,与所述比对单元 连接,用于设定滑动长度L1和窗口大小L2对所述目标区域进行切分,获得多个窗口,基于 所述比对结果,计算每个窗口的测序深度,依据所述每个窗口所在的窗口大小和/或所在 的滑动长度区域大小确定每个窗口的平均测序深度,所述多个窗口的长度总和覆盖所述目 标区域的一部分、全部的一次或者全部的多次,所述每个窗口的测序深度为比对上该窗口 的测序数据的量与该窗口大小的比值;D1.CNV判定单元,与所述窗口平均测序单元相连, 用于判断所述窗口与对照样本的相应窗口的平均测序深度的差异程度,差异显著则判定存 在所述CNV。该装置能够用以执行本发明一方面提供的CNV检测方法的部分或所有步骤。
[0009] 本发明的再一方面还提供了一种同时检测多种基因变异的装置,所述多种基因变 异包括点突变、CNV和倒位中的至少两种,所述装置包括:A2.测序单元,用于对待测样本进 行目标区域捕获,对所述目标区域进行测序,获得测序数据,所述测序的进行利用了本发明 一方面提供的组合物;B2.多种变异同时检测单元,与所述测序单元相连,用于基于A2中的 测序数据,同时检测多种基因变异检测。该装置能够用以执行本发明一方面提供的同时检 测多种基因变异的方法的部分或所有步骤。
[0010] 利用本发明的组合物、方法和/或装置,能够准确检出点突变,也能很好的检出外 显子缺失和/或重复(CNV)。利用本发明的组合物,利用基于候选基因的序列信息设计探 针,将捕获富集获得的DNA片段进行测序,利用本发明的方法和/或装置,能够获得候选基 因点突变、CNV以及倒位信息。利用本发明开发的方法和/或装置,能够低费用、操作方便 地覆盖多种疾病基因和对各种突变类型进行检测,通过设计开发的检测芯片和信息分析流 程,基于目标区域捕获技术结合高通量测序技术,能够对表型正常、无遗传病家族史的健康 育龄夫妇,一次性检测或者辅助检测15个常见致病基因,筛查或辅助筛查12种我国高发 严重遗传病,包括地中海贫血(α、β /HBA1、HBA2、HBB),遗传性耳聋(GJB2、SLC26A4),脊 髓性肌肉萎缩症(SMN1),苯丙尿酮症(ΡΑΗ),糖原累积病II型(GAA),半乳糖血症(GALT), 甲型血友病(F8),乙型血友病(F9),肝豆状核变性(ATP7B),先天性肾上腺皮质增生症 (CYP21A2),进行性假肥大性肌营养不良(DMD)和常染色体隐性多囊肾(PKHD1),确定夫妻 双方以上致病基因的携带情况,评估后代的患病风险,达到降低出生缺陷、科学指导优生优 育、提高人口出生质量的目的,能够实现准确、高效进行孕前遗传检测。能够根据各地单基 因疾病发病趋势进行因地制宜的优化并将此模式推广至全国甚至全球,推进生育医学领域 的科学技术发展与产业进步。本发明的组合物、方法和/或装置,能够提供一种针对大众的 孕前基因筛查方法,可以一次性筛查12种我国高发的隐性遗传病,筛查基因的突变类型全 面而准确。能够利用目标区域捕获结合高通量测序,通过变异信息分析方法,同时检测候选 基因的点突变和CNV,方便快捷,准确度高。
【附图说明】
[0011] 本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将 变得明显和容易理解,其中:
[0012] 图1是本发明的一个【具体实施方式】中的实验流程图;
[0013] 图2是本发明的一个【具体实施方式】中的信息分析流程图;
[0014] 图3是本发明的一个【具体实施方式】中的CNV检测原理图;
[0015] 图4是本发明的一个【具体实施方式】中的的F8的22号内含子倒位检测结果;
[0016] 图5是本发明的一个【具体实施方式】中的的F8的1号内含子倒位检测结果。
【具体实施方式】
[0017] 根据本发明的一个实施方式,提供了一个组合物,该组合物包含探针,所述探针固 定在固相载体上或者游离于溶液中,所述探针至少能够覆盖以下15个基因中的5个基因的 每个基因区域的至少一部分:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、 ATP7B、CYP21A2、GAA和PKHD1。这15个基因,与12种我国高发遗传病相关,包括地中海贫 血(α、β /HBA1、HBA2、HBB),遗传性耳聋(GJB2、SLC26A4),脊髓性肌肉萎缩症(SMN1),丙 尿酮症(ΡΑΗ),糖原累积病II型(GAA),半乳糖血症(GALT),甲型血友病(F8),乙型血友病 (F9),肝豆状核变性(ATP7B),先天性肾上腺皮质增生症(CYP21A2),进行性假肥大性肌营 养不良(DMD),常染色体隐性多囊肾(PKHD1)。至少一部分,比如所包含的基因的外显子区 域、和/或基因与外显子相连的上下游30bp的内含子区域,和/或全基因区域,利于后续与 该基因相关的单核苷酸突变、结构变异以及剪切突变的检测。
[0018] 在本发明的一个【具体实施方式】中,所述探针至少能够覆盖上述15个基因中的10 个基因的每个基因区域的至少一部分。在本发明的一个【具体实施方式】中,所述探针能够覆 盖上述15个基因中的每个基因区域的至少一部分。至少一部分,比如各基因的外显子区 域、和/或基因与外显子相连的上下游30bp的内含子区域,和/或全基因区域,利于后续与 该基因相关的单核苷酸突变、结构变异以及剪切突变的检测。
[0019] 在本发明的一个【具体实施方式】中,所述探针的设计是依据预覆盖区域在参考基 因组上的起始和终止位置,从位置的一端开始,在所述参考基因组上依次截取预定序列长 度直至所述位置的另一端,所述预定序列长度的长度总和至少为所述预覆盖区域大小的1 倍,所述预覆盖区域选自所述15个基因中至少5个基因的每个基因区域的至少一部分,所 述预定序列长度为50~250nt,所述预定序列长度即为预定探针长度。在本发明的一个具 体实施方式中,预定探针长度的总和为目标区域(预覆盖区域)大小的5倍,即设计的每条 探针大多至少有5个拷贝,各区域探针的拷贝数可根据目标区域序列碱基组成及对目标区 域中的部分或全部的捕获需求调整。
[0020] 在本发明的一个【具体实施方式】中,该组合物中的探针能够覆盖的区域包括: chrl6:59501-60501, chrl6:84266-84414, chr16:84536-84781, chrl6:84831-85101, chrl6:93451-94030, chrl6:97141-97648, chrl6:101131-101752, chrl6:103124-104124, chrl6:131785-131980, chr 1 6:163436-163820, chr 1 6:17230 1-17330 1, chrl6:188799-189799, chr16:193176-194176 , chr16:195937-196208 , chrl6:197099-201899, chr 1 6:201949-203073, chr 1 6:203090-203162, chrl6:203 170-203270, chr 1 6:203799-206016, chr 1 6:206540-207072, chrl6:207565-209099, chr 1 6:2091 10-209857 , chr16:209909-210084 , chrl6:210715-210790, chr16:2 10835-2 1 1 7 1 3 , chr16:21 1845-2 1 1 9 1 0 , chrl6:212174-221360, chr16:221499-224753 , chr16:225065-2339 1 0 , chrl6:234200-236401, chr16:237220-237735 , chr16:237800-239636 , chrl6:242780-243149, chr16:254625-255 1 99 , chr16:258005-258928 , chr 16:303840-304852, chr16:313300-314300 , chr 13:52506776-52508891, chrl3:52508892-52509195, chr13:52509699-52509861, chr13:52511382-52511559, chr13:52511582-52511845, chr 13 : 52513157-52513359, chr13:52515187-52515390, chrl3:52516492-52516720, chrl3:52518215-52518457, chrl3:52520390-52520644, chr 13:52523768-52523962, chr 13:52524113-52524327, chr 13:52524378-52524565, chrl3:52531622-52531773, chrl3:52532417-52532710, chrl3:52534156-52534157, chrl3:52534254-52534488, chr13:52535943-52536079, chr13:52538978-52539199, chr13:52542550-52542773, chrl3:52544598-52544915, chr13:52548041-52549334, chrl3:52585393-52585473, chr 13:52585474-52585660 , chr11:47599-48599, chrl 1 :67836-68836, chr 1 1 :9566 1-9666 1, chr 1 1 : 10 2 6 5 8- 103658, chrll:5133611-5135542, chrl1:5151625-5154197, chrl1:5161020-5162526, chrl1:5165060-5166060, chrl1:5167335-5168901, chrl1:5169775-5171446, chrll:5173950-5174950, chr11:5179167-5180167 , chrl1:5180196-5181196, chrll:5187425-5187801, chrl1:5190647-5194526, chrl1:5194530-5197746, chrll: 5198220-5200664, chrll:5207460-5209762, chrll:5215188-5216188, chrll:5217440-5218440, chrll:5218705-5219705, chrll:5220930-5223803, chrll:5223825-5224976, chrll:5227490-5229196, chrll:5230655-5232014, chrll:5233456-5234456, chrll:5235175-5236175, chrll:5236680-5238663, chrll:5239076-5240500, chrll:5240607-5241607, chrll:5243655-5249785, chrll:5249788-5251275, chrll:5252088-5253088, chrll:5253894-5256137, chrll: 5256268-5257393, chrll:5257616-5260578, chrll:5261109-5262109, chrll:5263479-5264479, chrll:5264956-5266333, chrll:5266863-5268837, chrll:5269306-5272017, chrll:5272027-5273936, chrll:5274421-5276011, chrll:5276020-5276313, chrll:5277190-5281370, chrll:5289580-5292060, chrll:5296973-5297773, chrll:5300302-5301302, chrll:5301646-5302822, chrll:5305045-5309165, chrll:5316550-5319380, chrll:5331720-5334343, chrll:5340085-5341085,chrll:5342735-5347056, chrll:5349993-5350993, chrll:5354065-5357231, chr13:20766920-20766921, chr6:31947356-31948352, chr6:31973287-31974926,chr6:31975247-31975249,chr6:31975263-31976013, chr6:31976102-31976233, chr6:31976572-31976708, chr6:31978697-31978852, chr6:31979037-31979174, chr6:31980912-31981045, chr6:31981442-31981762, chr6:31983786-31987153,chr6:31988701-3199002
再多了解一些
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1