组合物及其在序列测定和变异检测中的用图_6

文档序号:9682210阅读:来源:国知局
103246563-103246758, chrl2: 103248884-103249140, chrl2: 103260344-103260471, chrl2: 103271210-103271358, chrl2: 103288483-103288726, chrl2: 103306539-103306706, chrl2:103310819-103310908, chrl2:103310909-103311411, chr6:51480115-51483878, chr6:51483879-51484348,chr6:51491765-51491944, chr6:51497314-51497316, chr6:51497333-51497551,chr6:51503617-51503784, chr6:51503824-51503825, chr6:51512799-51512946,chr6:51513500-51513501,chr6:51513853-51514048, chr6:51523720-51524797,chr6:51609153-51609370,chr6:51611343-51611344, chr6:51611489-51611717,chr6:51612514-51612515,chr6:51612555-51613493, chr6:51617969-51618182,chr6:51618696-51618697,chr6:51619443-51619444, chr6:51619529-51619530,chr6:51619537-51619538,chr6:51619552-51619766, chr6:51637470-51637617,chr6:51640576-51640749,chr6:51640750-51640751, chr6:51640786-51640787,chr6:51655962-51655963,chr6:51656004-51656201, chr6:51695629-51695817, chr6:51701089-51701090, chr6:51701100-51701101, chr6:51701164-51701165,chr6:51701172-51701297, chr6:51701330-51701331, chr6:51712543-51712798,chr6:51720661-51720898,chr6:51732597-51732598, chr6:51732617-51732618, chr6:51732627-51732628, chr6:51732631-51732937, chr6:51735272-51735467,chr6:51747237-51747238,chr6:51747861-51748055, chr6:51750562-51750563, chr6:51750635-51750800, chr6:51751388-51751389, chr6:51751901-51752073, chr6:51768351-51768352, chr6:51768360-51768361, chr6:51768365-51768555, chr6:51768754-51768870, chr6:51770983-51771168, chr6:51774051-51774302,chr6:51776567-51776784, chr6:51776917-51776918, chr6:51777134-51777404, chr6:51798878-51799150, chr6:51824638-51824854, chr6:51875077-51875287, chr6:51875298-51875299, chr6:51882178-51882457, chr6:51887569-51887772, chr6:51889342-51891009, chr6:51891010-51891011, chr6:51892597-51892724, chr6:51892924-51893179, chr6:51897798-51897993, chr6:51900359-51900549,chr6:51907627-51907962,chr6:51908393-51908558, chr6:51908909-51908910,chr6:51909524-51909525,chr6:51909734-51909916, chr6:51910772-51911016,chr6:51911406-51911407,chr6:51912915-51912916, chr6:5191322卜51913222,chr6:51913236-51913237,chr6:51913239-51913240, chr6:51913247-51913248,chr6:51913252-51913253,chr6:51913260-51913447, chr6:51913451-51913452,chr6:51914897-51914898,chr6:51914925-51915123, chr6:51917844-51918079,chr6:51918531-51918532,chr6:51918806-51918993, chr6:51920355-51920557, chr6:51920558-51920560, chr6:51920885-51920886, chr6:51921466-51921616,chr6:51921658-51921807, chr6:51923091-51923429, chr6:51924562-51924563, chr6:51924696-51924870, chr6:51924885-51924886, chr6:51927287-51927488,chr6:51927665-51927666,chr6:51929723-51929878, chr6:51930436-51930437,chr6:51930744-51930905,chr6:51934225-51934355, chr6:51934394-51934395,chr6:51934732-51934733,chr6:51934975-51934976, chr6:51934977-51934978,chr6:51935060-51935061,chr6:51935174-51935273,chr6:51935702-51935703,chr6:51935746-51935747,chr6:51935774-51935898, chr6:51936257-51936258, chr6:51936505-51936506,chr6:51936558-51936559, chr6:51936716-51936717, chr6:51936883-51937017, chr6:51937026-51937027, chr6:51937470-51937471,chr6:51937752-51937753,chr6:51937976-51937977, chr6:51938066-51938067, chr6:51938209-51938210, chr6:51938231-51938369, chr6:51938416-51938417,chr6:51941044-51941161,chr6:51944668-51944836, chr6:51944846-51944847,chr6:51947160-51947370,chr6:51947946-51948083, chr6:51948471-51948472,chr6:51948574-51948575,chr6:51949650-51949731, chr6:51949732-51949845,chr6:51949861-51949862,chr6:51952202-51952453, chr7:107301050-107301330, chr7:107302054-107302086, chr7:107302087-107302280, chr7:107303711-107303910, chr7:107312553-107312723, chr7:107314579-107314823, chr7:107315360-107315584, chr7:107323617-107323829, chr7:107323870-107324012, chr7:107329468-107329675, chr7:107330539-107330712, chr7:107334818-107334955, chr7:107335036-107335191,chr7:107336348-107336514, chr7:107338457-107338586, chr7:107340498-107340650, chr7:107341516-107341671,chr7:107342242-107342532, chr7:107344746-107344860, chr7:107350469-107350674, chr7:107352954-107353097, chr7:107355838-107355891, chr7:107355892-107358282, chr5:70220738-70248868, chr5:70255752-70255888和chr5:70305353-70306150。4. 权利要求1或2的组合物,其特征在于,还包括如SEQIDNO:1-15和SEQIDNO: 22-23所示的序列; 任选地,组合物还包括如SEQIDNO:16-21所示的序列。5. 权利要求1-4任一组合物在测定以下15个基因中的至少5个基因的每个基因序 列的至少一部分中的用途:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、 ATP7B、CYP21A2、GAA和PKHD1。6. 检测CNV的方法,包括: A. 对待测样本进行目标区域捕获,对所述目标区域进行测序,获得测序数据,所述测序 数据由多个读段组成; B. 将所述测序数据与参考序列进行比对,获得比对结果; C. 设定滑动长度L1和窗口大小L2对所述目标区域进行切分,获得多个窗口,基于所述 比对结果,计算每个窗口的测序深度,依据所述每个窗口所在的窗口大小和/或所在的滑 动长度区域大小确定每个窗口的平均测序深度,所述多个窗口的长度总和覆盖所述目标区 域的一部分、全部的一次或者全部的多次,所述每个窗口的测序深度为比对上该窗口的读 段与该窗口大小的比值; D. 判断所述窗口与对照样本的相应窗口的平均测序深度的差异程度,差异显著则判定 存在所述CNV;其中, A是利用权利要求1-4任一组合物进行的,L1和L2为自然数,L1和L2为定值或者为 变化数值。7. 权利要求6的方法,其特征在于,还包括预先或者同时对至少一个对照样本进行A-C 处理。8. 权利要求6或7的方法,其特征在于,C中的每个窗口的平均测序深度的确定,包括: C1.当L1>L2,所述每个窗口的平均测序深度为所述窗口的测序深度以及与其相邻的 非窗口区域的测序深度的平均值; C2.当L1〈L2,所述每个窗口的平均测序深度为从所述窗口的一端开始依次滑动L1长 的区域至所述窗口的另一端所包含的所有L1大小的区域的测序深度的平均值; C3.当LI=L2,所述每个窗口的平均测序深度为包含所述窗口在内的、与所述窗口的 一个末端相连的数个连续窗口的各连续窗口的测序深度的平均值。9. 权利要求6或7的方法,其特征在于,还包括对C中的每个窗口的平均测序深度进行 修正,所述修正包括基于全基因组重复序列的修正,和/或基于GC含量的修正,和/或基于 染色体深度的修正。10. 权利要求9的方法,其特征在于,所述基于全基因组重复序列的修正包括, (1) 设定数值K,统计参考序列上从第i碱基开始的K个碱基长度的序列在整个参考序 列上的出现次数; (2) 去除(1)中的在所述参考序列上出现大于一次的所述Kbp序列,获得修正的参考 序列; (3) 以(2)中的修正的参考序列代替B中的参考序列,进行B-C,获得所述每个窗口基 于全基因组重复序列修正后的平均测序深度; 其中,i为参考序列的碱基编号,K为自然数,A中的测序数据中的读段的长〉K>A中的 测序数据中的读段的长/2。11. 权利要求9的方法,其特征在于,所述基于GC含量的修正是利用已建立的GC比例 和测序深度的关系进行的,所述GC比例和测序深度关系的建立包括, 对多个样本进行目标区域捕获,对所述目标区域进行测序,获得多个样本的测序数 据; 将所述多个样本的测序数据与参考序列进行比对,获得多个样本的比对结果; 分别划分所述多个样本的目标区域,使得每个样本的目标区域包含相同的窗口,基于 所述比对结果,计算各个样本的每个窗口的测序深度,获得所述每个窗口测序深度的平均 值; 划分所述参考序列,以使所述参考序列包含与所述目标区域相同的窗口,确定每个窗 口中GC喊基所占的比例; 基于所述每个窗口测序深度的平均值和该窗口的GC碱基比例,建立所述GC比例和测 序深度的关系。12. 权利要求9的方法,其特征在于,所述基于染色体拷贝数的修正,包括: 利用多个样本间的每个染色体测序深度的一致性确定染色体的真实拷贝数,若出现有 非2拷贝的染色体,或者男性的非2拷贝的X和Y,修正该染色体拷贝数为其真实值。13. 权利要求6或7的方法,其特征在于,D中CNV的判定还包括: 依据B中的比对结果中的有固定距离关系的成对的读段在参考序列上的距离,确定所 述CNV的类型,以L表示一对成对读段中的两个读段的固定距离,以L'表示该对成对读段 中的两个读段在参考序列上的距离, 当L' >L,则判定所述CNV是缺失类型, 当L' <L,则判定所述CNV为插入类型;其中, 所述有固定距离关系的成对读段来自一个测序文库的两端,所述测序文库的构建包含 于A中的测序。14. 权利要求13的方法,其特征在于,D中CNV的判定还包括: 依据B中的比对结果中的不完全比对到参考序列上的读段,确定所述CNV的精确位置 和大小。15. 权利要求14的方法,其特征在于,确定所述CNV的精确位置和大小包括: 截取所述比对结果中的不完全比对到参考序列上的读段的不能比对上的部分,将截取 的部分定义为一个割裂片段; 将割裂片段比对到参考序列,获得割裂片段在参考序列上的位置; 基于割裂片段在参考序列上的位置和该割裂片段所属读段在参考序列上的位置、以及 所述两个位置在参考序列上的距离,确定所述CNV的精确位置和大小。16. 同时检测多种基因变异的方法,所述多种基因变异包括点突变、CNV和倒位中的至 少两种,所述方法包括: (i) 对待测样本进行目标区域捕获,对所述目标区域进行测序,获得测序数据; (ii) 基于⑴中的测序数据,同时检测多种基因变异检测;其中, (i)的进行利用了权利要求1-4任一组合物。17. 检测CNV的装置,其特征在于,所述装置包括: A1.测序单元,用于对待测样本进行目标区域捕获,对所述目标区域进行测序,获得测 序数据,所述测序是利用权利要求1-6任一组合物进行的; B1.比对单元,与所述测序单元连接,用于将所述测序数据与参考序列进行比对,获得 比对结果; C1.窗口平均测序深度确定单元,与所述比对单元连接,用于设定滑动长度L1和窗口 大小L2对所述目标区域进行切分,获得多个窗口,基于所述比对结果,计算每个窗口的测 序深度,依据所述每个窗口所在的窗口大小和/或所在的滑动长度区域大小确定每个窗口 的平均测序深度,所述多个窗口的长度总和覆盖所述目标区域的一部分、全部的一次或者 全部的多次,所述每个窗口的测序深度为比对上该窗口的测序数据的量与该窗口大小的比 值; Dl.CNV判定单元,与所述窗口平均测序单元相连,用于判断所述窗口与对照样本的相 应窗口的平均测序深度的差异程度,差异显著则判定存在所述CNV。18. 同时检测多种基因变异的装置,所述多种基因变异包括点突变、CNV和倒位中的至 少两种,所述装置包括: A2.测序单元,用于对待测样本进行目标区域捕获,对所述目标区域进行测序,获得测 序数据,所述测序的进行利用了权利要求1-4任一组合物; B2.多种变异同时检测单元,与所述测序单元相连,用于基于A2中的测序数据,同时检 测多种基因变异检测。
【专利摘要】本发明提供了一包含探针的组合物、该组合物的用途、CNV变异检测方法以及同时进行多种变异检测的方法以及用以执行各方法全部或部分步骤的装置。所提供的组合物包含探针,探针固定在固相载体上或者游离于溶液中,所说的探针至少能够覆盖以下15个基因中的5个基因的每个基因区域的至少一部分:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、CYP21A2、GAA和PKHD1。该组合物能够用于这15个基因的全部或部分序列的测定,以及基于获得的测定序列进行变异分析,分析变异利于检测或者辅助检测12种我国高发遗传病。
【IPC分类】C12M1/34, C12N15/11, C12Q1/68
【公开号】CN105441432
【申请号】CN201410452745
【发明人】黎琴, 易玉婷, 袁媛, 刘涛, 曹飞, 吴仁花, 阿叁, 杨玲, 易鑫
【申请人】天津华大基因科技有限公司, 深圳华大基因医学有限公司
【公开日】2016年3月30日
【申请日】2014年9月5日
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1