用于核酸分析的组合物和方法与流程

文档序号:34607936发布日期:2023-06-29 04:18阅读:44来源:国知局
用于核酸分析的组合物和方法与流程


背景技术:


技术实现思路

1、在各种实施方案中,方法包括:提供正向多核苷酸和同源多核苷酸(cognatepolynucleotide);使用测序确定所述正向多核苷酸的基因座处的第一碱基的第一身份和所述同源多核苷酸的相应基因座处或近侧的第二碱基的第二身份;以及使用包括处理器、存储器和存储在其上的指令的计算机,当执行所述指令时,至少部分地基于所述第一碱基的第一身份和所述第二碱基的第二身份,确定与所述正向多核苷酸的所述基因座对应的原始多核苷酸的基因座处的真实碱基的值。在一些情况下,所述第二碱基位于所述同源多核苷酸的所述相应基因座处。在一些情况下,所述第二碱基在所述同源多核苷酸的所述相应基因座近侧。在一些情况下,所述正向多核苷酸和所述同源多核苷酸相连接。在所述方法的一些实施方案中,在所述测序前的任何时间点,所述正向多核苷酸和所述同源多核苷酸(i)经由发夹共价连接;(ii)通过沃森-克里克碱基配对连接成双链多核苷酸;(iii)各自偶联到条形码;或(iv)它们的任意组合。在一些情况下,所述正向多核苷酸包括互补脱氧核糖核酸(cdna)分子或其扩增子。在一些情况下,所述方法还包括使rna核苷酸与逆转录酶、其生物活性片段或其衍生物接触,以产生所述正向多核苷酸。在一些情况下,所述原始多核苷酸包括从对象获得的样品中分离的脱氧核糖核酸(dna)多核苷酸。在一些情况下,所述原始多核苷酸包括无细胞dna(cfdna)多核苷酸。在一些情况下,所述正向多核苷酸为所述原始多核苷酸或其一部分。在一些情况下,所述正向多核苷酸为所述原始多核苷酸的扩增子拷贝。如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为以下组合中的任一者,则所述真实碱基的所述值被确定为误判:腺嘌呤和腺嘌呤、腺嘌呤和胞嘧啶、腺嘌呤和鸟嘌呤、胞嘧啶和腺嘌呤、胞嘧啶和胞嘧啶、胞嘧啶和胸腺嘧啶、鸟嘌呤和腺嘌呤、鸟嘌呤和鸟嘌呤、鸟嘌呤和胸腺嘧啶、胸腺嘧啶和胞嘧啶、胸腺嘧啶和鸟嘌呤或胸腺嘧啶和胸腺嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为腺嘌呤和胸腺嘧啶,则所述真实碱基的值为腺嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤,则所述真实碱基的值为胞嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为鸟嘌呤和胞嘧啶,则所述真实碱基的值为鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和腺嘌呤,则所述真实碱基的值为胸腺嘧啶。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/100。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/1000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/10000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/100000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/1000000。在一些情况下,确定所述第二碱基的第二身份包括对读段多核苷酸进行测序,其中所述读段多核苷酸为所述同源多核苷酸的同源扩增子。在一些情况下,在将所述测序期间产生的数据与参考核酸序列进行比对之前,确定所述真实碱基的所述值。在一些情况下,以至少90%的灵敏度,使用不超过450倍、不超过500倍、不超过700倍或不超过1000倍的基因座覆盖范围,在所述原始多核苷酸的所述基因座处检测包括对象的群体中频率不超过0.1%的突变,从所述对象获得所述样品。在一些情况下,所述方法还包括通过对所述原始多核苷酸或其衍生物进行一种或多种化学反应或酶促反应来产生所述正向多核苷酸和所述同源多核苷酸。在一些情况下,所述方法还包括通过进行脱氨基反应产生所述正向多核苷酸和所述同源多核苷酸。在一些情况下,所述脱氨基反应用脱氨酶进行。在一些情况下,脱氨酶为apobec或其片段。在一些情况下,脱氨基反应在解旋酶或其片段的存在下进行。

2、在各种实施方案中,方法包括:(a)提供正向多核苷酸和同源多核苷酸;(b)使所述正向多核苷酸和任选的所述同源多核苷酸与亚硫酸氢盐接触;(c)使用测序确定所述正向多核苷酸的基因座处的第一碱基的第一身份和所述同源多核苷酸的相应基因座处或近侧的第二碱基的第二身份;以及(d)使用包括处理器、存储器和存储在其上的指令的计算机,当执行所述指令时,至少部分地基于所述第一碱基的所述身份和所述第二碱基的所述身份,确定与所述正向多核苷酸的所述基因座对应的原始多核苷酸的基因座处的真实碱基的值。在一些情况下,所述第二碱基位于所述同源多核苷酸的所述相应基因座处。在一些情况下,所述第二碱基在所述同源多核苷酸的所述相应基因座近侧。在一些情况下,所述方法还包括使所述正向多核苷酸和所述同源多核苷酸与具有dna甲基转移酶活性的实体接触。在一些情况下,所述使所述正向多核苷酸和所述同源多核苷酸与所述具有dna甲基转移酶活性的实体接触是在使所述正向多核苷酸和任选的所述同源多核苷酸与亚硫酸氢盐接触之前进行。在一些情况下,所述具有dna甲基转移酶活性的实体为dna(胞嘧啶-5)-甲基转移酶1(dnmt1)或dnmt5。在一些情况下,所述正向多核苷酸包括5-甲基胞嘧啶、5-羟甲基胞嘧啶或两者。在一些情况下,所述正向多核苷酸和所述同源多核苷酸通过沃森-克里克碱基配对相连接。在一些情况下,所述正向多核苷酸和所述同源多核苷酸进一步通过发夹、条形码或两者连接。在一些情况下,在与所述具有dna甲基转移酶活性的实体接触之后,所述同源多核苷酸任选地还包括5-甲基胞嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为以下组合中的任一者,则所述真实碱基的所述值被确定为误判:腺嘌呤和腺嘌呤、腺嘌呤和胞嘧啶、腺嘌呤和鸟嘌呤、胞嘧啶和腺嘌呤、胞嘧啶和胞嘧啶、胞嘧啶和胸腺嘧啶、鸟嘌呤和腺嘌呤、鸟嘌呤和鸟嘌呤、鸟嘌呤和胞嘧啶、胸腺嘧啶和胞嘧啶或胸腺嘧啶和胸腺嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为腺嘌呤和胸腺嘧啶,则所述真实碱基的所述值为腺嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和鸟嘌呤,则所述真实碱基的所述值为胞嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为鸟嘌呤和胸腺嘧啶,则所述真实碱基的所述值为鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和腺嘌呤,则所述真实碱基的所述值为胸腺嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤,则所述真实碱基的所述值为甲基化胞嘧啶。在一些情况下,在将所述测序期间产生的数据与参考核酸序列进行比对之前,确定所述真实碱基的所述值。在一些情况下,所述方法还包括使用所述正向多核苷酸和所述同源多核苷酸进行化学或酶促反应。

3、在各种实施方案中,方法包括:(a)提供正向多核苷酸和同源多核苷酸;(b)使所述正向多核苷酸和任选的所述同源多核苷酸与氧化剂接触;(c)使用测序确定所述正向多核苷酸的基因座处的第一碱基的第一身份和所述同源多核苷酸的相应基因座处或近侧的第二碱基的第二身份;以及(d)使用包括处理器、存储器和存储在其上的指令的计算机,当执行所述指令时,至少部分地基于所述第一碱基的所述身份和所述第二碱基的所述身份,确定与所述正向多核苷酸的所述基因座对应的原始多核苷酸的基因座处的真实碱基的值。在一些情况下,所述第二碱基位于所述同源多核苷酸的所述相应基因座处。在一些情况下,所述第二碱基在所述同源多核苷酸的所述相应基因座近侧。在一些情况下,所述氧化剂为金属氧化物。在一些情况下,所述氧化剂为钌酸盐。在一些情况下,所述氧化剂为钌酸钾。在一些情况下,所述氧化剂为甲基胞嘧啶双加氧酶。在一些情况下,所述正向多核苷酸包括5-甲基胞嘧啶、5-羟甲基胞嘧啶或两者。在一些情况下,所述正向多核苷酸和所述同源多核苷酸通过沃森-克里克碱基配对相连接。在一些情况下,所述正向多核苷酸和所述同源多核苷酸进一步通过发夹、条形码或两者连接。在一些情况下,方法还包括使所述正向多核苷酸和所述同源多核苷酸与具有dna甲基转移酶活性的实体接触。在一些情况下,所述具有dna甲基转移酶活性的实体选自dna(胞嘧啶-5)-甲基转移酶1(dnmt1)或dna(胞嘧啶-5)-甲基转移酶5(dnmt5)。在一些情况下,所述方法包括使所述正向多核苷酸和所述同源多核苷酸与具有dna甲基转移酶活性的实体接触是在使所述正向多核苷酸和任选的所述同源多核苷酸与所述氧化剂接触之后进行。在一些情况下,所述方法还包括使所述正向多核苷酸和任选的所述同源多核苷酸与脱氨剂接触。在一些情况下,所述脱氨剂为脱氨酶。在一些情况下,所述脱氨酶为apobec或其片段。在一些情况下,所述方法还包括使所述正向多核苷酸和任选的所述同源多核苷酸与解旋酶接触。在一些情况下,所述脱氨剂是亚硫酸氢盐。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为以下组合中的任一者,则所述真实碱基的所述值被确定为误判:腺嘌呤和腺嘌呤、腺嘌呤和胞嘧啶、腺嘌呤和鸟嘌呤、胞嘧啶和腺嘌呤、胞嘧啶和胞嘧啶、胞嘧啶和胸腺嘧啶、鸟嘌呤和腺嘌呤、鸟嘌呤和鸟嘌呤、鸟嘌呤和胞嘧啶、胸腺嘧啶和胞嘧啶或胸腺嘧啶和胸腺嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为腺嘌呤和胸腺嘧啶,则所述真实碱基的所述值为腺嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和鸟嘌呤,则所述真实碱基的所述值为胞嘧啶或5-羟甲基胞嘧啶(5hmc)。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为鸟嘌呤和胸腺嘧啶,则所述真实碱基的所述值为鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和腺嘌呤,则所述真实碱基的值为胸腺嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤,则所述真实碱基的值为5-甲基胞嘧啶(5mc)。在一些情况下,在将所述测序期间产生的数据与参考核酸序列进行比对之前,确定所述真实碱基的所述值。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/100。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/1000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/10000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/100000。在一些情况下,用于确定所述原始多核苷酸的基因座处的真实碱基身份的假阳性率不高于1/1000000。在一些情况下,所述方法包括通过对所述原始多核苷酸或其衍生物进行一种或多种化学反应或酶促反应来产生所述正向多核苷酸和所述同源多核苷酸。

4、在各种实施方案中,方法包括:(a)提供正向多核苷酸和同源多核苷酸;(b)使所述正向多核苷酸和任选的所述同源多核苷酸与特异性葡糖基化5-羟甲基胞嘧啶(5hmc)的药剂接触;(c)使用测序确定所述正向多核苷酸的基因座处的第一碱基的第一身份和所述同源多核苷酸的相应基因座处或近侧的第二碱基的第二身份;以及(d)使用包括处理器、存储器和存储在其上的指令的计算机,当执行所述指令时,至少部分地基于所述第一碱基的所述身份和所述第二碱基的所述身份,确定与所述正向多核苷酸的所述基因座对应的原始多核苷酸的基因座处的真实碱基的值。在一些情况下,所述第二碱基位于所述同源多核苷酸的所述相应基因座处。在一些情况下,所述第二碱基在所述同源多核苷酸的所述相应基因座近侧。在一些情况下,所述方法还包括使所述正向多核苷酸和所述同源多核苷酸与具有dna甲基转移酶活性的实体接触。在一些情况下,所述具有dna甲基转移酶活性的实体选自dna(胞嘧啶-5)-甲基转移酶1(dnmt1)或dna(胞嘧啶-5)-甲基转移酶5(dnmt5)。在一些情况下,所述使所述正向多核苷酸和所述同源多核苷酸与所述具有dna甲基转移酶活性的实体接触是在使所述正向多核苷酸和任选的所述同源多核苷酸与所述特异性葡糖基化5-羟甲基胞嘧啶(5hmc)的药剂接触之后进行。在一些情况下,所述方法还包括使所述正向多核苷酸和任选的所述同源多核苷酸与脱氨剂接触。在一些情况下,所述脱氨剂为脱氨酶。在一些情况下,所述脱氨剂为apobec或其片段。在一些情况下,所述方法还包括使所述正向多核苷酸和任选的所述同源多核苷酸与解旋酶接触。在一些情况下,所述脱氨剂为亚硫酸氢盐。在一些情况下,所述方法还包括使所述正向多核苷酸和任选的所述同源多核苷酸与氧化剂接触。在一些情况下,所述氧化剂为甲基胞嘧啶双加氧酶。在一些情况下,所述甲基胞嘧啶双加氧酶为十-十一易位(tet)酶或其衍生物。在一些情况下,所述使所述正向多核苷酸和任选的所述同源多核苷酸与所述氧化剂接触是在使所述正向多核苷酸和所述同源多核苷酸与所述具有dna甲基转移酶活性的实体接触之后进行。在一些情况下,所述具有dna甲基转移酶活性的实体选自dna(胞嘧啶-5)-甲基转移酶1(dnmt1)或dna(胞嘧啶-5)-甲基转移酶5(dnmt5)。在一些情况下,所述方法还包括使所述正向多核苷酸和所述同源多核苷酸与所述特异性葡糖基化5-羟甲基胞嘧啶(5hmc)的所述药剂接触。在一些情况下,所述特异性葡糖基化5hmc的药剂为β-葡糖基转移酶。在一些情况下,所述使所述正向多核苷酸和所述同源多核苷酸与所述特异性葡糖基化5hmc的所述药剂接触是在使所述正向多核苷酸和任选的所述同源多核苷酸与所述氧化剂接触之后进行。在一些情况下,所述方法还包括使所述正向多核苷酸和任选的所述同源多核苷酸与脱氨酶接触。在一些情况下,所述脱氨酶选自载脂蛋白b mrna编辑酶(apobec)、双链dna脱氨酶或它们的片段。在一些情况下,所述方法包括在所述使所述正向多核苷酸和任选的所述同源多核苷酸与apobec接触之前,对所述正向多核苷酸和所述同源多核苷酸进行处理,使得所述正向多核苷酸和所述同源多核苷酸的一个或多个基因座不连接。在一些情况下,所述处理包括将第一多核苷酸或其一部分与第二多核苷酸或其一部分分离。在一些情况下,所述分离包括使所述正向多核苷酸和所述同源多核苷酸与解旋酶接触。在一些情况下,所述处理包括使所述正向多核苷酸和所述同源多核苷酸与单链dna结合蛋白(ssb)接触。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为以下组合中的任一者,则所述真实碱基的所述值被确定为误判:分别为腺嘌呤和腺嘌呤、腺嘌呤和胞嘧啶、腺嘌呤和鸟嘌呤、胞嘧啶和腺嘌呤、胞嘧啶和胞嘧啶、胞嘧啶和胸腺嘧啶、鸟嘌呤和腺嘌呤、鸟嘌呤和鸟嘌呤、胸腺嘧啶和胞嘧啶、胸腺嘧啶和胸腺嘧啶、前面没有胞嘧啶和鸟嘌呤时的鸟嘌呤和胞嘧啶、后面没有鸟嘌呤和胞嘧啶时的胞嘧啶和鸟嘌呤、或者后面没有鸟嘌呤和胸腺嘧啶时的胞嘧啶和鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为腺嘌呤和胸腺嘧啶,则所述真实碱基的所述值为腺嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和鸟嘌呤,则所述真实碱基的所述值为胞嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为鸟嘌呤和胸腺嘧啶,则所述真实碱基的所述值为鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和腺嘌呤,则所述真实碱基的所述值为胸腺嘧啶。在一些情况下,如果在cpg背景中,所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤、接着为鸟嘌呤和胞嘧啶,则所述真实碱基的所述值为5-甲基胞嘧啶(5mc)。在一些情况下,如果在cpg背景中,所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤、后面分别为鸟嘌呤和胸腺嘧啶,则所述真实碱基的所述值为5-羟甲基胞嘧啶(5hmc)。在一些情况下,在将所述测序期间产生的数据与参考核酸序列进行比对之前,确定所述真实碱基的所述值。在一些情况下,所述方法还包括使所述正向多核苷酸和所述同源多核苷酸与还原剂接触。在一些情况下,所述还原剂为硼烷或硼烷的衍生物。在一些情况下,所述还原剂选自吡啶硼烷、2-甲基吡啶硼烷(pic-硼烷)、硼烷、乙硼烷、叔丁胺硼烷、氨硼烷、硼氢化钠(nabh4)、氰基硼氢化钠(nabh3cn)、乙二胺硼烷、二甲胺硼烷、三乙酰氧基硼氢化钠、吗啉硼烷、4-甲基吗啉硼烷、三甲胺硼烷、二环己胺硼烷或硼氢化锂(libh4)或它们的盐。在一些情况下,所述还原剂为吡啶硼烷。在一些情况下,所述还原剂包括氢化铝锂、钠汞齐、汞齐、二氧化硫、连二硫酸盐、硫代硫酸盐、碘化物、过氧化氢、肼、二异丁基氢化铝、草酸、一氧化碳、氰化物、抗坏血酸、甲酸、二硫苏糖醇、β-巯基乙醇或它们的任意组合。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为以下组合中的任一者,则所述真实碱基的所述值被确定为误判:分别为腺嘌呤和腺嘌呤、腺嘌呤和胞嘧啶、腺嘌呤和鸟嘌呤、胞嘧啶和腺嘌呤、胞嘧啶和胞嘧啶、胞嘧啶和胸腺嘧啶、鸟嘌呤和腺嘌呤、鸟嘌呤和鸟嘌呤、胸腺嘧啶和胞嘧啶、胸腺嘧啶和胸腺嘧啶、前面没有胸腺嘧啶和鸟嘌呤时的鸟嘌呤和胸腺嘧啶、后面没有鸟嘌呤和胞嘧啶时的胸腺嘧啶和鸟嘌呤、或者后面没有鸟嘌呤和胸腺嘧啶时的胸腺嘧啶和鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为腺嘌呤和胸腺嘧啶,则所述真实碱基的所述值为腺嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和鸟嘌呤,则所述真实碱基的所述值为胞嘧啶。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为鸟嘌呤和胸腺嘧啶,则所述真实碱基的所述值为鸟嘌呤。在一些情况下,如果所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胸腺嘧啶和腺嘌呤,则所述真实碱基的所述值为胸腺嘧啶。在一些情况下,如果在cpg背景中,所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤、接着为鸟嘌呤和胞嘧啶,则所述真实碱基的所述值为5-甲基胞嘧啶(5mc)。在一些情况下,如果在cpg背景中,所述第一碱基的第一身份和所述第二碱基的第二身份分别被确定为胞嘧啶和鸟嘌呤、后面分别为鸟嘌呤和胸腺嘧啶,则所述真实碱基的所述值为5-羟甲基胞嘧啶(5hmc)。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/100。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/1000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/10000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/100000。在一些情况下,用于确定所述原始多核苷酸的所述基因座处的所述真实碱基的所述身份的假阳性率不高于1/1000000。在一些情况下,所述方法还包括,在(a)之前,通过对所述原始多核苷酸或其衍生物进行一种或多种化学反应或酶促反应来产生所述正向多核苷酸和所述同源多核苷酸。在一些情况下,在所述测序前的任何时间点,所述正向多核苷酸和所述同源多核苷酸(i)经由发夹共价连接;(ii)通过沃森-克里克碱基配对连接成双链多核苷酸;(iii)各自偶联到条形码;或(iv)它们的任意组合。在一些情况下,所述方法还包括至少部分基于所述基因座处的真实碱基变体的所述值来诊断对象的病况。在一些情况下,所述病况为癌症。在一些情况下,所述癌症选自肉瘤、神经胶质瘤、腺瘤、白血病、膀胱癌、乳腺癌、结肠直肠癌、子宫内膜癌、肾癌、肝癌、肺癌、黑色素瘤、非霍奇金淋巴瘤、胰腺癌、前列腺癌、甲状腺癌。在一些情况下,所述病况为神经退行性病况。在一些情况下,所述神经退行性病况选自阿尔茨海默病、额颞叶痴呆、肌萎缩侧索硬化症、帕金森病、脊髓小脑性共济失调、脊髓性肌肉萎缩症、路易体痴呆或亨廷顿氏病。在一些情况下,所述测序包括maxam-gilbert测序、sanger测序或高通量测序。在一些情况下,所述高通量测序包括新一代测序或第三代测序。在一些情况下,所述第三代测序为长读段测序。

5、在各种实施方案中,方法包括:(a)在解旋酶的存在下对双链多核苷酸的胞嘧啶碱基进行脱氨基,以产生经脱氨基的胞嘧啶碱基;(b)对包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸或其双链衍生物的至少一部分进行测序,以获得测序数据;以及(c)对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更高的准确度鉴定所述胞嘧啶碱基。在一些情况下,所述测序包括对所述双链多核苷酸或其双链衍生物的两条链的至少一部分进行测序。在一些情况下,所述方法包括对所述测序数据进行处理,从而以至少约90%、至少约95%或至少约99%的准确度鉴定所述胞嘧啶碱基。在一些情况下,所述脱氨基用脱氨酶进行。在一些情况下,所述脱氨酶为载脂蛋白b mrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌(geobacillus sterothermophilus)bad蛋白、pcra解旋酶或它们的片段至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约93%、至少约95%、至少约97%或至少约99%同源的氨基酸序列或其片段。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段。在一些情况下,所述方法还包括使包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸经历一种或多种反应以产生其所述双链衍生物,并且包括对其所述双链衍生物的至少一部分进行测序以获得所述测序数据。在一些情况下,所述方法还包括提供包含正向链和反向链的样品双链多核苷酸。在一些情况下,所述方法还包括将所述正向链与所述反向链分离。在一些情况下,所述方法还包括在核酸延伸反应中使用所述正向链来产生所述双链多核苷酸。在一些情况下,所述脱氨基用脱氨酶进行。在一些情况下,所述脱氨酶为载脂蛋白b mrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约93%、至少约95%、至少约97%或至少约99%同源的氨基酸序列或其片段。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、apcra解旋酶或它们的片段。在一些情况下,所述胞嘧啶碱基为甲基胞嘧啶碱基或羟甲基胞嘧啶碱基。在一些情况下,所述方法还包括,使包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸经历一种或多种反应以产生其所述双链衍生物,并且包括对其所述双链衍生物的至少一部分进行测序以获得所述测序数据,并且对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更高的准确度将所述胞嘧啶碱基鉴定为胞嘧啶碱基。在一些情况下,所述正向链包括甲基化胞嘧啶碱基,并且所述方法还包括在核酸延伸反应中使用所述正向链,所述核酸延伸反应产生经修饰的双链多核苷酸,所述经修饰的双链多核苷酸包括(i)包含所述甲基化胞嘧啶碱基的所述正向链和(ii)包含所述胞嘧啶碱基的额外反向链。在一些情况下,所述方法还包括将所述甲基化胞嘧啶碱基转化为葡糖基化羟甲基胞嘧啶。在一些情况下,所述甲基化胞嘧啶碱基为甲基胞嘧啶碱基,并且所述转化包括使所述甲基胞嘧啶碱基经历氧化条件以产生羟甲基胞嘧啶碱基,并且使所述羟甲基胞嘧啶碱基经历葡糖基化条件以产生所述葡糖基化羟甲基胞嘧啶。在一些情况下,所述甲基化胞嘧啶碱基为羟甲基胞嘧啶,并且所述转化包括使所述羟甲基胞嘧啶碱基经历葡糖基化条件以产生所述葡糖基化羟甲基胞嘧啶。在一些情况下,所述脱氨基用脱氨酶进行。在一些情况下,所述脱氨酶为载脂蛋白b mrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约93%、至少约95%、至少约97%或至少约99%同源的氨基酸序列。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、apcra解旋酶或它们的片段。在一些情况下,所述方法还包括使包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸经历一种或多种反应以产生其所述双链衍生物,并且包括对其所述双链衍生物的至少一部分进行测序以获得所述测序数据。在一些情况下,所述方法包括对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更大的准确度将所述甲基化胞嘧啶碱基鉴定为甲基化胞嘧啶碱基。

6、在各种实施方案中,方法包括:(a)在解旋酶的存在下,用脱氨酶对双链多核苷酸的胞嘧啶碱基进行脱氨基,以产生经脱氨基的胞嘧啶碱基;(b)对包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸或其双链衍生物的至少一部分进行测序,以获得测序数据;以及(c)对所述测序数据进行处理以鉴定所述胞嘧啶碱基。在一些情况下,所述方法还包括对所述双链多核苷酸或其双链衍生物的两条链的至少一部分进行测序。在一些情况下,所述脱氨酶为载脂蛋白bmrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段至少90%同源的氨基酸序列。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、apcra解旋酶或它们的片段。在一些情况下,所述方法还包括提供包含正向链和反向链的样品双链多核苷酸。在一些情况下,所述方法还包括将所述正向链与所述反向链分离。在一些情况下,所述分离包括使所述正向链经历核酸延伸反应,所述核酸延伸反应产生所述双链多核苷酸。在一些情况下,所述脱氨酶为载脂蛋白b mrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约93%、至少约95%、至少约97%或至少约99%同源的氨基酸序列。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、apcra解旋酶或它们的片段。在一些情况下,所述胞嘧啶碱基为甲基胞嘧啶碱基或羟甲基胞嘧啶碱基。在一些情况下,所述方法包括使包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸经历一种或多种反应以产生其所述双链衍生物,并且包括对其所述双链衍生物的至少一部分进行测序以获得所述测序数据。在一些情况下,所述正向链包括甲基化胞嘧啶碱基,并且所述分离包括在核酸延伸反应中使用所述正向链,所述核酸延伸反应产生经修饰的双链多核苷酸,所述经修饰的双链多核苷酸包括(i)包含所述甲基化胞嘧啶碱基的所述正向链和(ii)包含所述胞嘧啶碱基的额外反向链。在一些情况下,所述方法还包括将所述甲基化胞嘧啶碱基转化为葡糖基化羟甲基胞嘧啶。在一些情况下,所述甲基化胞嘧啶碱基为甲基胞嘧啶碱基,并且所述转化包括使所述甲基胞嘧啶碱基经历氧化条件以产生羟甲基胞嘧啶碱基,并且使所述羟甲基胞嘧啶碱基经历葡糖基化条件以产生所述葡糖基化羟甲基胞嘧啶。在一些情况下,所述甲基化胞嘧啶碱基为羟甲基胞嘧啶,并且所述转化包括使所述羟甲基胞嘧啶碱基经历葡糖基化条件以产生所述葡糖基化羟甲基胞嘧啶。在一些情况下,所述脱氨酶为载脂蛋白b mrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约93%、至少约95%、至少约97%或至少约99%同源的氨基酸序列。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、apcra解旋酶或它们的片段。在一些情况下,所述方法还包括使包含所述经脱氨基的胞嘧啶碱基的所述双链多核苷酸经历一种或多种反应以产生其所述双链衍生物,并且包括对其所述双链衍生物的至少一部分进行测序以获得所述测序数据。

7、在各种实施方案中,本文提供了一种试剂盒,所述试剂盒包括:脱氨酶;解旋酶;以及包装和其中的使用所述试剂盒的说明。在一些情况下,所述脱氨酶为载脂蛋白b mrna编辑酶、催化多肽样(apobec)酶或它们的片段。在一些情况下,所述试剂盒还包括甲基胞嘧啶双加氧酶。在一些情况下,所述甲基胞嘧啶双加氧酶包括十-十一易位(tet)酶或其片段。在一些情况下,所述试剂盒还包括脱氧核糖核酸(dna)葡糖基转移酶。在一些情况下,所述dna葡糖基转移酶包括dnaβ-葡糖基转移酶。在一些情况下,所述试剂盒还包括dna甲基转移酶。在一些情况下,所述dna甲基转移酶包括dna甲基转移酶1(dnmt1)。在一些情况下,所述解旋酶包括与uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、pcra解旋酶或它们的片段至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约93%、至少约95%、至少约97%或至少约99%同源的氨基酸序列。在一些情况下,所述解旋酶为uvrd解旋酶、嗜热脂肪地芽孢杆菌bad蛋白、apcra解旋酶或它们的片段。

8、在各种实施方案中,方法包括:(a)使包括碱基(例如,胞嘧啶碱基)的多核苷酸与一种或多种试剂接触,所述试剂共同将所述碱基转化为源自所述碱基的改变的碱基,从而产生包括所述改变的碱基的经修饰的多核苷酸;以及(b)对包括所述改变的碱基的所述经修饰的多核苷酸或其衍生物的至少一部分进行测序,以获得覆盖范围不超过30倍、不超过25倍、不超过20倍、不超过15倍或不超过10倍、不超过5倍或不超过2倍的测序数据;以及(c)对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更高的准确度鉴定所述碱基。在一些情况下,所述经修饰的多核苷酸或其衍生物为双链多核苷酸。在一些情况下,所述测序包括对所述双链多核苷酸的两条链的至少一部分进行测序。在一些情况下,所述方法包括对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更大的准确度鉴定所述碱基。在一些情况下,所述胞嘧啶碱基为甲基化胞嘧啶碱基。在一些情况下,所述方法还包括对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更大的准确度将所述甲基化碱基鉴定为胞嘧啶。在一些情况下,所述一种或多种试剂包括氧化剂。在一些情况下,所述一种或多种试剂包括dna-葡糖基转移酶。在一些情况下,所述一种或多种试剂包括脱氨酶。在一些情况下,所述一种或多种试剂包括解旋酶。在一些情况下,所述一种或多种试剂包括dna甲基转移酶。在一些情况下,所述方法还包括提供包含正向链和反向链的样品双链多核苷酸,所述正向链包含所述多核苷酸。在一些情况下所述方法还包括将所述正向链与所述反向链分离。在一些情况下,所述分离包括在核酸延伸反应中使用所述正向链,所述核酸延伸反应产生包含所述多核苷酸的双链多核苷酸。在一些情况下,所述甲基化碱基为甲基化胞嘧啶碱基。在一些情况下,所述一种或多种试剂包括脱氨酶和解旋酶。在一些情况下,所述测序包括对所述双链多核苷酸或其双链衍生物的两条链的至少一部分进行测序。在一些情况下,所述方法还包括对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更大的准确度将所述甲基化胞嘧啶碱基鉴定为胞嘧啶。在一些实施方案中,所述多核苷酸源自多核苷酸群体,并且其中在给定基因座处,所述多核苷酸群体中所述甲基化胞嘧啶碱基的碱基频率小于或等于75%、小于或等于70%、小于或等于65%、小于或等于60%、小于或等于55%、小于或等于50%、小于或等于45%、小于或等于40%、小于或等于35%、小于或等于30%、小于或等于25%、小于或等于20%、小于或等于15%、小于或等于10%、小于或等于7%、小于或等于5%、小于或等于3%或小于或等于1%或更低。

9、在一些情况下,所述甲基化胞嘧啶碱基包括甲基胞嘧啶碱基或羟甲基胞嘧啶碱基。在一些情况下,所述甲基化胞嘧啶碱基包括甲基胞嘧啶碱基,并且所述一种或多种试剂包括氧化剂、dna葡糖基转移酶、脱氨酶和解旋酶。在一些情况下,所述甲基化胞嘧啶碱基包括羟甲基胞嘧啶碱基,并且所述一种或多种试剂包括氧化剂、dna葡糖基转移酶、甲基转移酶、脱氨酶和解旋酶。在一些情况下,所述测序包括对所述双链多核苷酸或其双链衍生物的两条链的至少一部分进行测序。在一些情况下,所述方法还包括对所述测序数据进行处理,从而以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.9%、至少约99.99%、至少约99.999%、至少约99.9999%或更大的准确度将所述甲基化胞嘧啶碱基鉴定为甲基胞嘧啶或羟甲基胞嘧啶。在一些情况下,所述多核苷酸为双链多核苷酸,其中链经由发夹共价连接。在一些情况下,所述正向链和所述反向链经由发夹共价连接。

10、在各种实施方案中,方法包括:(a)提供正向多核苷酸和同源多核苷酸;(b)使所述正向多核苷酸和所述同源多核苷酸与具有dna甲基转移酶活性的实体接触;(c)使所述正向多核苷酸和任选的所述同源多核苷酸与氧化剂接触;(d)使用所述测序确定所述正向多核苷酸的基因座处的第一碱基变体的身份和所述同源多核苷酸的相应基因座处的第二碱基变体的身份;以及(e)使用包括处理器、存储器和存储在其上的指令的计算机,当执行所述指令时,至少部分地基于所述第一碱基变体的身份和所述第二碱基变体的身份,确定与所述正向多核苷酸的所述基因座对应的原始多核苷酸的基因座的真实碱基变体的值。在一些情况下,所述方法包括使所述正向多核苷酸和任选的所述同源多核苷酸与所述氧化剂接触是在所述使所述正向多核苷酸和所述同源多核苷酸与所述具有dna甲基转移酶活性的实体接触之后进行。在一些情况下,所述具有dna甲基转移酶活性的实体为dnmt1或dnmt5。在一些情况下,所述氧化剂为十-十一易位(tet)酶。在一些情况下,所述方法包括使所述正向多核苷酸和所述同源多核苷酸与还原剂接触。在一些情况下,所述还原剂为硼烷或硼烷的衍生物。在一些情况下,所述还原剂选自吡啶硼烷、2-甲基吡啶硼烷(pic-硼烷)、硼烷、乙硼烷、叔丁胺硼烷、氨硼烷、硼氢化钠(nabh4)、氰基硼氢化钠(nabh3cn)、乙二胺硼烷、二甲胺硼烷、三乙酰氧基硼氢化钠、吗啉硼烷、4-甲基吗啉硼烷、三甲胺硼烷、二环己胺硼烷或硼氢化锂(libh4)或它们的盐。在一些情况下,所述还原剂为吡啶硼烷。在一些情况下,所述还原剂包括氢化铝锂、钠汞齐、汞齐、二氧化硫、连二硫酸盐、硫代硫酸盐、碘化物、过氧化氢、肼、氢化二异丁基氢化铝、草酸、一氧化碳、氰化物、抗坏血酸、甲酸、二硫苏糖醇、β-巯基乙醇或它们的任意组合。在一些情况下,所述方法包括在使所述正向多核苷酸和所述同源多核苷酸与所述具有dna甲基转移酶活性的实体接触之前,使所述正向多核苷酸和任选的所述同源多核苷酸与氧化剂接触。在一些情况下,所述氧化剂为钌酸盐。在一些情况下,所述氧化剂为钌酸钾。在一些情况下,如果确定的所述第一碱基的所述身份和所述第二碱基的所述身份分别为下列组合中的任一者,则所述真实碱基变体的所述值被确定为误判:分别为腺嘌呤和腺嘌呤、腺嘌呤和胞嘧啶、腺嘌呤和鸟嘌呤、胞嘧啶和腺嘌呤、胞嘧啶和胞嘧啶、胞嘧啶和胸腺嘧啶、鸟嘌呤和腺嘌呤、鸟嘌呤和鸟嘌呤、胸腺嘧啶和胞嘧啶、胸腺嘧啶和胸腺嘧啶、前面没有胸腺嘧啶和鸟嘌呤时的鸟嘌呤和胸腺嘧啶、如果后面没有鸟嘌呤和胞嘧啶则分别为胸腺嘧啶和鸟嘌呤或者鸟嘌呤和胸腺嘧啶。在一些情况下,如果所述第一碱基变体的身份和所述第二碱基变体的身份分别为腺嘌呤和胸腺嘧啶,则所述真实碱基变体的所述值为腺嘌呤。在一些情况下,如果所述第一碱基变体的身份和所述第二碱基变体的身份分别为胞嘧啶和鸟嘌呤,则所述真实碱基变体的所述值为胞嘧啶。在一些情况下,如果所述第一碱基变体的身份和所述第二碱基变体的身份分别为鸟嘌呤和胞嘧啶,则所述真实碱基变体的所述值为鸟嘌呤。在一些情况下,如果所述第一碱基变体的身份和所述第二碱基变体的身份分别为胸腺嘧啶和腺嘌呤,则所述真实碱基变体的所述值为胸腺嘧啶。在一些情况下,如果在cpg背景中所述第一碱基变体的身份和所述第二碱基变体的身份为胸腺嘧啶和鸟嘌呤,然后为鸟嘌呤和胸腺嘧啶,则所述真实碱基变体的值为5-甲基胞嘧啶(5mc)。在一些情况下,如果在cpg背景中所述第一碱基变体的身份和所述第二碱基变体的身份分别为胸腺嘧啶和鸟嘌呤,然后分别为鸟嘌呤和胞嘧啶,则所述真实碱基变体的所述值为5-羟甲基胞嘧啶(5hmc)。在一些情况下,所述方法包括至少部分基于所述基因座处的所述真实碱基变体的所述值来诊断对象的病况。在一些情况下,所述病况为癌症。在一些情况下,所述癌症选自肉瘤、神经胶质瘤、腺瘤、白血病、膀胱癌、乳腺癌、结肠直肠癌、子宫内膜癌、肾癌、肝癌、肺癌、黑色素瘤、非霍奇金淋巴瘤、胰腺癌、前列腺癌、甲状腺癌。在一些情况下,所述病况为神经退行性病况。在一些情况下,所述神经退行性病况选自阿尔茨海默病、额颞叶痴呆、肌萎缩侧索硬化症、帕金森病、脊髓小脑性共济失调、脊髓性肌肉萎缩症、路易体痴呆或亨廷顿氏病。在一些情况下,所述测序包括maxam-gilbert测序、sanger测序或高通量测序。在一些情况下,所述高通量测序包括新一代测序或第三代测序。在一些情况下,所述第三代测序为长读段测序。

11、从下面的详细描述中,本公开的其他方面和优点对于本领域的技术人员来说将变得显而易见,其中仅示出和描述了本公开的说明性实施方案。如将认识到的,本公开能够有其他和不同的实施方案,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和描述本质上被认为是说明性的,而不是限制性的。

12、通过引用并入

13、本说明书中提到的所有出版物、专利和专利申请都通过引用并入本文,就如同各单独的出版物、专利或专利申请都被具体和单独地指出通过引用并入一样。在通过引用并入的出版物和专利或专利申请与本说明书中包括的公开内容相矛盾的程度上,本说明书旨在取代和/或优先于任何此类矛盾的材料。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1