用于组装来自一个或多个生物体的染色体段的方法、设备和计算机程序与流程

文档序号:12167254阅读:来源:国知局

技术特征:

1.一种用于基于代表至少一个文库的所有DNA片段的一组原始子序列组装代表至少一个生物体的至少一条染色体的至少一段的至少一个序列的用于计算机的方法,所述至少一个文库包括包含所述至少一条染色体的连续核苷酸的链的DNA片段并且包括包含所述至少一条染色体的连续核苷酸的至少两条链的组合的DNA片段,所述方法包括以下步骤:

-获得代表所述至少一条染色体的DNA区域之间的接触频率的第一值,所述第一值与代表相应DNA区域之间的距离的第二值相关联;和

-迭代地执行以下步骤:

-基于所述第一和第二值并基于将DNA区域之间的接触概率与相应DNA区域之间的距离相关联的理论模型更新基因组结构,更新的基因组结构代表所述至少一个生物体的至少一条染色体的至少一段的真实基因组结构;和

-更新作为更新的基因组结构的函数的所述理论模型的参数。

2.根据权利要求1所述的方法,其中两个DNA区域之间的距离被测定为沿着预定路径的两个DNA区域之间的距离和/或两个DNA区域之间的空间距离的函数。

3.根据权利要求1或权利要求2所述的方法,还包括将代表至少一个文库的所有DNA片段的原始子序列分成多个箱的步骤。

4.根据权利要求1至3中任一项所述的方法,还包括产生多个基因组候选结构和计算每个所产生的候选基因组结构更接近于真实基因组结构的显式似然值的步骤。

5.根据权利要求4所述的方法,其中产生多个基因组候选结构的步骤基于包括易位、缺失、倒置和重复中的至少一种变化的预定结构变化。

6.根据权利要求4或5所述的方法,其中根据多重尝试Metropolis类型的规则选择所生成的基因组候选结构之一作为相关联的似然值的函数。

7.根据权利要求4至6中任一项所述的方法,依赖于权利要求3,其中基因组候选结构通过箱的结构变化来确定。

8.根据权利要求1至7中任一项所述的方法,其中更新理论模型参数的步骤基于Gibbs采样类型的算法。

9.根据权利要求1至8中任一项所述的方法,其中所述理论模型包括代表用于区分DNA区域之间的染色体内接触与DNA区域之间的染色体内和染色体间接触的阈值的至少一个参数。

10.根据权利要求1至9中任一项所述的方法,其中所述理论模型包括代表用于区分DNA区域之间的染色体内接触或DNA区域之间的染色体内和染色体间接触与不同生物体之间的接触的阈值的至少一个参数。

11.根据权利要求1至9中任一项所述的方法,还包括对所述至少一个文库的DNA片段进行聚类的步骤,其中每个聚簇与特定生物体相关,所述原始子序列对应于被处理用于基于聚簇测序的经聚类的DNA片段。

12.根据权利要求11所述的方法,其中对所述文库的DNA片段进行聚类的步骤基于Louvain类型的算法。

13.根据权利要求1至12中任一项所述的方法,还包括鉴定代表所述至少一个生物体的至少一条染色体的至少一段的至少一条序列中的至少一个DNA序列的步骤。

14.根据权利要求1至12中任一项所述的方法,其用于表征至少一个生物体的全局染色体组构,所述方法还包括推断所述至少一个生物体的代谢状态的步骤,所述全局染色体组构的特征在于相应基因组的三维组构。

15.一种用于鉴定生物样品中的真核细胞、原核细胞或微生物的基因组的方法,所述方法包括权利要求1至14中任一项的用于组装至少一个生物体的至少一条染色体的至少一段的方法的每一个步骤。

16.权利要求15的用于鉴定生物样品中的微生物的基因组的方法,所述微生物是寄生虫、细菌、古细菌、真菌、酵母和病毒类型之一。

17.根据权利要求1至16中任一项所述的方法,还包括以下步骤:

-使包含所述至少一条染色体的至少一段的所制备的生物样品的染色体段交联;

-使用至少两种不同类型的限制性酶使交联的染色体片段化;和

-对从片段化步骤得到的染色体片段进行测序。

18.一种用于组装至少一个生物体的至少一条染色体的至少一段的方法,所述方法包括以下步骤:

-制备包含所述至少一条染色体的至少一段的生物样品;

-使所制备的生物样品的染色体段交联;

-使用至少两种不同类型的限制性酶使交联的染色体片段化;

-对从片段化步骤得到的染色体片段进行测序;和

-组装染色体的经测序的片段。

19.权利要求18的方法,其中使用终浓度为3%的甲醛进行所制备的生物样品的染色体段的交联。

20.权利要求18或19的方法,还包括经交联的染色体的基于玻璃或陶瓷珠的机械裂解的步骤,所述机械裂解在使用至少两种不同类型的限制性酶的片段化之前进行。

21.一种用于建立生物样品的病毒组和基因组之间的对应性的方法,所述方法包括以下步骤:

-从所述生物样品中提取独立病毒颗粒群体;

-基于权利要求1至17中任一项所述的方法鉴定提取的独立病毒颗粒群体的病毒基因组序列,所鉴定的病毒基因组序列形成所述病毒组;

-基于权利要求1至17中任一项所述的方法鉴定其中已提取病毒颗粒群体的生物样品中的细菌、质粒和病毒基因组序列,以形成所述生物样品的基因组;和

-基于物理接触建立所述生物样品的病毒组和基因组之间的对应性。

22.根据权利要求21所述的方法,其中所述病毒组是噬菌体组,并且所述病毒颗粒是噬菌体颗粒。

23.权利要求22所述的方法,还包括以下步骤:裂解提取的噬菌体颗粒群体的噬菌体,提取裂解的噬菌体的DNA,并从提取的DNA重建染色质。

24.一种装置,其包含被配置用于执行根据权利要求1至23中任一项所述的方法的每个步骤的工具。

25.一种用于可编程装置的计算机程序产品,所述计算机程序产品包括用于当所述程序由可编程装置加载和执行时执行根据权利要求1至16中任一项所述的方法的每个步骤的指令。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1