用于检测和评估基因毒性的方法和试剂与流程

文档序号:22688097发布日期:2020-10-28 12:57阅读:来源:国知局

技术特征:

1.一种用于检测和定量在受试者暴露于诱变剂后在所述受试者中体内发展的基因组突变的方法,包括:

提供来自所述受试者的样品,其中所述样品包括双链dna分子;

为所述样品中的多个双链dna分子中的每一个生成错误校正的序列读数,包括:

生成衔接子-dna分子的原始第一链的一组拷贝和衔接子-dna分子的原始第二链的一组拷贝;

对所述原始第一链和第二链的拷贝组进行测序,以提供第一链序列和第二链序列;和

比较所述第一链序列和所述第二链序列,以识别所述第一链序列和第二链序列之间的一个或多个对应关系;和

分析所述一个或多个对应关系以确定所述样品中的所述双链dna分子的突变谱。

2.根据权利要求1所述的方法,进一步包括通过计算每个测序的双重碱基对的独特突变的数目来计算靶双链dna分子的突变频率。

3.根据权利要求1所述的方法,其中靶双链dna分子是从所述受试者的肝、脾、血液、肺或骨髓中提取的。

4.根据权利要求1所述的方法,其中在将靶双链dna分子从所述受试者中移除之前,所述受试者被暴露于所述诱变剂30天或更短时间。

5.根据权利要求1所述的方法,其中所述突变谱通过无监督的分级突变谱聚类生成。

6.根据权利要求1所述的方法,其中所述突变谱是三重态突变谱。

7.根据权利要求1所述的方法,其中为多个双链dna分子中的每一个生成错误校正的序列读数包含生成一个或多个靶基因组区域的错误校正的序列读数。

8.根据权利要求7所述的方法,其中所述一个或多个靶基因组区域是基因组中的易突变位点。

9.根据权利要求7所述的方法,其中所述一个或多个靶基因组区域是已知的癌症驱动基因。

10.根据权利要求1所述的方法,其中所述受试者是转基因动物,并且其中至少一些靶双链dna分子包含转基因的一个或多个部分。

11.根据权利要求1所述的方法,其中所述受试者是非转基因动物,并且其中靶双链dna分子包含内源性基因组区域。

12.根据权利要求1所述的方法,其中所述受试者是人,并且其中靶双链dna分子是从取自所述人的血液中提取的。

13.一种用于生成测试药剂的诱变标志的方法,包括:

对从暴露于所述测试药剂的测试受试者中提取的dna片段进行双重测序;和

生成所述测试药剂的诱变标志,包括:

通过计算每个测序的双重碱基对的独特突变的数量来计算多个dna片段的突变频率;和

确定所述多个dna片段的突变的突变模式,其中所述突变模式包含突变的突变类型、突变三核苷酸环境和基因组分布。

14.根据权利要求13所述的方法,进一步包括将所述测试药剂的突变标志与一种或多种已知的基因毒素的突变标志进行比较。

15.根据权利要求13所述的方法,其中所述测试药剂的突变标志基于组织类型、对所述测试药剂的暴露水平、基因组区域和受试者类型中的一种或多种而变化。

16.根据权利要求15所述的方法,其中所述受试者类型是在培养物中生长的人细胞。

17.根据权利要求13所述的方法,其中在处死动物之前,将测试动物暴露于测试化合物30天或更短时间。

18.根据权利要求13所述的方法,其中所述诱变标志通过计算模式匹配来生成。

19.根据权利要求13所述的方法,其中突变标志是三重态突变标志。

20.根据权利要求13所述的方法,其中对dna片段进行双重测序包含对一个或多个靶基因组区域进行双重测序。

21.根据权利要求20所述的方法,其中所述一个或多个靶基因组区域是基因组中的易突变位点。

22.根据权利要求20所述的方法,其中所述一个或多个靶基因组区域是已知的癌症驱动基因。

23.根据权利要求13所述的方法,其中测试动物是转基因动物,并且其中至少一些所述dna片段包含转基因的一个或多个部分。

24.根据权利要求13所述的方法,其中所述测试动物是非转基因动物,并且其中所述dna片段包括内源性基因组区域。

25.一种用于评估测试药剂的基因毒性潜力的方法,包括:

(a)从包括来自暴露于所述测试药剂的生物源的多个双链dna片段的样品制备测序文库,其中制备序列文库包括将不对称的衔接子分子连接至所述多个双链dna片段以生成多个衔接子-dna分子;

(b)对所述衔接子-dna分子的第一链和第二链进行测序,以提供每个衔接子-dna分子的第一链序列读数和第二链序列读数;

(c)对于每个衔接子-dna分子,比较所述第一链序列读数和所述第二链序列读数,以识别所述第一链序列读数和第二链序列读数之间的一个或多个对应关系;和

(d)通过分析每个衔接子-dna分子的所述第一链序列读数和第二链序列读数之间的所述一个或多个对应关系来确定所述测试药剂的突变标志,以确定所述样品中突变的突变模式、突变类型、突变频率、突变类型分布和基因组分布中的至少一个;和

(e)将所述测试药剂的所述突变标志与来自已知基因毒素的多个突变谱进行比较,以确定所述突变标志是否与来自已知基因毒素的突变谱足够相似;或者

(f)评估所述突变频率、所述突变类型或所述突变类型分布中的至少一个是否高于安全阈值水平;或者

(g)确定所述突变频率是否超过安全阈值突变频率。

26.根据权利要求25所述的方法,其中所述测试药剂的突变标志包括高于安全阈值频率的突变频率。

27.根据权利要求25所述的方法,其中所述测试药剂的所述突变标志包括与已知癌症相关的突变模式足够相似的突变模式。

28.根据权利要求25所述的方法,其中所述生物源是在培养物中生长的细胞、动物、人、人细胞系、转基因动物、非转基因动物、人组织样品或人血液样品中的至少一种。

29.根据权利要求25所述的方法,其中在提取包括多个双链dna片段的样品之前,将所述生物源暴露于所述测试药剂30天或更短时间。

30.根据权利要求25所述的方法,其中所述突变标志是三重态突变标志。

31.根据权利要求25所述的方法,其中在比较所述第一链序列读数和所述第二链序列读数之前,所述方法包括使用衔接子序列、序列读数长度和原始链信息中的一个或多个将所述第一链序列读数与所述第二链序列读数相关联。

32.根据权利要求25所述的方法,其中在制备所述测序文库之前,所述方法进一步包括将所述生物源暴露于所述测试药剂。

33.根据权利要求32所述的方法,其中在将所述生物源暴露于所述测试药剂之前,所述生物源是癌症组织或包括癌症组织。

34.根据权利要求32所述的方法,其中在将所述生物源暴露于所述测试药剂之前,所述生物源是健康组织或包括健康组织。

35.根据权利要求25所述的方法,其中所述样品是血液样品或包括血液样品。

36.根据权利要求25所述的方法,其中所述样品是癌细胞系或包括癌细胞系。

37.根据权利要求25所述的方法,其中所述生物源包括癌细胞,并且其中测试所述物质对所述癌细胞的至少一部分的选择性基因毒性。

38.根据权利要求37所述的方法,其中所述物质是治疗性化合物。

39.根据权利要求38所述的方法,其中对于显示出对所述治疗性化合物的选择性基因毒性敏感的所述癌细胞的所述部分,所述方法进一步包括在暴露于所述治疗性化合物之前确定所述癌细胞的所述部分的突变频率和突变谱中的一种或多种。

40.根据权利要求25所述的方法,其中所述测试药剂包括食品、药物、疫苗、化妆品物质、工业添加剂、工业副产物、石油馏出物、重金属、家用清洁剂、空气传播的微粒、制造的副产物、污染物、增塑剂、洗涤剂、放射性产品、烟草产品、化学材料或生物材料。

41.一种用于确定受试者暴露于基因毒性药剂的方法,包括:

将受试者的dna突变谱与已知诱变化合物的突变谱进行比较;和

识别与所述受试者的dna突变谱最相似的已知诱变化合物的突变谱。

42.根据权利要求41所述的方法,其中所述受试者的dna突变谱通过双重测序来评估。

43.根据权利要求41所述的方法,其中所述受试者的dna突变谱由从患者的血液中提取的dna生成。

44.根据权利要求41所述的方法,其中所述受试者的dna突变谱是三重态突变谱。

45.根据权利要求41所述的方法,进一步包括对所述受试者的dna进行测序以生成所述受试者的dna突变谱。

46.根据权利要求45所述的方法,其中对所述受试者的dna进行测序包含对一个或多个已知的癌症驱动基因进行测序。

47.一种能够用于双链多核苷酸的错误校正的双重测序以识别基因毒素的试剂盒,所述试剂盒包括:

至少一组聚合酶链式反应(pcr)引物和至少一组衔接子分子,其中所述引物和衔接子分子能够用于错误校正的双重测序实验;和

关于使用所述试剂盒对从受试者的样品中提取的dna进行错误校正的双重测序以识别所述受试者是否已经被暴露于至少一种基因毒素的方法的说明。

48.根据权利要求47所述的试剂盒,其中试剂包括dna修复酶。

49.根据权利要求47所述的试剂盒,其中所述衔接子分子的组中的每个所述衔接子分子包括至少一个单分子标识符(smi)序列和至少一个链定义元件。

50.根据权利要求47所述的试剂盒,进一步包括嵌入在非暂时性计算机可读介质中的计算机程序产品,当在计算机上执行时,所述计算机程序产品执行以下步骤:确定样品中一个或多个双链dna分子的错误校正的双重测序读数,以及使用所述错误校正的双重测序读数来确定至少一种基因毒素的突变频率、突变谱和/或三重态谱。

51.根据权利要求50所述的试剂盒,其中所述计算机程序产品进一步确定基因毒素在使受试者的dna突变中的作用机制;和基于基因毒素作用机制的适合于对所述受试者给药的治疗性或预防性治疗。

52.一种用于诊断和治疗暴露于基因毒素的受试者的方法,包括:

a)通过以下来确定受试者是否暴露于基因毒素:

i)从所述受试者获得生物样品;

ii)提供从所述样品中提取的多个双链dna序列的双重错误校正的测序读数;

iii)确定所述dna序列的突变频率、突变谱和/或三重态突变谱;

iv)确定突变频率、突变谱和/或三重态突变谱是否指示所述受试者已经被暴露于基因毒素;

b)如果所述受试者已经被暴露于基因毒素,则提供预防性和/或治疗性治疗以预防或抑制与基因毒素相关的疾病或障碍的发作。

53.一种用于识别对基因毒素的安全暴露的阈值水平并提供治疗的方法,包括:

a)确定基因毒素的安全暴露的阈值水平;

b)通过以下来确定受试者是否以高于所述安全暴露的阈值水平的水平被暴露于基因毒素:

i)从所述受试者获得生物样品;

ii)提供从所述生物样品中提取的多个双链dna序列的双重错误校正的测序读数;

iii)确定所述dna序列的突变频率、突变谱和/或三重态突变谱;

iv)确定突变频率、突变谱和/或三重态突变谱是否指示所述受试者已经被暴露于特定的基因毒素;

v)基于突变频率、突变谱和/或三重态突变谱来计算所述受试者暴露于基因毒素的水平;和

c)如果所述受试者已经被暴露于超过基因毒素的安全暴露的阈值水平,则提供预防性和/或治疗性治疗以预防或抑制与基因毒素相关的疾病或障碍的发作。

54.一种用于检测和识别由样品的基因毒性暴露引起的诱变事件和/或核酸损伤事件的系统,包括:

计算机网络,所述计算机网络用于传输与测序数据和基因毒性数据相关的信息,其中所述信息包含原始测序数据、双重测序数据、样品信息和基因毒素信息中的一种或多种;

客户端计算机,所述客户端计算机与一个或多个用户计算装置相关联并与所述计算机网络通信;

数据库,所述数据库连接至所述计算机网络,用于存储多个基因毒素概况和用户结果记录;

双重测序模块,所述双重测序模块与所述计算机网络通信并且被配置为从所述客户端计算机接收原始测序数据和请求,用于生成双重测序数据,对来自代表原始双链核酸分子的家族的序列读数进行分组,并将来自单个链的代表性序列相互比较以生成双重测序数据;和

基因毒素模块,所述基因毒素模块与所述计算机网络通信并且被配置为将双重测序数据与参考序列信息进行比较,以识别突变并生成包括突变频率、突变谱和三重态突变谱中的至少一种的基因毒素数据。

55.根据权利要求54所述的系统,其中所述基因毒素概况包括来自多个已知基因毒素的基因毒素突变谱。

56.一种包括指令的非暂时性计算机可读存储介质,当由一个或多个处理器执行时,所述指令执行权利要求1-53中任一项所述的方法,用于确定受试者是否暴露于至少一种基因毒素和/或确定至少一种基因毒素的身份。

57.根据权利要求56所述的非暂时性计算机可读存储介质,进一步包括计算被检测的药剂的突变谱、突变频率和/或三重态突变谱,由此确定所述至少一种基因毒素的身份。

58.一种用于执行权利要求1-53中任一项所述的方法的计算机系统,所述方法用于确定受试者是否暴露于至少一种基因毒素和/或至少一种基因毒素的身份,所述系统包括:至少一台计算机,其具有处理器、存储器、数据库和包括用于所述处理器的指令的非暂时性计算机可读存储介质,其中所述处理器被配置为执行所述指令以执行包括权利要求1-53中任一项所述的方法的操作。

59.根据权利要求58所述的系统,进一步包括联网计算机系统,包括:

a.有线或无线网络;

b.多个用户电子计算装置,其能够接收由使用试剂盒获得的数据,所述试剂盒包括提取、扩增和产生受试者的样品的多核苷酸序列的试剂,并且能够通过网络将所述多核苷酸序列传输到远程服务器;和

c.远程服务器,包括处理器、存储器、数据库和包括用于处理器的指令的非暂时性计算机可读存储介质,其中所述处理器被配置为执行所述指令以执行包括权利要求1-53中任一项所述的方法的操作;和

d.其中所述远程服务器能够检测和识别由样品的基因毒性暴露导致的诱变事件和/或核酸损伤事件。

60.根据权利要求59所述的系统,其中所述数据库和/或可通过网络访问的第三方数据库进一步包括多个记录,所述记录包括已知基因毒素的基因毒素概况、至少一个受试者的样品的基因毒素概况中的一个或多个,并且其中所述基因毒素概况包括突变或dna损伤的位点。

61.一种非暂时性计算机可读介质,其内容使至少一台计算机执行一种用于提供来自基因毒性筛选测定的样品中的双链核酸分子的双重测序数据的方法,所述方法包括:

从用户计算装置接收原始序列数据;和

创建样品特异性数据集,所述数据集包括从所述样品中的多个核酸分子获得的多个原始序列读数;

对来自代表原始双链核酸分子的家族的序列读数进行分组,其中分组基于共享的单分子标识符序列;

比较来自原始双链核酸分子的第一链序列读数和第二链序列读数,以识别所述第一链序列读数和第二链序列读数之间的一个或多个对应关系;和

提供所述样品中的双链核酸分子的双重测序数据。

62.根据权利要求58所述的计算机可读介质,进一步包括识别比较的第一序列读数和第二序列读数之间的非互补性的核苷酸位置,其中所述方法进一步包括:

在非互补性的位置中,识别并消除或忽略过程错误;和

在不被识别为过程错误的非互补性的位置中,将剩余的非互补性的位置识别为由于暴露于基因毒素而可能导致体内dna损伤的位点。

63.一种非暂时性计算机可读介质,其内容使至少一台计算机执行一种用于检测和识别由样品的基因毒性暴露导致的诱变事件的方法,所述方法包括:

将双重序列数据与参考序列信息进行比较;

识别所述双重序列数据中的突变,其中突变被识别为与参考信息不一致的区域;

确定所述双重序列数据中的突变频率;

从所述双重序列数据生成突变谱;

从所述双重序列数据生成三重态突变谱;和

将所述突变谱和/或所述三重态突变谱与多个已知的基因毒素数据集进行比较。

64.一种非暂时性计算机可读介质,其内容使至少一台计算机执行用于检测和识别受试者中的致癌物或致癌物暴露的方法,所述方法包括:

使用由来自所述受试者的样品中生成的双重测序数据来识别靶基因组区域中的序列变体;

计算测试样品和对照样品的变体等位基因频率(vaf);

确定vaf在测试组中是否比在对照组中高;

在具有较高的vaf的样品中,确定序列变体是否是非单重态的;

在具有较高的vaf的样品中,确定所述序列变体是否是驱动突变;和

将具有非单重态和/或驱动突变的样品表征为对致癌物是可疑的。

65.根据权利要求68所述的非暂时性计算机可读介质,进一步包括评估致癌物的安全阈值和/或确定在所述受试者中暴露后与发展基因毒素相关的疾病或障碍相关的风险。


技术总结
本文公开了具有用于评估基因毒性的试剂的方法、系统和试剂盒。基因毒性及其作用机制可以在受试者暴露的几天内确定。该技术的一些实施例涉及利用双重测序来评估暴露的受试者中化合物(例如,化学化合物)的基因毒性潜力。该技术的其他实施例涉及利用双重测序来确定与基因毒性药剂相关的突变标志;和/或基因毒素暴露的安全阈值水平。该技术的另外的实施例涉及通过将受试者的DNA突变谱与已知诱变化合物的突变谱进行比较来识别受试者可能已经暴露于的一种或多种基因毒性药剂。一旦受试者中的基因毒素暴露被识别或确认,则提供预防性和/或抑制性治疗的疗程。

技术研发人员:J·J·索尔克;C·C·瓦伦丁三世
受保护的技术使用者:特温斯特兰德生物科学有限公司
技术研发日:2019.02.13
技术公布日:2020.10.27
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1