使用具有患者特异性的相关性评价的变体-疾病关联性的诊断基因分析的制作方法

文档序号:8516062阅读:489来源:国知局
使用具有患者特异性的相关性评价的变体-疾病关联性的诊断基因分析的制作方法
【技术领域】
[0001]下文涉及基因分析领域、医学领域,并涉及相同领域的应用,诸如包括肿瘤学领域、兽医学领域等的医学领域。
【背景技术】
[0002]全基因组关联性(GWA)研宄检查不同个体的基因组中的变体,以识别在不同个体中发现的变体与其表型(诸如疾病易感性)之间的关系。不同变体则与不同性状(诸如疾病)相关联。这种临床研宄识别随后能够在患者中被检测到的变体,并因此能够作为对关联的疾病(或其他表型特性)的指示。
[0003]在人类中,GWA研宄已经引起对带有疾病的特定基因的关联性的发现,诸如作为老年性黄斑变性和糖尿病所公知的眼病。通常在这些研宄中,成百上千的个体被测试了在他们基因组中的成百上千的变体。变体通常是单核苷酸多态,或SNP。超过1200个人类GWA研宄已经检查了超过200种疾病和性状,并发现将近4000种的SNP关联性。
[0004]下文设想了克服上述局限性的改进的装置和方法及其他方面。

【发明内容】

[0005]根据一个方面,一种非暂态存储介质存储由电子数据处理设备可执行的指令,以执行一种方法,所述方法包括:识别诊断对象基因数据中的研宄基因变体,所述诊断对象基因数据通过临床研宄与表型特征相关联;识别与所述研宄基因变体在功能上相关的一组多态;针对该组多态计算在诊断对象基因数据中观察到的变体的前景分布;针对该组多态计算在临床研宄的对象的基因数据中观察到的变体的背景分布;计算比较所述前景分布与所述背景分布的比较度量;以及基于所述比较度量对所述研宄变体与所述诊断对象的相关性进行量化。
[0006]根据另一方面,一种装置,包括:如前一段落中所提出的非暂态存储介质;以及电子数据处理设备,其被配置为执行存储在所述非暂态存储介质上的指令。
[0007]根据另一方面,一种方法,包括:识别与在诊断对象基因数据中观察到的研宄基因变体在功能上相关的一组多态,所述诊断对象基因数据通过临床研宄与表型特征相关联;针对该组多态计算在诊断对象基因数据中观察到的变体的前景分布;针对该组多态计算在临床研宄的对象的基因数据中观察到的变体的背景分布;以及计算比较前景分布与背景分布的比较度量。识别一组多态、计算前景分布、计算背景分布以及计算比较度量由电子数据处理设备适当地执行。
[0008]一个优点在于针对总体上公知的基因变体提供患者特异性的相关性评价,以与疾病或其他表型特征相关联。
[0009]另一优点在于使用基因标记的更精确的临床测试。
[0010]对于本领域普通技术人员,在阅读下文的详细描述的情况下,许多额外的优点和益处将变得显而易见。
【附图说明】
[0011]本发明可以采取各种部件和部件布置,以及各种处理操作和处理操作布置的形式。附图仅用于说明优选实施例的目的,不应被解释为限制本发明。
[0012]图1示意性地示出了用于分析患者基因数据集以检测患者中的疾病或其他表型特征的系统。
[0013]图2-图6示意性地示出了图1的系统的选定的部件的细节图。
【具体实施方式】
[0014]基因评价通常包括采集患者基因数据,并将其与具有如由临床研宄所指示的疾病关联性(或其他表型关联性)的基因变体进行比较。通过示例性范例的方式,所采集的患者基因数据可以包括全基因组序列(WGS)(通常被视为包括至少90%的核DNA含量,更典型地,包括95%或更多核DNA含量,并且任选地还包括RNA或其他基因测序数据)、包括小于WGS的基因测序数据、使用微阵列采集的基因数据,例如具有成百上千的单核苷酸多态(SNP)测量值(可能包括基因表达(即蛋白质组)形式的基因数据、信息)等。对于诸如通过高通量基因测序或微阵列处理产生的大量患者基因数据集,数以千计的基因变体可以在患者基因数据中被观察到。通常,几十到几百个这些变体已经被预先确定为是在某些GWA研宄中相关联的疾病。
[0015]然而,本文中认识到在特定个体中观察到的与基因变体相关联的风险仅在临床研宄结果的基础上不容易对该个体进行量化。对此的一个原因是,通过GWA研宄识别的变体与疾病(或其他表型特征)的关联性是在临床研宄所执行的研宄种群的情况下被识别。例如,如果主要在中欧血统的种群中进行GWA研宄,则SNP关联性可能仅与中欧血统的患者相关。其他种群,诸如非洲或亚洲血统的人可能具有疾病关联SNP所属的同一路径中的其他基因中的补偿性变体,从而降低疾病关联性的显著性。相似地,GWA研宄可能限于单一性别或者在一定年龄段内等的对象。这些在研宄种群上的限制是否实际上影响了对特定患者的变体-疾病关联性的相关性是不容易确定的。例如,即使给定的临床研宄已经在中欧血统的种群进行了,但所得到的变体关联性可以是对其他种族的人毫不相关-或它们可以是与这种种群毫不相关,或者对于其他种族的人较少相关。
[0016]通常,研宄文献包括研宄在其中进行的种群库的人口学信息。在此基础上,患者的医生能够确定临床研宄结果是否适用于该患者,并因此决定是否为该患者定制该测试。然而,通常没有用于医生做出这个决定的原则基础。看似微小的人口学差异可以实际上使测试不适用于患者,而看似显著的人口学差异实际上可以对患者的适用性具有很少或没有影响。此外,实际影响检测适用性的患者和研宄种群之间的差异可以是未被记录在研宄文献中。
[0017]因此,当患者出现与研宄种群库偏离,给医生留下困难的选择:在获得虚假结果的风险下向该患者应用研宄结果;或者在未获得证明性医疗信息的风险下向患者应用研宄结果O
[0018]本文提出了对于这些困难的解决方案。在这些方法中,期望如果患者具有与研宄变体在功能上相关的相似变体分布,所述研宄变体的相关性如在临床研宄中所使用的种群中评价的,则该研宄变体-疾病关联性很可能在患者中是显著的,并且因而提供用于患者的相关临床?目息。
[0019]对本文所使用的术语某些说明如下。
[0020]术语“诊断对象”本文中用于指患者、兽医学上的对象、法医学上的对象(例如,正在进行尸检的尸体)、考古学上的对象(例如,木乃伊或人类遗骸)等,从他们中获取诊断对象基因数据,并将其与临床研宄的结果进行比较,以达到识别诊断对象中的疾病或其他表型特征的目的。识别通过观察诊断对象中的基因变体来完成,所述临床研宄将所述诊断对象与疾病或其他表型特征相关联,然后评价该关联性对使用本文所公开的方法的诊断对象的实际相关性。在示意性实施例中,诊断对象是患者和被称为患者的对象;然而,示意性实施例很容易应用于其他类型的诊断对象(例如,兽医学上的对象、法医学上的对象等)。临床研宄的对象通常是与诊断对象相同的“类型”。因而,应用于患者、人类尸体等的临床研宄采用人类种群;而应用于犬类兽医学对象的临床研宄采用犬类对象种群。在考古学上的诊断对象的情况下,所应用的临床研宄的种群库可以包括现代生物种群,或者可以包括(其他)考古学遗迹的种群。
[0021]如本文中所使用的,术语“多态”被用于指示具有两个或更多不同的可能的“变体”的序列(其“位置”)。例如,单核苷酸多态(SNP)由染色体X位置y指示,而变体可以被指定为在染色体X位置y处的核苷酸“A”(腺嘌呤)。多态是在种群中观察到的具有两个或多个变体的基因子序列。通常,WGA研宄识别单核苷酸多态(SNP),其中,基因子序列是在基因组中的单核苷酸的位置,所述基因组具有在种群中出现的两个或更多个不同的可能的核苷酸(变体)。例如,给定的SNP通常可以具有核苷酸“A”(腺嘌呤),但在某些个体中可以具有核苷酸“G”(鸟嘌呤),或较不常见地具有核苷酸“C”(胞嘧啶)。这种示意性的SNP具有在种群中出现的三种变体(“A”、“G”和“C”)。(注意,术语“核苷酸”和“碱基”在本文中可互换使用)。
[0022]尽管SNP是在临床研宄中最经常被表征的多态,多态能够具有其他配置。多态的其他(非穷尽的)的范例包括:插入(基因子序列可以具有被插入的额外的核苷酸)、缺失(基因子序列可以具有被省略的核苷酸)、拷贝数多态(基因子序列可以被复制一次或多次)、结构性多态(基因子序列具有两个或更多个可能的二级结构配置)、甲基化多态(基因子序列可以包括甲基化的核苷酸)、等等。如本文中所使用的多态还包括序列多态,即一个以上序列能够出现的位置。例如,二核苷酸形式的变体能够存在于一个位置上,或基因能够出现在基因组中的一个或多个拷贝中。如本文中所使用的,“基因多态”或简单的“多态”指的是子序列(实际上,指基因组中的“位置”),而“基因变体”或简单的“变体”指的是多态的特定值(例如,用于SNP的具体核苷酸,或在序列多态情况下的具体序列)。因此,例如,SNP可以由其在染色体C中的位置X来指定,并且可以具有前述范例中的可能的变体“A”、“C”或“G”。变体因此完全由其位置和在该位置上的值来指定(例如,变体可以
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1