来自基因转录产物检测的具有广泛基础的疾病结合的制作方法

文档序号:439524阅读:270来源:国知局
专利名称:来自基因转录产物检测的具有广泛基础的疾病结合的制作方法
来自基因转录产物检测的具有广泛基础的疾病结合 临时专利申请的交叉参考 本专利申请要求2007年4月24日递交的名为"具有广泛基础的疾病结合基因转 录产物检测"的相关临时专利申请的优先权,该申请在此通过引证全部并入本文。
背景技术
许多人被遗传性疾病所折磨,因此遗传性疾病是许多研究和误解的主体。 一些遗 传性紊乱可能是由染色体数失常所引起的,例如,唐氏综合症(额外的21染色体)和克兰 费尔特氏综合症(具有2个X染色体的男性)。分别通过改变基因表达或者获得功能,三联 体扩增重复突变可以造成X染色体易损综合症或亨丁顿舞蹈症。当某些基因序列不以预期 形式存在时,会发生其他的遗传性紊乱,例如,患有多发性硬化和II型糖尿病。目前,已知 大约4, 000例遗传性紊乱,随着对人类基因组的了解的深入,更多的遗传性紊乱将会被发 现。大部分疾病是非常罕见的,千百万人中才会有一例患者,而其他的疾病是较为常见的, 例如囊肿性纤维化,其中大约有5%的美国人携带至少一个拷贝的缺陷基因。
人类的遗传组成是通过脱氧核糖核酸(DNA)来反映的。DNA是一种分子,该分子包 括核酸序列(即,核苷酸),所述核酸序列形成了包括活生物体生长和作用的遗传指令的密 码。DNA序列或者遗传序列是由任意四个具体核酸串联构成的,代表了真实的或者假设的 DNA分子或DNA链的一级结构,具有携带信息的能力。如本领域内已知的,可能的核酸(字 母)是A、C、G和T,分别代表了DNA核甘酸亚基链一与磷酸骨架共价相连的腺嘌呤、胞嘧啶、 鸟嘌呤和胸腺嘧啶碱基。通常序列之间相邻打印,中间没有空格,例如,序列AAAGTCTGAC。 四个以上核苷酸的串联可以被叫做序列。 核糖核酸(RNA)是一种核酸聚合物,由核苷酸单体组成,作为DNA和核糖体之间 的信使,并且通过编码氨基酸负责制备蛋白质。RNA多聚核苷酸包括核糖糖基,与DNA不同 的是,DNA包括脱氧核糖糖基。通过叫做核糖核酸聚合酶的酶作用,从DNA中转录(合成) RNA,并且通过其他酶进行进一步加工。RNA作为基因翻译成蛋白质的模板,将氨基酸传递给 核糖体产生蛋白质,并同时将转录产物转变成蛋白质。 基因是核酸的一部分,该部分包括产生功能性产品所必须的信息,所述功能性产 品通常指蛋白质。基因包括调节区域、转录区域和/或其他的功能性序列区域,调节区域指 令在什么情况下产生产品,转录区域指令产品的结构。基因彼此之间相互作用,影响身体发 展和行为举止。基因有长链DNA组成(在某些病毒中由RNA组成),包括一种启动子和一 种编码序列,所述启动子控制基因活性,编码序列决定产生什么基因。当基因是有活性的时 候,编码序列被拷贝入叫做转录作用的过程中,产生一种基因信息的RNA拷贝。因此,这些 RNA通过遗传密码指导蛋白质合成。然而,RNA还可以直接被使用,例如作为核糖体的一部 分直接被使用。由基因表达产生的分子,无论是RNA还是蛋白质,都叫做基因产物。
有机体或者细胞中的总补充基因叫做它的基因组。有机体基因组的大小不严 格的取决于他的复杂性。在人类基因组中基因的数目估计是小雨30亿个碱基对和大约 20, 000-25, 000个基因。
4
正如前面提到的那样,某些遗传性紊乱可能由DNA序列不正确编码引起。单一核 苷酸多形性或者SNP(有时也叫做"snp")是在同一种类成员间(或者在一个成员的成对染 色体之间)当基因组中单一核苷酸一A、T、G、C不同时发生的DNA序列的变化。例如,来自 不同个体的两个测序的DNA片段AAGCCTA和AAGCTTA,这两个片段在单一核苷酸上包含差 异。在这种情况下,该位点被认为具有两个等位基因C和T。 在一个群体内部,单一核苷酸多形性可以被赋予一种次要的等位基因出现 率 一 在携带较少常见变体的群体中的染色体与携带较多常见变体的群体中的染色体的比 例。通常,人们希望单一核苷酸多形性具有的次要等位基因出现率^ 1% (或者0.5%等 等),而不是〃 所有的单一核苷酸多形性〃 (太大以至于不实用)。注意到人类群体之间的 变化是非常重要的,因此,在一个区域性或者种族性群体中包含的足够常见的单一核苷酸 多形性可能在另一个群体中非常罕见。 单一核苷酸多形性可以属于基因的编码序列,基因的非编码序列或者基因间区 域。由于所述遗传密码的退化,编码序列内部的单一核苷酸多形性不会必然改变所产生的 蛋白质的氨基酸序列。能够导致相同多肽序列的单一核苷酸多形性的两种形式叫做同义 (有时也叫做静态突变)-如果产生不同的多肽序列,就是非同义的。不在蛋白质编码区域 中的单一核苷酸多形性也可以具有基因剪接、转录因子结合或者非编码RNA序列的效果。
人DNA序列的变化能够影响人类疾病的发展和/或对病原体、化学物质、药物等等 的反应。然而,已经了解到DNA序列对生物学研究极为重要的一个方面是人类基因组之间 的比较区域(例如,来自相似人的比较DNA序列, 一个患有某种疾病而另一个不患有这种疾 病)。来自AffymetrixTM和lllumina 的技术能够在几天之内测定几十万单一核苷酸多形 性的基因型,花费通常不超过$1, 000. 00。 微阵列分析技术通常被用于整理分析从DNA、 RNA和蛋白质微阵列试验中产生的 数据,从而允许研究员在单一实验中调查大多数基因的表达状态,在多数情况下,大多数基 因组是指有机体的整个基因组。这种实验产生非常大量的遗传数据,难以进行分析,尤其在 缺少有效的基因注解的情况下。大多数微阵列厂家,例如AffymetrixTM,会提供商业可售的 数据分析软件以及微阵列设备。 用于统计分析的专门化软件工具能够确定在微阵列实验中相对于参考状态基因 的超表达或不充分表达,这可能会帮助识别与具体表型有关的基因或者基因组。这种统计 标准程序一般会提供所关心的基因或者基因组的用户信息,包括与数据库和非冗余集合数 据库(curated databases)和基因实体论相连,所述数据库例如NCBI基因银行,所述非冗 余集合数据库例如Biocarta。 作为统计分析的结果,有机体的某一方面可能被定型。基因定型涉及使用生物实 验确定个体基因型的过程。目前进行这一过程的方法包括聚合酶链反应、DNA测序和与DNA 微阵列或磁珠杂交。该技术是检测父亲/母亲时固有的,也是在调查与疾病有关的基因时 必须的。 个体有机物的表型或者是它的总物理性质和结构,或者是一种特征的特异性表 现,例如,身材、眼睛的颜色、或者个体间有变化的行为。表型很大程度上通过基因型来确 定,或者通过个体在染色体的一个或者一个以上位点携带的等位基因一致性来确定。许多 表型通过多重基因来确定并受到环境因素的影响。因此,一个或者几个已知等位基因的一致性不总是能够预测表型。 在本技术现有状态的缺陷中,基因定型过程通常对单一病人或者单一进样研究样 品的单一循环中完成,只注意基因定型的特定疾病。因此,这种结果对于其他相似状态病人 任意可能的比较和分析来讲是相对孤立的。因此,这种孤立导致不能在实验所得结构的诊 断和治疗中起作用。目前没有一种系统允许带下划线的数据共享,因此失去了整合数据所 有可能的有益效果。因此,当收集遗传物质样品时,只作为一种个体方法来进行,不考虑结 合来自多种样品来源(例如,人)的各个遗传样品数据能够带来的有益效果。这里需要一 种具有广泛基础的疾病结合基因转录产物试验,以及与此有关的系统和方法,从而允许来 源广泛的各式各样数据的同化。


当与所附附图结合理解时,本发明的前述方面和与之相伴的权利要求的优点将会
变得更容易理解,同时通过参考如下详细说明,会理解的更为透彻。其中 图1是一种示意图,显示了根据这里公开的本发明的一种实施方案制备微阵列的
方法,所述微阵列在具有广泛基础的疾病结合基因转录产物试验中使用; 图2是一种示意图,显示了根据这里公开的本发明的一种实施方案,从若干来源
的样品中收集遗传物质样品并检测和分离用于分组的遗传物质链的方法; 图3是一种示意图,显示了用于建立数据结构的系统和方法,根据这里公开的本
发明的一种实施方案,所述数据结构在具有广泛基础的疾病结合基因转录产物试验中使 用; 图4显示了可能与信息数据库有关的典型的数据排列,根据这里所公开的本发明 的一种实施方案,所述信息数据库是由具有广泛基础的疾病结合基因转录产物试验获得的 信息数据库;并且 图5是一种示意图,根据这里公开的本发明的一种实施方案,显示了用于建立具 有广泛基础的疾病结合基因转录产物试验的方法和系统。
具体实施例方式
进行下列讨论使所属领域普通技术人员能够制备并使用这里公开的主题内容。在 不脱离这里所详细描述的精神和范围的情况下,这里描述的主要原则可以被应用于除了这 里详细描述的实施方案和应用之外的实施方案和应用中。这里公开的内容不局限于具体描 述的实施方案,而是与能够符合这里公开或建议的原则和特点的最宽范围相一致。
这里公开的主体内容与单一核苷酸多形性(SNP)以及插入/删除(UD)遗传性多 态现象的翻译检测有关,通过在定制的微阵列基因表达平台上进行荧光杂交作用完成检测 RNA序列的成比例分析。单一核苷酸多形性(SNP)可以通过一种专门设计的方法识别(单 一核苷酸多形性(SNP)通常通过脱氧核糖核酸分析进行评价)。这种独特的试验涉及的疾 病包括一系列常见的遗传序列,经过同行评议的文献中公开了各种已知的疾病都与这一系 列的遗传序列有关,所述疾病例如爱迪生氏病、贫血、哮喘、动脉粥样硬化、孤独症、乳腺癌、 雌激素新陈代谢作用、巴塞多病(Grave' s disease)、激素代替治疗、主要组织相容性复合 体(MHC)基因、传染性疾病筛选板、存活力、狼疮、多发性脑脊髓硬化症、肥胖症、关节变性病、前列腺癌和2型糖尿病。通过第三方临床组获得临床样品用于构建发展基础数据库,并且部分与Swank MS基础相关。同时进一步的融合并利用Swank计划的追随者的合作和自愿努力,所述Swank计划如 〃 多发性硬化饮食书〃 (Roy L. Swank所著)的记载。通过一定的试验服务可以促进对医生和病人使用的实时表型/基因型结合检验的实时在线访问。
新工艺的各种实施方案和方法包括与疾病相关的遗传物质样品的结合和结合、以最适合分析及操作的方式制备具有代表性遗传物质样品的微阵列、以及通过计算机网络传递被同化并编辑的数据。下面的图l-5描述了这些实施方案的各个方面。
图1表示了全部100种用于制备数据结构(例如,一种微阵列)的方法,根据这里所公开的发明的一种实施方案,所述数据结构可以被用于具有广泛基础的疾病结合基因转录产物试验。该方法通常包括从病人体内吸取血液样品,所述病人在iio步骤预定了基因定型。当然,为了同化与若干疾病相关的包含广泛的数据库,通常从多个来源吸取血液样品。应当注意到,任何适用于获得遗传物质(例如,脱氧核糖核酸和/或核糖核酸)的组织都可以被使用,例如肝脏组织。血液细胞可以容易的被收集和容易的被运输,这是这种脱氧核糖核酸/核糖核酸来源更有效率并更为有效。通常使用适当的血液收集装置,例如血液收集管来收集血液样品,所述血液收集管可以从Paxgene 处购得。 该样品通常被贴上适当的标签并且通过一种无名但可追踪的病人识别方法进行标记。说得更精确些,所有的测量都在遵守健康保险便利及责任法案(HIPAA)的规定的情况下进行,因此所述血液样品可看作是相同的,并且不会偶然泄露特许信息。在收集的时候,可以对血液样品储存其他的人口统计学信息(例如,在标签上记录,存贮在计算机数据库中)。这种人口统计学信息可以包括许多不同的描述性表型特征,例如,年龄、性别、国籍、种族、具体的健康问题、职业、诞生地、目前的生活场所,等等。 然后从血液样品获得的特异性遗传物质,例如核糖核酸可以被检测并在步骤112中使用核糖核酸分离试剂盒分离,所述试剂盒例如从QiagenTM获得的试剂盒。如上所述,核糖核酸的分离可以再进行收集的实际位点完成,或者可以在收集之后在远程实验室中完成。在下面的图2中更为详细的描述了所述遗传物质的分离过程。 在步骤114中,使用荧光过程扩增一种核糖核酸样品中的特异性序列,其中所述荧光过程对预先确定的核糖核酸链具有特异性,所述预先确定的核糖核酸链可以从llluminaTM处获得,商品名为DASl"。在一种作为选择的实施方案中,脱氧核糖核酸中的特异性序列也可以通过相似的荧光过程扩增,所述荧光过程对预先确定的脱氧核糖核酸链具有特异性,所述预先确定的脱氧核糖核酸链从llluminaTM处获得,商品名为Golden GateTM。
遗传物质的分离之后通常进行荧光标记的拷贝扩增,所述荧光标记的拷贝随后可能与附着有共同底物,即微阵列的特异性探针杂交。然而,经过收集并分离的样品可以在适合于分析的任意数据结构中排列并分析。如此,数据可以直接被基于计算机的数据结构,例如一种数据库所收集并吸收。 在步骤116中,所述被分离并扩增的遗传物质样品可以根据识别的遗传物质链进行分组。根据预定格式在微阵列的微珠池中以一种特定的方式排列各个组。这种预定格式可以包括适合于分离的核糖核酸/脱氧核糖核酸链中所有识别基因个体分析的标准格式。其他的预定格式可以包括与一种或一种以上参照组样品的参照组类似基因进行并列式比较。其他的形式可以包括特异性的基因组,所述特异性基因组适合于具有广泛基础的疾病结合、多发性脑脊髓硬化症结合、包含广泛的诊断法集合、包含广泛的预示性治疗数据库或 者其他任何样品基因结合。 一旦以特异性方式制造出微阵列,所述方式或者类似形式的出 现可以为步骤118的分析做好准备。西雅图WA州的IGD-Intel公司所有的名为"用于制备 疾病结合基因转录产物试验微阵列的方法和系统"的专利申请中更为详细的描述了每个微 阵列的制备方法,该专利通过引证在此全部并入本文。在微阵列中排列样品的形式通常符 合与血液样品分组有关的特异性,入下面图2所述。 图2显示了一种示意图,显示了根据这里公开的本发明的一种实施方案,从若干 来源的样品中收集血液样品并识别用于分组的遗传物质链的方法。在这里公开的一种方法 的概括中,本领域技术人员可以通过从许多相似来源的样品种收集许多相似的血液样品, 作为所述方法的开端,所述血液样品适用于遗传密码分离和分析。然后,检测并分离每种血 液样品中遗传物质可识别的链,从而所述遗传物质链可以通过一种基因序列或者核苷酸序 列来识别。 其次,对于各个血液样品,当出现一种可识别的链时,根据其相似的可识别链,所 述样品可以被分成各个样品组,然后每类遗传物质分离链样品组可以组成每个血液样品遗 传物质组,因此,每组包括来自每种血液样品的遗传物质相似的可识别链。 一旦完成分组, 每组遗传物质可能与一种疾病有关,所述疾病与该组所包括的可识别链或者其他可有效用 于诊断的相关数据有关。这些包含广泛的步骤的各个方面如下所述。 在图2中,一些不同来源的遗传物质通常可以被用于获得一些不同的遗传物质样 品。这一步骤在图2中结合步骤200被表达,并且与图1中单独的步骤110有关。因此,不 同的并可识别的遗传物质样品随后可以被处理,从而检测并分离具体的遗传物质,用于同 化入结合物中。这种过程包括核糖核酸的分离。 在步骤210中,从每个样品中检测并分离遗传物质链时可以识别特异性基因序列 (即,核苷酸序列)。在一种结合水平上,每个样品通常具有第一链,例如,链A,从而所有可 以被链A识别的基因序列都可以被分离,并将样品从其他链中分离出来。同样的,每个样品 的链B也可以被分离,并且,从而获得其各自的分离样品。对于链C以及每个样品中遗传物 质的每种其他可识别的链也是一样。虽然,图2只表示了 3个特异性链,本领域普通技术人 员应该理解,还有成千的潜在链可以被分离。在递交本申请时,至少有1142种特异性可识 别链可以有效用于每种样品的检测和分离。 这种分离过程还可以包括根据上述特异性基因序列识别的核糖核酸链进行的遗 传物质的分离。另外,所述遗传物质的分离还可以基于与显示疾病的基因表达有关的基因 序列、基于与显示一种性状的基因表达有关的基因序列、基于与显示一种表型的基因表达 有关的基因序列、和/或基于与显示一种基因型的基因表达有关的基因序列。
在检测、分离并识别了所有链的情况下,所有样品中的每类链(即,所有链A分离 作用产生的样品)都可以在步骤220被集合在一起,用于其他的结合和分析。同样,所有链 A的表达可以被集合入组A 230,所有链B的表达可以被集合入组B 231,所有链C的表达可 以被集合入组C 232。这种集合考虑了一种结合水平上数据的同化作用,所述同化作用基于 与许多同化数据结合水平比较后的多种基因表达。具体而言,样品来源的人口统计信息可 能与每个样品都有关。 另外,与每个血液样品有关的结合信息可以通过对相似的链进行分组完成。这种结合包括将显示可表达第一疾病的基因序列表达过程的血液样品与该血液样品的人口统 计信息相结合,将显示可表达第一疾病的基因序列表达过程的血液样品与显示可表达第一 疾病的基因序列表达过程的另外一种血液样品相结合;将显示可表达第一疾病的基因序列 表达过程的血液样品与显示可表达第二疾病的基因序列表达过程的另外一种血液样品相 结合;将显示可表达第一疾病的基因序列表达过程的血液样品和与这种第一疾病有关的治 疗方法相结合;并且,将显示可表达第一疾病的基因序列表达过程的血液样品与一种特异 性多形性相结合。 分组过程产生许多适当的结合,根据一种血液样品与另一种血液样品的结合从结 合的血液样品中获得的统计数据可以外推。这种统计数据包括表达速率,相互关联的表达 速率,等等。 使用这种独特的探针将会提供一种低成本的个体健康状况基因评定方法,通过一 种新型并有效的临床诊断获得个体的健康状况。另外,添加或者消除与给定疾病相关的探 针,如文献中出现的新信息的记载,可以进一步增强临川诊断方法的优势。根据报道,本领 域技术人员可以理解,增加探针含量是一种设计中的未来方法。但是,进一步地,所达临床 诊断法也可以被扩大,从而分别检测各个成分,和/或进行能够解决不同疾病或者所关心 的生活方式的试验。 现在可以从分组的遗传物质中收集的信息可以通过一种电脑服务器被结合入电 脑可读媒介物中,例如,数据库。然后,这些数据可以被任何连接的客户电脑访问,并因此从 结合的数据库中,根据客户电脑向电脑服务器的请求,将信息提供给客户电脑。
图3是一种示意图,显示了用于建立数据结构的系统和方法,根据这里公开的本
发明的一种实施方案,所述数据结构在具有广泛基础的疾病结合基因转录产物试验中使 用。 由于各种来源的遗传物质的样品被聚集,每种样品可以唯一的通过该样品的来源 来分离。例如,在图3所示的所有样品中,(即,样品X 310到样品M),通过一种轨迹识别方 法可以唯一的识别出每种样品。为了得到最后的数据结构,第一样品可以是样品X,其他的 可以是样品Y,如此类推直到最后的样品,样品M。本领域技术人员应该知道,这些样品可以 根据如上图2所述的一些特异性方法来处理,或者还可以在一种微阵列上被处理,所述微 阵列专门为这里所描述的方法和系统而制备。 —旦通过来源分别确认出所有的样品,每种样品可以再具体分为具体的部分,其 中,每个具体部分可能显示如上所述的特异性基因表达。在这里使用的"部分"是指任意量 的显示特异性基因表达的遗传物质样品。在任何情况下,"部分"都不表示一种具体的遗传 物质量或数量。因此,每种样品可以具有许许多多的部分,因此,每个部分显示一种特异性 基因表达。 在构建数据结构时,每个部分都可以在集合步骤311中进一步的确认为显示一种 特异性基因表达(或者依情况所示,不表达所述基因)。因此,部分X1可以被确认为具有一 种第一特异性核苷酸序列、部分X2可以被确认为具有一种第二特异性核苷酸序列,等等, 直到最后的部分被确认为具有一种第n特异性核苷酸序列。在将每个部分识别为包括第一 到第n的特异性核苷酸序列的情况下,保留这种来源(即,样品X)的部分结合。样品Y到 M中类似的部分也保持有这种来源样品的特异性结合。简而言之,样品Y被分成部分Yi到Yn,分别唯一的显示特异性第一到第n核苷酸序列。对所有第m样品进行这种分部分和结合的过程。 其次,在集合步骤312,每个部分都与各自的疾病有关。说得更精确些,部分XrXn与疾病DrDn有关,因此,与各个部分有关的每种疾病唯一的对应于各个部分所显示的特异性核苷酸序列。同样的,部分YrYn与疾病DrDn有关,以此类推到第M部分,其中,M1-Mn与疾病Dl-Dn有关。 每种样品的每种部分都与一种特定的疾病有关,在此基础上,包含广泛的疾病结合基因转录产物数据可以被保存在单一数据结构330中。适当使用这种数据结构,以外推得到许多不同的结合和数据趋势。 例如,如果在收集样品的同时收集样品来源的人口分布数据,通过将人口分布数
据与每个样品中显示这种遗传疾病表达的部分相结合,可知人口分布数据还可能同时与特
异性基因表达有关。然后,在数据结构内部适当的使用这种数据结合,可以推导出与此相关
的数据,即该数据包括一种第一疾病,这种第一疾病与携带有该样品来源人口统计信息的
样品某一部分有关。总体来说,人口资料和特异性疾病的特异性趋势可以被储存。 作为另一个实施例,其他的趋势数据可以通过将来自第一来源的样品部分与来自
第二来源的样品部分相结合来储存,其中,所述第一来源的样品显示能够表现出第一疾病
的特异性基因表达,所述第二来源的样品显示能够表现第二疾病的特异性基因表达。然后,
使用这种适当的结合,可以通过推导相关的数据储存其他趋势数据,所述相关数据包括来
自第一来源的样品部分与来自第二来源的样品部分,其中,所述第一来源的样品显示能够
表现出第一疾病的特异性基因表达,所述第二来源的样品显示能够表现第二疾病的特异性
基因表达。同样的,这种趋势数据可以通过将特异性多形性和某种特异性部分相结合来存
储,所述特异性部分显示与这种多形性有关的核苷酸序列。 关于多种疾病结合的其他信息可以通过将来自第一样品的部分和来自第二来源的样品部分相结合来储存,其中,所述第一样品分别显示与第一和第二疾病有关的特异性基因表达,第二来源显示与第一或第二疾病有关的特异性基因表达。在这些结合的基础上,本领域普通技术人员可以推导关于来自第一来源的样品部分的相关数据,该样品部分显示能够表现第一疾病能够的特异性基因表达;也可以推导出关于来自第一来源的样品部分的相关数据,该样品部分显示能够表现出第二疾病的特异性基因表达;还可以推导出关于来自第二来源的样品部分,所述样品部分显示与第一或第二疾病有关的特异性基因表达,从而致力于产生其他的趋势数据。 在另一个实施例中,可以通过将来自第一来源的样品部分与关于第一疾病的治疗相结合来表达治疗数据,所述来自第一来源的样品部分显示能够表现出第一疾病的特异性基因表达。进一步的,这种治疗数据还可以从这种相关性中推导得出,所述相关性包括将来自第一来源的样品部分和与第一疾病有关的治疗,所述来自第一来源的样品部分显示能够表现出第一疾病的特异性基因表达。 图4显示了一种与信息数据库有关的典型的数据排列,根据这里所公开的本发明的一种实施方案,所述信息数据库是由具有广泛基础的疾病结合基因转录产物试验获得的信息数据库。根据图4的公开,在数据结构400中可以排列与遗传物质部分有关的数据,所述遗传物质部分是从可追踪的样品中滋生出来的。在图4中,所述数据结构可以结合特异性试验470、 ID 411、多形性412、表达比率413和讨论414。 特异性试验410通常包括已知的核苷酸序列种类,其中,本领域普通技术人员可 以进行试验确定存在或者不存在特异性遗传疾病或者遗传紊乱。根据多形性412和比率 413,讨论414会显示用于诊断的可能性,或者建议对于某种具体疾病的治疗方法。
ID 411通常包括能够去除个体显著性并将这种个体显著性替换为相关的表型特 点的独特的识别测定法。 多形性412通常是指对分析样品呈递的特异性核苷酸,这种核苷酸可能与某种疾 病的存在有关。说得更精确些,在多形性412所识别的特异性核苷酸序列中涉及对每个个 体进行检测过程而产生的分析基因组序列的比例。 最后,数据结构还可以包括讨论414,讨论414是从已经发表的文献和出版的临床 研究实验中获得的临床相关知识中总结出来的。 在数据结构的至少一些数据设置中,可以获得具有广泛基础的疾病结合基因转录 产物实验数据结构。这种数据结构具有以下特点一种第一有形数据组,可以操作储存来 自特异性来源的遗传物质的表达数据结果,所述表达与第一疾病有关;一种第二有形数据 组,可以操作用来存储数据源的识别方法并与第一有形数据组相结合;和一种第三有形数 据组,可以操作存储至少一个其他的与第二疾病有关的结合,所述第二疾病与第二基因表 达有关。 其他的数据组可以包括一种第四有形数据组,可以操作用来存贮与第一疾病有关
的特异性试验的识别方法;一种第五有形数据组,可以操作用来存储于第一疾病和第一基
因表达有关的表达速率;以及一种第六有形数据组,可以操作用来存储于第一疾病和与第
一基因表达有关的讨论。这种数据结构可以在固定于电脑可读的媒介物中识别,例如,一种
数据库,或者可以被固定到另一种媒介物中,例如,含有遗传样品微阵列的基质材料。 在独立基因表达微阵列平台上,从人类基因组分离区域获得的核酸序列的特异性
组合可以作为一种常见的内容被反映。完整的核酸序列表形成人类基因组测试中的分析因
素,这可以形成基因转录产物测试的基本特点,在临床使用中通常能够有效的检测遗传密
码中的转录变量,有文献证明所述遗传密码与疾病、治疗剂反映结合,和/或疾病的治疗有
关。通过定量(测定并评价组织内部存在的转录产物)和定性(测定基因组区域)的方法,
检测结果可以评价RNA。 这种核酸阵列可以由探针序列组成,所述探针序列被分离用于检测给定的基因内 部区域,所这给定的基因绝大部分能够有效地显示表达水平并表明多形性部分,显示个体 实际表达的基因组中的序列。通过将扩增部分与所述阵列杂交并分析从杂交过程产生的杂 交方式来检测被认为存在于样品扩增部分的核酸序列,所述样品是从标准血液样品和/或 疾病感染组织中分离出来的。 经过全面的分析经过同行评议的文献(或者其他的定期更新内容),具有临床相 关性要求的实验结果的结合可以被获取并记录作为结论。通过现有的和正在进行的企业结 合按季度协议评价或维持一种对等医生支持网络,可以对现有的要求进行进一步的改进。
记载这种实验结果的文章显示了 1到50遗传序列自己的结果。其他的关于至少 1142种剩余序列的结果可以通过交替测定获得。通过给中相关的聚类分析方法(分级方 法、区分方法和结合方法),这些测定可以使医生相对于所有进行这种测定的病人而言更好的掌握他们负责的病人的信息。按照需要实现的目标可以进一步的促进为医生/医生网络 提供实时基因型/表型结合的方案。医生可以相对于所有进行过这种实验的个体的其他数 据分析他们自己负责的病人的数据。 经评价的实施例的多形性可以是单一核苷酸多形性(SNP)、缺失、和/或删除插入 序列。进一步的,已经确定出预计存在于所述方法部分的多形性。更进一步的,所述核酸样 品可以是基因组DNA、互补DNA、互补RNA、 RNA1总RNA或者信使核糖核酸。在这些变量中, 所述单一核苷酸多形性(SNP)、缺失或者插入可能与一种疾病、药物的功效有关、和/或与 上述疾病发展或者减缓的倾向性有关。通常,输出数据可以包含在电脑可读的媒介物(例 如,一种CD或者DVD)中并传递给客户,例如,订阅的医生。 图5是一种示意图,根据这里公开的本发明的一种实施方案,显示了用于建立具 有广泛基础的疾病结合基因转录产物试验的方法和系统。在这个实施方案中,微阵列500 的特点在于根据每个样品的结合具有不同识别的基因表达排列。其他的实施方案中也存在 其他的数据排列。因此,根据样品已知的排列,存在的表型或其缺点的特异性表达方式确定 了从每种制备的微阵列500中获得的信息类型。作为这种事实方案的结果,出现的特异性 方式表明单一核苷酸多形性(SNP)、插入或者缺失在不同的区域出现的可能性。
这种方式可以通过微阵列阅读器501阅读。微阵列阅读装置通常包括一种微阵列 站502,可以操作用来观察微阵列500。如上所述,典型的微阵列500包括大量的存储孔,用 于储存遗传物质样品。基质中存在的孔可以被处理,从而每个行都适于杂交遗传物质样品, 由此识别一种独特的基因表达(即,每行一个基因)。进一步的,对每个栏进行处理,使每栏 中每行中的样品与单一来源的遗传物质有关(即,每列一个人)。 微阵列阅读器501通常也可以包括一种分析装置510和一种记录装置520,分析装 置510可以操作用来分析显示在微阵列500上的方式,记录装置520可以操作用来传递分 析报告。另外,计算机系统550的接触面可以对报告进行分析从而在显示器上显示(未表 现出)和/或存储于电脑可读媒介物551中。所述微阵列阅读器501还可以具有一种电子 微阵列评价仪540,可以操作用来从一系列从微阵列500中发送出来或者接收到的电脉冲 中确定基因表达方式。 微阵列500在绘制或表达经处理的遗传物质组成的数据方面是相当有效的。微阵 列500包括以下应用。信使核糖核酸或者基因表达曲线检测的数千基因同时表达的表达 水平与生物学和医学的许多领域有关,例如,研究治疗方法、疾病和发展阶段。例如,微阵 列500可用于通过比较患病细胞和正常细胞的基因表达识别疾病基因。比较基因组杂交作 用-这种典型的使用包括评价单一种类中大基因组的重新排列。单一核苷酸多形性(SNP) 检测-在一种种类的群体基因组中寻找单一核苷酸多形性。染色质免疫沉淀研究-使用芯 片内建芯片(chip-on-chip)技术确定基因组中蛋白结合占位情况。微阵列500其他的应 用也是已知的和/或可以预料到,因此为了简便起见在此不在论述。 使用可用于分析的微阵列500,并与其他制备的微阵列相结合,开始形成与疾病和 /或特异性基因序列的存在或缺失相关的包含广泛的数据。微阵列500可以被扫描并选取 强度数据域原始样品种存在/不存在遗传物质相结合。这些数据与其他的数据,例如诊断 和治疗数据一起被吸收入已知大型信息数据库中,从而提供关于一系列数据组大量的有关 信息。由于数据被吸收,还可以提供一种综合性文献检索,报道具有基因序列变更的疾病的实际结合。所述数据是随机匿名的,并且加载到中央存储器中进行样品交叉对比并最终,较早的检测到疾病。 尽管这里讨论的实质内容可以进行多种修饰和结构变化,但其某些示例性的实施方案在这里已经进行了如上所述的详细介绍并在附图中有所显示。另外,本领域技术人员应该理解,这里的描述不意味着将要求保护的权利限制到这里公开的具体形式上,相反的,是意味着覆盖所有修饰,结构变化和落入本发明要求保护的精神和范围内的所有等价物。
权利要求
一种用于从多种遗传物质来源中集合基因专利产物数据的方法,该方法包括从多种遗传物质来源中获得遗传物质样品;对每个样品,分离每个样品的部分从而使每个部分显示一种特异性基因表达,所述特异性基因表达与多种疾病的一种有关,每种分离的部分唯一的对应于一种有关的疾病;将每种部分与它的来源相结合;将每种部分与相应的疾病相结合;并将每种结合存储在一种数据结构中。
2. 根据权利要求1所述的方法,进一步包括将来源于每个样品的人口统计数据与样品 的每个部分相结合。
3. 根据权利要求2所述的方法,进一步包括从数据结构中推导结合的数据,所述结合 的数据包括与样品一种部分有关的第一疾病和关于该样品来源的人口统计信息。
4. 根据权利要求1所述的方法,进一步包括将显示代表第一疾病的特异性基因表达的 第一来源样品部分与显示代表第二疾病的特异性基因表达的第以来源的样品部分相结合。
5. 根据权利要求4所述的方法,包括从数据结构中推导结合的数据,所述结合的数据 包括显示代表第一疾病的特异性基因表达的第一来源样品部分和显示代表第二疾病的特 异性基因表达的第一来源样品部分。
6. 根据权利要求4所述的方法,进一步包括将显示分别代表第一和第二疾病的特异性 基因表达的第一来源样品部分与第二来源的样品部分相结合,所述第二来源的样品部分显 示与第一或第二疾病有关的特异性基因表达。
7. 根据权利要求6所述的方法,进一步包括从数据结构中推导结合的数据,所述结合 的数据包括显示代表第一疾病的特异性基因表达的第一来源样品部分;显示代表第二疾病 的特异性基因表达的第一来源样品部分;显示与第一或第二疾病有关的特异性基因表达的 第二来源的样品部分。
8
9
10. 根据权利要求1所述的方法,进一步包括将显示代表第一疾病的特异性基因表达 的第一来源样品部分和与第一疾病有关的治疗方法相结合。
11. 根据权利要求io所述的方法,进一步包括从数据结构中推导结合的数据,所述结合的数据包括将显示代表第一疾病的特异性基因表达的第一来源样品部分和与第一疾病 有关的治疗方法相结合。
12. 根据权利要求1所述的方法,进一步包括将显示代表第一疾病的特异性基因表达 的第一来源样品部分和与一种特异性多形性相结合。
13. 根据权利要求12所述的方法,进一步包括从数据结构中推导结合的数据,所述结 合的数据包括将显示代表第一疾病的特异性基因表达的第一来源样品部分和与一种特异 性多形性相结合。
14. 一种数据结构,包括固定在有形媒介物上的第一数据组,可以操作用来存储来自 特异性来源的遗传物质中分离的基因表达,所述基因表达与第一疾病有关;固定在有形媒 介物上的第二数据组,可以造作用来存储来源的识别并与第一有形数据组有关;固定在有 形媒介物上的第三数据组,可以操作用来存储至少一种其他的关于第二疾病的结合,所述 第二疾病与第二基因表达有关。
15. 根据权利要求14所述的数据结构,进一步包括一种固定在有形媒介物上的第四数 据组,可以操作用来存贮与第一疾病有关的特异性试验的识别方法。
16. 根据权利要求15所述的数据结构,进一步包括一种固定在有形媒介物上的第五数据组,可以操作用来存储于第一疾病和第一基因表达有关的表达速率。
17. 根据权利要求16所述的数据结构,进一步包括一种固定在有形媒介物上的第六数 据组,可以操作用来存储于第一疾病和与第一基因表达有关的讨论。
18. —种数据结构阅读装置,包括一种微阵列站可以操作用来观察微阵列,所述微阵列 包括大量的存储孔,适用于储存遗传物质样品;每行适用于与遗传物质样品杂交从而识别 一种独特的基因表达;每栏适用于含有一种样品,在栏中的每一行含有的每种样品与单一 的遗传物质来源有关;一种分析装置,可以操作用来分析至少一种微阵列的图形;和一种 记录装置,可以操作用来传递分析报告。
19. 根据权利要求18所述的数据结构阅读装置,进一步包括一种计算机系统接触面, 从而在显示器上显示记录的分析结果并存储将其于电脑可读媒介物中。
20. 根据权利要求18所述的数据结构阅读装置,其中所述分析装置进一步包括一种电 子微阵列评价仪,所述电子微阵列评价仪可以操作用来从一系列从微阵列500中发送出来 或者接收到的电脉冲中确定基因表达方式。
全文摘要
具有广泛基础的疾病结合的基因转录产物检测和数据结构。用于研究这种独特试验的疾病包括一类常用遗传序列,在经过同行评议的文献中这种序列与多种已知疾病有关,例如,爱迪生氏病、贫血、哮喘、动脉粥样硬化、孤独症、乳腺癌、雌激素新陈代谢、巴塞多病(Grave′s disease)、激素代替治疗、主要组织相容性复合体(MHC)基因、存活力、狼疮、多发性硬化、肥胖、关节变性病、前列腺癌、和2型糖尿病。可以从第三方获得的临床样品来发展基础数据库。通过分析按规格改制的微阵列试验服务可以促进对医生和病人进行实时表型/基因型结合试验的在线访问。
文档编号C12Q1/68GK101743320SQ200780053485
公开日2010年6月16日 申请日期2007年6月1日 优先权日2007年4月24日
发明者D·I·斯波勒斯 申请人:伊维什遗传诊断公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1