基因作图和确定单倍型的方法

文档序号:433108阅读:2357来源:国知局
专利名称:基因作图和确定单倍型的方法
基因作图和确定单倍型的方法
技术领域
本发明主要涉及遗传学领域。具更体说本发明涉及基因作图方法以及测定 对象单倍型的方法。
背景技术
基因组图谱可描述各染色体上基因或其它标志之间的顺序及它们之间的 间隔。已构建了人类基因组的几种不同比例或分辨水平的图谱。分辨率最粗糙
的是基因连锁图,是通过各DNA标志(基因和其它可鉴定的DNA序列)在染色 体中的相对位置来描述它们的遗传方式。基因连锁图显示了沿染色体上各特异 性DNA标志的相对位置。个体之间不相同的可在实验室检测出来的任何遗传 的生理或分子特征即是潜在的遗传标志。这种标志可以是表达的DNA区域(基 因)或不具有已知编码功能但其遗传方式可被遵循的的DNA区段。DNA序列
的差异是特别有用的标志,因为它们的特征丰富和易于精确鉴定。
所述标志必须具有多态性方可用于绘制图谱;也就是说,不同形式必须存 在于诸个体中从而在家族不同成员之间的研究中可检测它们。多态性是DNA
序列中的变异,平均每300-500 bp发生一次。外显子序列中的变异可产生可观 察到的性状改变,如眼球颜色、血型和疾病易感性的差异。大多数差异发生在 内含子中,它们对器官的外观或功能只有极小的或没有影响,但它们可在DNA 水平被检测到因而可用作这种标志。这些类型的标志例子包括(l)可用DNA 限制性内切酶切割的反映DNA位点中序列变异的限制性片段长度多态性 (RFLP),和(2)串联重复序列数目的差异,这种短的重复序列因重复单位的数目 不同而长度不同(一种易于检测的特征)。人类基因连锁图是通过观察两种标志 一起遗传的频率如何而构建的。
位于同一染色体上互相靠近的两种标志倾向于一起从母亲传递给孩子。在 精子和卵细胞正常产生期间,DNA双链偶而会断裂,同一染色体上或同一染 色体另一拷贝(即同源染色体)上的不同位点可发生连接。这种过程(减数分裂重
组)可导致原先位于同一染色体上的两种标志分离。彼此靠近的标志更紧密连 锁的可能性不大,它们之间的重组将失败而分离。因此重组频率可提供对两种 标志之间距离的估计。
此种基因图谱的价值是患病个体存在的某DNA标志(但不患病个体缺乏此 标志)遗传后可在此图中定位某遗传疾病,虽然对此疾病的分子基础可能还不 了解或尚未鉴定到其负责疾病的基因。业已利用遗传图谱来发现包括囊性纤维 化、镰状红细胞病、泰-萨克斯病、脆性X综合征和强直性肌营养不良在内的 一些重要疾病基因的确切染色体定位。
目前鉴定基因组中影响基因功能的基因方法具有两个共同特征首先,利
用非编码序列变异的标志来提示含有候选基因的染色体区域;其次,通过基因
组广泛分析寻找此种序列变异的标志与感兴趣表型之间的相关性。通过基因组
广泛相关性分析发现基因,也称为连锁不平衡图谱,是美国专利No.5,851,762
的主题。
虽然连锁研究中利用了基因组信息,但认为关于单倍型的信息对于鉴定感 兴趣基因组区域的标志而明确(基因在)疾病中的功能更为有用。采用单倍型序 列可减少连锁研究中的错误,因为不需要考虑该基因涉及所研究性状的第二拷 贝(同源染色体上提供的)造成的影响。
2003年,国立卫生研究院设立的国际协会启动了一项历时三年耗资一亿美 元的项目来制作人类基因组单倍型图谱(称为"HapM叩"),以助于通过基于单 倍型的复杂疾病中标记等位基因疾病基因相关性来发现基因。此种连锁不平衡 等位基因相关性图谱('相关性图谱')策略涉及无关的个体病人,对于不能找 到全家族时的家族(谱系)连锁分析的传统方法而言,这是一种更为现代的替代 方法。
关于HapMap基础的一种假设是,通过二倍体DNA基因分型推断出的单 倍型足以分辨相关性图谱从而保证作为基因组泛基因发现策略的连续性。
另一种假设是,对四种人群(西非黑人、日本人、中国人、美国人)数百位 个体的SNP(单核苷酸多态性)的分析将足以鉴定出冗余的SNP,因而足以鉴定 单倍型标记的单个SNP,或最小化SNP的套数,从而表征所有人,包括混合 人群中的单倍型部件。这种HapMap聚集体(consortium)也提示在常见的多基因
疾病中和药物反应性中只有常见的单倍型(>5-10%)才是最重要的,这些常见的 单倍型将在约200名个体硏究中于以鉴定。
还有一种假设是单倍体组成了不同的"部件(block)",每个部件具有一可鉴 定的唯一SNP "标签"。遗传学领域目前接受的是利用HapMap方案所揭示的 最小必须SNP来鉴定任何人群中足够常见的单倍型,以在致病基因搜寻和受 药物影响的药物基因组学研究中检测共有的过度单倍型。
因此,该技术目前的状态是HapM叩将是明确的,能为连锁研究提供更充 分的信息。然而,更密切地审查该H叩Map方案后,提示该方案最佳只能获得 有限的信息,对于揭示多基因疾病的应用可能基本上无效。例如,SNP鉴定只 能检测出一部分真实的单倍型,也许甚至不能检测出所有常见的单倍型。而不 常见的单倍型(HapMap可能检测不出)对个体之间基因功能的差异也可能有影 响。
以上假设的单倍体部件结构也可能导致错误。预计重组和其它重排活动将 影响混合人群中单倍型部件的构成,这是对"核心"人群的有限分析所不能揭 示的。
当一个染色体区域中有两个或多个基因具有不同遗传方式(隐性、显性、共 显性)、具有不同功能(易感疾病、保护不患疾病)、作用于疾病进程的不同阶段 时,预计推断单倍型方法的分辨力可能受到挑战。当疾病由两个染色体所致例 如复杂的杂合子隐性疾病,且共显性遗传基因(如HLA复合体中的那些基因) 中发生反式及顺式共显性相互作用时,这种分辨力将受到最大挑战。本领域还 没有认识到这些不确定疑问的意义。
已通过谱系连锁分析鉴定了利用单倍型相关性图谱的关键性检测所能鉴 定的感兴趣基因区域。在一个重要的检测例子中,相关性图谱未能检测出鼻咽 癌致病基因5 6p21.3(HLA)区(RR:下界20 -上界无限),而单倍型共同连锁分 析(haplotype sharing linkage analysis)能检测出。这指出了该领域的另 一个问题 基于非编码(区)的策略分辨力不足,不能检测出任何人类常见癌症中甚至最强 的遗传相关性。
已知或怀疑许多疾病是多基因性疾病。认为大多数疾病的确是多基因疾 病,单基因疾病是例外。由于遗传母亲和父亲基因型诸基因的方式(存在差异)
使现有技术方法鉴定涉及多基因疾病的基因变得复杂。因此,虽然已采用了现 有技术的绘制基因图和发现基因的方法来鉴定具有单独遗传方式的基因和单 独涉及疾病的基因,但仍然明显需要更为有力的方法来阐明复杂疾病所涉及的 基因。
因此,本发明一方面的目的是克服或至少缓解现有技术不足的问题。具体 说,本发明的目的是利用单倍体信息提供更精确基因作图的方法。
本申请书中包括的文件、会议记录、物质、装置、引用文章等,目的只是 用于提供本发明的内容,并不暗示或代表任何或所有这些材料构成了在本申请 各项优先权利要求时间之前的现有技术的基础部分,或本领域中与本发明有关 的共同通用知识。
发明概述
本发明涉及提供对象明确单倍型的方法。用本文所述方法产生的单倍型信 息比现有技术只能给出推断的单倍型方法更为精确。因此,本发明的一方面提 供检测对象的明确单倍型的方法,该方法包括如下步骤提供对象的基本上分 离的单倍体元件,和获得此单倍体元件的核苷酸序列信息。申请人提出,利用 基本上分离的单倍体元件可消除对单倍型中两个或多个基因座相(phase)作出 错误推断或误导推断的问题,从而可揭示单倍型中参与的两个或多个基因,不 会因遗传方式的差异而复杂化。通过使用基本分离的单倍型元件作为序列分析 的起始材料本发明方法能够确保严格的顺式相相关性。
在所述方法的一种实施方式中,使序列信息与等位基因相关。在所述方法 的另一种实施方式中,所述等位基因是编码序列的等位基因。
本申请人认识到在明确单倍型中,联合利用二倍体物质与最大可能性算法 问题本身的重要性。预计现有技术所用方法中的错误当调査具有多基因基础 (疾病)的性状时将倒产生特别重要的问题。
在所述方法的一种实施方式中,基本上分离对象单倍体元件的步骤包括采 用二倍体物质作为单倍体元件的来源。可采用本领域技术人员熟知的任何一种 方法或它们的组合,分离二倍体基因组或其一部分中的单倍体元件。在本发明 的一种实施方式中,采用物理方法,如显微解剖法。例如,可显微解剖通过着
丝粒切开染色体产生两个染色单体。
可分离二倍体细胞,如体细胞的二倍体基因组或基因组的一部分。可避免 采用天然的单倍体物质如精细胞和卵细胞,因为临床上获得这些性细胞存在问 题。当考虑到减数分裂过程有时会发生重组,如原先以顺式连接的基因座变成 反式连接时,在单倍体分型中避免采用配子另有一种优点。因此,分析配子的 单倍型与分析获自二倍体细胞的单倍体元件将可能产生不同的(即错误的)单倍 型信息。
本发明另一方面内容是利用单倍体元件来测定对象的明确单倍型。 本发明还有一方面提供测定基因区域与性状之间相关性的方法,该方法包 括如下步骤提供多个对象的第一组单倍体元件,所述对象诸个体代表了常规 人群的遗传多样性,分析所述第一组单倍体元件是否存在等位基因;提供该常 规人群多个对象的第二组单倍体元件,所述对象具有(疾病)性状,所述对象不 来自同一家族,分析所述第二组单倍体元件是否存在等位基因,测定第一组与 第二组单倍体元件之间共有等位基因的水平;存在过量的共有等位基因表明该 等位基因与此(疾病)性状相关。在该方法的一种实施方式中,所述等位基因是 编码序列等位基因。
本发明另一方面对多基因疾病或性状提供鉴定其所涉及基因的方法,该方 法包括采用本文所述方法。提供本文所述明确的单倍型可消除阐述多基因疾病 系统中某个基因是否参与的混乱不确定性。
附图简述


图1显示人染色体6的激光压力弹射(catapulting)的光学显微照片。从左至 右的各分图是分裂中期扩散、染色体6鉴定和弹射(cat叩ult)后视野。
图2显示另一例人染色体6弹射的光学显微照片。左图为鉴定,右图为弹 射后视野。
图3显示染色体7弹射的CFTR外显子10的嵌套式PCR扩增子。泳道1-3 为染色体7。泳道4为阴性对照。泳道5为阳性对照。
图4显示激光压力弹射的单个染色体6s中HLA-A外显子2的直接嵌套式 PCR产物。泳道1为10微升0.1%曲通X-100(Triton X-100)溶液中单个染色体
6的激光压力弹射。泳道2为10微升0.1%曲通X-100溶液中单个染色体6的 激光压力弹射。泳道3为10微升0.1%曲通X-100溶液中单个染色体6的激光 压力弹射。泳道4为10微升0.P/。曲通X-100溶液中单个染色体6的激光压力 弹射。泳道5为10微升0.1%曲通X-100溶液中单个染色体6的激光压力弹射。 泳道6为10微升0.P/。曲通X-100溶液中单个染色体6的激光压力弹射。泳道 7为10微升0.1%曲通X-100溶液中单个染色体6的激光压力弹射。泳道8为 10微升0.1%曲通X-100溶液中单个染色体6的激光压力弹射。泳道9为阴性 对照,所含的PEN膜空白区用10微升0.P/。曲通X-100溶液捕获。泳道10为 只含有10微升0.1%曲通X-100溶液的阴性对照。泳道11为阳性对照,总体 积为10微升的0.1%曲通X-100溶液中含有1微升200pg/pl gDNA。泳道12 为分子量标记Vm。泳道l、 5和6被用于测序。泳道l、 5和6是纯的03序 列-环圈很亮。
图5显示对图4泳道1、 5和6的HLA-A扩增子的测序(结果)。 图6显示分裂中期激光弹射的DRB1外显子2的嵌套式PCR扩增子。 上面二块凝胶(用标记有"单个分裂中期"的括号括住)显示DRB"Ol特异 性PCR(产物)。上面二块凝胶的泳道内容物如下泳道l为分子量标记。泳道 2(清晰条带)为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳 道3为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道4为 用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道5为含有6 微升0.1%曲通X-100溶液的阴性对照。泳道6为用6微升0.1%曲通X-100溶 液捕获的单个LMPC分裂中期。泳道7(清晰条带)为用6微升0.1。/。曲通X-100 溶液捕获的单个LMPC分裂中期。泳道8(清晰条带)为用6微升0.1。/。曲通X-100 溶液捕获的单个LMPC分裂中期。泳道9为用6微升0.1%曲通X-100溶液捕 获的单个LMPC分裂中期。泳道9(清晰条带)为用6微升0.1%曲通X-100溶液 捕获的单个LMPC分裂中期。泳道IO(清晰条带)为用6微升0.1%曲通X-100 溶液捕获的单个LMPC分裂中期。泳道11为含6微升0.1。/。曲通X-100溶液的 阴性对照。泳道12为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中 期。泳道13为用6微升0.1。/。曲通X-100溶液捕获的单个LMPC分裂中期。泳 道14为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道15
为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道16为含6 微升0.1%曲通X-100溶液的阴性对照。泳道17为用6微升0.1%曲通X-100 溶液捕获的单个LMPC分裂中期。泳道18为标记。泳道19为标记。泳道20 为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道21为用6 微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道22为用6微升 0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道23为含6微升0.1%曲 通X-100溶液的阴性对照。泳道24为用6微升0.1%曲通X-100溶液捕获的单 个LMPC分裂中期。泳道25(清晰条带)为用6微升0.1%曲通X-100溶液捕获 的单个LMPC分裂中期。泳道26(清晰条带)为用6微升0.1%曲通X-100溶液 捕获的单个LMPC分裂中期。泳道27为含6微升0.1%曲通X-100溶液的阴性 对照。泳道28(清晰条带)为阳性对照,总体积为10微升的0.1。/。曲通X-100溶 液中含有1微升400pg/W gDNA。泳道29为标记。
下面二块凝胶显示DRB1*09特异性PCR(产物)。泳道1为标记。泳道2 为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道3为含6 微升0.1%曲通X-100溶液的阴性对照。泳道4为用6微升0.1%曲通X-100溶 液捕获的单个LMPC分裂中期。泳道5为含6微升0.1%曲通X-100溶液的阴 性对照。泳道6(清晰条带)为用6微升0.1%曲通X-100溶液捕获的单个LMPC 分裂中期。泳道7为含6微升0.in/。曲通X-100溶液的阴性对照。泳道8为用6 微升0.iy。曲通X-100溶液捕获的单个LMPC分裂中期。泳道9为含6微升0.P/。 曲通X-100溶液的阴性对照。泳道10为用6微升0.1%曲通X-100溶液捕获的 单个LMPC分裂中期。泳道11为含6微升0.ir。曲通X-100溶液的阴性对照。 泳道12为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道 13为含6微升0.1%曲通X-100溶液的阴性对照。泳道14(清晰条带)为用6微 升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道15为含6微升0.1% 曲通X-100溶液的阴性对照。泳道16(清晰条带)为用6微升0.1%曲通X-100 溶液捕获的单个LMPC分裂中期。泳道17为含6微升0.1%曲通X-100溶液的 阴性对照。泳道18为用6微升0.1%曲通X-100溶液捕获的单个LMPC分裂中 期。泳道19为含6微升0.1%曲通X-100溶液的阴性对照。泳道20为用6微 升0.1%曲通X-100溶液捕获的单个LMPC分裂中期。泳道21为含6微升0.1%
曲通X-100溶液的阴性对照。泳道22(清晰条带)为阳性对照,总体积为10微
升的0.1%曲通X-100溶液中含有1微升lng/pl纯gDNA。泳道23为标记。 图7显示染色体弹射(chromopult)产生的DRB1扩增子的斑点印迹表征。
发明详述
本发明一方面内容提供测定对象明确的单倍型的方法,该方法包括如下步
骤提供对象的基本上分离的单倍体元件,和获得此单倍体元件的核苷酸序列 信息。申请人提出,利用基本上分离的单倍体元件可消除对单倍型中两个或多 个基因座相作出错误推断或误导推断的问题,从而可揭示单倍型中参与的两个 或多个基因,不会因遗传方式的差异而复杂化。
预计本发明改进了现有技术检测单倍体的方法,本文描述了明确的单倍体 分型方法。为了更好地理解它们的区别,应考虑对目前本领域所理解的单倍型 概念和测定对象单倍型的方法进行重新阐述。
术语"单倍型"是"单倍体基因型"短语的简化称谓,其目前被人们接受 的含义是母亲或父亲单个染色体上存在的通常作为一个单位一起遗传的一组 核苷酸序列多态性或等位基因。以二倍体生物如人为例,某基因座的单倍型含 有一对等位基因中的一个成员。
在现有技术的方法中,单倍型的测定开始采用从临床上常规获得的二倍体 物质。申请人提出,这种采用二倍体物质进行单倍体分型的已接受实施方式是 不够的。另一种方法是采用天然的单倍体物质(例如精子或卵子),然而,这一 般很不方便,妇女将遭受(手术的)过度入侵。此外。配子提供的序列信息由于 减数分裂期间发生的,如SNP之间的顺式相相关性杂交而会产生混乱,不可 能保证可靠。
由于采用二倍体DNA的方法不能直接测定作为单倍型的顺式连接基因座, 故可采用最大可能性和类似的基于算法的估计来推断单倍型的出现几率。因此 一直认为顺式相连接中可能存在的两种多态性不会作为一个孟德尔单位一起 遗传。因此现有技术的这种方法更正确的描述应为"推断的单倍型"。本发明 方法认为孟德尔遗传的基本单位是以父亲重组位点为边界的染色体区段,因而 更接近单倍型的精确定义。
因此,本领域技术人员不会怀疑是否会产生利用二倍体原料产生错误影响 的问题。因此还没有认识到测定人群相关性状,或对象单倍型可能产生的问题。 相反,申请人认识到在联合利用二倍体物质与最大可能性算法来明确单倍型问 题本身的重要性。预计现有技术所用方法中的错误当调查具有多基因基础(疾 病)的性状时将产生特别重要的问题。
因此,本发明涉及测定明确的单倍型的方法。本文所用术语"明确的单倍 型"指只在归因单倍型时认为严格顺式相关的(单倍型)。本文所述方法包括任 何估计或推断,不论同一DNA分子上是否存在两种多态性。这与上述通过查
询二倍体物质的序列信息(如HapM叩方案中实施的)所获得的"推断的单倍型" 不同。
除了推断产生的问题外,利用二倍体细胞还会引入短等位基因优势所致的 复杂性("等位基因退出(allele dropout)"),此时不能特异性扩增较大的等位基 因。因此,可能完全忽略了较大等位基因的存在和产生错误的单倍型信息。
本发明方法利用基本上分离的单倍体元件作为序列分析的原料保证了严格 正确的顺式相的相关性(分析)。本文所用术语"单倍体元件"指包括只有母亲 产生的或只有父亲产生的核苷酸序列的任何核酸分子(DNA、 RNA或其衍生 物)。这种单倍体元件可以是任何长度的核酸分子,包括全长染色体、染色单 体或染色单体的一部分。本发明利用一种或多种单倍体元件来讯问序列信息。 对于人类,所述方法采用所有的46条单倍体元件,和分别分析所有的46条单 倍体元件。
术语"基本上分离的"指基本上不含有可能干扰讯问时只对单倍体元件顺 式相相关性鉴定的污染基因材料。通常当认为这种单倍体元件是父亲产生的 时,其污染的基因材料是母亲产生的单倍体元件;当认为这种单倍体元件是父 亲产生的时,其污染的基因材料是母亲产生的单倍体元件。
在本发明的一种实施方式中,所述方法包括基本上分离对象单倍体的步骤。 获得基本上分离的单倍体元件的方法可以是本领域技术人员已知的任何合适 方法。应理解实现基本上分离不是限制本发明的范围,而是在所述方法的一种 实施方式中,包括用物理方法基本上分离此种单倍体元件。应理解,可物理性 去除单倍体元件中的污染基因材料,使单倍体元件与污染的基因材料分离。当
二倍体细胞中存在单倍体元件时,可采用此方法。例如,手工操作或通过非接 触式仪器操作进行染色体显微解剖来取得此种单倍体元件。或者在讯问时用物 理方法去除此种单倍体元件中的污染基因材料。
在所述方法的另一种实施方式中,灭活或切除污染的基因材料,使其不再 具有污染基因材料的功能。例如,这可利用小心引导的激光束照射破坏同源染 色体而实现。
另一种可能的方法是用PCR选择性扩增这种单倍体元件,使单倍体元件
DNA的拷贝数大大超过污染的DNA。然后可用核酸酶部分消化这种DNA分 子混合物,而基本上消化去除所有污染的DNA,而留下低水平的单倍体元件。
也可通过长PCR(long PCR),釆用加入了标签的引物选择性扩增这种单倍 体元件,然后利用该标签分离获得单倍体元件拷贝。
可分离对象基因组或基因组一部分中的这种单倍体元件。本文所用的术语 "基因组"指对象的全部基因材料,包括对象的全套DNA序列。基因组的"一 部分"指核酸的一部分,例如对象基因组的脱氧核糖核酸(DNA)。
可获得细胞或含核酸生物样品中的基因组或其一部分。当所述基因组获自 二倍体细胞时,可通过加入本领域技术人员已知的诱导剂如秋水仙酰胺,诱导 该细胞进入分裂中期。分裂中期出现不连续的染色体,可如下所述将其解剖成 为单倍体元件。
在所述方法的一种实施方式中,基本上分离对象的单倍体元件的步骤包括 利用二倍体物质作为这种单倍体元件的来源。可采用本领域技术人员熟知的任 何一种方法或联合方法来分离获得二倍体基因组或其一部分中的单倍体元件。 本发明还包括将来可能开发出的任何其它方法。在本发明的一种实施方式中, 采用物理方法如显微解剖法。可通过显微解剖切断染色体的着丝粒产生两个染 色单体,每个即为单倍体元件。或者,在着丝粒远端切断染色体分离产生p和 q臂,每个臂即为单倍体元件。因此,这种单倍体元件可以是染色单体或染色 单体区段。
技术人员熟悉用于显微操作的平台和工具。虽然技术上要求严格,但高级 实验室装备中包括可利用的显微解剖器材。装备要求包括配有显微操作器和旋 转台、移液抽吸器(可产生显微针)的显微镜。推荐具有振动分离器的显微镜。
虽然不需要特别清洁的实验室,但显微解剖得到的染色体片段只含毫微微克量的DNA,必须控制其被外源性DNA污染。
可采用非接触式方法。此法的一个例子是采用激光微束。激光微束显微解 剖包括采用与显微镜接口的高束流质量(beam quality)的脉冲式紫外激光。可釆 用市场购得的德国P.A丄.M.公司(P.A丄.M.GmbH Bernried,Grmany)制造的 P.A丄.M⑧罗伯特微光束仪(RA丄.NP) Robot Microbeam)进行激光束显微解剖。 所述激光的波长通常不会损伤或破坏基因组区段,如337nm激光离核酸如 DNA的最大吸收波长相距很远。
可用于染色体激光显微解剖的另一系统是莱卡激光显微解剖显微镜。此系 统采用DMLA直立显微镜,包括可移动喷嘴、可移动平台、xyz-控制元件和新 型DMLA显微镜的所有其它优点。所用激光是波长337nm的紫外激光。通过 移动照射光切割,同时保持平台静止。在监控器上标记出感兴趣区域,用PC 控制切割。不用额外力使样品落入PCR试管中。通过自动化查看方式不难核 査切割的结果。
例如,可用PALM激光,利用激光弹射染色体进行显微解剖,实现单倍体 元件的分离。此时,所述非接触方式包括用激光消蚀靶单倍体元件的外周,然 后用激光压力弹射使所确定的元件落入试管盖,如微离心管盖上,随后分析单 个臂的DNA。
可用激光压力弹射回收产生的单倍体元件。通过聚焦激光微束于(例如)感 兴趣的单倍体基因组某区段或几个区段而实现激光压力弹射,由于产生的光子 密度高而产生力,导致所需的单倍体元件弹射掉不需要的基因组区段。在所述 方法的一种实施方式中,使样品在光波上方移动而被弹射到收集管中。本领域 技术人员知道合适的收集管,包括例如聚合酶链式反应(PCR)常用的试管或微 离心管。
可用制备型流式细胞仪基本上分离获得单倍体元件。另一方法是采用幅射 状杂交体,其中发育的二倍体物质包含人的染色体作为唯一的各对染色体之 一。另一策略是采用GMP科技有限公司(GMP Technologies Inc.)开发的"基因 转变技术"。GMP基因转变技术(GMP Conversion Technology) 采用的方法可将 成对的染色体分离成为单个染色体。分离后,可用能鉴定基因序列的基因探针
分别分析等位基因。此技术可应用于基因、染色体或整个人类基因组。
通常分离体细胞常染色体的二倍体基因组或其一部分术语"常染色体"指
正常体细胞或生殖细胞中除性染色体外的任何染色体。例如,人的1-22号染
色体就是常染色体。
如上所述,避免了采用天然的单倍体物质如精细胞或卵细胞是由于临床上
获得这些性细胞存在问题。在单倍体分型中避免采用配子的另一优点是应考虑
到减数分裂时有时可能发生重组,使原先顺式连接的基因座变成反式相关。因
此,分析配子的单倍型将产生与二倍体细胞获得的店倍体元件不同的(即错误
的)单倍型信息。
参见"获得序列信息"指包括用本领域技术人员已知的任何方法来测定核
酸分子的核苷酸序列,包括直接测序。可用熟知的技术,例如Maniatis等编著 的《分子克隆实验室手册》(Molecular Cloning: A Laboratory Manual),冷泉港 实验室(Cold Spring Habor Laboratory), 1982中所述的那些技术来获得核酸序 列。也可用自动化技术,包括利用从市场购买的仪器进行核酸测序。本文所用 术语"核酸"包括单链或双链核酸分子,包括完整核酸分子的片段或一部分。 包括DNA和RNA 二者。
也可用间接方法,如采用寡核苷酸探针获得序列信息。要获得序列信息通 常包括鉴定SNP,本领域技术人员有能力设计出能检测SNP的探针。探针一 般约长25个核苷酸,设计的多态性位点杂交时位于探针中心。
获得序列信息的前体步骤通常是用侧接有感兴趣区域的引物扩增核酸。可 获得任何实质组织来源(除了纯的红细胞外)的DNA。例如,可方便获得的组织 样品包括全血、精液、唾液、眼泪、尿液、粪便材料、汗液、口颊液、皮肤和 毛发。
制备的DNA可用本领域技术人员己知的适当方法,包括采用相应引物的 PCR方法进行分析。当需要分析整个基因组时,可采用全基因组扩增(WGA) 方法。例如,可反式激活分裂后期细胞而分离得到两种单倍体,然后进行WGA。 此种方法所用的商品化试剂盒不难购得,包括美国密苏里州圣路易斯西格玛公 司(Sigma-Aldrich Corp), St Louis, MO, USA)的GenoPlex⑧完全WGA试剂盒 (GenoPlex Complete WGAkit)。此试剂盒以基因组的随机片段化成为一系列模
板为基础。得到的较短DNA链可产生含有3'端引发和5'端引发的DNA片段 库。在起始阶段用线性恒温扩增复制该库,然后用有限轮次的几何(PCR)扩增。
用PCR扩增DNA有许多方法。这些方法包括Klein等人(PNAS 96(8): 4494-4499, 1999-4-13)所述的()完全无偏斜全基因组扩增,和(2)前景是能够扩 增所分离的单倍体元件中数十至数百个基因座的方法。
也经常对mRNA样品进行扩增。此时,扩增前通常要逆转录。可按WO 96/14839和WO 97/01603中所述扩增所有表达的mRNA。如果提供样品的对 象是杂合子在表达的mRNA中含有多态性位点,扩增其二倍体样品中的RNA 可产生两种靶分子。
鉴定核苷酸多态性的方便方法是采用微阵列技术。本发明此种实施生生世
世的例子可参见八{&11^1^ 投放市场的基因芯片&61160^口@)技术。此技术依
据光蚀刻加工5" X5"石英晶片包衣层,并用光敏化合物防止晶片与DNA探针 的第一核苷酸之间发生偶联。利用平板印刷遮光板阻断光或传送光到晶片表面 的特定位置。这种表面浸没在含有腺苷、胸苷、胞苷或鸟苷的溶液中,偶联只 发生在玻片上已通过光照脱保护的那些区域中。偶联的核酸还带有光敏保护基 团,因此要重复循环进行。许多公司,包括英国牛津的牛津基因技术公司 (Oxford Gene Technology, Oxford, UK),美国加州帕罗阿托的阿吉兰特科技 公司(Agilent Technologies, Palo Alto, CA USA)和美国威斯康星州麦迪逊 的宁布莱根系统有限公司(Nimblegen Systems Inc., Madison, WI, USA)提供 了其它固定探针的方法。
预计可将设计的探针所提供的对象两种单倍型信息加入到一个微阵列芯片 上。负责提供父亲单倍型信息的探针可用一种类型的荧光标签标记,而母亲的 单倍型信息可用不同的标签标记。
在本发明的一种实施方式中,两种或多种多态性组成了等位基因编码序列 的-一部分。可用本发明方法通过证明共有的等位基因过量来显示基因与性状之 间的相关性。本发明内容中,术语"等位基因"用于指与编码区相关的基因变 异,包括给定基因的交替剪接形式。本文所用的术语"共有等位基因"指一组 个体中某基因存在着(或共享)等位基因。可用技术人员能得到的许多统计学软 件包之一来发现共有等位基因的存在和程度。利用(存在有)与HapM叩所用的
非编码序列变体(如SNP和STR)不相同的等位基因编码序列可间接表明存在编 码的单倍型。这种HapMap间接法本身不能确定SNP是否代表了群体单倍型 的多样性、单倍型部件的长度、连锁不平衡和相。虽然本发明不限于分析任何 特定等位基因,但示范性等位基因是与CFTR、 DRB1和HLA-A有关的那些等 位基因。
本发明另一方面提供利用单倍体元件来测定对象的明确单倍型。 本发明还有一方面提供测定基因区与性状之间相关性的方法,该方法包括 以下步骤提供多个对象的第一组单倍体元件,所述个体代表了总体人群的遗 传多样性,分析该第一组单倍体元件中是否存在等位基因,提供总体人群多个 对象的第二组单倍体元件,所述对象具有性状而且不是来自同一家族,分析该 第二组单倍体元件中是否存在等位基因,测定第一与第二组单倍体元件之间等 位基因中共有等位基因的水平,共有等位基因过量表明该等位基因与性状相 关。在该方法的一种实施方式中,所述等位基因是编码序列等位基因。
本发明另一方面提供鉴定涉及多基因疾病或性状的基因的方法,该方法包 括采用本文所述的方法。鉴于现有的单倍体分型方法依靠推断,不是不可能而 是非常难以完全查明某给定基因在多基因疾病或性状中的作用。而本文提供的 明确单倍型方法可消除对多基因系统疾病中涉及的单个基因的混乱阐述所产 生的不确定性。
本领域技术人员明白,本发明可有许多用途。在一实施方式中,本发明提 供利用本文所述方法来鉴定涉及单基因疾病或表型的基因。另一实施方式用本 文所述方法来鉴定涉及多基因疾病或表型的基因。提供明确的单倍型也能组织 移植时供者与受者更好匹配。
本发明可应用于任何对象。所述对象可以是人、马、牛、山羊、绵羊、狗、 猫、或猪。技术人员将明白,生物如植物也适合这种应用。某些生物是多倍体 (如某些植物和有壳水生生物),鉴于它们的每个细胞存在三个或多个同源染色 体而产生的混乱情况,预期本发明具有甚至更大的优点。
本发明还有一方面提供用本文所述方法来鉴定参与药物反应的基因。药物 基因组学是研究个体的遗传特性是如何影响机体对药物的反应。药物基因组学 的基础是可为个体按他们本身的基因组成定制药物。环境、饮食、年龄、生活
类型和健康状态等都可能影响个体对药物治疗的反应,但应理解认为个体的基 因组成是制定更高效更安全的个体化给药的关键。
利用本发明方法,可根据与基因和疾病相关的蛋白质、酶及RNA分子制
定给药方案。这将有利于发现药物,使研究人员能制定耙向特定患病(细胞)的 治疗方案,其精确程度不仅最大程度提高了疗效而且也减少了对临近健康细胞 的损伤。
代替标准的使病人与正确药物相配的反复试验方法,临床医师将能够分析 病人的遗传概貌,从而在治疗开始时即能开出最佳的可利用的治疗药物处方。 这不仅可猜测出要为病人确定的正确药物,而且由于消除了发生不良反应的可 能性而加速了康复时间提高了安全。药物基因组学有潜力显著降低美国估计的
因药物不良反应导致每年发生10万人死亡和2百万人住院的现状。
实施本发明的一种结果可能是制定出更精确测定药物适合剂量的方法。目 前依据体重和年龄确定基础剂量的方法将代之以依据病人遗传学的剂量方法。 依据精确的遗传概貌,例如依据机体如何代谢该药物和分解代谢该药物所花费 的时间来制定给药方案。这将最大程度提高疗效和减少过量的可能性。
实施本发明的另一种结果可能是改进疾病筛选的方法。知晓个体的遗传概 貌就可能明确其对一种或多种疾病的易感性。知晓这种易感性则可让个人在较 年青时采取正确生活方式和改变环境以避免发生遗传病或减轻其严重程度。同 样,预先知晓对特定疾病的易感性可小心监视该个体,在最适当的阶段进行治 疗使疗效最佳。
实施本发明的还有一种结果是改进疫苗接种。用遗传物质如DNA或RNA 制备的疫苗没有现用疫苗的所有危险而显示出优良的应用前景。基因疫苗能激 活免疫系统但不引起感染。此种疫苗不昂贵、稳定、易于贮存,能够经工程改 造而同时携带几种病原体的(抗原)。
也可利用本发明来加速药物开发和审批程序。制药公司利用基因组中的靶 序列能更容易发现潜在的治疗药物。可回顾以往失败的候选药物它们是否能与 其服务的赢利市场人群相匹配。应能加速药物审批过程,因为申报的临床试验 是针对特定的遗传疾病人群,只要成功程度更好。通过只针对对药物具有反应 的那些个人进行临床试验可减少费用和危险性。
因此,本发明提供的精确遗传信息可减少药物不良反应的发生、减少药物 临床试验的失败、减少当局批准药物应用的时间、减少病人的治疗时间、减少 病人获得有效治疗必须服用的药物数量、减少疾病对机体的影响(通过早期检 测)和提高药物可能治疗的目标疾病范围。这些优点可导致保健费用的净降低。
如上所述,本发明方法也可用于鉴定赋予个体对疾病易感的基因或多个基 因,具体说的例子是多基因疾病如糖尿病。例如,已经发现的大多数糖尿病易 感基因使带有缺陷拷贝的人发生2型糖尿病的可能性提高了 3倍。已知钙蛋白
酶-10(—种蛋白酶)基因中的SNP与2型糖尿病相关。易患此病的墨西哥美国 人证明了这种相关性。对这种人群的DNA样品测序并进行统计学分析,发现 这些墨西哥美国人有胰岛素抗性,显示钙蛋白酶-10表达水平降低。本发明可 以更简化基因/疾病相关性的测定,促进其它遗传性复杂疾病如哮喘、精神分裂 症和阿耳茨海默病的基因基础鉴定。
本发明另一方面提供用于鉴定药物靶基因(或靶蛋白)或基因治疗的方法。 实施本发明可了解疾病的遗传基础,从而提供药物设计和基因治疗的有效靶 标。例如,如果鉴定到某基因或某些基因与疾病相关,可增强或抑制该基因的 活动来提供治疗效果。或者,可利用此基因的蛋白产物作为基础进行筛检试验, 通过结合调节此蛋白的活性。另外,如果了解此蛋白的三维结构,可进行合理 的药物设计。
另一方面,本发明提供用本文所述方法鉴定对疾病易感的个体。 一旦鉴定 出某基因与特定疾病相关,采用本发明方法技术人员将能设计出筛检该基因缺 陷形式的试验。鉴定到处于某些疾病发病危险的个人将能采取预防措施,如给 予药物治疗和改变生活方式。
还有一方面,本发明提供用所述方法鉴定对环境剌激易产生反应的个体。 这种应用的一个例子是鉴定对各种物质过敏的个人。某些个人对过敏原(如花 生或蜂毒)的反应可能导致潜在的致死性过敏反应。鉴定出特别敏感的个体即
能采取脱过敏治疗程序。
现通过以下非限制性实施例来说明本发明。
实施例
实施例1:用PALM罗伯特微光束仪在100X物镜下利用激光显微解剖和 压力弹射(LMPC)程序进行分裂中期染色体分离
在载玻片上制备分裂中期细胞涂片,该载玻片适合随后用PALM显微镜在 lOOx物镜下进行激光捕获。将一个分裂中期染色体与其姐妹染色体作空间分 离,包括用标准P.A丄.M显微镜程序将单个染色体弹射到装有6微升0.1%(Wv) 曲通-X-100的200jJ的超通量平帽PCR管(UItraFlux Flat Cap PCR tube)的帽中。
离心使弹射物转移到管底用于分析。
实施例2:扩增分离的染色体
通过PCR或MDA用标准程序扩增激光显微捕获分离的DNA。 CFTR(外 显子10)、 HLA-A(外显子2)、 DRB1(外显子2)的外显子特异性PCR扩增程序 如下。
CFTR
用嵌套PCR方法扩增gDNA、分裂中期或单个染色体中的CFTR基因座外 显子IO。第一轮扩增反应体积为30微升,采用TaqDNA聚合酶,所用引物如 下
CF-1F 5GACTTCACTTCTAATGATGAT-3'禾口
CF-l.R 5 ' —CTCTTCTAGTTGGCATGC-3 '
循环条件如下95。C3分钟;95。C30秒,50。C30秒,72°C 45秒,共25 轮;72°C 5分钟;4"C保持。
用第一轮产物作为模板进行第二轮嵌套式PCR,所用引物如下
CF-2F 5'-TGGGAGAACTGGAGCCTT-3'和
Cf-2r 5'-GCTTTGATGACGCTTCTGTAT—3'
将2微升第一轮产物转移到30微升反应液中,采用Taq聚合酶,循环条
件如下95。C3分钟;95。C30秒,55。C30秒,72。C30秒,共40轮;72°C 5
分钟;4X:保持。 HLA-A
用嵌套PCR方法扩增gDNA、分裂中期或单个染色体中的HLA-A基因座 外显子2。第一轮扩增HLA-A外显子2采用以下通用引物
sqr2
5'-CTCGGACCCGGAGACTGT-3'和 M13—5AInl-4 6
将基因组DNA、单个分裂中期或单个染色体用作起始模板。PCR采用 Platinum TaqDNA聚合酶,反应体积为25微升,在以下循环条件下进行反应 98°C 2分钟;98°C 5秒,60°C 120秒,72°C 120秒,10轮;98°C 5秒,65°C 30 秒,72"C60秒,25轮;72t:i0分钟,4。C保持。
用2微升第一轮产物进行HLA-A基因座外显子2的第二轮嵌套式扩增, 反应体积25微升,循环条件如下98°C 30秒;98°C 5秒,65°C 30秒,72°C 60 秒,10轮;98。C5秒,6(TC30秒,72。C60秒,25轮;72°C IO分钟;4。C保
持。采用以下引物
5 ' -■ 丁tgggacgaggac-acagggaaag-3 ',
5 ' -'gggaccaggagacacggaatg-3 ', 5'—gggacgaggagacacggaagg-3',
a e217 4b a5e2174e a3'e2174h
afe217 4(; a.fe2174d
a3"e217 4g sqr2
-GGjACGGGGAGACACGGAATG-3 ',
-丁tgggaccaggac;acacggaata-3 ', -gga(;gg(igagacacggaaag-3 ',
-〔;ggaccggaaca(:acggaawg, -gggacctgcagacacggaatg—3'和 —ctcggacccggagactgt-3'
HLA-DRB1
用嵌套式PCR方法扩增gDNA、分裂中期或单个染色体中的HLA-DRB1 基因座外显子2。用特异性引物进行HLA-DRB1*01和-DRB"09外显子2的
第一轮扩增。采用以下引物扩增DRBPOh
R31mf
5' --tgtaaaacgacggccag丁tcccagtgcccgctccct-3'和 R32mr
5' -c'aggaaacagcta了gaccm:acactcagattctccgc丁t-3 ' 采用以下引物扩增DRBP09:
工l-RB15mf
5 ' -tgtaaaacgacggccagtcagttaaggt1'ccagtgcca-3
和12-RB28mr
5 ' -CAGGAAACAGCrATGACCACACACACACTC'AGATTCCCA-3 '
将基因组DNA、单个分裂中期或单个染色体用作起始模板。PCR采用 Platinum TaqDNA聚合酶,体积25微升,在以下循环条件下进行反应95°C 3 分钟;95。C30秒,50。C120秒,72。C90秒,30轮;72°C 10分钟,4。C保持。
50微升第二轮(嵌套)反应液中包含2微升此初次反应液,采用TaqDNA聚 合酶和降解引物
GH46V1 5 ' -CCGGA丁(:STTCGTGTCCCCACAGCAYG-3 ', AnipB 5 * -CCGCTGCACTGTGAAGCTCT-3 ',
ArnpBl 5 ' -CCGCTGCACCGTGAAGC丁CT-3 ',
AmpB2 5 ' -CCGCTGCACTGTGAArCTCT-.3 '
循环条件如下95。C3分钟;95。C30秒,55。C30秒,72。C30秒,30-40
轮;72°C 5分钟;4。C保持。
CFTR基因座10、 HLA-A、 HLA-DRB1的分析结果见图1-7。这些图证实 了用激光显微解剖和弹射技术获得了分离的单倍体元件的有价值的序列信息。
最后,应知道,可对(上述内容)作出各种其它修饰和/或变化,但不脱离本 文所述的本发明思路。
权利要求
1.一种测定对象明确的单倍型的方法,该方法包括如下步骤提供对象的基本上分离的单倍体元件,和获得此单倍体元件的核苷酸序列信息。
2. 如权利要求1所述的方法,其特征在于,所述方法包括基本上分离对象 的单倍体元件的步骤。
3. 如权利要求1或2所述的方法,其特征在于,所述基本上分离单倍体元件的步骤采用物理方法。
4. 如权利要求3所述的方法,其特征在于,所述物理方法是染色体显微解 剖法。
5. 如权利要求3或4所述的方法,其特征在于,所述方法包括用激光弹射 单倍体元件而有效地基本上分离该单倍体元件。
6. 如权利要求2-5中任一项所述的方法,其特征在于,所述基本上分离对 象的单倍体元件的步骤包括采用二倍体物质作为所述单倍体元件的来源。
7. 如权利要求6所述的方法,其特征在于,所述二倍体物质获自体细胞。
8. 如权利要求1-7中任一项所述的方法,其特征在于,所述单倍体元件是 染色单体或染色单体的一个区段。
9. 如权利要求1-8中任一项所述的方法,其特征在于,所述核苷酸序列信 息是是否存在单核苷酸多态性。
10. 如权利要求1-9中任一项所述的方法,其特征在于,所述核苷酸序列 信息提供了等位基因信息。
11. 如权利要求l-10中任一项所述的方法,其特征在于,所述序列信息通 过直接测序提供。
12. 如权利要求1-10中任一项所述的方法,其特征在于,所述序列信息通过与信息寡核苷酸探针杂交而提供。
13. 如权利要求12所述的方法,其特征在于,所述寡核苷酸探针可检测是 否存在单核苷酸多态性。
14. 如权利要求13所述的方法,其特征在于,只提供顺式相单核苷酸多态 性相关。
15. 如权利要求10-14中任一项所述的方法,其特征在于,所述等位基因是编码区等位基因。
16. 如权利要求10-15中任一项所述的方法,其特征在于,所述等位基因 与CFTR、 DRB1或HLA-A相关。
17. 单倍体元件在测定对象明确单倍型中的应用。
18. —种测定基因区域与性状之间相关性的方法,该方法包括如下步骤提供多位个体的第一组单倍体元件,所述个体代表了常规人群的遗传多样性,分析第一组单倍体元件是否存在某等位基因;提供所述常规人群中多位个体的第二组单倍体元件,所述个体具有所述性 状,所述个体不来自同一家族;分析第二组单倍体元件是否存在所述等位基因,测定第一组与第二组单倍 体元件二者之间共有等位基因的水平;共有等位基因水平过度表明所述等位基因与性状相关。
19. 如权利要求18所述的方法,其特征在于,所述等位基因是编码序列等 位基因。
20. —种鉴定涉及多基因疾病或性状的基因的方法,所述方法包括采用权 利要求18或权利要求19所述的方法。
全文摘要
本发明涉及提供对象明确单倍型的方法。用本文所述方法产生的单倍型信息比现有技术只能给出推断的单倍型的方法提供的更为精确。因此,本发明一方面提供测定对象明确的单倍型的方法,该方法包括如下步骤提供对象的基本上分离的单倍体元件,和获得此单倍体元件的核苷酸序列信息。申请人提出,利用基本上分离的单倍体元件可消除对单倍型中两个或多个基因座相作出错误推断或误导推断的问题,从而可揭示单倍型中参与的两个或多个基因,不会因遗传方式的差异而复杂化。本发明方法采用基本上分离的单倍体元件作为序列分析的原料,保证了严格正确的顺式相相关性。
文档编号C12Q1/68GK101365944SQ200680051103
公开日2009年2月11日 申请日期2006年12月4日 优先权日2005年12月2日
发明者M·J·西蒙斯 申请人:西蒙斯单倍体有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1