高效基因组扫描方法

文档序号:6101683阅读:746来源:国知局
专利名称:高效基因组扫描方法
技术领域
本发明涉及一种方法,通过对多个核酸样品进行高效电泳来发现令人感兴趣的核酸。本发明还涉及一种在该方法中使用过的电泳装置。本发明中的方法在如下方面尤其有用,包括对基因组DNA多态性的检测、遗传分析、基因图谱绘制以及构建可包含一种生物整个基因组在内的重叠群或物理图谱。
背景技术
为了在核酸水平上检测生物之间如品种之间的差异,常规上使用RFLP(限制性酶切片段长度多态性)和RAPD(随机扩增的多态DNA)技术。然而,在RFLP方法中为了检测出与某特定基因邻近的标记,要求提供大量的DNA样品,还要求有根据现有RFLP标记制作的被测生物的基因组图谱。另外,构建图谱要求大量的时间、费用和人力。再有,仅有有限的生物具有包括足够密度的RFLP标记的遗传图谱。相对而言,利用RAPD方法进行多态性检测,可能应用于较大数目的样品中。然而,一次试验中获得的稳定的条带数是有限的。为了增加条带数目而放宽PCR条件,所得的多态性条带存在重现性低下等问题。
目前AFLP(扩增的片断长度多态性)方法的使用日益增加,因为该法能够一次比较大量的条带(50~100或更多)、DNA样品的消耗较低而且其所得条带也具有高重现性。然而,在该方法的原初程序中,测序凝胶有40~50cm大,且核酸条带要利用同位素通过放射自显影来检测。因此,这种方法要求丰富的经验、仅能够在限定的条件下使用、检测花费时间较多而且不能分析大量样品(一次至多仅能分析几十条带)。
最近发展起来一种方法,其中荧光引物PCR及自动测序仪的使用,使条带检测更加容易。所用的测序仪非常昂贵(不低于1~2千万日元),而且该方法的一次试验将在相当长的一段时间里占用这种本来是用于基因测序的测序仪。再者,由于该方法中的条带检测过程是利用一个使用自动测序仅的系统来完成的,因此在检测过程之后,无法将所要的条带分离出来以供分析。因此,一个主要的问题是,这些已检测到的条带不容易被做成可通过特异性引物检测的SCAR(特征性序列扩增区)标记。另外,目前可用的每套荧光引物只有8~9个类型,只能允许最多64~81个引物对组合。
RLGS(限制性酶切标记基因组扫描)是一种已知的用来一次对整个基因组多态性条带进行检测的方法。但这种方法也使用同位素,而且对低数量标记的检测需要好几天的时间。此外,该方法中还包括为每一个样品处理一块很大(40×30cm)或很狭长的琼脂糖凝胶,这就要求操作者不仅有丰富的经验还要有强健的肌肉。另外,在琼脂糖凝胶中用限制性内切酶切割核酸要求使用大量昂贵的限制性内切酶,从而使得该过程花费巨大。
举例说明,在水稻基因组(450MB)的RLGS中,仅有有限的8-碱基限制性内切酶如NotI可被用于对标记的部分进行限定。另外,从一次电泳周期中获得的斑点数的理论上限是450MB÷48=13,700,但因为电泳的特性,实际上这一数值只能达到其1/3~1/6,也就是2,000~4,000个斑点。再者,从每一个体来的样品是在一个单独的凝胶上电泳,不同样品的电泳图谱常常不能完全匹配。因此,必须要求有一种昂贵的大型扫描和二维电泳软件来比较个体间的不同。
在构建基因组文库的早期阶段,这些基因组文库中覆盖整个基因组的相邻的重叠克隆被基于它们之间的重叠区而组织并连接在一起,曾试图使用诸如RFLP图谱等现有图谱中的标记。然而,即使在那些所谓的高密度图谱中,也只有大约2,000个标记。甚至在具有小基因组(450MB)的水稻中,平均密度也仅为至少200KB/条带。这样的密度太低以至于不能构建一个覆盖整个基因组的重叠群。另一方面,检索如此之多的RFLP标记将需要巨大数量的费用、人力和时间。
最近常常用来构建一个覆盖整个基因组的叠连群的方法如下一个文库中的所属克隆被合适的限制性内切酶切割,所得片断在高分辨率的凝胶上电泳,获得的图谱经数字化后输入一个数据库,在计算机中具有相同图谱的克隆被相互连接在一起。然而,这种方法也要求巨大的劳动力和费用来酶切所有这些克隆、在它们的末端进行放射标记以及进行放射性自显影。

发明内容
本发明是由于考虑到上述情况而完成的。本发明的一个目的是提供一种方法以及用于本方法的一套电泳装置,该方法是为了有效且便宜地对大量核酸样品进行电泳从而检测所要的核酸。在本方法的优选实施方案中,本发明提供了一种利用本方法在基因组DNA中检测多态性的手段、一种遗传分析的手段、一种构建基因图谱的手段、一种对特定条带的一个基因组克隆进行鉴定的手段以及一种构建一群覆盖完整基因组的有组织的叠连群的手段。
为解决上述问题而进行广泛深入地研究之后,本发明者们想到用一种通常用于蛋白电泳的小型凝胶来进行电泳,可能适用于对大量的核酸进行有效的电泳并检测所要的核酸。
因此,本发明者们独立地制作了一种用于核酸电泳的电泳装置,在该装置上一次可安装多个10~30平方厘米大小的凝胶板、每块凝胶板上至少可加32个核酸样品,所有这些样品可在该电泳装置上同时进行电泳。利用该装置,本发明者们检索到了靠近Pyricularia oryzae Cavara中一个非病原基因或是靠近脆秆(kamairazu)突变基因的核酸标记。结果发现,与传统的RAPD方法比较,本法中检出多态性条带的效率有显著提高。
对检索到的多态性条带进行连锁分析表明,在检索的多态性条带中,即使是那些特别靠近靶基因处的条带,其通过本方法被检索的效率也明显高于传统方法。
另外,还发现本发明中的方法可用于分离和特异性地扩增各种重要的多态性条带,比如说通过上述方法找到的那些条带。例如,本发明者们使用本方法后,分离到了好几个可用于鉴定10个主要的水稻品种的条带;根据对10个品种之一的Akitakomachi具有特异性的条带的序列信息设计了引物;继而用从这10个精白米品种中得到的基因组DNA作模板进行了PCR。结果发现,仅能对Akitakomachi得到特异性的PCR-扩增产物。因此说明,本发明中的方法可以有效地提供多态性条带,这些条带可被用于对水稻品种进行便利地鉴定。
此外,本发明者们发现本发明中的方法可以被用于获得为构建生物的遗传图谱或构建覆盖生物整个基因组的叠连群所需的核酸标记。
因此,本发明涉及到一种方法,该方法用于在高效率低花费的情况下进行电泳并检测大量的核酸样品,还涉及到一种本方法中用过的电泳装置以及该装置的使用权。更明确地说,本发明提供(1)一种用于核酸电泳的方法,该方法包括以下步骤a)用一种电泳装置对核酸样品进行电泳,在该装置上一次可安装多个10~30平方厘米大小的凝胶板,利用该装置每块凝胶板至少可使32个核酸样品同时进行电泳。
b)电泳之后在凝胶上检测核酸条带。
(2)根据(1)中的方法,其中电泳用不连续缓冲系统的凝胶来进行;(3)根据(1)中的方法,其中的核酸样品是通过变性使双链DNA解离而制备的单链DNA,而且电泳是用变性凝胶完成;(4)根据(1)中的方法,其中对凝胶上核酸条带的检测是通过荧光染色或银染色来完成的;(5)根据(1)、(2)或(4)中任何一个的方法,其中该方法的运用是为了在被测个体之间检出基因组DNA的多态性;(6)根据(3)中的方法,其中该方法的运用是为了在被测个体之间检出基因组DNA的多态性;(7)根据(5)中的方法,其中核酸样品是通过AFLP法扩增的DNA片段;(8)根据(5)中的方法,其中核酸样品是异源双链DNA分子;(9)一种用于制备包含多态性的DNA片段的方法,该方法包括一种从凝胶中分离那些根据(5)~(8)中的任何一种方法检出的包含多态性的DNA片段的步骤;(10)一种包含被测个体之间的多态性的DNA片段,该DNA片段是根据(9)中的方法分离得到的;(11)根据(1)~(8)中任何一个的方法,其中本方法的使用是为了进行遗传学分析;(12)根据(11)中的方法,其中的遗传学分析是F2代分析、RI(重组白交)分析或QTL(量化性状位点)分析;(13)根据(1)~(8)中任何一个的方法,该方法是用于构建生物的遗传图谱;(14)某生物的一种遗传图谱,该遗传图谱是通过利用包含多态性的基因组DNA条带作为标记而构建的,该DNA条带是根据(13)中的方法检测的;
(15)一种从某基因组DNA文库中筛选克隆的方法,所筛选的克隆与通过(1)~(8)中任一方法在凝胶上检测到的特定的核酸条带相对应,该方法包括以下步骤a)把某一特定生物的基因组DNA文库分成多个亚文库,每一个亚文库的大小最多为该生物的1个基因组。
b)给每一个亚文库中的所有克隆分配属于该亚文库的一个行号、一个列号和一个板号,其中行、列和板分别是指X、Y和Z坐标。
c)通过以下过程来检测条带分别收集代表所有板中特定行的全部克隆(X坐标克隆组)、代表所有板中特定列的全部克隆(Y坐标克隆组)以及在一个亚文库中特定板上的全部克隆(Z坐标克隆组),通过从收集的每一个克隆组中提取DNA作为坐标样品,从该生物中制备基因组DNA作为对照,对比坐标样品和对照组并利用权利要求1~4中任一方法进行电泳。
d)在每一个X坐标克隆组、Y坐标克隆组和Z坐标克隆组中确定一个克隆,该克隆相对应于某一个条带,该条带在凝胶上与对照中所感兴趣的核酸具有相同的迁移率。
e)从亚文库中选出一个与已确定的三维坐标相符合的克隆。
(16)根据(15)中的方法,其中该方法的使用是为了构建覆盖特定生物全部基因组DNA的重叠群。
(17)一套用于核酸电泳的电泳装置,其中在该装置上一次可安装多个10~30平方厘米大小的凝胶板,而且利用该电泳装置每块凝胶板至少可使32个核酸样品同时进行电泳。
1.电泳方法和电泳装置本发明中的电泳装置是这样一种装置,在其上可放置小型聚丙烯酰胺凝胶板(10~30平方厘米大小,标准大小18平方厘米),利用该装置每块凝胶板一次至少可对32个(标准64个)检测样品以及几个(标准2~4个)分子量大小标记进行电泳,此外通过同时使用至少2块(标准4块)这样的凝胶板,利用该装置可对大量(标准256个)样品进行电泳。

图1至图4展示了本发明中电泳装置的一个实例。在该装置中,用一块18平方厘米的玻璃板制备了一块1毫米厚的凝胶,其上有66个孔,一次可允许64个样品和2个分子量大小标准进行电泳。该装置还允许一次对4块凝胶进行电泳。这些合在一起,一个周期可检测256个样品。
通常用于蛋白电泳的不连续聚丙烯酰胺电泳系统(Laemmli,英国(1970)自然,227680-685),可以用于本发明中的凝胶。利用这种凝胶,即使在宽度仅为1mm的泳道中,也可对多至10μl的样品进行高分辨率电泳。它还可提高条带检测的灵敏度。
在根据本发明的核酸电泳中,优选使用利用浓缩凝胶(Tris-HClpH6.8,0.5M)和分离凝胶(Tris-HCl pH8.8,1.5M)的双层电泳,来提高凝胶上核酸条带的分辨率。在核酸电泳中,根据目的不同,核酸可保持双链状态或被变性为单链。在后一种情况下,电泳中使用变性凝胶(凝胶中包含6~8.5M尿素)。当对核酸中的多态性检测时,用异源双链电泳可得到高度敏感检测,这种方法能够检测到用传统方法可能检不到的微小多态性。
在本发明中的核酸电泳中,优选使用银染或荧光染色来检测电泳后得到的核酸条带。银染可在短的时间范围内(1~2小时)进行高度灵敏的检测,要求较低的专业技能,而且与用同位素的方法来比更加安全。另外,除了提高灵敏度以外,该材料还可经过干燥来提供可保存的样品。利用荧光染色,在大约染色30分钟后可得到结果。由于该方法具有高的核酸回收率,荧光染色适于切割和收集条带。
本发明的方法中,扩增后的DNA或类似样品在凝胶上点样的效率可能被大幅度提高,例如,通过设计一种电泳凝胶梳子,使其在与96(8×12)孔板中相同的间隔(9mm)内至少可点两行样品。
2.核酸标记的检测尽管与其它形式的核酸多态性检测方法联合使用也有可能性,但如果将本发明中的方法与AFLP(扩增片断长度多态性。Vos P等,(1995)核酸研究234407-4414)联合使用来检测核酸多态性,能够令人信服地产生最高的效率。
例如,使用AFLP技术,在一个序列大小相当于水稻(450MB)的基因组中,用引物去扩增那些一个末端具有6碱基切割位点而另一个末端具有4碱基切割位点的基因组片断,当在每一个末端的引物中使用3个经过挑选的核苷酸(参照下述公式)时,每个泳道中可产生大约50个扩增条带。一个包括标准的4块凝胶256个样品泳道的系统,一次电泳周期将产生大约12,800个条带(实施例2)。
完整基因组大小÷6碱基限制性内切酶切后得到的片断数÷使用3核苷酸在基因组片断两个末端进行选择的选择率=条带数目(450MB÷46×2÷43×2=50)这一数目可与在RLGS法中几块凝胶中获得的信息数相比。另外,在本发明中的方法里,将被用来进行比较的多个泳道可以相邻放置,这样就易于对原始数据进行直接比较而不必要求特殊的读取装置。
如图6中所示(实施例2),在实际进行的AFLP试验中,其中水稻基因组被EcoRI和MseI酶切,获得的条带数目接近于上述公式中估计的数目。不过,具有可靠清晰度的条带大约是这一数目的一半。
取5~10μl样品,利用0.2ml的微孔板对96个样品进行PCR,可节约核酸以及诸如热稳定性DNA聚合酶等酶类的消耗,此外还可通过使用8道10μl取液器一次向凝胶上转移8个样品,来提高效率。因此,使用4块凝胶的一次电泳周期可以很容易地在一天中完成。
在电泳完成以后,4块凝胶可被同时置于一个容器中进行银染,这是一种高效率、低消耗并且简便的操作程序。一般来讲,可以使用市售的蛋白银染试剂盒。
至于用于AFLP的核苷酸引物,任何与所选定的限制性内切酶相一致的核苷酸都可以使用。而且,任何长度为1~几个碱基的选择性序列都可以被加在引物的3’端。这样就允许有几乎无限多的引物组合。对于一种具有一个1GB或稍小一些的基因组的植物,使用EcoRI和MseI分别作为6碱基限制性内切酶和4碱基限制性内切酶,以及使用含有3核苷酸选择序列的PCR引物,每一种引物都可有64个组合,扩增反应可以在64×64=4,096种组合下进行。这就可以在对其多态性比率为5~10%的亲本之间进行的遗传分析中的产生的10,000~20,000个多态性条带进行搜索。这一数目实际上已经足够用于物理图谱的构建,并且超过了传统遗传图谱中标记数目一个数量级或更多。
那些从全分析(Michelmore RW等,1991,美国科学院年报889828-9832)或其它方法中获得的重要条带,例如那些靠近目标基因的条带,在染色以后可以被切出来供进一步分析切下来的凝胶经压碎后在适当的缓冲液中提取,用于另一次PCR程序;该PCR产物接着被插入适当的质粒,经连接筛选后用于测序(实施例4)。
利用上述引物组合方式,就有可能按照如下步骤进行高效电泳,例如先制备好一套4个样品,其中2个来自于杂交亲本,另2个来自于F2代纯合个体,一个是大约10个显性个体的混合物,另一个是大约10个隐性个体的混合物;电泳按照每对引物4个泳道来进行;使用一套标准的电泳装置(4块凝胶、256个泳道),64对引物的电泳可以一次完成。在本实施例中,通过64次电泳(共约2个月时间),可完成对选定引物的所有4,096个组合的检测。在一种含有约10%的多态性的杂交组合中,例如indica-japonica杂交,这种方法适于对整个基因组中的20,000个多态性条带扫描和搜索。这种方法的效率超过传统方法1~2个数量级,而且不管有没有遗传图谱存在都可以在短时期内分离基因。用这种方法搜索所有4,096个组合所需的花费也是比较低的,大约为40万日元。
3.遗传分析1)F2代分析为确定任意的基因组合或多态性标记组合之间的遗传距离(或图上的距离),F2代分析是最常用的。将F2代分析与本发明协调使用,甚至能更有效地测定在2个多态性标记之间或一个多态性标记和一个基因之间的距离。
如同普通的F2代分析一样,一个品系(A系)包含某一给定的基因,而另一个品系(B系)不含有这一基因、或在涉及该基因的性状中有明显的差异、抑或是在那些A品系的性状中有适当的微小差异,这两个品系被选定并进行杂交来产生大量的F2代个体。将被用作分析的F2代个体的数目多少,取决于分析的精确度。如要达到1CM的精确度,选50个纯合个体(通常是隐性纯合个体),通过测定在100条染色体上所要的基因和一个多态性标记之间的重组频率,就足以确定该基因和该标记之间的遗传距离。在隐性纯合个体的分析中,如果没有重组发生,那么所有的个体都应该具有与表现隐性性状的一方亲本相同的标记;重组频率为1/100时,重组现象应该只能在一个个体的一条染色体上发现。
因为本发明的标准系统能够一次分析256个个体,如果可以得到如此多的纯合个体,一个电泳周期内就可以在512条染色体上对多态性标记的重组进行检测,这样可以提供0.2CM的精确度。将AFLP技术用在多态性标记分析上,可以使用极少量的DNA样品(100ng或更少)进行检测。基因组DNA被从每一个个体中制备出来,然后用EcorI和MseI双酶切。接着,把适于每一种酶的接头与基因组DNA片段相结合。使用适于这些接头的第一批引物进行第一次PCR,以便扩增这些基因组DNA片段。第二批引物是通过在每一个第一批引物的3′末端加上1~4个任意的碱基制备而成的。利用第二批引物,只有一部分其序列与所选择的碱基序列相符的基因组片段才能通过PCR得到扩增。接着,用本发明中的电泳,PCR产物被按照分子量大小分离开。电泳完成以后,凝胶被用如银染等方法染色,然后检测在所要的多态性标记中发生的重组。
在与本发明相一致的情况下,用来自多至256个个体的少量DNA所作的F2代分析可在一次电泳周期中完成,其精确度在0.2CM的水平。而且,这一过程不需要转印或放射性自显影。另外,在染色和干燥以后,这4块凝胶可被固定大小然后封在相夹中以便于分析结果。
2)RI分析RI(重组自交)系是指那些通过将由不同品系杂交得到的F2代个体之间反复自交几代后得到的品系。作为重复自交的结果,多数座位都是纯合的。因为杂合体的数量很有限,所以显-隐性状的分离比率是1∶1。因此,即使在显性个体中,所要的基因也是纯合的,这就使它们适合于本发明中的基因分析。这种基因分析方法比F2代分析更加精确,因为在F2代分析中杂合个体的比例是1/2,显-隐性状的分离比是3∶1。当有合适的RI品系可以利用时,按照与F2代分析同样的方式,采用从RI品系的个体中提取的基因组DNA所进行的基因分析(RI分析)可在与本发明相一致的情况下进行。
3)邻近标记的逼近筛选为了通过F2代分析缩小在混合分离群体分池分析中获得的目的基因的邻近标记的范围,并最终在图上标定出该基因最邻近的标记,本发明中的电泳是很有用的;标准方法中,可一次对256个样品进行电泳的能力,为基因分析提供了很高的效率。如2.中所述用水稻作例子(在indica-japonica杂交的情况下),假设20000个多态性标记的条带平均分布在全长2000CM的基因组上,那么在从混合分离群体分池分析中获得的目的基因的两边各10CM的范围内,也就是20CM的区域内所存在的标记的数目,估计可达到200个条带。为了把数目如此多的邻近标记缩减到只剩下最邻近的标记,第一步是按每个标记选取14个F2代的隐性纯合个体加上从每个亲本来的DNA,在16条泳道上电泳,以检查在目的基因和候选标记之间是否存在重组。这样,每一标记在28条染色体上的重组频率就被确定下来。这一过程的分辨率大约为3.5CM。这样,每块凝胶上可检测4个候选标记条带,相当于每一个电泳周期检测16个标记条带。同时,具有与目的基因距离最近的重组位点的个体也被鉴定出来。经过这一过程以后,仅需使用8个泳道对6个具有最近重组位点的个体及其亲本进行电泳,就可在6个电泳周期中完成对剩余192个标记的检测。
假设标记的位置和染色体重组的位置是均匀分布的,可以预计,作为上述筛选的结果,在基因两边各4CM的范围也就是8CM区域内大约可以获得40个标记条带。第二个步骤是把经第一步筛选后保留下来的标记以1CM的精确度定位于图上。首先,为了获得F2代的62个隐性纯和个体及其亲本的AFLP产物,给每个标记一块凝胶,使12个标记在3个电泳周期内完成检测。这一步骤为基因周围8CM的区域制出了一个精细的图谱,其中显示出了在紧靠着该基因,大约距该基因1CM之内的区域有重组发生的个体。利用这些含有最近重组位点的个体,对剩余的28个条带进行了分析以便确定它们在图上的位置。通过一次有224个泳道的电泳周期,也就是8个泳道(6个具有最邻近重组的个体加上其亲本)乘以28种组合,完成对基因周围区域的分析。
因此,从混合分离群体分池分析中所得的20000个多态性条带中所选出的这200个候选邻近标记,通过大约11个电泳周期,可以被缩小到只剩下在距基因大约1CM以内的最邻近标记。
在基因分离时,如果生物的基因组大小是1GB或更小些,那么这些标记中的平均1CM将是500kB或更小。因此,可以从一个平均插入大小约为150kB的BAC(细菌人工染色体)基因组文库中选出邻近基因的克隆,构建一个叠连群。
还有可能通过使用256个隐性纯合个体把分析精确度提高至0.2CM的水平。在这种情况下,通过选择大约4个合适的邻近标记并进行4次电泳周期,那些具有最邻近基因的重组位点的个体就能被鉴定出来。按照第二步骤同样的方式,利用这些具有邻近重组位点的个体来检查那些被假定为最靠近该基因的条带中的重组情况,通过1次电泳周期,最邻近的标记就可以很容易地被鉴定出来。
在这里,本发明的原理是通过两个假设来描述的电泳获得的条带在基因组或染色体上几乎是平均分布的;另外染色体的重组在该基因组上也是均匀发生的。然而,在实际上电泳条带和重组位点在染色体上的分布是不均一的。因此,根据检测中使用的F2代个体数目所得到的某邻近标记和该目的基因之间的距离,可能大于所预期的均匀分布情况下的距离。
4)标记育种上的应用按照上述方法获得的某特定性状基因的一个邻近标记,在通过杂交进行的传统育种中也可以被用作一个十分可靠的标记。而且,当对大量的杂交后代进行标记分析时,采用基因组扫描的分析方法,使得对数目众多的仅有少量DNA样品的个体的分析变得更容易。与传统的使用RFLP方法的技术相比,使用这种方法将提高操作效率并降低花费。
5)QTL(量化性状座位)分析上的应用一个QTL是一个量化性状的座位,其中该性状的表达不如质量性的表达那么强,而且在大多数情况下好几个座位参与该性状的表达。进行QTL分析是为了分析出在染色体上的什么位点的什么基因座位,对该性状表达的贡献有多大。
QTL分析要求,使用大量平均分布在整个基因组上的核酸标记时,应该对大批量的杂交后代个体中的多态性进行检测。例如,利用分布在一个2000CM的完整基因组上,标记密度为大约10CM/标记的标记群来进行QTL分析时,200个标记就要求用至少50个F2代个体来检测。用RFLP标记进行这一分析,需要用已被这50个个体的核酸转印的膜进行200次杂交。因为一次杂交周期需要2天,即使一次操作4块膜,整个过程也需要100天。即使一块膜可重复使用10次,也必须从50个个体的每一个体中收集多至100μg的核酸来制备20块膜。这些都要求巨大的劳动。
当用来研究的生物类似于水稻的indica-japonica杂交一样,有大约1 0%的多态性时,通过使用本发明中的AFLP方法,一个泳道上能得到很少几条多态性条带。因此,通过采用合适的引物对,只需用50对多一点的引物进行电泳,就可完成对200个标记的搜索。因为1次电泳周期可使用5个引物对(50×5=250个泳道),10个电泳周期(总共10天)就能完成对所有200个标记在50个个体中的检查。另外,每个个体只需要1μg的DNA就足够完成这一过程。
明确地说,在实施这一方法之前必须用AFLP标记制备一个该生物的基因组图谱。在没有一个类似这样的图谱可以利用的情况下,可以按照本发明如下面5中描述的方法很容易地构建一个图谱。从该图谱中选出以理想密度分布的标记群。这种情况下的效率是很高的,因为有可能选择尽可能少的引物对数目来覆盖整个基因组。
为了在育种中达到合适的多态性频率,推荐选择使用两个遗传关系较远的品系,其中一个对所感兴趣的性状是强表达而另一个对该性状仅表现出很低的表达。远缘品系间的育种能够抑制标记的缓慢分离。利用从这一育种过程得到的大约50个F2代或RI品系的个体(这一数目的变化取决于分析的目的),该感兴趣的性状就可被进行量化分析。而且,利用从每一个个体中制备的基因组DNA,可以通过在3.1)中描述的AFLP方法扩增基因组片断,然后用本发明中的系统对这些片断进行电泳,从而检测并记录这些标记条带中的多态性。
为了表示靠近每一个标记的每个座位对所感兴趣性状表达的贡献,将所感兴趣性状的个数乘以每一条带在一个亲本中的多态性个数,将所得乘积为每一个标记条带绘制在图上。
本发明可以被有效地用来检测必要的标记,对农业、畜牧业或多种生物中的某一特定的品种和/或品系进行鉴定。用从大量将被用来比较的品种中取得的DNA来进行AFLP,并用本发明中的电泳装置同时进行电泳,以便一次就可以为数十个、乃至100、以至于更多的品种比较数十打的条带。因此,即使有大量的品种,特异性的识别条带也可以被容易地选出来。
在该种应用中,虽然理论上n条带的组合能够鉴定多达2n个品种和/或品系,而在实际应用中可能稍微低于这一结果。
当用来比较的品种和/或品系相互之间亲缘关系非常接近,以至于用常规的如AFLP方法很难获得多态性时,可以把利用AFLP、RAPD或任何其它方法从参比样品的基因组中获得的产物混合在一起,经过加热后冷却来产生异源双链核酸分子;这些异源双链核酸分子可以用于电泳以便对所感兴趣的条带进行比较。这样,品种和/或品系间的差异可以被敏感、有效而且简单地检测出来。
当某一具有高度鉴别能力的特定条带被确定出来后,可以按照7中描述的方法将该条带分离出来,从而使该条带可以被用作特定的引物进行PCR扩增。在PCR扩增以后,简单的琼脂糖凝胶电泳在约1个小时之内就能够对该品种进行鉴定。此外,该引物还可被特定的荧光标记物标记,从而可以使用配备有荧光检测仪的PCR仪来确定该引物扩增的产物中是否存在这一条带。在该方法中,无需进行电泳,经过2~30分钟的PCR过程就可对该品种和/或品系进行鉴定。
5.构建生物的遗传图谱为了构建一个覆盖某生物整个基因组的遗传图谱(准确地说是核酸标记图谱),如同在QTL分析中一样,必须用F2代个体对几百乃至几千或更多的标记进行分析,其中F2代个体的数目取决于所需图谱的分辨率。在大多数高等植物尤其是主要作物中,基因组的总长度在1500~2000CM之间。因此,用传统的RFLP方法构建一个密度及精确度大约在1CM左右的基因组图谱,需要从至少100个F2代个体中制备杂交膜,并且要把这些膜对大约1800个标记反复转印杂交。由于包括制备探针在内,一次转印杂交周期需要4天时间,即使一次可操作4个探针,整个过程也需要1800天。此外,该过程要求有很大量的核酸,每一个F2代个体都必须有至少1mg的DNA。这就是为什么已经构建成的遗传图谱都是通过一个包括数十人的团队经过好几年的时间来完成的原因之一。
按照本发明,例如采用具有大约10%多态性的育种亲本,平均一对引物可显示4~5个多态性。因此,通过进行预检测程序来选择可显示至少6个多态性的引物对,然后用选出来的引物对通过标准模式对128个F2代个体进行作图,利用2个引物对在一次电泳周期中可对至少12个标记进行图谱定位。这样,一个包括1800个标记的精细图谱可被一个人在总共150天内完成,这比传统方法的效率至少高了10倍。一个包括约300个标记的图谱用1个人将在大约1个月内完成。
详细操作程序如下两个具有合适的遗传距离的品系进行杂交,获得其数目符合所需图谱精确度要求的RI系或F2代个体。为了是杂交不育和分离比率失真的可能性降到最低,这两个品系间的平均多态性频率应达到10%或稍高一些。要达到大约0.5~1CM的精确度,一般有64~128个个体就足够了。从这些个体中制备基因组DNA,然后按照与已经叙述过的F2代分析和RI分析相同的方式,用AFLP方法进行扩增。通过本发明中的系统,扩增后的PCR片段被电泳、染色并分析。这些是按如下步骤来完成的已制备的基因组DNA被放置于96孔板中。一部分DNA(大约0.1μg)被EcoRI和MseI双酶切。在切断的末端加上接头,然后用与接头有相同的5′末端的引物进行预扩增。然后,利用预扩增的PCR产物作为模板,利用含有合适数目选择性碱基的选择性引物进行第二次扩增。扩增产物被用在本发明中的电泳装置上进行电泳。采用8~12道的取液器或8~12道的微量调节注射器来提高凝胶加样效率。当被检测的样品是64个时,可用4套引物在1次电泳周期中对大约20个标记进行操作;当被检测的是128个样品时,则用2套引物对10个标记进行操作。诸如MAPL或MAPMAKER等遗传图谱构建软件可用于多态性分析,来提高效率。
使用一种本发明以前的系统的一个参考案例被展示在这里(图11)。在该系统中使用了8块15个泳道的凝胶。利用Azumamugi和Kanto Nakate Gold这两个大麦品种杂交育种产生的99个RI系个体,在大约2个月的时间里构建了一个包括227个标记的AFLP图谱。该AFLP图谱被与一个已存在的包括45个标记的图谱整合在了一起,从而产生一个具有272个标记的图谱。在这个案例中,该AFLP图谱被一个人在大约2个月的时间里完成,其效率比传统的图谱构建方法如那些使用STS标记的方法高了约40倍。本发明中的操作效率甚至比这一早先系统更加提高。
6.在具有较大基因组生物中的应用当与AFLP联合使用时,本发明按设想可发挥出它的最大潜力。AFLP的一个结果是因为基因组被EcoRI(识别6碱基序列)和MseI(识别4碱基序列)双酶切成许多片断而产生;与切断的位点互补的接头被加在片断末端;在第一次扩增中接头序列被用作PCR引物,以便使所有的片断都能够被扩增;第二次扩增中使用的引物是选择性引物,该引物是在第一次扩增引物的3′末端附加上了1至几个碱基的选择性序列;因此只有那些在其两个末端都有能与选择性引物互补的序列的基因组片断才能被特异性扩增。在生物具有相对较小基因组(如水稻450MB)的情况下,在两个末端的EcoRI和MseI位点都附加了3碱基选择性序列的选择性引物被用作第二次扩增引物。因此,如“2.核酸标记的检测”中所述,平均有约50个条带被选择性扩增。对于其基因组大小类似于丝状真菌,如P.oryzae Cavara(40MB)的生物,在两个切割位点各加上一个碱基就将产生50×(40MB/450MB)×16=70个条带。对于基因组较大的生物,只需简单地把AFLP引物中选择性序列的碱基数提高到3或4个,基本上就可以应用本方法了。
作为选择,电泳的条件可以被改变。通常,在PCR产物的电泳过程中,对在非变形条件下保持双链状态的PCR产物进行电泳十分方便。然而,对于一个具有较大基因组(如大麦5.5GB)的生物,如果PCR产物是双链,电泳条带可能就不会被很清楚地分离开来。因此,通过使用含有8.5M尿素的变性凝胶并且把DNA样品在存在50%甲酰胺的情况下于90℃处理3分钟,使DNA解离成为单链后再进行电泳,数目众多的条带就被清晰地区分开来(实施例4)。
实际上,当基因组大小增加时,进行AFLP的困难也会增加。因此,联合起来使用以上两种方法是值得推荐的。
7.为制备SCAR标记对重要条带进行分离和测序在本发明的实施方案中,如上面已经叙述过的3.、4和5.节中,每一种情况下条带所具有的特定重要信息都被确定出来邻近某一特定基因的条带(在节3.中)、可用于品种鉴定的条带(在节4.中)以及用作遗传图谱上的位置标记的条带(在节5.中)。
这些条带可被从凝胶中切出来,按照如下步骤生成SCAR(特征性序列扩增区域)标记在切下来的凝胶中的DNA物质,通过粉碎抽提、冻融、电泳或其它方法被洗脱出来,使用同样的引物对其进行PCR扩增。所得PCR产物被插入合适的克隆载体用于测序。在确定其序列以后,两个末端的序列被用作SCAR标记的引物(实施例3)。在这种情况下,诸如cyber绿等荧光染料的使用可以使核酸提取变得更加容易。使用测序仪的AFLP方法中,条带可以被鉴定但不能被提取出来,与该方法相比较,本发明中的方法更加简单,同时完全利用了AFLP的重要特性。
8.分离包含特定条带的基因组克隆当发现包含重要信息的条带后,如上面3.、4.和5.节中举例说明的,包含这些条带的基因组克隆可能需要被分离出来。特别是用定位克隆来分离某一具有重要功能的基因时,有必要按如下步骤制备一系列的重叠克隆通过如2或3中的方法将该基因两端的最邻近标记鉴定出来;利用这些标记,一个包含这些条带的克隆被从一个象BAC文库这样的基因组文库中分离出来;利用处在该克隆两末端的标记,可鉴定出另一个相邻的克隆,接着重复这一过程(步移);于是一个连续重叠克隆的系列被制备出来,这个克隆系列把那些位于该基因两末端的标记(旁侧标记)之间连接起来。
通过集落杂交,一个基因组文库中的克隆成员被组织并连接在膜上,当这些高密度膜被制备好以后,利用扩增得到的条带作为探针在这些膜上进行杂交,目标克隆就可能被筛选出来。这些条带可以通过如7.节中描述的直接PCR扩增或是被当作SCAR标记来扩增的途径进行制备。
作为选择,包含感兴趣条带的克隆也可以按照如下步骤,在不需要杂交的情况下进行鉴定根据9.节,目标生物的基因组文库被分解成一些亚文库;同等的标记是利用亚基因组文库克隆的混合DNA制备的,这些克隆相对应于微孔板中的行、列和板号;这些同等的标记备用于使用同样的引物对并以基因组DNA为对照的AFLP分析,然后进行本发明中的电泳;这样,根据与对照中的扩增条带相同的条带所处的行、列以及板的坐标,包含感兴趣条带的克隆就被鉴定出来。
9.制备覆盖生物整个基因组的重叠群如果按照一种生物的基因组文库例如那些基于BAC的文库的要求来讲,所有这些组成克隆的邻近情况若明确的话,那么相互重叠的克隆就被连接在一起从而构建一个覆盖整个基因组的更大的重叠群(物理图谱)。以这种方式构建成的物理图谱是该生物基因组结构的一种重现。即使在整个基因组的序列被测定之前,完成这样的一个图谱,也使得分离和鉴定重要的功能基因更加容易,而且使对该生物基因组的操作更加便利。实际上,一旦完成完整基因组的重叠群,随后的基因组测序工作就可能被完全机械化。迄今为止,完整基因组重叠群的构建仍然要求一个包括几十个人员在内的大研究组。然而,利用本发明,一个可覆盖其基因组大小接近于水稻(大约500MB)的生物的完整基因组的重叠群,有可能仅用一个人在约一年的时间内完成。
构建一个完整基因组重叠群的主要困难,是由于难以获得特异性的标签来标记组成该基因组文库的每一个克隆。在本发明中,通过与AFLP联合使用,在一次电泳周期内可获得多至30~50个高度特异性的条带,这些条带被用两个参数来标注,一个是在其两端的3碱基序列、另一个是该条带的碱基数(长度)。每一个这样的特异性条带都可能与一个该基因组的组成克隆相关联,而且这些条带的分布密度可能被有效地降低到小于BAC克隆的长度。因此,就不难把拥有同样标记的克隆连在一起。
为了在AFLP条带和文库克隆之间达到差不多一对一的对应性,把通常其容量有几个乃至更多的基因组等价物的完整基因组文库,分成几个亚文库,每一个亚文库大约有相当于1个基因组的容量。通过微孔板的行坐标、列坐标和板坐标,每一个亚文库的组成克隆都被唯一地鉴别出来。因此,利用行、列和板号作为坐标轴的坐标值,从具有共同的轴坐标的克隆群体中收集少量的DNA,然后将它们混合在一起来提供代表每一坐标轴上各位置的坐标样品。通过进行本发明中的基因组扫描,具体是利用这些坐标样品作为模板进行AFLP,利用完整基因组DNA作模板制备对照,将对照加在坐标样品泳道的两边进行电泳,然后将所得AFLP电泳图与对照泳道相比较,与基因组DNA模板扩增所得的特异性条带相对应的克隆可以容易地被从亚文库中查出来。当亚群体中有2~n个符合要求的克隆时,会有23=8~n3个克隆与这些条带相对应。在这种情况下,通过除去这8个克隆并实施该基因组扫描方法中的第二次电泳,真实地符合要求的2个克隆就被鉴定出来。制备亚文库的坐标样品的特定程序展示于实施例5.中。
就一个其基因组大小与P.oryzae Cavara(大约40MB)处于一个级别且平均克隆插入为120kB的文库来说,一个内含大约为1个基因组等价物的亚克隆将包括约300个克隆,这些克隆可能被保存于8行、6列和6个半板中。因此,如果一块凝胶包括22个泳道,将其中20个用于坐标样品、2个用于对照,那么2块凝胶就足以对相当于6个基因组等价物的亚克隆即完整的基因组文库进行电泳。换句话说,如果用两对引物在1次电泳周期能够把大约60个条带进行鉴定和坐标定位,那么在25个电泳周期内就可以处理1500个条带。这相当于40MB/1500个条带=27kB/条带的密度,也就等于在平均大小为120kB的每个BAC克隆中平均鉴定出4.4个条带。假设有平均6个基因组等价物的克隆,这一密度预计足以覆盖整个基因组(参照实施例5)。
当基因组大小与水稻(450MB)处于一个级别,如果该文库相当于6个基因组等价物且平均克隆插入大小为150kB时,通过使用32块微孔板制备一个其内容相当于1个基因组等价物的16个行、12个列、16×2个板的矩阵,在1次电泳周期中就可完成对6个亚文库的电泳。这就使得每个周期可鉴定25个条带。因此,200个电泳周期将鉴定出5000个条带,相当于450MB/5000个条带=90kB/条带的密度。这一密度应该足够用来从一个其中平均克隆大小为150kB并以6倍冗余状态存在的基因组中,构建长重叠群。
附图简述图1是在基因组扫描中使用的一个标准电泳装置主体的正视图和顶视图,该电泳装置一次能够处理4块18平方厘米大的凝胶。在每一块凝胶上,用梳子做成的加样孔可以1mm的宽度加载66~68个样品。因为有2~4个泳道用来加载分子量标记或类似样品,所以一次基本上可同时处理64个样品/块凝胶,也就是4块凝胶上共256个样品。通过使用8道微量取液器,PCR扩增所得样品可被高效率地加在这些凝胶上。
图2是一个在基因组扫描中使用的标准电泳装置上固定凝胶的零件附图。
图3是一个在基因组扫描中使用的标准电泳装置的梳子的附图。
图4是一个在基因组扫描中使用的一套完整的标准电泳装置的照片。
图5是一个电泳图,该图显示了利用基因组筛选从混合分离群体分池分析中获得的avrPib基因邻近标记的候选者的初步筛选结果,该基因是P.oryzae Cavara的一个非致病基因。将基因组扫描和在A、B、C和D这4对引物上进行的AFLP结合使用,这4对引物能够产生不同的邻近标记候选者,进行电泳时,从左边开始依次分别是avrPib-和+的亲本株系、avrPib-和+的混合分离群体池以及avrPib-和+的六个F1代株系中的每一个成员。三角形图形标记表示候选标记的条带。用A、B和C引物对得到的初次筛选结果显示了预期的共分离基因型。相反,用引物对D在一个-株系和一个+株系中观察到了重组(黑三角形)。注意每一对引物产生了5~60个条带。在一块凝胶上可扫描3~4000个条带。因此该装置一次能够处理4块凝胶,在一个周期中可以对12~16000个条带进行扫描。这些引物对中使用的选择性核苷酸数在EcoRI端是3个,在MspI端是1个。用在这里的杂交系之间的多态性频率约为5%。因为P.oryzae Cavara的完整基因组大小约为500CM,用256对引物可获得约500个多态性条带,即整个基因组都被密度为1CM/条带的标记所覆盖。
图6是P.oryzae Cavara的一个非致病基因avrPib周围的精细图谱,其中该图谱是利用125个F1代株系,通过RAPD方法和基因组扫描把该基因的邻近标记进行图谱定位而制得的。如表1中所示,寻找邻近标记是通过利用700条引物的RAPD方法以及用251对引物的PCR进行的基因组扫描方法来完成的。用RAPD方法来寻找和作图需3个月时间,而使用基因组扫描在1个月内就可完成。由于仅有非常清晰的条带才被记录下来,所以记录的条带数看起来较少。An通过基因组扫描获得的标记,(Rn)通过RAPD方法获得的标记。
图7是一个电泳图谱,该图展示了一个为寻找bc-3的邻近标记而作的混合分离群体分池分析的实例,bc-3是水稻中纤维素合成突变体Kamairazu中的一个基因。为每一个引物显示四个泳道从左边开始依次是突变亲本品系(M11japonica)、突变体(隐性)纯系的混合分离群体池、野生型(显性)纯系的混合分离群体池以及野生型亲本品系(Kasalathindica)。图上的箭头表示邻近标记的候选者,它们表现了在不同的混合分离群体池之间的显著差异。当仅记录明显的条带时,每一泳道有20~30个条带;把较狭小的条带也包括进来以后,每个泳道平均可观察到50个条带,这个数目反映出了理论值。
图8是一个用基因组扫描技术寻找大麦中控制双棱基因的照片。用Azumamugi(六棱)对Azumamugi(六棱)和Kanto Nakate Gold(双棱)的杂交种回交7代以上后,选出具有双棱的品系来建立一个准纯合的遗传品系,该品系具有双棱但却是Azumamugi的遗传背景。在图8的照片中,通过基因组扫描对该品系及回交亲本Azumamugi进行了比较。在32个泳道上寻找从16对引物中产生的差异,但只有很有限数目的条带表现出差异。具有差异的条带便可能是在与双棱基因紧密连锁区域中的多态性条带。
图9A展示了一些SCAR(特征性序列扩增区域)标记的实例,这些标记是通过分离针对一个水稻品种秋田小町(Akitakomachi)的特异性条带而获得的。反向的部分是制备好的引物。图9B是一个电泳图,显示了利用图9A中展示的引物,通过PCR对10个主要的水稻品种的核酸进行扩增所产生的条带。仅从Akitakomachi中扩增得到了一个特异性的条带。在“对照1”中,一个已被分离出来用于测序的特异性条带被用作模板。
图10显示了一个相对应于某一特定条带的克隆是怎样被利用基因组扫描直接从基因组文库中筛选出来。在这种情况下,其中包括6个基因组等价物且平均克隆插入大小为120kB的P.oryzae Cavara(基因组大小40MB)文库,被分成6个亚文库,每个亚文库中含大约1个基因组等价物,在每一个亚文库中对与基因组扫描条带相对应的克隆进行鉴定。
在图10A中,那个用一个斑点显示的克隆被表示为行C、列4和板a。代表行C的坐标的坐标样品的制备,是通过从全部半板上行C中所有列中的每一个克隆中各提取10ng DNA并混合在一起后制得的。在图10B中,一个亚文库由22个泳道组成,其中包括对照基因组泳道以及对应于8个行、6个列和6个半板的坐标样品的泳道。6个基因组等价物可被加载于2块凝胶上在1次电泳周期中进行处理。根据与对照显示相同目标条带的样品所处的坐标,相应的克隆就被鉴定出来。
图11是一个通过15泳道凝胶电泳构建成功的大麦基因图谱的实例,基因组扫描就是从其中发展起来的。在总共272个标记中,有227个AFLP标记是通过该方法进行图谱定位的。
本发明实施的最佳模式提供以下这些实施例是为了更进一步说明本发明,但不能认为本发明仅限于这些特定的例子。
对邻近一个对水稻无致病性的avrPib基因的核酸标记的精细作图与水稻中的抗病基因Pi-b相对应的avrPib是P.oryzae Cavara中的非致病基因,该基因被用来寻找处于其周围的核酸标记,而且这些标记和该基因之间的距离已被确定。基因avrPib是P.oryzae Cavara中的一个非致病基因,该基因与水稻中的抗病基因Pi-b相对应;水稻对病原P.oryzae Cavara的抗性依赖于水稻中的Pi-b基因对avrPib基因产物的识别。因此,在avrPib基因中的突变会破坏Pi-b基因引导的抗性。这样,为了研究造成突变的原因以及抗性基因产物和非致病基因产物之间的相互作用,有必要从抗性已被破坏了的品系中分离avrPib基因。通过用从已观察到抗性瓦解的部分中分离出来的P.oryzae Cavara与正在和Pi-b发生相互作用的P.oryzae Cavara进行杂交,比较了分别使用本发明中的方法和一种有代表性的传统方法即RAPD方法对该非致病基因所作的精细作图。
将保留有avrPib的株系(因此不能感染含有Pi-b的水稻)和没有avrPib的株系(因此能感染含有Pi-b的水稻)之间进行杂交,来产生大量的F1代株系。为了确定在每一个株系中是否存在avrPib,这些F1代株系被注入含有Pi-b的水稻中。然后分别从存在avrPib的群体(+)和不存在avrPib的群体(-)中制备基因组DNA的混合分离群体池,在每一个群体中使用几十个左右的株系。采用4个株系,即来自每一个亲本株系的2个以及分别来自(+)和(-)混合分离群体池中的2个,用对64×4=256引物进行AFLP分析。因为P.oryzaeCavara的基因组大小约为40MB,是水稻基因组大小的1/10左右,所以覆盖整个基因组所需的引物对数目是水稻所需的1/16左右。
为了对比,大约540个引物被用于RAPD(随机扩增多态性DNA)扩增。在RAPD方法中,当进行混合分离群体分池分析需要有540×4=2160个泳道时,用一种大型的水下凝胶一次就可能对,例如,144个泳道进行处理。因为只有稳定且明显的条带才能被选择用于对比。这样,经15天的时间,经过选择的1860个条带被在混合分离群体池之间进行比较,结果在亲本之间得到了约100个多态性条带。
与之相比,本发明中的方法在4天内就可比较并查寻5700个条带,结果得到304个多态性条带(表1)。这表明该方法的效率比RAPD法的效率高11倍(5700/1860×15/4)。
表1多态性条带平均条带使用的引 获得的总多态性百与avrPib连锁的数/每引物物对数目 条带数 总数 分率(%)(紧密连锁的) 对RAPD 539 186110110(4)3.5 5.4AFLP 251 571030486(41) 22.75.3在这些多态性条带中,6个来自RAPD以及41个来自AFLP的被认为是该基因邻近标记条带的候选者,其中混合分离群体分池分析揭示出在显性和隐性纯合群体之间有很显著的差异。以12个F1代株系作为参比,这些候选条带首先被提交进行初次筛选(图5)。提高使用的F1代株系的数目,最后,当用到125个F1代株系时avrPib基因周围的精细图谱被构建出来(图6)。在距离目标avrPib基因20CM的范围之内,RAPD方法显示出两个标记条带而本发明中的方法则有12个条带。用RAPD方法检测到的距该基因最近的条带在离该基因5.3CM的位置,而用本发明中方法检测到的一个最近条带则在距该基因1.8CM处,比用RAPD法得到的近得多。这一距离被认为小到足以用来构建一个物理图谱,因为在P.oryzae Cavara中1CM相当于约80kB。
水稻中的一个Kamairazu(脆秆)突变基因bc-3的精细作图bc-3基因是造成水稻纤维素合成抑制突变(Kamairazu或脆秆)的基因,纤维素合成是水稻秆中细胞壁进行2次加厚所必需的过程。通过基因组扫描,邻近bc-3基因的核酸标记被进行了检查。一个iaponica中的bc-3突变M11和一个indica中的野生型Kasalath被用来作为杂交亲本进行F2代分析。十个纯合突变个体和八个纯合的野生型个体被提高到F3代分析来鉴定,而它们的基因组DNA混合物与那些亲本品系的一起被提交进行与AFLP结合起来的基因组扫描混合分离群体分池分析。这些核酸被两个酶,即EcoRI(识别6碱基位点的)和MseI(识别4碱基位点的)双酶切。然后,用1430个在酶切末端连接有3-碱基选择性核苷酸的引物的组合,完成了依据混合分离群体分池分析法的基因组扫描。该结果的实例展示在图7中。
结果获得了97个邻近标记的候选者,其中的50个可用于检测隐性纯合个体中的重组标记。为了缩小候选标记的范围,每一个候选者都被用10个隐性纯合个体(20条染色体)进行F2代分析。其中的24个候选标记被用32个隐性纯合个体即64条染色体进行分析,发现有1个标记与靶基因(距其0CM)共分离(图7)。
当本发明被用在对某种基因组很大的生物如大麦(5.5GB)进行的AFLP中时,如果在每一个基因组末端引物上所加的选择性序列长度为3个碱基,那么如果仍然采用较小基因组如水稻基因组(450MB)所用的方法,即用于检测的DNA保持在非变形条件下的双链状态,则有可能得不到显著的条带。在这种情况下,有一种解决办法是增加选择性引物的数目。然而作为另一种选择,通过电泳时把DNA变性成为单链的方法,即使仍用3碱基选择性标记也可能达到足够的条带分辨率。为了提供这样的变性条件,在凝胶中加入了6~8.5M的尿素,在样品缓冲液中加入了50%的甲酰胺,而且在马上进行电泳之前要把样品置于90℃中3分钟。
图8是一个用基因组扫描技术寻找大麦中控制双排穗性状基因的结果。用Azumamugi(六棱)对Azumamugi(六棱)和Kanto Nakate Gold(双棱)的杂交种回交7代以上后,选出具有双棱的品系来建立一个准纯合的遗传品系,该品系具有双棱但却是Azumamugi的遗传背景。在图8的照片中,通过基因组扫描对该品系及回交亲本Azumamugi进行了比较。在32个泳道上检查了从16对引物中产生的差异,但只有很有限数目的条带表现出差异。具有差异的条带便可能是存在于与双棱基因紧密连锁区域中的多态性条带。
就大麦来说,在这种条件下平均可鉴定出来58个条带。假设用大规模测序凝胶(Castilioni等,1998,遗传学1492039-2056)对大麦进行AFLP分析时平均可获得约88个条带,那么这些条带中约有67%可被本方法鉴定。本发明中的方法能够在每块凝胶上每天处理256个泳道,其效率比使用处理能力大约为每天32个泳道的大凝胶的方法高5~6倍。
分离通过基因组扫描鉴定出来的水稻品种特异性条带以及通过测序设计特异性引物一方面为了使市场销售的精白米中进行品种鉴定更加容易,另一方面为了建立一个任何人用之都能通过进行快速的PCR很容易地鉴定水稻品种的系统,本发明者们开发了SCAR标记。
通过使用55条引物的基因组扫描(AFLP),寻找那些可在10个主要的市售精大米中把不同品种区分开来的条带。该检测需2天时间。在发现的几个适于用作品种鉴定的条带中,一个对品种″Akitakomachi″有特异性的条带被准备出来在宽泳道中进行电泳。电泳完成以后,用一种荧光染料(vistra绿)对该泳道染色,将条带切出来在TE缓冲液中粉碎抽提,然后用AFLP中使用的引物对其进行PCR扩增。所得PCR产物被插入合适的质粒以便导入E.Coli。在对E.Coli进行培养和扩增以后,该质粒被提取出来并通过限制内切酶鉴定来确定其中存在目的插入片断。接下来对质粒进行序列分析从而设计可特异地扩增该目的条带的引物(图9A)。当用从10个主要品种来的DNA为模板,用这些引物为引物进行PCR扩增时,发现仅能从Akitakomachi的扩增中得到一条特异性的条带(图9B)。
从文库中筛选出相对应于某一核酸标记的克隆为了鉴别出与通过本方法从基因组文库中获得的某一特定条带相对应的克隆,一般是用如上面实施例3中所述方法获得的SCAR标记,通过对载有该文库的高密度杂交膜进行集落杂交,从而筛选出阳性克隆。然而,这一方法需要耗费劳动和时间来制备大量的条带。而且,分离出来的条带其内部序列不一定是唯一的。
文库中相对应于某一特定条带的克隆可通过下面的基因组扫描被直接筛选出来,而不需要分离标记条带首先,用一种质粒提取仪从全部文库克隆中提取如BAC等基因组克隆的DNA,以便制备出DNA板子,使其中所载DNA与原来克隆板上所载克隆中含有的DNA序列相同。然后把整个基因组文库分成几个含有1个基因组等价物或更小的亚文库。因此,对于一个特定的条带来讲每一个亚文库中平均包括1个与之相对应的克隆。更进一步,以行、列和板号作为坐标,从构成一个亚文库的几个板上选取具有相同坐标值的克隆,从每一个克隆中各采集10ng DNA,从而获得对应于不同坐标位置的坐标样品。例如,第3行的坐标样品是在不考虑板号和列号的情况下,从每一个位于第3行的克隆中采集10ng DNA并混合在一起而得来的。所有的坐标样品都是以同样的方式制备的。以相同的方式对这些坐标样品和作为对照的完整基因组样品进行基因组扫描分析。坐标样品DNA可以在不必抽提基因组文库中的所有克隆的DNA的情况下进行制备;替代方法是,可以把每一行、列或板中的所有克隆混合在一起后,培养和扩增至约2ml,从其中提取混合的DNA从而得到坐标样品。一旦一个完整基因组对照扩增产物中的感兴趣条带,在特定行、列和板号的坐标样品扩增产物中找到与它相符的条带,那么这些行、列和板号的值就表示出了靶克隆的一个三维坐标,这样就能把该克隆从亚文库中挑出来。在亚文库中包括好几个候选克隆的情况下,可把这些候选者挑选出来然后与对照一起进行再次基因组扫描,以确定最后的结果(图10)。
本方法对于构建完整基因组的重叠群是特别有效的,因为该法可以把从基因组扫描中获得的所有条带与文库中的克隆相匹配,从而使一个基因组文库的所有组成克隆都被覆盖进来。这样,一个全基因组的重叠群可以容易地被一个人构建完成。
图10A显示了一个特定的克隆是怎样被从一个包括6个半板(3个整板)的基因组亚文库中鉴别出来,其中P.oryzae Cavara(基因组大小40MB)的基因组文库(平均插入120kB,6个基因组等价物)被分成6个亚文库,以使每个亚文库大约包括1个基因组等价物。在每一个基因组亚文库中,代表第1行的坐标样品的制备,是通过把6个半板中所有第1行的克隆(6行×6个半板=36个克隆)的10μg DNA混合物收集起来而完成的。因此,每一个基因组亚文库包括总数为20个的坐标样品,代表8个行、6个列和6个板,可以对整个基因组亚文库中的8×6×6=288个克隆进行鉴别。
如图10B中所示,用基因组扫描一次进行22个泳道的电泳,其中在20个泳道上用那些坐标样品作为坐标板,对照全基因组在2个泳道上被用作坐标板。这样,相对应于对照中所获得条带的克隆可以方便地从亚基因组文库中鉴别出来。
因为3个次级基因组文库可被放置于1块电泳凝胶(66个泳道)上进行电泳,仅需2块凝胶就可以覆盖整个基因组也即6个亚文库。因此,就使用1对引物的1次AFLP周期来说,在其中有6个基因组等价物的完整基因组文库中,寻找相对应于25~40个条带的克隆的工作可用两块凝胶完成。由于标准的基因组扫描中每个周期可处理4块凝胶,所以在整个基因组文库中,对相对应于通过2对引物获得的50~80个条带的克隆进行的鉴别,可在1次电泳周期内完成。
因此,即使按照保守的估计,在1次电泳周期中也可以把由2套引物产生的约50~80个条带与其相对应的克隆进行匹配;在25个周期中可把约1200~2000个条带与相对应的基因组进行匹配。假设P.oryzae Cavara的基因组大小为40MB,获得1500个条带将要求在基因组上的平均条带分布密度为40MB/1500个条带=27kB/条带,其意味着在平均大小为120kB的一个克隆中平均能获得4.4个条带。把平均6倍的克隆冗余考虑进去,这一密度应该足以用来构建一个基因组重叠群。这样,在可使用BAC质粒的情况下,一个由6个基因组等价物组成的完整基因组文库的重叠群,可在约1个月内完成。
假设有一台自动化质粒提取仪可供充分使用,18个板中的质粒在2个星期左右就能制备完毕。
工业适用性本发明中的方法和电泳装置,使得有可能十分容易且有效地为诸如下列用途检测、鉴定和获得核酸标记(1)通过利用邻近该基因的核酸多态性,开发多态性标记来标记某一个控制重要功能和/或性状的单基因。
对于这一用途,带有目的基因的生物可以不具备一个由已知标记组成的基因组图谱。
(2)在定位克隆过程中鉴定和分离邻近靶基因的克隆。
在仅以染色体上的位置信息为基础的情况下,为通过定位克隆技术分离和克隆某一控制重要功能和/或性状的单基因,搜索了紧邻该基因的标记,还提供了可用于从一个基因组文库如BAC文库中筛选位于该基因周围区域内的克隆的标记。对于这一用途,带有目的基因的生物可以不具备一个由已知标记组成的基因组图谱。
(3)基因分析和高密度作图有效地提供了大量用于对一种生物进行基因作图的核酸标记。对该生物F2代或RI品系的连锁分析以及高密度作图也是在高效率下完成的。因此,基于至少2个基因的贡献的定量性状位点(QTL)分析也可以容易地完成。
(4)品种鉴定用于对包括精白米在市场上销售的食物和种子进行品种鉴定的标记条带被有效地检测出来。而且,为了设计用于SCAR(特征性序列扩增区域)分析的引物,所得鉴定条带被分离并克隆后进行了序列分析。利用这样的SCAR标记可以进行快速的品种鉴定。某一特定基因的邻近标记也可以被提供做成SCAR标记,以便使它们可以被用作更容易使用的育种标记等等,或者被用于筛选该基因邻近区域的BAC克隆。
(5)构建覆盖生物整个基因组的重叠群按照如下步骤,构成某生物的基因组文库的克隆可以被容易地连在一起构建一个覆盖整个基因组的重叠群一个含有几个基因组等价物的基因组文库被分成几个亚文库,每个亚文库中大约包括一个基因组等价物。对于每一个构成每个亚文库的微孔板组,其行、列和板分别被指定为X、Y和Z轴。所有与某一轴直交的克隆的DNA被混合成一个群体,提供一种用作模板的坐标样品。这些坐标样品和作为对照的整个基因组DNA被作为模板置于电泳凝胶上并通过基因组扫描进行处理。这样,一个相对应于整个基因组的泳道上的条带的克隆就被鉴别出来(图10)。假设所获得条带的分布密度相当于1条带/20~50kB,一个其中平均含有几倍克隆冗余的全基因组的重叠群,就被构建成功了。
权利要求
1.一种用于核酸电泳的方法,该方法包括以下步骤a)用一种电泳装置对核酸样品进行电泳,在该装置上一次可安装多个10~30平方厘米大小的凝胶板,利用该装置每块凝胶板至少可使32个核酸样品同时进行电泳。b)电泳之后在凝胶上检测核酸条带。
2.根据权利要求1中的方法,其中电泳是在使用不连续缓冲系统的凝胶上进行的。
3.根据权利要求1中的方法,其中的核酸样品是通过变性使双链DNA解离而制备的单链DNA,而且电泳是用变性凝胶完成。
4.根据权利要求1中的方法,其中对凝胶上核酸条带的检测是通过荧光染色或银染色来完成的。
5.根据权利要求1、2或4中任何一个的方法,其中该方法的运用是为了在被测个体之间检测基因组DNA的多态性。
6.根据权利要求3中的方法,其中该方法的运用是为了在被测个体之间检测基因组DNA的多态性。
7.根据权利要求5中的方法,其中核酸样品是通过AFLP法扩增而得的DNA片段。
8.根据权利要求5中的方法,其中核酸样品是异源双链DNA分子。
9.一种用于制备包含多态性的DNA片段的方法,该方法包括从凝胶中分离那些根据权利要求5~8中的任何一种方法检测的,具有多态性的DNA片段的步骤。
10.一种包含被测个体之间的多态性的DNA片段,该DNA片段是根据权利要求9中的方法分离得到的。
11.根据权利要求1~8中任何一个的方法,其中所述方法的使用是为了进行遗传学分析。
12.根据权利要求11中的方法,其中的遗传学分析是F2代分析、RI(重组自交)分析或QTL(量化性状位点)分析。
13.根据权利要求1~8中任何一个的方法,该方法是用于构建一种生物的遗传图谱。
14.生物的遗传图谱,该遗传图谱是通过利用包含多态性的基因组DNA的条带作为标记而构建的,该DNA条带是根据权利要求13中的方法检测到的。
15.一种从基因组DNA文库中筛选克隆的方法,所筛选的克隆与通过权利要求1~8中任一方法在凝胶上检测到的特定核酸条带相对应,该方法包括以下步骤a)把特定生物的基因组DNA文库分成多个亚文库,每一个亚文库的大小最多为该生物的1个基因组;b)给每一个亚文库中的所有克隆分配属于该亚文库的一个行号、一个列号和一个板号,其中行、列和板分别是指X、Y和Z坐标。c)分别收集代表所有板中特定行的全部克隆(X坐标克隆组)、代表所有板中特定列的全部克隆(Y坐标克隆组)以及在一个亚文库中特定板上的全部克隆(Z坐标克隆组),从收集的每一个克隆组中提取DNA作为坐标样品,并从该生物中制备基因组DNA作为对照,通过利用权利要求1~4中任一方法进行电泳来检测条带,从而对比坐标样品和对照组;d)在每一个X坐标克隆组、Y坐标克隆组和Z坐标克隆组中确定一个克隆,该克隆对应于凝胶上与对照中目的核酸具有相同迁移率的条带。e)从该亚文库中选出一个与已确定的三维坐标相对应的克隆。
16.根据权利要求15中的方法,其中该方法的使用是为了构建能覆盖特定生物全部基因组DNA的重叠群。
17.一套用于核酸电泳的电泳装置,其中在该装置上一次可安装多个10~30平方厘米大小的凝胶板,而且利用该电泳装置每块凝胶板至少可使32个核酸样品同时进行电泳。
全文摘要
这里发现,采用一种使用小型凝胶的电泳装置,使得有可能以明显高于传统方法的效率来检测多态性条带。还发现该方法适用于遗传分析、生物系统的鉴定等等。
文档编号G01N27/447GK1399721SQ00816256
公开日2003年2月26日 申请日期2000年9月22日 优先权日1999年9月24日
发明者川崎信二, 小松田隆夫, 间野吉郎 申请人:独立行政法人农业生物资源研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1