一种亲本特异位点测序克隆基因的方法

文档序号:397448阅读:254来源:国知局
专利名称:一种亲本特异位点测序克隆基因的方法
技术领域
本发明属于遗传学领域,公开了一种亲本特异位点测序克隆基因的方法。
背景技术
自然界物种性状丰富多样,如株高、抗病性、产量等。从孟德尔时代起,就逐渐认识到了性状是由遗传因子控制,摩尔根进一步将遗传因子明确为“基因”,并指出基因位于染色体上且呈线性排列。确定基因在染色体上具体的位置(基因定位)是研究性状的基础,也是分离、克隆并利用基因的前提。经典的基因定位策略源于摩尔根的连锁理论,即染色体上相邻基因(即基因连锁)不能自由分离,而是倾向于整体向后代传递,它们所控制的性状也倾向于同时出现。二者相邻越近,性状同时出现的可能性越大,重组性状越少。因此,由重组性状(配子)的比 例可以度量二者间的距离。若已知道其中一个基因在染色体上的位置(称这样的基因为标记基因),就可以根据重组率推断另一个基因的位置。例如,黄色圆粒豌豆品种(基因型分别为YYRR)与绿色皱粒品种(基因型为yyrr)杂交产生F1 (基因型YyRr) ,F1自交可能产生YR、Yr、yR和yr4种配子,根据F2代的性状表现可以确定它们的比例,进而计算交换率。若交换率为I %,且已知控制颜色的Y基因位于第3染色体上,那么就可以推测,控制豌豆籽粒形状的R基因位于第3染色体且与Y基因相距lcM。从以上的分析可以看出,经典连锁标记定位的实质是找到与目标性状连锁的已知分子标记,并计算二者的交换率,进而推断目标基因的位置。分离群体分池是基因定位的实际操作策略,以上述实例进行说明如下。以籽粒形状为标准,将F2群体划分为两个部分(池)显性池(随机抽取的圆粒单株)和隐性池(随机抽取的皱粒单株),比较豌豆基因组上已知的1000个SSR标记(SSR1-SSR1000)扩增产物在这两个池间的差异。若标记SSR17与籽粒形状R/r连锁,那么对籽粒形状分池,也就相当于对SSR17分池,因此,SSR17在两个池间的扩增产物是有差异的,相反就没有差异,由此确定目标基因与SSR17处于同一染色体。再分析F2各个单株的表现,计算R/r与SSR17的遗传距离,即可进一步定位R/r在该染色体上的具体位置。分子标记连锁定位基因经过几十年的发展,已成为基因定位的经典方法,但该方法依旧存在明显缺陷,主要表现如下(I)经典定位方法依赖于分子标记,分子标记分为两种,一种为通用标记,如RAPD.AFLP等,可用于任何物种,但这些标记在染色体上的位置信息不明确,因此,利用通用标记定位基因极为耗时耗力,且十分困难,利用这类标记定位的基因相当有限。另一类标记是已知染色体信息的,如SSR标记。只要找到了与性状连锁的标记,就相当于找到目标基因的大致位置,目前大部分性状是利用此类标记定位的。然而,已开发此类标记的物种只占了很少一部分,绝大部分自然界的有利基因无法通过这一方法定位、克隆和利用。(2)找到的是与目标基因连锁的分子标记,即得到的是包含目标基因的区段,而不是目标基因本身,还需要基因预测和大量验证工作以排除区段内非目标基因,当区段较大时,该工作十分困难甚至难以完成。而且易漏掉基因,如很小的蛋白分子、非编码基因等。
(3)要求定位群体遗传距离大,找到连锁标记的可能性才大。从而导致一些问题。第一,过大遗传距离常导致性状偏分离,需另建群体调查性状分离比,增加了工作量。第二,远缘杂交难以用于育种,导致基因定位理论研究与育种应用实践脱节,这违背了基因定位的初衷。(4)精细定位时,连锁标记与目标基因距离很近,发现多态性标记变得越来越难,常出现无标记可用的情况。另外,相邻很近导致交换很难 发生,要获得准确的交换率,群体要求很大。而交换率计算是定量分析,需要检查群体每一个单株,工作量十分巨大
发明内容
本发明实施例的目的是针对上述现有技术的缺陷,提供了一种能够准确、快速克隆目标基因的未本特异位点测序克隆基因的方法。为了实现上述目的本发明采取的技术方案是一种亲本特异位点测序克隆基因的方法,其特征在于,包括以下步骤选用遗传距离近但目标性状有差异的材料做亲本,通过两个亲本杂交构建群体,从分离群体中选择具有隐性性状的个体构建隐性基因池,对两个亲本进行基因组高通量测序,通过初步、de novo(直接)组装并比对,获得显性与隐性亲本特异位点,将它们定义为目标基因的候选位点;通过富集隐性池候选位点并重测序或PCR方式逐个检查隐性池每个个体的每个候选位点的方式,确定目标基因座位;通过PCR扩增克隆全长目标基因,通过遗传互补实验验证目标基因。本发明更具体的技术方案是一种亲本特异位点测序克隆基因的方法,包括以下步骤(I)构建分离群体利用分别含有相对性状的亲本杂交后构建分离群体;(2)隐性池的获得随机选择分离群体中目标性状为隐性的个体组成隐性池;(3)DNA提取取两个亲本的叶片或其它组织,分别提取并获得两个亲本的基因组DNA ;从隐性池中每个体上取等量组织混合后提取DNA,或从每个个体中提取DNA后等量混合,获得隐性池DNA ;(4)确定候选位点按高通量测序流程构建2个亲本文库,PCR并高通量测序;初步组装亲本基因组后,比对2个亲本基因组DNA,分别获得显性亲本与隐性亲本中的特异位点,将这些特异位点定义为目标基因候选位点;(5)目标位点的确定通过两个方式确定目标位点;第一种候选位点超过50个时,通过杂交(如安捷伦SureSelect平台)或PCR方式在隐性池中富集候选位点后再次高通量测序,检测显性亲本中特有的候选位点是否在隐性池中出现,若没有出现,则为目标性状的基因位点。第二种候选位点不足50个时,可采用普通PCR、实时PCR或高通量的OppenArray的检测方式,逐个检查隐性池每个个体的每个候选位点。同样,没有出现的显性座位位点即为目标位点。(6)基因克隆与功能验证通过比对亲本基因组的方式获得基因的全长序列,PCR扩增克隆目标基因,按通用的遗传互补实验验证所克隆基因的功能。所述亲本杂交构建分离群体最好利用遗传距离近的纯系亲本构建,且距离越近越好。
本发明实施例的有益效果是(I)可应用于任何物种。经典克隆方法依赖于分子标记,目前大部分物种分子标记发展还不成熟,应用受限。本发明以测序为基础,不需要分子标记,可应用于任何物种,大大拓宽了对自然界基因利用的范围,对基因克隆产生了实质性的进步。(2)直接克隆基因本身。传统方法克隆基因之前需要定位基因,获得的是包含目标基因的区域,本发明直接克隆了目标基因。(3)工作量大为减少,速度大为加快。传统克隆方法耗时数年是很正常的,本发明群体构建完成后,只需要提取3份DNA、富集I份DNA,并进I次或2次高通量测序即可完成实验,可在数月内完成,工作量大为减少,速度大为加快。(4)风险大为降低。传统克隆方法常因缺乏足够或合适的标记而失败。本发明技术方案中,只要保证测序覆盖度,即可发现目的基因。大部分步骤有概率保证,具有判断的标准。比如,在隐性池中测得的序列,可以与显性亲本或隐性亲本序列组成比较,以排除测序误差、基因突变等偶然因素的影响。


图I是本发明实施例I提供的基因克隆方法流程示意图;图2是本发明实施例2提供的水稻高杆基因克隆方法流程示意图。
具体实施例方式下面结合附图和具体实施例对本发明作进一步说明,但不作为对本发明的限定。实施例I :一种亲本特异位点测序克隆基因的方法(参见图I)(I)构建分离群体选择具有相对目标性状的两个亲本进行正反交(除目标性状外,其它性状差异越小越好,可通过突变株/野生株或回交育种产生姊妹系等方式创造亲本)。根据F1的表现判断控制性状的基因座位是显性还是隐性;根据正反交的性状是否有差异,判断是否具有细胞质效应,若没有差异,表明不受细胞质基因影响,否则该性状与细胞质基因相关A自交形成F2群体。根据相对性状在F2群体中植株的比例,判断控制目标性状的基因对数,卡方检验若符合3 I的分离比,则为I对基因控制,否则为多对基因控制。(2)隐性池的构建与DNA提取。从F2群体中随机选择隐性个体构建隐性池(在保证性状鉴定准确的前提下,隐性池中植株数尽可能多)。将选出的每株叶片或其它组织等量混合后,提取获得隐性池基因组DNA,也可将隐性池的单株分别提取DNA后再等量混合获得隐性混合池DNA。同时分别提取2个亲本的基因组DNA。(3)全基因组高通量测序与候选基因位点的确定。按高通量测序操作流程,分别构建2个亲本的DNA文库,然后进行PCR并上机测序。比对2个亲本的测序片段,对亲本基因组进行初步的de novo组装(忽略重复序列等不能组装的区域,因为这些区域通常不含编码基因),通过比对获得每一亲本的特异位点,比较特异位点在组装后的基因组上的位置,判断它们之间的等位关系。所有这些亲本特异的位点被定义为目标基因的候选位点。(4)目标基因的确定与克隆。具体操作如下当目标基因候选位点数超过50个时,向安捷伦公司提交目标基因候选位点的序列,由安捷伦公司设计探针,在SureSelect平台上,从隐性混合池中富集所有候选位点。在候选位点不多的情况下,也可采用PCR扩增的方式在隐性混合池中富集候选基因。对富集的候选位点进行高通量测序。将显性亲本中的特异位点按完全匹配的方式与测序结果进行比对,没有出现的显性亲本位点为目标位点。当目标基因候选位点数不足50个时,可针对每一个候选位点设计引物,按普通PCR、实时PCR或高通量的PCR如OpenArray等方式,逐一检验隐性池中每一个体的每一候选位点,同样,没有出现的显性亲本特异位点为目标位点。另外,等位位点比例接近I : I的为与目标性状无关的非连锁位点,比例介于I : O和I : I之间为与目标性状连锁的位点。设隐性混合池中个体数为η个,连锁位点与目标座位遗传距离为m CM,则隐性混合池测序中,该连锁位点不能出现的概率(该位点不 能与目标座位区分开的概率)为(l-m% VntjSn = SOOOm = O. I,则概率为(1_0. 1%) 2*3000= 0.25%。因此,即使遗传距离很近(O. IcM),也有超过99%的把握直接获得目标位点。目标位点获得后,可通过信息学基因结构预测基因的起始位点与结束位点,再通过PCR方式克隆获得全长基因。(5)目标基因功能互补实验。利用转显性基因于隐性植株或RNAi等经典方法,进行遗传互补实验,验证基因功能,检测所克隆基因的正确性。实施例2 下面通过一个具体实施例对本发明作进一步说明水稻高杆基因克隆方法(参见图2)(I)群体构建RH23与RS35为育种选育的两个水稻亲本,其中,RH23平均株高为134. 56cm, RS35平均株高为87. 89cm,二者为姊妹系,除了株高性状外,其余性状基本相同。RH23与RS35进行正反交产生F1, F1表现为高杆(平均株高134. 49cm),表明高杆为显性,矮杆为隐性,正反交之间株高没有显著差异,表明株高不受细胞质基因控制。种植F2共20000株,按株高>135cm和< 86cm将群体分为高杆和矮杆两个群体,其中高杆13783株,矮杆为4637株,经卡方检验在95%的概率保证下符合3 I的分离比,表明高杆受一对显性基因控制,定名为HD。从矮杆群体中随机选择3000个植株,每个植株取少许叶片,混合磨样后充分混匀,与亲本RH23和RS35 —起分别按植物DNA提取试剂盒(DP305,天更,北京)操作手册分离纯化基因组DNA,利用ND2000超微量分光光度计测定样品浓度与纯度。(2)亲本测序与目标基因候选位点的确定按Illumina GAIIx高通量测序技术规程建两个亲本RH23、RS35和矮杆隐性池文库并高通量测序,采用Fragment建库方式,采用条形码对2种基因组DNA进行区分。RH23和RS35测序上样量比例为I : I。对输出的原始数据进行去除低质量序列等处理后,2个样本的总测序量的Clean data分别为9. 3G和7. SG。水稻基因组总长约为O. 3G,这些测序数据平均覆盖31和26倍水稻基因组,用基因组组装程序ABySS (http ://www. bcgsc. ca/platform/bio info/software/abyss)对两个亲本 RH23 和 RS35 基因组进行初步 de novo 组装。比较两亲本基因组间的差异,在RH23和RS35基因组间分别有258个特有的差异位点,分别命名为Hl,H2,H3……H258和SI,S2,S3……S258。这些特异位点两两之间,除一个碱基外,其余部分均相同,表明它们两两之间可能为等位基因,且均为单碱基点突变位点(因为亲本互为姊妹系,所以差异位点不多,大部分差异位点可能是自然突变后形成,因此为点突变)。将这258个等位位点确定为控制株高性状的候选基因。(3)安捷伦SureSelect平台富集目标基因候选位点、重测序与目标基因的克隆根据这258个目标基因的候选位点序列,按安捷伦基于Web的探针设计方案(https://earray. chem. agilent. com/earray/)设计这258个候选位点的杂交探针,按安捷伦SureSelect试剂盒操作手册对这258个序列进行捕获并建立测序文库,每个位点捕获
0.5kb,258个位点共129kb。按Illumina GAIIx高通量测序技术规程,选用扩增子串联法建库,对以上258个位点进行高通量测序,共获得获得152. 93G测序数据(Clean Data :清除了接头和不完全匹配的序列),每个位点平均被覆盖320. 72万次。其中,H3中被检测到了 320. 22万次,除9条序列与S3匹配外,其余均与H3完全匹配,考虑到高通量测序也存在错误,因此,极低频率与S3匹配可以看作是测序的随机错误,判断该位点为控制株高的目标位点(最终通过遗传互补实验得到了验证)。H41被检测到了 325. 42万次,有322. 10万次与H41完全匹配,3. 32万次与S41完全匹配,表明H41为与H3连锁的位点,二者遗传距离大约为I. 03cM。其余256个目标基因的候选位点的显性频率与隐性频率之间的比例很接近I 1,表明它们为与目标位点无关的位点。通过以上实验表明,H3为控制水稻高杆的基因座位。将上述H3与初步组装显性亲本基因组比对,通过基因组注释内容发现,H3位点位于一基因外显子内,整个基因全长为3123bp,功能注释为赤酶素氧化酶。基于全长为3123bp基因起始点前500bp和结束点后500bp的碱基序列,利用Primer5设计引物于RH23亲本中扩增全长基因序列,引物设计按该软件提供的默认参数进行。Sense primer (正向引物)为序列表中的 SEQID NO. I ACTCACTCCCGCTCAACA ;Antisense primer(反向引物)为序列表中的 SEQ IDN0. 2 :CATTCATCCGTCGTTCCA。PCR 扩增体系按试剂盒 DreamTaq Green PCRMaster Mix(2X) (K1081, fermentas)推荐体系进行,即含 PCR 混合物 501,RH23 模板 15ng,引物21 (浓度0. 5M/L),加纯水至总体积为1001。扩增程序如下94°C预变性4分钟;94°C,I分钟,54°C,3分钟,72°C,3分钟,循环44次;72°C延伸8分钟。扩增产物用2%的琼脂糖凝胶检测。按PCR产物按琼脂糖凝胶回收试剂盒(K0691,Fermentas)操作手册回收并纯化扩增片段并测序,获得控制水稻高杆的目的基因序列为序列表中的SEQ ID N0.3所示。atggtggccgagcaccccacgccaccacagccgcaccaaccaccgcccatggactccaccgccggctctggcattgccgccccggcggcggcggcggtgtgcgacctgaggatggagcccaagatcccggagccattcgtgtggccgaacggcgacgcgaggccggcgtcggcggcggagctggacatgcccgtggtcgacgggggcgtgctccgcgacggcgacgccgaggggctgcgccgcgccgcggcgcaggtggccgccgcgtgcgccacgcacgggttcttccaggtgtccgagcacggcgtcgacgccgctctggcgcgcgccgcgctcgacggcgccagcgacttcttccgcctcccgctcgccgagaagcgccgcgcgcgccgcgtcccgggcaccgtgtccggctacaccagcgcccacgccgaccgcttcgcctccaagctcccatggaaggagaccctctccttcggcttccacgaccgcgccgccgcccccgtcgtcgccgactacttctccagcaccctcggccccgacttcgcgccaatggggtaattaaaacgatggtggacgacattgcatttcaaattcaaaacaaattcaaaacacaccgaccgagattatgctgaattcaaacgcgtttgtgcgcgcaggagggtgtaccagaagtactgcgaggagatgaaggagctgtcgctgacgatcatggaactcctggagctgagcctgggcgtggagcgaggctactacagggagttcttcgcggacagcagctcaatcatgcggtgcaactactacccgccatgcccggagccggagcggacgctcggcacgggcccgcactgcgaccccaccgccctcaccatcctcctccaggacgacgtcggcggcctcgaggtcctcgtcgacggcgaatggcgccccgtcagccccgtccccggcgccatggtcatcaacatcggcgacaccttcatggtaaaccatctcctattctcctctcctctgttctcctctgcttcgaagcaacagaacaagtaattcaagcttttttttctctctcgcgcgaaattgacgagaaaaataagatcgtggtaggggcggggctttcagctgaaagcgggaagaaaccgacctgacgtgatttctctgttccaatcacaaacaatggaatgccccactcctccatgtgttatgatttatctcacatcttatagttaataggagtaagtaacaagctacttttttcatattatagttcgtttgattttttttttttaaagtttttttagttttatccaaatttattgaaaaactt agcaacgtttataataccaaattagtctcatttagtttaatattgtatatattttgataatatatttatgttatattaaaaatattactatatttttctataaacattattaaaagccatttataatataaaatggaaggagtaattaatatggatctcccccgacatgagaatattttccgatggtgtgacgacgccatgtaagcttcggtgggcctggacggccagaggtgccaacagccacgtccaacaacccctgggtccccccctaacactccaaacagtagtgagtagtgtctcgtcgcgttttagtatttgatgacaaacaaagtgtgagttgagttagccaccaccaacttgcacacgagcacatacatttgtgtccattctcgccagtcacttccatctctagtcctaactcctatctagcgatgtaagcggataatttcatcatccgtatataaacctgtttgttatagttaatttcctatataatactataacagtatacattttaaaagaaaacaaaattaggataaacaggccctgctcctatccatccatggcacttggaaggaccagactcggtcatgccatgccaagccaagatatgggttatggaagagtagagaagaggagagatgagagataagcatgcgttctcctcctcgttggatgtgtattttggagggatttgtgtagtagtagcagcggcgccgcggggacggatgcggatggtggcgctttcggtggcgttttcccgggggggttttggtttggcgcttgggggggatggcatggcgcggcgtgcggctgcacgccacacacacgcgcgcgcacgcacgtacgtcgtcgtcgccgcgggcggacggtagcttagggtggtgtgttccgcgcgcgggcgcggattgttccatgccgatcgatttggcgccaccctcgccgcggctcttgtcgcgtcgtgcgcctctctcgcgcggtttgtccttgtcgcgttgctcagccggcgacgggggcacggacattggcgatgtagccctgcacgtgtcggcctctccgttgatgaatgatgatgtatgtatgtatttttttttgtctgaaggaatttgtggggaattgttgtgtgtgcaggcgctgtcgaacgggaggtataagagctgcctgcacagggcggtggtgaaccagcggcgggagcggcggtcgctggcgttcttcctgtgcccgcgggaggacagggtggtgcggccgccgccgagcgccgccacgccgcagcactacccggacttcacctgggccgacctcatgcgcttcacgcagcgccactaccgcgccgacacccgcacgctcgacgccttcacgcgctggctcgcgccgccggccgccgacgccgccgcgacggcgcaggtcgaggcggccagctgao 通过以上技术手段,克隆获得了控制水稻株高的基因HD,(4)功能互补验证利用根癌农杆菌Ti质粒载体,将HD转入矮杆亲本RS23中,转基因阳性植株表现为高杆,证明HD控制了水稻高杆性状。以上所述的实施例,只是本发明较优选的具体实施方式
的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
权利要求
1.一种亲本特异位点测序克隆基因的方法,其特征在于,包括以下步骤选用目标性状有差异的材料做亲本,通过两亲本杂交构建分离群体,从分离群体中选择具有隐性性状的个体构建隐性基因池;对两个亲本进行基因组高通量测序,通过初步直接组装并比对,获得显性与隐性亲本特异位点,该特异位点为目标基因的候选位点;通过富集隐性池候选位点并重测序或PCR方式逐个检查隐性池每个个体的每个候选位点的方式,确定目标基因位点;通过PCR扩增克隆全长目标基因,通过遗传互补实验验证目标基因。
2.根据权利要求I所述的亲本特异位点测序克隆基因的方法,其特征在于,包括以下步骤 (1)构建分离群体利用分别含有相对性状的两亲本杂交后构建分离群体; (2)隐性池的获得随机选择分离群体中目标性状为隐性的个体组成隐性池; (3)DNA提取取两个亲本的叶片或其它组织,分别提取并获得两个亲本的基因组DNA;从隐性池中每个体上取等量组织混合后提取DNA,或从每个个体中提取DNA后等量混合,获得隐性池DNA ; (4)确定候选位点按高通量测序流程分别构建亲本文库,PCR并高通量测序;按denovo (直接)组装,初步构建两亲本全基因组,通过比对,分别获得显性亲本与隐性亲本中的特异位点及其等位关系,该位点为目标性状的候选位点; (5)目标位点的确定当候选位点超过50个时,通过杂交或PCR方式在隐性池中富集候选位点后再次高通量测序,检测显性亲本中特有的候选位点是否在隐性池中出现,若没有出现,则为目标性状的基因位点;当候选位点不足50个时,采用普通PCR、实时PCR或高通量的OppenArray的检测方式,逐个检查隐性池每个个体的每个候选位点,没有出现的显性座位位点即为目标位点; (6)基因克隆与功能验证通过比对亲本基因组的方式获得基因的全长序列,PCR扩增克隆目标基因,按通用的遗传互补实验验证所克隆基因的功能。
3.根据权利要求I所述的亲本特异位点测序克隆基因的方法,其特征在于,所述亲本杂交构建分离群体是利用遗传距离近的纯系亲本。
全文摘要
本发明公开了一种亲本特异位点测序克隆基因的方法。其包括以下步骤选用目标性状有差异的材料做亲本,通过两亲本杂交构建分离群体,从分离群体中选择具有隐性性状的个体构建隐性基因池;对两个亲本进行基因组高通量测序,通过初步直接组装并比对,获得显性与隐性亲本特异位点,该特异位点为目标基因的候选位点;通过富集隐性池候选位点并重测序或PCR方式逐个检查隐性池每个个体的每个候选位点的方式,确定目标基因位点;通过PCR扩增克隆全长目标基因,通过遗传互补实验验证目标基因。本发明以测序为基础,可用于任何物种,直接克隆基因本身。采用本发明的方法,工作量大为减少,速度大为加快,而且降低了风险。
文档编号C12Q1/68GK102899312SQ201110215778
公开日2013年1月30日 申请日期2011年7月29日 优先权日2011年7月29日
发明者彭海, 张静, 章伟雄 申请人:江汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1