一种基于功能基因多态性的分子标记方法

文档序号:433783阅读:454来源:国知局
专利名称:一种基于功能基因多态性的分子标记方法
技术领域
本发明涉及基因组学、分子生物学和生物信息学领域,具体说是涉及一种基于PCR的功能基因扩增多态性(Function Gene Amplified Polymorphism, FGAP)标记方法。用于gDNA单基因多态性、同源性基因家族多态性和mRNA 表达多态性分析。
技术背景分子标记是生物DNA水平上遗传变异的直接反映,具有数量丰富、信息 量大、检测不受季节、环境和个体发育阶段的影响等优点,广泛应用于遗传 作图、基因定位、基因克隆、动植物育种、、遗传多样性分析、亲缘关系鉴定、 遗传病鉴定、法医学鉴定等许多领域。目前分子标记技术主要有DNA限制性片段长度多态性(restrictiori fragment length polymorphism^RFLP)、 随机扩增多态性DNA(random amplified polymorphic DNA ,RAPD)、扩增片段长度多态性(Amplified Fragment Length Polymorphism ,AFLP)、简单重复序歹ij(simple sequence repeat^ SSR)、特殊序列扩增(sequence characterized amplified regions,SCAR)和单 核苷酸多态性(single nucleotide polymorphisms,SNP)、表达序歹U标签 (e邻ressed sequence tags,EST)等。由于PCR技术的优点,基于PCR的标记体 系类型多样,应用广泛,但各自的复杂性、可靠性与遗传信息不同。RFLP基本原理是将基因组DNA用已知的限制性内切酶消化,电泳经 Southern印迹后,用放射性同位素或非放射性物质标记探针,与转移于支 持膜上的DNA杂交,经放射自显影显示出基因组DNA中与探针同源的DNA 序列片段的大小。RFLP标记呈共显性,标记准确,不影响表型,数目也较 多,但其分析程序复杂,有放射性污染,技术难度大,费时,成本较高,需要的DNA量较大等。RAPD是用短的(通常为10bp)随机序列DNA作为引物, 对目的基因组DNA进行PCR扩增而产生多态性。RAPD程序简单、快速,所 需DNA量少,能分析大量样品,且无需知道目的DNA片段序列信息。但是 RAPD受反应条件影响较大,因而其检测的重复性较差。(罗林广等,分子标 记及其在作物遗传育种中的应用.江西农业学报,1997, 9(1) :45-54)。 AFLP 标记是RFLP与RAPD相结合的产物,该法先设计针对某种限制性内切酶的 通用接头以及可与接头序列和限制性酶切位点的序列配对的专用引物,用上 述内切酶消化基因组DNA,将通用接头与限制性片段两端连接,再用专用引 物扩增,最后电泳显示结果。AFLP具有标记多态性强、准确性高、重复性 好以及可用于没有任何分子生物学研究基础的物种等优点,但AFLP成本较 髙、对技术要求苛刻等。(相宁,洪焰.扩增片段长度多态性技术及其在植物 研究中的应用.植物生理学通讯,2000, 36(3) :236-240;周晓梅,沈晋良.扩 增片段长度多态性的研究进展.棉花学报,2003, 15 (3): 185-190)。 SSR是根 据微卫星DNA两端的单拷贝序列设计一对特异引物,利用PCR技术,扩增每 个位点的微卫星DNA序列,通过电泳分析核心序列的长度多态性。但要获得 SSR引物需要进行大量克隆、测序和杂交验证工作。(王长有,吉万全,薛秀 庄.分子标记技术在小麦遗传育种中的应用现状.麦类作物学 报,2000, 20(4) :75-80)。 SCAR标记十分稳定,在应用上具有迅速、简便、低 成本的特点,非常适合于样品的大量分析。SCAR标记一般是由RFLP、 RAPD、 AFLP等标记转换而来。如王斌等"紫菜序列鉴定扩增区标记的建立方法"(发 明申请号200310105267):杨剑波等"鉴别水稻苯达松敏感致死基因的分 子标记方法"(发明申请号02138080)。但通常情况下,SCAR标记转换的成 功率是很低的,这也是目前发展SCAR标记的一个主要困难。SNP是指在基因 水平上由于单个核苷酸位置上存在转换、颠换、插入、缺失等变异而引起的 DNA序列多态性,与RFLP及微卫星等DNA标记不同,不再以长度的差异作 为检测手段,而是直接对序列的变异作为标记。但大多数普通类型的SNP 信息量不大,且大规模地筛选SNP,费用极其昂贵等。EST标记是根据EST本身的差异而建立的分子标记。根据开发的方法不 同,EST标记可分为4类(1) EST-PCR和EST-SSR(微卫星)。这一类以PCR技术为核心,操作简便、经济,是目前研究和应用最多的一类;(2)EST-SNP (单核苷酸多态性)。它是以特定EST区段内单个核苷酸差异为基础的标记, 可依托杂交、PCR等较多种手段进行检测;(3) EST-AFLP。它是以限制性内 切酶技术和PCR相结合为基础的标记;(4) EST-RFLP。它是以限制性内切酶 和分子杂交为依托,以EST本身作为探针,与经过不同限制性内切酶消化 后的基因组DNA杂交而产生的。但EST分子标记存在着一些问题,如基于 PCR的EST分子标记是以长度多态性为基础的,其分辨取决于高分辨率的凝 胶,然而由于高频率非长度变异的等位基因的存在,这些信息检测存在一 定难度;EST的保守性在一定程度上也限制了 EST标记的多态性等。最近发展的新型分子标记相关序列扩增多态性(sequence-related amplified polymorphism^ SRAP)和耙位区域扩增多态性(tai^et region amplified polymorphism, TRAP)是一种新型的基于PCR标记。引物设计是 SRAP与TRAP分析的关键,SRAP-PCR反应体系中使用两个引物正向引物含 有一段14碱基的核心序列:5'端前10个碱基为"填充"序列,无任何特异 组成,接着为CCGG序列;随后为3'端的3个选择性碱基,选择性碱基的变化与相同核心序列组合成一套正向引物。反向引物的组成与正向引物类 似,但"填充"序列后连接的为MTT; AATT序列后为3个选择性可变碱基, 位于引物3'端。SRAP标记测序显示多数标记为外显子区域,其多态性产生 于两个方面小片段插入与缺失导致片段大小改变而产生共显性标记;核苷 酸改变影响引物的结合位点,导致显性标记产生。与SRAP、 RAPD和AFLP 等标记技术无须任何序列信息即可直接PCR扩增不同,TRAP技术是基于已 知的cDNA或EST序列信息。使用长度为16-20核苷的固定引物与任意引物, 固定引物以公用数据库中的靶EST序列设计而来,但固定引物是否为特异性 未能检测;任意引物与SRAP所用的一样,为一段以富含AT或GC为核心、 可与内含子或外显子区配对的随机序列,因而未能针对某类基因序列的特点 设计引物,固定引物与任意引物不易配合和协调。SRAP和TRAP的PCR条件 采用复性变温法,前5个循环复性温度为35t:,第5至第30-35个循环为 50'C;扩增产物可在聚丙烯酰胺或琼脂糖凝胶上电泳。但假若一对固定引物 在退火温度为5CTC时出现多个条带或无条带,则该固定引物与任意引物组合扩增的多态性很难与其cDNA或EST信息相联系,也即固定引物可能起不 到固定作用。吴为人等也开发了一种基于内含子长度多态性的扩增共有序列 的通用型分子标记方法(发明申请号200510060852)。以上基于PCR的各类分子标记方法,主要是区别于采用的引物特点及退 火温度。目前对功能基因的研究成为热点之一,功能基因序列由于插入与缺 失导致片段大小改变和核苷酸改变影响引物的结合位点等产生多态性,基于 PCR的功能基因多态性分子标记技来将对功能基因的深入研究有着广阔的 应用前景。 发明内容本发明针对现有分子标记技术尤其是TRAP和SNP标记技术的不足之处, 利用已知物种的公用数据库中的gDNA、 cDNA或EST序列信息,设计不同基 因的特异引物和高频序列引物并配合其相应的退火温度,作为基于PCR的功 能基因扩增多态性(FGAP)标记方法。本发明方法通过下述步骤进行1、 根据公用数据库目的基因的cDNA或EST序列设计多对候选特异引物, 经电子PCR后,选择只有一个PCR产物、扩增片段位于基因易变的中心区域 及引物长度最短的一对特异引物,进一步实际PCR验证其特异性并确定所需 退火温度。'2、 根据公用数据库目的基因的gDNA序列,分别按2个、3个和4个不 同碱基可能的排列组合,査找在目的基因gDNA序列中出现频率高的序列为 高频序列引物的3、端选择性碱基,然后在5、端填充不同碱基以合符一般引 物设计要求。3、 根据目的基因序列同源性分析,在公用数据库已知的同源性基因家 族各序列中,分别按2个、3个和4个不同碱基可能的排列组合,查找共同 出现频率高的序列为高频序列引物的3、端选择性碱基,然后在5、端填充不同碱基以合符一般引物设计要求。4、 以上游特异引物与不同的下游高频序列引物组合、下游特异引物与 不同的上游高频序列引物组合;以前4-8个循环采用低退火温度、循环次数 在第4-8到第34-42次采用高退火温度,进行PCR、凝胶电泳后筛选基因多态性引物组合。5、进一步地,从生体提取RNA后,经反转录酶将RNA反转录为cDNA, 以目的基因下游特异引物与上游高频序列引物组合以前4-8个循环采用低 退火温度、循环次数在第4-8到第34-42次采用高退火温度,进行PCR、凝 胶电泳后检测基因表达多态性。 《所述特异引物是指在gDNA中仅能扩增出一条带的一对引物,引物长度 为能扩增出特异带所需的最少碱基数,且某一基因上游特异引物能与下游不 同高频序列引物组合、下游特异引物能与上游不同高频序列引物组合,形成 该基因以特异带区段为中心向一侧或两侧延伸至PCR所能扩增范围的检测方 法。所述高频序列引物是指某一基因和/或同源性基因家族中,利用公用数 据库中的cDNA或EST序列信息作同源性分析,根据gDNA序列片段(包括外 显子的编码区、非编码区;内含子及在特异引物上、下游PCR可能扩增的范 围)内查找具有2-4个碱基排序出现频率高、分布较均匀的或具有SNP位点 的碱基序列作为高频序列引物3、端的选择性碱基。设计高频序列引物为3' 端的2-4个选择性碱基,5'端的填充碱基可以是随机序列或限制性内切酶位 点序列,但要配合特异引物的退火温度要求,并要符合引物不形成发夹结构 及其他二级结构、CG含量为4W-60%等引物设计原则,在此前题下,对高频 序列引物长度的要求尽可能短,以降低PCR时低退火温度的错配机率。同时, 高频序列引物设计为正向引物和反向引物,以不同的正向髙频序列引物与反 向特异引物组合、不同的反向高频序列引物与正向特异引物组合,形成以基 因特异序列区段为中心、对特异序列区段正反交叉检测并可在该区段两侧延 伸的适当范围内检测。所述退火温度的确定,FGAP采用退火温度前4-8个循环采用低退火 温度33-39C:。 PCR反应中可被扩增的DNA片段数由"选择性"碱基的数目来调节,数目越少,可扩增的片段多,反之则少;"选择性"碱基的数目 则由退火温度的高低所调节,退火温度高,"选择性"碱基的数目增多,反 之则少。循环次数和退火温度可根据高频序列引物的选择性碱基数及降低错 配条带率,以利于结果的重复性和稳定性而定;循环次数在第4-8到第34-42次采用高退火温度,其退火温度高低根据该对特异引物能扩增特异带所需的 最低温度。所述基于功能基因多态性的分子标记方法,应用于对单基因多态性分子检测,对同源性基因家族多态性分子检测或对mRNA表达多态性的分子检测。所述对单基因多态性分子检测,包括基因编码序列、非编码序列、内含 子序列及基因两侧PCR所能扩增范围的序列长度多态性和选择性碱基结合 位点的检测。所述对同源性基因家族多态性分子检测,包括利用已知物种同源性基因 家族的序列,设计通用高频序列(选择性碱基序列)引物,对已知物种或未 知物种同源性基因家族多态性检测。所述对mRNA表达多态性的分子检测,主要是提取RNA并经反转录酶转 录为cDNA后,使用基因下游特异引物与上游高频序列引物组合对cDNA扩增 多态性检测。通过本发听的FGAP标记方法,可实现gDNA单基因多态性、同源性基因 家族多态性和mRNA表达多态性分析,易于与生物形态性状、生理生化特征或某个特定的环境适应型相联系。gDNA的单基因多态性检测。根据该基因的cDNA或EST序列设计一对特 异引物,经PCR可扩增一条特异带;根据该基因的gDNA序列査找出髙频的 2-4个碱基序列为引物选择性碱基设计高频序列引物,与特异引物组合检测 基因多态性,可作个体间基因差异分析。gDNA的同源性基因家族多态性检测。同源性高的基因家族,可根据共有 保守序列设计一对特异引物;同源性较低的基因家族,可根据各个基因保守 序列设计特异引物。要求是每对特异引物仅能扩增出一条特异带。确保特异 引物在同 一功能基因序列内。高频序列弓I物的选择性碱基序列在已知的同源 性基因家族中查找,因而高频序列引物在该同源性基因家族中具有通用性, 也可对未知的物种同源性基因家族多态性检测,。mRNA表达多态性检测。 一般的RT-PCR是利用逆转录酶将RNA逆转录(RT) 成cDNA,然后以cDNA为模板,使用一对特异引物通过聚合酶链式反应(PCR) 扩增目的片段。而提取的RNA易降解,因而RT-PCR难度较大。利用该cDNA的下游特异引物与上游高频序列引物PCR扩增,在一定程度上克服RNA降解 的影响,并能检测功能基因是否表达以及RNA降解的情况;若RM不降解, 则可检测转录后的mRNA多态性。


图1是本发明的水稻单基因扩增多态性实例图,泳道1-12分别为水稻 品种R6,湛A, N仏博A; R6杂交种R31f, R02f; R6单株R6-731, R6-6B3, R6-7A12, R6-331;阴性对照;R6。图2是本发明的不同物种基因家族多态性实例图,泳道1-6分别为水稻, 辣椒,柑橙,大豆,蓖麻,富贵竹。
具体实施例方式实施例一、水稻细胞色素P450单基因多态性分子标记。经诱抗剂恶霉灵对水稻122个品种的诱导后,只有品种R6的诱导效果 好,能在l%NaCl的盐胁迫下完成生育期。恶霉灵需在植物体内经细胞色素 P450酶代谢后才具有诱导作用,因而需要对细胞色素P450基因多态性分析。1、 根据基因(GenBank accession no: NM—190973)序列,设计并筛选出一对特异引物上游MGMGCCTCGCACCCAT 下游CCGCTGCCATAGCCACTG用退火温度50'C扩增到只有一个309BP长度片段的PCR产物。2、 根据基因(GenBank accession no: NM—190973)序列和基因组(GenBank accession no: AP008207)同源序列1536BP中,4个碱基排列组合有CGGC、 CATG、 CCGG、 GGAG的序列频率高,设计高频序列引物。3、 用特异引物分别与高频序列引物组合,前6个循环采用低退火温度 35'C、后35个循环采用髙退火温度5(TC,进行PCR、凝胶电泳后,结果得 到由上游特异引物AAGMGCCTCGCACCCAT与髙频序列引物CATGGTGAGGCTCA 的PCR塞因扩增多态性如图l。实施例二、水稻细胞色素P450基因家族多态性分子标记。 1、根据同源性分析,细胞色素P450基因都具有高度保守的结构 FX XGXRXCXG氣基酸序歹ij。对accession no: XM_190966、 XM—477684、XM—475110、 XM—190973、 XM—195080、 XM_194828、 XM—482839、 AK 103088 等8个基囟序列分别査找2-4个碱基所有排列组合的序列出现的频率,选取 4个碱基的部分序列列于表1。选择平均数多、各基因间差异小、在基因序 列中分布较均匀的序列CGGC、 CATG、 GGCG、 CCGG、 CTTC、 GGCC分别设计 高频序列引物,作为细胞色素P450基因家族通用高频序列引物。表i s对基因序列中4个gyi排列组合的 部分序列频率情况械基排列组合 的部分序列平均数变异系数CCTC13.60.5949CGGC20.80.3276CATG14.40.3447GGAG14.50.3849GAGG15.10.3559GGCG19.90.4431GCGG14.30.4844GGTG11.30.4322GACG14.40.4414CCGG16.90.2182GGCC15.50.3253AATT6.61.0127TTAA2.51.5126CTTC12.80.2610TGAT7.60.77412、按实施例一第3步骤所述方法,对细胞色素P450基因家族各基因特 异引物与通用高频序列引物组合进行PCR扩增,筛选出一对引物accession no: XM—477684的下游特异引物GGAGGMGTCATGGGAGGA与高频序列引物 GATCATGTATGGCC组合,在前6个循环采用低退火温度36、后34个循环采 用高退火温度51'C,进行PCR、凝胶电泳后,得到水稻、辣椒、蓖麻、大豆、 柑橙和富贵竹等不同物种间基因扩增多态性条带,验证了基因家族多态性可 在未知基因序列的物种中分析,如图2。实施例三、mRNA表达多态性检测。1、水稻品种R6经诱抗剂恶霉灵处理后再用l%NaCl胁迫、仅用l%NaCl胁迫和淡水对照等三种处理,分别提取RNA,用AMV反转录酶与accession no: NM—190973下游特异引物反转录为cDNA。2、按实施例一所述步骤,用下游特异引物与上游高频序列引物组合, 前6个循环采用低退火温度35'C、后35个循环考用高退火温度50'C,进行 PCR、凝胶电泳后,比较三种处理的NM—190973 i因表达及多态性。
权利要求
1. 一种基于功能基因多态性的分子标记方法,其特征是利用已知物种的公用数据库中的gDNA、cDNA或EST序列信息,设计不同基因的特异引物和高频序列引物并配合其相应的退火温度,作为基于PCR的功能基因扩增多态性标记方法。
2、据权利要求1所述的基于功能基因多态性的分子标记方法,其特 征是通过下述步骤进行-(1) 根据公用数据库目的基因的cDNA或EST序列设计多对候选特异 引物,经电子PCR后,选择只有一个PCR产物、扩增片段位于基因易变的 中心区域及引物长度最短的一对特异引物,进一步实际PCR验证其特异性 并确定所需退火温度;(2) 根据公用数据库目的基因的gDNA序列,分别按2个、3个和4 个不同碱基可能的排列组合,查找在目的基因gDNA序列中出现频率高的 序列为髙频序列引物的3、端选择性碱基,然后在5、端填充不同碱基以合 符一般引物设计要求;(3) 根据目的基因序列同源性分析,在公用数据库已知的同源性基 因家族各序列中,分别按2个、3个和4个不同碱基可能的排列组合,査 找共同出现频率高的序列为高频序列引物的3、端选择性碱基,然后在5' 端填充不同碱基以合符一般引物设计要求;(4) 以上游特异引物与不同的下游高频序列引物组合、下游特异引 物与不同的上游高频序列引物组合;以前4-8个循环采用低退火Mjg,循 环次数在第4-8到第34-42次采用特异性扩增所需的高退火温度,进行 PCR、凝胶电泳后筛选基因多态性引物组合;(5) 进一步地,从生物体提取RNA后,经反转录酶将RNA反转录为 cDNA,以目的基因下游特异引物与上游高频序列引物组合;以前4-8个循 环采用低退火温度,循环次数在第4-8到第34-42次采用高退火温度,进 行PCR、凝胶电泳后检测基因表达多态性。
3、据权利要求1或2所述的基于功能基因多态性的分子标记方法, 其特征是其中所用的特异引物是指在gDNA中仅能扩增出一条带的一对引物,引物长度为能扩增出特异带所需的最少碱基数,且某一基因上游特 异引物能与下游不同高频序列引物组合、下游特异引物能与上游不同高频序列引物组合,形成该基因以特异带区段为中心向一侧或两侧延伸至PCR 所能扩增范围的检测方法。
4、 据权利要求1或2所述的基于功能基因多态性的分子标记方法,其 特征是其中所用的高频序列引物是指某一基因和/或同源性基因家族中, 根据gDNA序列片段,包括外显子的编码区、非编码区;内含子及在特异引 物上、下游PCR可能扩增的范围,査找2-4个不同碱基种类的各种排列组 合中出现高频率的序列,或是单核苷酸多态性位点的序列,作为引物3、 端选择性碱基,引物5'端填充适当碱基以满足与特异引物配对及退火温度 要求,同一高频序列引物可设计为上、下游引物,将基因中高频率出现的 2-4个碱基短序列作为选择性碱基,以增加长度多态性条带和引物结合位 点的检测。
5、 据权利要求1或2所述的基于功能基因多态性的分子标记方法, 其特征是其中PCR所用的相应退火温度是指两种退火温度PCR中循环 次数在第1到第4-8次时采用33-39'C的低退火温度,循环次数多少和退 火温度高低根据髙频序列引物中选择性碱基数而定,循环次数在第4-8到 第34-42次采用高退火温度,其退火温度高低根据该对特异引物能扩增特 异带所需的最低退火温度。
6、 据权利要求1或2所述的基于功能基因多态性的分子标记方法, 其特征是该方法应用于对单基因多态性分子检测,对同源性基因家族多 态性分子检测或对mRNA表达多态性的分子检测。
7、 根据权利要求6所述基于功能基因多态性的分子标记方法,其特 征是其中,对单基因多态性分子检测,包括基因编码序列、非编码序列、 内含子序列及基因两侧PCR所能扩增范围的序列长度多态性和选择性碱基 结合位点的检测。
8、 根据权利要求6所述基于功能基因多态性的分子标记方法,其特 征是其中,对同源性基因家族多态性分子检测,包括利用已知物种同源 性基因家族的序列,设计通用高频序列引物,对已知物种或未知物种同源 性基因家族多态性检测。9、根据权利要求6所述基于功能基因多态性的分子标记方法,其特 征是其中,对mRNA表达多态性的分子检测,主要是提取RNA并经反转录酶转录为cDNA后,使用基因下游特异引物与上游高频序列引物组合对 cDNA扩增多态性检测。
全文摘要
本发明公开了一种基于功能基因多态性的分子标记方法。其中包括利用已知物种的公用数据库中的gDNA、cDNA或EST序列信息,设计不同基因的特异引物和高频序列引物并配合其相应的退火温度进行PCR扩增,可实现gDNA单基因多态性、同源性基因家族多态性和mRNA反转录后的cDNA多态性分析,易于与生物形态性状、生理生化特征或某个特定的环境适应型相联系。
文档编号C12Q1/68GK101235417SQ200710026739
公开日2008年8月6日 申请日期2007年1月30日 优先权日2007年1月30日
发明者方良俊 申请人:广东海洋大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1