人与模式生物功能基因电子克隆的方法

文档序号:565886阅读:592来源:国知局
专利名称:人与模式生物功能基因电子克隆的方法
技术领域
本发明涉及遗传工程技术,具体涉及一种利用EST与人及模式生物基 因组草图序列信息进行人与模式生物功能基因电子克隆的方法。
背景技术
电子克隆是近年来伴随着人类基因组计划和EST (表达序列标签)计划 发展起来的基因克隆新方法,主要原理是利用日益发展的生物信息学技术, 借助电子计算机的巨大运算能力,通过EST或基因组的序列组装和拼接, 利用RT-PCR(逆转录-聚合酶链式反应)的方法快速获得功能基因,具有投 入低、速度快、技术要求低和针对性强等优点。随着人类基因组计划的实 施,已有研究人员利用电子克隆的方法克隆了很多人与模式生物的功能基 因。目前利用电子克隆进行生物体功能基因发掘的方法有两种
1利用EST数据库信息
利用EST数据库信息进行功能基因的电子克隆是目前最常用的手段。 首先选择感兴趣的目标EST作为查询探针,搜索dbEST (非冗余EST)数据库, 找到部分重叠的EST进行拼接,然后再以拼接好的EST重叠群((EST contig) 为新的查询探针,继续搜索dbEST库,直到没有新的EST可供拼接为止, 最后根据拼接好的完整序列设计PCR引物,通过RT-PCR的方法获得目的 cDNA(互补脱氧核糖核酸)克隆并进行序列测定验证,(参见图1)。
2利用基因组信息
随着人类基因组以及一大批模式基因组序列测序的完成,并供全世界 免费使用,促进了生物功能基因的电子克隆。它以EST或全长cDNA序列作 为信息探针,搜索GenBank(核苷酸数据库),随后根据内含子"GU ... AG" 的规则通过人工拼接或相应的计算机软件处理,可以得到该基因完整的开 放读码框(0RF),根据拼接的序列结果设计PCR引物,进一步采取RT-PCR 的方法获得目的基因的cDNA克隆并进行序列测定,(参见图2)。

发明内容
本发明的目的在于利用EST与人及模式生物基因组草图序列信息进行 功能基因的电子克隆,提出一种具有广泛适用性的人及模式生物功能基因 电子克隆的方法。
本发明是按以下步骤实现的。
一种人与模式生物功能基因电子克隆的方法,具体步骤如下
(1) 利用感兴趣的EST片段作为查询探针搜索dbEST库,找到与该序 列同源的所有EST序列;
(2) 分别将EST序列同源的所有EST片段,通过DNAstar软件进行EST拼接、延伸获得大片段或全长cDNA,获得一致序列其中包括潜在的核香酸 多态性信息;
(3) 以获得的一致序列作为查询序列在UCSC服务器上执行BLAT比对 分析,获得包括一个新基因所对应的完整EST序列、mRNA序列和相应基因 组图谱序列,以及可能的可变剪切体以及EST表达谱的详细信息;
(4) 综合上述三个步骤,的结果,拼接外显子,最终获得得到GenBank EST数据库和基因组图谱双'重支持,同时包含基因可变剪切体、核苷酸多 态性以及组织表达等完整信息的cDNA序列;'
(5) 确定新基因编码区序列生物信息学分析包含候选开放读码框架 的cDNA典型基因特征,如开放读码框架(ORF)前有无终止码和启动子, Kozak规则,加尾信号,polyA等,进行种属基因的比较基因组分析,通 过种属内同源蛋白的氨基酸序列确定该新基因的翻译起始点。
(6) 根据预测的功能基因设计PCR引物,通过RT-PCR的方法获得目的 cDNA克隆并进行序列测定验证。
所述人与模式生物功能基因电子克隆的方法,其基因组序列与EST序 列一致,直接拼接外显子。
所述人与模式生物功能基因电子克隆的方法,其基因组序列与EST序 列不一致,则根据有两个以上EST序列支持的核苷酸进行拼接外显子。
所述人与模式生物功能基因电子克隆的方法,对同时存在有两个以上 EST序列(包括一个EST序列支持基因组序列的情况)支持的核苷酸位点 确定为单核苷酸多态性;
所述人与模式生物功能基因电子克隆的方法,其外显子拼接过程中, EST数据库中缺少对应的核苦酸序列且已知存在种属同源基因的氨基酸, 则以该氨基酸序列为查询序列用TBLASTN程序比对以获得预测的编码序 列。
所述人与模式生物功能基因电子克隆的方法,其生物信息学分析不符 合上述典型基因特征,则通过种属同源蛋白的氨基酸序列的比对确定新基 因真实翻译起始和终止点。
这样设计的本发明对物种并没有特异性,只要被研究的新基因有足够 的EST序列信息,且该物种的基因组已经测净,均可以采用该方法进行基 因发掘,故具有广泛的适用性。通过该方法,可以方i^更、快捷、完整的得 到新基因及潜在的可变剪切体,而且由于这些功能基因均得到了 EST序列 和基因组序列的双重支持,故预测结果的可靠性较高,是功能基因电子克 隆的一种新方法。


图l是利用EST数据库进行电子克隆的方法流程图;图2是利用基因组信息进行功能基因电子克隆的方法的流程图3是利用EST与基因组草图序列信息进行功能基因发掘的流程图4是利用本方法克隆的KABE基因两种可变剪切体;
图5是KABE基因的外显子拼接过程。
具体实施例方式
下面以人类新基因克隆为例,具体的操作过程为
1. 利用感兴趣的EST片段作为查询探针到NCBI网站 (http: 〃www. ncbi. nlm. nih. gov),搜索dbEST库,找到与该序列同源的
所有EST序列;
2. 分别下载与查询EST序列同源的所有EST片段,通过DNAstar软件 进行EST拼接、延伸获得大片段或全长cDNA,获得一致序列(Contig)其 中包括潜在的核普酸多态性信息;
3. 以获得的 一 致序列作为查询序列在UCSC服务器 (http: 〃genome. ucsc. edu )上执行BLAT比对分析,这样就获得了包括一
个新基因所对应的完整EST序列、mRNA序列和相应人类基因组图语序列 (genomic
sequence )以及可能的可变剪切体以及EST表达谱的详细信息;
4、 综合上述三个步骤的结果,拼接外显子,具体过程为 ①如基因组序列与EST序列一致,直接拼接;②如基因组序列与EST
序列不一致,则根据有两个以上EST序列支持的核香酸进行拼接;③对同 时存在有多种两个以上EST序列(包括一个EST序列支持基因组序列的情 况)支持的核苷酸位点确定为单核苷酸多态性;④4并接过程中如EST数据 库中缺少对应的核苷酸序列且已知存在种属同源基因的氨基酸,则以该氨 基酸序列为查询序列用TBLASTN程序比对以获得预测的编码序列。通过上 述方法最终获得通过GenBank EST数据库和人类基因组图谱双重支持,同 时包含基因可变剪切体、核苷酸多态性以及組织表达等完整信息的cDNA序 列。
5、 利用生物信息学分析确定新基因编码区序列生物信息学分析包含 候选开放读码框架(0RF)的cDNA典型基因特征,如0RF前有无终止码和 启动子,Kozak规则,加尾信号,polyA等;如生物信息学分析不符合上 述典型基因特征,则通过种属同源蛋白的氨基酸序列的比对确定新基因真 实翻译起始和终止点。
6、 最后根据预测的功能基因设计PCR引物,通过RT-PCR的方法获得 目的cDNA克隆并进行序列测定验证,(参见图3 )。
本发明利用该方法电子克隆几个人与模式生物新基因例如采用电子 克隆技术结合分子克隆手段,在国际上首先发现人类肾脏和脑组织特异表达新基因KABE及其模式生物同源基因序列,基因编号LOC613212, mRNA 序列号为AB219832、 AB219764;采用电子克隆技术成功克隆了大鼠WDR45L 基因该基因为国际上首次克隆,并已被确认为模式序列,编号 薩-001039587。 '
图4显示将Unigene (Hs. 66194 )中的36条EST序列拼接获得cDNA contig (图中显示为Assembled KABE )作为查询序列进行BLAT比对的结 果,图中清晰地显示了该基因存在两种可变剪切体,这比传统的电子克隆 方法更"智能化",获得了更为准确和完整的基因信息;图5显示了 KABE 基因的外显子拼接过程图中显示的外显子碱基位置对应于BLAT比对显示 的人基因组图谱序列,同时根据EST信息还可以获得基因的表达信息。
权利要求
1. 一种人与模式生物功能基因电子克隆的方法,具体步骤如下(1)利用感兴趣的EST片段作为查询探针搜索dbEST库,找到与该序列同源的所有EST序列;(2)分别将EST序列同源的所有EST片段,通过DNAstar软件进行EST拼接、延伸获得大片段或全长cDNA,获得一致序列其中包括潜在的核苷酸多态性信息;(3)以获得的一致序列作为查询序列在UCSC服务器上执行BLAT比对分析,获得包括一个新基因所对应的完整EST序列、mRNA序列和相应基因组图谱序列,以及可能的可变剪切体以及EST表达谱的详细信息;(4)综合上述三个步骤的结果,拼接外显子,最终获得得到GenBankEST数据库和基因组图谱双重支持,同时包含基因可变剪切体、核苷酸多态性以及组织表达等完整信息的cDNA序列;(5)确定新基因编码区序列生物信息学分析包含候选开放读码框架的cDNA典型基因特征,开放读码框架前有无终止码和启动子,Kozak规则,加尾信号,polyA,进行种属基因的比较基因组分析,通过种属内同源蛋白的氨基酸序列确定该新基因的翻译起始点。(6)根据预测的功能基因设计PCR引物,通过RT-PCR的方法获得目的cDNA克隆并进行序列测定验证。
2. 根据权利要求1所述人与模式生物功能基因电子克隆的方法,其 特征在于基因组序列与EST序列一致,直接拼接外显子。
3. 根据权利要求1所述人与模式生物功能基因电子克隆的方法,其 特征在于基因组序列与EST序列不一致,则根据有两个以上EST序列 支持的核香酸进行拼接外显子。 '
4. 根据权利要求1所述人与模式生物功能基因电子克隆的方法,其 特征在于对同时存在有两个以上EST序列支持的核苷酸位点确定为单 核苦酸多态性。
5. 根据权利要求1所述人与模式生物功能基因电子克隆的方法,其 特征在于外显子拼接过程中,EST数据库中缺少对应的核苷酸序列且 已知存在种属同源基因的氨基酸,则以该氨基酸序列为查询序列用 TBLASTN程序比对以获得预测的编码序列。
6. 根据权利要求1所述人与模式生物功能基因电子克隆的方法,其 特征在于生物信息学分析不符合上述典型基因特征,则通过种属同源 蛋白的氨基酸序列的比对确定新基因真实翻译起始和终止点。
全文摘要
本发明公开了一种人与模式生物功能基因电子克隆的方法,属于遗传工程技术。该方法包括利用感兴趣的EST片段作为查询探针搜索dbEST库,DNAstar软件进行EST拼接、延伸获得大片段或全长cDNA,获得一致序列,其中包括潜在的核苷酸多态性信息,以获得的一致序列作为查询序列在UCSC服务器上执行BLAT比对分析,拼接外显子等步骤,最后根据预测的功能基因设计PCR引物,通过RT-PCR方法获得cDNA克隆。本发明方法预测结果的可靠性高,对物种并没有特异性,只要被研究的新基因有足够的EST序列信息,且该物种的基因组已经测序,均可以采用该方法进行基因发掘,故具有广泛的适用性。
文档编号C12N15/10GK101423831SQ20081014415
公开日2009年5月6日 申请日期2008年7月28日 优先权日2007年7月27日
发明者王海涛, 畅继武, 志 郭 申请人:天津医科大学附属肿瘤医院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1