一种分析体系内相似序列相对数量的方法与流程

文档序号:14890843发布日期:2018-07-07 17:51阅读:178来源:国知局

本发明属于分子生物学技术领域,具体涉及一种分析体系内相似序列相对数量的方法。



背景技术:

功能基因组学是一种利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等。这些功能基因在基因组中常常有多个拷贝,这些拷贝之间的序列高度相似,只有部分碱基序列的差异,甚至只有几个碱基的snp差异,然而这些差异的基因在特定情况下并不是都能够表达或者存在表达量的差异,因此,研究基因组中功能基因多个拷贝的相对数量变得非常困难。

怎样弄清楚这些相似的同源基因在细胞内的相对丰度,对于确定其对应基因的功能研究有重要意义。pcr技术是一种用于放大扩增特定的dna片段的分子生物学技术,对于同源基因之间全部表达或者不表达的情况通过普通pcr就很容易确定,然而对于同源基因仅仅是量的差异情况,目前还没有一种简单便捷的分析方法。



技术实现要素:

本发明的目的是针对现有技术存在的问题,提出了一种分析体系内相似序列相对数量的方法,通过一代测序方法就能够简单快速判定同源基因产物的相对丰度。

为实现上述目的,本发明采用的技术方案是:

本发明提供一种分析体系内相似序列相对数量的方法,包括如下步骤:将待检测的至少两种同源序列用一引物对进行扩增,扩增结果进行一代测序,将测序得到的峰值数据以及作为参比差异序列的所述同源序列一起提交给计算机程序进行比对,统计每个序列所有差异位点的平均强度,各序列平均信号强度的比值即代表了所述同源序列的数量比值。

所述一代测序基于毛细管电泳,电泳后扫描电泳泳道上的荧光信号并记录,具体的,一代测序结果数据为abi公司开发的数据软件,所述峰值数据指距离电泳起点一定距离上的a,t,c,g对应荧光信号强度。

优选的,所述扩增过程对所有所述同源序列具有同样的扩增效率。

优选的,所述引物对与所述同源序列均为100%匹配,扩增过程选定的扩增靶标dna中差异位点范围为4~30个。

优选的,所述参比差异序列为所述扩增靶标dna中的所有同源序列。

优选的,每次比对的所述同源序列为两种。

优选的,所述计算机程序进行比对的方法包括:先根据提交的参比差异序列算出所有差异位点,记录这些差异位点的具体碱基和在序列中的位置;然后根据这些位置信息在测序结果文件数据中找出这些位置上4种碱基的信号强度,并记录;统计所有差异位点上不同碱基的信号强度;对每个位点的信号强度进行均一化;统计每个序列所有差异位点的平均强度,各序列平均信号强度的比值代表了起始体系中各同源序列的数量比值。

与现有技术相比,本发明的有益效果是:对于一个体系内相似序列并不是都能够表达或者存在表达量差异的情况,能够通过一代测序即可简单便捷的分析出所述相似序列的相对数量,对于其分别对应的功能基因的研究具有重要意义。

附图说明

图1为实施例中的测序结果用数据软件打开的峰值数据图。

具体实施方式

下面将结合本发明中的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动条件下所获得的所有其它实施例,都属于本发明保护的范围。

实施例1

(1)在水稻转基因植株中启动子pg1090和启动子paction分别驱动gfp和gfp(m)片段转录;提取植株rna进行反转录,获得gfp和gfp(m)同源片段,分别如序列表中seqidno.1~2所示。

(2)将上述待检测的gfp和gfp(m)同源片段用一引物对进行扩增,扩增结果进行一代测序;所述引物对如序列表seqidno.3~4所示,为:

gfp-f:ttcttcaaggacgacggcaa

gfp-r:aagttggcctttatcccgtt

该引物对与待检测的所述同源片段均为100%匹配,扩增过程选定的扩增靶标dna中差异位点范围为4~30个。

(3)测序得到2017121889hmapz_gfp.ab1测序结果文件,测序结果用数据软件打开的峰值数据图如图1所示;将测序得到的峰值数据以及作为参比差异序列的所述同源序列seqidno.1~2一起提交给计算机程序进行比对,比对过程如下表所示:

注:碱基_a:序列a(gfp)中的差异位点对应的碱基;碱基_b:序列b(gfp(m))中的差异位点对应的碱基;峰值_a:序列a(gfp)上差异位点碱基信号强度值;峰值_b:序列b(gfp(m))上差异位点碱基信号强度值;均一化值_a:序列a(gfp)上差异位点碱基信号强度均一化后的值;均一化值_b:序列b(gfp(m))上差异位点碱基信号强度均一化后的值。

根据提交的参比差异序列算出所有差异位点,记录这些差异位点的具体碱基和在序列中的位置,得到共21个差异位点;然后根据这些位置信息在测序结果文件数据中找出这些位置上4种碱基的信号强度,并记录;统计所有差异位点上不同碱基的信号强度;对每个位点的信号强度进行均一化;统计每个序列所有差异位点的平均强度,各序列平均信号强度的比值代表了起始体系中各同源序列的数量比值。

计算结果显示a(gfp):b(gfp(m))的相对数量比值=1.712828。

根据上述实施例的记载及本发明公开的内容,本领域技术人员可对同一体系中两种或多种同源序列的相对数量进行简单便捷的分析,对于功能基因的研究具有重要意义。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

sequencelisting

<110>武汉艾德士生物科技有限公司

<120>一种分析体系内相似序列相对数量的方法

<130>

<160>4

<170>patentinversion3.3

<210>1

<211>200

<212>dna

<213>水稻gfp片段

<400>1

ttcttcaaggacgacggcaactacaagacgcgagctgaggtgaagttcgagggcgacacg60

ctcgtcaaccgtatcgagctcaagggaatcgacttcaaggaggacggaaacattctcgga120

cacaagctggagtacaactacaactcccacaacgtttacataatggcggacaagcagaag180

aacggcattaaggccaactt200

<210>2

<211>200

<212>dna

<213>水稻gfp(m)片段

<400>2

ttcttcaaggacgacgggaactacaagacccgtgcagaggtcaagttcgagggggacacc60

ctcgtgaacagaatcgagctcaagggtatcgacttcaaggaggacggtaacatactcggt120

cacaagctcgagtacaactacaactcgcacaacgtatacattatggccgacaagcagaag180

aacgggataaaggccaactt200

<210>3

<211>20

<212>dna

<213>人工序列gfp-f

<400>3

ttcttcaaggacgacggcaa20

<210>4

<211>20

<212>dna

<213>人工序列gfp-r

<400>4

aagttggcctttatcccgtt20

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1