一种基于高通量测序的基因芯片探针序列的获取方法与流程

文档序号:13608448阅读:2798来源:国知局

本发明涉及生物技术领域,具体来说是一种基于高通量测序的基因芯片探针序列的获取方法。



背景技术:

基因芯片由于其具有平行,快速,高通量检测等特点,在分子诊断技术领域有着广泛的运用。基因芯片主要是通过让所检测的生物样本与芯片上该检品独有的基因探针相结合,而不与其他检品对应探针结合,来判断该样本是否为某检品的生物技术检测产品。这种检品与芯片探针的结合是通过核酸杂交的方式进行,而这组特异性的探针是能成功检测的关键。

基因芯片最重要的一点是找到一组特异性的探针序列可以明确的区分待检样品。通常情况下,这组特异性的探针是由同源基因组成的,即检测的相近样品都具有该段基因。由于同源基因的相似性,每一个探针有相似性,同时又存在基因的变异位点将这些探针区分开来。在最初选择要检测的基因片段和所对应的探针时,需要借助基因库(如genbank)来寻找相关的背景资料。实际操作中,针对特定的一组检测对象,基因库中很多时候未包括所有待检测物种的该基因序列。对于这些没有所选基因的待检物种来说,通常我们利用通用引物进行pcr扩增的方法将该物种对应的同源基因找出来。

但在实际运用中,这种用常规pcr扩增的方法面临着两大问题。首先,用作芯片的探针要有足够的差异,其在引物的位置也可能出现变异。由此,常规引物将不能有效的扩增这些同源基因,从而无法获取该物种的序列和探针。通过其他手段来获取该基因的方法,如基因组步移或race(cdna末端快速扩增)技术,往往事倍功半。其次,随着检测范围扩大,所选择的基因检测范围也越来越广,而很多基因除了直系同源基因之外,还存在着旁系同源基因(非特异性基因)。这些旁系同源基因的序列不仅可能影响直系同源基因的扩增,并且可能使最终的杂交出现假阳性的结果。

目前高通量测序技术蓬勃发展,基因测序出现了井喷式的增长。利用高通量测序技术,可以有效的且快速的寻找直系同源基因,并且同时获得旁系同源基因或非特异性相似片段,从而在探针设计时排除这些旁系同源基因的干扰。



技术实现要素:

本发明的目的是针对背景技术存在的问题,提供一种基于高通量测序技术获取未知检品相关检测基因序列,从而进行探针的筛选和排除其他非特异性基因干扰。

为实现上述目的,本发明采用的技术方案是:一种基于高通量测序的基因芯片探针序列的获取方法,步骤包括:

(1)确定待测基因片段:根据已有的资料,评估出用于特定检测项目所需的基因芯片目标基因片段;

(2)待测未知物种高通量测序:对需要检测但不具有该基因的物种或样品进行高通量测序,根据检测的目的可以采用不同的高通量测序方案;

(3)高通量检测拼接:高通量测序后整理,采用相关的软件进行拼接,生成contig文件,用于后续的比对分析;

(4)利用已知物种基因做blast比对:用已知的物种该段基因,在拼接生成的contig文件做比对,直接钓出未知该基因;

(5)基因芯片探针设计:根据所搜集的不同物种的该基因序列设计长度为18-40bp探针。

进一步的,步骤(2)中,用于特定编码基因的检测采用转录组测序的方案,即取目标物种的特定组织样,提取rna,反转录为cdna后,进行高通量测序建库,然后测序;

进一步的,步骤(2)中,用于基因侧翼序列和非编码序列检测用简化基因组测序的方案,即直接提取目标物种或样品的dna,建库,然后高通量测序。

进一步的,步骤(3)中,转录组测序使用trinity软件进行拼接。

进一步的,步骤(3)中,简化基因组测序采用soapdenovo软件进行拼接。本发明的有益技术效果是:本发明可以明显的加速获取待检的未知物种相应基因片段,弥补了常规pcr有时无法有效扩增的缺陷,同时,比对找出的旁系同源基因或非特异性相似片段可增加背景信息,有效的减少非特异性探针杂交,从而减少假阳性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

如图1所示,一种基于高通量测序的基因芯片探针序列的获取方法,步骤包括:

(1)根据已有的资料,评估出用于特定检测项目所需的基因芯片目标基因片段。

(2)对需要检测但不具有该基因的物种或样品进行高通量测序;根据检测的目的可以采用两种不同的高通量测序方案:

①用于特定编码基因的检测采用转录组测序的方案,即取目标物种的特定组织样,提取rna,反转录为cdna后,进行高通量测序建库,然后测序;

②用于基因侧翼序列和非编码序列检测可以用简化基因组测序的方案,即直接提取目标物种或样品的dna,建库,然后高通量测序。

(3)高通量测序后整理,采用相关的软件进行拼接,生成contig文件,用于后续的比对分析。

对于不同的测序方案采用不同的拼接方法:转录组测序可使用trinity软件进行拼接;简化基因组测序采用soapdenovo软件进行拼接。

(4)用已知的物种该段基因,在拼接生成的contig文件做比对,直接钓出未知该基因,所使用的软件为blast+。具体操作为:先将contig文件生成blast所需的格式化数据库;然后用已知的物种该段基因为源文件,找出所建立的未知物种数据库中与该基因片段相似的序列,设置参数-evalue为1e-5,-num_alignments为250,使输出文件中出现多条与其相似的序列;输出文件中,evalue值最高,并且基因为明确的编码基因的序列则定义为直系同源的目标基因,而找出来的其他序列为旁系同源基因(非特异性片段)。

(5)根据所搜集的不同物种的该基因序列设计探针。具体操作为:将所有搜集到的需要检测物种的该基因片段以及非特异性片段一起进行clustal比对,采用mega或clustalx等软件完成;比对后,从每一个物种的目标基因中找出2-3段特异的探针,探针长度18-40bp;这些探针要求为该物种特有,与其他物种序列及非特异性片段均有不同。

实施例2

两栖类性别决定及发育检测基因芯片运用。在两栖类中,dmrt1基因与性别决定及发育相关,但是基因库中还没有包含很多两栖类的该基因。为此,对需检测的棘腹蛙和四川湍蛙进行转录组测序,trinity拼接后,通过已知的爪蟾和黑斑蛙dmrt1基因,经blast找出这两个物种的dmrt1基因及非特异序列。最后将搜集到的需要检测物种的该基因片段以及非特异性片段一起进行clustal比对,找出每一个物种的目标基因中2-3段特异的探针。

实施例3

检疫性实蝇dna条形码检测基因芯片应用。dna条形码,即coi基因序列被广泛用作物种的识别,但是由于该基因为线粒体基因,其在核基因组中具有与该基因相似的非特异基因(假基因,numt)。这些非特异基因片段干扰了dna条形码应用,使假阳性升高。为此,选取了5种不易辨识的实蝇(具条实蝇,桔小实蝇,南瓜实蝇,异颜实蝇,瓜实蝇)进行简化基因组测序。拼接后,用已知的上述物种coi基因,经blast找出这些物种的coi基因及非特异序列(假基因)。最后将搜集到的需要检测物种的该基因片段以及非特异性片段一起进行clustal比对,找出每一个物种的目标基因中2-3段特异的探针。避免与非特异序列的雷同,从而减少假阳性。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应该理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1