河南斗鸡基因组SNP分子标记的筛选方法及其应用与流程

文档序号:16645781发布日期:2019-01-16 08:15阅读:719来源:国知局
河南斗鸡基因组SNP分子标记的筛选方法及其应用与流程

本发明涉及遗传学领域,具体而言,涉及一种河南斗鸡基因组snp分子标记的筛选方法及其应用。



背景技术:

河南斗鸡(henangamechicken),又称中原斗鸡,原产地及中心产区为河南省开封市;1989年被《中国家禽品种志》收录,2000年被列入国家级畜禽品种资源保护名录。河南斗鸡饲养历史悠久,在长期的选择和驯化过程中形成了与其它地方鸡品种截然不同的的外貌特征,具有较强的斗性和抗击打能力,是我国家禽库极其宝贵的遗传资源。

单核苷酸多态性(singlenucleotidepolymorphism,snp),主要是指在基因组水平上由单个核苷酸的变异所引起的dna序列多态性,包括转换、颠换、缺失和插入,形成的遗传标记,其数量很多,多态性丰富,从理论上来看每一个snp位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:1。snp是基因组中最常见的多态形式,具有很高的遗传稳定性。

限制性酶切位点关联dna测序技术(restriction-site-associateddnasequencing,rad-seq)是在二代测序技术基础上发展起来的一种简化基因组技术。简化基因组测序(reduced-representationsequencing)是在新一代测序基础上发展起来的一种新型测序方法,该方法利用限制性内切酶对基因组进行酶切,只选取基因组特定区域进行测序,从而降低了基因组的复杂程度。rad测序文库构建是对基因组dna片段进行酶切和随机打断,选取一端带有酶切位点,另一端为随机打断点的片段进行建库测序。rad-seq能够降低基因组的复杂度,操作简便,同时不受参考基因组的限制,可快速鉴定出高密度的snp。

全基因组关联分析(genome-wideassociationanalysis,gwas)是当前用于功能基因发掘的最常用手段,然而,其仅针对单个性状,且需要建立分离群体,并不适于品种特性的全面评价。自然选择和人工选择作用会在动物基因组上留下选择信号(selectionsignal),对这些选择信号进行分析是发掘品种特性功能基因的最有效技术手段,通过多种不同类型品种基因组的比较,可在全基因组水平上对单个品种资源的特性有充分、全面的认识。

品种资源的保护目标是尽可能地保持品种的特征、特性不丢失,因此开展品种资源保护的前提是充分认识品种的特征特性。目前,微卫星标记及线粒体dna序列变异已被广泛应用于地方鸡种(包括斗鸡)的遗传多样性、遗传结构及起源分析,然而这些dna标记在整个鸡基因组中的覆盖范围是极其微小的,如鸡微卫星标记仅有约30个,鸡线粒体dna的d-loop区域全长也仅约1200bp,其所代表的基因组遗传变异信息量非常有限。现阶段,斗鸡保种效果的评价主要依赖于常规表型性状记录、系谱记录和低密度dna分子标记信息,通量低,精确度差,不能客观的评价斗鸡保种效果如何;也限制了斗鸡品种资源的开发利用。因此,快速高效低成本的筛选出能够评价河南斗鸡遗传多样性的分子标记是目前有待解决的问题。

有鉴于此,特提出本发明。



技术实现要素:

本发明的目的在于提供了河南斗鸡基因组snp分子标记的筛选方法,缓解了目前现有技术中由于缺少能够评价河南斗鸡遗传多样性的分子标记导致的对河南斗鸡遗传分化研究成本高、精确度低的技术问题。

本发明的目的还在于提供了河南斗鸡基因组snp分子标记的应用,缓解了现有技术中河南斗鸡的遗传、分化、鉴定研究缺少分子生物学标记的技术问题。

为了实现本发明的上述目的,特采用以下技术方案:

本发明提供了一种河南斗鸡基因组snp分子标记的筛选方法,对采用高通量测序检测得到的数据计算遗传统计量,通过分析河南斗鸡与其他鸡种群体的遗传差异,筛选出河南斗鸡snp分子标记。

进一步地,所述高通量测序为rad-seq。

进一步地,所述rad-seq的测序样本通过ddrad建库方式构建pair-end文库;

优选地,所述文库长度范围在300-500bp。

进一步地,所述高通量测序检测的质控条件包括:q20>95%、ddraddepth>60%、maf>0.05、在所有鸡种群体中的snpcallrate>70%和在单个鸡种中snpcallrate>90%。

进一步地,所述遗传统计量包括观察杂合度ho值、核苷酸多样度pi值、近交系数fis值、群体分化系数fst值、平均基因流nm和群体θπ值。

进一步地,所述的分析方法包括连锁不平衡分析、群体聚类分析、选择消除分析和基因功能富集分析。

进一步地,所述基因功能富集分析是基于go的富集分析方法。

进一步地,所述其他鸡种群体包括:狼山鸡、安义瓦灰鸡、固始鸡、仙居鸡、白耳黄鸡、东乡绿壳蛋鸡、金湖乌凤鸡、文昌鸡、大围山微型鸡、藏鸡、茶花鸡、瓢鸡、惠阳胡须鸡、大骨鸡、萧山鸡、鹿苑鸡、边鸡、北京油鸡、隐性白羽肉鸡和/或安卡红鸡。

进一步地,筛选出河南斗鸡snp分子标记主要富集的生物学通路包括:神经系统发育、代谢过程、微管细胞骨架、运动行为、适应性免疫和刺激反应。

本发明还提供了上述的筛选方法在如下a)-e)中的任一项中的应用:

a)遗传多态性位点分析;

b)种质资源鉴定;

c)家系管理;

d)新品系选育;

e)个体识别。

与现有技术相比,本发明的有益效果为:

本发明提供的河南斗鸡基因组snp分子标记的筛选方法采用了高通量测序方法,计算遗传统计量,接着分析河南斗鸡与其他鸡种群体的遗传差异,筛选出河南斗鸡snp分子标记。该方法可对河南斗鸡进行全面有效的种质分析,筛选得到河南斗鸡的受选择基因作为鉴定河南斗鸡种质的分子标记,成本低,数据量丰富,检测精度高,为后续的河南斗鸡的种质资源鉴定、新品种选育及开发利用提供科学依据。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1提供的河南斗鸡snp在染色体上的分布图;

图2为本发明实施例1提供的河南斗鸡和其它品种ld随距离增长的衰减图;

图3为本发明实施例1提供的河南斗鸡及其他鸡种聚类图;

图4为本发明实施例1提供的河南斗鸡受选择的基因go注释分类统计图;

图5为本发明实施例1提供的河南斗鸡受选择基因的kegg通路注释统计图。

具体实施方式

下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。

本发明提供了一种河南斗鸡基因组snp分子标记的筛选方法,对采用高通量测序检测得到的数据计算遗传统计量,通过分析河南斗鸡与其他鸡种群体的遗传差异,筛选出河南斗鸡snp分子标记。

该方法可对河南斗鸡进行全面有效的种质分析,筛选得到河南斗鸡的受选择基因作为鉴定河南斗鸡种质的分子标记,成本低,数据量丰富,检测精度高,为后续的河南斗鸡的资源鉴定、新品种选育及开发利用提供科学依据。

一个优选的实施方式中,上述高通量测序为rad-seq。rad-seq(restriction-siteassociateddnasequencing)是在第二代测序基础上发展而来的一项基于全基因组酶切位点的简化的基因组测序技术,是简化基因组测序技术的总称。该方法利用限制性内切酶对基因组进行酶切,只选取基因组特定区域进行测序,从而降低了基因组的复杂程度。rad-seq不仅实验操作简单,性价比高,更为重要的是它并不依赖参考基因组的信息,一次测序即可获得数以万计的多态性遗传标记,已然广泛用于生态学、遗传学、基因组学等研究领域。

一个优选的实施方式中,rad-seq测序样本通过ddrad建库方式构建pair-end文库。

一个更优选的实施方式中,文库长度范围在300-500bp。

采用ddrad建库方式能够在改善测序效率的同时减少试验成本,通过采用双酶切系统对基因组进行切割,同时对酶切后产物大小的选择,可以得到两端为不同酶切位点并且长度为500bp左右的序列。该方法得到的文库长度大小适中,测序效率高,既不容易测出过多的接头序列导致数据质量低,也不容易由于文库片段过长导致文库中间部分测序不充分,数据流失。

一个优选的实施方式中,高通量测序检测的质控条件为:q20>95%、ddraddepth>60%、maf>0.05、在所有鸡种群体中的snpcallrate>70%和在单个鸡种中snpcallrate>90%。

需要说明的是,q20表示正确率99%的碱基数目比例;ddraddepth表示snp的测序深度;maf表示最小等位基因频率;snpcallrate表示核酸多态性检出率。

一个优选的实施方式中,遗传统计量包括观察杂合度ho值、核苷酸多样度pi值、近交系数fis值、群体分化系数fst值、平均基因流nm和群体θπ值。

一个优选的实施方式中,所述分析方法包括连锁不平衡分析、群体聚类分析、选择消除分析和基因功能富集分析。

连锁不平衡(linkagedisequilibrium,ld)是指在某一群体中,不同座位上某两个基因同时遗传的频率明显高于预期的随机频率的现象。一般来说,在连锁不平衡分析中,野生种的ld值较低,而驯化种由于受到了正选择的作用,ld值就会偏大。采用haploview软件分析。

群体聚类分析技术是将功能相关的基因按表达谱的相似程度归纳成共同表达类别,有助于对基因功能、基因调控、细胞过程及细胞亚型等进行综合研究。采用mega软件nj聚类法。

选择消除分析就是基因组某区域由于受到了选择而消除多态性。选择消除分析是正向选择在物种基因组上留下的印迹。与野生祖先相比,栽培或驯化的物种发生选择消除的区域遗传多样性显著降低,这是驯化区域的典型特征。利用plink软件检测选择信号,进行选择消除分析,选择信号检测条件为以100kb为窗口,10kb为step进行滑动的θπ值和fst分布计算,0≤fst≤1,fst越接近1表示亚种群间的种群分化越明显。

基因功能富集分析中的基因功能指的是众多代表一定的基因功能特征和生物过程的基因功能集。由这些基因功能集构成的常用基因功能数据库有go。

一个优选的实施方式中,基因功能富集分析是基于go的富集分析方法。基因本体数据库(geneontology,go)涵盖了基因生物学过程、分子功能和细胞组分三个方面,go数据库通过控制注释词汇的层次结构从不同层面查询和使用基因注释信息,从整体上看,go注释系统是一个有向无环图结构,包含基因生物学过程、分子功能和细胞组分三个节点,注释系统中每一个节点都是对基因或蛋白质的描述,因此,一个基因可以从三个方面得到注释。

一个优选地实施方式中,其他鸡种群体包括:狼山鸡、安义瓦灰鸡、固始鸡、仙居鸡、白耳黄鸡、东乡绿壳蛋鸡、金湖乌凤鸡、文昌鸡、大围山微型鸡、藏鸡、茶花鸡、瓢鸡、惠阳胡须鸡、大骨鸡、萧山鸡、鹿苑鸡、边鸡、北京油鸡、隐性白羽肉鸡和/或安卡红鸡。这些鸡种包括蛋用型、肉用型、兼用型、观赏和药用型等品种,同时地理上广泛分布于我国青藏高原区、蒙新高原区、黄土高原区、西南山地区、东北地区和黄淮海区等地理生态区域,充分代表了差异化品种类型,通过对比能准确地鉴定出河南斗鸡品种的特异性分子标记。

一个优选地实施方式中,筛选出河南斗鸡snp分子标记主要富集的生物学通路包括:神经系统发育、代谢过程、微管细胞骨架、运动行为、适应性免疫和刺激反应。

河南斗鸡群体与其他鸡种群体相比较,通过fst和θπ检验,在河南斗鸡中鉴定出24个受选择区域、129个受选择基因。go分析表明这些基因主要富集在神经系统发育、代谢过程、微管细胞骨架、运动行为、适应性免疫和刺激反应等生物学通路。

本发明还提供了上述的筛选方法在如下a)-e)中的任一项中的应用;

a)遗传多态性位点分析;

b)种质资源鉴定;

c)家系管理;

d)新品系选育;

e)个体识别。

为了有助于进一步理解本发明,现结合优选实施例对本发明的技术方案进行详细说明。

本发明实施例中建库测序部分由南京集思慧远生物科技有限公司完成;本发明实施例中所用试剂全部为市售常规试剂;河南斗鸡保种群体与其他品种保种群体来自于江苏省家禽科学研究所的国家级地方鸡种基因库。

实施例1河南斗鸡基因组snp分子标记的筛选

(a)血液样品采集:河南斗鸡及对照组18个地方鸡品种(狼山鸡、安义瓦灰鸡、固始鸡、仙居鸡、白耳黄鸡、东乡绿壳蛋鸡、金湖乌凤鸡、文昌鸡、大围山微型鸡、藏鸡、茶花鸡、瓢鸡、惠阳胡须鸡、大骨鸡、萧山鸡、鹿苑鸡、边鸡和北京油鸡)和2个引入鸡品种(隐性白羽肉鸡和安卡红鸡)来自于江苏省家禽科学研究所的国家级地方鸡种基因库,每个群体按照家系选择30个个体(10公、20母),个体间无亲缘关系。翅静脉采血1ml-1.5ml,柠檬酸钠(acd)抗凝,-20℃保存备用。

(b)dna样品获取:采用酚-氯仿法提取所有品种的基因组dna。将获得的dna进行质检,包括nanodrop初步检测dna样品浓度;电泳检测dna的完整性,包括dna有无降解,是否存在蛋白质和rna等其他杂质污染;qubit2.0对dna样品进行准确定量,选取质量≥1ug的样品。将合格样品置于-80℃保存,以备建库测序使用。

(c)建库测序:将步骤(b)的样品采用ddrad建库的方式构建长度范围在300-500bp的pair-end文库,然后进行rad-seq简化基因组测序。将得到的rawreads数据进行过滤得到cleanreads,过滤标准为:①去除接头污染的reads;②去除质量值小于5的碱基占整条reads比例超过50%的reads;③去掉测为n的碱基占整条reads比例超过10%的reads。

(e)snp的检测主要使用gatk和samtools软件工具包实现。质控条件包括q20>95%、ddraddepth>60%、在所有鸡种群体中的snpcallrate>70%、在单个鸡种中的snpcallrate>90%和maf>0.05。通过数据质控,在河南斗鸡群体中鉴定出259412个snp,snp数量与染色体长度呈正相关,大染色体上snp分布较多,其中1~7号及z染色体上snp数量均超过10,000个,小染色体上snp分布较少,结果图1所示,具体统计结果如下表1所示。

表1河南斗鸡snp在染色体上的分布

(f)利用plink软件对所有品种进行连锁不平衡(ld)分析,结果如图2所示,可以发现在总体范围内,河南斗鸡群体和其它地方鸡种群体各等位基因不存在强烈的连锁不平衡现象。

(g)popgen软件计算近交系数fis、核苷酸多样度pi、群体分化指数fst和观察杂合度ho,得到河南斗鸡群体近交系数fis为0.1099,核苷酸多样度pi为0.1752,观察杂合度ho为0.1560,与其他18个地方鸡种相比遗传多样性相对匮乏,河南斗鸡的平均遗传分化系数fst最高为0.2187,在以引入品种为外群的系统发育树中形成一个独立的分支。

(h)利用mega软件nj聚类法进行群体聚类分析,结果表明,河南斗鸡与瓢鸡之间的遗传分化系数fst最低(0.1765),其次为文昌鸡(0.1932)和惠阳胡须鸡(0.1980),相对应的基因流nm分别为1.1665、1.0443和1.0125。以隐性白羽肉鸡、安卡红鸡做外群构建的nj聚类结果表明,河南斗鸡dj形成了一个相对独立的分支,结果如图3所示。

附图中缩写表示:be-白耳黄鸡;zz-藏鸡;ch-茶花鸡;xj-仙居鸡;gs-固始鸡;dg-大骨鸡;by-北京油鸡;dx-东乡绿壳蛋鸡;hx-惠阳胡须鸡;jh-金湖乌凤鸡;ls-狼山鸡;xs-萧山鸡;wh-瓦灰鸡;wx-大围山微型鸡;wc-文昌鸡;pj-瓢鸡;dj-斗鸡;ly-鹿苑鸡;bj-边鸡;rw-隐性白羽肉鸡;ak-安卡红鸡。

(i)选择信号检测采用plink软件,以100kb为窗口,10kb为step进行滑动的θπ值和fst分布计算。

(j)对受选择的基因进行go注释和kegg通路注释,确定受选择的基因与河南斗鸡群生物学特性的关系,go注释结果如图4所示,kegg通路注释结果如图5所示。结合核苷酸多样度θπ比率和遗传分化系数fst的选择信号分析发现24个染色体区域受到选择,129个受选择基因。功能分析结果表明,筛选出的能够鉴定河南斗鸡品种特性的分子标记主要富集的功能区域包括:神经系统发育、代谢过程、微管细胞骨架、运动行为、适应性免疫和刺激反应。

斗性行为是河南斗鸡在进化过程中形成的最显著的特性,分析发现多个参与下丘脑-垂体-肾上腺/甲状腺轴调控通路及激素介导信号通路的基因crh、adrb1、slc64a、drd1、tshr和sorcs2等受到选择作用。肾上腺素、多巴胺、5-羟色胺及雄激素等已被证实是调控攻击行为的主要神经递质,vps10p蛋白家族成员sorcs2也被发现是调节鸡攻击行为的重要候选基因。另外,还发现一些参与突触生成和传递的基因slitrk5、snap47、mef2c等也受到了选择,提示突触可塑性在斗性行为中可能也发挥着重要作用。

与成骨细胞分化、骨生长及矿化相关的基因fbn2、ddr2、twsg1、wnt3a等受到了选择。研究表明,fbn2通过调控tgfβ和bmp影响成骨细胞分化及骨组织形成,ddr2是成骨细胞生成的促进因子,twsg1依赖于bmp结合抑制破骨细胞的形成。这些基因的作用可能使得河南斗鸡具有较其它鸡种更粗壮致密的骨骼。骨骼发育与肌肉生长可能是受到共选择,用以支撑较大的体重。另外,与头部发育相关的基因mef2c、cryab、wnt6等也受到了选择作用,这些基因的作用形成了河南斗鸡头盖骨厚、脸部狭长及独特的眼部结构特征。

心血管系统方面,心室发育与心脏收缩力调节基因(foxf1、myl3、atp2b4等)、内皮细胞分化基因(erap1、ptprm等),肌球蛋白、肌动蛋白及微丝运动相关基因(myh10、egfr等)也受到了选择作用。能量代谢方面,氧化还原酶活性基因(ptgs2、sri等)、蛋白磷酸化作用基因(st3gal1、stk36等)及线粒体呼吸链基因(ndufv2、steap4等)也受到了选择作用。发达的心血管系统和能量代谢系统使得河南斗鸡能够适于长时间激烈的打斗,内皮细胞分化有利于血管再生和伤口的愈合。免疫调节方面,与细菌、病毒和外源dsdna响应相关基因ifna、erap1等,自噬相关基因mtcl1、atg4b等也受到了选择作用,表明河南斗鸡具有较强的抗病能力。另外,一些压力响应基因(oprm1、grm7等),视觉及声音感知基因(rgs9bp、pde6h等),运动行为调节基因(dscam、trmt1l等)也显示出强烈的选择信号,表明河南斗鸡仍保持着野外生存状态下必须的机警与敏感。

实施例2河南斗鸡分子标记的应用

(a)河南斗鸡保种群个体血液采集:采集保种群公、母鸡翅静脉全血0.5-1.0ml(随机选留公鸡不少于10只,母鸡不少于20只),采集后迅速注入含有2μl0.5mol/lna2edta抗凝剂的无酶管中,然后将无酶管置于4℃环境下保存备用。

(b)dna提取和质量检测:常温下吸出无酶管中保存备用的公、母鸡个体血液0.2-0.3ml,采用常规动物外周血苯-酚抽提法提取个体血液dna;对dna进行质检,琼脂糖凝胶电泳分析dna完整度,分光光度计检测dna的纯度;将合格样品置于-80℃保存,以备snp检测使用。

(c)河南斗鸡品种特异性基因的snp标记检测

引物设计:对筛选得到的河南斗鸡品种特性基因的snp位点在参考基因组中进行染色体定位,获得包含这些snps位点的一段序列。利用鸡基因组dna作为模板,使用oligo等软件设计引物进行pcr扩增。

pcr扩增和检测:pcr扩增总体积为20μl:1μldna模板,其浓度为100ng/μl,2μl10×pcrbuffer,1.5μldntp,浓度为10mmol/l,上下游引物各1μl,浓度为10pmol/μl,taq酶为0.2μl,浓度为5u/μl,ddh2o13.3μl;pcr扩增程序:95℃预变性5min,94℃变性40s,适宜退火温度40s,72℃延伸40s,35个循环,最后72℃延伸10min,4℃保存备用;把pcr产物送入上海生工生物工程股份有限公司进行测序验证。

(d)河南斗鸡保种效果的评价,结果如下表2所示:

表2河南斗鸡保种效果的评价

本发明采用计算机模拟方法研究了一对基因在群体内的实际频率和假设不同基因频率和不同群体规模闭锁群体内单个双等位基因座位的遗传漂变,发现不同初始基因频率下4种群体规模100次重复模拟中等位基因a发生丢失的概率。可以看出:无论在何种初始频率下,等位基因a固定的次数均随着群体规模的降低而升高,且a发生固定的概率受其初始频率的影响较为明显。当初始频率为0.1时,规模为100只和300只的群体在第10代时a发生丢失的概率分别为4.4%和1.49%,当初始频率为0.5时,100只和300只的群体在第10代时a发生丢失的概率分别为2.4%和0.8%。即使到了20世代,规模为400只的群体发生a的丢失或固定仅为1.2%。当初始频率为0.9时,100只和300只的群体在第10代时a发生丢失的概率分别为0.49%和0.17%。下表的模拟结果这表明,初始频率过低将会加速基因在群体中的丢失(见表3)。

表3不同基因频率和群体规模下1对等位基因a固定概率的数学模型理论预测结果

基于上述模拟理论的结果,可以将河南斗鸡品种特性记基因的等位基因频率75%作为临界点,大于75%的基因频率代表保种效果较好,由表1和表2可知河南斗鸡在保种过程中未发生较强的遗传漂变。

尽管已用具体实施例来说明和描述了本发明,然而应意识到,在不背离本发明的精神和范围的情况下可以作出许多其它的更改和修改。因此,这意味着在所附权利要求中包括属于本发明范围内的所有这些变化和修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1