一种基于SNP位点鉴别槐猪和官庄花猪的方法与流程

文档序号:15469701发布日期:2018-09-18 19:59阅读:394来源:国知局

本发明涉及动物分子生物技术及动物遗传育种领域,尤其是涉及一种基于SNP位点鉴别槐猪和官庄花猪的方法。



背景技术:

福建省地方猪种现有槐猪、莆田黑猪、闽北花猪、武夷黑猪、官庄花猪、福安花猪。具有分布广、耐粗饲、早熟易肥、抗逆性好、适应性强、肉质细嫩鲜美等特点。但迄今为止,用于品种鉴定的SNP标记组合以及个体识别的SNP标记组合还很少。

随着猪高密度SNP芯片的应用、全基因组测序技术的普及和发展,及基因分型、测序成本的不断下降,建立基于DNA标记或全基因组序列的个体追踪溯源技术和品种鉴定技术成为可能。

槐猪广泛分布于福建省闽西南的三明、龙岩和漳州地区,具有早熟易肥,边长边肥,沉积脂肪能力强,骨细,肉嫩味美,屠宰率高,性情温顺,母性好,能适应于粗放的饲养管理。官庄花猪在当地适应性强、抗病力好、耐粗、性格温顺、早熟易肥、肉质细嫩,是小型的早熟脂肪型品种。目前用于鉴别槐猪和官庄花猪遗传位点的分子技术层面上的方法还不够完善。

中国专利CN106520943A公开了一种与加系官庄花猪背膘厚相关的SNP位点及其应用,是关于一个位于猪9号染色体上的CACNA1E基因内的SNP,所述CACNA1E基因的SNP位点为ALGA0055091(G/A),该位点基因型为AA的个体比GG型的个体有更薄的背膘,在此基础上,ALGA0055091可以作为一个SNP标记,通过对基因型的选择,可以加快对加系官庄花猪背膘厚的选择,同时加快提高加系官庄花猪的瘦肉率的遗传进展。

中国专利CN105603089A公开了一组用于鉴别猪种的SNP标记,主要利用纯种的大白、长白共200个个体作为研究对象,对上述2个品种的全部样本进行全基因组SNP 60K芯片扫描判型;对所有数据按要求进行质控后,筛选出可以用于鉴别长白、大白的SNP标记位点,通过全基因组关联分析筛选出16个SNP位点用于长白和大白猪的鉴别;另外通过主成分分析和聚类分析在另外500个个体中进行验证,16个SNP位点的准确率达到了99%,表明发明的16个SNP位点可以用于大白和长白的鉴别。

中国专利CN106566887A公开了一组用于鉴别加系官庄花猪、台系官庄花猪的SNP位点,这些SNP位点分别位于:SSC1、2、5、7、9、12、14、23上,SNP名称分别为:H3GA0021245、ASGA0033017、ALGA0075620、ALGA0075780、INRA0025222、H3GA0006033、ASGA0024360、ASGA0011065、ASGA0042109、ASGA0090983、ALGA0016497、M1GA0016745、ASGA0089906、ALGA0040895、ALGA0075815、ALGA0099582、ALGA0066519、ALGA0075754、ALGA0075715、SIRI0001491共计20个SNP位点。发明的20个SNP位点能够用于鉴别加系官庄花猪、台系官庄花猪。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于SNP位点鉴别槐猪和官庄花猪的方法。

本发明利用槐猪、官庄花猪的全基因组60K信息,经过全基因组关联分析、筛选最后挑选出16个可用于槐猪、官庄花猪遗传位点鉴别的SNP位点。

本发明的目的可以通过以下技术方案来实现:

一种基于SNP位点鉴别槐猪、官庄花猪的方法,利用槐猪、官庄花猪不同SSC(猪染色体,Sus scrofa chromosome)上SNP位点的不同,对槐猪、官庄花猪进行鉴别,位于SSC 1上的SNP名称分别为:ALGA0103591、ALGA0105914、MARC0111426、ALGA0007903、DRGA0001967,位于SSC 7上的SNP名称为:MARC0007845,位于SSC 8上的SNP名称为:H3GA0054057,位于SSC 9上的SNP名称为:ASGA0042913,位于SSC 11上的SNP名称分别为:MARC0069213、ALGA0062417、MARC0029934,位于SSC 13上的SNP名称为:ASGA0058253,位于SSC 14上的SNP名称为:ALGA0081288,位于SSC 18上的SNP名称为:H3GA0050329,位于SSC 23上的SNP名称分别为:ASGA0081086、MARC0034652共计16个SNP位点。

槐猪、官庄花猪SSC 1、7、8、9、11、13、14、18、23上SNP位点的不同,具体为:ALGA0103591位置的A或G、ALGA0105914位置的A或G、MARC0111426位置的A或G、ALGA0007903位置的C或A、DRGA0001967位置的G或A、MARC0007845位置的G或A、H3GA0054057位置的G或A、ASGA0042913位置的G或A、MARC0069213位置的G或A、ALGA0062417位置的G或A、MARC0029934位置的G或A、ASGA0058253位置的G或A、ALGA0081288位置的G或A、H3GA0050329位置的G或A、ASGA0081086位置的G或A、MARC0034652位置的G或A共计16个SNP位点。

这16个SNP位点的位置信息如下表1。

表1 16个SNP位点在染色体上的位置

鉴别已知的SNP位点方法,可以针对该位点所在的一段基因序列设计相应的引物,再通过荧光定量PCR的方法,扩增该片段,再通过扩增结果(不同碱基的波峰不同)确定该SNP位点,可以采用常规的生物学技术手段。

这16个SNP位点对应设计的引物序列如下:

使用The R Project for Statistical Computing对官庄花猪和槐猪进行主成分分析,其中横坐标代表主成分1,纵坐标代表主成分2,主成分1与主成分2分别代表了同一SNP位点的不同基因型,其中横坐标大于0的点为官庄花猪群体,横坐标小于0的点为槐猪群体。

与现有技术相比,本发明通过选择20个SNP位点,通过对SNP位点的测定可以便宜、快速、方便的鉴别槐猪、官庄花猪。

本发明的16个SNP位点能够用于鉴别槐猪与官庄花猪的遗传位点。

与现有技术相比,本发明通过选择16个SNP位点,通过对SNP位点的测定可以便宜、快速、方便的鉴别槐猪、官庄花猪。

附图说明

图1为槐猪、官庄花猪成分分析结果展示。

X轴:主成分1Y轴:主成分2

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

本发明以槐猪、官庄花猪为研究材料,利用Illumina 60K SNP芯片对这些个体进行全基因组基因分型,分析并筛选出尽可能少的能够用于槐猪、官庄花猪鉴定的SNP标记组合。

实验猪群:本发明使用的材料来自63头槐猪个体、35头官庄花猪猪个体。

猪全基因组60K SNP基因型检测:从上述群体中的每个个体采集一小块耳组织样,以标准酚氯仿方法提取基因组DNA,将DNA溶解于TE缓冲液中。用Nanodrop-1000核酸蛋白分析仪对提取出来的DNA进行质量检测和浓度测定,A260/280比值在1.8-2.0,A260/230比值在1.7-1.9判定为合格。合格的DNA样品统一稀释成50ng/μL,利用Illumina Infinium SNP分型平台,订购Porcine SNP60DNA Analysis Kit芯片,根据Illumina Infinium的使用说明和标准流程进行芯片杂交与结果扫描,通过GenomeStudio软件读取基因型数据。用PLINK v1.07对获得的基因型数据进行质量控制,剔除检出率<99.7%、次等位基因频率(minor allele frequency,MAF)<0.01或偏离哈代温伯格平衡(Hardy–Weinberg Equilibrium,HWE)P≤10-6的SNP标记,排除检出率<90%、家系孟德尔错误率高于0.1的个体,最后有620个SNP和31个个体用于数据分析。

全基因组关联(GWAS)分析,使用plink软件对槐猪、官庄花猪开展Case-Control分析,官庄花猪为Case,槐猪为Control。采用Bonferroni法确定在槐猪、官庄花猪中存在显著差异的SNP位点,基因组水平显著阈值为0.05除以有效SNP位点数量,即0.05/1568=3.189e-5;GWAS结果显示,top16的SNP位点分别位于:SSC(猪染色体)1、7、8、9、11、13、14、18、23上,用于槐猪、官庄花猪的鉴别。16个SNP位点在槐猪、官庄花猪中的基因型分布如表2所示。G开头的代表官庄花猪,H开头的代表槐猪。以SNP位点:ASGA0103591为例,在槐猪个体中AA的比例很高,而在官庄花猪群体中GG的比例最高。每个SNP位点在槐猪和官庄花猪的主要基因型都不一样,因此通过16个点的组合,便可以达到区分槐猪和官庄花猪的目的。

表2 16个SNP在槐猪、官庄花猪中基因型情况

主成分分析:

为了检验该16个SNP位点鉴别槐猪、官庄花猪的准确性,本发明用这16个SNP位点在63头槐猪、35头官庄花猪个体中进行了验证。主要使用R软件(全称:The R Project for Statistical Computing)对槐猪和官庄花猪进行主成分分析,结合统计学的主成分分析法,以及实际问题,主成分1和主成分2分别代表了同一SNP位点的不同基因型。

本实施例采用主成分分析法,主成分分析法为统计学中旨在考察多个变量间相关性的一种多元统计方法。研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。经典做法为:用F1(选取的第一个线性组合,即第一个综合指标)的方差来表示,即Var(F1)越大,表示在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则成F2为第二主成分,依次类推可以构造出第三、第四,……,第P个主成分,图中每个点代表1头猪16个SNP的信息。

结果如图1所示,由图1可以得知:16个SNP位点可以将槐猪、官庄花猪的遗传位点分开来。其中横坐标大于0的点为官庄花猪群体,横坐标小于0的点为槐猪群体(每个点代表1头猪的这16个SNP位点的信息,通过全基因组关联分析鉴别得到的这些点的信息)。验证结果表明通过全基因组关联分析鉴别到的16个SNP位点可用于槐猪、官庄花猪遗传位点的鉴别。

上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1