一种基于多聚单核苷酸多态性的猪50K液相芯片及其应用

文档序号:34551081发布日期:2023-06-28 01:40阅读:178来源:国知局
一种基于多聚单核苷酸多态性的猪50K液相芯片及其应用

本发明涉及基因分子育种领域,具体涉及基于多聚单核苷酸多态性的猪50k液相芯片及其应用,更具体是猪50k msnp液相芯片。


背景技术:

1、单核苷酸多态性(single nucleotide polymorphism, snp)具有数量庞大,在基因组范围分布广泛、易于大规模快速筛查以及基因分型等特点,被认为是目前最佳的分子标记。分子检测技术发展极为迅速,能够进行高通量基因分型的snp芯片应运而生。目前,市场主流的snp芯片主要基于固相技术开发,检测准确率较高。如图1所示,固相芯片主要对目标位点多次检测,保证基因分型的准确性。但固相芯片存在灵活性差、样本量要求严格(需是12或24的倍数)、定制成本高等缺点,限制了其在实际育种中的大规模使用。

2、与固相芯片不同,基于靶向测序基因型检测(genotyping by targetsequencing,gbts)技术的液相芯片,具有标记增减方便、无样本量要求等优点。图1显示了gbts技术主要对靶位点及其上下游进行多重测序,保证靶位点基因型分型质量。与固相芯片不同,液相芯片在对靶位点基因型检测同时,靶位点上下游的多态位点也能够得到基因型分型,称之为多聚单核苷酸多态性(multiple singlenucleotide-polymorphismcluster,msnp或multiple dispersed nucleotide polymorphism,mnp)。以靶位点为核心的msnp由于紧密连锁,处于高度连锁不平衡状态。在很多物种中,靶位点上下游msnp基因型被认为与靶位点一致,提供不了额外的信息。如图2所示,水稻多个品种200bp片段内的标记间连锁不平衡(r2)为1,表明这些片段内的snp基因型连锁相一样,即使有多个msnp,提供的信息与单个靶位点是一样的。因此液相芯片纵使能够检测出超过靶位点数量的msnp,也很少利用靶位点上下游的msnp信息,仍以靶位点进行遗传分析和分子育种为主。

3、虽然动物基因组也存在近距离标记连锁不平衡程度高的现象,但是由于动物基因组多样性高和标记平均杂合度高,存在很多基因组区域,标记间的连锁不平衡程度处于中等水平。对于液相芯片,靶位点上下游的标记可以提供额外的信息。因此,多聚单核苷酸多态性技术,在不增加靶位点标记的前提下,显然可以增加更多有效msnp标记,提高液相芯片的信息含量,充分利用gbts技术特点,这是固相芯片技术做不到的。

4、多聚单核苷酸多态性技术虽然增加了msnp标记,但是如何利用这些标记信息也存在诸多挑战,直接将msnp作为单标记利用,标记间较高的连锁不平衡往往会带来噪音,降低遗传分析的效果。单倍型分析能够同时利用多个snp标记信息,提高遗传分析效力。但是很多研究表明,如果标记间距过大,造成标记间的低连锁不平衡会产生很多单倍型,不仅不能增加遗传分析效力,还增加了分析复杂度和计算时间。目前猪上主流的50k snp芯片,如美国纽勤公司设计的snp chip porcine ggp 50 k (包含 50,697 snp标记),相邻标记平均间距40kb, 平均连锁不平衡为0.2。理论研究和育种实践表明,固定片段长度或固定snp数目的单倍型分析不能够提高基因组选择的准确性。而液相芯片,虽然靶位点平均间距及连锁不平衡水平与snp chip porcine ggp 50 k接近,但以靶位点为核心的上下游msnp标记,由于间距小,标记间连锁不平衡程度大大提升,将其作为一个区块进行单倍型分析,基因组选择准确性及遗传分析效力会大幅度提升。


技术实现思路

1、本发明开发了猪50k液相芯片,同时提供了芯片靶位点开发方法和分析方法,利用本发明设计的芯片和分析策略能够最大限度地利用靶位点上下游msnp标记信息,提高猪遗传分析和分子育种效率。

2、本发明第一方面提供一种用于多聚单核苷酸多态性的50k msnp液相芯片的snp标记筛选和探针制备的方法,其以猪品种全基因组测序数据,挖掘并筛选靶位点snp,再针对靶位点snp设计探针并优化,最终得到确定的探针,所述方法包括以下步骤:

3、步骤一、确定靶位点snp:基于杜洛克、大白、长白三个猪品种全基因组测序数据,比对至猪品种全基因组测序数据,挑选标记间连锁不平衡程度中等的基因组区域,筛选靶向捕获位点,即靶位点snp;

4、步骤二、根据确定的靶位点snp,设计探针:利用多聚单核苷酸多态性检测技术,以每个靶位点snp为核心,设计1-4个110bp长度探针,每个探针覆盖靶位点,以靶位点为核心的探针总覆盖165bp长度区间;而探针设计的原则是:1)选取探针含量在30%-80%之间的;2)选取同源性区域个数≤5的;3)选取探针区域不包含ssr、n区域的;

5、步骤三、挑选含高质量msnp的探针并优化探针:对探针进行杂交和测序,检测靶位点在内的msnp基因型分型质量,设定缺失率na<0.1,最小等位基因频率maf>=0.05,杂合度het<0.5,作为标准筛选msnp,去掉不符合要求的msnp,若探针没有符合标准要求的msnp,删去该探针和靶位点,重新按步骤一和二设计新的探针,继续按本步骤检测和优化探针;符合质检要求的msnp,最终作为50k msnp液相芯片的靶位点。

6、具体地,所述猪品种全基因组测序数据是11.1参考基因组;所述靶位点snp筛选的原则是:①各染色体上分布均匀、各染色体两端分布较密;②多态性考虑杜洛克、长白猪、大白猪中maf>0.35;③与上下游snp标记平均连锁不平衡程度r2低于0.85;④与qtldb数据库比对,snp标记尽量落在经济性状qtl区域;⑤与已知的猪50k芯片的部分位点重叠。

7、更具体地,所述已知的猪50k芯片是50ksnp液相芯片、美国纽勤公司ggp50k或中芯一号。

8、本发明第二方面提供一种基于多聚单核苷酸多态性的猪50kmsnp液相芯片,其是基于所述方法得到的探针制备而成。

9、其制备步骤是,合成所述探针后进行等摩尔质量混合,缓冲液中定容1-5 pmol/ml,然后配制探针杂交液即得。

10、具体地,所述缓冲液是edta和tris-hcl混合液。

11、更具体地,进一步包括采用pooled,barcoded library,genobaits block i,genobaits block ii for ilm/mgi配制探针杂交液,其组成如下:

12、

13、优选地,利用真空浓缩仪在≤60℃的温度下对探针杂交液浓缩至全干。

14、本发明第三方面提供所述猪50kmsnp液相芯片的应用,具体是用于检测猪只个体基因型的方法,所述方法包括以下步骤:受检猪样本获得与基因组dna提取;猪cdna文库构建;用所述猪50kmsnp液相芯片与所构建的文库进行杂交、测序;按测序数据操作流程,对msnp基因型分型,完成个体所有液相芯片标记位点的基因型判定。

15、优选地,所述msnp基因型分析方法如下:

16、步骤一:完成个体液相芯片所有msnp标记基因型判定后,对msnp基因型进行质量控制;质控时按如下次序进行:

17、1)过滤复等位基因;

18、2)去除性染色体和位置未知的位点;

19、3)去除检出率(call rate)低于90%的snp;

20、4)去除snp位点的最小等位基因频率(maf)低于0.05的snp;

21、5)去除检出率低于90%的个体

22、步骤二:以靶位点snp为核心,将其上下游200bp作为一个单倍型区块,将基因组划分为52000个单倍型区块,单倍型区块内msnp标记数不少于1,数量不等;

23、步骤三:以单个单倍型区块为单位,推断单倍型,判定单倍型等位基因,构建受检样本该单倍型区块的单倍型基因型或双倍型,进而构建受检样本所有单倍型区块的双倍型向量,类似所有msnp标记的基因型向量;

24、步骤四:根据所有样本双倍型向量,采用遗传分析或分子育种方法,以单倍型区块作为一个标记,区块内单倍型作为等位基因,双倍型为基因型。

25、与现有技术相比,本发明提供的基于猪50kmsnp液相芯片的开发方法具备以下有益效果:

26、本发明提供了基于靶向捕获测序进行基因分型的猪高通量snp50k探针,探针设计考虑了捕获的snp位点在全基因组的分布情况、位点多态性、msnp标记质量等问题。在杜洛克、长白猪、大白猪群体中靶位点maf要求大于0.35,有效避免了标记密度不均匀和多态性较差等问题。

27、相较于已有液相芯片,本发明考虑了msnp标记质量及msnp标记间连锁不平衡问题,在保持液相芯片设计基本原则下,挑选标记间连锁不平衡程度中等的基因组区域,产生更多分型质量高、在探针区域内与靶位点连锁不平衡中等的snp标记,与靶位点统称为msnp。msnp液相芯片在单个扩增位点(靶位点)可以产生多个snp标记,使可检测的snp数目扩大到位点数的1.5-2倍以上。解决了传统液相芯片高质量msnp标记较少的问题,且成本没有增加。

28、此外,本发明提供了有效利用msnp标记的分析方法。相比传统的单标记分析及单倍型分析方法,本发明提供了以靶位点为核心涵盖其上下游msnp的单倍型区块方法,充分利用了探针内snp标记的连锁不平衡信息,提高了遗传分析及分子育种的效率。避免了传统单标记分析探针内msnp带来的噪声,造成偏差过大;以及固定snp数或片段长度的单倍型分析方法效力不高的问题。

29、因此,本发明在已开发的猪50k液相芯片基础上,结合猪基因组特点,利用多聚单核苷酸多态性技术,开发了猪50kmsnp液相芯片。相比已有的液相芯片,本发明在不增加成本的前提下,增加了有效的msnp标记,信息量更大。同时,可以利用msnp, 结合单倍型等分析方法,提高遗传分析和分子育种的效力。此外,本发明液相芯片可实现dna杂交捕获时间为1个小时,相对于16小时以上的过夜杂交捕获流程,可大大缩短基因型获取时间,建库和捕获全流程可在一天内完成。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1