一种同源四倍体自然群体的连锁不平衡分析模型的构建方法

文档序号:6535541阅读:740来源:国知局
一种同源四倍体自然群体的连锁不平衡分析模型的构建方法
【专利摘要】本发明提供一种同源四倍体自然群体的连锁不平衡分析模型的构建方法,包括:对来自自然群体中一组同源四倍体植物,设置一个位点A和一个位点B;两个位点产生16单倍型,且分别都具有35种基因型,但在遗传上每个位点能够识别的四倍体基因型有只有15种,因此两个位点共产生225种基因型;从所述自然群体中随机抽取n个同源四倍体个体,得到不同基因型个体数量;根据单体型频率计算相应的配子频率,并根据配子频率计算计算相应的基因型频率;计算基因型频率;计算单倍型基因频率;通过单倍型基因频率获取两个位点的等位基因的估算频率;通过单倍型基因频率计算每两个位点间的连锁不平衡系数;然后进行验证。
【专利说明】一种同源四倍体自然群体的连锁不平衡分析模型的构建方法
【技术领域】
[0001]本发明涉及生物建模【技术领域】,特别是指一种同源四倍体自然群体的连锁不平衡分析模型的构建方法。
【背景技术】 [0002]半数以上的被子植物是多倍体,或在其进化史上出现过多倍体现象,故此多倍体对于植物的遗传与进化研究具有重要的价值。同源四倍体作为自然界中常见的多倍体,是研究多倍体时常用的材料,分析多位点群体遗传研究的重要性已经越来越被认可。连锁不平衡分析是分析自然群体遗传结构、分化、多样性的重要工具。连锁不平衡分析是基于多个位点,可以通过基因组估算程度和非随机组合的分布提供不同物种结构的额外信息。对于一个随机组合群体,两标记间连锁不平衡世代的比例的衰减取决于两标记间的重组率。连锁不平衡的衰减速率为物种复杂性状的高通量作图建立了一个基本原则,因此通过比较LD遗传距离的衰减率,可以推断一个物种的进化历史,但是这一方面目前仅适用于二倍体自然群体,至今仍没有一种同源四倍体两位点的连锁不平衡分析模型。

【发明内容】

[0003]本发明要解决的技术问题是提供一种能够构建同源四倍体进行两位点连锁不平衡分析模型的方法。
[0004]为了解决上述问题,本发明实施例提出了一种同源四倍体自然群体的连锁不平衡分析模型的构建方法,包括:
[0005]步骤1、对于来自自然群体中一组同源四倍体植物,设置一个位点A和一个位点B ;
[0006]其中该位点A具有4个等位基因记为A1, A2, A3, A4 ;该位点B具有4个等位基因记为 B1, B2, B3, B4 ;其中 P1, p2, p3, p4 为位点 A 的基因频率,且 PJ+P2+P3+P4=!;其中 q1? q2,Q3? Q4为位点B的基因频率,且qi+q2+q3+q4=l ;
[0007]两个位点产生16 单倍型表示为 A1B15A1B25A1B35A1B45A2B15A2B25A2B35A2B45A3B15A3B2,A3B3, A3B4, A4B1, A4B2, A4B3, A4B4 ;基因连锁不平衡系数表示为Dij,其代表Ai和Bj的连锁不平衡系数(i=l,2,3,4 ;j=l,2,3,4,下同);单倍型AiBj频率表示为Pij ;
[0008]步骤2、从所述自然群体中随机抽取n个同源四倍体个体,得到不同基因型个体数
S- ^u/V ;
[0009]步骤3、根据单体型频率计算相应的配子频率,并根据配子频率计算相应的基因型频率为Pu/v ;
[0010]如基因型为A3/B12的同源四倍体,其包含的基因型有A3A3A3A3B1B1B1B2,AsA3A3A3B1B1B2B2, A3A3A3A3B1B2B2B2,其基因型频率 p3/12 一 2p 31+3p31 p32 +2p31p32 ;
[0011]步骤4、[0012]估算参数,未知单倍型频率Q= (pu),根据如下似然函数值计算:logL(Q)=
Snij1g(Pij)(I)
[0013]由公式(I)获得单倍型频率的最大似然估计
[0014]
【权利要求】
1.一种同源四倍体自然群体的连锁不平衡分析模型的构建方法,其特征在于,包括:步骤1、对于来自自然群体中一组同源四倍体植物,设置一个位点A和一个位点B ;其中该位点A具有4个等位基因记为A1, A2, A3, A4 ;该位点B具有4个等位基因记为B1,B2, B3, B4 ;其中P1, p2, p3, p4为位点A的基因频率,且PAPdPjP4=I ;其中q1; q2, q3, q4为位点B的基因频率,且QJqJqJq4=I ; 两个位点产生 16 单倍型表示为 A1BpA1ByA1BpA1BpA2BpA2ByA2BrA2BpA3BpA3ByA3B3,A3B4, A4B1, A4B2, A4B3, A4B40基因连锁不平衡系数表示为Du,其代表Ai和B」的连锁不平衡系数(i=l,2,3,4 ;j=l,2,3,4,下同);单倍型AiBj频率表示为Pij ; 步骤2、从所述自然群体中随机抽取n个同源四倍体个体,得到不同基因型个体数量nu/V ; 步骤3、根据单体型频率计算相应的配子频率,并根据配子频率计算计算相应的基因型频率为Pu/v ; 如基因型为A3/B12的同源四倍体,其包含的基因型有A3A3A3A3B1B1B1B2, A3A3A3A3B1B1B2B2,AsA3A3A3B1B2B2B2,其基因型频率 p3/12 - 2p 31+3p31 p32 +2p31p32 ; 步骤4、估算参数,未知单倍型频率Q= (pu),根据如下似然函数值计算: 1gL(Q) = Snij1g(Pij)(I) 由(I)获得单倍型频率的最大似然估计
2.根据权利要求1所述的同源四倍体自然群体的连锁不平衡分析模型的构建方法,其特征在于,还包括: 步骤6、将9个连锁不平衡系数分别进行检验。
3.根据权利要求1所述的同源四倍体自然群体的连锁不平衡分析模型的构建方法,其特征在于, 所述步骤I中,所述16单倍型的频率包含以下等位基因频率以及九个独立的连锁不平衡系数: PuPiQi+D
4.根据权利要求1所述的同源四倍体自然群体的连锁不平衡分析模型的构建方法,其特征在于, 所述步骤I中,所述位点A和位点B分别都具有35种基因型,在遗传上能够识别基因型共225种;位点 A 有,4 种 AiAiAiAi,其中 i=l,2,3,4 ;12种4,4,44,其中幸 i2=l,2,3,4 ;6 种.4,4,4:4,其中 i2=l,2,3,4 ;12 种 4,4,44;其中 i2^ is=l,2,3,4 ^ftA1A2A3A4 ;位点 B 有,4 种 BjBjBjBj,其中 j=l,2,3,4 ; 12 种乂 Bi' Bi' Bj',其中么关戈=1,2,3,4 ;6^BjBjBhBh,其中 Ji 幸 j2=l,2,3,4 ;12 种W,其中 J1 幸 J2 幸 j3=l,2,3,4 ;1 种B1B2B3B4 ; 两个位点,在遗传上能识别的基因型有225种,表示为Au/Bv (u=l,2,3,4,12,13,14,.23,24,34,123,124,134,234,1234 ;v=l,2,3,4,12,13,14,23,24,34,123,124,134,234,.1234)。
【文档编号】G06F19/12GK103699815SQ201410013164
【公开日】2014年4月2日 申请日期:2014年1月10日 优先权日:2014年1月10日
【发明者】邬荣领, 冯思思 申请人:北京林业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1