鱼类种质资源遗传分析装置的制作方法

文档序号:6611819阅读:389来源:国知局
专利名称:鱼类种质资源遗传分析装置的制作方法
技术领域
本发明属于分子生物学DNA分子标记数据分析技术领域,具体涉及到 DNA分子标记电泳基因分型后的数据处理,尤其指随机引物扩增多态性DNA(RAPD)、限制性片段长度多态性(RFLP)、扩增片段长度多态性(AFLP) 和微卫星分子标记(SSR或MS或SSLP或STR)这几种DNA分子标记在物 种的遗传多样性、群体遗传结构等群体遗传学方面应用的数据分析。
背景技术
鱼类种质资源研究是生物多样性研究的重要组成部分,是鱼类物种保护、 渔业可持续生产的一项基本的研究内容,DNA分子标记分析作为鱼类种质资源研究的一个重要部分,在濒危鱼类保护、野生资源评估、养殖鱼类遗传指导、 鱼类遗传育种等众多方面发挥着重要作用。近些年来,DNA分子标记技术充足的发展和完善,特别是随机引物扩增 多态性DNA (RAPD)、限制性片段长度多态性(RFLP)、扩增片段长度多 态性(AFLP)和微卫星分子标记(SSR或MS或SSLP或STR)这几种DNA 分子标记由于其各自的优点及快捷方便的检测方法,在群体遗传多样性、群体 遗传结构、群体演化、个体识别、亲子鉴定等群体遗传学领域得到了广泛的应 用,群体遗传学领域关于这些分子标记的数据处理方法和理论也进行了纵深研 究,形成了一系列的理论基础,并在此基础上结合计算机算法产生了诸多具有 各自特色和优点的分子标记分析软件,如Genepop (RaymondM. 1995. J. Heredity, 86:248-249)软件、PopGene(YEH, F.C. 1997. Belgian Journal of Botany 129: 157)软件、Arlequin (Excoffier. Evolutionary Bioinformatics Online 1:47-50) 软件、Phylip (Felsenstein J. 2005. Department of Genome Sciences, University of Washington, Seattle.)软《牛、Structure (Pritchard. J.K. 2007. Molecular Ecology Notes 7, 574~578)软件、GeneClass (Piry S. 2004Journal of Heredity 95:536-539.) 软件、FreeNA (Chapuis, M.P. 2007. Molecular Biology and Evolution 24: 621-631)软件等等一系列群体遗传学分析软件,它们各自有各自的功能,单 独使用比较方便,在鱼类种质资源遗传分析中常用的软件及其实现的功能有 Genepop (Raymond M. 1995. J. Heredity, 86:248-249)软件能够完成哈代温博格(HWequilibrium)平衡、群体分化(Population differentiation)、连锁不平衡 (Genotype linkage disequilibrium)、基因流(Nm)等参数的分析;PopGene (YEH, F,C. 1997. Belgian Journal of Botany 129: 157)软件能够对基因频率、 基因型频率、等位基因数目(Ae)、杂合度(He)、群体自交系数(f)、及遗 传分化(Fit, Fst, Fis)、基因流(Nm)等参数进行分析;Phylip(Felsenstein J. 2005. Department of Genome Sciences, University of Washington, Seattle.)系歹廿软件倉巨 够处理包括核酸序列、分子标记数据、包括形态学数据在类的离散或连续分布 的数据,完成鱼类种质资源的群体或品种演化等相关分析;Structure (Pritchard. J.K. 2007, Molecular Ecology Notes 7, 574~578 )软件能够完成鱼类种质资源遗 传群体的确定及群体、个体的亲缘分配(assign),获得群体迁徙路线、群体 分化程度、群体演化等结果。但这些软件各自都有其独特的输入文件格式标准, 在使用某一软件的时候,必须先将待分析的分子标记数据转换成其特定的格式 后才能够使用该软件进行分析并获得所要的结果,其中Phylip软件包含有35 个分析程序,均为命令行界面,各程序独立使用,不支持分析的批量处理 (Felsenstein J, 2005)。在日常工作中,经常要对一组分子标记数据进行多方位的分析,逐一使用 上述各个软件,目前的办法就是试验人员在对分子标记数据进行分析之前,首 先要确定要使用哪几个软件,然后手工将由分子标记检测获得的电泳图谱经过 图谱分析软件处理后获得的结果文件根据软件的需求转换成相应的格式,最后 再逐一的使用相应的软件对数据进行分析,进而获得想要的结果,这极大的增 加了工作人员的工作量,也容易由于格式转换错误或者输入失误而影响分析结 果。发明内容为了解决在现有鱼类种质资源遗传分析过程中,需要根据使用功能软件的 要求人工转换分子标记数据格式及分别调用各种功能软件的问题,本发明提供 了一种鱼类种质资源遗传分析装置。本发明的鱼类种质资源遗传分析装置由以下部分组成 用于将指定的由分子标记检测获得的电泳图谱转换成0,1矩阵的Excel格式的分子标记文件的数据输入装置;用于设置数据分析处理步骤及各步骤的处理参数形成工程文件,进而为调用装置提供工作顺序流程的工程建立装置;用于将数据输入装置获得的0,1矩阵的Excel格式的分子标记文件转换成 分析装置中各个分析软件模块需要的输入格式文件的格式转换装置;用于根据工程建立装置形成的工程文件调用分析装置中的分析软件模块 的调用装置;用于对分子标记数据进行分析的分析装置;其中所述数据分析装置包括-用于完成哈代温博格平衡、群体分化、连锁不平衡、基因流参数分析的 Genepop软件模块;用于对基因频率、基因型频率、等位基因数目、杂合度、群体自交系数及 遗传分化、基因流参数进行分析的PopGene软件模块;用于处理包括核酸序列、分子标记数据、包括形态学数据在类的离散或连 续分布的数据,完成鱼类种质资源的群体或品种演化相关分析的Phylip系列软 件模块。用于完成鱼类种质资源遗传群体的确定及群体、个体的亲缘分配,获得群 体迁徙路线、群体分化程度、群体演化等结果分析的Structure软件模块。本发明所述的鱼类种质资源遗传分析装置,将现有的多个分子标记分析软 件集成到一起,通过输入一个分子标记文件、建立相应的工作流程就能够获得 多种鱼类种质资源遗传分析的结果,减少了试验人员的工作量,避免了由于格 式转换错误导致分析结果错误的问题,提高了工作效率和工作质量。


图1为DNA分子标记电泳图谱经图谱分析软件分析后获得结果的Excel 文件示意图,图中Population为群体标识符,HM为群体名称,Locus为位点 标识符,第二列中AF346676、 OMM5000等为位点名称,4、 5、 6 等为群体HM中的个体,其他单元格内容如248、 226等为位点在个体中扩增的条带 大小,同一行表示同一个等位基因,不同行表示不同的等位基因。图2为建立工程的对话框示意图,图中输入文件为"Genotype-correct.xls", 即为图l所示内容。图3为图1所示的内容经数据输入装置转换后获得的0、 1矩阵的Excel 格式的文件示意图,图中Population为群体标识符,HM为群体名称,Locus为位点标识符,AF346676、 OMM5000等为位点名称,4、 5、 6......等为群体HM中的个体数,其他单元格第一列的内容如248、 226等为等位基因的大小(即等位基因的名称),同一行表示同一个等位基因,不同行表示不同的等位 基因。图4为基因频率数据Phylip批处理的对话框示意图。图5是Phylip软件包Seqboot程序运行参数配置对话框示意图。图6是为图1所示的DNA分子标记电泳图谱经图谱分析软件分析后获得 结果的Excel文件经过格式转换及Structure分析软件进行处理后获得的最终结 果群体遗传组成的示意图,图中HM, ZJ, HT, HQ等为4个群体。图7为图1所示的DNA分子标记电泳图谱经图谱分析软件分析后获得结 果的Excel文件经过Phylip分析软件进行批处理后获得的最终结果聚类树的示 意图,图中HM, ZJ, HTA, HTB, HQ等为5个群体。图8是E-Po格式转换装置中将0,1矩阵的Excel格式的分子标记文件转换 成PopGene软件需要的显性标记数据格式的转换方法流程图。图9是E-Po格式转换装置中将O,l矩阵的Excel格式的分子标记文件转换 成PopGene软件需要的微卫星标记数据格式的转换方法流程图。图10是E-Ge格式转换装置中将0,1矩阵的Excel格式的分子标记文件转 换成GenePop软件需要的数据格式的转换方法流程图。图11是E-St格式转换装置中将O,l矩阵的'Excel格式的分子标记文件转换 成Structure软件需要的微卫星标记数据格式的转换方法流程图。图12是E-St格式转换装置中将0,1矩阵的Excel格式的分子标记文件转 换成Structure软件需要的显性标记数据格式转换方法流程图。图13是E-Ph格式转换装置中将0,1矩阵的Excel格式的分子标记文件转 换成Phylip软件需要的显性标记数据格式的转换方法流程图。图14是E-Ph格式转换装置中将0,1矩阵的Excel格式的分子标记文件转 换成Phylip软件需要的微卫星标记的个体基因频率数据格式的转换方法流程 图。图15是E-Ph格式转换装置中将0,1矩阵的Excel格式的分子标记文件转 换成Phylip软件需要的微卫星标记的群体基因频率数据格式的转换方法流程 图。图16是图15中步骤H22所述的获取群体中位点的等位基因频率流程图。
具体实施方式
本发明的鱼类种质资源遗传分析装置由以下部分组成用于将指定的由分子标记检测获得的电泳图谱转换成0,1矩阵的Excel格 式的分子标记文件的数据输入装置-,用于设置数据分析处理步骤及各步骤的处理参数形成工程文件,进而为调 用装置提供工作顺序流程的工程建立装置;用于将数据输入装置获得的0,1矩阵的Excel格式的分子标记文件转换成 分析装置中各个分析软件模块需要的输入格式文件的格式转换装置;用于根据工程建立装置形成的工程文件调用分析装置中的分析软件模块 的调用装置;用于对分子标记数据进行分析的分析装置;其中所述数据分析装置包括用于完成哈代温博格平衡、群体分化、连锁不平衡、基因流参数分析的 Genepop软件模块;用于对基因频率、基因型频率、等位基因数目、杂合度、群体自交系数及 遗传分化、基因流参数进行分析的PopGene软件模块;用于处理包括核酸序列、分子标记数据、包括形态学数据在类的离散或连 续分布的数据,完成鱼类种质资源的群体或品种演化相关分析的Phylip系列软 件模块;用于完成鱼类种质资源遗传群体的确定及群体、个体的亲缘分配(assign), 获得群体迁徙路线、群体分化程度、群体演化等结果分析的Structure软件模块。其中所述Gen印op软件模块中包括多个用于获得一种数据分析结果的 Gen印op功能模块,还包括用于根据工程建立装置形成的工程文件调用相应 Gen印op功能模块的Genepop批处理模块。所述Phylip系列软件模块中包括多个用于获得一种数据分析结果的Phylip 功能模块,还包哮用于设置各个Phylip功能模块的工作参数的Phylip参数设置 模块;用于根据工程建立装置形成的工程文件调用相应Phylip功能模块的 Phylip批处理模块。所述Phylip功能模块包括DNA序列分析模块、蛋白质序列分析模块、基 因频率分析模块、限制性数据分析模块、连续性数据分析模块、离散性数据分 析模块。本实施方式所述的数据输入装置包括计算DNA分子标记电泳图谱经过图 谱分析软件处理后获得的结果文件中每个个体在同一电泳迁移位置扩增条带大小的平均值的均值计算装置;根据平均值计算装置获得的结果作为等位基因的大小,进而获得等位基因及基因型的基因确认装置;根据基因确认装置获得 的各个等位基因大小及基因型得到0, 1矩阵的0/1确认装置。DNA分子标记电泳图谱经图谱分析软件分析获得的结果,由于DNA分子 标记电泳的实验误差、图谱分析软件的误差和人为操作的误差,DNA分子标 记在不同个体中扩增的同一等位基因,电泳形成的电泳图谱经过图谱分析软件 分析得到的条带大小不一致,导致不能很好的确定等位基因的大小及DNA分 子标记的基因分型,本实施方式的数据输入装置用每个个体在同一电泳迁移位 置扩增条带大小的平均值作为等位基因的大小,以此确定等位基因及基因型, 并将其转换成0、 l矩阵。本实施方式中所述的格式转换装置由以下装置组成.-用于将O,l矩阵的Excel格式的分子标记文件转换成PopGene软件输入格 式的分子标记文件的E-Po格式转换装置;用于将0,1矩阵的Excel格式的分子标记文件转换成GenePop软件输入格 式的分子标记文件的E-Ge格式转换装置;用于将O,l矩阵的Excel格式的分子标记文件转换成Phylip软件输入格式 的分子标记文件的E-Ph格式转换装置;用于将O,l矩阵的Excel格式的分子标记文件转换成Structure软件输入格 式的分子标记文件的E-St格式转换装置。其中所述E-Po格式转换装置中,将0,1矩阵的Excel格式的分子标记文件 转换成PopGene软件需要的显性标记数据格式的转换方法参见图8所示,具体 过程为-步骤A1:从0,1Excel文件中读取数据;歩骤A2:获取群体数、位点数及各个位点名称,并输出数据注释及位点 名称到输出文件;步骤A3:群体计数器i累加l;步骤A4:判断群体计数器i是否大于群体数,如果判断结果为是,结束数 据转换过程;如果判断结果为否,执行步骤A5;步骤A5:输出群体ID号和群体名称到输出文件; 步骤A6:获取位点数和个体数; 步骤A7:个体计数器j累加l;步骤A8:判断个体计数器j是否大于个体数,如果判断结果为是,则返回 执行步骤A3;如果判断结果为否,则执行步骤A9;步骤A9:获取并输出个体j在所有位点上的基因型,并输出到输出文件,返回执行步骤A7。所述E-Po格式转换装置中,将0,1矩阵的Excel格式的分子标记文件转换 成PopGene软件需要的微卫星标记数据格式的转换方法参见图9,具体过程为 步骤B1: 从0,1Excel文件中读取数据;步骤B2: 获取群体数、位点数及各个位点名称,并输出数据注释及位点 名称到输出文件;步骤B3: 群体计数器i累加l;步骤B4: 判断群体计数器i是否大于群体数,如果判断结果为是,则结 束数据转换过程;如果判断结果为否,执行步骤B5; 步骤B5: 输出群体ID号和群体名称到输出文件; 步骤B6: 获取位点数和个体数; 步骤B7: 个体计数器j累加l;步骤B8: 判断个体计数器j是否大于个体数,如果判断结果为是,则返 回执行步骤B3;如果判断结果为否,执行步骤B9; 步骤B9: 位点计数器k累加l步骤B10:判断位点记数器k是否大于位点数,如果判断结果为是,则返 回执行步骤B7;如果判断结果为否,执行步骤B11; 步骤B11:获取个体j在位点k上的等位基因数; 步骤B12:等位基因计数器h累加1;步骤B13:判断等位基因计数器h是否大于等位基因数,如果判断结果为 是,则执行步骤B17;如果判断结果为否,则执行步骤B14;步骤B14:获得个体j在位点k上的等位基因h的基因型0或1;步骤B15:判断基因型是否为0,如果判断结果为是,则返回执行步骤 B12;如果判断结果为否,则执行步骤B16;步骤B16:获取个体j在位点k上等位基因h的基因型值和,并将所述等位基因转换成字母(A-Z,a-z)基因变量;步骤B17:判断基因型值和是否大于1,如果判断结果为是,执行步骤 B19;如果判断结果为否,执行步骤B18;步骤B18:判断基因型值和是否为1,如果判断结果为是,执行步骤B21;如果判断结果为否,执行步骤B20;步骤B19:输出转换完成的字母基因变量到输出文件,然后执行步骤 B22;步骤B20:输出".."字母基因变量到输出文件,然后执行步骤B22; 步骤B21:两次输出转换完成的字母基因变量到输出文件,然后执行步骤 B22;步骤B22:基因型值和清零,然后返回执行步骤B9。 所述E-Ge格式转换装置中,将O,l矩阵的Excd格式的分子标记文件转换 成GenePop软件需要的数据格式的转换方法参见图10,具体过程为 步骤C1:从O,lExcel文件中读取数据;步骤C2:获取群体数、位点数及各个位点名称,并输出数据注释和各位点 名称到输出文件;步骤C3:群体计数器i累加l;步骤C4:判断群体计数器i是否大于群体数,如果判断结果为是,则结束 数据转换过程;如果判断结果为否,则执行步骤C5;步骤C5:获取个体数,输出"Pop"关键字到输出文件; 步骤C6:个体计数器j累加l;步骤C7:判断个体计数器j是否大于个体数,如果判断结果为是,返回执 行步骤C3;如果判断结果为否,执行步骤C8; 步骤C8:位点计数器k累加l;步骤C9:判断位点记数器k是否大于位点数,如果判断结果为是,则返回 执行步骤C6;如果判断结果为否,执行步骤C10; 步骤C10: 获取等位基因数; 步骤C11: 等位基因计数器h累加1;步骤C12: 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,执行步骤C18;如果判断结果为否,执行步骤C13;步骤C13: 获得个体j在位点k上的等位基因h的基因型0或1;步骤C14: 判断基因型是否为0,如果判断结果为是,返回执行步骤Cll; 如果判断结果为否,执行步骤C15;步骤C15: 判断所需基因型是否是2位数格式,如果判断结果为是,执行步骤C17;如果判断结果为否,执行步骤C16;步骤C16: 获取个体j在位点k上第h个等位基因的基因型值和基因型 值和,并获取所述等位基因的名称作为基因变量,返回执行步骤C11;步骤C17: 获取个体j在位点k上第h个等位基因的基因型值和基因型 值和,并将所述等位基因转换成01 99形式的基因变量,返回执行步骤C11;步骤C18: 判断基因型值和是否大于1,如果判断结果为是,执行步骤 C20;如果判断结果为否,执行步骤C19;步骤C19: 判断基因型值和是否为1,如果判断结果为是,执行步骤C22; 如果判断结果为否,执行步骤C21;步骤C20: 输出转换完成的字母基因变量到输出文件,然后执行步骤 C23;步骤C21: 输出输出"0000"字母基因变量到输出文件,然后执行步骤 C23;步骤C22: 两次输出转换完成基因型到输出文件,然后执行步骤C23;步骤C23: 基因型值和清零,然后返回执行步骤C8。所述E-St格式转换装置中,将O,l矩阵的Excel格式的分子标记文件转换 成Structure软件需要的微卫星标记数据格式的转换方法参见图11,具体过程 为步骤D1:从O,lExcd文件中读取数据;步骤D2: 获取群体数、位点数及各个位点名称;并输出各位点名称到 输出文件;步骤D3: 群体计数器i累加l;步骤D4:判断群体计数器i是否大于群体数,如果判断结果为是,则 结束数据转换过程;如果判断结果为否,则执行步骤D5; 步骤D5:获取个体数、位点数; 步骤D6: 个体计数器j累加l步骤D7: 判断个体计数器j是否大于个体数,如果判断结果为是,则 返回执行步骤D3;如果判断结果为否,则执行步骤D8;步骤D8:分别将个体变量名称、群体名称输出给临时变量一、二; 步骤D9:位点计数器k累加1;步骤D10: 判断位点计数器k是否大于位点数,如果判断结果为是,则执行步骤D26;如果判断结果为否,则执行步骤D11; 步骤D11: 获取等位基因数; 步骤D12: 等位基因计数器h累加1;步骤D13: 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,则执行步骤D20;如果判断结果为否,则执行步骤D14;步骤D14: 获得个体j在位点k上的等位基因h的基因型0或1;步骤D15: 判断基因型是否为0,如果判断结果为是,则返回执行步骤 D12;如果判断结果为否,则执行步骤D16;步骤D16: 求取个体j在位点k上的等位基因h的基因型值及基因和;步骤D17: 判断步骤D16获得的基因型值和是否大于1,如果判断结果为是,则返回执行步骤D18;如果判断结果为否,则执行步骤D19;步骤D18: 获取个体j在位点k上的等位基因h的基因名称,并转换成 基因变量二,然后返回执行步骤D12;步骤D19: 获取个体j在位点k上的等位基因h的基因名称,并转换成 基因变量一,然后返回执行步骤D12;步骤D20: 判断基因型值和是否大于1,如果判断结果为是,则执行步骤 D24;如果判断结果为否,则执行步骤D21;步骤D21: 判断基因型值和是否为1,如果判断结果为是,则执行步骤D23;如果判断结果为否,则执行步骤D22;步骤D22: 分别输出"一9"给临时变量一、二,然后执行步骤D25;分别输出基因变量一给临时变量一、二,然后执行步骤D25;分别输出基因变量一、二给临时变量一、二,然后执行步骤步骤D23 步骤D24 D25;步骤D25 步骤D26 步骤D27基因型值和清零,然后返回执行步骤D9; 分别输出临时变量一、二到输出文件; 临时变量一、二清零,返回执行步骤D6。 所述E-St格式转换装置中,将0,1矩阵的Excel格式的分子标记文件转换 成Structure软件需要的显性标记数据格式的转换方法参见图12所示,具体过 程为步骤E1、从O,lExcel文件中读取数据;步骤E2、获取群体数、及各个位点名称,并输出各位点名称到输出文件;步骤E3、输出位点数个"0"到输出文件; 步骤E4、群体计数器i累加1;步骤E5、判断群体计数器i是否大于群体数,如果判断结果为是,则转换 结束;如果判断结果为否,执行步骤E6; 步骤E6、获取个体数、位点数; 步骤E7、个体计数器j累加l步骤E8、判断个体计数器j是否大于个体数,如果判断结果为是,则返回 执行步骤E4;如果判断结果为否,执行步骤E8;步骤E9、分别将个体变量名称、群体名称输出给临时变量一、二; 步骤EIO、 位点计数器k累加1;步骤Ell、 判断位点计数器k是否位点数;如果判断结果为是,则执行 步骤E14;如果判断结果为否,执行步骤E12;步骤E12、 获取个体j在位点k上的基因型值输出给临时变量一,并将"0"输出给临时变量二,返回执行步骤E10;步骤E13、 分别输出临时变量一、二到输出文件; 步骤E14、 临时变量一、二清零,返回执行步骤E7。 所述E-Ph格式转换装置中,将O,l矩阵的Excel格式的分子标记文件转换 成Phylip软件需要的显性标记数据格式的转换方法参见图13,具体过程为 步骤F1、从O,lExcel文件中读取数据;步骤F2、获取群体数、位点数及各群体的个体数,求个体数总和,输出个 体数总和和位点数到输出文件; 步骤F3、群体计数器i累加l;步骤F4、判断群体计数器i是否大于群体数,如果判断结果为是,则转换 过程结束;如果判断结果为否,执行步骤F5; 步骤F5、获取位点数和群体的个体数; 步骤F6、个体计数器j累加l步骤F7、判断个体计数器是否大于个体数,如果判断结果为是,则返回执 行步骤F3;如果判断结果为否,执行步骤F8; 步骤F8、获取个体名称,并输出到输出文件;步骤F9、获取并输出个体j在所有位点上的基因型,并输出到输出文件; 返回执行步骤F6。所述E-Ph格式转换装置中,将O,l矩阵的Excel格式的分子标记文件转换 成Phylip软件需要的微卫星标记的个体基因频率数据格式的转换方法参见图 14所示,具体过程为步骤G1、从0,1Excel文件中读取数据;步骤G2、获取群体数、位点数及各群体的个体数,求个体数总和,输出 个体数总和和位点数到输出文件; 步骤G3、 群体计数器i累加l;步骤G4、判断群体计数器i是否大于群体数,如果判断结果为是,则转 换结束;如果判断结果为否,执行步骤G5; 步骤G5、 获取个体数、位点数; 步骤G6、 个体计数器j累加l;步骤G7、判断个体计数器j是否大于个体数,如果判断结果为是,则返回执行步骤G3;如果判断结果为否,执行步骤G8; 步骤G8、 获取个体名称,并输出到输出文件; 步骤G9、 位点计数器k累加l;步骤GIO、判断位点计数器k是否大于位点数,如果判断结果为是,则返回执行步骤G23;如果判断结果为否,执行步骤G11; 步骤Gll、获取等位基因数; 步骤G12、等位基因计数器h累加l;步骤G13、判断等位基因计数器h是否大于等位基因数,如果判断结果为是,则执行步骤G16;如果判断结果为否,执行步骤G14;步骤G14、获得个体j在位点k上的等位基因h的基因型0或1; 步骤G15、求取个体j在位点k上的基因型值和,返回执行步骤G12;步骤G16、等位基因计数器h清零; 步骤G17、等位基因计数器h累加l;步骤G18、判断等位基因计数器h是否大于等位基因数,如果判断结果为是,则返回执行步骤G9;如果判断结果为否,执行步骤G19;步骤G19、获得个体j在位点k上的等位基因h的基因型0或1;步骤G20、判断个体j在位点k上的基因型值和是否为零,如果判断结果 为是,则执行步骤G21;如果判断结果为否,执行步骤G22;歩骤G21、输出"0"到临时变量,返回执行步骤G17;步骤G22、求取基因型值与基因型值和的比值,即等位基因h在个体j的 基因频率,并输出到临时变量,返回执行步骤G17; 步骤G23、输出临时变量到输出文件; 步骤G24、临时变量清零,返回执行步骤G6。所述E-Ph格式转换装置中,将O,l矩阵的Excel格式的分子标记文件转换 成Phylip软件需要的微卫星标记的群体基因频率数据格式的转换方法参见图 15,具体过程为步骤H1、 从0,1Excel文件中读取数据;步骤H2、 获取群体数、位点数,输出群体数和位点数到输出文件; 步骤H3、 群体计数器i累加l;步骤H4、 判断群体计数器i是否大于群体数,如果判断结果为是,则扰 行步骤H22;如果判断结果为否,执行步骤H5; 步骤H5、 获取个体数、位点数; 步骤H6、 个体计数器j累加l;步骤H7、 判断个体计数器j是否大于个体数,如果判断结果为是,则返 回执行步骤H3;如果判断结果为否,执行步骤H8; 步骤H8、 位点计数器k累加1;步骤H9、 判断位点计数器k是否大于位点数,如果判断结果为是,则执行步骤H6;如果判断结果为否,执行步骤H10; 步骤HIO、获取等位基因数; 步骤Hll、等位基因计数器h累加l;步骤H12、判断等位基因计数器h是否大于等位基因数,如果判断结果为 是,则执行步骤H15;如果判断结果为否,执行步骤H13;步骤H13、获得个体j在位点k上的等位基因h的基因型0或1;步骤H14、求取个体j在位点k上的基因型值和,返回执行步骤H11; 步骤H15、判断基因型和是否为1,如果判断结果为是,则执行步骤H16;如果判断结果为否,则返回执行步骤H8; 步骤H16、等位基因计数器h清零; 歩骤H17、等位基因计数器h累加l;步骤H18、判断等位基因计数器h是否大于等位基因数,如果判断结果为是,则舉回执行H8;如果判断结果为否,执行步骤H19;步骤H19、获得个体j在位点k上的等位基因h的基因型0或1;步骤H20、判断基因型是否为l,如果判断结果为是,则执行步骤H21; 如果判断结果为否,则返回执行步骤H17;步骤H21、给基因型赋值2,返回执行步骤H17;步骤H22、获取群体中位点的等位基因频率并输出到文件。在上述将O,l矩阵的Excel格式的分子标记文件转换成Phylip软件需要的 微卫星标记的群体基因频率数据格式的转换方法中,步骤H22所述的获取群体 中位点的等位基因频率的过程参见图16所示,具体过程为-步骤Il、获取群体数、位点数;步骤12、群体计数器i累加l;步骤13、判断群体计数器i是否大于群体数,如果判断结果为是,则转换 过程结束;如果判断结果为否,则执行步骤I4; 步骤14、输出群体名称到输出文件; 步骤15、位点计数器k累加l;步骤16、判断位点计数器k是否大于位点数,如果判断结果为是,则执行 步骤I18;如果判断结果为否,则执行步骤I7; 步骤n、获取个体数; 步骤18、个体计数器j累加l; 步骤19、获取等位基因数;步骤IIO、 判断个体计数器j是否大于个体数,如果判断结果为是,则 执行步骤I15;如果判断结果为否,则执行步骤I11; 步骤Il 1 、 等位基因计数器h累加1;步骤112、 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,则返回执行步骤I8;如果判断结果为否,则执行步骤I13;步骤113、 获得个体j在位点k上的等位基因h的基因型值,0、 l或2;步骤114、 求取位点k所有等位基因在所有个体的基因型值和位点k的 基因和,求取等位基因h在所有个体的基因型值和基因和,返回执行步骤I11;步骤115、 等位基因计数器h累加1;步骤116、 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,则返回执行步骤I5;如果判断结果为否,则返回执行步骤I17;步骤I17、 求取等位基因h在所有个体的基因型值的基因和与位点k的基因型值的基因和的比值,即为等位基因的群体基因频率,并输出所述等位基 因的群体基因频率到临时变量,返回执行步骤I15;步骤I 18 、 输出临时变量到输出文件;步骤119、 临时变量清零,返回执行步骤I2。本实施方式所述的鱼类种质资源遗传分析装置在使用的时候,首先指定待 分析的数据文件,然后本实施方式通过工程建立装置建立数据分析流程进而形 成工程文件,然后调用装置根据工程文件中设定的步骤,逐一调用相应的格式 转换装置和分析装置中的分析软件模块实现对输入数据的分析,进而完成鱼类 种质资源分子标记的遗传分析,获得如等位基因数目(Ae)、杂合度(He)、多 态'性{言,良含量(Polymorphism information Content, PIC)、 Hardy國WeinBorg平後 (HW equilibrium)、群体分l七(Population differentiation)、连丰贞不平衡(Genotype linkage disequilibrium)、群体自交系数(f)、基因流(Nm)及遗传分化(Fit, Fst, Fis)等等种质资源的遗传多样性参数及群体迁徙、演化的评估结果。本 发明实现方式简单、灵活,各处理单元之间独立工作,根据设置好的处理步骤 自动完成所有分析。
具体实施方式
二采用本发明的鱼类种质资源遗传分析装置对图1所示的 DNA分子标记电泳图谱经图谱分析软件分析后获得结果,图中Population为群 体标识符,HM为群体名称,Locus为位点标识符,第二列中AF346676、 OMM5000等为位点名称,4、 5、 6……等为群体HM中的个体,其他单元格 内容如248、 226等为位点在个体中扩增的条带大小,同一行表示同一个等位 基因,不同行表示不同的等位基因。首先通过工程建立装置建立数据分析的工程文件,参见图2,指定分析目 标文件为图1所示的文件"Genotype-correctxls",建立数据分析处理步骤第 一步、等位基因的确定及0、 l矩阵的转换;第二步、E-Po格式转换;第三步、 E-Ge格式转换;第四步、E-Ph格式转换;第五步、进行群体基因频率数据的 Phylip分析;第六步、E-St格式转换;第七步、进行分子标记数据的Structure 分析。然后通过调用装置根据工程文件调用相应的处理装置,第一步通过调 用数据输入装置将分析目标文件"Genotype-correct.xls"转换成0,1矩阵的Excel 格式的分子标记文件,参见图3所示,图中Population为群体标识符,HM为 群体名称,Locus为位点标识符,AF346676、 OMM5000等为位点名称,4、 5、6……等为群体HM中的个体数,其他单元格第一列的内容如248、 226等为等 位基因的大小(即为等位基因的名称),同一行表示同一个等位基因,不同行 表示不同的等位基因。第二步调用格式转换装置中的E-Po格式转换装置,将O,l矩阵转换成 PopGene软件需要的输入格式的分子标记文件;第三步调用格式转换装置中的E-Ge格式转换装置,将O,l矩阵转换成 GenePop软件需要的输入格式的分子标记文件;第四步调用格式转换装置中的E-Ph格式转换装置,将O,l矩阵转换成 Phylip软件需要的输入格式的分子标记文件;第五步设置好批处理参数后,进行群体基因频率数据的Phylip分析;第六步调用格式转换装置中的E-St格式转换装置,将0, l矩阵转换成 Structure软件需要的输入格式的分子标记文件;第七步调用Structure软件,通过Structure软件设置好处理参数后,进行 分子标记数据的Structure确定遗传群体分析。获得PopGene 、 GenePop 、 Phylip和Structure的输入文件及采用UPGMA 距离聚类分析法的群体基因频率数据的Phylip分析结果,参见图7所示的聚类 树,和采用MCMC算法的遗传群体确定的Structure分析结果,参见图6。
权利要求
1、鱼类种质资源遗传分析装置,其特征在于它由以下部分组成用于将指定的由分子标记检测获得的电泳图谱转换成0,1矩阵的Excel格式的分子标记文件的数据输入装置;用于设置数据分析处理步骤及各步骤的处理参数形成工程文件,进而为调用装置提供工作顺序流程的工程建立装置;用于将数据输入装置获得的0,1矩阵的Excel格式的分子标记文件转换成分析装置中各个分析软件模块需要的输入格式文件的格式转换装置;用于根据工程建立装置形成的工程文件调用分析装置中的分析软件模块的调用装置;用于对分子标记数据进行分析的分析装置;其中所述数据分析装置包括用于完成哈代温博格平衡、群体分化、连锁不平衡、基因流参数分析的Genepop软件模块;用于对基因频率、基因型频率、等位基因数目、杂合度、群体自交系数及遗传分化、基因流参数进行分析的PopGene软件模块;用于处理包括核酸序列、分子标记数据、包括形态学数据在类的离散或连续分布的数据,完成鱼类种质资源的群体或品种演化相关分析的Phylip系列软件模块;用于完成鱼类种质资源遗传群体的确定及群体、个体的亲缘分配,获得群体迁徙路线、群体分化程度、群体演化等结果分析的Structure软件模块。
2、 根据权利要求1所述的鱼类种质资源遗传分析装置,其特征在于所述 Gen印op软件模块中包括多个用于获得一种数据分析结果的Genepop功能模 块,还包括用于根据工程建立装置形成的工程文件调用相应Genepop功能模块 的Genepop批处理模块。
3、 根据权利要求1所述的鱼类种质资源遗传分析装置,其特征在于所述 Phylip系列软件模块中包括多个用于获得一种数据分析结果的Phylip功能模 块,还包括用于设置各个Phylip功能模块的工作参数的Phylip参数设置模块;用于根据工程建立装置形成的工程文件调用相应Phylip功能模块的Phylip批处 理模块。
4、 根据权利要求1所述的鱼类种质资源遗传分析装置,其特征在于所述格式转换装置由以下装置组成-用于将0,1矩阵的Excel格式的分子标记文件转换成P叩Gene软件输入格 式的分子标记文件的E-Po格式转换装置;用于将O,l矩阵的Excel格式的分子标记文件转换成GenePop软件输入格 式的分子标记文件的E-Ge格式转换装置;用于将0,1矩阵的Excel格式的分子标记文件转换成Phylip软件输入格式 的分子标记文件的E-Ph格式转换装置;用于将0,1矩阵的Excel格式的分子标记文件转换成Structure软件输入格式的分子标记文件的E-St格式转换装置。 '
5、根据权利要求4所述的鱼类种质资源遗传分析装置,其特征在于所述E-Po格式转换装置中将0,1矩阵的Excel格式的分子标记文件转换成PopGene软件需要的显性标记数据格式的转换方法为步骤A1:从0,1矩阵Excel文件中读取数据;步骤A2:获取群体数、位点数及各个位点名称,并输出数据注释及位点 名称到输出文件;步骤A3:群体计数器i累加l;步骤A4:判断群体计数器i是否大于群体数,如果判断结果为是,结束数 据转换过程;如果判断结果为否,执行步骤A5;步骤A5:输出群体ID号和群体名称到输出文件; 步骤A6:获取位点数和个体数; 步骤A7:个体计数器j累加l;步骤A8:判断个体计数器j是否大于个体数,如果判断结果为是,则返回 执行步骤A3;如果判断结果为否,则执行步骤A9;步骤A9:获取并输出个体j在所有位点上的基因型,并输出到输出文件,返回执行步骤A7。所述E-Po格式转换装置中将0,1矩阵的Excel格式的分子标记文件转换成 PopGene软件需要的微卫星标记数据格式的转换方法为 步骤B1: 从0,1矩阵Excel文件中读取数据;步骤B2: 获取群体数、位点数及各个位点名称,并输出数据注释及位点 名称到输出文件;步骤B3: 群体计数器i累加l;步骤B4: 判断群体计数器i是否大于群体数,如果判断结果为是,则结 束数据转换过程;如果判断结果为否,执行步骤B5; 步骤B5: 输出群体ID号和群体名称到输出文件; 步骤B6: 获取位点数和个体数; 步骤B7: 个体计数器j累加l;步骤B8: 判断个体计数器j是否大于个体数,如果判断结果为是,则返 回执行步骤B3;如果判断结果为否,执行步骤B9; 步骤B9: 位点计数器k累加1步骤B10:判断位点记数器k是否大于位点数,如果判断结果为是,则返 回执行步骤B7;如果判断结果为否,执行步骤B11; 步骤B11:获取个体j在位点k上的等位基因数; 步骤B12:等位基因计数器h累加1;步骤B13:判断等位基因计数器h是否大于等位基因数,如果判断结果为 是,则执行步骤B17;如果判断结果为否,则执行步骤B14;步骤B14:获得个体j在位点k上的等位基因h的基因型0或1;步骤B15:判断基因型是否为0,如果判断结果为是,则返回执行步骤 B12;如果判断结果为否,则执行步骤B16;步骤B16:获取个体j在位点k上等位基因h的基因型值和,并将所述等位基因转换成字母(A-Z,a-z)基因变量;步骤B17:判断基因型值和是否大于1,如果判断结果为是,执行步骤 B19;如果判断结果为否,执行步骤B18;步骤B18:判断基因型值和是否为1,如果判断结果为是,执行步骤B21; 如果判断结果为否,执行步骤B20;步骤B19:输出转换完成的字母基因变量到输出文件,然后执行步骤B22;步骤B20:输出".."字母基因变量到输出文件,然后执行步骤B22; 步骤B21:两次输出转换完成的字母基因变量到输出文件,然后执行步骤 B22;步骤B22:基因型值和清零,然后返回执行步骤B9。
6、根据权利要求4所述的鱼类种质资源遗传分析装置,其特征在于所述 E-Ge格式转换装置中将0,1矩阵的Excel格式的分子标记文件转换成GenePop 软件需要的数据格式的转换方法为-步骤C1:从0,1矩阵Excel文件中读取数据;步骤C2:获取群体数、位点数及各个位点名称,并输出数据注释和各位点名称到输出文件;步骤C3:群体计数器i累加l;步骤C4:判断群体计数器i是否大于群体数,如果判断结果为是,则结束 数据转换过程;如果判断结果为否,则执行步骤C5;步骤C5:获取个体数,输出"Pop"关键字到输出文件; 步骤C6:个体计数器j累加h步骤C7:判断个体计数器j是否大于个体数,如果判断结果为是,返回执 行步骤C3;如果判断结果为否,执行步骤C8; 步骤C8:位点计数器k累加l;步骤C9:判断位点记数器k是否大于位点数,如果判断结果为是,则返回 执行步骤C6;如果判断结果为否,执行步骤C10; 步骤C10: 获取等位基因数; 步骤C11: 等位基因计数器h累加1;步骤C12: 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,执行步骤C18;如果判断结果为否,执行步骤C13;步骤C13: 获得个体j在位点k上的等位基因h的基因型0或1;步骤C14: 判断基因型是否为0,如果判断结果为是,返回执行步骤Cll; 如果判断结果为否,执行步骤C15;步骤C15: 判断所需基因型是否是2位数格式,如果判断结果为是,执 行步骤C17;如果判断结果为否,执行步骤C16;步骤C16: 获取个体j在位点k上第h个等位基因的基因型值和基因型 值和,并获取所述等位基因的名称作为基因变量,返回执行歩骤C11;步骤C17: 获取个体j在位点k上第h个等位基因的基因型值和基因型 值和,并将所述等位基因转换成01 99形式的基因变量,返回执行步骤C11;步骤C18: 判断基因型值和是否大于1,如果判断结果为是,执行步骤 C20;如果判断结果为否,执行步骤C19;步骤C19: 判断基因型值和是否为1,如果判断结果为是,执行步骤C22; 如果判断结果为否,执行步骤C21;步骤C20: 输出转换完成的字母基因变量到输出文件,然后执行步骤 C23;步骤C21: 输出输出"OOOO"字母基因变量到输出文件,然后执行步骤 C23;步骤C22: 两次输出转换完成基因型到输出文件,然后执行步骤C23; 步骤C23: 基因型值和清零,然后返回执行步骤C8。
7、根据权利要求4所述的鱼类种质资源遗传分析装置,其特征在于所述 E-St格式转换装置中将O,l矩阵的Excel格式的分子标记文件转换成Structure软件需要的微卫星标记数据格式的转换方法为步骤D1: 从0,1矩阵Excel文件中读取数据;步骤D2: 获取群体数、位点数及各个位点名称;并输出各位点名称到 输出文件; 步骤D3: 步骤D4:群体计数器i累加l;判断群体计数器i是否大于群体数,如果判断结果为是,则结束数据转换过程;如果判断结果为否,则执行步骤D5;步骤D5 步骤D6 步骤D7获取个体数、位点数; 个体计数器j累加1判断个体计数器j是否大于个体数,如果判断结果为是,则 返回执行步骤D3;如果判断结果为否,则执行步骤D8;步骤D8:分别将个体变量名称、群体名称输出给临时变量一、二; 步骤D9:位点计数器k累加1;步骤D10: 判断位点计数器k是否大于位点数,如果判断结果为是,则执行步骤D26;如果判断结果为否,则执行步骤D11;步骤D11: 获取等位基因数; 步骤D12: 等位基因计数器h累加1;步骤D13: 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,则执行步骤D20;如果判断结果为否,则执行步骤D14;步骤D14: 获得个体j在位点k上的等位基因h的基因型0或1;步骤D15: 判断基因型是否为0,如果判断结果为是,则返回执行步骤 D12;如果判断结果为否,则执行步骤D16;步骤D16: 求取个体j在位点k上的等位基因h的基因型值及基因和;步骤D17: 判断步骤D16获得的基因型值和是否大于1,如果判断结果为是,则返回执行步骤D18;如果判断结果为否,则执行步骤D19;步骤D18: 获取个体j在位点k上的等位基因h的基因名称,并转换成基因变量二,然后返、回执行步骤D12;步骤D19: 获取个体j在位点k上的等位基因h的基因名称,并转换成 基因变量一,然后返回执行步骤D12;步骤D20: 判断基因型值和是否大于1,如果判断结果为是,则执行步骤 D24;如果判断结果为否,则执行步骤D21;步骤D21: 判断基因型值和是否为1,如果判断结果为是,则执行步骤 D23;如果判断结果为否,则执行步骤D22;步骤D22: 分别输出"一9"给临时变量一、二,然后执行步骤D25;分别输出基因变量一给临时变量一、二,然后执行步骤D25;分别输出基因变量一、二给临时变量一、二,然后执行步骤步骤D23: 步骤D24: D25;步骤D25 步骤D26 步骤D27基因型值和清零,然后返回执行步骤D9; 分别输出临时变量一、二到输出文件; 临时变量一、二清零,返回执行步骤D6。 所述E-St格式转换装置中将0,1矩阵的Excel格式的分子标记文件转换成 Structure软件需要的显性标记数据格式的转换方法为 步骤E1、从O,l矩阵Excel文件中读取数据;步骤E2、获取群体数、及各个位点名称,并输出各位点名称到输出文件; 步骤E3、输出位点数个"0"到输出文件; 步骤E4、群体计数器i累加l;步骤E5、判断群体计数器i是否大于群体数,如果判断结果为是,则转换 结束;如果判断结果为否,执行步骤E6; 步骤E6、获取个体数、位点数; 步骤E7、个体计数器j累加1步骤E8、判断个体计数器j是否大于个体数,如果判断结果为是,则返回 执行步骤E4;如果判断结果为否,执行步骤E8;步骤E9、分别将个体变量名称、群体名称输出给临时变量一、二; 步骤EIO、 位点计数器k累加l;步骤Ell、 判断位点计数器k是否位点数;如果判断结果为是,则执行步骤E14;如果判断结果为否,执行步骤E12;步骤E12、 获取个体j在位点k上的基因型值输出给临时变量一,并将 "O"输出给临时变量二,返回执行步骤E10;步骤E13、 分别输出临时变量一、二到输出文件;步骤E14、 临时变量一、二清零,返回执行步骤E7。
8、根据权利要求4所述的鱼类种质资源遗传分析装置,其特征在于所述 E-Ph格式转换装置中将O,l矩阵的Excel格式的分子标记文件转换成Phylip软 件需要的显性标记数据格式的转换方法为-步骤F1、从0,1矩阵Excel文件中读取数据;步骤F2、获取群体数、位点数及各群体的个体数,求个体数总和,输出个 体数总和和位点数到输出文件; 步骤F3、群体计数器i累加l;步骤F4、判断群体计数器i是否大于群体数,如果判断结果为是,则转换 过程结束;如果判断结果为否,执行步骤F5; 步骤F5、获取位点数和群体的个体数; 步骤F6、个体计数器j累加l步骤F7、判断个体计数器是否大于个体数,如果判断结果为是,则返回执 行步骤F3;如果判断结果为否,执行步骤F8; 步骤F8、获取个体名称,并输出到输出文件;步骤F9、获取并输出个体j在所有位点上的基因型,并输出到输出文件; 返回执行步骤F6。所述E-Ph格式转换装置中将O,l矩阵的Excel格式的分子标记文件转换成 Phylip软件需要的微卫星标记的个体基因频率数据格式的转换方法为 步骤G1、 从O,l矩阵Excel文件中读取数据;步骤G2、 获取群体数、位点数及各群体的个体数,求个体数总和,输出 个体数总和和位点数到输出文件; 步骤G3、 群体计数器i累加l;步骤G4、 判断群体计数器i是否大于群体数,如果判断结果为是,则转 换结束;如果判断结果为否,执行步骤G5; 步骤G5、 获取个体数、位点数;步骤G6、 个体计数器j累加l;步骤G7、 判断个体计数器j是否大于个体数,如果判断结果为是,则返回执行步骤G3;如果判断结果为否,执行步骤G8;步骤G8、 获取个体名称,并输出到输出文件; 步骤G9、 位点计数器k累加1;步骤GIO、判断位点计数器k是否大于位点数,如果判断结果为是,则返 回执行步骤G23;如果判断结果为否,执行步骤G11; 步骤Gll、获取等位基因数; 步骤G12、等位基因计数器h累加l;步骤G13、判断等位基因计数器h是否大于等位基因数,如果判断结果为 是,则执行步骤G16;如果判断结果为否,执行步骤G14;步骤G14、获得个体j在位点k上的等位基因h的基因型0或1;步骤G15、求取个体j在位点k上的基因型值和,返回执行步骤G12;步骤G16、等位基因计数器h清零; 步骤G17、等位基因计数器h累加l;步骤G18、判断等位基因计数器h是否大于等位基因数,如果判断结果为是,则返回执行步骤G9;如果判断结果为否,执行步骤G19;步骤G19、获得个体j在位点k上的等位基因h的基因型0或1;步骤G20、判断个体j在位点k上的基因型值和是否为零,如果判断结果 为是,则执行步骤G21;如果判断结果为否,执行步骤G22;步骤G21、输出"0"到临时变量,返回执行步骤G17;步骤G22、求取基因型值与基因型值和的比值,即等位基因h在个体j的 基因频率,并输出到临时变量,返回执行步骤G17;步骤G23、输出临时变量到输出文件;步骤G24、临时变量清零,返回执行步骤G6。所述E-Ph格式转换装置中将0,1矩阵的Excel格式的分子标记文件转换成 Phylip软件需要的微卫星标记的群体基因频率数据格式的转换方法为 步骤H1、 从0,1矩阵Excel文件中读取数据; 步骤H2、 获取群体数、位点数,输出群体数和位点数到输出文件; 步骤H3、 群体计数器i累加l;步骤H4、 判断群体计数器i是否大于群体数,如果判断结果为是,则执 行步骤H22;如果判断结果为否,执行步骤H5;步骤H5、 获取个体数、位点数; 步骤H6、 个体计数器j累加1;步骤H7、 判断个体计数器j是否大于个体数,如果判断结果为是,则返 回执行步骤H3;如果判断结果为否,执行步骤H8; 步骤H8、 位点计数器k累加1;步骤H9、 判断位点计数器k是否大于位点数,如果判断结果为是,则执 行步骤H6;如果判断结果为否,执行步骤H10; 步骤HIO、获取等位基因数; 步骤Hll、等位基因计数器h累加l;步骤H12、判断等位基因计数器h是否大于等位基因数,如果判断结果为 是,则执行步骤H15;如果判断结果为否,执行步骤H13;步骤H13、获得个体j在位点k上的等位基因h的基因型0或1; 步骤H14、求取个体j在位点k上的基因型值和,返回执行步骤H11; 步骤H15、判断基因型和是否为1,如果判断结果为是,则执行步骤H16;如果判断结果为否,则返回执行步骤H8; 一步骤H16、等位基因计数器h清零; 步骤H17、等位基因计数器h累加1;步骤H18、判断等位基因计数器h是否大于等位基因数,如果判断结果为是,则返回执行H8;如果判断结果为否,执行步骤H19;步骤H19、获得个体j在位点k上的等位基因h的基因型0或1;步骤H20、判断基因型是否为l,如果判断结果为是,则执行步骤H21; 如果判断结果为否,则返回执行步骤H17;步骤H21、给基因型赋值2,返回执行步骤H17; 步骤H22、获取群体中位点的等位基因频率并输出到文件。 其中步骤H22中所述的获取群体中位点的等位基因频率的方法为 步骤Il、获取群体数、位点数; 步骤12、群体计数器i累加l;步骤13、判断群体计数器i是否大于群体数,如果判断结果为是,则转换 过程结束;如果判断结果为否,则执行步骤I4;步骤14、输出群体名称到输出文件; 步骤15、位点计数器k累加l;步骤16、判断位点计数器k是否大于位点数,如果判断结果为是,则执行步骤I18;如果判断结果为否,则执行步骤I7; 步骤17、获取个体数; 步骤18、个体计数器j累加l; 步骤19、获取等位基因数;步骤IIO、判断个体计数器j是否大于个体数,如果判断结果为是,则执行步骤I15;如果判断结果为否,则执行步骤I11; 步骤Il 1 、 等位基因计数器h累加1;步骤112、 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,则返回执行步骤I8;如果判断结果为否,则执行步骤I13;步骤113、 获得个体j在位点k上的等位基因h的基因型值,0、 l或2;步骤114、 求取位点k所有等位基因在所有个体的基因型值和位点k的 基因和,求取等位基因h在所有个体的基因型值和基因和,返回执行步骤I11;步骤115、 等位基因计数器h累加1;步骤116、 判断等位基因计数器h是否大于等位基因数,如果判断结果 为是,则返回执行步骤I5;如果判断结果为否,则返回执行步骤I17;步骤117、 求取等位基因h在所有个体的基因型值的基因和与位点k的 基因型值的基因和的比值,即为等位基因的群体基因频率,并输出所述等位基 因的群体基因频率到临时变量,返回执行步骤I15;步骤I 18 、 输出临时变量到输出文件;步骤119、 临时变量清零,返回执行步骤I2。
全文摘要
鱼类种质资源遗传分析装置,涉及到分子生物学DNA分子标记数据分析技术领域。它解决了现有鱼类种质资源遗传分析过程中,需要根据使用功能软件的要求人工转换分子标记数据格式及分别调用各种功能软件的问题。本发明将现有多个分子标记分析软件集成到一起,通过建立工程文件实现多个分析软件联合使用的目的,通过格式转换装置使原本使用多种格式文件的多个分析软件能够采用一种格式的输入文件实现多种分析、获得多种分析结果的目的。本发明可以作为群体遗传多样性及遗传结构等方面研究的一个基本工具,推广应用到濒危鱼类保护、野生资源评估、养殖鱼类遗传指导、鱼类遗传育种等领域。
文档编号G06F9/44GK101251873SQ200710144749
公开日2008年8月27日 申请日期2007年12月5日 优先权日2007年12月5日
发明者匡友谊, 孙效文, 尹家胜 申请人:中国水产科学研究院黑龙江水产研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1