遗传图谱的构建方法和装置的制造方法

文档序号:9611825阅读:1212来源:国知局
遗传图谱的构建方法和装置的制造方法
【技术领域】
[0001]本发明涉及生物信息学技术领域,尤其涉及一种遗传图谱的构建方法和装置。
【背景技术】
[0002]遗传图谱的构建对于各物种的研究具有重大的意义,能够阐释物种的遗传规律、特点,因此,通过构建遗传图谱能够揭示出人类以及其他生物的遗传规律,从而为人们日常生活中自身疾病分析指导、动植物的生物功能的异常研究等提供依据。
[0003]目前,可根据各种测序技术得到测序结果来构建遗传图谱,例如,可根据全基因组重测序、RAD (Restrict1n-site associated DNA tags,限制性内切位点相关的DNA标记)测序以及GBS(genotyping-by_sequencing,基因分型测序法)等方法的获取测序结果,然后通过一些遗传图谱根据测序结果来构建遗传图谱。在得到分子标记数据后,需要研究人员对这些分子标记进行筛选整理,以使这些分子标记数据符合所使用的遗传图谱构建方法或者软件的输入要求,对标记进行筛选及其准确性这是构建遗传图谱的一个关键指标。但是,通过研究人员手动进行筛选整理的方式非常耗时耗力,并且容易出错,一旦出错,就需重新进程筛选并再次进行构图的步骤,非常不便,并且效率非常低,准确率也难以保证。

【发明内容】

[0004]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明第一方面的目的在于提出一种遗传图谱的构建方法,提高了整理和筛选的准确率和效率,从而提高了构建遗传图谱的准确性和效率。
[0005]本发明的第二方面的目的在于提出一种遗传图谱的构建装置。
[0006]为达上述目的,根据本发明第一方面实施例提出了一种遗传图谱的构建方法,包括:接收分子标记数据和多个个体的测序数据;根据所述分子标记数据对所述多个个体的测序数据进行整合得到预设格式的第一基因型数据;根据所述第一基因型数据获取每个标记的标记缺失率、每个个体的个体标记缺失率和任意两个标记之间的物理距离中的一种或多种;根据所述标记缺失率、所述个体标记缺失率和所述任意两个标记之间的物理距离中的一种或多种对个体和/或标记进行筛选,以得到第二基因型数据;根据所述第二基因型数据构建遗传图谱。
[0007]另外,根据本发明上述实施例的遗传图谱的构建方法,还可以具有如下附加的技术特征:
[0008]在本发明的一个实施例中,在所述根据所述分子标记数据对所述多个个体的测序数据进行整合得到预设格式的第一基因型数据之后,还包括:如果所述分子标记数据中的标记的位置坐标为假染色体坐标,则获取所述假染色体坐标对应的坐标转换规则,并根据所述坐标转换规则对所述第一基因型数据中标记的位置坐标进行坐标转换。
[0009]在本发明的一个实施例中,该遗传图谱的构建方法还包括:根据所述第一基因型数据对每个标记的分离比进行显著性检验,并根据所述显著性检验的结果对所述第一基因型数据中的标记进行筛选。
[0010]在本发明的一个实施例中,所述根据所述标记缺失率、所述个体标记缺失率和所述任意两个标记之间的物理距离中的一种或多种对个体和/或标记进行筛选,具体包括:获取所述第一基因型数据中个体标记缺失率大于第一阈值的个体,并将所述个体标记缺失率大于第一阈值的个体对应的记录从所述第一基因型数据中移除。
[0011]在本发明的一个实施例中,所述根据所述标记缺失率、所述个体标记缺失率和所述任意两个标记之间的物理距离中的一种或多种对个体和/或标记进行筛选,具体包括:获取所述第一基因型数据中标记缺失率大于第二阈值的标记,并将所述标记缺失率大于第二阈值的标记对应的记录从所述第一基因型数据中移除。
[0012]在本发明的一个实施例中,所述根据所述标记缺失率、所述个体标记缺失率和所述任意两个标记之间的物理距离中的一种或多种对个体和/或标记进行筛选,具体包括:获取所述第一基因型数据中物理距离小于预设距离的标记A和标记B ;如果所述标记A的标记缺失率大于所述标记B的标记缺失率,则将所述标记A对应的记录从所述第一基因型数据中移除;如果所述标记A的缺失率小于或等于所述标记B的标记缺失率,则将所述标记B对应的记录从所述第一基因型数据中移除。
[0013]本发明的第二方面的实施例提供了一种遗传图谱的构建装置,包括:接收模块,用于接收分子标记数据和多个个体的测序数据;整合模块,用于根据所述分子标记数据对所述多个个体的测序数据进行整合得到预设格式的第一基因型数据;获取模块,用于根据所述第一基因型数据获取每个标记的标记缺失率、每个个体的个体标记缺失率和任意两个标记之间的物理距离中的一种或多种;筛选模块,用于根据所述标记缺失率、所述个体标记缺失率和所述任意两个标记之间的物理距离中的一种或多种对个体和/或标记进行筛选,以得到第二基因型数据;构建模块,用于根据所述第二基因型数据构建遗传图谱。
[0014]另外,根据本发明上述实施例的遗传图谱的构建装置,还可以具有如下附加的技术特征:
[0015]在本发明的一个实施例中,上述遗传图谱的构建装置还包括:坐标转换模块,用于在所述分子标记数据中的标记的位置坐标为假染色体坐标时,获取所述假染色体坐标对应的坐标转换规则,并根据所述坐标转换规则对所述第一基因型数据中标记的位置坐标进行坐标转换。
[0016]在本发明的一个实施例中,上述遗传图谱的构建装置还包括:显著性检验模块,用于根据所述第一基因型数据对每个标记的分离比进行显著性检验,并根据所述显著性检验的结果对所述第一基因型数据中的标记进行筛选。
[0017]在本发明的一个实施例中,所述筛选模块具体用于获取所述第一基因型数据中个体标记缺失率大于第一阈值的个体,并将所述个体标记缺失率大于第一阈值的个体对应的记录从所述第一基因型数据中移除。
[0018]在本发明的一个实施例中,所述筛选模块具体用于:获取所述第一基因型数据中标记缺失率大于第二阈值的标记,并将所述标记缺失率大于第二阈值的标记对应的记录从所述第一基因型数据中移除。
[0019]在本发明的一个实施例中,所述筛选模块具体用于:获取所述第一基因型数据中物理距离小于预设距离的标记A和标记B,并在所述标记A的标记缺失率大于所述标记B的标记缺失率时,将所述标记A对应的记录从所述第一基因型数据中移除,以及在所述标记A的缺失率小于或等于所述标记B的标记缺失率时,将所述标记B对应的记录从所述第一基因型数据中移除。
[0020]本发明实施例的遗传图谱的构建方法和装置,在接收到分子标记数据和测序数据后,可根据二者整合得到预设格式的第一基因型数据,并根据标记的缺失率、个体标记缺失率、标记间的物理距离等对标记和个体进行筛选,以根据筛选后得到的第二基因型数据构建遗传图谱,免去人工操作,省时省力,并且提高了整理和筛选的准确率和效率,从而提高了构建遗传图谱的准确性和效率,为遗传图谱的构建提供了非常便利的条件。
【附图说明】
[0021]本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0022]图1为根据本发明一个实施例的遗传图谱的构建方法的流程图;
[0023]图2a为根据本发明一个实施例的CNS文件中部分数据的示意图;
[0024]图2b为根据本发明一个实施例的第一基因型数据中部分数据的示意图;
[0025]图3为根据本发明另一个实施例的遗传图谱的构建方法的流程图;
[0026]图4为根据本发明一个实施例的遗传图谱的构建装置的结构示意图;
[0027]图5为根据本发明另一个实施例的遗传图谱的构建装置的结构示意图。
【具体实施方式】
[0028]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0029]下面参考附图描述根据本发明实施例的遗传图谱的构建方法和装置。
[0030]图1为根据本发明一个实施例的遗传图谱的构建方法的流程图。
[0031]如图1所示,该遗传图谱的构建方法,包括:
[0032]S101,接收分子标记数据和多个个体的测序数据。
[0033]在本发明的实施例中,当用户需要针对一个分离群里构建遗传图谱时,需要输入相应的分子标记数据和多个个体的测序数据。
[0034]其中,分子标记数据可以是SNP标记数据、RELP标记数据、RAPD标记数据等,也可以是其他类型的分子标记数据。分子标记数据中包括标记所在染色体、标记的位置坐标、变异等信息。
[0035]测序数据为用于构建遗传图谱的分离群体中每个个体的基因组序列。
[0036]S102,根据分子标记数据对多个个体的测序数据进行整合得到预设格式的第一基因型数据。
[0037]由于在后续构建遗传图谱时,使用的方法或者软件都需要输入特定格式的基因型数据文件,才可成功构建遗传图谱,因此,需要根据分子标记数据对多个个体的测序数据进行格式转换和整理,以整合成符合后续所使用的遗传图谱构建方法或软件所需的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1