内分泌与代谢系统对应的基因突变位点的获取方法及装置与流程

文档序号:11134478阅读:来源:国知局

技术特征:

1.一种内分泌与代谢系统对应的基因突变位点的获取方法,其特征在于,所述方法包括:

将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点的突变碱基以及每个初步变异位点的位置信息;

根据所述初步变异位点信息,将多个初步变异位点中不满足预设保留条件的变异位点删除,将删除后获得的所述待测基因中的变异位点作为待检位点;

将所述待检位点与内分泌与代谢系统基因库中的内分泌与代谢系统对应的基因的多个变异位点进行比较,所述内分泌与代谢系统基因库中包括内分泌与代谢系统对应的基因的每个变异位点的突变碱基以及每个变异位点所在位置;

当所述待检位点中存在与所述内分泌与代谢系统基因库中位置相同且突变碱基相同的变异位点,获得所述待测基因中内分泌与代谢系统对应的基因的位点突变情况。

2.根据权利要求1所述的方法,其特征在于,所述内分泌与代谢系统基因库中还包括内分泌与代谢系统对应的基因的每个变异位点的每种突变碱基对蛋白质功能的影响,

所述方法还包括:

根据所述待测基因中内分泌与代谢系统对应的基因的位点突变情况,确定所述待测基因中每个变异位点的突变对蛋白质功能的影响。

3.根据权利要求1所述的方法,其特征在于,在所述将所述待检位点与内分泌与代谢系统基因库中的内分泌与代谢系统对应的基因的多个变异位点进行比较之前,还包括建立内分泌与代谢系统基因库,所述建立内分泌与代谢系统基因库包括:

获取COSMIC基因数据库、NCBI的clivar数据库中与内分泌与代谢系统相关的基因位点信息,所述基因位点信息中包括内分泌与代谢系统对应的基因的每个变异位点的突变碱基以及每个变异位点所在位置;

将所述基因位点信息中可信度低于预设标准的以及错误的基因位点信息删除,获得的基因位点信息形成所述内分泌与代谢系统基因库。

4.根据权利要求3所述的方法,其特征在于,还包括:

每隔预设时间段对所述内分泌与代谢系统基因库进行更新。

5.根据权利要求1所述的方法,其特征在于,所述将多个初步变异位点中不满足预设保留条件的变异位点删除包括以下一种或多种:

去除所述多个初步变异位点中,等位基因的个数大于预设阈值的变异位点;

删除所述多个初步变异位点中,位于每个插入缺失的上游范围或者下游范围内的所有变异位点,所述上游范围和下游范围包括的碱基个数为预设个数;

将所述多个初步变异位点中,彼此之间间隔预设碱基个数的变异位点删除;

将所述多个初步变异位点中,对应的GQ值小于预设GQ阈值的变异位点删除;

将所述多个初步变异位点中,对应的MQ值小于预设MQ阈值的变异位点删除。

6.根据权利要求1所述的方法,其特征在于,所述将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息包括:

将所述待测基因的多个短序列与参考基因组进行首次比对,获得SAM格式的比对结果;

对所述比对结果进行去重,使对比到参考基因组的一个位置的短序列个数小于或等于1;

对去重后的对比结果进行本地重比对;

重新计算本地重比对后的比对结果中的碱基质量分数;

根据所述碱基质量分数,对本地重比对后的对比结果进行SNP和indel分析,获得初步变异位点信息。

7.根据权利要求1所述的方法,其特征在于,所述变异位点为SNP。

8.一种内分泌与代谢系统对应的基因突变位点的获取装置,其特征在于,所述装置包括:

比对模块,用于将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点的突变碱基以及每个初步变异位点的位置信息;

过滤模块,用于根据所述初步变异位点信息,将多个初步变异位点中不满足预设保留条件的变异位点删除,将删除后获得的所述待测基因中的变异位点作为待检位点;

比较模块,用于将所述待检位点与内分泌与代谢系统基因库中的内分泌与代谢系统对应的基因的多个变异位点进行比较,所述内分泌与代谢系统基因库中包括内分泌与代谢系统对应的基因的每个变异位点的突变碱基以及每个变异位点所在位置;

突变获取模块,当所述待检位点中存在与所述内分泌与代谢系统基因库中位置相同且突变碱基相同的变异位点,用于获得所述待测基因中内分泌与代谢系统对应的基因的位点突变情况。

9.根据权利要求8所述的装置,其特征在于,还包括基因库建立模块,用于建立内分泌与代谢系统基因库,所述基因库建立模块包括:

数据获取单元,用于获取COSMIC基因数据库、NCBI的clivar数据库中与内分泌与代谢系统相关的基因位点信息,所述基因位点信息中包括内分泌与代谢系统对应的基因的每个变异位点的突变碱基以及每个变异位点所在位置;

数据删除单元,用于将所述基因位点信息中可信度低于预设标准的以及错误的基因位点信息删除,获得的基因位点信息形成所述内分泌与代谢系统基因库。

10.根据权利要求8所述的装置,其特征在于,所述过滤模块包括以下一种或多种:

第一删除单元,用于去除所述多个初步变异位点中,等位基因的个数大于预设阈值的变异位点;

第二删除单元,用于删除所述多个初步变异位点中,位于每个插入缺失的上游范围或者下游范围内的所有变异位点,所述上游范围和下游范围包括的碱基个数为预设个数;

第三删除单元,用于将所述多个初步变异位点中,彼此之间间隔预设碱基个数的变异位点删除;

第四删除单元,用于将所述多个初步变异位点中,对应的GQ值小于预设GQ阈值的变异位点删除;

第五删除单元,用于将所述多个初步变异位点中,对应的MQ值小于预设MQ阈值的变异位点删除。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1