一种疾病相关的基因检测报告自动化生成方法及系统与流程

文档序号:17779737发布日期:2019-05-28 20:45阅读:241来源:国知局
一种疾病相关的基因检测报告自动化生成方法及系统与流程

本发明涉及基因检测技术领域,更为具体来说,本发明为一种疾病相关的基因检测报告自动化生成方法及系统。



背景技术:

目前,疾病相关的基因检测报告的生成过程中,需要一个有大量遗传病解读人员查阅大量文献对众多突变位点进行致病性判读,这种方式需要团队付出大量人力资源和时间;比如对于一批20个样本,一个资深解读人员至少需要两周时间才能出得来报告,而一般做遗传性主动脉疾病基因检测的往往都是临床患者,迫切需要得到检测结果,而且现有方法的成本非常高,很多患者难以承受,所以现有基因检测报告生成方法因时间长、效率低、成本高等问题而无法满足实际需要。

因此,如何能够快速得到低成本的疾病相关的基因检测报告,成为了本领域技术人员亟待解决的技术问题和始终研究的重点。



技术实现要素:

为解决现有基因检测报告生成方法存在的时间长、成本高等问题,本发明创新地提供了一种疾病相关的基因检测报告自动化生成方法及系统,能够实现基因检测报告的快速、自动化生成,适用于遗传性主动脉疾病、妇科肿瘤、血液肿瘤等多种疾病的基因检测报告生成,从而彻底解决现有技术存在的人力投入高、时间成本高等问题。

为实现上述的技术目的,本发明公开了一种疾病相关的基因检测报告自动化生成方法,该生成方法包括如下步骤;

步骤1,获取通过测序仪得到的原始基因检测结果数据;

步骤2,从所述原始基因检测结果数据中筛选出与目标疾病相关的基因突变位点数据;

步骤3,依据第一突变位点优选策略筛除所述基因突变位点数据中的无效基因突变位点数据,从而得到第一突变位点数据;

步骤4,依据第二突变位点优选策略筛除所述第一突变位点数据中的假阳性位点数据,从而得到第二突变位点数据;

步骤5,计算第二突变位点数据中各突变位点的致病性等级;

步骤6,根据所述各突变位点的致病性等级、用户信息以及目标疾病知识库自动生成没有致病性结果的基因检测报告。

进一步地,步骤5中,根据各突变位点的致病性等级筛除第二突变位点数据中的良性位点数据和可能良性位点数据,从而得到第三突变位点数据;

步骤6中,对所述第三突变位点数据进行判读,以删除假阳性突变位点、保留阳性突变位点且对阳性突变位点致病性进行分级;根据判读结果、用户信息及目标疾病知识库自动生成致病性判读结果的基因检测报告。

进一步地,步骤3中,所述第一突变位点优选策略包括:将同一批次中出现五次以上的基因突变位点数据筛除、将只有单向碱基有突变的移码基因突变位点数据筛除、将处于非编码区的基因突变位点数据筛除以及将没有氨基酸改变的同义基因突变位点数据筛除。

进一步地,步骤4中,所述第二突变位点优选策略包括:基于预设数据库将第一突变位点数据与同批次测序分析样本结果数据进行比较的方式。

进一步地,步骤6中,对所述第三突变位点数据进行判读时,采用人机交互判读方式和/或人工智能判读方式。

为实现上述技术目的,本发明还公开了一种疾病相关的基因检测报告自动化生成系统,其特征在于:该系统包括测序结果获取模块、突变位点筛选模块、突变位点优选模块、假阳性位点筛除模块、自动判读模块及报告生成模块;

所述测序结果获取模块,用于获取通过测序仪得到的原始基因检测结果数据;

所述突变位点筛选模块,用于从所述原始基因检测结果数据中筛选出与目标疾病相关的基因突变位点数据;

所述突变位点优选模块,用于依据第一突变位点优选策略筛除所述基因突变位点数据中的无效基因突变位点数据,从而得到第一突变位点数据;

所述假阳性位点筛除模块,用于依据第二突变位点优选策略筛除所述第一突变位点数据中的假阳性位点数据,从而得到第二突变位点数据;

所述自动判读模块,用于计算第二突变位点数据中各突变位点的致病性等级;

所述报告生成模块,用于根据所述各突变位点的致病性等级、用户信息以及目标疾病知识库自动生成没有致病性结果的基因检测报告。

进一步地,所述自动判读模块,还用于根据各突变位点的致病性等级筛除第二突变位点数据中的良性位点数据和可能良性位点数据,从而得到第三突变位点数据;

所述报告生成模块,还用于根据对所述第三突变位点数据的判读结果、用户信息及目标疾病知识库自动生成致病性判读结果的基因检测报告。

进一步地,所述第一突变位点优选策略包括:将同一批次中出现五次以上的基因突变位点数据筛除、将只有单向碱基有突变的移码基因突变位点数据筛除、将处于非编码区的基因突变位点数据筛除以及将没有氨基酸改变的同义基因突变位点数据筛除。

进一步地,所述第二突变位点优选策略包括:基于预设数据库将第一突变位点数据与同批次测序分析样本结果数据进行比较的方式。

进一步地,所述基因检测报告的格式为可编辑格式。

本发明的有益效果为:

本发明能够显著提高疾病相关的基因检测报告的生成效率,从而极大减少了人力成本以及时间成本,本发明的报告生成过程中极少人为干预,从而大大减小了人为引入误差并缩短了工作周期。

附图说明

图1为疾病相关的基因检测报告自动化生成方法的工作流程示意图。

图2为疾病相关的基因检测报告自动化生成系统的工作原理示意图。

具体实施方式

下面结合说明书附图对本发明涉及的一种疾病相关的基因检测报告自动化生成方法及系统进行详细的解释和说明。

实施例一:

如图1中所示,本实施例公开了一种疾病相关的基因检测报告自动化生成方法,本实施例能通过对二代基因测序下机数据注释结果进行假阳性突变位点的自动判别、突变位点致病性分级等方式实现自动生成基因检测报告,解决了传统人工方法需要花费大量时间和人力成本的问题,该生成方法包括如下步骤:对疾病的基因检测数据自动筛选出与疾病相关的基因突变位点;根据疾病知识库以及致病基因突变位点,自动生成解读报告;可适用于遗传性主动脉疾病、血液肿瘤、妇科肿瘤等多种疾病的基因检测报告的自动生成;具体说明如下。

步骤1,获取通过测序仪得到的原始基因检测结果数据,本实施例为带有注释结果的二代基因测序下机数据。

步骤2,对于获取的数据,本实施例从原始基因检测结果数据中筛选出与目标疾病相关的基因突变位点数据。

步骤3,依据第一突变位点优选策略筛除基因突变位点数据中的无效基因突变位点数据,从而得到第一突变位点数据。本实施例中,第一突变位点优选策略包括:将同一批次中出现五次以上的基因突变位点数据筛除、将只有单向碱基有突变的移码基因突变位点数据筛除、将处于非编码区的基因突变位点数据筛除以及将没有氨基酸改变的同义基因突变位点数据筛除,实现对基因突变位点数据的优选。

步骤4,依据第二突变位点优选策略筛除第一突变位点数据中的假阳性位点数据,以得到第二突变位点数据。本实施例中,第二突变位点优选策略包括:基于预设数据库将第一突变位点数据与同批次的测序分析样本结果数据进行比较的方式;本实施例还可在此基础上作上假阳性标识,以首先排除这些突变位点。

步骤5,计算第二突变位点数据中各个突变位点的致病性等级,在本实施例中,具体根据acmg(美国医学院遗传学会临床遗传学年会)致病等级判断标准来判断筛选出来的突变位点的致病性等级;本实施例步骤5中,可根据各突变位点的致病性等级筛除第二突变位点数据中的良性位点数据和可能良性位点数据,从而得到第三突变位点数据。

步骤6,根据各突变位点的致病性等级、用户信息(患者信息)以及目标疾病知识库自动生成没有致病性结果的基因检测报告(本实施例为word格式报告)。更为具体地,步骤6中,对第三突变位点数据进行判读,以删除假阳性突变位点、保留阳性突变位点且对阳性突变位点致病性进行分级;根据判读结果、用户信息以及目标疾病知识库自动生成致病性判读结果的基因检测报告(本实施例为word格式报告)。另外,在步骤6中,对第三突变位点数据进行判读时,采用人机交互判读方式和/或人工智能判读方式,本实施例中的人机交互判读模式为使用一代测序技术验证筛选出来的突变位点的真实性,解读人员根据一代验证结果过滤掉假阳性位点,并对剩下的真实存在的位点进行致病性分级确认,最后自动生成有致病性判读结果的word报告。

本发明能够遗传性主动脉疾病的基因检测数据里面的突变信息、统计结果、疾病数据库、突变位点人群频率数据库等自动进行位点筛选和解读,大大减少了人为查阅文件的解读方法的时间。本发明可对判读出来的数据自动生成word报告,免去了人为书写报告的时间,同时避免了人为书写报告引起的人为失误。

实施例二:

本实施例与实施例一基于相同的发明构思,具体公开了一种执行实施例一中的基因检测报告自动化生成方法的系统,可理解为是一种知识解释系统,本实施例具体涉及一种疾病相关的基因检测报告自动化生成系统(可用ireport表示),该系统包括测序结果获取模块、突变位点筛选模块、突变位点优选模块、假阳性位点筛除模块、自动判读模块及报告生成模块。

测序结果获取模块,用于获取通过测序仪得到的原始基因检测结果数据。

突变位点筛选模块,用于从原始基因检测结果数据中筛选出与目标疾病相关的基因突变位点数据。

突变位点优选模块,用于依据第一突变位点优选策略筛除基因突变位点数据中的无效基因突变位点数据,从而得到第一突变位点数据;本实施例中,第一突变位点优选策略包括:将同一批次中出现五次以上的基因突变位点数据筛除、将只有单向碱基有突变的移码基因突变位点数据筛除、将处于非编码区的基因突变位点数据筛除以及将没有氨基酸改变的同义基因突变位点数据筛除。

假阳性位点筛除模块,用于依据第二突变位点优选策略筛除第一突变位点数据中的假阳性位点数据,从而得到第二突变位点数据;本实施例中,第二突变位点优选策略包括:基于预设数据库将第一突变位点数据与同批次测序分析样本结果数据进行比较的方式。

自动判读模块,用于计算第二突变位点数据中各突变位点的致病性等级;作为改进的方案,自动判读模块还用于根据各突变位点的致病性等级筛除第二突变位点数据中的良性位点数据和可能良性位点数据,从而得到第三突变位点数据。

报告生成模块,用于根据各突变位点的致病性等级、用户信息以及目标疾病知识库自动生成没有致病性结果的基因检测报告。作为改进的方案,报告生成模块还用于根据对第三突变位点数据的判读结果、用户信息及目标疾病知识库自动生成致病性判读结果的基因检测报告。本发明能够得到致病性和没有致病性的两种基因检测报告,检测结果全面,且提供的基因检测报告的格式为可编辑格式,以供修正,本实施例基因检测报告的格式为word格式。本实施例可以支持windows/linux/mac三种不同的计算机操作系统,并使用python来包装知识解释系统。本实施例适用于遗传性主动脉疾病、血液肿瘤、妇科肿瘤等多种基因检测报告的自动生成。遗传性主动脉疾病以主动脉扩张、主动脉瘤/夹层为特征,可发生于马凡综合征、loeys-dietz综合征、血管型ehlers-danlos综合征、家族性胸主动脉瘤/夹层等多种疾病,其共同特点是主动脉瘤发生破裂的风险高,必须通过手术置换损伤部位动脉而避免发生致命性动脉瘤破裂。这些疾病有着不同程度的临床表型重合,仅靠临床症状往往难以区分确诊。这种情况下,基因检测在患者症状完全表现之前即可明确诊断,显示出无可比拟的优势。针对遗传性主动脉疾病基因检测,主要采用基因组合测序的方法,其检测结果对于患者的早期、明确诊断和家属筛查具有重要意义,对于患者手术方案的选择及预后判断也有一定的指导作用。

如图2所示,以遗传性主动脉疾病为例,本实施例按照如下方式进行工作。

在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明实质内容上所作的任何修改、等同替换和简单改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1