一种单基因遗传病检测方法及装置与流程

文档序号:12056665阅读:481来源:国知局
一种单基因遗传病检测方法及装置与流程

本发明涉及数据分析及生物信息技术领域,具体而言,涉及一种单基因遗传病检测方法及装置。



背景技术:

单基因遗传病是指受一对等位基因控制的遗传病,约有6600多种,并且每年在以10-50种的速度递增,较为常见的有红绿色盲、血友病、白化病等,目前,单基因遗传病对人类的健康已经构成了很大的威胁,因此,对单基因遗传病的检测就显得尤为重要。

现有技术中,大都是采用一代测序或者二代测序的方法检测出遗传变异,根据遗传变异以及包含单基因遗传病和遗传变异的数据库,比如人类孟德尔遗传(0nline Mendelian Inheritance in Man,OMIM)、人类基因突变数据库(The Human Gene Mutation Database,HGMD)等进行查找、匹配、判断,并最终得出检测报告,但是,现有技术中的方法,查找、匹配、判断以及出具检测报告都是采用人工方式实现的,检测的效率和准确率都较低。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种单基因遗传病检测方法及装置,以解决采用人工方式对单基因遗传病进行检测导致的检测效率和准确率都较低的问题。

第一方面,本发明实施例提供了一种单基因遗传病检测方法,包括:

接收基因测序装置发送的受检者的基因测序信息,所述基因测序信息包括基因测序结果数据和受检者信息;

将所述基因测序结果数据与参考基因组进行比对,确定所述受检者的基因变异信息;

确定所述受检者的基因变异信息、单基因遗传病及所述受检者的基因变异信息对所述单基因遗传病的致病等级的对应关系;

根据所述对应关系和所述受检者信息生成所述受检者的单基因遗传病检测报告。

结合第一方面,本发明实施例提供了上述第一方面的第一种可能的实现方式,其中,所述基因变异信息包括变异所在的染色体、所述变异在所述染色体上的起始物理位置、所述变异在所述染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列。

结合第一方面或者第一方面的第一种可能的实现方式,本发明实施例提供了上述第一方面的第二种可能的实现方式,其中,所述接收基因测序装置发送的受检者的基因测序信息之前,所述方法还包括:

确定每个基因变异信息对应的单基因遗传病,及每个所述基因变异信息对其对应的所述单基因遗传病的致病等级;

建立每个所述基因变异信息、所述单基因遗传病和所述致病等级的对应关系;

将所述每个所述基因变异信息、所述单基因遗传病和所述致病等级的对应关系存储在单基因遗传病知识库中。

结合第一方面的第二种可能的实现方式,本发明实施例提供了上述第一方面的第三种可能的实现方式,其中,所述确定所述受检者的基因变异信息、单基因遗传病及所述受检者的基因变异信息对所述单基因遗传病的致病等级的对应关系,包括:

在所述单基因遗传病知识库中查找与所述受检者的变异所在的染色体、所述变异在所述染色体上的起始物理位置、所述变异在所述染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列一致的所述基因变异信息;

从所述单基因遗传病知识库中获取所述基因变异信息所在的对应关系;

将所述基因变异信息所在的对应关系确定为所述受检者的基因变异信息、所述单基因遗传病及所述致病等级的对应关系。

结合第一方面,本发明实施例提供了上述第一方面的第四种可能的实现方式,其中,所述将所述基因测序结果数据与参考基因组进行比对,确定所述受检者的基因变异信息,包括:

判断所述基因测序结果数据的格式;

根据所述基因测序结果数据的格式选择比对流程;

根据所述比对流程将所述基因测序结果数据与所述参考基因组进行比对,确定所述基因测序结果数据中的基因变异信息;

将所述基因测序结果数据中的基因变异信息确定为所述受检者的基因变异信息。

结合第一方面,本发明实施例提供了上述第一方面的第五种可能的实现方式,其中,所述根据所述对应关系和所述受检者信息生成所述受检者的单基因遗传病检测报告,包括:

根据所述对应关系确定所述受检者的基因变异信息对应的单基因遗传病,以及所述受检者的基因变异信息对所述单基因遗传病的致病等级;

将所述受检者的基因变异信息、所述受检者的基因变异信息对应的单基因遗传病、所述受检者的基因变异信息对所述单基因遗传病的致病等级和所述受检者信息组成所述单基因遗传病检测报告。

结合第一方面的第五种可能的实现方式,本发明实施例提供了上述第一方面的第六种可能的实现方式,其中,所述单基因遗传病检测报告还包括所述基因测序装置的名称和所述基因测序装置的型号。

结合第一方面,本发明实施例提供了上述第一方面的第七种可能的实现方式,其中,所述受检者信息包括:所述受检者的姓名、所述受检者的年龄、所述受检者的种族、所述受检者的个人病史和所述受检者的家族病史。

第二方面,本发明实施例提供了一种单基因遗传病检测装置,所述装置包括:

接收模块,用于接收基因测序装置发送的受检者的基因测序信息,所述基因测序信息包括基因测序结果数据和受检者信息;

比对模块,用于将所述基因测序结果数据与参考基因组进行比对,确定所述受检者的基因变异信息;

确定模块,用于确定所述受检者的基因变异信息、单基因遗传病及所述受检者的基因变异信息对所述单基因遗传病的致病等级的对应关系;

生成模块,用于根据所述对应关系和所述受检者信息生成所述受检者的单基因遗传病检测报告。

结合第二方面,本发明实施例提供了上述第二方面的第一种可能的实现方式,其中,所述确定模块包括:

查找单元,用于在所述单基因遗传病知识库中查找与所述受检者的变异所在的染色体、所述变异在所述染色体上的起始物理位置、所述变异在所述染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列一致的所述基因变异信息;

获取单元,用于从所述单基因遗传病知识库中获取所述基因变异信息所在的对应关系;

确定单元,用于将所述基因变异信息所在的对应关系确定为所述受检者的基因变异信息、所述单基因遗传病及所述致病等级的对应关系。

本发明实施例提供的单基因遗传病检测方法及装置,实现了单基因遗传病的自动检测,避免使用人工方式进行检测,提高了检测效率和检测结果的准确性。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例所提供的单基因遗传病检测方法的流程图;

图2示出了本发明实施例所提供的单基因遗传病检测方法中,确定受检者的基因变异信息的流程图;

图3示出了本发明实施例所提供的单基因遗传病检测装置的结构示意图;

图4示出了本发明实施例所提供的单基因遗传病检测装置的第二种结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

考虑到现有技术中,在进行单基因遗传病检测时,大都是先采用一代测序或者二代测序的方法检测出遗传变异,根据检测出的遗传变异及OMIM、HGMD等知识库采用人工方式进行查找、匹配、判断及出具检测报告等,但是,采用人工方式检测的效率和准确性均较低。基于此,本发明实施例提供了一种单基因遗传病检测方法及装置,下面通过实施例进行描述。

本发明实施例提供了一种单基因遗传病检测方法,可以实现单基因遗传病的自动检测,在采用本发明实施例提供的方法进行遗传病检测之前,需要建立单基因遗传病知识库,具体包括:

确定每个基因变异信息对应的单基因遗传病,及每个基因变异信息对其对应的单基因遗传病的致病等级;建立每个基因变异信息、单基因遗传病和致病等级的对应关系;将每个基因变异信息、单基因遗传病和致病等级的对应关系存储在单基因遗传病知识库中。

上述基因变异信息包括变异所在的染色体、变异在染色体的起始物理位置、变异在染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列。

具体的,一个基因变异可能对应一种单基因遗传病,也可能会对应多种单基因遗传病。

上述致病等级指的是基因变异信息对与该基因变异信息对应的单基因遗传病的致病性的等级划分,具体的,上述致病等级包括致病、可能致病、不确定意义、可能良性和良性。

具体的,致病,指的是某个基因变异会引起相应的单基因遗传病;可能致病,指的是某个基因变异引起相应的单基因遗传病的可能性在90%以上;不确定意义,指的是某个基因变异与相应的单基因遗传病发病关系不确定;可能良性,指的是某个基因变异不会引起相应的单基因遗传病的可能性在90%以上;良性,指的是某个基因变异不会引起相应的单基因遗传病。

基因变异的种类有很多,比如说,单核苷酸变异、插入、缺失、插入缺失、重复、拷贝数变异等,而每个具体的变异类型包括很多不同的基因变异。

在建立单基因遗传病知识库时,首先确定出每个基因变异信息对应的单基因遗传病,以及该基因变异信息对其对应的单基因遗传病的致病等级,建立每个基因变异信息、单基因遗传病及致病等级的对应关系,将每个基因变异信息所在的对应关系组成列表,如表1所示,存储在单基因遗传病知识库中。

表1以插入和缺失两种基因变异为例举例说明了建立的对应关系,在表1中,变异1对应的单基因遗传病为A,且变异1对单基因遗传病A的致病等级为致病,变异2对应的单基因遗传病为A,且变异2对单基因遗传病A的致病等级为良性,变异3对应的单基因遗传病为B1和B2,且变异3对单基因遗传病B1的致病等级为致病,变异3对单基因遗传病B2的致病等级为不确定意义。

当然,表1只是举例说明上述对应关系的一种可能的存在形式,在单基因遗传病知识库中,上述对应关系还可以以其它方式存在,并非只是以表格这一种方式存在,表1只是列举了其中一种可能的形式。

表1

当建立了上述单基因遗传病知识库后,则开始采用本发明实施例提供的单基因遗传病检测方法对受检者进行单基因遗传病检测。

参考图1所示,本发明实施例提供了一种单基因遗传病检测方法,包括步骤S110-S140,具体如下。

S110,接收基因测序装置发送的受检者的基因测序信息,该基因测序信息包括基因测序结果数据和受检者信息。

具体的,上述受检者信息包括受检者的姓名、受检者的年龄、受检者的种族、受检者的个人病史和受检者的家族病史。

其中,受检者信息可以是在使用基因测序装置检测受检者的基因测序时录入的。

上述基因测序装置可以是基因测序仪。

本发明实施例提供的单基因遗传病检测方法的执行主体可以是一种单基因遗传病检测装置或者是单基因遗传病检测平台。

上述基因测序装置与单基因遗传病检测装置通过网络建立连接,这样,基因测序装置在完成基因测序后,可以将受检者的基因测序信息发送给单基因遗传病检测装置,上述网络可以是无线保真(Wireless-Fidelity,WIFI)网络、第三代移动通信技术(3rd-Generation,3G)或者第四代移动通信(the 4Generation mobile communication technology,4G)等。

在本发明实施例中,上述基因测序结果数据可以是捕获测序数据、全外显子测序数据或者全基因组测序数据等,数据结构为Illumina平台的fastq文件或者是Ion torrent平台的bam文件。

另外,本发明实施例中的基因测序结果数据指的是人体中生殖系的基因测序结果数据。

S120,将上述基因测序结果数据与参考基因组进行比对,确定受检者的基因变异信息。

其中,上述参考基因组指的是标准基因组,对于所有的受检者均与该标准基因组进行比对。

具体的,如图2所示,上述将基因测序结果数据与参考基因进行比对,确定受检者的基因变异信息,包括步骤S210-S240,具体如下:

S210,判断上述基因测序结果数据的格式;

S220,根据上述基因测序结果数据的格式选择比对流程;

S230,采用上述比对流程将基因测序结果数据与参考基因组进行比对,确定基因测序结果数据中的基因变异信息;

S240,将基因测序结果数据中的基因变异信息确定为受检者的基因变异信息。

具体的,上述基因变异信息包括变异所在的染色体、变异在染色体上的起始物理位置、变异在染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列。

上述变异基因发生变异的种类包括单核苷酸变异、插入、缺失、插入缺失、重复、拷贝数变异等。

其中,对于不同厂家生产的基因测序装置或者不同型号的基因测序装置,得到的基因测序结果数据的格式是不同的,如果上述基因测序装置为Illumina公司的,则得到的基因测序结果数据为FASTQ格式文件,这时,需要选择与Illumina数据特征相适配的变异识别算法将基因测序结果数据与参考基因组进行比对;如果上述基因测序装置为Ion Torrent公司的,则上述基因测序结果数据为bam格式文件,这时,需要选择与Ion Torrent数据特征相适配的变异识别算法将基因测序结果数据与参考基因组进行比对;如果上述基因测序结果数据为WES或WGS格式数据,则需要选择与WES或WGS格式数据格式相适配的变异识别算法将基因测序结果数据与参考基因组进行比对。

因此,在本发明实施例中,当接收到受检者的基因测序信息后,首先判断基因测序信息中的基因测序结果数据的格式,具体的,可以根据基因测序结果数据的文件尾缀来进行判断。

在本发明实施例中,在将基因测序结果数据与参考基因进行比对时,可以将基因测序结果数据中的全部或者部分数据与参考基因组进行比对。

S130,确定受检者的基因变异信息、单基因遗传病及受检者的基因变异信息对单基因遗传病的致病等级的对应关系。

具体的,上述确定受检者的基因变异信息、单基因遗传病及受检者的基因变异信息对单基因遗传病的致病等级的对应关系,包括:

在单基因遗传病知识库中查找与受检者的变异所在的染色体、变异在染色体上的起始物理位置、变异在染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列一致的基因变异信息;从单基因遗传病知识库中获取基因变异信息所在的对应关系;将上述基因变异信息所在的对应关系确定为受检者的基因变异信息、单基因遗传病及致病等级的对应关系。

在本发明实施例中,在单基因遗传病知识库中存储有单核苷酸变异、插入、缺失、插入缺失、重复、拷贝数变异等多种基因变异信息的对应关系,比如说,受检者的基因变异信息为缺失变异信息,则将缺失变异信息的变异所在的染色体、变异在染色体上的起始物理位置、变异在染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列四个参数与单基因遗传病知识库中每个基因变异信息的上述四个参数进行比较,将单基因遗传病知识库中与缺失变异信息的上述四个参数一致的基因变异信息所在的对应关系确定为上述缺失变异信息所在的对应关系。

S140,根据上述对应关系和受检者信息生成受检者的单基因遗传病检测报告。

具体的,根据上述对应关系和受检者信息生成受检者的单基因遗传病检测包括,包括:

根据上述对应关系确定受检者的基因变异信息对应的单基因遗传病,以及受检者的基因变异信息对单基因遗传病的致病等级;将受检者的基因变异信息、受检者的基因变异信息对应的单基因遗传病、受检者的单基因遗传变异信息对单基因遗传病的致病等级和受检者信息组成单基因遗传病检测报告。

在本发明实施例中,上述单基因遗传病检测报告还包括基因测序装置的名称和基因测序装置的型号。

优选的,在本发明实施例中,当生成受检者的单基因遗传病检测报告后,可以直接将检测报告呈现在显示屏幕上,方便检测者和受检者观看。

具体的,上述受检者的检测报告可以是表格的形式,如表2所示,为其中一种可能的检测报告结果。

在表2中,S1和S2为受检者的基因变异种类,S1和S2可以是单核苷酸变异、插入、缺失、插入缺失、重复、拷贝数变异等中的任意两种,变异1对应的单基因遗传病为C1,变异1对C1的致病等级为D1,变异1对应的单基因遗传病为C1,变异2对单基因遗传病的致病等级为D2,变异3对应的单基因遗传病为C3,变异3对单基因遗传病C3的致病等级为D3。D1、D2和D3为致病、可能致病、不确定意义、可能良性和良性中的任意一种或多种。

表2

在表2中,染色体指的是变异所在的染色体,起始物理位置指的是变异在染色体上的起始物理位置,终止物理位置指的是变异在染色体上的终止物理位置。

当然,上述表2指示举例说明其中一种可能的检测报告形式,检测报告中的具体内容并不局限于此。

本发明实施例提供的单基因遗传病检测方法,实现了单基因遗传病的自动检测,避免使用人工方式进行检测,提高了检测效率和检测结果的准确性。

参考图3所示,本发明实施例还提供了一种单基因遗传病检测装置,该装置用于执行本发明实施例提供的单基因遗传病检测方法,该装置包括接收模块310、比对模块320、确定模块330和生成模块340;

上述接收模块310,用于接收基因测序装置发送的受检者的基因测序信息,上述基因测序信息包括基因测序结果数据和受检者信息;

上述比对模块320,用于将上述基因测序结果数据与参考基因组进行比对,确定受检者的基因变异信息;

上述确定模块330,用于确定受检者的基因变异信息、单基因遗传病及受检者的基因变异信息对单基因遗传病的致病等级的对应关系;

上述生成模块340,用于根据上述对应关系和受检者信息生成受检者的单基因遗传病检测报告。

具体的,上述受检者信息包括受检者的姓名、受检者的年龄、受检者的种族、受检者的个人病史和受检者的家族病史。

参考图4所示,上述确定模块330确定受检者的基因变异信息、单基因遗传病及受检者的基因变异信息对单基因遗传病的致病等级的对应关系,是通过查找单元331、获取单元332和确定单元333实现的,具体包括:

上述查找单元331,用于在单基因遗传病知识库中查找与受检者的变异所在的染色体、变异在染色体上的起始物理位置、变异在染色体上的终止物理位置、变异前的碱基序列和变异后的碱基序列一致的基因变异信息;上述获取单元332,用于从单基因遗传病知识库中获取上述基因变异信息所在的对应关系;上述确定单元333,用于将上述基因变异信息所在的对应关系确定为受检者的基因变异信息、单基因遗传病及致病等级的对应关系。

本发明实施例提供的单基因遗传病检测装置,实现了单基因遗传病的自动检测,避免使用人工方式进行检测,提高了检测效率和检测结果的准确性。

本发明实施例所提供的单基因遗传病检测装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1