一种宏基因测序结果分析方法、装置、设备及存储介质与流程

文档序号:36137926发布日期:2023-11-22 22:17阅读:57来源:国知局
一种宏基因测序结果分析方法与流程

本发明涉及一种宏基因高通量测序结果分析方法、装置、电子设备及存储介质,属于基因测序领域。


背景技术:

1、微生物是地球上分布最广泛、最丰富的一类生命体,不仅在生物地球化学循环中起到重要作用,而且也是人体内不可或缺的重要组成部分。长久以来,人们为了研究人体,陆续推动了微生物培养、单分子技术、高通量测序等技术的发展,其中高通量测序技术突破了传统生物学研究手段不能分析“不可培养微生物”的局限,并且还能够测定环境中低丰度的微生物物种。

2、现有的宏基因组测序方法,主要利用第二代高通量测序技术对环境样品中全部微小生物的基因组dna进行shoutgun测定,以分析微生物群体的遗传多样性,但是这样的处理方式在处理存在病原体数量众多的病原表单时仍然耗时耗力,在对病患进行临床治疗时不能快速提供结果,也无法发挥历史数据中各种测序记录的优势。


技术实现思路

1、本发明提供一种宏基因高通量测序结果分析方法、装置、电子设备及存储介质,其主要目的在于提高临床中基因测序分析的效率。

2、为实现上述目的,本发明提供的一种宏基因高通量测序结果分析方法,包括:

3、基于病原测序需求从历史数据中获取病原表单集,并将所述病原表单集作为初始病原表单集;

4、查询所述初始病原表单集中各个初始病原表单对应的筛选病原表单,得到筛选病原表单集,并根据所述初始病原表单集和所述筛选病原表单集构建病原筛选数据集;

5、通过所述病原筛选数据集对预设的神经网络模型进行训练,得到病原筛选网络模型;

6、将病患的当前病原表单输入所述病原筛选网络模型,获取所述当前病原表单的筛选表单;

7、从所述筛选表单中获取病原样本数据,并通过高通量测序法获取所述病患的病原样本数据的基因测序分析结果。

8、可选地,所述基于病原测序需求从历史数据中获取病原表单集,包括:

9、基于病原测序需求获取医疗系统中历史数据的访问权限,得到系统访问权限;

10、获取所述医疗系统提供的数据查询工具,并根据所述病原测序需求构建病原查询订单;

11、基于所述系统访问权限和病原查询订单,利用所述数据查询工具从历史数据中获取多个病原表单,得到病原表单集。

12、可选地,所述查询所述初始病原表单集中各个初始病原表单对应的筛选病原表单,得到筛选病原表单集,包括:

13、从所述初始病原表单集中获取一个初始病原表单,并获取所述初始病原表单的病患身份信息;

14、根据所述病患身份信息从医疗系统中获取病患的诊断记录;

15、从所述诊断记录中获取相关性排名前6的病原体数据,得到筛选病原体数据;

16、获取所述初始病原表单的表单格式,根据所述表单格式和所述筛选病原体数据构建所述筛选病原表单;

17、对所述初始病原表单集中各个初始病原表单都重复上述操作,得到所述筛选病原表单集。

18、可选地,所述通过所述病原筛选数据集对预设的神经网络模型进行训练,得到病原筛选网络模型,包括:

19、将所述病原筛选数据集划分为训练病单数据集和验证病单数据集;

20、确定所述神经网络模型的结构,并对所述神经网络模型的权重和偏置进行初始化,得到标准神经网络模型;

21、从所述训练病单数据集中获取病单训练数据,并通过所述标准神经网络对所述病单训练数据进行正向传播,得到训练筛选表单;

22、获取所述病单训练数据对应的筛选病原表单,并利用交叉熵算法计算所述训练筛选表单和所述筛选病原表单中数据的损失值;

23、利用前反馈神经网络最小化所述损失值,得到损失值最小时的模型参数,并将所述模型参数进行网络逆向传播,得到初步训练神经网络;

24、通过所述验证病单数据集对所述初步训练神经网络进行验证,并在验证通过时得到所述病原筛选网络模型。

25、可选的,所述通过高通量测序法获取所述病患的病原样本数据的基因测序分析结果,包括:

26、对所述病原样本数据进行提纯和质量检测,并在通过时得到标准样本数据;

27、判断所述标准样本数据中病原体的基因型是否为dna;

28、若所述标准样本数据中病原体的基因型为dna,则将所述病原体的dna进行切割,得到所述病原体的片段化基因;

29、若所述标准样本数据中病原体的基因型不为dna,则获取所述病原体的rna,并通过反转录合成所述病原体的cdna,切割所述病原体的cdna,得到所述病原体的片段化基因;

30、将所述片段化基因导入预设的测序平台,通过所述测序平台的测序仪器对所述片段化基因进行测序,得到所述病原体的基因组序列或转录组序列,并根据所述基因组序列和所述转录组序列得到测序序列;

31、利用已知的基因组或转录组对所述测序序列进行功能注释,得到所述病患的病原样本数据的基因测序分析结果。

32、可选地,所述从所述诊断记录中获取相关性排名前6的病原体数据,得到筛选病原体数据之前,所述方法还包括:

33、从所述诊断记录中获取所有病原体的相关型,并将所述相关性从大到小进行排序,得到病原体相关性列表。

34、可选地,所述基于病原测序需求获取医疗系统中历史数据的访问权限,得到系统访问权限之前,所述方法还包括:

35、确定所述历史数据的数据源。

36、为了解决上述问题,本发明还提供一种宏基因高通量测序结果分析装置,所述装置包括:

37、表单获取模块,用于基于病原测序需求从历史数据中获取病原表单集,并将所述病原表单集作为初始病原表单集;

38、表单筛选模块,用于查询所述初始病原表单集中各个初始病原表单对应的筛选病原表单,得到筛选病原表单集,并根据所述初始病原表单集和所述筛选病原表单集构建病原筛选数据集;

39、模型训练模块,用于通过所述病原筛选数据集对预设的神经网络模型进行训练,得到病原筛选网络模型;

40、基因测序模块,用于将病患的当前病原表单输入所述病原筛选网络模型,获取所述当前病原表单的筛选表单;从所述筛选表单中获取病原样本数据,并通过高通量测序法获取所述病患的病原样本数据的基因测序分析结果。

41、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

42、至少一种处理器;以及,

43、与所述至少一个处理器通信连接的存储器;其中,

44、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的一种宏基因高通量测序结果分析方法。

45、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的一种宏基因高通量测序结果分析方法。

46、相比于背景技术所述问题,本发明实施例基于病原测序需求从历史数据中获取病原表单集,并将病原表单集作为初始病原表单集;查询初始病原表单集中各个初始病原表单对应的筛选病原表单,得到筛选病原表单集,并根据初始病原表单集和筛选病原表单集构建病原筛选数据集;通过病原筛选数据集对预设的神经网络模型进行训练,得到病原筛选网络模型;将病患的病原表单输入病原筛选网络模型,获取当前病原表单的筛选表单;从筛选表单中获取病原样本数据,并通过高通量测序法获取病原样本数据的基因测序分析结果。在获取当前病原表单后,可以直接通过训练好的病原筛选网络模型降低当前病原表单中的病原体数量,降低数据的处理量的同时,对病患的基因测序分析结果不产生大的改变,将基因测序分析结果快速的应用到临床医疗中。因此本发明提出的一种宏基因高通量测序结果分析方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高临床中基因测序分析的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1