单基因泛癌预后分析系统及分析方法与流程

文档序号:34249573发布日期:2023-05-25 02:14阅读:65来源:国知局
单基因泛癌预后分析系统及分析方法与流程

本技术属于生物科技,具体涉及一种单基因泛癌预后分析系统及分析方法。


背景技术:

1、随着肿瘤研究的进展,研究人员发现了越来越多的基因对肿瘤的发生进展起重要作用。例如,tp53是著名的抑癌基因,它的编码产物肿瘤抑制蛋白p53能够使许多基因保持其稳定性,并调节细胞的生长、分化、衰老,被称为“基因守护者”。

2、研究人员在获取到感兴趣的基因之后,迫切需要分析该基因对肿瘤的影响,但是现有的分析服务系统至少存在以下缺点:

3、1)程序运行慢。现有的单基因流程大多以脚本形式写成,任意两次运行之间不存在联系,导致分析相同的参数运行了很多次。例如,查看tp53在肝癌中的表达差异,当用户1运行程序得到结果之后,如果用户2还需要看,则又需要运行一次,极大地降低了程序运行的效率。

4、2)整理报告慢、出错率高。当程序运行完成之后,交付给研究人员的往往需要是一份分析报告,而现有的服务系统往往是通过人工的方式书写报告的。整理的方法一般是先确定一个分析报告模板,分析人员将分析结果一个一个粘贴到报告模板里面,导致出报告慢、出错率高。

5、以上两个缺点导致在大规模分析时非常吃力,无法及时为研究人员提供及时的高质量的服务。


技术实现思路

1、为了解决现有技术中存在的至少一个技术问题,本技术提供了一种单基因泛癌预后分析系统及分析方法。

2、第一方面,本技术公开了一种单基因泛癌预后分析系统,包括:

3、分析指令生成模块,用于根据用户的选择生成至少一个子分析指令,每个所述子分析指令包含:用户选择的目标基因的基本信息、针对所述目标基因所选择的其中一种生物信息分析项目、该生物信息分析项目所涉及的至少一种分析手段,以及采用所述分析手段对所述目标基因进行分析时所对应的输入参数;

4、缓存模块,其内部同时存储有各种不同的输入参数、不同的输入参数所采用的分析手段类型数据以及最终得到的各自相对应的历史分析结果数据;

5、分析子模块,其数量和类型与所有生物信息分析项目所涉及的分析手段的数量和类型相对应,其中,每个所述分析子模块能够通过对应的分析手段对接收的输入参数进行分析,从而得到对应的分析结果数据,并且在每次分析之前,会先判断所述缓存模块中是否存储有与该输入参数及其分析手段类型相对应的历史分析结果数据,如果是,直接提取该历史分析结果数据,否则,才对该输入参数进行分析,并将最新得到的分析结果数据发送至所述缓存模块进行存储,随后提取该最新得到的分析结果数据;

6、分析项目模块,其数量和类型与所述生物信息分析项目的数量和类型相对应,其中,每个所述分析项目模块用于在接收到对应的子分析指令时,根据其中包含的分析手段的种类对分析子模块进行匹配,并将其中的输入参数输送至对应的分析子模块,最后再获取所有分析子模块提取的分析结果数据;

7、报告生成模块,用于接收所有所述分析项目模块获取的分析结果数据,并按照预定布局方式生成分析报告。

8、可选地,在所述缓存模块中,对于同一个输入参数、该输入参数所采用的分析手段类型数据以及分析得到的分析结果数据,是以一个键值对的存储方式进行存储,其中:

9、键是指模块指纹,其包括输入参数、该输入参数所采用的分析手段类型数据;

10、值是指分析得到的分析结果数据。

11、可选地,所述分析子模块在判断所述缓存模块中的是否存储有与该输入参数及其分析手段类型相对应的历史分析结果数据时,是先将该输入参数及其分析手段类型数据转换成模块指纹,通过判断所述缓存模块中的是否存储有与之相同的模块指纹,来完成判断;

12、相应的,当所述分析子模块对相应的输入参数进行分析后,是将该输入参数、该输入参数所采用的分析手段类型数据以及分析得到的分析结果数据以一个键值对的方式发送至所述缓存模块进行存储。

13、可选地,当分析结果数据包括图片和/或表格时,每个所述分析子模块中还包括:

14、第一转换模块,用于将图片的内容使用base64进行编码,再序列化为json字符串;和/或

15、第二转换模块,用于将表格转换为可序列化的数据类型,再序列化为json字符串;

16、此时,所述分析子模块是将分析结果数据转换为json字符串后的传输至缓存模块中作为对应键值对的值,且每个键值对存储为单个文件。

17、可选地,所述报告生成模块包括:

18、模板划分模块,用于将主报告模板划分为至少一个子模板,所述子模板按照预定排版模式在所述报告模板进行排版,且每个所述子模板用于呈现与对应一个分析项目模块的分析结果相关联的报告数据;

19、变量获取模块,用于通过与子模板相对应的变量,对子模板获取的分析结果数据进行计算处理,从而得到各子模板的变量的值;

20、变量构建模块,用于构建各子模板的变量,并将所述变量获取模块获得的变量的值填充至对应子模板中,作为报告数据;

21、渲染导演模块,用于对各子模板预呈现的内容进行预定的渲染处理,得到最终的分析报告,且最终的分析报告格式至少包括html格式和pdf格式。

22、可选地,所述生物信息分析项目以及相对应的分析子模块如下:

23、1)tcga泛癌队列表达差异分析项目,其对应的分析子模块包括泛癌单基因差异表达模块;

24、2)tcga泛癌队列基因表达的预后效能分析项目,其对应的分析子模块包括泛癌单基因生存模块;

25、3)tcga泛癌队列基因表达与分子机制的相关性分析项目,其对应的分析子模块包括单样本富集分析模块、泛癌单基因得分相关性模块、cibersortmodule、mcpcountermodule、xcellmodule;

26、4)tcga泛癌队列突变对预后的影响分析项目,其对应的分析子模块包括泛癌单基因snv生存模块;

27、5)免疫治疗队列表达差异分析项目,其对应的分析子模块包括基因表达模块;

28、6)免疫治疗队列基因预后效能分析项目,其对应的分析子模块包括泛癌单基因生存模块;

29、7)免疫治疗队列基因表达与免疫治疗效果的相关性分析项目,其对应的分析子模块包括泛癌单基因免疫治疗相关性模块;

30、8)验证队列表达差异分析项目,其对应的分析子模块包括基因表达模块;

31、9)验证队列预后效能分析项目,其对应的分析子模块包括基因生存模块。

32、第二方面,本技术还公开了一种单基因泛癌预后分析方法,包括如下步骤:

33、步骤一、根据用户的选择生成至少一个子分析指令,每个所述子分析指令包含:用户选择的目标基因的基本信息、针对所述目标基因所选择的其中一种生物信息分析项目、该生物信息分析项目所涉及的至少一种分析手段,以及采用所述分析手段对所述目标基因进行分析时所对应的输入参数;

34、步骤二、将各子分析指令发送至对应的分析项目模块,各分析项目模块根据子分析指令中包含的分析手段的种类对分析子模块进行匹配,并将其中的输入参数输送至对应的分析子模块;

35、其中,分析项目模块的数量和类型与所述生物信息分析项目的数量和类型相对应;

36、步骤三、所匹配的每个分析子模块在接收到相应的输入参数时,首先判断缓存模块中的是否存储有与该输入参数及其分析手段类型相对应的分析结果数据,如果是,进行步骤四,否则进行步骤五;

37、其中,所述分析子模块的数量和类型与所有生物信息分析项目所涉及的分析手段的数量和类型相对应;以及

38、所述缓存模块中同时存储有各种不同的输入参数、不同的输入参数所采用的分析手段类型数据以及最终得到的各自相对应的分析结果数据;

39、步骤四、所述分析子模块提取缓存模块中对应的分析结果数据;

40、步骤五、所述分析子模块采用相应分析手段对该输入参数进行分析,并将最新得到的分析结果数据发送至所述缓存模块进行存储,随后提取该最新得到的分析结果数据;

41、步骤六、各分析项目模块获取其包含的所有分析子模块提取的分析结果数据;

42、步骤七、通过报告生成模块将所有分析项目模块获取的分析结果数据按照预定布局方式生成分析报告。

43、可选地,在所述步骤五中,所述分析子模块是将同一个输入参数、该输入参数所采用的分析手段类型数据以及分析得到的分析结果数据,以一个键值对的存储方式传输至缓存模块进行存储,其中:

44、键是指模块指纹,其包括输入参数、该输入参数所采用的分析手段类型数据;

45、值是指分析得到的分析结果数据,其包括图片和/或表格;

46、相应的,在此步骤中,还包括所述分析子模块对分析结果数据的如下处理步骤:

47、当分析结果数据为图片时,将图片的内容使用base64进行编码,再序列化为json字符串;

48、当分析结果数据为表格时,将表格转换为可序列化的数据类型,再序列化为json字符串;以及

49、当分析结果数据为图片和表格的组合时,分别采用上述图片和表格的处理方式进行处理;以及

50、将最后得到的json字符串的传输至缓存模块中作为对应键值对的值,且每个键值对存储为单个文件。

51、可选地,在所述步骤三中,所述分析子模块是先将相应的输入参数及其分析手段类型数据转换成模块指纹,通过判断所述缓存模块中的是否存储有与之相同的模块指纹,从而判断缓存模块中的是否存储有相对应的分析结果数据;

52、相应的,在所述步骤五中,所述分析子模块是将相应输入参数、该输入参数所采用的分析手段类型数据以及分析得到的分析结果数据,以一个键值对的方式发送至所述缓存模块进行存储。

53、可选地,所述步骤七包括如下子步骤:

54、步骤7.1、将主报告模板分为至少一个子模板,其中,所述子模板按照预定排版模式在所述报告模板进行排版,且每个所述子模板用于呈现与对应一个分析项目模块的分析结果相关联的报告数据;

55、步骤7.2、通过与子模板相对应的变量,对子模板获取的分析结果数据进行计算处理,从而得到各子模板的变量的值;

56、步骤7.3、构建各子模板的变量,并将所述变量获取模块获得的变量的值填充至对应子模板中,作为报告数据;

57、步骤7.4、对各子模板预呈现的内容进行预定的渲染处理,得到最终的分析报告,且最终的分析报告格式至少包括html格式和pdf格式。

58、本技术至少存在以下有益技术效果:

59、1)本技术的单基因泛癌预后分析系统及分析方法,对用户的指令进行多维度分解后生成至少一个子分析指令;另外,每个分析项目模块中的各个分析子模块在对输入的输入参数采用相应的分析手段进行分析之前,若判断缓存模块中存储有相应的历史分析结果数据,则直接提取该历史分析结果数据,从而能够省略该生物信息分析步骤,以提高分析效率;并且,当分析项目模块以及其分析子模块数量越多时,分析效率提高的效果越明显;进一步,随着系统的使用,缓存模块中存储的历史数据量会不断增加,同样能够增加后续使用者匹配到历史分析结果数据的概率,从而提高分析效率;

60、2)本技术的单基因泛癌预后分析系统及分析方法中,每个基因的相关分析数据是以一个键值对的存储方式进行存储,再加上作为键的模块指纹的设置,最终使得分析结果数据的存储和提取更加方便快捷,同样能够提高分析效率;

61、3)本技术的单基因泛癌预后分析系统及分析方法中,通过将分析结果数据中的图片和/或表格转换为字符串,从而便于将每个键值对存储为单个文件,方便存储、识别和提取,显著提高了分析处理效率和准确率;

62、4)本技术的单基因泛癌预后分析系统及分析方法中,将主报告模板分为至少一个子模板,每个子模板最终呈现的报告数据又与对应一个分析项目模块的分析结果相关联,从而能够实现自动渲染报告,提高报告生成速度,减少出错率。

63、术语定义或解释:

64、tcga泛癌队列表达差异分析:thecancergenome atlas(tcga)数据库提供33种肿瘤共计1万多例患者的组织的高通量芯片或者测序的数据,这里是针对33种肿瘤和正常表达谱数据分析研究基因的转录组表达差异;

65、tcga泛癌队列基因表达:研究基因在tcga数据库中33种肿瘤中的转录组表达量;

66、cibersortmodule:cibersortmodul是一款使用基因表达数据可计算不铜细胞类型丰度的工具;

67、mcpcountermodule:mcpcountermodul是一个r包,可以利用转录组数据量化8个免疫细胞和2个基质细胞的绝对丰度;

68、xcellmodule:xcellmodule是一个基于表达谱数据推测bulkrna样本中细胞类型丰度的r包;

69、tcga泛癌队列突变:tcga数据库33种肿瘤基因组数据,研究基因的体细胞突变情况;

70、泛癌单基因snv生存模块:tcga数据库33种肿瘤基因组数据,研究基因snv突变与野生型生存差异;

71、免疫治疗队列表达差异:使用了免疫治疗的转录组队列中耐药和敏感组间研究基因的表达差异情况;

72、免疫治疗队列基因预后:使用了免疫治疗的转录组队列中研究基因表达对疾病免疫治疗预后的影响。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1