微生物集富集的分析方法、分析装置和计算机介质与流程

文档序号:30309725发布日期:2022-06-05 10:25阅读:252来源:国知局
微生物集富集的分析方法、分析装置和计算机介质与流程

1.本公开涉及生物信息学的技术领域,更具体地,涉及微生物信息尤其是微生物集富集的分析方法、分析装置和计算机介质。


背景技术:

2.研究发现,共生的微生物组(微生物集)能够通过调节宿主生理功能(如机体免疫、物质代谢等)来影响宿主的各种表型特征,其中很多表型与多种人类复杂疾病的发生和发展有关。宿主-微生物组的相互作用通过微生物集或单个微生物的改变而发生作用。
3.微生物能通过调节基因表达或相关宿主细胞/组织中的细胞信号传导来影响宿主表型,但微生物影响宿主生理功能的调节机制尚不清楚。目前一些研究表明,可通过微生物代谢物实现这种宿主-微生物组的相互作用,而宿主免疫系统会受到肠道微生物组中的微生物代谢产物的调控。
4.虽然人们也进行了一些研究,例如但不限于人类功能基因组计划(hfgp),试图得出微生物组在细胞水平上的作用机制,但这些研究通常依赖大量的实验和资源投入,并且易出现经验偏差,所得出的作用机制也比较有限。例如,在hfgp中对500名荷兰健康成年人的研究发现,肠道微生物组特征与各种细胞因子的产量有关:在研究中通过实验验证了两种微生物代谢物,即三酚和棕榈油酸,能够分别调节外周血单核细胞中ifnγ和tnfγ的产量。在进一步研究中,还将微生物衍生的代谢产物抗坏血酸鉴定为活化的cd4+效应t细胞(包括产生il-17a-,il-4-和ifn4的细胞)的选择性抑制剂。
5.虽然人们建立了一些根据人类疾病中微生物组的组成差异而分类的数据库,例如disbiome,其涵盖了674项已发表研究中的190种人类疾病和800种微生物,其中也包含了基于基因组、蛋白家族和物种分类信息对微生物进行分类的数据库。但是,并未系统性地研究这些疾病可能经由微生物作用于哪些人类基因以及作用机制。随着微生物组研究的快速发展,虽然能够通过差异丰度分析确定与人类疾病相关的微生物物种,但现有研究需要大量的人力介入和资源投入,建立的数据库都是相对孤立的,缺乏结构化知识,也不能高效、系统性地利用研究成果的最新相关公开信息,导致针对各种疾病的微生物集富集分析滞后且受到较大限制。


技术实现要素:

6.提供了本公开以解决现有技术中存在的上述问题。
7.本公开旨在提供一种由计算机实现的微生物集富集的分析方法、分析装置、分析系统和计算机介质,其能够高效且系统性地利用微生物的研究成果的相关公开信息,来确定各个属和种下的微生物与人类基因之间的显著关联信息,该显著关联信息可以进行结构化处理以生成微生物集知识库,从而便利各种疾病经由特异性微生物群落作用于基因的机制分析。
8.根据本公开的第一方案,提供了一种微生物集富集的分析方法。所述分析方法包
括接收用户输入的待分析的微生物集。该分析方法还包括由第一处理器,利用第二微生物集知识库确定所述待分析的微生物集的富集信息,所述富集信息包括相关联的人类基因及显著性参数。其中,所述第二微生物集知识库基于微生物分类的第一微生物集知识库并结合显著的微生物与人类基因之间的关联信息来生成。所述分析方法还包括由所述第一处理器,根据所述显著性参数对所述相关联的人类基因进行排序。
9.根据本公开的第二方案,提供了一种微生物集富集的分析装置,该分析装置包括第一接口和第一处理器。所述第一接口可以配置为接收用户输入的待分析的微生物集。第一处理器可以配置为:利用第二微生物集知识库确定所述待分析的微生物集的富集信息,所述富集信息包括相关联的人类基因及显著性参数。其中,所述第二微生物集知识库基于微生物分类的第一微生物集知识库并结合显著的微生物与人类基因之间的关联信息来生成。所述第一处理器还可以配置为根据所述显著性参数对所述相关联的人类基因进行排序。
10.根据本公开的第三方案,提供了一种微生物集富集的分析系统。该分析系统可以包括根据本公开各个实施例的分析装置、第二接口、第三接口、第二处理器和第三处理器。第二接口可以配置为:从针对细菌界和古菌界的16srrna基因的数据库获取微生物的属和种的名称。第三接口可以配置为获取微生物系统发育树。第二处理器可以配置为:基于所获取的微生物的属和种的名称,从公共文献数据库的文献摘要中查询对应的摘要列表;从查询到的摘要列表中识别人类基因信息,并确定微生物与人类基因之间的关联信息;以及确定微生物与人类基因之间的各条关联信息的关联强度,据此对各条关联信息进行筛选,以确定显著的微生物与人类基因之间的关联信息。第三处理器可以配置为:基于获取的微生物系统发育树构建有向无环图;以及基于所述有向无环图构建微生物分类的第一微生物集知识库。
11.利用根据本公开各个实施例的微生物集富集的分析方法、分析装置、分析系统和计算机介质,能够高效且系统性地利用微生物的研究成果的相关公开信息,精确地进行各种疾病经由特异性微生物群落作用于基因的机制分析。
附图说明
12.在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
13.图1示出根据本公开实施例的微生物集富集的分析方法的第一示例的流程图;
14.图2(a)示出根据本公开实施例的基于公共文献数据库的公开信息确定的微生物与人类基因之间的显著关联信息的处理的流程图;
15.图2(b)示出对确定的微生物与人类基因之间的显著关联信息的通过t-sne可视化的评估结果的图示;
16.图3示出根据本公开实施例的构建微生物分类的第一微生物集知识库的处理的流
程图;
17.图4示出根据本公开实施例的微生物集富集的分析方法的第二示例的流程图;
18.图5示出将帕金森病患者和健康人的粪便分别植入野生型小鼠和asyn超表达小鼠体内的具有差异丰度的微生物的对比图示;
19.图6示出根据本公开实施例的微生物集富集的分析装置的框架示意图;以及
20.图7示出根据本公开实施例的微生物集富集的分析系统的配置示意图。
具体实施方式
21.为使本领域技术人员更好的理解本公开的技术方案,下面结合附图和具体实施方式对本公开作详细说明,但不作为对本公开的限定。注意,在本公开使用措辞“第一”、“第二”和“第三”仅仅用于区分,并不旨在限定数量或者功能。
22.图1示出根据本公开实施例的微生物集富集的分析方法的第一示例的流程图。如图1所示,该分析方法始于步骤101:接收用户输入的待分析的微生物集。该待分析的微生物集可以是一组预定义的微生物集,例如但不限于疾病相关联的微生物集、疾病的特异性微生物集以及疾病与其他疾病或者健康状态的宿主具有差异丰度的微生物集中的任何一种或多种。在一些实施例中,该待分析的微生物集可以由用户根据先验知识来自定义。在一些实施例中,该待分析的微生物集也可以预先根据对各种疾病与微生物的关联信息的研究成果或公布信息等针对各种疾病建立,并通过界面经由菜单等呈现给用户,使得用户可以通过选择关注的疾病而输入待分析的微生物集,如此用户无需掌握各种疾病与微生物的关联信息,即可以对关注疾病实施自动化的微生物集富集的分析,用户友好度较高,而且利于保持不同用户对于同个关注疾病的富集分析结果的一致性和鲁棒性。上述的先验知识、研究成果获公布信息例如但不限于disbiome数据库,其包含人类疾病中微生物组的组成差异信息。
23.在步骤102,可由第一处理器,利用第二微生物集知识库确定所述待分析的微生物集的富集信息,所述富集信息可以包括相关联的人类基因及显著性参数。其中,所述第二微生物集知识库基于微生物分类的第一微生物集知识库并结合微生物与人类基因之间的显著的关联信息来生成,从而提供了各种物种分类的微生物如何作用于人类基因的结构化知识。
24.在步骤103,可由所述第一处理器,根据所述显著性参数对所述相关联的人类基因进行排序。在一些实施例中,所述显著性参数可以包括p值、q值以及or值中的至少一种,还可以基于至少两种值的结合来得到结合得分c,并基于结合得分对所述相关联的人类基因进行排序。在一些实施例中,微生物与人类基因之间的显著的关联信息可能存在对各个人类基因的关注度偏差,例如,作为该显著的关联信息的计算基础的数据来源,例如但不限于公共文献数据库等,自身存在对各个人类基因的关注度偏差,则可以基于对各个人类基因的关注度偏差确定校正值。相应地,可以基于所述显著性参数和所述校正值确定富集参数;再基于所确定的富集参数对所述相关联的人类基因进行排序。如此,可以纠正由于对各个人类基因的关注度偏差所导致的富集参数的偏差,从而得到更准确的富集参数。
25.通过根据本公开各个实施例的微生物集富集的分析方法,提供了各种物种分类的微生物如何作用于人类基因的更准确和全面的结构化知识,基于疾病所关联的微生物组群
落特征自动推断基因级别的致病机制,且通过包括相关联的人类基因及显著性参数的富集信息能够准确且定量地解释各种物种分类的微生物对宿主表型的影响。
26.图2(a)示出根据本公开实施例的基于公共文献数据库的公开信息确定的微生物与人类基因之间的显著关联信息的处理的流程图。如图2(a)所示,在步骤201,从针对细菌界和古菌界的16s rrna基因的数据库获取微生物的属和种的名称。例如,针对细菌界和古菌界的16s rrna基因的数据库可以采用greengenes数据库,但不限于此。本公开中以greengenes数据库为例进行说明,但本公开基于greengenes数据库的说明也可转用于其他的针对细菌界和古菌界的16s rrna基因的现有数据库,例如silva数据库,在此不赘述。可以解析greengenes数据库的分类信息,从而获得细菌界和古菌界的1,085个微生物的属和种的名称。
27.在步骤202,由第二处理器,基于所获取的微生物的属和种的名称,从公共文献数据库的文献摘要中查询对应的摘要列表。在一些实施例中,公共文献数据库可以包括pubmed数据库,但不限于此,也可以采用例如web of science等,只要其中的文献中记载与人类基因的关联微生物的研究成果即可。文献摘要通常记载了文献的核心研究成果,例如,该研究成果如果涉及微生物与人类基因之间的关联信息,则通常摘要中会记载微生物的名称和人类基因的名称,且数据量只占文献的总数据量的很小部分,从而显著提高了查询工作的效率同时也确保了查询结果的针对性。例如,可以使用geneshot从pubmed摘要的属和种水平上查询greengene分类中标准微生物名称,从而返回相关摘要列表。
28.在步骤203,由第二处理器,从查询到的摘要列表中识别人类基因信息,并确定微生物与人类基因之间的关联信息。在一些实施例中,可以从查询到的摘要列表中经由命名实体识别(ner)工具(例如但不限于tagger等)来识别人类基因信息,并将所识别的人类基因信息基于人类基因组数据库(hgnc)的人类基因名称规范化,从而确定微生物与规范化的人类基因之间的关联信息。可以使用该方法,查询并记录其中的至少返回一次的970个微生物物种名称,一共识别到8,865种不同的人类基因。
29.在步骤204,由所述第二处理器,确定微生物与人类基因之间的各条关联信息的关联强度,并在步骤205,对各条关联信息进行筛选,以确定微生物与人类基因之间的显著的关联信息。在一些实施例中,可以通过将关联强度与阈值进行比较,以去除偶然发现的关联,即删除非显著性的关联,从而得到微生物与人类基因之间的显著的关联信息。
30.在一些实施例中,微生物与人类基因之间的各条关联信息的关联强度通过如下公式(1)来计算:
[0031][0032]
其中,i为微生物的序号,j为人类基因的序号,为集合的大小。
[0033]
在一些实施例中,筛选结果显示,可以获得42,944个微生物-基因关联对,涵盖752个微生物和2,045个人类基因。其中,与微生物最紧密相关的人类基因是人体免疫和炎症反应相关基因,如编码包括tnf、il10和il6在内的细胞因子的基因,以及与先天性免疫反应有关的基因,如toll样受体(tlr)和先天免疫信号转导接头myd88(参见如下的表1)。
[0034]
表1:pubmed数据库中与微生物紧密相关的人类基因统计表
[0035][0036][0037]
此外,在免疫中没有明显作用的基因也显示出与许多微生物关联,如原癌基因fos和凋亡相关的半胱氨酸蛋白酶casp3。此外,通过根据本公开的基于pubmed数据库的公开摘要信息确定的微生物与人类基因之间的显著关联信息的处理,还发现与人类基因关联最密
切的微生物的属和种,包括模式微生物(如大肠杆菌和酿酒酵母),常见的共生细菌(例如金黄色葡萄球菌和乳杆菌)以及著名的微生物病原体(例如小肠沙门氏菌,铜绿假单胞菌和幽门螺杆菌)(参见如下的表2)。
[0038]
表2:pubmed文献中与人类基因最紧密相关的微生物统计表
[0039][0040]
[0041]
在一些实施例中,使用t-sne机器学习算法,对所得到的微生物-人类基因之间的显著的关联关系信息进行降维,从而基于它们对人类基因的潜在功能关联谱,推导相关微生物属和种。通过将门类信息标识到t-sne上,获得同一门水平的几种微生物簇,如硬毛菌和变形杆菌,如图2(b)所示。可以看到,与同一人类基因相关联的微生物集比随机物种在某些分类进化分枝(例如门水平)中更显著地富集,从而证实了根据本公开各种实施例的处理所得到的微生物-人类基因之间的显著的关联关系的良好质量。
[0042]
图3示出根据本公开实施例的构建微生物分类的第一微生物集知识库的处理的流程图。如图3所示,在步骤301,获取微生物系统发育树。在步骤302,由第三处理器,基于获取的微生物系统发育树构建有向无环图。在步骤303,由所述第三处理器,基于所述有向无环图构建微生物分类的第一微生物集知识库。
[0043]
在一些实施例中,在步骤301,可以下载针对细菌界和古菌界的16s rrna基因的数据库,例如但不限于greengenes数据库。在一些实施例中,可以采用与微生物-人类基因之间的显著的关联关系所使用的针对细菌界和古菌界的16s rrna基因的数据库相同的数据库,以便使得构建的第一微生物集知识库与所述显著的关联关系匹配度更好,能够提高基于第一微生物集知识库并结合显著的关联信息来生成第二微生物集知识库的处理效率。下面以greengenes数据库为例进行说明。
[0044]
可以对greengenes数据库中的系统发育树进行过滤,由于本公开主要关注来自16s rdna数据,因此可以从系统发育树中滤除两个界,即病毒和类病毒界,从而得到微生物系统发育树。在一些实施例中,还可以删除包括“_noname”和“_unclassified”的后缀,以便规范greengenes数据库中描述微生物的字符串。
[0045]
在一些实施例中,在步骤302,可以利用过滤后的微生物系统发育树来构建有向无环图(dag)。例如,可以基于dag算法来构建,例如可以使用greengenes数据库中各分类水平(不包括株水平,在株水平以上)的各分类水平的分类单元作为dag的节点。
[0046]
在一些实施例中,在步骤303,可以通过枚举来自各个物种分类水平的父节点的所有叶节点,将微生物系统发育树转换为微生物集的集合,从而构建了基于物种分类学的第一微生物集知识库。在另外一些实施例中,还可以采用其他方法将微生物系统发育树转换为微生物集的集合,例如但不限于基于参考基因组的序列对比来实现。
[0047]
图4示出根据本公开实施例的微生物集富集的分析方法的第二示例的流程图。该分析方法主要分为三部分,构建微生物分类的第一微生物集知识库的第一处理401、基于公共文献数据库的公开信息确定微生物与人类基因之间的显著的关联信息的第二处理402以及基于用户输入的待分析的微生物集来确定所述待分析的微生物集的富集信息并进行相应的排序的第三处理403。第一处理401可以采用根据本公开各种实施例的构建微生物分类的第一微生物集知识库的处理,第二处理402可以采用根据本公开各种实施例的基于公共文献数据库的公开信息确定的微生物与人类基因之间的显著关联信息的处理,在此不赘述。
[0048]
第三处理403始于步骤404,接收用户输入的待分析的微生物集。在一些实施例中,在步骤404还可以接收第二微生物集知识库,该第二微生物集知识库基于微生物分类的第一微生物集知识库并结合显著的微生物与人类基因之间的关联信息来生成。在一些实施例中,第三处理403可以包含第二微生物集知识库的生成步骤,例如,接收来自第一处理401的
微生物分类的第一微生物集知识库以及来自第二处理402的微生物与人类基因之间的显著的关联信息,并对两者进行结合,从而生成所述第二微生物集知识库。
[0049]
在步骤405,利用第二微生物集知识库对待分析的微生物集中的每种微生物注释背景信息(包括与之紧密关联的人类基因等),对已经注释有背景信息的每种微生物进行独立迭代检验,以得到富集信息,所述富集信息包括相关联的人类基因及显著性参数。在一些实施例中,独立迭代检验可以采用诸如fisher检验方法,但不限于此,还可以采用诸如stouffer检验方法的检验方法。在一些实施例中,该显著性参数包括但不限于p值,迭代次数例如可以是大约1,000次-2,000次等。
[0050]
可以对p值进行矫正得到q值(也可以得到or值,未图示)。在一些实施例中,可以使用例如p值(或者q值、or值等)来对所述相关联的人类基因进行排序。在一些实施例中,也可以基于p值、q值和or值中的至少两种来计算总得分c(步骤406),并基于总得分c来对所述相关联的人类基因进行排序(步骤407)。
[0051]
总得分c可以采用多种计算方法。例如,可以采用与基因富集分析软件(enrichr)相同的算法来计算预期等级偏差的z得分。可以将fisher检验所得到的p值与预期等级偏差z得分相结合,来得到总得分c。例如,可以根据公式(2)来计算总得分。
[0052]
c=log
10
(p)
·zꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(2)
[0053]
通过引入预期等级偏差z得分,能够对诸如fisher检验等对大样本集的偏差进行有效纠正。
[0054]
通过将根据本公开各种实施例的微生物集富集的分析方法应用于disbiome数据库,充分证实了该分析方法的良好效果,处理时间可控制在两小时内,自动分析的结果与最近一些相关文献报道的特定疾病与基因的关联性研究成果充分吻合。
[0055]
例如,通过将根据本公开各种实施例的微生物集富集的分析方法应用于disbiome数据库,自动地发现了几种以微生物为中介的疾病-基因关联,参见表3。
[0056]
表3:基于disbiome数据库的富集分析所识别的主要基因-疾病关联表
[0057][0058]
一项显著的成果是,发现非酒精性脂肪肝病(nafld)与srebf1和lpl基因相关微生物的显著富集(参见表3)。srebf1是肝脏中胆固醇和脂肪酸合成的已知调节剂,可编码固醇调节元件结合转录因子,srebf1的过表达被证明可引起小鼠nafld。脂蛋白脂肪酶(lpl)则在nafld的病理生理学中发挥作用:脂蛋白代谢是肝细胞脂质稳态的主要途径。该显著富集分析结果也得到了最近针对非酒精性脂肪性肝炎的研究的验证,后者发现,肝脏星状细胞中lpl的上调也被证明会加剧非酒精性脂肪性肝炎(nash)的肝纤维化,后者可被视为nafld的亚型。因此,那些同时与srebf1和lpl相关的微生物在nafld患者中出现的异常丰度值得进一步研究。
[0059]
另一项显著的成果是在克罗恩病(一种炎症性肠病(ibd))患者中发现与atg16l1、ccl11和fut2基因的相关微生物的显著富集。可据此推测这些微生物与克罗恩病的病理学有关。这一显著富集分析结果与健康对照组的比较生物实验结果相吻合,在与健康对照组进行比较生物实验时发现,克罗恩病患者血清中的ccl11含量显著升高,其是一种嗜酸性粒细胞特异性趋化因子,且已证明其是结肠中嗜酸性粒细胞募集的主要介质。这一显著富集分析结果也与岩藻糖基转移酶2(fut2)的最近研究结果相吻合,其遗传多态性与来自不同人群的多项独立的全基因组关联研究中的克罗恩病有关。另外,这一显著富集分析结果也得到了最近针对克罗恩病的研究文献的证实,后者充分阐明了自噬相关的16like 1(atg16l1)在克罗恩病中的作用。因此,与上述三类物质有关的微生物可能在克罗恩病的发生发展中起到关键作用。
[0060]
由此可见,根据本公开实施例的微生物集富集的分析方法不仅能够回溯人类基因与人类疾病之间的关系,特别是对于代谢紊乱性疾病,如nafld、克罗恩病等,这进一步证实了宿主-微生物组相互作用是由微生物代谢产物介导的假设。根据本公开实施例的微生物
集富集的分析方法还可能在实际生物实验之前,提前全面地找到与各种人类疾病(例如nafld)有关的人类基因,反映了肠道微生物组在炎症性肠病发生发展中的不可或缺作用,从而为后续生物实验研究提供有益的参考。
[0061]
进一步地,根据本公开实施例的微生物集富集的分析方法在帕金森病(pd)病理研究上也取得了突出的成果。
[0062]
对pd病人和健康人的16s微生物组数据进行重新分析,并对两组人群具有差异丰度的微生物,利用根据本公开实施例的微生物集富集的分析方法,进行微生物集富集分析。具体说来,可以首先从qiita下载了16s数据集(项目id:10483)。然后,通过应用ancom下载之前报道中将pd患者和健康人的粪便分别植入野生型的小鼠和asyn超表达的小鼠体内的da(差异丰度)微生物信息(如图5所示,其中,浅灰色的是asyn超表达,深灰色的是野生型),并以这些da微生物信息作为输入。之后,基于所述第二微生物集知识库,使用微生物集富集分析对与pd相关的da微生物富集的人类基因进行排序。
[0063]
在da富集的基因中(如表4所示),发现了一些免疫相关的基因,如il10,foxp3、defb4a、ccl2和ccr2。
[0064]
表4.将pd和健康人粪便植入小鼠体内的da微生物进行富集分析所找到的主要人类基因
[0065][0066]
这表明,pd中的da微生物可通过调节参与各种类免疫应答的基因来影响免疫系统,这与2016年sampson等人经由生物实验对pd的研究中肠道菌群影响pd小鼠模型中的神经免疫应答的发现一致。
[0067]
还利用根据本公开实施例的微生物集富集的分析方法研究了pd患者大脑中两种
表达升高的促炎细胞因子的富集,包括肿瘤坏死因子-α(tnf-α)和白细胞介素-6(il-6),发现il-6有少量da微生物富集(p值=9.7e-3;综合得分=4.42)。该结果表明,pd中微生物含量的改变有可能上调促炎性细胞因子,如il-6,从而诱导pd的神经炎症状态。
[0068]
为了进一步研究da微生物富集的主要基因的聚集效应在神经炎症中所发挥的作用,还使用enrichr进行基因功能富集分析,发现这些基因在小胶质细胞相关基因中显著富集(p值=5.8e-6),这与2016年sampson等人经由生物实验对pd的研究中的发现一致:pd具有特异性的肠道微生物群落,且肠道微生物群落调节小胶质细胞活化。
[0069]
在对数据集的重新分析中,根据本公开的微生物集富集的分析方法可以应用于pd的da微生物,从而找到与微生物集富集相关的人类基因,这其中许多与免疫相关。该结果表明肠道微生物组在神经免疫反应中的重要作用。同时,基因功能富集分析发现,许多人类基因都参与了小胶质细胞的发育,这与经过大量动物实验的各种研究的最终发现一致。
[0070]
图6示出根据本公开实施例的微生物集富集分析装置600的框架示意图。如图6所示,该微生物集富集分析装置600可以包括通信接口601和第一处理器602。该通信接口601可以配置为:接收用户输入的待分析的微生物集。所述第一处理器602可以配置为:利用第二微生物集知识库确定所述待分析的微生物集的富集信息;所述富集信息包括相关联的人类基因及显著性参数;以及根据所述显著性参数对所述相关联的人类基因进行排序。其中,所述第二微生物集知识库是基于微生物分类的第一微生物集知识库并结合显著的微生物与人类基因之间的关联信息来生成的。
[0071]
在一些实施例中,通信接口601可以包括网络适配器、电缆连接器、串行连接器,usb连接器、并行连接器、高速数据传输适配器(诸如光纤、usb3.0、雷电接口等)、无线网络适配器(诸如wifi适配器)、电信(3g、4g/lte等)适配器等。微生物集富集分析装置600可以通过通信接口601连接到其他构件。
[0072]
在一些实施例中,微生物集富集分析装置600可以通过通信接口601连接到图7中示出的微生物-人类基因关联信息确定装置606、第一微生物集知识库构建装置等,以便相应地接收微生物-人类基因的显著关联信息以及第一微生物集知识库。相应地,所述第一处理器602可以进一步配置为:基于微生物分类的第一微生物集知识库,结合显著的微生物与人类基因之间的关联信息,来生成第二微生物集知识库。
[0073]
在一些实施例中,所述通信接口601可以配置为接收现成的第二微生物集知识库。
[0074]
在一些实施例中,所述通信接口601可以配置为从针对细菌界和古菌界的16s rrna基因的数据库获取微生物的属和种的名称并且获取微生物系统发育树。相应地,所述第一处理器602可以配置为:基于所获取的微生物的属和种的名称,从公共文献数据库的文献摘要中查询对应的摘要列表;从查询到的摘要列表中识别人类基因信息,并确定微生物与人类基因之间的关联信息;确定微生物与人类基因之间的各条关联信息的关联强度,据此对各条关联信息进行筛选,以确定显著的微生物与人类基因之间的关联信息。在一些实施例中,所述第一处理器602可以进一步配置为:基于获取的微生物系统发育树构建有向无环图;基于所述有向无环图构建微生物分类的第一微生物集知识库;以及基于微生物分类的第一微生物集知识库,结合显著的微生物与人类基因之间的关联信息,来生成所述第二微生物集知识库。
[0075]
如图6中所示,医学图像检测装置400可以包括通信接口601、第一处理器602、内存
603、储存器604和显示器605。
[0076]
在一些实施例中,第一处理器602可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(cpu)、图形处理单元(gpu)等。更具体地,该处理器可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。该处理器还可以是一个以上专用处理设备,诸如专用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)、片上系统(soc)等。第一处理器602可以通信地耦合到内存603并且被配置为执行存储在其上的计算机可执行指令,以执行诸如根据本公开各实施例的微生物集富集的分析方法的各个步骤。在一些实施例中,根据本公开各实施例的微生物集富集的分析方法也可以通过在储存器604上存储的程序来实现,这些程序可以加载到内存603以由第一处理器602执行。
[0077]
在一些实施例中,内存603/储存器604可以是非暂时性计算机可读的介质,诸如只读存储器(rom)、随机存取存储器(ram)、相变随机存取存储器(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、电可擦除可编程只读存储器(eeprom)、其他类型的随机存取存储器(ram)、闪存盘或其他形式的闪存、缓存、寄存器、静态存储器、光盘只读存储器(cd-rom)、数字通用光盘(dvd)或其他光学存储器、盒式磁带或其他磁存储设备,或被用于储存能够被计算机设备访问的信息或指令的任何其他可能的非暂时性的介质等。
[0078]
在一些实施例中,储存器604可以储存在根据本公开各实施例的微生物集富集的分析方法中出现的各种数据,例如但不限于:第二微生物集知识库;针对细菌界和古菌界的16s rrna基因的数据库,微生物分类的第一微生物集知识库,微生物与人类基因之间的显著的关联信息,查询到的摘要列表,微生物系统发育树,显著性参数,相关联的疾病等等。
[0079]
在一些实施例中,第一处理器602可以进一步配置为在显示器605上呈现相关联的人类基因及其排序、相应的至少一种显著性参数和/或其他数据的可视化。显示器605可以包括液晶显示器(lcd)、发光二极管显示器(led)、等离子显示器或任何其他类型的显示器,并提供显示器上呈现的图形用户界面(gui)用于用户输入和图像/数据显示。
[0080]
图7示出根据本公开实施例的微生物集富集的分析系统的配置示意图,其中与图6所示的配置相同的部分不再赘述。如图7所示,该系统可以包括微生物-人类基因关联信息确定装置606、第一微生物集知识库构建装置608和微生物集富集分析装置600。其中,微生物-人类基因关联信息确定装置606可以包括第二处理器607,而第一微生物集知识库构建装置608可以包括第三处理器609。
[0081]
在一些实施例中,第二处理器607可以配置为:从针对细菌界和古菌界的16s rrna基因的数据库获取微生物的属和种的名称;基于所获取的微生物的属和种的名称,从公共文献数据库的文献摘要中查询对应的摘要列表;从查询到的摘要列表中识别人类基因信息,并确定微生物与人类基因之间的关联信息;以及确定微生物与人类基因之间的各条关联信息的关联强度,据此对各条关联信息进行筛选,以确定显著的微生物与人类基因之间的关联信息。在一些实施例中,第三处理器609可以配置为:获取微生物系统发育树;基于获取的微生物系统发育树构建有向无环图;以及基于所述有向无环图构建微生物分类的第一微生物集知识库。
[0082]
微生物-人类基因关联信息确定装置606、第一微生物集知识库构建装置608可以
采用与微生物集富集分析装置600相似的配置,在此不赘述。虽然图7中以分立的第一处理器602、第二处理器607和第三处理器609为示例进行说明,但本公开不限于此。在一些实施例中,第一处理器602、第二处理器607和第三处理器609也可以整合,相应地,整个系统可以整合到单个微生物集富集分析装置600来实现。
[0083]
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本公开的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本技术的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
[0084]
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本发明的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1