生物标志物的可解释交互作用快速遍历检测方法及装置

文档序号:37933277发布日期:2024-05-11 00:12阅读:5来源:国知局
生物标志物的可解释交互作用快速遍历检测方法及装置

本发明涉及数据挖掘分类及生物医药,具体涉及一种针对大规模生物标志物的可解释交互作用快速遍历检测方法及装置。


背景技术:

1、生物标志物在确定生物特有属性中起到重要的作用,如鉴定疾病类型、表型类型、药物敏感性、评估个体风险等。一般而言,其中一个生物标志物的真实效应往往会随着另一个生物标志物的改变而发生改变,但是当两种或两种以上的生物标志物同时存在的效应不等于单个作用相联合的效应时,各因素之间存在交互作用。因此,有必要研究生物标志物之间的交互作用,以揭示暴露影响疾病发生的机制。但是,由于生物标志物的数量往往超过万、十万、百万,因此生物标志物的交互作用计算量巨大,需要完成亿、100亿、万亿次的计算。传统方法完成相应运算,就单台电脑(16g内存,i5cpu)而言,需要几个月或几年的时间,无法对全部生物标志物的交互作用进行遍历,至今大规模交互作用计算,是各领域的痛点。因此,针对大规模生物标志物的交互作用快速遍历检测是亟待解决的一个难题。

2、发明人在研究中发现,传统的交互作用分析还存在一个解释困难的特点,也就是说尽管发现两个生物标志物存在交互作用,这种交互作用仅仅是偏离随机,而不能具体知道什么含义,阻碍交互作用的发展。因此,有必要提供一种针对大规模生物标志物的可解释交互作用快速遍历检测方法,以解决在以往的交互作用研究中存在的耗时长,无法实现全遍历,并且交互作用关系不明确,可解释性差,给交互作用分析带来的巨大障碍的问题。


技术实现思路

1、为了解决在以往的交互作用研究中,计算交互作用耗时长,无法实现全遍历,并且交互作用关系不明确,可解释性差,给交互作用分析带来的巨大障碍的问题,本发明的目的在于提供一种针对大规模生物标志物(指标或特征值)的可解释交互作用快速遍历检测方法。

2、为实现上述目的,本发明的技术方案如下。

3、本发明的第一方面提供一种生物标志物的可解释交互作用快速遍历检测方法,包括如下步骤:

4、s1、获取原始数据,所述原始数据为含有一种或多种类型标志物的表达矩阵;对所述原始数据进行计算得出交互作用分析次数,对所述交互作用分析次数进行计算,以获得gpu单次运算可承载的运算批次数;当gpu单次运算可承载的运算批次数>1时,根据gpu单次运算可承载的运算批次数对所述原始数据进行数据分割,得到对应的数据分割结果;以及构建可解释交互作用关系的函数库;

5、s2、根据所述数据分割结果获取对应批次指定的原始数据;利用函数库对所述对应批次指定的原始数据中标志物的组合进行全局交互作用分析,以获得全局交互作用结果,和/或,利用函数库对所述对应批次指定的原始数据中标志物的组合进行个体化交互作用分析,以生成个体化数据;

6、s3、对所述全局交互作用结果,和/或,所述个体化数据,以及所述对应批次指定的原始数据中的表型数据进行统计分析,以筛选并输出结果数据,所述结果数据为具有交互作用关系的表达矩阵。

7、本发明的方法能够充分利用gpu的多核心计算单元,极大的节约了时间,使得原来在几个月或几年内能够完成的计算任务在几分钟或几十分钟内解决,极大地推进交互作用研究。并且交互作用是基于可解释函数库进行,因此获得的交互作用意义明确,易于个体化,个体化的交互作用可以作为新特征进行高级分类、预测等研究。

8、进一步,s1中,获取原始数据之前,还包括:将一种或多种类型标志物、样本数据、表型数据组成矩阵或分块矩阵并输入,以生成原始数据;

9、s2中,对应批次指定的原始数据中排除标志物外的数据为样本数据。

10、进一步,s1中,交互作用分析次数是全遍历或部分遍历的交互作用分析次数。本发明中,计算同一种类型标志物的表达矩阵的交互作用分析次数的全遍历方式是循环计算第i行与余下n-i行的交互作用,n为标志物的总行数,i为≥1的整数。计算不同类型标志物的表达矩阵的交互作用分析次数的全遍历方式是循环计算每个矩阵的行与其他矩阵的行的交互作用。

11、进一步,s1中,获得gpu单次运算可承载的运算批次数的具体计算方式为:k=n/l(1);式(1)中,k为gpu单次运算可承载的运算批次数;n为交互作用分析总次数;l为gpu每批次所运行的交互作用分析次数。

12、进一步,s1中,所述函数库是具有一元及多元函数表达式的函数库。

13、进一步,s3中,所述个体化数据是对标志物的组合根据函数库计算而成的能够度量交互作用关系的数据。

14、进一步,s4中,所述统计分析为差异检验分析或相关性分析。

15、进一步,s4中,筛选并输出结果数据,具体包括:显著结果筛选,以获得具有交互作用关系的表达矩阵。其中,所述显著结果筛选是使用多重检验校正方法以保证结果的阳性率。

16、本发明的第二方面提供一种生物标志物的可解释交互作用快速遍历检测装置,包括函数构建模块、数据获取模块、数据计算模块、分割模块和处理模块,以及与所述函数构建模块、所述数据获取模块、所述数据计算模块、所述分割模块和所述处理模块均电连接的存储模块;

17、所述函数构建模块,用于构建可解释交互作用关系的函数库,并将建立的函数库发送至所述处理模块和/或所述存储模块;

18、所述数据获取模块,用于发起获取数据请求,获取所述存储模块中的原始数据,并分配至所述数据计算模块;所述原始数据为一种或多种类型标志物的表达矩阵;

19、所述数据计算模块,用于接收分配的所述原始数据,并对分配的所述原始数据计算交互作用分析次数,得到第一数据,再对第一数据计算gpu单次运算可承载的运算批次,得到第二数据,将所述第一数据和所述第二数据发送至所述分割模块和/或所述存储模块;

20、所述分割模块,用于接收所述数据计算模块发送的第一数据和第二数据,根据所述第二数据对所述第一数据进行数据分割,得到对应的数据分割结果,并将所述数据分割结果发送至所述处理模块和/或所述存储模块;

21、所述处理模块,用于接收所述分割模块发送的数据分割结果,以及接收所述函数构建模块发送的函数库,根据所述数据分割结果获取所述存储模块中的对应批次指定的原始数据,并利用所述函数库对所述对应批次指定的原始数据中的标志物的组合进行全局交互作用或个体化交互作用分析,生成第三数据,对所述第三数据与所述对应批次指定的原始数据中的表型数据进行统计分析,以筛选得到结果数据,并将所述结果数据发送至所述存储模块;所述第三数据为个体化数据;所述结果数据为具有交互作用关系的表达矩阵;

22、所述存储模块,用于存储所述函数构建模块写入的函数库、所述数据计算模块发送的所述第一数据和所述第二数据、所述分割模块发送的所述数据分割结果以及所述处理模块发送的结果数据。

23、本发明的第三方面提供一种电子设备,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于在调用计算机程序时执行上述可解释交互作用快速遍历检测方法。

24、本发明的第四方面提供一种计算机可读或可写存储介质,所述计算机可读或可写存储介质上存储有计算机程序,计算机程序被处理模块执行时实现上述可解释交互作用快速遍历检测方法。

25、本发明的有益效果:

26、1、本发明的方法利用gpu的多核心计算单元以提高生物标志物交互作用的速度,并且交互作用是基于可解释函数库进行,使得交互作用具有高度的可解释性,易于个体化,个体化的交互作用可以作为新特征进行高级分类、预测等研究,以便于更好服务于生物医药等相关领域研究,该方法能够解决在以往的交互作用研究中,计算交互用往往利用cpu进行,耗时时间长,无法实现全遍历,并且交互作用关系不明确,可解释性差,给交互作用分析带来的巨大障碍的问题。

27、2、本发明的方法主要是针对一个或多个大规模生物样本标志物矩阵、表型数据,计算交互作用分析次数,构建可解释的交互作用关系函数库,利用可解释函数库对标志物进行全局交互作用分析和个体化交互作用分析,利用可解释函数库对生物样本标志物矩阵进行个体化指标生成,利用gpu核心计算生成的个体化交互作用指标与表型的差异性和相关性,对结果利用多重检验校正等方式进行过滤,借助机器学习、人工智能等方法使用个体化指标对样本进行分类、识别、评估等,将函数库往复作用到新指标矩阵反复筛选交互作用,可以评估新指标与旧指标的相关性,对结果显著性p值高精度输出。该方法为检测生物、医、药中哪些生物标志物、指标或特征之间存在交互作用,它们以何种函数关系互作提出了新的技术构思。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1