一种探测复杂生物系统临界状态的方法

文档序号:36716375发布日期:2024-01-16 12:15阅读:21来源:国知局
一种探测复杂生物系统临界状态的方法

本发明属于生物系统,涉及生物系统临界点检测领域,具体涉及一种探测复杂生物系统临界状态的方法。


背景技术:

1、复杂疾病系统的发展可分为三个阶段:正常状态、危重状态和疾病状态。人体系统在正常状态和疾病状态下都具有较高的弹性和较强的鲁棒性。在临界状态下,人体系统是不稳定和可逆的,具有低回弹和弱鲁棒性。如果此时系统受到干扰,则可能进入下一个稳定状态,也可能回到上一个稳定状态。大多数疾病都是在出现症状的这一阶段被发现的,患者虽然接受了合理的治疗,但很难恢复到正常状态。能够在早期阶段发现复杂疾病系统的危重状态,并在严重并发症发生之前确定临界点,可以实现更精确的个性化治疗。

2、在单细胞实验中,细胞命运承诺代表了关键状态转变,表征和预测这一关键转变对于患者特异性疾病建模和药物测试至关重要。因此,描述生物系统的动态特性,准确检测临界状态具有重要的生物医学意义。

3、临界点的识别不仅能更好地理解疾病发展过程中至关重要的潜在机制,而且还能为即将到来的疾病恶化提供早期预警信号,以供及时干预诊断参考。目前可用数据规模越来越大,在检测疾病恶化临界状态研究中如何更好处理高维且强噪声数据是一大难题;

4、在复杂生物系统的研究中,利用动态网络标记物、差分网络和网络熵等方法对复杂生物系统的预警信号进行检测取得了很大的成果。虽然许多研究可以促进与检测系统临界转变预警信号相关领域的发展,但目前大多数算法是根据离散变量设计的,基于单细胞数据设计算法方面仍有很大研究空间;与传统的bulk组学信息相比,从单细胞层面分析受高维、噪声、稀疏和异质性样本的影响。从单细胞数据集描述生物系统的动力学特征并准确检测临界状态是具有挑战性的。

5、在复杂生物系统的动态演化中,关键性的转变通常伴随着系统的灾难性进展。因此,如何描述生物系统的动力学特征并准确检测临界状态对于揭示复杂生物系统的潜在机制至关重要。


技术实现思路

1、有鉴于此,为解决上述现有技术的不足,本发明的目的在于提供了一种探测复杂生物系统临界状态的方法,在计算局部网络熵值时引入网络边权重,充分利用网络信息,从全局网络的互信息加权熵的角度追踪生物系统的动态发展识别临界点信号,准确反映出系统变化的动态性和复杂性,实现能够准确检测出复杂生物系统发生质变的临界阶段。

2、为实现上述目的,本发明所采用的技术方案是:一种探测复杂生物系统临界状态的方法,该方法包括以下步骤:

3、步骤一、为各阶段的每个基因拟合高斯分布;基于每个时间点给定的样本,将基因表达转化为概率分布;

4、步骤二、构建每个时间点的互信息网络,过程如下:利用互信息度量一个随机变量包含另一个随机变量的信息量,根据计算得到的基因与基因间的互信息作为边权重构建每个时间点的基因互信息网络;

5、步骤三、从每个时间点的全局网络中提取局部网络,以基因之间的互信息为局部网络边权重;

6、步骤四、计算时刻t的每个局部网络中邻域基因的微分熵;

7、步骤五、计算全局网络的互信息加权熵识别临界点信号,定义如下:根据局部网络边权重和一阶邻域基因的微分熵,计算每个局部网络在时刻t的加权熵得分,如果某阶段熵值急剧增加,认为该阶段为临界点。

8、进一步地,步骤一中根据基因gi(i=1,2,...,m)在时间点t的n个样本{s1,s2,...,sn}中的表达值拟合高斯分布,并对拟合的高斯分布进行拟合优度检验。

9、进一步地,步骤二中从信息的角度来描述基因之间的关联程度,当变量之间存在某种程度的关联时,变量之间的随机性越小,互信息越大。

10、更进一步地,利用边权重定量表征基因之间的关联度,其中基因gi与基因gj之间的网络边权重由互信息mit(gi,gj)指标确定。

11、进一步地,步骤三中通过步骤二得到的每个阶段的全局网络提取局部网络,每个局部网络中包含一个中心基因和其一阶邻域基因。

12、进一步地,步骤四中对连续随机变量的概率分布中的不确定性信息进行量化,将基因表达视为连续随机变量,拟合概率分布,量化阶段网络中基因与基因间的关联动态变化,熵值越高,代表不确定性越大。

13、进一步地,步骤五中临界点的确定如下:

14、当一个复杂动力系统经历关键转变时,生物信号分子表现出显著的集体行为和强烈波动,含有生物信号分子的局部网络在临界状态下的加权熵与过渡前状态下的加权熵有显著差异,如果某阶段熵值急剧增加,可以认为该阶段为临界点。

15、本发明的有益效果是:

16、1、从连续变量的角度来看,本方法比离散变量更能准确地描述基因之间的相互影响,并且在处理复杂的数据结构和非线性关系时能够捕捉到微小的变化和趋势,具有较强的鲁棒性;

17、2、本方法既适用于批量表达数据,也适用于单细胞表达数据且充分利用网络信息,能准确反映系统变化的动态性和复杂性,提高了有效性;

18、3、在本方法基础上,可以在复杂生物系统发生临界转变之前检测出临界状态,并识别临界状态下的信号基因,发现与胚胎分化相关的关键转录因子和更多传统生物标志物无法检测到的潜在暗基因。虽然这些暗基因是非差异信号基因,但它们已被证明可以通过功能通路参与胚胎分化过程;

19、4、本方法是无模型的,有助于识别和检测复杂生物系统中的关键状态,为及时的临床干预和疾病建模提供理论依据。



技术特征:

1.一种探测复杂生物系统临界状态的方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种探测复杂生物系统临界状态的方法,其特征在于,步骤一中根据基因gi(i=1,2,...,m)在时间点t的n个样本{s1,s2,...,sn}中的表达值拟合高斯分布,并对拟合的高斯分布进行拟合优度检验。

3.根据权利要求1所述的一种探测复杂生物系统临界状态的方法,其特征在于,步骤二中从信息的角度来描述基因之间的关联程度,当变量之间存在某种程度的关联时,变量之间的随机性越小,互信息越大。

4.根据权利要求3所述的一种探测复杂生物系统临界状态的方法,其特征在于,利用边权重定量表征基因之间的关联度,其中基因gi与基因gj之间的网络边权重由互信息mit(gi,gj)指标确定。

5.根据权利要求1述的一种探测复杂生物系统临界状态的方法,其特征在于,步骤三中通过步骤二得到的每个阶段的全局网络提取局部网络,每个局部网络中包含一个中心基因和其一阶邻域基因。

6.根据权利要求1述的一种探测复杂生物系统临界状态的方法,其特征在于,步骤四中对连续随机变量的概率分布中的不确定性信息进行量化,将基因表达视为连续随机变量,拟合概率分布,量化阶段网络中基因与基因间的关联动态变化,熵值越高,代表不确定性越大。

7.根据权利要求1述的一种探测复杂生物系统临界状态的方法,其特征在于,步骤五中临界点的确定如下:


技术总结
本发明公开了一种探测复杂生物系统临界状态的方法,首先将基因表达转化为概率分布,并在每个阶段构建互信息网络;然后从全局网络中提取局部网络;根据每个阶段网络中基因间的权重,计算每个局部网络的加权微分熵,定量表征系统在每个阶段的波动,从而检测复杂生物系统中的临界状态。本发明利用各阶段的微分熵信息来检测临界状态,可以在复杂生物系统发生临界转变之前检测出临界状态,并识别临界状态下的信号基因;既适用于批量表达数据,也适用于单细胞表达数据且充分利用网络信息,能准确反映系统变化的动态性和复杂性。

技术研发人员:李培峦,李沛谕,谢宇珂,卢跃静,任婧,郑园梦,蒋静,张菁菁
受保护的技术使用者:河南科技大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1