基于细胞动态分化的基因调控网络构建方法

文档序号:34971835发布日期:2023-08-01 17:06阅读:19来源:国知局
基于细胞动态分化的基因调控网络构建方法

本发明涉及生物信息,特别涉及一种基于细胞动态分化的基因调控网络构建方法。


背景技术:

1、单细胞转录组测序技术生成的数据集以前所未有的分辨率描述单个细胞的状态。自引入该技术以来,已报道的单细胞组学数据的数量呈爆炸式增长,这对于理解细胞过程至关重要,单细胞转录组测序在揭示细胞类型的异质性和分化轨迹方面发挥了重要作用。因此,在单细胞水平上推断基因调控网络对于解释细胞分化、细胞命运决定和表达失调等生物学现象至关重要。特别是了解肿瘤微环境中促进免疫逃逸机制的复杂调控,这为理解基因之间的相互作用以及细胞状态转变的新见解提供了机会,也可以指导研究人员识别新的药物靶点并开发有效的免疫治疗药物。然而,与bulk 转录组测序数据不同,单细胞转录组测序数据带来了许多独特的挑战,如较低的信噪比、dropouts和异质性等等,由于这些特性,从单细胞转录组测序数据中推断基因调控网络仍然具有挑战性。

2、目前为止,已经提出了许多基于单细胞转录组测序数据构建调控网络的方法。然而,以往的方法忽略了调控网络是高度动态的,基因之间的调控关系随时间而变化。因此,在推断调控网络时,应考虑随细胞状态变化的时间信息。由于目前提供具有时间序列信息的单细胞转录组测序数据集比较稀少,并且这种时间序列可能无法提供足够的信息来推断基因调控网络。因此,根据细胞的表达水平和细胞状态,采用对细胞分化过程进行分类的方法来计算细胞的时间信息,这种时间信息一般称为拟时间信息。与时间序列信息相似,拟时间排序也显示了基因在细胞过程中的表达趋势,这可能有助于准确构建基因调控网络。因此,一些方法试图从具有时间信息的基因表达数据中重建基因调控网络。然而,这些方法仍有很大的改进空间,特别是在某些情况下,它们并没有明显优于随机网络。比如没有考虑细胞密度沿拟时间的分布状况,并且这些方法简单的将所有细胞的基因表达谱看作为一个表达矩阵,没有考虑细胞类型。

3、最近,开发推断细胞类型特异性基因调控网络的计算方法方面取得了重大进展。大多数早期的方法只依赖于单细胞转录组测序数据,并专注于设计不同的数学公式,如基于随机森林树方法、信息论方法和深度神经网络模型。多项研究表明,在构建细胞类型特异性基因调控网络加入额外信息有助于细胞类型特异性基因调控网络的预测。由于与单细胞转录组测序数据配对的其他组学的单细胞数据(如scatac-seq、snmc-seq和lncrnas数据)不易获取,并且不同组学的单细胞数据之间可能存在大量技术、生物噪音,而通用网络信息在现有数据库及文献中更容易收集。

4、通过上述可知的是,目前现有技术存在如下问题:

5、1、无法有效利用拟时间信息,没有考虑细胞密度沿拟时间的分布状况,并且这些方法简单的将所有细胞的基因表达谱看作为一个表达矩阵,没有考虑细胞类型。

6、2、不同组学的单细胞数据获取难度高,且所获取的不同组学的单细胞数据之间可能存在大量技术、生物噪音等问题。

7、3、单细胞转录组数据本身具有高维高稀疏特性,目前现有技术并没有克服该问题,在进行构建基因调控网络时,网络中存在假阳性和假阴性等不足。


技术实现思路

1、鉴于上述状况,本发明的主要目的是为了提出一种基于细胞动态分化的基因调控网络构建方法,以解决上述技术问题。

2、本发明提供了一种基于细胞动态分化的基因调控网络构建方法,所述方法包括如下步骤:

3、步骤1、获取单细胞转录组测序数据,对单细胞转录组测序数据进行预处理,得到不同类型不同状态的细胞,利用slingshot推断不同细胞状态的拟时间信息,得到包含细胞注释信息和拟时间信息的表达矩阵;

4、步骤2、根据表达矩阵中拟时间信息的密度计算两种细胞状态之间的交点,以交点为基准,将所有细胞划分成多个不同大小的窗口,每个窗口由具有连续状态的细胞组成;

5、步骤3、选取窗口中在拟时间上具有显著变化的基因,采用基于l0正则化的l0l2稀疏回归模型推断具有显著变化的基因,根据推断结果,在每个窗口中构建表示转录因子-基因之间调控关系的细胞类型特异性基因调控网络;

6、步骤4、利用单细胞转录组测序数据构建参考网络,将参考网络作为参考信息来校准细胞类型特异性基因调控网络,得到最终的细胞类型特异性基因调控网络。

7、本发明将拟时间信息和细胞类型结合,并且考虑了细胞密度沿拟时间的分布状况,有助于从细胞动态分化的角度构建细胞类型特异性的基因调控网络,不仅使得所构建的基因调控网络更准确,并且有利于后续分别基于免疫细胞和肿瘤细胞的基因调控网络挖掘肿瘤进展过程中重要的免疫逃逸通路。

8、本发明的附加方面与优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。



技术特征:

1.一种基于细胞动态分化的基因调控网络构建方法,其特征是,所述方法包括如下步骤:

2.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,在步骤1中,对单细胞转录组测序数据进行预处理的具体方法包括如下步骤:

3.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤2中,以交点为基准,将所有细胞划分成多个不同大小的窗口的具体方法包括:以两个交点作为一个滑动窗口,若两种细胞状态之间存在多个交点,则以密度最大处的交点作为基准重新划分边界,重新调整滑动窗口宽度。

4.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤3中,选取窗口中在拟时间上具有显著变化的基因的方法具体包括:设定基因过滤标准,再将过滤后的每个基因拟合一个广义线性模型,利用广义线性模型来建模窗口中细胞的基因表达和拟时间之间的关系,并使用关联检验函数检验基因表达和拟时间之间的关联的显著性,得到基因沿拟时间上的方差和方差的p-value;

5.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤3中,l0l2稀疏回归模型的表达式为:

6.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤3中,窗口中的转录因子-基因之间的相互作用强度存在如下关系式:

7.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤4中,最终的细胞类型特异性基因调控网络中的转录因子-基因的相互作用强度存在如下关系式:

8.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤4中,构建参考网络的具体方法包括如下步骤:

9.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,步骤4中,将参考网络作为参考信息来校准细胞类型特异性基因调控网络的具体方法为:将细胞类型特异性基因调控网络与参考网络的邻接矩阵进行合并,并进行归一化,得到最终的细胞类型特异性基因调控网络。

10.根据权利要求1所述的基于细胞动态分化的基因调控网络构建方法,其特征是,所述方法还包括步骤5:


技术总结
本发明提出一种基于细胞动态分化的基因调控网络构建方法,该方法包括,获取单细胞转录组测序数据并进行预处理,再利用Slingshot进行推断,得到包含细胞注释信息和拟时间信息的表达矩阵;根据表达矩阵中拟时间信息的密度计算两种细胞状态之间的交点,以交点为基准,将所有细胞划分成多个窗口;在每个窗口中构建细胞类型特异性基因调控网络;构建参考网络,将参考网络作为参考信息来校准细胞类型特异性基因调控网络。本发明将拟时间信息和细胞类型结合,并且考虑了细胞密度沿拟时间的分布状况,有助于从细胞动态分化的角度构建细胞类型特异性的基因调控网络,使得所构建的基因调控网络更准确。

技术研发人员:李雄,张龙宇,孟旭,周娟,陈浩文
受保护的技术使用者:华东交通大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1