一种基于基因调控网络数据库的信息获取方法、平台及设备

文档序号:36832674发布日期:2024-01-26 16:48阅读:18来源:国知局
一种基于基因调控网络数据库的信息获取方法、平台及设备

本技术涉及生物信息学领域,具体涉及一种基于基因调控网络数据库的信息获取方法、平台、设备及计算机可读存储介质。


背景技术:

1、基因调控网络(grns)的研究可以帮助揭示细胞中基因调控机制的复杂性,理解生命的奥秘。转录因子tf及其下游靶基因形成的grn在监督细胞分裂、细胞生长和细胞死亡等细胞过程中发挥着重要作用。此外,对grn的研究对许多疾病的发生和治疗具有深远的意义,如癌症、心血管疾病和神经疾病,这些疾病与基因调节失调有关。了解疾病相关基因的调控网络可以为疾病的诊断、治疗和药物开发提供重要线索。例如,通过抑制或激活基因调控网络中的关键节点,可以实现疾病的干预和治疗。单细胞技术的最新进展为深入分析细胞异质性提供了新的方法和视角。单细胞转录组学数据的快速积累和单细胞染色质的可及性使得大规模细胞特异性grn的构建成为可能。作为转录调控的一个重要问题,基于scrna-seq和scatac-seq数据的grn的识别和构建对于更好地理解基因表达的调控模式和促进疾病的临床治疗是迫切需要的。目前,很少有数据库包含单细胞调控网络数据。grndb从大量和部分单细胞转录组数据中记录了tf靶基因调控网络。此外,一些单元数据库也将基本grn信息作为一个部分引入,如htca和ageanno。然而,目前还没有将单细胞转录组调控网络和单细胞表观基因组调控网络结合起来的数据库,同时没有基于该数据库获取基因信息、基因调控信息,也没有基于该数据库获取任意组织或细胞的特异基因调控信息的方法。


技术实现思路

1、根据上述问题,本发明提供一种基于scrna-seq和scatac-seq数据构建的单细胞转录组调控网络和单细胞表观基因组调控网络结合起来的数据库获取信息的方法。所述信息获取的过程涉及:网站服务器、应用端、基因调控网络数据库,所述网站服务器、所述应用端、所述基因调控网络数据库两两通信连接,所述应用端通过访问所述网站服务器获取目的信息,其中,所述应用端从访问到获得信息的步骤为:

2、进入所述网站服务器并发出查询指令;

3、基于所述网站服务器外部分析指令进行分析得到查询目的;

4、基于所述查询目的调用基因调控网络数据库数据,其中,所述基因调控网络数据库基于scrna-seq、scatac-seq数据重构得到的;

5、所述基因调控网络数据库数据通过运算处理得到查询的基因信息。

6、进一步,所述查询的方式包括下列的一种或几种:按tf搜索、按目标基因搜索、按组织类型搜索、按细胞类型搜索;其中,所述按tf搜索得到与输入tf关联的基因网络调控数据;所述按目标基因搜索得到特定基因的基因调控网络数据;所述按组织类型搜索、所述按细胞类型搜索得到查询的组织类型或细胞类型;

7、优选地,所述基因调控网络数据库中包括:样本信息、基因信息、可视化信息、s:基于所述scrna-seq的基因调控网络、a:基于所述scatac-seq的基因调控网络、t:任意组织信息或细胞信息的基因调控网络;

8、优选地,所述基因调控网络数据库中的数据还包括组织和/或细胞特异的基因调控信息,所述组织和/或细胞特异的基因调控信息是通过胶囊网络对比s和t/a和t/s+a和t得到的。

9、进一步,通过所述胶囊网络得到组织或细胞特异的基因调控信息前包括预处理阶段,所述预处理中对所述基因调控网络采用对数比值法构建基因调控网络的差分影像;

10、基于对数比值的差分影像dilr表示为:

11、dilr=|ln(x2/x1)|

12、其中,ln表示自然对数算子,x1表示第一基因调控网络,x2表示第二基因调控网络;

13、优选地,所述差分影像通过模糊c-means算法进行第一级分类得到差异类和未差异类,所述模糊c-means算法通过优化目标函数得到每个样本关于各个类别的隶属度,所述目标函数通过拉格朗日乘数法迭代得到最小取值;

14、优选地,所述隶属度通过目标函数的迭代更新取值,当所述目标函数相较于上一次的改变值小于预设阈值时,停止迭代,取得当前次的模糊隶属度作为隶属度。

15、进一步,基于所述隶属度引入差异信息熵优化训练样本得到优化后的样本,所述差异信息熵通过计算得到差分影像中每个像元的不确定性;

16、优选地,所述差异信息熵h(x)的公式表示为:

17、h(x)=-(ma(x)×lnma(x)×wx+mh(x)×lnmh(x))

18、其中,wx表示像素x的自适应权重,ma(x)表示未差异类a的隶属度,mh(x)表示差异类h的隶属度,ln表示自然对数算子。

19、所述胶囊网络由卷积层、普通胶囊层、稀疏胶囊层、全连接胶囊层组成,所述基因调控网络图输入胶囊网络后通过卷积层后进行卷积提取特征得到卷积特征,其中,所述卷积层中采用空间变换器学习输入数据的空间变换;所述卷积特征输至所述普通胶囊层进行类卷积运算得到底层特征;所述底层特征输至稀疏胶囊层中通过局部连接和共享变换矩阵减少参数数量得到稀疏特征;所述稀疏特征输至全连接胶囊层中通过动态路由机制更新耦合系数,计算得到每一类的概率;

20、优选地,所述空间变换器包括本地化网络、网格生成器、采样器,所述本地化网络用于估计变换矩阵,所述网格生成器生成变换矩阵前后的网格,所述采样器根据生成的数据对输入数据进行变换;

21、进一步,所述类卷积运算在进行计算时能获得m个特征映射,m为大于1的自然数;

22、进一步,所述稀疏胶囊层中采用注意力机制捕捉关键信息,注意力对所述稀疏胶囊的输入特征分配的注意力权重vj表示为:

23、

24、其中,aij为注意力权重,i为稀疏胶囊层的输入特征,j为稀疏胶囊层的输出特征,uj|i为预测输出。

25、本发明的目的在于提供一种基于基因调控网络数据库的信息获取平台,所述平台显示基因调控网络信息时实现任意一项上述的基于基因调控网络数据库的信息获取方法。

26、进一步,所述基因调控网络平台包含搜索模块、样本概述模块、可视化模块,基因概述模块、分析模块、下载模块;

27、进一步,所述搜索模块是为用户提供搜索途径通过搜索得到目标信息,其中,搜索方式包括下列的一种或几种:按tf搜索、按目标基因搜索、按组织类型搜索、按细胞类型搜索;

28、所述可视化模块是对数据进行运算提供可视图,其中,提供可视化效果图的内容包括细胞簇和tf活性、regulon模块、regulon特异性、regulon活性;

29、所述样本概述模块是展示样本的简要信息,包括下列的一种或几种:样本id、物种、平台、数据类型、组织类型、gse id、gsm id、pubmed id、细胞数、簇数、tf目标数;其中,所述样本概述模块的面板左侧为所选样本的基本描述,右侧以图的形式显示详细信息,所述以图的形式显示详细信息包括下列的一种或几种:细胞分布、监管网络统计、质量控制结果;

30、基因调控网络的信息显示在tf目标网络面板中,在所述tf目标网络中点击目标基因后呈现新的页面展示基因的详细描述,所述详细描述包括基因概述、感兴趣的目标基因的tf结合区域注释以及来自不同来源的基因表达图谱;

31、所述基因概述模块是呈现基因的简要信息,包括:目标基因、样本id、ncbi官方符号、entrez id、基因全称、strand、基因库、外部链接;

32、所述下载模块提供的下载内容包括下列的一种或几种:图表、表格、图、所有样本以tf靶标关系形式存储的原始基因调控网络或细胞类型特异性基因调控网络、目的基因功能注释和表达图谱。

33、所述分析模块是对基因调控网络的分析,所述分析包括tf富集分析、差异tf目标网络分析、pathway富集分析;

34、进一步,所述差异tf目标网络分析需要先确定物种、数据类型、网络推理方法再选择样本进行分析,得到差异网络分析结果;

35、所述tf富集分析需要先提供tf列表或tf名称的文件,再设置超几何测试使用的参数,同时选择需要进行tf富集的样本,通过运算分析得到tf富集结果;

36、所述pathway富集分析是识别选定样本中tf或目标基因的富集通路。

37、本发明的目的在于提供一种基于基因调控网络数据库的信息获取设备,包括:

38、存储器和处理器,所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时实现任意一项上述的一种基于基因调控网络数据库的信息获取平台。

39、本发明的目的在于提供一种计算机可读存储介质,其上存储有计算机程序,包括:所述计算机程序被处理器执行时实现任意一项上述的一种基于基因调控网络数据库的信息获取平台。

40、本发明的优势:

41、1.本发明采用胶囊网络,通过对比不同的基因调控网络得到任意组织或细胞的特异基因调控信息,使得用户在使用基因调控网络数据库时能通过组织或细胞搜索时得到组织或细胞的特异性的信息,有助于后续对单细胞的、或组织的研究。

42、2.传统的差分影像计算方法可能没有使用对数比值法,导致图像间微小或局部的变化难以被准确捕捉,而本发明胶囊网络中采用通过对数比值法快速并准确地捕捉了图像间的变化,为后续的处理提供了准确的基础数据。

43、3.现有技术可能主要依赖于硬分类方法,可能会导致在边界或模糊区域的像元分类不准确。而本发明利用改进的模糊c-means算法和信息熵,可以得到每个像元对差异类、未差异类和不确定类的隶属度,对像元进行软分类,提高了分类的灵活性能够更准确地分类像元,从而提高了差分影像的准确性。

44、4.在胶囊网络中通过空间变换器学习输入数据的空间变换,如旋转、缩放等,空间变换器使得网络能够自适应地处理各种空间变换,提高了网络对这些变换的适应性。

45、5.在胶囊网络中引入注意力机制,使模型能够更为关注重要信息,从而提高了检测的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1