基于图神经网络的基因调控网络构建方法及系统与流程

文档序号:34177460发布日期:2023-05-17 05:56阅读:60来源:国知局
基于图神经网络的基因调控网络构建方法及系统与流程

本发明涉及深度学习领域,具体涉及一种基于图神经网络的基因调控网络构建方法及系统。


背景技术:

1、随着基因组研究的不断发展,探索基因调控网络成为基因组学的重大挑战之一,并成为生物学研究的主要焦点。基因调控网络主要描述了细胞内或一个基因组内的基因之间的相互作用,简单来说就是描述了生物体内控制基因表达的机制。研究基因调控网络可以为很多生物学领域提供保障,例如药物设计或其他医学相关领域。这些领域需要基因调控网络来提供对活细胞中细胞过程的清晰洞察和理解。这是因为基因及其产物之间的相互作用在许多分子过程中发挥着重要作用。同时,单细胞rna测序技术允许在单细胞分辨率下解析基因表达,这极大的促进了转录组学的研究,也使得推断基因调控网络有了新方法。因此使用单细胞测序数据来构建基因调控网络成为了新的热点问题。

2、近些年来在使用单细胞rna测序数据推断基因调控网络中取得不错效果的是基于线性常微分方程和线性回归领域的变换架构和基于熵的异构生物信息聚合评分方法。这些方法都未将图结构信息纳入到他们的方法中,使得丢失了重要的非欧几里得空间数据的特征。同时,近些年来,在人工智能领域,图神经网络开始得到广泛的研究和关注,不少研究学者提出了很多图神经网络模型,都取得良好的效果,这使得引入图神经网络研究基因调控网络成为可能。

3、随着人工智能领域的不断发展,全连接神经网络,卷积神经网络,注意力机制网络,强化学习等在图像处理,自然语言处理等领域得到广泛使用,但是现在提出的网络结构在非欧几里得空间中的数据的处理却不是很理想,所以为了解决从非欧几里得领域生成的数据的处理等一系列问题,从而诞生了图神经网络。因为在现实中,许多非欧几里得数据都表示为具有复杂关系和对象之间相互依赖的图形,例如社交网络,蛋白质结构等。图神经网络在推荐系统设计,机器视觉中点云的生成等方面得到了广泛的应用。图神经网络分为循环神经网络、图卷积神经网络、图自动编码器和时空图神经网络。其中由于图卷积神经网络有更有效且更方便与其他神经网络结合的优势,成为主流的研究方向,因此引入性能优异的基于图卷积神经网络对提升性能也十分重要。图卷积神经网络分为两类:基于频谱和基于空间的图卷积神经网络。基于频谱的图卷积神经网络通过从图信号处理的角度引入滤波器,其中图卷积操作被解释为从图信号中去除噪声。基于空间的图卷积神经网络继承了循环神经网络的思想,通过信息传播来定义图卷积。基于空间的图卷积神经网络因具有高效性、灵活性和通用性而在最近迅速发展。在图神经网络研究领域中,链接预测又是图神经网络中的典型任务之一。链接预测通常用于预测网络中两个节点之间的相互连通性。启发式链接预测方法通常因其简单和有效而受到青睐。这些启发式方法往往需要知道局部的网络结构,甚至有一些高阶启发式方法需要整个网络的信息,这种计算开销往往是不能接受的。不仅如此,启发式方法对链接节点施加了很强的假设,这在实际应用中的有些场景下是站不住脚的,并且会对预测性能产生不利影响。


技术实现思路

1、本发明的目的在于针对现有技术的不足,提出一种基于链接预测和图神经网络的基因调控网络构建方法。通过引入能很好处理非欧几里得数据的图神经网络和使用基于衰减理论的封闭子图代替启发式方法来提升链接预测的性能,从而构建获得基因调控网络。

2、本发明采用的技术方案具体如下:

3、一种基于图神经网络的基因调控网络构建方法,包括:

4、获取一个细胞或一个基因组的基因测序数据,基于获取的基因测序数据构建图表示;

5、提取感兴趣的中心基因,并基于图表示获取中心基因周围的链接基因,将中心基因与链接基因两两组成基因对;

6、构建每一基因对的输入特征,所述输入特征包括基因信息矩阵和图表示中的邻接矩阵,所述基因信息矩阵由特征信息矩阵、基因对的封闭子图和封闭子图标签矩阵拼接构成;所述特征信息矩阵由图表示中每一基因的显性特征和隐性特征拼接构成;

7、将每一基因对的输入特征输入至训练好的图神经网络,输出获得预测的基因对的链接关系,根据所有基因对的链接关系构建获得基因调控网络。

8、进一步地,基于图表示,采用广度优先搜索算法获取中心基因周围的链接基因。

9、进一步地,所述基因的显性特征为基因在细胞或基因组中的表达量,隐性特征为采用node2vec算法构建的节点嵌入特征。通过节点嵌入算法获得隐性特征,再将隐性特征和显性特征进行结合,可以获得更全面的节点信息。并且通过构建封闭子图以取代基于强假设的启发式方法以避免假设失效带来的负面影响,可以极大地提高神经网络的预测性能。

10、进一步地,所述基因对的封闭子图和封闭子图标签矩阵通过如下方法构建:

11、将基因对作为中心节点加入列表l的头部;

12、在图表示中寻找与任意一个中心节点距离为k的节点,k∈{1,2,…,h},加入到列表l的末尾,重复h次,每次重复k都会加1,构建获得封闭子图;

13、对封闭子图中的每个节点给予标签值,构建获得封闭子图标签矩阵。

14、进一步地,对封闭子图中的每个节点给予标签值,其中,中心节点的标签值为1,封闭子图中除中心节点外的其他节点的标签值表示为:

15、

16、其中为中心节点,i为封闭子图中除中心节点外的其他节点,是节点i到中心节点的距离;,若出现或,则节点标签为0,表示取余数。

17、进一步地,所述图神经网络由多个图卷积层、排序池化层、多个一维卷积层和全连接层组成。通过使用高效的图卷积层和排序池化层可以提高模型链接预测的准确度。

18、进一步地,所述训练好的图神经网络是基于收集的数据集,以最小化图神经网络输出的预测的基因对的链接关系与链接真值构建的损失函数为目标进行训练获得的。

19、一种基于图神经网络的基因调控网络构建系统,用于实现所述的基于图神经网络的基因调控网络构建方法,包括:

20、数据预处理模块,用于获取一个细胞或一个基因组的基因测序数据,基于获取的基因测序数据构建图表示;

21、基因对构建模块,用于提取感兴趣的中心基因,并基于图表示获取中心基因周围的链接基因,将中心基因与链接基因两两组成基因对;

22、输入特征构建模块,用于构建每一基因对的输入特征,所述输入特征包括基因信息矩阵和图表示中的邻接矩阵,所述基因信息矩阵由特征信息矩阵、基因对的封闭子图和封闭子图标签矩阵拼接构成;所述特征信息矩阵由图表示中每一基因的显性特征和隐性特征拼接构成;

23、基因调控网络构建模块,用于将每一基因对的输入特征输入至训练好的图神经网络,输出获得预测的基因对的链接关系,根据所有基因对的链接关系构建获得基因调控网络。

24、一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的基于图神经网络的基因调控网络构建方法。

25、一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现所述的基于图神经网络的基因调控网络构建方法。

26、本发明的有益效果是:

27、本发明通过链接预测和图神经网络的方式构建基因调控网络,结合了封闭子图和封闭子图标签矩阵作为输入特征的一部分,取代基于强假设的启发式方法,可以避免假设失效带来的负面影响,同时使神经网络能识别每个节点在图中的重要作用,再使用高效的图卷积层和排序池化层可以显著提高图神经网络链接预测的准确度。通过本发明,可以构建疾病的基因调控网络以发现与疾病相关的基因,从而提供潜在的药物靶点,从而达到治疗该疾病的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1