模型确定方法、装置、设备及计算机可读存储介质与流程

文档序号:30582719发布日期:2022-06-29 13:19阅读:275来源:国知局
模型确定方法、装置、设备及计算机可读存储介质与流程

1.本技术涉及人工智能技术,尤其涉及一种模型确定方法、装置、设备及计算机可读存储介质。


背景技术:

2.图(graph)是现实世界中用来描述离散数据的拓扑,其要素有两个,顶点和边。在普通图中,一条边可以连接两个顶点,并表示两个顶点间的某种关联。在超图中,需要重定义超边的概念,即超图中的一条超边可以包含多个顶点。很多现实问题,需要利用图或者超图结构来组织数据,如引文网络、社交网络、蛋白质分子结构网络等。得益于图神经网络的发展,图结构数据的表示能力和信息汇集能力得到快速发展。而超图则是一种表示能力更强的拓扑结构,普通图可以是看作限定超边度为2的特殊超图,因此超图比图有更加泛化的表示能力。


技术实现要素:

3.本技术实施例提供一种模型确定方法、装置、设备及计算机可读存储介质,能够提高不同输入信息在超图处理网络模型处理后得到的输出信息的差异度。
4.本技术实施例的技术方案是这样实现的:
5.本技术实施例提供一种模型确定方法,包括:
6.获取基于待处理数据预先构建的超图,确定所述超图对应的随机游走状态转移矩阵;
7.基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核;
8.确定所述随机游走状态转移矩阵对应的对称状态转移矩阵;
9.基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子;
10.获取预设的激活函数,利用所述激活函数和所述超图信号卷积算子生成超图处理网络模型。
11.本技术实施例提供一种模型确定装置,包括:。
12.第一确定模块,用于获取基于待处理数据预先构建的超图,确定所述超图对应的随机游走状态转移矩阵;
13.第二确定模块,用于基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核;
14.第三确定模块,用于确定所述随机游走状态转移矩阵对应的对称状态转移矩阵;
15.第四确定模块,用于基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子;
16.模型确定模块,用于获取预设的激活函数,利用所述激活函数和所述超图信号卷积算子生成超图处理网络模型。
17.在一些实施例中,该第一确定模块,还用于:
18.基于所述超图,获取各个超边的先验权重、出度、入度、所述各个顶点进入超边过程中的第一超边依赖顶点权重和流出超边过程中的第二超边依赖顶点权重;
19.获取预设的影响函数,并根据所述影响函数、所述各个超边的出度、入度确定各个顶点的度,所述影响函数表征超边的出度或入度对顶点的度的影响类型;
20.基于所述各个超边的先验权重、出度、入度,和各个顶点的度、第一超边依赖顶点权重、第二超边依赖顶点权重,确定所述各个顶点随机游走到其他顶点的游走概率;
21.基于所述各个顶点随机游走到其他顶点的游走概率确定随机游走状态转移矩阵。
22.在一些实施例中,该第二确定模块,还用于:
23.基于所述随机游走状态转移矩阵获取各个顶点对应的折损访问率向量;
24.基于顶点u对应的折损访问率向量和顶点v对应的折损访问率向量,确定顶点u与顶点v之间的折损马尔科夫扩散距离;其中,u=0,1,2,

,(n-1);v=0,1,2,

,(n-1),n为超图中的顶点总数;
25.基于所述折损马尔科夫扩散距离确定所述超图对应的折损马尔科夫核。
26.在一些实施例中,该第二确定模块,还用于:
27.获取预设的折损因子;
28.基于所述所述随机游走状态转移矩阵和所述折损因子确定从顶点u出发,经过t步随机游走到顶点v的折损平均访问概率;t=0,1,2,

,(n-1),
29.将从顶点u出发,经过t步随机游走到各个顶点的折损平均访问概率确定为顶点u对应的折损访问概率向量。
30.在一些实施例中,该第三确定模块,还用于:
31.基于所述超图确定顶点度矩阵;
32.基于所述随机游走概率矩阵和所述顶点度矩阵确定所述超图对应的带权邻接关系矩阵;
33.对所述带权邻接关系矩阵进行对称正则化转换,得到对称状态转移矩阵。
34.在一些实施例中,该第四确定模块,还用于:
35.获取输入信道与输出信道之间的过滤器构成的卷积核;
36.基于所述折损马尔科夫核确定输入空间与输出空间之间的特征映射关系;
37.基于所述对称状态转移矩阵、所述特征映射关系和所述卷积核确定输出信息和输入信息之间的超图信号卷积算子。
38.在一些实施例中,该模型确定模块,还用于:
39.获取残差连接超参数;
40.利用所述超图信号卷积算子和第(l+1)层的输入信息确定所述第(l+1)层的卷积结果;其中,l=0,1,

,l,l为网络的预设层数;
41.利用所述残差连接超参数将所述第(l+1)层的卷积结果和第l层的输出信息进行融合处理,得到融合结果;
42.将所述激活函数作用于所述融合结果,得到超图处理网络模型。
43.在一些实施例中,该装置还包括:
44.第一获取模块,用于从所述超图中获取训练数据,所述训练数据包括训练顶点的顶点信息和所述训练顶点的标签信息;
45.第一处理模块,用于利用所述超图处理网络模型对各个训练顶点的顶点信息进行处理,得到所述各个训练顶点的表示向量;
46.第一预测模块,用于获取训练好的分类模型,利用所述分类模型对所述各个训练顶点的表示向量进行预测处理,得到所述各个训练顶点对应的预测信息;
47.模型训练模块,用于利用所述各个训练顶点的预测信息和所述各个训练顶点的标签信息对所述超图处理网络模型进行训练,得到训练好的超图处理网络模型。
48.在一些实施例中,该装置还包括:
49.第二获取模块,用于获取所述超图中获取测试顶点的顶点信息;
50.第二处理模块,用于利用所述训练好的超图处理网络模型对各个测试顶点的顶点信息进行处理,得到所述测试顶点的表示向量;
51.第二预测模块,用于利用所述训练好的分类模型对所述各个测试顶点的表示向量进行预测处理,得到所述各个测试顶点对应的预测信息;
52.第五确定模块,用于将所述各个测试顶点对应的预测信息确定为所述各个测试顶点的分类信息。
53.本技术实施例提供一种计算机设备,包括:
54.存储器,用于存储可执行指令;
55.处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的方法。
56.本技术实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本技术实施例提供的方法。
57.本技术实施例提供一种计算机程序产品,包括计算机程序或指令,所述计算机程序或指令被处理器执行时实现本技术实施例提供的方法。
58.本技术实施例具有以下有益效果:
59.在获取到基于待处理数据预先构建的超图之后,确定所述超图对应的随机游走状态转移矩阵,然后基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核,并确定所述随机游走状态转移矩阵对应的对称状态转移矩阵;之后基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子;最后获取预设的激活函数,利用所述激活函数和所述超图信号卷积算子生成超图处理网络模型,在确定折损马尔科夫核时引入了折损因子,进而基于对称状态转移矩阵和折损马尔科夫核确定出超图信号卷积算子能够削弱较远层级的影响,从而避免出现过平滑现象,提高不同输入信号经过生成的超图处理网络模型所输出的表示向量的差异性,进而能够保证在利用表示向量执行后续的下游任务所得到的结果的准确性。
附图说明
60.图1为本技术实施例提供的超图数据处理系统的网络架构示意图;
61.图2为本技术实施例提供的服务器400的结构示意图;
62.图3为本技术实施例提供的模型确定方法的一种实现流程示意图;
63.图4a为本技术实施例提供的确定折损马尔科夫核的实现流程示意图;
64.图4b为本技术实施例提供的确定对称状态转移矩阵的实现流程示意图;
65.图5为本技术实施例提供的对确定出的超图处理网络模型进行训练和预测的实现流程示意图;
66.图6为本技术实施例提供的超边示意图;
67.图7为本技术实施例提供的超图谱卷积神经网络的生成过程示意图。
具体实施方式
68.为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
69.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
70.在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本技术实施例能够以除了在这里图示或描述的以外的顺序实施。
71.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
72.对本技术实施例进行进一步详细说明之前,对本技术实施例中涉及的名词和术语进行说明,本技术实施例中涉及的名词和术语适用于如下的解释。
73.1)图:一种数据结构,由顶点和边组成,其中一个边只能连接两个顶点;
74.2)超图:一种数据结构,由顶点和边组成,其中一个边可以连接一个或多个顶点;
75.3)依赖于边的顶点权重(edvw,edge-dependent vertex weight):表示在一个超图中,同一顶点的权重是依赖于不同超边的,即在不同超边中,该顶点拥有不同的权重。
76.4)马尔科夫过程:是一类随机过程,其原始模型为马尔科夫链,马尔科夫过程是研究离散事件动态系统状态空间的重要方法,它的数学基础是随机过程理论。
77.为了更好地理解本技术实施例提供的模型确定方法,首先对相关技术中的超图处理模型及存在的缺点进行说明。
78.hgnn中超图卷积网络的信息汇集作用,在数学概念上,可以理解为一个最简单的超图随机游走模型,即其转移概率只取决于超边和顶点间邻接数量的大小,这样在很大程度上丢失了超图拓扑结构能够表示的细粒度信息,从而导致hgnn的处理性能不佳。
79.另一方面,在一个超图上,要想获得“长阶(long-term)”节点的信息聚合,需要加深卷积神经网络的层数。然而,现存的超图谱卷积神经网络[1,8],随着卷积层数的加深,节点的嵌入特征会趋于同质化,即节点间的特征逐渐收敛到一个固定的向量,这会造成下游分类任务的表现急剧下降。
[0080]
本技术实施例提供一种模型确定方法、装置、设备和计算机可读存储介质,能够提高不同输入信息在超图处理网络模型处理后得到的输出信息的差异度,从而避免出现“过平滑”问题。下面说明本技术实施例提供的计算机设备的示例性应用,本技术实施例提供的
计算机设备可以实施为笔记本电脑,平板电脑,台式计算机,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的用户终端,也可以实施为服务器。下面,将说明设备实施为服务器时示例性应用。
[0081]
参见图1,图1为本技术实施例提供的超图处理系统100的架构示意图,如图1所示,该超图处理系统100包括终端200、网络300和服务器400,终端200通过网络300连接服务器400,网络300可以是广域网或者局域网,又或者是二者的组合。
[0082]
在本技术实施例中,以超图处理系统为处理引文数据构成的超图为例进行说明。用户可以通过终端200将待发表或者待分类的论文数据通过网络300发送至服务器400,服务器400获取多个论文数据,并且基于多个论文数据构建超图,然后基于超图的拓扑结构信息确定随机游走状态转移矩阵,然后基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核,并确定所述随机游走状态转移矩阵对应的对称状态转移矩阵;之后基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子;最后获取预设的激活函数,利用所述激活函数和所述超图信号卷积算子生成超图处理网络模型,在确定折损马尔科夫核时引入了折损因子,进而基于对称状态转移矩阵和折损马尔科夫核确定出超图信号卷积算子能够削弱较远层级的影响,从而避免出现过平滑现象,提高不同输入信号经过生成的超图处理网络模型所输出的表示向量的差异性。在生成超图处理网络模型后,利用超图中已经具备标签信息的顶点信息作为训练数据,对超图处理网络模型进行训练,得到训练好的超图处理模型,然后再利用训练好的超图处理模型和训练好的分类模型,对超图中不具备标签信息的顶点进行进行分类,从而得到各个顶点的分类结果。由于通过训练好的超图处理模型能够提高不同输入信号对应表示向量的差异性,从而能够提高分类结果的准确度。
[0083]
在一些实施例中,服务器400可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。终端200可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能手表、车载智能终端、飞行器等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本技术实施例中不做限制。
[0084]
参见图2,图2为本技术实施例提供的服务器400的结构示意图,图2所示的服务器400包括:至少一个处理器410、至少一个网络接口420、总线系统430和存储器440。服务器400中的各个组件通过总线系统430耦合在一起。可理解,总线系统430用于实现这些组件之间的连接通信。总线系统430除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统430。
[0085]
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(dsp,digital signal processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
[0086]
存储器440可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器440可选地包括在物理位置上远离处理器410的一个或多个存储设备。
[0087]
存储器440包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(rom,read only me mory),易失性存储器可以是随机存取存储器(ram,random access memor y)。本技术实施例描述的存储器440旨在包括任意适合类型的存储器。
[0088]
在一些实施例中,存储器440能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
[0089]
操作系统441,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
[0090]
网络通信模块442,用于经由一个或多个(有线或无线)网络接口420到达其他计算设备,示例性的网络接口420包括:蓝牙、无线相容性认证(wifi)、和通用串行总线(usb,universal serial bus)等;
[0091]
在一些实施例中,本技术实施例提供的装置可以采用软件方式实现,图2示出了存储在存储器440中的模型确定装置443,其可以是程序和插件等形式的软件,包括以下软件模块:第一确定模块4431、第二确定模块4432、第三确定模块4433、第四确定模块4434和模型确定模块4435,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
[0092]
在另一些实施例中,本技术实施例提供的装置可以采用硬件方式实现,作为示例,本技术实施例提供的装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本技术实施例提供的模型确定方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic,application specif ic integrated circuit)、dsp、可编程逻辑器件(pld,programmable logic de vice)、复杂可编程逻辑器件(cpld,complex programmable logic device)、现场可编程门阵列(fpga,field-programmable gate array)或其他电子元件。
[0093]
将结合本技术实施例提供的服务器的示例性应用和实施,说明本技术实施例提供的模型确定方法。
[0094]
本技术实施例提供一种模型确定方法,应用于计算机设备,该计算机设备可以是服务器,还可以是终端。在本技术实施例中以计算机设备为服务器为例进行说明。图3为本技术实施例提供的模型确定方法的一种实现流程示意图,以下结合图3对各个步骤进行说明。
[0095]
步骤s101,获取基于待处理数据预先构建的超图,确定超图对应的随机游走状态转移矩阵。
[0096]
在本技术实施例中,待处理数据可以是待分类的数据,例如可以是待分类的论文数据,也可以是待分类的图像数据、待分类的视频数据等等。待处理数据可以是终端上传的,还可以是从其他服务器获取的。在获取到待处理数据后,首先基于待处理数据之间的关联关系构建超图。以待处理数据为论文数据为例进行说明,可以以论文间的引用关系或者以共同作者关系构建超图,并且在构建超图时,会根据论文作者的重要程度确定顶点的先验权重。在构建好超图后,可以获取各个超边的出度、入度、顶点的度,然后基于超边的出度、入度、顶点的度确定顶点之间随机游走的状态转移概率,从而得到超图对应的随机游走状态转移矩阵。
[0097]
步骤s102,基于该随机游走状态转移矩阵确定该超图对应的折损马尔科夫核。
[0098]
该步骤在实现时,首先引入折损因子,该折损因子为0到1之间的实数,然后基于随机游走状态转移矩阵确定从顶点u出发,在t步内游走到各个顶点的折损平均访问概率向量,并基于顶点u对应的折损平均访问概率向量和顶点v对应的折损平均访问概率向量确定顶点u和顶点v之间的折损马尔科夫距离,再基于折损马尔科夫距离确定折损马尔科夫核,通过该马尔科夫核可以得到输入空间到输出空间之间的特征映射关系,在后续步骤中可以通过该特征映射关系将输入信号映射至输出空间。
[0099]
步骤s103,确定该随机游走状态转移矩阵对应的对称状态转移矩阵。
[0100]
在确定随机游走状态转移矩阵对应的对称状态转移矩阵时,基于随机游走概率矩阵和超图的顶点度矩阵确定超图对应的带权邻接关系矩阵,再对所述带权邻接关系矩阵进行对称正则化转换,得到对称状态转移矩阵
[0101]
步骤s104,基于该对称状态转移矩阵和折损马尔科夫核确定超图信号卷积算子。
[0102]
该步骤在实现时,对于单个输入通道和对应的单个输出通道来说,首先对所述对称状态转移矩阵进行特征分解,得到特征矩阵,然后获取输入顶点的顶点特征向量、输入通道和输出通道对应的过滤器,并利用所述特征矩阵对所述顶点特征向量进行傅里叶变换得到第一变换结果,在本技术实施例中,由于过滤器的参数是未知的可学习参数,无法直接确定出对过滤器进行傅里叶变换的结果,因此在实现时基于折损因子和所述特征矩阵的特征值确定第二变换结果,其中第二变换结果为对所述过滤器进行傅里叶变换的结果,利用所述特征矩阵、第一变换结果和第二变换结果确定所述顶点特征向量通过所述过滤器的卷积结果,此时可以得到单个输入通道与单个输出通道之间的超图信号卷积算子。
[0103]
在本技术实施例中为了确定多个输入信道和多个输出信道之间的超图信号卷积算子,可以获取多个输入信道与多个输出信道之间的过滤器构成的卷积核,并基于所述折损马尔科夫核确定输入空间与输出空间之间的特征映射关系,最后基于所述对称状态转移矩阵、所述特征映射关系和所述卷积核确定输出信息和输入信息之间的超图信号卷积算子。
[0104]
步骤s105,获取预设的激活函数,利用该激活函数和超图信号卷积算子确定超图处理网络模型。
[0105]
其中,该激活函数可以是softmax函数,还可以是relu函数等。该步骤在实现时,为了保留顶点输入特征的原始信息,可以采用残差连接的思想,将第l层的顶点输入特征与第l层得到的卷积后的输出特征进行融合处理,再加入激活函数,得到超图处理网络模型。
[0106]
在本技术实施例提供的模型确定方法中,在获取到基于待处理数据预先构建的超图之后,确定所述超图对应的随机游走状态转移矩阵,然后基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核,并确定所述随机游走状态转移矩阵对应的对称状态转移矩阵;之后基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子;最后获取预设的激活函数,利用所述激活函数和所述超图信号卷积算子生成超图处理网络模型,在确定折损马尔科夫核时引入了折损因子,进而基于对称状态转移矩阵和折损马尔科夫核确定出的超图信号卷积算子能够削弱较远层级的影响,从而避免出现过平滑现象,提高不同输入信号经过生成的超图处理网络模型所输出的表示向量的差异性,进而能够保证在利用表示向量执行后续的下游任务所得到的结果的准确性。
[0107]
在一些实施例中,上述步骤s101中的“确定所述超图对应的随机游走状态转移矩阵”,可以通过以下步骤实现:
[0108]
步骤s1011,基于超图获取各个超边的先验权重、各个超边的出度、各个超边的入度、各个顶点进入对应超边过程中的第一超边依赖顶点权重和各个顶点流出对应超边过程中的第二超边依赖顶点权重。
[0109]
在本技术实施例中,在超图构建的过程中,会基于顶点间的关联关系确定超图的拓扑结构,并且会预先确定各个超边的先验权重,以及各个顶点进入对应超边过程中的第一超边依赖顶点权重和各个顶点流出对应超边过程中的第二超边依赖顶点权重。在确定出超图的拓扑结构之后,可以基于超图的拓扑结构和各个顶点进入对应超边过程中的第一超边依赖顶点权重确定出各个超边的出度、并基于超图的拓扑结构和各个顶点流出对应超边过程中的第二超边依赖顶点权重确定各个超边的入度,并基于超图的拓扑结构确定顶点的度。
[0110]
其中,超边e的出度δ
out
(e)可以用公式(1-1)计算得出:
[0111][0112]
其中,q
out
(v,e)表示由顶点v流出超边e过程中,顶点v的“超边依赖顶点权重(edvw),通过公式(1-1)可以得出,超边e的出度为流出超边e的各个顶点的超边依赖顶点权重之和。
[0113]
超边e的入度δ
in
(e)可以用公式(1-2)计算得出:
[0114][0115]
其中,q
in
(v,e)表示从顶点v进入超边e过程中顶点v的“超边依赖顶点权重(edvw),也即超边e的入度为流入超边e的各个顶点的超边依赖顶点权重之和。
[0116]
步骤s1012,获取预设的影响函数,并根据所述影响函数、各个超边的出度、各个超边的入度确定各个顶点的度。
[0117]
其中,该影响函数表征超边的出度或者超边的入度对顶点的度的影响类型。例如,该影响函数可以是线性函数、倒数函数等,影响函数的其作用是体现超边度(出度或入度)对顶点的度的不同形式的影响,如若该影响函数为ρ(x)=x,即体现超边的出度对顶点的度是正相关的影响,这个影响在不同数据构建的超图上是不一样的,该影响函数可以看成一个“超参数”。
[0118]
该步骤在实现时,可以通过公式(1-3)确定顶点u的度:
[0119][0120]
其中,ρ(δ
out
(e)表示超边的出度对顶点的度产生的影响类型,ρ(δ
in
(e)表示超边e的入度对顶点的度产生的影响类型。
[0121]
步骤s1013,基于各个超边的先验权重、各个超边的出度、各个超边的入度、各个顶点的度、各个顶点的第一超边依赖顶点权重、各个顶点的第二超边依赖顶点权重,确定各个顶点随机游走到其他顶点的游走概率。
[0122]
在实现时,可以通过公式(1-4)确定顶点u随机游走到顶点v的游走概率:
[0123][0124]
其中ω(e)为超边的先验权重。
[0125]
步骤s1014,基于各个顶点随机游走到其他顶点的游走概率确定随机游走状态转移矩阵。
[0126]
在确定出各个顶点随机游走到其他顶点的游走概率后,即可构建随机游走状态转移矩阵,其中该随机游走状态转移矩阵中的第u行第v列的元素表征从顶点u随机游走到顶点v的随机游走状态转移矩阵。
[0127]
通过上述的步骤s1011至步骤s1014,能够基于构建出的超图确定出顶点件的随机游走状态转移矩阵,为后续计算折损马尔科夫核提供必要的数据基础。
[0128]
在一些实施例中,上述步骤s102“基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核”,可以通过图4a所示的步骤s1021至步骤s1023实现,以下结合图4a对各个步骤进行说明。
[0129]
步骤s1021,基于该随机游走状态转移矩阵获取各个顶点对应的折损访问率向量。
[0130]
在实际应用中,该步骤在实现时,首先获取预设的折损因子,该折损因子可以是0到1之间的实数,例如,该折损因子可以为0.5、0.8等,折损因子的值越接近于0,说明折损率越高,反之,折损因子的值越接近于1,说明折损率越低。之后基于所述所述随机游走状态转移矩阵和所述折损因子确定从顶点u出发,经过t步随机游走到顶点v的折损平均访问概率;其中,u=0,2,

,(n-1);v=0,2,

,(n-1),t=0,2,

,(n-1),n为超图中的顶点总数,最后将从顶点u出发,经过t步随机游走到各个顶点的折损平均访问概率确定为顶点u对应的折损访问概率向量。
[0131]
在实际实现过程中,从顶点u出发,经过t步随机游走到顶点v的折损平均访问率可以通过公式(1-5)确定:
[0132][0133]
其中,pr(s(τ)=k|s(0)=i)表示随机游走过程从顶点u出发,经τ步到达顶点v的概率,它的值等于状态转移矩阵p的τ次方的第i行第j列的元素。
[0134]
顶点u对应的折损访问率向量可以表示为另外由于顶点u经过0步只能达到顶点u本身,因此其中ei是单位列向量。由于是矩阵的第i行,记因此可表示为公式(1-6):
[0135][0136]
步骤s1022,基于顶点u对应的折损访问率向量和顶点v对应的折损访问率向量,确定顶点u与顶点v之间的折损马尔科夫扩散距离。
[0137]
在实际应用过程中,可以利用公式(1-7)确定顶点u与顶点v之间的折损马尔科夫扩散距离:
[0138]
[0139]
顶点u与顶点v之间的折损马尔科夫扩散距离可以表征顶点u扩散到其他顶点以及顶点v扩散到其他顶点间的相似程度。
[0140]
步骤s1023,基于该折损马尔科夫扩散距离确定所述超图对应的折损马尔科夫核。
[0141]
该步骤在实现时,可以将公式(1-6)代入到公式(1-7),得到公式(1-8):
[0142][0143]
在本技术实施例中,将公式中的(1-8)中的z(t)z
t
(t)确定为折损马尔科夫核,记为k
md

[0144]
在一些实施例中,上述步骤s103“确定所述随机游走状态转移矩阵对应的对称状态转移矩阵”,可以通过图4b所示的步骤s1031至步骤s1033实现,以下结合图4对各个步骤进行说明。
[0145]
步骤s1031,基于该超图确定顶点度矩阵。
[0146]
在上述步骤s1012中已经确定出各个顶点的度,那么在该基础上即可确定出顶点度矩阵,在一些实施例中,顶点度矩阵用来表示,顶点度矩阵为对角矩阵,其对角线上的元素对应按照公式(1-3)确定出的顶点的度。
[0147]
步骤s1032,基于该随机游走概率矩阵和该顶点度矩阵确定该超图对应的带权邻接关系矩阵。
[0148]
由于超图中一条边连接有多个顶点,因此顶点间的邻接关系矩阵往往不能通过超图的拓扑结构直接得出,而超图对应的带权邻接关系矩阵可以通过公式(1-9)计算得出:
[0149][0150]
其中,p为随机游走状态转移矩阵。
[0151]
步骤s1033,对该带权邻接关系矩阵进行对称正则化转换,得到对称状态转移矩阵。
[0152]
该步骤在实现时,可以根据公式(1-10)对带权连接关系矩阵进行对称正则化转换,得到对称状态转移矩阵psym:
[0153][0154]
通过上式得到的对称状态转移矩阵与对称超图拉普拉斯矩阵l
sym
满足公式(1-11)所示的关系:
[0155]
l
sym
=i-p
sym
ꢀꢀꢀ
(1-11);
[0156]
对称超图拉普拉斯矩阵l
sym
有良好的谱性质,其特征值取值范围为[0,2],因此对称状态转移矩阵的取值范围为[-1,1],从而为后续设计的超图谱卷积神经网络的稳定性提供了理论保证。
[0157]
在一些实施例中,上述步骤s104“基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子”,可以通过以下步骤实现:
[0158]
步骤s1041,获取输入信道与输出信道之间的过滤器构成的卷积核。
[0159]
在本技术实施例中,假设有cin个输入信道,有cout个输出信道,那么输入信道与输出信道之间的过滤器构成的卷积核的维度为cin*cout。
[0160]
步骤s1042,基于所述折损马尔科夫核确定输入空间与输出空间之间的特征映射
关系。
[0161]
根据上述的公式(1-8)可知,折损马尔科夫核为z(t)z
t
(t),在本技术实施例中,将折损马尔科夫核中的z(t)确定为输入空间与输出空间之间的特征映射关系。
[0162]
步骤s1043,基于所述对称状态转移矩阵、所述特征映射关系和所述卷积核确定输出信息和输入信息之间的超图信号卷积算子。
[0163]
对于单个输入通道和对应的单个输出通道来说,在确定输入通道和输出通道之间的过滤器参数时,可以对所述对称状态转移矩阵进行特征分解,得到特征矩阵;并获取输入顶点的顶点特征向量、输入通道和输出通道对应的过滤器,再利用所述特征矩阵对所述顶点特征向量进行傅里叶变换得到第一变换结果,在本技术实施例中,由于过滤器是未知的,因此无法直接确定出过滤器对应的傅里叶变换的结果,因此在本技术实施例中,基于折损因子和所述特征矩阵的特征值确定第二变换结果,所述第二变换结果为对所述过滤器进行傅里叶变换的结果,并利用所述特征矩阵、第一变换结果和第二变换结果确定所述顶点特征向量通过所述过滤器的卷积结果,此时得到公式(1-13):
[0164][0165]
在公式(1-13)中,仅有一个未知参数θg,其中一个θg代表一对输入、输出信道间的过滤器的可学习参数。
[0166]
假设有cin个输入信道,有cout个输出信道,那么输入信道与输出信道之间的过滤器构成的卷积核θ的维度为cin*cout,由公式(1-13)可以得出超图上输出信息和输入信息之间的超图信号卷积算子为:
[0167][0168]
通过上述步骤s1041至步骤s1043,即基于所述对称状态转移矩阵和所述折损马尔科夫核确定出超图信号卷积算子,并且根据公式(1-14)可以看出,在折损因子的作用下i越大,那么αi的值就越小,此时输入信息对输出信息的影响也就越小,从而能够削弱较远输入信息的影响,进而通过该超图卷积算子能够提高不同输入信号经过生成的超图处理网络模型所输出的表示向量的差异性。
[0169]
在一些实施例中,上述步骤s105中的“利用所述激活函数和所述超图信号卷积算子确定超图处理网络模型”可以通过以下步骤实现:
[0170]
步骤s1051,获取残差连接超参数。
[0171]
其中,该残差连接超参数为0到1之间的实数。
[0172]
步骤s1052,利用所述超图信号卷积算子和第l层的输入信息确定所述第l层的卷积结果。
[0173]
其中,l=0,1,

,l,l为网络的预设层数;在本技术实施例中,假设第l层的输入信息为x
(l)
,将该第l层的输入信息代入公式(1-14),也即得到第l层的卷积结果为:
[0174]
步骤s1053,利用所述残差连接超参数将所述第l层的卷积结果和第l层的输入信
息进行融合处理,得到融合结果。
[0175]
该步骤在实现时,可以按照将所述第l层的卷积结果和第l层的输入信息进行融合处理,得到融合结果。也即残差连接超参数用于调节卷积结果与第l层的输入信息的融合程度,其中,残差连接超参数越接近与0.5,两者的融合程度越高,越接近于0或者越接近于1,融合程度越低。
[0176]
步骤s1054,将所述激活函数作用于所述融合结果,得到超图处理网络模型。
[0177]
假设激活函数为ψ(),那么第l层的输出信息(也即第(l+1)层的输入信息)可以用公式(1-15)得出:
[0178][0179]
由于得到了第l层的输入信息和第(l+1)层的输入信息(也即第l层的输出信息)之间的对应关系,那么也就得到了超图处理网络模型。在生成超图处理网络模型的过程中,引入马尔科夫扩散过程,并在此基础上提出“折损马尔科夫核”,并基于折损马尔科夫核确定超图卷积算子,能够解决因超图上的“长阶”信息聚合造成的“过平滑”问题,并且在计算超图对应的随机游走状态转移矩阵时利用了细粒度的超图拓扑信息,即超边依赖顶点权重,从而等同于基于该随机游走状态转移矩阵所确定出的用于计算超图卷积算子中所使用的对称状态转移矩阵也利用该细粒度信息,从而能够保证超图处理模型具备良好的处理性能。
[0180]
在一些实施例中,在通过上述步骤s101至步骤s105生成超图处理网络模型后,可以通过如图5所示的步骤s106至步骤s109对生成的超图处理网络模型进行训练,以下结合图5对步骤s106至步骤s109进行说明。
[0181]
步骤s106,从该超图中获取训练数据。
[0182]
所述训练数据包括训练顶点的顶点信息和所述训练顶点的标签信息,也就是说训练顶点是具备标签信息的顶点。训练顶点的标签信息可以是训练顶点的分类信息。例如超图是基于论文构建的,超图中的顶点为各个论文,训练顶点的标签信息可以是论文的分类信息,该分类信息可以是分类号。
[0183]
该步骤在实现时,可以确定超图中的各个顶点是否具备分类信息,并把具备分类信息的顶点确定为训练顶点,将分类信息确定为训练顶点的标签信息;将不具备分类信息的顶点确定为测试顶点。
[0184]
步骤s107,利用该超图处理网络模型对各个训练顶点的顶点信息进行处理,得到所述各个训练顶点的表示向量。
[0185]
训练顶点的顶点信息可以包括多维信息,例如可以包括顶点本身的信息,顶点的属性信息等,以顶点是论文为例,顶点信息可以包括论文的标题、论文的摘要、还可以包括论文的正文、作者等信息。该步骤在实现时,论文的标题、摘要、正文、作者可以作为该超图处理网络模型不同输入通道的输入信息,超图处理网络模型对各个输入通道的输入信息进行处理,得到对应的输出信息,也即得到各个训练顶点的表示向量,可以理解为训练顶点在输出空间的特征向量。
[0186]
步骤s108,获取训练好的分类模型,利用该训练好的分类模型对各个训练顶点的
表示向量进行预测处理,得到各个训练顶点对应的预测信息。
[0187]
该训练好的分类模型可以是神经网络模型,也可以是其他分类模型。例如可以是决策树模型、支持向量机模型、贝叶斯分类模型等。通过训练好的分类模型对训练顶点的表示向量进行预测处理,所得到的的预测信息可以是训练顶点的预测分类。
[0188]
步骤s109,利用所各个训练顶点的预测信息和各个训练顶点的标签信息对该超图处理网络模型进行训练,得到训练好的超图处理网络模型。
[0189]
该步骤在实现时,利用将所述预测信息和所述标签信息反向传播至该超图处理网络模型中,利用预设的损失函数对超图处理网络模型的参数进行调整,直至达到训练结束条件,从而得到训练好的超图处理网络模型。
[0190]
在通过上述步骤s106至步骤s109得到训练好的超图处理网络模型后,可以通过图5所示的步骤s109至步骤s112利用训练好的超图处理网络模型对超图中不具备标签信息的顶点进行预测,以下结合图5对各个步骤进行说明。
[0191]
步骤s110,从该超图中获取测试顶点的顶点信息。
[0192]
其中,测试顶点不具备分类信息,因此测试顶点为待分类的顶点。
[0193]
步骤s111,利用该训练好的超图处理网络模型对各个测试顶点的顶点信息进行处理,得到各个测试顶点的表示向量。
[0194]
步骤s112,利用该训练好的分类模型对各个测试顶点的表示向量进行预测处理,得到所各个测试顶点对应的预测信息。
[0195]
步骤s113,将各个测试顶点对应的预测信息确定为所述各个测试顶点的分类信息。
[0196]
通过上述步骤s110至步骤s113,能够利用训练好的超图处理模型对超图中不具备分类信息的测试顶点进行处理,以提取出测试顶点的表示向量,利用该训练好的超图处理模型对不同的输入信号进行处理所得到的表示向量之间的差异性较大,不易出现过平滑现象,进而能够提高在利用训练好的分类模型对不同输入信号的表示向量进行分类处理时所得到的分类信息的准确性。
[0197]
下面,将说明本技术实施例在一个实际的应用场景中的示例性应用。
[0198]
本技术实施例提供的模型确定方法,可应用于引文网络或者3d物体分类等场景中,以下对这两种场景进行说明。
[0199]
第一、引文网络:
[0200]
在学术文献中,论文之间的互相引用或者共同作者,构成了论文间的某种关系。在引文网络(citation network)中,顶点被定义为论文,边由论文间的引用关系或者共同作者构成。但是,简单地仅由论文两两间的引用关系,难以直接表达一些更高阶的隐式交互关系,因此通过一些先验知识构建超边,已被证明可以获得更强的表示能力。例如,论文数据库中(a)同作者(co-author ed)(如图6所示,对于作者为a的超边1有四个顶点,说明该论文数据库中包括作者a发表的4篇论文):被同一作者署名的所有论文(顶点)构成一条超边;(b)同引用关系(co-citation):引用同一篇论文的所有论文(顶点)构成一条超边。然而,同一顶点(论文)对于其不同作者(超边)来说,其重要性也不一样,例如,一篇论文对确定其第一作者(超边)的研究领域有比较重要的意义,但是对其他作者(超边)可能意义相对较小。这就是edvw信息,即在一个超图中,一个顶点的权重在不同超边中的体现是不同的。
[0201]
第二、3d-视觉物体分类:
[0202]
在3d-视觉物体分类(3d-visual object classification)中,为构建超图,每个3d物体是一个顶点。这些3d物体从多个视角拍下照片,利用不同的图像处理技术手段来提取顶点特征。为了提取物体间的高阶相似信息,需要构建超图来表示它们。构建超边的一般技术是:在顶点特征空间上定义一个距离,将任一物体(顶点)j作为中心点,利用k近邻算法,选出最相邻的k个顶点,以j和其k个邻居的特征距离作为顶点权重,构建一个超边度(超边中的顶点数目)为k的超边。由此可知,edvw信息是很自然地被这样的超图构建方法引入到构建的超图中:因为对同一个物体i来说,其顶点特征和其他物体顶点特征的欧式距离在细粒度的尺度上一般是不同的,也就是说在以其他不同物体为中心构建的不同超边中,i的权重不同。
[0203]
在本技术实施例中,基于广义超图随机游走的视角,定义了一个“折损马尔科夫扩散核”及其特征映射,并随之导出一个新的超图谱卷积神经网络:简易超图谱卷积神经网络(shsc)。在本技术实施例中,一个超图记为h,顶点集合记为v,超边集合记为ε。记m为一个马尔科夫过程,p为m上的状态转移概率矩阵。图7为本技术实施例提供的超图谱卷积神经网络的生成过程示意图,如图7所示,该生成过程包括:
[0204]
步骤s701,创建edvw超图。
[0205]
步骤s702,确定edvw超图随机游走状态转移概率矩阵。
[0206]
在本技术实施例中提出一种新的“统一超图随机游走”定义的游走概率(由顶点u到顶点v)的计算方式,可由公式(2-1)表示:
[0207][0208]
其中ω(e)为超边的先验权重;q
in
(u,e)表示由顶点u进入超边e过程中顶点u的“超边依赖顶点权重(edvw)、q
out
(v,e)表示由顶点v流出超边e过程中,顶点v的“超边依赖顶点权重(edvw)、q
in
(v,e)表示从顶点v进入超边e过程中顶点v的“超边依赖顶点权重(edvw)、q
out
(u,e)表示由顶点v流出超边e过程中,顶点u“超边依赖顶点权重(edvw)”,δ
out
(e)表示超边e的出度,δ
in
(e)表示超边e的入度,d(u)表示顶点u的度,ρ(
·
)是任意函数,其作用是体现超边度δ(e)对顶点出度d(u)的不同形式的影响,如若ρ(x)=x,即体现正相关的影响,这个影响在不同数据构建的超图上是不一样的,可以看成一个“超参数”。
[0209]
其中,超边e的出度可以用公式(2-2)表示:
[0210][0211]
超边e的出度可以用公式(2-3)表示:
[0212][0213]
顶点u的度可以用公式(2-4)表示:
[0214][0215]
基于公式(2-1)示出的顶点u到顶点v的随机游走概率,可以得到超图对应的概率转移矩阵:
[0216][0217]
其中,以及都是对角矩阵,其对角线上的元素分别对应上述定义的超边出度、入度以及顶点的度。
[0218]
步骤s703,基于超图随机游走状态转移概率矩阵确定对称状态转移矩阵。
[0219]
公式(2-5)示出的概率转移矩阵对应一个超图上顶点的带权邻接关系矩阵(weighted adjacency matrix),如公式(2-6)所示:
[0220][0221]
对公式(2-6)利用对称行正则化技巧(symmetrical row normalize trick),得到“对称状态转移矩阵”,如公式(2-7)所示:
[0222][0223]
这里需要强调一下,利用上述对称技巧得到p
sym
的原因是,p
sym
背后的对称超图拉普拉斯矩阵,如公式(2-8)所示:
[0224][0225]
对称超图拉普拉斯矩阵有良好的谱性质,l
sym
的特征值取值范围为[0,2],这为后面设计的超图谱卷积神经网络的稳定性提供了理论保证。
[0226]
步骤s704,对对称状态转移矩阵进行谱分解,得到特征矩阵。
[0227]
在本技术实施例中,记特征矩阵u=(u1,u2,...,un),其中ui为l
sym
的特征向量(注意也为p
sym
的特征向量)。
[0228]
步骤s705,利用特征矩阵对特征x进行超图傅里叶变换及逆变换。
[0229]
在本技术实施例中,定义在超图上的傅里叶变换如公式(2-9)所示,逆变换如公式(2-10)所示:
[0230][0231][0232]
其中,x∈rn是超图顶点上的一个频域信号,是变换后的谱域信号。
[0233]
步骤s706,确定折损平均访问率。
[0234]
在本技术实施例中,定义“折损平均访问率(discounted average visiting rate)”通过公式(2-11)确定:
[0235][0236]
其中,pr(s(τ)=k|s(0)=i)表示随机游走过程从顶点u出发,经τ步到达顶点v的概率,它的值等于状态转移矩阵p的τ次方的第i行第j列的元素。总体来说,公式(2-11)表示超图上的随机游走从顶点u出发,在t步内游走到顶点v的“折损平均访问概率”。在公式(2-11)中引入折损因子α,以缓解超图“长阶(long-term)”信息聚合而造成的过平滑问题。
[0237]
于是,对任意顶点u来说,从其本身出发,到达超图上各点的“折损平均访问率
(average visiting rate)”可以表示为向量:特别地,在本技术实施例中定义如果u=v,否则即其中ei是单位列向量。由于是矩阵的第i行,记因此可表示为公式(2-12):
[0238][0239]
步骤s707,确定折损马尔科夫扩散距离。
[0240]
在本技术实施例中,定义“折损马尔科夫扩散距离(discounted markov di ffusion distance)”,如公式(2-13)所示:
[0241][0242]
公式(2-13)表示,在第t步游走时,顶点u扩散到其他顶点以及顶点v扩散到其他顶点间的相似程度,如果利用(2-13)确定出的距离很小,说明顶点u和顶点v在扩散过程中对其他顶点的影响相似。这个距离能够描述顶点间信息汇集、流动的相似程度。
[0243]
步骤s708,确定折损马尔科夫核和特征映射。
[0244]
在该步骤中,通过将公式(2-12)带入(2-13)中,可以得到:
[0245][0246]
从公式(2-14)所示的折损马尔科夫扩散距离,可以得到“折损马尔科夫扩散核”,如公式(2-15)所示:
[0247][0248]
这里,k
md
即为“折损马尔科夫扩散核”,而z(t)是这个核空间上的特征映射(feature map),即任意超图上的信号x,通过z(t)x将信号映射到这个核空间中。
[0249]
步骤s709,利用折损马尔科夫核特征映射多项式、过滤器g和特征x进行超图卷积运算。
[0250]
在本技术实施例中,定义超图上的卷积运算如公式(2-16)所示:
[0251]
(g*x)h=u((u
t
g)

(u
t
x))
ꢀꢀꢀ
(2-16);
[0252]
这里,是超图上一个输入信道到一个输出信道的过滤器。
[0253]
在实现时,结合公式(2-15)中特征映射的形式,如同gcn一样,利用p
sym
=i-l
sym
特征值λ
p
(取值范围[-1,1])的多项式来估计
[0254]
其中,一个θg代表一对输入、输出信道间的过滤器可学习参数。
[0255]
步骤s710,确定超图信号卷积算子。
[0256]
假设超图上的输入信号有c
in
个信道(channel),输出信号x
out
有c
out
个信道,于是用表示所有过滤器构成的卷积核,由公式(2-17),得出超图上输入信号和输出信号间的卷积算子为:
[0257][0258]
步骤s711,生成简易超图谱卷积神经网络。
[0259]
为了保留顶点输入特征的原始信息,在本技术实施例中,采用残差连接的思想,将顶点输入特征的原始信息融入卷积后的输出特征,再加入激活函数ψ,以及代入得到“简易超图谱卷积神经网络(shsc)”的最终形式:
[0260][0261]
其中x
(l)
是网络第l层的输入;θ是网络中可学习的卷积核参数,ψ是选取的激活函数,β是超参数,调节卷积后的特征与原始特征的融合程度。
[0262]
通过上述步骤s701至步骤s711,即可生成简易超图谱卷积神经网络,该超图谱卷积神经网络用于获取待分类对象的表示向量,然后利用训练好的分类子模块对该表示向量进行分类处理,得到分类结果。
[0263]
表1、引文网络识别实验结果-分类准确率
[0264][0265]
通过表1可以看出,本技术实施例提供的超图谱卷积神经网络(shsc)的性能(准确率)在全部5个数据集上都很大程度地超越了现存的超图卷积神经网络。
[0266]
表2、3d-视觉物体识别实验结果-分类准确率
[0267][0268][0269]
通过表2可以看出,shsc在两个数据集共6种超图构建方法下,其中5种超越了现存其他超图神经网络方法。
[0270]
表3、引文网络中超图卷积模型的过平滑现象
[0271][0272]
通过表3可以看出,现存的超图卷积神经网络hgnn、hypergcn都遭受过平滑现象,并且随着网络层数(layers)的增加,可以看到分类准确率在下降,而本技术实施例提供的shsc并不出现这样的现象。
[0273]
在本技术实施例中,将马尔科夫扩散过程引入超图,并在此基础上提出“折损马尔科夫核”,进而结合“超边依赖顶点权重
”‑
超图随机游走,生成一种简易超图谱卷积神经网络模型,该模型在下游的图顶点分类任务上取得当前超图神经网络社区中最佳的表现,通过引入的“折损马尔科夫核”能够克服当前超图神经网络模型面临的“过平滑”问题,另外基于“超边依赖顶点权重
”‑
超图随机游走还能够捕获细粒度的超图拓扑信息,这些细粒度的信息为模型能够得到当前最好性能提供了保障。
[0274]
可以理解的是,在本技术实施例中,涉及到用户信息的内容,例如,论文内容等相关的数据,当本技术实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0275]
下面继续说明本技术实施例提供的模型确定装置443的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器440的模型确定装置443中的软件模块可以包括:
[0276]
第一确定模块4431,用于获取基于待处理数据预先构建的超图,确定所述超图对应的随机游走状态转移矩阵;
[0277]
第二确定模块4432,用于基于所述随机游走状态转移矩阵确定所述超图对应的折损马尔科夫核,
[0278]
第三确定模块4433,确定所述随机游走状态转移矩阵对应的对称状态转移矩阵;
[0279]
第四确定模块4434,用于基于所述对称状态转移矩阵和所述折损马尔科夫核确定超图信号卷积算子;
[0280]
模型确定模块4435,用于获取预设的激活函数,利用所述激活函数和所述超图信号卷积算子生成超图处理网络模型。
[0281]
在一些实施例中,该第一确定模块,还用于:
[0282]
基于所述超图,获取各个超边的先验权重、出度、入度、所述各个顶点进入超边过程中的第一超边依赖顶点权重和流出超边过程中的第二超边依赖顶点权重;
[0283]
获取预设的影响函数,并根据所述影响函数、所述各个超边的出度、入度确定各个顶点的度,所述影响函数表征超边的出度或超边的入度对顶点的度的影响类型;
[0284]
基于所述各个超边的先验权重、出度、入度,和各个顶点的度、各个顶点的第一超边依赖顶点权重、第二超边依赖顶点权重,确定所述各个顶点随机游走到其他顶点的游走概率;
[0285]
基于所述各个顶点随机游走到其他顶点的游走概率确定随机游走状态转移矩阵。
[0286]
在一些实施例中,该第二确定模块,还用于:
[0287]
基于所述随机游走状态转移矩阵获取各个顶点对应的折损访问率向量;
[0288]
基于顶点u对应的折损访问率向量和顶点v对应的折损访问率向量,确定顶点u与顶点v之间的折损马尔科夫扩散距离;其中,u=0,1,2,

,(n-1);v=0,1,2,

,(n-1),n为超图中的顶点总数;
[0289]
基于所述折损马尔科夫扩散距离确定所述超图对应的折损马尔科夫核。
[0290]
在一些实施例中,该第二确定模块,还用于:
[0291]
获取预设的折损因子;
[0292]
基于所述所述随机游走状态转移矩阵和所述折损因子确定从顶点u出发,经过t步随机游走到顶点v的折损平均访问概率;t=0,1,2,

,(n-1);
[0293]
将从顶点u出发,经过t步随机游走到各个顶点的折损平均访问概率确定为顶点u对应的折损访问概率向量。
[0294]
在一些实施例中,该第三确定模块,还用于:
[0295]
基于所述超图确定顶点度矩阵;
[0296]
基于所述随机游走概率矩阵和所述顶点度矩阵确定所述超图对应的带权邻接关系矩阵;
[0297]
对所述带权邻接关系矩阵进行对称正则化转换,得到对称状态转移矩阵。
[0298]
在一些实施例中,该第四确定模块,还用于:
[0299]
获取输入信道与输出信道之间的过滤器构成的卷积核;
[0300]
基于所述折损马尔科夫核确定输入空间与输出空间之间的特征映射关系;
[0301]
基于所述对称状态转移矩阵、所述特征映射关系和所述卷积核确定输出信息和输入信息之间的超图信号卷积算子。
[0302]
在一些实施例中,该模型确定模块,还用于:
[0303]
获取残差连接超参数;
[0304]
利用所述超图信号卷积算子和第(l+1)层的输入信息确定所述第(l+1)层的卷积结果;其中,l=0,1,

,l,l为网络的预设层数;
[0305]
利用所述残差连接超参数将所述第(l+1)层的卷积结果和第l层的输出信息进行融合处理,得到融合结果;
[0306]
将所述激活函数作用于所述融合结果,得到超图处理网络模型。
[0307]
在一些实施例中,该装置还包括:
[0308]
第一获取模块,用于从所述超图中获取训练数据,所述训练数据包括训练顶点的顶点信息和所述训练顶点的标签信息;
[0309]
第一处理模块,用于利用所述超图处理网络模型对各个训练顶点的顶点信息进行处理,得到所述各个训练顶点的表示向量;
[0310]
第一预测模块,用于获取训练好的分类模型,利用所述分类模型对所述各个训练顶点的表示向量进行预测处理,得到所述各个训练顶点对应的预测信息;
[0311]
模型训练模块,用于利用所述各个训练顶点的预测信息和所述各个训练顶点的标签信息对所述超图处理网络模型进行训练,得到训练好的超图处理网络模型。
[0312]
在一些实施例中,该装置还包括:
[0313]
第二获取模块,用于获取所述超图中获取测试顶点的顶点信息,所述测试顶点不具备标签信息;
[0314]
第二处理模块,用于利用所述训练好的超图处理网络模型对各个测试顶点的顶点信息进行处理,得到所述测试顶点的表示向量;
[0315]
第二预测模块,用于利用所述训练好的分类模型对所述各个测试顶点的表示向量进行预测处理,得到所述各个测试顶点对应的预测信息;
[0316]
第五确定模块,用于将所述各个测试顶点对应的预测信息确定为所述各个测试顶点的分类信息。
[0317]
需要说明的是,本技术实施例针对模型确定装置的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本装置实施例中未披露的技术细节,请参照本技术方法实施例的描述而理解。
[0318]
本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术实施例上述的模型确定方法。
[0319]
本技术实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本技术实施例提供的模型确定方法,例如,如图3、图4a、图4b和图5示出的方法。
[0320]
在一些实施例中,计算机可读存储介质可以是fram、rom、prom、eprom、eeprom、闪存、磁表面存储器、光盘、或cd-rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
[0321]
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
[0322]
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在
保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(html,hyper text markup language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
[0323]
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
[0324]
以上所述,仅为本技术的实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1