信息处理装置、信息处理方法以及存储介质与流程

文档序号:22688602发布日期:2020-10-28 12:58阅读:157来源:国知局
信息处理装置、信息处理方法以及存储介质与流程

本发明的实施方式关于信息处理装置、信息处理方法以及存储介质。



背景技术:

近年来,进行了将人工智能运用于产业领域的尝试。其利用被研究的人工智能技术多是深度学习及其相关技术,适用范围扩展至图像识别、故障分析、特性预测等。

特别是,图像识别中积极地进行了运用卷积神经网络(cnn;convolutionalneuralnetwork)的研究和实际应用。cnn中,对于图像的各像素点实施使用了附近的像素信息的过滤器处理(卷积处理、池化(pooling)处理)后,通过输入至全连接(fullconnection)的神经网络,能够实现提高计算的效率化和精度。可以认为作为过滤器处理的卷积、池化是将实际的视觉系统的结构反映到神经网络的结构中的处理,该实际的视觉系统的结构是指实际的视觉区上的感受野上的处理仅以附近的视觉细胞的信号为对象的局部处理。该过滤器处理中,由视觉区整体来分散并列地进行相同的处理。并且,在反映了视觉系统的神经网络中,各像素彼此的连接结构至少作为刚刚输入后的处理而成为具有局部连接图(graph)结构的处理。与之相关,为了将图结构的数据适用于人工智能,正在进行反映了图结构的神经网络的研究(参照非专利文献1)。

然而,在以往的反映了图结构的神经网络的技术中,存在无法应对大规模化、多样性、变动性等需求的情况。

现有技术文献

非专利文献

非专利文献1:“graphattentionnetworks”。petarvelickovicetal,publishedasaconferencepaperaticlr2018



技术实现要素:

发明要解决的课题

本发明要解决的课题是提供一种能够应对更广泛的需求的信息处理装置、信息处理方法、以及存储介质。

用于解决课题的手段

实施方式的信息处理装置具有数据取得部和网络处理部。数据取得部取得包含多个真实节点和一个以上的真实边缘的图结构数据,所述真实边缘连接所述多个真实节点中的两个。网络处理部基于所述数据取得部所取得的图结构的数据,执行在神经网络中使多个虚拟节点各自的第k-1层的特征量至少传播到其他虚拟节点的第k层的特征量的处理,所述多个虚拟节点包含所述多个真实节点以及所述一个以上的真实边缘,所述其他虚拟节点与所述各个虚拟节点有连接关系(k为1以上的自然数)。

附图说明

图1是表示通过以往的构思从图结构的数据生成神经网络的样子的图。

图2是表示通过第一实施方式的方法从图结构的数据生成神经网络的样子的图。

图3是用于对信息处理装置决定系数αi,j的方法进行说明的图。

图4是第一实施方式的信息处理装置的框图。

图5是表示虚拟节点an的种类的定义的一个例子的图。

图6是表示通过第二实施方式的方法从图结构的数据生成的神经网络的图。

图7是表示根据对象数据的变更而变更神经网络的样子的图。

图8是第二实施方式的信息处理装置的框图。

图9是用于对将第二实施方式适用于电力输电配电网的样子进行说明的图。

图10是表示变形例的神经网络的一个例子的图。

具体实施方式

以下,参照附图对实施方式的信息处理装置、信息处理方法、以及程序进行说明。

首先,对信息处理装置制作的神经网络的原理进行说明。图1是表示通过以往的构思从图结构的数据生成神经网络的样子的图。

图1的上图示意性地示出了图结构的数据。图示的构成中存在真实节点rn1~rn4。“真实节点”是用于与后述的“虚拟节点”区分的概念,意味着信息处理装置所取得的图结构的数据(处理对象数据、元数据)中的节点。真实节点rn1具有特征量h1,真实节点rn2具有特征量h2,真实节点rn3具有特征量h3,真实节点rn4具有特征量h4。特征量例如是向量,但在本说明书以及附图中,标量和向量在表述上不进行区分。

图1的上图中,真实节点rn1与真实节点rn2在真实边缘re12上被连接,真实节点rn1与真实节点rn3在真实边缘re13上被连接,真实节点rn1与真实节点rn4在真实边缘re14上被连接,真实节点rn2与真实节点rn3在真实边缘re23上被连接。“真实边缘”是用于与后述的“虚拟边缘”区分的概念,意味着信息处理装置所取得的图结构的数据的边缘。这里的“被连接”意味着相互的特征量在下一个状态下对双方的特征量互相带来影响的关系。该定义以无向图作为前提,但在处理有向图的情况下,“被连接”意味着一方的特征量在下一个状态下对另一方的特征量带来影响的关系。

图1的下图是表示基于图1的上图所示的图结构的数据所生成的神经网络的一个例子的图。h1#、h2#、h3#、h4#分别是真实节点rn1、rn2、rn3、rn4各自的特征量的、中间第1层的特征量。如图所示,图1的上图中的真实边缘re原样地成为神经网络的连接结构。特征量h1#如式(1)所示。式中,α1,1~α1,4是表示传播程度的系数。由此,某真实节点rn的第k层的特征量通过相对于有连接关系的其他真实节点rn以及该真实节点rn自身的、k-1层的特征量分别乘以系数与传播矩阵w并合计而求得。关于传播矩阵将后述。

h1#=α1,1·w·h1+α1,2·w·h2+α1,3·w·h3+α1,4·w·h4…(1)

(第一实施方式)

图2是表示通过第一实施方式的方法从图结构的数据生成神经网络的样子的图。如图所示,第一实施方式的信息处理装置不仅设定包含真实节点rn的虚拟节点an,还设定包含真实边缘re的虚拟节点an,并生成神经网络,该神经网络是使虚拟节点an的第k-1层的特征量传播到有连接关系的其他虚拟节点an的第k层的特征量、以及该虚拟节点an自身的第k层的特征量的神经网络。k为1以上的自然数,k=0的层例如意味着输入层。

信息处理装置例如基于式(2)决定中间第1层的特征量。式(2)相当于虚拟节点(rn1)的中间第1层的特征量h1#的计算方法。作为一个例子,α1、12是表示虚拟节点(rn1)与虚拟节点(re12)之间的传播程度的系数。虚拟节点(rn1)的中间第2层的特征量h1##如式(3)所示。中间第3层以后也依次以同样的规则决定特征量。

h1#=α1,1·w·h1+α1,12·w·h12+α1,13·w·h13+α1,14·w·h14…(2)

h1##=α1,1·w·h1#+α1,12·w·h12#+α1,13·w·h13#+α1,14·w·h14#…(3)

信息处理装置例如通过基于图注意力网络(graphattentionnetwork)的规则决定系数αi,j。图3是用于对信息处理装置决定系数αi,j的方法进行说明的图。信息处理装置将向量(whi,whj)输入到单独神经网络a(注意力),该向量(whi,whj)结合了传播源的虚拟节点rni的特征量hi乘以传播矩阵w而得的向量whi与传播目标的虚拟节点rnj的特征量hj乘以传播矩阵w而得的向量whj,并将输出层的向量输入到s型函数(sigmoid函数)、relu、归一化指数函数(softmax函数)等的激励函数并归一化并全部相加,从而导出系数αi,j。个别神经网络a是关于成为分析对象的现象预先求得参数等的神经网络。

信息处理装置以一边依照上述的规则,一边按照神经网络的目的的方式决定神经网络的参数(w,αi,j)。神经网络的目的是在以虚拟节点an作为现在的状态的情况下输出将来的状态,或者是输出用于评价现在的状态的指标,或者是对现在的状态进行分类。

图4是第一实施方式的信息处理装置1的框图。信息处理装置1例如具备数据取得部10、网络处理部30、以及输出部60。这些功能部例如通过cpu(centralprocessingunit)等的硬件处理器来执行程序(软件)来实现。这些构成要素中的一部分或者全部可以通过lsi(largescaleintegration,大规模集成电路)、asic(applicationspecificintegratedcircuit,专用集成电路)、fpga(field-programmablegatearray,现场可编程门阵列)、gpu(graphicsprocessingunit)等的硬件(回路部;包含circuitry(电路系统))来实现,也可以通过软件与硬件的协作来实现。程序可以预先保存于hdd(harddiskdrive)、闪存等的存储装置中,也可以保存于dvd、cd-rom等的能够装卸的存储介质中,并且通过将存储介质装载于驱动器装置而安装。

数据取得部10例如从外部装置取得图结构的数据20,使该图结构的数据20存储于存储部。存储部例如通过ram(randomaccessmemory)、hdd(harddiskdrive),闪存等实现。图结构的数据20例如是使如图1、图2的上图所示的那样的图结构作为真实节点rn和真实边缘re的各自的记录而表现的数据。图结构的数据20也可以被赋予作为各个真实节点rn的初始状态的特征量。作为真实节点rn的初始状态的特征量也可以作为与图结构的的数据20不同的数据组而被准备。数据取得部10也可以取代从外部装置取得图结构的数据20而取得预先存储于存储部的图结构的数据20(读出),也可以取得用户使用输入器件输入的图结构的数据20。

网络处理部30例如具备真实节点真实边缘邻接关系提取部32、虚拟节点元图(metagraph)化部36、以及元图卷积(metagraphconvolution)部40。

真实节点真实边缘邻接关系提取部32参照图结构的数据20提取有邻接关系(连接关系)的真实节点rn和真实边缘re。例如真实节点真实边缘邻接关系提取部32对于各个真实节点rn以及真实边缘re网罗式地提取有邻接关系(连接关系)的真实节点rn或者真实边缘re,将它们以建立了对应地形式存储于存储部。

虚拟节点元图化部36,以由真实节点真实边缘邻接关系提取部32所提取的真实节点rn和真实边缘re被连接的方式生成将虚拟节点an状态层状地相连的神经网络。此时,虚拟节点元图化部36以一边依照基于上述图注意力网络的规则,一边按照上述神经网络的目的的方式决定传播矩阵w以及系数αi,j。

元图卷积部40例如将虚拟节点an中的作为真实节点rn的初始值的特征量输入到神经网络,导出各层的虚拟节点an的状态(特征量)。通过重复执行上述内容,输出部60将虚拟节点an的特征量输出到外部。

根据以上说明的第一实施方式,能够应对更加广泛的需求。

(第二实施方式)

以下,对第二实施方式进行说明。第二实施方式中,信息处理装置对于成为虚拟节点an的源的真实节点rn和真实边缘的至少一方设定种类(换言之,对于虚拟节点an设定种类),按种类变更设定系数时的规则。更具体而言,信息处理装置按虚拟节点an的种类使用于决定系数αi,j的传播矩阵w不同,该系数αi,j规定从该虚拟节点an传播的特征量。

图5是表示虚拟节点an的种类的定义的一个例子的图。该例中,第二实施方式的信息处理装置对于作为真实节点rn的虚拟节点设定a、b二种的种类,对于作为真实边缘re的虚拟节点设定l、t二种的种类。图5的上图表示图结构的数据20的内容的一个例子,图5的下图示意性地表示将真实节点rn和真实边缘re变换为虚拟节点an的样子。

种类为“a”的真实节点rn(a)仅与种类为“l”真实边缘re(l)连接。

种类为“b”的真实节点rn(b)与种类为“l”的真实边缘re(l)和种类为“t”的真实边缘re(t)双方连接。

种类为“l”的真实边缘re(l)和种类为“t”的真实边缘re(t)与连接于自身的真实节点rn的特征量的传播特性相互不同。

接续a,b,l,t的数字是真实节点rn、真实边缘re、虚拟节点an的标识符。以下,使a1,b1,l1,t2等的附图标记作为虚拟节点an的标识符,并且,表示它们的特征量。

图6是表示通过第二实施方式的方法从图结构的数据20生成的神经网络的图。关于神经网络的生成规则与第一实施方式相同,但是第二实施方式的信息处理装置按虚拟节点an的种类使用于决定系数αi,j的传播矩阵w不同,该决定系数αi,j规定从该虚拟节点an传播的特征量。具体而言,信息处理装置对从作为真实节点rn(a)的虚拟节点an传播的特征量适用传播矩阵wa,对从作为真实节点rn(b)的虚拟节点an传播的特征量适用传播矩阵wb,对从作为真实边缘re(l)的虚拟节点an传播的特征量适用传播矩阵wl,对从作为真实节点re(t)的虚拟节点an传播的特征量适用传播矩阵wt。各个传播矩阵wa,wb,wl,wt也可以按层而不同。

由此,能够更加正确地跟踪真实节点rn、真实边缘re的特性的不同,并正确地预测虚拟节点an的状态(特征量)。

根据第一或者第二实施方式的信息处理装置,能够对对象数据的变更灵活地应对。图7是表示根据对象数据的变更而变更神经网络的样子的图。图7的上图的例子与图5的例子相比,追加有连接真实节点rn(b1)与真实节点rn(b2)的真实边缘re(t2)。该情况下,如图7的下图所示,在神经网络中追加虚拟节点an(t2),并且追加将虚拟节点an(t2)与虚拟节点an(b1)、an(b2)及虚拟节点an(t2)自身连接的虚拟边缘ae即可。因而,能够对对象数据的变更灵活地应对。

图8是第二实施方式的信息处理装置2的框图。信息处理装置2与第一实施方式相比,例如进一步具备种类设定部34。种类设定部34例如通过cpu等的硬件处理器执行程序(软件)来实现。这些构成要素中的一部分或者全部可以通过lsiasic、fpga、gpu等的硬件(回路部;包含circuitry)来实现,也可以通过软件与硬件的协作来实现。程序可以预先保存于hdd、闪存等的存储装置中,也可以保存于dvd、cd-rom等的能够装卸的存储介质中并且通过将存储介质装载于驱动器装置而安装。

种类设定部34参照由真实节点真实边缘邻接关系提取部32所提取的结果,对真实节点rn以及真实边缘re的各个赋予上述那样的种类。

虚拟节点元图化部36根据基于上述图注意力网络的规则,并且根据特征量的传播源的种类适用传播矩阵w,决定系数αi,j。

关于其他构成要素的功能与第一实施方式相同。

根据以上说明的第二实施方式,能够应对更广泛的需求。

上述的构成适合分析社会基础设施的状态。例如通过将电力输电配电网、上下水道网等的分析对象作为图结构而捕捉,从而能够进行正确的分析。

图9是用于对将第二实施方式适用于电力输电配电网的样子进行说明的图。图示的构成包含总线(日语原文:バス)1~总线4。总线是指电力的供给源、需求者所连接的“位置”那样的概念。总线1与总线2之间设有变压器。总线2连接有60[mw]的需求者。总线2与总线3之间通过70[km]的电力线连接。总线3连接有发电机和70[mw]的需求者。总线2与总线4之间通过40[km]的电力线连接,总线3与总线4之间通过50[km]的电力线连接。总线4连接有发电机和10[mw]的需求者。在这样的构成中,若以总线为真实节点、变压器为种类「t」的真实边缘、电力线为种类「l」的真实边缘来考虑,则能够通过图7所示的图结构的数据以及神经网络来分析状态。该情况下,作为基于真实节点rn的对于虚拟节点an输入的输入属性有种类、连接的负荷、并联电阻等。作为基于种类「t」的真实边缘re的对于虚拟节点an输入的输入属性有回路常数,作为基于种类「l」的真实边缘re的对于虚拟节点an输入的输入属性有距离、单元自由度等。输入属性是特征量中的静态信息。

对于被图结构模拟的社会基础设施,通过神经网络进行分析处理的情况下,优选满足以下的要件。

1.大规模性

对社会基础设施的适用基本上需要规模的大小和扩张性。例如,若考虑电力输电配电网,存在成为总线(设备机器、需要负荷等的连接点)数为1万以上的大规模回路网。

2.多样性

应用了以往的神经网络的输入信息大多为均匀的属性信号。例如,图像处理情况下,输入是像素信号这一种类的信息或是其特征信号。然而,社会基础设施的情况下,存在其输入信号数(纬度)为数千以上的情况,网络层也存在为几十层这样的较大规模的情况。若考虑上述的电力输电配电网,则是发电机、变压器、负荷、变换器(日语原文:トランス)、电线等多种的设备相连的大规模系统。

3.变动性

通常,社会基础设施自身的运作期间长,其间机器的维护、改进、置换被反复进行,并且每次进行运作管理的重新评价、投资研究。对于这样的社会基础设施的局部改善、变更,正在寻求不进行模型的再学习就能够跟踪的功能。

与之相对,实施方式的信息处理装置通过在多个虚拟节点an之间共用使用传播矩阵w,不需要网罗式地搜索关于传播的参数,因此,即使分析对象为大规模也能够抑制处理负荷的增大。通过对于虚拟节点an设定种类,并且根据种类使传播矩阵w不同,从而能够应对多样性的要求。由于将神经网络中的连接数限定于原始的图结构的数据中有邻接关系(连接关系)的图结构的数据,因此也能够应对变动性的要求。

(第一或者第二实施方式的变形例)

上述各实施方式中使真实节点rn和真实边缘re为虚拟节点后,将它们在神经网络上不区分而进行处理,但也可以将对于基于真实节点rn的虚拟节点an的处理和对于基于真实边缘re的虚拟节点an的处理一边错开定时一边交替地进行。图10是表示变形例的神经网络的一个例子的图。通过该构成,能够将某真实节点rn的状态更迅速传播到邻接(经由一个真实边缘而连接)的其他真实节点。该情况下,对于从真实边缘的传播,也可以以与图注意力网络的规则不同的规则使信息传播。

根据以上说明至少一个实施方式,通过具有:数据取得部10,取得包含多个真实节点rn和一个以上的真实边缘re的图结构的数据20,该一个以上的真实边缘re连接多个真实节点rn中的两个;以及网络处理部30,该网络处理部30基于数据取得部10所取得的图结构的数据20,执行在神经网络中使多个虚拟节点an的各自的第k-1层的特征量传播到其他虚拟节点an的第k层的特征量的处理,该多个虚拟节点an包含多个真实节点rn以及一个以上的真实边缘re,该其他虚拟节点an至少与各个虚拟节点an有连接关系(k为1以上的自然数),从而能够应对更广泛的需求。

对本发明的几个实施方式进行了说明,但这些实施方式是作为例而提示的,并不意图限定发明的范围。这些实施方式能够以其他各种方式实施,在不脱离发明的主旨的范围内,能够进行各种省略、置换、变更。这些实施方式、其变形与发明的范围、主旨所含的同样地包含于专利权利要求的范围所记载的发明和其均等的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1