基于侧向抑制的视觉注意检测方法及装置与流程

文档序号:14991287发布日期:2018-07-20 22:16阅读:300来源:国知局

本发明涉及计算机视觉技术领域,具体涉及一种基于侧向抑制的视觉注意检测方法及装置。



背景技术:

视觉注意机制能够引导人眼在海量数据中注视到显著的区域,并分配资源对重要区域进行优先处理,使得人类可以从复杂的场景中快速地找到感兴趣的区域。具体地,当人眼接收到大量的视觉信息后,人脑可以筛选出少部分人类感兴趣的重要信息,以对这些信息进行优先处理。当前,计算机视觉技术领域中视觉注意机制主要包括选择性注意机制和显著性目标注意机制,但是这两种注意机制均不能完全模拟人脑的视觉注意机制,降低了计算机视觉注意机制的有效性和实用性。



技术实现要素:

为了解决现有技术中的上述问题,即为了解决如何提高计算机视觉注意机制的有效性和实用性的技术问题。为此目的,本发明提供了一种基于侧向抑制的视觉注意检测方法及装置。

在第一方面,本发明中的基于侧向抑制的视觉注意检测方法包括:

通过预先构建的卷积神经网络,获取并选择预测概率大于预设概率阈值的目标图像的图像类别;

获取所述预先构建的卷积神经网络中,每个激活函数神经元接收到的目标神经元输出的反馈信息;

根据所获取的反馈信息,计算每个所述激活函数神经元的侧抑制量,并根据所计算的侧抑制量和预设侧抑制量阈值,判断是否关闭对应的激活函神经元;

根据判断结果关闭相应的激活函数神经元后,重新获取所述目标图像的图像类别;

对重新获取的图像类别对应的激活函数神经元的响应值进行归一化处理,得到所述图像类别对应的选择性注意结果图;

对所选择的图像类别对应的选择性注意结果图进行归一化处理,得到所述目标图像的显著性目标检测结果图。

进一步地,本发明提供的一个优选技术方案为:

“获取所述预先构建的卷积神经网络中,每个激活函数神经元接收到的目标神经元输出的反馈信息”的步骤具体包括:

获取所述激活函数神经元与所选择的图像类别之间的计算路径对应的路径函数;

基于泰勒级数展开算法,并按照下式所示的方法对所获取的路径函数进行展开:

g(u)≈g(u0)+g'(u0)(u-u0)

其中,所述g(u)为激活函数神经元u与图像类别c之间的计算路径对应的路径函数;所述u0为激活函数神经元u对目标图像x0的激活值;

提取所述展开后的路径函数中的g'(u0)作为激活函数神经元u接收到的目标神经元输出的反馈信息。

进一步地,本发明提供的一个优选技术方案为:

“根据所获取的反馈信息,计算每个所述激活函数神经元的侧抑制量”的步骤具体包括:

选取所述激活函数神经元的反馈信息数据立方体中每个空间位置的最大反馈信息,由每个位置的最大反馈信息构成反馈信息图;其中,所述反馈信息数据立方体包括多个通道,每个所述通道均包括数量相同的反馈值,并且所述反馈信息数据立方体与所述激活函数神经元的响应值数据立方体的尺寸相同;

按照下式所示的方法获取在所述反馈信息图中点uij的k邻域内,点uij接收到其邻近点的侧抑制量

其中,(i,j)为点uij的空间位置坐标;所述a和b均为预设的平衡系数,0<a<1,0<b<1且a+b=1;所述为在所述k邻域内点uij接收到的反馈值均值;所述dk为在所述k邻域内点uij与其第k个邻近点的空间距离;所述δ为截断函数,且

进一步地,本发明提供的一个优选技术方案为:

“根据所计算的侧抑制量和预设侧抑制量阈值,判断是否关闭对应的激活函神经元”的步骤具体包括:

按照下式所示的方法判断是否关闭激活函数神经元:

其中,所述yij为所述点uij对应的响应值。

进一步地,本发明提供的一个优选技术方案为:

“对重新获取的当前图像类别对应的激活函数神经元的响应值进行归一化处理,得到所述当前图像类别对应的选择性注意结果图”的步骤具体包括:

按照所述激活函数神经元的响应值数据立方体的通道维度,将所述响应值数据立方体中每个空间位置对应的多个响应值依次相加,得到第一响应值图,其中,所述响应值数据立方体包括多个通道,每个所述通道均包括数量相同的响应值;所述第一响应值图的长和宽,分别与所述响应值数据立方体的长和宽相同;

基于所述第一响应值图中的最大元素值和最小元素值,对所述第一响应值图中的元素值进行归一化处理,得到第二响应值图;

对所述第二响应值图进行缩放得到第三响应值图,以使其与目标图像的尺寸相同;

对所述预先构建的卷积神经网络中每个激活函数神经元对应的第三响应值图进行归一化处理,得到选择性注意结果图。

在第二方面,本发明中的基于侧向抑制的视觉注意检测装置包括:

图像类别获取模块,配置为通过预先构建的卷积神经网络,获取并选择预测概率大于预设概率阈值的目标图像的图像类别;

反馈信息获取模块,配置为获取所述预先构建的卷积神经网络中,每个激活函数神经元接收到的目标神经元输出的反馈信息;

激活函数神经元状态判断模块,配置为根据所述反馈信息获取模块所获取的反馈信息,计算每个所述激活函数神经元的侧抑制量,并根据所计算的侧抑制量和预设侧抑制量阈值,判断是否关闭对应的激活函神经元;图像类别获取模块,进一步配置为根据所述激活函数神经元状态判断模块的判断结果关闭相应的激活函数神经元后,重新获取所述目标图像的图像类别;

选择性注意结果图获取模块,配置为对所述图像类别获取模块重新获取的图像类别对应的激活函数神经元的响应值进行归一化处理,得到所述图像类别对应的选择性注意结果图;

显著性目标检测结果图获取模块,配置为对所述图像类别获取模块所选择的图像类别对应的选择性注意结果图进行归一化处理,得到所述目标图像的显著性目标检测结果图。

进一步地,本发明提供的一个优选技术方案为:

所述反馈信息获取模块包括:

路径函数获取子模块,配置为获取激活函数神经元与所述图像类别获取模块所选择的图像类别之间的计算路径对应的路径函数;

路径函数展开子模块,配置为基于泰勒级数展开算法,并按照下式所示的方法对所述路径函数获取子模块所获取的路径函数进行展开:

g(u)≈g(u0)+g'(u0)(u-u0)

其中,所述g(u)为激活函数神经元u与图像类别c之间的计算路径对应的路径函数;所述u0为激活函数神经元u对目标图像x0的激活值;

反馈信息提取子模块,配置为提取所述路径函数展开子模块得到展开后的路径函数中的g'(u0)作为激活函数神经元u接收到的目标神经元输出的反馈信息。

进一步地,本发明提供的一个优选技术方案为:

所述激活函数神经元状态判断模块包括侧抑制量计算子模块;所述侧抑制量计算子模块包括:

反馈信息图获取单元,配置为选取所述激活函数神经元的反馈信息数据立方体中每个空间位置的最大反馈信息,由每个位置的最大反馈信息构成反馈信息图;其中,所述反馈信息数据立方体包括多个通道,每个所述通道均包括数量相同的反馈值,并且所述反馈信息数据立方体与所述激活函数神经元的响应值数据立方体的尺寸相同;

侧抑制量计算单元,配置为按照下式所示的方法获取在所述反馈信息图获取单元所获取的反馈信息图中点uij的k邻域内,点uij接收到其邻近点的侧抑制量

其中,(i,j)为点uij的空间位置坐标;所述a和b均为预设的平衡系数,0<a<1,0<b<1且a+b=1;所述为在所述k邻域内点uij接收到的反馈值均值;所述dk为在所述k邻域内点uij与其第k个邻近点的空间距离;所述δ为截断函数,且

进一步地,本发明提供的一个优选技术方案为:

所述激活函数神经元状态判断模块包括神经元状态判断子模块;所述神经元状态判断子模块,配置为按照下式所示的方法判断是否关闭激活函数神经元:

其中,所述yij为所述点uij对应的响应值。

进一步地,本发明提供的一个优选技术方案为:

所述选择性注意结果图获取模块包括:

第一响应值图获取子模块,配置为按照所述激活函数神经元的响应值数据立方体的通道维度,将所述响应值数据立方体中每个空间位置对应的多个响应值依次相加,得到第一响应值图,其中,所述响应值数据立方体包括多个通道,每个所述通道均包括数量相同的响应值;所述第一响应值图的长和宽,分别与所述响应值数据立方体的长和宽相同;

第二响应值图获取子模块,配置为基于所述第一响应值图获取子模块所获取的第一响应值图中的最大元素值和最小元素值,对所述第一响应值图中的元素值进行归一化处理,得到第二响应值图;

第三响应值图获取子模块,配置为对所述第二响应值图获取子模块所获取的第二响应值图进行缩放得到第三响应值图,以使其与目标图像的尺寸相同;

选择性注意结果图获取子模块,配置为对所述预先构建的卷积神经网络中每个激活函数神经元对应的第三响应值图进行归一化处理,得到选择性注意结果图。

第三发面,本发明中的存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述技术方案所述的基于侧向抑制的视觉注意检测方法。

第四方面,本发明中的处理装置包括:

处理器,适于执行各条程序;

存储设备,适于存储多条程序;

所述程序适于由处理器加载并执行以实现上述技术方案所述的基于侧向抑制的视觉注意检测方法。

与最接近的现有技术相比,上述技术方案至少具有以下有益效果:

1、本发明中视觉注意检测方法可以基于侧抑制分析得到特定图像类别对应的选择性注意结果图,进而对多个特定图像类别对应的选择性注意结果图进行归一化处理,可以得到目标图像的显著性目标检测结果图。基于上述步骤,可以同时获取目标图像的选择性注意结果图和显著性目标检测结果图。

2、本发明中视觉注意检测方法在计算每个激活函数神经元的侧抑制量时主要包括两个步骤,一是基于反馈信息进行卷积神经网络中神经元输入模式的竞争抑制,二是在完成竞争抑制后对反馈信息数据立方体中每个空间位置的最大反馈信息进行相互抑制。

附图说明

图1是本发明实施例中一种基于侧向抑制的视觉注意检测方法的主要步骤示意图;

图2是本发明实施例中一种反馈信息数据立方体的主要结构示意图;

图3是本发明实施例中一种激活函数神经元的侧抑制量计算过程示意图;

图4是本发明实施例中一种基于侧向抑制的视觉注意检测装置的主要结构示意图。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。

生物认知神经学表明,大脑中存在各种各样的连接,如前馈、反馈和横向连接。当给定一个视觉输入之后,大脑中激活的神经元之间会先相互竞争,其结果为一部分神经元胜出,一部分神经元失败或处于劣势状态,这样的竞争层层进行,最后到达语义层,获得一个初步结论。大脑根据初步结论重新调整和组织信息去支持所获得的结论。认知心理学将这个过程描述为:信息通过竞争前馈流向一个语义节点,之后反馈快速起作用,这个语义节点向底层的神级元提供反馈偏置信息,这个偏置回到竞争前的神经元上从而调整竞争的格局,如原来胜出的可能失败或削弱,原来失败的可能胜出或被加强,最后整个网络实现了调整和选择性。基于此,本发明提供了一种基于侧向抑制的视觉注意检测方法,该方法基于卷积神经网络,并能够利用卷积神经网络的前馈与反馈信息实现对目标物体的信息检测。

参阅附图1,图1示例性示出了本实施例中一种基于侧向抑制的视觉注意检测方法的主要步骤。如图1所示,本实施例中基于侧向抑制的视觉注意检测方法适用于对图像信息进行检测,其可以包括下述步骤:

步骤s101:通过预先构建的卷积神经网络,获取并选择预测概率大于预设概率阈值的目标图像的图像类别。

具体地,本实施例中首先通过预先构建的卷积神经网络获取目标图像的图像类别,然后选择图像类别对应的预测概率大于预设概率阈值的图像类别。本实施例中预先构建的卷积神经网络包括多个卷积层和全连接层。例如,该卷积神经网络可以采用基于alexnet结构的卷积神经网络,也可以采用基于vggnet结构的卷积神经网络等。

本实施例中在获取目标图像的图像类别之前,还需要对预先构建的卷积神经网络进行网络训练,以得到能够准确预测图像类别的卷积神经网络。其中,本实施例中可以基于预设的图像样本训练集,并采用反向传播算法对预先构建的卷积神经网络进行网络训练。

步骤s102:获取预先构建的卷积神经网络中,每个激活函数神经元接收到的目标神经元输出的反馈信息。

本实施例中激活函数神经元指的是卷积神经网络中存储激活函数的神经元,例如relu神经元。激活函数神经元接收到的目标神经元输出的反馈信息可以表示该激活函数神经元对当前图像类别的预测结果所作出的贡献值。

具体地,本实施例中可以按照下述步骤获取激活函数神经元接收到的目标神经元输出的反馈信息:

步骤s1021:获取激活函数神经元与所选择的图像类别之间的计算路径对应的路径函数。

本实施例中激活函数神经元与所选择的图像类别之间的计算路径对应的路径函数可以度量每个激活函数神经元对卷积神经网络作出预测当前图像类别的贡献值。

步骤s1022:基于泰勒级数展开算法,对激活函数神经元u与当前图像类别c之间的计算路径对应的路径函数g(u)进行展开,可以得到如下式(1)所示的函数:

g(u)=g(u0)+g'(u0)(u-u0)+o(u-u0)(1)

公式(1)中各参数含义为:

u0为激活函数神经元u对目标图像x0的激活值,o(u-u0)表示泰勒公式余项,即(u-u0)的高阶无穷小。

本实施例中对公式(1)简化后可以得到路径函数g(u)的展开式如下式(2)所示:

g(u)≈g(u0)+g'(u0)(u-u0)(2)

步骤s1023:提取展开后的路径函数中的g'(u0)作为激活函数神经元u接收到的目标神经元输出的反馈信息,即将公式(2)中的g'(u0)作为激活函数神经元u接收到的目标神经元输出的反馈信息。

步骤s103:根据所获取的反馈信息,计算每个激活函数神经元的侧抑制量,并根据所计算的侧抑制量和预设侧抑制量阈值,判断是否关闭对应的激活函神经元。

具体地,本实施例中可以按照下述步骤计算激活函数神经元的侧抑制量:

步骤s1031:选取激活函数神经元的反馈信息数据立方体中每个空间位置的最大反馈信息,由每个位置的最大反馈信息构成反馈信息图。

本实施例中在数学计算领域中,激活函数神经元输出的响应值可以表示为一个数据立方体,而激活函数神经元的反馈信息也可以表示为相同大小的数据立方体。激活函数神经元的响应值数据立方体包括多个通道,每个通道均包括数量相同的响应值。激活函数神经元的反馈信息数据立方体包括多个通道,每个通道均包括数量相同的反馈信息。

参阅附图2,图2示例性示出了本实施例中一种反馈信息数据立方体的主要结构,其中,参数x和y表示数据立方体中反馈信息的空间位置。如图2所示,本实施例中反馈信息数据立方体包括五个通道,每个通道均包括数量相同的反馈信息。

步骤s1032:按照下式(3)所示的方法获取在反馈信息图中点uij的k邻域内,点uij接收到其邻近点的侧抑制量

公式(3)中各参数含义为:

(i,j)为点uij的空间位置坐标;a和b均为预设的平衡系数,0<a<1,0<b<1且a+b=1;为在k邻域内点uij接收到的反馈值均值;dk为在k邻域内点uij与其第k个邻近点的空间距离;δ为截断函数,且δ(uk-uij)如下式(4)所示:

本实施例中表示侧抑制量的均值能量项,表示侧抑制量的差分项。其中,均值能量项可以抑制能量较低的区域,差分项可以抑制变化较大区域内反馈值较小的位置。同时,通过公式(4)可以得到点uij仅受比其强的神经元的抑制,而不受比其弱的神经元的抑制。

参阅附图3,图3示例性示出了本实施例中一种基于反馈信息图的侧抑制过程。在具体实施时,我们为每一个隐层神经元配置了一个侧抑制处理神经元,由该侧抑制处理神经元完成由公式(3)定义的侧抑制计算,并依据uij与差的符号来决定该隐层神经元开和闭,差大于0时该神经元开,差小于0时该神经元关闭。在图3中,11表示目标神经元、12表示侧抑制处理神经元、13表示隐层神经元、14表示前馈过程、15表示反馈过程、16表示侧向抑制过程、17表示关闭或打开操作。如图3所示,网络先完成前馈过程,之后执行依据目标神经元计算每一个隐层神经元梯度反馈信息的反馈过程,然后每一个隐层神经元的侧抑制处理神经元完成侧抑制计算和打开关闭状态判断,最后侧抑制处理神经元打开或者关闭该隐层神经元。

进一步地,本实施例中在得到点uij接收到其邻近点的侧抑制量后,可以按照下式(5)所示的方法判断是否关闭对应的激活函神经元:

公式(5)中参数yij为点uij对应的响应值,通过公式(5)可以得到,本实施例中预设侧抑制量阈值为0,时不需要关闭激活函数神经元,即激活函数神经元输出的响应值保持不变。时需要关闭激活函数神经元,即激活函数神经元输出的响应值为0。

步骤s104:根据判断结果关闭相应的激活函数神经元后,重新获取目标图像的图像类别。本实施例中在按照判断结果关闭卷积神经网络中的相应激活函数神经元后,再次利用该卷积神经网络重新获取目标图像的图像类别,在此过程中卷积神经网络可以实现对特定图像类别的预测,包括卷积神经网络的前传过程和该特定图像类别的反传过程。

步骤s105:对重新获取的图像类别对应的激活函数神经元的响应值进行归一化处理,得到图像类别对应的选择性注意结果图。

具体地,本实施例中可以按照下述步骤获取选择性注意结果图:

步骤s1051:按照激活函数神经元的响应值数据立方体的通道维度,将响应值数据立方体中每个空间位置对应的多个响应值依次相加,得到第一响应值图。本实施例中响应值数据立方体的长为h,宽为w,通道数为c时,第一响应值图的长和宽分别为h与w。

假设,本实施例中响应值数据立方体包括3个通道,每个通道包括9个响应值,且这9个响应值的空间坐标依次为(1,1)、(1,2)、(1,3)、(2,1)、(2,2)、(2,3)、(3,1)、(3,2)和(3,3)。本实施例中按照激活函数神经元的响应值数据立方体的通道维度,将响应值数据立方体中每个空间位置对应的多个响应值依次相加具体为:将3个通道中空间坐标为(1,1)的响应值的和作为第一响应值图中坐标(1,1)的元素值,将3个通道中空间坐标为(1,2)的响应值的和作为第一响应值图中坐标(1,2)的元素值,将3个通道中空间坐标为(1,3)的响应值的和作为第一响应值图中坐标(1,3)的元素值,空间坐标(2,1)、(2,2)、(2,3)、(3,1)、(3,2)和(3,3)处的处理方法与前述方法相同,为了简洁描述,在此不再赘述。

步骤s1052:基于第一响应值图中的最大元素值和最小元素值,对第一响应值图中的元素值进行归一化处理,得到第二响应值图。本实施例中通过归一化处理,可以将第一响应值图中的元素值归一化为[0,1]之间的值。

步骤s1053:对第二响应值图进行缩放得到第三响应值图,以使其与目标图像的尺寸相同。本实施例中通过将第二响应值图缩放至目标图像的大小,可以显示重点关注的位置。

步骤s1054:对预先构建的卷积神经网络中每个激活函数神经元对应的第三响应值图进行归一化处理,得到选择性注意结果图。

假设,本实施例中预先构建的卷积神经网络包括五个激活函数神经元,则通过步骤s1051~步骤s1054可以得到五个第三响应值图,此时对这五个第三响应值图再次进行归一化处理,即可以得到特定图像类别对应的选择性注意结果图。其中,特定图像类别指的是图1所示方法中选择的预测概率大于预设概率阈值的目标图像的图像类别。

步骤s106:对所选择的图像类别对应的选择性注意结果图进行归一化处理,得到目标图像的显著性目标检测结果图。

本实施例中通过选择预测概率大于预设概率阈值的目标图像的图像类别,可以选取目标图像的多个图像类别,而通过步骤s101~步骤s105可以得到每个图像类别对应的选择性注意结果图,此时对这几个选择性注意结果图再次进行归一化处理,即可以得到目标图像的显著性目标检测结果图。

下面以包含多种物体图像的目标图像为例,对图1所示的方法的实施过程进行说明。具体地,本实施例中可以按照下述步骤对目标图像进行检测:

步骤s201:基于图像数据集imagenet中的图像样本,对基于vggnet结构的卷积神经网络进行网络训练,训练后的卷积神经网络能够识别1000个图像类别。

步骤s202:通过上述训练好的卷积神经网络对目标图像进行识别,选择前五个较大预测概率对应的图像类别,分别为猫、汽车、狗、马和赛车。

步骤s203:以图像类别为猫的神经元作为目标神经元,获取卷积神经网络中所有激活函数神经元接收到的目标神经元输出的反馈信息。

步骤s204:将卷积神经网络中与猫无关的神经元关闭,保留与猫相关的神经元。

步骤s205:通过卷积神经网络重新对目标图像进行识别,即将与猫相关的额神经元重新激活。

步骤s206:按照图1所示的方法获取猫对应的选择性注意结果图。

步骤s207:重复执行步骤s203~步骤s207,依次获取汽车、狗、马和赛车对应的选择性注意结果图。

步骤s208:根据步骤s201~步骤s207得到的选择性注意结果图,并按照图1所示的方法获取目标图像的显著性目标检测结果图。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。

基于与方法实施例相同的技术构思,本发明还提供一种基于侧向抑制的视觉注意检测装置。下面结合附图对该基于侧向抑制的视觉注意检测装置进行具体说明。

参阅附图4,图4示例性示出了本实施例中一种基于侧向抑制的视觉注意检测装置的主要结构。如图4所示,本实施例中基于侧向抑制的视觉注意检测装置可以包括图像类别获取模块21、反馈信息获取模块22、激活函数神经元状态判断模块23、选择性注意结果图获取模块24和显著性目标检测结果图获取模块24。具体地,本实施例中图像类别获取模块21可以配置为通过预先构建的卷积神经网络,获取并选择预测概率大于预设概率阈值的目标图像的图像类别。反馈信息获取模块22可以配置为获取预先构建的卷积神经网络中,每个激活函数神经元接收到的目标神经元输出的反馈信息。激活函数神经元状态判断模块23可以配置为根据反馈信息获取模块22所获取的反馈信息,计算每个激活函数神经元的侧抑制量,并根据所计算的侧抑制量和预设侧抑制量阈值,判断是否关闭对应的激活函神经元。此时,图像类别获取模块21进一步配置为根据激活函数神经元状态判断模块23的判断结果关闭相应的激活函数神经元后,重新获取目标图像的图像类别。选择性注意结果图获取模块24可以配置为对图像类别获取模块21重新获取的图像类别对应的激活函数神经元的响应值进行归一化处理,得到图像类别对应的选择性注意结果图。显著性目标检测结果图获取模块25可以配置为对图像类别获取模块21所选择的图像类别对应的选择性注意结果图进行归一化处理,得到目标图像的显著性目标检测结果图。

进一步地,本实施例中图4所示的反馈信息获取模块21可以包括路径函数获取子模块、路径函数展开子模块和反馈信息提取子模块。具体地,路径函数获取子模块可以配置为获取激活函数神经元与图像类别获取模块21所选择的图像类别之间的计算路径对应的路径函数。路径函数展开子模块可以配置为基于泰勒级数展开算法,并按照公式(2)所示的方法对路径函数获取子模块所获取的路径函数进行展开。反馈信息提取子模块可以配置为提取路径函数展开子模块得到展开后的路径函数中的g'(u0)作为激活函数神经元u接收到的目标神经元输出的反馈信息。

进一步地,本实施例中图4所示的激活函数神经元状态判断模块包括侧抑制量计算子模块,侧抑制量计算子模块包括反馈信息图获取单元和侧抑制量计算单元。具体地,反馈信息图获取单元可以配置为选取激活函数神经元的反馈信息数据立方体中每个空间位置的最大反馈信息,由每个位置的最大反馈信息构成反馈信息图。其中,反馈信息数据立方体包括多个通道,每个通道均包括数量相同的反馈值,并且反馈信息数据立方体与激活函数神经元的响应值数据立方体的尺寸相同。侧抑制量计算单元可以配置为按照公式(3)所示的方法获取在反馈信息图获取单元所获取的反馈信息图中点uij的k邻域内,点uij接收到其邻近点的侧抑制量

进一步地,本实施例中图4所示的激活函数神经元状态判断模块包括神经元状态判断子模块,神经元状态判断子模块可以配置为按照公式(5)所示的方法判断是否关闭激活函数神经元。

进一步地,本实施例中图4所示的选择性注意结果图获取模块包括第一响应值图获取子模块、第二响应值图获取子模块、第三响应值图获取子模块和选择性注意结果图获取子模块。具体地,第一响应值图获取子模块可以配置为按照激活函数神经元的响应值数据立方体的通道维度,将响应值数据立方体中每个空间位置对应的多个响应值依次相加,得到第一响应值图,其中,响应值数据立方体包括多个通道,每个通道均包括数量相同的响应值;第一响应值图的长和宽,分别与响应值数据立方体的长和宽相同。第二响应值图获取子模块可以配置为基于第一响应值图获取子模块所获取的第一响应值图中的最大元素值和最小元素值,对第一响应值图中的元素值进行归一化处理,得到第二响应值图。第三响应值图获取子模块可以配置为对第二响应值图获取子模块所获取的第二响应值图进行缩放得到第三响应值图,以使其与目标图像的尺寸相同。选择性注意结果图获取子模块可以配置为对预先构建的卷积神经网络中每个激活函数神经元对应的第三响应值图进行归一化处理,得到选择性注意结果图。

上述基于侧向抑制的视觉注意检测装置实施例可以用于执行上述基于侧向抑制的视觉注意检测方法实施例,其技术原理、所解决的技术问题及产生的技术效果相似,所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的基于侧向抑制的视觉注意检测装置的具体工作过程及有关说明,可以参考前述基于侧向抑制的视觉注意检测方法实施例中的对应过程,在此不再赘述。

本领域技术人员可以理解,上述基于侧向抑制的视觉注意检测装置还包括一些其他公知结构,例如处理器、控制器、存储器等,其中,存储器包括但不限于随机存储器、闪存、只读存储器、可编程只读存储器、易失性存储器、非易失性存储器、串行存储器、并行存储器或寄存器等,处理器包括但不限于cpld/fpga、dsp、arm处理器、mips处理器等,为了不必要地模糊本公开的实施例,这些公知的结构未在图4中示出。

应该理解,图4中的各个模块的数量仅仅是示意性的。根据实际需要,各模块可以具有任意的数量。

基于上述基于侧向抑制的视觉注意检测方法实施例,本发明实施例还提供了一种存储装置,该存储装置存储有多条程序,并且这些程序适于由处理器加载并执行以实现上述方法实施例所述的基于侧向抑制的视觉注意检测方法。

进一步地,基于上述基于侧向抑制的视觉注意检测方法实施例,本发明实施例还提供了一种处理装置,该处理装置包括处理器和存储设备,其中,处理器可以适于执行各条程序,存储设备可以适于存储多条程序,并且这些程序可以适于由处理器加载并执行以实现上述方法实施例所述的基于侧向抑制的视觉注意检测方法。

本领域技术人员可以理解,可以对实施例中装置的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个装置中。可以把实施例中的模块或单元组合成一个模块或单元,以及此外可以把它们分成多个子模块或子单元。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的pc来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在本发明的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1