一种处理方法及利用了它的处理装置与流程

文档序号:22342884发布日期:2020-09-25 18:14阅读:116来源:国知局
一种处理方法及利用了它的处理装置与流程

本公开涉及处理技术,尤其是执行针对图像的处理的处理方法及利用了它的处理装置。



背景技术:

在图像识别处理中,例如使用deeplearning(深度学习)。deeplearning作为使用了多层神经网络的机械学习的方法论而为人所知,对于多层神经网络,例如使用卷积神经网络。卷积神经网络由反复进行局部区域的卷积(convolution)和池化(pooling)的多层神经网络形成。进而,提出了一种完全卷积神经网络的构造,其将构成卷积神经网络的全连接层设为卷积层(例如,参照非专利文献1)。

[现有技术文献]

[专利文献]

非专利文献1:jonathanlong,evanshelhamer,trevordarrell,”fullyconvolutionalnetworksforsemanticsegmentation”,theieeeconferenceoncomputervisionandpatternrecognition(cvpr),2015,pp.3431-3440



技术实现要素:

[发明要解决的课题]

为了将完全卷积神经网络使用于图像识别处理,需要使用监督数据来使完全卷积神经网络预先学习。在为完全卷积神经网络的情况下,对于监督数据,使用进行了着色区分的图像。一般而言,进行了着色区分的图像通过手动生成。关于这样的手动工作量,监督数据的数量越多就越会増加。另一方面,被使用于学习的监督数据的数量越是变多,图像识别处理的精度就越会提高。

本公开鉴于这样的状况而完成,其目的在于提供一种既抑制学习工作量的増加,又抑制图像识别处理精度的降低的技术。

[用于解决技术课题的技术方案]

为了解决上述问题,本公开的一个方案的处理装置包括:输入部,用于输入处理对象的图像;处理部,其针对输入到输入部的图像,执行除全连接层外的卷积神经网络的处理;以及输出部,其输出处理部的处理结果。处理部中的卷积神经网络包含卷积层和池化层。在处理部中的卷积神经网络中,针对具有1×1的空间维度的处理结果,进行了卷积层的滤波器的学习,被输入到输入部的图像的尺寸大于学习用图像的尺寸,该学习用图像在学习卷积层的滤波器时被输入到卷积神经网络,且与学习卷积层的滤波器时的处理结果对应。

本公开的另一方案为一种处理方法。该方法包括输入处理对象的图像的步骤、针对输入的图像,执行除全连接层外的卷积神经网络的处理的步骤、以及输出处理结果的步骤。卷积神经网络包含卷积层和池化层。在卷积神经网络中,针对具有1×1的空间维度的处理结果,进行了卷积层的滤波器的学习,被输入的图像的尺寸大于学习用图像的尺寸,该学习用图像在学习卷积层的滤波器时被输入到卷积神经网络,且与学习卷积层的滤波器时的处理结果对应。

另外,将以上构成要素的任意组合、以及本公开的表现形式在方法、装置、系统、计算机程序或记录有计算机程序的记录介质等之间进行转换后的结果,作为本公开的方案也是有效的。

[发明效果]

根据本公开,能够既抑制学习工作量的増加,又抑制图像识别处理精度的降低。

附图说明

图1的(a)-图1的(c)是表示实施例的处理对象的图。

图2是表示作为实施例的比较对象的处理装置中的处理的概要的图。

图3是表示作为实施例的比较对象的处理装置中的处理的概要的图。

图4的(a)-图4的(b)是表示实施例的处理装置的构成的图。

图5是表示图4的(a)-图4的(b)的处理部中的处理的概要的图。

图6是表示图5中的卷积层中的处理的概要的图。

图7的(a)-图7的(c)是表示在图4的(b)的处理装置中处理的图像的图。

图8的(a)-图8的(b)是表示从图4的(b)的输出部输出的输出图像的图。

图9的(a)-图9的(b)是表示图4的(a)-图4的(b)的处理装置中的处理步骤的流程图。

具体实施方式

在具体地说明本公开的实施例之前,对本实施例的概要进行说明。实施例涉及一种处理装置,其通过针对拍摄太阳能电池单元而得到的图像执行图像识别处理,从而执行太阳能电池单元的检查。太阳能电池单元的检查的一个例子为太阳能电池单元中有无内部裂纹,产生了内部裂纹的太阳能电池单元因受冲击时易破裂而被视为不良品。这样的内部裂纹在太阳能电池单元为单晶硅的情况下以45度的角度产生。即使确定了产生内部裂纹的角度,在内部裂纹与刻蚀不均等重合的情况下,也难以检测出内部裂纹。因此,对于太阳能电池单元的检查,使用图像识别处理。

以往,针对拍摄太阳能电池单元所得的图像执行加博滤波器处理,以使45度的线段锐化,其后,进行deeplearning(深度学习)。然而,当在太阳能电池单元的表面要形成45度的电极时,这种电极也会被加博滤波器处理锐化,因此,难以使用加博滤波器处理。在这种状况下,针对拍摄太阳能电池单元而得到的图像的、卷积神经网络的使用是有力的。卷积神经网络包含:卷积层,其通过多个滤波器的卷积处理来提取特征;池化层,其通过汇总一定区域的反应的池化处理来获得局部数据的不变性;以及全连接层,其用基于softmax函数等的概率来进行识别。由于它们中的全连接层,在卷积神经网络中,针对任意尺寸图像的处理是困难的。为了解决这些问题,使用完全卷积神经网络,该完全卷积神经网络通过将卷积神经网络的全连接层转变为卷积层而得到。

在完全卷积神经网络中,在执行了反复进行卷积层和池化层的处理的下采样处理之后,执行反复进行卷积层和上池化层的处理的上采样处理。在此,图像的空间维度会因下采样处理而变小,并会因上采样处理而变大。通过这样的处理,从完全卷积神经网络输出的图像(以下,称为“输出图像”)具有与被输入的图像(以下,称为“输入图像”)同等的空间维度。此外,对于输出图像,针对图像中的物体进行了着色区分。在包含完全卷积神经网络的神经网络中,执行图像识别处理之前的学习是必要的。在为完全卷积神经网络的情况下,使用监督数据来学习卷积层的滤波器系数。然而,如前所述,用于生成监督数据的工作量较为巨大。为了提高图像识别处理的精度,需要使监督数据的数量变多,当监督数据的数量变多时,用于生成监督数据的工作量会进一步増加。

为了抑制用于生成监督数据的工作量的増加,在本实施例中,使用除了完全卷积神经网络中的上采样处理以外的卷积神经网络。在此,在学习时,使用输出图像为1×1空间维度的监督数据、以及与该监督数据对应的输入图像。在本实施例中,与监督数据对应的输入图像有时也会被称为“学习用图像”。在监督数据中,区分的结果是,例如仅显示ok、内部裂纹、以及颜色不均等,而删除了位置信息。由此,因为易于生成监督数据,所以即使使监督数据的数量变多,也会抑制用于生成监督数据的工作量的増加。另一方面,在图像识别处理中,只要能够确定在应视为不良的太阳能电池单元中产生了内部裂纹的位置即可,因为只要作为太阳能电池单元的相似形而得到处理结果,就能够确定位置,所以根据本实施例也可抑制图像识别处理精度的降低。

图1的(a)-图1的(c)表示实施例的处理对象。图1的(a)是表示作为检查对象,即图像识别处理对象的太阳能电池单元10的构成的立体图。太阳能电池单元10例如由单晶硅形成,具有包含受光面12和背面14的板形形状。受光面12为主要入射太阳光的面,背面14为朝向受光面12的相反侧的面。图1的(b)表示从受光面12侧或背面14侧以红外线来拍摄图1的(a)的太阳能电池单元10而得到的图像20。在图像20中,吸附垫片22、刻蚀不均24、电极加强线26、线痕28、以及晶片厚度分布30被以图案的方式示出在太阳能电池单元10上。这些是公知技术,因而在此省略说明,这些并非是不良品的图案,而是良品的图案。

图1的(c)表示从受光面12侧或背面14侧以红外线来拍摄图1的(a)的太阳能电池单元10而得到的图像20。图1的(c)相当于对与图1的(b)不同的太阳能电池单元10进行拍摄而得到的图像20。如图所示,在太阳能电池单元10上,示出了沿45度的方向延伸的线段与沿135度的方向延伸的线段交叉而成的“×”图案即内部裂纹32。这是不良品的图案。在此,为了使说明清晰,仅示出了内部裂纹32。然而实际上,在图1的(b)那样的图像20中,混杂有内部裂纹32。例如,在吸附垫片22中、刻蚀不均24中,埋有内部裂纹32。因此,不易准确地判定在图像20中是否包含内部裂纹32。

图2表示作为实施例的比较对象的处理装置50中的处理的概要。处理装置50具有包含前述全连接层的卷积神经网络的构成。处理装置50包含统称为卷积层42的第1卷积层42a、第2卷积层42b、第3卷积层42c、第4卷积层42d、第5卷积层42e、第6卷积层42f、统称为池化层44的第1池化层44a、第2池化层44b、第3池化层44c、第4池化层44d、第5池化层44e、以及全连接层46。这样的卷积层42、池化层44、以及全连接层46表示执行各处理的框图。输入图像40为作为处理装置50中的图像识别处理的处理对象的图像,相当于前述图像20的至少一部分。输入图像40被输入到第1卷积层42a。

各卷积层42被表示为直平行六面体,其由正方形的2个第1表面52、以及4个第2表面54构成,该正方形的2个第1表面52具有深度方向和高度方向,该4个第2表面54被夹在2个第1表面52中。为了使附图清晰,仅在第1卷积层42a中示出第1表面52和第2表面54。第1表面52的大小表示在卷积层42中处理的图像的空间维度的大小,即图像的尺寸。卷积层42中,针对图像,使比图像的尺寸更小的尺寸的空间滤波器错开地执行空间滤波。

因为空间滤波是公知的技术,所以在此省略说明,该空间滤波相当于卷积处理,图像的特征量被通过卷积处理来进行提取。也可以是,在卷积层42中执行填充等。进而,也可以是,卷积层42中,针对图像,并联使用多个空间滤波器,从而并行执行多个空间滤波。通过并联使用这样的多个空间滤波器,图像会得到増加。在卷积层42中被并联使用的空间滤波器的数量被称为通道数,其通过第2表面54的左右方向的长度来表示。

各池化层44也被与卷积层42同样地构成。池化层44中,通过将图像内的任意区域所包含的多个像素归为1个像素,从而使图像的尺寸变小。在此,为了将多个像素归为1个像素,执行平均池化或最大池化。在平均池化中,针对1个像素使用区域内的多个像素值的平均值,在最大池化中,针对1个像素,使用区域内的多个像素值中的最大值。池化处理为了针对关注区域中的代表值或平均值的平移运动强化鲁棒性而进行。

在此,按第1卷积层42a、第1池化层44a、第2卷积层42b、第2池化层44b、第3卷积层42c、第3池化层44c、第4卷积层42d、第4池化层44d、第5卷积层42e、第5池化层44e、第6卷积层42f的顺序执行处理。即,反复执行卷积处理和池化处理。此外,通过反复进行卷积处理和池化处理,使图像的尺寸依次变小,第6卷积层42f成为1×1的空间维度,且将具有1以上的通道数的图像输出到全连接层46。在此,作为一例,将通道数设为“8”。

全连接层46从第6卷积层42f接收被提取了特征量的图像。全连接层46基于特征量,通过执行对多个类别的分类来对图像进行识别。因为对于全连接层46中的处理,可使用公知的技术,所以在此省略说明,全连接层46中的分类结果,即识别结果为输出48。在输出48中,示出了“ok”、“内部裂纹”、“刻蚀不均”、“针孔”、“黑点”、“裂纹”、“吸附垫片”、以及“汇流条”这8个类别各自所对应的概率。在该情况下,“内部裂纹”所对应的概率高达“0.9”,因此,识别为在输入图像40中存在内部裂纹32。

在执行这样的图像识别处理之前,针对处理装置50,执行学习处理。学习处理将已知的输出48即监督数据、以及与该监督数据对应的学习用图像输入到处理装置50,从而使其学习全连接层46中的系数、以及各卷积层42的空间滤波器的系数。学习用图像具有与输入图像40相同的尺寸,是在准确地执行了图像识别处理的情况下输出监督数据那样的原图像。对于这样的学习处理,可使用公知的技术。在学习处理中,越是大量使用监督数据与学习用图像的组合,它们的系数的精度就越会提高,图像识别处理的精度也越会提高。

在学习处理结束后,执行前述图像识别处理。对于处理装置50,输入将原图像即图像20剪切成一定的尺寸而得到的输入图像40。处理装置50例如对内部裂纹32等是否存在于输入图像40而二元地进行图像识别处理,若在输入图像40中存在内部裂纹32,则生成表示内部裂纹32的存在的输出48。这相当于通过图像识别处理分类为8个类别。

在此,在处理装置50中使用的卷积神经网络包含全连接层46。因为来自全连接层46的输出48的尺寸被固定,所以该卷积神经网络可处理的输入图像40的尺寸也会被固定。即,处理装置50仅能够对一定尺寸的输入图像40进行识别处理。因此,在处理装置50中,对输入图像40的尺寸设置有限制。

图3表示实施例的比较对象即处理装置70中的处理的概要。处理装置70具有完全卷积神经网络的构成。处理装置70包含统称为卷积层62的第1卷积层62a、第2卷积层62b、第3卷积层62c、第4卷积层62d、第5卷积层62e、第6卷积层62f、第7卷积层62g、第8卷积层62h、第9卷积层62i、第10卷积层62j、第11卷积层62k、第12卷积层62l、第13卷积层62m、统称为池化层64的第1池化层64a、第2池化层64b、第3池化层64c、第4池化层64d、第5池化层64e、以及统称为上池化层66的第1上池化层66a、第2上池化层66b、第3上池化层66c、第4上池化层66d、第5上池化层66e。这样的卷积层62、池化层64、以及上池化层66表示执行各处理的框图。

输入图像60是作为处理装置70中的图像识别处理的处理对象的图像。对于完全卷积神经网络,因为不包含前述全连接层,所以不会设置针对输入图像60的尺寸的限制。因此,输入图像60也可以为前述的图像20。输入图像60被输入到第1卷积层62a。

卷积层62执行与前述的卷积层42同样的处理,池化层64执行与前述的池化层44同样的处理。上池化层66执行池化层64中的处理的逆处理。即,在池化层64中,使图像的尺寸变小,而在上池化层66中,使图像的尺寸变大。对于上池化层66中的处理,可以使用公知的技术,因而在此省略说明。

完全卷积神经网络依次配置有下采样处理部72、上采样处理部74。在下采样处理部72中,依次配置有第1卷积层62a、第1池化层64a、第2卷积层62b、第2池化层64b、第3卷积层62c、第3池化层64c、第4卷积层62d、第4池化层64d、第5卷积层62e、第5池化层64e、以及第6卷积层62f。即,反复执行卷积处理和池化处理。此外,通过反复进行卷积处理和池化处理,从而使图像的尺寸依次变小。

在上采样处理部74中,依次配置有第7卷积层62g、第8卷积层62h、第1上池化层66a、第9卷积层62i、第2上池化层66b、第10卷积层62j、第3上池化层66c、第11卷积层62k、第4上池化层66d、第12卷积层62l、第5上池化层66e、以及第13卷积层62m。即,反复执行卷积处理和上池化处理。此外,通过反复进行卷积处理和上池化处理,从而使图像的尺寸依次变大,第13卷积层62m输出与输入图像60相近尺寸的图像(以下,称为“输出图像68”)。

针对输入图像60,当执行下采样处理部72和上采样处理部74中的图像识别处理时,会取得输出图像68。在输出图像68中,针对输出图像68所包含的物体,分别进行了与类别相应的着色。即,在图像识别处理的结果即输出图像68中,针对物体进行了着色区分。例如,在输入图像60中包含内部裂纹32的情况下,在输出图像68中包含内部裂纹区域34。内部裂纹区域34是被识别为内部裂纹32的区域,着以与输出图像68中的其它区域不同的颜色。此外,在输入图像60中包含刻蚀不均、以及吸附垫片的情况下,在输出图像68中,包含被识别为刻蚀不均的区域(以下,称为“刻蚀不均区域”)、以及被识别为吸附垫片的区域(以下,称为“吸附垫片区域”)。在该情况下,内部裂纹区域34、刻蚀不均区域、吸附垫片区域、以及其它区域被着以彼此不同的颜色。输出图像68也被称为特征图。

在执行这样的图像识别处理前,也针对处理装置70执行学习处理。学习处理将已知的输出图像68即监督数据、以及与该监督数据对应的学习用图像输入到处理装置70,从而使其学习各卷积层62的空间滤波器的系数。在此,监督数据为针对物体进行了着色区分的图像。这样的监督数据一般通过手动生成。因此,关于用于生成监督数据的工作量,监督数据的数量越多就越会増加。为了减少工作量,当使监督数据的数量变少时,图像识别处理的精度会降低。在这种状况下,为了既抑制工作量的増加,又抑制图像识别处理精度的降低,需要减少用于生成1个监督数据的工作量。因为未设置针对输入图像60尺寸的限制,所以学习用图像与输入图像60也可以为不同的尺寸。

图4的(a)-图4的(b)表示处理装置100的构成。尤其是,图4的(a)表示用于学习处理的构成,图4的(b)表示用于图像识别处理的构成。图4的(a)中的处理装置100与图4的(b)中的处理装置100既可以为同一装置,也可以为不同的装置。处理装置100包含第1输入部110、第2输入部112、以及处理部114作为用于学习处理的构成,包含输入部132、修正部134、处理部114、以及输出部136作为用于图像识别处理的构成。此外,处理装置100被连接于拍摄装置130。即,在学习处理中学习处理部114,在图像识别处理中使用处理部114。在对处理装置100的构成进行说明前,与图2、图3同样,对处理部114的构成进行说明。

图5表示处理部114中的处理的概要。处理部114包含统称为卷积层142的第1卷积层142a、第2卷积层142b、第3卷积层142c、第4卷积层142d、第5卷积层142e、第6卷积层142f、以及统称为池化层144的第1池化层144a、第2池化层144b、第3池化层144c、第4池化层144d、第5池化层144e。这样的卷积层142、以及池化层144表示执行各处理的框图。

输入图像140是作为处理装置100中的图像识别处理的处理对象的图像。在处理部114中的神经网络中,与完全卷积神经网络同样,不包含全连接层,因此,不会设置针对输入图像140尺寸的限制。因此,输入图像140也可以为前述的图像20。输入图像140被输入到第1池化层144a。卷积层142执行与前述的卷积层42、卷积层62同样的处理,池化层144执行与前述的池化层44、池化层64同样的处理。

处理部114与完全卷积神经网络同样地,配置有下采样处理部152。然而,处理部114与完全卷积神经网络不同,不配置上采样处理部。在下采样处理部152中,依次配置有第1卷积层142a、第1池化层144a、第2卷积层142b、第2池化层144b、第3卷积层142c、第3池化层144c、第4卷积层142d、第4池化层144d、第5卷积层142e、第5池化层144e、以及第6卷积层142f。即,反复执行卷积处理和池化处理。

图6表示卷积层142中的处理的概要。图像200为卷积层142中的处理对象,在此,作为一例,由10×10的像素构成。各像素具有像素值。卷积层142通过填充202来使图像200的周围扩展,从而生成扩展图像204。各填充202也为像素,扩展图像204由12×12的像素构成。卷积层142针对扩展图像204,使比扩展图像204的尺寸更小的尺寸的滤波器210错开地执行卷积。滤波器210例如具有3×3的尺寸。

在此,填充202的像素值被如下这样确定。处理部114在以包含填充202的方式使扩展图像204与滤波器210对应的情况下,将被与滤波器210对应的图像的一部分,即像素中的任意一个像素值使用于填充202。如图6所示,在使滤波器210与扩展图像204的左上部分对应的情况下,包含5个填充202和4个像素。在此,对于各填充202的像素值,使用4个像素的像素值中的任意一个。例如,将最接近填充202的像素的像素值作为该填充202的像素值。此外,处理部114在以包含填充202的方式使扩展图像204与滤波器210对应的情况下,将被与滤波器210对应的图像的一部分,即像素的像素值的统计值使用于填充202。如图6所示,在使滤波器210与扩展图像204的左上部分对应的情况下,将4个像素的像素值的统计值作为各填充202的像素值。统计值包括平均值和中央值。然后,回到图5。

通过反复进行卷积处理和池化处理,使图像的尺寸依次变小,第6卷积层142f输出具有1以上通道数的图像(以下,称为“输出图像148”)。也可以是,池化层144被配置于最终级,池化层144输出输出图像148。在此,作为一例,也将通道数设为“8”。即,当针对输入图像140,执行下采样处理部152中的图像识别处理时,会取得输出图像148。针对输出图像148,会在后面进行叙述。

以这样的处理部114的构成为基础,在此,使用图4的(a)来对处理装置100中的学习处理进行说明。第1输入部110接收已知的输出图像148即监督数据,第2输入部112接收与在第1输入部110中接收到的监督数据对应的学习用图像。处理部114具有图5的构成,并以在第1输入部110中接收到的监督数据、以及在第2输入部112中接收到的学习用图像为基础,使其学习各卷积层142的空间滤波器的系数。

在本实施例中,监督数据的尺寸具有1×1的空间维度。因此,监督数据不具有学习用图像所包含的物体的位置信息,1个通道所对应的监督数据仅表示前述的输出48中的8个类别中的任意一个物体的存在。例如,在学习用图像中包含内部裂纹32的情况下,“内部裂纹”类别的监督数据表示内部裂纹的存在。针对其它类别也是同样,因此,与8个通道对应的监督数据仅表示各类别物体的存在。即,与1个通道对应的监督数据可以仅表示1个类别的物体是否存在,且可以不是对物体进行了着色区分的图像。因此,与生成针对物体进行了着色区分的图像的情况相比,用于生成1个监督数据的工作量会减少。结果,能够既抑制工作量的増加,又使监督数据的数量变多。

另一方面,学习用图像是在准确执行了图像识别处理的情况下会输出监督数据的那样的原图像,其尺寸被以监督数据为1×1的空间维度的方式确定。在此,不设置针对输入图像140尺寸的限制,因此,学习用图像与输入图像140也可以为不同的尺寸。对于使用这样的监督数据和学习用图像的状况下的空间滤波器的系数的学习本身,可以使用公知的技术,因而在此省略说明。

接着,使用图4的(b),对处理装置100中的图像识别处理进行说明。在图4的(a)与图4的(b)中的处理装置100为不同的装置时,通过针对图4的(a)中的处理部114的学习而导出的空间滤波器的系数被设定于图4的(b)中的处理部114。

拍摄装置130例如为红外线照相机,以红外线来对作为检查对象即图像识别处理对象的图1的(a)的太阳能电池单元10进行拍摄。例如,进行8比特、9m像素的拍摄。拍摄装置130将拍摄到的图像输出到处理装置100。处理装置100的输入部132接收在拍摄装置130中拍摄到的图像(以下,称为“图像120”)。图7的(a)-图7的(c)表示在处理装置100中被处理的图像120,尤其是,图7的(a)表示被输入到输入部132的图像120。在图像120中,示出了太阳能电池单元10的受光面12或背面14。一般而言,在图像120中,太阳能电池单元10被倾斜地配置。图7的(b)-图7的(c)将在后面叙述,接着,回到图4的(b)。输入部132将图像120输出到修正部134。

修正部134从输入部132接收图像120。修正部134对图像120中的太阳能电池单元10的倾斜度进行修正。修正部134针对图7的(a)的图像120中的太阳能电池单元10,如图7的(b)所示,确定出第1角边l1、第2角边l2、第3角边l3、以及第4角边l4。此外,修正部134通过使第1角边l1和第2角边l2延长来导出相交的第1交点p1。进而,修正部134与第1交点p1同样地,导出第2交点p2、第3交点p3、以及第4交点p4。接着,修正部134使用透视投影变换来使图像120变形,使其向设定有第1交点p1、第2交点p2、第3交点p3、以及第4交点p4的坐标移动。变形的结果如图7的(c)所示。修正部134将修正后的图像120输出到处理部114。

处理部114从修正部134接收修正后的图像120。处理部114具有图5所示的构成,接收到的图像120相当于输入图像140。因此,以下将修正后的图像120称为输入图像140。处理部114如前所述,针对输入图像140,执行除全连接层46外的卷积神经网络的处理。在此,处理部114中的卷积神经网络包含下采样处理部152,下采样处理部152包含多个卷积层142和多个池化层144。因此,处理部114执行下采样处理而不执行上采样处理。

此外,在处理部114中的卷积神经网络中,针对具有1×1的空间维度且具有8个通道的处理结果、即监督数据,进行了卷积层42的空间滤波器的学习。尤其是,卷积层42的空间滤波器的学习是针对有无与8个通道一一对应的8个类别的物体而进行的。8个类别的物体之一为内部裂纹32。

通过由学习处理后的处理部114进行的图像识别处理,从而取得处理结果或检查结果即输出图像148,而在输出图像148中,示出了8个类别的物体的有无。另一方面,因为输出图像148的尺寸比输入图像140的尺寸更小,所以在输出图像148中,例如删除了内部裂纹32的准确位置信息。然而,在处理装置100中的检查中,只要能够检测出有无内部裂纹32即可,因此无需内部裂纹32的准确位置信息。因此,即使删除了内部裂纹32的准确位置信息,也不会降低图像识别处理的精度。在学习用图像与输入图像140为不同的尺寸的情况下,输出图像148与监督数据不同,具有大于1×1的空间维度。处理部114将输出图像148输出到输出部136,输出部136将输出图像148输出到外部。

如前所述,学习用图像与输入图像140也可以为不同的尺寸,尤其是,输入图像140的尺寸也可以大于学习用图像的尺寸。在此,学习用图像在学习卷积层的滤波器210时会被输入到完全卷积神经网络中,并且与监督数据对应。当这样的输入图像140被输入到处理装置100时,从输出部136输出的输出图像148具有小于输入图像140的尺寸且大于1×1的空间维度。

图8的(a)-图8的(b)表示从输出部136输出的输出图像148。在图8的(a)中,输出图像148整体上大致显示为同一颜色。由此可以明确,在太阳能电池单元10中,不存在内部裂纹32。另一方面,在图8的(b)中,进行了与类别相应的着色,输出图像148的中央部分被以比其它部分更浓的颜色来表示。由此可以明确,在太阳能电池单元10的中央部分,存在内部裂纹32。即,因为输出图像148具有大于1×1的空间维度,所以根据特征图,不仅可以确定有无内部裂纹32,还可以确定太阳能电池单元10中的相对位置。该特征图也被称为热图(heatmap)。

本公开中的装置、系统或方法的主体包括计算机。该计算机通过执行程序来实现本公开中的装置、系统或方法的主体的功能。计算机包括按照程序进行动作的处理器作为主要的硬件构成。只要处理器能够通过执行程序来实现功能,其种类就不被特别地限定。处理器由包含半导体集成电路(ic)或lsi(largescaleintegration:大规模集成电路)的1个或多个电子电路构成。多个电子电路既可以被集成于1个芯片,也可以被设置于多个芯片。多个芯片既可以被集成于1个装置,也可以被设置于多个装置。程序被记录于计算机可读取的rom、光盘、以及硬盘驱动器等非暂时性记录介质。程序既可以被预先容纳于记录介质,也可以介由包含互联网等的广域通信网而被供给到记录介质。

以下,针对以上构成的处理装置100的动作进行说明。图9的(a)-图9的(b)是表示处理装置100中的处理步骤的流程图。图9的(a)是表示学习处理的步骤的流程图。第1输入部110输入监督用数据,第2输入部112输入学习用图像(s10)。处理部114使用监督用数据和学习用图像来使各卷积层42的空间滤波器的系数被学习(s12)。当监督用数据与学习用图像的组合有剩余时(s14中的“是”),返回步骤10,当监督用数据与学习用图像的组合未剩余时(s14中的“否”),结束处理。

图9的(b)是表示图像识别处理的步骤的流程图。输入部132输入图像120(s50)。修正部134对图像120的倾斜度进行修正(s52)。处理部114将修正后的图像120作为输入图像140来执行图像识别处理(s54)。输出部136输出图像识别处理的结果即输出图像148(s56)。

根据本实施例,针对具有1×1的空间维度的监督数据,使用进行了卷积层142的空间滤波器的学习的卷积神经网络,因此能够减少制作监督数据的工作量。此外,因为会减少制作监督数据的工作量,所以能够抑制学习的工作量的増加。此外,因为会减少制作监督数据的工作量,所以能够使监督数据的数量变多。此外,因为监督数据的数量会变多,所以能够提高学习的精度。

此外,因为针对具有1×1的空间维度的监督数据,使用进行了卷积层142的空间滤波器的学习的卷积神经网络,所以能够检测出有无目标物体。此外,因为会检测出目标物体的有无,所以能够抑制图像识别处理精度的降低。此外,因为针对具有1×1的空间维度的监督数据,使用进行了卷积层142的空间滤波器的学习的卷积神经网络,所以能够既抑制学习工作量的増加,又抑制图像识别处理精度的降低。

此外,因为卷积神经网络执行由卷积层142和池化层144进行的下采样处理而不执行上采样处理,所以能够在学习时使用具有1×1的空间维度的监督数据。此外,因为至少针对有无内部裂纹32,在进行了卷积层142的空间滤波器的学习的状况下,输入对太阳能电池单元10进行拍摄而得到的图像,所以能够检查出有无内部裂纹32。

此外,因为输入比学习用图像的尺寸更大尺寸的输入图像140,所以能够取得具有1×1以上的空间维度的输出图像148。此外,因为会取得具有1×1以上的空间维度的输出图像148,所以能够取得相对的位置信息。此外,因为将图像所包含的像素的像素值作为填充202的像素值来使用,所以能够抑制填充202所导致的检测精度的恶化。此外,因为将图像所包含的像素的像素值的统计值作为填充202的像素值来使用,所以能够抑制填充202所导致的检测精度的恶化。

本公开的一个方案的概要如下所述。本公开的一个方案的处理装置(100)包括:输入部(132),其输入处理对象的图像;处理部(114),其针对输入到输入部(132)的图像,执行除全连接层外的卷积神经网络的处理;以及输出部(136),其输出处理部(114)的处理结果。处理部(114)中的卷积神经网络包含卷积层(142)、以及池化层(144)。在处理部(114)中的卷积神经网络中,针对具有1×1的空间维度的处理结果,进行了卷积层(142)的滤波器(210)的学习。被输入到输入部(132)的图像的尺寸大于学习用图像的尺寸,该学习用图像在学习卷积层(142)的滤波器(210)时被输入到卷积神经网络,且与学习卷积层(142)的滤波器(210)时的处理结果对应。

也可以是,处理部(114)中的卷积神经网络执行由卷积层(142)和池化层(144)进行的下采样处理而不执行上采样处理。

从输出部(136)输出的处理结果具有小于被输入到输入部(132)的图像的尺寸且大于1×1的空间维度,表示特征图。

也可以是,处理部(114)中的卷积神经网络所包含的卷积层(142)利用填充(202)来使图像的周围扩展,并且针对扩展后的图像,使比该扩展后的图像的尺寸更小的尺寸的滤波器(210)错开地执行卷积,处理部(114)在以包含填充(202)的方式使滤波器(210)对应的情况下,将被与滤波器(210)对应的图像的一部分中的任何一者的值使用于填充(202)。

也可以是,处理部(114)中的卷积神经网络所包含的卷积层(142)利用填充(202)来使图像的周围扩展,并且针对扩展后的图像,使比该扩展后的图像的尺寸更小的尺寸的滤波器(210)错开地执行卷积,处理部(114)在以包含填充(202)的方式使滤波器(210)对应的情况下,将被与滤波器(210)对应的图像的一部分的值的统计值使用于填充(202)。

也可以是,被输入到输入部(132)的图像是对作为检查对象的物体进行拍摄而得到的图像,在处理部(114)中的卷积神经网络中,至少针对有无不良,进行了卷积层(142)的滤波器(210)的学习,输出部(136)将处理部(114)的处理结果作为检查结果而输出。

也可以是,被输入到输入部(132)的图像是对作为检查对象的物体进行拍摄而得到的图像,在处理部(114)中的卷积神经网络中,针对物体可能包含的1个以上的要素,分别进行了卷积层(142)的滤波器(210)的学习,输出部(136)将处理部(114)的处理结果作为检查结果输出。

本公开的另一方案为一种处理方法。该方法包括:输入处理对象的图像的步骤;针对输入后的图像,执行除全连接层外的卷积神经网络的处理的步骤;以及输出处理结果的步骤。卷积神经网络包含卷积层(142)、以及池化层(144)。在卷积神经网络中,针对具有1×1的空间维度的处理结果,进行了卷积层(142)的滤波器的学习。被输入的图像的尺寸大于学习用图像的尺寸,该学习用图像在学习卷积层(142)的滤波器(210)时被输入到卷积神经网络,且与学习卷积层(142)的滤波器(210)时的处理结果对应。

以上,基于实施例对本公开进行了说明。本领域技术人员应理解的是,该实施例仅为例示,在它们的各构成要素或各处理过程的组合中,可能存在各种变形例,且那样的变形例也处于本公开的范围之内。

本实施例中的处理部114的构成中,多个卷积层42与多个池化层44交替排列。然而不限于此,例如也可以是,处理部114具有googlenet系、densenet系等构成。根据本变形例,能够提高构成的自由度。

本实施例中的处理装置100执行用于从对太阳能电池单元10进行拍摄而得到的输入图像140中检测有无内部裂纹32的处理。然而不限于此,例如也可以是,将对太阳能电池单元10以外的物体进行拍摄而得到的输入图像140作为处理对象。此外,也可以是,进行用于检测有无内部裂纹32以外的不良的处理。进而,也可以是,进行用于检测物体可能包含的1个以上的要素而非物体中有无不良的处理。根据本变形例,能够扩大处理装置100的适用范围。

[附图标记说明]

10太阳能电池单元、32内部裂纹、100处理装置、110第1输入部、112第2输入部、114处理部、120图像、130拍摄装置、132输入部、134修正部、136输出部、140输入图像、142卷积层、144池化层、148输出图像、152下采样处理部。

[工业可利用性]

根据本公开,能够既抑制学习工作量的増加,又抑制图像识别处理精度的降低。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1