一种基于二值化图像分类网络的图像分类方法

文档序号：26628280发布日期：2021-09-14 22:17阅读：来源：国知局

技术特征：
1.一种基于二值化图像分类网络的图像分类方法，其特征在于，包括以下步骤：s1：采集原始图像，并对原始图像进行初始化；s2：根据初始化后的原始图像，搭建图像分类网络；s3：利用图像分类网络的softmax分类器进行图像分类。2.根据权利要求1所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤s1包括以下子步骤：s11：采集尺寸为224*224*3的原始图像，并在原始图像的四周各添加宽度为3的0元素，得到尺寸为230*230*3的第一输出图像；s12：利用尺寸为7*7且步长为1的卷积核对第一输出图像进行卷积操作，得到尺寸为224*224*64的第二输出图像，并对第二输出图像进行批量归一化，得到尺寸为224*224*64的第三输出图像；s13：利用非线性激活函数h(x)对第三输出图像进行激活，并对激活后的第三输出图像进行最大池化，得到尺寸为112*112*64的第四输出图像；s14：利用符号函数s(x
′
)对第四输出图像进行二值化，得到尺寸为112*112*64的第五输出图像，完成原始图像初始化。3.根据权利要求2所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤s14中，符号函数s(x
′
)的表达式为：其中，x表示符号函数的输入图像，α表示第一待学习参数。4.根据权利要求2所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤s2包括以下子步骤：s21：在第五输出图像的四周各添加宽度为1的0元素，得到尺寸为114*114*64的第六输出图像；s22：利用尺寸为3*3且步长为1的二值化卷积核对第六输出图像进行卷积操作，得到尺寸为112*112*128的第七输出图像；s23：利用非线性激活函数h(x)对第七输出图像进行激活，并对激活后的第七输出图像进行最大池化，得到尺寸为56*56*128的第八输出图像；s23：在第八输出图像的四周各添加宽度为1的0元素，得到尺寸为58*58*128的第九输出图像；s24：利用尺寸为3*3且步长为1的二值化卷积核对第九输出图像进行卷积操作，得到尺寸为56*56*256的第十输出图像；s25：利用非线性激活函数h(x)对第十输出图像进行激活，并对激活后的第十输出图像进行最大池化，得到尺寸为28*28*256的第十一输出图像；s26：在第十一输出图像的四周各添加宽度为1的0元素，得到尺寸为30*30*256的第十二输出图像；s27：利用尺寸为3*3且步长为1的二值化卷积核对第十二输出图像进行卷积操作，得到尺寸为28*28*512的第十三输出图像；
s28：利用非线性激活函数h(x)对第十三输出图像进行激活，并对激活后的第十三输出图像进行最大池化，得到尺寸为14*14*512的第十四输出图像；s29：在第十四输出图像的四周各添加宽度为1的0元素，得到尺寸为16*16*512的第十五输出图像；s210：利用尺寸为3*3且步长为1的二值化卷积核对第十五输出图像进行卷积操作，得到尺寸为14*14*512的第十六输出图像；s211：利用非线性激活函数h(x)对第十六输出图像进行激活，并对激活后的第十六输出图像进行最大池化，得到尺寸为7*7*512的第十七输出图像；s212：在第十七输出图像的四周各添加宽度为1的0元素，得到尺寸为9*9*512的第十八输出图像；s213：利用尺寸为3*3且步长为1的二值化卷积核对第十八输出图像进行卷积操作，得到尺寸为7*7*512的第十九输出图像；s214：利用非线性激活函数h(x)对第十九输出图像进行激活，并对激活后的第十九输出图像进行拉伸，得到尺寸为1*25088的第二十输出图像；s215：将第二十输出图像输入至两层神经元为4096的全连接层，完成图像分类网络搭建。5.根据权利要求4所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤s13、步骤s23、步骤s25、步骤s28、步骤s211和步骤s214中，进行最大池化的池化池大小为2*2，步长为2*2。6.根据权利要求4所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤s13、步骤s23、步骤s25、步骤s28和步骤s211中，非线性激活函数h(x)的表达式为：其中，表示非线性激活函数的输入图像，β表示第二待学习参数，γ表示第三待学习参数，τ表示第四待学习参数。7.根据权利要求4所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤s2中，对尺寸为3*3的卷积核进行二值化包括以下子步骤：a21：利用尺寸为3*3*c
in
*c
out
的第一二值化卷积核b
i1
、第二二值化卷积核b
i2
、第三二值化卷积核b
i3
和第四二值化卷积核b
i4
对尺寸为3*3的卷积核分别进行线性近似，其中，c
in
表示输入通道数，c
out
表示输出通道数；a22：对线性近似后的卷积核矩阵中的各个元素进行归一化处理，得到归一化处理后的卷积核；a23：设定第一二值化卷积核b
i1
、第二二值化卷积核b
i2
、第三二值化卷积核b
i3
和第四二值化卷积核b
i4
对应的激活阈值，分别为b
i1
、b
i2
、b
i3
和b
i4
；a24：在第一二值化卷积核b
i1
、第二二值化卷积核b
i2
、第三二值化卷积核b
i3
和第四二值化卷积核b
i4
中，分别将归一化处理后的卷积核矩阵中小于激活阈值b
i1
、b
i2
、b
i3
和b
i4
的参数确定为0，大于激活阈值b
i1
、b
i2
、b
i3
和b
i4
的参数确定为1，并随机初始化第一二值化卷积核b
i1
、第二二值化卷积核b
i2
、第三二值化卷积核b
i3
和第四二值化卷积核b
i4
的权重，完成尺寸为3*3的卷积核的二值化。
8.根据权利要求7所述的基于二值化图像分类网络的图像分类方法，其特征在于，所述步骤a21中，进行线性近似的计算公式为：w
i
≈α
i1
*b
i1
+α
i2
*b
i2
+α
i3
*b
i3
+α
i4
*b
i4
其中，w
i
表示线性近似后的卷积核，α
i1
表示第一二值化卷积核b
i1
的权重，α
i2
表示第二二值化卷积核b
i2
的权重，α
i3
表示第三二值化卷积核b
i3
的权重，α
i4
表示第四二值化卷积核b
i4
的权重；所述步骤a22中，对线性近似后的卷积核矩阵中的各个元素a
ij
进行归一化处理的公式为：其中，a
′
ij
表示归一化后的各个元素，min表示元素a
ij
中的最小值，max表示元素a
ij
中的最大值。

技术总结
本发明公开了一种基于二值化图像分类网络的图像分类方法，包括以下步骤：S1：采集原始图像，并对原始图像进行初始化；S2：根据初始化后的原始图像，搭建图像分类网络；S3：利用图像分类网络的softmax分类器进行图像分类。该图像分类方法对传统图像分类中运算量最大的卷积运算模块的卷积核进行二值化处理，使用4个同规格的二值化卷积核进行线性近似，节约算法存储空间开销。存储空间开销。存储空间开销。

技术研发人员：刘启和王钰涵周世杰张准董婉祾但毅严张豹
受保护的技术使用者：电子科技大学
技术研发日：2021.06.10
技术公布日：2021/9/13

完整全部详细技术资料下载

当前第2页1 2