图像分类的方法及装置的制造方法_2

文档序号:9866190阅读:来源:国知局
45] 其中,提取的所述中间卷积层的特征为F = mXnXk,其中mXn为每个卷积特征图 的大小,k为卷积特征图的个数。
[0046] 进一步的,所述处理单元22具体用于:
[0047] 将每个特征图处理成一列,得到一个二维数组,对所述二维数组进行归一化和降 维处理,得到最后的特征X=[X1;X2;. . . ;xk],其中Xt表示一个k维的行特征,t=l,2,. . .,k。 [004引进一步的,所述处理单元22具体用于:
[0049] 令X= {xt},X服从概率密度函数μΑ,λ表示所有的参数,贝化表示为K二l〇g,",(J〇, 形成图像表示的中层语义特征为。=与.Jog从(Λ')(ν,少巧//.如-从]c
[0050] 综上所述,本发明实施例与现有技术相比存在的有益效果是:本发明实施例通过 卷积神经网络提取输入图像的中间卷积层的特征,对提取的所述中间卷积层的特征进行预 处理后编码成图像表示的中层语义特征,并将所述图像表示的中层语义特征和图像表示的 高层语义特征进行融合,通过融合后的混合特征来表示图像信息,由于融合后的混合特征 不仅能够体现图像的高层全局语义特征而且也能很好的体现图像的细节和局部信息,因此 效果相比单一的全连接层特征有明显提高,可有效提高图像内容识别的准确率,进而提高 图像分类的准确率。另外,本发明实施例在实现上述过程中,不需要增加额外的硬件,可有 效降低成本,具有较强的易用性和实用性。
[0051] 所属领域的技术人员可W清楚地了解到,为了描述的方便和简洁,仅W上述各功 能单元的划分进行举例说明,实际应用中,可W根据需要而将上述功能分配由不同的功能 单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,W完成W上描述 的全部或者部分功能。实施例中的各功能单元可W集成在一个处理单元中,也可W是各个 单元单独物理存在,也可W两个或两个W上单元集成在一个单元中,上述集成的单元既可 W采用硬件的形式实现,也可W采用软件功能单元的形式实现。另外,各功能单元的具体名 称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中各单元的具体 工作过程,可W参考前述方法实施例中的对应过程,在此不再寶述。
[0052] 本领域普通技术人员可W意识到,结合本文中所公开的实施例描述的各示例的单 元及算法步骤,能够W电子硬件、或者计算机软件和电子硬件的结合来实现。运些功能究竟 W硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员 可W对每个特定的应用来使用不同方法来实现所描述的功能,但是运种实现不应认为超出 本发明的范围。
[0053] 在本发明所提供的实施例中,应该理解到,所掲露的装置和方法,可W通过其它的 方式实现。例如,W上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为 一种逻辑功能划分,实际实现时可W有另外的划分方式,例如多个单元或组件可W结合或 者可W集成到另一个系统,或一些特征可W忽略,或不执行。另一点,所显示或讨论的相互 之间的禪合或直接禪合或通讯连接可W是通过一些接口,装置或单元的间接禪合或通讯连 接,可W是电性,机械或其它的形式。
[0054] 所述作为分离部件说明的单元可W是或者也可W不是物理上分开的,作为单元显 示的部件可w是或者也可w不是物理单元,即可w位于一个地方,或者也可w分布到多个 网络单元上。可W根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
[0055] 另外,在本发明各个实施例中的各功能单元可W集成在一个处理单元中,也可W 是各个单元单独物理存在,也可W两个或两个W上单元集成在一个单元中。上述集成的单 元既可W采用硬件的形式实现,也可W采用软件功能单元的形式实现。
[0056] 所述集成的单元如果W软件功能单元的形式实现并作为独立的产品销售或使用 时,可W存储在一个计算机可读取存储介质中。基于运样的理解,本发明实施例的技术方案 本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可软件产品 的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用W使得一台 计算机设备(可W是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发 明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、 只读存储器(ROM,Read-Only Memoir)、随机存取存储器(RAM,Random Access Memoir)、磁 碟或者光盘等各种可W存储程序代码的介质。
[0057] W上所述实施例仅用W说明本发明的技术方案,而非对其限制;尽管参照前述实 施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可W对前述各 实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而运些修改 或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范 围。
【主权项】
1. 一种图像分类的方法,其特征在于,所述方法包括: 通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征; 对提取的所述中间卷积层的特征以及全连接层的特征进行预处理,并对预处理后的中 间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进 行归一化处理后作为图像表示的高层语义特征; 将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合; 基于融合后的特征进行图像分类。2. 如权利要求1所述的图像分类的方法,其特征在于,提取的所述中间卷积层的特征为 F=mXnXk,其中mX η为每个卷积特征图的空间大小,k为卷积特征图的个数。3. 如权利要求2所述的图像分类的方法,其特征在于,所述对提取的所述中间卷积层的 特征进行预处理包括: 将每个特征图处理成一列,得到一个二维数组,对所述二维数组进行归一化和降维处 理,得到最后的特征Χ=[χι;χ2; ·. · ;xk],其中xt表示一个k维的行特征,t=l,2, · · ·,k。4. 如权利要求3所述的图像分类的方法,其特征在于,所述对预处理后的中间卷积层的 特征进行编码,以形成图像表示的中层语义特征包括: 令X= {Xt},X服从概率密度函数μλ,λ表示所有的参数,则X表示为= log,",(幻,形成 图像表示的中层语义特征为^ = log凡Cv)(V J〇g/〇))'_ ]。5. -种图像分类的装置,其特征在于,所述装置包括: 特征提取单元,用于通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接 层的特征; 处理单元,用于对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷 积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归 一化处理后作为图像表示的高层语义特征; 融合单元,用于将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行 融合; 分类单元,用于基于融合后的特征进行图像分类。6. 如权利要求5所述的图像分类的装置,其特征在于,提取的所述中间卷积层的特征为 F=mXnXk,其中mX η为每个卷积特征图的大小,k为卷积特征图的个数。7. 如权利要求6所述的图像分类的装置,其特征在于,所述处理单元具体用于: 将每个特征图处理成一列,得到一个二维数组,对所述二维数组进行归一化和降维处 理,得到最后的特征Χ=[χι;χ2; ·. · ;xk],其中xt表示一个k维的行特征,t=l,2, · · ·,k。8. 如权利要求7所述的图像分类的装置,其特征在于,所述处理单元具体用于: 令X={xt},X服从概率密度函数μλ,λ表示所有的参数,则X表示为筠=^1呢.々(;〇,形成 图像表示的中层语义特征为巧=l〇g凡⑴
【专利摘要】本发明适用于计算机视觉技术领域,提供了一种图像分类的方法及装置。该方法包括:通过深度卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。通过本发明,可有效提高图像内容识别的准确率,进而提高图像分类的准确率。
【IPC分类】G06K9/62
【公开号】CN105631466
【申请号】CN201510960328
【发明人】乔宇, 郭胜, 黄韡林
【申请人】中国科学院深圳先进技术研究院
【公开日】2016年6月1日
【申请日】2015年12月21日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1