图像分类方法、服务器及存储介质与流程

文档序号:14940959发布日期:2018-07-13 20:45阅读:217来源:国知局

本发明涉及图像处理技术领域,尤其涉及一种图像分类方法、服务器及存储介质。



背景技术:

目前,在业务系统操作过程中,往往需要将大量资料扫描成图像并保存成电子资料,方便查询和使用,一般来说,这些资料有很多分类,比如说身份证、合同、个人征信等等,业务人员在扫描资料的时候,需要手动进行归类很不方便,可能误操作导致分类错误,也极为影响效率。



技术实现要素:

本发明的主要目的在于提出一种图像分类方法、服务器及存储介质,旨在提高图像分类的效率及图像分类的准确性。

为实现上述目的,本发明提供一种图像分类方法,所述图像分类方法包括以下步骤:

获取待分类图像;

提取所述待分类图像预设区域的特征信息,并将所述特征信息生成目标特征向量;

将所述目标特征向量与预设样品库中分类后的索引向量数据进行匹配,确定匹配成功的索引向量数据对应的预设分类类型,并将所述预设分类类型作为所述待分类图像的目标分类类型。

优选地,所述提取所述待分类图像预设区域的特征信息,并将所述特征信息生成目标特征向量,具体包括:

根据颜色和边缘的方向性描述符提取所述待分类图像全局区域的特征信息,生成多维直方图向量信息;根据加速稳健特征算法提取所述待分类图像局部区域的预设特征点信息,并根据所述预设特征点信息生成特征点向量信息;根据视觉词袋模型提取所述待分类图像局部区域的特征信息,并根据预设视觉词生成所述特征信息对应的视觉词直方图向量信息;

将所述多维直方图向量信息、特征点向量信息和视觉词直方图向量信息生成目标特征向量。

优选地,所述根据颜色和边缘的方向性描述符提取所述待分类图像全局区域的特征信息,生成多维直方图向量信息,具体包括:

根据颜色和边缘的方向性描述符提取所述待分类图像中全局区域的颜色信息和纹理信息,将所述颜色信息和纹理信息进行结合生成多维直方图向量信息。

优选地,所述根据加速稳健特征算法提取所述待分类图像局部区域的预设特征点信息,并根据所述预设特征点信息生成特征点向量信息,具体包括:

根据加速稳健特征算法依据预设矩阵生成预设特征点信息,并根据所述预设特征点信息生成特征点向量信息。

优选地,所述根据视觉词袋模型提取所述待分类图像局部区域的特征信息,并根据预设视觉词生成所述特征信息对应的视觉词直方图向量信息,具体包括:

根据视觉词袋模型提取所述待分类图像局部区域的特征信息,通过所述特征信息与预设视觉词的映射关系生成所述特征信息对应的视觉词直方图向量信息。

优选地,所述将所述目标特征向量与预设样品库中分类后的索引向量数据进行匹配,确定匹配成功的索引向量数据对应的预设分类类型,并将所述预设分类类型作为所述待分类图像的目标分类类型之前,所述方法还包括:

根据颜色和边缘的方向性描述符、加速稳健特征算法和视觉词袋模型提取样本图像数据中的向量信息,并根据所述向量信息生成索引向量数据。

优选地,所述提取所述待分类图像预设区域的特征信息,并将所述特征信息生成目标特征向量之后,所述方法还包括:

将所述特征向量与预设样品库中分类后的索引向量数据进行匹配,在匹配结果为匹配不成功时,将所述待分类图像设为预设分类类型。

优选地,所述将所述目标特征向量与预设样品库中分类后的索引向量数据进行匹配,确定匹配成功的索引向量数据对应的预设分类类型,并将所述预设分类类型作为所述待分类图像的目标分类类型之后,所述方法还包括:

根据所述待分类图像的目标分类类型更新所述预设样品库,并接收查询和修改指令,对更新后的预设样品库中的图像进行查询和修改。

此外,为实现上述目的,本发明还提出一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像分类程序,所述图像分类程序配置为实现如上所述的图像分类方法的步骤。

此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有图像分类程序,所述图像分类程序被处理器执行时实现如上所述的图像分类方法的步骤。

本发明技术方案提出的图像分类方法,先对待分类图像进行特征信息提取,特征信息包括全局特征和局部特征,并将特征信息生成目标特征向量,再将目标特征向量与与预设图库中的索引向量数据进行对比,根据对比结果确定分类类型。本发明技术方案通过对图像进行识别,实现对图像进行自动分类,提高图像分类的效率及图像分类的准确性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的服务器结构示意图;

图2为本发明图像分类方法第一实施例的流程示意图;

图3为本发明图像分类系统的结构示意图;

图4为本发明图像分类方法第二实施例的流程示意图;

图5为本发明cedd工作原理的结构框图;

图6为本发明图像分类方法第三实施例的流程示意图;

图7为本发明图像分类方法第四实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的服务器结构示意图。

如图1所示,该服务器可以包括:处理器1001,例如cpu,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏、输入单元比如键盘,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是非易失性存储器,例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像分类程序。

在图1所示的服务器中,网络接口1004主要用于连接网络,与网络进行数据通信;用户接口1003主要用于连接用户终端,与终端进行数据通信;本发明服务器通过处理器1001调用存储器1005中存储的图像分类程序,并执行以下操作:

获取待分类图像;

提取所述待分类图像预设区域的特征信息,并将所述特征信息生成目标特征向量;

将所述目标特征向量与预设样品库中分类后的索引向量数据进行匹配,确定匹配成功的索引向量数据对应的预设分类类型,并将所述预设分类类型作为所述待分类图像的目标分类类型。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

根据颜色和边缘的方向性描述符提取所述待分类图像全局区域的特征信息,生成多维直方图向量信息;根据加速稳健特征算法提取所述待分类图像局部区域的预设特征点信息,并根据所述预设特征点信息生成特征点向量信息;根据视觉词袋模型提取所述待分类图像局部区域的特征信息,并根据预设视觉词生成所述特征信息对应的视觉词直方图向量信息;

将所述多维直方图向量信息、特征点向量信息和视觉词直方图向量信息生成目标特征向量。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

根据颜色和边缘的方向性描述符提取所述待分类图像中全局区域的颜色信息和纹理信息,将所述颜色信息和纹理信息进行结合生成多维直方图向量信息。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

根据加速稳健特征算法依据预设矩阵生成预设特征点信息,并根据所述预设特征点信息生成特征点向量信息。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

根据视觉词袋模型提取所述待分类图像局部区域的特征信息,通过所述特征信息与预设视觉词的映射关系生成所述特征信息对应的视觉词直方图向量信息。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

根据颜色和边缘的方向性描述符、加速稳健特征算法和视觉词袋模型提取样本图像数据中的向量信息,并根据所述向量信息生成索引向量数据。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

将所述特征向量与预设样品库中分类后的索引向量数据进行匹配,在匹配结果为匹配不成功时,将所述待分类图像设为预设分类类型。

进一步地,处理器1001可以调用存储器1005中存储的图像分类程序,还执行以下操作:

根据所述待分类图像的目标分类类型更新所述预设样品库,并接收查询和修改指令,对更新后的预设样品库中的图像进行查询和修改。

本实施例通过上述方案,通过对待分类图像提取出全局特征和局部特征,并与预设图库中的索引进行对比,根据对比相似度确定分类类型,可通过对图像进行识别,实现对图像进行自动分类,从而提高图像分类准确性。

基于上述硬件结构,提出本发明图像分类方法实施例。

参照图2,图2为本发明图像分类方法第一实施例的流程示意图。

在第一实施例中,所述图像分类方法包括以下步骤:

步骤s10,服务器获取待分类图像;

需要说明的是,本实施例的执行主体可为服务器,通过移动终端与服务器进行连接,所述移动终端可为平板、电脑等终端设备,在本实施例中,以电脑为例进行说明,还可为其他可实现相同或相似功能的终端设备,本实施例对此不作限制。

用户通过移动终端将待分类的图像上传至所述移动终端,在所述移动终端上设有分类处理的接口,例如安装在所述移动终端上的应用程序(application,app),通过应用程序将待分类图像上传至所述服务器进行处理,还可为其他接口形式,本实施例对此不作限制。

所述待分类信息可为个人征信报告、不同银行开具的征信材料或者身份证复印件等通过扫描仪或者其他扫描设备扫描成的各种图像信息,可将所述图像信息保存成电子资料。

步骤s20,提取所述待分类图像预设区域的特征信息,并将所述特征信息生成目标特征向量;

可以理解的是,所述预设区域为全局区域和局部区域,在本实施例中,可获取到待分类图像的全局区域和局部区域,从而可通过多方面进行特征提取,并将提取出的特征通过预设算法生成特征向量,可将待分类的图像转化为数字化的参数信息,更易于实现对所述待分类图像的识别。

在具体实现中,可先提取全局区域中的特征信息,在所述特征信息匹配度达到预设值时,再提取局部区域的特征信息,从而减少其他噪声图像的影响,提高特征提取的准确度,还可同时提取所述待分类图像中的全局区域和局部区域的特征信息,并将所述特征信息生成特征向量,从而提高特征向量的匹配参数,使所述待分类图像的辨认度更高。

在本实施例中,所述特征向量可为将提取的特征信息,根据预设算法生成特征参数,并将所述特征参数进行聚类,从而得到所述待分类图像的特征向量,所述特征向量可为带有方向的特征信息,从而提高所述待分类图像识别的准确性。

步骤s30,将所述目标特征向量与预设样品库中分类后的索引向量数据进行匹配,确定匹配成功的索引向量数据对应的预设分类类型,并将所述预设分类类型作为所述待分类图像的目标分类类型。

需要说明的是,所述预设样品库为根据已经分类好的历史样本图像进行保存的样品库,所述预设样本库中的历史样本图像为各个分类中填充的图像样本,所述图像样本可能涉及不同的征信材料,需要将所述征信材料填充成一份样本,并依据颜色和边缘的方向性描述符(colorandedgedirectivitydescriptor,cedd)、加速稳健特征(speededuprobustfeatures,surf)和视觉词袋模型(bagofwordsmodel,bovw),提取出样本中的特征,并据此生成索引向量数据。

可以理解的是,所述预设分类类型可为身份证复印件、房产证明和贷款证明等,通过将待分类图像与预设样品库中的已分类的图像数据进行匹配,在匹配成功时,将所述已分类的图像数据的图像类型作为所述待分类图像的目标分类类型。

在具体实现中,可将所述待分类图像与所述样品库中的所有样本图像进行对比,并根据对比结果的相似度生成相似度值,根据与所有样本图像进行比较的结果生成相似度列表,并将所述相似度列表从高到低的顺序进行排列,选择相似度最高的样本图像对应的图像类型作为所述待分类图像的目标分类类型,例如所述待分类图像与所述样品库中的相似度列表为文件名a为90%、文件名b为75%等,选取相似度最高的90%的文件名a对应的分类类型作为所述待分类图像对应的目标分类类型。

如图3所示的图像分类系统的结构示意图,所述图像分类系统可包括影像管理子系统和以图搜图子系统,所述影像管理子系统和以图搜图子系统各自独立部署运行。所述影像管理子系统将所述待分类图像传输给所述以图搜图子系统,而以图搜图子系统对影像进行分类,并将分类结果返回给影像管理子系统。影像管理子系统收到识别结果后,将所述待分类图像分门别类地保存下来。

在具体实现中,可首先在以图搜图系统中,确定图库需要有哪些图像分类,确定好分类后就往各个分类中填充图像样本。比如说个人征信材料,不同银行开具的征信材料样式布局等都有所差别,所以涉及到的不同的征信材料都需要填充一份样本,系统会依据cedd特征算法、surf算法和bovw模型,提取出样本中的特征,并据此生成索引,然后将待分类图像扫描成电子图像并上传到影像管理系统,影像管理系统再将图像传输至以图搜图系统,以图搜图系统收到后,同样依据cedd特征算法、surf算法和bovw模型提取出特征向量,并和图库中的特征索引做对比,根据相似度得出每个图像的分类,并返回结果至影像管理系统,所述影像管理系统收到识别结果后,将图像分门别类地保存下来。

本实施例提供的方案,服务器通过对待分类图像提取出全局特征和局部特征,并与预设图库中的索引进行对比,根据对比相似度确定分类类型,可通过对图像进行识别,实现对图像进行自动分类,从而提高图像分类准确性。

进一步地,如图4所示,基于第一实施例提出本发明图像分类方法第二实施例,在本实施例中,所述步骤s20,具体包括:

步骤s201,根据颜色和边缘的方向性描述符提取所述待分类图像全局区域的特征信息,生成多维直方图向量信息;

需要说明的是,所述颜色和边缘的方向性描述符(colorandedgedirectivitydescriptor,cedd),它结合了图像的颜色和纹理信息,生成一个144位的直方图。cedd直方图信息由六个区域组成,六个区域就是提取出的6维向量直方图,然后在这些纹理信息的每一维中再加入颜色模块提取出的24维颜色信息,这样就可以将颜色和纹理有效结合起来,最终得出6*24=144维的直方图信息。

步骤s202,根据加速稳健特征算法提取所述待分类图像局部区域的预设特征点信息,并根据所述预设特征点信息生成特征点向量信息;

可以理解的是,所述加速稳健特征算法(spleededuprobustfeatures,surf),是一种稳健的局部特征点检测和描述算法,从而对待分类图像进行更细化的特征提取,在本实施例中,通过surf算法进行局部的特征提取,从而细化待分类图像,提高待分类图像的辨认度。

步骤s203,根据视觉词袋模型提取所述待分类图像局部区域的特征信息,并根据预设视觉词生成所述特征信息对应的视觉词直方图向量信息;

需要说明的是,所述视觉词袋模型(bagofvisualword,bovw)通过预设视觉词提取所述待分类图像的特征信息,从而通过预设分类的视觉词通过特征匹配的权重值对待分类图像进行有效的分类。

步骤s204,将所述多维直方图向量信息、特征点向量信息和视觉词直方图向量信息生成目标特征向量。

在本实施例中,将通过cedd算法、surf算法及bovw模型进行组合利用,充分提取待分类图像中的特征信息,从而从全局特征到局部特征对待分类图像中的特征进行更细化的特征匹配,从而实现自动对待分类图像进行分类,提高图像分类的准确性。

进一步地,所述步骤s201,具体包括:

步骤s205,根据颜色和边缘的方向性描述符提取所述待分类图像中全局区域的颜色信息和纹理信息,将所述颜色信息和纹理信息进行结合生成多维直方图向量信息。

在具体实现中,首先提取待分类图像中的颜色信息,为了实现对待分类图像中的颜色信息的提取,生成加色法混色模型(redgreenblue,rgb),将所述rgb模型转换为色调饱和度明度模型(huesaturationvalue,hsv),通过10区间模糊过滤器将所述hsv模型的信息生成10个模糊的直方图信息,然后将10区间模糊过滤器输出的每种色区通过24区间模糊过滤器再分为3个h值区域,输入一个10维向量和s、v通道值,输出一个24维向量。

如图5所示的cedd工作原理的结构框图,将待分类图像送入10区间模糊过滤器,所述生成10区间模糊过滤器根据所述待分类图像的颜色信息生成10维直方图信息,再将所述10维直方图信息送入24区间模糊过滤器生成24维直方图信息,从而实现对待分类图像的颜色识别,并更精细的根据识别出的颜色提取待分类图像的颜色特征信息。

为了实现对纹理特征的识别和提取,在本实施例中,所述cedd算法还通过数字过滤器快速提取所述待分类图像中的纹理边缘信息,并根据边缘直方图描述符(edgehistogramdescriptor,ehd)提取一个6维直方图,可知,cedd直方图信息由6个区域组成,就是通过纹理信息提取的六个区域取出的6维向量直方图,然后将纹理信息的每一维加入颜色提取中的24维颜色信息,并将颜色信息和纹理信息结合,得出144维直方图信息。

继续如图5所示的将待分类图像送入数字过滤器中进行过滤提取出待分类图像中的纹理信息,再将所述纹理信息通过边缘直方图进行判断生成6维直方图信息,将所述6维直方图信息与提取出的24维直方图信息进行量化,生成cedd特征,从而实现对待分类图像的全局特征的提取。

进一步地,所述步骤s202,具体包括:

步骤s206,根据加速稳健特征算法依据预设矩阵生成预设特征点信息,并根据所述预设特征点信息生成特征点向量信息。

在具体实现中,首先通过黑塞矩阵,生成所有的特征点,用于特征提取,然后通过划分的八度组的多层组成构建尺寸空间,不同组间图像的尺寸一致,通过不同组间使用不断增大的盒式滤波器,再将黑塞矩阵处理的每个像素点与二维空间和尺寸空间领域内的26个点进行比较,定位出初始关键点,并通过过滤能量比较弱的关键点以及错误定位的错误点,筛选出最终的稳定的特征点,将所述特征点进行统计获取统计出的圆形区域内的哈尔小波特征,在特征点的圆形邻域内,统计60度扇形内所有点的水平、垂直哈尔小波特征总和,然后扇形以一定间隔进行旋转并再次统计该区域内哈尔小波特征值之后,最后将值最大的那个扇形的方向作为该特征点的主方向。

在特征点周围取一个4*4的矩形区域块,所述矩形区域方向沿着特征点的主方向,每个子区域统计25个像素的水平方向和垂直方向的哈尔小波特征,该哈尔小波特征为水平方向值、垂直方向值、水平方向绝对值以及垂直方向绝对值4个方向,把这4个值作为每个子块区域的特征向量,所以一共有4*4*4=64维向量作为surf特征的描述向量特征信息。

进一步地,所述步骤s203,具体包括:

步骤s207,根据视觉词袋模型提取所述待分类图像局部区域的特征信息,通过所述特征信息与预设视觉词的映射关系生成所述特征信息对应的视觉词直方图向量信息。在具体实现中,首先提取待分类图像中的特征,根据数据集选取特征,然后进行描述,形成特征数据;再通过学习词袋,利用处理好的特征数据全部合并,再用聚类的方法把特征词分为若干类,每一个类相当于一个视觉词,最后利用视觉词袋量化图像特征,从而形成视觉词直方图向量信息。

本实施例提供的方案,通过cedd算法获取颜色与纹理相关的全局特征信息,然后通过surf算法获取预设特征点的64维特征向量信息,再通过bovw模型获取视觉词直方图向量信息,从而通过结合多方向最大限度的提取待分类图像中的特征信息,提高图像识别的准确度。

进一步地,如图6所示,基于第一实施例和第二实施例提出本发明图像分类方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤s30之前,所述方法还包括:

步骤s301,根据颜色和边缘的方向性描述符、加速稳健特征算法和视觉词袋模型提取样本图像数据中的向量信息,并根据所述向量信息生成索引向量数据。

在具体实现中,为了使待分类图像进行准确分类,首先,必须建立多种分类后的预设样品库,并将所述预设样品库中保存已分类完成的图像数据,然后根据分类完成的图像数据与待分类图像进行特征向量匹配,从而根据匹配结果,将最匹配的图像数据对应的分类类型作为待分类图像的目标分类类型。

需要说明的是,为了进行一致的数据匹配,在匹配之前,可对已分类图像数据根据cedd算法、surf算法和bovw模型提取出已分类图像数据的向量数据信息,并根据所述向量数据信息建立索引,从而可更快速的根据匹配的图像数据查找到对应的分类类型。

本实施例提供的方案,将已分类完成的图像数据通过cedd算法、surf算法和bovw模型提取出向量数据信息,并通过所述向量数据信息建立所索引,从而可更快速的通过索引查找到匹配度最高的图像数据对应的分类类型,提高对待分类图像的分类效率。

进一步地,如图7所示,基于第一实施例和第二实施例提出本发明图像分类方法第四实施例,在本实施例中,基于第一实施例进行说明,所述步骤s20之后,所述方法还包括:

步骤s208,将所述特征向量与预设样品库中分类后的索引向量数据进行匹配,在匹配结果为匹配不成功时,将所述待分类图像设为预设分类类型。

需要说明的是,所述预设分类类型可为已分类完成的分类类型,例如身份证证明等分类类型,还可为待定分类类型,用于存放未分类成功的待分类图像。

在具体实现中,还可提取未匹配成功的待分类图像,根据待分类图像的特征信息更新预设样品库中分类后的索引向量数据,从而使预设样品库中的索引更丰富,满足更多不同的图像数据的分类。

进一步,所述步骤s30之后,所述方法还包括:

步骤s40,根据所述待分类图像的目标分类类型更新所述预设样品库,并接收查询和修改指令,对更新后的预设样品库中的图像进行查询和修改。

需要说明的是,所述查询和修改指令可为用户通过移动终端进行接口操作执行的指令,例如,用户通过服务端口中显示的查询或修改按钮执行的点击指令,还可通过其他方式发送的查询或修改指令,本实施例对此不作限制。

本实施例提供的方案,对于匹配不成功的待分类图像,将所述待分类图像设定为预设分类类型,从而对于匹配不成功的待分类图像也可进行分类,提高服务器对于图像分类的完整性,同时提供查询和修改接口对预设样品库中的样品图像进行有效管理。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1