图片分类方法及装置的制造方法_2

文档序号:8299082阅读:来源:国知局
示图片时,在文字图片之间会间隔非文字图片,导致查看效率低的问题,达到了提高查看 效率的效果。
[0072] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本 公开。
【附图说明】
[0073] 此处的附图被并入说明书中并构成本公开说明书的一部分,示出了符合本公开的 实施例,并与说明书一起用于解释本公开的原理。
[0074] 图1是根据一示例性实施例示出的一种图片分类方法的流程图。
[0075] 图2A是根据另一示例性实施例示出的一种图片分类方法的流程图。
[0076] 图2B是根据另一示例性实施例示出的文字图片的示意图。
[0077] 图2C是根据另一示例性实施例示出的样本图片的第一种直方图的示意图。
[0078] 图2D是根据另一示例性实施例示出的样本图片的第二种直方图的示意图。
[0079] 图2E是根据另一示例性实施例示出的第一种图片分类的显示示意图。
[0080] 图2F是根据另一示例性实施例示出的第二种图片分类的显示示意图。
[0081] 图2G是根据另一不例性实施例不出的折萱图片集的显不不意图。
[0082] 图2H是根据另一不例性实施例不出的有效时间彳目息的设置不意图。
[0083] 图3是根据一示例性实施例示出的一种图片分类装置的框图。
[0084] 图4是根据一示例性实施例示出的一种图片分类装置的框图。
[0085] 图5是根据一示例性实施例示出的一种用于图片分类的装置的框图。
【具体实施方式】
[0086] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0087] 图1是根据一示例性实施例示出的一种图片分类方法的流程图,该图片分类方法 应用于终端中,如图1所示,该图片分类方法包括以下步骤。
[0088] 在步骤101中,获取待分类的图片。
[0089] 在步骤102中,根据图片的特征信息确定图片所属的类别,类别包括文字图片类 和非文字图片类。
[0090] 在步骤103中,将图片按照该类别进行分类。
[0091] 综上所述,本公开提供的图片分类方法,通过获取待分类的图片;根据图片的特征 信息确定图片所属的类别,类别包括文字图片类和非文字图片类;将图片按照该类别进行 分类,可以将图片按照文字图片类和非文字图片类进行分类,使得文字图片类中的图片都 是文字图片,解决了终端按照存储时间显示图片时,在文字图片之间会间隔非文字图片,导 致查看效率低的问题,达到了提高查看效率的效果。
[0092] 图2A是根据另一示例性实施例示出的一种图片分类方法的流程图,该图片分类 方法应用于终端中,如图2A所示,该图片分类方法包括如下步骤。
[0093] 在步骤201中,获取待分类的图片。
[0094] 图片是终端中存储的图片,可以包括文字图片和非文字图片。其中,文字图片是指 图片中包含文字信息的图片,非文字图片是指除文字图片之外的图片。
[0095] 请参考图2B所示的文字图片的示意图,图2B是用户对一则通知进行拍摄后得到 的一张文字图片。文字图片包括"通知"的标题、"各位x园业主,2014年11月26日将进行 线路检修,请大家提前做好准备"的内容以及"x物业宣"的通知发布者。
[0096] 在步骤202中,根据图片的特征信息确定图片所属的类别,类别包括文字图片类 和非文字图片类。
[0097] 由于文字图片中包含文字信息,非文字图片中包含图形信息,因此,终端可以根据 文字信息和图形信息的特征信息来确定图片所属的类别,该特征信息可以为gabor特征值 或梯度方向值。
[0098] 其中,根据图片的特征信息确定图片所属的类别,包括:
[0099] 1)对图片中每个像素点的特征信息进行提取;
[0100] 2)根据SVM(SupportVectorMachine,支持向量机)模型对特征信息进行判定, SVM模型是对样本图片进行训练后得到的,样本图片包括文字图片和非文字图片;
[0101] 3)根据判定结果确定图片所属的分类。
[0102] 在提取特征信息时,由于文字是由横、竖、撇、捺等笔画构成的,因此,当特征信息 是gabor特征值时,可以将文字的粗细分为5个等级,将笔画的方向分为8个等级,对图片 中的每个像素点计算出一个40维的gabor特征值;当特征信息是梯度方向值时,根据图片 中的每个像素点的坐标,计算该像素点的梯度方向值。
[0103] 终端还可以获取SVM模型,并将提取的特征信息输入到该SVM模型中,由该SVM模 型根据特征信息对图片的类别进行判定,并输出判定结果。其中,判定结果用于指示该图片 是文字图片,或,判定结果用于指示该图片是非文字图片。
[0104] 终端可以先获取SVM模型,再根据SVM模型和特征信息确定图片的类别。其中,终 端获取SVM模型的方法有很多种。比如,当终端处理能力较强时,终端可以对样本图片进 行训练,得到SVM模型;或,当终端处理能力较弱时,终端可以从服务器中获取SVM模型,该 SVM模型是服务器对样本图片进行训练后得到的。可选的,终端也可以不获取SVM模型,而 是将特征信息发送给服务器,由服务器根据SVM模型和特征信息确定图片的类别,终端接 收服务器反馈的类别,该SVM模型是服务器对样本图片进行训练后得到的。
[0105] 本实施例以终端根据样本图片训练SVM模型为例进行说明,则本实施例提供的图 片分类方法,还包括:
[0106] 1)将样本图片的分辨率归一化到预定分辨率;
[0107] 2)对归一化后的样本图片中每个像素点的特征信息进行提取;
[0108] 3)统计每个样本图片分区中特征信息的直方图,样本图片分区是对样本图片进行 区域划分后得到的;
[0109] 4)根据样本图片的类型和直方图得到SVM模型。
[0110] 第一,终端需要获取第一数量的文字图片和第二数量的非文字图片,将文字图片 和非文字图片确定为样本图片。其中,样本图片的数量越多,训练得到的SVM模型越精确, 此时,训练SVM模型所要消耗的处理资源也越多,因此,可以根据实际需要选取样本图片的 数量。比如,第一数量可以是5万,第二数量可以是10万。
[0111] 第二,终端获取到的每张样本图片的分辨率不同,导致相同的样本图片分区内包 括的像素点的个数不同,使得统计出的直方图不准确,因此,终端需要将样本图片的分辨 率归一化到预定分辨率。其中,预定分辨率可以是终端设置的,比如,预定分辨率可以是 300*300DPI(DotsPerInch,每英寸的像素点),也可以是其它数值,本实施例不作限定。
[0112] 第三,终端对归一化后的样本图片的特征信息进行提取,得到每个像素点的gabor 特征值或得到每个像素点的梯度方向值。
[0113] 第四,终端可以对一张样本图片的特征信息进行统计,得到一个直方图,该直方图 用于表示样本图片中特征信息的分布情况。
[0114] 本实施例中的特征信息为gabor特征值或梯度方向值,由于gabor特征值和梯度 方向值不便于在附图中直观表示,因此,本实施例以特征信息是像素点的灰度值且样本图 片a和样本图片b的分辨率相同为例对直方图的统计过程进行举例说明。请参考图2C所示 的样本图片的第一种直方图的示意图,假设样本图片a的上半部分由黑色的像素点组成, 下半部分由白色的像素点组成,样本图片b中每两个黑色的像素点中间隔一个白色的像素 点。假设直方图中的区间为[0,63]、(63,127]、(127,191]和(191,255],则图a的直方图 中,区间为[0,63]的面积为0. 5,区间为(191,255]的面积为0. 5。图b的直方图中,区间 为[0,63]的面积为0.5,区间为(191,255]的面积为0.5。即,样本图片a的直方图和样本 图片b的直方图相同,而样本图片a与样本图片b并不相同。可见,当统计的特征信息越多 时,特征信息的分布越相似。
[0115] 为了避免由于特征信息多造成的特征信息分布相似的问题,终端可以对样本图片 进行区域划分,得到样本图片分区,再对样本图片分区中特征信息的直方图进行统计。假设 将样本图片等面积分成4个样本图片分区,此时,样本图片a中第一个样本图片分区中区间 为[0,63]的面积为
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1