图片分类方法及装置的制造方法_2

文档序号：8299082阅读：来源：国知局

示图片时，在文字图片之间会间隔非文字图片，导致查看效率低的问题，达到了提高查看效率的效果。
[0072] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。
【附图说明】
[0073] 此处的附图被并入说明书中并构成本公开说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。
[0074] 图1是根据一示例性实施例示出的一种图片分类方法的流程图。
[0075] 图2A是根据另一示例性实施例示出的一种图片分类方法的流程图。
[0076] 图2B是根据另一示例性实施例示出的文字图片的示意图。
[0077] 图2C是根据另一示例性实施例示出的样本图片的第一种直方图的示意图。
[0078] 图2D是根据另一示例性实施例示出的样本图片的第二种直方图的示意图。
[0079] 图2E是根据另一示例性实施例示出的第一种图片分类的显示示意图。
[0080] 图2F是根据另一示例性实施例示出的第二种图片分类的显示示意图。
[0081] 图2G是根据另一不例性实施例不出的折萱图片集的显不不意图。
[0082] 图2H是根据另一不例性实施例不出的有效时间彳目息的设置不意图。
[0083] 图3是根据一示例性实施例示出的一种图片分类装置的框图。
[0084] 图4是根据一示例性实施例示出的一种图片分类装置的框图。
[0085] 图5是根据一示例性实施例示出的一种用于图片分类的装置的框图。
【具体实施方式】
[0086] 这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0087] 图1是根据一示例性实施例示出的一种图片分类方法的流程图，该图片分类方法应用于终端中，如图1所示，该图片分类方法包括以下步骤。
[0088] 在步骤101中，获取待分类的图片。
[0089] 在步骤102中，根据图片的特征信息确定图片所属的类别，类别包括文字图片类和非文字图片类。
[0090] 在步骤103中，将图片按照该类别进行分类。
[0091] 综上所述，本公开提供的图片分类方法，通过获取待分类的图片；根据图片的特征信息确定图片所属的类别，类别包括文字图片类和非文字图片类；将图片按照该类别进行分类，可以将图片按照文字图片类和非文字图片类进行分类，使得文字图片类中的图片都是文字图片，解决了终端按照存储时间显示图片时，在文字图片之间会间隔非文字图片，导致查看效率低的问题，达到了提高查看效率的效果。
[0092] 图2A是根据另一示例性实施例示出的一种图片分类方法的流程图，该图片分类方法应用于终端中，如图2A所示，该图片分类方法包括如下步骤。
[0093] 在步骤201中，获取待分类的图片。
[0094] 图片是终端中存储的图片，可以包括文字图片和非文字图片。其中，文字图片是指图片中包含文字信息的图片，非文字图片是指除文字图片之外的图片。
[0095] 请参考图2B所示的文字图片的示意图，图2B是用户对一则通知进行拍摄后得到的一张文字图片。文字图片包括"通知"的标题、"各位x园业主，2014年11月26日将进行线路检修，请大家提前做好准备"的内容以及"x物业宣"的通知发布者。
[0096] 在步骤202中，根据图片的特征信息确定图片所属的类别，类别包括文字图片类和非文字图片类。
[0097] 由于文字图片中包含文字信息，非文字图片中包含图形信息，因此，终端可以根据文字信息和图形信息的特征信息来确定图片所属的类别，该特征信息可以为gabor特征值或梯度方向值。
[0098] 其中，根据图片的特征信息确定图片所属的类别，包括：
[0099] 1)对图片中每个像素点的特征信息进行提取；
[0100] 2)根据SVM(SupportVectorMachine，支持向量机）模型对特征信息进行判定， SVM模型是对样本图片进行训练后得到的，样本图片包括文字图片和非文字图片；
[0101] 3)根据判定结果确定图片所属的分类。
[0102] 在提取特征信息时，由于文字是由横、竖、撇、捺等笔画构成的，因此，当特征信息是gabor特征值时，可以将文字的粗细分为5个等级，将笔画的方向分为8个等级，对图片中的每个像素点计算出一个40维的gabor特征值；当特征信息是梯度方向值时，根据图片中的每个像素点的坐标，计算该像素点的梯度方向值。
[0103] 终端还可以获取SVM模型，并将提取的特征信息输入到该SVM模型中，由该SVM模型根据特征信息对图片的类别进行判定，并输出判定结果。其中，判定结果用于指示该图片是文字图片，或，判定结果用于指示该图片是非文字图片。
[0104] 终端可以先获取SVM模型，再根据SVM模型和特征信息确定图片的类别。其中，终端获取SVM模型的方法有很多种。比如，当终端处理能力较强时，终端可以对样本图片进行训练，得到SVM模型；或，当终端处理能力较弱时，终端可以从服务器中获取SVM模型，该 SVM模型是服务器对样本图片进行训练后得到的。可选的，终端也可以不获取SVM模型，而是将特征信息发送给服务器，由服务器根据SVM模型和特征信息确定图片的类别，终端接收服务器反馈的类别，该SVM模型是服务器对样本图片进行训练后得到的。
[0105] 本实施例以终端根据样本图片训练SVM模型为例进行说明，则本实施例提供的图片分类方法，还包括：
[0106] 1)将样本图片的分辨率归一化到预定分辨率；
[0107] 2)对归一化后的样本图片中每个像素点的特征信息进行提取；
[0108] 3)统计每个样本图片分区中特征信息的直方图，样本图片分区是对样本图片进行区域划分后得到的；
[0109] 4)根据样本图片的类型和直方图得到SVM模型。
[0110] 第一，终端需要获取第一数量的文字图片和第二数量的非文字图片，将文字图片和非文字图片确定为样本图片。其中，样本图片的数量越多，训练得到的SVM模型越精确，此时，训练SVM模型所要消耗的处理资源也越多，因此，可以根据实际需要选取样本图片的数量。比如，第一数量可以是5万，第二数量可以是10万。
[0111] 第二，终端获取到的每张样本图片的分辨率不同，导致相同的样本图片分区内包括的像素点的个数不同，使得统计出的直方图不准确，因此，终端需要将样本图片的分辨率归一化到预定分辨率。其中，预定分辨率可以是终端设置的，比如，预定分辨率可以是 300*300DPI(DotsPerInch，每英寸的像素点），也可以是其它数值，本实施例不作限定。
[0112] 第三，终端对归一化后的样本图片的特征信息进行提取，得到每个像素点的gabor 特征值或得到每个像素点的梯度方向值。
[0113] 第四，终端可以对一张样本图片的特征信息进行统计，得到一个直方图，该直方图用于表示样本图片中特征信息的分布情况。
[0114] 本实施例中的特征信息为gabor特征值或梯度方向值，由于gabor特征值和梯度方向值不便于在附图中直观表示，因此，本实施例以特征信息是像素点的灰度值且样本图片a和样本图片b的分辨率相同为例对直方图的统计过程进行举例说明。请参考图2C所示的样本图片的第一种直方图的示意图，假设样本图片a的上半部分由黑色的像素点组成，下半部分由白色的像素点组成，样本图片b中每两个黑色的像素点中间隔一个白色的像素点。假设直方图中的区间为[0,63]、（63，127]、（127，191]和（191，255]，则图a的直方图中，区间为[0,63]的面积为0. 5,区间为（191，255]的面积为0. 5。图b的直方图中，区间为[0,63]的面积为0.5,区间为（191，255]的面积为0.5。即，样本图片a的直方图和样本图片b的直方图相同，而样本图片a与样本图片b并不相同。可见，当统计的特征信息越多时，特征信息的分布越相似。
[0115] 为了避免由于特征信息多造成的特征信息分布相似的问题，终端可以对样本图片进行区域划分，得到样本图片分区，再对样本图片分区中特征信息的直方图进行统计。假设将样本图片等面积分成4个样本图片分区，此时，样本图片a中第一个样本图片分区中区间为[0,63]的面积为

完整全部详细技术资料下载

当前第2页1 2 3