一种大规模人脸模式分析样本库的构建方法和装置的制造方法_2

文档序号：8457577阅读：来源：国知局

能够针对不同分辨率的图片进行自适应的裁剪人脸区域。该方法涉及的比值系数可以在预设数量的人脸图片中，计算眉毛到下嘴唇间的垂直距离与眉毛到头顶距离的垂直距离的比值以及眉毛到下嘴唇的垂直距离与下嘴唇到下巴的垂直距离的比值，然后进行数据分析得出适用的比值数据。
[0026] D、采用主成分分析法（PCA)和线性判别分析方法（LDA)融合的算法对裁剪的图片进行性别分类以得到不同性别的人脸图片库。性别分类是一个典型的二类鉴别问题，一般是在图片的预处理后，进行主元分析提取特征，获得特征子空间，最后利用分离器（可以通过人脸样本训练获得）进行分类。其中，主成分分析法的目的在于在数据空间中找到一组向量以尽可能地解释数据的方差，从而用降维后的低维向量保存原数据中的主要信息，使数据更易于处理，换句话说，PCA方法的主要原理就是基于对原始数据进行统计分析，利用线性变换，对高维数据进行分析与压缩。LDA方法主要选择与类内散布的正交的矢量作为特征脸空间，从而能够压制图像之间的与识别信息无关的差异，对光照及人脸表情变化都不太敏感，这种方法的最终目的就是找到一些特征使得类间离散度和类内离散度的比值最大。
[0027] E、分别在不同性别的人脸图片库中，对图片进行灰度直方图的相似度比对以确定重复的图片，然后删除重复的图片，并且输出建立好的人脸样本库。其中，灰度直方图是灰度级的函数，描述图像中该灰度级的像素个数（或该灰度级像素出现的频率）：其横坐标是灰度级，纵坐标表示图像中该灰度级出现的个数（频率）。在本实施例中，优选地分别在基准图片和待比对图片的灰度直方图中获取对应的灰度级像素的频率值，并且计算基准图片和待比对图片的灰度级像素的频率值之间的巴氏系数（也称为巴氏距离）。如果计算的巴氏系数值超过预设的阀值，则认定基准图片和待比对图片为重复图片。
[0028] F、根据需要对建立好的人脸样本库进行二次筛选和人工标记，然后储存适用的人脸样本库至本地存储器。
[0029] 为了更具体地描述根据本发明的大规模人脸模式分析样本库的构建方法，下面从另一个优选的实施例中描述构建大规模人脸模式分析样本库的流程。
[0030] 参照图2所示的根据本发明实施例的构建大规模人脸模式分析样本库的流程框图。该流程包括：图像获取与过滤、图像预处理和图像分析，三个计算机自动处理步骤；以及人工筛选步骤。
[0031] 在图像获取与过滤步骤中，首先，基于广度优先策略和路径检索策略，使用网络爬虫脚本通过网络收集图片，优选地设置图片来源为互联网上的大型公开的社交网站并通过合法协议收集图片，因为其中多为正面人脸图片且更适用于建立人脸样本；然后利用 Viola-Jones人脸检测算法对获取的图片进行人脸检测，如果检测到包含人脸的图片则自动保留，其余图片可以自动删除以节约存储空间。
[0032] 在图像预处理步骤中，对筛选得到的图片基于人脸比例进行剪裁，具体操作如下：在检测出的人脸范围内Viola-Jones人脸器会生成一个矩形标定框（参照图4)，定义该标定框为原始标定框，且定义其左上角坐标为（x，y)其坐标向量形式为& = ，高为lh，宽为Iw并组合成向量形式Θ = (lw，lh)T，同理，定义调整后的检测框的相应参数分别为 C' = (x',.yf，Θ，= (V，lh，)T
[0033] 则调整后的检测框的参数计算公式为：
[0034]
【主权项】
1. 一种大规模人脸模式分析样本库的构建方法，其特征在于包括如下步骤： A、通过本地和/或远程网络批量获取图片； B、采用基于Harr-Iike特征的Viola-Jones人脸检测算法对获取的图片进行人脸检测并进行筛选，保留包含人脸的图片； C、基于人脸比例对包含人脸的图片进行剪裁并使包含人脸的图片归一化到预设的尺寸； D、采用主成分分析法和线性判别分析方法融合的算法对裁剪的图片进行性别分类以得到不同性别的人脸图片库； E、分别在不同性别的人脸图片库中，对图片进行灰度直方图的相似度比对以确定重复的图片，然后删除重复的图片，并且输出建立好的人脸样本库； F、根据需要对建立好的人脸样本库进行二次筛选和人工标记，然后储存适用的人脸样本库至本地存储器。
2. 根据权利要求1所述的大规模人脸模式分析样本库的构建方法，其特征在于，所述步骤A包括：利用网络爬虫脚本从本地和/或远程网络批量获取图片，其中基于广度优先策略使网络爬虫执行路径检索，在预设的网络路径抓取所有与统一资源定位符（URL)所对应的图片，从而控制抓取效率和图片的来源。
3. 根据权利要求1所述的大规模人脸模式分析样本库的构建方法，其特征在于，所述步骤C包括：在包含人脸的图片上会生成矩形标定框；根据图片中的人脸尺寸和位置来设置标定框的位置、宽度和高度；根据标定框裁剪图片。
4. 根据权利要求3所述的大规模人脸模式分析样本库的构建方法，其特征在于，所述步骤C包括：在预设数量的人脸图片中计算眉毛到下嘴唇的垂直距离与眉毛到头顶距离的垂直距离的比值，以及眉毛到下嘴唇的垂直距离与下嘴唇到下巴的垂直距离的比值；经过统计分析得出适用的比值数据，用于确定所述矩形标定框的裁剪系数以实现标定框的缩放。
5. 根据权利要求1所述的大规模人脸模式分析样本库的构建方法，其特征在于，所述步骤D包括：在采用主成分分析法进行数据降维处理过程中，维数是由的已知性别图片的训练样本集的协方差矩阵的97%以上的矩阵特征值的个数来确定。
6. 根据权利要求1所述的大规模人脸模式分析样本库的构建方法，其特征在于，所述步骤E包括：分别计算基准图片和待比对图片的灰度直方图；分别在基准图片和待比对图片的灰度直方图中获取对应的灰度级像素的频率值，并且计算基准图片和待比对图片的灰度级像素的频率值之间的巴氏系数；如果计算的巴氏系数值超过预设的阀值，则认定基准图片和待比对图片为重复图片。
7. 根据权利要求1所述的大规模人脸模式分析样本库的构建方法，其特征在于所述方法还包括：在采用主成分分析法和线性判别分析方法融合的算法对裁剪的图片进行性别分类以得到不同性别的人脸图片库之后，对人脸进行校准使人脸处于规范化的位置和姿态。
8. 根据权利要求7所述的大规模人脸模式分析样本库的构建方法，其特征在于，对人脸进行校准使图像中的人脸处于规范化的位置和姿态包括：采用已获取到的包含人脸的图片作为训练集并利用无监督联合校准算法对人脸进行校准。
9. 根据权利要求8所述的大规模人脸模式分析样本库的构建方法，其特征在于，采用已获取到的包含人脸的图片作为训练样本并利用无监督联合校准算法对人脸进行校准包括：提取训练集的每张图片中每个像素点的SURF特征；对应提取的SURF特征点依次对分布域中每个元素的概率、分布域的熵、似然函数和整体熵进行计算；重复上述步骤并实施迭代计算，从而计算出使得计算的整体熵的值最小的仿射变换矩阵，其中所述仿射变换矩阵包含对训练集的X轴平移、y轴平移、旋转变换、X轴尺度变换以及y轴尺度变换。
10. -种用于构建大规模人脸模式分析样本库的装置，包括：用于获取图片的网络通信接口；用于显不图片的显不设备；用于图片筛选的输入设备；用于储存计算机程序指令和储存图片的存储器；至少一个处理器，其中当所述处理器执行所述指令时，所述计算机程序指令触发处理器执行根据权利要求1至9中任一项所述的大规模人脸模式分析样本库的构建方法。
【专利摘要】本发明公开了一种大规模人脸模式分析样本库的构建方法和装置，方法包括：通过网络批量获取图片；采用Viola-Jones人脸检测算法对获取的图片进行人脸检测和筛选；基于人脸比例对包含人脸的图片进行归一化处理；采用PCA+LDA算法对裁剪的图片进行性别分类；利用图片灰度直方图的相似度比对以剔除重复的图片；根据需要对人脸样本库进行二次筛选和人工标记，然后储存至本地存储器。装置包括网络通信接口、显示设备、输入设备、存储器以及处理器，其中处理器执行所述的大规模人脸模式分析样本库的构建方法。本发明较大程度上降低了科研人员搭建用于人脸模式分析的人脸样本库的劳动强度，提高了样本库的搭建速度，且本发明亦可用于其它模式识别相关科研的样本库搭建。
【IPC分类】G06K9-66, G06K9-46
【公开号】CN104778481
【申请号】CN201410808371
【发明人】翟懿奎, 甘俊英, 王斌, 彭超, 曾军英
【申请人】五邑大学
【公开日】2015年7月15日
【申请日】2014年12月19日

完整全部详细技术资料下载

当前第2页1 2