一种基于s-tld的川金丝猴面部检测和追踪算法

文档序号:10471454阅读:287来源:国知局
一种基于s-tld的川金丝猴面部检测和追踪算法
【专利摘要】本发明公开了一种基于S?TLD的川金丝猴面部检测和追踪算法,属于图像处理领域。所述发明包括获取川金丝猴的肤色和毛色图片,确定川金丝猴的面部特征库,使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM网络模型,获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝猴进行定位,基于TLD理论对定位后的川金丝猴进行追踪。通过使用备用分类器SVM,使得该追踪算法在背景复杂、目标运动幅度大或重新回到视频中的情况下有较高的追踪精度。同时针对金丝猴自身的特性,如复杂的面部纹理特征、动作极其敏捷迅速。本发明使用了LBP算子提取金丝猴面部特征,使得在光照变化、面部多尺度变化的情况下保证了追踪的正确性和速度。
【专利说明】
-种基于S-TLD的川金竺猴面部检测和追踪算法
技术领域
[0001] 本发明属于图像处理领域,特别设及一种基于S-化D的川金丝猴面部检测和追踪 算法。
【背景技术】
[0002] 随着现代科学技术的发展,在众多野生动物监测技术中,数码影像技术(包括自动 相机技术或红外相机技术)W其具有的非强制性,非接触性和无损伤性等优点已广泛应用 于野生动物监测的过程中。利用数码影像技术对金丝猴进行全面实时的监测,能够获得丰 富的图像数据。
[0003] 目前,在对野生动物图像数据的研究中,已有较多的利用其各自之间的视觉差异 (如生物特征)进行个体识别的研究。单目标长时间追踪算法,该算法需要人为的参与选择 目标在视频中的位置,该追踪算法的优点是可W让用户随意定义目标,但是该优点也是其 缺点,由于没有大量的对目标的先验知识,在目标变动幅度大、背景复杂的情况下,其追踪 的效果并不是很好,从而会丢失大量的有用的图像信息。基于人脸检测技术的野生动物追 踪方法。该追踪方法能够很好的追踪视频图像中运动的物体,但是由于化T算法对光照和运 动幅度敏感,故在背景复杂、动作迅速敏捷的动物来说,该算法不能够完成较高精度的追 踪。
[0004] 在实现本发明的过程中,发明人发现现有技术至少存在W下问题:
[0005] 现有的动物图像识别技术存在根据动物皮毛上的花纹特征对斑马进行识别,或者 基于外形特征对鸟群群体行为进行监控,或者基于红外图像中人脸的生理特征进行人脸识 另IJ。但是上述运些方法都是针对不同动物个体所具有的不同特征进行个体识别追踪的,而 川金丝猴与其他类型动物在自身特征方面存在较大差异,主要变现在:①川金丝猴面部由 毛发和皮肤两个部分组成;②川金丝猴的面部(特别是面部毛发区域)具有更为复杂的纹 理特征;③川金丝猴天生就有极其敏捷迅速的运动天赋。川金丝猴的W上特征都会增加视 频追踪的难度。因此,现有方法不能直接应用于川金丝猴的个体检测和追踪。

【发明内容】

[0006] 为了解决现有技术的问题,本发明提供了一种基于S-化D的川金丝猴面部检测和 追踪算法,所述基于S-TLD的川金丝猴面部检测和追踪算法,包括:
[0007] 获取川金丝猴的肤色和毛色图片,确定川金丝猴的面部特征库;
[000引使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM网络模 型;
[0009] 获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝猴进行定 位,基于TLD理论对定位后的川金丝猴进行追踪。
[0010] 可选的,获取川金丝猴的肤色和毛色图片,确定所述川金丝猴的面部特征库,包 括:
[0011] 获取川金丝猴的肤色和毛色图片,对所述肤色和毛色图片进行72色RGB-HSV量化, 对量化后的颜色进行统计归类,确定最大输出量化区间范围;
[0012] 基于所述最大输出量化区间范围,构建肤色区域查找表W及毛色区域查找表;
[0013] 根据所述肤色区域查找表和所述毛色区域查找表中的量化区间,基于图像分割原 理提取金丝猴面部特征,构建川金丝猴的面部特征库。
[0014] 可选的,使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM 网络模型,包括:
[0015] 使用LBP算子提取人脸样本和环境样本的LBP特征,构建人脸样本库和环境样本 库;
[0016] 使用SVM分类器,基于由所述面部特征库、所述人脸样本库和所述环境样本库构成 的训练样本对所述面部特征库进行优化,得到优化后的SVM网络模型。
[0017] 可选的,获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝 猴进行定位,基于TLD理论对定位后的川金丝猴进行追踪,包括:
[0018] 获取待识别的视频图像,对所述视频图像中的帖图像进行72色RGB-HSV量化,将得 到的量化区间与所述SVM模型中特征进行对比,确定川金丝猴的位置区域;
[0019] 提取所述川金丝猴的位置区域中LBP特征,使用SVM分类器对所述特征进行分类, 选取精度值最高的位置作为川金丝猴的脸部位置;
[0020] 基于TLD理论对所述川金丝猴的脸部位置进行追踪。
[0021] 可选的,提取所述川金丝猴的位置区域中LBP特征,使用SVM分类器对所述特征进 行分类,选取精度值最高的位置作为川金丝猴的脸部位置,包括:
[0022] 使用不同尺寸的窗口对所述帖图像进行连续扫描;
[0023] 在确定川金丝猴的位置区域后,提取所述位置区域的扫描窗口 W及所述扫描窗口 的LBP特征,将所述扫描窗口的LBP特征存储在矩阵中;
[0024] 使用SVM备用分类器对所述矩阵中的LBP特征进行分类,结合所述SVM模型选取符 合预设条件的扫描窗口位置作为川金丝猴的脸部位置。
[0025] 可选的,基于TLD理论对所述川金丝猴的脸部位置进行追踪,包括:
[0026] 获取所述川金丝猴的脸部位置对应的扫描窗口的索引值;
[0027] 基于所述索引值和所述川金丝猴的位置区域坐标,建立所述扫描窗口与当前帖图 像的映射关系;
[0028] 基于所述映射关系,实时确定川金丝猴在所述当前帖图像中的脸部位置;
[0029] 结合所述当前帖图像中的脸部位置,基于化D理论获取在下一帖图像中川金丝猴 的脸部位置,实现自动追踪。
[0030] 可选的,所述基于S-TLD的川金丝猴面部检测和追踪算法,还包括:
[0031] 当追踪失败时,激活SVM备用分类器,再次确定川金丝猴的位置,进而基于化D理论 对定位后的川金丝猴进行追踪。本发明提供的技术方案带来的有益效果是:
[0032] 通过使用备用分类器SVM,使得该追踪算法在背景复杂、目标运动幅度大或重新 回到视频中的情况下有较高的追踪精度。同时针对金丝猴自身的特性,如复杂的面部纹理 特征、动作极其敏捷迅速。本发明使用了 LBP算子提取金丝猴面部特征,使得在光照变化、面 部多尺度变化的情况下保证了追踪的正确性和速度。
【附图说明】
[0033] 为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图 作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普 通技术人员来讲,在不付出创造性劳动的前提下,还可W根据运些附图获得其他的附图。
[0034] 图1是本发明提供的一种基于S-化D的川金丝猴面部检测和追踪算法的流程示意 图;
[0035] 图2(a)是本发明提供的川金丝猴在第一姿势下的面部LBP灰度图;
[0036] 图2(b)是本发明提供的川金丝猴在第二姿势下的面部LBP灰度图;
[0037] 图2(c)是本发明提供的川金丝猴在第Ξ姿势下的面部LBP灰度图;
[0038] 图2(d)是本发明提供的川金丝猴在第四姿势下的面部LBP灰度图;
[0039] 图3(a)是本发明提供的川金丝猴在第一姿势下的面部LBP特征图;
[0040] 图3(b)是本发明提供的川金丝猴在第二姿势下的面部LBP特征图;
[0041] 图3(c)是本发明提供的川金丝猴在第Ξ姿势下的面部LBP特征图;
[0042] 图3(d)是本发明提供的川金丝猴在第四姿势下的面部LBP特征图;
[0043] 图4(al)是本发明提供的川金丝猴在第一姿势下降维之后的LBP直方图;
[0044] 图4(a2)是本发明提供的川金丝猴在第一姿势下没有降维的LBP直方图;
[0045] 图4(bl)是本发明提供的川金丝猴在第二姿势下降维之后的LBP直方图;
[0046] 图4(b2)是本发明提供的川金丝猴在第二姿势下没有降维的LBP直方图;
[0047] 图4(cl)是本发明提供的川金丝猴在第Ξ姿势下降维之后的LBP直方图;
[0048] 图4(c2)是本发明提供的川金丝猴在第Ξ姿势下没有降维的LBP直方图;
[0049] 图4(dl)是本发明提供的川金丝猴在第四姿势下降维之后的LBP直方图;
[0050] 图4(d2)是本发明提供的川金丝猴在第四姿势下没有降维的LBP直方图;
[0051] 图5是对t图4(al)、图4(bl)、图4(cl)、图4(dl)降维后LBP直方图的曲线拟合示意 图;
[0052] 图6(1)是本发明提供的初始帖备用分类器追踪效果图;
[0053] 图6(2)是本发明提供的化D根据SVM备用分类器传入的参数后第20帖的追踪的效 果;
[0054] 图6(3)是本发明提供的在金丝猴转脸时化D追踪失效后备用分类器SVM修正的结 果图一;
[0055] 图6(4)是本发明提供的经过SVM修正后TLD追踪的效果图一;
[0056] 图6(5)是本发明提供的在金丝猴转脸时化D追踪失效后备用分类器SVM修正的结 果图二;
[0057] 图6(6)是本发明提供的经过SVM修正后TLD追踪的效果图二;
[0058] 图6(7)是本发明提供的在金丝猴剧烈运动后,SVM备用分类器修正的结果图一;
[0059] 图6(8)是本发明提供的经过SVM修正之后TLD追踪的结果图一;
[0060] 图6(9)是本发明提供的在金丝猴剧烈运动后,SVM备用分类器修正的结果图二;
[0061] 图6(10)是本发明提供的经过SVM修正之后TLD追踪的结果图二;
[0062] 图6(11)是本发明提供的在金丝猴剧烈运动后,SVM备用分类器修正的结果图Ξ;
[0063] 图6(12)是本发明提供的经过SVM修正之后TLD追踪的结果图Ξ;
[0064] 图7(1)是本发明提供的在有家族成员干扰的情况下初始帖SVM备用分类器追踪效 果图;
[0065] 图7(2)是本发明提供的根据SVM备用分类器传入参数后第10帖的追踪效果;
[0066] 图7(3)是本发明提供的在家族成员和被追踪金丝猴由于脸部运动导致化D追踪 失败的情况下SVM备用分类器修正追踪效果图一;
[0067] 图7(4)是本发明提供的根据SVM备用分类器修正后第10帖追踪效果图一;
[0068] 图7(5)是本发明提供的在家族成员和被追踪金丝猴由于脸部运动导致化D追踪失 败的情况下SVM备用分类器修正追踪效果图二;
[0069] 图7(6)是本发明提供的根据SVM备用分类器修正后第10帖追踪效果图二;
[0070] 图7(7)是本发明提供的被追踪金丝猴由于完全侧脸导致化D追踪失败后SVM备用 分类器追踪效果图;
[0071] 图7(8)是本发明提供的TLD根据修正后第10帖追踪效果图。
【具体实施方式】
[0072] 为使本发明的结构和优点更加清楚,下面将结合附图对本发明的结构作进一步地 描述。
[0073] 实施例一
[0074] 本发明提供了一种基于S-TLD的川金丝猴面部检测和追踪算法,所述基于S-TLD的 川金丝猴面部检测和追踪算法,包括:
[0075] 获取川金丝猴的肤色和毛色图片,确定川金丝猴的面部特征库;
[0076] 使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM网络模 型;
[0077] 获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝猴进行定 位,基于TLD理论对定位后的川金丝猴进行追踪。
[0078] 在实施中,为了实现在视频图像中对川金丝猴的检测和追踪,本发明提出了一种 基于S-TLD的川金丝猴面部检测和追踪算法,如图1所示,包括:
[0079] 11、获取川金丝猴的肤色和毛色图片,确定川金丝猴的面部特征库。
[0080] 12、使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM网络 模型。
[0081] 13、获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝猴进 行定位,基于TLD理论对定位后的川金丝猴进行追踪。
[0082] 运里的S-TLD具体是指SVM和TLD,支持向量机(Suppod Vector MacMne,SVM)在 机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类、W及回归分析。而 TUKTracking-Learning-Detection)是一种视频追踪算法,其算法思想就是把追踪器和检 测器结合使用,同时加入机器学习来提高结果的准确度,具体分为追踪模块(Tracking),学 习模块(Xearning)和检测模块(Detection)。
[0083] 本方法基于现有的目标追踪算法TLD的基本框架,为了解决化D在目标大幅度运动 或重新返回视频中导致化D检测失效的问题,引入备用分类器SVM,使得该追踪算法在背景 复杂、目标运动幅度大或重新回到视频中的情况下有较高的追踪精度,从而解决了TLD追踪 目标需人工手动选择的缺点,能够自动的完成了目标选择的任务。同时解决了化D由于训练 样本不足导致的在目标变化较大时检测率低的问题,提高了视频中目标追踪的精度,为获 取丰富的图像数据提供了技术支持。
[0084] 同时针对川金丝猴复杂的面部纹理特征、动作极其敏捷迅速等自身的特性,还使 用了局部二值模式化ocal Binary Patterns,LBP)算子提取金丝猴面部特征,使得在光照 变化、面部多尺度变化的情况下保证了追踪的正确性和速度。
[0085] 本发明提供了一种基于S-化D的川金丝猴面部检测和追踪算法,包括获取川金丝 猴的肤色和毛色图片,确定川金丝猴的面部特征库,使用SVM分类器对所述面部特征库中的 特征进行优化,得到优化后的SVM网络模型,获取待识别的视频图像,结合所述SVM模型,在 所述视频图像中对川金丝猴进行定位,基于TLD理论对定位后的川金丝猴进行追踪。通过使 用备用分类器SVM,使得该追踪算法在背景复杂、目标运动幅度大或重新回到视频中的情况 下有较高的追踪精度。同时针对金丝猴自身的特性,如复杂的面部纹理特征、动作极其敏捷 迅速。本发明使用了LBP算子提取金丝猴面部特征,使得在光照变化、面部多尺度变化的情 况下保证了追踪的正确性和速度。
[0086] 可选的,获取川金丝猴的肤色和毛色图片,确定所述川金丝猴的面部特征库,包 括:
[0087] 获取川金丝猴的肤色和毛色图片,对所述肤色和毛色图片进行72色RGB-HSV量化, 对量化后的颜色进行统计归类,确定最大输出量化区间范围;
[0088] 基于所述最大输出量化区间范围,构建肤色区域查找表W及毛色区域查找表;
[0089] 根据所述肤色区域查找表和所述毛色区域查找表中的量化区间,基于图像分割原 理提取金丝猴面部特征,构建川金丝猴的面部特征库。
[0090] 在实施中,步骤11的具体实现方式为:
[0091] 101、获取川金丝猴的肤色和毛色图片,对所述肤色和毛色图片进行72色RGB-HSV 量化,对量化后的颜色进行统计归类,确定最大输出量化区间范围。
[0092] 具体的,步骤101的实现方式为:
[0093] 首先将所有的肤色和毛发样本分别按照RGB空间当中的长度进行排序,并按照公 式(1)转化为服V值。
[0097]其次,由于一幅图像中包含的颜色信息太多,不可能将所有颜色信息全部提取出 来逐个进行分析。因此运就要求对图像进行一定程度的量化,从而简化该问题。选择对处 于服V空间中的像素点进行72色量化,按照公式(2)的规则进行转化。
[009引
[0100] 接着,将该Ξ个矢量化^,7)、5^,7)、¥^,7)相叠加得到合成的一维矢量,即公式 (3)所示:
[0101] L(x,y)=70H(x,y)+3S(x,y)+V(x,y) (3)
[0102] 提取面部皮肤样本图像和面部毛发样本图像的72色量化灰度图像的L(x,y)的值。 运用数学统计的方法分别对其中出现的不同量化值进行统计记录并标明出现的频率次数, 统计结果表明,选择灰度值为70-80与330-360区间段分别作为毛色和肤色的量化范围区 间。
[0103] 102、基于所述最大输出量化区间范围,构建肤色区域查找表W及毛色区域查找 表。
[0104] 103、根据所述肤色区域查找表和所述毛色区域查找表中的量化区间,基于图像分 割原理提取金丝猴面部特征,构建川金丝猴的面部特征库。
[0105] 步骤103的具体实现方式为:
[0106] 首先,根据步骤101得到的金丝猴肤色灰度值量化区间,运用图像分割技术提取金 丝猴面部图像并建立金丝猴面部图像库P{pi,P2........,pn},其中Pi(l含i含η)为图像库中 第i张金丝猴面部图片。
[0107] 其次,使用LBP算子,提取金丝猴面部图像库P中的每一张图片的面部特征。提取公 式(4)如下:
[010 引
[0109] 其中(Xc,y。)是中屯、像素,i。为亮度,in为相邻像素的亮度。s(x)为一个符号函数。
[0110] 接着,运用"等价模式"对LBP算子的模式种类进行降维,将二进制模式由原始的 256种减少到59种,W减少系统运行过程中的计算量。最终用矩阵存储得到的金丝猴面部特 征,表示方法如下:
[0111] Fm=[fl ?2. . .fn]',
[01切其中,η为样本的总个数,fi(iy含η)为58维行向量。
[0113] 可选的,使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM 网络模型,包括:
[0114] 使用LBP算子提取人脸样本和环境样本的LBP特征,构建人脸样本库和环境样本 库;
[0115] 使用SVM分类器,基于由所述面部特征库、所述人脸样本库和所述环境样本库构成 的训练样本对所述面部特征库进行优化,得到优化后的SVM网络模型。
[0116] 在实施中,步骤12的具体实现方式为:
[0117] 201、为了提高SVM分类器的鲁棒性,需要其他类别的负样本(人脸样本和环境样 本)丰富SVM网络模型的多样性,W优化其参数。利用步骤1中的方法,使用LBP算子提取人脸 样本和环境样本的LBP特征。表示方法分别如下:
[011 引 Fh=[fl f2. . .fl],,Ft=[fl f2. . .fm],
[0119] 其中,Fm,Ft分别为人脸和环境样本特征库,l,m分别为其样本总数。
[0120] 202、使用SVM分类器,对由各个特征库Fm,Fh,Ft组成的特征库矩阵F=[Fm Fh Ft]' 作为训练样本,训练金丝猴面部特征库网络模型。 II-τ-.γ,ΙΙ]
[01別]使用SVM种的高斯径向基核函数乂-,使用的参数为('-C 2-g 1-t 2-b Γ )。通过训练得到WSVM网络模型model。
[0122] 可选的,获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝 猴进行定位,基于TLD理论对定位后的川金丝猴进行追踪,包括:
[0123] 获取待识别的视频图像,对所述视频图像中的帖图像进行72色RGB-HSV量化,将得 到的量化区间与所述SVM模型中特征进行对比,确定川金丝猴的位置区域;
[0124] 提取所述川金丝猴的位置区域中LBP特征,使用SVM分类器对所述特征进行分类, 选取精度值最高的位置作为川金丝猴的脸部位置;
[0125] 基于TLD理论对所述川金丝猴的脸部位置进行追踪。
[01%]在实施中,步骤13的具体实现方式为:
[0127] 301、使用图像处理软件matlab读入彩色视频图像,获取第一帖图像。为了提高追 踪的速度,在第一帖视频图像中,使用步骤1中的方法对图像进行72色RGB-HSV量化,然后与 步骤1得到的毛色量化区间值对比进行筛选,选择出在区间范围内的像素点予W保留,W确 定金丝猴在视频帖中的具体位置。
[0128] 302、根据步骤301得到的金丝猴的位置,使用扫描窗口在猴身区域检测猴脸,提取 获得的窗口数据的LBP特征并使用SVM分类器对各个窗口的特征进行分类,其中选取精度值 最大的一个输出作为猴脸部的位置。
[0129] 303、基于TLD理论对所述川金丝猴的脸部位置进行追踪。
[0130] 可选的,提取所述川金丝猴的位置区域中LBP特征,使用SVM分类器对所述特征进 行分类,选取精度值最高的位置作为川金丝猴的脸部位置,包括:
[0131] 使用不同尺寸的窗口对所述帖图像进行连续扫描;
[0132] 在确定川金丝猴的位置区域后,提取所述位置区域的扫描窗口 W及所述扫描窗口 的LBP特征,将所述扫描窗口的LBP特征存储在矩阵中;
[0133] 使用SVM备用分类器对所述矩阵中的LBP特征进行分类,结合所述SVM模型选取符 合预设条件的扫描窗口位置作为川金丝猴的脸部位置。
[0134] 在实施中,步骤302中确定川金丝猴脸部位置的内容具体为:
[0135] (1)构建扫描窗口:为了比较精确的找到目标在视频帖中的位置W及大小,需要使 用不同尺寸的窗口对视频帖连续的扫描。
[0136] 初始扫描的窗口为o_sw = 40 X 40pixel,步长为d= lOpixel,最大的扫描窗口为m_ sw= 100 X 10化ixel,扫描窗口的尺寸缩放步长为s_d = 5pixel。
[0137] (2)提取扫描窗口的LBP特征:根据(1)中的扫描窗口,在得到的金丝猴位置L中提 取扫描窗口,并提取扫描窗口的LBP特征。使用矩阵MmXnXSS来存储扫描窗口的LBP特征值,其 中mXn为扫描窗口的索引,行数m代表不同尺寸的扫描窗口的种类数,列数η代表每一种尺 寸扫描窗口的个数,每一行中列数不够的用0填充,W保证矩阵的完整性。具体映射关系如 下:
[013 引
[0139] 其中;r_min,;r_max,c_min,c_min为猴身位置的坐标,c_sw为当前扫描窗口的尺寸。
[0140] 可选的,基于TLD理论对所述川金丝猴的脸部位置进行追踪,包括:
[0141] 获取所述川金丝猴的脸部位置对应的扫描窗口的索引值;
[0142] 基于所述索引值和所述川金丝猴的位置区域坐标,建立所述扫描窗口与当前帖图 像的映射关系;
[0143] 基于所述映射关系,实时确定川金丝猴在所述当前帖图像中的脸部位置;
[0144] 结合所述当前帖图像中的脸部位置,基于化D理论获取在下一帖图像中川金丝猴 的脸部位置,实现自动追踪。
[0145] 在实施中,TLD的思想就是把追踪器和检测器结合使用,同时加入机器学习来提高 结果的准确度。分为追踪模块(Tracking),检测模块(Detection)和学习模块化earning)。
[0146] 追踪模块:基于Lucas-Kanade追踪器和FB误差(forward-backward error)。首先 在第t帖的所要追踪的目标中均匀的产生一些追踪点,利用Lucas-Kanade追踪器正向追踪 运些点到t+1帖,然后再反向追踪到t帖,计算FB误差(追踪点之间的欧式距离),筛选出FB误 差最小的一半点作为最佳追踪点。最后根据运些点的坐标变化和距离的变化计算t+1帖物 体的位置和大小。
[0147] 检测模块:使用了一个级联分类器,对从包围框获得的样本进行分类。首先通过图 像元分类器计算图像元像素的灰度值的方差,把方差小于原始图像元方差一半的样本标记 为负;然后使用集成分类器(随机藤分类器)提高分类的准确性;最后使用最近邻分类器,通 过计算样本的相对近似度,如果大于0.6,则人为是正样本,否则为负样本。
[0148] 学习模块:作者提出了一种半监督新的机器学习算法(P-N Learning),其作用是 对检测器对样本分类时产生的两种类型的错误提供了两种纠正方式。一种是P专家,其作用 是改正漏检(正样本误分为负样本)的正样本;另一种是N专家,其作用是改正误检(负样本 误分为正样本)的正样本。
[0149] 基于TLD理论,步骤303的具体实现方式为:
[0150] (1)使用SVM备用分类器对矩阵Mmxnxss所存储的LBP特征分类,核函数和参数的选 取与步骤(2)中的相同,并结合步骤12中的预测模型分类,从预测的结果中选取预测值最大 的并且大于阔值θηη = 0.93值的扫描窗口作为猴脸的位置,并对应的找到该扫描窗口所对应 的索引值(mx,nx),索引值从0开始算起。
[0151] (2)扫描窗口对应的坐标值:为了找到每个扫描窗口在视频帖中对应的坐标值,需 要根据③中的扫描窗口的索引值和步骤301中猴身的位置坐标建立扫描窗口与坐标值的映 射关系。
[0152] 具体映射关系如下:
[0153]
[0154] 通过该映射关系可求出猴脸在视频帖中的具体位置为:
[015引 f_L=[r_cmin c_cmin r_cmax c_cmax]。
[0156] (3)向TLD输入猴脸位置f_L= [;r_cmin c_cmin r_cmax c_cmax],调用激活函数 run_TLD(f_L)启动化D,化0首先根据初始目标位置,通过一定程度的多尺度变换产生自己 的样本库,经过级联分类器产生正样本,放入样本集;然后使用追踪器估计出物体的新位 置,P-专家根据运个位置产生正样本,N-专家从运些正样本里面选出一个最可信的,同时把 其他正样本标记为负;最后用正样本更新检测器的分类器参数,并确定下一帖物体位置。
[0157] 可选的,所述基于S-TLD的川金丝猴面部检测和追踪算法,还包括:
[0158] 当追踪失败时,激活SVM备用分类器,再次确定川金丝猴的位置,进而基于化D理论 对定位后的川金丝猴进行追踪。
[0159] 在实施中,在金丝猴动作幅度比较大或重新返回到视频中导致化D丢失目标或追 踪失效后,算法调用激活函数run_SVM()再次激活SVM备用分类器,根据步骤13中的流程,先 获取猴身位置,然后根据猴身位置检测猴脸位置,修正TLD追踪结果。
[0160] 本发明提供了一种基于S-化D的川金丝猴面部检测和追踪算法,包括获取川金丝 猴的肤色和毛色图片,确定川金丝猴的面部特征库,使用SVM分类器对所述面部特征库中的 特征进行优化,得到优化后的SVM网络模型,获取待识别的视频图像,结合所述SVM模型,在 所述视频图像中对川金丝猴进行定位,基于TLD理论对定位后的川金丝猴进行追踪。通过使 用备用分类器SVM,使得该追踪算法在背景复杂、目标运动幅度大或重新回到视频中的情况 下有较高的追踪精度。同时针对金丝猴自身的特性,如复杂的面部纹理特征、动作极其敏 捷迅速。本发明使用了 LBP算子提取金丝猴面部特征,使得在光照变化、面部多尺度变化的 情况下保证了追踪的正确性和速度。
[0161] 本发明的效果可W通过W下实验结果进一步说明。
[0162] 图2为金丝猴面部LBP特征图。
[0163] 图2(a)至(d)展示了同一个金丝猴在四种不同姿态下面部灰度图像,为了说明LBP 能够很好的提取金丝猴脸部特征。
[0164] 图3(a)至(d)展示了对应图2(a)至(d)中的四种姿态下的特征图像,从图3(a)至 (d)中可W看出,LBP黑色的点和白色的点的分布大体相同,运就说明了LBP特征能够很好的 表示金丝猴脸部特征。
[0165] 图4(a)至(d)分别对应图2(a)至(d)中的四种姿态中每个面部图像的LBP直方图, 图4(al)、图4(bl)、图4(cl)、图4(dl)代表了运用LBP等价模式降维之后的LBP直方图,图4 (曰2)、图4化2)、图4(c2)、图4(d2)代表了没有降维的LBP直方图,图4(a)至(d)中反映了其灰 度变化趋势大体相同,从而间接的反映出LBP特征能够准确的表示金丝猴面部特征。
[0166] 图5是对降维后上述四幅LBP直方图的曲线拟合,其直观的展现出四条曲线的变化 情况具有高度的一致性,从而反映出LBP特征的鲁棒性。其中,P1、P2、P3、P4分别对应图4 (al)、图4化1)、图4(cl)、图4(dl)四幅子图降维后LBP特征直方图的曲线拟合,图中横坐表 代表了降维后LBP特征的维数(59维),纵坐标代表了每一维特征的值(0-255),图中颜色越 深的地方表示曲线的重合度越高,其直观的展现出了 LBP特征对金丝猴脸部变化的鲁棒性。
[0167] 图6和图7分别展示了在不同的场景下该算法追踪效果图。图6在光线比较亮、背景 为草丛W及金丝猴运动幅度比较大的条件下测试效果图。图7是在光线比较暗,背景颜色和 金丝猴毛色相似,并且有家族金丝猴成员的条件下测试效果图。绿色框表示TLD追踪时的效 果,红色的框表示在初始帖或者TLD追踪失效后,备用分类器SVM追踪效果。
[0168] 图6是对一个视频中金丝猴不同的动作中追踪效果的展示,验证了该算法对于运 动敏捷的金丝猴来说有较好的鲁棒性。其中,
[0169] 子图(1)表示了初始帖备用分类器追踪效果,子图(2)相应的为化D根据SVM备用分 类器传入的参数后第20帖的追踪的效果;子图(3)和子图(5)分别为金丝猴转脸时化D追踪 失效后备用分类器SVM修正的结果,子图(4)和子图(6)相应的为经过SVM修正后化D追踪的 效果。子图(7)、子图(9)和子图(11)分别表示在金丝猴剧烈运动后,SVM备用分类器修正的 结果,相应的子图(8)、子图(10)和子图(12)为经过SVM修正之后TLD追踪的结果。
[0170] 图7主要展示了在光线比较暗、背景颜色和金丝猴毛色相似W及有家族成员的条 件下测试效果图。主要展示了在金丝猴做不同的脸部动作,W及有子代家族金丝猴成员的 条件下该算法追踪的效果图,W验证该算法对于金丝猴家族成员天生相似度高的特点具有 较好的识别追踪效果。其中,子图(1)表示了在有家族成员干扰的情况下初始帖SVM备用分 类器追踪效果,子图(2)相应的为化D根据SVM备用分类器传入参数后第10帖的追踪效果。子 图(3)和子图(5)表示了在家族成员和被追踪金丝猴由于脸部运动导致化D追踪失败的情况 下SVM备用分类器修正追踪效果;相应的子图(4)和子图(6)为化D根据SVM备用分类器修正 后第10帖追踪效果。子图(7)表示了被追踪金丝猴由于完全侧脸导致化D追踪失败后SVM备 用分类器追踪效果,子图(8)相应的为TLD根据修正后第10帖追踪效果。
[0171] 可W清楚的看到在金丝猴运动幅度大、脸部遮挡严重的时候,该算法都够很好的 完成追踪的效果。
[0172] 需要说明的是:上述实施例提供的基于S-化D的川金丝猴面部检测和追踪算法进 行视频图像中对川金丝猴进行检测和追踪的实施例,仅作为该检测和追踪算法在实际应用 中的说明,还可W根据实际需要而将上述检测和追踪算法在其他应用场景中使用,其具体 实现过程类似于上述实施例,运里不再寶述。
[0173] 上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先 后顺序。
[0174] W上所述仅为本发明的实施例,并不用W限制本发明,凡在本发明的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,所述基于S-TLD的川 金丝猴面部检测和追踪算法,包括: 获取川金丝猴的肤色和毛色图片,确定川金丝猴的面部特征库; 使用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM网络模型; 获取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝猴进行定位, 基于TLD理论对定位后的川金丝猴进行追踪。2. 根据权利要求1所述的基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,获 取川金丝猴的肤色和毛色图片,确定所述川金丝猴的面部特征库,包括: 获取川金丝猴的肤色和毛色图片,对所述肤色和毛色图片进行72色RGB-HSV量化,对量 化后的颜色进行统计归类,确定最大输出量化区间范围; 基于所述最大输出量化区间范围,构建肤色区域查找表以及毛色区域查找表; 根据所述肤色区域查找表和所述毛色区域查找表中的量化区间,基于图像分割原理提 取金丝猴面部特征,构建川金丝猴的面部特征库。3. 根据权利要求1所述的基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,使 用SVM分类器对所述面部特征库中的特征进行优化,得到优化后的SVM网络模型,包括: 使用LBP算子提取人脸样本和环境样本的LBP特征,构建人脸样本库和环境样本库; 使用SVM分类器,基于由所述面部特征库、所述人脸样本库和所述环境样本库构成的训 练样本对所述面部特征库进行优化,得到优化后的SVM网络模型。4. 根据权利要求1所述的基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,获 取待识别的视频图像,结合所述SVM模型,在所述视频图像中对川金丝猴进行定位,基于TLD 理论对定位后的川金丝猴进行追踪,包括: 获取待识别的视频图像,对所述视频图像中的帧图像进行72色RGB-HSV量化,将得到的 量化区间与所述SVM模型中特征进行对比,确定川金丝猴的位置区域; 提取所述川金丝猴的位置区域中LBP特征,使用SVM分类器对所述特征进行分类,选取 精度值最高的位置作为川金丝猴的脸部位置; 基于TLD理论对所述川金丝猴的脸部位置进行追踪。5. 根据权利要求4所述的基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,提 取所述川金丝猴的位置区域中LBP特征,使用SVM分类器对所述特征进行分类,选取精度值 最高的位置作为川金丝猴的脸部位置,包括: 使用不同尺寸的窗口对所述帧图像进行连续扫描; 在确定川金丝猴的位置区域后,提取所述位置区域的扫描窗口以及所述扫描窗口的 LBP特征,将所述扫描窗口的LBP特征存储在矩阵中; 使用SVM备用分类器对所述矩阵中的LBP特征进行分类,结合所述SVM模型选取符合预 设条件的扫描窗口位置作为川金丝猴的脸部位置。6. 根据权利要求4所述的基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,基 于TLD理论对所述川金丝猴的脸部位置进行追踪,包括: 获取所述川金丝猴的脸部位置对应的扫描窗口的索引值; 基于所述索引值和所述川金丝猴的位置区域坐标,建立所述扫描窗口与当前帧图像的 映射关系; 基于所述映射关系,实时确定川金丝猴在所述当前帧图像中的脸部位置; 结合所述当前帧图像中的脸部位置,基于TLD理论获取在下一帧图像中川金丝猴的脸 部位置,实现自动追踪。7.根据权利要求1所述的基于S-TLD的川金丝猴面部检测和追踪算法,其特征在于,所 述基于S-TLD的川金丝猴面部检测和追踪算法,还包括: 当追踪失败时,激活SVM备用分类器,再次确定川金丝猴的位置,进而基于TLD理论对定 位后的川金丝猴进行追踪。
【文档编号】G06K9/00GK105825168SQ201610072508
【公开日】2016年8月3日
【申请日】2016年2月2日
【发明人】许鹏飞, 叶贵鑫, 常鸿莉, 郭松涛, 郑欣, 李保国, 何刚, 陈晓江, 房鼎益
【申请人】西北大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1