基于视觉词袋模型的人脸图像检索方法与流程

文档序号:12612296阅读:来源:国知局

技术特征:

1.一种基于视觉词袋模型的人脸图像检索方法,其特征在于,所述检索方法包括:索引阶段和检索阶段;其中,所述索引阶段包括:

1.1)通过特征分类器对训练图像中的任一张图像提取出人脸部位,并从人脸部位中提取出局部区域图像;

1.2)根据划分的局部区域,分别计算每个局部区域内的任一张局部区域图像,得到对应的视觉特征描述符向量;

1.3)采用聚类算法对每个局部区域内的视觉特征描述符向量进行聚类,得到视觉单词词汇表,然后再根据所述视觉单词词汇表中的视觉单词对视觉特征描述符向量进行归类统计,生成倒排索引表,其中,所述倒排索引表以key-value键值对的形式表示;

所述检索阶段包括:

2.1)通过特征分类器提取出待检索图像,并从待检索图像中提取出局部区域图像,然后分别计算每个局部区域图像,得到对应的视觉特征描述符向量;

2.2)利用索引阶段生成的视觉单词词汇表对2.1)中所述的视觉特征描述符向量进行归类统计,得到相应的key-value键值对;

2.3)采用分布式并行计算方式将2.2)中得到的key-value键值对与倒排索引表进行匹配,得到相似图像列表;

2.4)通过对相似图像进行相似度分数计算,得到相似图像的相似度排序。

2.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述局部区域图像包括额头、左部眼睛区域、右部眼睛区域、鼻子、左嘴角及右嘴角。

3.根据权利要求2所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述局部区域图像还包括左眉毛、右眉毛、左耳朵、右耳朵、下颌、左脸颊、或右脸颊中的一种或多种。

4.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,1.2)中还包括采用主成分分析法对所述视觉特征描述符向量进行降维处理,使所述视觉特征描述符向量从128维降到64维。

5.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,1.3)中key-value键值对包括key和value两部分,其中,

所述key包括<局部区域ID_视觉单词ID>;

所述value包括视觉单词t的idf值,其中,N为训练图像中所有人脸部位的总数,dft为出现视觉单词t的人脸部位个数;

所述value还包括视觉单词t出现过的人脸部位列表及记录所述视觉单词t在相似图像d中的权重wft,d其中,d为相似图像,tft,d为视觉单词t在相似图像d中出现的次数。

6.根据权利要求1所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述相似度分数是通过以视觉单词为粒度的特征点相似度和以划分的局部区域为粒度的区域相似度相结合的方式计算得到,其中,所述相似度分数score(q,d)=λ·S(q,d)+(1-λ)·J(q,d),其中,S(q,d)为相似图像d和待检索图像q在特征点粒度上的相似度权重,J(q,d)为待检索图像q和相似图像d在局部区域粒度上的相似度权重,λ为平滑参数,且0≤λ≤1。

7.根据权利要求6所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述相似图像d和待检索图像q在特征点粒度上的相似度权重其中,n为待检索图像q所有局部区域上的视觉单词总数,wft,d为视觉单词t在相似图像d中的权重,wt,q为视觉单词t在待检索图像q中的权重。

8.根据权利要求7所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,通过WF-IDF权重计算wt,q,公式为wt,q=wft,q·idf(t),其中,wft,d为视觉单词t在相似图像d中的权重,idf(t)为视觉单词t的idf值。

9.根据权利要求7或8任一项所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,视觉单词t在相似图像d中的权重其中,d为相似图像,tft,d为视觉单词t在相似图像d中出现的次数。

10.根据权利要求8所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,视觉单词t的idf值其中,N为训练图像中所有人脸部位的总数,dft为出现视觉单词t的人脸部位个数。

11.根据权利要求6所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,所述待检索图像q和相似图像d在局部区域粒度上的相似度权重其中,P为局部区域的总数,wj(q,d,k)为待检索图像q和相似图像d在局部区域k中是否有相同的视觉单词,如果有,wj(q,d,k)=1,否则wj(q,d,k)=0。

12.根据权利要求6所述的基于视觉词袋模型的人脸图像检索方法,其特征在于,0.6≤λ≤0.8。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1