基于概率潜在语义分析模型的动态纹理识别和定位方法_3

文档序号：9226050阅读：来源：国知局

Itj.)，W此得到该个视频的词的分布P(WItj.)。在训练阶段，分布P(VIZ)通过训练视频得到，每个训练视频由P(ZIttf。J表示，P(VIZ)和P(ZIttf。J通过概率潜在语义分析模型得到。在本步骤S24中，采用如下公式实现动态纹理识别；video categcxry = argmaXk P(Zk|tteJ，其中P(Zklttwt)代表视频，其通过过期望最大化算法巧M)算法来得到。
[0076] S3 ;利用步骤S2中所得到的概率潜在语义分析模型中的主题特点，实现动态纹理定位。在本实施例中，动态纹理定位选择出对应的混浊特征词的最高概率，其不是定位每一帖，而是定位到视频流，即像素时间序列，类似于视频分割中得到的运动模式。
[0077] 下面通过实验结果来对本发明的基于概率潜在语义分析模型的动态纹理识别和定位方法进行比对说明。
[007引实验数据采用UCLA动态纹理据库[1，3]，可W将此数据库分为9类，包括沸水 (boiling)巧个），火的re)巧个），花的owers) (12个），植物（plant) (108个），喷泉 (fountain) (20 个），海水（sea) (12 个），烟雾（smoke) (4 个），水（water) (12 个），瀑布 (water化11) (16个），其中括弧中的数字代表动态纹理个数，为了证明本发明提出的特征的有效性，本实施例中采集了 16组河水的视频和UCLA-9数据库组成新的数据库，共为10 类，称为newDT-10。本发明采集的该16个视频含有轻微的抖动，数据库中的部分视频帖如图3所示。
[0079] 在定位试验中，newDT-10数据库用来对概率潜在语义分析模型学习，UCLA 数据库，文献（G.Doretto,D. Cremers,P.F'avaro, and S.Soatto, "Dynamic Tex1:ure Segmentation,，中roc. Int'l Conf. Computer Vision, 2, pp. 1236-1242, (2003).)中的数据和我们自己合成的数据库用来定位。
[0080] 识别方法：选择最近邻作为分类器，对每个实验，随机选择一半数据来训练，另一半数据来测试。所有试验运行10次。
[OOW] 图4 (a)给出了对UCLA-9数据，用时空信息特征作为特征的混淆特征向量矩阵，识别率是76.6%。图4(b)给出了对UCLA-9数据，用像素时间序列作为特征的混淆特征向量矩阵，识别率是66. 9%。图4(C)给出了本发明所提出的混浊特征向量得到的混浊特征向量矩阵，识别率为82%，图中每行代表真实的类别，每列代表识别的类别。
[00間代码本对识别UCLA-9数据库的识别率的影响见图5。
[008引图6 (a)给出了对UCLA-9数据，用时空信息特征作为特征的混淆矩阵，识别率是 78.33%。图6(b)给出了对UCLA-9数据，用像素时间序列作为特征的混淆矩阵，识别率是 64.54%。图6(c)给出了本发明所提出的混浊特征向量得到的混浊特征向量矩阵，识别率为 78. 7%。
[0084] 代码本对识别UCLA-9数据库的识别率的影响见图7。
[0085] 图8显示了不用概率潜在语义分析模型对UCLA-9数据库和newDT-10数据库识别的结果。实验表明，用概率潜在语义分析模型可W对实验结果提高2%到5%。
[0086] 本发明用学习得到的模型对UCLA数据库来定位，定位结果如图9所示，视频大小为160*110,可W看到大部分动态纹理可W被本发明的方法准确定位。
[0087]另外，本发明还可W检测位置视频里面的动态纹理，图10给出了本发明通过概率潜在语义分析学习，可W检测到视频里面的动态纹理。
[008引请结合图11，其演示在同一个视频里面定位多个动态纹理；假定模型已经通过概率潜在语义分析学习了，动态纹理类别个数由P(Zkk，dj.)确定，该是因为P(Zkk，dj.)提供了描述动态纹理内容的方法。因此，当P(Zkki，dj.)大于某个阔值的时候，表示由多个动态纹理。图11显示了定位结果，其中图11(a)是通过本发明合成的一个动态纹理视频，左上角是一个火焰，大小是40*80,让它覆盖在大小为200*200大小的动态纹理视频上面，图中两类动态纹理分别用红色和藍色显示了。
[0089]综上所述，上述基于概率潜在语义分析模型的动态纹理识别和定位方法，其具有的良好的分类能力，对轻微的物理噪声和角度变化具有一定的鲁椿性，另外，还具有能够对动态纹理定位的功能，可应用于场景识别定位、军事目标跟踪识别系统等各类民用及军用系统中，具有广泛性的应用。
[0090] W上所述仅是本发明的优选实施方式，并不用于限制本发明，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可W做出若干改进和变型，该些改进和变型也应视为本发明的保护范围。
【主权项】
1. 一种基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：包括如下步骤： 51 :利用混沌理论对视频中的像素时间序列计算，以提取多个特征，并将所述多个特征组成混纯特征向量，将混纯特征向量组成混纯特征向量矩阵； 52 :利用K-均值算法对步骤Sl中的混沌特征向量矩阵进行计算以得到直方图；通过期望最大值化算法对直方图进行学习，以建立概率潜在语义分析模型；利用概率潜在语义分析模型能够对局部特征准确建模的特点，实现动态纹理识别； 53 :利用步骤S2中所得到的概率潜在语义分析模型中的主题特点，实现动态纹理定位。2. 根据权利要求1所述的基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：所述步骤Sl之前还包括：对视频中的像素时间序列插值，以得到统一长度的像素时间序列。3. 根据权利要求1所述的基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：在所述步骤Sl中，所述混纯特征向量为F =[ T，m，Db，mean]，其中Db表示盒维数，T和m分别表示嵌入时间延迟和嵌入维数， mean表示像素时间序列的平均值。4. 根据权利要求1所述的基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：所述步骤S2具体包括： 521 :生成聚类中心：利用K-均值算法，用欧式距离来得到k个聚类中心，形成代码本； 522 :生产直方图：每个动态纹理里面的特征映射到相应的聚类中心，当一个动态纹理视频里面的所有特征都映射完之后，产生代码本的直方图； 523 :通过期望最大值化算法对直方图进行学习，以建立概率潜在语义分析模型； S24:利用概率潜在语义分析模型对局部特征准确建模的特点，实现动态纹理识别。5. 根据权利要求4所述的基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：所述步骤S21中所述K-均值算法具体包括如下步骤： 5211 :从视频中的混沌特征向量随机选取k个混沌特征向量作为初始聚类中心； 5212 :对于视频中的混沌特征向量，计算其与这k个聚类中心的欧式距离，根据最近邻原则，将每个混沌特征向量分别划分到相应的类别； 5213 :对于通过步骤S212所得到的k个类别，分别在每个类别中计算混沌特征向量的平均值，并将该平均值设为新的聚类中心，从而得到k个新的聚类中心； 5214 :重复步骤S212和步骤S213,直到均方差收敛到小于设定的阈值后停止迭代。6. 根据权利要求4所述的基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：所述步骤S23中所述期望最大化算法具体包括如下步骤： 5231 :期望步骤，即隐含参数的估计； 5232 :最大化步骤，即确定实际参数，然后最大化似然估计，其中，选用最近邻策略，度量选用欧氏距离。7. 根据权利要求6所述的基于概率潜在语义分析模型的动态纹理识别和定位方法，其特征在于：所述步骤S24中，采用如下公式实现动态纹理识别：video category = argmaxk P (zk I ttest)，其中 P (zk I ttest)代表视频。
【专利摘要】本发明涉及一种计算机模式识别技术领域的分类和定位方法，尤其涉及一种基于概率潜在语义分析模型的动态纹理识别和定位方法，包括如下步骤：S1：利用混沌理论对视频中的像素时间序列计算，以提取多个特征，并将所述多个特征组成混沌特征向量，将混沌特征向量组成混沌特征向量矩阵；S2：利用K-均值算法对步骤S1中的混沌特征向量矩阵进行计算以得到直方图；通过期望最大值化算法对直方图进行学习，以建立概率潜在语义分析模型；利用概率潜在语义分析模型能够对局部特征准确建模的特点，实现动态纹理识别；S3：利用步骤S2中所得到的概率潜在语义分析模型中的主题特点，实现动态纹理定位。
【IPC分类】G06K9/46, G06K9/62
【公开号】CN104951786
【申请号】CN201510306492
【发明人】罗新斌, 王勇
【申请人】苏州珂锐铁电气科技有限公司
【公开日】2015年9月30日
【申请日】2015年6月8日

完整全部详细技术资料下载

当前第3页1 2 3