多视图度量学习方法

文档序号：8223645阅读：371来源：国知局

多视图度量学习方法
【专利说明】
[0001]
技术领域
[0002] 本发明涉及一种多视图度量学习方法，具体来说，涉及一种用于多视图视频摘要的多视图度量学习方法。
【背景技术】
[0003] 监督式学习通过对大量有标记的训练例进行学习W建立模型用于预测未见示例的标记。该里的"标记"是指示例所对应的输出，例如，在分类任务中标记就是示例的类别，而在回归任务中标记就是示例所对应的实值输出。随着人类收集、存储数据能力的高度发展，在很多实际任务中可W容易地获取大批未标记数据，而对该些数据赋予标记则往往需要耗费大量的人力物力。半监督学习试图让学习机器自动地对大量未标记数据进行利用W 辅助少量有标记数据进行学习。而无监督式学习并不需要人力来输入标签。
[0004] 在过去的十年中，多视图学习受到大量关注。大多数已有方法都致力于半监督学习。
[0005] 在许多现实应用中，未标签的数据通常表现为大量高度相关的视图。例如，在视频处理领域，不同的相机可能聚焦在基本上同样的视场上。又例如，在二维码扫描领域，会有多个固定式二维码扫描器在不同位置从多个角度拍摄同一个二维码目标，而对于手持式扫描枪，也会因为抖动产生多个不同角度的二维码目标图像。在该种情况下，人们可能期望利用相关性来帮助理解数据并使其特征化，并且期望找到能反映输入数据的内在结构的"优化"的度量。
[0006] 假定在本地集合坐标中的复杂人体运动是随时间变化的函数，并且通过多个照相机同时按时间采样。为了掲示该初始空间的特征，传统方法一般对每个视图视频W多种假定独立地抽取高维度特征矢量空间，然后使用许多降维方法。
[0007] 传统视频摘要方法设计成对单视图视频记录生成摘要，因此不能够完全利用多视图记录中的兀余，会忽略掉不同的视图视频中包括的对原始数据集来说有特色的和互补的信息。
[0008]

【发明内容】

[0009] 本发明提供一种用于多视图视频摘要的多视图度量学习方法。多视图视频同时采集真实生活中的相同时空的不同视觉投影。本发明中的多视图度量学习把所有多视图视频投射到新的度量空间中，W最好地模拟真实世界多样性空间，并用来掲示物体运动的内在特征。该通过保存跨不同视图的最多内在特征而极大地简化了视频摘要。在所学习的度量空间中，视觉数据通过聚类而摘要并在各聚类中提取关键峽。
[0010] 本发明的方法其结合了最大间隔聚类和不一致最小标准的优点，因此能够找到最好地分离数据的度量，并同时迫使所学习的度量保持数据点之间的原始内在信息。
[0011] 本发明的方法特别适用于无监督学习的情况。
[0012] 本发明提供一种用于多视图视频摘要的多视图度量学习方法，其包括W下步骤： (1) 将视频记录分解成峽的集合，表示为xW，…，X?，其中
【主权项】
1. 一种用于多视图视频摘要的多视图度量学习方法，其包括以下步骤： (1) 将视频记录分解成帧的集合，表示为χ(1)，…，χ(κ)，其中
,是表示第k视图的η个帧的dk维度特征，R表示实数，dk表示第k个视图空间的维数，η表示帧数； (2) 根据处于Χ(1)，…，父00中的信息，学习统一化的度量空间X，其中X d 表示映射后空间的维数； (3) 执行在X上的聚类，使用聚类的中心作为代表，表示成 f" 二f JiI >….九...：I S >? <+… < 々* ii- "}，F表不摘要的集合，ir.. ic表不一中贞的ID ; (4) 对每个fic;从K个帧中选出一个和它对应的帧，并输出这些帧作为最后摘要；其中，在执行学习的步骤中，寻找统一的坐标矩阵
使其最小化
其中，RMP(X)，Rstrart(X), Rdiff(X)分别是X的经验损失、结构损失以及不一致损失； Y1, Y 2是控制目标之间平衡的参数；并且经验损失Remp (X)为O ; 结构损$
其中Gx是度量X的相似性变换，￡是归一化拉普拉斯算子，λ馮的本征值，c表示预定义的类的个数；不一致损失 Rdiff (X)为
2. 根据权利要求1所述的多视图度量学习方法，其特征在于，最小化的R(X)为
3. 根据权利要求2所述的多视图度量学习方法，其特征在于，最小化的R(X)优化为
4. 根据权利要求3所述的多视图度量学习方法，其特征在于，最小化的R(X)进一步优化为
，其中
μ表示权重因子，μ??表示￡ <:々:ι的权重因子。
【专利摘要】本发明公开一种用于多视图视频摘要的多视图度量学习方法。其包括以下步骤：将视频分解为帧的集合；学习统一化的度量空间；执行在统一度量空间上的聚类；并选择特定帧输出作为摘要。本发明能够找到最好地分离数据的度量，并同时迫使所学习的度量保持数据点之间的原始内在信息。
【IPC分类】G06F17-30
【公开号】CN104537124
【申请号】CN201510042581
【发明人】张驰, 付彦伟
【申请人】苏州德沃智能系统有限公司
【公开日】2015年4月22日
【申请日】2015年1月28日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张驰;付彦伟;
技术所有人：苏州德沃智能系统有限公司;
我是此专利的发明人

上一篇：一种基于消息传递接口的遥感影像金字塔并行构建方法
上一篇：一种快速浏览文档的方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。