基于ar模型功率谱的动态场景分类方法及装置的制造方法_4

文档序号：9751260阅读：来源：国知局

其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
【主权项】
1. 一种基于A財莫型功率谱的动态场景分类方法，其特征在于，包括：获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频域特征；通过词袋模型分别对每个所述空域特征、所述时域特征和所述AR模型功率谱频域特征进行统计分析，得到对应的空域的词频直方统计图特征、时域的词频直方统计图特征和AR 模型功率谱频域的词频直方统计图特征；将各域的词频直方统计图特征按域映射到核空间中，得到各域的核函数，并采用多核学习方法得到所述各域的核函数的权重，根据所述权重对所述各域的核函数进行特征融合，得到分类特征，根据所述分类特征对所述多段动态场景视频进行分类。2. 根据权利要求1所述的分类方法，其特征在于，所述获取多段动态场景视频每段各自的AR模型功率谱频域特征，包括：针对任一段所述动态场景视频，去除所述动态场景视频中的背景，并进行降采样，得到时间序列；通过A財莫型对所述时间序列进行建模，得到所述A財莫型的参数和方差；将所述AR模型的参数和方差转换为AR模型功率谱特征向量，并对所述AR模型功率谱特征向量进行归一化，得到所述AR模型功率谱频域特征。3. 根据权利要求2所述的分类方法，其特征在于，所述去除所述动态场景视频中的背景，并进行降采样，得到时间序列，包括：采用帖差法去除所述动态场景视频中的背景，将去除背景后的所述动态场景视频分割成多个视频块，对每个所述视频块中的每一帖进行像素平均，得到每个所述视频块对应的时间序列{Rth 所述通过A財莫型对所述时间序列进行建模，得到所述A財莫型的参数和方差，包括：采用高阶AR模型原理公式对每个所述视频块对应的所述时间序列{Rt}进行建模，采用正则计算公式得到每个所述视频块对应的AR模型的参数{Ai巧日方差O2; 所述将所述AR模型的参数和方差转换为AR功率谱特征向量，并对所述特征向量进行归一化，得到所述AR模型功率谱频域特征，包括：采用特征向量获取公式将每个所述视频块对应的所述AR模型参数{Ai}和方差O2转换为每个所述视频块对应的AR模型功率谱特征向量Pz( ?)，并采用归一化公式对每个所述视频块对应的所述AR模型功率谱特征向量Pz( CO)进行归一化，得到每个所述视频块对应的AR模型功率谱频域特征P( O ); 其中，所述高阶A財莫型原理公式为：其中，所述正则计算公式为：其中，所述特征向量获取公式为：其中，所述归一化公式为：其中，t表示帖数，t为大于1小于所述视频块的总帖数的正整数，q为AR模型的阶数，d) 为Rt的自相关函数，i的取值范围为从1至q的正整数，V(t)为符合均值为0,方差为O2的误差噪声，j为虚数单位，e为自然常数，CO表示频率，CO的取值范围为从1至128的正整数。4. 根据权利要求3所述的分类方法，其特征在于，所述空域特征包括将所述动态场景视频进行网格划分得到的各网格对应的空域特征、所述时域特征包括将所述动态场景视频进行网格划分得到的各网格对应的时域特征，所述AR模型功率谱频域特征包括各所述视频块对应的AR模型功率谱频域特征；所述通过词袋模型分别对每个所述空域特征、所述时域特征和所述AR模型功率谱频域特征进行统计分析，得到对应的空域的词频直方统计图特征、时域的词频直方统计图特征和AR模型功率谱频域的词频直方统计图特征，包括：对任一段所述动态场景视频的各网格对应的空域特征、各网格对应的时域特征和各视频块对应的AR模型功率谱频域特征分别进行聚类，生成所述动态场景视频的空域特征的视觉词典、时域特征的视觉词典和AR模型功率谱频域特征的视觉词典；将所述各网格对应的空域特征、所述各网格对应的时域特征和所述各视频块对应的AR 模型功率谱频域特征分别映射到对应的视觉词典中距离所述各网格对应的空域特征、所述各网格对应的时域特征和所述各视频块对应的AR模型功率谱频域特征最近的视觉单词上；根据映射结果，对映射后的视觉单词的进行词频统计，得到所述空域的词频直方统计图特征、所述时域的词频直方统计图特征和所述AR模型功率谱频域的词频直方统计图特征。5. 根据权利要求1-3任一项所述的分类方法，其特征在于，所述将各域的词频直方统计图特征按域映射到核空间中，得到各域的核函数，并采用多核学习方法得到所述各域的核函数的权重，根据所述权重对所述各域的核函数进行特征融合，得到分类特征，包括：对于任一域的词频直方统计图特征，将所述域的多段动态场景视频的词频直方统计图特征按照映射规则映射到核空间，得到所述域的核函数Ks; 通过多核学习方法，得到各域的核函数Ks的权重ds; 根据所述权重和融合公式，得到分类特征K; 其中，所述映射规则为：其中，所述融合公式为其中，C为词频直方统计图特征的维数，C的取值范围为从1至C的正整数，Fm(C)和Fn(C) 分别表示多段动态场景视频中第m个和第n个动态场景视频在维数为C时的词频直方统计图特征，M为动态场景视频的总段数，且m和n的取值范围为从I至M的正整数，Ks为映射后得到的各域的核函数，S取1，2和3分别表示空域特征的核函数，时域特征的核函数和AR功率谱频域特征的核函数;ds表示学习得到的权重值，S为所述域的总个数。6. 根据权利要求1-3任一项所述的分类方法，其特征在于，所述空域特征为稠密采样的尺度不变特征转换空域特征。7. 根据权利要求1-3任一项所述的分类方法，其特征在于，所述获取动态场景视频的时域特征，包括：获取所述动态场景视频的光流方程，通过对所述光流方程进行一阶泰勒级数展开，获取所述动态场景视频的光流场；根据所述光流场的方向和大小，获取所述动态场景视频的时域特征。8. 根据权利要求1-3任一项所述的分类方法，其特征在于，所述根据所述分类特征对所述动态场景进行分类，包括：采用支持向量机分类器，根据所述分类特征对所述动态场景进行分类。9. 一种基于A財莫型功率谱的动态场景分类装置，其特征在于，包括：域特征获取模块，用于获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频域特征；直方统计图特征获取模块，用于通过词袋模型分别对每个所述空域特征、所述时域特征和所述AR模型功率谱频域特征进行统计分析，得到对应的空域的词频直方统计图特征、时域的词频直方统计图特征和AR模型功率谱频域的词频直方统计图特征；特征融合模块，用于将各域的词频直方统计图特征按域映射到核空间中，得到各域的核函数，并采用多核学习方法得到所述各域的核函数的权重，根据所述权重对所述各域的核函数进行特征融合，得到分类特征，根据所述分类特征对所述多段动态场景视频进行分类。10. 根据权利要求9所述的装置，其特征在于，所述域特征获取模块包括： AR模型功率谱频域特征获取模块，用于针对任一段所述动态场景视频，去除所述动态场景视频中的背景，并进行降采样，得到时间序列;通过A財莫型对所述时间序列进行建模，得到所述A財莫型的参数和方差;将所述AR模型的参数和方差转换为AR模型功率谱特征向量，并对所述AR模型功率谱特征向量进行归一化，得到所述AR模型功率谱频域特征。
【专利摘要】本发明提供一种基于AR模型功率谱的动态场景分类方法及装置。该方法包括：获取多段动态场景视频每段各自的空域特征、时域特征和自回归AR模型功率谱频域特征；通过词袋模型分别对上述各域的特征进行统计分析，得到各域的词频直方统计图特征；将各域的多个词频直方统计图特征按域映射到核空间中，得到各域的核函数，得到各域的核函数的权重，根据权重对各域的核函数进行特征融合，得到分类特征，根据分类特征对多段动态场景视频进行分类。本发明提供的动态场景分类方法及装置，提高了具有周期性运动的动态场景的分类准确率，进一步提高了总的动态场景的分类能力。
【IPC分类】G06K9/00
【公开号】CN105512606
【申请号】CN201510825669
【发明人】曹先彬, 黄元骏, 蒋小龙, 任一存, 潘朝凤
【申请人】北京航空航天大学
【公开日】2016年4月20日
【申请日】2015年11月24日

完整全部详细技术资料下载

当前第4页1 2 3 4