视频分类方法和系统的制作方法

文档序号:6400171阅读:667来源:国知局
专利名称:视频分类方法和系统的制作方法
视频分类方法和系统
技术领域
本发明涉及视频处理领域,特别涉及一种视频分类方法和系统。
背景技术
随着多媒体技术的发展以及影视传媒业的繁荣,影像视频不但在数量上急剧增力口,而且在种类上也层出不穷。为了限制不良视频的泛滥,需要对影像视频进行分类管理。由于一段视频中所包含的数据量通常达到几百兆甚至几吉。因此,由计算机实现对视频进行自动分类非常困难,一般只能通过人工来对视频进行分类。

发明内容基于此,有必要提供一种能准确判断视频所属的视频类型的视频分类方法。一种视频分类方法,包括以下步骤:读取待分类视频;统计各预设物体对象在所述待分类视频中的出现频率;根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵;计算所述待分类视频的信息熵与各类型视频的信息熵的距离;获取计算得 到的距离中最小距离对应的视频类型为所述待分类视频的视频类型。在其中一个实施例中,在所述读取待分类视频的步骤之前,所述方法还包括以下步骤: 读取视频样本数据库中的视频;统计各预设物体对象在视频样本数据库的视频中的总出现频率;根据所述总出现频率计算各预设物体对象的信息量。在其中一个实施例中,所述根据所述总出现频率计算各预设物体对象的信息量的步骤为:计算各预设物体对象的信息量为以预设常数为底各预设物体对象在视频样本数据库的视频中总现出频率的对数的相反数,所述预设常数大于I。在其中一个实施例中,在所述读取待分类视频的步骤之前,所述方法还包括以下步骤:统计各预设物体对象在视频样本数据库的各类型视频中的出现频率;根据各预设物体对象的信息量及各预设物体对象在各类型视频中的出现频率计算各类型视频的信息熵。在其中一个实施例中,根据各预设物体对象的信息量及各预设物体对象在某一类型视频中的出现频率计算该类型视频的信息熵的步骤为:计算各预设物体对象的信息量与各预设物体对象在该类型视频中的出现频率的乘积之和,计算该类型视频的信息熵为该乘积之和与该类型视频的视频时长总和的商;
根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵的步骤为:计算各预设物体对象的信息量与各预设物体对象在待分类视频中的出现频率的乘积之和,计算所述待分类视频的信息熵为该乘积之和与所述待分类视频的视频时长的商。此外,还有必要提供一种能准确判断视频所属的视频类型的视频分类方法。一种视频分类系统,包括:视频读取模块,用于读取待分类视频;出现频率统计模块,用于统计各预设物体对象在所述待分类视频中的出现频率;信息熵计算模块,用于根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵;距离计算模块,用于计算所述待分类视频的信息熵与各类型视频的信息熵的距离;类型设置模块,用于获取计算得到的距离中最小距离对应的视频类型为所述待分类视频的视频类型。在其中一个实施例中,所述视频读取模块还用于在所述读取待分类视频的步骤之前,读取视频样本数据库中的视频;所述出现频率统计模块还用于统计各预设物体对象在视频样本数据库的视频中的总出现频率;所述系统还包括信息量计算模块,用于根据所述总出现频率计算各预设物体对象
的信息量。在其中一个实施例中,所述信息量计算模块用于计算各预设物体对象的信息量为以预设常数为底各预设物体对象的信息量的对数的相反数,所述预设常数大于I。在其中一个实施例中,所述出现频率统计模块还用于统计各预设物体对象在视频样本数据库的各类型视频中的出现频率;所述信息熵计算模块还用于根据各预设物体对象的信息量及各预设物体对象在各类型视频中的出现频率计算各类型视频的信息熵。在其中一个实施例中,所述信息熵计算模块根据各预设物体对象的信息量及各预设物体对象在某一类型视频中的出现频率计算该类型视频的信息熵的过程为:计算各预设物体对象的信息量与各预设物体对象在该类型视频中的出现频率的乘积之和,计算该类型视频的信息熵为该乘积之和与该类型视频的视频时长总和的商;所述信息熵计算模块根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵的过程为:计算各预设物体对象的信息量与各预设物体对象在待分类视频中的出现频率的乘积之和,计算所述待分类视频的信息熵为该乘积之和与所述待分类视频的视频时长的商。上述视频分类方法和系统,根据各预设物体对象的信息量及各预设物体对象在待分类视频中的出现频率计算待分类视频的信息熵,进一步根据待分类视频的信息熵与已知的各类型视频的信息熵的距离来判断待分类视频的类型,由于视频中某些特定的物体对象的出现频率可以反映视频所属的视频类型,上述方法和系统根据待分类视频中预设物体对象的出现频率对应的信息熵来确定待分类视频的视频类型,从而可以准确地判断待分类视频的视频类型。

图1为一个实施例中的视频分类方法的流程示意图;图2为一个实施例中图1中的步骤S102的流程示意图;图3为一个实施例中计算 各预设物体对象的信息量的步骤的流程示意图;图4为一个实施例中计算视频样本数据库中各类型视频的信息熵的步骤的流程示意图;图5为一个实施例中的视频分类系统的结构示意图;图6为另一实施例中的视频分类系统的结构示意图;图7为又一实施例中的视频分类系统的结构示意图。
具体实施方式如图1所示,在一个实施例中,一种视频分类方法,包括以下步骤:步骤S101,读取待分类视频。步骤S102,统计各预设物体对象在待分类视频中的出现频率。预设物体对象为可表征视频类型的特定的物体对象。例如,暴力类型的视频中出现刀具、枪等具有暴力性质的物体对象的频率较多。则刀具、枪等具有暴力性质的物体对象为可表征暴力视频类型的物体对象。如图2所示,在一个实施例中,步骤S102包括以下步骤:步骤S112,获取待分类视频中的视频图像帧。可按照预设时间间隔获取待分类视频中的视频图像帧,或者随机获取待分类视频中预设数量的视频图像帧。步骤S122,根据各预设物体对象的图像特征判断各预设物体对象是否在视频图像帧中出现,并统计各预设物体对象出现的次数。在步骤S122之前,可搜索各预设物体对象的样本图像,对各预设物体对象的样本图像进行训练,提取出各预设物体对象的图像特征。步骤S132,计算各预设物体对象中某一预设物体对象的出现频率为该预设物体对象在视频图像帧中出现的次数与各预设物体对象在视频图像帧中出现的次数总和的商。记各预设物体对象为object_l, object_2,…,object_n,预设物体对象object_i在视频图像巾贞中出现的次数为occur_num_i (其中i=l,…,n),则object」在待分类视频中的出现频率 Pi 可计算为 occur_num_i/(occur_num_l+occur_num_2+…+occur_num_n)。步骤S103,根据各预设物体对象的信息量及各预设物体对象在待分类视频中的出现频率计算待分类视频的信息熵。在步骤SlOl之前,上视频分类方法还包括计算各预设物体对象的信息量的过程,如图3所示,该过程包括以下步骤:步骤S301,读取视频样本数据库中的视频。可读取视频样本数据库中的所有视频。步骤S302,统计各预设物体对象在视频样本数据库的视频中的总出现频率。具体的,可统计各预设物体对象在视频样本数据库的视频中的总出现次数,进一步计算各预设物体对象中某一预设物体对象的总出现频率为该预设物体对象的总出现次数与各预设物体对象的总出现次数之和的商。记预设物体对象object」在视频样本数据库的所有视频中的总出现次数为sum_occur_num_i (其中i=l,…,η,η为预设物体对象的数量),则预设物体对象object」在视频样本数据库的所有视频中的总出现频率SUIi^Pi可计算为sum_occur_num_i/(sum_occur_num_l+sum_occur_num_2+…+sum_occur_num_n)。其中,统计某一预设物体对象在某一视频中的出现次数的过程与步骤S102的过程类似,在此不再赘述。步骤S303,根据总出现频率计算各预设物体对象的信息量。具体的,可计算各预设物体对象的信息量为以预设常数为底各预设物体对象在视频样本数据库的视频中的总出现频率的对数的相反数,其中预设常数大于I。记预设物体对象object_i的信息量为infor_i, object_i在视频样本数据库的所有视频中的总出现频率为sum_Pi (其中i=l,..., η, η为预设物体对象的数量),则infor_i= - logbsum-Pi,其中b为大于I的预设常数。步骤S103包括以下步骤:计算各预设物体对象的信息量与各预设物体对象在待分类视频中的出现频率的乘积之和,计算待分类视频的信息熵为该乘积之和与待分类视频的视频时长的商。记待分类视频的信息熵为entropy,预设物体对象object」的信息量为infor_i,预设物体对象object_i在待分类视频中的出现频率为Pi,待分类视频的视频时长为 t,则 entropy = (infor_l XP1 + infor_2XP2 H-----l.infor_nXPn) /to步骤S104,计算待分类视频的信息熵与各类型视频的信息熵的距离。在一个实施例中,在步骤SlOl之前,上述视频分类方法还包括计算视频样本数据库中各类型视频的信息熵的步骤,如图4所示,该步骤包括以下步骤:步骤S401,统计各预设物体对象在视频样本数据库的各类型视频中的出现频率。可预先标记视频样本数据库中所有视频所属的视频类型,进一步的,分类统计各预设物体对象在视频样本数据库的各类型视频中的出现频率。某一预设物体对象在某一类型视频中的出现频率等于该预设物体对象在该类型视频中的出现次数除以各预设物体对象在该类型视频中的出现次数之和。其中,统计某一预设物体对象在某一类型视频中的出现频率的过程与步骤S102的过程类似,在此不再赘述。步骤S402,根据各预设物体对象的信息量及各预设物体对象在各类型视频中的出现频率计算各类型视频的信息熵。步骤S402中,根据各预设物体对象的信息量及各预设物体对象在某一类型视频中的出现频率计算该类型视频的信息熵的步骤包括:计算各预设物体对象的信息量与各预设物体对象在该类型视频中的出现频率的乘积之和,计算该类型视频的信息熵为该乘积之和与该类型视频的视频时长总和的商。记预设物体对象ob ject_i的信息量为infor_i, object_i在type_j类型视频中的出现频率为P_ij,视频样本数据库中type_j类型视频的视频时长总和为time_j,则视频样本数据库中type_j类型视频的信息熵entropy_j = (infor_l X Plj + infor_2XP2J H-----l.in for_nXPnj)/time_j,其中 i=l, η, n 为预设物体对象的数量,
j=l,…,m, m为视频样本数据库中视频类型的类型数量。
步骤S105,获取计算得到的距离中最小距离对应的视频类型为待分类视频的视频类型。如图5所示,在一个实施例中,一种视频分类系统,包括视频读取模块10、出现频率统计模块20、信息熵计算模块30、距离计算模块40和类型设置模块50,其中:视频读取模块10用于读取待分类视频。出现频率统计模块20用于统计各预设物体对象在待分类视频中的出现频率。预设物体对象为可表征视频类型的特定的物体对象。例如,暴力类型的视频中出现刀具、枪等具有暴力性质的物体对象的频率较多。则刀具、枪等具有暴力性质的物体对象为可表征暴力视频类型的物体对象。具体的,出现频率统计模块20获取待分类视频中的视频图像帧。出现频率统计模块20可按照预设时间间隔获取待分类视频中的视频图像帧,或者随机获取待分类视频中预设数量的视频图像帧。进一步的,出现频率统计模块20根据各预设物体对象的图像特征判断各预设物体对象是否在视频图像帧中出现,并统计各预设物体对象出现的次数。本实施例中,如图6所示,上述视频分类系统还包括图像特征提取模块60,用于搜索各预设物体对象的样本图像,对各预设物体对象的样本图像进行训练,提取出各预设物体对象的图像特征。进一步的,出现频率统计模块20计算各预设物体对象中某一预设物体对象的出现频率为该预设物体对象在视频图像帧中出现的次数与各预设物体对象在视频图像帧中出现的次数总和的商。信息熵计算模块30用于根据各预设物体对象的信息量及各预设物体对象在待分类视频中的出现频率计算待分类视频的信息熵。在一个实施例中,如图7所示,上视频分类系统还包括信息量计算模块70,用于计算各预设物体对象的信息量的过程,本实施例中,视频读取模块10还用于读取视频样本数据库中的视频。视频读取模块10可读取视频样本数据库中的所有视频。出现频率统计模块20还用于统计各预设物体对象在视频样本数据库的视频中的总出现频率。具体的,出现频率统计模块20可统计各预设物体对象在视频样本数据库的视频中的总出现次数,进一步计算各预设物体对象中某一预设物体对象的总出现频率为该预设物体对象的总出现次数与各预设物体对象的总出现次数之和的商。信息量计算模块70用于根据总出现频率计算各预设物体对象的信息量。具体的,信息量计算模块70可计算各预设物体对象的信息量为以预设常数为底各预设物体对象在视频样本数据库的视频中的总出现频率的对数的相反数,其中预设常数大于I。本实施例中,信息熵计算模块30可计算各预设物体对象的信息量与各预设物体对象在待分类视频中的出现频率的乘积之和,计算待分类视频的信息熵为该乘积之和与待分类视频的视频时长的商。距离计算模块40用于计算待分类视频的信息熵与各类型视频的信息熵的距离。在一个实施例中,在视频读取模块10读取待分类视频之前,出现频率统计模块20还用于统计各预设物体对象在视频样本数据库的各类型视频中的出现频率。出现频率统计模块20可预先标记视频样本数据库中所有视频所属的视频类型,进一步的,分类统计各预设物体对象在视频样本数据库的各类型视频中的出现频率。某一预设物体对象在某一类型视频中的出现频率等于该预设物体对象在该类型视频中的出现次数除以各预设物体对象在该类型视频中的出现次数之和。其中,统计某一预设物体对象在某一类型视频中的出现频率的过程与步骤S102的过程类似,在此不再赘述。信息熵计算模块30还用于根据各预设物体对象的信息量及各预设物体对象在各类型视频中的出现频率计算各类型视频的信息熵。信息熵计算模块30根据各预设物体对象的信息量及各预设物体对象在某一类型视频中的出现频率计算该类型视频的信息熵的过程包括:计算各预设物体对象的信息量与各预设物体对象在该类型视频中的出现频率的乘积之和,计算该类型视频的信息熵为该乘积之和与该类型视频的视频时长总和的商。类型设置模块50用于获取计算得到的距离中最小距离对应的视频类型为待分类视频的视频类型。上述视频分类方法和系统,根据各预设物体对象的信息量及各预设物体对象在待分类视频中的出现频率计算待分类视频的信息熵,进一步根据待分类视频的信息熵与已知的各类型视频的信息熵的距离来判断待分类视频的类型,由于视频中某些特定的物体对象的出现频率可以反映视频所属的视频类型,上述方法和系统根据待分类视频中预设物体对象的出现频率对应的信息熵来确定待分类视频的视频类型,从而可以准确地判断待分类视频的视频类型。以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
权利要求
1.一种视频分类方法,包括以下步骤: 读取待分类视频; 统计各预设物体对象在所述待分类视频中的出现频率; 根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵; 计算所述待分类视频的信息熵与各类型视频的信息熵的距离; 获取计算得到的距离中最小距离对应的视频类型为所述待分类视频的视频类型。
2.根据权利要求1所述的视频分类方法,其特征在于,在所述读取待分类视频的步骤之前,所述方法还包括以下步骤: 读取视频样本数据库中的视频; 统计各预设物体对象在视频样本数据库的视频中的总出现频率; 根据所述总出现频率计算各预设物体对象的信息量。
3.根据权利要求2所述的视频分类方法,其特征在于,所述根据所述总出现频率计算各预设物体对象的信息量的步骤为: 计算各预设物体对象的信息量为以预设常数为底各预设物体对象在视频样本数据库的视频中总现出频率的对数的相反数,所述预设常数大于I。
4.根据权利要求2或3所述的视频分类方法,其特征在于,在所述读取待分类视频的步骤之前,所述方法还包括以下步骤: 统计各预设物体对象在视频样本数据库的各类型视频中的出现频率; 根据各预设物体对象的信息量及各预设物体对象在各类型视频中的出现频率计算各类型视频的信息熵。
5.根据权利要求4所述的视频分类方法,其特征在于,根据各预设物体对象的信息量及各预设物体对象在某一类型视频中的出现频率计算该类型视频的信息熵的步骤为: 计算各预设物体对象的信息量与各预设物体对象在该类型视频中的出现频率的乘积之和,计算该类型视频的信息熵为该乘积之和与该类型视频的视频时长总和的商; 根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵的步骤为: 计算各预设物体对象的信息量与各预设物体对象在待分类视频中的出现频率的乘积之和,计算所述待分类视频的信息熵为该乘积之和与所述待分类视频的视频时长的商。
6.一种视频分类系统,其特征在于,包括: 视频读取模块,用于读取待分类视频; 出现频率统计模块,用于统计各预设物体对象在所述待分类视频中的出现频率; 信息熵计算模块,用于根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵; 距离计算模块,用于计算所述待分类视频的信息熵与各类型视频的信息熵的距离;类型设置模块,用于获取计算得到的距离中最小距离对应的视频类型为所述待分类视频的视频类型。
7.根据权利要求6所述的视频分类方法,其特征在于,所述视频读取模块还用于在所述读取待分类视频的步骤之前,读取视频样本数据库中的视频;所述出现频率统计模块还用于统计各预设物体对象在视频样本数据库的视频中的总出现频率; 所述系统还包括信息量计算模块,用于根据所述总出现频率计算各预设物体对象的信息量。
8.根据权利要求7所述的视频分类方法,其特征在于,所述信息量计算模块用于计算各预设物体对象的信息量为以预设常数为底各预设物体对象的信息量的对数的相反数,所述预设常数大于I。
9.根据权利要求7或8所述的视频分类方法,其特征在于,所述出现频率统计模块还用于统计各预设物体对象在视频样本数据库的各类型视频中的出现频率; 所述信息熵计算模块还用于根据各预设物体对象的信息量及各预设物体对象在各类型视频中的出现频率计算各类型视频的信息熵。
10.根据权利要求9所述的视频分类方法,其特征在于,所述信息熵计算模块根据各预设物体对象的信息量及各预设物体对象在某一类型视频中的出现频率计算该类型视频的信息熵的过程为: 计算各预设物体对象的信息量与各预设物体对象在该类型视频中的出现频率的乘积之和,计算该类型视频的信息熵为该乘积之和与该类型视频的视频时长总和的商; 所述信息熵计算模块根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵的过程为: 计算各预设物体对象的信息量与各预设物体对象在待分类视频中的出现频率的乘积之和,计算所述待分类 视频的信息熵为该乘积之和与所述待分类视频的视频时长的商。
全文摘要
一种视频分类方法,包括以下步骤读取待分类视频;统计各预设物体对象在所述待分类视频中的出现频率;根据各预设物体对象的信息量及各预设物体对象在所述待分类视频中的出现频率计算所述待分类视频的信息熵;计算所述待分类视频的信息熵与各类型视频的信息熵的距离;获取计算得到的距离中最小距离对应的视频类型为所述待分类视频的视频类型。此外,还提供一种视频分类系统。由于视频中特定物体对象的出现频率可以反映视频所属的视频类型,上述方法和系统根据待分类视频中预设物体对象的出现频率对应的信息熵来确定待分类视频的视频类型,从而可以准确地判断待分类视频的视频类型。
文档编号G06F17/30GK103177091SQ20131007589
公开日2013年6月26日 申请日期2013年3月8日 优先权日2013年3月8日
发明者朱定局 申请人:深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1