一种视频元信息自动补全整理的方法和装置与流程

文档序号：11710248阅读：159来源：国知局

本发明涉及计算机技术安全领域，特别涉及一种视频元信息自动补全整理的方法和装置。

背景技术：

随着社会的发展以及技术的进步，网络的质量和带宽也大大提高，网络视频成为用户观看视频的首选。由于种种因素的影响，大多数用户会提前将网络视频下载到本地的存储设备中，以备随时调出观看，主要应用场合有以下几点：(1)在宽带网络不可达或使用费用(移动流量)昂贵时；(2)长途旅行无法接触宽带网络(如坐飞机、出海、出境、位于深山中等)；(3)宽带网络不稳定时(如经过隧道、远游、在海上时)。

离线下载的视频由于来源复杂，没有统一的格式，视频元信息往往不全，如果离线视频数量庞大，由于视频元信息不全，导致这些视频难于管理，给用户在遍历搜索这些视频时带来不良的体验。

技术实现要素：

为此，需要提供一种视频元信息自动补全整理的技术方案，用以解决现有的离线视频因为视频元信息不全导致难于管理，给用户带来不良体验的问题。

为实现上述目的，发明人提供了一种视频元信息自动补全整理的装置，所述装置包括多媒体服务器、视频播放设备和存储设备；所述多媒体服务器与视频播放设备连接，所述视频播放设备与存储设备连接；所述视频播放设备包括视频信息补全单元，所述视频信息补全单元包括第一视频元信息获取模块、音频数据获取模块、音频指纹生成模块、通信模块和第一写入模块；

所述第一视频元信息获取模块用于从存储设备中获取视频文件并解析出该视频文件对应的第一视频元信息，所述视频文件包括第一视频元信息、视频数据和音频数据；

所述音频数据获取模块用于解析视频文件并获取该视频文件对应的音频数据；

所述音频指纹生成模块用于根据视频文件的音频数据生成音频指纹；

所述通信模块用于将音频指纹发送至多媒体服务器；

所述多媒体服务器用于根据音频指纹查询该音频指纹对应的第二视频元信息，并将第二视频元信息发送至视频播放设备；

所述通信模块还用于接收第二视频元信息，所述第一写入模块用于将第二视频元信息写入视频文件中，替换该视频文件原有的第一视频元信息。

进一步地，所述存储设备中存储有多个视频文件，所述视频播放设备还包括视频整理单元，所述视频整理单元包括第二视频元信息获取模块、聚类分析模块、第二写入模块和显示模块；

所述第二视频元信息获取模块用于从获取存储设备中所有视频文件对应的视频元信息；

所述聚类分析模块用于对所有视频文件对应的视频元信息进行聚类分析，确定若干个视频文件对应的分类名，每一视频文件对应一分类名；

所述第二写入模块用于将分类名写入该分类名对应的视频文件的视频元信息中；

所述显示模块还用于接收第一指令，显示具有同一分类名的视频元信息对应的视频文件。

进一步地，所述视频元信息为第二视频元信息。

进一步地，所述第一指令由用户点击分类名触发。

进一步地，所述第一视频元信息和第二视频元信息包括视频数据对应的采样率、音频数据对应的采样率、视频文件对应的缩略图、简介。

发明人还提供了一种视频元信息自动补全整理的方法，所述方法应用于视频元信息自动补全整理的装置，所述装置包括多媒体服务器、视频播放设备和存储设备；所述多媒体服务器与视频播放设备连接，所述视频播放设备与存储设备连接；所述视频播放设备包括视频信息补全单元，所述视频信息补全单元包括第一视频元信息获取模块、音频数据获取模块、音频指纹生成模块、通信模块和第一写入模块；所述方法包括以下步骤：

第一视频元信息获取模块从存储设备中获取视频文件并解析出该视频文件对应的第一视频元信息，所述视频文件包括第一视频元信息、视频数据和音频数据；

音频数据获取模块解析视频文件并获取该视频文件对应的音频数据；

音频指纹生成模块根据视频文件的音频数据生成音频指纹；

通信模块将音频指纹发送至多媒体服务器；

多媒体服务器根据音频指纹查询该音频指纹对应的第二视频元信息，并将第二视频元信息发送至视频播放设备；

通信模块接收第二视频元信息，第一写入模块将第二视频元信息写入视频文件中，替换该视频文件原有的第一视频元信息。

进一步地，所述存储设备中存储有多个视频文件，所述视频播放设备还包括视频整理单元，所述视频整理单元包括第二视频元信息获取模块、聚类分析模块、第二写入模块和显示模块；所述方法包括以下步骤：

第二视频元信息获取模块从获取存储设备中所有视频文件对应的视频元信息；

聚类分析模块对所有视频文件对应的视频元信息进行聚类分析，确定若干个视频文件对应的分类名，每一视频文件对应一分类名；

第二写入模块将分类名写入该分类名对应的视频文件的视频元信息中；

显示模块接收第一指令，显示具有同一分类名的视频元信息对应的视频文件。

进一步地，所述视频元信息为第二视频元信息。

进一步地，所述第一指令由用户点击分类名触发。

进一步地，所述第一视频元信息和第二视频元信息包括视频数据对应的采样率、音频数据对应的采样率、视频文件对应的缩略图、简介。

上述技术方案所述的视频元信息自动补全整理的方法和装置，所述方法应用于视频元信息自动补全整理的装置，所述方法包括以下步骤：首先第一视频元信息获取模块从存储设备中获取视频文件并解析出该视频文件对应的第一视频元信息；而后音频数据获取模块解析视频文件并获取该视频文件对应的音频数据；而后音频指纹生成模块根据视频文件的音频数据生成音频指纹；而后通信模块将音频指纹发送至多媒体服务器；而后多媒体服务器根据音频指纹查询该音频指纹对应的第二视频元信息，并将第二视频元信息发送至视频播放设备；而后通信模块接收第二视频元信息，第一写入模块将第二视频元信息写入视频文件中，替换该视频文件原有的第一视频元信息。通过上述方法可以补全离线视频的元信息，便于了解视频所包含的基本信息，用户可以在此基础上对视频文件进行归纳整理，大大提升了用户体验。

附图说明

图1为本发明一实施方式涉及的视频元信息自动补全整理的装置的示意图；

图2为本发明一实施方式涉及的视频元信息自动补全整理的方法的流程图；

图3为本发明另一实施方式涉及的视频元信息自动补全整理的方法的流程图；

附图标记说明：

101、多媒体服务器；

102、视频播放设备；

103、视频信息补全单元；111、第一视频元信息获取模块；112、音频数据获取模块；113、音频指纹生成模块；114、通信模块；115、第一写入模块；

104、视频整理单元；121、第二视频元信息获取模块；122、聚类分析模块；123、第二写入模块；124、显示模块；

105、存储设备。

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。

请参阅图1，本发明一实施方式涉及的视频元信息自动补全整理的装置的示意图，所述装置包括多媒体服务器101、视频播放设备102和存储设备103；所述多媒体服务器101与视频播放设备102连接，所述视频播放设备102与存储设备105连接；所述视频播放设备102包括视频信息补全单元103，所述视频信息补全单元103包括第一视频元信息获取模块111、音频数据获取模块112、音频指纹生成模块113、通信模块114和第一写入模块115。视频播放设备为具有视频播放功能的设备，可以为手机、pc、平板等。多媒体服务器为存储有诸多视频文件的服务器，且在本实施方式中，多媒体服务器上存储的视频文件具备有完整的视频元信息。多媒体服务器与视频播放设备之间可以通过无线连接，也可以通过有线连接。存储设备可以内嵌于视频播放设备中，也可以是外接于视频播放设备。

所述第一视频元信息获取模块111用于从存储设备105中获取视频文件并解析出该视频文件对应的第一视频元信息，所述视频文件包括第一视频元信息、视频数据和音频数据；

所述音频数据获取模块112用于解析视频文件并获取该视频文件对应的音频数据；

所述音频指纹生成模块113用于根据视频文件的音频数据生成音频指纹；

所述通信模块114用于将音频指纹发送至多媒体服务器；

所述多媒体服务器101用于根据音频指纹查询该音频指纹对应的第二视频元信息，并将第二视频元信息发送至视频播放设备；

所述通信模块114还用于接收第二视频元信息，所述第一写入模块115用于将第二视频元信息写入视频文件中，替换该视频文件原有的第一视频元信息。

在使用视频元信息自动补全整理的装置时，首先第一视频元信息获取模块从存储设备中获取视频文件并解析出该视频文件对应的第一视频元信息。视频文件即离线视频文件，包括第一视频元信息、视频数据和音频数据。视频数据为视频文件中的视频码流数据，音频数据为视频文件中的音频码流数据。所述存储设备为具有存储功能的电子元件，可以为硬盘、u盘等。视频元信息即视频元数据，用于表征视频文件基本信息。在本实施方式中，视频元数据包括视频数据对应的采样率、音频数据对应的采样率、视频文件对应的缩略图、简介。在其他实施例中，视频元数据还可以包括视频数据对应的关键词(用于检索该视频的参数)、时长、格式、大小、字幕内容、演员信息等等。第一视频元信息为信息不是十分完整的视频元信息，由于信息不完整，因而需要对离线视频初始的视频元信息(第一视频元信息)进行补全，以便对离线视频进行管理，如分类、搜索等。

而后音频数据获取模块解析视频文件并获取该视频文件对应的音频数据，音频指纹生成模块根据视频文件的音频数据生成音频指纹。音频指纹技术(audiofingerprintingtechnology)是指通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来，用于识别海量的声音样本或跟踪定位样本在数据库中的位置。音频指纹作为内容自动识别技术的的核心算法，已广泛应用于音乐识别、版权内容监播、内容库去重和电视第二屏互动等领域。生成的音频指纹可以作为视频文件的标识信息，进而采用该标识信息进行检索视频文件。

而后通信模块将音频指纹发送至多媒体服务器，多媒体服务器根据音频指纹查询该音频指纹对应的第二视频元信息，并将第二视频元信息发送至视频播放设备。所述第二视频元信息为多媒体服务器上存储的视频元信息，即较为完整的视频元信息。简言之，每一视频文件对应一音频指纹，而多媒体服务器上存储的每一视频文件又对应一第二视频元信息，因而可以通过音频指纹作为索引，查询并该音频指纹对应的第二视频元信息。又由于音频指纹是通过获取离线视频的音频生成的，因而所获取的第二视频元信息即为较为完整的离线视频对应的视频元信息。

而后通信模块接收第二视频元信息，第一写入模块将第二视频元信息写入视频文件中，替换该视频文件原有的第一视频元信息。视频播放设备接收第二视频元信息后，就可以对原有的视频文件中的视频元信息(第一视频元信息)进行补全，具体为：将视频码流数据中存储该视频文件的视频元数据字段上的信息替换为第二视频元信息。至此，就完成了对一个视频文件的视频元信息的自动补全，之后可以根据实际需要对视频文件进行分类，便于进一步管理。

在某些实施例中，所述存储设备中存储有多个视频文件，所述视频播放设备102还包括视频整理单元104，所述视频整理单元104包括第二视频元信息获取模块121、聚类分析模块122、第二写入模块123和显示模块124。所述第二视频元信息获取模块用于从获取存储设备中所有视频文件对应的视频元信息；所述聚类分析模块用于对所有视频文件对应的视频元信息进行聚类分析，确定若干个视频文件对应的分类名，每一视频文件对应一分类名；所述第二写入模块用于将分类名写入该分类名对应的视频文件的视频元信息中；所述显示模块还用于接收第一指令，显示具有同一分类名的视频元信息对应的视频文件。在本实施方式中，所述视频元信息为第二视频元信息。

离线视频文件中的视频元信息补全后，就可以根据视频元信息来对不同的视频文件进行分类。例如可以将视频元信息里包含主演信息为同一明星的视频文件归为一类，并以该明星的名字作为这一类视频的分类名；再比如也可以将视频元信息里时长大于1小时的视频文件归为一类，并以“时长>1小时”作为满足这一条件的视频文件的分类名。聚类分析可以通过聚类分析算法来实现，总得原则是对所有视频文件进行分类后，同一个类别中的视频具有尽可能多的相同的视频元信息中的要素，如时长、片名、主演信息等。

聚类分析完成后，每一离线视频文件就有自己对应的分类名，即每一视频文件的视频元数据字段内多写入了该视频文件对应的分类名。而后就可以按照分类名对不同的视频文件进行分类，例如可以根据分类名新建相同数量的文件夹，每一文件夹对应一分类名，将具有同一分类名的视频文件存储于该分类名对应的文件夹中。当用户点击该文件夹时，触发第一指令，显示具有同一分类名的视频元信息对应的视频文件。通过上述方案可以在视频元信息补全后再对不同的视频文件进行分类，以便用户遍历、搜索、查看，极大增加了用户的感官体验。

请参阅图2，为本发明一实施方式涉及的视频元信息自动补全整理的装方法的流程图，所述方法应用于视频元信息自动补全整理的装置，所述装置包括多媒体服务器、视频播放设备和存储设备；所述多媒体服务器与视频播放设备连接，所述视频播放设备与存储设备连接；所述视频播放设备包括视频信息补全单元，所述视频信息补全单元包括第一视频元信息获取模块、音频数据获取模块、音频指纹生成模块、通信模块和第一写入模块；所述方法包括以下步骤：

首先进入步骤s201第一视频元信息获取模块从存储设备中获取视频文件并解析出该视频文件对应的第一视频元信息。所述视频文件包括第一视频元信息、视频数据和音频数据。视频数据为视频文件中的视频码流数据，音频数据为视频文件中的音频码流数据。所述存储设备为具有存储功能的电子元件，可以为硬盘、u盘等。视频元信息即视频元数据，用于表征视频文件基本信息。在本实施方式中，视频元数据包括视频数据对应的采样率、音频数据对应的采样率、视频文件对应的缩略图、简介。在其他实施例中，视频元数据还可以包括视频数据对应的关键词(用于检索该视频的参数)、时长、格式、大小、字幕内容、演员信息等等。第一视频元信息为信息不是十分完整的视频元信息，由于信息不完整，因而需要对离线视频初始的视频元信息(第一视频元信息)进行补全，以便对离线视频进行管理，如分类、搜索等。

而后进入步骤s202音频数据获取模块解析视频文件并获取该视频文件对应的音频数据，以及步骤s203音频指纹生成模块根据视频文件的音频数据生成音频指纹。音频指纹技术(audiofingerprintingtechnology)是指通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来，用于识别海量的声音样本或跟踪定位样本在数据库中的位置。音频指纹作为内容自动识别技术的的核心算法，已广泛应用于音乐识别、版权内容监播、内容库去重和电视第二屏互动等领域。生成的音频指纹可以作为视频文件的标识信息，进而采用该标识信息进行检索视频文件。

而后进入步骤s204通信模块将音频指纹发送至多媒体服务器，以及步骤s205多媒体服务器根据音频指纹查询该音频指纹对应的第二视频元信息，并将第二视频元信息发送至视频播放设备。所述第二视频元信息为多媒体服务器上存储的视频元信息，即较为完整的视频元信息。简言之，每一视频文件对应一音频指纹，而多媒体服务器上存储的每一视频文件又对应一第二视频元信息，因而可以通过音频指纹作为索引，查询并该音频指纹对应的第二视频元信息。又由于音频指纹是通过获取离线视频的音频生成的，因而所获取的第二视频元信息即为较为完整的离线视频对应的视频元信息。

而后进入步骤s206通信模块接收第二视频元信息，第一写入模块将第二视频元信息写入视频文件中，替换该视频文件原有的第一视频元信息。视频播放设备接收第二视频元信息后，就可以对原有的视频文件中的视频元信息(第一视频元信息)进行补全，具体为：将视频码流数据中存储该视频文件的视频元数据字段上的信息替换为第二视频元信息。至此，就完成了对一个视频文件的视频元信息的自动补全，之后可以根据实际需要对视频文件进行分类，便于进一步管理。

在某些实施例中，所述存储设备中存储有多个视频文件，所述视频播放设备还包括视频整理单元，所述视频整理单元包括第二视频元信息获取模块、聚类分析模块、第二写入模块和显示模块。如图2所示，所述方法包括以下步骤：

首先进入步骤s301第二视频元信息获取模块从获取存储设备中所有视频文件对应的视频元信息；而后进入步骤s302聚类分析模块对所有视频文件对应的视频元信息进行聚类分析，确定若干个视频文件对应的分类名。每一视频文件对应一分类名。而后进入步骤s303第二写入模块将分类名写入该分类名对应的视频文件的视频元信息中。而后进入步骤s304显示模块还接收第一指令，显示具有同一分类名的视频元信息对应的视频文件。在本实施方式中，所述视频元信息为第二视频元信息。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括……”或“包含……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外，在本文中，“大于”、“小于”、“超过”等理解为不包括本数；“以上”、“以下”、“以内”等理解为包括本数。

本领域内的技术人员应明白，上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机设备可读取的存储介质中，用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备，包括但不限于：个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等；所述的存储介质，包括但不限于：ram、rom、磁碟、磁带、光盘、闪存、u盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。

上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器，使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中，使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机设备上，使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已经对上述各实施例进行了描述，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改，所以以上所述仅为本发明的实施例，并非因此限制本发明的专利保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林宇辉;方兴文;黄晓明
技术所有人：福州瑞芯微电子股份有限公司
我是此专利的发明人

上一篇：一种提高实时视频播放质量的方法与流程
上一篇：一种频道切换方法及其装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。