视频标记方法和装置的制造方法

文档序号:9434131阅读:204来源:国知局
视频标记方法和装置的制造方法
【技术领域】
[0001] 本发明总地涉及视频处理,具体地说,涉及一种对视频进行标记的方法和装置。
【背景技术】
[0002] 近年来,可观看的视频节目数量显著增长,能对数量日益庞大的视频节目进行整 理、归纳和检索成为非常重要的工作,为此,需要对视频进行描述。视频标记是一种将描述 信息与视频内容关联起来的技术。有了这样的技术,可以对视频节目中携带的人物、物品、 事件、声音、文字等进行描述,从而便于视频的分类、整理、检索、分发和获取。
[0003] 目前,常用的视频标记方式是,将描述视频内容的信息存储成文本文件的格式,并 给标记相应视频信息的时间戳。这种视频标记方式分别提供了视频文件和描述信息的文本 文件,在播放视频文件时,根据时间戳来读取文本文件中的描述信息。例如,在给电影加字 幕或者旁白时,现有的做法是,将字幕或旁白制作成文本文件,并根据字幕或旁白在电影播 放过程中出现的时间点加上适当的时间戳。这样,在播放电影的视频内容时,播放器通过时 间戳指示的时间读取相应的字幕或旁白,在图像上呈现出合适的字幕或旁白。
[0004] 按照这种标记方式,视频文件和描述信息是分离的两个文件,极易导致二者之间 的不匹配,甚至描述信息丢失,造成对视频描述的无效。再者,如果对视频文件进行了剪辑 或重新编辑,那么必须对相应的描述信息进行修改;否则,由于时间上的不对准,必然会造 成视频文件与描述信息之间的不匹配。这也是我们常常看到电影与其对白对不上的原因之 〇
[0005] 此外,由于视频文件和用于标记它的文件是两个分离的文件,这也给视频整理、检 索和获取造成了不少的麻烦和不小的困难。
[0006] 当前的视频标记方式存在着操作复杂、连续性不强、标记效果不明显的问题。因 此,如何提高视频标记性能成为一个亟待解决的技术问题。

【发明内容】

[0007] 有鉴于此,本发明提供一种基于声音编码来标记视频的技术,可以有效地对视频 进行标记,经标记的视频只有一个文件,不会有描述信息文件丢失造成视频无标记、无法整 理、检索和/或获取的问题,并且标记后的视频连续性强,重新剪辑、编辑或删除部分视频 内容都不会影响对视频文件的标记。
[0008] 根据本发明的一方面,一种视频标记方法包括:
[0009] 对标记进行编码,其中,所述标记与对视频进行描述的描述信息和位置相对应;
[0010] 将编码后的标记转换成音频文件;以及
[0011] 根据所述位置,将所述音频文件插入所述视频中。
[0012] 其中,将所述标记表示成2字节无符号整数、或8字节无符号整数、或16字节无符 号整数。
[0013] -方面,所述将编码后的标记转换成音频文件的步骤包括:
[0014] 将编码后的标记转换成比特流;
[0015] 利用扩频序列,将所述比特流进行直接序列扩频基带调制;
[0016] 对所获得的直接序列扩频基带调制信号进行低通滤波和正交调制,以获得中心频 率是期望频率的音频信号;
[0017] 对所述音频信号进行采样和量化,以获得数字信号;以及
[0018] 将所述数字信号写成音频文件。
[0019] 其中,可以将数字信号写成WAV格式且时长与原视频时长相同的音频文件。
[0020] 此外,将所述音频文件插入到不影响视听体验的频段,例如,是17-20kHz之间的 频段。
[0021] 另一方面,本发明还提供一种视频标记装置,其包括:
[0022] 数据库,用于存储对视频进行描述的描述信息及其位置,并指示标记与所述描述 信息及其位置之间的对应关系;
[0023] 编码模块,用于对所述标记进行编码;
[0024] 转换模块,用于将经编码的标记转换成音频文件;和
[0025] 混音模块,用于根据所述位置,将所述音频文件与所述视频文件进行混音。
[0026] 其中,所述编码模块将所述标记表示成2字节无符号整数、或8字节无符号整数、 或16字节无符号整数。
[0027] 其中,所述转换模块包括:
[0028] 比特流形成模块,用于将编码后的标记转换成比特流;
[0029] 扩频模块,用于利用扩频序列,将所述比特流进行直接序列扩频基带调制;
[0030] 调制模块,用于对所获得的直接序列扩频基带调制信号进行低通滤波和正交调 制,以获得中心频率是期望频率的音频信号;
[0031] 采样模块,用于对所述音频信号进行采样和量化,以获得数字信号;以及
[0032] 格式化模块,用于将所述数字信号写成音频文件。
[0033] 其中,所述混音模块将所述音频文件混音至不影响视听体验的频段,例如, 17_20kHz之间的频段。
[0034] 采用以上方案,可以有效地对视频文件进行标记,标记后的视频仍然保持一个文 件的状态,使得视频文件的完整性得以体现,视频文件的剪辑、截取、部分删除等都不影响 对视频文件的标记,不会有标记丢失造成的各种问题;可标记的视频内容也得到大幅提升, 不仅可以标记字幕、人物、物品、事件,还可以标记画外音、视频中不可见的物品或说明,因 此,对视频进行整理、归纳和/或检索都更加容易和方便。
【附图说明】
[0035] 图1是根据本发明的方案对视频进行标记的方法流程图。
[0036] 图2是根据本发明的方案对视频进行标记的装置的示意性框图。
【具体实施方式】
[0037] 为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实 施方式进行详细说明。附图中所示和根据附图描述的本发明的实施方式仅仅是示例性的, 并且本发明并不限于这些实施方式。
[0038] 需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了 与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他 细节。
[0039] 本发明的主要目的在于对视频文件进行标记,这里所述的视频可以是任何带有图 像和/或声音的文件,包括但不限于一段声音、音乐、一段图像、电影、电视节目、微电影、访 谈、录像等等。这里所述的"标记"可以是标记的动作,指用某种信息对视频进行标注、描 述、解释和/或说明,包括但不限于给视频加电视字幕、电影字幕、旁白等,这些信息在本发 明中称为描述信息;也可以是指标记信息,其可以指示描述信息及其位置或时间,所述的位 置信息或者时间信息例如是视频图像的第几帧、开始时间、时间段,位置信息和时间信息在 本发明中具有相同的作用和含义。
[0040] 下面,以在一段时长10分钟的视频的第3分20秒处标记X歌手开始唱歌为例,详 细描述根据本发明的视频标记技术。
[0041] 在这个实施例中,标记与"位置/时间信息--第3分20秒"和"描述信息--X 歌手开始唱歌"存在着 对应的关系。
[0042] 图1示出了对视频进行标记的过程。参见图1,该过程包括了如下步骤:
[0043] SlOl、对标记进行编码;
[0044] 一般而言,与视频相关的描述信息及其位置/时间信息存储在服务器的数据库 中,按照数据库存储数据的格式或方式,描述信息及其位置/时间信息作为一条记录,会被 分配一索引号,通过该索引号,就可以在数据库中查找到相应的记录。
[0045] 由于标记也对应着描述信息及其位置/时间信息,所以具有索引号的一条记录就 对应一个标记。换言之,也可以将标记作为相应描述信息及其位置/时间信息的索引,一并 存储在数据库中。
[0046] 对于本实施例而言,描述信息的具体内容是"X歌手开始唱歌",其出现的位置/时 间是第3' 20",在数据库中可将它们存储成如下形式:
[0048] 上述这条记录对应着一个标记。作为示例,将该索引号编码成2字节无符号整数。 这种编码方式可表示65536个标记。应该理解,本发明不限于这种编码方式,将标记编码成 8字节无符号整数或16字节无符号整数等任何其它码的方式也都落入本发明的范围。
[0049] S102、将编码后的标记转换成音频文件;
[0050] 作为示例,可以采用如下方式将编码后的标记转换成音频文件:
[0051] (1)将编码后的标记,即2字节无符号整数(或8字节无符号整数或16字节无符 号整数),按照从最低有效位(LSB)到最高有效位(MSB)的顺序转换成比特流;
[0052] (2)采用7阶m
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1