视频标记方法和装置的制造方法

文档序号：9434131阅读：204来源：国知局

视频标记方法和装置的制造方法
【技术领域】
[0001] 本发明总地涉及视频处理，具体地说，涉及一种对视频进行标记的方法和装置。
【背景技术】
[0002] 近年来，可观看的视频节目数量显著增长，能对数量日益庞大的视频节目进行整理、归纳和检索成为非常重要的工作，为此，需要对视频进行描述。视频标记是一种将描述信息与视频内容关联起来的技术。有了这样的技术，可以对视频节目中携带的人物、物品、事件、声音、文字等进行描述，从而便于视频的分类、整理、检索、分发和获取。
[0003] 目前，常用的视频标记方式是，将描述视频内容的信息存储成文本文件的格式，并给标记相应视频信息的时间戳。这种视频标记方式分别提供了视频文件和描述信息的文本文件，在播放视频文件时，根据时间戳来读取文本文件中的描述信息。例如，在给电影加字幕或者旁白时，现有的做法是，将字幕或旁白制作成文本文件，并根据字幕或旁白在电影播放过程中出现的时间点加上适当的时间戳。这样，在播放电影的视频内容时，播放器通过时间戳指示的时间读取相应的字幕或旁白，在图像上呈现出合适的字幕或旁白。
[0004] 按照这种标记方式，视频文件和描述信息是分离的两个文件，极易导致二者之间的不匹配，甚至描述信息丢失，造成对视频描述的无效。再者，如果对视频文件进行了剪辑或重新编辑，那么必须对相应的描述信息进行修改；否则，由于时间上的不对准，必然会造成视频文件与描述信息之间的不匹配。这也是我们常常看到电影与其对白对不上的原因之〇
[0005] 此外，由于视频文件和用于标记它的文件是两个分离的文件，这也给视频整理、检索和获取造成了不少的麻烦和不小的困难。
[0006] 当前的视频标记方式存在着操作复杂、连续性不强、标记效果不明显的问题。因此，如何提高视频标记性能成为一个亟待解决的技术问题。

【发明内容】

[0007] 有鉴于此，本发明提供一种基于声音编码来标记视频的技术，可以有效地对视频进行标记，经标记的视频只有一个文件，不会有描述信息文件丢失造成视频无标记、无法整理、检索和/或获取的问题，并且标记后的视频连续性强，重新剪辑、编辑或删除部分视频内容都不会影响对视频文件的标记。
[0008] 根据本发明的一方面，一种视频标记方法包括：
[0009] 对标记进行编码，其中，所述标记与对视频进行描述的描述信息和位置相对应；
[0010] 将编码后的标记转换成音频文件；以及
[0011] 根据所述位置，将所述音频文件插入所述视频中。
[0012] 其中，将所述标记表示成2字节无符号整数、或8字节无符号整数、或16字节无符号整数。
[0013] -方面，所述将编码后的标记转换成音频文件的步骤包括：
[0014] 将编码后的标记转换成比特流；
[0015] 利用扩频序列，将所述比特流进行直接序列扩频基带调制；
[0016] 对所获得的直接序列扩频基带调制信号进行低通滤波和正交调制，以获得中心频率是期望频率的音频信号；
[0017] 对所述音频信号进行采样和量化，以获得数字信号；以及
[0018] 将所述数字信号写成音频文件。
[0019] 其中，可以将数字信号写成WAV格式且时长与原视频时长相同的音频文件。
[0020] 此外,将所述音频文件插入到不影响视听体验的频段,例如,是17-20kHz之间的频段。
[0021] 另一方面，本发明还提供一种视频标记装置，其包括：
[0022] 数据库，用于存储对视频进行描述的描述信息及其位置，并指示标记与所述描述信息及其位置之间的对应关系；
[0023] 编码模块，用于对所述标记进行编码；
[0024] 转换模块，用于将经编码的标记转换成音频文件；和
[0025] 混音模块，用于根据所述位置，将所述音频文件与所述视频文件进行混音。
[0026] 其中，所述编码模块将所述标记表示成2字节无符号整数、或8字节无符号整数、或16字节无符号整数。
[0027] 其中，所述转换模块包括：
[0028] 比特流形成模块，用于将编码后的标记转换成比特流；
[0029] 扩频模块，用于利用扩频序列，将所述比特流进行直接序列扩频基带调制；
[0030] 调制模块，用于对所获得的直接序列扩频基带调制信号进行低通滤波和正交调制，以获得中心频率是期望频率的音频信号；
[0031] 采样模块，用于对所述音频信号进行采样和量化，以获得数字信号；以及
[0032] 格式化模块，用于将所述数字信号写成音频文件。
[0033] 其中，所述混音模块将所述音频文件混音至不影响视听体验的频段，例如， 17_20kHz之间的频段。
[0034] 采用以上方案，可以有效地对视频文件进行标记，标记后的视频仍然保持一个文件的状态，使得视频文件的完整性得以体现，视频文件的剪辑、截取、部分删除等都不影响对视频文件的标记，不会有标记丢失造成的各种问题；可标记的视频内容也得到大幅提升，不仅可以标记字幕、人物、物品、事件，还可以标记画外音、视频中不可见的物品或说明，因此，对视频进行整理、归纳和/或检索都更加容易和方便。
【附图说明】
[0035] 图1是根据本发明的方案对视频进行标记的方法流程图。
[0036] 图2是根据本发明的方案对视频进行标记的装置的示意性框图。
【具体实施方式】
[0037] 为使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明的具体实施方式进行详细说明。附图中所示和根据附图描述的本发明的实施方式仅仅是示例性的，并且本发明并不限于这些实施方式。
[0038] 需要说明的是，为了避免因不必要的细节而模糊了本发明，在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤，而省略了与本发明关系不大的其他细节。
[0039] 本发明的主要目的在于对视频文件进行标记，这里所述的视频可以是任何带有图像和/或声音的文件，包括但不限于一段声音、音乐、一段图像、电影、电视节目、微电影、访谈、录像等等。这里所述的"标记"可以是标记的动作，指用某种信息对视频进行标注、描述、解释和/或说明，包括但不限于给视频加电视字幕、电影字幕、旁白等，这些信息在本发明中称为描述信息；也可以是指标记信息，其可以指示描述信息及其位置或时间，所述的位置信息或者时间信息例如是视频图像的第几帧、开始时间、时间段，位置信息和时间信息在本发明中具有相同的作用和含义。
[0040] 下面，以在一段时长10分钟的视频的第3分20秒处标记X歌手开始唱歌为例，详细描述根据本发明的视频标记技术。
[0041] 在这个实施例中，标记与"位置/时间信息--第3分20秒"和"描述信息--X 歌手开始唱歌"存在着对应的关系。
[0042] 图1示出了对视频进行标记的过程。参见图1，该过程包括了如下步骤：
[0043] SlOl、对标记进行编码；
[0044] 一般而言，与视频相关的描述信息及其位置/时间信息存储在服务器的数据库中，按照数据库存储数据的格式或方式，描述信息及其位置/时间信息作为一条记录，会被分配一索引号，通过该索引号，就可以在数据库中查找到相应的记录。
[0045] 由于标记也对应着描述信息及其位置/时间信息，所以具有索引号的一条记录就对应一个标记。换言之，也可以将标记作为相应描述信息及其位置/时间信息的索引，一并存储在数据库中。
[0046] 对于本实施例而言，描述信息的具体内容是"X歌手开始唱歌"，其出现的位置/时间是第3' 20"，在数据库中可将它们存储成如下形式：
[0048] 上述这条记录对应着一个标记。作为示例，将该索引号编码成2字节无符号整数。这种编码方式可表示65536个标记。应该理解，本发明不限于这种编码方式，将标记编码成 8字节无符号整数或16字节无符号整数等任何其它码的方式也都落入本发明的范围。
[0049] S102、将编码后的标记转换成音频文件；
[0050] 作为示例，可以采用如下方式将编码后的标记转换成音频文件：
[0051] (1)将编码后的标记，即2字节无符号整数（或8字节无符号整数或16字节无符号整数），按照从最低有效位（LSB)到最高有效位（MSB)的顺序转换成比特流；
[0052] (2)采用7阶m

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢晓辉;蔡振华;傅静静;
技术所有人：北京司响无限文化传媒有限公司;
我是此专利的发明人

上一篇：一种播放场景启动方法及装置的制造方法
上一篇：一种播放音频信号的方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。