视频标记方法和装置的制造方法_2

文档序号：9434131阅读：来源：国知局

序列作为扩频序列，对比特流进行直接序列扩频基带调制，码片速率为IK码片/秒；
[0053] (3)对所获得的直接序列扩频基带调制信号进行带宽（_6dB)为I. 5kHz的有限脉冲响应（FIR)低通滤波，并利用I/Q正交调制将其调制到中心频率是期望频率（例如， 19kHz)的音频信号；
[0054] (4)对所获得的音频信号进行采样和量化以获得数字信号，采样率为48kHz的采样率，量化率为16bit ;
[0055] (5)将如此获得的数字信号写成音频文件。例如，WAV格式的音频文件。
[0056] 这样，就实现了将标记转换成音频文件，并且该音频文件的频率，19kHz，处于不影响用户的视听体验的高频段（17-20kHz)。
[0057] S103、根据位置将所获得的音频文件插入到原视频文件中。
[0058] 按照位置/时间信息的指示，将在步骤S102中所获得的音频文件与原视频文件进行混音操作。这种混音操作可以通过任意一款视频编辑软件来实现，例如，可商购的Adobe Premiere. Pro CS4视频编辑软件。
[0059] 需要注意的是，在进行混音操作时，可能还需要对音频文件进行幅度调整，以便后续解码时能够加以分辨。
[0060] 此外，在步骤S102中，在将数字信号写成音频文件时，还可以将数字信号写成与视频文件相同时长的音频文件，即制作成时长为10分钟的音频文件，其中，仅在第：V 20" 处存在描述信息。这样做的好处是，在与原视频混音时，可以直接合成，而不用考虑位置信息。其中，所获得的音频文件是插入到高频段，例如，17_20kHz的频段。此外，还可以将音频文件插入到不影响用户的视听体验的频段。
[0061] 根据上述方案，基于声音编码的方式来标记视频，使得标记后的视频仍然保持一个文件的状态，完整性得以体现，视频文件的剪辑、截取、部分删除等都不影响对视频文件的标记，不会有标记丢失造成的各种问题；可标记的视频内容也得到大幅提升，不仅可以标记字幕、人物、物品、事件，还可以标记画外音、视频中不可见的物品或说明，因此，对视频进行整理、归纳和/或检索都更加容易和方便。进一步地，按上述方式标记的描述信息，可以容易地通过声音解码解译出来。
[0062] 图2示出了对视频进行标记的装置的示意图。如图2所示,视频标记装置1包括：数据库10、编码模块11、转换模块12和混音模块13。
[0063] 数据库10用于存储对视频进行描述的描述信息及其位置，按照数据库10的存储格式，描述信息及其位置/时间信息作为一条记录，会被分配一索引号，通过该索引号，可以在数据库中查找到相应的记录。将要对视频所做的标记对应于描述信息及其位置/时间信息。这样，索引号与标记也是一一对应的。从某种意义上而言，标记就可以看作是相应描述信息及其位置/时间信息在数据库10中的索引。
[0064] 编码模块11用于对标记进行编码。例如，对数据库10中与描述信息及其位置/ 时间信息相对应的索引号进行编码，将其编码成2字节无符号整数，或8字节无符号整数或 16字节无符号整数。
[0065] 转换模块12用于将编码后的标记转换成音频文件，具体地，在本实施例中，转换模块12首先将2字节无符号整数或8字节无符号整数或16字节无符号整数按照从最低有效位（LSB)到最高有效位（MSB)的顺序转换成比特流；然后，采用7阶m序列作为扩频序列，对比特流进行直接序列扩频基带调制，码片速率为IK码片/秒；接着，对所获得的直接序列扩频基带调制信号进行带宽（_6dB)为I. 5kHz的有限脉冲响应（FIR)低通滤波，并利用1/ Q正交调制将其调制到中心频率是期望频率（例如，19kHz)的音频信号；接下来，对所获得的音频信号进行采样和量化以获得数字信号，采样率为48kHz的采样率，量化率为16bit ; 最后，将数字信号写成音频文件，例如，写成WAV格式的音频文件。
[0066] 混音模块13用于将所获得的音频文件与原视频文件进行混音。混音模块13还可以将音频文件按一定幅度的比例进行调整后与原视频文件进行混音。混音模块13可以使用任意一款视频编辑软件来实现，例如，可商购的Adobe Premiere. Pro CS4视频编辑软件。 [0067] 转换模块12在将标记转换成音频文件时，可以将音频文件制作成与原视频文件时长相同的文件，这样，在混音时，只要对准原视频文件和音频文件的开始时间，就能实现在适当位置给视频加标记；转换模块12也可以仅仅将标记转换成相关描述信息指示的具体内容所处时长的文件，例如，在本实施例中，转换成的音频文件可以是4分钟长的文件，这样，在混音时，混音模块13需要在第3' 20"处插入该音频文件，即，需要监控插入时间。 [0068] 按照上述实施例并入了声音标记的视频文件，可以正常播放。而且，所标记的声音频段是人的耳朵对其不敏感的频段，不会对整个视频的播放造成影响。此外，经过编码的信息，可以容易地通过声音解码而解析出来。
[0069] 以上所述的【具体实施方式】是用于帮助理解本发明的目的、技术方案和有益效果，应理解的是，以上所述仅为本发明的【具体实施方式】而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1. 一种视频标记方法，其特征在于，该方法包括如下步骤：对标记进行编码，其中，所述标记与对视频进行描述的描述信息和位置相对应；将编码后的标记转换成音频文件；以及根据所述位置，将所述音频文件插入所述视频中。2. 如权利要求1所述的方法，其特征在于，对标记进行编码包括：将所述标记表示成2字节无符号整数、或8字节无符号整数、或16字节无符号整数。3. 如权利要求1所述的方法，其特征在于，所述将编码后的标记转换成音频文件的步骤包括：将编码后的标记转换成比特流；利用扩频序列，将所述比特流进行直接序列扩频基带调制；对所获得的直接序列扩频基带调制信号进行低通滤波和正交调制，以获得中心频率是期望频率的音频信号；对所述音频信号进行采样和量化，以获得数字信号；以及将所述数字信号写成音频文件。4. 如权利要求1所述的方法，其特征在于，将所述音频文件插入到不影响视听体验的频段。5. 如权利要求4所述的方法，其特征在于，所述频段是17-20kHz之间的频段。6. -种视频标记装置，其特征在于，所述装置包括：数据库，用于存储对视频进行描述的描述信息及其位置，并指示标记与所述描述信息及其位置之间的对应关系；编码模块，用于对所述标记进行编码；转换模块，用于将经编码的标记转换成音频文件；和混音模块，用于根据所述位置，将所述音频文件与所述视频文件进行混音。7. 如权利要求6所述的装置，其特征在于，所述编码模块将所述标记表示成2字节无符号整数、或8字节无符号整数、或16字节无符号整数。8. 如权利要求6所述的装置，其特征在于，所述转换模块包括：比特流形成模块，用于将编码后的标记转换成比特流；扩频模块，用于利用扩频序列，将所述比特流进行直接序列扩频基带调制；调制模块，用于对所获得的直接序列扩频基带调制信号进行低通滤波和正交调制，以获得中心频率是期望频率的音频信号；采样模块，用于对所述音频信号进行采样和量化，以获得数字信号；以及格式化模块，用于将所述数字信号写成音频文件。9. 如权利要求6所述的装置，其特征在于，所述混音模块将所述音频文件混音至不影响视听体验的频段。10. 如权利要求9所述的装置，其特征在于，所述频段是17-20kHz之间的频段。
【专利摘要】本发明涉及视频标记方法和装置，其方法包括：对标记进行编码，其中，所述标记与对视频进行描述的描述信息和位置相对应；将编码后的标记转换成音频文件；以及根据所述位置，将所述音频文件插入所述视频中。本发明提供的基于声音编码来标记视频的技术，可以有效地对视频进行标记，经标记的视频只有一个文件，不会有描述信息文件丢失造成视频无标记、无法整理、检索和/或获取的问题，并且标记后的视频连续性强，重新剪辑、编辑或删除部分视频内容都不会影响对视频文件的标记。
【IPC分类】G11B27/031, G11B27/10
【公开号】CN105185397
【申请号】CN201410268811
【发明人】谢晓辉, 蔡振华, 傅静静
【申请人】北京司响无限文化传媒有限公司
【公开日】2015年12月23日
【申请日】2014年6月17日

完整全部详细技术资料下载

当前第2页1 2