一种视频文件的处理方法以及服务器与流程

文档序号：19221686发布日期：2019-11-26 02:11阅读：216来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本申请涉及视频领域，尤其涉及一种视频文件的处理方法以及服务器。

背景技术：

随着网络服务关于提速降费政策的落实，视频服务可更好地推向广大的用户，也因此，越高质量的视频内容，可带来越高的用户流量，进而可为视频制作方以及视频平台带来更高的流量收益。

用户在用户设备(userequipment，ue)上通过视频应用程序(application，app)观看视频时，若对视频的背景内容感兴趣，则在浏览器app上通过搜索引擎搜索相关的背景内容，以满足自身的信息获取需求。

然而在上述的实际场景中，由于搜索引擎的工作机制，导致搜索出来的信息较为繁杂，且经常夹杂着大量广告，在得到真正有用的背景内容前，用户往往需要耗费大量的人力成本以及时间成本。

技术实现要素：

本申请提供了一种视频文件的处理方法以及服务器，用于用户可便捷地获悉与视频内容相关的背景内容。

第一方面，本申请提供一种视频文件的处理方法，方法包括：

服务器获取原始视频文件，原始视频文件用于向ue提供视频播放业务；

服务器对原始视频文件进行分解处理，得到视频轨道对应的多个视频片段文件以及音频轨道对应的多个音频片段文件；

服务器通过图像识别处理，提取视频片段文件的内容项的特征信息，特征信息包括人物特征、动植物特征以及非生命物体特征；

服务器获取特征信息对应的第一介绍信息，第一介绍信息包括用于向用户介绍特征信息的内容项；

服务器将第一介绍信息封装至第一字幕文件，第一字幕文件用于在特征信息出现于原始视频文件的时间进行加载。

结合本申请第一方面，在本申请第一方面第一种可能的实现方式中，方法还包括：

服务器通过语音识别处理，提取音频片段文件的内容项的关键词；

服务器获取关键词对应的第二介绍信息，第二介绍信息包括用于向用户介绍关键词的内容项；

服务器将第二介绍信息封装至第二字幕文件，第二字幕文件用于在关键词出现于原始视频文件的时间进行加载。

结合本申请第一方面第一种可能的实现方式，在本申请第一方面第二种可能的实现方式中，服务器获取特征信息对应的第一介绍信息包括：

服务器识别特征信息对应的特征标识(identification，id)；

服务器从本地预设的百科词条列表中定位特征id对应的第一百科词条，百科词条列表包括不同百科词条与不同特征id的对应关系；

服务器从本地预设的百科信息库中获取第一百科词条中的第一文本内容，并确定为第一介绍信息；或者，

服务器获取关键词对应的第二介绍信息包括：

服务器从百科词条列表中定位关键词对应的第二百科词条；

服务器从百科信息库中提取第二百科词条中的第二文本内容，并确定为第二介绍信息。

结合本申请第一方面第一种可能的实现方式，在本申请第一方面第三种可能的实现方式中，服务器获取特征信息对应的第一介绍信息包括：

服务器通过网络爬虫，从第三方的公开数据库中获取第一介绍信息；或者，

服务器通过第三方应用程序接口(applicationprograminterface，api)，从第三方的百科信息库获取第一介绍信息；或者，

服务器获取关键词对应的第二介绍信息包括：

服务器通过网络爬虫，从第三方的公开数据库中获取第二介绍信息；或者，

服务器通过第三方api，从第三方的百科信息库获取第二介绍信息。

结合本申请第一方面第一种可能的实现方式，在本申请第一方面第四种可能的实现方式中，服务器将第一介绍信息封装至第一字幕文件包括：

服务器识别特征信息出现于原始视频文件的n个第一时间段，n大于2；

当n为偶数时，服务器将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2)个第一时间段以及第n个第一时间段对应的第一字幕文件；

当n为奇数时，服务器将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2向上取整)个第一时间段以及第n个第一时间段对应的第一字幕文件；或者，

服务器将第二介绍信息封装至第二字幕文件包括：

服务器识别关键词出现于原始视频文件的m个第二时间段，m大于2；

当m为偶数时，服务器将第二介绍信息封装至原始视频文件在第1个第二时间段、第(m/2)个第二时间段以及第m个第二时间段对应的第二字幕文件；

当m为奇数时，服务器将第二介绍信息封装至原始视频文件在第1个第二时间段、第(m/2向上取整)个第二时间段以及第m个第二时间段对应的第二字幕文件。

结合本申请第一方面第一种可能的实现方式，在本申请第一方面第五种可能的实现方式中，方法还包括：

服务器设置配置策略；

当服务器接收到ue基于目标视频文件发起的视频播放请求时，服务器向ue下发原始视频文件、配置策略以及第一字幕文件；或者，

当服务器接收到ue基于目标视频文件发起的视频播放请求时，服务器向ue下发原始视频文件、配置策略、第一字幕文件以及第二字幕文件；

其中，配置策略包括：

当字幕文件的文本内容在100字符以内时，以透明悬浮窗方式悬浮显示字幕文件的配置策略；

当字幕文件的文本内容在100字符以上、300字符以内时，以滚动显示方式显示字幕文件的配置策略；以及，

当字幕文件的文本内容在300字符以上时，以字幕控件在用户选择操作下选择是否显示字幕文件的配置策略。

结合本申请第一方面第一种可能的实现方式，在本申请第一方面第六种可能的实现方式中，配置策略还包括：

以字幕控件在用户选择操作下删除目标字幕文件的配置策略；

方法还包括：

服务器统计多个ue在本地删除目标字幕文件的次数；

当在预设统计时间内次数大于预设次数时，服务器从本地存储的第一字幕文件和/或第二字幕文件中，删除目标字幕文件。

结合本申请第一方面第一种可能的实现方式，在本申请第一方面第七种可能的实现方式中，方法还包括：

服务器将第一字幕文件和/或第二字幕文件内嵌至原始视频文件中，得到目标视频文件，目标视频文件用于向ue提供视频播放业务。

结合本申请第一方面，在本申请第一方面第八种可能的实现方式中，服务器获取原始视频文件包括：

当服务器检测到原始视频文件上传至本地的视频数据库时，服务器获取原始视频文件；或者，

当服务器接收到ue基于原始视频文件发起的视频播放请求时，服务器根据视频播放请求携带的视频文件id从视频数据库获取原始视频文件。

本申请在第二方面，提供一种服务器，服务器包括：

获取单元，用于获取原始视频文件，原始视频文件用于向ue提供视频播放业务；

分解单元，用于对原始视频文件进行分解处理，得到视频轨道对应的多个视频片段文件以及音频轨道对应的多个音频片段文件；

提取单元，用于通过图像识别处理，提取视频片段文件的内容项的特征信息，特征信息包括人物特征、动植物特征以及非生命物体特征；

获取单元，还用于获取特征信息对应的第一介绍信息，第一介绍信息包括用于向用户介绍特征信息的内容项；

封装单元，用于将第一介绍信息封装至第一字幕文件，第一字幕文件用于在特征信息出现于原始视频文件的时间进行加载。

结合本申请第二方面，在本申请第二方面第一种可能的实现方式中，提取单元，还用于通过语音识别处理，提取音频片段文件的内容项的关键词；

获取单元，还用于获取关键词对应的第二介绍信息，第二介绍信息包括用于向用户介绍关键词的内容项；

封装单元，还用于将第二介绍信息封装至第二字幕文件，第二字幕文件用于在关键词出现于原始视频文件的时间进行加载。

结合本申请第二方面二种可能的实现方式，在本申请第二方面第二种可能的实现方式中，获取单元，具体用于：

识别特征信息对应的特征id；

从本地预设的百科词条列表中定位特征id对应的第一百科词条，百科词条列表包括不同百科词条与不同特征id的对应关系；

从本地预设的百科信息库中获取第一百科词条中的第一文本内容，并确定为第一介绍信息；或者，

获取关键词对应的第二介绍信息包括：

从百科词条列表中定位关键词对应的第二百科词条；

从百科信息库中提取第二百科词条中的第二文本内容，并确定为第二介绍信息。

结合本申请第二方面第二种可能的实现方式，在本申请第二方面第三种可能的实现方式中，获取单元，具体用于：

服务器通过网络爬虫，从第三方的公开数据库中获取第一介绍信息；或者，

服务器通过第三方api，从第三方的百科信息库获取第一介绍信息；或者，

获取单元，具体用于：

服务器通过网络爬虫，从第三方的公开数据库中获取第二介绍信息；或者，

服务器通过第三方api，从第三方的百科信息库获取第二介绍信息。

结合本申请第二方面第二种可能的实现方式，在本申请第二方面第四种可能的实现方式中，封装单元，具体用于：

识别特征信息出现于原始视频文件的n个第一时间段，n大于2；

当n为偶数时，将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2)个第一时间段以及第n个第一时间段对应的第一字幕文件；

当n为奇数时，将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2向上取整)个第一时间段以及第n个第一时间段对应的第一字幕文件；或者，

封装单元，具体用于：

识别关键词出现于原始视频文件的m个第二时间段，m大于2；

当m为偶数时，将第二介绍信息封装至原始视频文件在第1个第二时间段、第(m/2)个第二时间段以及第m个第二时间段对应的第二字幕文件；

当m为奇数时，将第二介绍信息封装至原始视频文件在第1个第二时间段、第(m/2向上取整)个第二时间段以及第m个第二时间段对应的第二字幕文件。

结合本申请第二方面第二种可能的实现方式，在本申请第二方面第五种可能的实现方式中，服务器还包括：

设置单元，用于设置配置策略；

下发单元，用于当服务器接收到ue基于目标视频文件发起的视频播放请求时，向ue下发原始视频文件、配置策略以及第一字幕文件；或者，

当服务器接收到ue基于目标视频文件发起的视频播放请求时，向ue下发原始视频文件、配置策略、第一字幕文件以及第二字幕文件；

其中，配置策略包括：

当字幕文件的文本内容在100字符以内时，以透明悬浮窗方式悬浮显示字幕文件的配置策略；

当字幕文件的文本内容在100字符以上、300字符以内时，以滚动显示方式显示字幕文件的配置策略；以及，

当字幕文件的文本内容在300字符以上时，以字幕控件在用户选择操作下选择是否显示字幕文件的配置策略。

结合本申请第二方面第二种可能的实现方式，在本申请第二方面第六种可能的实现方式中，配置策略还包括：

以字幕控件在用户选择操作下删除目标字幕文件的配置策略；

服务器还包括：

统计单元，用于统计多个ue在本地删除目标字幕文件的次数；

删除单元，用于当在预设统计时间内次数大于预设次数时，从本地存储的第一字幕文件和/或第二字幕文件中，删除目标字幕文件。

结合本申请第二方面第二种可能的实现方式，在本申请第二方面第七种可能的实现方式中，服务器还包括：

内嵌单元，用于将第一字幕文件和/或第二字幕文件内嵌至原始视频文件中，得到目标视频文件，目标视频文件用于向ue提供视频播放业务。

结合本申请第二方面，在本申请第二方面第八种可能的实现方式中，获取单元，具体用于：

当服务器检测到原始视频文件上传至本地的视频数据库时，获取原始视频文件；或者，

当服务器接收到ue基于原始视频文件发起的视频播放请求时，根据视频播放请求携带的视频文件id从视频数据库获取原始视频文件。

第三方面，本申请提供一种服务器，包括处理器，处理器用于执行存储器中存储的计算机程序时实现如上述第一方面的视频文件的处理方法的任一步骤。

第四方面，本申请提供一种可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现如上述第一方面的视频文件的处理方法的任一步骤。

从以上技术方案可以看出，本申请具有以下优点：

在视频平台侧，服务器获取原始视频文件，并从该原始视频文件进行音视频分解得到的视频片段文件提取内容项的特征信息，在该特征信息的基础上，再获取对应的介绍信息并封装至字幕文件，从而，当播放原始视频文件时，在该特征信息出现的时间加载该字幕文件，即可直观地向用户呈现该字幕文件中与特征信息对应的介绍信息，用户无需进行人工检索，即可根据该介绍信息，轻松地获悉该特征信息对应的背景内容，通过该设置，视频平台即可向用户提供更为优质视频内容、丰富视频内容的视频播放服务。

附图说明

图1示出了本申请提供的视频文件的处理方法的一种流程示意图；

图2示出了本申请提供的视频文件的处理方法的又一种流程示意图；

图3示出了本申请提供的通过百科词条获取特征信息的一种流程示意图；

图4示出了本申请提供的将介绍信息封装至字幕文件的一种流程示意图；

图5示出了本申请提供的服务器的一种结构示意图；

图6示出了本申请提供的服务器的又一种结构示意图。

具体实施方式

本申请提供了一种视频文件的处理方法以及服务器，用于用户可便捷地获悉与视频内容相关的背景内容。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号，并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤，已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序，只要能达到相同或者相类似的技术效果即可。

本申请中所出现的模块的划分，是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个系统中，或一些特征可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。

首先，在介绍本申请之前，首先介绍本申请涉及的视频平台、服务器以及ue。

视频平台用于通过网络在线平台的方式，向用户提供视频播放服务，用户可通过ue访问视频平台，观看视频节目。

服务器为承载上述视频平台的硬件设备，服务器具体为一台或者多台，并可在部分的服务器上应用本申请涉及的视频文件的处理方法，以实现向用户提供更为优质视频内容、丰富视频内容的视频播放服务。

ue，具体可以为智能手机、平板电脑、笔记本电脑、台式电脑、电脑一体机、个人数字助理(personaldigitalassistant，pda)等可访问视频平台并播放视频节目的终端设备，进一步的，具体还可以为可访问视频平台的电视机以及机顶盒，具体在此不做限定。

下面，则基于上述场景的说明，开始对本申请提供的视频文件的处理方法进行详细介绍。

参阅图1，图1示出了本申请提供视频文件的处理方法的一种流程示意图，具体的，本申请提供的视频文件的处理方法可包括如下步骤：

步骤s101，服务器获取原始视频文件；

其中，原始视频文件用于向ue提供视频播放业务。

可以理解，视频平台设有视频数据库，应用本申请提供的视频文件的处理方法的服务器，即可从本地或者其他部署视频数据库的服务器，获取原始视频文件。

原始视频文件，可以理解为未经本申请提供的视频文件的处理方法处理过的视频文件，也可以直接理解为本申请提供的视频文件的处理方法的待处理视频文件。

步骤s102，服务器对原始视频文件进行分解处理，得到视频轨道对应的多个视频片段文件以及音频轨道对应的多个音频片段文件；

服务器在确定待处理的原始视频文件后，将之进行音视频分解处理，按视频轨道以及音频轨道在时间轴上的划分，得到对应的多个视频片段文件以及多个的音频片段文件。

步骤s103，服务器通过图像识别处理，提取视频片段文件的内容项的特征信息；

其中，特征信息包括人物特征、动植物特征以及非生命物体特征；

每个视频片段文件中，具有对应的视频画面，因此，服务器可通过图像识别处理，从视频画面中提取内容项的特征信息。

例如，可从视频画面中提取出x配角的人脸特征、背景植物y的叶片特征、动物z的脚趾特征，或者还可提取出雕像、画作以及服饰在轮廓、色彩或者三维结构上的特征。

步骤s104，服务器获取特征信息对应的第一介绍信息；

其中，第一介绍信息包括用于向用户介绍特征信息的内容项；

在识别出上述的特征信息后，服务器即可进行进一步的检索处理，获取该特征信息对应的介绍信息。

例如，与上述对应的，通过x配角的人脸特征确定x配角的基本信息、人物经历或者参演作品等信息、通过背景植物y的叶片特征确定植物y的学名、生长环境或者获取渠道等信息、通过动物z的脚趾特征确定动物z的学名、生长环境或者参观地点等信息；或者，通过雕像、画作以及服饰在轮廓、色彩或者三维结构的特征信息确定雕像、画作以及服饰的作品名称、创作者、获取渠道等信息。

步骤s105，服务器将第一介绍信息封装至第一字幕文件；

其中，第一字幕文件用于在特征信息出现于原始视频文件的时间进行加载。

服务器在得到特征信息对应的介绍信息后，即可将之封装至字幕文件，以便当ue播放原始视频文件时，在特征信息出现于原始视频文件的时间进行加载，向用户呈现，用户即可了解特征信息对应的背景内容。

从上述可看出，在视频平台侧，服务器获取原始视频文件，并从该原始视频文件进行音视频分解得到的视频片段文件提取内容项的特征信息，在该特征信息的基础上，再获取对应的介绍信息并封装至字幕文件，从而，当播放原始视频文件时，在该特征信息出现的时间加载该字幕文件，即可直观地向用户呈现该字幕文件中与特征信息对应的介绍信息，用户无需进行人工检索，即可根据该介绍信息，轻松地获悉该特征信息对应的背景内容，通过该设置，视频平台即可向用户提供更为优质视频内容、丰富视频内容的视频播放服务。

继续参阅图2，图2示出了本申请提供的视频文件的处理方法的又一种流程示意图，具体的，本申请提供的视频文件的处理方法可包括如下步骤：

步骤s201，服务器获取原始视频文件；

其中，原始视频文件用于向ue提供视频播放业务。

步骤s202，服务器对原始视频文件进行分解处理，得到视频轨道对应的多个视频片段文件以及音频轨道对应的多个音频片段文件；

可以理解，步骤201以及步骤202，与上述图1对应实施例中步骤s101以及步骤s102的重复内容，具体在此不再赘述。

步骤203，服务器通过语音识别处理，提取音频片段文件的内容项的关键词；

应当理解，本申请提供的视频文件的处理方法，在从视频片段文件提取出特征信息的基础上，还可从音频片段文件提取出关键词。

该关键词可预设为人物名称、动植物名称以及非生命物体名称，甚至还可预设为形容词、短语以及语句等词汇。

步骤204，服务器获取关键词对应的第二介绍信息；

其中，第二介绍信息包括用于向用户介绍关键词的内容项。

与上述图1对应实施例中步骤s104类似的，在识别出上述的关键词后，服务器即可进行进一步的检索处理，获取该关键词对应的介绍信息。

步骤205，服务器将第二介绍信息封装至第二字幕文件。

其中，第二字幕文件用于在关键词出现于原始视频文件的时间进行加载。

服务器在得到关键词对应的介绍信息后，即可将之封装至字幕文件，以便当ue播放原始视频文件时，在关键词出现于原始视频文件的时间进行加载，向用户呈现，用户即可了解特征信息对应的背景内容。

应当理解，为便于说明，上述图2对应实施例的说明中，省略了有关从视频片段文件提取出特征信息、获取特征信息对应的第一介绍信息以及将第一介绍信息封装至第一字幕文件的说明。

基于上述视频片段文件对应的特征信息以及音频片段文件的关键词，基于对本申请提供的视频文件的处理方法进行说明。

在一些实施例中，可通过百科词条获取特征信息以及关键词对应的介绍信息。

参阅图3，图3示出了本申请提供的通过百科词条获取特征信息的一种流程示意图，具体的，可包括如下步骤：

步骤s301，服务器识别特征信息对应的特征id；

可以理解，不同的特征信息，服务器可预设有不同的特征id，从而服务器在通过图像识别处理识别出视频片段文件的特征信息时，可识别出对应的特征id，通过该特征id再进行介绍信息的获取，大大压缩服务器获取介绍信息所需的信息处理量，减轻服务器的负载压力。

步骤s302，服务器从本地预设的百科词条列表中定位特征id对应的第一百科词条；

其中，百科词条列表包括不同百科词条与不同特征id的对应关系。

在识别出特征信息对应的特征id后，服务器即可从本地的百科词条列表中定位对应的百科词条。

步骤s303，所述服务器从本地预设的百科信息库中获取第一百科词条中的第一文本内容，并确定为第一介绍信息。

应该理解，该百科信息库，包括服务器预设的用于向用户介绍特征信息的背景内容(百科词条的文本内容)的信息集合，并以百科词条列表作为索引目录，在实际应用中，便于视频平台管控本地百科词条的内容质量，例如相关工作人员可方便地对词条内容进行备份、还原、删减、增添、更新或者维护等操作。

与上述特征信息类似的，在识别出音频片段文件的关键词后，服务器可直接从上述的百科词条列表中定位关键词对应的第二百科词条，再从上述的百科信息库中提取第二百科词条中的第二文本内容，并确定为第二介绍信息。

在一些实施例中，可通过视频平台外界获取特征信息以及关键词对应的介绍信息。

例如，服务器可通过网络爬虫，从第三方的公开数据库中获取特征信息以及关键词对应的介绍信息。

服务器可通过网络爬虫，从第三方的公开数据库中搜索特征信息以及关键词，并定位到第三方的公开数据库中特征信息以及关键词相关的文本信息，提取作为介绍信息。

或者，服务器也可通过第三方api，从第三方的百科信息库获取特征信息以及关键词对应的介绍信息。

服务器与第三方的百科信息库之间，可事先协商，并预设两者之间的第三方api及其权限，以便服务器从第三方的百科信息库中获取特征信息以及关键词对应的介绍信息。

与上述图3对应实施例类似的，可通过服务器本地预设的百科词条列表，从第三方的百科信息库中获取特征信息以及关键词对应的介绍信息，具体在此不再赘述。

在一些实施例中，将介绍信息封装至字幕文件的处理，参阅图4，图4示出了本申请提供的将介绍信息封装至字幕文件的一种流程示意图，具体的，可包括如下步骤：

步骤s401，服务器识别特征信息出现于原始视频文件的n个第一时间段；

其中，n大于2，当n为偶数时，则触发步骤s402，当n为奇数时，则触发步骤s403。

可以理解，特征信息在原始视频文件中出现的时间，或者说特征信息在视频片段文件中出现的时间，可划分为不同的时间段。

相应封装有介绍信息的字幕文件，可根据特征信息出现的不同时间段，进行设置。

步骤s402，服务器将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2)个第一时间段以及第n个第一时间段对应的第一字幕文件；

步骤s403，服务器将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2向上取整)个第一时间段以及第n个第一时间段对应的第一字幕文件。

当特征信息出现3个以上时间段时，对于封装有特征信息a的介绍信息c，字幕文件c可选择其中3个时间段进行播放，以便在不同场景、不同视角或者不同时间点等不同条件下对特征信息a进行播放，使得用户可更为详细地获悉特征信息a的背景内容。

在实际应用中，对于特征信息a出现的时间段计数n，可如上述步骤s402以及步骤s403，根据其奇数以及偶数的不同情况，选择3个时间段，进行字幕文件的封装。

与上述图4对应实施例类似的，根据关键词出现于原始视频文件的m个第二时间段，选择其中3个时间段进行对应字幕文件的封装，具体在此不再赘述。

字幕可分为嵌入式字幕以及外挂式字幕。

一方面，在一些实施例中，嵌入式字幕可直接封装在原始视频文件中，具体的，如：

服务器将第一字幕文件和/或第二字幕文件内嵌至原始视频文件中，得到目标视频文件，目标视频文件用于向ue提供视频播放业务。

在ue向服务器发起原始视频文件或者目标视频文件对应的视频播放请求时，服务器即可向ue下发目标视频文件，ue在播放目标视频文件的过程中，还可加载第一字幕文件和/或第二字幕文件，用户即可获悉特征信息和/或关键词对应的背景内容。

另一方面，外挂式字幕的字幕文件可采用srt、ass、smi、ssa或者sub等文件格式，ue在加载原始视频文件时可同步加载字幕文件，向用户输出获悉特征信息和/或关键词对应的背景内容。

在一些实施例中，对于外挂式字幕的字幕文件，服务器还可设置配置策略，该配置策略用于配置ue对于外挂式字幕的字幕文件的输出方式。

由此，当服务器接收到ue基于目标视频文件发起的视频播放请求时，服务器向ue下发原始视频文件、配置策略以及第一字幕文件；或者，

当服务器接收到ue基于目标视频文件发起的视频播放请求时，服务器向ue下发原始视频文件、配置策略、第一字幕文件以及第二字幕文件；

其中，配置策略可包括如下策略：

当字幕文件的文本内容在100字符以内时，以透明悬浮窗方式悬浮显示字幕文件的配置策略；

当字幕文件的文本内容在100字符以上、300字符以内时，以滚动显示方式显示字幕文件的配置策略；以及，

当字幕文件的文本内容在300字符以上时，以字幕控件在用户选择操作下选择是否显示字幕文件的配置策略。

在一些实施例中，为便于优化字幕文件的内容质量，配置策略还可包括：

以字幕控件在用户选择操作下删除目标字幕文件的配置策略。

因此，本申请提供的视频文件的处理方法还可包括：

服务器统计多个ue在本地删除目标字幕文件的次数；

当在预设统计时间内所述次数大于预设次数时，所述服务器从本地存储的第一字幕文件和/或第二字幕文件中，删除目标字幕文件。

可以理解，通过追踪多个ue删除同一字幕文件的方式，从而可有效筛选出内容质量欠佳的特定字幕文件，并在服务器侧加以删除，从整体层面上提高服务器下发的字幕文件的内容质量。

在一些实施例中，可以将原始视频文件的上传或者对应的播放请求作为服务器获取原始视频文件的触发条件。

可以理解，服务器在应用本申请提供的视频文件的处理方法时，可对服务器本地或者视频平台本地的视频数据库进行监控，若监测到有新的视频文件上传至视频数据库中，则可将之识别为原始视频文件，触发本申请提供的视频文件的处理方法。

由此，当服务器检测到原始视频文件上传至本地的视频数据库时，服务器获取原始视频文件。

或者，服务器在应用本申请提供的视频文件的处理方法时，也可等待ue发起视频播放请求时，再针对该请求对应的视频文件，确定请求中携带的视频文件id对应的视频文件为原始视频文件，并应用本申请提供的视频文件的处理方法，以便减少应用本申请提供的视频文件的处理方法的视频文件处理量。

应当理解，视频平台上，往往存在点击量、播放量很少的视频文件，若事先将视频平台上的所有视频文件应用本申请提供的视频文件的处理方法，显然，需要在短时间内投入大量不必要的资源成本，例如时间成本、计算资源等，若在接收到ue上报的视频播放请求后再对视频文件应用本申请提供的视频文件的处理方法，则可在减少服务器的视频文件处理量的基础上，明显降低服务器的负载压力。

由此，当服务器接收到ue基于原始视频文件发起的视频播放请求时，服务器根据视频播放请求携带的视频文件id从视频数据库获取原始视频文件。

以上是对本申请提供的视频文件的处理方法的介绍，下面开始介绍本申请提供的服务器。

参阅图5，图5示出了本申请提供的服务器的一种结构示意图，具体的，服务器可包括如下结构：

获取单元501，用于获取原始视频文件，原始视频文件用于向ue提供视频播放业务；

分解单元502，用于对原始视频文件进行分解处理，得到视频轨道对应的多个视频片段文件以及音频轨道对应的多个音频片段文件；

提取单元503，用于通过图像识别处理，提取视频片段文件的内容项的特征信息，特征信息包括人物特征、动植物特征以及非生命物体特征；

获取单元501，还用于获取特征信息对应的第一介绍信息，第一介绍信息包括用于向用户介绍特征信息的内容项；

封装单元504，用于将第一介绍信息封装至第一字幕文件，第一字幕文件用于在特征信息出现于原始视频文件的时间进行加载。

在一些实施例中，提取单元503，还用于通过语音识别处理，提取音频片段文件的内容项的关键词；

获取单元501，还用于获取关键词对应的第二介绍信息，第二介绍信息包括用于向用户介绍关键词的内容项；

封装单元504，还用于将第二介绍信息封装至第二字幕文件，第二字幕文件用于在关键词出现于原始视频文件的时间进行加载。

在一些实施例中，获取单元501，具体用于：

识别特征信息对应的特征id；

从本地预设的百科词条列表中定位特征id对应的第一百科词条，百科词条列表包括不同百科词条与不同特征id的对应关系；

从本地预设的百科信息库中获取第一百科词条中的第一文本内容，并确定为第一介绍信息；或者，

获取关键词对应的第二介绍信息包括：

从百科词条列表中定位关键词对应的第二百科词条；

从百科信息库中提取第二百科词条中的第二文本内容，并确定为第二介绍信息。

在一些实施例中，获取单元501，具体用于：

服务器通过网络爬虫，从第三方的公开数据库中获取第一介绍信息；或者，

服务器通过第三方api，从第三方的百科信息库获取第一介绍信息；或者，

获取单元501，具体用于：

服务器通过网络爬虫，从第三方的公开数据库中获取第二介绍信息；或者，

服务器通过第三方api，从第三方的百科信息库获取第二介绍信息。

在一些实施例中，封装单元504，具体用于：

识别特征信息出现于原始视频文件的n个第一时间段，n大于2；

当n为偶数时，将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2)个第一时间段以及第n个第一时间段对应的第一字幕文件；

当n为奇数时，将第一介绍信息封装至原始视频文件在第1个第一时间段、第(n/2向上取整)个第一时间段以及第n个第一时间段对应的第一字幕文件；或者，

封装单元504，具体用于：

识别关键词出现于原始视频文件的m个第二时间段，m大于2；

当m为偶数时，将第二介绍信息封装至原始视频文件在第1个第二时间段、第(m/2)个第二时间段以及第m个第二时间段对应的第二字幕文件；

当m为奇数时，将第二介绍信息封装至原始视频文件在第1个第二时间段、第(m/2向上取整)个第二时间段以及第m个第二时间段对应的第二字幕文件。

在一些实施例中，服务器还包括：

设置单元505，用于设置配置策略；

下发单元506，用于当服务器接收到ue基于目标视频文件发起的视频播放请求时，向ue下发原始视频文件、配置策略以及第一字幕文件；或者，

当服务器接收到ue基于目标视频文件发起的视频播放请求时，向ue下发原始视频文件、配置策略、第一字幕文件以及第二字幕文件；

其中，配置策略包括：

当字幕文件的文本内容在100字符以内时，以透明悬浮窗方式悬浮显示字幕文件的配置策略；

当字幕文件的文本内容在100字符以上、300字符以内时，以滚动显示方式显示字幕文件的配置策略；以及，

当字幕文件的文本内容在300字符以上时，以字幕控件在用户选择操作下选择是否显示字幕文件的配置策略。

在一些实施例中，配置策略还包括：

以字幕控件在用户选择操作下删除目标字幕文件的配置策略；

服务器还包括：

统计单元507，用于统计多个ue在本地删除目标字幕文件的次数；

删除单元508，用于当在预设统计时间内次数大于预设次数时，从本地存储的第一字幕文件和/或第二字幕文件中，删除目标字幕文件。

在一些实施例中，服务器还包括：

内嵌单元509，用于将第一字幕文件和/或第二字幕文件内嵌至原始视频文件中，得到目标视频文件，目标视频文件用于向ue提供视频播放业务。

在一些实施例中，获取单元501，具体用于：

当服务器检测到原始视频文件上传至本地的视频数据库时，获取原始视频文件；或者，

当服务器接收到ue基于原始视频文件发起的视频播放请求时，根据视频播放请求携带的视频文件id从视频数据库获取原始视频文件。

参阅图6，图6示出了本申请提供的服务器的又一种结构示意图，具体的，本申请提供的服务器包括处理器601，处理器601用于执行存储器602中存储的计算机程序时实现如图1至图4对应任意实施例中的视频文件的处理方法的各步骤；或者，处理器601用于执行存储器602中存储的计算机程序时实现如图5对应实施例中各单元的功能。

示例性的，计算机程序可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器602中，并由处理器601执行，以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序在计算机装置中的执行过程。

服务器可包括，但不仅限于处理器601、存储器602。本领域技术人员可以理解，所述示意仅仅是计算机装置的示例，并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如服务器还可以包括输入输出设备、网络接入设备、总线等，处理器601、存储器602、输入输出设备以及网络接入设备等通过总线相连。

处理器601可以是中央处理单元(centralprocessingunit，cpu)，还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现成可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，处理器是计算机装置的控制中心，利用各种接口和线路连接整个计算机装置的各个部分。

存储器602可用于存储计算机程序和/或模块，处理器601通过运行或执行存储在存储器602内的计算机程序和/或模块，以及调用存储在存储器602内的数据，实现计算机装置的各种功能。存储器602可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(smartmediacard，smc)，安全数字(securedigital，sd)卡，闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本申请还提供一种可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现如图1至图4对应任意实施例中的视频文件的处理方法。

可以理解，集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各方法实施例的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的服务器及其单元的具体工作过程，可以参考图1至图4对应实施例中视频文件的处理方法的说明，具体在此不再赘述。

综上所述，本申请提供的一种视频文件的处理方法以及服务器，在视频平台侧，服务器获取原始视频文件，并从该原始视频文件进行音视频分解得到的视频片段文件提取内容项的特征信息，在该特征信息的基础上，再获取对应的介绍信息并封装至字幕文件，从而，当播放原始视频文件时，在该特征信息出现的时间加载该字幕文件，即可直观地向用户呈现该字幕文件中与特征信息对应的介绍信息，用户无需进行人工检索，即可根据该介绍信息，轻松地获悉该特征信息对应的背景内容，通过该设置，视频平台即可向用户提供更为优质视频内容、丰富视频内容的视频播放服务。

在本申请所提供的几个实施例中，应该理解到，所揭露的服务器及其单元，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高志栋;陶晓龙;张志涛;金博;杨洋;郭军
技术所有人：中电万维信息技术有限责任公司
我是此专利的发明人

上一篇：一种教育管理平台的制作方法
上一篇：一种地埋式的LED反射信号灯的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。