一种视频中的嵌入内容的获取方法和装置与流程

文档序号：14072316阅读：294来源：国知局

本申请涉及计算机技术领域，尤其涉及一种视频中的嵌入内容的获取方法和装置。

背景技术：

随着多媒体技术的发展，观看视频已逐渐成为人们工作、学习、娱乐、生活中非常重要的一部分。针对一些视频而言，视频图像中除了包含常见的字幕之外，还可能会包含其它一些嵌入视频图像中的内容(后称嵌入内容)。所述嵌入内容，比如包括可显示于视频图像右下角的二维码或者条形码等。

这些嵌入内容通常包含较多的有用信息。以二维码为例，其承载的可能是与视频图像关联的商品信息，或者是一些推荐信息的访问地址，等等。通过对二维码进行解析，可以获取到有用信息。

按照现有技术，用户通过视频播放设备播放视频的过程中，当视频图像中出现二维码时，用户需要拿起其它设备(比如手机或者是其它的外围设备)扫描嵌入有二维码的视频图像，才能获取到二维码。这种获取视频中的嵌入内容的获取方法，因需要用户拿出其它设备、启动其它设备的图像扫描功能、对视频图像中包含二维码的区域进行扫描，存在操作繁琐的问题。

技术实现要素：

本申请实施例提供一种视频中的嵌入内容的获取方法和装置，以解决现有技术中获取视频中的嵌入内容操作繁琐的问题。

本申请实施例采用下述技术方案：

一种视频中的嵌入内容的获取方法，包括：

视频播放设备在播放视频的过程中，接收嵌入内容获取指令；

响应于所述指令，获取所述视频中的嵌入内容。

可选地，所述嵌入内容获取指令，根据用户对视频播放设备的视频播放界面执行的操作生成。

可选地，所述视频播放设备为触屏设备时，所述操作包括下述至少一种：

点击操作、滑动操作、长按操作。

可选地，获取所述视频中的嵌入内容，具体包括：

获取所述视频中的图像帧；

识别出所述图像帧中的嵌入内容。

可选地，识别出所述图像帧中的嵌入内容，具体包括：

识别出所述图像帧中的指定区域的嵌入内容。

可选地，所述嵌入内容包括字符串和/或二维码。

可选地，所述嵌入内容为字符串时，获取所述视频中的嵌入内容，具体包括：

获取所述视频中的图像帧；

对所述图像帧中的局部图像进行二值化处理，其中，所述局部图像为预设的、以显示所述字符串的区域的图像；

对二值化处理后局部图像中的字符串进行字符切分；

对切分后得到的字符进行特征提取，并将提取出的特征与字符库中的字符的特征进行比对；

根据比对结果，确定出字符串。

可选地，获取所述视频中的嵌入内容之后，所述方法还包括：

执行与所述嵌入内容对应的操作。

可选地，所述视频播放设备，包括：视频播放客户端。

一种视频中的嵌入内容的获取装置，包括：接收模块和获取模块，其中，

所述接收模块，用于视频播放设备在播放视频的过程中，接收嵌入内容获取指令；

所述获取模块，用于响应于所述指令，获取所述视频中的嵌入内容。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

视频播放设备在播放视频的过程中，当接收嵌入内容获取指令时，即可响应于所述指令，获取所述视频中的嵌入内容。整个操作过程在视频播放设备上进行，无需借用视频播放设备外的其它设备，从而也就不需要依靠用户拿出其它设备、启动其它设备的图像扫描功能、对视频图像中包含嵌入内容的区域进行扫描这一复杂的流程，因此简化了获取视频中的嵌入内容的过程。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例1提供的视频中的嵌入内容的获取方法的实现流程示意图；

图2为本申请实施例2提供的视频中的二维码的获取方法的应用场景示意图；

图3为本申请实施例3提供的视频中的字符串的获取方法的部分流程示意图；

图4为本申请实施例4提供的视频中的嵌入内容的获取装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例1

如图1所示，本申请实施例1提供一种视频中的嵌入内容的获取方法，用于简化获取视频中的嵌入内容的过程，所述方法包括以下步骤：

步骤s11：视频播放设备在播放视频的过程中，接收嵌入内容获取指令；

在这里，视频播放设备可以具体为手机、平板电脑、掌上电脑等触屏设备，实际上，只要具有视频播放功能的终端设备均可满足本申请的应用需要。比如，视频播放设备还可以是笔记本、台式机等。

嵌入内容一般是添加在视频图像中的可视化的内容，并且，可以通过图像识别的方式识别出。嵌入内容具体可以是嵌入在上述视频图像中的二维码、条形码、邮箱地址、网址、阿拉伯数字、文字等，还可以是添加在视频图像中的特定图像，如商品图像、人物图像、动物图像等。

视频播放之前，具体在上述视频中添加上述嵌入内容时，可以首先对视频文件进行解析，以获取视频文件包含的全部图像帧，然后按照视频播放时间和各图像帧的对应关系，在预定播放时间对应的若干图像帧中添加上述嵌入内容，最后再将上述添加嵌入内容的图像帧、以及其余的未添加嵌入内容的图像帧按照预设算法处理后生成视频文件。

视频播放设备播放的视频，可以是在视频播放设备的浏览器中播放的在线网页视频；还可以是在视频播放设备的视频播放软件中播放的在线视频、预先存储在本地的本地视频；还可以是在视频播放设备的其它应用程序上播放的在线视频等。

该实施例中，嵌入内容获取指令可以是由用户触发生成。例如，当视频播放设备为触屏设备时，所述嵌入内容获取指令，根据用户对视频播放设备的视频播放界面执行的操作生成。具体地，用户对视频播放页面执行的操作可以包括下述至少一种：点击操作、滑动操作、长按操作。

上述点击动作，如单击、双击、以及预设次数的多次点击等。

上述滑动操作，如直线滑动、曲线滑动、按照预设图形的形状以及方向执行的滑动操作等；还例如，单指与屏幕接触的滑动、双指与屏幕接触的滑动、多指与屏幕接触的滑动等。

上述长按操作，如长按视频播放界面、长按设置在视频界面上的某一区域(如按钮控件所在的区域)等。

另外，该实施例中，还可以在视频播放设备上预设物理按键，当用户按下一个特定的物理按键、或者几个物理按键的组合时生成嵌入内容获取指令。

步骤s12：响应于所述指令，获取所述视频中的嵌入内容。

该步骤中，获取所述视频中的嵌入内容时，可以首先获取所述视频中的图像帧；然后根据嵌入内容的特征对所述图像帧进行图像识别，以获取到所述嵌入内容。当然还可以通过截图等方式获取图像帧中的指定区域的图像，进而再识别得到指定区域的图像中的嵌入内容，其中，上述指定区域的图像为预设的、以显示所述嵌入内容的区域的图像。

指定区域的图像与整个图像帧相比，其尺寸相对较小，因此在指定区域的图像中进行嵌入内容识别等后续操作，相对于在整个图像帧中进行嵌入内容识别等操作，将会大大地缩短处理时间。因此，为了更快速地获取到嵌入内容，可以首先得到指定区域的图像，然后仅仅对指定区域的图像进行图像识别的操作。

该步骤中，当嵌入内容为二维码时，具体获取视频中的二维码时，可以首先获取视频中的一帧或者是若干帧图像，若假设在获取到的图像帧中包含有二维码，则可以通过二维码识别技术识别出图像帧中包含的二维码。具体在图像中识别二维码，在现有技术中的应用已经比较成熟，本实施例中并不再详细介绍。

二维码承载的可能是文本信息又或者是访问地址等，在获取到视频中的二维码之后，可以存储二维码所包含的文本信息，或者是跳转至二维码包含的访问地址对应的网站等。

本实施例的执行主体可以是一视频播放设备，具体而言，可以是安装在视频播放设备上的具有视频播放功能的应用程序，又或者是安装在视频播放设备上的硬件模块等。

通过本申请实施例提供的上述方法，视频播放设备在播放视频的过程中，当接收嵌入内容获取指令时，即可响应于所述指令，获取所述视频中的嵌入内容。整个操作过程在视频播放设备上进行，无需借用视频播放设备外的其它设备，从而也就不需要依靠用户拿出其它设备、启动其它设备的图像扫描功能、对视频图像中包含嵌入内容的区域进行扫描这一复杂的流程，因此简化了获取视频中的嵌入内容的过程。

实施例2

为进一步阐释上述实施例1，下面举例说明。如图2所示，用户利用触屏手机在全屏观看某一视频，在视频播放的过程中，例如按照视频播放的时间，在2分30秒到3分30秒的过程中，在视频界面的右下角出现有一个二维码，该二维码承载有下载该视频的视频网站的地址，该网站上有更多的与当前播放视频类似的视频资源。

在现有技术中，如果用户想要最终打开上述二维码包含的网站时，至少需要以下操作步骤：

首先需要拿起一台外围设备，如另一部手机；

然后打开外围设备上的二维码扫描软件；

再将外围设备的取景摄像头对准当前播放的视频界面中的二维码进行扫码，最终外围设备通过解析扫描得到的二维码，获取到二维码所承载的网址；

最后外围设备通过浏览器等跳转至对应的网站。

通过上述分析可知，现有技术在获取视频中的二维码，到最后的跳转到二维码所承载的访问地址对应的网站时，需要借助外围设备以及存在多个操作步骤，存在操作繁琐的问题，而通过本实施例2提供的获取视频中嵌入内容的方法，包括以下步骤：

步骤s21：手机在播放视频的过程中，接收二维码获取指令；

该实施例中的二维码获取指令，可以是根据用户点击手机的视频播放界面而生成。例如根据用户对视频播放界面执行的双击操作生成二维码获取指令，当然，在手机上的应用程序中存储有对应的执行规则，即检测到用户双击视频播放界面时，即生成二维码获取指令。

对于用户的双击位置，可以是视频播放界面的任意位置。

步骤s22：响应于所述指令，获取所述视频中的二维码；

具体获取视频中的二维码时，可以首先获取当前播放时间所对应的一帧或者是若干帧图像，然后利用二维码识别技术进行识别，当识别出二维码后即可对二维码进行解析。当然不排除对视频文件进行解析获取的到全部的图像帧，进而再对全部的图像帧一一利用二维码识别技术进行二维码识别。

二维码又称二维条码，利用特定的几何图形按一定规律在平面(二维方向)上分布的黑白相间的图形，能在有限的空间内存储文字、图像、指纹、签名等信息。二维码的编码利用了构成计算机内部逻辑基础的“0”、“1”比特流的概念，使用若干个与二进制相对应的几何形体来表示文字数值信息，通过二维码识别技术，即可实现对二维码承载的信息的处理。

在二维码中，以qr码为例，在qr码的4个边角中的3个边角上印有较小的像“回”字的正方图案，即fip(finderpattern，定位标识)。这3个fip是帮助定位的图案，满足一定的三角形的几何位置关系，例如，构成等腰直角三角形关系。该步骤中即可根据二维码特有的黑白跳变规律，搜索图像帧内的3个fip，进而完成对整个二维码的定位和识别。

步骤s23：控制手机浏览器跳转至二维码承载的网址对应的网站。

通过步骤s22中的操作对二维码进行识别，可以获取到二维码所承载的网址，该步骤即可控制手机的浏览器跳转至二维码所承载的网址对应的网站。

当控制手机浏览器跳转至二维码承载的网址对应的网站时，在手机界面上显示的是跳转后的网站页面，此时，还可以对所述播放的视频进行控制，如控制视频暂停、控制视频终止播放等。

需要说明的是，步骤s21中的二维码生成指令是因用户的触发而生成，一般情况下，用户看到视频界面中有二维码时才会执行上述操作，此时即表明视频中具有二维码，然后即可执行后续的步骤s22和步骤s23的操作。当然，在视频图像中没有二维码时，因用户误操作而双击屏幕时，在步骤s22中还可以执行一次获取视频图像中二维码获取的动作，当然最终不可能获取到二维码，因此可以结束流程，不再执行步骤s23的操作。

通过实施例2的上述分析可知，现有技术中获取视频中的二维码，到最后的跳转到二维码所承载的访问地址时，需要用户操作的步骤较多，而通过本实施例提供的方法，只需要用户在视频播放的过程中双击视频播放界面，即可完成二维码的获取操作，并且最终完成跳转至二维码所承载的网址对应的网站的操作，相对于现有技术而言，首先不需要借助外围设备，并且大大简化了用户需要操作的步骤。

实施例3

视频中的嵌入内容较多，较常见的包括二维码，字符串等。上述实施例2以视频中的嵌入内容为二维码为例进行说明，本实施例3以视频中的嵌入内容为字符串为例进行说明。

现有技术中，当视频中出现字符串时，该处的字符串，如网址、邮箱地址、电话号码等，用户一般需要打开其它的外围设备进行手动输入存储，因此存在操作繁琐的问题，而通过本实施例3提供的获取视频中嵌入内容的方法，包括以下步骤：

步骤s31：视频播放设备在播放视频的过程中，接收字符串获取指令；

具体公开不足之处参照实施例1中的步骤s11。

步骤s32：响应于所述指令，获取所述视频中的字符串；

该步骤中，具体获取视频中的字符串时，如图3所示，又可以细分为以下几个步骤：

步骤s321：获取所述视频中的图像帧；

具体获取时，可以从视频解析后得到的图像帧中，获取当前播放时间所对应的一帧或者是若干帧图像。其中，在当前播放时间，视频图像上包括有字符串。

步骤s322：对所述图像帧中的局部图像进行二值化处理，其中，所述局部图像为预设的、以显示所述字符串的区域的图像；

步骤s321中获取到的图像帧大多数是彩色图像，彩色图像所含信息量较大，为了更快的识别出字符串，可以首先对彩色图像帧进行处理，使图像帧只包含前景信息与背景信息，可以简单的定义前景信息为黑色，背景信息为白色，进而实现图像帧的二值化处理。

另外，存在字符串的局部图像与整个图像帧相比，其尺寸相对较小，因此在局部图像中进行字符串识别等后续操作，相对于在整个图像帧中进行字符串识别等操作，将会大大地缩短处理时间。因此，为了更快速地获取到字符串，可以从步骤s321中获取到的图像帧中，首先得到局部图像，然后仅仅对包含字符串的局部图像进行二值化处理，其中，所述局部图像为预设的、以显示所述字符串的区域的图像。

具体确定图像帧中的局部图像时：

在一种实施方式中，字符串固定出现在视频界面中的指定区域，如视频的右下角位置，因此该步骤中只需截取图像帧右下角区域的图像，进而得到包含字符串的局部图像。

在另一种实施方式中，在视频中添加字符串时，以像素为单位，添加字符串的局部图像的像素坐标已经确定，则该步骤中即可根据其像素坐标，精确地获取到包含字符串的局部图像。

当然，对所述图像帧中包含字符串的局部图像进行二值化处理之后，还可以对局部图像进行噪声去除操作，以提升最终确定出的字符串的准确度。

步骤s323：对二值化处理后局部图像中的字符串进行字符切分；

一般视频图像中的字符为规则的印刷字体且其字符串的长宽比、字符之间的间隙、字符的长宽比及笔画宽度都是严格地按照一定的标准来生成的，因此，为准确地识别出视频图像中的汉字、英文字母和数字等字符，还可以把单个字符从上述局部图像中提取分离出来。

本实施例可根据上述局部图像中的字符的上述特征，从上述局部图像中分割出字符图像，例如先确定字符的上下左右边界，也即确定字符的边界线；然后再根据各字符之间的固定间隙，将字符一一分割出来。

步骤s324：对切分后得到的字符进行特征提取，并将提取出的特征与字符库中的字符的特征进行比对；

特征是用来识别字符的关键信息，每个不同的字符都能通过特征来和其它字符进行区分。对于数字和英文字母来说，特征提取是比较容易的，因为数字只有10个，英文字母只有52个，都是小字符集。对于汉字来说，特征提取比较困难，首先，汉字是大字符集，国标中最常用的第一级汉字就有3755个；第二个汉字结构复杂，形近字多。

在确定了使用何种特征后，还可以进行特征降维，如果特征的维数太高(特征一般用一个向量表示，维数即该向量的分量数)，分类器的效率会受到很大的影响，为了提高识别速率，往往就要进行降维，既要降低维数，又要得使得减少维数后的特征向量还保留了足够的信息量(以区分不同的字符)。

当提取出字符的特征之后，不管是用统计或结构的特征，都须有一比对字符库或特征数据库来进行比对，字符库的内容可以包含所有的欲识别的字符，还包括根据上述字符特征抽取方法、对字符库中的字符进行特征抽取得的特征群组。

s325：根据比对结果，确定字符串。

根据上述步骤中的字符特征的比对结果，即可确定出字符串。

步骤s33：执行与所述字符串对应的操作。

该实施例中确定出的字符串可以分为多个种类，例如邮箱地址、网址、电话号码、汉字等，因此在该步骤中，可以根据字符串的种类不同，分别执行相应的操作。

例如，当字符串为邮箱地址、电话号码、汉字等时，可以保存上述类型的字符串。

又例如，当字符串为网址时，可以控制视频播放设备的浏览器跳转至上述网址对应的网站页面。

通过本申请实施例提供的上述方法，视频播放设备在播放视频的过程中，当接收字符串获取指令时，即可响应于所述指令，获取所述视频中的字符串。整个操作过程在视频播放设备上进行，无需借用其它的外围设备，且简化了获取视频中的字符串的过程。

实施例4

以上皆为本申请的方法实施例，相应地，本申请还提供了一种视频中的嵌入内容的获取装置实施例，用于简化获取视频中的嵌入内容的过程。如图4所示，该装置包括：接收模块41和获取模块42，其中，

所述接收模块41，可以用于视频播放设备在播放视频的过程中，接收嵌入内容获取指令；

所述获取模块42，可以用于响应于所述指令，获取所述视频中的嵌入内容。

通过本申请实施例提供的上述装置，视频播放设备在播放视频的过程中，当接收模块41接收嵌入内容获取指令时，获取模块42即可响应于所述指令，获取所述视频中的嵌入内容。无需借用其它的外围设备即可获取到视频中的嵌入内容，简化了获取视频中的嵌入内容的过程。

上述实施例中，接收模块41接收的嵌入内容获取指令，可以是根据用户对视频播放设备的视频播放界面执行的操作生成。当所述视频播放设备为触屏设备时，所述操作包括下述至少一种：点击操作、滑动操作、长按操作。上述嵌入内容具体包括字符串和/或二维码。

获取模块42获取所述视频中的嵌入内容，具体可以包括：获取所述视频中的图像帧；识别出所述图像帧中的嵌入内容。其中，识别出所述图像帧中的嵌入内容时，具体可以识别出所述图像帧中的指定区域的嵌入内容。

当所述嵌入内容为字符串时，获取所述视频中的嵌入内容，具体可以包括：获取所述视频中的图像帧；对所述图像帧中的局部图像进行二值化处理，其中，所述局部图像为预设的、以显示所述字符串的区域的图像；对二值化处理后局部图像中的字符串进行字符切分；对切分后得到的字符进行特征提取，并将提取出的特征与字符库中的字符的特征进行比对；根据比对结果，确定出字符串。

另外，如图4所示，所述装置还可以包括执行模块43，其中，所述执行模块43，可以用于在获取模块42获取到所述视频中的嵌入内容之后，执行与所述嵌入内容对应的操作。最后，所述视频播放设备中，包括有视频播放客户端。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上，使得在计算机或其它可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其它数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其它类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其它内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其它光学存储、磁盒式磁带，磁带磁磁盘存储或其它磁性存储设备或任何其它非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其它变体意在涵盖非排它性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张军友
技术所有人：法乐第（北京）网络科技有限公司
我是此专利的发明人

上一篇：一种大棚喷药装置的制作方法
上一篇：一种丙烯酸酯压敏胶、压敏胶带及丙烯酸酯压敏胶的制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。