内插视频标签的制作方法_4

文档序号:9333058阅读:来源:国知局
或非连续移动的情况下,视频分段模块8可以生成单帧分段或者包括相对低数量的 帧的分段。
[0108] 视频分段模块8可以基于分段中的数据是否可以使用数学上更为简单的函数进 行描述来确定分段端点。在各个实例中,视频分段模块8可以基于诸如形状类型变化或移 动趋势变化之类的标准来检测分段端点。在基于形状类型变化的确定的示例中,不同形状 类型通常无法共同以数学上简单的方式进行描述。例如,在以上所列出的原始数据示例中, 形状类型在从f= 120到f= 121的转换处从圆形变为正方形。视频分段模块8可以将这 种变化解释为新的分段在f= 121开始的信号。然而,视频分段模块8可以通过将更为特 殊的形状概括为更为一般的形状而将某些形状类型的变化识别为"兼容的"。例如,如果圆 形形状变为旋转的椭圆形或反之亦然,视频分段模块8可以将该圆形升级为具有相等轴并 且具有任意旋转的椭圆形。以这种方式,视频分段模块8可以缓和转变点处的形状类型变 化。
[0109] 在移动趋势变化的情形中,如果视频分段模块8确定特定形状属性(例如圆中心 的x位置)已经增大,但是突然从特定帧变为减小,则视频分段模块8可以确定该特定帧可 能是开始新的分段的数据点,否则内插功能函数模块可能不再能够调节先前所确定的内插 函数来在不产生更大误差的情况下包括新的帧处的数据。
[0110] 在内插函数模块6和视频分段模块8所实施的协同技术的示例中,视频分段模块 8确定诸如在帧f。处的分段开始,其中f。是整个序列的开始的时间/帧编号或者紧跟在先 前使用该工作流所限定的最后分段。此外,视频分段模块8将候选分段定义为从f。到f,其 中f被初始化为等于f。。接下来,视频分段模块8向内插函数模块6馈送f。和f之间的原 始帧数据,并且向内插函数模块6提交生成在特定误差容忍阈值内近似这些帧中的所有数 据的内插函数。该示例协同技术可以是迭代过程,例如,如果内插函数模块6能够存储先前 所提供的从&到紧邻f之前的帧的数据,则视频分段模块8可以仅需要提供f处的数据。 此外,内插函数模块6可以将访问指引到原始帧数据,在这种情况下,视频分段模块可以仅 需要为内插函数模块6提供对于其获取帧数据的范围"f。到f"。
[0111] 如果内插函数模块6能够生成所请求的内插函数,则视频分段模块8可以通过将 f递增至下一个可对其获得数据的帧而对候选分段进行扩展,并且请求内插函数模块6对 先前所生成的函数进行调节或者提供新的函数以包括新的帧处的数据。该过程继续进行直 至内插函数模块6不能在不超过误差容忍阈值的情况下生成适当函数,此时内插功函数模 块6可以向视频分段模块8提供结束候选分段的特定帧f',其处于f。和f?之前的最后帧之 间。f之前的最后帧通常是f-1,其在如以上所描述的任意帧跳跃的情况下是缺失的。
[0112] 以上所描述的过程也可以在视频分段模块8在使得f?递增时确定f已经处于整个 序列的结尾从而帧计数不能被递增的情况下、或者在视频分段模块8确定新的f?处的数据 不能表示来自从&起并且排除f(例如,通过查看形状变化和实质性位置移位)的数据点 的自然连续的情况下终止。如果该过程以这种方式终止,则视频分段模块8将该序列的分 段定义为从&到f?的先前值,其具有内插函数模块6最近所返回的内插函数。
[0113] 以以上所描述的方式,该协同工作流可以连续定义序列中的分段,直至该序列中 的所有帧都被处理。该工作流可以在最后的帧被包括在分段中马上终止,或者可选地为了 关于数据近似准确性、内插函数简单性或者其它所期望的属性找到最佳分段方案而使用不 同参数重新开始。不同参数例如可以包括仅由视频分段模块8所作出的不同决策,诸如是 否在移动跳跃、形状变化或移动趋势变化的点断开分段。
[0114] 以下样本工作流中描述了在不与服务器设备2的其它模块进行协同的情况下由 内插函数模块6所实施的示例技术。在该示例技术中,内插函数模块6可以尽可能准确地对 视频划分模块8所定义的分段近似内插函数。在以下所描述的示例中,内插函数模块6可 以使用简单实施方式来确定内插函数,其基于视频分段模块8所提供的候选分段的端点。
[0115] 当接收到具有数据R(f。)的第一个帧f。时,内插函数模块6可以使用所接收到的 数据来定义最终内插函数的形状类型。进而,内插函数模块6可以返回总是产生该未修改 的帧的数据的函数,BP
[0116] S(fs:f〇. ,f〇) =R(f〇)
[0117] 其中"fs"是该函数的参数,但是其范围被限制为f。。当接收到具有数据R(f)的 任意后续帧f?时,如果R(f)不表示与R(fc)相同的形状类型,则内插函数模块6可以指示 视频分段模块8在通过所描述的工作流的先前帧终止该分段。
[0118] 内插函数模块6可以在域(f。彡ff)中定义内插函数S(fs),使得该 进程以及所有形状属性都被线性内插。内插函数模块6可以仅使用来自R(f。)和R(f)的 数据如下进行确定:
[0119] S(fs:f0..f)=父(\,13;3,。;3,...),其中
[0120] as=a0+(a_a0)p,
[0121] bs=b〇+(b-b〇)p,
[0122] cs=c〇+(c-c〇)p
[0123] 等等,其_
并且X,aQ,a,...匹配
[0124] R(f。)= X(a。,b。,c。,? ? ?),R(f) = X(a,b,c,? ??)
[0125] 项X可以表示R(f。)中的形状名称,例如"Circle";项a,b,c...可以表示形状属 性的值,诸如x坐标、y坐标以及圆的直径。
[0126] 对于每个帧圪,其中&<f"<f,并且其中R(fJ被定义且未包括在帧的跳跃所导 致的"间隙"之中,内插函数模块6可以使用以上函数来计算as、bs、cs等的内插结果,并且 将所计算的值与R(fn)的实际值进行比较。如果没有超过误差阈值的差异,则内插函数模 块6可以返回以上所定义的函数S作为内插函数。否则,内插函数模块6可以向视频分段 模块8指示在经过该示例工作流的先前帧处终止该分段。
[0127] 使用以上所定义的R中的原始数据的该工作流的示例执行如以下所阐述。假设帧 100至119已经被处理并且最后所生成的内插函数为:
[0128]S(fs:100. . 119) =Circle(x= 0. 3+0. 19p,y= 0. 2+0. 19p,d= 0. 1),
[0129] 其中p = (fs-l〇〇)/l9
[0130] 在以R(100) =Circle(x= 0? 3,y= 0? 2,d= 0? 1) ; | 以下端点数据:
[0131]R(119) =Circle(x=0.49,y=0.39,d=0.1)
[0132] 视频分段模块8可以向内插函数模块6指示将R(120) =Circle(x=0.6,y= 0. 4,d= 0. 1)包括在所要生成的内插函数中。在该实例中,x的每帧增量明显比先前(处 于0.01)大(处于0. 11)。进而,内插函数模块6可以生成对应于帧100至120的以下暂定 函数:
[0133]S(fs:100. . 120) =Circle(x= 0. 3+0. 3p,y= 0. 2+0. 2p,d= 0. 1),
[0134]其中p= (fs-100)/20
[0135] 在对帧119进行验证时,内插函数模块6可以确定S(119) =Circle(x=0.585,y =0? 39,d= 0? 1),其与R(119) =Circle(x= 0? 49,y= 0? 39,d= 0? 1)进行比较,x偏差 0. 095。例如,如果误差公差被设置在0. 05,内插函数模块6可以确定覆盖帧100至120的 候选函数超过阈值并且应当被拒绝。作为结果,在该示例中,内插函数模块6可以向视频分 段模块指示在帧119终止该分段,并且在帧120开始新的分段。在该示例中,新的分段可以 仅包含帧120,因为帧121已经具有与帧120 (圆形)不兼容的形状(正方形)。
[0136] 服务器设备2的映射模块10可以进行操作以将知识数据82的特定部分与对象识 别模块4所识别的特定对象相关联。作为示例,知识数据82可以包括演员和画外音艺术家 的影片目录信息、运动员的技术统计、音乐家的唱片分类目录等。进而,作为一个示例,映射 模块10可以将特定影片目录与特定演员相关联。此外,映射模块10可以存储将诸如知识 数据82的特定部分与相对应对象之间的关联之类的映射信息存储到映射数据84。以这种 方式,映射模块10可以利用将知识数据82的相关部分与视频中由视频识别模块4所识别 的相对应对象相关联的信息来扩增映射数据84。映射模块10还可以将内插函数模块6所 生成的内插函数映射至相对应的对象,并且将该信息存储至映射数据84。
[0137] 进而,服务器设备2可以经由通信单元72将视频、视频中由对象识别模块4所识 别的每个对象的指示、以及内插函数模块所生成的每个内插模块的指示传送至客户端设 备。此外,服务器设备2可以将知识数据82的特定部分以及映射数据84传送至客户端设 备。以这种方式,服务器设备2可以实施本公开的一种或多种服务器侧技术以向客户端设 备提供相关信息从而提供内插视频标签。通过向客户端设备提供相关信息,即使在客户端 设备未活动地耦合至服务器设备2以便进行通信的情况下,服务器设备2也可以使得客户 端设备能够向用户提供内插视频标签体验。
[0138] 图3是图示被配置为执行本公开的一种或多种客户端侧内插视频标签技术的客 户端设备12的细节的框图。客户端设备12可以包括、作为各种类型的设备中的一种或多 种,或者作为其一部分,除其它之外,上述设备诸如移动电话(包括智能电话)、平板计算 机、上网本、膝上计算机、台式机、个人数字助理(PDA)、机顶盒、电视机以及手表。
[0139] 在各个示例中,一个或多个处理器40被配置为实施功能和/或过程指令以便在客 户端设备12内执行。例如,处理器40可以处理存储在存储设备48或者能够以其它方式通 过其进行访问的指令。这样的指令可以包括一个或多个操作系统54的组件、对象UI设备 模块52、内插模块15及其组件、标签选择模块,以及知识数据输出模块22。
[0140] 客户端设备12还可以包括一个或多个通信单元44。在一个示例中,客户端设备 12利用通信单元44经由诸如一个或多个无线网络的一个或多个网络与外部设备进行通 信。通信单元44可以包括诸如以太网卡的网络接口卡、光学收发器、射频收发器、或者能够 发送并接收信息的任意其它类型的设备中的一个或多个。这样的通信单元的其它示例可以 包括诸如移动主机设备中的蓝牙?、3G、4G和WiFi?无线电的网络接口以及通用串行总 线(USB)。在一些示例中,客户端设备12利用通信单元44通过网络与诸如一个或多个服务 器和/或主机设备的外部设备进行无线通信。
[0141] 在各个示例中,输入设备42被配置为通过触觉、音频或视频反馈接收来自用户的 输入。输入设备42的示例包括存在敏感显示器(诸如触摸屏)、鼠标、键盘、语音响应系统、 视频相机、麦克风或者用于检测来自用户的命令的任意其它类型的设备。在一些示例中,存 在敏感显示器包括触摸敏感屏幕。
[0142] -个或多个输出设备206也可以包括在客户端设备12中。在一些示例中,输出设 备46被配置为使用触觉、音频或视频刺激向用户提供输出。在各个示例中,输出设备46包 括存在敏感显示器(例如,触摸屏)、声卡、视频图形适配器卡、或者用于将信号转换为人或 机器所能够理解的适当形式的任意其它类型的设备。输出设备46的另外示例包括扬声器、 阴极射线管(CRT)监视器、液晶显示器(LCD)、或者能够向用户生成可理解输出的任意其它 类型的设备。
[0143] 组件40、42、44、46、14和48中的每一个可以互连(物理地、通信地和/或操作地) 以便进行组件间通信。在一些示例中,一个或多个通信信道50可以包括系统总线、网络连 接、进程间通信数据结构或者用于传输数据的任意其它通道。作为图3中的一个示例,组件 40、42、44、46、14和48可以通过一个或多个通信信道50进行耦合。
[0144] 一个或多个操作系统54可以控制客户端设备12和/或其组件的一种或多种功 能。例如,操作系统54可以与UI设备模块52、内插模块15、标签选择模块20和知识数据 输出模块22中的一个或多个进行交互,并且可以促成这些模块与一个或多个处理器40和 通信单元44之间经由通信信道50所进行的一种或多种交互。在一些示例中,UI设备模块 52、内插模块15、标签选择模块20和知识数据输出模块22中的一个或多个可以包括在操作 系统54中。在其它示例中,UI设备模块52、内插模块15、标签选择模块20和知识数据输 出模块22中的一个或多个可以在客户端设备12之外实施,诸如在网络位置实施。在一些 这样的实例中,客户端设备12可以使用通信单元44通过公知为"云计算"的方法访问并实 施关于客户端设备12及其相应组件所阐述的各种模块提供的功能。
[0145] 客户端设备12还可以包括应用模块56。应用模块56可以被配置为或者能够以其 它方式进行操作以基于诸如检测到用户输入之类的各种条件来执行操作。作为一个示例, 一个或多个应用模块12可以利用UI设备14在各个实例中输出UI26。此外,相关应用模 块56可以接收用户输入,并且基于客户的端设备12所接收到的用户输入生成输出。应用 模块56还可以通过移动客户端设备12所提供的各种工具将输出传输给用户,诸如通过经 由UI设备4(例如,在UI26内)以可读取的格式显示该输出。在各个实例中,应用模块56 可以实施客户端设备12的制造商所提供的功能和/或另一方(经常被称作"第三方应用") 所提供的功能。
[0146] 客户端设备12可以诸如经由通信单元44从服务器设备2接收诸如视频、视频中 所表示的对象的指示、内插函数、知识数据和映射数据之类的数据。此外,客户端设备可以 将所接收到的信息存储到存储设备48的下载数据58。进而,图3所示的各个模块可以在实 施这里所描述的客户端侧内插视频标签技术时访问所下载的数据58的相关部分。
[0147]例如,内插模块15可以从所下载的数据58确定所下载的视频中各个对象的指示, 以及与每个这样的对象相关联的内插函数。更具体地,每个内插函数可以指定相应内插函 数在其中有效的时域。换句话说,内插模块15可以基于所指定的时域确定特定分段,该对 象在该分段期间被连续或基本上连续地表示在视频中。
[0148] 此外,内插模块15可以使得UI设备模块52输出标签以便结合该分段的相对应帧 进行显示。在一个示例中,内插模块15可以将该标签嵌入在相对应的视频帧中,使得UI设 备模块52响应于诸如经由输入设备42所接收到的暂停请求之类的一种或多种条件而输出 该标签。
[0149] 如关于图1所描述的,标签选择模块20可以接收对结合当前帧显示的标签的选 择。更具体地,标签选择模块20可以经由输入设备42接收选择请求,诸如通过在输入设备 42的触摸屏处所提供的触摸输入。此外,知识数据输出模块22可以响应于标签选择模块 20所检测到的选择而使得UI设备模块52经由输出设备46和/或UI设备14为带标签对 象输出相关知识数据。
[0150] 通过实施以上所描述的客户端侧内插视频标签技术,客户端设备12可以提供使 得能够对带标签对象进行知识数据访问的用户体验,同时减少计算资
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1