扩展信息的展示方法及装置与流程

文档序号:11878381阅读:145来源:国知局
扩展信息的展示方法及装置与流程

本发明涉及终端设备技术领域,具体而言,本发明涉及一种扩展信息的展示方法以及一种扩展信息的展示装置。



背景技术:

随着时代的发展,信息扩展技术已被广泛应用,其中,人们在日常生活中常用的二维码扫描就是其中的应用最广泛的一种。用户通过终端设备的摄像头扫描二维码即可实现快速便捷地浏览网页、下载图文、音乐、视频、获取优惠券、参与抽奖、了解企业产品信息,从而省去了在终端设备上输入URL的繁琐操作过程,实现一键上网。同时,还可以方便地使用终端设备识别和存储联系人名片、自动输入短信、获取公共服务(如天气预报)、通过电子地图进行查询定位、进行电子阅读等多种功能。

在现有技术中,通过二维码扫描获取的扩展信息不乏枯燥无味,由于扩展信息展现的局限性导致用户获得到的信息大部分仅仅是以文字或图片形式呈现的信息,即使用户可以通过扩展信息进行相应的交互操作,也是单一的文字交互操作,并不生动而又有趣。



技术实现要素:

为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:

本发明的一个实施例提出了一种扩展信息的展示方法,包括:

通过视频捕捉设备获取待识别视频信息;

基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果;

基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器;

接收服务器基于扩展信息获取请求返回的扩展信息;

依据与扩展信息匹配的展示方式展示扩展信息。

优选地,基于预定的识别方法识别待识别视频信息,包括:

提取待识别视频信息中的视频帧;

基于图像识别技术识别提取到的视频帧中的图像信息。

优选地,视频帧中的图像信息包括物品图像信息、物品标识信息、背景图像信息和商品标识码中的至少一种。

优选地,依据与扩展信息匹配的展示方式展示扩展信息,包括:

实时通过视频捕捉设备捕捉实景视频信息;

以实景视频信息为背景将扩展信息进行叠加展示。

优选地,若扩展信息是三维动画信息,其中,以实景视频信息为背景将扩展信息进行叠加展示,包括:

通过预定的三维动画播放引擎将扩展信息以三维动画的形式在实景视频信息上进行叠加展示。

优选地,通过预定的三维动画播放引擎将扩展信息以三维动画的形式在实景视频信息上进行展现,包括:

基于扩展信息构建三维动画模型;

通过预定的三维动画播放引擎将三维动画模型以三维动画的形式在实景视频信息上进行叠加展现。

可选地,该方法还包括:

判断与待识别视频信息相应的识别结果是否为信息扩展对象;

若是,则执行基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器的步骤。

本发明的另一实施例提出了一种扩展信息的展示装置,包括:

获取模块,用于通过视频捕捉设备获取待识别视频信息;

识别模块,用于基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果;

生成及发送模块,用于基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器;

接收模块,用于接收服务器基于扩展信息获取请求返回的扩展信息;

展示模块,用于依据与扩展信息匹配的展示方式展示扩展信息。

优选地,识别模块包括:

帧提取单元,用于提取待识别视频信息中的视频帧;

信息识别单元,用于基于图像识别技术识别提取到的视频帧中的图像信息。

优选地,视频帧中的图像信息包括物品图像信息、物品标识信息、背景图像信息和商品标识码中的至少一种。

优选地,展示模块包括:

信息捕捉单元,用于实时通过视频捕捉设备捕捉实景视频信息;

叠加展示单元,用于以实景视频信息为背景将扩展信息进行叠加展示。

优选地,若扩展信息是三维动画信息,其中,叠加展示单元用于通过预定的三维动画播放引擎将扩展信息以三维动画的形式在实景视频信息上进行叠加展示。

优选地,叠加展示单元包括:

模型构建子单元,用于基于扩展信息构建三维动画模型;

叠加展现子单元,用于通过预定的三维动画播放引擎将三维动画模型以三维动画的形式在实景视频信息上进行叠加展现。

可选地,该装置还包括:

判断模块,用于判断与待识别视频信息相应的识别结果是否为信息扩展对象;

其中,当与待识别视频信息相应的识别结果是信息扩展对象时,生成及发送模块执行基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器的操作。

本发明的技术方案解决了如何将扩展信息以更丰富的展现形式进行展现的问题。首先,基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果,通过该步骤可以对待识别视频信息中提供的任何形式的信息进行识别,识别的内容打破了单一的条形码、二维码的局限性;其次,依据与扩展信息匹配的展示方式展示扩展信息,该步骤使得扩展信息可以通过与扩展信息匹配的展示方式进行展示,采用生动、灵活的展示形式来展示扩展信息,为用户带来更有趣味的感官体验。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本发明一个实施例的扩展信息的展示方法的流程示意图;

图2为本发明一个实施例的扩展信息的展示方法的视频帧示意图;

图3为本发明一个实施例的扩展信息的展示方法的三维动画模型示意图;

图4为本发明另一实施例的扩展信息的展示装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。

图1为本发明一个实施例的扩展信息的展示方法的流程示意图。

随着终端设备如智能手机的不断发展,如增强了CPU的运算能力、配备了功能强大的传感器设备、增加了视频捕捉设备获取的视频清晰度等,终端设备处理任务的能力也随之不断增强,可以处理的任务种类也不断增多,上述技术上的改进为终端设备能够提供更优的信息展示效果奠定了坚实的基础。除此之外,如今的用户已不满足于通过搜索引擎手动执行搜索来获取到其关注事物的相关信息,而更多地希望通过智能的方式直接获取到其所关注的事物的扩展信息,同时结合终端设备强大的处理任务的能力和软件技术上的不断创新,本发明实施例提供的方法可以实现上述可能。

步骤S110:通过视频捕捉设备获取待识别视频信息。

在实际应用场景中,用户可以通过智能手机中的摄像头装置进行待识别视频信息的获取操作。

步骤S120:基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果。

需要说明的是,若从待识别视频信息中提取到商品标识码,则读取商品标识码中的条形码或二维码的数据信息,并依据数据信息确定与待识别视频信息相应的识别结果。

优选地,基于预定的识别方法识别待识别视频信息的步骤包括步骤S121和步骤S122:步骤S121:提取待识别视频信息中的视频帧;步骤S122:基于图像识别技术识别提取到的视频帧中的图像信息。

首先,提取待识别视频信息中的视频帧。

例如,通过摄像头设备对实物进行拍摄操作,该拍摄操作持续3秒,若每一秒都包括25帧图像,则通过3秒的拍摄操作可以获取75帧图像;随后,分别提取75帧图像;进一步地,还可以将上述75帧图像中对焦不清晰的帧图像删除,以提高图像信息识别的准确率。

优选地,视频帧中的图像信息包括但不限于物品图像信息、物品标识信息、背景图像信息和商品标识码中的至少一种。

其中,图像信息不局限于商品标识码如条形码、二维码,还包括物品图像如一瓶可口可乐的包装罐、物品标识如“Coca-Cola”、背景图像如以可口可乐公司大楼为背景的图像、以新闻事发地为背景的图像等图像信息。在具体应用场景中,当对可口可乐的包装罐、“Coca-Cola”标识和可口可乐公司大楼为背景的图像进行信息扩展时,都可以获取到与可口可乐产品相关的广告信息。如图2所示,是本发明一个实施例的扩展信息的展示方法的视频帧示意图,其中,通过视频捕捉设备获取到的待识别视频信息中的一帧图像为可口可乐的包装罐图像。

接着,基于图像识别技术识别提取到的视频帧中的图像信息。

需要说明的是,存在多种可以对提取到的视频帧中的图像信息进行识别的方法,在本发明实施例中不一一详尽举例,只对其中一种进行说明,以供参考。

具体地,首先,提取图像信息中的图像特征信息;随后,根据图像特征信息在图像索引库中进行匹配,以确定图像特征信息匹配度高于预定阈值的索引库图像;最后,通过索引库图像确定与图像信息相应的识别结果。

首先,提取图像信息中的图像特征信息。

其中,图像特征信息可以包括但不限于图像的颜色特征、纹理特征、形状特征和空间关系特征。

具体地,颜色特征是一种全局特征,描述了图像信息或图像信息中局部区域所对应的物体的表面性质。颜色特征是基于像素点的特征,所有属于图像信息或图像信息中局部区域的像素相结合以形成完整的颜色特征。颜色直方图是最常用的表达颜色特征的方法,通过常用的颜色空间:RGB颜色空间、HSV颜色空间来对颜色特征进行描述。

纹理特征也是一种全局特征,它也描述了图像信息或图像信息中局部区域所对应物体的表面性质。与颜色特征不同,纹理特征不是基于像素点的特征,其需要在包含多个像素点的区域中进行统计计算。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。

形状特征包括两类表示方法:一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要关注物体的外边界,而图像的区域特征则关系到整个形状区域。常用的提取图片形状特征的方法包括:傅里叶形状描述符法,通过物体边界的傅里叶变换作为形状描述。

空间关系特征是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接关系、邻接关系、交叠关系、重叠关系、包含关系、包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。常用的提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。

接着,在提取到用于描述图像信息的图像的颜色特征、纹理特征、形状特征和空间关系特征等图像特征信息后,根据图像特征信息在图像索引库中进行匹配,以确定图像特征信息匹配度高于预定阈值的索引库图像。

需要说明的是,上述图像识别方法是通过“以图识图”的方式进行图像识别的,该方法充分利用了图像索引库中预先存储的大量的索引库图像进行图像识别,以减小在终端设备中通过单一图像直接进行图像识别的资源开销。当将待识别的图像信息与索引库图像匹配成功时,即可通过索引库图像确定待识别的图像信息的识别结果。

步骤S130:基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器。

需要说明的是,当服务器接收到终端设备发送的扩展信息获取请求时,可以提取扩展信息获取请求中包含的与待识别视频信息相应的识别结果;接着,在预先建立的扩展信息库中确定与识别结果相应的扩展信息;随后,将与识别结果相应的扩展信息发送至终端设备。

其中,扩展信息包括但不限于文字信息、图片信息、音频信息、二维动画信息、三维动画信息、互动操作相关信息等。

步骤S140:接收服务器基于扩展信息获取请求返回的扩展信息。

步骤S150:依据与扩展信息匹配的展示方式展示扩展信息。

需要说明的是,依据与扩展信息匹配的展示方式展示扩展信息,若扩展信息是二维动画信息,则可以直接播放二维动画如Flash动画;若扩展信息是三维动画信息,则依据预定的三维动画展示方式展示三维动画。

优选地,依据与扩展信息匹配的展示方式展示扩展信息的步骤包括步骤S151和步骤S152:步骤S151:实时通过视频捕捉设备捕捉实景视频信息;步骤S152:以实景视频信息为背景将扩展信息进行叠加展示。

具体地,上述本发明提供的优选实施例可以通过AR(Augmented Reality,增强现实技术)相关技术实现,以到达将现实图像与虚拟图像进行结合的目的,从而给用户更丰富的视觉体验。在终端设备上通过AR技术可以实现逼真的视、挺、力、触和动等感觉的虚拟环境,通过多种传感设备使用户“沉浸”到虚拟环境中,用户不仅能够通过虚拟现实画面感受到在客观物理世界中所经历的“身临其境”的逼真性,而且能够突破空间、时间以及其它客观因素的限制,感受到在真实世界中无法亲身经历的体验。AR技术可以作为VR(Virtual Reality,虚拟实境)技术当中的一个分支技术,然而AR技术与VR技术略为不同的是VR技术创造了一个全新的虚拟世界出来。AR技术的三个要素:

1.Combines real and virtual(结合虚拟与现实);

2.Interactive in real time(即时互动);

3.Registered in 3-D(3D定位)。

通常地,为了实现AR技术展现的视觉效果,用户可以透过特定装置来进行观看。早先大部分针对AR技术的研究主要是透过HMD(Head-Mounted Display,头罩式装置)进行研究的,其技术大概分成光学式(Optical)与影像式(Video)两种,前者是透明装置,用户可以直接透过光学式的透明装置观察到真实世界的影像,HMD装置会通过另外的投影设备把虚拟影像投射在光学式的透明装置上;影像式的HMD装置是不透明装置,用户观察到的是由终端设备处理好的、已实现虚实结合的影像。头罩式的HMD装置显得尤为麻烦,现如今通过智能手机的发展,已彻底改变了AR技术的样貌:而智能手机已同时集成强大的运算能力的CPU、视频捕捉设备、高清的显示屏等,当然还有定位设备、网络连接设备、触控设备、倾斜度侦测传感器等额外设备,因此,以智能手机为平台的AR技术的研究越来越蓬勃。

首先,实时通过视频捕捉设备捕捉实景视频信息;接着,以实景视频信息为背景将扩展信息进行叠加展示,其中,实景视频信息为实时实地捕捉的视频信息,扩展信息则是通过服务器获取到的虚拟信息。

更优选地,若扩展信息是三维动画信息,则以实景视频信息为背景将扩展信息进行叠加展示的步骤包括:通过预定的三维动画播放引擎将扩展信息以三维动画的形式在实景视频信息上进行叠加展示。

其中,预定的三维动画播放引擎可以是AR引擎和\或Cocos2d-X引擎,对此本发明不作限定。Cocos2d-x引擎最初只是二维游戏引擎,但是从3.0版本以上开始,Cocos2d-x引擎增加了三维动画播放的功能。

优选地,通过预定的三维动画播放引擎将扩展信息以三维动画的形式在实景视频信息上进行展现的步骤包括步骤S153和步骤S154:步骤S153:基于扩展信息构建三维动画模型;步骤S154:通过预定的三维动画播放引擎将三维动画模型以三维动画的形式在实景视频信息上进行叠加展现。

首先,基于扩展信息中包含的用于构建三维动画模型的基本元素信息构建三维动画模型。

例如,基于扩展信息构建三维精灵模型,其中,构建三维精灵模型的具体代码可如下所示:

Konglong3D=cocos2d::Sprite3D::create("KL.c3t");

auto animation=Animation3D::create("KL.c3t");

cocos2d::Animate3D*_swim=Animate3D::create(animation);

Sequence*pSequence=Sequence::create(_swim,NULL);

Konglong3D->runAction(RepeatForever::create(pSequence));

Konglong3D->setScale(0.001);

Konglong3D->setVisible(false);

addChild(Konglong3D);

Konglong3D->setPosition3D(Vec3(0,0,0));

Konglong3D->setRotation3D(Vec3(0,0,0));

需要说明的是,构建的三维精灵模型不仅仅包括三维精灵本身,还包括该三维精灵可以进行的基本动作的动画元素。

接着,通过预定的三维动画播放引擎将三维动画模型以三维动画的形式在实景视频信息上进行叠加展现。

例如,可以通过Cocos2d-X引擎将三维动画模型以三维动画的形式进行播放,其中,通过Cocos2d-X引擎播放三维动画的具体代码可如下所示:

cocos2d::GLView*glview=cocos2d::GLViewImpl::createWithEAGL View((_bridge void*)eaglView);

cocos2d::Director::getInstance()->setOpenGLView(glview);

app->run();

如图3所示,是本发明一个实施例的扩展信息的展示方法的三维动画模型示意图,其中,三维精灵是一只恐龙,三维精灵可以做预先设计的动作如跳跃等动作,关于三维精灵模型的三维动画播放是以实景场景为背景进行的。需要说明的是,以实景视频信息为背景进行三维动画的播放可以提供用户三维动画模型“活”在面前的视觉效果,从而为用户带来更生动有趣的体验。

例如,用户对一件“米奇”书包很感兴趣,则可以通过视频捕捉设备拍摄一段包括“米奇”书包的待识别视频信息,经过识别操作可以将人眼可以识别的待识别视频信息转换成终端设备可以识别的与待识别视频信息相应的识别结果,最后将与识别结果相应的扩展信息进行展示,如将“米老鼠”作为三维精灵以三维动画的方式进行展示。更进一步地,三维精灵“米老鼠”可以通过预定的互动方式与用户进行互动,以使用户通过更生动的方式了解更多关于“米奇”书包产品的相关扩展信息。

可选地,本发明实施例提供的方法还包括步骤S160和步骤S170:步骤S160:判断与待识别视频信息相应的识别结果是否为信息扩展对象;步骤S170:若是,则执行基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器的步骤。

需要说明的是,并非所有识别结果都存在与之相应的扩展信息,扩展信息的存在与否是依据服务器中预先建立的扩展信息库的容量以及是否预先收录与识别结果相应的扩展信息决定的。因此,在向服务器发送扩展信息获取请求之前,也可以预先判断与待识别视频信息相应的识别结果是否为信息扩展对象。具体地,可以通过终端设备中预先存储的信息扩展对象列表确定识别结果是否是信息扩展对象。当然,上述操作也可以在服务器实现,对比本发明实施例不作限定。

本发明的技术方案解决了如何将扩展信息以更丰富的展现形式进行展现的问题。首先,基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果,通过该步骤可以对待识别视频信息中提供的任何形式的信息进行识别,识别的内容打破了单一的条形码、二维码的局限性;其次,依据与扩展信息匹配的展示方式展示扩展信息,该步骤使得扩展信息可以通过与扩展信息匹配的展示方式进行展示,采用生动、灵活的展示形式来展示扩展信息,为用户带来更有趣味的感官体验。

图4为本发明另一实施例的扩展信息的展示装置的结构示意图。

随着终端设备如智能手机的不断发展,如增强了CPU的运算能力、配备了功能强大的传感器设备、增加了视频捕捉设备获取的视频清晰度等,终端设备处理任务的能力也随之不断增强,可以处理的任务种类也不断增多,上述技术上的改进为终端设备能够提供更优的信息展示效果奠定了坚实的基础。除此之外,如今的用户已不满足于通过搜索引擎手动执行搜索来获取到其关注事物的相关信息,而更多地希望通过智能的方式直接获取到其所关注的事物的扩展信息,同时结合终端设备强大的处理任务的能力和软件技术上的不断创新,本发明实施例提供的方法可以实现上述可能。

获取模块410通过视频捕捉设备获取待识别视频信息。

在实际应用场景中,用户可以通过智能手机中的摄像头装置进行待识别视频信息的获取操作。

识别模块420基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果。

需要说明的是,若从待识别视频信息中提取到商品标识码,则读取商品标识码中的条形码或二维码的数据信息,并依据数据信息确定与待识别视频信息相应的识别结果。

优选地,识别模块420包括帧提取单元和信息识别单元:帧提取单元提取待识别视频信息中的视频帧;信息识别单元基于图像识别技术识别提取到的视频帧中的图像信息。

首先,帧提取单元提取待识别视频信息中的视频帧。

例如,通过摄像头设备对实物进行拍摄操作,该拍摄操作持续3秒,若每一秒都包括25帧图像,则通过3秒的拍摄操作可以获取75帧图像;随后,分别提取75帧图像;进一步地,还可以将上述75帧图像中对焦不清晰的帧图像删除,以提高图像信息识别的准确率。

优选地,视频帧中的图像信息包括但不限于物品图像信息、物品标识信息、背景图像信息和商品标识码中的至少一种。

其中,图像信息不局限于商品标识码如条形码、二维码,还包括物品图像如一瓶可口可乐的包装罐、物品标识如“Coca-Cola”、背景图像如以可口可乐公司大楼为背景的图像、以新闻事发地为背景的图像等图像信息。在具体应用场景中,当对可口可乐的包装罐、“Coca-Cola”标识和可口可乐公司大楼为背景的图像进行信息扩展时,都可以获取到与可口可乐产品相关的广告信息。

接着,信息识别单元基于图像识别技术识别提取到的视频帧中的图像信息。

需要说明的是,存在多种可以对提取到的视频帧中的图像信息进行识别的方法,在本发明实施例中不一一详尽举例,只对其中一种进行说明,以供参考。

具体地,首先,提取图像信息中的图像特征信息;随后,根据图像特征信息在图像索引库中进行匹配,以确定图像特征信息匹配度高于预定阈值的索引库图像;最后,通过索引库图像确定与图像信息相应的识别结果。

首先,提取图像信息中的图像特征信息。

其中,图像特征信息可以包括但不限于图像的颜色特征、纹理特征、形状特征和空间关系特征。

具体地,颜色特征是一种全局特征,描述了图像信息或图像信息中局部区域所对应的物体的表面性质。颜色特征是基于像素点的特征,所有属于图像信息或图像信息中局部区域的像素相结合以形成完整的颜色特征。颜色直方图是最常用的表达颜色特征的方法,通过常用的颜色空间:RGB颜色空间、HSV颜色空间来对颜色特征进行描述。

纹理特征也是一种全局特征,它也描述了图像信息或图像信息中局部区域所对应物体的表面性质。与颜色特征不同,纹理特征不是基于像素点的特征,其需要在包含多个像素点的区域中进行统计计算。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。

形状特征包括两类表示方法:一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要关注物体的外边界,而图像的区域特征则关系到整个形状区域。常用的提取图片形状特征的方法包括:傅里叶形状描述符法,通过物体边界的傅里叶变换作为形状描述。

空间关系特征是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接关系、邻接关系、交叠关系、重叠关系、包含关系、包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。常用的提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。

接着,在提取到用于描述图像信息的图像的颜色特征、纹理特征、形状特征和空间关系特征等图像特征信息后,根据图像特征信息在图像索引库中进行匹配,以确定图像特征信息匹配度高于预定阈值的索引库图像。

需要说明的是,上述图像识别方法是通过“以图识图”的方式进行图像识别的,该方法充分利用了图像索引库中预先存储的大量的索引库图像进行图像识别,以减小在终端设备中通过单一图像直接进行图像识别的资源开销。当将待识别的图像信息与索引库图像匹配成功时,即可通过索引库图像确定待识别的图像信息的识别结果。

生成及发送模块430基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器。

需要说明的是,当服务器接收到终端设备发送的扩展信息获取请求时,可以提取扩展信息获取请求中包含的与待识别视频信息相应的识别结果;接着,在预先建立的扩展信息库中确定与识别结果相应的扩展信息;随后,将与识别结果相应的扩展信息发送至终端设备。

其中,扩展信息包括但不限于文字信息、图片信息、音频信息、二维动画信息、三维动画信息、互动操作相关信息等。

接收模块440接收服务器基于扩展信息获取请求返回的扩展信息。

展示模块450依据与扩展信息匹配的展示方式展示扩展信息。

需要说明的是,展示模块450依据与扩展信息匹配的展示方式展示扩展信息,若扩展信息是二维动画信息,则可以直接播放二维动画如Flash动画;若扩展信息是三维动画信息,则依据预定的三维动画展示方式展示三维动画。

优选地,展示模块450包括信息捕捉单元和叠加展示单元:信息捕捉单元实时通过视频捕捉设备捕捉实景视频信息;叠加展示单元以实景视频信息为背景将扩展信息进行叠加展示。

具体地,上述本发明提供的优选实施例可以通过AR(Augmented Reality,增强现实技术)相关技术实现,以到达将现实图像与虚拟图像进行结合的目的,从而给用户更丰富的视觉体验。在终端设备上通过AR技术可以实现逼真的视、挺、力、触和动等感觉的虚拟环境,通过多种传感设备使用户“沉浸”到虚拟环境中,用户不仅能够通过虚拟现实画面感受到在客观物理世界中所经历的“身临其境”的逼真性,而且能够突破空间、时间以及其它客观因素的限制,感受到在真实世界中无法亲身经历的体验。AR技术可以作为VR(Virtual Reality,虚拟实境)技术当中的一个分支技术,然而AR技术与VR技术略为不同的是VR技术创造了一个全新的虚拟世界出来。AR技术的三个要素:

1.Combines real and virtual(结合虚拟与现实);

2.Interactive in real time(即时互动);

3.Registered in 3-D(3D定位)。

通常地,为了实现AR技术展现的视觉效果,用户可以透过特定装置来进行观看。早先大部分针对AR技术的研究主要是透过HMD(Head-Mounted Display,头罩式装置)进行研究的,其技术大概分成光学式(Optical)与影像式(Video)两种,前者是透明装置,用户可以直接透过光学式的透明装置观察到真实世界的影像,HMD装置会通过另外的投影设备把虚拟影像投射在光学式的透明装置上;影像式的HMD装置是不透明装置,用户观察到的是由终端设备处理好的、已实现虚实结合的影像。头罩式的HMD装置显得尤为麻烦,现如今通过智能手机的发展,已彻底改变了AR技术的样貌:而智能手机已同时集成强大的运算能力的CPU、视频捕捉设备、高清的显示屏等,当然还有定位设备、网络连接设备、触控设备、倾斜度侦测传感器等额外设备,因此,以智能手机为平台的AR技术的研究越来越蓬勃。

首先,实时通过视频捕捉设备捕捉实景视频信息;接着,以实景视频信息为背景将扩展信息进行叠加展示,其中,实景视频信息为实时实地捕捉的视频信息,扩展信息则是通过服务器获取到的虚拟信息。

更优选地,若扩展信息是三维动画信息,则叠加展示单元用于通过预定的三维动画播放引擎将扩展信息以三维动画的形式在实景视频信息上进行叠加展示。

其中,预定的三维动画播放引擎可以是AR引擎和\或Cocos2d-X引擎,对此本发明不作限定。Cocos2d-x引擎最初只是二维游戏引擎,但是从3.0版本以上开始,Cocos2d-x引擎增加了三维动画播放的功能。

优选地,叠加展示单元包括模型构建子单元和叠加展现子单元:模型构建子单元基于扩展信息构建三维动画模型;叠加展现子单元通过预定的三维动画播放引擎将三维动画模型以三维动画的形式在实景视频信息上进行叠加展现。

首先,模型构建子单元基于扩展信息中包含的用于构建三维动画模型的基本元素信息构建三维动画模型。

例如,基于扩展信息构建三维精灵模型,其中,构建三维精灵模型的具体代码可如下所示:

Konglong3D=cocos2d::Sprite3D::create("KL.c3t");

auto animation=Animation3D::create("KL.c3t");

cocos2d::Animate3D*_swim=Animate3D::create(animation);

Sequence*pSequence=Sequence::create(_swim,NULL);

Konglong3D->runAction(RepeatForever::create(pSequence));

Konglong3D->setScale(0.001);

Konglong3D->setVisible(false);

addChild(Konglong3D);

Konglong3D->setPosition3D(Vec3(0,0,0));

Konglong3D->setRotation3D(Vec3(0,0,0));

需要说明的是,构建的三维精灵模型不仅仅包括三维精灵本身,还包括该三维精灵可以进行的基本动作的动画元素。

接着,叠加展现子单元通过预定的三维动画播放引擎将三维动画模型以三维动画的形式在实景视频信息上进行叠加展现。

例如,可以通过Cocos2d-X引擎将三维动画模型以三维动画的形式进行播放,其中,通过Cocos2d-X引擎播放三维动画的具体代码可如下所示:

cocos2d::GLView*glview=cocos2d::GLViewImpl::createWithEAGL View((_bridge void*)eaglView);

cocos2d::Director::getInstance()->setOpenGLView(glview);

app->run();

需要说明的是,以实景视频信息为背景进行三维动画的播放可以提供用户三维动画模型“活”在面前的视觉效果,从而为用户带来更生动有趣的体验。

例如,用户对一件“米奇”书包很感兴趣,则可以通过视频捕捉设备拍摄一段包括“米奇”书包的待识别视频信息,经过识别操作可以将人眼可以识别的待识别视频信息转换成终端设备可以识别的与待识别视频信息相应的识别结果,最后将与识别结果相应的扩展信息进行展示,如将“米老鼠”作为三维精灵以三维动画的方式进行展示。更进一步地,三维精灵“米老鼠”可以通过预定的互动方式与用户进行互动,以使用户通过更生动的方式了解更多关于“米奇”书包产品的相关扩展信息。

可选地,本发明实施例提供的装置还包括判断模块:判断模块判断与待识别视频信息相应的识别结果是否为信息扩展对象;当与待识别视频信息相应的识别结果是信息扩展对象时,生成及发送模块430执行基于识别结果生成扩展信息获取请求,并将扩展信息获取请求发送至服务器的操作。

需要说明的是,并非所有识别结果都存在与之相应的扩展信息,扩展信息的存在与否是依据服务器中预先建立的扩展信息库的容量以及是否预先收录与识别结果相应的扩展信息决定的。因此,在向服务器发送扩展信息获取请求之前,也可以预先判断与待识别视频信息相应的识别结果是否为信息扩展对象。具体地,可以通过终端设备中预先存储的信息扩展对象列表确定识别结果是否是信息扩展对象。当然,上述操作也可以在服务器实现,对比本发明实施例不作限定。

本发明的技术方案解决了如何将扩展信息以更丰富的展现形式进行展现的问题。首先,基于预定的识别方法识别待识别视频信息,以确定与待识别视频信息相应的识别结果,通过该步骤可以对待识别视频信息中提供的任何形式的信息进行识别,识别的内容打破了单一的条形码、二维码的局限性;其次,依据与扩展信息匹配的展示方式展示扩展信息,该步骤使得扩展信息可以通过与扩展信息匹配的展示方式进行展示,采用生动、灵活的展示形式来展示扩展信息,为用户带来更有趣味的感官体验。

本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。

本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。

本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1