一种基于图片来搜索视频的方法及装置与流程

文档序号:12541340阅读:1097来源:国知局
一种基于图片来搜索视频的方法及装置与流程
本发明涉及计算机网络技术领域,尤其涉及一种在互联网上搜索视频的方法及系统。

背景技术:
用户在使用互联网搜索信息的过程中,有时会需要搜索到和某张图片相似的图片或者这张图片中图像的相关信息,但又不了解该图片的来源。如果用户根据经验使用关键词来进行查询,往往需要反复的尝试筛选关键词。目前现有技术中有一种以图搜图的识图技术,通过搜索图像文本或者图像特征值,为用户提供互联网上相关图形图像资料检索服务。用户可以通过上传与搜索结果相似的图片或图片的URL(UniformResourceLocator,统一资源定位符)进行查询。然而,现有技术中的以图搜图技术只能通过图片搜索图片,发明人发现,在实际应用中,用户如果在互联网上浏览到一张视频的海报图片,却不了解该海报图片对应视频的名称、主演等信息,通过经验提炼关键词来搜索该海报图片对应的视频,搜索过程繁琐且花费时间较长。

技术实现要素:
本发明所要解决的技术问题是提供一种基于图片来搜索视频的方法及系统,以解决现有技术只能通过关键词搜索视频资源,导致搜索过程繁琐且花费时间较长的问题。根据本发明的一个方面,提供一种用于搜索视频的方法,该方法包括:获取用户选择的待查询图片;对所述待查询图片进行图像识别,获得该待查询图片的图片特征,该图片特征包括除图片尺寸与像素以外的多个图像特征值;根据所述图片特征在图片索引库中进行查询,获得与所述待查询图片的图片特征相同的预存图片;根据所述预存图片的ID,通过预先建立的视频网页地址与图片的ID之间的索引关系,获得与所述图片的ID对应的视频网页地址。根据本发明的另一个方面,还提供了一种用于搜索视频的装置,该装置包括:第一获取装置,用于获取用户选择的待查询图片;第一识别装置,用于对所述待查询图片进行图像识别,获得该待查询图片的图片特征,该图片特征包括除图片尺寸与像素以外的多个图像特征值;图片查询装置,用于根据所述图片特征在图片索引库中进行查询,获得与所述待查询图片的图片特征相同的预存图片;视频查询装置,用于根据所述预存图片的ID,通过预先建立的视频网页地址与图片的ID之间的索引关系,查询与所述图片的ID对应的视频网页地址。与现有技术相比,本发明通过对用户选择的图片进行图像识别,在图片索引库中搜索到和用户选择图片内容相同的图片,获得图片索引库中该图片预先分配的ID,以及根据预先建立的视频网页地址与该ID之间的索引关系,搜索到相应的视频网页地址,实现了根据用户选择的图片搜索到该图片对应的视频资源,简化了搜索程序,缩短了搜索时间。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:图1为本发明的基于图片来搜索视频的方案的场景示意图;图2为本发明的一种基于图片来搜索视频的方法示意图;图3为本发明建立图片索引库的方法流程示意图;图4为本发明的一种基于图片来搜索视频的装置示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本发明作进一步详细描述。图1示出根据本发明的基于图片来搜索视频的方案的场景示意图,其中包括用户设备1与网络设备2,用户设备1经由网络与网络设备2进行交互,用户通过用户设备1访问网络设备2,并选择待查询的图片,网络设备2基于用户选择的待查询图片来搜索对应的视频,并将搜索结果反馈给用户设备1。在此,网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(CloudComputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、触摸板、或声控设备进行人机交互的移动电子产品,例如智能手机、PDA(掌上电脑,PersonalDigitalAssistant)。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(AdHoc网络)等。本领域技术人员应能理解,其他的用户设备、网络设备、网络同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。图2示出根据本发明的一种基于图片来搜索视频的方法示意图,如图2所示,该方法包括步骤:在步骤S201中,用户设备1向网络设备2发送查询请求,用以请求查询与待查询图片对应的视频。以下通过两个示例来说明用户发起查询请求的过程:示例1:用户经由用户设备1来访问网络设备2,在浏览其上显示的图片时,通过选择待查询图片向网络设备2发起查询请求,请求查询与所选择的待查询图片对应的视频。示例2:当用户经由用户设备1浏览某个网站时选择一张图片,该网站所在的网络服务器向用户设备1反馈该图片的网络地址,用户设备1随后向网络设备2发送查询请求,该查询请求中包括待查询图片的网络地址,网络设备2通过访问该网络地址可获得待查询图片。在步骤S202中,网络设备2获取用户选择的待查询图片,对待查询图片进行图像识别,以获得待查询图片的图片特征,该图片特征包含除图片尺寸、像素以外的多个图像特征值。图像识别过程是在图片像素中选择若干个像素子集,这些像素子集可以是属于同一个亮度或色度范围的连续区域或连续曲线段;然后通过计算这些连续区域或连续曲线段的相互关系,包括相互之间的方位、尺寸比例、亮度或色度差值来获得一系列特征值,从而,无论该图片的尺寸或像素值是否改变,均可以利用图片特征识别出同一图片。本领域技术人员应理解,上述图像识别过程仅为例举,其他图像识别技术同样适用于本发明,也应包含在本发明的保护范围中,并在此以引用方式包含于此。随后,在步骤S203中,网络设备2根据提取的图片特征在图片索引库中进行查询,以确定具有相同图片特征的预存图片,并获取预存图片的ID。预存图片ID是建立与更新图片索引库时为图片分配并相关联保存的图片ID。随后,在步骤S204中,网络设备2根据所获取的具有与待查询图片相同图片特征的预存图片的ID,在视频索引库中搜索与该图片ID对应的视频的相关信息,该视频相关信息包含与该图片的ID对应的视频的网络地址,包括但不限于该视频所在网页的URL。其中,该视频索引库是预先建立的包含多个视频与多个图片ID之间索引关系的数据库。在一个优选实施例中,网络设备2还可以通过人工或网络抓取技术(Spider)来获取大量图片,并建立图片索引库。图3示出该建立图片索引库的过程:在步骤S301中,网络设备2通过人工或Sipder自动访问大量网页来抓取图片,并通过上述步骤S202中相同的图像识别技术提取所抓取图片的图片特征。在步骤S302中,网络设备2为所获取的图片分配图片ID,并在图片索引库中将图片特征与图片ID相互映射地保存,使得图片特征相同的图片具有相同的图片ID。因为图片特征相同的图片可具有相同的图片ID,因此,如果多个图片的,除图片尺寸和/或像素不同以外,其他图像特征值相同,则这多个图片可以分配相同的图片ID,此图片ID也可以称为图片组ID(GroupID)。在图片索引库中,图片与GroupID之间的映射关系如下表所示:图片1GroupID1图片2GroupID1图片3GroupID1图片4GroupID2图片5GroupID2图片6GroupID3图片7GroupID3图片8GroupID3图片9GroupID4......以下通过两个示例来说明获取图片的过程:示例3:网络设备2获取图片的网页地址,随后,通过该网页地址访问该网页所在的网络服务器,并从该网络服务器下载图片。其中,可以通过配置正则表达式来获取图片的网页地址。具体实施时,可以通过GIPS(GeneralImageProcessSystem)缩略图服务来下载图片。示例4:网络设备2通过访问基于WEB来播放视频的视频网站,并通过抓取正在网页上播放视频的视频网页,其中包括抓取时网页的视频播放框中所呈现的视频帧与网页的其他部分。随后,通过对抓取的视频网页进行解析,提取仅包含视频帧的视频图片并获取该视频图片的网页地址。本领域技术人员应理解以上示例仅为例举,其他获取图片的方式可适用于本发明,并应包含在本发明的保护范围中,在此以引用方式包含于此。在另一个优选实施例中,网络设备2还获取各图片对应的视频的的网络地址,包括但不限于该视频所在网页的URL,并根据图片ID与视频网页地址来建立包含多个视频与多个图片ID之间索引关系的数据库。以下通过一个示例来说明获取与图片对应的视频网页地址的过程:示例5:网络设备2在通过Sider访问网站,优选为视频网站,来抓取图片时,同时获取图片的相关信息,其中包括与图片对应的视频的网络地址,包括视频所在网页的视频网页地址。示例6:在上述示例2中,网络设备2访问正在网页上播放视频的视频网页,随后,除了提取仅包含视频帧的视频图片,还获取该视频图片的网页地址,从而可以建立该视频图片与视频网页地址之间的索引关系。本领域技术人员应理解以上示例仅为例举,其他获取视频网页地址的方式可适用于本发明,并应包含在本发明的保护范围中,在此以引用方式包含于此。以下通过一个示例来说明网络设备2建立视频网页地址和对应的图片ID之间的索引关系的过程:示例7:网络设备2根据视频网页地址与图片ID来生成索引文件,该索引文件的每一行分别包括不同的视频网页地址和视频网页所对应的图片ID,所述的视频网页是该行所包括视频网页地址对应的视频网页。例如,该索引文件每行的格式如下:视频网页URL\视频网页所对应的图片ID所生成的索引文件即为视频网页地址和图片ID之间的索引关系,将该索引文件作为视频网页地址和图片ID之间的索引关系保存在视频索引库中。优选地,如果需要返回的搜索结果除包含视频网页地址外,还包含该视频的其他属性,例如视频摘要等,以上建立视频网页地址和图片ID之间的索引关系还包括如下步骤:-为视频网页地址分别增加索引字段,取视频网页地址分别在所述索引文件中查找,如果在该索引文件中找到该视频网页地址,则将该视频网页地址对应的图片的ID写入所述索引字段;如果在该索引文件中没有找到该视频网页地址,则将所述索引字段留空;-将带有所述索引字段的视频网页地址作为所述视频网页地址和图片的ID之间的索引关系保存。本领域技术人员应理解以上示例仅为例举,其他建立视频网页地址与图片ID的方式可适用于本发明,并应包含在本发明的保护范围中,在此以引用方式包含于此。需要说明的是,其中,上述图片索引库与视频索引库包括但不限于各种关系型或XML数据库。图片索引库与视频索引库可以是分离的,也可以集成在一个数据库中。同样地,图片索引库与视频数据库可以集成于网络设备中,也可位于与之分离的一台网络设备或多个网络设备的集群中中,并通过网络相互连接。当图片索引库与视频索引库集成在一个数据库中时,也即将所述视频网页、视频网页地址、图片索引库、图片的网页地址、图片和ID之间的映射关系、以及视频网页地址和图片的ID之间的索引关系保存在同一个数据库中。图4示出了本发明的一种基于图片来搜索视频的装置示意图,如图4所示,该装置包括:第一获取装置41,用于获取用户选择的待查询图片。第一识别装置42,用于对所述待查询图片进行图像识别,获得该待查询图片的图片特征,该图片特征包括除图片尺寸与像素以外的多个图像特征值。图像识别过程是在图片像素中选择若干个像素子集,这些像素子集可以是属于同一个亮度或色度范围的连续区域或连续曲线段;然后通过计算这些连续区域或连续曲线段的相互关系,包括相互之间的方位、尺寸比例、亮度或色度差值来获得一系列特征值,从而,无论该图片的尺寸或像素值是否改变,均可以利用图片特征识别出同一图片。本领域技术人员应理解,上述图像识别过程仅为例举,其他图像识别技术同样适用于本发明,也应包含在本发明的保护范围中,并在此以引用方式包含于此。图片查询装置43,用于根据所述图片特征在图片索引库中进行查询,获得与所述待查询图片的图片特征相同的预存图片,并获取预存图片的ID。视频查询装置44,用于根据所获取的具有与待查询图片相同图片特征的预存图片的ID,在视频索引库中搜索与该图片ID对应的视频的相关信息,该视频相关信息包含与该图片的ID对应的视频的网络地址,包括但不限于该视频所在网页的URL。其中,该视频索引库是预先建立的包含多个视频与多个图片ID之间索引关系的数据库。在一个优选实施例中,还可以通过人工或网络抓取技术(Spider)来获取大量图片,并建立图片索引库,则本发明的一种基于图片来搜索视频的装置还可以包括:第二获取装置45,用于通过人工或Sipder自动访问大量网页来抓取图片。第二识别装置46,用于通过与第一识别装置相同的图像识别技术提取所抓取图片的图片特征。第一建立装置47,用于根据所获得的图片的图片特征,建立或更新图片索引库。其中,第一建立装置47可以包括:分配模块471,用于为待存入图片索引库中的图片分配图片ID;建立模块472,用于建立图片索引库中的图片和ID之间的映射关系,其中,图片特征相同的图片共享相同的ID。因为图片特征相同的图片可具有相同的图片ID,因此,如果多个图片的,除图片尺寸和/或像素不同以外,其他图像特征值相同,则这多个图片可以分配相同的图片ID,此图片ID也可以称为图片组ID(GroupID)。在图片索引库中,图片与GroupID之间的映射关系如下表所示:图片1GroupID1图片2GroupID1图片3GroupID1图片4GroupID2图片5GroupID2图片6GroupID3图片7GroupID3图片8GroupID3图片9GroupID4......第二获取装置可以包括:获取模块,用于获取视频网页;解析模块,对视频网页进行解析,提取图片及图片的网页地址。以下通过两个示例来说明第二获取装置获取图片的过程:示例8:第二获取装置获取图片的网页地址,随后,通过该网页地址访问该网页所在的网络服务器,并从该网络服务器下载图片。其中,可以通过配置正则表达式来获取图片的网页地址。具体实施时,可以通过GIPS(GeneralImageProcessSystem)缩略图服务来下载图片。示例9:第二获取装置通过访问基于WEB来播放视频的视频网站,并通过抓取正在网页上播放视频的视频网页,其中包括抓取时网页的视频播放框中所呈现的视频帧与网页的其他部分。随后,通过对抓取的视频网页进行解析,提取仅包含视频帧的视频图片并获取该视频图片的网页地址。本领域技术人员应理解以上示例仅为例举,其他获取图片的方式可适用于本发明,并应包含在本发明的保护范围中,在此以引用方式包含于此。在另一个优选实施例中,本发明的一种基于图片来搜索视频的装置还可以包括:第三获取装置,用于获取各图片对应的视频的网络地址,包括但不限于该视频所在网页的URL。第二建立装置,用于根据图片ID与视频网页地址来建立包含多个视频与多个图片ID之间索引关系的数据库。以下通过一个示例来说明获取与图片对应的视频网页地址的过程:示例10:第三获取装置在通过Sider访问网站,优选为视频网站,来抓取图片时,同时获取图片的相关信息,其中包括与图片对应的视频的网络地址,包括视频所在网页的视频网页地址。示例11:第三获取装置访问正在网页上播放视频的视频网页,随后,除了提取仅包含视频帧的视频图片,还获取该视频图片的网页地址,从而第二建立装置可以建立该视频图片与视频网页地址之间的索引关系。本领域技术人员应理解以上示例仅为例举,其他获取视频网页地址的方式可适用于本发明,并应包含在本发明的保护范围中,在此以引用方式包含于此。以下通过一个示例来说明第二建立装置建立视频网页地址和对应的图片ID之间的索引关系的过程:示例12:第二建立装置根据视频网页地址与图片ID来生成索引文件,该索引文件的每一行分别包括不同的视频网页地址和视频网页所对应的图片ID,所述的视频网页是该行所包括视频网页地址对应的视频网页。例如,该索引文件每行的格式如下:视频网页URL\视频网页所对应的图片ID所生成的索引文件即为视频网页地址和图片ID之间的索引关系,将该索引文件作为视频网页地址和图片ID之间的索引关系保存在视频索引库中。优选地,如果需要返回的搜索结果除包含视频网页地址外,还包含该视频的其他属性,例如视频摘要等,以上建立视频网页地址和图片ID之间的索引关系还可以为视频网页地址分别增加索引字段,取视频网页地址分别在所述索引文件中查找,如果在该索引文件中找到该视频网页地址,则将该视频网页地址对应的图片的ID写入所述索引字段;如果在该索引文件中没有找到该视频网页地址,则将所述索引字段留空;将带有所述索引字段的视频网页地址作为所述视频网页地址和图片的ID之间的索引关系保存。本领域技术人员应理解以上示例仅为例举,其他建立视频网页地址与图片ID的方式可适用于本发明,并应包含在本发明的保护范围中,在此以引用方式包含于此。需要说明的是,其中,上述图片索引库与视频索引库包括但不限于各种关系型或XML数据库。图片索引库与视频索引库可以是分离的,也可以集成在一个数据库中。同样地,图片索引库与视频数据库可以集成于网络设备中,也可位于与之分离的一台网络设备或多个网络设备的集群中中,并通过网络相互连接。当图片索引库与视频索引库集成在一个数据库中时,也即将所述视频网页、视频网页地址、图片索引库、图片的网页地址、图片和ID之间的映射关系、以及视频网页地址和图片的ID之间的索引关系保存在同一个数据库中。与现有技术相比,本发明通过对用户选择的图片进行图像识别,在图片索引库中搜索到和用户选择图片内容相同的图片,获得图片索引库中该图片预先分配的ID,以及根据预先建立的视频网页地址与该ID之间的索引关系,搜索到相应的视频网页地址,实现了根据用户选择的图片搜索到该图片对应的视频资源。需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1