支持图像录入的检索方法和装置与流程

文档序号：20999045发布日期：2020-06-05 22:29阅读：229来源：国知局

本申请涉及软件领域，具体而言，涉及一种支持图像录入的检索方法和装置。

背景技术：

互联网上图像的数据信息日渐庞大，用户对网上图像搜索的要求也在不断提高，使各种基于web的图像搜索引擎应运而生。图像搜索引擎的出现，使用户对网上图像信息的搜索变得非常简单，尽管还不很完美，却已经可以满足用户的部分需求。

图像搜索引擎有一种是基于语义的检索，该检索方式需要为图像建立索引信息，能够进行图像分析和判别，为图像加注释，存储抽取出的索引信息建立索引库。

这种检索方式可以理解为一种语义层次的匹配。因此，需要人工提前对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类，给出描述词。这样才能够建立起比较健全的索引库。检索时，将主要在这些描述词中搜索用户输入的检索词。这种查询方式是比较准确的，一般来讲可以获得较好的查准率。

但是使用这种方式需要提前对大量的图片来进行描述，占用了大量的人工。因此，限制了可处理的图像数量，从而制约了图像的检索精度。

技术实现要素：

本申请提供一种支持图像录入的检索方法和装置，以解决相关技术中图片索引库中用于比对的图片需要人工预先设置文字索引所导致处理效率低的问题。

根据本申请的一个方面，提供了一种支持图像录入的检索方法，包括：获取关键词，其中，所述关键词用于指示待收集的图片的类型；使用检索词在互联网上进行检索，其中，所述检索词包括：所述关键词和图片，其中，’图片’本身作为一个词语为检索使用的检索词；在检索出的网页中获取该网页中的图像；获取所述网页的源代码，并查找该源代码中对应于所述图像的标签中对所述图像的文字描述；至少根据所述文字描述建立所述图像的文字索引，并将所述图像以及所述文字索引对应保存在数据库中。

进一步地，获取预先配置的关键词列表，其中，所述列表中包括多个关键词；

对于所述关键词列表中的每个关键词依次执行上述方法中的步骤。

进一步地，至少根据所述文字描述建立所述图像的文字索引包括：将所述文字描述本身作为所述图像的文字索引。

进一步地，所述标签为img标签，所述文字描述记载在img标签中的alt属性中。

根据本申请的另一个方面，还提供了一种支持图像录入的检索装置，包括：第一获取模块，用于获取关键词，其中，所述关键词用于指示待收集的图片的类型；检索模块，用于使用检索词在互联网上进行检索，其中，所述检索词包括：所述关键词和图片，其中，’图片’本身作为一个词语为检索使用的检索词；第二获取模块，用于在检索出的网页中获取该网页中的图像；第三获取模块，用于获取所述网页的源代码，并查找该源代码中对应于所述图像的标签中对所述图像的文字描述；建立模块，用于至少根据所述文字描述建立所述图像的文字索引，并将所述图像以及所述文字索引对应保存在数据库中。

进一步地，所述第一获取模块用于获取预先配置的关键词列表，并从所述关键词列表中依次获取每个关键词。

进一步地，所述建立模块用于：将所述文字描述本身作为所述图像的文字索引。

进一步地，所述标签为img标签，所述文字描述记载在img标签中的alt属性中。

根据本申请的另一个方面，还提供了一种存储器，用于存储软件，其中，所述软件用于执行上述的方法。

根据本申请的另一个方面，还提供一种处理器，用于执行软件，其中，所述软件用于执行上述的方法。

本申请采用以下步骤：获取关键词，其中，所述关键词用于指示待收集的图片的类型；使用检索词在互联网上进行检索，其中，所述检索词包括：所述关键词和图片，其中，’图片’本身作为一个词语为检索使用的检索词；在检索出的网页中获取该网页中的图像；获取所述网页的源代码，并查找该源代码中对应于所述图像的标签中对所述图像的文字描述；至少根据所述文字描述建立所述图像的文字索引，并将所述图像以及所述文字索引对应保存在数据库中。通过本申请解决了相关技术中图片索引库中用于比对的图片需要人工预先设置文字索引所导致处理效率低的问题，提高了图片索引库中图片和文字索引保存的效率。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例提供的支持图像录入的检索方法的流程图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

在本实施例中，提供了一种支持图像录入的检索方法，图1是根据本发明实施例的支持图像录入的检索方法的流程图，如图1所示，该方法包括如下步骤：

步骤s102，获取关键词，其中，关键词用于指示待收集的图片的类型；

步骤s104，使用检索词在互联网上进行检索，其中，检索词包括：关键词和图片，其中，’图片’本身作为一个词语为检索使用的检索词；

例如，如果使用鲜花作为关键词，此时在互联网上进行检索的时候使用：鲜花和图片，这两个词作为关键词来进行检索。

步骤s106，在检索出的网页中获取该网页中的图像；

步骤s108，获取网页的源代码，并查找该源代码中对应于图像的标签中对图像的文字描述；

在实施时可以增加如下可选实施方式：除了将图像中的标签中的内容作为所述图像的文字描述之外，还可以额外增加另外的文字描述，这是因为：文字描述越多对建立起的图像数据库越便于使用。增加的额外的文字描述可以是：图像的文件名或目录名、路径名、链路以及图像周围的文本信息等外部信息，在找出图像文件后，将图像的文件名或目录名、路径名、链路以及图像周围的文本信息作为文字描述也建立与改图像的对应关系。

步骤s110，至少根据文字描述建立图像的文字索引，并将图像以及文字索引对应保存在数据库中。

在实施时还可以增加如下实施方式，在保存到数据库中之后，由人工进行修改。在数据库中还可以记录该图片的来源网站，例如来自a网站。如果人工修改的内容比较少，则获取该图像的来源地址，下次进行图片是优先检索该来源地址中的图片。

可选的，在实施时，数据库中可以记载两种文字描述，一种是通过上述步骤自动生成的，另一种是人工修正后的。此时，可以利用程序比较人工修正后的文字描述和人工修正前文字描述，按照图像来源的网址统计修正所占的比例，如果所占的比例低于阈值，则下次优先从该网址检索图像。

在实施时还可以增加如下实施方式：可以训练一个机器学习模型，该模型是使用多组训练数据训练得到的，其中每一组训练数据均包括：修正前的文字描述和修正后的文字描述，该模型训练好之后，输入时自动获取到的文字描述，输出是修正后的文字描述，这样可以将人工修改变成自动修改，进一步提高效率。

通过本申请解决了相关技术中图片索引库中用于比对的图片需要人工预先设置文字索引所导致处理效率低的问题，提高了图片索引库中图片和文字索引保存的效率。

可选地，获取预先配置的关键词列表，其中，列表中包括多个关键词；对于关键词列表中的每个关键词依次执行上述方法中的步骤。例如，数据库中需要收集多种类型的图片，则可以在关键词列表中增加如下关键词：动物、植物、广告、运动。然后对这些关键词依次执行上述步骤s102至步骤s110。

可选地，至少根据文字描述建立图像的文字索引包括：将文字描述本身作为图像的文字索引。

在实施时可以增加如下可选实施方式：还可以将所述文字描述，和/或图像的文件名或目录名、路径名、链路以及图像周围的文本信息等外部信息进行分词，将分出的每一个词均作为一个文字描述标签，这样一张图片将对应多个文字描述标签。

分词可以是基于统计的分词，下面对此进行说明。

基于统计的分词方法是在给定大量已经分词的文本的前提下，利用统计机器学习分模型学习词语切分的规律(称为训练)，从而实现对未知文本的切分。例如最大概率分词方法和最大熵分词方法等。随着大规模语料库的建立，统计机器学习方法的研究和发展，基于统计的中文分词方法渐渐变得精确。

主要的统计模型有：n元文法模型(n-gram)，隐马尔可夫模型(hiddenmarkovmodel，hmm)，最大熵模型(me)，条件随机场模型(conditionalrandomfields，crf)等。在实际的应用中，基于统计的分词系统都需要使用分词词典来进行字符串匹配分词，同时使用统计方法识别一些新词，即将字符串频率统计和字符串匹配结合起来，既发挥匹配分词切分速度快、效率高的特点，又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。

可选地，标签为img标签，文字描述记载在img标签中的alt属性中。

例如，可以通过两个html标签，即imgsrc和href来检测是否存在可显示的图像文件，imgsrc表示“显示下面的图像文件”，而href则表示“下面是一个链接”，这两种标签经常导向一个图像文件。搜索引擎通过检查文件扩展名来判断链接的是否是图像文件。如果文件扩展名是.gif或.jpg，那它就是一个可显示的图像。

一个通常的img标签属性如下：

<imgsrc＝"/i/eg_tulip.jpg"alt＝"上海鲜花港-郁金香"/>

在这个img标签中，alt表示的是如果浏览器无法显示该图像，在原本显示图片的位置就显示该文字说明：“上海鲜花港-郁金香”。

在本实施例中还提供了一种装置，该装置中的模块对应于上述的方法步骤，在上述实施例中已经进行过说明的，在此不再赘述。

在本实施例中还提供了一种支持图像录入的检索装置，包括：第一获取模块，用于获取关键词，其中，关键词用于指示待收集的图片的类型；检索模块，用于使用检索词在互联网上进行检索，其中，检索词包括：关键词和图片，其中，’图片’本身作为一个词语为检索使用的检索词；第二获取模块，用于在检索出的网页中获取该网页中的图像；第三获取模块，用于获取网页的源代码，并查找该源代码中对应于图像的标签中对图像的文字描述；建立模块，用于至少根据文字描述建立图像的文字索引，并将图像以及文字索引对应保存在数据库中。

可选地，第一获取模块用于获取预先配置的关键词列表，并从关键词列表中依次获取每个关键词。

可选地，建立模块用于：将文字描述本身作为图像的文字索引。

可选地，标签为img标签，文字描述记载在img标签中的alt属性中。

在本实施例中，提供了一种存储器，用于存储软件，其中，该软件用于执行上述的方法。

在本实施例中，提供了一种处理器，用于执行软件，其中，该软件用于执行上述的方法。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本发明实施例提供了一种存储介质，其上存储有程序或者软件，该程序被处理器执行时实现上述方法。存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)，存储器包括至少一个存储芯片。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑红
技术所有人：郑红
我是此专利的发明人

上一篇：一种治疗和/或预防消化系统疾病的物质及其设计方法和制备方法与流程
上一篇：一种铝箔腐蚀线放箔机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。