基于验证码的图片标注系统、方法、存储介质及图片识别自学习系统与流程

文档序号:18901273发布日期:2019-10-18 21:58阅读:366来源:国知局
基于验证码的图片标注系统、方法、存储介质及图片识别自学习系统与流程

本发明涉及图片标注技术领域,尤其涉及基于验证码技术的图片标注系统、方法、存储介质及图片识别自学习系统。



背景技术:

现有技术为了实现图像识别技术,通常会采用神经网络技术并辅以深度学习技术来对预设的神经网络进行训练,从而提高图像识别率,然而神经网络的训练需要庞大数量的高质量被识别的物体图像和对应物体名字标签的数据集来支撑,因此依靠人工手段提供筛选后的图片及对应标签的方式显然不够效率和经济。

因此现有技术中,提出了一种可以借助人们上网时的时间碎片,来对图像进行标注的手段,从而为获取大量训练素材提供了一种渠道,例如典型的应用场景中,大多验证码(captcha)系统已经开始采用此类方式,即一般形式是用户需要指出服务器发送过来的图片所代表的内容(如图1所示)同时上述验证码系统中的图片来源,一般可以从互联网中使用关键字爬取对应图片。

但发明人发现,上述现有技术由于采用关键词爬取技术来寻找对应图片,因此仅仅只能对该图片所代表的内容打上概括性描述标签,如图1所示,只能要求找到含有猫的图片,并对该图片打上猫的标签,而除此之外还有大量不能通过关键字爬取到的含有特定特征组合的图片,比如含有某些食材的菜品图片,这些图片中的某些特定食材特征与原物食材的基本特征可能是大相径庭,比如咖喱土豆鸡(仅为示意俗称,实际中各菜品图片可能并没有名称或仅有概括性的名称标签,如:中餐,西餐,粤菜,本帮菜等),由于鸡和土豆被剁碎成块,因此菜品中的鸡和土豆的特征与原物基本特征差距甚远,依靠网络爬取的此类图片显然无法成为神经网络深度学习的素材。

因此本领域技术人员亟待一种能够针对图片中的组成特征进行高效识别及标注的技术出现,从而解决上述技术难题。



技术实现要素:

本发明的主要目的在于提供一种基于验证码的图片标注系统及方法,以利用验证码技术有效判别图片中的组成特征并标注。

为了实现上述目的,根据本发明的一个方面,提供了一种基于验证码的图片标注系统,其包括:服务器向被验证方示出验证图片及特征标签选项,其中所述服务器内存储有图片库,标签列表,对应关系库,所述服务器示出图片库中的验证图片及标签列表中的特征标签供被验证方选取,所述服务器记录该次选取的对应关系,并存储至对应关系库中,所述服务器分析对应关系库中验证图片与各特征标签之间的被选率,并根据预设被选率范围动态调整各特征标签与验证图片之间的确定对应关系。

优选地,所述服务器统计各特征标签对应各验证图片的共同示出次数及被选次数,以获取对应验证图片的各特征标签概率,并逐渐根据预设概率范围筛选与各验证图片再次共同示出的特征标签。

优选地,所述服务器向被验证方示出至少两组验证图片及特征标签选项,其中至少一组验证图片及特征标签具有确定对应关系,其中当所述服务器判断被验证方正确选择了其中一组具有确定对应关系的验证图片及特征标签选项后,所述服务器记录本次另一组验证图片及特征标签的对应关系。

优选地,其中确定对应关系的所述特征标签为验证图片中含有的组成特征。

优选地,所述图片库中的验证图片经由所述服务器从网络爬取。

优选地,所述图片库中存储的验证图片为组合物图片包括:菜品图片,所述标签列表中存储有食材特征标签。

为了实现上述目的,根据本发明的另一个方面,还提供了一种基于验证码的图片标注方法,步骤包括:服务器向被验证方示出至少两组验证图片及标签选项,其中至少一组验证图片及特征标签具有确定对应关系;当服务器判断被验证方正确选择了其中一组具有确定对应关系的验证图片及特征标签选项后;服务器记录本次另一组验证图片及特征标签的对应关系;服务器依据对应关系库分析验证图片与各特征标签之间的被选概率,动态调整预设被选概率范围内的验证图片与各特征标签之间的确定对应关系。

优选地,该基于验证码的图片标注方法步骤还包括:所述服务器统计各特征标签对应各验证图片的共同示出次数及被选次数,以获取对应验证图片的各特征标签概率,并逐渐根据预设概率范围筛选与各验证图片再次共同示出的特征标签。

上述发明的优点在于,通过本发明提供的基于验证码的图片标注系统及方法,能够有效判别图片中的组成特征,并加以标注,从而将网络中大量现有技术无法标注的图片利用起来,有效增加了神经网络训练素材量。

本发明的另一个目的在于提供一种存储介质,以供计算机执行后利用含有基于验证码的图片标注方法,来高效识别图片中的组成特征并标注。

为了实现上述目的,根据本发明的另一个方面,还提供了一种存储介质,以供计算机读取,所述存储介质上存储有指令,所述指令用于使得计算机执行基于验证码的图片标注方法。

上述发明的优点在于,通过本发明提供的一种存储介质,能够利用计算机执行含有基于验证码的图片标注方法后,有效判别图片中的组成特征,并加以标注,从而将网络中大量现有技术无法标注的图片利用起来,有效增加了神经网络训练素材量。

本发明的另一个目的在于提供一种采用基于验证码的图片标注方法的图片识别自学习系统,以利用验证码技术高效识别图片中的组成特征并标注以供神经网络高效学习。

为了实现上述目的,根据本发明的另一个方面,还提供了一种图片识别自学习系统,包括采用基于验证码的图片标注系统搜集图片及其特征标签信息,并向卷积神经网络传输。

上述发明的优点在于,通过本发明提供的图片识别自学习系统,能够为卷积神经网络,提供图片中有效判别的组成特征标签,从而将网络中大量现有技术无法标注的图片利用起来,有效增加了神经网络训练素材及模型量。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明背景技术中验证码技术的验证界面示意图;

图2是本发明的基于验证码的图片标注系统的验证界面示意图;

图3是本发明的基于验证码的图片标注系统的流程构架示意图;

图4是本发明的基于验证码的图片标注方法的流程图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

为了使本领域的技术人员更好的理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,在本领域普通技术人员没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。

请参阅图2至图3根据本发明的实施例,提供了一种基于验证码的图片标注系统及方法,以利用验证码技术有效判别图片中的组成特征并标注,具体来说该基于验证码的图片标注系统,主要包括:服务器向被验证方示出验证图片及特征标签选项,其中所述服务器内存储有图片库,标签列表,对应关系库,所述服务器示出图片库中的验证图片及标签列表中的特征标签供被验证方选取,所述服务器记录该次选取的对应关系,并存储至对应关系库中,所述服务器分析对应关系库中验证图片与各特征标签之间的被选率,并根据预设被选率范围动态调整各特征标签与验证图片之间的确定对应关系。

在优选实施方式下,其中确定对应关系的所述特征标签为验证图片中含有的组成特征。其中以该图片库中的验证图片内容为菜品为例,该菜品图可以是人工预先设置,但在优选实施方式下该图片库中的验证图片,也可经由所述服务器从英特网中爬取,如进行概括性的关键词爬取:中餐,西餐,粤菜,本帮菜等模糊性概括词,即可收集大量菜品图片(但若以土豆,葱,鸡肉,洋葱等具体食材关键词获取的图片,则可能只有食材的原本特征,而非融合在菜品中的特征,因此无法供神经网络准确学习)。

而本实施例中以含有咖喱土豆鸡肉的该第一菜品为例进行说明,其中该标签列表中存储有大量特征标签,以根据不同的图片关键词领域调取对应特征标签列表,例如在本实施例中,当该图片库准备示出该第一菜品图后,服务器获知该图片属于菜品领域,此时服务器将调取该标签列表中对应的食材特征标签,并随该第一菜品图片通过验证码技术向被验证者示出,例如该第一菜品图随附待选特征标签有,土豆,鸡肉,黄瓜,丝瓜,花生等食材标签,并以随机或顺序方式向不同的被验证方提供具有差异性食材标签。

例如a被验证者会获得土豆,鸡肉,黄瓜标签,而b验证者或获得鸡肉,丝瓜,花生标签,由此通过验证码技术,服务器可以搜集该第一菜品图对应标签的被选率,如:该第一菜品图,鸡肉被选率70%,土豆被选率65%,黄瓜被选率1%,丝瓜被选率0.5%,花生被选率0%,此时该预设被选率范围在优选实施方式中可以设定为50%以上则被保留,因此前2项高选率的特征标签,即可被动态的与该验证图片形成确定对应关系并存储在该对应关系库中。

而之所以上述高选率的特征标签被动态的与该验证图片形成确定对应关系,原因在于若第一菜品图是新加入图片库中的验证图片,则可能暂未有形成确定的对应关系,或已经形成确定的对应关系,但由于数据量的上升,造成被选率具有一定波动,从而会形成反复性的对应关系变化,因此采用动态方式调整对应关系的变化,直至数据量达到稳定后,则正确的食材标签自然是始终保持高选率的,也就自然的与该验证图片形成确定的对应关系了。

此外本实施例中的该预设被选率范围可根据经验及实际情况进行调整,本发明的实施例并不做出限制,本领域技术人员可以根据经验来进行自适应的预设,同时该预设被选率范围可以是被选率的百分比范围,如40%-100%被选率,也可以是特征标签的高选率排名位次,如前2位高选率的特征标签。

此外在优选实施方式下,为了进一步提高在验证码每次验证图片与示出的特征标签之间的对应关系,提高标签标注效率,所述服务器统计各特征标签对应各验证图片的共同示出次数及被选次数,以获取对应验证图片的各特征标签概率,并逐渐根据预设概率范围筛选与各验证图片再次共同示出的特征标签。

具体来说,还以上述第一菜品图为例,若随附待选特征标签有,土豆,鸡肉,黄瓜,丝瓜,花生等食材标签,当第一菜品图与花生标签同时示出的次数较多,但被选率却极低的情况下,可降低该花生标签与该第一菜品图同时示出的几率,甚至直接剔除第一菜品图中出现花生标签的几率,从而逐步减少第一菜品图所对应的特征标签数量,便于提高验证图片的识别和标识的效率。而本领域技术人员根据该优选实施例也可以理解反之,若第一菜品图与鸡肉标签同时示出的次数较多,而被选率也很高的情况下,也可适当提高该鸡肉标签与该第一菜品图同时示出的几率,从而加速验证该特征标签的被选率以加快确定对应关系。

此外在另一优选实施放下,为了确保验证码本身的验证效果并加以利用,所述服务器向被验证方示出至少两组验证图片及特征标签选项,其中至少一组验证图片及特征标签具有确定对应关系,其中当所述服务器判断被验证方正确选择了其中一组具有确定对应关系的验证图片及特征标签选项后,所述服务器记录本次另一组验证图片及特征标签的对应关系。

具体来说,即服务器同是示出两组验证图片及特征标签选项,但其中随机会有一组是已经有确定对应关系的特征标签的,该验证组用来维持验证码功能,而另一组标签组则是为了利用被验证人来进行图片标签标注的,因此被验证人无法知晓哪一组是用于验证的,从而必须认真对待这2组。

而另一方面为了减少验证图片的错误标签统计,降低服务器工作量,则在该验证过程中设置了仅在其中用于验证的一组选择正确时,才记录另一组的验证图片及特征标签的对应关系,从而进一步提高了图片标注效率

此外本领域技术人员根据上述实施例也可以理解,该标签组并非每次都会示出有可对应的特征标签的,因此上述实施例中允许该标签组在没有可对应的特征标签时,可以不选,从而便于服务器获悉此次与该验证图片同时示出的该特征标签不适用的信息,下次识别该验证图片时减少或剔除该些特征标签,从而缩小特征标签范围,提高该验证图片的识别和标识的效率。以加快确定对应关系。

请参阅图4,本发明的另一个方面,还提供了一种基于验证码的图片标注方法,步骤包括:服务器向被验证方示出至少两组验证图片及标签选项,其中至少一组验证图片及特征标签具有确定对应关系;当服务器判断被验证方正确选择了其中一组具有确定对应关系的验证图片及特征标签选项后;服务器记录本次另一组验证图片及特征标签的对应关系;服务器依据对应关系库分析验证图片与各特征标签之间的被选概率,动态调整预设被选概率范围内的验证图片与各特征标签之间的确定对应关系。

在优选实施方式下,该基于验证码的图片标注方法步骤还包括:所述服务器统计各特征标签对应各验证图片的共同示出次数及被选次数,以获取对应验证图片的各特征标签概率,并逐渐根据预设概率范围筛选与各验证图片再次共同示出的特征标签。

籍此通过本发明提供的基于验证码的图片标注系统及方法,能够有效判别图片中的组成特征,并加以标注,从而将网络中大量现有技术无法标注的图片利用起来,有效增加了神经网络训练素材量。

本发明的另一个方面还提供了一种存储介质,以供计算机执行含有基于验证码的图片标注方法,来高效识别图片中的组成特征并标注。具体来说,该存储介质用以供计算机读取,所述存储介质上存储有指令,所述指令用于使得计算机执行基于验证码的图片标注方法,籍此通过本发明的存储介质,能够利用计算机执行上述实施例中的基于验证码的图片标注方法后,有效判别图片中的组成特征,并加以标注,从而将网络中大量现有技术无法标注的图片利用起来,有效增加了神经网络训练素材量。

本发明的另一个方面还提供了一种采用基于验证码的图片标注方法的图片识别自学习系统,以利用验证码技术,高效识别图片中的组成特征并标注,以供神经网络高效深度学习。具体来说,该图片识别自学习系统,包括采用基于验证码的图片标注系统搜集图片及其特征标签信息,并向卷积神经网络传输,从而通过该图片识别自学习系统,能够为卷积神经网络,提供图片中有效判别的组成特征标签,从而将网络中大量现有技术无法标注的图片利用起来,有效增加了神经网络训练素材及模型量。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1