图片的标注方法、装置及电子设备与流程

文档序号:27101255发布日期:2021-10-27 17:43阅读:81来源:国知局
图片的标注方法、装置及电子设备与流程

1.本公开涉及图像处理领域,尤其涉及数据标注、计算机视觉等人工智能领域,可应用于无人驾驶、智能安防等场景下。


背景技术:

2.随着人工智能算法发展的迅速,数据标注成为了为人工智能算法提供训练数据的行业,其中,图片标注数据是视觉类人工智能算法应用最为广泛的数据。相关技术中,多使用网页版工具对连续图片进行标注,以生成图片标注数据,进而导致对计算机资源占用过多,以及作业人员的等待时间较长等相关问题,使得图片标注的效率以及连续性受到了一定的影响。
3.因此,如何保证图片标注的连续性,同时降低对计算机资源的占用进而提高图片标注的效率,成为了目前需要解决的问题。


技术实现要素:

4.本公开提供了一种图片的标注方法、装置、电子设备、存储介质及计算机程序产品。
5.根据本公开的第一方面,提供了一种图片的标注方法,包括:响应于图片加载指令,根据所述图片加载指令确定基准图片;根据所述基准图片和资源池的图片承载数量,确定需要向所述资源池中加载的第一图片;确定所述资源池已经加载的第二图片,并根据所述第一图片和所述第二图片,向所述资源池中加载目标图片,其中,每次加载结束后所述资源池内加载的图片为帧编号连续的图片;基于所述资源池中加载的所述帧编号连续的图片进行图片标注。
6.根据本公开的第二方面,提供了一种图片的标注装置,包括:获取模块,用于响应于图片加载指令,根据所述图片加载指令确定基准图片;确定模块,用于根据所述基准图片和资源池的图片承载数量,确定需要向所述资源池中加载的第一图片;加载模块,用于确定所述资源池已经加载的第二图片,并根据所述第一图片和所述第二图片,向所述资源池中加载目标图片,其中,每次加载结束后所述资源池内加载的图片为帧编号连续的图片;标注模块,用于基于所述资源池中加载的所述帧编号连续的图片进行图片标注。
7.根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面中任一项所述的图片的标注方法。
8.根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面中任一项所述的图片的标注方法。
9.根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算
机程序在被处理器执行时实现执行上述第一方面中任一项所述的图片的标注方法。
10.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
11.附图用于更好地理解本方案,不构成对本公开的限定。其中:
12.图1为本公开一实施例的图片的标注方法的流程示意图;
13.图2为本公开另一实施例的图片的标注方法的流程示意图;
14.图3为本公开另一实施例的图片的标注方法的流程示意图;
15.图4为本公开另一实施例的图片的标注方法的流程示意图;
16.图5为本公开另一实施例的图片的标注方法的流程示意图;
17.图6为本公开另一实施例的图片的标注方法的流程示意图;
18.图7为本公开一实施例的图片的标注装置的结构示意图;
19.图8为本公开另一实施例的图片的标注装置的结构示意图;
20.图9为本公开一实施例的电子设备的示意性框图。
具体实施方式
21.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
22.图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素。图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。
23.数据标注(data annotation),是通过数据加工人员借助标记工具,对人工智能学习数据进行加工的一种行为。包括对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作,为待标注数据增加标签,生产满足机器学习训练要求的机器可读数据编码。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3d画框、文本转录、图像打点、目标物体轮廓线等。
24.计算机视觉(computer vision),是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取

信息’的人工智能系统。这里所指的信息指shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
25.人工智能(artificial intelligence,简称ai),是研究使计算机来模拟人类的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软
件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图技术等几大方面。
26.图1为本公开一实施例的图片的标注方法的流程示意图,如图1所示,该方法包括:
27.s101,响应于图片加载指令,根据图片加载指令确定基准图片。
28.实现中,对于图片进行的标注会在计算机上执行,计算机可以基于不同的指令执行不同的动作,比如,基于获取到的图片加载指令,可以对需要加载的图片资源进行加载。
29.其中,对于图片的加载指令,可以是作业人员打开设定的图片标注操作界面时自动触发,也可以是作业人员基于设定的操作流程生成,还可以是其他可以生成加载指令的方法,此处不做限定。
30.本公开实施例中,计算机获取到的图片的加载指令中可以包含多个指令信息,比如待加载的图片类型、图片数量等等,计算机可以基于加载指令可以确定待加载图片的范围,进而实现对于该部分图片的加载。
31.进一步地,为了保证图片加载的准确性,在进行图片加载前,需要确定待加载图片中的基准图片。
32.可选地,在首次向资源池进行图片加载时,可以将待加载图片中的首帧图片确定为基准图片。
33.可选地,在非首次向资源池进行图片加载时,可以将当前的设定图片标注操作界面所显示的图片确定为基准图片。
34.进一步地,计算机获取到加载指令对图片加载时,基准图片会作为第一张被加载的图片。
35.s102,根据基准图片和资源池的图片承载数量,确定需要向资源池中加载的第一图片。
36.实现中,图片的加载需要时间,因此,在进行图片标注的操作时,往往会因为图片的加载时间导致操作无法连续。相应的,由于图片加载对计算机的资源占用过多,还会导致计算机的卡顿现象,进一步地降低了图片标注的效率。
37.可选地,为了避免上述情况对图片标注效率的影响,可以为图片标注作业中所需的图片构建资源池,计算机在获取到加载指令后,基于加载指令将需要加载的图片加载至资源池中。
38.进一步地,基于计算机的可分配资源,可以构建能够承载一定数量的图片的资源池,由于构建的资源池存在容量的上限,因此,需要分批次的将所需的图片加载至资源池中。
39.其中,可以基于资源池的容量以及需要加载至资源池中的图片的大小,确定资源池可承载的图片数量。进一步地,基于资源池可承载的图片数量以及基准图片,确定需要向资源池加载的第一图片。
40.其中,待加载的图片存在各自对应的帧编号,且相邻的图片帧编号是连续的。
41.可选地,当确定的基准图片为待加载图片的首帧图片时,此时的资源池处于空闲状态,因此,以基准图片为加载的起始图片,基于当前资源池可承载的图片数量n,获取全部的待加载图片中帧编号位于前n个位置的图片,可以将这部分应该加载至资源池的图片确定为第一图片。
42.可选地,当确定的基准图片为待加载图片的非首帧图片时,为了保证图片标注结果的连续性,需要以基准图片对应的帧编号为基准,基于当前资源池可承载的一半的图片数量n/2,从基准图片对应的帧编号的前向以及后向分别获取n/2个图片,并将获取到的图片确定为需要加载至资源池的第一图片。
43.比如,设定待加载的图片大小为p,资源池的容量为m,则资源池可承载的图片数量n为n=m/p。
44.进一步地,设定n为200,在首次向资源池加载图片的场景下,可以将第1帧的待加载图片确定为基准图片,从第1帧开始获取位于前200位置的帧编号对应的图片。并将该200张待标注图片确定为第一图片。
45.在非首次向资源池加载图片的场景下,设定当前在图片标注的操作界面显示的图片为第150帧图片,则将第150帧图片确定为基准图片,分别从第150帧图片开始基于帧序的倒序获取100张待标注图片,以及基于帧序的正序获取100张待标注图片,则将该201张图片确定为第一图片。
46.s103,确定资源池已经加载的第二图片,并根据第一图片和第二图片,向资源池中加载目标图片,其中,每次加载结束后资源池内加载的图片为帧编号连续的图片。
47.实现中,在进行图片标注时,可以从资源池中直接调取已经加载完毕的图片,由于资源池的存在容量上限,因此,可以将部分图片其释放出资源池,进而获取部分空间加载需要加载至资源池中的待加载图片。
48.其中,可以将资源池中已加载完毕的图片确定为第二图片。
49.可以理解为,在非首次向资源池加载图片的场景下,资源池中已经存在部分加载完毕可以被调取查看的图片,可以将该部分图片确定为第二图片。
50.进一步地,第一图片体现了需要加载至资源池的图片,第二图片体现了资源池中已经加载完毕的图片,因此,基于第一图片与第二图片,可以确定能够在本次加载至资源池的目标图片。
51.可选地,在资源池处于空的状态的场景中,资源池中不存在第二图片,因此,可以将需要加载至资源池的第一图片,确定为本次加载至资源池的目标图片。
52.可选地,在资源池中存在第二图片的场景中,为了保证资源池中存在空闲的容量承载需要加载至其中的第一图片,可以在资源池中的第二图片中,确定其中符合释放标准的第二图片,基于第一图片以及需要释放的第二图片,进而确定本次加载至资源池中的目标图片。其中,设定符合释放标准的第二图片的数量为x,则可以从第一图片中的最小帧编号开始,获取共计x个帧编号对应的第一图片,该部分图片即为本次加载至资源池的目标图片。
53.需要说明的是,完成每次的图片加载后,资源池中的已加载图片的帧编号是连续的。
54.s104,基于资源池中加载的帧编号连续的图片进行图片标注。
55.图片加载完毕后,资源池中存在已经加载完毕的帧编号连续的图片,基于该部分已经加载完成的图片,可以在图片标注的操作过程中,节省掉图片加载的环节,使得图片标注的效率得到了保证。
56.进一步地,可以从资源池中调取已加载的图片,并对其进行图片标注。
57.可选地,可以对图片中的特征进行标注,提取出图片中的特征数据。其中,对于连续图片进行的图片标注获取到的特征数据存在连续性。因此,在进行图片标注时可以不停地从资源池中调取当前帧图片的前后帧图片,切换进行查看,进而保证标注结果的准确性以及连续性。
58.本公开提出的图片的标注方法,基于计算机的可分配资源构建设定容量的资源池,基于获取到的加载指令确定需要待加载图片的基准图片,并基于基准图片以及资源池的可承载图片数量,确定可以加载至资源池的第一图片。进一步地,结合资源池中已加载的第二图片,确定向资源池加载的目标图片。进一步地,从资源池中调取图片进行图片标注,进而获取图片标注数据。本公开中,通过加载指令,精准地确定了需要加载至资源池的图片中的基准图片,将待加载图片按序分批加载至资源池中,使得可以从资源池直接调取已经加载完毕的图片进行图片标注,降低了图片加载对于计算机资源的占用,实现了图片的连续切换,保证了对于图片标注结果的连续性判断的准确性,提高了图片标注的效率以及准确率。
59.上述实施例中,关于第一图片,可结合图2进一步理解,图2为本公开另一实施例的图片的标注方法的流程示意图,如图2所示,该方法包括:
60.s201,根据图片承载数量和基准图片的基准帧编号,确定需要加载至资源池中的第一图片的最小帧编号和最大帧编号。
61.实现中,资源池存在容量上限,因此,当待加载图片的数量超过资源池可承载的图片数量时,需要将待加载图片基于设定的顺序分批次的加载至资源池中。
62.其中,可以基于资源池可承载的图片数量以及基准图片,确定加载至资源池的第一图片。
63.进一步地,待加载的图片存在各自对应的帧编号,且全部的帧编号是连续的,因此,可以基于第一图片中的待加载图片的全部的帧编号,确定第一图片的最小帧编号以及最大帧编号。
64.可选地,针对首次的向资源池进行的图片加载,可以包括:
65.将基准图片的基准帧编号确定为最小帧编号。
66.本公开实施例中,向资源池加载图片时,是基于待加载图片的帧编号的顺序按序加载的,可以理解为,帧编号排序靠前的待加载图片会先于帧编号靠后的待加载图片加载至资源池。
67.进一步地,可以将待加载图片中第一张加载至资源池的图片确定为基准图片,其对应的帧编号为基准帧编号。其中,基准帧编号为全部的待加载图片对应的帧编号中的最小帧编号。
68.进一步地,将基准帧编号和图片承载数量的和值,确定为最大帧编号。
69.本公开实施例中,在首次对资源池进行待标注图片加载时,可以基于资源池可以承载的图片数量的上限,将一定数量的待加载图片加载至资源池中。
70.其中,可以将基准帧编号和资源池可承载的图片数量的上限值进行加和,并将获取到的和值确定为首次加载至资源池的待加载图片中的最大帧编号。
71.进一步地,确定第一图片的最小帧编号以及最大帧编号。
72.可选地,针对非首次向资源池进行的图片加载,可以包括:
73.获取图片承载数量的一半向下取整和上向取值,分别得到第一数值和第二数值。
74.本公开实施例中,进行图片标注操作时,为了保证图片标注结果的连续性,会不停的切换与当前显示的图片处于上下帧关系的图片进行查看。
75.其中,图片的帧切换可以是被动,也可以是主动的。
76.进一步地,当图片处于被动切帧时,可以理解为,是作业人员基于通过设定的操作实现的图片的切帧。
77.比如,设定图片a对应的帧编号为a,则需要切换至图片a时,可以通过操作界面中设定的“上一帧”和/或“下一帧”的按钮进行上下帧切换直至切换至图片a,也可以通过设定的快捷键进行上下帧的切换直至切换至图片a,还可以将帧编号a输入至设定的位置从而直接调取查看图片a以实现对图片a的切换。
78.进一步地,当图片处于主动切帧时,可以理解为,图片在进行连续的播放。
79.可选地,若图片被动切帧和/或主动切帧时,可以将切换后需要显示的图片确定为基准图片,并将其对应帧编号确定为基准帧编号。
80.为了保证图片标注结果的连续性,在图片标注过程中,不仅需要查看资源池中已经标注过的图片,还需要查看资源池中的图片。因此,在图片的被动切帧的过程中,可以将基准帧作为标准,在基准帧的前后分别加载一定数量的图片。
81.进一步地,基于资源池可承载的图片数量,在基准帧之前的帧编号对应的图片中加载资源池可承载的一半数量的图片,相应地,在基准帧之后的帧编号对应的图片中加载资源池可承载的一半数量的图片。
82.可以理解为,获取资源池可承载的图片数量的一半的值,基于基准帧的帧编号向上获取该值对应的图片数量,进而确定第一数值。相应地,基于基准帧的帧编号向下获取该值对应的图片数量,进而确定第二数值。
83.其中,资源池可承载的图片数量可以为奇数,也可以为偶数。当资源池可承载的图片数量为奇数时,其一半的取值并非整数。
84.该场景下,若图片被动切帧,则将基于其切帧的方向对应的第一数值或第二数值加一,可以理解为,在其切帧方向多加载一帧图片。若图片主动切帧时,则将基于其播放后续方向对应的第一数值或第二数值加一,可以理解为,在其播放后续方向多加载一帧图片。
85.比如,资源池可承载的图片数量为n,则当图片被动切帧和/或主动切帧时,设定基准图片以及其对应的基准帧编号后,则可以在基准帧前后各加载n/2张图片。进一步地,当n为奇数时,n/2的计算结果为非整数,因此,可以在切帧方向和/或播放后续方向多加载一帧。
86.进一步地,确定上向的第一数值以及向下的第二数值。
87.将基准图片的基准帧编号与第一数值的差值,确定为最小帧编号。
88.本公开实施例中,第一数值为基准帧的上向方向的图片对应的数值,基准帧上向方向的图片对应的帧编号均小于基准帧编号,因此,可以将基准帧编号与第一数值做差,获取到的差值可以确定为第一图片中的最小帧编号。
89.将基准帧编号与第二数值的和值,确定为最大帧编号。
90.本公开实施例中,第二数值为基准帧的向下方向的图片对应的数值,基准帧的向下方向的图片对应的帧编号均大于基准帧编号,因此,可以将基准帧编号与第二数值加和,
获取到的和值可以确定为第一图片中的最大帧编号。
91.本公开提供的图片标注方法,基于资源池的图片承载数量以及基准图片的基准帧编号,可以确定第一图片中的最小帧编号和最大帧编号,进而确定可以加载至资源池的第一图片,使得后续的图片标注过程中,可以降低图片加载对于计算机资源的占用,有效保证了对于图片标注结果的连续性判断的准确性,提高了图片标注的效率以及准确率。
92.上述实施例中,关于基准图片的确认,可结合图3进一步理解,图3为本公开另一实施例的图片的标注方法的流程示意图,如图3所示,该方法包括:
93.s301,响应于图片加载指令为启动目标应用程序时所触发的指令,确定基准图片为目标应用程序退出时播放的图片,或者新的标注任务对应的图片集中的第一帧图片。
94.实现中,对于数量较大的图片进行图片标注,存在可能无法通过一次作业完成,因此,每一次的图片标注作业,可以是继续对未完成的图片标注任务进行操作,也可以是对新的图片标注任务进行操作。
95.进一步地,可以将进行图片标注时所使用的程序确定为目标应用程序。
96.可选地,若当前进行的图片标注是针对未完成的图片标注任务,则该场景下,作业人员启动目标应用程序后可以触发图片加载指令,基于该加载指令,计算机会向资源池加载作业需要的图片。
97.其中,目标应用程序在前一次的图片标注作业结束时,其界面存在正在显示的图片,即为前一次图片标注操作的最后一张图片,可以将该图片确定为本次图片加载的基准图片。基于基准图片以及资源池的图片承载的数量,可以确定本次加载至资源池的图片数量。
98.可选地,若当前进行的图片标注是针对新的标注任务,则该场景下,可以将新的图片标注任务对应的图片中的首帧图片确定为基准图片,基于该基准图片与资源池可承载的图片数量,确定本次加载至资源池的图片数量。
99.本公开提出的图片的标注方法,可以基于不同的场景,确定其对应的基准图片,保证了后续加载至资源池的图片的准确性,进而保证了图片标注的准确率。
100.进一步地,关于基准图片的确定还可以结合图4,图4为本公开另一实施例的图片的标注方法的流程示意图,如图4所示,该方法包括:
101.s401,响应于图片加载指令为帧切换指令,根据帧切换指令中携带的切换后图片确定基准图片。
102.在图片标注作业的过程中,基于图片的帧切换的需求,可以对计算机发送加载指令,该加载指令中携带有作业人员所需的图片切换信息。
103.进一步地,帧切换可以是图片的被动切帧,也可以是图片的主动切帧。
104.其中,图片的被动切帧是基于作业人员的人工操作实现的,可以通过操作界面中设定的“上一帧”和/或“下一帧”的按钮实现图片的被动切帧,,也可以通过设定的快捷键进行上下帧的切换进而实现图片的被动切帧,还可以将帧编号输入至设定的位置从而直接调取帧编号对应的图片进而实现图片的被动切帧。
105.其中,图片的主动切帧是图片在进行连续播放时所需的切帧状态。
106.可选地,可以将帧切换后需要调取查看的图片确定为基准图片。
107.本公开提供的图片的标注方法,针对图片切帧的场景,确定相应的基准图片,保证
了后续加载至资源池的图片的准确性,进而保证了对图片标注结果的连续性判断的准确性,提高了图片标注的效率以及准确率。
108.上述实施例的基础上,确定第一图片后,需要进一步的确定资源池中第二图片的相关信息,进而可以精准确定加载至资源池中的目标图片。
109.作为其中一种情况,资源池中不存在第二图片的场景下,可结合图5进一步理解,图5为本公开另一实施例的图片的标注方法的流程示意图,如图5所示,该方法包括:
110.s501,确定资源池中无第二图片。
111.本公开实施例中,第二图片为资源池中已加载的图片,因此,当资源池为空的状态时,可以确定,当前资源池中无第二图片。
112.可选地,可以通过读取资源池的状态信息判断资源池中是否存在第二图片。
113.s502,将从最小帧编号对应的基准图片开始至最大帧编号对应的图片确定为目标图片。
114.进一步地,当资源池中无第二图片时,则可以将确定的第一图片全部加载至资源池中。
115.可以理解为,第一图片包含的全部的待加载图片对应的帧编号中,可以将最小帧编号对应的图片作为基准图片,将最小帧编号至最大帧编号的全部的帧编号对应的待加载图片确定为目标图片。
116.进一步地,在本次的图片加载指令的执行中,将目标图片加载至资源池中。
117.本公开提供的图片的标注方法,当资源池中无第二图片时,可以将第一图片中最小帧编号至最大帧编号的全部的帧编号对应的图片确定为目标图片,并将目标图片加载至资源池中。保证了加载至资源池的图片的准确性,进而保证了对于图片标注结果的连续性判断的准确性,提高了图片标注的效率以及准确率。
118.作为其中另一种情况,资源池中存在第二图片的场景下,可结合图6进一步理解,图6为本公开另一实施例的图片的标注方法的流程示意图,如图6所示,该方法包括:
119.s601,获取资源池中第二图片的帧编号。
120.当资源池中存在已加载的第二图片时,对于其中已经被标注完成,同时在后续的图片标注过程中可以不对其进行切换查看的第二图片,可以将其从资源池中释放,进而使得资源池的空间可以得到有效地利用。
121.可选地,可以通过对资源池的当前的状态信息的读取,获取到第二图片对应的全部的帧编号。
122.s602,从第二图片的帧编号中,确定处于最小帧编号和最大帧编号之间的帧编号。
123.本公开实施例中,资源池中的图片所对应的帧编号是连续的,因此,在获取到第二图片的帧编号后,可以对全部的帧编号按大小进行排序。
124.进一步地,基于已经确定的基准帧,可以获取第二图片的帧编号中的最小帧编号与最大帧编号。
125.比如,设定资源池可承载的图片数量n为6,当前目标应用程序显示的图片为第10帧对应的图片,则可以将第10帧对应的图片确定为基准图片,第10帧确定为基准帧。则当前资源池中的已经加载的图片为第7帧、第8帧、第9帧、第10帧、第11帧、第12帧、第13帧对应的图片。
126.此时,第二图片对应的最小帧编号即为第7帧,最大帧编号即为第13帧。
127.进一步地,在第二图片对应的全部的帧编号中确定最小帧编号与最大帧编号之间的帧编号。
128.s603,将未处于最小帧编号和最大帧编号之间的帧编号对应的第二图片,确定为待释放图片,并从资源池中释放待释放图片。
129.进一步地,确定第二图片对应的最小帧编号与最大帧编号后,也将资源池中不处于该帧编号范围内的图片确定为待释放图片。
130.比如,在上述示例的基础上,当目标应用程序当前显示的图片由第10帧切换为第11帧时,此时,可以将第11帧确定为基准图片,并将第11真确定为基准帧,则为了保证对第11帧图片的标注作业,资源池中需要加载第8帧、第9帧、第10帧、第11帧、第12帧、第13帧、第14帧对应的图片,进一步地,可以将最小帧编号确定为第8帧,最大帧编号确定为第14帧。
131.此时,资源池中已加载的第二图片为第7帧、第8帧、第9帧、第10帧、第11帧、第12帧、第13帧对应的图片,因此,需要对当前资源池中的第二图片状态进行判断,确定其中的可释放图片,为没有加载至资源池中的第14帧图片获取加载空间。
132.进一步地,可以确定第7帧未处于最小帧编号与最大帧编号之间,因此,将第7帧图片确定为待释放图片,并将从资源池中释放。
133.s604,将未存在资源池中且处于最小帧编号和最大帧编号之间的帧编号对应的图片,确定为目标图片,并向资源池中加载目标图片。
134.本公开实施例中,将资源池中的待释放图片释放后,资源池中会存在部分可承载新的图片的空间,此时,可以将未加载至资源池中的,处于最小帧编号与最大帧编号之间的帧编号对应的图片,确定为目标图片,并加载至资源池中。
135.比如,在上述示例的基础上可知,第14帧图片即为未加载至资源池中的,处于最小帧编号第8帧与最大帧编号第14帧之间的帧编号对应的图片,因此,可以将第14帧图片确定为目标图片,并加载至资源池中。
136.本公开提供的图片的标注方法,将资源池中的可释放图片释放出资源池,使得资源池的空间可以得到有效的利用,从而降低图片加载对计算机资源的占用,进而提高了图片标注的效率以及准确率。
137.与上述几种实施例提供的图片的标注方法相对应,本公开的一个实施例还提供了一种图片的标注装置,由于本公开实施例提供的图片的标注装置与上述几种实施例提供的图片的标注方法相对应,因此上述图片的标注方法的实施方式也适用于本公开实施例提供的图片的标注装置,在下述实施例中不再详细描述。
138.图7为本公开一实施例的图片的标注装置的结构示意图,如图7所示,图片的标注装置700,包括获取模块71、确定模块72、加载模块73、标注模块74,其中:
139.获取模块71,用于响应于图片加载指令,根据图片加载指令确定基准图片;
140.确定模块72,用于根据基准图片和资源池的图片承载数量,确定需要向资源池中加载的第一图片;
141.加载模块73,用于确定资源池已经加载的第二图片,并根据第一图片和第二图片,向资源池中加载目标图片,其中,每次加载结束后资源池内加载的图片为帧编号连续的图片;
142.标注模块74,用于基于资源池中加载的帧编号连续的图片进行图片标注。
143.图8为本公开一实施例的图片的标注装置的结构示意图,如图8所示,图片的标注装置800,包括获取模块81、确定模块82、加载模块83、标注模块84,其中:
144.需要说明的是,获取模块71、确定模块72、加载模块73、标注模块74与获取模块81、确定模块82、加载模块83、标注模块84,具备相同的结构和功能。
145.本公开实施例中,确定模块82,还用于:根据图片承载数量和基准图片的基准帧编号,确定需要加载至资源池中的第一图片的最小帧编号和最大帧编号。
146.本公开实施例中,获取模块81,还用于:响应于图片加载指令为启动目标应用程序时所触发的指令,确定基准图片为目标应用程序退出时播放的图片,或者新的标注任务对应的图片集中的第一帧图片。
147.本公开实施例中,确定模块82,还用于:将基准图片的基准帧编号确定为最小帧编号;将基准帧编号和图片承载数量的和值,确定为最大帧编号。
148.本公开实施例中,加载模块83,还用于:确定资源池中无第二图片;将从最小帧编号对应的基准图片开始至最大帧编号对应的图片确定为目标图片。
149.本公开实施例中,获取模块81,还用于:响应于图片加载指令为帧切换指令,根据帧切换指令中携带的切换后图片确定基准图片。
150.本公开实施例中,确定模块82,还用于:获取图片承载数量的一半向下取整和上向取值,分别得到第一数值和第二数值;将基准图片的基准帧编号与第一数值的差值,确定为最小帧编号;将基准帧编号与第二数值的和值,确定为最大帧编号。
151.本公开实施例中,加载模块83,还用于:获取资源池中第二图片的帧编号;从第二图片的帧编号中,确定处于最小帧编号和最大帧编号之间的帧编号;将未处于最小帧编号和最大帧编号之间的帧编号对应的第二图片,确定为待释放图片,并从资源池中释放待释放图片;将未存在资源池中且处于最小帧编号和最大帧编号之间的帧编号对应的图片,确定为目标图片,并向资源池中加载目标图片。
152.本公开提出的图片的标注装置,基于计算机的可分配资源构建设定容量的资源池,基于获取到的加载指令确定需要待加载图片的基准图片,并基于基准图片以及资源池的可承载图片数量,确定可以加载至资源池的第一图片。进一步地,结合资源池中已加载的第二图片,确定向资源池加载的目标图片。进一步地,从资源池中调取图片进行图片标注,进而获取图片标注数据。本公开中,通过加载指令,精准地确定了需要加载至资源池的图片中的基准图片,将待加载图片按序分批加载至资源池中,使得可以从资源池直接调取已经加载完毕的图片进行图片标注,降低了图片加载对于计算机资源的占用,实现了图片的连续切换,保证了对于图片标注结果的连续性判断的准确性,提高了图片标注的效率以及准确率。
153.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
154.图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算
装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
155.如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元909加载到随机访问存储器(ram)903中的计算机程序,来执行各种适当的动作和处理。在ram 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
156.设备900中的多个部件连接至i/o接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元909,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
157.计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如图片的标注方法。例如,在一些实施例中,图片的标注方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元909。在一些实施例中,计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时,可以执行上文描述的图片的标注方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图片的标注方法。
158.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
159.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
160.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计
算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
161.为了提供与作业人员的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向作业人员显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),作业人员可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与作业人员的交互;例如,提供给作业人员的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自作业人员的输入。
162.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形作业人员界面或者网络浏览器的作业人员计算机,作业人员可以通过该图形作业人员界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
163.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
164.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开的技术方案所期望的结果,本文在此不进行限制。
165.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1