模型的处理方法、装置、存储介质以及电子设备与流程

文档序号:28945211发布日期:2022-02-19 08:36阅读:78来源:国知局
模型的处理方法、装置、存储介质以及电子设备与流程

1.本发明涉及模型处理领域,具体而言,涉及一种模型的处理方法、装置、存储介质以及电子设备。


背景技术:

2.目前,需要针对不同的识别场景开发对应的模型以适应不同的文本板式,若业务场景较多,则需要大量人力进行数据标注、模型开发、模型验证与平台部署,整个过程耗时较长,从而导致模型在平台中部署的效率较低。
3.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本发明实施例提供了一种模型的处理方法、装置、存储介质以及电子设备,以至少解决相关技术中在平台中部署模型效率较低的技术问题。
5.根据本发明实施例的一个方面,提供了一种响应于对目标模型的部署指令,获取目标模型包,其中,目标模型包至少包括目标模型和目标字段,目标模型用于识别目标图像中与目标字段对应的待识别文本;利用多个设备对目标模型包进行验证,得到目标验证结果,其中,多个设备中的至少一个设备上部署目标模型;基于目标验证结果确定是否将目标模型包部署至目标平台。
6.可选地,利用多个设备对目标模型包进行验证,得到目标验证结果,包括:利用第一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果,其中,目标图像集合包括至少一个目标图像和与至少一个目标图像对应的标注结果;利用第二设备通过目标图像集合对目标模型包进行验证,得到第二验证结果,其中,第二设备中部署有目标模型;基于第一验证结果和第二验证结果,确定目标验证结果。
7.可选地,利用第一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果,包括:通过第一设备利用目标模型包中的目标模型对至少一个目标图像中与目标字段对应的待识别文本进行识别,得到第一识别结果;基于第一识别结果和标注结果确定目标模型的第一准确度;响应于第一准确度大于或等于第一预设准确度,确定第一验证结果为验证成功;响应于第一准确度小于第一预设准确度,确定第一验证结果为验证失败。
8.可选地,利用第二设备通过目标图像集合对目标模型包进行验证,得到第二验证结果,包括:通过第二设备中利用目标模型对至少一个目标图像中与目标字段对应的待识别文本进行识别,得到第二识别结果;基于第二识别结果和标注结果确定目标模型的第二准确度;响应于第二准确度大于或等于第二预设准确度,确定第二验证结果为验证成功;响应于第二准确度小于第二预设准确度,确定第二验证结果为验证失败。
9.可选地,在利用第一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果之前,该方法还包括:利用第一设备获取第一存储路径和第二存储路径,其中,第一存储路径为目标模型包在目标存储模块中的存储路径,第二存储路径为目标图像集合在目
标存储模块中的存储路径;利用第一设备通过第一存储路径在目标存储模块中获取目标模型包;利用第一设备通过第二存储路径在目标存储模块中获取目标图像集合。
10.可选地,该方法还包括:利用第一预设模型对至少一个目标图像进行标注,得到与至少一个目标图像对应的标注结果;基于至少一个目标图像和至少一个图像对应的标注结果,生成目标图像集合;存储目标图像集合至目标存储模块,并生成第二存储路径。
11.可选地,在利用预设标注模型对至少一个目标图像进行标注,得到与至少一个目标图像对应的标注结果之后,该方法还包括:响应于对标注结果的调整指令,对至少一个目标图像对应的标注结果进行调整。
12.可选地,该方法还包括:利用目标训练集合中的至少一组训练参数对第二预设模型进行训练,得到至少一个训练模型;对至少一个训练模型进行测试,得到测试结果,其中,测试结果用于描述每个训练模型的准确度;基于测试结果从至少一个训练模型中确定目标模型;存储目标模型至目标存储模块,并生成第一存储路径。
13.可选地,该方法还包括:响应于对目标模型的修正指令,通过目标接口接收修正参数;基于修正参数对目标模型进行修正。
14.在本发明实施例中,首先响应于对目标模型的部署指令,获取目标模型包,其中,目标模型包至少包括目标模型和目标字段,目标模型用于识别目标图像中与目标字段对应的待识别文本,然后利用多个设备对目标模型包进行验证,得到目标验证结果,其中,多个设备中的至少一个设备上部署目标模型,最后基于目标验证结果确定是否将目标模型包部署至目标平台,实现了快速在目标平台中部署目标模型的目的。容易注意到的是,在目标平台中部署目标模型的过程中,可以利用多个设备对目标模型包进行验证,在自动部署的基础上,由于采用多个设备对目标模型包进行验证,因此,可以在快速部署目标模型的基础上提高待部署模型的准确率,避免出现目标模型准确度较低而需要重新训练模型并进行部署,由于可以进一步地提高模型部署的效率。进而解决了相关技术中在平台中部署模型效率较低的技术问题。
附图说明
15.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
16.图1是根据本发明实施例的一种模型的处理方法的流程图;
17.图2是根据本发明实施例的一种模型部署过程的示意图;
18.图3是根据本发明实施例的一种模型的处理装置的示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
20.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.实施例1
22.根据本发明实施例,提供了一种模型的处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
23.图1是根据本发明实施例的模型的处理方法,如图1所示,该方法包括如下步骤:
24.步骤s102,响应于对目标模型的部署指令,获取目标模型包。
25.其中,目标模型包至少包括目标模型和目标字段,目标模型用于识别目标图像中与目标字段对应的待识别文本。
26.上述的目标模型可以是待部署的模型,其中,目标模型可以为训练得到的新模型,目标模型还可以为对历史模型进行训练得到的优化后的模型,目标模型还可以为对历史模型进行更新后的模型。
27.上述的目标模型中包括多个模型,例如,文本检测模型、朝向检测模型、文本识别模型。通过目标模型中的文本检测模型可以对目标图像中的文本进行检测,检测出文本之后,可以利用朝向检测模型对目标图像中文本的朝向进行检测,在得到目标图像中文本的朝向之后,可以利用文本识别模型对目标图像中文本进行识别,得到与目标字段对应的待识别文本。
28.上述的部署指令是指在得到目标模型后,将目标模型部署至目标平台的指令。其中,目标平台可以内嵌有目标模型,用户可以在目标平台上使用目标模型识别目标图向中的待识别文本。
29.上述的目标模型包通过打包目标模型和目标字段生成,其中,目标模型包中包含了网络服务代码,使得在目标平台上可以通过网络服务代码使用目标模型。
30.上述的目标字段用于确定目标图像中目标模型待识别的文本。其中,目标字段可以为key值(键值)。
31.在一种可选的实施例中,在响应于对目标模型的部署指令时,自动打包平台可以对目标模型和目标字段进行打包,并生成目标模型包,此时,可以获取该目标模型包,并通过该目标模型包完成对目标模型的部署。
32.在另一种可选的实施例中,通过获取目标字段,可以使目标模型识别到目标图像中需要得到的待识别文本。示例性的,目标图像可以是新闻报道的文本图像,目标字段可以是题目、作者姓名,那么待识别的文本可以是新闻报道的标题和新闻报道的作者。
33.步骤s104,利用多个设备对目标模型包进行验证,得到目标验证结果。
34.其中,多个设备中的至少一个设备上部署目标模型。
35.上述的多个设备可以是多个部署环境不同的物理机。
36.在一种可选的实施例中,通过多个设备对目标模型包进行验证,可以在目标模型部署至目标平台之前,提前对目标模型包中目标模型的识别能力进行验证,提高后续在目标平台部署的目标模型的识别准确率。
37.在另一种可选的实施例中,可以先利用未部署目标模型的设备对目标模型包进行验证,在验证成功之后再利用部署目标模型的设备对目标模型包进行验证。若验证未成功,可以重新对目标模型进行训练,并基于重新训练后的目标模型和目标字段生成目标模型包,再次对目标模型包进行验证,直至验证成功。在利用未部署目标模型的设备对目标模型包验证成功之后,可以将目标模型包中的目标模型部署在设备中,并利用部署好目标模型的设备对目标模型包进行验证,在验证成功之后,可以将目标模型包部署在目标平台中,若未验证成功,则重新对目标模型进行训练,并基于重新训练后的目标模型和目标字段生成目标模型包,再次对目标模型包进行验证,直至验证成功。由于在验证设备上部署目标模型会占用较多内存资源,因此,只有在未部署目标模型的设备上验证成功时,才利用部署目标模型的设备进行验证,这样可以减少内存资源的占用,提高验证效率。
38.步骤s106,基于目标验证结果确定是否将目标模型包部署至目标平台。
39.上述的目标平台可以为提供光学字符识技术(ocr,optical character recognition)的服务平台。其中,部署好的目标平台中可以内嵌有目标模型。上述的目标平台可以为图像识别平台。
40.在一种可选的实施例中,目标验证结果中多个设备的验证结果都为验证成功时,确定将目标模型包部署至目标平台,若存在有设备对目标模型包未验证成功,则将重新对目标模型进行训练,并重新训练后的目标模型和目标字段生成目标模型包,再次对目标模型包进行验证,直至验证成功。
41.在另一种可选的实施例中,在目标验证结果为多个设备都验证成功的情况下,可以开放目标平台,并将目标模型包部署在目标平台中。
42.在另一种可选的实施例中,部署好目标模型包的目标平台可以将目标图像中的待识别文本识别并进行提取。示例性的,在金融领域中,需要对不同证件、票据等图片数据进行文字识别,通过目标平台可以提取该图片数据中的关键字段信息,具体的,目标平台中的定位模型可以通过目标字段定位待识别文本,然后通过识别模型对待识别文本进行识别,得到识别结果,最后将识别结果返回给客户端使用。
43.通过上述步骤,可以首先响应于对目标模型的部署指令,获取目标模型包,其中,目标模型包至少包括目标模型和目标字段,目标模型用于识别目标图像中与目标字段对应的待识别文本,然后利用多个设备对目标模型包进行验证,得到目标验证结果,其中,多个设备中的至少一个设备上部署目标模型,最后基于目标验证结果确定是否将目标模型包部署至目标平台,实现了快速在目标平台中部署目标模型的目的。容易注意到的是,在目标平台中部署目标模型的过程中,可以利用多个设备对目标模型包进行验证,在自动部署的基础上,由于采用多个设备对目标模型包进行验证,因此,可以在快速部署目标模型的基础上提高待部署模型的准确率,避免出现目标模型准确度较低而需要重新训练模型并进行部署,由于可以进一步地提高模型部署的效率。进而解决了相关技术中在平台中部署模型效率较低的技术问题。
44.可选地,利用多个设备对目标模型包进行验证,得到目标验证结果,包括:利用第
一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果,其中,目标图像集合包括至少一个目标图像和与至少一个目标图像对应的标注结果;利用第二设备通过目标图像集合对目标模型包进行验证,得到第二验证结果,其中,第二设备中部署有目标模型;基于第一验证结果和第二验证结果,确定目标验证结果。
45.上述的第一设备可以是物理机,上述的第二设备可以是通过docker容器(开源的应用容器引擎)对目标模型包中的目标模型进行部署好的设备。其中,可以通过docker-compose(用于运行开源的应用容器引擎的工具)在物理机的gpu(graphics processing unit,图形处理器)上自动启动docker容器,并通过docker容器在物理机上部署目标模型。
46.上述的目标图像集合可以是包含有多个目标图像以及多个目标图像对应的多个标注结果的图像的集合。目标图像集合可以存储于预设的存储装置。可以不断的更新存储装置中的目标图像集合。
47.在一种可选的实施例中,可以先从存储的装置中获取到最近更新好的目标图像集合,并利用第一设备通过目标图像集合对目标模型包进行验证,具体的,可以通过目标模型包中的目标模型和目标字段识别目标图像集合中目标图像的待识别文字,得到识别结果,通过比对识别结果和目标图像集合中的标注结果来确定目标模型的识别准确度。当识别准确度大于预设识别准确度时,确定第一设备的第一验证结果为验证成功。
48.进一步地,在第一设备验证成功之后,可以将获取到的目标模型包和目标图像集合发送至第二设备,在第二设备中可以通过目标图像集合对目标模型包进行验证,得到目标模型的识别准确度,当识别准确度大于预设识别准确度时,确定第二设备验证成功。可选地,还可以在识别准确度大于预设识别准确度的基础上,确定第一设备的识别准确度和第二设备的识别准确度是否一致,若一致,则确定第二设备验证成功;若不一致,可以重新对目标模型进行训练,并基于重新训练后的目标模型和目标字段生成目标模型包,再次对目标模型包进行验证,直至两个设备的识别准确度相同,则确定第二设备的第二验证结果为验证成功。
49.可选地,利用第一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果,包括:通过第一设备利用目标模型包中的目标模型对至少一个目标图像中与目标字段对应的待识别文本进行识别,得到第一识别结果;基于第一识别结果和标注结果确定目标模型的第一准确度;响应于第一准确度大于或等于第一预设准确度,确定第一验证结果为验证成功;响应于第一准确度小于第一预设准确度,确定第一验证结果为验证失败。
50.上述的第一预设准确度可以由用户进行确定。
51.在一种可选的实施例中,可以在第一设备中利用目标模型和目标字段对目标图像集合中的至少一个目标图像对应的待识别文本进行识别,得到识别出的文本,也即上述的第一识别结果,将识别出的文本与该目标图像对应的标注结果进行比对,基于比对结果确定目标模型的第一准确度,若两者的相同的数量越多,则说明目标模型的识别精确度越高,即目标模型识别的第一准确度越高。
52.在另一种可选的实施例中,可以在第一准确度大于或等于第一预设准确度的情况下,说明识别出的文本与目标图像对应的标注结果相同的数量较多或者相似度较高,此时,说明目标模型的识别能力较强,可以确定第一验证结果为验证成功。在第一准确度小于第一预设准确度的情况下,说明识别出的文本与目标图像对应的标注结果相同的数量较少或
者相似度较低,此时,说明目标模型的识别能力较强,未能够达到识别需求,可以确定第一验证结果为验证失败。
53.可选地,利用第二设备通过目标图像集合对目标模型包进行验证,得到第二验证结果,包括:通过第二设备中利用目标模型对至少一个目标图像中与目标字段对应的待识别文本进行识别,得到第二识别结果;基于第二识别结果和标注结果确定目标模型的第二准确度;响应于第二准确度大于或等于第二预设准确度,确定第二验证结果为验证成功;响应于第二准确度小于第二预设准确度,确定第二验证结果为验证失败。
54.在一种可选的实施例中,可以在第二设备中利用目标模型和目标字段对目标图像集合中的至少一个目标图像对应的待识别文本进行识别,得到识别出的文本,也即上述的第二识别结果,将识别出的文本与该目标图像对应的标注结果进行比对,基于比对结果确定目标模型的第二准确度,若两者的相同的数量越多,则说明目标模型的识别精确度越高,即目标模型识别的第二准确度越高。
55.在另一种可选的实施例中,可以在第二准确度大于或等于第二预设准确度的情况下,说明识别出的文本与目标图像对应的标注结果相同的数量较多或者相似度较高,此时,说明目标模型的识别能力较强,可以确定第二验证结果为验证成功。在第二准确度小于第二预设准确度的情况下,说明识别出的文本与目标图像对应的标注结果相同的数量较少或者相似度较低,此时,说明目标模型的识别能力较强,未能够达到识别需求,可以确定第二验证结果为验证失败。
56.可选地,在利用第一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果之前,该方法还包括:利用第一设备获取第一存储路径和第二存储路径,其中,第一存储路径为目标模型包在目标存储模块中的存储路径,第二存储路径为目标图像集合在目标存储模块中的存储路径;利用第一设备通过第一存储路径在目标存储模块中获取目标模型包;利用第一设备通过第二存储路径在目标存储模块中获取目标图像集合。
57.在一种可选的实施例中,为了节省第一设备中的空间,可以将打包好的目标模型包和已经进行标注的目标图像集合存储至目标存储模块中,以便在需要时从目标存储模块中获取,节省了用于进行验证的设备空间。
58.上述的目标存储模块可以为系统存储媒介,例如hodoop(一个处理、存储和分析海量的分布式、非结构化数据的开源框架)存储集群。
59.在一种可选的实施例中,自动打包平台在根据目标模型和目标字段打包完目标模型包时,可以先将目标模型包存储至目标存储模块中,并生成目标模型包在目标存储模块中的第一存储路径;标注平台在对目标图像进行标注,得到标注结果,并基于目标图像和其对应的目标结果生成目标图像集合之后,可以将目标图像集合存储至目标存储模块中,并生成目标图像集合在目标存储模块中的第二存储路径。
60.在另一种可选的实施例中,第一设备在接收到对于目标模型的部署指令时,可以获取第一存储路径和第二存储路径,并通过第一存储路径在目标存储模块中获取预先存储好的目标模型包,利用第二存储路径在目标存储模块中获取预先存储好的目标图像集合。
61.可选地,该方法还包括:利用第一预设模型对至少一个目标图像进行标注,得到与至少一个目标图像对应的标注结果;基于至少一个目标图像和至少一个图像对应的标注结果,生成目标图像集合;存储目标图像集合至目标存储模块,并生成第二存储路径。
62.上述的第一预设模型可以是预先训练好的标注模型,通过第一预设模型可以实现对目标图像的标注,并得到目标图像对应的标注结果。其中,第一预设模型可以为位置预标注模型、转录预标注模型等。上述的至少一个目标图像可以是与业务相关的图像数据。
63.在一种可选的实施例中,可以先接受用户发送的标注任务,并根据标注任务获取相关的待标注的目标图像,在标注平台中对于目标图像进行标注,得到标注结果,并基于目标图像和标注结果生成目标图像集合。标注平台可以提供位置标注、文字转录的功能,在标注平台中通过内嵌的位置、转录预标注模型对目标图像进行标注,得到与该目标图像对应的标注结果,并基于目标图像和与目标图像对应的标注结果生成目标图像集合。
64.进一步地,在生成目标图像集合之后,可以将目标图像集合存储至目标存储模块中,在需要对目标模型进行验证时,可以根据生成的第二存储路径获取目标图像集合。
65.可选地,在利用预设标注模型对至少一个目标图像进行标注,得到与至少一个目标图像对应的标注结果之后,该方法还包括:响应于对标注结果的调整指令,对至少一个目标图像对应的标注结果进行调整。
66.在一种可选的实施例中,在获取到至少一个目标图像对应的标注结果之后,为了进一步地提高标注的准确度,可以将目标图像和对应的标注结果发送至客户端,由客户端对标注有误的标注结果进行调整,以提高标注结果的准确度。
67.进一步地,在对标注结果进行调整之后,可以基于目标图像和对应的调整之后的标注结果生成目标图像集合。还可以利用调整之后的标注结果对第一预设模型进行训练,以提高第一预设模型的准确度。
68.可选地,该方法还包括:利用目标训练集合中的至少一组训练参数对第二预设模型进行训练,得到至少一个训练模型;对至少一个训练模型进行测试,得到测试结果,其中,测试结果用于描述每个训练模型的准确度;基于测试结果从至少一个训练模型中确定目标模型;存储目标模型至目标存储模块,并生成第一存储路径。
69.上述的目标训练集合可以包括多组的训练参数,其中,不同组的训练参数可以不同。上述的第二预设模型可以为待训练的模型。
70.在一种可选的实施例中,可以在训练平台中利用目标训练集合中的多组训练参数对第二预设模型进行训练,得到多组训练模型,通过对多组训练模型的准确度进行测试,可以得到多组训练模型的测试结果,并基于测试结果从多个训练模型中确定出准确度最高的目标模型,并将该目标模型存储至目标存储模块中,以便后续在部署的过程中使用。
71.在另一种可选的实施例中,可以在训练平台中提供训练环境,分别对通用的朝向检测、文本定位、文字识别模型进行多组不同参数的训练,其中,训练参数可以根据经验提供默认配置以便于适配不同的需求,对于定制化的需求可以由用户上传训练参数,并获取每个类型模型中准确度最高的一组模型作为目标模型,获取该目标模型对应的模型配置,将模型的配置存储至代码参数中,在后续获取目标模型时,可以从代码仓库中获取该目标模型对应的配置。
72.可选地,该方法还包括:响应于对目标模型的修正指令,通过目标接口接收修正参数;基于修正参数对目标模型进行修正。
73.在一种可选的实施例中,在目标平台部署好目标模型包之后,可以向外提供一个应用接口用于外部访问,对于目标平台中目标模型的修正,可以通过上述的目标接口来接
收修正参数,并利用修正参数对目标模型进行修正,以提高目标模型的准确度。
74.进一步地,目标平台在提供识别服务时,可以自动标记未识别出的数据,并利用该未识别出的数据进行后续的问题排查以及模型优化。具体的,可以将未识别出的数据发送至客户端,用户可以对未识别出的数据进行标注,并利用未识别出的数据对应的图像和对应的标注结果对目标平台中目标模型进行优化。
75.下面结合图2对本发明一种优选的实施例进行详细说明。
76.如图2所示为模型部署过程的示意图,其中包括有标注平台、训练平台、系统存储媒介、代码仓库、自动打包服务、自动部署验证服务、物理机代理服务、开源的应用容器引擎、图像识别平台。其中,标注平台可以对训练数据进行标注,并将标注后得到的标注数据存储至系统存储媒介中,训练平台可以通过多组训练数据训练模型,并从训练好的多个模型中确定出最优模型,将最优模型存储至系统存储媒介中,同时可以将最优模型的模型参数存储至代码仓库中,自动打包服务可以获取关键字段key值,并从代码仓库中选取模板代码,从系统存储媒介中获取模型路径,通过模板代码可以调用从关键字段中调用目标字段,可以将目标字段和目标模型打包生成目标模型包,并将目标模型包对应的模型路径发送至自动部署验证服务中。
77.进一步地,在自动部署验证服务中可以将模型包路径和标注数据路径发送给物理机代理服务中,物理机代理服务可以根据模型包路径和标注数据路径获取到模型包和标注数据,并利用标注数据通过物理机对模型包进行验证,在验证成功之后,可以通过通过docker-compose在物理机gpu上自动启动docker容器部署模型服务,并在部署好目标模型的物理机上进行验证,若验证成功,则可以将目标模型包部署至目标平台中。在后续可以对目标平台提供一个aip接口,利用该aip接口可以将无法识别的数据保存至系统存储媒介中,用于后续的对模型的优化。
78.对于目标模型的准确率验证主要包括三部分;第一是训练平台对于每类模型是使用不同的模型参数同时训练多个模型,使用标注数据测试模型准确率,选择一个大于预设准确度且准确度最高的一个模型;第二是上线前通过目标图像的标注结果验证环境测试各个关键字段的准确度,在准确度达到预设准确度的情况下,才可以将目标模型包部署在目标平台中,若低于预设准确度则重新训练模型;第三是上线前的最后一次验证,确保线上环境服务准确率与测试环境准确率一致才可开放目标平台,并在目标平台中部署目标模型。
79.本发明实施例中,可以自动发布模型的迭代服务。通过在标注平台内嵌预标注模型,可以加快人工标注业务数据效率;将标注数据送入训练平台对通用模型同时进行多组参数训练;将最优模型存储至系统存储媒介;自动部署上线平台拉取模版代码与最优模型打自动打包后在docker容器中自动部署评估,准确率合格即可完成目标平台的部署;目标平台可标记badcase(未识别数据),将badcase送入标注平台即可进行目标平台的迭代更新。本发明可以高效快速更新目标平台中的目标模型,其中目标平台可以通过目标模型对多种证件、票据类图片的结构化字段进行提取,整体流程除标注与关键字段配置以外,无需人工进行开发部署,实现了对于图像识别的平台进行低成本、高效率的发布迭代。
80.实施例2
81.根据本发明实施例,还提供了一种模型的处理装置,该装置可以执行上述实施例中的模型的处理方法,具体实现方式和优选应用场景与上述实施例相同,在此不做赘述。
82.图3是根据本发明实施例的一种模型的处理装置的示意图,如图3所示,该装置包括:获取模块302,用于响应于对目标模型的部署指令,获取目标模型包,其中,目标模型包至少包括目标模型和目标字段,目标模型用于识别目标图像中与目标字段对应的待识别文本;验证模块304,用于利用多个设备对目标模型包进行验证,得到目标验证结果,其中,多个设备中的至少一个设备上部署目标模型;部署模块306,用于基于目标验证结果确定是否将目标模型包部署至目标平台。
83.可选地,验证模块包括:第一验证单元,用于利用第一设备通过目标图像集合对目标模型包进行验证,得到第一验证结果,其中,目标图像集合包括至少一个目标图像和与至少一个目标图像对应的标注结果;第二验证单元,用于利用第二设备通过目标图像集合对目标模型包进行验证,得到第二验证结果,其中,第二设备中部署有目标模型;确定单元,用于基于第一验证结果和第二验证结果,确定目标验证结果。
84.可选地,第一验证单元包括:第一识别子单元,用于通过所述第一设备利用所述目标模型包中的所述目标模型对所述至少一个目标图像中与所述目标字段对应的待识别文本进行识别,得到第一识别结果;第一确定子单元,用于基于第一识别结果和标注结果确定目标模型的第一准确度;第一确定子单元还用于响应于所述第一准确度大于或等于第一预设准确度,确定所述第一验证结果为验证成功;第一确定子单元还用于响应于所述第一准确度小于所述第一预设准确度,确定所述第一验证结果为验证失败。
85.可选地,第二验证单元包括:第二识别子单元,用于通过所述第二设备中利用所述目标模型对所述至少一个目标图像中与所述目标字段对应的待识别文本进行识别,得到第二识别结果;第二确定子单元,用于基于第二识别结果和标注结果确定目标模型的第二准确度;第二确定子单元还用于响应于所述第二准确度大于或等于第二预设准确度,确定第二验证结果为验证成功;第二确定子单元还用于响应于所述第二准确度小于所述第二预设准确度,确定所述第二验证结果为验证失败。
86.可选地,获取模块还用于利用第一设备获取第一存储路径和第二存储路径,其中,第一存储路径为目标模型包在目标存储模块中的存储路径,第二存储路径为目标图像集合在目标存储模块中的存储路径;获取模块还用于利用第一设备通过第一存储路径在目标存储模块中获取目标模型包;获取模块还用于利用第一设备通过第二存储路径在目标存储模块中获取目标图像集合。
87.可选地,该装置还包括:标注模块、生成模块、第一存储模块。
88.其中,标注模块用于利用第一预设模型对至少一个目标图像进行标注,得到与至少一个目标图像对应的标注结果;生成模块用于基于至少一个目标图像和至少一个图像对应的标注结果,生成目标图像集合;第一存储模块用于存储目标图像集合至目标存储模块,并生成第二存储路径。
89.可选地,该装置还包括:调整模块,用于响应于对标注结果的调整指令,对至少一个目标图像对应的标注结果进行调整。
90.可选地,该装置还包括:训练模块,用于利用目标训练集合中的至少一组训练参数对第二预设模型进行训练,得到至少一个训练模型;测试模块,用于对至少一个训练模型进行测试,得到测试结果,其中,测试结果用于描述每个训练模型的准确度;确定模块,用于基于测试结果从至少一个训练模型中确定目标模型;第二存储模块,用于存储目标模型至目
标存储模块,并生成第一存储路径。
91.可选地,该装置还包括:接收模块,用于响应于对目标模型的修正指令,通过目标接口接收修正参数;修正模块,用于基于修正参数对目标模型进行修正。
92.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
93.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
94.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
95.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
96.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
97.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
98.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1