一种特征提取方法、装置、计算机设备及存储介质与流程

文档序号:29510772发布日期:2022-04-06 19:44阅读:89来源:国知局
一种特征提取方法、装置、计算机设备及存储介质与流程

1.本技术涉及计算机技术领域,尤其涉及一种特征提取方法、装置、计算机设备及存储介质。


背景技术:

2.随着科技的不断发展,越来越多的设备可以采用人工智能相关的神经网络模型,来实现智能化的图像处理任务。
3.由于采用神经网络模型处理图像的过程较为复杂,因此,采用神经网络模型处理图像的处理效率较低,对设备的性能要求较高,为了提高采用神经网络模型处理图像的效率,传统的方法通常是通过降低神经网络模型的网络结构复杂度来实现的。
4.然而,为了保证神经网络模型针对图像的处理能力的稳定性,神经网络模型的网络结构的可简化程度有限,因此,采用神经网络模型处理图像过程中,仍然存在处理效率较低的问题。


技术实现要素:

5.本技术实施例提供一种特征提取方法、装置、计算机设备及存储介质,用于解决采用神经网络模型处理图像过程中处理效率较低的问题。
6.第一方面,提供一种特征提取方法,包括:
7.获得待提取图像;
8.基于目标分辨率信息,对所述待提取图像进行压缩处理,获得压缩后的待提取图像,其中,所述目标分辨率信息是采用如下方法生成的:分别确定目标特征提取模型,针对具有不同图像分辨率的各个输入图像的提取评估信息,并基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值,生成所述目标分辨率信息;
9.采用所述目标特征提取模型,对所述压缩后的待处理图像进行特征提取处理,获得所述待提取图像的目标特征信息。
10.第二方面,提供一种特征提取装置,包括:
11.获取模块:用于获得待提取图像;
12.处理模块:用于基于目标分辨率信息,对所述待提取图像进行压缩处理,获得压缩后的待提取图像,其中,所述目标分辨率信息是采用如下方法生成的:分别确定目标特征提取模型,针对具有不同图像分辨率的各个输入图像的提取评估信息,并基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值,生成所述目标分辨率信息;
13.所述处理模块还用于:采用所述目标特征提取模型,对所述压缩后的待处理图像进行特征提取处理,获得所述待提取图像的目标特征信息。
14.可选的,所述处理模块还用于:
15.在采用所述目标特征提取模型,对所述压缩后的待处理图像进行特征提取处理,获得所述待提取图像的目标特征信息之后,基于目标图像处理任务,对所述目标特征信息
进行相应处理,获得针对所述待提取图像的目标处理结果,其中,所述目标图像处理任务包括图像分类任务、图像识别任务或图像检测任务中的一种或多种。
16.可选的,所述目标特征提取模型是采用如下方法训练得到的,所述处理模块还用于:
17.获取已训练的参考特征提取模型,作为待训练的特征提取模型,其中,所述参考特征提取模型是基于样本集合训练得到的,所述样本集合包括未经过压缩处理的各个训练样本图像;
18.基于分辨率降采样策略,依次降低所述待训练的特征提取模型处理的输入图像的图像分辨率,确定所述待训练的特征提取模型的提取评估信息,直到所述待训练的特征提取模型的提取评估信息不满足所述目标评估条件时,将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
19.可选的,每次降低图像分辨率时,执行以下操作所述处理模块具体用于:
20.基于所述分辨率降采样策略,分别对所述各个训练样本图像进行压缩处理,获得各个压缩训练样本图像;
21.基于所述各个压缩训练样本图像,对所述待训练的特征提取模型进行多轮迭代训练,直到所述待训练的特征提取模型的训练损失达到训练目标时,确定所述待训练的特征提取模型的提取评估信息;
22.若所述待训练的特征提取模型的提取评估信息不满足目标评估条件,则将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
23.可选的,针对多轮迭代训练,分别执行以下操作,所述处理模块具体用于:
24.采用所述待训练的特征提取模型,对压缩训练样本图像进行特征提取处理,获得所述压缩训练样本图像对应的训练特征信息;
25.基于目标图像处理任务,对所述训练特征信息进行相应处理,获得所述压缩训练样本图像对应的训练处理结果;
26.若基于获得的训练特征信息和训练处理结果,确定所述待训练的特征提取模型的训练损失达到所述训练目标,则确定所述待训练的特征提取模型的提取评估信息。
27.可选的,所述样本集合还包括所述各个训练样本图像针对所述目标图像处理任务各自对应的样本处理结果;所述处理模块具体用于:
28.获取历史特征提取模型对所述压缩训练样本图像进行特征提取处理之后,获得的历史特征信息,其中,所述历史特征提取模型是上一次降低图像分辨率之后,训练获得的待训练的特征提取模型;
29.获取所述样本集合中,所述压缩训练样本图像对应的未经过压缩处理的训练样本图像对应的样本处理结果;
30.若基于所述训练特征信息与所述历史特征信息之间的特征信息误差,以及,所述训练处理结果与所述样本处理结果之间的处理结果误差,确定所述待训练的特征提取模型的训练损失达到所述训练目标,则确定所述待训练的特征提取模型的提取评估信息。
31.可选的,所述样本集合还包括未经过压缩处理的各个验证样本图像和所述各个验证样本图像针对所述目标图像处理任务各自对应的样本处理结果;所述处理模块具体用
于:
32.基于所述分辨率降采样策略,分别对所述各个验证样本图像进行压缩处理,获得各个压缩验证样本图像;
33.采用所述待训练的特征提取模型,分别对所述各个压缩验证样本图像进行特征提取处理,获得所述各个验证样本图像各自对应的验证特征信息;
34.基于所述目标图像处理任务,分别对各个验证特征信息进行相应处理,获得所述各个压缩验证样本图像各自对应的验证处理结果;
35.基于获得的各个验证处理结果分别与相应的样本处理结果之间的误差,确定所述待训练的特征提取模型的提取评估信息。
36.第三方面,提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述方法的步骤。
37.第四方面,提供一种计算机设备,包括:
38.存储器,用于存储程序指令;
39.处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如第一方面所述的方法。
40.第五方面,提供一种计算机可读存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面所述的方法。
41.本技术实施例中,在获得待提取图像之后,先对待提取图像进行压缩处理,再采用目标特征提取模型对压缩处理后的待处理图像进行特征提取处理,降低了特征提取过程中,目标特征提取模型需要处理的数据量,提高了采用神经网络模型处理图像过程中处理效率。
42.进一步的,在压缩过程中,是基于目标分辨率信息,对待提取图像进行的压缩处理,目标分辨率信息是基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值生成的,使得在保证目标特征提取模型的提取能力的前提下,最大程度的降低了目标特征提取模型需要处理的数据量,进一步提高了采用神经网络模型处理图像过程中处理效率。
附图说明
43.图1a为相关技术中特征提取方法的一种原理示意图一;
44.图1b为相关技术中特征提取方法的一种流程示意图;
45.图1c为相关技术中特征提取方法的一种原理示意图二;
46.图2为本技术实施例提供的特征提取方法的一种原理示意图一;
47.图3为本技术实施例提供的特征提取方法的一种应用场景;
48.图4为本技术实施例提供的特征提取方法的一种流程示意图一;
49.图5a为本技术实施例提供的特征提取方法的一种流程示意图二;
50.图5b为本技术实施例提供的特征提取方法的一种原理示意图二;
51.图5c为本技术实施例提供的特征提取方法的一种流程示意图三;
52.图5d为本技术实施例提供的特征提取方法的一种流程示意图四;
53.图5e为本技术实施例提供的特征提取方法的一种原理示意图三;
54.图6a为本技术实施例提供的特征提取方法的一种原理示意图四;
55.图6b为本技术实施例提供的特征提取方法的一种流程示意图五;
56.图7为本技术实施例提供的特征提取装置的一种结构示意图一;
57.图8为本技术实施例提供的特征提取装置的一种结构示意图二。
具体实施方式
58.为了使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。
59.下面对本技术实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
60.(1)知识蒸馏:
61.将一个模型,即教师模型中的隐含知识迁移到另一个模型,即学生模型中。学生模型相较于教师模型来说,模型结构和模型参数较为简单,教师模型相较于学生模型来说,特征提取能力更强。通过知识蒸馏,学生模型可以尽可能逼近或超过教师模型的特征提取能力。
62.(2)卷积神经网络:
63.神经网络是一种模仿生物神经网络的结构和功能的数学模型,用于对函数进行估计或近似。神经网络由大量的人工神经元联结组成,并形成层次结构,能在外界信息的基础上改变内部结构,是一种自适应系统,即具备学习功能。
64.卷积神经网络是使用卷积层的神经网络,卷积层用于捕获输入的局部特征,大量应用于图像相关任务中。
65.(3)全局池化层:
66.池化层是仿照人的视觉系统进行降维(降采样),用更高层的抽象表示图像特征的神经网络层。全局池化层是池大小等于输入大小的池化层,全局池化层汇总了空间信息,因此对输入的空间转换更加健壮。
67.本技术实施例涉及人工智能技术(artificial intelligence,ai)。基于人工智能技术中的计算机视觉技术(computer vision,cv)和机器学习(machine learning,ml)等而设计。
68.人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
69.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
70.计算机视觉技术计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图
形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
71.机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
72.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
73.下面对本技术实施例提供的特征提取方法的应用领域进行简单介绍。
74.随着科技的不断发展,越来越多的设备可以采用人工智能相关的神经网络模型,来实现智能化的图像处理任务。例如,采用神经网络模型识别图像中是否存在目标,又例如,采用神经网络模型跟踪视频中的指定目标等。
75.由于采用神经网络模型处理图像的过程较为复杂,因此,采用神经网络模型处理图像的处理效率较低,对设备的性能要求较高,为了提高采用神经网络模型处理图像的效率,传统的方法通常是通过降低神经网络模型的网络结构复杂度来实现的。
76.请参考图1a,原始神经网络具有大量的神经元,同时,各个神经元之间具备大量连接。请参考图1b,为相关技术中简化神经网络模型的网络结构的流程示意图。s101,获得原始的神经网络模型;s102,通过依次取消每个神经元,来评估各个神经元的重要程度;s103,通过依次取消每两个神经元之间的连接,来评估各个连接的重要程度;s104,根据评估结果,调整模型的网络结构;s105,判断是否继续调整模型的网络结构;s106,如果不需要继续调整模型的网络结构,那么确定出调整后的神经网络模型。
77.其中,评估神经元或连接的重要程度的方法有多种,例如,基于连接幅度的方法。由于特征的输出是由输入与权重相乘后进行加权,权重的幅度越小,对输出的贡献越小,因此可以基于权重的幅度来评估神经元或连接的重要程度,如l1或l2范数的大小。
78.又例如,基于损失函数的方法。通过删除神经元或连接之后,对神经网络模型的损失的影响,来评估相应神经元或连接的重要程度,从而可以找到一个模型参数集合,使得删除掉这个模型参数集合之后损失函数的增加最小。
79.从而,请参考图1c,通过移除重要程度较低的神经元,同时移除重要程度较低的连接,来简化神经网络模型的网络结构复杂度。
80.然而,为了保证神经网络模型针对图像的处理能力的稳定性,神经网络模型的网络结构的可简化程度有限,因此,采用神经网络模型处理图像过程中,仍然存在处理效率较低的问题。
81.为了解决采用神经网络模型处理图像过程中处理效率较低的问题,本技术提出一种特征提取方法。请参考图2,该方法在获得待提取图像之后,基于目标分辨率信息,对待提取图像进行压缩处理,获得压缩后的待提取图像。其中,目标分辨率信息是采用如下方法生成的:分别确定目标特征提取模型,针对具有不同图像分辨率的各个输入图像的提取评估信息,并基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值,生成目标分辨率信息。采用目标特征提取模型,对压缩后的待处理图像进行特征提取处理,获得待提取图像的目标特征信息。
82.本技术实施例中,在获得待提取图像之后,先对待提取图像进行压缩处理,再采用目标特征提取模型对压缩处理后的待处理图像进行特征提取处理,降低了特征提取过程中,目标特征提取模型需要处理的数据量,提高了采用神经网络模型处理图像过程中处理效率。
83.进一步的,在压缩过程中,是基于目标分辨率信息,对待提取图像进行的压缩处理,目标分辨率信息是基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值生成的,使得在保证目标特征提取模型的提取能力的前提下,最大程度的降低了目标特征提取模型需要处理的数据量,进一步提高了采用神经网络模型处理图像过程中处理效率。
84.下面对本技术提供的特征提取方法的应用场景进行说明。
85.请参考图3,为本技术实施例提供的特征提取方法的一种应用场景。该应用场景中包括特征提取端301和图像处理端302。特征提取端301和图像处理端302之间可以通信,通信方式可以是采用有线通信技术进行通信,例如通过连接网线或串口线进行通信;也可以是采用无线通信技术进行通信,例如通过蓝牙或无线保真(wireless fidelity,wifi)等技术进行通信,具体不做限制。
86.特征提取端301泛指可以对图像进行特征提取处理的设备,例如,包含卷积神经网络的特征提取部分的设备,特征提取端301可以包含全局池化层,针对不同图像分辨率的输入图像进行特征提取后,可以获得相同维度的特征信息。图像处理端302泛指可以对图像执行图像处理任务的设备。例如,终端设备、终端设备可以访问的第三方应用程序、终端设备可以访问的网页或服务器等。终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。服务器包括但不限于云服务器、本地服务器或关联的第三方服务器等。特征提取端301和图像处理端302均可以采用云计算,以减少本地计算资源的占用;同样也可以采用云存储,以减少本地存储资源的占用。
87.作为一种实施例,特征提取端301和图像处理端302可以是同一个设备,也可以是不同的设备,具体不做限制。本技术实施例中,以特征提取端301和图像处理端302为部署在同一个服务器上为例进行介绍。
88.请参考图4,为本技术实施例提供的特征提取方法的流程示意图。
89.s401,获得待提取图像。
90.服务器可以接收客户端发送的待提取图像,也可以接收其他设备发送的待提取图像,也可以调用内容中存储的待提取图像等,具体不做限制。待提取图像可以是拍摄或制作的图像,也可以是拍摄的视频中的一帧图像,或制作的动画中的一帧图像等,具体不做限制。
91.s402,基于目标分辨率信息,对待提取图像进行压缩处理,获得压缩后的待提取图像。
92.在获得待提取图像之后,服务器可以基于目标分辨率信息,对待提取图像进行压缩处理,获得压缩后的待提取图像。目标分辨率信息可以是采用如下方法获得的,服务器分别确定目标特征提取模型,针对具有不同图像分辨率的各个输入图像的提取评估信息,并基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值,生成目标分辨率信息。
93.目标分辨率信息可以是上述的图像分辨率的最小值,与可以是包含图像分辨率的最小值的一个取值区间,也可以是与图像分辨率的最小值相关联的一个取值区间等,具体不做限制。目标分辨率信息可以通过目标特征提取模型的训练过程获得,目标特征提取模型可以由服务器训练获得,也可以由其他设备训练获得,服务器在使用目标特征提取模型时,从其他设备中调用等,具体不做限制。
94.下面对训练待训练的特征提取模型获得目标特征提取模型的过程进行介绍。请参考图5a,为训练待训练的特征提取模型的流程示意图。
95.s51获取已训练的参考特征提取模型,作为待训练的特征提取模型。
96.参考特征提取模型是基于样本集合训练得到的,样本集合包括未经过压缩处理的各个训练样本图像。服务器可以将参考特征提取模型的网络结构,作为待训练的特征提取模型的网络结构,将参考特征提取模型的模型参数,作为待训练的特征提取模型的初始模型参数,从而,服务器获得待训练的特征提取模型。
97.s52,基于分辨率降采样策略,依次降低待训练的特征提取模型处理的输入图像的图像分辨率,确定待训练的特征提取模型的提取评估信息,直到待训练的特征提取模型的提取评估信息不满足目标评估条件时,将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
98.在获得待训练的特征提取模型之后,服务器可以对待训练的特征提取模型进行训练,为了保证待训练的特征提取模型的特征提取能力,服务器可以基于分辨率降采样策略,依次降低待训练的特征提取模型处理的输入图像的图像分辨率,每降低一次图像分辨率时,对待训练的特征提取模型进行多轮迭代训练,并确定待训练的特征提取模型的提取评估信息,判断待训练的特征提取模型的提取评估信息是否满足目标评估条件,在待训练的特征提取模型的提取评估信息不满足目标评估条件时,将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
99.例如,请参考图5b,为训练待训练的特征提取模型的原理示意图。上一次降低图像分辨率获得的待训练的特征提取模型记为m
t-1
,当前降低图像分辨率之后的待训练的特征提取模型记为m
t
。针对模型m
t-1
的各个输入图像x
t
∈a
t
的图像分辨率r
t
,进行降采样d
t
(
·
),获得各个压缩训练样本图像x
t-1
=d
t
(x
t
)∈a
t-1
的图像分辨率r
t-1
=r
t-s。模型m
t-1
的模型参数为模型m
t
的初始模型参数,采用各个压缩训练样本图像x
t-1
对模型m
t
进行多轮迭代训练,并确定待训练的特征提取模型的提取评估信息。
100.下面针对一次降低图像分辨率之后的过程为例进行介绍,每次降低图像分辨率之后的过程类似,在此不再赘述。请参考图5c,为一次降低图像分辨率之后的流程示意图。
101.s501,基于分辨率降采样策略,分别对各个训练样本图像进行压缩处理,获得各个
压缩训练样本图像。
102.在待训练的特征提取模型的输入图像的图像分辨率基于分辨率降采样策略进行了一次降低之后,可以基于分辨率降采样策略对样本集合包含的各个训练样本图像进行压缩处理,获得各个压缩训练样本图像。从而,服务器不需要重新获取用来训练待训练的特征提取模型的图像集合,就可以采用各个压缩训练样本图像进行训练。
103.s502,基于各个压缩训练样本图像,对待训练的特征提取模型进行多轮迭代训练,直到待训练的特征提取模型的训练损失达到训练目标时,确定待训练的特征提取模型的提取评估信息。
104.在获得各个压缩训练样本图像之后,服务器可以基于各个压缩训练样本图像,对待训练的特征提取模型进行多轮迭代训练,每进行一轮迭代训练,服务器可以确定待训练的特征提取模型的训练损失,并判断获得的训练损失是否达到训练目标。
105.下面针对一轮迭代训练的过程为例进行介绍,每轮迭代训练的过程类似,在此不再赘述。请参考图5d,为一轮迭代训练的流程示意图,请参考图5e,为一轮迭代训练的原理示意图。
106.s5001,采用待训练的特征提取模型,对压缩训练样本图像进行特征提取处理,获得压缩训练样本图像对应的训练特征信息。
107.基于各个压缩训练样本图像中的一个压缩训练样本图像,服务器将该压缩训练样本图像输入待训练的特征提取模型,采用待训练的特征提取模型,对压缩训练样本图像进行特征提取处理,获得该压缩训练样本图像对应的训练特征信息。
108.s5002,基于目标图像处理任务,对训练特征信息进行相应处理,获得压缩训练样本图像对应的训练处理结果。
109.在获得压缩训练样本图像对应的训练特征信息之后,服务器可以基于目标图像处理任务,对训练特征信息进行相应处理,获得压缩训练样本图像对应的训练处理结果。目标图像处理任务包括图像分类任务、图像识别任务或图像检测任务等针对图像的处理任务中的一种或多种,具体可以根据实际情况设置,在此不做限制。
110.s5003,若基于获得的训练特征信息和训练处理结果,确定待训练的特征提取模型的训练损失达到训练目标,则确定待训练的特征提取模型的提取评估信息。
111.在获得压缩训练样本图像对应的训练特征信息和训练处理结果之后,服务器可以基于获得的训练特征信息和训练处理结果,确定待训练的特征提取模型的训练损失是否达到训练目标。
112.作为一种实施例,如果样本集合还包括各个训练样本图像针对目标图像处理任务各自对应的样本处理结果,那么确定待训练的特征提取模型的训练损失是否达到训练目标方法可以是,先获取历史特征提取模型对压缩训练样本图像进行特征提取处理之后,获得的历史特征信息。其中,历史特征提取模型是上一次降低图像分辨率之后,训练获得的待训练的特征提取模型。再获取样本集合中,压缩训练样本图像对应的未经过压缩处理的训练样本图像对应的样本处理结果。
113.服务器分别确定训练特征信息与历史特征信息之间的特征信息误差,以及,训练处理结果与样本处理结果之间的处理结果误差。如果基于特征信息误差和处理结果误差,确定待训练的特征提取模型的训练损失达到训练目标,那么确定待训练的特征提取模型的
提取评估信息。
114.基于特征信息误差和处理结果误差,确定待训练的特征提取模型的训练损失达到训练目标的方法可以是,如果确定特征信息误差和处理结果误差分别收敛,那么确定待训练的特征提取模型的训练损失达到训练目标;也可以是如果确定特征信息误差和处理结果误差分别小于各自对应的误差阈值,那么确定待训练的特征提取模型的训练损失达到训练目标等,具体不做限制。
115.作为一种实施例,如果样本集合还包括未经过压缩处理的各个验证样本图像和各个验证样本图像针对目标图像处理任务各自对应的样本处理结果,那么服务器可以基于各个验证样本图像和各个验证样本图像针对目标图像处理任务各自对应的样本处理结果,确定待训练的特征提取模型的提取评估信息。
116.在待训练的特征提取模型的输入图像的图像分辨率基于分辨率降采样策略进行了一次降低之后,可以基于分辨率降采样策略对样本集合包含的各个验证样本图像进行压缩处理,获得各个压缩验证样本图像。从而,服务器不需要重新获取用来验证待训练的特征提取模型的图像集合,就可以采用各个压缩验证样本图像确定待训练的特征提取模型的提取评估信息。
117.在获得各个压缩验证样本图像之后,服务器可以采用待训练的特征提取模型,分别对各个压缩验证样本图像进行特征提取处理,获得各个验证样本图像各自对应的验证特征信息。
118.服务器可以基于目标图像处理任务,分别对各个验证特征信息进行相应处理,获得各个压缩验证样本图像各自对应的验证处理结果。在获得各个验证样本图像各自对应的验证处理结果之后,服务器可以基于获得的各个验证处理结果分别与相应的样本处理结果之间的误差,确定待训练的特征提取模型的提取评估信息。
119.s5004,若基于获得的训练特征信息和训练处理结果,确定待训练的特征提取模型的训练损失未达到训练目标,则调整待训练的特征提取模型的模型参数,继续对待训练的特征提取模型的进行下一轮迭代训练。
120.如果服务器在获得训练特征信息与历史特征信息之间的特征信息误差,以及,训练处理结果与样本处理结果之间的处理结果误差之后,确定基于特征信息误差和处理结果误差,确定待训练的特征提取模型的训练损失未达到训练目标,那么可以调整待训练的特征提取模型的模型参数,继续对待训练的特征提取模型的进行下一轮迭代训练。
121.s503,若待训练的特征提取模型的提取评估信息不满足目标评估条件,则将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
122.如果待训练的特征提取模型的提取评估信息不满足目标评估条件,说明待训练的特征提取模型在当前输入图像的图像分辨率的情况下,已经无法保证特征提取能力,因此,上一次降低图像分辨率之后训练获得的待训练的特征提取模型对应的图像分辨率,已经是保证待训练的特征提取模型的特征提取能力时对应的最小图像分辨率,那么可以将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
123.s504,若待训练的特征提取模型的提取评估信息满足目标评估条件,则继续基于
分辨率降采样策略,降低待训练的特征提取模型处理的输入图像的图像分辨率,继续进行训练。
124.如果待训练的特征提取模型的提取评估信息满足目标评估条件,说明待训练的特征提取模型的输入图像的图像分辨率可能还可以继续降低,因此可以继续基于分辨率降采样策略,降低待训练的特征提取模型处理的输入图像的图像分辨率,继续进行训练,依据下一次降低图像分辨率之后,待训练的特征提取模型的提取评估信息是否满足目标评估条件,决定是否继续降低图像分辨率。
125.s403,采用目标特征提取模型,对压缩后的待处理图像进行特征提取处理,获得待提取图像的目标特征信息。
126.在获得压缩后的待提取图像之后,可以采用目标特征提取模型之后,对压缩后的待处理图像进行特征提取处理,获得待提取图像的目标特征信息。
127.作为一种实施例,获得待提取图像的目标特征信息之后,可以基于目标图像处理任务,对目标特征信息进行相应处理,获得针对待提取图像的目标处理结果,其中,目标图像处理任务包括图像分类任务、图像识别任务或图像检测任务等针对图像的处理任务中的一种或多种。
128.下面对本技术实施例提供的特征提取方法中的训练过程进行示例介绍。待训练的特征提取模型记为m
t
,已训练的参考特征提取模型为t=0的情况,待训练的特征提取模型的输入图像的图像分辨率记为r
t
,参考特征提取模型的输入图像的图像分辨率为t=0的情况,待训练的特征提取模型的模型参数记为w
t
,参考特征提取模型的模型参数为t=0的情况。压缩处理后的各个压缩训练样本图像记为x
t
=d
t
(x
t-1
)∈a
t
,样本集合中的各个样本训练图像为t=0的情况,本实施例选用ms1m-arcface中的样本训练图像,压缩处理后的压缩验证样本图像记为b
t
,样本集合中的各个验证样本图像为t=0的情况,本技术实施例选用lfw中的验证样本图像。
129.ms1m-arcface数据集包含8.5万人的共5.8万张人脸图片,每张人脸图片的分辨率为112x112;lfw数据集共包含6000对人脸组成的图像对,其中3000对属于同一个人的2张人脸照片,3000对属于不同人的每人1张人脸照片。lfw数据集中所有人脸图像通过预处理方式对齐缩放到112x112分辨率。
130.请参考图6a,参考特征提取模型采用se-resnet18中的特征提取部分,se-resnet18中的特征提取部分可以输出256维特征向量,目标图像任务采用se-resnet18中的全连接层完成,全连接层可以输出8.5万维分类概率向量。
131.请参考图6b,为待训练的特征提取模型的训练流程示意图。
132.s601,基于上一次降低图像分辨率时,训练获得的模型构建模型m
t-1
;基于图像分辨率为r
t-1
=112*112的各个压缩训练样本图像x
t-1
∈a
t-1
作为输入图像,获得压缩训练样本图像x
t-1
的历史特征信息f
t-1
=m
t-1
(x
t-1
,w
t-1
)。
133.s602,基于模型m
t-1
,降低图像分辨率r
t
=(112-16)*(112-16),获得模型m
t

134.s603,采用降采样后的各个压缩训练样本图像x
t
作为输入图像,对模型m
t
进行训练,获得各个训练特征信息f
t
=m
t
(x
t
,w
t
);采用图像处理端对各个训练特征信息f
t
进行相应处理,获得各个训练处理结果p
t

135.s604,根据公式(1),确定训练特征信息f
t
与历史特征信息f
t-1
之间的特征信息误
差l
fd

[0136][0137]mt-1
学习到的隐含知识在输入图像压缩之后可能会丢失,通过特征蒸馏的方式,特征蒸馏损失l
fd
能够将m
t-1
学习到的隐含知识传递到模型m
t
中,在降低图像分辨率的同时,还可以保证特征提取模型的特征提取能力。
[0138]
s605,根据公式(2),确定训练处理结果p
t
与样本处理结果y之间的处理结果误差l
t

[0139][0140]
s606,根据公式(3),确定模型m
t
的训练损失,从而确定模型m
t
的训练损失是否达到训练目标;
[0141]
l=a
×
l
fd
+b
×
l
t
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0142]
其中,a和b分别为特征信息误差l
fd
和处理结果误差l
t
的权重系数。
[0143]
s607,如果达到训练目标,那么可以采用模型m
t
对压缩验证样本图像b
t
进行特征提取,获得验证特征信息,并采用图像处理端对验证特征信息进行相应处理,获得验证处理结果;
[0144]
通过验证处理结果与样本处理结果之间的误差,确定模型m
t
的提取评估信息,从而获得提取评估信息表征的图像任务精度;
[0145]
如果未达到训练目标,那么调整模型m
t
的模型参数,继续进行训练。
[0146]
s608,如果图像任务精度大于指定阈值a-0.005,那么继续降低图像分辨率,如果图像任务精度小于或等于指定阈值a-0.005,那么将上一次降低图像分辨率之后训练获得的模型m
t-1
作为目标特征提取模型。其中,a为已训练的参考特征提取模型的图像任务精度,0.005为允许的最大识别率下降幅度。
[0147]
在t=3时,人脸识别模型的输入分辨率为64x64,图像任务精度符合最低识别准确率要求。人脸识别模型seresnet-18的图像分辨率从初始的112x112降低到64x64,同时识别准确率下降幅度低于0.5个点,计算复杂度为加速前的(64/112)2=32.65%,降低了67.35%。
[0148]
基于同一发明构思,本技术实施例提供一种特征提取装置,该装置相当于前文论述的服务器,能够实现前述的特征提取方法对应的功能。请参考图7,该装置包括获取模块701和处理模块702,其中:
[0149]
获取模块701:用于获得待提取图像;
[0150]
处理模块702:用于基于目标分辨率信息,对待提取图像进行压缩处理,获得压缩后的待提取图像,其中,目标分辨率信息是采用如下方法生成的:分别确定目标特征提取模型,针对具有不同图像分辨率的各个输入图像的提取评估信息,并基于满足目标评估条件的提取评估信息对应的图像分辨率中的最小值,生成目标分辨率信息;
[0151]
处理模块702还用于:采用目标特征提取模型,对压缩后的待处理图像进行特征提取处理,获得待提取图像的目标特征信息。
[0152]
在一种可能的实施例中,处理模块702还用于:
[0153]
在采用目标特征提取模型,对压缩后的待处理图像进行特征提取处理,获得待提取图像的目标特征信息之后,基于目标图像处理任务,对目标特征信息进行相应处理,获得针对待提取图像的目标处理结果,其中,目标图像处理任务包括图像分类任务、图像识别任务或图像检测任务中的一种或多种。
[0154]
在一种可能的实施例中,目标特征提取模型是采用如下方法训练得到的,处理模块702还用于:
[0155]
获取已训练的参考特征提取模型,作为待训练的特征提取模型,其中,参考特征提取模型是基于样本集合训练得到的,样本集合包括未经过压缩处理的各个训练样本图像;
[0156]
基于分辨率降采样策略,依次降低待训练的特征提取模型处理的输入图像的图像分辨率,确定待训练的特征提取模型的提取评估信息,直到待训练的特征提取模型的提取评估信息不满足目标评估条件时,将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
[0157]
在一种可能的实施例中,每次降低图像分辨率时,执行以下操作处理模块702具体用于:
[0158]
基于分辨率降采样策略,分别对各个训练样本图像进行压缩处理,获得各个压缩训练样本图像;
[0159]
基于各个压缩训练样本图像,对待训练的特征提取模型进行多轮迭代训练,直到待训练的特征提取模型的训练损失达到训练目标时,确定待训练的特征提取模型的提取评估信息;
[0160]
若待训练的特征提取模型的提取评估信息不满足目标评估条件,则将上一次降低图像分辨率之后训练获得的待训练的特征提取模型输出,作为已训练的目标特征提取模型。
[0161]
在一种可能的实施例中,针对多轮迭代训练,分别执行以下操作,处理模块702具体用于:
[0162]
采用待训练的特征提取模型,对压缩训练样本图像进行特征提取处理,获得压缩训练样本图像对应的训练特征信息;
[0163]
基于目标图像处理任务,对训练特征信息进行相应处理,获得压缩训练样本图像对应的训练处理结果;
[0164]
若基于获得的训练特征信息和训练处理结果,确定待训练的特征提取模型的训练损失达到训练目标,则确定待训练的特征提取模型的提取评估信息。
[0165]
在一种可能的实施例中,样本集合还包括各个训练样本图像针对目标图像处理任务各自对应的样本处理结果;处理模块702具体用于:
[0166]
获取历史特征提取模型对压缩训练样本图像进行特征提取处理之后,获得的历史特征信息,其中,历史特征提取模型是上一次降低图像分辨率之后,训练获得的待训练的特征提取模型;
[0167]
获取样本集合中,压缩训练样本图像对应的未经过压缩处理的训练样本图像对应的样本处理结果;
[0168]
若基于训练特征信息与历史特征信息之间的特征信息误差,以及,训练处理结果与样本处理结果之间的处理结果误差,确定待训练的特征提取模型的训练损失达到训练目
标,则确定待训练的特征提取模型的提取评估信息。
[0169]
在一种可能的实施例中,样本集合还包括未经过压缩处理的各个验证样本图像和各个验证样本图像针对目标图像处理任务各自对应的样本处理结果;处理模块702具体用于:
[0170]
基于分辨率降采样策略,分别对各个验证样本图像进行压缩处理,获得各个压缩验证样本图像;
[0171]
采用待训练的特征提取模型,分别对各个压缩验证样本图像进行特征提取处理,获得各个验证样本图像各自对应的验证特征信息;
[0172]
基于目标图像处理任务,分别对各个验证特征信息进行相应处理,获得各个压缩验证样本图像各自对应的验证处理结果;
[0173]
基于获得的各个验证处理结果分别与相应的样本处理结果之间的误差,确定待训练的特征提取模型的提取评估信息。
[0174]
基于同一发明构思,本技术实施例提供一种计算机设备,下面对该计算机设备800进行介绍。
[0175]
请参照图8,上述特征提取装置可以运行在计算机设备800上,数据存储程序的当前版本和历史版本以及数据存储程序对应的应用软件可以安装在计算机设备800上,该计算机设备800包括显示单元840、处理器880以及存储器820,其中,显示单元840包括显示面板841,用于显示由用户交互操作界面等。
[0176]
在一种可能的实施例中,可以采用液晶显示器(liquid crystal display,lcd)或有机发光二极管oled(organic light-emitting diode)等形式来配置显示面板841。
[0177]
处理器880用于读取计算机程序,然后执行计算机程序定义的方法,例如处理器880读取数据存储程序或文件等,从而在该计算机设备800上运行数据存储程序,在显示单元840上显示对应的界面。处理器880可以包括一个或多个通用处理器,还可包括一个或多个dsp(digital signal processor,数字信号处理器),用于执行相关操作,以实现本技术实施例所提供的技术方案。
[0178]
存储器820一般包括内存和外存,内存可以为随机存储器(ram),只读存储器(rom),以及高速缓存(cache)等。外存可以为硬盘、光盘、usb盘、软盘或磁带机等。存储器820用于存储计算机程序和其他数据,该计算机程序包括各客户端对应的应用程序等,其他数据可包括操作系统或应用程序被运行后产生的数据,该数据包括系统数据(例如操作系统的配置参数)和用户数据。本技术实施例中程序指令存储在存储器820中,处理器880执行存储其中820中的程序指令,实现前文图论述的任意的一种特征提取方法。
[0179]
上述显示单元840用于接收输入的数字信息、字符信息或接触式触摸操作/非接触式手势,以及产生与计算机设备800的用户设置以及功能控制有关的信号输入等。具体地,本技术实施例中,该显示单元840可以包括显示面板841。显示面板841例如触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在显示面板841上或在显示面板841的操作),并根据预先设定的程式驱动相应的连接装置。
[0180]
在一种可能的实施例中,显示面板841可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测玩家的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给
处理器880,并能接收处理器880发来的命令并加以执行。
[0181]
其中,显示面板841可以采用电阻式、电容式、红外线以及表面声波等多种类型实现。除了显示单元840,计算机设备800还可以包括输入单元830,输入单元830可以包括图形输入设备831和其他输入设备832,其中其他输入设备可以但不限于包括物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0182]
除以上之外,计算机设备800还可以包括用于给其他模块供电的电源890、音频电路860、近场通信模块870和rf电路810。计算机设备800还可以包括一个或多个传感器850,例如加速度传感器、光传感器、压力传感器等。音频电路860具体包括扬声器861和麦克风862等,例如计算机设备800可以通过麦克风862采集用户的声音,进行相应的操作等。
[0183]
作为一种实施例,处理器880的数量可以是一个或多个,处理器880和存储器820可以是耦合设置,也可以是相对独立设置。
[0184]
作为一种实施例,图8中的处理器880可以用于实现如图7中的获取模块701和处理模块702的功能。
[0185]
作为一种实施例,图8中的处理器880可以用于实现前文论述的服务端102对应的功能。
[0186]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0187]
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0188]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1