图像处理方法、装置、芯片、电子设备和存储介质与流程

文档序号:30494556发布日期:2022-06-22 03:34阅读:106来源:国知局
图像处理方法、装置、芯片、电子设备和存储介质与流程

1.本公开涉及图像处理技术领域,具体涉及一种图像处理方法、装置、芯片、电子设备和存储介质。


背景技术:

2.近年来,随着人工智能技术的发展,可以对图像和视频进行各种自动化处理,例如图像细节增强、去噪等处理。图像细节增强技术是通过图像处理的方法在原有图像的基础上增加或还原细节的一种技术,经过处理的图像将比原始图像具有更精细的纹理和视觉表现。相关技术中,可以使用多帧融合的方式对图像进行处理,即通过将数张连续拍摄的图像来进行去噪和细节增强,但是所实现处理效果有待提高,处理结果的图像质量难以达到用户满意。


技术实现要素:

3.为克服相关技术中存在的问题,本公开实施例提供一种图像处理方法、装置、芯片、电子设备和存储介质,用以解决相关技术中的缺陷。
4.根据本公开实施例的第一方面,提供一种图像处理方法,包括:
5.获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,其中,所述待处理图像序列包括按顺序排列的多帧待处理图像及每帧待处理图像的噪声图;
6.分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征;
7.对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理;
8.将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。
9.在一个实施例中,所述获取待处理图像序列,包括:
10.获取按顺序排列的多帧待处理图像,并根据采集待处理图像的采集设备的参数生成每帧待处理图像的噪声图;
11.将按顺序排列的多帧待处理图像,以及每帧待处理图像的噪声图生成待处理图像序列。
12.在一个实施例中,所述对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理,包括:
13.针对所述待处理图像序列中待处理图像的各个颜色通道和噪声图,提取所述待处理图像序列的浅层特征;
14.以所述浅层特征作为特征对齐处理的引导信息,分别对所述第一深层特征和所述第二深层特征进行特征对齐处理。
15.在一个实施例中,所述图像处理方法利用神经网络模型执行,所述神经网络模型
包括特征提取模块、特征对齐模块和特征融合模块;
16.其中,所述特征提取模块用于分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征;所述特征对齐模块用于对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理;所述特征融合模块用于将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。
17.在一个实施例中,所述神经网络模型还包括预处理模块,用于获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,其中,所述待处理图像序列包括按顺序排列的多帧待处理图像及每帧待处理图像的噪声图。
18.在一个实施例中,还包括:
19.获取训练集中的训练图像序列,并对所述训练图像序列中的每帧训练图像增加噪声,得到每帧训练图像的噪声图;
20.将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中,输出所述预测图像;
21.根据所述预测图像和所述训练图像序列的标签图像,确定网络损失值,并根据所述网络损失值对所述神经网络模型的网络参数进行调整,直至所述神经网络模型收敛。
22.在一个实施例中,在所述将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中之前,还包括:
23.针对所述训练图像序列,保持中间帧的训练图像位置不变,对其他帧训练图像进行随机排列。
24.在一个实施例中,在所述将所述训练图像序列,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图及每帧训练图像的噪声图输入至所述神经网络模型中之前,还包括:
25.分别对每一帧训练图像进行增强处理。
26.在一个实施例中,还包括:
27.获取多个原始图像序列,其中,每个原始图像序列均包括预设数量的原始图像;
28.对每个原始图像序列中的每个原始图像进行模糊处理,得到每个原始图像对应的训练图像;
29.按照每个原始图像序列中各个原始图像的排列顺序,对各个原始图像对应的训练图像进行排列,得到每个原始图像序列对应的训练图像序列,并根据全部训练图像序列确定训练集。
30.在一个实施例中,还包括:
31.将所述原始图像序列的中间帧原始图像,确定为对应的所述训练图像序列的标签图像。
32.根据本公开实施例的第二方面,提供一种图像处理装置,包括:
33.预处理模块,用于获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,其中,所述待处理图像序列包括按顺序排列的多帧待处理图像及每帧待处理图像的噪声图;
34.特征提取模块,用于分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征;
35.特征对齐模块,用于对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理;
36.特征融合模块,用于将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。
37.在一个实施例中,所述获取模块用于获取待处理图像序列时,具体用于:
38.获取按顺序排列的多帧待处理图像,并根据采集待处理图像的采集设备的参数生成每帧待处理图像的噪声图;
39.将按顺序排列的多帧待处理图像,以及每帧待处理图像的噪声图生成待处理图像序列。
40.在一个实施例中,所述特征对齐模块具体用于:
41.针对所述待处理图像序列中待处理图像的各个颜色通道和噪声图,提取所述待处理图像序列的浅层特征;
42.以所述浅层特征作为特征对齐处理的引导信息,分别对所述第一深层特征和所述第二深层特征进行特征对齐处理。
43.在一个实施例中,所述图像处理装置包括神经网络模型,所述神经网络模型包括所述特征提取模块、所述特征对齐模块和所述特征融合模块。
44.在一个实施例中,所述神经网络模型还包括所述预处理模块。
45.在一个实施例中,所述图像处理装置还包括训练模块,用于:
46.获取训练集中的训练图像序列,并对所述训练图像序列中的每帧训练图像增加噪声,得到每帧训练图像的噪声图;
47.将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中,输出所述预测图像;
48.根据所述预测图像和所述训练图像序列的标签图像,确定网络损失值,并根据所述网络损失值对所述神经网络模型的网络参数进行调整,直至所述神经网络模型收敛。
49.在一个实施例中,所述训练模块还用于:
50.在所述将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中之前,针对所述训练图像序列,保持中间帧的训练图像位置不变,对其他帧训练图像进行随机排列。
51.在一个实施例中,所述训练模块还用于:
52.在所述将所述训练图像序列,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图及每帧训练图像的噪声图输入至所述神经网络模型中之前,分别对每一帧训练图像进行增强处理。
53.在一个实施例中,还包括训练集生成模块,用于:
54.获取多个原始图像序列,其中,每个原始图像序列均包括预设数量的原始图像;
55.对每个原始图像序列中的每个原始图像进行模糊处理,得到每个原始图像对应的训练图像;
56.按照每个原始图像序列中各个原始图像的排列顺序,对各个原始图像对应的训练
图像进行排列,得到每个原始图像序列对应的训练图像序列,并根据全部训练图像序列确定训练集。
57.在一个实施例中,所述训练集生成模块还用于:
58.将所述原始图像序列的中间帧原始图像,确定为对应的所述训练图像序列的标签图像。
59.根据本公开实施例的第三方面,提供一种芯片,所述芯片用于执行第一方面所述的图像处理方法。
60.根据本公开实施例的第四方面,提供一种电子设备,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于第一方面所述的图像处理方法。
61.根据本公开实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的方法。
62.本公开的实施例提供的技术方案可以包括以下有益效果:
63.本公开通过获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,可以分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征,并且可以进一步对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理,最后可以将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。由于融合了待处理图像序列的正反两个方向所提取并对其的深层特征,因此充分利用了待处理图像序列中待处理图像的特征信息,对图像的增强和去噪效果较为明显,所得到的目标图像质量较高,提高了用户的满意程度。
附图说明
64.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
65.图1是本公开一示例性实施例示出的图像处理方法的流程图;
66.图2是本公开一示例性实施例示出的特征提取模块的结构示意图;
67.图3是本公开一示例性实施例示出的神经网络模型的训练方法的流程图;
68.图4是本公开一示例性实施例示出的图像处理装置的结构示意图;
69.图5是本公开一示例性实施例示出的电子设备的结构框图。
具体实施方式
70.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
71.在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
72.应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
73.第一方面,本公开至少一个实施例提供了一种图像处理方法,请参照附图1,其示出了该方法的流程,包括步骤s101和步骤s104。
74.其中,该方法可以用于对图像进行细节增强和去噪处理。该方法可以采用多帧融合的方式对图像进行细节增强和去噪处理,例如在一个可能的场景中,该方法应用于拍照程序,摄像头可以连续拍摄多帧原始图像,然后对这多帧原始图像进行处理,得到最终的输出图像。
75.该方法应用于用户设备(user equipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)手持设备、计算设备、车载设备、可穿戴设备等终端设备或者服务器。
76.在步骤s101中,获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,其中,所述待处理图像序列包括按顺序排列的多帧待处理图像及每帧待处理图像的噪声图。
77.其中,待处理图像序列可以为摄像头连续拍摄的多帧图像,或者是摄像头拍摄的视频中连续的多个图像帧。待处理图像可以为rgb三通道图像。
78.在一个可能的实施例中,可以按照下述方式获取待处理图像序列:首先,获取按顺序排列的多帧待处理图像,并根据采集待处理图像的采集设备的参数生成每帧待处理图像的噪声图,其中,采集设备可以为相机、摄像头等。示例性的,可以按照预设数量要求,实时获取采集设备最新采集的预设数量帧待处理图像,例如预设数量为5,则可以设置帧数为5的时间窗,该时间窗以最新采集的一帧待处理图像为终点,每采集一帧待处理图像则采集一次时间窗内的5帧待处理图像。采集设备的参数能够影响其所采集的图像的噪声,因此可以根据该参数生成每帧待处理图像的噪声图(noise map),噪声图能够反映噪声位置和噪声强度,噪声图的尺寸、通道数与待处理图像一致。接下来,将按顺序排列的多帧待处理图像,以及每帧待处理图像的噪声图生成待处理图像序列。
79.其中,待处理图像序列的反向图像序列中的多帧待处理图像的排列顺序,与待处理图像序列中的多帧待处理图像的排列顺序相反。在一个可能的实施例中,可以按照下述方式生成所述待处理图像序列的反向图像序列:先将待处理图像序列中的多帧待处理图像的排列顺序调整为完全相反的顺序,例如共5帧图像,将原第1帧调整为第5帧,原第2帧调整为第4帧,原第3帧位置不变,原第4帧调整为第2帧,原第5帧调整为第1帧;然后将反向排列的多帧待处理图像,以及每帧待处理图像的噪声图生成待处理图像序列的反向图像序列。
80.可以理解的是,本步骤可以使用神经网络模型来执行,即将待处理图像序列输入神经网络模型后,神经网络模型执行该步骤。示例性的,神经网络模型具有预处理模块,该预处理模块用于执行本步骤。
81.在步骤s102中,分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征。
82.其中,待处理图像序列和其反向图像序列中的待处理图像排列顺序相反,因此信息流向相反,因此所提取的深层特征所表征的内容不同,两个方向的深层特征能够更加全面的表征待处理图像序列内的图像内容。
83.可以理解的是,本步骤可以使用神经网络模型来执行。示例性的,神经网络模型具有用于执行本步骤的特征提取模块,若步骤s101是神经网络模型的预处理模块所执行的,则预处理模块可以将待处理图像序列和待处理图像序列的反向图像序列输入至该特征提取模块;然后该特征提取模块分别对待处理图像序列和其反向图像序列执行一致的提取操作,即分别提取待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征;若步骤s101并非神经网络模型所执行,则用于执行步骤s101的模块可以将待处理图像序列和待处理图像序列的反向图像序列输入至神经网络模型的特征提取模块,以使其按照上述方式完成特征提取。
84.特征提取模块可以包括采用残差连接方式堆叠的多层卷积单元组,每层卷积单元组内具有至少两个卷积单元,还包括级联层、注意力机制层等,例如可以为残差特征蒸馏模块(residual feature distillation block)。
85.在一个示例中,特征提取模块可以为附图2所示的结构,待特征提取的数据(input)输入至该模块后,数据的通道被分成两部分,例如16个通道被分为8+8的形式,然后一部分通道(例如8个通道)被第一层的3*3卷积单元(conv3)进行卷积处理,另一部分通道(例如8个通道)被第一层的1*1卷积单元(conv1)进行卷及处理;然后第一层3*3卷积单元的卷积处理结果的通道被分成两部分,例如8个通道被分为4+4的形式,然后一部分通道(例如4个通道)被第二层的3*3卷积单元进行卷积处理,另一部分通道(例如4个通道)被第二层的1*1卷积单元进行卷及处理;然后第二层3*3卷积单元的卷积处理结果的通道被分成两部分,例如4个通道被分为2+2的形式,然后一部分通道(例如2个通道)被第三层的3*3卷积单元进行卷积处理,另一部分通道(例如2个通道)被第三层的1*1卷积单元进行卷及处理;然后第三层3*3卷积单元的卷积处理结果被第四层的3*3卷积单元进行卷积处理;然后级联层(concat)对第一层1*1卷积单元的卷积结果、第二层1*1卷积单元的卷积结果、第三层1*1卷积单元的卷积结果、第四层3*3卷积单元的卷积处理结果进行级联;然后级联结果被第四层的1*1卷积单元进行卷积;第四层的1*1卷积单元的卷积结果输入至注意力机制层(attention)被处理,处理结果与输入数据联合生成该模块提取的特征(output)。该示例中,采用拆分通道和残差学习的方式,在不明显增加计算量的情况下提升网络效果。
86.在步骤s103中,对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理。
87.本步骤中,可以先针对所述待处理图像序列中待处理图像的各个颜色通道和噪声图,提取所述待处理图像序列的浅层特征;然后以所述浅层特征作为特征对齐处理的引导信息,分别对所述第一深层特征和所述第二深层特征进行特征对齐处理。由于待处理图像的各个颜色通道均包含重要且有效信息,因此针对全通道提取的浅层特征能够提高特征对齐的效果,相较于单个颜色通道的引导作用,本技术的引导作用极大提高。
88.可以理解的是,本步骤可以使用神经网络模型来执行。示例性的,该神经网络模型具有用于执行本步骤的特征对齐模块,则执行步骤s102的特征提取模块将提取到的第一深层特征和第二深层特征输入至该特征对齐模块,然后特征对齐模块可以按照上述方式分别
对第一深层特征和第二深层特征进行对齐处理。
89.特征对齐模块可以基于金字塔convlstm结构设计,内部卷积为3x3卷积形式。现有算法中金字塔convlstm里的卷积采用的是可形变卷积,可以通过结构调整将可形变卷积改为传统3x3卷积,以适应更多的硬件需求。
90.在步骤s104中,将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。
91.可以理解的是,本步骤可以使用神经网络模型来执行。示例性的,该神经网络模型具有用于执行本步骤的特征融合模块,则执行步骤s103的特征对齐模块将对齐后的第一深层特征和第二深层特征输入该特征融合模块,然后该特征融合模块可以对两个深层特征进行融合,进而生成目标图像,即细节增强和降噪后的图像。
92.特征融合模块采用unet结构,其内部的卷积核也可以采用如图2所示的特征提取模块显示的分通道残差结构代替,从而提高融合效果。
93.本公开通过获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,可以分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征,并且可以进一步对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理,最后可以将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。由于融合了待处理图像序列的正反两个方向所提取并对其的深层特征,因此充分利用了待处理图像序列中待处理图像的特征信息,对图像的增强和去噪效果较为明显,所得到的目标图像质量较高,提高了用户的满意程度。
94.本公开的一些实施例中,利用神经网络模型来执行本公开的图像处理方法,所述神经网络模型包括预处理模块、特征提取模块、特征对齐模块和特征融合模块;其中,所述预处理模块用于获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,其中,所述待处理图像序列包括按顺序排列的多帧待处理图像及每帧待处理图像的噪声图(即执行附图1中所示的步骤s101);所述特征提取模块用于分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征(即执行附图1中所示的步骤s102);所述特征对齐模块用于对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理(即执行附图1中所示的步骤s103);所述特征融合模块用于将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像(即执行附图1中所示的步骤s104)。
95.基于上述实施例中的神经网络模型,本公开一些实施例采用如图3所示的方式进行模型训练,包括步骤s301至步骤s303。
96.在步骤s301中,获取训练集中的训练图像序列,并对所述训练图像序列中的每帧训练图像增加噪声,得到每帧训练图像的噪声图。
97.可以选择数据集来生成训练集。一种情况下,数据集为reds数据集等,数据集内的数据(图像序列或视频)成对存在,每一对数据的清晰度不同,这种情况下可以直接将该数据集作为训练集,即将每一对数据中清晰度较差的数据作为训练图像序列,将每一对数据中清晰度较高的数据中的某一帧图像作为对应的标签图像。
98.另一种情况下,数据集为vimeo90k数据集等,数据集内的数据(图像序列或视频)并非成对存在,这种情况下可以按照下述方式生成训练集:首先,获取数据集内的多个原始
图像序列,其中,每个原始图像序列均包括预设数量(例如5帧)的原始图像;然后对每个原始图像序列中的每个原始图像进行模糊处理,得到每个原始图像对应的训练图像;最后,按照每个原始图像序列中各个原始图像的排列顺序,对各个原始图像对应的训练图像进行排列,得到每个原始图像序列对应的训练图像序列,并根据全部训练图像序列确定训练集。同时还可以将所述原始图像序列的中间帧原始图像,确定为对应的所述训练图像序列的标签图像。
99.可以为每个训练图像随机增加shot噪声(散粒噪声)和read噪声(读出噪声),进而计算对应噪声强度的噪声图(noise map)。
100.在步骤s302中,将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中,输出所述预测图像。
101.可选的,在将训练图像序列及每帧训练图像的噪声图,和训练图像序列的反向图像序列及每帧训练图像的噪声图输入至神经网络模型前,还可以对训练图像序列进行下述至少一项处理:针对所述训练图像序列,保持中间帧的训练图像位置不变,对其他帧训练图像进行随机排列;分别对每一帧训练图像进行增强处理,例如可以采用下述至少一种算法对图像进行增强处理:cutblur算法(剪切模糊算法)、随机rgb算法(随机颜色通道算法)、copyblend算法(复制混合算法)、invertcolor算法(反色算法)、hightlight算法(高光算法)。
102.针对训练图像序列进行顺序调整或图像增强后,对应的反向图像序列的顺序和图像也相应更新,即始终保持训练图像序列和其反向图像序列的顺序相反,且同时保证训练图像序列和其反向图像序列中的同一张图像状态一致。
103.通过对训练图像序列的顺序和图像质量进行改变,可以扩充训练数据的量,即同一个训练图像序列通过上述两方面处理可以扩充出更多的训练图像序列,从而可以提高训练效果。
104.其中,神经网络模型可以对输入的训练图像序列和反向图像序列分别进行深层特征提取,并使用浅层特征对两个深层特征进行对齐处理,最后对两个深层特征进行融合,得到预测图像。
105.在步骤s303中,根据所述预测图像和所述训练图像序列的标签图像,确定网络损失值,并根据所述网络损失值对所述神经网络模型的网络参数进行调整,直至所述神经网络模型收敛。
106.可以采用l1 loss和srgb loss等损失函数。为避免学习率较大的时候会发生梯度爆炸,可以采用初始学习率为10e-5
,每20epoch(轮)衰减10e-1
,衰减三次。
107.本实施例中,通过训练集中的训练图像序列对神经网络模型进行训练,从而使神经网络模型能够对连续拍摄的多帧图像进行图像增强,从而生成高质量的目标图像,满足用户的质量要求。
108.根据本公开实施例的第二方面,提供一种图像处理装置,请参照附图4,所述装置包括:
109.预处理模块401,用于获取待处理图像序列,并生成所述待处理图像序列的反向图像序列,其中,所述待处理图像序列包括按顺序排列的多帧待处理图像及每帧待处理图像
的噪声图;
110.特征提取模块402,用于分别提取所述待处理图像序列的第一深层特征和所述待处理图像序列的反向图像序列的第二深层特征;
111.特征对齐模块403,用于对所述第一深层特征进行特征对齐处理,并对所述第二深层特征进行特征对齐处理;
112.特征融合模块404,用于将所述第一深层特征和所述第二深层特征进行融合处理,并根据融合处理的结果生成目标图像。
113.在本公开的一些实施例中,所述获取模块用于获取待处理图像序列时,具体用于:
114.获取按顺序排列的多帧待处理图像,并根据采集待处理图像的采集设备的参数生成每帧待处理图像的噪声图;
115.将按顺序排列的多帧待处理图像,以及每帧待处理图像的噪声图生成待处理图像序列。
116.在本公开的一些实施例中,所述特征对齐模块具体用于:
117.针对所述待处理图像序列中待处理图像的各个颜色通道和噪声图,提取所述待处理图像序列的浅层特征;
118.以所述浅层特征作为特征对齐处理的引导信息,分别对所述第一深层特征和所述第二深层特征进行特征对齐处理。
119.在本公开的一些实施例中,所述图像处理装置包括神经网络模型,所述神经网络模型包括所述特征提取模块、所述特征对齐模块和所述特征融合模块。
120.在本公开的一些实施例中,所述神经网络模型还包括所述预处理模块。
121.在本公开的一些实施例中,所述图像处理装置还包括训练模块,用于:
122.获取训练集中的训练图像序列,并对所述训练图像序列中的每帧训练图像增加噪声,得到每帧训练图像的噪声图;
123.将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中,输出所述预测图像;
124.根据所述预测图像和所述训练图像序列的标签图像,确定网络损失值,并根据所述网络损失值对所述神经网络模型的网络参数进行调整,直至所述神经网络模型收敛。
125.在本公开的一些实施例中,所述训练模块还用于:
126.在所述将所述训练图像序列及每帧训练图像的噪声图,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图输入至所述神经网络模型中之前,针对所述训练图像序列,保持中间帧的训练图像位置不变,对其他帧训练图像进行随机排列。
127.在本公开的一些实施例中,所述训练模块还用于:
128.在所述将所述训练图像序列,和所述训练图像序列的反向图像序列及每帧训练图像的噪声图及每帧训练图像的噪声图输入至所述神经网络模型中之前,分别对每一帧训练图像进行增强处理。
129.在本公开的一些实施例中,还包括训练集生成模块,用于:
130.获取多个原始图像序列,其中,每个原始图像序列均包括预设数量的原始图像;
131.对每个原始图像序列中的每个原始图像进行模糊处理,得到每个原始图像对应的训练图像;
132.按照每个原始图像序列中各个原始图像的排列顺序,对各个原始图像对应的训练图像进行排列,得到每个原始图像序列对应的训练图像序列,并根据全部训练图像序列确定训练集。
133.在本公开的一些实施例中,所述训练集生成模块还用于:
134.将所述原始图像序列的中间帧原始图像,确定为对应的所述训练图像序列的标签图像。
135.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在第一方面有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
136.根据本公开实施例的第三方面,提供一种芯片,所述芯片用于执行第一方面所述的图像处理方法。其中,所述芯片可以为常规的cpu(central processing unit,中央处理器)芯片、gpu(graphics processing unit,图形处理器)芯片等,也可以为人工智能技术专用的加速芯片,例如ai(artificial intelligence,人工智能)加速器等。
137.根据本公开实施例的第四方面,请参照附图5,其示例性的示出了一种电子设备的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
138.参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(i/o)的接口512,传感器组件514,以及通信组件516。
139.处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理部件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
140.存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
141.电力组件506为装置500的各种组件提供电力。电力组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
142.多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触控面板(tp)。如果屏幕包括触控面板,屏幕可以被实现为触控屏,以接收来自用户的输入信号。触控面板包括一个或多个触控传感器以感测触控、滑动和触控面板上的手势。所述触控传感器可以不仅感测触控或滑动动作的边界,而且还检测与所述触控或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
143.音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(mic),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
144.i/o接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
145.传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到装置500的打开/关闭状态,组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514还可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
146.通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如wifi,2g或3g,4g或5g或它们的组合。在一个示例性实施例中,通信部件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件516还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
147.在示例性实施例中,装置500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述电子设备的供电方法。
148.第五方面,本公开在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述电子设备的供电方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
149.本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
150.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1