本揭示有关于一种数据扩增装置、数据扩增方法以及非挥发性计算机可读存储介质,且特别是有关于机器学习的影像数据扩增装置、数据扩增方法以及非挥发性计算机可读存储介质。
背景技术:
1、近年来,在机器学习的领域中,自监督式学习(ssl;self-supervised learning)的方法被提出,以通过无标记数据训练自监督式学习模型的方式,来解决建置大型标记数据集的成本,以及数据集的标记质量管控等问题。而在自监督式学习的方法中,数据扩增是缩短训练时间、提高结果性能的关键因素之一。
2、然而,在大多数的数据扩增方法中,需要研究人员手动设计扩增流程(augmentation pipeline)中的参数,且扩增流程中的参数常为预设的值无法随机调整。有限的数据扩增集合可能使自监督式学习模型学习到的特征缺乏多样性,导致自监督式学习模型预测的稳健性(robustness)较低,因而影响自监督式学习模型于下游任务的结果性能。
技术实现思路
1、本揭示的一态样揭露一种数据扩增装置。此数据扩增装置包含处理器。处理器用以由原始影像撷取至少一样本影像,并输入至少一样本影像到至少二数据扩增模型中,以经由至少二数据扩增模型产生至少二扩增影像组。至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型。第一数据扩增模型的第一参数组合为固定值,且第二数据扩增模型的第二参数组合为非固定值。
2、于部分实施例中,其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数,其中该搜索空间中的单一影像的转化次数参数为固定值,且该每一影像转换中的全局参数为非固定值。
3、于部分实施例中,其中该处理器还用以输入该至少一样本影像至该第一数据扩增模型以产生该至少二扩增影像组中的第一扩增影像组,并将该至少一样本影像输入至该第二数据扩增模型以产生该至少二扩增影像组中的第二扩增影像组,其中该处理器还用以依据该第一扩增影像组与该第二扩增影像组计算总损失。
4、于部分实施例中,其中该处理器还用以于该原始影像中选取至少一像素点,并于第一数值与第二数值之间选取至少一比例数值,依据该至少一像素点及该至少一比例数值由该原始影像对应撷取该至少一样本影像,其中该至少一像素点为该至少一样本影像的中心点,该至少一比例数值为该至少一样本影像的长相对于该原始影像的长,且为该至少一样本影像的宽相对于该原始影像的宽。
5、本揭示的另一态样揭露一种数据扩增方法。此数据扩增方法包含以下步骤:由处理器从原始影像撷取至少一样本影像;以及由处理器输入至少一样本影像到至少二数据扩增模型中,以经由至少二数据扩增模型产生至少二扩增影像组;其中至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型,其中第一数据扩增模型的第一参数组合为固定值,且第二数据扩增模型的第二参数组合为非固定值。
6、于部分实施例中,其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数,其中该搜索空间中的单一影像的转化次数参数为固定值,且该每一影像转换中的全局参数为非固定值。
7、于部分实施例中,还包含:输入该至少一样本影像至该第一数据扩增模型以产生该至少二扩增影像组中的第一扩增影像组,并将该至少一样本影像输入至该第二数据扩增模型以产生该至少二扩增影像组中的第二扩增影像组;以及依据该第一扩增影像组与该第二扩增影像组计算总损失。
8、于部分实施例中,其中该第一数据扩增模型以及该第二数据扩增模型中的每一者包含多个影像转换策略,其中该至少一样本影像还用以经由所述多个影像转换策略以产生该至少二扩增影像组。
9、于部分实施例中,还包含:于该原始影像中选取至少一像素点,并于第一数值与第二数值之间选取至少一比例数值;以及依据该至少一像素点以及该至少一比例数值由该原始影像撷取该至少一样本影像;其中该至少一像素点为该至少一样本影像的中心点,该至少一比例数值为该至少一样本影像的长相对于该原始影像的长,且为该至少一样本影像的宽相对于该原始影像的宽。
10、本揭示的另一态样揭露一种非挥发性计算机可读存储介质,用以存储计算机程序,其中在执行计算机程序时,将致使一个或多个处理元件执行多个操作包含:从原始影像撷取至少一样本影像;以及输入至少一样本影像到至少二数据扩增模型中,以经由至少二数据扩增模型产生至少二扩增影像组;其中至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型,其中第一数据扩增模型的第一参数组合为固定值,且第二数据扩增模型的第二参数组合为非固定值。
1.一种数据扩增装置,其特征在于,包含:
2.根据权利要求1所述的数据扩增装置,其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数,其中该搜索空间中的单一影像的转化次数参数为固定值,且该每一影像转换中的全局参数为非固定值。
3.根据权利要求1所述的数据扩增装置,其中该处理器还用以输入该至少一样本影像至该第一数据扩增模型以产生该至少二扩增影像组中的第一扩增影像组,并将该至少一样本影像输入至该第二数据扩增模型以产生该至少二扩增影像组中的第二扩增影像组,其中该处理器还用以依据该第一扩增影像组与该第二扩增影像组计算总损失。
4.根据权利要求1所述的数据扩增装置,其中该处理器还用以于该原始影像中选取至少一像素点,并于第一数值与第二数值之间选取至少一比例数值,依据该至少一像素点及该至少一比例数值由该原始影像对应撷取该至少一样本影像,其中该至少一像素点为该至少一样本影像的中心点,该至少一比例数值为该至少一样本影像的长相对于该原始影像的长,且为该至少一样本影像的宽相对于该原始影像的宽。
5.一种数据扩增方法,其特征在于,包含:
6.根据权利要求5所述的数据扩增方法,其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数,其中该搜索空间中的单一影像的转化次数参数为固定值,且该每一影像转换中的全局参数为非固定值。
7.根据权利要求5所述的数据扩增方法,其中还包含:
8.根据权利要求5所述的数据扩增方法,其中该第一数据扩增模型以及该第二数据扩增模型中的每一者包含多个影像转换策略,其中该至少一样本影像还用以经由所述多个影像转换策略以产生该至少二扩增影像组。
9.根据权利要求5所述的数据扩增方法,其中还包含:
10.一种非挥发性计算机可读存储介质,其特征在于,用以存储计算机程序,其中在执行该计算机程序时,将致使一个或多个处理元件执行多个操作包含: