数据扩增装置、方法以及非挥发性计算机可读存储介质与流程

文档序号：37926866发布日期：2024-05-11 00:05阅读：12来源：国知局

本揭示有关于一种数据扩增装置、数据扩增方法以及非挥发性计算机可读存储介质，且特别是有关于机器学习的影像数据扩增装置、数据扩增方法以及非挥发性计算机可读存储介质。

背景技术：

1、近年来，在机器学习的领域中，自监督式学习(ssl；self-supervised learning)的方法被提出，以通过无标记数据训练自监督式学习模型的方式，来解决建置大型标记数据集的成本，以及数据集的标记质量管控等问题。而在自监督式学习的方法中，数据扩增是缩短训练时间、提高结果性能的关键因素之一。

2、然而，在大多数的数据扩增方法中，需要研究人员手动设计扩增流程(augmentation pipeline)中的参数，且扩增流程中的参数常为预设的值无法随机调整。有限的数据扩增集合可能使自监督式学习模型学习到的特征缺乏多样性，导致自监督式学习模型预测的稳健性(robustness)较低，因而影响自监督式学习模型于下游任务的结果性能。

技术实现思路

1、本揭示的一态样揭露一种数据扩增装置。此数据扩增装置包含处理器。处理器用以由原始影像撷取至少一样本影像，并输入至少一样本影像到至少二数据扩增模型中，以经由至少二数据扩增模型产生至少二扩增影像组。至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型。第一数据扩增模型的第一参数组合为固定值，且第二数据扩增模型的第二参数组合为非固定值。

2、于部分实施例中，其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数，其中该搜索空间中的单一影像的转化次数参数为固定值，且该每一影像转换中的全局参数为非固定值。

3、于部分实施例中，其中该处理器还用以输入该至少一样本影像至该第一数据扩增模型以产生该至少二扩增影像组中的第一扩增影像组，并将该至少一样本影像输入至该第二数据扩增模型以产生该至少二扩增影像组中的第二扩增影像组，其中该处理器还用以依据该第一扩增影像组与该第二扩增影像组计算总损失。

4、于部分实施例中，其中该处理器还用以于该原始影像中选取至少一像素点，并于第一数值与第二数值之间选取至少一比例数值，依据该至少一像素点及该至少一比例数值由该原始影像对应撷取该至少一样本影像，其中该至少一像素点为该至少一样本影像的中心点，该至少一比例数值为该至少一样本影像的长相对于该原始影像的长，且为该至少一样本影像的宽相对于该原始影像的宽。

5、本揭示的另一态样揭露一种数据扩增方法。此数据扩增方法包含以下步骤：由处理器从原始影像撷取至少一样本影像；以及由处理器输入至少一样本影像到至少二数据扩增模型中，以经由至少二数据扩增模型产生至少二扩增影像组；其中至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型，其中第一数据扩增模型的第一参数组合为固定值，且第二数据扩增模型的第二参数组合为非固定值。

6、于部分实施例中，其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数，其中该搜索空间中的单一影像的转化次数参数为固定值，且该每一影像转换中的全局参数为非固定值。

7、于部分实施例中，还包含：输入该至少一样本影像至该第一数据扩增模型以产生该至少二扩增影像组中的第一扩增影像组，并将该至少一样本影像输入至该第二数据扩增模型以产生该至少二扩增影像组中的第二扩增影像组；以及依据该第一扩增影像组与该第二扩增影像组计算总损失。

8、于部分实施例中，其中该第一数据扩增模型以及该第二数据扩增模型中的每一者包含多个影像转换策略，其中该至少一样本影像还用以经由所述多个影像转换策略以产生该至少二扩增影像组。

9、于部分实施例中，还包含：于该原始影像中选取至少一像素点，并于第一数值与第二数值之间选取至少一比例数值；以及依据该至少一像素点以及该至少一比例数值由该原始影像撷取该至少一样本影像；其中该至少一像素点为该至少一样本影像的中心点，该至少一比例数值为该至少一样本影像的长相对于该原始影像的长，且为该至少一样本影像的宽相对于该原始影像的宽。

10、本揭示的另一态样揭露一种非挥发性计算机可读存储介质，用以存储计算机程序，其中在执行计算机程序时，将致使一个或多个处理元件执行多个操作包含：从原始影像撷取至少一样本影像；以及输入至少一样本影像到至少二数据扩增模型中，以经由至少二数据扩增模型产生至少二扩增影像组；其中至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型，其中第一数据扩增模型的第一参数组合为固定值，且第二数据扩增模型的第二参数组合为非固定值。

技术特征：

1.一种数据扩增装置，其特征在于，包含：

2.根据权利要求1所述的数据扩增装置，其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数，其中该搜索空间中的单一影像的转化次数参数为固定值，且该每一影像转换中的全局参数为非固定值。

3.根据权利要求1所述的数据扩增装置，其中该处理器还用以输入该至少一样本影像至该第一数据扩增模型以产生该至少二扩增影像组中的第一扩增影像组，并将该至少一样本影像输入至该第二数据扩增模型以产生该至少二扩增影像组中的第二扩增影像组，其中该处理器还用以依据该第一扩增影像组与该第二扩增影像组计算总损失。

4.根据权利要求1所述的数据扩增装置，其中该处理器还用以于该原始影像中选取至少一像素点，并于第一数值与第二数值之间选取至少一比例数值，依据该至少一像素点及该至少一比例数值由该原始影像对应撷取该至少一样本影像，其中该至少一像素点为该至少一样本影像的中心点，该至少一比例数值为该至少一样本影像的长相对于该原始影像的长，且为该至少一样本影像的宽相对于该原始影像的宽。

5.一种数据扩增方法，其特征在于，包含：

6.根据权利要求5所述的数据扩增方法，其中该第二参数组合包含搜索空间中的单一影像的转化次数参数以及每一影像转换中的全局参数，其中该搜索空间中的单一影像的转化次数参数为固定值，且该每一影像转换中的全局参数为非固定值。

7.根据权利要求5所述的数据扩增方法，其中还包含：

8.根据权利要求5所述的数据扩增方法，其中该第一数据扩增模型以及该第二数据扩增模型中的每一者包含多个影像转换策略，其中该至少一样本影像还用以经由所述多个影像转换策略以产生该至少二扩增影像组。

9.根据权利要求5所述的数据扩增方法，其中还包含：

10.一种非挥发性计算机可读存储介质，其特征在于，用以存储计算机程序，其中在执行该计算机程序时，将致使一个或多个处理元件执行多个操作包含：

技术总结
一种数据扩增装置，包含处理器。处理器用以由原始影像撷取至少一样本影像，并输入至少一样本影像到至少二数据扩增模型中，以经由至少二数据扩增模型产生至少二扩增影像组。至少二数据扩增模型包含第一数据扩增模型以及第二数据扩增模型。第一数据扩增模型的第一参数组合为固定值。第二数据扩增模型的第二参数组合为非固定值。本实施具有更佳的数据效率。

技术研发人员：栗永徽,陈研文,黄启恩
受保护的技术使用者：鸿海精密工业股份有限公司
技术研发日：
技术公布日：2024/5/10

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：栗永徽,陈研文,黄启恩
技术所有人：鸿海精密工业股份有限公司
我是此专利的发明人

上一篇：一种自动修管口机的制作方法
上一篇：一种具有防窥屏结构的POS机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。