一种基于数据质量与强化学习的元任务小样本分类方法与流程

文档序号：37295186发布日期：2024-03-13 20:43阅读：10来源：国知局

本申请涉及元任务小样本分类，特别是涉及一种基于数据质量与强化学习的元任务小样本分类方法。

背景技术：

1、小样本分类是指只有少量标注数据的情况下，训练出能够对新类别的数据进行准确分类的模型。在金融领域，小样本分类是一个重要的问题，因为金融数据往往具有高维、稀疏、非线性、动态变化等特点，导致难以获取足够多的标注数据来训练有效的分类模型。例如，在信用卡欺诈检测中，欺诈交易的比例非常低，而且欺诈手段不断更新，因此需要一种能够在少量标注数据下，快速识别出新的欺诈模式的方法。

2、元学习在这方面具有很大的潜力，例如，它可以利用已有的正常交易和欺诈交易数据，学习一个通用的分类器，然后在新出现的交易数据上进行快速适应和预测。但是，元学习也面临着数据质量的问题，如果元任务中抽取的数据存在类别不平衡或者噪声，那么元学习模型将难以从元任务中获取有效的信息，从而影响其在目标任务上的泛化能力。因此，需要一种方法来评估元任务抽取到的数据质量和优化元任务的选择策略，使其能够更好地适应目标任务。

技术实现思路

1、基于此，有必要针对传统的小样本分类方法存在的过拟合、泛化能力差、对噪声数据敏感等问题，提供一种能够根据目标任务的特征，动态地选择和调整元任务的数据分布和数量，从而提高元学习模型在目标任务上的分类性能的小样本分类方法，具体为一种基于数据质量与强化学习的元任务小样本分类方法。

2、本发明提供了一种基于数据质量与强化学习的元任务小样本分类方法，该方法用于对金融科技产品数据进行分类，包括：

3、s1：获取金融科技产品数据的特征向量和类别标签，并构建原始数据集；所述特征向量包括金融科技产品的名称、描述、开发者、技术基础、种类；所述类别标签包括理财、支付、借贷、股票、记账、保险、资讯、基金；

4、s2：将所述原始数据集按比例划分为训练集和测试集，分别对标准化处理后的训练集和测试集进行采样，得到采样训练集和采样测试集；将所述采样训练集和所述采样测试集组合成一元学习任务；

5、s3：采用数据质量评估函数计算所述元学习任务中每个任务的权重，并对计算出的每个权重进行归一化，得到每个任务对应的归一化权重；

6、所述任务为二分类任务，所述任务包括对金融科技产品数据进行理财类型或支付类型分类、对金融科技产品数据进行借贷类型或股票类型分类、对金融科技产品数据进行记账类型或保险类型分类、对金融科技产品数据进行资讯类型或基金类型分类；

7、每个所述任务中的数据为二分类任务中各类别标签对应的金融科技产品数据；

8、s4：基于每个任务对应的归一化权重，确定每个任务的所属类别；任务的所属类别包括0和1；

9、对所属类别为0的任务，进行元策略优化，得到第一元策略以及第一参数；

10、对所属类别为1的任务，进行元强化学习，得到第二元策略以及第二参数；

11、s5：基于所述第一元策略和所述第二元策略，得到混合策略；基于所述第一参数和所述第二参数，得到混合参数；

12、s6：基于所述混合策略和所述混合参数构建目标函数，并最大化所述目标函数，直至收敛，得到分类模型；

13、s7：将待分类的金融科技产品数据输入至所述分类模型，得到分类结果。

14、有益效果：该方法利用数据质量指标来评估每个元任务的适应算法，然后使用强化学习算法来动态地分配不同的元任务以不同的策略，从而提高了小样本分类的性能。

技术特征：

1.一种基于数据质量与强化学习的元任务小样本分类方法，用于对金融科技产品数据进行分类，其特征在于，包括：

2.根据权利要求1所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，将所述原始数据集按设定比例p划分为训练集和测试集，所述训练集记为dtrain，所述测试集记为dtest，且所述训练集与所述测试集之间满足关系式：

3.根据权利要求2所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，对所述训练集和所述测试集进行标准化处理包括：对训练集中金融科技产品数据的特征向量以及测试集中金融科技产品数据的特征向量均进行标准化处理，标准化公式为：

4.根据权利要求3所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，所述采样训练集表示为：

5.根据权利要求1所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，对计算出的每个权重进行归一化，得到每个任务对应的归一化权重，计算公式为：

6.根据权利要求5所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，基于每个任务对应的归一化权重，确定每个任务的所属类别，表达式为：

7.根据权利要求1所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，所述对所属类别为0的任务，进行元策略优化，得到第一元策略以及第一参数包括：

8.根据权利要求1所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，所述对所属类别为1的任务，进行元强化学习，得到第二元策略以及第二参数包括：

9.根据权利要求8所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，基于所述第一元策略和所述第二元策略，得到混合策略，计算公式为：

10.根据权利要求9所述的基于数据质量与强化学习的元任务小样本分类方法，其特征在于，所述基于所述混合策略和所述混合参数构建目标函数，并最大化所述目标函数，直至收敛，得到分类模型包括：

技术总结
本申请涉及一种基于数据质量与强化学习的元任务小样本分类方法，该方法包括：分别对标准化处理后的训练集和测试集进行采样，得到采样训练集和采样测试集；将采样训练集和采样测试集组合成一元学习任务；对计算出的每个权重进行归一化，得到每个任务对应的归一化权重；基于每个任务对应的归一化权重，确定每个任务的所属类别；对所属类别为0的任务，进行元策略优化，得到第一元策略以及第一参数；对所属类别为1的任务，进行元强化学习，得到第二元策略以及第二参数；基于第一元策略和第二元策略，得到混合策略；基于第一参数和第二参数，得到混合参数；基于混合策略和混合参数构建目标函数，并最大化目标函数，直至收敛，得到分类模型。

技术研发人员：陈晓红,霍杨杰,徐雪松,张震,王煜坤,许冠英
受保护的技术使用者：湘江实验室
技术研发日：
技术公布日：2024/3/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈晓红,霍杨杰,徐雪松,张震,王煜坤,许冠英
技术所有人：湘江实验室
我是此专利的发明人

上一篇：一种车载多联机热泵空调系统的制作方法
上一篇：一种混凝土制备养护装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。