一种数据分类方法、装置、设备及存储介质与流程

文档序号:30390697发布日期:2022-06-11 15:25阅读:146来源:国知局
一种数据分类方法、装置、设备及存储介质与流程

1.本发明涉及人工智能技术领域,尤其涉及一种数据分类方法、装置、设备及存储介质。


背景技术:

2.随着互联网技术和移动智能终端的飞速发展,依赖于大规模标记数据训练的深度学习方法在各个领域中都取得了巨大的成功。然而,在实际的生活应用中,许多问题只能提供极其有限的标记数据,其无法满足深度学习在大规模标记数据上训练的需求。
3.小样本学习方法被提出来去解决上述问题,作为小样本学习方法中的一种典型方法,基于转导理论的小样本方法充分利用小样本学习任务中的少量有标记数据和大量无标记数据之间的图结构信息来预测无标记数据的类别信息,该方法高度依赖于在特征空间上构建的图结构,即采用传统的距离度量方法,构建训练样本在特征空间上静态的图结构。
4.在实现本发明的过程中,发现现有技术中至少存在以下技术问题:
5.现有的图结构的构建方法简单且固定,导致小样本模型的识别性能较差。


技术实现要素:

6.本发明提供了一种数据分类方法、装置、设备及存储介质,以解决现有的图结构的构建方法简单且固定的问题,提高分类模型在小样本数据任务中的识别性能。
7.根据本发明的一方面,提供了一种数据分类方法,该方法包括:
8.将获取到的待处理数据集输入到第一目标分类模型中;其中,所述待处理数据集包括待处理支撑集和待处理查询集,所述待处理支撑集包含多个有标签数据,所述待处理查询集包含多个无标签数据,所述第一目标分类模型包括训练完成的第一目标特征嵌入模型和第一目标图结构模型;
9.通过所述第一目标特征嵌入模型,提取所述待处理支撑集和待处理查询集分别对应的待处理支撑特征和待处理查询特征,并将所述待处理支撑特征和所述待处理查询特征输出给所述第一目标图结构模型;
10.通过所述第一目标图结构模型,基于预设目标函数和所述待处理支撑特征,对基于所述待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于所述更新结果,确定所述待处理查询集中各待处理查询数据分别对应的分类标签。
11.根据本发明的另一方面,提供了一种数据分类装置,该装置包括:
12.待处理数据集输入模块,用于将获取到的待处理数据集输入到第一目标分类模型中;其中,所述待处理数据集包括待处理支撑集和待处理查询集,所述待处理支撑集包含多个有标签数据,所述待处理查询集包含多个无标签数据,所述第一目标分类模型包括训练完成的第一目标特征嵌入模型和第一目标图结构模型;
13.特征提取模块,用于通过所述第一目标特征嵌入模型,提取所述待处理支撑集和待处理查询集分别对应的待处理支撑特征和待处理查询特征,并将所述待处理支撑特征和
所述待处理查询特征输出给所述第一目标图结构模型;
14.分类标签确定模块,用于通过所述第一目标图结构模型,基于预设目标函数和所述待处理支撑特征,对基于所述待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于所述更新结果,确定所述待处理查询集中各待处理查询数据分别对应的分类标签。
15.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
16.至少一个处理器;以及
17.与所述至少一个处理器通信连接的存储器;
18.其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据分类方法。
19.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据分类方法。
20.上述发明中的实施例具有如下优点或有益效果:
21.本发明实施例的技术方案,通过将待处理数据集输入到第一目标分类模型中,通过第一目标分类模型中的第一特征嵌入模型,对待处理数据集中的待处理支撑集和待处理查询集分别进行提取,得到待处理支撑特征和待处理查询特征,并将待处理支撑特征和待处理查询特征输出给第一目标分类模型中的第一目标图结构模型,通过第一目标图结构模型,基于预设目标函数,对基于待处理支撑特征和待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于更新结果,确定所述待处理查询集中各待处理查询数据分别对应的分类标签,解决了现有的图结构的构建方法简单且固定的问题,提高了分类模型的识别性能。
22.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
23.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1是根据本发明实施例提供的一种数据分类方法的流程图;
25.图2是根据本发明实施例提供的一种待处理数据集的示意图;
26.图3是根据本发明实施例提供的另一种数据分类方法的流程图;
27.图4是根据本发明实施例提供的一种数据分类方法的具体实例的路程示意图;
28.图5是根据本发明实施例提供的一种第一目标分类模型的确定方法的流程图;
29.图6是根据本发明实施例提供的一种数据分类装置的结构示意图;
30.图7是根据本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
31.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
32.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
33.图1是根据本发明实施例提供的一种数据分类方法的流程图,本实施例可适用于对小样本任务数据进行分类的情况,该方法可以由数据分类装置来执行,该数据分类装置可以采用硬件和/或软件的形式实现,该数据分类装置可配置于台式机、笔记本电脑、平板电脑等智能终端中。如图1所示,该方法包括:
34.s110、将获取到的待处理数据集输入到第一目标分类模型中。
35.其中,具体的,待处理数据集可以是小样本学习任务中的数据集,一个小样本学习任务可以用于描述根据少量的有标签数据,学习区分大量的无标签数据对应的分类标签的任务。在本实施例中,待处理数据集包括待处理支撑集和待处理查询集,待处理支撑集包含多个有标签数据,待处理查询集包含多个无标签数据。具体的,在本实施例中,待处理支撑集包含的数据量可以远小于待处理查询集包含的数据量。
36.在一个实施例中,可选的,有标签数据包含支撑图片数据和与支撑图片数据对应的分类标签数据,无标签数据包含查询图片数据。图2是根据本发明实施例提供的一种待处理数据集的示意图。具体的,图2示出了待处理数据集中的待处理支撑集和待处理查询集,待处理支撑集包含少量的有标签数据,具体的,有标签数据包括支撑图片数据和与该支撑图片数据对应的分类标签数据(如图2中的a、b或c),待处理查询集包含大量的无标签数据,具体的,无标签数据包括查询图片数据。需要说明的是,图2中各个图片数据仅是为了对各图片进行区分进行的示例性说明,并不是对图片数据的内容进行限定,在实际应用中,图片数据具体可以是动物图片、建筑图片、风景图片和人物图片等等。
37.其中,具体的,第一目标分类模型为训练完成的网络模型。在本实施例中,第一目标分类模型包括训练完成的第一目标特征嵌入模型和第一目标图结构模型。其中,具体的,第一目标特征嵌入模型和第二目标图结构模型的网络结构可以是任何能够完成本技术提出的模型功能的网络架构,本技术并不对第一目标特征嵌入模型和第二目标图结构模型的网络结构进行限定。示例性的,第一目标特征嵌入模型的网络结构可以包括4层的卷积神经网络、18层的残差网络和121层的densenet网络。
38.s120、通过第一目标特征嵌入模型,提取待处理支撑集和待处理查询集分别对应的待处理支撑特征和待处理查询特征,并将待处理支撑特征和待处理查询特征输出给第一
目标图结构模型。
39.其中,具体的,将待处理数据集输入到第一目标分类模型中的第一目标特征嵌入模型中,第一目标特征嵌入模型对待处理支撑集中的有标签数据进行特征提取,得到待处理支撑特征,以及对待处理查询集中的无标签数据进行特征提取,得到待处理查询特征。
40.s130、通过第一目标图结构模型,基于预设目标函数和待处理支撑特征,对基于待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于更新结果,确定待处理查询集中各待处理查询数据分别对应的分类标签。
41.在本实施例中,预设目标函数用于表征图结构与标签概率分布矩阵之间的函数关系。在一个实施例中,可选的,预设目标函数满足公式:
[0042][0043]
其中,y表示标签概率分布矩阵,w表示图结构,c表示待处理支撑集对应的分类标签数据的种类,m表示待处理查询集中查询图片数据的数量,y
ic
表示待处理查询集中第i个查询图片数据与待处理支撑集中第c个分类标签数据之间的标签概率,xi表示待处理查询集中第i个查询图片数据的待处理查询特征,xj表示待处理查询集中第j个查询图片数据的待处理查询特征,mc表示待处理支撑集中第c个分类标签数据对应的支撑图片数据的待处理支撑特征,w(xi,xj)表示第i个查询图片数据与第j个查询图片数据之间的局部几何信息,d(xi,mc)表示第i个待处理查询特征与第c个待处理支撑特征之间的特征距离,yi表示待处理查询集中第i个查询图片数据对应的标签概率,yj表示待处理查询集中第j个查询图片数据对应的标签概率,表示α和β表示第一目标图结构模型中的支撑参数。
[0044]
其中,具体的,第一目标图结构基于待处理查询特征,确定初始图结构,并基于预设目标函数和待处理支撑特征,对初始图结构进行优化更新,得到更新结果。
[0045]
在本实施例中,初始图结构用于表征待处理查询集中各查询图片数据之间的初始局部几何信息。其中,具体的,初始目标图结构中第i个查询图片数据与第j个查询图片数据之间的初始局部几何信息w(xi,xj)0满足公式:
[0046][0047]
其中,||x
i-xj||2表示第i个查询图片数据与第j个查询图片数据在特征空间中的特征距离。
[0048]
其中,示例性的,第一预设要求可以是小于第一预设距离阈值。
[0049]
在一个实施例中,可选的,更新结果包括目标图结构与目标图结构对应的目标标签概率分布矩阵,相应的,基于预设目标函数和待处理支撑特征,对基于待处理查询特征确定的初始图结构进行优化更新,得到更新结果,包括:基于预设目标函数、待处理支撑特征以及基于待处理查询特征确定的初始图结构,确定初始标签概率分布矩阵。
[0050]
在本实施例中,初始标签概率分布矩阵用于表征待处理查询数据集中各查询图片
数据分别与待处理支撑集对应的分类标签数据之间的初始标签概率。其中,具体的,基于预设目标函数和初始图结构,得到初始标签概率分布矩阵中第i个查询图片数据与第c个分类标签数据之间的初始标签概率满足公式:
[0051][0052]
其中,1
t
表示单位矩阵的转置,w(xi,xj)0表示初始图结构中第i个查询图片数据与第j个查询图片数据之间的初始局部几何信息。
[0053]
在本实施例中,目标图结构用于表征待处理查询集中各查询图片数据之间在特征空间和标签空间中的目标局部几何信息。在一个实施例中,可选的,基于初始标签概率分布矩阵和预设目标函数,确定目标图结构,包括:基于初始标签概率分布矩阵和预设目标函数,确定待处理查询集中各查询图片数据之间在标签空间中的标签概率距离;基于待处理查询特征和预设目标函数,确定待处理查询集中各查询图片数据之间在特征空间中的特征距离;基于标签概率距离和特征距离,确定目标图结构。
[0054]
其中,具体的,基于预设目标函数和初始标签概率分布矩阵,确定第i个查询图片数据与第j个查询图片数据在标签空间中的标签概率距离y
ij
满足公式:
[0055][0056]
其中,表示初始标签概率分布矩阵中第i个查询图片数据对应的初始标签概率,表示初始标签概率分布矩阵中第j个查询图片数据对应的初始标签概率。
[0057]
其中,具体的,基于待处理查询特征和预设目标函数,确定第i个查询图片数据与第j个查询图片数据在特征空间中的特征距离x
ij
满足公式:
[0058]
x
ij
=β||x
i-xj||2[0059]
在一个实施例中,可选的,基于标签概率距离和特征距离,确定目标图结构,包括:基于标签概率距离和特征距离,确定目标几何距离;针对待处理查询集中的每个查询图片数据,基于预设分类算法,对查询图片数据与待处理查询集中其他查询图片数据之间的目标几何距离进行分类筛选;基于筛选到的目标几何距离,确定查询图片数据对应的目标子图结构。
[0060]
其中,具体的,第i个查询图片数据与第j个查询图片数据之间的目标几何距离满足公式:
[0061][0062]
其中,示例性的,预设分类算法包括k近邻算法。具体的,假设待处理查询集包含n个查询图片数据,则分别确定第i个查询图片数据与其他查询图片数据之间的目标几何距离,对多个目标几何距离进行排序,将距离最小的k个目标几何距离作为筛选到的目标几何距离。其中,目标几何距离越小(越接近于0),说明查询图片数据之间的局部几何信息越相近,则局部几何信息为1,反之越远,则局部几何信息为0。
[0063]
其中,具体的,将筛选到的目标几何距离分别对应的局部几何信息设置为1,将未
筛选到的目标几何距离分别对应的局部几何信息设置为0。在本实施例中,目标子图结构可以用于描述第i个查询图片数据与k个其他查询图片数据之间的目标局部几何信息。
[0064]
其中,具体的,目标图结构中第i个查询图片数据与第j个查询图片数据之间的目标局部几何信息w(xi,xj)1满足公式:
[0065][0066]
在上述实施例的基础上,可选的,将小于预设距离阈值的目标几何距离对应的局部几何信息设置为1,大于或等于预设距离阈值的额目标几何距离对应的局部几何信息设置为0。在本实施例中,目标图结构中第i个查询图片数据与第j个查询图片数据之间的目标局部几何信息w(xi,xj)1满足公式:
[0067][0068]
在本实施例中,目标标签概率分布矩阵用于表征待处理查询集中各查询图片数据分别与待处理支撑集对应的分类标签数据之间的目标标签概率。其中,具体的,基于预设目标函数和目标图结构,得到目标标签概率分布矩阵中第i个查询图片数据与第c个分类标签数据之间的目标标签概率满足公式:
[0069][0070]
其中,w(xi,xj)1表示目标图结构中第i个查询图片数据与第j个查询图片数据之间的目标局部几何信息。
[0071]
现有技术中的目标图结构仅可以表征待处理查询集中各查询图片数据之间在特征空间中的局部几何信息,该目标图结构反映出的查询图片数据之间的局部几何信息较简单,容易受到噪声的影响。
[0072]
本实施例的技术方案,通过第一目标图结构模型,基于预设目标函数,对基于待处理支撑特征和待处理查询特征确定的初始图结构进行优化更新,得到目标图结构,该目标图结构可以表征待处理查询集中各查询图片数据之间在标签空间和特征空间中的局部几何信息,从多个空间维度综合计算目标图结构,可以在一定程度上减少查询图片数据中存在的噪声影响,解决了现有的图结构的构建方法简单且固定的问题,提高了分类模型的识别性能。
[0073]
在上述实施例的基础上,可选的,还可以基于预设目标函数对上述实施例得到的目标图结构进行进一步优化更新。该方法还包括:基于目标图结构和目标标签概率分布矩阵,判断预设目标函数对应的函数损失值是否收敛;如果是,则基于目标标签概率分布矩阵,确定待处理查询集中各查询图片数据分别对应的分类标签;如果否,则基于目标标签概率分布矩阵和预设目标函数,确定优化后的目标标签概率分布矩阵,并基于优化后的目标概率分布矩阵,重复执行判断预设目标函数对应的函数损失值是否收敛的操作。
[0074]
图3是根据本发明实施例提供的另一种数据分类方法的流程图。本实施例的具体
实施步骤包括:
[0075]
s210、将获取到的待处理数据集输入到第一目标分类模型中。
[0076]
s220、通过第一目标特征嵌入模型,提取待处理支撑集和待处理查询集分别对应的待处理支撑特征和待处理查询特征,并将待处理支撑特征和待处理查询特征输出给第一目标图结构模型。
[0077]
s230、通过第一目标图结构模型,基于预设目标函数、待处理支撑特征以及基于待处理查询特征确定的初始图结构,确定初始标签概率分布矩阵。
[0078]
s240、基于初始标签概率分布矩阵和预设目标函数,确定目标图结构,并基于目标图结构和预设目标函数,确定目标标签概率分布矩阵。
[0079]
s250、判断预设目标函数对应的函数损失值是否收敛,如果是,则执行s280,如果否,则执行s260。
[0080]
在一个实施例中,可选的,预设损失值要求可以是函数损失值最小或者函数损失值收敛。其中,具体的,将目标图结构和目标标签概率分布矩阵带入到预设目标函数中,得到损失函数值,如lossk。示例性的,如果lossk与loss
k-1
的损失差值小于预设差值阈值,则认为损失函数值收敛。
[0081]
s260、基于目标标签概率分布矩阵和预设目标函数,确定优化后的目标图结构。
[0082]
其中,具体的,第k(k≥1)次迭代对应的优化后的目标图结构中第i个查询图片数据与第j个查询图片数据之间的局部几何信息w(xi,xj)
k+1
满足公式:
[0083][0084]
其中,目标几何距离满足公式:
[0085][0086]
其中,表示第k-1次迭代得到的目标概率分布矩阵中第i个查询图片数据对应的目标标签概率,表示第k-1次迭代中的目标概率分布矩阵中第j个查询图片数据对应的目标标签概率。
[0087]
s270、基于优化后的目标图结构和预设目标函数,确定优化后的目标标签概率分布矩阵,并重新执行s250。
[0088]
其中,具体的,第k次迭代对应的优化后的目标标签概率分布矩阵中第i个查询图片数据与第c个分类标签数据之间的初始标签概率满足公式:
[0089][0090]
w(xi,xj)
k+1
表示第k次迭代得到的目标图结构中第i个查询图片数据与第j个查询图片数据之间的目标局部几何信息。
[0091]
s280、基于目标标签概率分布矩阵,确定待处理查询集中各查询图片数据分别对
应的分类标签。
[0092]
图4是根据本发明实施例提供的一种数据分类方法的具体实例的路程示意图。具体的,将待处理数据集输入到第一目标分类模型中的第一目标特征嵌入模型中,第一目标特征嵌入模型进行特征提取,并将提取到的特征输入到第一目标图结构模型中。第一目标图结构模型基于预设目标函数,即图4中示出的对初始图结构进行优化更新,并对更新结果中的目标图结构和目标标签概率分布矩阵进行交替迭代更新。图4中的第一目标图结构模型中的第二层中的左边矩阵表示目标标签概率分布矩阵,虚线箭头右边矩阵表示优化后的目标标签概率分布矩阵,虚线箭头上下的两个公式分别表示标签概率的求解公式和局部几何信息的求解公式。图4中的第一目标图结构模型的第三层左边的两个虚线框分别表示待处理查询集中各查询图片数据在特征空间中的标签图结构和在标签空间中的特征图结构,基于标签图结构和特征图结构,确定目标图结构(即第三层虚线箭头右边虚线框)。其中,标签图结构和特征图结构可以分别基于标签概率距离和特征距离确定。
[0093]
当预设目标函数的函数损失值收敛时,得到优化后的目标图结构和与优化后的目标图结构对应的优化后的目标标签概率分布矩阵,基于优化后的目标标签概率分布矩阵,确定待处理查询集中各查询图片数据分别对应的分类标签。
[0094]
本实施例的技术方案中预设目标函数包含两个变量,分别为图结构和标签概率分布矩阵,本实施例将预设目标函数拆分成两个子问题,分别为固定图结构优化概率分布矩阵以及固定概率分布矩阵优化图结构,实现图结构和概率分布矩阵的交替优化,直到预设目标函数对应的函数损失值收敛,使得最终得到的目标图结构和目标标签概率分布矩阵均为最优解,解决了现有技术中固定的图结构的求解方式只能确定图结构的唯一解的问题,进一步提高了分类模型的识别性能。
[0095]
在上述实施例的基础上,本实施例还对上述实施例中第一目标分类模型中的第一目标图结构模型的确定方法进行了优化。可选的,该方法还包括:将获取到的验证数据集分别输入到至少两种第一初始分类模型中;其中,验证数据集包括验证支撑集和验证查询集,第一初始分类模型包括第一初始图结构模型和第一目标特征嵌入模型,不同第一初始分类模型中第一初始图结构模型对应的支撑参数不同;针对每个第一初始分类模型,基于验证查询集中各无标签数据分别对应的真实分类标签和第一初始分类模型输出的各无标签数据分别对应的预测分类标签,确定第一初始分类模型对应的识别率;将识别率最高的第一初始分类模型作为第一目标分类模型。
[0096]
其中,具体的,验证支撑集包含少量的有标签数据,验证查询集包含大量的无标签数据。第一目标特征嵌入模型为训练完成的模型,不同第一初始分类模型中的第一目标特征嵌入模型相同。
[0097]
本实施例的技术方案中的预设目标函数包含两个变量,分别为图结构和标签概率分布矩阵,在第一目标分类模型的确定步骤中,首先保证第一初始分类模型中的特征嵌入模型为训练完成的第一目标特征嵌入模型,从而使得在每次交替优化过程中,预设目标函数中的验证查询特征和验证支撑特征都是相同的,减少预设目标函数中的变量个数,提高最优的图结构和最优的标签概率分布矩阵的确定效率,进而提高了第一目标分类模型的确
定效率。
[0098]
在本实施例中,不同第一初始分类模型中第一初始图结构模型对应的支撑参数不同。其中,示例性的,第一初始分类模型a中的第一初始图结构模型a中α=1,β=3;第一初始分类模型b中的第一初始图结构模型中α=3,β=4。此处对第一初始分类模型的数量以及不同第一初始图结构模型对应的支撑参数的参数设置不作限定。
[0099]
本实施例的技术方案不是对图结构模型的元学习训练策略进行改进,而是对图结构模型的模型算法进行了改进。本技术方案通过基于验证数据集,确定该不同支撑参数的第一初始分类模型的识别率,并将识别率最高的第一初始分类模型作为第一目标分类模型,使得该图结构模型可以与任意的特征嵌入模型结合使用,在提高查询图片数据的预测效率的同时,扩展了本方案的适用场景,具有很强的推广意义。
[0100]
在一个实施例中,可选的,该方法还包括:将获取到的测试数据集输入到第一目标分类模型中;其中,测试数据集包括测试支撑集和测试查询集;基于测试查询集中各无标签数据分别对应的真实分类标签和第一目标分类模型输出的各无标签数据分别对应的预测分类标签,确定第一目标分类模型的目标分类精度,并将目标分类精度进行输出。
[0101]
其中,具体的,测试支撑集包含少量的有标签数据,测试查询集包含大量的无标签数据。
[0102]
这样设置的好处在于,方便用户准确掌握选择得到的第一目标分类模型的识别性能,为后续的模型修正提供数据参考。
[0103]
在上述实施例的基础上,本实施例还对上述实施例中第一目标分类模型中的第一目标特征嵌入模型的确定方法进行了优化。可选的,该方法还包括:将获取到的基类数据集输入到第二初始分类模型中;其中,基类数据集包含多个有标签数据,第二初始分类模型包含未训练的第二初始特征嵌入模型和第二初始分类器;基于基类数据集中各有标签数据分别对应的真实分类标签和第二初始分类模型输出的各有标签数据分别对应的预测分类标签,对第二初始分类模型中的模型参数进行调整,得到训练完成的第二目标分类模型;将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型。
[0104]
其中,具体的,通过第一初始分类模型中的第二初始特征嵌入模型,对输入的基类数据集中的各有标签数据分别进行特征提取,得到特征数据,并将各特征数据输入到第二初始分类器中,通过第二初始分类器,基于各特征数据,确定有标签数据分别对应的预测分类标签。
[0105]
其中,示例性的,基于有标签数据对应的预测分类标签和真实分类标签,确定交叉熵损失函数值,并基于交叉熵损失函数值,对第二初始分类模型中的第二初始特征嵌入模型中的模型参数进行训练。其中,交叉熵损失函数c满足公式:
[0106]
c=-∑
qyq
logyq[0107]
其中,yq表示基类数据集中第q个有标签数据对应的真实分类标签,yq表示基类数据集中第q个有标签数据对应的预测分类标签,q表示基类数据集中有标签数据的数量。
[0108]
在一个实施例中,可选的,在将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型之前,该方法还包括:基于获取到的验证数据集,确定第二目标分类模型对应的训练分类精度,并判断训练分类精度是否满足预设
精度范围;如果是,则将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型;如果否,则对第二目标分类模型中的超参数进行调整,并将调整后的第二目标分类模型作为第二初始分类模型,重新执行将获取到的基类数据集输入到第二初始分类模型中的操作。
[0109]
其中,示例性的,超参数包括但不限于网络模型的学习速率、卷积核数量、卷积核尺寸、批样本数量和权重衰减次数等等。此处对超参数不作限定。
[0110]
图5是根据本发明实施例提供的一种第一目标分类模型的确定方法的流程图。具体的,向数据存储设备中输入数据,在本实施例中,输入数据包括基类数据集、验证数据集和测试数据集。基于基类数据集和交叉熵函数损失值,对第二初始分类模型进行训练,得到第二目标分类模型。基于验证数据集,对第二目标分类模型进行分类精度测试,判断第二目标分类模型对应的训练分类精度是否满足预设精度范围,如果否,则对第二目标分类模型中的超参数进行调整,并将调整后的第二目标分类模型作为第二初始分类模型,重复执行基于基类数据对第二初始分类模型进行训练,得到第二目标分类模型的操作。如果训练分类精度满足预设精度范围,则将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型,基于验证数据集,确定不同的第一初始分类模型分别对应的识别率,将识别率最高的第一初始分类模型作为第一目标分类模型,此时第一目标分类模型中第一目标图结构模型对应的平衡参数为最优的平衡参数。基于测试数据集,对第一目标分类模型进行分类精度的测试,输出目标分类精度。
[0111]
需要说明的是,本发明上述实施例中提到的距离计算方法仅进行示例性说明,并不对其进行限定,示例性的,距离计算方法包括但不限于欧氏距离、余弦距离、高斯核函数、曼哈顿距离和切比雪夫距离等等。
[0112]
图6是根据本发明实施例提供的一种数据分类装置的结构示意图。如图6所示,该装置包括:待处理数据集输入模块310、特征提取模块320和分类标签确定模块330。
[0113]
其中,待处理数据集输入模块310,用于将获取到的待处理数据集输入到第一目标分类模型中;其中,待处理数据集包括待处理支撑集和待处理查询集,待处理支撑集包含多个有标签数据,待处理查询集包含多个无标签数据,第一目标分类模型包括训练完成的第一目标特征嵌入模型和第一目标图结构模型;
[0114]
特征提取模块320,用于通过第一目标特征嵌入模型,提取待处理支撑集和待处理查询集分别对应的待处理支撑特征和待处理查询特征,并将待处理支撑特征和待处理查询特征输出给第一目标图结构模型;
[0115]
分类标签确定模块330,用于通过第一目标图结构模型,基于预设目标函数和待处理支撑特征,对基于待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于更新结果,确定待处理查询集中各待处理查询数据分别对应的分类标签。
[0116]
本实施例的技术方案,通过将待处理数据集输入到第一目标分类模型中,通过第一目标分类模型中的第一特征嵌入模型,对待处理数据集中的待处理支撑集和待处理查询集分别进行提取,得到待处理支撑特征和待处理查询特征,并将待处理支撑特征和待处理查询特征输出给第一目标分类模型中的第一目标图结构模型,通过第一目标图结构模型,基于预设目标函数,对基于待处理支撑特征和待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于更新结果,确定待处理查询集中各待处理查询数据分别对应的
分类标签,解决了现有的图结构的构建方法简单且固定的问题,提高了分类模型的识别性能。
[0117]
在上述实施例的基础上,可选的,有标签数据包含支撑图片数据和与支撑图片数据对应的分类标签数据,无标签数据包含查询图片数据,相应的,初始图结构用于表征待处理查询集中各查询图片数据之间的初始局部几何信息。
[0118]
在上述实施例的基础上,可选的,更新结果包括目标图结构与目标图结构对应的目标标签概率分布矩阵,相应的,分类标签确定模块330包括:
[0119]
初始标签概率分布矩阵确定单元,用于基于预设目标函数、待处理支撑特征以及基于待处理查询特征确定的初始图结构,确定初始标签概率分布矩阵;
[0120]
目标图结构确定单元,用于基于初始标签概率分布矩阵和预设目标函数,确定目标图结构,并基于目标图结构和预设目标函数,确定目标标签概率分布矩阵;
[0121]
其中,目标图结构用于表征待处理查询集中各查询图片数据之间在特征空间和标签空间中的目标局部几何信息,目标标签概率分布矩阵用于表征待处理查询集中各查询图片数据分别与待处理支撑集对应的分类标签数据之间的目标标签概率,预设目标函数用于表征图结构与标签概率分布矩阵之间的函数关系。
[0122]
在上述实施例的基础上,可选的,目标图结构确定单元,包括:
[0123]
标签概率距离确定子单元,用于基于初始标签概率分布矩阵和预设目标函数,确定待处理查询集中各查询图片数据之间在标签空间中的标签概率距离;
[0124]
特征距离确定子单元,用于基于待处理查询特征和预设目标函数,确定待处理查询集中各查询图片数据之间在特征空间中的特征距离;
[0125]
目标图结构确定子单元,用于基于标签概率距离和特征距离,确定目标图结构。
[0126]
在上述实施例的基础上,可选的,目标图结构确定子单元,具体用于:
[0127]
基于标签概率距离和特征距离,确定目标几何距离;
[0128]
针对待处理查询集中的每个查询图片数据,基于预设分类算法,对查询图片数据与待处理查询集中其他查询图片数据之间的目标几何距离进行分类筛选;
[0129]
基于筛选到的目标几何距离,确定查询图片数据对应的目标子图结构。
[0130]
在上述实施例的基础上,可选的,该装置还包括:
[0131]
损失函数值判断模块,用于基于目标图结构和目标标签概率分布矩阵,判断预设目标函数对应的函数损失值是否收敛;
[0132]
分类标签确定模块,用于如果是,则基于目标标签概率分布矩阵,确定待处理查询集中各查询图片数据分别对应的分类标签;
[0133]
目标标签概率分布矩阵优化模块,用于如果否,则基于目标标签概率分布矩阵和预设目标函数,确定优化后的目标标签概率分布矩阵,并基于优化后的目标概率分布矩阵,重复调用损失函数值判断模块。
[0134]
在上述实施例的基础上,可选的,预设目标函数满足公式:
[0135][0136]
其中,y表示标签概率分布矩阵,w表示图结构,c表示待处理支撑集对应的分类标签数据的种类,m表示待处理查询集中查询图片数据的数量,y
ic
表示待处理查询集中第i个查询图片数据与待处理支撑集中第c个分类标签数据之间的标签概率,xi表示待处理查询集中第i个查询图片数据的待处理查询特征,xj表示待处理查询集中第j个查询图片数据的待处理查询特征,mc表示待处理支撑集中第c个分类标签数据对应的支撑图片数据的待处理支撑特征,w(xi,xj)表示第i个查询图片数据与第j个查询图片数据之间的局部几何信息,d(xi,mc)表示第i个待处理查询特征与第c个待处理支撑特征之间的特征距离,yi表示待处理查询集中第i个查询图片数据对应的标签概率,yj表示待处理查询集中第j个查询图片数据对应的标签概率,表示α和β表示第一目标图结构模型中的支撑参数。
[0137]
在上述实施例的基础上,可选的,该装置还包括:
[0138]
第一目标分类模块确定模块,用于将获取到的验证数据集分别输入到至少两种第一初始分类模型中;其中,验证数据集包括验证支撑集和验证查询集,第一初始分类模型包括第一初始图结构模型和第一目标特征嵌入模型,不同第一初始分类模型中第一初始图结构模型对应的支撑参数不同;
[0139]
针对每个第一初始分类模型,基于验证查询集中各无标签数据分别对应的真实分类标签和第一初始分类模型输出的各无标签数据分别对应的预测分类标签,确定第一初始分类模型对应的识别率;
[0140]
将识别率最高的第一初始分类模型作为第一目标分类模型。
[0141]
在上述实施例的基础上,可选的,该装置还包括:
[0142]
目标分类精度输出模块,用于将获取到的测试数据集输入到第一目标分类模型中;其中,测试数据集包括测试支撑集和测试查询集;
[0143]
基于测试查询集中各无标签数据分别对应的真实分类标签和第一目标分类模型输出的各无标签数据分别对应的预测分类标签,确定第一目标分类模型的目标分类精度,并将目标分类精度进行输出。
[0144]
在上述实施例的基础上,可选的,该装置包括:
[0145]
第一目标特征嵌入模型确定模块,用于将获取到的基类数据集输入到第二初始分类模型中;其中,基类数据集多个有标签数据,第二初始分类模型包含未训练的第二初始特征嵌入模型和第二初始分类器;
[0146]
基于基类数据集中各有标签数据分别对应的真实分类标签和第二初始分类模型输出的各有标签数据分别对应的预测分类标签,对第二初始特征嵌入中的模型参数进行调整,得到训练完成的第二目标分类模型;
[0147]
将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型。
[0148]
在上述实施例的基础上,可选的,该装置还包括:
[0149]
第二目标分类模型确定模块,用于在将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型之前,基于获取到的验证数据集,确定第二目标分类模型对应的训练分类精度,并判断训练分类精度是否满足预设精度范围;
[0150]
如果是,则将第二目标分类模型中的第二目标特征嵌入模型作为第一初始分类模型中的第一目标特征嵌入模型;
[0151]
如果否,则对第二目标分类模型中的超参数进行调整,并将调整后的第二目标分类模型作为第二初始分类模型,重新执行将获取到的基类数据集输入到第二初始分类模型中的操作。
[0152]
本发明实施例所提供的数据分类装置可执行本发明任意实施例所提供的数据分类方法,具备执行方法相应的功能模块和有益效果。
[0153]
图7是根据本发明实施例提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0154]
如图7所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0155]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0156]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如数据分类方法。
[0157]
在一些实施例中,数据分类方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的数据分类方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据分类方法。
[0158]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电
路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0159]
用于实施本发明的数据分类方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0160]
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行一种数据分类方法,该方法包括:
[0161]
将获取到的待处理数据集输入到第一目标分类模型中;其中,待处理数据集包括待处理支撑集和待处理查询集,待处理支撑集包含多个有标签数据,待处理查询集包含多个无标签数据,第一目标分类模型包括训练完成的第一目标特征嵌入模型和第一目标图结构模型;
[0162]
通过第一目标特征嵌入模型,提取待处理支撑集和待处理查询集分别对应的待处理支撑特征和待处理查询特征,并将待处理支撑特征和待处理查询特征输出给第一目标图结构模型;
[0163]
通过第一目标图结构模型,基于预设目标函数和待处理支撑特征,对基于待处理查询特征确定的初始图结构进行优化更新,得到更新结果,并基于更新结果,确定待处理查询集中各待处理查询数据分别对应的分类标签。
[0164]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0165]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0166]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据
服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0167]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0168]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0169]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1