分类模型训练方法、装置及分类方法及装置与流程

文档序号:14991437发布日期:2018-07-20 22:18阅读:140来源:国知局

本发明涉及深度学习技术领域,具体而言,涉及一种分类模型训练方法、装置以及分类方法及装置。



背景技术:

迁移学习可以利用已知领域中有标签的训练样本(可称为源域数据)训练分类模型来对目标领域的数据(可称为目标域数据)进行标定,而并不要求源域数据和目标域数据具有相同的数据分布。迁移学习实际上是通过找寻待标定数据和已知标签数据之间的联系,例如采用核函数的方式将源域和目标域数据映射到同一空间中,在该空间下源域数据和目标域数据拥有相同的分布,从而可以利用该空间表示的有标签的源域样本数据训练分类器来对目标领域进行标定。

已有的迁移学习方法中,通常使用源域数据和目标域数据训练同一神经网络,获得参数共享网络。该网络训练过程能够找出源域数据和目标域数据之间的共性,通常将源域数据和目标域数据映射在具有高可比性的高位空间,从而得到两个域的分布特征。这种训练方法虽然能够将源域数据和目标域数据之间的相同特征利用起来,却使源域和目标域之间的差异特征丢失严重,导致训练得到的分类模型在对目标域数据进行分类时存在一定的误差。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种分类模型训练方法、装置及分类方法及装置,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果。

第一方面,本发明实施例提供了一种分类模型训练方法,该方法包括:

获取携带标签的源域数据以及未携带标签的目标域数据;

将所述源域数据以及所述目标域数据输入第一神经网络,为所述源域数据提取第一源域特征向量,为所述目标域数据提取第一目标域特征向量;并

对所述源域数据和所述目标域数据进行共有特征捕捉,使所述第一目标域特征向量学习所述源域数据和所述目标域数据的共有特征;并

将所述第一源域特征向量输入第一分类器得到第一分类结果;

将所述源域数据以及所述目标域数据输入第二神经网络,为所述目标域数据提取第二目标域特征向量;并

对所述源域数据和所述目标域数据进行差异性特征捕捉,使所述第二目标域特征向量学习所述源域数据和所述目标域数据的差异特征;

分别对所述第一目标域特征向量以及所述第二目标域特征向量进行聚类;

根据聚类的结果,以及所述第一分类结果,对所述第一神经网络以及所述第一分类器进行本轮训练;

经过对所述第一神经网络和所述第一分类器进行多轮训练,得到分类模型。

第二方面,本发明实施例还提供一种分类方法,该方法包括:

获取待分类数据;

将所述待分类数据输入至通过本申请实施例提供的分类模型训练方法得到的分类模型中,得到所述待分类数据的分类结果;

其中,所述分类模型包括:所述第一神经网络和所述第一分类器。

第二方面,本发明实施例还提供一种分类模型训练装置,包括:

获取模块,用于获取携带标签的源域数据以及未携带标签的目标域数据;

第一处理模块,用于将源域数据以及目标域数据输入第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量;并对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;并将第一源域特征向量输入第一分类器得到第一分类结果;

第二处理模块,用于将源域数据以及目标域数据输入第二神经网络,为目标域数据提取第二目标域特征向量;并对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征;

聚类模块,用于分别对第一目标域特征向量以及第二目标域特征向量进行聚类;

训练模块,用于根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练;经过对第一神经网络和第一分类器进行多轮训练,得到分类模型。

第四方面,本发明实施例还提供一种分类装置,包括:待分类数据获取模块,用于获取待分类数据;

分类模块,用于将待分类数据输入至通过本申请实施例提供的分类模型训练方法得到的分类模型中,得到待分类数据的分类结果;其中,分类模型包括:第一神经网络和第一分类器。

第五方面,本发明实施例还提供一种计算机设备,该设备包括存储器、处理器及存储在该存储器上并可在该处理器上运行的计算机程序,其中,上述处理器执行上述计算机程序时实现本申请实施例提供的分类模型训练方法的步骤。

第六方面,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行本方实施例所提供的分类模型训练方法的步骤。

本发明实施例利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例所提供的一种分类模型训练方法的流程图;

图2示出了本发明实施例所提供的分类模型训练方法中,对源域数据和目标域数据进行共有特征捕捉的具体方法的流程图;

图3示出了本发明实施例所提供的分类模型训练方法中,根据域分类结果,对第一神经网络进行参数调整的具体方法的流程图;

图4示出了本发明实施例所提供的分类模型训练方法中,对源域数据和目标域数据进行差异性特征捕捉的具体方法的流程图;

图5示出了本发明实施例所提供的分类模型训练方法中,根据域分类结果,对第二神经网络进行参数调整的具体方法的流程图;

图6示出了本发明实施例所提供的分类模型训练方法中,根据聚类结果对第一神经网络进行本轮训练的具体方法的流程图;

图7示出了本发明实施例所提供的分类模型训练方法中,相似度计算操作的具体方法的流程图;

图8示出了本发明实施例所提供的一种分类方法的流程图;

图9示出了本发明实施例所提供的一种分类模型训练装置的结构示意图;

图10示出了本发明实施例所提供的一种分类装置的结构示意图;

图11示出了本发明实施例所提供的一种计算机设备的结构示意图

具体实施方式

与现有技术不同,本发明实施例利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和所述目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。

为便于对本实施例进行理解,首先对本发明实施例所公开的一种分类模型训练方法进行详细介绍,该方法用于对各种数据的分类模型的训练,所得的分类模型能够对对应数据进行分类。

参见图1所示,本发明实施例提供的分类模型训练方法包括:

s101:获取携带标签的源域数据以及未携带标签的目标域数据。

在具体实现的时候,源域数据为带有标签的数据,目标域数据为不带有标签的数据。源域数据和目标域数据具有一定的共性,又有一定的差异性。

可以认为源域数据作为训练样本数量充足,而现实需求需要对具有预设特征的目标域数据进行分类,而具有预设特征的第二目标域数据作为训练样本数量不足,或者训练过程中困难较大,那么,需要通过迁移学习,在对源域数据学习的过程中,同时学习预设特征,从而将预设特征与源域数据特征融合;同时,还需要通过迁移学习,在对源域数据学习的过程中,同时学习到源域数据与目标域数据之间的差异特征,从而将预设特征、源域数据与目标域数据的差异特征均和源域数据特征融合,充分学习目标域特征空间,对目标域数据的分类更加的准确。

此处,源域数据以及目标域数据可以是图像、视频、语言等可以采用神经网络学习进行分类的数据。

例如当源域数据和目标域数据均为图像数据时,源域数据可以为质量较好的图像,如使用分辨率较高的图像获取设备在均匀光照条件下,所获得的面部无遮挡物的清晰人脸图像。源域数据中的人脸可以是多种角度的人脸图像,例如人脸正视图像、侧视图像、斜视图像、仰视图像、俯视图像等。

目标域数据均为具有预设特征的图像,如图像质量较差的图像,可以是用分辨率较低的图像获取设备在非均匀的多种不同光照条件下所获取的不清晰的人脸图像。目标域数据中的人脸也可以是多种角度的人脸图像。

又例如,当源域数据和目标域数据均为语言数据时,源域数据为法语词汇,目标域数据为西班牙语词汇,由于法语和西班牙语同属于拉丁语系,因此两者之间具有部分共同的特征;但两者属于两种不同的语言,因此又具有一定的差异。使用能够识别的法语对西班牙语的特征进行学习,从而能够识别西班牙语。

又例如,源域数据和目标域数据为语言数据时,要对某些词汇或者话术进行情感分析;源域数据为已经标注了情感标签的词汇,目标域数据是未标注情感标签的话术。

s102:将源域数据以及目标域数据输入第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量;并对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;并将第一源域特征向量输入第一分类器得到第一分类结果。

在具体实现的时候,第一神经网络可以采用卷积神经网络(convolutionalneuralnetwork,cnn)来为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量。

源域数据为携带有标签的数据,该标签用于指示源域数据的正确分类结果;目标域数据为不携带标签的数据。在将源域数据和目标域数据输入第一神经网络后,第一神经网络对源域数据以及目标域数据进行共享参数的特征学习。在这个过程中,由于第一神经网络对源域数据进行有监督学习,而对目标域数据进行无监督学习,在使用同一第一神经网络对源域数据和目标域数据进行共享参数的学习过程中,会不断调整第一神经网络中所使用的参数,从而在对第一神经网络训练的过程中,让第一神经网络的参数受到目标域数据的影响,进而使得第一神经网络在对源域数据和目标域数据进行特征学习后,对每个源域数据进行特征提取所得到的第一源域特征向量中会受到目标域数据的干扰,实现源域数据和目标域数据的域间混合。

同时,在为源域数据提取第一源域特征向量,并为目标域数据提取第一目标域特征向量后,还会对源域数据和目标域数据进行共有特征的捕捉,这使得在对第一神经网络训练的时候,为源域数据提取得到的第一源域特征向量受到的目标域数据的干扰,就是受到源域数据和目标域数据共有特征的干扰,从而在实现源域数据和目标域数据的域间融合的时候,将源域数据和目标域数据的共有域进行融合,最终使得第一源域特征向量学习到源域数据和目标域数据的共有特征。

参见图2所示,本发明实施例还提供一种对源域数据和目标域数据进行共有特征捕捉的具体方法。该方法包括:

s201:在为源域数据提取第一源域特征向量,并为目标域数据提取第一目标域特征向量之后,将第一源域特征向量和第一目标域特征向量进行梯度反向处理。

s202:将进行梯度反向处理的第一源域特征向量和第一目标域特征向量输入第一域分类器。

s203:根据第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第一神经网络进行参数调整。

在具体实现的时候,由于在使用源域数据和目标域数据对第一神经网络进行训练的过程,实际上是要将源域数据和目标域数据进行域混合的过程。即使用第一神经网络对源域数据进行特征提取所获得的第一源域特征向量要受到目标域数据中特征的影响,也即,使得第一源域特征向量向目标域数据的特征接近;同时,使用第一神经网络对源域数据进行特征提取所获取的第一目标域特征向量受到源域数据中特征的影响,也即,使得第一目标域特征向量向源域数据的特征接近。因此,为了实现对源域数据和目标域数据的域混合,在为目标域数据中的每个目标域数据提取第一目标域特征向量,并为源域数据中的每个源域数据提取第一源域特征向量后,要将第一目标域特征向量和第一源域特征向量进行梯度反向处理,然后将经过梯度反向处理的第一目标域特征向量和第一源域特征向量输入至第一域分类器,使用第一域分类器对第一目标域特征向量和第一源域特征向量进行域分类。

域分类的结果正确,也即第一域分类器能够正确对第一源域特征向量和第一目标域特征向量进行正确分类的概率越大,则说明域混合的程度越小;域分类的结果错误的概率越大,也即域分类器对第一源域特征向量和第一目标域特征向量进行分类正确的概率越小,说明域混合的程度越大,因此,要基于第一域分类器对第一目标域特征向量和第一源域特征向量分别表征的源域数据和目标域数据进行分类的结果,对第一神经网络进行参数调整。

此处,参见图3所示,可以通过执行下述域分类损失确定操作,来实现根据域分类结果,对第一神经网络进行参数调整:

s301:确定当前第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失。

此处,通过域分类损失来表征域混合的程度。源域数据的域分类损失是指在基于第一源域特征向量和第一目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为被分到目标域中的源域数据的数量。目标域数据的域分类损失是指在基于第一源域特征向量和第一目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为被分到源域中的目标域数据的数量。在使用第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据进行域分类后,就能够获得域分类结果,然后按照域分类结果,确定源域数据合目标域数据分别对应的域分类损失。

s302:针对最近预设次数的域分类损失之间的差别不小于预设差别阈值,生成第三反馈信息,并基于该第三反馈信息对第一神经网络进行参数调。

此处,使用预设差别阈值来对域混合的程度进行约束。第一域分类器中预先存储有第一源域特征向量和第一目标域特征向量分别所属域的分布,当最近预设次数的域分类损失之间的差别不小于预设差别阈值时,则认为域分类还未达到稳定的状态,也就是说,在某次域分类中,第一域分类器能正确区分第一源域特征向量和第一目标域特征向量分别所属的域,某次域分类中,域分类器又不能正确区分第一源域特征向量和第一目标域特征向量分别所属的域,域混合程度还不稳定,那么,需要对第一神经网络的参数进行调整,因此会生成域分类损失差别过大的第三反馈信息,并反馈给第一神经网络。第一神经网络在接收到该域分类损失差别过大的第三反馈信息后,会对自身的参数进行调整。

s303:基于调整后的参数,使用第一神经网络为源域数据提取新的第一源域特征向量,并为目标域数据提取新的第一目标域特征向量,并执行域分类损失确定操作,直至差别大于预设差别阈值,完成基于第一域分类器对第一神经网络的本轮训练。

基于第一域分类器对第一神经网络的训练,是要根据第一域分类器的对第一源域特征向量和第一目标域特征向量的分类结果所确定的域分类损失维持在一定的值上,尽可能分不清楚目标域数据和源域数据到底是属于源域还是属于目标域,提取两者的公用特征。

此处,需要注意的是,当最近预设次数的域分类损失之间的差别小于预设差别阈值时,也会生成域分类损失合适的反馈信息,并将之反馈给第一神经网络。第一神经网络在接收到该域分类损失合适的反馈信息后,还会对自身的参数进行幅度较小的调整,力求梯度下降到局部最优。

s103:将源域数据以及目标域数据输入第二神经网络,为目标域数据提取第二目标域特征向量;并对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征。

在具体实现的时候,第二神经网络可以采用卷积神经网络(convolutionalneuralnetwork,cnn)来为源域数据提取第二源域特征向量,为目标域数据提取第二目标域特征向量。

可选地,第一神经网络和第二神经网络为结构相同的神经网络。

源域数据为携带有标签的数据,该标签用于指示源域数据的正确分类结果;目标域数据为不携带标签的数据。在将源域数据和目标域数据输入第二神经网络后,第二神经网络对源域数据以及目标域数据进行共享参数的特征学习。在这个过程中,由于第二神经网络对源域数据进行有监督学习,而对目标域数据进行无监督学习,在使用同一第二神经网络对源域数据和目标域数据进行共享参数的学习过程中,会不断调整第一神经网络中所使用的参数,从而在对第二神经网络训练的过程中,让第二神经网络的参数受到目标域数据的影响,进而使得第二神经网络在对源域数据和目标域数据进行特征学习后,对每个源域数据进行特征提取所得到的第二源域特征向量中会受到目标域数据的干扰,实现源域数据和目标域数据的域间混合。

同时,在为源域数据提取第二源域特征向量,并为目标域数据提取第二目标域特征向量后,还会对源域数据和目标域数据进行差异性特征的捕捉,这使得在对第二神经网络训练的时候,为源域数据提取得到的第二源域特征向量受到的目标域数据的干扰,也即,受到源域数据和目标域数据差异性特征的干扰,从而在实现源域数据和目标域数据的域间融合的时候,将源域数据和目标域数据的差异性域进行融合,最终使得第二源域特征向量学习到源域数据和目标域数据的差异性特征。

在对源域数据和目标域数据进行差异性特征捕捉之前,要为源域数据提取第二源域特征向量。

参见图4所示,本发明实施例还提供一种对源域数据和目标域数据进行差异性特征捕捉的具体方法。该方法包括:

s401:将所第二源域特征向量和第二目标域特征向量输入第二域分类器。

s402:根据第二域分类器的对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第二神经网络进行参数调整。

在具体实现的时候,在不对第二源域特征向量和第二目标域特征向量进行梯度反向处理,而是将两者直接输入第二域分类器,使用第二域分类器对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据进行域分类,所得到的域分类损失越小,才能够尽可能区分出源域数据和目标域数据所属的域。使得第二神经网络能够捕捉到源域数据和目标域数据之间的差异性特征,拉远两者之间的距离。

具体地,参见图5所示,可以通过执行下述域分类损失确定操作,来实现根据域分类结果,对第二神经网络进行参数调整:

s501:确定当前第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失。

此处,通过域分类损失来表征第二源域特征向量和第二目标域特征向量进行域混合的程度。源域数据的域分类损失是指在基于第二源域特征向量和第二目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为目标域数据的源域数据的数量。目标域数据的域分类损失是指在基于第二源域特征向量和第二目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为源域数据的目标域数据的数量。在使用地域分类器对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据进行域分类后,就能够获得域分类结果,然后按照域分类结果,确定源域数据合目标域数据分别对应的域分类损失。

s502:针对域分类结果错误的情况,生成第四反馈信息,并基于第四反馈信息对第二神经网络进行参数调整。

此处,由于要保证域分类结果的正确性,只有域分类结果是正确的,才会拉远源域数据和目标域数据之间的距离,也即提取到源域数据和目标域数据之间的差异性数据,因此要在域分类结果错误的时候,生成第四反馈信息,并基于第四反馈信息对第二神经网络进行参数调整。

s503:基于调整后的参数,使用第二神经网络为源域数据提取新的第二源域特征向量,并为目标域数据提取新的第二目标域特征向量,并执行域分类损失确定操作。

直至域分类结果正确,或者域分类结果的正确率达到预设的阈值。

s104:分别对第一目标域特征向量以及第二目标域特征向量进行聚类。

s105:根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练。

在具体实现的时候,根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练,是要根据聚类的结果,对第一神经网络在训练过程中的参数进行调整,并根据第一分类结果,度第一神经网络和第一分类器在训练过程中的参数进行调整。

其一:根据聚类的结果,对第一神经网络在训练过程中的参数进行调整时,由于是要使用第一神经网络为目标域数据提取第一目标域特征向量,并使用第二神经网络为目标域数据提取第二目标域特征向量,模型最终的训练结果,是要对目标域数据进行尽可能正确的分类,因此在对第一神经网络和第二神经网络进行训练的过程中,要保证两者分别提取的第一目标域特征向量和第二目标域特征向量的分布的相似性在一定范围之内。

这里的第一目标域特征向量和第二目标域特征向量的分布的相似性,是指,目标域数据包括了多个数据。这多个数据均属于目标域数据。在对每个目标域数据提取特征向量的时候,是为这多个数据中的每个分别提取特征向量;多个数据的第一目标域特征向量和第二目标域特征向量在空间上的分布是相似的。

因此,此处要对第一目标域特征向量和第二目标域特征向量分别进行聚类。

参见图6所示,在根据聚类结果对第一神经网络进行本轮训练的时候,包括:

s601:根据对第一目标域特征向量进行聚类的结果,生成第一邻接矩阵。

具体地,由于在将第一目标域特征向量进行聚类的时候,可以将每个第一目标域数据看作是映射到高维空间中的点,根据点与点之间的距离,对这些点进行聚类操作,将距离在预设阈值以内的点划分到同一类中。然后根据聚类操作的结果,形成点到点之间距离的第一邻接矩阵。

在第一邻接矩阵中,如果两个点在聚类时属于同一类,则两者之间的距离为1;如果两个点在聚类时不属于同一类,则两点之间的距离为0。

例如,目标域数据有5个,得到的第一目标域特征向量分别为:1、2、3、4、5。其中,对第一目标域特征向量进行聚类的结果为:{1,3}、{2}、{4,5},则形成的邻接矩阵为:

s602:根据对第二目标域特征向量进行聚类的结果,生成第二邻接矩阵。

此处,生成第二邻接矩阵的方法与生成第一邻接矩阵的方法类似,在此不再赘述。

s603:根据第一邻接矩阵以及第二邻接矩阵之间的相似度,对第一神经网络进行训练。

此处,在根据第一邻接矩阵以及第二邻接矩阵之间的相似度,对第一神经网络进行训练时,执行如下相似度计算操作,直至第一邻接矩阵和第二邻接矩阵之间的相似度小于预设的相似度阈值。

参见图7所示,相似度计算操作包括:

s701:计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度。

在具体实现的时候,在计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度时,计算第一邻接矩阵的迹和第二邻接矩阵的迹,第一邻接矩阵的迹和第二邻接矩阵的迹之间的距离越近,则第一邻接矩阵和第二邻接矩阵之间的相似度越高。在对第一邻接矩阵的迹和第二邻接矩阵的迹之间的距离进行求解时,可以将第一邻接矩阵的迹与第二邻接矩阵的迹之间的差作为第一邻接矩阵和第二邻接矩阵之间的相似度,也即第一邻接矩阵的迹与第二邻接矩阵的迹之间的差的绝对值越大,第一邻接矩阵和第二邻接矩阵的相似度越低。

s702:针对相似度不小于预设的相似度阈值的情况,生成第一反馈信息,并基于第一反馈信息对第一神经网络和第二神经网络进行参数调整。

s703:基于调整后的参数,使用第一神经网络为目标域数提取新的第一目标域特征向量,以及使用第二神经网络为目标域数据提取新的第二目标域特征向量;

s704:对新的第一目标域特征向量进行聚类,生成新的第一邻接矩阵,以及,对新的第二目标域特征向量进行聚类,生成新的第二邻接矩阵,并再次执行相似度计算操作。

由于第一邻接矩阵和第二邻接矩阵之间的相似度越高,则第一邻接矩阵表征的对第一目标域特征向量进行分类的分类结果,和第二邻接矩阵表征的对第二目标域特征向量进行分类的分类结果越相似,因此要根据第一邻接矩阵和第二邻接矩阵之间的相似度,对第一神经网络进行参数调整,使得第一神经网络在对源域数据和目标域数据之间的差异特征进行限制,加快模型收敛。

其二,根据第一分类结果,对第一神经网络和第一分类器在训练过程中的参数进行调整。

具体地,在根据第一分类结果,对对第一神经网络和第一分类器在训练过程中的参数进行调整时,执行如下分类操作,知道得到的第一分类结果正确,则完成基于第二神经网络对第一神经网络和第一分类器的本轮训练。

该分类操作包括:

使用第一分类器对当前提取的第一源域特征向量进行分类;

针对分类结果错误的情况,生成第二反馈信息,并将于第二反馈信息,对第一神经网络以及第一分类器的参数进行调整;

基于调整后的参数,使用第一神经网络为源域数据提取新的第一源域特征向量,并再次执行分类操作。

此处,由于分类模型要对目标域数据进行分类,要尽量保证分类的正确性的前提下,在利用源域和目标域支架的差异性特征的同时,要保证对源域数据的分类结果是正确的,因此要使用第一分类结果对第一神经网络和第一分类器的参数进行约束。

s106:经过对第一神经网络和第一分类器进行多轮训练,得到分类模型。

在具体实现的时候,对第一神经网络和第一分类器进行一轮训练,是指使用一组源域数据和目标域数据对第一神经网络和第一分类器进行训练。之后,还会继续输入多组域数据和目标域数据对第一神经网络和第一分类器进行训练,直至得到满足要求的第一神经网络和第一分类器,并将得到的第一神经网络和第一分类器作为得到的分类模型。

上述过程中,s102和s103之间并无先后执行顺序。

本发明实施例提供的分类模型训练方法中,利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。

在另一实施例中,由于要基于第二神经网络对第一神经网络和第一分类器,因此,在对第一神经网络训练的同时,还会对第二神经网络进行同步训练。在对第二神经网络进行训练的时候,其一会根据聚类的结果,对第二神经网络的参数进行调整。其二,还要保证第二神经网络对源域数据的分类结果是准确的。

因此在为源域数据提取第二源域特征向量之后,还要将第二源域特征向量输入第二分类器得到第二分类结果;

根据第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对第二神经网络进行参数调整。

此处,根据第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对第二神经网络进行参数调整,具体包括:

执行下述分类操作,直至得到的第二分类结果正确,则完成对第二神经网络和第二分类器的本轮训练;

分类操作包括:

使用第二分类器对当前提取的第二源域特征向量进行分类;

针对分类结果错误的情况,生成第五反馈信息,并将于第五反馈信息,对第二神经网络以及第二分类器的参数进行调整;

基于调整后的参数,使用第二神经网络为源域数据提取新的第二源域特征向量,并再次执行分类操作。

使用第二分类结果对第二神经网络和第二分类器进行参数调整的过程,与使用第一分类结果对第一神经网络和第一分类器进行参数调整的过程类似,在此不再赘述。

参见图8所示,本发明实施例还提供一种分类方法,该方法包括:

s801:获取待分类数据;

s802:将待分类数据输入至本申请实施例所提供的分类模型训练方法得到的分类模型中,得到待分类数据的分类结果;

其中,分类模型包括:第一神经网络和第一分类器。

基于同一发明构思,本发明实施例中还提供了与分类模型训练方法对应的分类模型训练装置,由于本发明实施例中的装置解决问题的原理与本发明实施例上述分类模型训练方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

参见图9所示,本发明实施例提供的分类模型训练装置,包括:

获取模块901,用于获取携带标签的源域数据以及未携带标签的目标域数据;

第一处理模块902,用于将源域数据以及目标域数据输入第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量;并对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;并将第一源域特征向量输入第一分类器得到第一分类结果;

第二处理模块903,用于将源域数据以及目标域数据输入第二神经网络,为目标域数据提取第二目标域特征向量;并对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征;

聚类模块904,用于分别对第一目标域特征向量以及第二目标域特征向量进行聚类;

训练模块905,用于根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练;经过对第一神经网络和第一分类器进行多轮训练,得到分类模型。

本发明实施例利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。

可选地,第一处理模块902用于如下方式对源域数据和目标域数据进行共有特征捕捉:

在为源域数据提取第一源域特征向量,并为目标域数据提取第一目标域特征向量之后,将第一源域特征向量和第一目标域特征向量进行梯度反向处理;

将进行梯度反向处理的第一源域特征向量和第一目标域特征向量输入第一域分类器;

根据第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第一神经网络进行参数调整。

可选地,第二处理模块903在将源域数据以及目标域数据输入第二神经网络,对源域数据以及目标域数据进行特征学习后,为源域数据提取第二源域特征向量;

第二处理模块903用于采用如下方式对源域数据和目标域数据进行差异性特征捕捉:

将第二源域特征向量和第二目标域特征向量输入第二域分类器;

根据第二域分类器的对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第二神经网络进行参数调整。

可选地,还包括第二训练模块,用于为源域数据提取第二源域特征向量之后,将第二源域特征向量输入第二分类器得到第二分类结果;

根据第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对第二神经网络进行参数调整。

可选地,训练模块905,具体用于根据对第一目标域特征向量进行聚类的结果,生成第一邻接矩阵;

根据对第二目标域特征向量进行聚类的结果,生成第二邻接矩阵;

根据第一邻接矩阵以及第二邻接矩阵之间的相似度,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练。

可选地,训练模块905,具体用于:执行如下相似度计算操作以及分类操作,直至第一邻接矩阵和第二邻接矩阵之间的相似度小于预设的相似度阈值,以及得到的第一分类结果正确,则完成基于第二神经网络对第一神经网络和第一分类器的本轮训练;

相似度计算操作包括:

计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度;

针对相似度不小于预设的相似度阈值的情况,生成第一反馈信息,并基于第一反馈信息对第一神经网络和第二神经网络进行参数调整;

基于调整后的参数,使用第一神经网络为目标域数提取新的第一目标域特征向量,以及使用第二神经网络为目标域数据提取新的第二目标域特征向量;

对新的第一目标域特征向量进行聚类,生成新的第一邻接矩阵,以及,对新的第二目标域特征向量进行聚类,生成新的第二邻接矩阵,并再次执行相似度计算操作;

分类操作包括:

使用第一分类器对当前提取的第一源域特征向量进行分类;

针对分类结果错误的情况,生成第二反馈信息,并将于第二反馈信息,对第一神经网络以及第一分类器的参数进行调整;

基于调整后的参数,使用第一神经网络为源域数据提取新的第一源域特征向量,并再次执行分类操作。

可选地,训练模块905,具体用于根据下述方式计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度:

计算第一邻接矩阵的迹和第二邻接矩阵的迹;

将第一邻接矩阵的迹与第二邻接矩阵的迹之间的差作为第一邻接矩阵和第二邻接矩阵之间的相似度。

可选地,第二训练模块,还用于采用下述方式对第二神经网络进行参数调整:

执行如下域分类损失确定操作:

确定当前第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失;

针对域分类结果错误的情况,生成第四反馈信息,并基于第四反馈信息对第二神经网络进行参数调整;

基于调整后的参数,使用第二神经网络为源域数据提取新的第二源域特征向量,并为目标域数据提取新的第二目标域特征向量,并执行域分类损失确定操作。

本发明又一实施例还提供一种分类装置,参见图10所示,本发明实施例所提供的分类装置包括:

待分类数据获取模块1001,用于获取待分类数据;

分类模块1002,用于将待分类数据输入至通过本申请实施例提供的分类模型训练方法得到的分类模型中,得到待分类数据的分类结果;其中,分类模型包括:第一神经网络和第一分类器。

对应于图1中的分类模型训练方法,本发明实施例还提供了一种计算机设备,如图11所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述分类模型训练方法的步骤。

具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述分类模型训练方法,从而解决在对分类模型训练过程中是能够利用源域数据和目标域数据之间的相同特征,而无法利用源域数据和莫标语数据之间的差异数据导致的分类模型在对目标域数据进行分类时存在的误差问题,进而达到既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果的效果。

对应于图1中的分类模型训练方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述分类模型训练方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述分类模型训练方法,从而解决在对分类模型训练过程中是能够利用源域数据和目标域数据之间的相同特征,而无法利用源域数据和莫标语数据之间的差异数据导致的分类模型在对目标域数据进行分类时存在的误差问题,进而达到既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果的效果。

本发明实施例所提供的分类模型训练方法、装置以及分类方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1