一种具有时间适应性的分类方法及装置与流程

文档序号:11864907阅读:来源:国知局

技术特征:

1.一种具有时间适应性的分类方法,其特征在于,包括:

将已标注的历史样本集作为训练样本,训练得到基础分类器;

利用所述基础分类器对现阶段的预定未标注样本集中的部分样本进行分类,得到具有类别标签的部分样本;

将所述已标注的历史样本集及具有类别标签的所述部分样本中置信度高于预定阈值的样本作为新的训练样本,并迭代执行所述训练、所述分类及所述训练样本的更新过程,直至所述未标注样本集中的各个样本均具有相应的类别标签;

基于所述已标注的历史样本集及所述未标注样本集标注后对应的具有类别标签的所有样本,训练得到目标分类器,以使得基于所述目标分类器对待测样本进行分类。

2.根据权利要求1所述的方法,其特征在于,所述将已标注的历史样本集作为训练样本,训练得到基础分类器,包括:

将所述历史样本集划分为两个属性集:第一属性集及第二属性集;其中,所述第一属性集及所述第二属性集的交集为空,合集为所述历史样本集;

基于所述第一属性集训练得到第一基础分类器;

基于所述第二属性集训练得到第二基础分类器。

3.根据权利要求2所述的方法,其特征在于,所述利用所述基础分类器对现阶段的预定未标注样本集中的部分样本进行分类,得到具有类别标签的部分样本,包括:

利用所述第一基础分类器对所述部分样本中的第一部分样本进行分类,得到具有类别标签的第一部分样本;

利用所述第二基础分类器对所述部分样本中的第二部分样本进行分类,得到具有类别标签的第二部分样本。

4.根据权利要求3所述的方法,其特征在于,将所述已标注的历史样本集及具有类别标签的所述部分样本中置信度高于阈值的样本作为新的训练样本,并迭代执行所述训练、所述分类及所述训练样本的更新过程,包括:

将所述具有类别标签的第一部分样本中置信度高于预定阈值的样本添加至所述第一属性集,得到新的第一属性集;

将所述具有类别标签的第二部分样本中置信度高于预定阈值的样本添加至所述第二属性集,得到新的第二属性集;

将所述第一属性集及所述第二属性集作为新的训练样本,并迭代执行所述训练、所述分类及训练样本的更新过程。

5.根据权利要求1-4任意一项所述的方法,其特征在于,还包括:

基于所述待测样本的分类类别及实际类别,验证所述目标分类器的分类准确性。

6.一种具有时间适应性的分类装置,其特征在于,包括:

基础分类器训练模块,用于将已标注的历史样本集作为训练样本,训练得到基础分类器;

标签标注模块,用于利用所述基础分类器对现阶段的预定未标注样本集中的部分样本进行分类,得到具有类别标签的部分样本;

迭代模块,用于将所述已标注的历史样本集及具有类别标签的所述部分样本中置信度高于预定阈值的样本作为新的训练样本,并迭代执行所述训练、所述分类训练样本的更新过程,直至所述未标注样本集中的各个样本均具有相应的类别标签;

目标分类器训练模块,用于基于所述已标注的历史样本集及所述未标注样本集标注后对应的具有类别标签的所有样本,训练得到目标分类器,以使得基于所述目标分类器对待测样本进行分类。

7.根据权利要求6所述的装置,其特征在于,所述基础分类器训练模块包括:

划分单元,用于将所述历史样本集划分为两个属性集:第一属性集及第二属性集;其中,所述两个属性集的交集为空,合集为所述历史样本集;

第一训练单元,用于基于所述第一属性集训练得到第一基础分类器;

第二训练单元,用于基于所述第二属性集训练得到第二基础分类器。

8.根据权利要求7所述的装置,其特征在于,所述标签标注模块包括:

第一标注单元,用于利用所述第一基础分类器对所述部分样本中的第一部分样本进行分类,得到具有类别标签的第一部分样本;

第二标注单元,用于利用所述第二基础分类器对所述部分样本中的第二部分样本进行分类,得到具有类别标签的第二部分样本。

9.根据权利要求8所述的装置,其特征在于,所述迭代模块包括:

第一添加单元,用于将所述具有类别标签的第一部分样本中置信度高于预定阈值的样本添加至所述第一属性集,得到新的第一属性集;

第二添加单元,用于所述具有类别标签的第二部分样本中置信度高于预定阈值的样本添加至所述第二属性集,得到新的第二属性集;

迭代单元,用于将所述第一属性集及所述第二属性集作为新的训练样本,并迭代执行所述训练、所述分类及训练样本的更新过程。

10.根据权利要求6-9任意一项所述的装置,其特征在于,还包括:

准确性验证模块,用于基于所述待测样本的分类类别及实际类别,验证所述目标分类器的分类准确性。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1