数据处理方法和装置与流程

文档序号:12272770阅读:来源:国知局

技术特征:

1.一种数据处理方法,其特征在于,包括:

接收目标数据;

根据预设的数据分类模型确定所述目标数据属于各个预定类的概率,其中,所述数据分类模型是根据过滤后的多个样本数据建立的模型;

基于所述目标数据属于各个预定类的概率,得到所述目标数据的分类结果;

输出所述分类结果。

2.根据权利要求1所述的方法,其特征在于,根据预设的数据分类模型确定所述目标数据属于各个预定类的概率包括:

根据所述数据分类模型中记录的正态分布密度函数,计算所述目标数据属于每个预定类中每个属性的属性概率,其中,每个预定类包括多个属性;

计算每个预定类中多个属性的属性概率的加权值,得到所述目标数据属于每个预定类的概率。

3.根据权利要求1或2所述的方法,其特征在于,基于所述目标数据属于各个预定类的概率,得到所述目标数据的分类结果包括:

将最大概率值对应的预定类,确定为所述目标数据所属的预定类。

4.根据权利要求1所述的方法,其特征在于,在根据预设的数据分类模型确定所述目标数据属于各个预定类别的概率之前,所述方法还包括:

采集所述多个样本数据,其中,所述样本数据中的每个样本包括多个类,每个类包括多个属性;

对所述多个样本数据进行无效数据过滤,得到过滤后的数据,其中,所述无效数据为所述样本数据中属性值缺失率超过预设阈值的数据;

对所述每个类的每个属性分别计算所述样本数据的属性分布;

根据所述属性分布建立数据分类模型。

5.根据权利要求4所述的方法,其特征在于,在对所述多个样本数据进行无效数据过滤,得到过滤后的数据之后,所述方法还包括:

计算所述每个类的每个属性的数据的均值和标准差;

过滤掉与所述均值的差值超过两倍标准差的数据。

6.根据权利要求4所述的方法,其特征在于,在对所述多个样本数据进行无效数据过滤,得到过滤后的数据之后,所述方法还包括:

对所述样本数据进行向量化表示,得到向量化数据。

7.一种数据处理装置,其特征在于,包括:

接收单元,用于接收目标数据;

确定单元,用于根据预设的数据分类模型确定所述目标数据属于各个预定类的概率,其中,所述数据分类模型是根据过滤后的多个样本数据建立的模型;

处理单元,用于基于所述目标数据属于各个预定类的概率,得到所述目标数据的分类结果;

输出单元,用于输出所述分类结果。

8.根据权利要求7所述的装置,其特征在于,所述确定单元包括:

根据所述数据分类模型中记录的正态分布密度函数,计算所述目标数据属于每个预定类中每个属性的属性概率,其中,每个预定类包括多个属性;

计算单元,用于计算每个预定类中多个属性的属性概率的加权值,得到所述目标数据属于每个预定类的概率。

9.根据权利要求7或8所述的装置,其特征在于,所述处理单元具体用于:

将最大概率值对应的预定类,确定为所述目标数据所属的预定类。

10.根据权利要求7所述的装置,其特征在于,所述装置还包括:

采集单元,用于在根据预设的数据分类模型确定所述目标数据属于各个预定类别的概率之前,采集所述多个样本数据,其中,所述样本数据中的每个样本包括多个类,每个类包括多个属性;

过滤单元,用于对所述多个样本数据进行无效数据过滤,得到过滤后的数据,其中,所述无效数据为所述样本数据中属性值缺失率超过预设阈值的数据;

属性分布计算单元,用于对所述每个类的每个属性分别计算所述样本数据的属性分布;

建立单元,用于根据所述属性分布建立数据分类模型。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1