信息处理装置和信息处理方法与流程

文档序号:12041965阅读:来源:国知局
信息处理装置和信息处理方法与流程

技术特征:
1.一种信息处理装置,用于对具有多维标签的多个原始数据进行特征变换,所述信息处理装置包括:原始特征向量生成单元,其被配置为针对每个原始数据,生成代表该原始数据的原始特征的原始特征向量;标签向量生成单元,其被配置为针对每个原始数据,生成代表该原始数据所具有的多维标签的标签向量;标签相似度确定单元,其被配置为针对每个原始数据,计算该原始数据与每个其他原始数据在标签向量空间中的标签相似度;相关数据确定单元,其被配置为针对每个原始数据,基于每个其他原始数据与该原始数据的标签相似度来确定该其他原始数据是否是该原始数据的相关数据;特征相似度确定单元,其被配置为针对每个原始数据,计算该原始数据与每个其他原始数据在原始特征向量空间中的特征相似度;近邻相关数据选择单元,其被配置为针对每个原始数据,基于该原始数据的每个相关数据与该原始数据的特征相似度,在该原始数据的相关数据中选择该原始数据的多个近邻相关数据;近邻相关图生成单元,其被配置为以每个原始数据和该原始数据的近邻相关数据作为节点,在对应于该原始数据和该原始数据的每个近邻相关数据的节点之间形成边,并且为每个边设定大于等于零的权重,从而形成近邻相关图;以及特征变换单元,其被配置为求解目标变换矩阵并根据所述目标变换矩阵对所述多个原始数据进行特征变换,其中,所述目标变换矩阵代表使得目标函数得到最大值的线性变换,所述目标函数与所述近邻相关图中的全部边在经过所述线性变换的特征空间中的加权长度之和负相关,使得特征变换后的近邻相关图中各个近邻相关数据之间的加权距离被拉近。2.根据权利要求1所述的信息处理装置,其中所述标签相似度确定单元被进一步配置为根据每个原始数据与每个其他原始数据在标签向量空间中的距离和标签相关性矩阵来计算所述标签相似度。3.根据权利要求1或2所述的信息处理装置,其中所述近邻相关图生成单元被进一步配置为针对每条边,将该边的权重设定为与对应于该边所连接的两个节点的两个原始数据之间的特征相似度和标签相似度中的至少一项正相关。4.根据权利要求1或2所述的信息处理装置,其中所述近邻相关图生成单元被进一步配置为针对每条边,如果与该边所连接的一个节点所对应的原始数据的特征相似度最大的第一预定数目的其他原始数据中包括与这条边所连接的另一个节点所对应的原始数据,则将该边的权重设定为1,否则将该边的权重设定为与对应于该边所连接的两个节点的两个原始数据之间的特征相似度和标签相似度中的至少一项正相关且小于等于1。5.根据权利要求1或2所述的信息处理装置,其还包括:非相关数据确定单元,其被配置为针对每个原始数据,基于该原始数据与每个其他原始数据的标签相似度来确定每个其他原始数据是否是该原始数据的非相关数据;近邻非相关数据选择单元,其被配置为针对每个原始数据,基于该原始数据的每个非相关数据与该原始数据的特征相似度,在该原始数据的非相关数据中选择该原始数据的多个近邻非相关数据;以及近邻非相关图生成单元被配置为以每个原始数据和该原始数据的近邻非相关数据作为节点,在对应于该原始数据和该原始数据的每个近邻非相关数据的节点之间形成边,并且为每个边设定大于等于零的权重,从而形成近邻非相关图;并且其中所述目标函数与所述近邻相关图中的全部边在经过所述线性变换的特征空间中的加权长度之和负相关,并且与所述近邻非相关图中的全部边在经过所述线性变换的特征空间中的加权长度之和正相关。6.根据权利要求5所述的信息处理装置,其中所述近邻非相关图生成单元被进一步配置为针对每条边,如果该边所连接的两个节点所对应的两个原始数据之间的特征相似度大于其中一个原始数据与该原始数据的所有相关数据的特征相似度中的最大值,则将该边的权重设定为与该边所连接的两个节点所对应的两个原始数据之间的特征相似度正相关,否则将该边的权重设定为0。7.根据权利要求1或2所述的信息处理装置,其通过进行所述特征变换来对所述原始数据进行分类。8.根据权利要求7所述的信息处理装置,其中所述多个原始数据是多个图像数据或者多个文本数据。9.一种信息处理装置,用于对具有多维标签的多个原始数据进行特征变换,所述信息处理装置包括:原始特征向量生成单元,其被配置为针对每个原始数据,生成代表该原始数据的原始特征的原始特征向量;标签向量生成单元,其被配置为针对每个原始数据,生成代表该原始数据所具有的多维标签的标签向量;标签相似度确定单元,其被配置为针对每个原始数据,计算该原始数据与每个其他原始数据在标签向量空间中的标签相似度,并且基于该标签相似度来确定该其他原始数据是否是该原始数据的非相关数据;特征相似度确定单元,其被配置为针对每个原始数据,计算该原始数据与每个其他原始数据在原始特征向量空间中的特征相似度;近邻非相关数据选择单元,其被配置为针对每个原始数据,在该原始数据的所有非相关数据中,基于与该原始数据的特征相似度来选择该原始数据的多个近邻非相关数据;近邻非相关图生成单元,其被配置为以每个原始数据和该原始数据的近邻非相关数据作为节点,在对应于该原始数据与该原始数据的每个近邻非相关数据的节点之间形成边,并且为每个边设定大于等于零的权重,从而形成近邻非相关图;以及特征变换单元,其被配置为求解目标变换矩阵并根据所述目标变换矩阵对所述多个原始数据进行特征变换,其中,所述目标变换矩阵代表使得目标函数得到最大值的线性变换,所述目标函数与所述近邻非相关图中的全部边在经过所述线性变换的特征空间中的加权长度之和正相关,使得特征变换后的近邻非相关图中各个近邻非相关数据之间的加权距离被拉远。10.一种信息处理方法,其用于对具有多维标签的多个原始数据进行特征变换,所述信息处理方法包括:针对每个原始数据,生成代表该原始数据的原始特征的原始特征向量;针对每个原始数据,生成代表该原始数据所具有的多维标签的标签向量;针对每个原始数据,计算该原始数据与每个其他原始数据在标签向量空间中的标签相似度;针对每个原始数据,基于每个其他原始数据与该原始数据的标签相似度来确定该其他原始数据是否是该原始数据的相关数据;针对每个原始数据,计算该原始数据与每个其他原始数据在原始特征向量空间中的特征相似度;针对每个原始数据,基于该原始数据的每个相关数据与该原始数据的特征相似度,在该原始数据的相关数据中选择该原始数据的多个近邻相关数据;以每个原始数据和该原始数据的近邻相关数据作为节点,在对应于该原始数据与该原始数据的每个近邻相关数据的节点之间形成边,并且为每个边设定大于等于零的权重,从而形成近邻相关图;并且求解目标变换矩阵并根据所述目标变换矩阵对所述多个原始数据进行特征变换,其中,所述目标变换矩阵代表使得目标函数得到最大值的线性变换,所述目标函数与所述近邻相关图中的全部边在经过所述线性变换的特征空间中的加权长度之和负相关,使得特征变换后的近邻相关图中各个近邻相关数据之间的加权距离被拉近。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1