一种信息处理方法及电子设备的制造方法

文档序号:9750796阅读:170来源:国知局
一种信息处理方法及电子设备的制造方法
【技术领域】
[0001] 本发明涉及文本分类技术,尤其涉及一种信息处理方法及电子设备。
【背景技术】
[0002] 在文本分类问题中,特征是决定最终分类与预期目标相关性强弱的重要因素。因 此,提升选择出的特征与预期目标的相关性具有重要的意义。通常,确定与预期目标相关的 规则集合的方法是:根据预设规则的评价准则确定每个特征的评分,将评分从大到小排列, 将特征评分较高的前N个特征组成的集合作为规则集合。
[0003] 但是,上述方法仅凭借每个特征的评分,决定是否将该特征保留在规则集合中的 方法并不客观,因为,某些情况下,虽然特征Π 和特征f2仅按预设规则确定出的评分排名 并未在前N个排名范围内,但是,所述特征Π 和特征f2组合后得到的新的组合特征的评分 能大大提升,甚至超过排名在前N中的特征,如此,现有方法确定的规则集合与预设规则的 相关性并不是很高。

【发明内容】

[0004] 为解决现有存在的技术问题,本发明实施例提供一种信息处理方法及电子设备。
[0005] 本发明的技术方案是这样实现的:本发明提供了一种信息处理方法,应用于电子 设备中;所述方法包括:
[0006] 从待检测信息中获取N个属性信息,将所述N个属性信息作为N个第一元素形成 初始特征集合;
[0007] 根据第一预设规则对所述初始特征集合进行筛选及组合操作,得到Μ个中间特征 集合;各中间特征集合中的元素均由两个或两个以上的第一元素组合而成;
[0008] 根据第二预设规则在所述Μ个中间特征集合中确定出由一个或一个以上中间特 征集合组合而成的目标特征集合;所述第二预设规则表征所述目标特征集合中的各中间特 征集合的权重大于第一预设阈值;
[0009] 根据所述目标特征集合对所述待检测信息进行分类;
[0010] 其中,所述Ν和Μ均为大于等于1的正整数。
[0011] 本发明实施例还提供了 一种电子设备,所述电子设备包括:
[0012] 第一预设单元,用于从待检测信息中获取Ν个属性信息,将所述Ν个属性信息作为 Ν个第一元素形成初始特征集合;
[0013] 筛选及组合单元,用于根据第一预设规则对所述初始特征集合进行筛选及组合操 作,得到Μ个中间特征集合;各中间特征集合中的元素均由两个或两个以上的第一元素组 合而成;
[0014] 确定单元,用于根据第二预设规则在所述Μ个中间特征集合中确定出由一个或一 个以上中间特征集合组合而成的目标特征集合;所述第二预设规则表征所述目标特征集合 中的各中间特征集合的权重大于第一预设阈值;
[0015] 分类单元,用于根据所述目标特征集合对所述待检测信息进行分类;其中,所述N 和Μ均为大于等于1的正整数。
[0016] 采用本发明实施例所述的信息处理方法及电子设备,能够在大量信息中选取多个 单一特征,即第一元素,并根据预设规则对第一元素进行筛选和组合,组合成由两个或两个 以上的第一元素组合而成的元素;其中,由两个或两个以上的第一元素组合而成的元素可 称为组合特征;再根据多个组合特征组合成一个或一个以上的中间特征集合;其中,中间 特征集合中包括一个或一个以上的组合特征,组合特征中包括两个或两个以上的第一元 素;如此,根据预设规则,将满足预设规则的中间特征集合作为目标特征集合,以实现从待 检测信息中确定出与目标特征相关性较高的组合特征的目的。
[0017] 另外,采用本发明实施例所述的信息处理方法及电子设备,还能够协助分类设备 对大量信息进行分类,即将确定出的目标特征集合作为分类设备的输入信息,使所述分类 设备根据所述目标特征集合对信息进行分类;这里,由于目标特征集合中包含中间特征集 合,中间特征集合中包含组合特征,而由于组合特征是经过筛选后得到的,组合特征的个数 远远小于单一特征的个数,因此,采用本发明实施例所述的信息处理方法及电子设备还能 够降低分类设备的运算量。
【附图说明】
[0018] 图1为本发明实施例信息处理方法的流程示意图一;
[0019] 图2为本发明实施例信息处理方法的流程示意图二;
[0020] 图3为本发明实施例信息处理方法的流程示意图三;
[0021] 图4为本发明实施例信息处理方法的流程示意图四;
[0022] 图5为本发明实施例信息处理方法的具体实现的流程示意图;
[0023] 图6为本发明实施例电子设备的结构示意图;
[0024] 图7为本发明实施例筛选及组合单元的结构示意图。
【具体实施方式】
[0025] 为了能够更加详尽地了解本发明的特点与技术内容,下面结合附图对本发明的实 现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
[0026] 实施例一
[0027] 图1为本发明实施例信息处理方法的流程示意图一,所述方法应用电子设备中, 如图1所示,所述方法包括:
[0028] 步骤101 :从待检测信息中获取Ν个属性信息,将所述Ν个属性信息作为Ν个第一 元素形成初始特征集合;
[0029] 在实际应用中,大量信息中的任一单一特征均可以作为属性信息。
[0030] 步骤102 :根据第一预设规则对所述初始特征集合进行筛选及组合操作,得到Μ个 中间特征集合;各中间特征集合中的元素均由两个或两个以上的第一元素组合而成;
[0031] 在实际应用中,对初始特征集合进行筛选,具体为对初始特征集合中的第一元素 进行筛选的目的是为了保留与目标特征相关性较高的第一元素,也即单一特征,进而将与 目标特征相关性较高的第一元素进行组合,以为确定出与目标特征相关性更高的中间特征 集合奠定基础。
[0032] 步骤103 :根据第二预设规则在所述Μ个中间特征集合中确定出由一个或一个以 上中间特征集合组合而成的目标特征集合;所述第二预设规则表征所述目标特征集合中的 各中间特征集合的权重大于第一预设阈值;
[0033] 步骤104 :根据所述目标特征集合对所述待检测信息进行分类;
[0034] 其中,所述Ν和Μ均为大于等于1的正整数。
[0035] 实际应用中,采用本发明实施例所述的信息处理方法,能够在大量信息中选取多 个单一特征,本实施例中也即第一元素,并根据预设规则将多个单一特征组合成组合特征, 本实施例中也即将初始特征集合中的第一元素根据预设规则进行筛选和组合,组合成由两 个或两个以上的第一元素组合而成的元素;此处,由两个或两个以上的第一元素组合而成 的元素即可称为组合特征;根据多个组合特征组合成一个或一个以上的中间特征集合;其 中,中间特征集合中包括一个或一个以上的组合特征,组合特征中包括两个或两个以上的 第一元素;如此,根据预设规则,将满足预设规则的中间特征集合作为目标特征集合;所述 目标特征集合即为与目标特征相关性较高的组合特征对应的集合。
[0036] 在一实现方式中,可以将第一元素的个数相同的组合特征组合成中间特征集合, 以得到多个中间特征集合;具体地,第一中间特征集合中包含的每个组合特征均包含有两 个第一元素;第二中间特征集合中包含的每个组合特征均包含有三个第一元素,依次类推, 使中间特征集合的组合特征中第一元素的个数逐个递增,如此,能够实现下一个中间特征 集合与目标特征集合的相关性高于上一个中间特征集合与目标特征集合的相关性,以实现 递进式确定中间特征集合的目的。
[0037] 在一实现方式中,可以将第一中间特征集合中的组合特征作为基础,根据预设规 贝1J,将第一中间特征集合中的组合特征进行组合,得到第二中间特征集合中的各组合特征, 由于第一中间特征集合中的组合特征是经过筛选后得到的,即第一中间特征集合中的每一 个组合特征均经过筛选,均符合预设规则,也就是说,第一中间特征集合中的每一个组合特 征均是根据预设规则从大量信息中确定出的、与目标特征相关性较高的组合特征,因此,将 第一中间特征集合中的组合特征进行组合后得到的组合特征作为第二中间特征集合的组 合特征,能够实现逐层向目标特征靠近的目的,也就是说,第一中间特征集合、第二中间特 征集合直至最后一个中间特征集合,与目标特征的相关性逐个增加,如此,能够为最终确定 目标特征集合奠定基础。
[0038] 实际应用中,组合特征与目标特征相关性的判断方法、以及中间特征集合与目标 特征相关性的判断方法均可以通过信息熵来实现;具体地,计算组合特征的信息熵,本实施 例中也即权重,根据预设规则,大于阈值的信息熵对应的组合特征即为与目标特征相关性 较高的组合特征;同理,计算中间特征集合的信息熵,本实施例中也即权重,根据预设规则, 大于阈值的信息熵对应的中间特征集合即为与目标特征相关性较高的组合特征,进而根据 信息熵的大小,将中间特征集合从大到小排列,并根据预设规则,将信息熵小于等于阈值的 中间特征集合去除,则剩余的中间特征集合即为目标特征集合;这里,信息熵越大,信息熵 对应的组合特征或中间特征集合与目标特征的相关性越高。
[0039] 另外,采用本发明实施例所述的信息处理方法,还能够协助分类设备对大量信息 进行分类;即将确定出的目标特征集合作为分类设备的输入信息,使所述分类设备根据所 述目标特征集合对信息进行分类;这里,由于目标特征集合中包含中间特征集合,中间特征 集合中包含组合特征,而由于组合特征是经过筛选后得到的,组合特征的个数远远小于单 一特征的个数,因此,采用本发明实施例所述的信息处理方法还能够降低分类设备的运算 量;在实际应用中,可以根据分类设备的运算量,确定目标特征集合中的中间特征集合的个 数,以将分类设备的运算量控制在能力范围之内。
[0040] 实施例二
[0041] 图2为本发明实施例信息处理方法的流程示意图二;所述方法应用电子设备中, 如图2所示,所述方法包括:
[0042] 步骤201 :从待检测信息中获取N个属性信息,将所述N个属性信息作为N个第一 元素形成初始特征集合;其中,所述N为大于等于1的正整数;
[0043] 在实际应用中,大量信息中的任一单一特征均可以作为属性信息;例如,从大量信 息中确定出5个属性信息,分别为??、Π 、f2、f3和f4 ;本实施例中,所述f0、fl、f2、f3和 f4均称为第一元素,将所述f0、f 1、f2、f3和f4组合成的集合称为初始特征集合F0。
[0044] 步骤202 :确定第一预设规则,所述第一预设规则中设置有第二预设阈值和组合 规则;
[0045] 步骤203 :将所述初始特征集合中权重小于所述第二预设阈值的第一元素移除;
[0046] 分别计算初始特征集合F0中的第一元素 fO、fl、f2、f3和f4的信息熵,将信息熵 小于第二预设阈值的第一元素移除,例如,当f2、f3和f4的信息熵均小于第二预设阈值时, 从所述初始特征集合中移除第一元素 f2、f3和f4。
[0047] 步骤204 :根据所述组合规则,将所述初始特征集合中剩余第一元素中的任一第 一元素分别与所述初始特征集合中除自身之外的其他第一元素组合,得到
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1