棉花异性纤维目标图像的特征选择方法和系统的制作方法

文档序号:6151461阅读:251来源:国知局
专利名称:棉花异性纤维目标图像的特征选择方法和系统的制作方法
技术领域
本发明涉及模式识别和机器视觉领域,特别涉及一种棉花异性纤维目 标图像的特征选择方法和系统。
背景技术
棉花异性纤维是指在棉花采摘、摊晒、收购等过程中混入棉花中的对 棉花及其制品的质量有严重影响的非棉纤维和色纤维,主要包括丙纶丝、 麻绳和头发等。异性纤维在皮棉中的含量虽少,但对棉纺织品的质量影响 严重, 一旦混入并参与纺织将影响纱线强力,且在染色时影响着色,会对 棉纺织工业造成重大经济损失。
目前可以通过挑拣异性纤维的方法降低棉花异性纤维的含量,或者将 棉花生产的样品进行取样后送到纤维检验机构分析确定异性纤维的含量。 但是,根据很多棉花行业专家的一致观点,应该从源头抓起,切断异性纤 维混入的途径,让棉农、棉花收购和加工企业都自觉地防范异性纤维混入。 而这关键是需要在籽棉收购或交易环节中快速准确地分析籽棉中的异性 纤维含量,给销售的籽棉分等定级,并按等级定价,这样就可以促使棉花 销售者自觉地降低棉花中异性纤维的含量。如果要实现在籽棉收购或交易 环节快速准确地确定籽棉中的异性纤维含量,其基础和关键是将异性纤维 快速分类,而从棉花异性纤维目标图像的原始特征集合中选择出最有分类 价值的最优特征子集则是异性纤维实现正确快速分类的前提和保障。
发明人在实现本发明的过程中发现,现有技术的特征选择方法至少存
在如下技术缺陷特征选择方法中的两个关键技术"搜索策略"和"评价函数"存在计算量大等缺陷。其中,搜索策略中的遗传算法试图通过随机
性来避免陷入局部最优解,并且能够以较大概率获得全局最优解;但是目 前的遗传算法还存在一些不足之处,如早熟收敛问题等,尤其是没有考虑 对棉花异性纤维目标图像中具有完全不同性质的特征进行局部化管理的 合理性和必要性。如果使用上述遗传算法的特征选择方法会使得特征选择 的效率较低,异性纤维无法实现快速正确分类,从而无法实现在籽棉收购 或交易环节快速准确地确定籽棉中的异性纤维含量,不能通过检测籽棉中 的异性纤维含量来影响其收购价格,不能有效切断异性纤维混入的途径, 可能对棉纺织工业造成重大经济损失。

发明内容
本发明的目的是提供 一 种棉花异性纤维目标图像的特征选择方法和 系统,实现对棉花异性纤维目标图像中不同性质特征的覆盖,选择出具有 最佳分类能力的最优特征子集,以便实现异性纤维的快速正确分类。
本发明实施例提供了 一种棉花异性纤维目标图像的特征选择方法,包

步骤1、利用分段式二进制编码方案对棉花异性纤维目标图像的待选 择的颜色特征、形状特征和紋理特征进行基因编码,随机生成含有多个分 别代表不同特征子集的个体的初始种群;每个所述个体表示的特征子集均 涵盖所述颜色特征、形状特征和紋理特征;设置进化代数为0;
步骤2、计算所述初始种群中每个个体的适应度;所述适应度是按照 所述个体表示的特征子集构造的分类器的分类正确率与所述特征子集的 加权大小作差得到的;
步骤3、根据所述适应度对所述初始种群中的多个个体进行选择得到 最高适应度个体和用于遗传操作的新种群,所述遗传操作包括分段交叉和 分段变异;步骤4、在所述新种群中随机选择两个个体作为双亲个体,并根据交 叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和紋理特征的两 个子个体;并按照步骤2所述的方法计算所述两个子个体的适应度;
步骤5、对所述两个子个体分别根据变异概率进行分段变异,产生涵 盖所述颜色特征、形状特征和紋理特征的两个新一代个体并替换所述双亲 个体,并按照步骤2所述的方法计算所述两个新一代个体的适应度;重复 所述步骤4和步骤5直到所述新种群中的所有个体都进行所述遗传操作后 得到新一代种群;所述遗传操作结束后,令所述进化代数加l;
步骤6、判断所述进化代数是否达到指定的最大进化代数或者所述新 一代种群中所有个体的平均适应度的差异连续G代都小于指定的阈值T, G和T为经验常数;若是,则继续执行步骤7,否则,继续执行步骤3-步骤5;
步骤7、将所述新一代种群中具有最高适应度的个体解码,得到所述 棉花异性纤维目标图像的最优特征子集,所述最优特征子集为从所述棉花 异性纤维目标图像的待选择的颜色特征、形状特征和紋理特征中选择得到
的特征。
本发明实施例提供了 一种棉花异性纤维目标图像的特征选择系统,包 括初始化模块、适应度计算模块、比例选择模块、分段交叉模块、分段 变异模块、进化终止判断模块和最优特征子集输出模块;
所述初始化才莫块,用于利用分段式二进制编码方案对棉花异性纤维目标 图像的待选择的颜色特征、形状特征和紋理特征进行基因编码,随机生成含 有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示的特征 子集均涵盖所述颜色特征、形状特征和紋理特征;设置进化代数为0;
所述适应度计算模块,用于计算所述初始种群中每个个体的适应度; 所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率 与所述特征子集的加权大小作差得到的;所述比例选择模块,用于根据所述适应度对所述初始种群中的多个个 体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作
包括分段交叉和分段变异;
所述分段交叉模块,用于在所述新种群中随机选择两个个体作为双亲 个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征 和紋理特征的两个子个体;并调用所述适应度计算模块来计算所述两个子 个体的适应度;
所述分段变异模块,用于对所述两个子个体分别根据变异概率进行分 段变异,产生涵盖所述颜色特征、形状特征和紋理特征的两个新一代个体 并替换所述双亲个体,并调用所述适应度计算模块来计算所述两个新一代 个体的适应度;重复执行分段交叉模块和分段变异模块直到所述新种群中 的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束 后,令所述进化代数加1;
所述进化终止判断模块,用于判断所述进化代数是否达到指定的最大 进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代 都小于指定的阈值T, G和T为经验常数;若是,则执行最优特征子集输 出模块,否则,继续执行所述比例选择模块、分段交叉模块和分段变异模 块;
所述最优特征子集输出模块,用于将所述新一代种群中具有最高适应 度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最 优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特 征和紋理特征中选择得到的特征。
本发明实施例通过釆用分段式编码管理方案对不同性质的特征进行 局部化管理,并对交叉算子和变异算子进行局部化约束,解决了现有遗传 算法的特征选择方法中没有考虑对诸如棉花异性纤维目标图像具有完全 不同性质的特征进行局部化管理而使得特征选择的效率较低且容易早熟收敛的问题;能够实现对棉花异性纤维目标图像的不同性质特征的覆盖, 特征选择的效率较高。


图l为本发明实施例一提供的棉花异性纤维目标图像的特征选择方法 的流程示意图2是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法 中的分段式染色体管理方案示意图3是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法 中的分段交叉方案示意图4是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法 中的分段变异方案示意图5是本发明实施例二提供的棉花异性纤维目标图像特征选择系统的 结构示意图。
具体实施例方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 本发明实施例的棉花异性纤维目标图像的特征选择方法和系统,前提 是用户已经提供了棉花异性纤维目标图像的原始特征集,该原始特征集指 的是对棉花异性纤维目标图像进行图像处理后,得到的该目标图像的颜色 特征、形状特征和紋理特征;即本发明实施例采用的是棉花异性纤维目标 图像的图像处理结果。本发明实施例的目标是从上述的待选择的颜色特 征、形状特征和紋理特征中选择出具有最佳分类能力的颜色特征、形状特 征和紋理特征即最优特征子集,以利于后续步骤中的实现棉花异性纤维的 正确快速分类,从而快速测定棉花异性纤维的含量;即本发明实施例得到 的最优特征子集为棉花异性纤维正确快速分类提供基础。图1为本发明实施例 一提供的棉花异性纤维目标图像的特征选择方法
的流程示意图,如图l所示,本实施例主要包括以下步骤
步骤101、利用分段式二进制编码方案对棉花异性纤维目标图像的待 选择的颜色特征、形状特征和紋理特征进行基因编码并生成初始种群,该 初始种群中包括多个分别代表不同特征子集的个体,每个个体均涵盖所述 颜色特征、形状特征和紋理特征。
本实施例中的个体可也称作染色体,分段式二进制编码方案是指将整 个染色体进行分段基因编码。下面结合图2具体阐述本步骤中的分段式二 进制编码方案,图2是本发明实施例一提供的棉花异性纤维目标图像的特 征选择方法中的分段式染色体管理方案示意图,如图2所示,由于本实施 例中的棉花异性纤维目标图像的原始特征集包括颜色特征、形状特征和紋 理特征三种性质的特征,因此,本实施例中将染色体分为三个子段,第一 子段实现对颜色特征的基因编码,表示为Ci CK, K为颜色特征的个数; C产l表示第i个颜色特征被选中,C尸O表示第i个颜色特征落选。第二子段 实现对形状特征的基因编码,表示为Si-SM, M为形状特征的个数;Sj=l 表示第j个形状特征被选中,Sj-O表示第j个形状特征落选。第三子段实现 对紋理特征的基因编码,表示为T广TN, N为紋理特征的个数;T^l表示 第k个紋理特征被选中,T^O表示第k个紋理特征落选。每个子段的长度分 别等于对应特征向量的长度;整个染色体的长度等于三个染色体子段的长 度之和,亦等于原始特征空间的维数。
在对上述染色体进行分段式二进制编码的基础上,还需要进行分段式染 色体管理,该分段式染色体管理是指需要限制上述染色体中的三个分段的内 容不能全部为零来保证整个染色体能够同时涵盖颜色、形状和紋理三种特征; 从而就可以实现对多质特征空间的有效搜索。该限制条件表示为公式(1):
<formula>formula see original document page 11</formula>上述限制条件对初始种群中的染色体进行约束,也同样施加于后续步
骤104中分段交叉操作产生的新染色体和步骤105中分段变异操作产生的 新染色体;交叉和变异后产生的新染色体同样要满足分段基因不全为零的 约束条件。
上述对棉花异性纤维图像的颜色、形状和紋理特征按照不同的条件进行 编码,就可以得到多个染色体。例如,对于图2中的染色体,假设颜色特征 有4个,形状特征有3个,紋理特征有5个;如果分别只选中三个分^:中的 第一个基因,则编码后得到的染色体为"100010010000";如果分别只选中三 个分段中的第二个基因,则编码后得到的染色体为"010001001000"。同理, 可以通过随机方式得到多个染色体。上述多个染色体组成初始种群。该初始 种群的规模PopSize可以根据实际情况进行设置, 一般取20SPo/^ze^l00;并 且要求该初始种群具有单一性,即初始种群中没有完全相同的染色体,每个 染色体都分别表示不同的特征子集。
步骤102、将个体代表的特征子集构造的分类器的分类正确率与该特 征子集的加权大小作差得到特征个体的适应度。
适应度是衡量特征个体即染色体优劣的唯一指标,是根据单个染色体 中的特征子集大小及由此构造的分类器在样本数据集上的分类正确率确 定的。特征子集是指单个染色体中为l的基因表示的特征集合。该样本数 据集也是由用户预先提供。染色体的适应度可以根据公式(2)计算得出
/(义,.W(A)-丰,|.............................. (2)
上述公式(2)中,《为个体/所表示的特征子集,J(义,)为根据《构造
的分类器的分类正确率;分类器可以是任何一种分类器,如K-NN分类器、 神经网络分类器、模糊分类器等;Ix,l为特征个体/所表示的特征子集的大
小(亦即染色体串上"1"的个数);w为权值(o^w<i )。
步骤103、根据个体的适应度对初始种群中的个体进行比例选择得出包括部分个体的新种群,该新种群用于后续的遗传操作。选择操作使得适 应度高的个体可能被选择多次,而适应度低的个体可能一次也没选中,但 选出的新个体数目不变,因此新种群的规模仍然等于原始种群的规模。
本步骤是用于选择可以保留下来的个体。根据精英策略将具有最高适
应度的个体直接保留到下一代,作为新一代种群中的染色体;轮盘赌法则 是根据染色体的选中概率进行选择,使适应度高的个体能以较高的概率被 选中以便进行遗传操作,体现了优胜劣汰的进化法则。其中选中概率与染 色体的适应度具有公式(3)所示的关系
尸从)S /(D.............................. (3)
其中,Po/^fee为当前种群大小,《(A)为染色体!'的选中概率。 步骤104、在选出的新种群中随机选择两个个体作为双亲并根据交叉 概率进行分段交叉,产生涵盖所述颜色特征、形状特征和紋理特征的两个 子个体,并按照步骤102所述的方法计算两个子个体的适应度。
在新种群中通过对两个父代染色体进行分段交叉操作,产生两个新的 染色体;产生的新染色体需要满足"染色体的每个分段上的基因都不全为 零"的约束条件。两个父代染色体的分段交叉是根据交叉概率进行交叉的, 该交叉概率是随进化代数不断变化的自适应交叉概率,其可以随着进化代 数的不断增加而逐渐变小。该自适应交叉概率可以根据公式(4) ~ (6) 进行定义
<formula>formula see original document page 13</formula>其中,《。为种群初始化时设置的交叉概率,0.4S《。20.9; g为当前进
化代数,x,、 A为两个父代染色体,/^为两个父代染色体中的较大适应 度,7为父代种群的平均适应度。
下面结合图3具体阐述本步骤中的分段交叉方案,图3是本发明实施 例一提供的棉花异性纤维目标图像的特征选择方法中的分段交叉方案示 意图,如图3所示,可以依次对染色体中的颜色特征分段、形状特征分段 和紋理特征分段进行交叉。例如,对颜色特征分段进行交叉时,对于长度 为K的颜色特征分段,首先根据颜色特征分段的长度产生一个1 ~ "K- 1" 之间的一个随机数a;然后对两个父代染色体的颜色特征分段在第a位以 交叉概率P。做单点交叉;最后判断交叉后的新的颜色特征分段上的基因是 否全部为0,如果是,则釆用随机反转该颜色特征分段中某个基因的方式 进行修正,例如将第a位基因置为"1",如果不全部为0,则进入下一分 段,开始依次对形状特征分段和紋理特征分段进行交叉操作,操作原理同 颜色特征分段,在此不再赘述。
步骤105、分别对步骤104产生的两个子个体根据变异概率进行分段 变异,产生涵盖所述颜色特征、形状特征和紋理特征的两个新一代个体并 替换步骤104选出的双亲,并按照步骤102的方法计算两个新一代个体的 适应度;重复步骤103- 105直到所有个体完成遗传操作,此时,该新种 群为新一代种群,进化代数加l。
对分段交叉后的两个子代个体分别进行分段变异操作,产生两个新一 代染色体;产生的新染色体需要满足"染色体的每个分段上的基因都不全 为零"的约束条件。对两个子代染色体的分段变异是根据变异概率进行变 异的,该变异概率是随进化代数不断变化的自适应变异概率,其可以随着 进化代数的不断增加而逐渐变小。该自适应变异概率可以根据公式(7) 进行定义尸,=
尸M。/l。g"g + l)
L "7…(7)
其中,几。为初始设置的变异概率,O.BPm。S0.25; g为当前进化代数,
/为准备进行变异操作的染色体的适应度,7为父代种群的平均适应度。
下面结合图4具体阐述本步骤中的个体分段交叉方案,图4是本发明 实施例 一 提供的棉花异'f生纤维目标图像的特征选择方法中的分段变异方 案示意图,如图4所示,可以依次并逐位对染色体中的颜色特征分段、形 状特征分段和紋理特征分段进行变异。例如,对颜色特征分段进行变异时, 可以对该颜色特征分段逐位以和克率Pm进行位取反才喿作,例如图4中对颜 色特征分段的第3位和第5位进行了位取反操作;然后判断变异后的新的 颜色特征分段上的基因是否全部为0,如果是,则重新进行变异运算,对 该颜色特征分段再次逐位以概率Pm进行位取反操作,直到变异成功,即 新颜色特征分段上的基因不全部为0。然后可以进入下一分段,开始依次 对形状特征分段和紋理特征逐位进行位取反操作,操作原理同颜色特征分 段,在此不再赘述。.
步骤106、判断进化代数是否达到指定的最大进化代数或者该新一代 种群中的个体的平均适应度的差异是否连续G代都小于指定的阈值T, G 和T为经验常数;若是,则继续执行步骤107,否则,返回去重新继续执 行步骤103~步骤105;
步骤107、将新一代种群中具有最高适应度的个体解码,得到棉花异 性纤维目标图像的最优特征子集,该最优特征子集为从棉花异性纤维目标 图像的待选择的颜色特征、形状特征和紋理特征中选择得到的最具有分类 价值的特征。
本实施例通过釆用分段式编码管理方案对不同性质的特征进行局部 化管理,并对交叉算子和变异算子进行局部化约束,能够实现对不同性质特征的覆盖,减少搜索次数,加快算法收敛。
图5是本发明实施例二提供的棉花异性纤维目标图像特征选择系统的 结构示意图,如图5所示,本实施例的棉花异性纤维目标图像特征选择系 统包括初始化模块21、适应度计算模块22、比例选择模块23、分段交叉模 块24、分段变异模块25、进化终止判断模块26和最优特征子集输出模块27。
具体实施中,初始化模块21利用分段式二进制编码方案对棉花异性纤 维目标图像的待选择的颜色特征、形状特征和紋理特征进行基因编码;随 机生成含有多个分别代表不同特征子集的个体的初始种群,所述初始种群 中的每个个体均涵盖所述颜色特征、形状特征和紋理特征;此外,还可以 设置初始化进化代数、交叉概率、变异概率等参数;
适应度计算模块22将个体表示的特征子集构造的分类器的分类正确 率与特征子集的加权大小作差得到所述个体的适应度;
比例选择模块23,根据适应度计算模块22得到的个体的适应度对初 始种群中的个体进行比例选择得到用于遗传操作的新种群;利用精英策略 将具有最高适应度的个体直接保留到下 一代而无须进行遗传操作;
分段交叉模块24在比例选择模块23得到的新种群中随机选择两个个 体作为双亲染色体并根据交叉概率进行分段交叉,产生涵盖所述颜色特 征、形状特征和紋理特征的两个子个体,并计算所述两个子个体的适应度;
分段变异模块25分别对分段交叉模块24得到的两个子个体根据变异概 率进行分段变异,产生涵盖所述颜色特征、形状特征和紋理特征的两个新一 代个体并替换双亲染色体,计算两个新一代个体的适应度;当所述新种群中 的所有个体都完成了遗传操作后,便完成了一代进化,令进化代数加l;
进化终止判断模块26判断完成了本次进化的新一代种群是否符合进 化终止条件,该进化终止条件包括达到指定的最大进化代数或者新一代种 群中的特征个体的平均适应度的差异连续G代都小于指定的阔值T, G和 T为经验常数;最优特征子集输出模块27在进化终止判断模块26判断新一代种群符 合进化终止条件时,将新一代种群中具有最高适应度的个体解码,得到棉 花异性纤维目标图像中的最优特征子集,该最优特征子集为从棉花异性纤 维目标图像的待选择的颜色特征、形状特征和紋理特征中选择得到的最具 有分类价值的特征。
在上述方案的基础上,进一步的,比例选择模块23包括精英策略 单元,用于将具有最高适应度的个体直接作为新一代种群中的个体;轮盘 赌法则单元,用于结合所述个体的选中概率选择部分个体组成新种群以便 进行后续的遗传操作,所述选中概率与所述个体的适应度成正比。
进一步的,分段交叉模块24包括第一修正单元,用于在产生不涵盖所 述颜色特征、形状特征和/或紋理特征的子个体时,采用随机反转所述子个 体中某个基因的方式进行修正,以使得所述子个体涵盖所述颜色特征、形 状特征和紋理特征。
进一步的,分段变异模块25包括第二修正单元,用于在产生不涵盖所 述颜色特征、形状特征和/或紋理特征的新一代个体时,重新对所述新一代 个体根据变异概率进行分段变异,直至所述新一代个体涵盖所述颜色特 征、形状特征和紋理特征。
本实施例通过采用分段式编码管理方案对不同性质的特征进行局部 化管理,并对交叉算子和变异算子进行局部化约束,能够实现对不同性质 特征的覆盖,减少搜索次数,加快算法收敛,选择出具有最佳分类能力的 最优特征子集,以便实现异性纤维的快速正确分类。
最后应说明的是以上实施例仅用以说明本发明的技术方案而非对其进 行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技 术人员应当理解其依然可以对本发明的技术方案进行修改或者等同替换, 而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的 并奇神和范围。
权利要求
1、一种棉花异性纤维目标图像的特征选择方法,其特征在于,包括步骤1、利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码,随机生成含有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示的特征子集均涵盖所述颜色特征、形状特征和纹理特征;设置进化代数为0;步骤2、计算所述初始种群中每个个体的适应度;所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率与所述特征子集的加权大小作差得到的;步骤3、根据所述适应度对所述初始种群中的多个个体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作包括分段交叉和分段变异;步骤4、在所述新种群中随机选择两个个体作为双亲个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体,并按照步骤2所述的方法计算所述两个子个体的适应度;步骤5、对所述两个子个体分别根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换所述双亲个体,并按照步骤2所述的方法计算所述两个新一代个体的适应度;重复所述步骤4和步骤5直到所述新种群中的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束后,令所述进化代数加1;步骤6、判断所述进化代数是否达到指定的最大进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代都小于指定的阈值T,G和T为经验常数;若是,则继续执行步骤7,否则,继续执行步骤3~步骤5;步骤7、将所述新一代种群中具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的特征。
2、 根据权利要求l所述的棉花异性纤维目标图像的特征选择方法,其 特征在于,所述步骤3包括根据精英策略选择具有最高适应度的个体直接作为所述新一代种群 中的个体;根据轮盘赌法则结合所述个体的选中概率选出用于遗传操作的 新种群,所述选中和克率与所述个体的适应度成正比。
3、 根据权利要求l所述的棉花异性纤维目标图像的特征选择方法,其概率,所述交叉概率随着进化代数的不断增加而逐渐变小。
4、 根据权利要求l所述的棉花异性纤维目标图像的特征选择方法,其 特征在于,所述步骤5中的变异概率为随进化代数不断变化的自适应变异 概率,所述变异概率随着进化代数的不断增加而逐渐变小。
5、 根据权利要求l所述的棉花异性纤维目标图像的特征选择方法,其 特征在于,所述步骤4还包括若产生不涵盖所述颜色特征、形状特征和/或紋理特征的个体,则采用 随机反转所述个体中某个基因的方式进行修正,以使得所述个体涵盖所述 颜色特征、形状特征和统理特征。
6、 根据权利要求l所述的棉花异性纤维目标图像的特征选择方法,其 特征在于,所述步骤5还包括若产生不涵盖所述颜色特征、形状特征和/或紋理特征的个体,则重新 对所述个体根据变异概率进行分段变异,直至所述个体涵盖所述颜色特 征、形状特征和纟丈理特征。
7、 一种棉花异性纤维目标图像的特征选择系统,其特征在于,包括: 初始化模块、适应度计算模块、比例选择模块、分段交叉模块、分段变异 模块、进化终止判断模块和最优特征子集输出模块;所述初始化模块,用于利用分段式二进制编码方案对棉花异性纤维目 标图像的待选择的颜色特征、形状特征和紋理特征进行基因编码,随机生成含有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示 的特征子集均涵盖所述颜色特征、形状特征和紋理特征;设置进化代数为 0;所述适应度计算模块,用于计算所述初始种群中每个个体的适应度; 所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率 与所述特征子集的加权大小作差得到的;所述比例选择模块,用于根据所述适应度对所述初始种群中的多个个 体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作 包括分段交叉和分段变异;所述分段交叉模块,用于在所述新种群中随机选择两个个体作为双亲 个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征 和紋理特征的两个子个体;并调用所述适应度计算模块来计算所述两个子 个体的适应度;所述分段变异模块,用于对所述两个子个体分别根据变异概率进行分 段变异,产生涵盖所述颜色特征、形状特征和紋理特征的两个新一代个体 并替换所述双亲个体,并调用所述适应度计算模块来计算所述两个新一代 个体的适应度;重复执行分段交叉模块和分段变异模块直到所述新种群中 的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束后,令所述进化代数加1;所述进化终止判断模块,用于判断所述进化代数是否达到指定的最大 进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代 都小于指定的阈值T, G和T为经验常数;若是,则执行最优特征子集输 出模块,否则,继续执行所述比例选择模块、分段交叉模块和分段变异模 块;所述最优特征子集输出模块,用于将所述新一代种群中具有最高适应 度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最 优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特 征和紋理特征中选择得到的特征。
8、 根据权利要求7所述的棉花异性纤维目标图像的特征选择系统, 其特征在于,所述比例选择模块包括精英策略单元,用于选择具有最高适应度的个体并直接作为所述新一 代种群中的个体;轮盘赌法则单元,用于结合所述个体的选中概率选择用于遗传操作的 新种群,所述选中^t率与所述个体的适应度成正比。
9、 根据权利要求7所述的棉花异性纤维目标图像的特征选择系统, 其特征在于,所述分段交叉模块包括第一修正单元,用于在产生不涵盖所述颜色特征、形状特征和/或紋理 特征的个体时,采用随机反转所述个体中某个基因的方式进行修正,以使 得所述个体涵盖所述颜色特征、形状特征和紋理特征。
10、 根据权利要求7所述的棉花异性纤维目标图像的特征选择系统, 其特征在于,所述分段变异模块包括第二修正单元,用于在产生不涵盖所述颜色特征、形状特征和/或紋理 特征的个体时,重新对所述个体根据变异概率进行分段变异,直至所述个 体涵盖所述颜色特征、形状特征和紋理特征。
全文摘要
本发明公开了一种棉花异性纤维目标图像的特征选择方法及系统。其中方法包括利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码并随机生成初始种群;计算所述初始种群中个体的适应度;根据所述适应度对所述初始种群进行选择得出新种群;对所述新种群中的个体进行分段交叉和变异产生新个体并替换原个体,计算新个体的适应度;判断是否符合终止条件;在符合终止条件时,将具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集。本发明实现了对棉花异性纤维目标图像中不同性质特征的覆盖,选择出具有最佳分类能力的最优特征子集,利于后续实现异性纤维的快速正确分类。
文档编号G01N21/88GK101587545SQ20091008739
公开日2009年11月25日 申请日期2009年6月19日 优先权日2009年6月19日
发明者康玉国, 李付堂, 李道亮, 杨文柱, 王金星, 魏新华 申请人:中国农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1