一种基于svm的分布式图像识别方法

文档序号:8396178阅读:272来源:国知局
一种基于svm的分布式图像识别方法
【技术领域】
[0001] 本发明属于图像的计算机分析技术的应用领域,具体涉及一种分布式环境下的图 像识别方法。
【背景技术】
[0002] SVM是一种用来解决分类和回归问题的数据挖掘技术,由于SVM方法具有许多引 人注目的优点和良好的实验性能,已成为机器学习研究领域的热点,并已取得了良好的效 果,如文本分类、手写识别、图像分类及识别等。
[0003] 在许多实际应用中,数据本身是分布的,它们之间除了通过网络传递信息外,其它 资源全部独立,分布式图像识别是分布式数据挖掘技术中的一个重要研究分支,它旨在通 过分布环境下的训练图像样本数据集来构造分类函数或分类器,并利用该分类函数或分类 器来识别待测图像的类别。为解决训练图像样本分布情况下的图像识别问题,一个可行 的解决方案是将这些数据集集中到某一台机器上,再利用算法SVM来构造分类器,或利用 MapReduce编程模型来构造分布环境下的分类器。一般情况下,此类思想至少存在两个方面 的问题,一是需要设置一台性能较(很)高的计算机来存储并处理这些大容量的数据,二是 在很多情况下,出于对数据安全性和隐私性的考虑,数据的集中是不可能的。对此,本发明 提出了一种基于SVM的分布式图像识别方法,该方法通过发现分布环境下训练图像样本数 据集中所隐含的分类器,由此实现图像的自动识别。

【发明内容】

[0004] 本发明的目的是提供一种训练图像样本分布式情况下对图像进行识别的方法,该 方法可以快速地构造线性分类器,实现准确高效的图像识别功能。
[0005] 本发明的技术方案是:一种基于SVM的分布式图像识别方法,包括:内积计算、最 优问题求解和图像识别步骤,其特征在于:所述内积计算、最优问题求解和图像识别步骤包 括:
[0006] 步骤1图像样本数据集的准备和预处理,各站点分别完成训练图像样本数据集的 准备、格式转换、尺度归一化、去噪、增强工作;
[0007] 步骤2图像分割,各站点采用基于密度聚类的图像分割方法分别识别出每幅训练 图像的待识别区域;
[0008] 步骤3特征提取,各站点分别提取每幅训练图像中待识别区域的特征,构造各站 点的训练图像样本数据集DBp i = 1,2,. . .,k。所述训练图像样本集DBi中各样本的表示 为Oq,x2,……,x p,y),其中P为非类别属性个数,Xl,x2,……,xp为非类别属性,y为 类别属性,y的值为1或-1,分别表示两类情况。
[0009] 步骤4最优分类函数f(x)的构造;
[0010] 步骤5图像的识别。
[0011]所述步骤4最优分类函数f(x)的构造的具体步骤包括:
[0012] 步骤4. 1初始化,其包括:
[0013]步骤4. 1. 1选择一台独立计算机作为主机(记为站点S),该机用来计算内积以及 求解最优化问题;
[0014] 步骤4. 1. 2设定主机两个内存块的大小,分别用来接收两个站点的数据;
[0015] 步骤4. 2内积计算,其包括:
[0016] 步骤4. 2. 1主机请求各站点发送训练图像样本;
[0017] 步骤4. 2. 2计算内积;
[0018] 步骤4. 3最优解的求解(主机完成),其包括:
[0019]步骤4. 3. 1求数学模型为(1)式的最优解;
[0020]
【主权项】
1. 一种基于SVM的分布式图像识别方法,包括:内积计算、最优问题求解和图像识别步 骤,其特征在于:所述内积计算、最优问题求解和图像识别步骤包括: 步骤1图像样本数据集的准备和预处理,各站点分别完成训练图像样本数据集的准 备、格式转换、尺度归一化、去噪、增强工作; 步骤2图像分割,各站点采用基于密度聚类的图像分割方法分别识别出每幅训练图像 的待识别区域; 步骤3特征提取,各站点分别提取每幅训练图像中待识别区域的特征,构造各站点的 训练图像样本数据集DBi,i= 1,2,. ..,k。所述训练图像样本集DBi中各样本的表示为(X1, x2,......,xp,y),其中P为非类别属性个数,Xl,x2,......,Xp为非类别属性,y为类别属 性,y的值为1或-1,分别表示两类情况; 步骤4最优分类函数f(X)的构造; 步骤5图像的识别。
2. 根据权利要求1所述的一种基于SVM的分布式图像识别方法,其特征在于:所述步 骤4的具体步骤包括: 步骤4. 1初始化,其包括: 步骤4.I. 1选择一台独立计算机作为主机(记为站点S),该机用来计算内积以及求解 最优化问题; 步骤4. 1. 2设定主机两个内存块的大小,分别用来接收两个站点的数据; 步骤4. 2内积计算,其包括: 步骤4. 2. 1主机请求各站点发送训练图像样本; 步骤4. 2. 2计算内积; 步骤4. 3最优解的求解(主机完成),其包括: 步骤4. 3. 1求数学模型为(1)式的最优解;
s.t.Yi ((w.Xi)+b) ^ 1 步骤4. 3. 2将(1)式转化为求式(2)Lagrange函数的鞍点;
步骤4. 3. 6计算b,选择不为O的af,代入af+6)-1) =O,得到b。
3. 根据权利要求1所述的一种基于SVM的分布式图像识别方法,其特征在于:所述步 骤5的具体步骤包括: 步骤5. 1待识别图像的准备和预处理,包括格式转换、尺度归一化、去噪、增强; 步骤5. 2主机采用基于密度聚类的图像分割方法识别出待识别图像的待识别区域; 步骤5. 3提取出待识别图像的待识别区域特征; 步骤5. 4根据步骤5. 3所述的待识别区域特征xt = (xtl,xt2,......,xtp)计算f(xt); 步骤5. 5根据f(Xt)决定待识别图像的类别。
【专利摘要】本发明公开了一种基于SVM的分布式图像识别方法,该方法包括分布图像样本的预处理、图像分割、特征提取、内积计算、最优问题求解和图像识别;该方法可以识别出训练图像样本分布情况下待识别图像的类别,并就识别过程中线性分类器的构造给出了相应的解决方案,提出了一种基于SVM的分布式图像识别方法,该方法可确保各站点数据不在其他站点驻留,保证了数据的安全和隐私性,同时有着较高的识别准确率。
【IPC分类】G06K9-62
【公开号】CN104715258
【申请号】CN201310687112
【发明人】朱玉全, 陈耿, 孙蕾, 耿霞, 彭晓冰
【申请人】镇江金全软件有限公司
【公开日】2015年6月17日
【申请日】2013年12月17日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1