一种基于svm的分布式图像识别方法

文档序号：8396178阅读：272来源：国知局

一种基于svm的分布式图像识别方法
【技术领域】
[0001] 本发明属于图像的计算机分析技术的应用领域，具体涉及一种分布式环境下的图像识别方法。
【背景技术】
[0002] SVM是一种用来解决分类和回归问题的数据挖掘技术，由于SVM方法具有许多引人注目的优点和良好的实验性能，已成为机器学习研究领域的热点，并已取得了良好的效果，如文本分类、手写识别、图像分类及识别等。
[0003] 在许多实际应用中，数据本身是分布的，它们之间除了通过网络传递信息外，其它资源全部独立，分布式图像识别是分布式数据挖掘技术中的一个重要研究分支，它旨在通过分布环境下的训练图像样本数据集来构造分类函数或分类器，并利用该分类函数或分类器来识别待测图像的类别。为解决训练图像样本分布情况下的图像识别问题，一个可行的解决方案是将这些数据集集中到某一台机器上，再利用算法SVM来构造分类器，或利用 MapReduce编程模型来构造分布环境下的分类器。一般情况下，此类思想至少存在两个方面的问题，一是需要设置一台性能较（很）高的计算机来存储并处理这些大容量的数据，二是在很多情况下，出于对数据安全性和隐私性的考虑，数据的集中是不可能的。对此，本发明提出了一种基于SVM的分布式图像识别方法，该方法通过发现分布环境下训练图像样本数据集中所隐含的分类器，由此实现图像的自动识别。

【发明内容】

[0004] 本发明的目的是提供一种训练图像样本分布式情况下对图像进行识别的方法，该方法可以快速地构造线性分类器，实现准确高效的图像识别功能。
[0005] 本发明的技术方案是：一种基于SVM的分布式图像识别方法，包括：内积计算、最优问题求解和图像识别步骤，其特征在于：所述内积计算、最优问题求解和图像识别步骤包括：
[0006] 步骤1图像样本数据集的准备和预处理，各站点分别完成训练图像样本数据集的准备、格式转换、尺度归一化、去噪、增强工作；
[0007] 步骤2图像分割，各站点采用基于密度聚类的图像分割方法分别识别出每幅训练图像的待识别区域；
[0008] 步骤3特征提取，各站点分别提取每幅训练图像中待识别区域的特征，构造各站点的训练图像样本数据集DBp i = 1，2,. . .，k。所述训练图像样本集DBi中各样本的表示为Oq，x2,……，x p，y)，其中P为非类别属性个数，Xl，x2,……，xp为非类别属性，y为类别属性，y的值为1或-1，分别表示两类情况。
[0009] 步骤4最优分类函数f(x)的构造；
[0010] 步骤5图像的识别。
[0011]所述步骤4最优分类函数f(x)的构造的具体步骤包括：
[0012] 步骤4. 1初始化，其包括：
[0013]步骤4. 1. 1选择一台独立计算机作为主机（记为站点S)，该机用来计算内积以及求解最优化问题；
[0014] 步骤4. 1. 2设定主机两个内存块的大小，分别用来接收两个站点的数据；
[0015] 步骤4. 2内积计算，其包括：
[0016] 步骤4. 2. 1主机请求各站点发送训练图像样本；
[0017] 步骤4. 2. 2计算内积；
[0018] 步骤4. 3最优解的求解（主机完成），其包括：
[0019]步骤4. 3. 1求数学模型为（1)式的最优解；
[0020]
【主权项】
1. 一种基于SVM的分布式图像识别方法，包括：内积计算、最优问题求解和图像识别步骤，其特征在于：所述内积计算、最优问题求解和图像识别步骤包括：步骤1图像样本数据集的准备和预处理，各站点分别完成训练图像样本数据集的准备、格式转换、尺度归一化、去噪、增强工作；步骤2图像分割，各站点采用基于密度聚类的图像分割方法分别识别出每幅训练图像的待识别区域；步骤3特征提取，各站点分别提取每幅训练图像中待识别区域的特征，构造各站点的训练图像样本数据集DBi,i= 1，2，. ..，k。所述训练图像样本集DBi中各样本的表示为（X1, x2,......，xp，y)，其中P为非类别属性个数，Xl，x2,......，Xp为非类别属性，y为类别属性，y的值为1或-1，分别表示两类情况；步骤4最优分类函数f(X)的构造；步骤5图像的识别。
2. 根据权利要求1所述的一种基于SVM的分布式图像识别方法，其特征在于：所述步骤4的具体步骤包括：步骤4. 1初始化，其包括：步骤4.I. 1选择一台独立计算机作为主机（记为站点S)，该机用来计算内积以及求解最优化问题；步骤4. 1. 2设定主机两个内存块的大小，分别用来接收两个站点的数据；步骤4. 2内积计算，其包括：步骤4. 2. 1主机请求各站点发送训练图像样本；步骤4. 2. 2计算内积；步骤4. 3最优解的求解（主机完成），其包括：步骤4. 3. 1求数学模型为（1)式的最优解；
s.t.Yi ((w.Xi)+b) ^ 1 步骤4. 3. 2将（1)式转化为求式（2)Lagrange函数的鞍点；
步骤4. 3. 6计算b，选择不为O的af，代入af+6)-1) =O，得到b。
3. 根据权利要求1所述的一种基于SVM的分布式图像识别方法，其特征在于：所述步骤5的具体步骤包括：步骤5. 1待识别图像的准备和预处理，包括格式转换、尺度归一化、去噪、增强；步骤5. 2主机采用基于密度聚类的图像分割方法识别出待识别图像的待识别区域；步骤5. 3提取出待识别图像的待识别区域特征；步骤5. 4根据步骤5. 3所述的待识别区域特征xt = (xtl，xt2,......，xtp)计算f(xt); 步骤5. 5根据f(Xt)决定待识别图像的类别。
【专利摘要】本发明公开了一种基于SVM的分布式图像识别方法，该方法包括分布图像样本的预处理、图像分割、特征提取、内积计算、最优问题求解和图像识别；该方法可以识别出训练图像样本分布情况下待识别图像的类别，并就识别过程中线性分类器的构造给出了相应的解决方案，提出了一种基于SVM的分布式图像识别方法，该方法可确保各站点数据不在其他站点驻留，保证了数据的安全和隐私性，同时有着较高的识别准确率。
【IPC分类】G06K9-62
【公开号】CN104715258
【申请号】CN201310687112
【发明人】朱玉全, 陈耿, 孙蕾, 耿霞, 彭晓冰
【申请人】镇江金全软件有限公司
【公开日】2015年6月17日
【申请日】2013年12月17日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱玉全;陈耿;孙蕾;耿霞;彭晓冰;
技术所有人：镇江金全软件有限公司;
我是此专利的发明人

上一篇：X光乳腺图像的核自适应优化分类方法
上一篇：一种图像中值滤波检测方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。