一种基于稀疏表示和判决分析的数码球识别方法

文档序号：6541634阅读：265来源：国知局

专利名称：一种基于稀疏表示和判决分析的数码球识别方法
一种基于稀疏表示和判决分析的数码球识别方法技术领域
本发明属于图像稀疏表示和概率计算领域，具体是涉及一种基于稀疏表示和判决分析的数码球识别方法。
背景技术：
传统的字符识别都是在平面上操作的，但如果把这些平面操作的方法用于曲面，就会出现很多问题。但是我们生活中的很多东西并不仅仅是平面上的识别，对于曲面甚至不规则图形上的识别是个很有意义又很实用的方法。数码球是一种在它表面上印有唯一数字的球，因此我们需要一种新的方法来识别球面上的数字信息。我们先实现静止图片的识别，然后对高速运动的数码球进行连续拍摄，再进行识别，这是个很有挑战性也很有工业价值的问题。
由于是球面上操作的，所以先要检测到圆，然后定位数字，接着把数字信息表示出来，最主要的还是识别这个数字信息。然而，因为数码球存在着三维旋转，不同视角等问题，所以导致了不同的观测结果。此外，通过单个相机，我们只能得到数码球的部分信息，不能得到完整的球面信息用于识别。最后，当图片中存在多个数码球的时候，我们如何准确定位和去除那些错误定位的圆很重要。所以我们提出了用稀疏表达和多次概率分布的测量来实现球面数字的识别。
近年来，稀疏表达在机器学习和模式识别中应用的越来越多了。尤其对于处理高维数据，稀疏的方法很有效。基于稀疏表达这个技术，每个样本都可以表达为训练数据的稀疏线性组合。当这个优化表示足够稀疏时，基于凸优化的算法能够有效用于解决该问题。比较有名的稀疏表达方法有lasso，弹性网(elastic net)和非负方法(normegative garrote)。该发明中，就是用这三种方法来表达数码球的信息用于分类的。
在表示了数码球的信息后，接着就是分类了。一直以来，分类都是机器学习中的重点，分类的方法也是多种多样的。在机器学习提出来之前，主要的分类方法是相关。随着机器学习的广泛兴起，有越来越多的分类方法了，如PCA(Shlens Jonathon, A Tutorial on Principal Component Analysis. Systems Neurobiology Laboratory, Salk Insitute for Biological Studies, 2009), Fisher 判决(Fisher, Ronald A. , The use of multiple measurements intaxonomic problems. Annals Eugen. ,1936.),线性判别分析(LDA) (R. Duda, P. Hart, and D.Stork, Pattern classification,2rd ed. ffiley-Interscience, 2000)。本发明利用多次测量和概率方法来进行分类，通过单次甚至多次的后验判决方法达到不错的数码球识别率。发明内容
本发明提供了一种基于稀疏表示和判决分析的数码球识别方法，该方法识别能力强，识别效果好。
—种基于稀疏表示和判决分析的数码球识别方法，包括4
(1)把数码球集合中的每一个数码球单独放置在单色背景下，利用单摄像头连续采集单幅或多幅图像，自动定位每幅图像中的数码球并提取视觉特征，并对所有的视觉特征建立稀疏表达，形成训练样本特征集合；
(2)把待识别的一个或多个数码球放置在同样的场景中，采集单幅或多幅图像，对每幅图像中的所有数码球自动定位并提取子图像；对单幅或者多幅图像中对应同一数码球的子图像提取视觉特征，并利用训练样本特征集合建立该子图像的稀疏表达；
(3)采用判决分析方法进行识别，得到测试图像所属的类别，其中对于多幅图像的情况，采用联合后验判决的方法实现。
所述的步骤(1)中形成训练样本特征集合的方法为在单色背景下用单摄像头连续采集单幅或多幅图像，每幅图中只有一个数码球，形成训练样本集合，定位图像中的球并提取视觉特征，建立训练样本集合的稀疏表达把数码球集合中的每一个数码球，单独放置在单色背景(如黑色)下，利用单摄像头连续采集单幅或多幅图像作为训练样本集合，每次获得的图像都是单视角的，具体步骤如下
(a)对采集的图像做预处理，使用Carmy算子进行边缘检测，得到二值化图像，接着给出圆的大致半径，使用霍夫变换或外接圆构造匹配的方法定位每幅图中的数码球位置；
(b)在每幅数码球图片上找到感兴趣的信息区域，检测并提取该兴趣区域(黄同同，数码球的快速检测与识别。浙江大学计算机学院计算机软件与理论，2010)，最后对该兴趣区域进行坐标轴变换，用极坐标形式进行特征提取和表示，其流程如下检测出数码球图片上的椭圆，然后将椭圆移到中心，旋转和重投影这椭圆，对椭圆进行二值化，从二值化图像转换得到极坐标图像；
(C)最后将来自第i类的Iii幅练图片构成矩阵Α/ =] G，其中、，j = 1，2，...叫是由每幅图像构成的列向量，每个元素都标准化为单位的I2范数，所有K个类的训练图片组合成一个训练样本矩阵A = [A1, A2, ... , AJ，即为训练样本特征集合。
所述的步骤O)中对每幅图像中的所有数码球自动定位并提取子图像的过程为
(a)对输入的测试图像A进行预处理，使用Carmy算子进行边缘检测，得到二值化图像；
(b)把二值化后的图像中的所有点都保存下来，以所有的非零点为中心，球的半径为半径，把该区域内的所有点都加1，再标准化该边缘直方(c)遍历标准化边缘直方图中所有的点，估计出所有圆的中心并保存下来；
(d)以每个圆心信息为中心，以球的半径为半径，提取出测试图片所有的感兴趣区域并以图片方式保存下来，输出得到所有感兴趣区域的子图像A= (A1, A2, ...An}，即测试图像的子图像。
多球检测的实施算法如下
输入单幅测试图像A
输出所有感兴趣区域子图像A = (A1, A2, . . . AJ
步骤1 对输入的测试图像进行预处理，使用Carmy算子进行边缘检测，得到二值化图像；
步骤2 计算二值化图像的边缘直方图，即以所有的非零点为中心，球的半径为半径，把该区域内的所有点都加1，再标准化该边缘直方步骤3 遍历图中所有的点，取那些一定区域内(大于某个设定的阈值)最大值的点为圆心并保存下来；
步骤4 以每个圆心信息为中心，以球的半径为半径，提取出测试图片所有的感兴趣区域并以图片方式保存下来。
所述的对识别单幅或者多幅图像中对应同一数码球的子图像提取视觉特征的过程为取出测试图片中的一个感兴趣区域子图像，把该兴趣区域堆成一个列向量JGM〃，用所有训练样本特征集合得到1的近似稀疏表达，即J G RP
其中，β是稀疏系数向量。理想情况下，β中除了与y所属的类i相关的系数不为零外，其它所有系数都为零。但是，通常是β的大部分非零值都集中在第i类上，小部分非零值分散在其它类上。现在的问题是如何来求得β，从而获得y的近似表达。我们可以用下面三种方法来实现
第一禾中方法是用 Iasso 算法(R. Tibshirani, Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society, Series B, 1996.)求得稀疏系数向量β，即:
arg min\\y~xp\l+A \β\[β 2
其中，I I · I I1是I1范数，λ I I β I I1是I1惩罚项。
第二种方法是用弹性网算法(H.Zou and Τ. Hastie, Regularization and variable selection via the Elastic Net. Journal of the Royal Statistical Society, Series B, 2005.)求得稀疏系数向量β，即:
mm\h -ΦΙβ -
其中，Μ · I I2表示为一个向量的I2范数，并且|y|2 =7^。弹性网可以用 LARS(B. Efron, T. Hastie, I.Johnstone and R. Tibshirani, Least angle regression. Annals of Statistics, 2004.)方法解决。
第三禾中方法是用方法(normegative garrote) (L. Breiman, Better subset regression using the nonnegative garrote. Technometrics, 1995.)求稀疏系数向量 β，即
min Il|y-a^0I+1IHIiA > 0对于 i = 1，· · ·，η。β 2
非负方法可以用经典的数值方法有效求得，这些经典的数值方法包括最小角回归 (LARS)禾口 pathwise coordinate(J. Friedman, Τ. Hastie, H. Hofling and R. Tibshirani, Pathwise coordinate optimization. Annals OfApplied Statistics, 2007.)方法。
得到测试图片y的稀疏表达β后，接下来就是判断y属于哪个类。这个提取的特征在不同的类之间应该尽可能的不同。根据前面的稀疏表达，已经知道系数向量β的6大部分非零值主要集中于测试样本所属的类，即广.，其中，是与第i 类相关的系数向量。为了估计测试样本所属的类，我们定义了下面的后验估计(posterior estimate)
权利要求
1.一种基于稀疏表示和判决分析的数码球识别方法，包括(1)把数码球集合中的每一个数码球单独放置在单色背景下，利用单摄像头连续采集单幅或多幅图像，自动定位每幅图像中的数码球并提取视觉特征，并对所有的视觉特征建立稀疏表达，形成训练样本特征集合；(2)把待识别的一个或多个数码球放置在同样的场景中，采集单幅或多幅图像，对每幅图像中的所有数码球自动定位并提取子图像；对单幅或者多幅图像中对应同一数码球的子图像提取视觉特征，并利用训练样本特征集合建立该子图像的稀疏表达；(3)采用判决分析方法进行识别，得到测试图片所属的类别，其中对于多幅图像的情况，采用联合后验判决的方法实现。
2.根据权利要求1所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的步骤(1)中形成训练样本特征集合的方法为(a)对采集的图像做预处理，使用Carmy算子进行边缘检测，得到二值化图像，接着给出圆的大致半径，使用霍夫变换或外接圆构造匹配的方法定位每幅图中的数码球位置；(b)在每幅数码球图片上找到感兴趣的信息区域，检测并提取该区域，最后对该兴趣区域进行坐标轴变换，用极坐标形式进行特征提取和表示，其流程如下检测出数码球图片上的椭圆，然后将椭圆移到中心，旋转和重投影这椭圆，对椭圆进行二值化，从二值化图像转换得到极坐标图像；(C)最后将来自第i类的Hi幅训练图片构成矩阵A,+ ^aaaynahlGRP^，其中
3.根据权利要求1所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的步骤O)中对每幅图像中的所有数码球自动定位并提取子图像的过程为(a)对输入的测试图像A进行预处理，使用Carmy算子进行边缘检测，得到二值化图像；(b)把二值化后的图像中的所有点都保存下来，以所有的非零点为中心，球的半径为半径，把该区域内的所有点都加1，再标准化该边缘直方图；(c)遍历标准化边缘直方图中所有的点，估计出所有圆的中心并保存下来；(d)以每个圆心信息为中心，以球的半径为半径，提取出测试图片所有的感兴趣区域并以图片方式保存下来，输出得到所有感兴趣区域的子图像A= (A1, A2, ...An}，即测试图像的子图像。
4.根据权利要求1所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的对识别的单幅或者多幅图像中对应同一数码球的子图像提取视觉特征的过程为取出测试图片中的一个感兴趣区域子图像，把该兴趣区域堆成一个列向量JG ，用所有训练样本特征集合得到y的近似稀疏表达，即J A^gM〃，其中，β是稀疏系数向量。
5.根据权利要求4所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的稀疏系数向量β由lasso算法求解得到，即
6.根据权利要求4所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的稀疏系数向量β由弹性网求解得到，即
7.根据权利要求4所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的稀疏系数向量β由非负方法求解得到，即
8.根据权利要求1所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的步骤(3)中，对于单幅图像采用的识别方法为单次后验估计法，其表达式为
9.根据权利要求1所述的基于稀疏表示和判决分析的数码球识别方法，其特征在于，所述的步骤(3)中，对于多幅图像采用的识别方法为多次联合后验判决方法，其表达式为
全文摘要
本发明公开了一种基于稀疏表示和判决分析的数码球识别方法，包括把数码球集合中的每一个数码球，放置在单色背景下，利用单摄像头连续采集单幅或多幅图像，自动定位每幅图像中的数码球并提取视觉特征，并对所有的特征建立稀疏表达，形成训练样本特征集合；把待识别的一个或多个数码球放置在同样的场景中，采集单幅或多幅图像，对每幅图像中的所有数码球自动定位并提取子图像和提取子图像的视觉特征，并利用训练样本特征集合建立该子图像的稀疏表达；采用判决分析方法进行识别，其中对于多幅图像的情况，采用联合后验判决，提高识别精度。本发明充分利用稀疏表达和判决分析，应用于单色背景下的单球或多球识别，识别效果好。
文档编号G06K9/66GK102034094SQ20101058675
公开日2011年4月27日申请日期2010年12月14日优先权日2010年12月14日
发明者王东辉, 程丽莉, 邓霄申请人:浙江大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王东辉;程丽莉;邓霄
技术所有人：浙江大学
我是此专利的发明人

上一篇：一种基于局部灰度突变的红外小目标检测方法
上一篇：一种利用硬件开关保护计算机信息安全的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。