基于斜率、截距和相关系数的距离测度方法

文档序号:6561543阅读:1252来源:国知局
专利名称:基于斜率、截距和相关系数的距离测度方法
基于斜率、截距和相关系数的距离测度方法
技术领域
本发明属于数据计算和推算领域,具体是一种基于斜率、截距和相关系数的 kNN(k-Nearest Neighbor)算法的距离测度方法。
背景技术
kNN算法是一个理论上较成熟的方法,也是最简单的机器学习算法之一,已被广泛应用于分类、回归和模式识别等领域中。训练样本的特征空间及研究对象称为参照集。整个研究区的特征空间称为目标集。在kNN算法中,距离测度起到非常重要的作用,是选择目标集k个最近邻参照集的工具。对于分类,如果一个目标在特征空间中的k个最近邻的参照集大多数属于某一个类别,则该目标就被判定为这个类别。对于回归,通过距离测度找到一个目标的k个最近邻参照集,将这些近邻参照集的属性以目标集与参照集之间距离倒数为权重进行加权平均,从而得到该目标的属性。森林资源连续清查是我国实施林业可持续发展重要保障。为了提高清查效率和精度,遥感技术、全球定位系统和地理信息系统技术被广泛地应用于森林资源清查中。随着调查技术和手段的提高,kNN算法作为一种非参数估算方法,能够很好地与遥感影像结合,最先被用于芬兰国家森林资源调查中并得到高度肯定。美国明尼苏达大学(University of Minnesota)自然资源学院联合其他机构开展kNN计划,目的是研究利用卫星遥感资料、样地调查和kNN算法调查美国的森林资源。可见,kNN算法是森林资源调查中常用的估算方法之一。但是,kNN算法在像元级上的估算精度并不理想,具有较大的误差。前人的研究已提出一些改进kNN算法的方法。例如,采用遗传算法(Genetic algorithm, GA)来优化最近邻权重以及对最近邻样本重新排序和去伪最近邻样本;采用模糊距离(Fuzzy Distance, FD)确定最近邻样本。

发明内容鉴于距离测度在kNN算法中的重要地位。本发明提出一种新的距离测度,即采用参照集与目标集之间的回归斜率、截距和相关系数来确定最近邻样本。当参照集与目标集高度相似时,两者之间的回归方程将逼近于y = χ方程,即斜率、截距和相关系数分别越接近于1、0和1时,参照集与目标集越相似。解决上述技术问题的技术方案是按如下步骤进行(1)确定特征空间,提取参照集和目标集根据样地调查地理坐标,提取样地的特征空间(美国陆地卫星5号专题制图仪 (Landsat Thematic Mapper, Landsat TM)影像的1 5,7波段)并结合样地森林调查因子属性(胸径、树高、碳储量等)构建参照集,将整个研究区影像特征空间作为目标集;(2) 构造基于斜率、截距和相关系数距离测度(Slope,Intercept and Correlation Distance, SICD)
a、计算参照集与目标集特征空间之间的线性回归方程以目标集特征空间为自变量(y),参照集特征空间为因变量(X),通过最小二乘法建立目标集与每个参照集之间的回归方程yia = axja+b+ ε[1]其中为第i个目标集第1个特征空间,为第j个参照集第1个特征空间, a和b分别为斜率和截距,ε为残差;b、以三维空间点坐标表述SI⑶,即求[a,b,r]与[1,0,1]两点之间的空间欧氏距离,为了消除a、b、r之间的尺度问题,分别对其进行归一化处理,SICD计算公式
权利要求
1. 一种基于斜率、截距和相关系数的距离侧度方法,其特征是按如下步骤进行(1)确定特征空间,提取参照集和目标集根据样地调查地理坐标,提取样地的特征空间并结合样地森林调查因子属性构建参照集,将整个研究区影像特征空间作为目标集;(2)构造SI⑶距离测度a、计算参照集与目标集特征空间之间的线性回归方程以目标集特征空间为自变量 (y),参照集特征空间为因变量(X),通过最小二乘法建立目标集与每个参照集之间的回归方程yia = axja+b+ ε[1]其中=Yu为第i个目标集第1个特征空间,为第j个参照集第1个特征空间,a和 b分别为斜率和截距,ε为残差;b、以三维空间点坐标表述SI⑶,即求[a,b,r]与[1,0,1]两点之间的空间欧氏距离, 为了消除a、b、r之间的尺度问题,分别对其进行归一化处理,SI⑶计算公式
全文摘要
一种基于斜率、截距和相关系数的距离测度方法,按如下步骤进行一是确定特征空间,提取参照集和目标集,按样地地理坐标,提取样地特征空间并结合样地森林调查因子属性构建参照集,将整个研究区影像特征空间作目标集。二是构造SICD距离测度,先计算参照集和目标集特征空间之间的线性回归方程,再以三维空间点坐标表述SICD,当SICD越小时,目标集与参照集样本越相似,反之,越不相似。三是SICD距离测度的应用,计算两集的SICD并对SICD排序,选取k个距离最短的参照集,以距离倒数计算权重,权重乘以对应参照集求和得估算结果。用本方法构建的距离测度,能降低噪声影响、有效确定最近邻样本及次序,提高估算精度。
文档编号G06K9/62GK102306299SQ20111020740
公开日2012年1月4日 申请日期2011年7月22日 优先权日2011年7月22日
发明者周国模, 徐小军, 杜华强 申请人:浙江农林大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1