一种基于人工神经网络的模糊宗地地价评估方法与流程

文档序号:16901877发布日期:2019-02-19 18:05阅读:155来源:国知局
一种基于人工神经网络的模糊宗地地价评估方法与流程

本发明涉及城市和农村的宗地价格评估的技术领域,具体涉及一种基于人工神经网络的模糊宗地地价评估方法。



背景技术:

目前比较常用的宗地价格评估方法主要包括市场比较法、基准地价修正法和成本估价法等。在这些方法中,市场比较法以估价原理简单、容易理解的优点被广泛使用。市场比较法是从广泛搜集的交易实例中选取可供比较参照的交易实例,然后进行影响因素、交易状态等修正,综合评估确定待估对象估价金额。市场比较法的理论依据是替代原理,因此如何准确的选择可比案例是正确运用市场比较法的关键。

土地评估实践中评估者多是基于主观经验来选择交易案例,不仅对从业者的专业素养要求较高,且存在较大的主观随意性。针对该问题有学者提出了聚类分析、集对分析、主成分分析、灰色关联度分析、模糊数学等定量选择方法。由于交易实例选择的模糊性使得模糊数学方法受到较多学者的关注,并且现有研究表明通过计算贴近度选择得到的比较交易实例可以较为准确评估待估对象的价格。土地价格受自然、经济、区位等多种因素影响,土地评估结果既能够表现出自然经济因素影响土地价值的区域结构性特征,也能反映人文活动及其它因素对地价的随机性扰动。部分学者考虑了评估过程中特征因素对地价影响的差异性,并对其进行量化,然后将该特征权重引入到模糊贴近度的计算模型当中,明显提高了参照案例选择的可靠性。但该部分研究一般采用层次分析法或专家打分等定性方法来确定特征权重,仍存在一定的主观随意性。并且随着时间和空间的推移,各影响特征对地价的影响程度可能发生变化,特征权重也需要做出调整才能符合实际情况。宗地价格评估是一个复杂的非线性系统,必须建立权重的动态学习机制,神经网络方法解决这类问题具有明显优势,并且孙会君、张云天、刘向楠等人的研究也验证了利用人工神经网络方法建立权重学习机制的可行性。



技术实现要素:

针对现有方法存在的特征因素权重确定主观性强、无法动态准确提取特征因素与宗地价格之间的权重系数等技术问题,本发明利用bp人工神经网络算法和模糊数学理论来构建一种基于人工神经网络的模糊宗地地价评估方法,利用bp人工神经网络的反馈学习机制,获取地价影响特征的权重系数,并利用该结果耦合现有的模糊数学贴近度计算模型选择最佳可比案例,计算待估宗地土地价格。

为了达到上述目的,本发明的技术方案是:一种基于人工神经网络的模糊宗地地价评估方法,其步骤如下:

步骤一:根据待估宗地性质从一般因素、区域因素、个别因素中挑选相关性高、易量化的因子作为特征因素构建土地评估特征体系;

步骤二:搜集市场交易资料根据土地评估特征体系构建地价样本数据集,利用z-score方法对样本特征数据进行归一化处理,并将原始样本集合按照设定比例随机拆分为训练样本集和测试样本集,给定所有样本地价标签;

步骤三:利用bp人工神经网络模型对训练样本集和测试样本集进行训练,提取地价样本数据集中每一特征因素的权重参数;

步骤四:选用类比法和阈值法建立隶属函数,构建交易案例和待估宗地的特征因素隶属度矩阵;贴近度和特征因素的权重参数计算交易案例与待估宗地之间的贴近程度,根据贴近度大小直接筛选可供比较的交易案例作为比较案例;

步骤五:利用贴近度衡量比较案例对待估宗地价格的差异影响程度修正比较案例的地价,基于贴近度加权方法计算待估宗地价格。

影响城市商业用地价格的因子有交通条件、繁华程度、人口状况、地形、城市规划、基础公用设施、环境质量和宗地几何。

所述步骤二中样本特征数据集为:

其中,为第l个样本的第d个特征值,表示第l个样本地块在第d个特征因素上的量化值,1≤l≤l,1≤d≤d,l为样本数据集的数量,d为每个样本数据的特征个数;

与样本特征数据集x对应的样本地价标签数据集y为:y=[y1y2...yl...yl]t;其中,yl表示第l个样本地块的实际市场价格。

所述z-score方法对对特征值归一化处理为:

其中,为特征值归一化后的数据特征值,φd为样本特征数据集x的第d个特征值的平均数,σd为样本特征数据集x的第d个特征值的标准差。

所述bp人工神经网络模型为包含一个隐含层的经典三层bp人工神经网络结构,进行训练的方法为:

网络结构设置:输入层包含d个节点,对应样本特征数据集x的d个特征,输入层的输入向量为节点x=[x1,x2,…xd,…,xd]t;隐含层包含m个节点、输出向量为h=[h1,h2…,hj,…,hm]t;输出层包含一个节点y,第l个样本特征输入对应的输出为ol,期望输出为地价标签yl;输入层到隐含层之间的连接权重矩阵w=(wdj)d×m,其中,元素wdj表示输入层第d个节点与隐含层第j个节点间的连接权;隐含层到输出层之间的连接权向量矩阵v=[v1,v2,…,vj,…,vm],其中,vj表示输出层与隐含层第j个节点间的连接权;

网络训练:对连接权重矩阵w和连接权向量矩阵v中各元素随机赋一较小的初始数值,将样本特征数据集x中各个特征数据xd作为输入层各节点的数据,选最常用的单极性sigmoid函数作为激活函数f(x’)来计算输入层和隐含层的输出:使用最速下降法通过反向传播来不断调整网络结构的权值和阈值,使bp人工神经网络的误差平方和最小;

特征权重计算:将神经元xd之间的网络关系参数转化为输入特征得到输出结果的决策权重;

①相关显著性系数ri的表达式为:

②相关指数ri的表达式为:

③绝对影响系数si的表达式为:

rd表示输入层第d个节点与输出层节点y的相关显著性系数;rd为输入层第d个节点与输出层节点y的相关指数,绝对影响系数sd就是所要求取的第d个特征的权重参数。

所述交易案例与待估宗地的用途相同、交易时间接近和空间位置临近,待估宗地为标尺对交易案例的交易日期及影响因素进行修正,得到交易案例的成交单价;选用类比法或阈值法建立隶属函数,计算待估宗地和交易案例的各个特征因素的隶属度,并构建交易案例和待估宗地的特征因素隶属度矩阵,将特征因素对交易样本地块的空间影响程度进行量化。

所述步骤四中的类比法用于没有明确外延或难以量化的软指标,对于选定的特征因素制定其评价模糊集的等级标准,并给与相应的隶属函数值;所述步骤四中的阈值法用于有明确外延或易量化的硬指标,针对不同特征因素构建对应的隶属函数,确定该特征指标取值范围,将特征值代入隶属函数求取隶属函数值。

所述步骤四中的贴进度为模糊数学理论中的贴进度,模糊贴近度取值范围为[0,1],贴近度越接近1,两模糊子集则越相似;设有n个交易样本a1、a2、…、an,ac表示第c个交易案例交易样本的特征向量,b表示待估宗地b1的特征向量,则:

其中,acd表示第c个交易案例的特征因素d的隶属函数值,bd表示待估案例宗地的第d个特征因素的隶属函数值;

将步骤三计算的每个特征因素的权重参数引入特征向量ac和特征向量b改进基本贴近度计算模型得到:

其中,sd为第d个特征因素的权重,且s1+s2+…+sd+…+sd=1;

计算待估宗地的特征向量b与交易样本的特征向量ac的贴近度ei为:

其中,b⊙ai表示特征向量b与特征向量ai的内积,表示特征向量b与特征向量ai的外积;

将n个交易样本a1、a2、…、an按照计算的贴进度值相近程度排序,选择贴近度最大的n-k个交易案例作为比较案例,k>=1。

所述基于贴近度加权方法计算待估宗地价格为:利用n-k个贴近度最大的比较案例来评估待估宗地,n-k个比较案例的贴近度分别为e1,e2,…,en-k,n-k个比较案例的成交地价分别为e1,e2,…,en-k,那么每一个交易样本地价对应的权重ewm为:

那么待估宗地的价格为:

本发明的有益效果是:1)将bp人工神经网络算法与模糊数学理论耦合求解宗地土地价格,为宗地地价评估工作提供了新思路;2)利用bp神经网络模型提取的宗地地价影响特征权重参数能够反映出不同用途的土地使用特性;3)改进后的模糊宗地地价评估模型的评估精度明显要高于传统市场比较法,对于高额度的土地评估具有很大的意义,能够使土地经济活动更加公正、合理,能够为土地市场经济的健康可持续发展做出贡献。本发明在我国宗地地价评估中具有重要的实际意义和应用价值。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的流程图。

图2为本发明中bp神经网络的拓扑图。

图3为本发明实施案例的商业用地评估指标体系。

图4为本发明实施案例的部分空间数据。

图5为本发明实施案例中估价对象与交易案例具体位置图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种基于人工神经网络的模糊宗地地价评估方法,利用bp人工神经网络的反馈学习机制,以地价影响特征向量作为输入空间,土地价格作为输出空间,建立地价与多维特征之间的复杂映射关系,获取地价影响特征的权重系数,并利用该结果耦合现有的模糊数学贴近度计算模型选择最佳可比案例,最后基于贴近度加权宗地评估方法计算待估宗地土地价格。以某市某商业用途宗地评估为实施案例,其步骤如下:

步骤一:根据待估宗地性质从一般因素、区域因素和个别因素中挑选相关性高、易量化的因子作为特征因素构建土地评估特征体系。

影响城市商业用地价格的因素有交通条件、繁华程度、人口状况、地形、城市规划、基础公用设施、环境质量和宗地几何等特征因子。本实例在某市基准地价评估成果基础之上,最终确定该市商业用地评估因素体系,交通条件包含的评价因子有道路通达度、公交便捷度、码头、火车站和长途汽车站,繁华程度的评价因子是商服中心,人口状况的评价因子是人口密度,地形的评价因子是地质条件和地形状况,城市规划的评价因子包括道路规划和用地规划,基础公用设施的评价因子包括电讯营业、供水状况和排水状况,环境质量的评价因子包括噪声污染、大气污染和绿地覆盖,共计17个评价因子,如图3所示。

步骤二:搜集市场交易资料根据土地评估特征体系构建地价样本数据集,利用z-score方法对样本特征数据进行归一化处理,并将原始样本集合按照设定比例随机拆分为训练样本集和测试样本集,给定所有样本地价标签。

为了提取商业用地价格影响特征权重,首先基于该市基准地价评估成果收集商业地价样本点共12386个,通过对样本点的异常检验,对其异常数据进行纠正或剔除,经整理后保留有效样点共9568个,然后对修改后的样点进行统一编号和规范化处理并存入数据库备用。

在利用样本点评提取特征权重之前,根据交易情况、交易期日、使用年期、容积率等因素对数据库中的样点的地价进行修正,得到样本特征数据集x。此外为量化特征因子对样本点的影响程度,本实施例搜集了土地利用、地形、交通条件、区位条件、基础设施配置、环境状况等方面的资料及空间图件。该市国土资源局提供了第二次土地调查数据库以及土地年度变更调查等土地利用数据及地形数据;道路通达、汽车站等交通数据主要参考交通部门提供的道路等级图、道路分布图、交通图等资料;大气污染、绿地覆盖等数据来源于环保部门;医院、电讯、供排水等数据来源于市政部门,主要空间数据如图4所示。

将样本特征数据集x表示为:

其中,l为样本数据集的数量,d为每个样本数据的特征个数,本实施例中l取9568,d取17。每一个拥有d个特征的数据都可以看做是空间rd中的一个向量,即样本特征数据集x中的一行。为第l个样本的第d个特征值,表示第l个样本地块在某一个属性特征上的量化值,1≤l≤l,1≤d≤d。y为与样本特征数据集x对应的样本标签数据集,可以表示为式(2),yl表示第l个样本地块对应的实际市场价格。

y=[y1y2...yl...yl]t......(2)

利用公式(3)进行对特征值归一化处理:

其中,为特征值归一化后的数据特征值,φd为样本特征数据集x的第d个特征值的平均数,σd为样本特征数据集x的第d个特征值的标准差。

步骤三:利用bp(back-propagation)人工神经网络模型对训练样本集和测试样本集进行训练,提取地价样本数据集中每一特征因素的权重参数。

本发明选择只包含一个隐含层的经典三层神经网络结构,即输入层、隐含层和输出层的节点数为17-8-1,学习率p_rate=0.8,均方误差阈值p_e=0.001,最大迭代次数t_study=10000。将样本点集合中的9568个地价样本点全部进行标注,随机抽选的训练样本集中的6000个样本作为权重学习模型的训练样本。试验采用的硬件平台为intel(r)core(tm)i7-4600ucpu4核,主频2.1ghz,内存16gb。软件配置为microsoftwindows7专业版64位操作系统,matlab2015运行环境。

网络结构定义:bp人工神经网络结构包括输入层、1个隐含层、输出层以及各层之间的连接关系。输入层包含d个节点,对应样本特征数据集x的d个特征,其输入向量为x=[x1,x2,…xd,…,xd]t;隐含层包含m个节点,其输出向量为h=[h1,h2…,hj,…,hm]t;输出层只包含一个节点y,第l个样本特征输入对应的输出为ol,期望输出为地价标签yl。输入层到隐含层之间的连接权重用矩阵w表示,w=(wdj)d×m,其中,元素wdj表示输入层第d个节点与隐含层第j个节点间的连接权;隐含层到输出层之间的连接权向量矩阵v=[v1,v2,…,vj,…,vm],其中,vj表示输出层与隐含层第j个节点间的连接权。

网络训练:对连接权的权重矩阵w和向量矩阵v中各元素随机赋一较小的初始数值,逐一将样本特征数据集x中各特征数据作为输入层各节点的数据,激活函数f(x’)均选最常用的单极性sigmoid函数来计算输入层和隐含层的输出,x’为输入层和隐含层节点的输入值;使用最速下降法通过反向传播来不断调整网络结构的权值和阈值,使bp人工神经网络的误差e平方和最小。

通过网络训练得到bp人工神经网络权值系数,如表1所示,网络训练对样本地价的拟合精度达到95.32%。

表1bp神经网络模型权值系数表

特征权重计算:通过bp人工神经网络训练得到神经元之间的网络关系参数,还需要进一步借助以下公式将其转化为输入特征对输出结果的决策权重。

①相关显著性系数ri的表达式为:

②相关指数ri的表达式为:

③绝对影响系数si的表达式为:

由于本发明的输出层只有一个节点,所以只考虑输入层神经元xd对输出层节点的影响即可。rd表示输入层第d个节点与输出层节点y的相关显著性系数;rd为输入层第d个节点与输出层节点y的相关指数,绝对影响系数sd就是所要求取的第d个特征的权重。

在表1的基础之上,根据公式(6)~(8)计算得出各特征因素对土地价格的影响权重,计算结果见表2。

表2地价影响特征权重

由表2可以看出,与商业用地价格相关性最高的因素包括商服中心、人口密度、交通条件,中度相关型因素包括市政条件、污染情况、地质地形状况等因素。商业用地作为城市中最为重要的用地类型,由于其特殊的土地使用目的,对于离市中心的远近、交通便捷程度、人口密度等因素十分敏感。bp人工神经网络模型提取的特征权重能够反映出商业用地的使用特性。

步骤四:选用类比法和阈值法建立隶属函数,构建交易案例和待估宗地的特征因素隶属度矩阵;贴近度和特征因素的权重参数计算交易案例与待估宗地之间的贴近程度,根据贴近度大小直接筛选可供比较的交易案例作为比较案例。

确定待估宗地与比较案例,本发明所选择的待估宗地的具体登记信息包括土地用途、面积、权利人、出让方式及年限等数据,如表3所示。

表3估价宗地描述

选取的交易案例应遵循替代原则,优先选择与待估宗地用途相同、交易时间接近、空间位置尽量临近的土地交易案例。通过某网站查找到交易状况相似的5个交易案例作为待选比较案例,具体信息如表4所示。为了保证比较案例与待估宗地的可比性,还需要对可比交易案例的交易日期及影响因素进行修正。由于影响因素对地价的差异性影响已经量化在影响特征的权重值当中,因此本发明只对交易案例进行交易日期修正。本发明实例从中国地价信息服务平台网站(http://www.landvalue.com.cn/)获取到某市地价指数表,以待估宗地b1为标尺对交易案例的成交单价进行修正,修正结果如表5所示,待估宗地与交易案例的具体区位位置如图5所示。

表4交易案例基本信息

表5交易案例地价修正

基于某市基准地价评估成果,将特征因素对交易样本地块的空间影响程度进行量化,然后选用类比法或阈值法建立隶属函数,构建交易案例和待估宗地的特征因素隶属度矩阵。

类比法适用于没有明确外延或难以量化的软指标,对于选定的特征因素制定其评价模糊集的等级标准,并给与相应的隶属函数值。例如对特征大气污染程度的五个等级“优”、“较优”、“一般”、“较差”和“差”可分别赋值为1、0、75、0.5、0.25和0。

阈值法适用于有明确外延或易量化的硬指标,针对不同特征因素构建对应的隶属函数,确定特征指标取值范围,将特征值代入隶属函数求取隶属函数值。例如某特征取值变化范围为[a,b],则评估单元特征因素指标v对应的隶属函数值g可通过以下公式计算。

按照类比法或阈值法可以计算得到待估宗地以及交易案例的各个特征因素的隶属度,结果如表6所示。

表6交易案例特征隶属度

模糊贴近度取值范围为[0,1],贴近度越接近1,两模糊子集则越相似。假设有n个交易样本的资料a1,a2,…,an以及待估宗地b1。ac表示第c个交易案例交易样本的特征向量,b表示待估宗地b1的特征向量。

acd表示第c个交易样本特征因素d的隶属函数值,bd表示待估案例第d个特征因素的隶属函数值。考虑到各特征因素对土地价格的影响程度不同,引入步骤三所获得的特征因素权重参数改进基本贴近度计算模型,则式(9)可以变为

其中,sd为第d个特征因素的权重,且s1+s2+…+sd+…+sd=1,然后按公式(11)来计算待估宗地特征向量b与交易样本的特征向量ac的贴近度ei:

其中,b⊙ai表示特征向量b与特征向量ai的内积,表示特征向量b与特征向量ai的外积。

在表2和表6的结果基础上采用公式(11)可计算得到待估宗地b1与比较案例a1的贴近度为:b⊙a1=0.0122,e1=1/2[0.0716+(1-0.0122)]=0.5297,同样可以算出e2=0.6845,e3=0.4743,e4=0.4223,e5=0.4715。由计算可以看出相近程度排序为a2,a1,a3,a5及a4,本实例选择贴近度最大的3个交易案例来计算待估宗地价格,即a2,a1,a3。

步骤五:利用贴近度衡量比较案例对待估宗地价格的差异影响程度修正比较案例的地价,基于贴近度加权方法计算待估宗地价格。

根据贴近度来控制交易样本价格对待估宗地价格的影响程度,进而提出基于贴近度加权的宗地评估方法。假设选定n个贴近度最大的交易案例来评估待估宗地,贴近度分别为e1,e2,…,en,对应的地价分别为e1,e2,…,en,那么每一个交易样本地价对应的权重ewi为:

那么待估宗地b1的价格eb可按公式(13)来计算。

按照公式(12)可以计算得到a2,a1,a3三个比较案例的地价所对应的权重分别为0.314、0.405和0.281。利用公式(13)可计算得到待估宗地b的单价=(0.314×37290+0.405×41821+0.281×36841)=39000(元/平方米),绝对误差=|评估地价-实际成交价格|=|39000-39451|=451(元/平方米),相对误差=绝对误差/实际成交价格*l00%=451/39451*l00%=1.14%。

为对比本发明方法的评估效果,应用传统市场比较法对待估宗地b1地块价值进行评估。从现有5个交易案例中随意选取3个作为可比案例,一共得到10种组合方式(a1、a2、a3;a1、a2、a4;a1、a2、a5;a1、a3、a4;a1、a3、a5;a1、a4、a5;a2、a3、a4;a2、a3、a5;a2、a4、a5;a3、a4、a5),先选取a1、a2、a3作为可比案例,故待估宗地b1的单价=(37290+43821+36841)/3=38650(元/平方米),绝对误差=|评估地价-实际成交价格|=|38650-39451|=801(元/平方米),相对误差=绝对误差/实际成交价格*l00%=801/39451*l00%=2.03%。

同理,另外9个可比案例组合的估价结果也可按上述方法计算得到,并将绝对误差、相对误差结果汇总如表7所示,注:序号为0的数据为本发明方法的计算结果。

表7不同案例组合情况下的估价结果表

从表7可见,本发明的评估结果相对误差要明显小于传统市场比较法,也即其估价准确度比现行市场比较法的估价准确度要更高,估价准确度要比现行传统市场比较法相对误差的平均值高出2.82%,说明本发明提出的改进方法是有效的,本发明对于高额度的土地评估具有很大的意义,特别是对土地司法鉴定、土地征收、土地作价入股等重要经济活动中涉及的土地估价尤为重要。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1