房屋价值预测方法、装置、计算机设备和存储介质与流程

文档序号:16935351发布日期:2019-02-22 20:38阅读:187来源:国知局
房屋价值预测方法、装置、计算机设备和存储介质与流程

本申请涉及前瞻预测技术领域,特别是涉及一种房屋价值预测方法、装置、计算机设备和存储介质。



背景技术:

在实际生活中,房价已经成为人们日常生活的关注重点,房价的变动牵动着各行各业以及普通百姓的心,不论是从事房地产开发、房地产金融以及建筑等行业的专业人员还是普通百姓都希望能够对未来房价走势有一个比较准确的前瞻预测。

传统的房价预测多数是专业的估价师基于近段时间来某个地区基础房价、房源供需关系、政策以及自身经验给出房价预测。这种方式,一般会严重依赖于估价师的主观判断以及经验,针对同一区域的房价,不同的估价师最终得出房价预测可能不同。

可见传统的房价预测方法均在极大局限性,其房价预测结果不够准确。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种房屋价值预测方法、装置、计算机设备和存储介质。

一种房屋价值预测方法,所述方法包括:

获取待预测区域房屋价值历史数据,从所述房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数;

对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理;

从量化和标准化后的指标和房屋价值指数中筛选出符合经济学逻辑的变量和样本;

提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型。

在其中一个实施例中,所述提取的指标和房屋价值指数去除异常值、趋势以及季节性影响因素进行标准化处理包括:

根据预设的缺失值填补规则,对所述指标中存在缺失的指标进行缺失值填补,得到缺失值填补完毕的数据集;

针对缺失值填补完毕的数据集,根据预设的指标变频规则,对指标进行变频处理;

根据变频处理后的指标,确定指标对应的衍生指标;

对所述衍生指标进行指标转化,将指标转化后的所述衍生指标及对应的变频处理后的指标进行合并,得到标准化处理后的指标。

在其中一个实施例中,所述预设的缺失值填补规则为:对于缺失率小于或等于预设阈值的指标,根据指标性质及指标缺失情况,对存在缺失值的指标进行缺失值填补;对于缺失率大于所述预设阈值的指标予以剔除

在其中一个实施例中,所述对指标进行变频处理包括:

获取指标中的季度指标和年度指标;

将所述季度指标和所述年度指标通过线性插值的方法转化为月度数据。

在其中一个实施例中,所述根据变频处理后的指标,确定指标对应的衍生指标包括:

获取预设房价前瞻预测因子体系;

根据所述预设房价前瞻预测因子体系,获取衍生指标数据;

从所述衍生指标数据中识别可以直接获取的指标数据以及需由其他指标运算方法的指标数据,确定各指标对应的衍生指标。

在其中一个实施例中,所述提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型包括:

提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,分别通过多个预设机器学习方法训练,构建不同的房价前瞻预测模型;

所述提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,分别通过多个预设机器学习方法训练,构建不同的房价前瞻预测模型之后,还包括:

选取筛选出的变量和样本中另一部分数据为测试数据,对所述不同的房价前瞻预测模型进行测试,选择平均误差最小的机器学习方法对应的房价前瞻预测模型为最优房价前瞻预测模型。

一种房屋价值预测装置,所述装置包括:

数据获取模块,用于获取待预测区域房屋价值历史数据,从所述房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数;

数据处理模块,用于对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理;

筛选模块,用于从量化和标准化后的指标和房屋价值指数中筛选出符合经济学逻辑的变量和样本;

模型构建模块,用于提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型。

在其中一个实施例中,所述数据处理模块还用于根据预设的缺失值填补规则,对所述指标中存在缺失的指标进行缺失值填补,得到缺失值填补完毕的数据集;针对缺失值填补完毕的数据集,根据预设的指标变频规则,对指标进行变频处理;根据变频处理后的指标,确定指标对应的衍生指标;对所述衍生指标进行指标转化,将指标转化后的所述衍生指标及对应的变频处理后的指标进行合并,得到标准化处理后的指标。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如个述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的方法的步骤。

上述房屋价值预测方法、装置、计算机设备和存储介质,从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数,对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理,筛选出符合经济学逻辑的变量和样本,提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型进行房屋价值预测。整个过程中,对获取的影响房屋价值的指标以及房屋价值指数进行量化处理和标准化,去除异常值、趋势以及季节性影响因素影响,准确获取训练数据,可以实现对房屋价值准确预测。

附图说明

图1为一个实施例中房屋价值预测方法的流程示意图;

图2为另一个实施例中房屋价值预测方法的流程示意图;

图3为一个实施例中房屋价值预测装置的结构框图;

图4为另一个实施例中房屋价值预测装置的结构框图;

图5为应用上述房屋价值预测方法的实验结果对比图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

如图1所示,一种房屋价值预测方法,方法包括:

s200:获取待预测区域房屋价值历史数据,从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数。

待预测区域是指本次房屋价值预测的目标区域,该区域可以是某一个行政区域,例如北京、上海、广州等。该区域还可以是一个较小范围,例如某个小区等。待预测区域房屋价值历史数据可以是在日常记录中终端采集发送至服务器累积下来的数据,可以是服务器通过互联网等手段获取外部已有对应的数据。在房屋价值历史数据中提取影响房屋价值的指标和房屋价值指数,影响房屋价值的指标包括有:各类宏观经济指标,例如gdp、cpi、pmi、人均可支配收入等;中观经济指标,例如各城市(区)城市化率、地铁里程、人均住房面积以及商品房待售面积等;政策法规例如房地产限售限购政策、首套房利率政策、城市中长期发展规划等。房屋价值指数具体可以是房价,其可以包括挂盘和交易价格。非必要的,为了确保后续房屋价值预测的准确性,可以获取近段时间内的待预测区域房屋价值历史数据,例如获取最近1年、获取最近6个月等时间内的待预测区域房屋价值历史数据,针对获取的数据还可以基于时间合理排布对应的指标,例如以月为依据。如以“居住人口”这一指标为例,该指标的历史值为[h1、h2、…、hi、…],其中,hi表示在预设时间内的第i个月的居住人口数。

s400:对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理。

进行量化处理的目的是将提取的指标和房屋价值指数中主观因素参数量化为方便处理的数据。进行标准化处理的目的是将去除提取的指标和房屋价值指数中异常值、趋势以及季节影响。对提取的指标和房屋价值指数进行量化处理和标准化进一步除去数据中主观因素、异常值、趋势以及季节性参数,为后续客观预测房屋价值提供可靠的数据基础。

s600:从量化和标准化后的指标和房屋价值指数中筛选出符合经济学逻辑的变量和样本。

筛选出符合经济学逻辑具体可以基于大数据分析的方式,从量化和标准化处理后的指标和房屋价值指数中筛选出来。筛选出的变量和样本作为下一步的训练数据。需要指出的时,这个筛选过程可以根据实际情况需要选择一定数量的变量和样本。当实际情况需要比较高要求、覆盖全面的房价前瞻预测结果时,可以选择尽量多一些变量好样本作为训练数据;当实际情况需要比较低要求、覆盖一定内容的房价前瞻预测结果时,可以选择少量变量好样本作为训练数据,减少后续训练的数据处理量。

s800:提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型。

预设机器学习方法是预先选定的机器气人学习方法,其具有不断学习能力,能够基于训练数据,训练出合理的模型。具体来说,预设机器学习方法可以包括线性回归、lasso、岭回归(ridgeregression)、随机森林、k近邻算法(kneighbourregression)、决策树、支持向量机回归(svr)、梯度增强回归(gradientboostingregressor)模型以及xgboost算法。选择上述任意一款机器学习方法,以待预测区域房屋价值指数为预测目标,以筛选出的变量和样本为训练数据进行训练,构建房价前瞻预测模型,基于构建的房价前瞻预测模型对待预测区域房屋价值进行预测。

上述房屋价值预测方法,从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数,对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理,筛选出符合经济学逻辑的变量和样本,提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型进行房屋价值预测。整个过程中,对获取的影响房屋价值的指标以及房屋价值指数进行量化处理和标准化,去除异常值、趋势以及季节性影响因素影响,准确获取训练数据,可以实现对房屋价值准确预测。

在其中一个实施例中,提取的指标和房屋价值指数去除异常值、趋势以及季节性影响因素进行标准化处理包括:

步骤一:根据预设的缺失值填补规则,对指标中存在缺失的指标进行缺失值填补,得到缺失值填补完毕的数据集。

某些指标存在数据缺失的情况,对于这种情况根据预先设定的缺失值填补规则以及已有数据进行缺失值调补,补齐数据集。具体来说,对于缺失率小于或等于预设阈值的指标,根据指标性质及指标缺失情况,对存在缺失值的指标进行缺失值填补;对于缺失率大于预设阈值的指标予以剔除。在实际应用中,对于缺失率小于或等于30%的预设指标而言,根据指标性质及指标缺失情况,对存在缺失值的指标进行缺失值填补;及对于缺失率大于30%的预设指标而言,(在考察其余可获得数据源均无法填补的情况下),对该指标予以剔除。当因子缺失为指标周期性缺失,例如每年1月份、2月份数据周期性缺失。由于该缺失情况与统计局统计工作周期相关,因此,为了消除春节日期不固定因素带来的影响,增强数据的可比性,需对1月份、2月份的确实指标进行填补。若该指标为累计值,则以当年度3月份数据的三分之一、三分之二分别作该年1月份、2月份数据缺失值填补;若该指标为当月发生值,则以该年3月份值作当年度1、2月份缺失值填补。当因子缺失的指标缺失数较少、无规律性,若该指标为累计值,则根据缺失当月前后一个月数据进行线性插值填补缺失;若该指标为当月实际发生值,则以距离缺失月最近6个月均值作填补。针对部分特殊指标,如施工面积,由于该指标性质的特殊性,采用该年度平均增长率倒推缺失值。

步骤二:针对缺失值填补完毕的数据集,根据预设的指标变频规则,对指标进行变频处理。

将季度的指标和年度的指标通过线性插值的方法转化为月度数据,实现预设指标的变频处理,便于后续计算衍生指标。例如,“gdp”这一指标为季度数据,“常住人口”这一指标为年度数据,通常使用连续两个季度或者两个年度的历史数据进行线性插值,计算得出每个月的数据。

步骤三:根据变频处理后的指标,确定指标对应的衍生指标。

一般房屋价值相关的因子体系涉及的衍生指标共计24个,可直接从数据源获取的共计13个,剩余11各衍生指标主要是由现有某几个指标相除、相减等方法获得。例如:“常住人口/户籍人口比”这个指标由“常住人口”和“户籍人口”这两个指标衍生得到。具体来说,上述步骤包括:获取预设房价前瞻预测因子体系;根据预设房价前瞻预测因子体系,获取衍生指标数据;从衍生指标数据中识别可以直接获取的指标数据以及需由其他指标运算方法的指标数据,确定各指标对应的衍生指标。其中房价前瞻预测因子体系是预先构建的,在房价前瞻预测因子体系中携带有大量影响房屋价值的指标以房屋价值指数,影响房屋价值的指标包括有:各类宏观经济指标,例如gdp、cpi、pmi、人均可支配收入等;中观经济指标,例如各城市(区)城市化率、地铁里程、人均住房面积以及商品房待售面积等;政策法规例如房地产限售限购政策、首套房利率政策、城市中长期发展规划等。房屋价值指数具体可以是房价,其可以包括挂盘和交易价格。宏观经济指标主因子包括世界经济指标、国民经济指标、货币银行、房地产及建筑业以及金融市场的从因子;中观经济指标主因子包括城市经济、城市生活、房地产及建筑业以及二手房市场的从因子;城市规划主因子包括待预测区域城市规划的从因子;舆论影响主因子自包括主流媒体、互联网门户和论坛、自媒体以及搜索引擎热度的从因子;政策法规主因子包括国家政策和待预测区域的城市政策的从因子。

步骤四:对衍生指标进行指标转化,将指标转化后的衍生指标及对应的变频处理后的指标进行合并,得到标准化处理后的指标。

衍生指标生成完毕,即形成了指标转化前数据集的宽表。基于此,再对其作指标转化,指标转化方式包括:3个月环比、一年同比、标准化以及原始值。例如,对于房交易量指标,会使用3个月环比,累积值数据(例如,销售面积),会使用一年同比,指标本身为比率,会使用原始值。需要说明的是,在指标转化过程中,部分需同比转化的指标,由于原始数据起始时间的局限性,会出现转化后数据缺失的情况,该类指标缺失可以指标转化后数据的中位数作缺失值进行填补。

如图2所示,在其中一个实施例中,步骤s800包括:提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,分别通过多个预设机器学习方法训练,构建不同的房价前瞻预测模型;

步骤s800之后还包括:

s900:选取筛选出的变量和样本中另一部分数据为测试数据,对不同的房价前瞻预测模型进行测试,选择平均误差最小的机器学习方法对应的房价前瞻预测模型为最优房价前瞻预测模型。

机器学习方法包括线性回归、lasso、岭回归(ridgeregression)、随机森林、k近邻算法(kneighbourregression)、决策树、支持向量机回归(svr)、梯度增强回归(gradientboostingregressor)模型以及xgboost算法,基于这些算法可以构建不同的房价前瞻预测模型,以样本数据中部分数据作为测试数据,测试各个房价前瞻预测模型的平均误差,选择平均误差最小的机器学习方法对应的房价前瞻预测模型为最优房价前瞻预测模型。

更进一步来说,可以根据预设短名单生成规则筛选出符合经济学逻辑的变量和样本。短名单生成规则是结合房地产行业专家经验和已有房地产模型讨论生成的。根据该短名单生成规则,从提取的指标中筛选出预设数量的指标生成短名单,例如可以选取53个指标中重要程度为高的指标作为模型训练短名单,根据每个指标的最佳滞后期数据生成样本数据集,用于机器学习建模训练。需要指出的是,样本数据集中包括有训练数据和测试数据,训练数据用于机器学习建模训练,测试数据用于测试建立好的模型是否预测准确。

在其中一个实施例中,上述步骤s900包括:

d1、对短名单中的所有指标进行分组配置,根据分组情况,依次从样本数据集中获取每个分组对应的入模指标的训练集、测试集。

d2、利用每个分组对应的入模指标的训练集,对预设的机器学习方法进行训练,构建房价前瞻模型。

d3、利用每个分组对应的入模指标的测试集,对各机器学习方法对应的房价前瞻模型的准确性进行测试。

d4、计算各房价前瞻模型对应的测试结果的平均误差(rmse),选取平均误差(rmse)最小的算法对应的房价前瞻预测模型作为最优房价前瞻模型。

首先,对短名单进行分组配置,每个分组的入模指标数量控制在有且仅有一个,由于不同城市其数据质量不尽相同,若分组内所有指标均无数据,则该组指标数量为零。例如,在分组配置过程中,根据指标类型进行分组:中观、宏观、衍生等。其中,训练模型组合的数量为所有分组中选取1个指标的遍历。比如,若a组有3个指标,b组有2个指标,则组合数为3*2=6,共6种,组合指标有2个。基于模型所有的组合数,将对每个组合分别采用9种机器学习方法进行训练,分别为:线性回归、lasso、岭回归(ridgeregression)、随机森林、k近邻算法(kneighbourregression)、决策树、支持向量机回归(svr)、梯度增强回归(gradientboostingregressor)模型以及xgboost算法。通过上述方法的训练,选取平均误差(rmse)最小的算法对应的房价前瞻预测模型作为最优房价前瞻模型。

应该理解的是,虽然图1-2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以其它的顺序执行。而且,图1-2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行

如图3所示,一种房屋价值预测装置,装置包括:

数据获取模块200,用于获取待预测区域房屋价值历史数据,从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数;

数据处理模块400,用于对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理;

筛选模块600,用于从量化和标准化后的指标和房屋价值指数中筛选出符合经济学逻辑的变量和样本;

模型构建模块800,用于提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型。

上述房屋价值预测装置,数据获取模块200从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数,数据处理模块400对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理,筛选模块600筛选出符合经济学逻辑的变量和样本,模型构建模块800提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型进行房屋价值预测。整个过程中,对获取的影响房屋价值的指标以及房屋价值指数进行量化处理和标准化,去除异常值、趋势以及季节性影响因素影响,准确获取训练数据,可以实现对房屋价值准确预测。

在其中一个实施例中,数据处理模块400还用于根据预设的缺失值填补规则,对指标中存在缺失的指标进行缺失值填补,得到缺失值填补完毕的数据集;针对缺失值填补完毕的数据集,根据预设的指标变频规则,对指标进行变频处理;根据变频处理后的指标,确定指标对应的衍生指标;对衍生指标进行指标转化,将指标转化后的衍生指标及对应的变频处理后的指标进行合并,得到标准化处理后的指标。

在其中一个实施例中,预设的缺失值填补规则为:对于缺失率小于或等于预设阈值的指标,根据指标性质及指标缺失情况,对存在缺失值的指标进行缺失值填补;对于缺失率大于预设阈值的指标予以剔除

在其中一个实施例中,数据处理模块400还用于获取指标中的季度指标和年度指标;将季度指标和年度指标通过线性插值的方法转化为月度数据。

在其中一个实施例中,数据处理模块400还用于获取预设房价前瞻预测因子体系;根据预设房价前瞻预测因子体系,获取衍生指标数据;从衍生指标数据中识别可以直接获取的指标数据以及需由其他指标运算方法的指标数据,确定各指标对应的衍生指标。

在其中一个实施例中,模型构建模块800还用于提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,分别通过多个预设机器学习方法训练,构建不同的房价前瞻预测模型。如图4所示,上述房屋价值预测装置还包括优化模块900,用于选取筛选出的变量和样本中另一部分数据为测试数据,对不同的房价前瞻预测模型进行测试,选择平均误差最小的机器学习方法对应的房价前瞻预测模型为最优房价前瞻预测模型。

关于房屋价值预测装置的具体限定可以参见上文中对于房屋价值预测方法的限定,在此不再赘述。上述房屋价值预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在实际应用,以本申请构建的房价前瞻预测模型对杭州市某一区域房价进行预测,其得到的实验结果图5所示。基于图5可见本申请房价前瞻预测模型可以准确对杭州市某一区域房价进行预测。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各区域房屋价值历史数据以及数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种房屋价值预测方法。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

获取待预测区域房屋价值历史数据,从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数;

对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理;

从量化和标准化后的指标和房屋价值指数中筛选出符合经济学逻辑的变量和样本;

提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据预设的缺失值填补规则,对指标中存在缺失的指标进行缺失值填补,得到缺失值填补完毕的数据集;针对缺失值填补完毕的数据集,根据预设的指标变频规则,对指标进行变频处理;根据变频处理后的指标,确定指标对应的衍生指标;对衍生指标进行指标转化,将指标转化后的衍生指标及对应的变频处理后的指标进行合并,得到标准化处理后的指标。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取指标中的季度指标和年度指标;将季度指标和年度指标通过线性插值的方法转化为月度数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设房价前瞻预测因子体系;根据预设房价前瞻预测因子体系,获取衍生指标数据;从衍生指标数据中识别可以直接获取的指标数据以及需由其他指标运算方法的指标数据,确定各指标对应的衍生指标。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,分别通过多个预设机器学习方法训练,构建不同的房价前瞻预测模型;选取筛选出的变量和样本中另一部分数据为测试数据,对不同的房价前瞻预测模型进行测试,选择平均误差最小的机器学习方法对应的房价前瞻预测模型为最优房价前瞻预测模型。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取待预测区域房屋价值历史数据,从房屋价值历史数据中提取影响房屋价值的指标以及房屋价值指数;

对提取的指标和房屋价值指数进行量化处理,并对提取的指标和房屋价值指数进行标准化处理;

从量化和标准化后的指标和房屋价值指数中筛选出符合经济学逻辑的变量和样本;

提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,构建房价前瞻预测模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据预设的缺失值填补规则,对指标中存在缺失的指标进行缺失值填补,得到缺失值填补完毕的数据集;针对缺失值填补完毕的数据集,根据预设的指标变频规则,对指标进行变频处理;根据变频处理后的指标,确定指标对应的衍生指标;对衍生指标进行指标转化,将指标转化后的衍生指标及对应的变频处理后的指标进行合并,得到标准化处理后的指标。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取指标中的季度指标和年度指标;将季度指标和年度指标通过线性插值的方法转化为月度数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设房价前瞻预测因子体系;根据预设房价前瞻预测因子体系,获取衍生指标数据;从衍生指标数据中识别可以直接获取的指标数据以及需由其他指标运算方法的指标数据,确定各指标对应的衍生指标。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

提取筛选出的变量和样本中部分数据为训练数据,以待预测区域房屋价值指数为预测目标,分别通过多个预设机器学习方法训练,构建不同的房价前瞻预测模型;选取筛选出的变量和样本中另一部分数据为测试数据,对不同的房价前瞻预测模型进行测试,选择平均误差最小的机器学习方法对应的房价前瞻预测模型为最优房价前瞻预测模型。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1