一种基于xgboost的房源成交预估方法及预估平台与流程

文档序号:14872572发布日期:2018-07-07 01:47阅读:193来源:国知局

本发明实施例涉及机器学习技术领域,具体为一种基于xgboost的房源成交预估方法及预估平台。



背景技术:

房屋在挂牌销售期间,获取热点房源信息,有利于经纪人进行更高效的房源跟踪和销售,促进房源交易的成功。热点房源为成交概率较大、受关注度较高的房源。对于热点房源的判断,一种方式是经纪人根据自己对房源和市场形式等的了解来进行判断,从而进行更高效的房源跟踪和销售;这种纯线下的人工作业不仅效率低,而且没有全局概念,容易受主观因素影响,判断误差较大。另一种方式是简单的通过线上的关注、浏览量等来自动评判房屋的受欢迎或者销售难易程度,但是这种方法所依赖的数据属于具有较大起伏变化的格式化数据,判断误差较大。

目前还没有很成熟的对细粒度的房屋销售前景进行预测与评级的系统,即无法有效地对每套房源进行短期交易前景的预测,因此亟需一种能对每套房屋在未来一段时间的成交概率进行较为准确预估的方法和平台。



技术实现要素:

为解决现有技术中无法实现可靠的房屋成交概率智能化预估的问题,本发明实施例提供一种基于xgboost的房源成交预估方法及预估平台。

第一方面,本发明实施例提供一种基于xgboost的房源成交预估方法,所述方法包括:获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

第二方面,本发明实施例提供一种基于xgboost的房源成交预估平台,所述预估平台包括:样本生成模块,具体用于获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;标签添加模块,具体用于对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;机器学习模块,具体用于对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;预测模块,具体用于将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

第三方面,本发明实施例提供一种电子设备,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

本发明实施例通过将xgboost运用到实际的房屋在售成交预估场景中,能够提供可靠的个体及整体房屋的成交前景;成交预估可实现无人值守自动化运行,减少了人力资源浪费。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于xgboost的房源成交预估方法流程图;

图2为本发明实施例提供的基于xgboost的房源成交预估方法的基础特征分布图;

图3为本发明实施例提供的基于xgboost的房源成交预估平台结构示意图;

图4为本发明实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的基于xgboost的房源成交预估方法流程图。如图1所示,所述方法包括:

步骤101、获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;

首先通过sparksql从数据仓库获取房源数据,所述房源数据为与所述房源有关的原始记录数据,如经纪人相关信息、客户相关信息、互动信息等。为得到机器学习的训练样本,则根据所述房源数据进行统计得到房源的特征数据,所述房源的特征数据可以用来生成样本。比如,所述房源的特征数据可为经纪人带看过的不同店铺数,则根据与经纪人带看店铺有关的原始数据进行统计得到经纪人带看过的不同店铺数,即得到所述房源的这一个特征数据。所述房源的特征数据可同时被存储在单机硬盘或者分布式的hdfs(hadoop分布式文件系统)上。为达到更好的预测效果,所述房源的特征数据可以为多个。由一套房源同一日的所述特征数据构成一个样本。

步骤102、对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;

所述预设时间为所述样本的样本日(指样本的数据是哪一天的数据)后的一段时间,如所述预设时间可以为样本日后14天内,则所述标签为样本日后14天内的房源成交概率。这也表明,如果所述预设时间为样本日后14天内,则要想获得所述标签,所述至少要挂牌14天以上。样本的日期与预测日越接近,预测的精度越高。各套房源的所述特征数据可以构成百万级别的样本集。对每个所述样本添加标签,如果预测14天内的房源成交概率,则所述标签为所述房源在样本日后14天内的房源实际成交情况,如果成交,则所述标签设置为1;如未成交,则所述标签设置为0。

步骤103、对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;

xgboost是一种基于决策树结构的boost模型,与gbdt类似,但由于对目标函数进行了二阶泰勒展开并加入了正则化项,使得模型具有较强的泛化能力,可以规避过拟合的风险,抗干扰能力强。

对具有所述标签的样本集利用xgboost进行监督学习,输入为样本及标签,所述样本为所述特征数据,所述标签为所述预设时间内的房源成交概率,输出为所述预设时间内的房源成交概率。如所述标签为样本日后14天内的房源成交概率,为已知值,所述输出也为样本日后14天内的房源成交概率,为预测值。根据xgboos算法的实现原理,当输出与标签值满足一定精度要求的时候,得到所述预测模型。

步骤104、将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

得到所述预测模型后,将预测房源当日的所述特征数据输入到所述预测模型,根据所述预测模型的输出即所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。预测的时间跨度应与进行机器学习时的训练样本标签的时间跨度相同,即,如果所述标签为样本日后14天内的房源成交概率,则预测模型的预测值也为预测样本日后14天内的房源成交概率。如果所述预测模型的预测值为0.2,可以认为所述房源在14天内的房源成交概率为20%。

在构建所述样本时面向的是每一个房屋个体,即使这套房子历史上被成交过又被出售,也会作为同一个样本源,这样也保证了样本物理意义上的连续性。因此本发明实施例可以实时地对每一套在售的房屋进行成交预估,且可以给出未来一段时间较为准确的成交概率。

为了使得预测模型对现有市场规律把握更准确,每天新的数据特征及样本生成后会更新样本集重新训练,得到新的预测模型。

本发明实施例通过将xgboost运用到实际的房屋在售成交预估场景中,能够提供可靠的个体及整体房屋的成交前景;成交预估可实现无人值守自动化运行,减少了人力资源浪费。

进一步地,基于上述实施例,根据所述房源数据得到房源的特征数据具体包括:对所述房源数据进行统计获取房源的基础特征数据;根据所述房源数据进行统计获取房源的统计特征数据;根据所述房源的基础特征数据和所述房源的统计特征数据得到所述房源的特征数据。

对所述房源数据进行统计获取房源的基础特征数据,所述房源的基础特征数据一般为数量统计值、是或否的统计,如最近14日经纪人带看过的不同客户数、最近14日调价次数、是否地铁、是否学区等;对所述房源数据进行统计获取房源的统计特征数据,所述房源的统计特征数据为与分布特征有关的数据,如房源a最近14日调价次数的最大值、标准差等。

根据所述房源的基础特征数据和所述房源的统计特征数据得到所述房源的特征数据,所述房源的特征数据包括所述房源的基础特征数据和所述房源的统计特征数据。

对于同一套房屋,其在同一日的特征数据融合到一起构成所述样本,但是在各类特征数据中会有缺失的现象,因此,需要对必要的特征数据进行补全操作。缺失数据的原因可能是因为统计天数内并没有与相应的特征数据对应的原始数据,这时可以将相应的特征数据根据实际情况进行补全,如设为0、设为否等。

在上述实施例的基础上,本发明实施例所设定的构成样本的特征数据,既包含由原始数据得出的统计值,又包含进一步进行统计的值,保证了预测样本的全面性。

图2为本发明实施例提供的基于xgboost的房源成交预估方法的基础特征分布图。进一步地,基于上述实施例,所述获取房源的基础特征数据具体包括:

获取经纪人特征数据,所述经纪人特征数据包括经纪人带看特征数据、经纪人跟进特征数据和维护人特征数据;

其中,所述经纪人带看特征数据包括经纪人最近14日带看过的不同客户数、最近14日带看过的不同店铺数、最近14日带看过的不同的经纪人数、最近14日总的带看数;所述经纪人跟进特征数据包括经纪人最近14日普通跟进数量、最近14日语音跟进数量;所述维护人特征数据包括维护人最近90日维护人维护成功概率、最近90日维护人维护成功房子数量、最近90日维护人维护失败房子数量。

获取房屋特征数据,所述房屋特征数据包括房屋物理属性数据、房源物理属性数据、三证核验特征数据和翻录特征数据;

其中,所述房屋物理属性数据包括物理楼层,楼层类型,建筑年代,是否地铁,是否学区;所述房源物理属性数据包括是否唯一,房源等级,是否满二,是否满五,是否登记契税时间,是否登记房本日期,是否登记原始购房合同日期,是否有维护人,有维护人的时间,是否有实勘,有实勘人时间,是否有钥匙,有钥匙人的时间,是否有连环单,有连环单的时间;所述三证核验特征数据包括近14天是否存在三证核验,近14天三证核验的次数,历史三证核验的次数;所述翻录特征数据包括本房被多少个不同的经纪人翻录过,本房被翻录次数,本次录入距上次录入的天数,本次录入距上次核销的天数,历次录入总挂牌天数,每次录入平均挂牌天数,平均翻录周期。

获取客源特征数据,所述客源特征数据包括客源电话特征数据、线上特征数据和意向金特征数据;

所述客源电话特征数据包括近14天是否存在400电话,近14天400电话的次数,历史400电话的次数(400电话为客户拨打的电话);所述线上特征数据包括近14天是否存在关注,近14天关注的次数,历史关注的次数;所述意向金特征数据包括近14天是否存在意向金,近14天意向金的次数,历史意向金的次数。

获取业主特征数据,所述业主特征数据包括业主线上特征数据和调价特征数据;

所述业主线上特征数据包括最近14日业主曝光数量,是否有业主自评,最近14日业主喊话数量;所述调价特征数据包括最近14日调价次数,最近14日上调次数,最近14日下调次数,最近一次调价距今天数,最近14天有多少天调过价,14天前价格,现价格,调价比例。

获取市场特征数据,所述市场特征数据包括供需比特征数据和成交周期特征数据;

所述供需比特征数据包括最近30日房源所在小区带看过的不同客户数,房源所在小区最近30日同居室挂牌房源数量,房源所在商圈最近30日带看过的不同客户数,房源所在商圈最近30日同居室挂牌房源数量;所述成交周期特征数据包括最近90天房源所在小区同居室成交周期,最近90天房源所在小区同居室成交数量,最近90天房源所在商圈同居室成交周期,最近90天房源所在商圈同居室成交数量。

获取价格特征数据,所述价格特征数据包括小区均价特征数据和价格排名特征数据。

所述小区均价特征数据包括房源所在小区的拟合日均价、成交中位数价、成交均价、挂牌中位数价和挂牌均价;所述价格排名特征数据包括房源所在小区同居室总价排名,房源所在小区同居室单价排名,房源所在小区同居室挂牌数量。

需注意的是,以上基础特征数据统计中如果挂牌日距样本日的天数小于相应时限要求的,则以实际的天数进行统计。

在上述实施例的基础上,本发明实施例通过设定6大类、16小类基础特征数据,即包含了房屋个体特征数据,又包含了市场特征数据,保证了样本数据特征的全面性,有利于提高机器学习的精度。

进一步地,基于上述实施例,所述对所述房源数据进行统计获取房源的统计特征数据,具体包括:根据所述房源数据统计预设特征的最大值、最小值、众数值、平均值和标准差值,从而得到所述房源的统计特征数据。

选择部分与基础特征数据对应的具有分布特征规律的特征作为所述预设特征,统计预设特征的最大值、最小值、众数值、平均值和标准差值,从而得到所述房源的统计特征数据。如根据经纪人最近14日每日的带看数,可以统计经纪人最近14日每日带看数的最大值、最小值、众数值、平均值和标准差值。

在上述实施例的基础上,本发明实施例通过设定可以反映分布特征的统计特征数据,保证了样本数据特征的全面性,有利于提高机器学习的精度。

进一步地,基于上述实施例,所述根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率具体包括:根据所述预测模型获取预设天数前的历史样本的所述预测值;利用pav算法根据所述历史样本的所述预测值与所述历史样本的所述标签获取所述预测值与所述房源成交概率的对应关系表;根据所述预测模型的预测值和所述对应关系表得到所述预测房源在所述预设时间内的房源成交概率。

根据预测模型的输出可以得到一个0~1之间的值,比如0.2,如果认为所述房源的成交概率为20%,可能误差较大。为进一步提高预测精度,可利用历史样本对预测模型的输出进行修正。根据历史样本的预测值和历史样本的标签(也即实际的房源成交概率),得到历史样本所反映的模型的预测值和房源成交概率的对应关系表。由于得出所述对应关系表需要知道历史样本的实际的房源成交概率,因此如果要预测14天以内的房源成交概率,则所选择的历史样本需至少距预测日14天。由于历史样本的日期与预测日越接近,预测精度越高,因此可选择预测日14天前的历史样本得到所述对应关系表。

选择好历史样本后,将所述历史样本(如14天前的数据特征)输入到所述预测模型,得到所述历史样本的所述预测值;由于所述历史样本的标签即为所述历史样本在样本日后14天的房源成交概率,是实际已知的房源成交概率,因此利用pav算法可以根据所述历史样本的所述预测值与所述历史样本的所述标签获取所述预测值与所述房源成交概率的对应关系表;将所述预测模型的预测值和所述对应关系表进行对照,可以得到所述预测房源在所述预设时间内的房源成交概率。

在上述实施例的基础上,本发明实施例通过利用历史数据的预测值对预测模型的输出进行修正,提高了预测的精度和可靠度。

图3为本发明实施例提供的基于xgboost的房源成交预估平台结构示意图。如图3所示,所述预估平台包括样本生成模块10、标签添加模块20、机器学习模块30和预测模块40,其中:

样本生成模块10具体用于获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;

样本生成模块10首先通过sparksql从数据仓库获取房源数据,所述房源数据为与所述房源有关的原始记录数据。为得到机器学习的训练样本,则根据所述房源数据进行统计得到房源的特征数据,所述房源的特征数据可以用来生成样本。为达到更好的预测效果,所述房源的特征数据可以为多个。由一套房源同一日的所述特征数据构成一个样本。

标签添加模块20具体用于对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;

所述预设时间为所述样本的样本日后的一段时间,如所述预设时间可以为样本日后14天内,则所述标签为样本日后14天内的房源成交概率。标签添加模块20对每个所述样本添加标签,如果预测14天内的房源成交概率,所述标签为所述房源在样本日后14天内的房源实际成交情况,如果成交,则所述标签设置为1;如未成交,则所述标签设置为0。

机器学习模块30具体用于对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;

机器学习模块30对具有所述标签的样本集利用xgboost进行监督学习,输入为样本及标签,所述样本为所述特征数据,所述标签为所述预设时间内的房源成交概率,输出为所述预设时间内的房源成交概率。通过xgboos算法的监督学习,当输出与标签值满足一定精度要求的时候,得到所述预测模型。

预测模块40具体用于将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

得到所述预测模型后,预测模块40将预测房源当日的所述特征数据输入到所述预测模型,根据所述预测模型的输出即所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。预测的时间跨度应与进行机器学习时的训练样本标签的时间跨度相同,即,如果所述标签为样本日后14天内的房源成交概率,则预测模型的预测值也为预测样本日后14天内的房源成交概率。所述预测模型的预测值为0~1间的值。

为了使得预测模型对现有市场规律把握更准确,每天新的数据特征及样本生成后会更新样本集重新训练,得到新的预测模型。

本发明实施例通过将xgboost运用到实际的房屋在售成交预估场景中,能够提供可靠的个体及整体房屋的成交前景;成交预估可实现无人值守自动化运行,减少了人力资源浪费。

进一步地,基于上述实施例,所述样本生成模块10还用于:对所述房源数据进行统计获取房源的基础特征数据;对所述房源数据进行统计获取房源的统计特征数据;根据所述房源的基础特征数据和所述房源的统计特征数据得到所述房源的特征数据。

样本生成模块10对所述房源数据进行统计获取房源的基础特征数据,所述房源的基础特征数据一般为数量统计值、是或否的统计等;对所述房源数据进行统计获取房源的统计特征数据,所述房源的统计特征数据为与分布特征有关的数据。

根据所述房源的基础特征数据和所述房源的统计特征数据得到所述房源的特征数据,所述房源的特征数据包括所述房源的基础特征数据和所述房源的统计特征数据。

对于同一套房屋,其在同一日的特征数据融合到一起构成所述样本,但是在各类特征数据中会有缺失的现象,因此,需要对必要的特征数据进行补全操作。

在上述实施例的基础上,本发明实施例所设定的构成样本的特征数据,既包含由原始数据得出的统计值,又包含进一步进行统计的值,保证了预测样本的全面性。

进一步地,基于上述实施例,所述样本生成模块10还用于:

获取经纪人特征数据,所述经纪人特征数据包括经纪人带看特征数据、经纪人跟进特征数据和维护人特征数据,如经纪人最近14日带看过的不同客户数、经纪人最近14日普通跟进数量、维护人最近90日维护人维护成功概率等;

获取房屋特征数据,所述房屋特征数据包括房屋物理属性数据、房源物理属性数据、三证核验特征数据和翻录特征数据,如物理楼层、是否唯一、近14天是否存在三证核验、本房被翻录次数等;

获取客源特征数据,所述客源特征数据包括客源电话特征数据、线上特征数据和意向金特征数据,如近14天是否存在400电话、近14天是否存在关注、近14天是否存在意向金等。

获取业主特征数据,所述业主特征数据包括业主线上特征数据和调价特征数据,如最近14日业主曝光数量、最近14日调价次数等;

获取市场特征数据,所述市场特征数据包括供需比特征数据和成交周期特征数据,如最近30日房源所在小区带看过的不同客户数、最近90天房源所在小区同居室成交周期等;

获取价格特征数据,所述价格特征数据包括小区均价特征数据和价格排名特征数据,如房源所在小区的拟合日均价、源所在小区同居室总价排名等。

在上述实施例的基础上,本发明实施例通过设定6大类、16小类基础特征数据,即包含了房屋个体特征数据,又包含了市场特征数据,保证了样本数据特征的全面性,有利于提高机器学习的精度。

进一步地,基于上述实施例,所述样本生成模块10还用于:根据所述房源数据统计预设特征的最大值、最小值、众数值、平均值和标准差值,从而得到所述房源的统计特征数据。

选择部分与基础特征数据对应的具有分布特征规律的特征作为所述预设特征,样本生成模块10统计所述预设特征的最大值、最小值、众数值、平均值和标准差值,从而得到所述房源的统计特征数据。

在上述实施例的基础上,本发明实施例通过设定可以反映分布特征的统计特征数据,保证了样本数据特征的全面性,有利于提高机器学习的精度。

进一步地,基于上述实施例,所述预测模块40还用于:根据所述预测模型获取预设天数前的历史样本的所述预测值;利用pav算法根据所述历史样本的所述预测值与所述历史样本的所述标签获取所述预测值与所述房源成交概率的对应关系表;根据所述预测模型的预测值和所述对应关系表得到所述预测房源在所述预设时间内的房源成交概率。

为进一步提高预测精度,预测模块40可利用历史样本进行对预测模型的输出进行修正。根据历史样本的预测值和历史样本的标签得到历史样本所反映的模型的预测值和房源成交概率的对应关系表。由于得出所述对应关系表需要知道历史样本的实际的房源成交概率,因此如果要预测14天以内的房源成交概率,则所选择的历史样本需至少距预测日14天。

预测模块40选择好历史样本并将所述历史样本输入到所述预测模型,得到所述历史样本的所述预测值;利用pav算法可以根据所述历史样本的所述预测值与所述历史样本的所述标签获取所述预测值与所述房源成交概率的对应关系表;将所述预测模型的预测值和所述对应关系表进行对照,可以得到所述预测房源在所述预设时间内的房源成交概率。

在上述实施例的基础上,本发明实施例通过利用历史数据的预测值对预测模型的输出进行修正,提高了预测的精度和可靠度。

本发明实施例提供的平台是用于上述方法的,具体功能可参照上述方法流程,此处不再赘述。

图4为本发明实施例提供的电子设备的结构示意图。如图4所示,电子设备1包括处理器401、存储器402和总线403。其中,所述处理器401和所述存储器402通过所述总线403完成相互间的通信;所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取房源数据,根据所述房源数据得到房源的特征数据,一套房源同一日的所述特征数据构成一个样本;对每个所述样本添加标签,所述标签为预设时间内的房源成交概率;对具有所述标签的样本集利用xgboost进行监督学习,得到预测模型;将预测房源的所述特征数据输入到所述预测模型,根据所述预测模型的预测值得到所述预测房源在所述预设时间内的房源成交概率。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1