成交量预测方法、装置、终端及计算机可读存储介质与流程

文档序号:18011952发布日期:2019-06-26 00:14阅读:221来源:国知局
成交量预测方法、装置、终端及计算机可读存储介质与流程

本发明涉及机器学习技术领域,尤其涉及一种成交量预测方法、装置、终端及计算机可读存储介质。



背景技术:

随着经济的发展,房地产市场对国民经济、人民生活的影响越来越大,因此需要对房地市场进行管控。对房地产市场进行管控需要对未来一段时间内的房屋成交量预测,然而现有技术中,对房屋成交量的预测需要分析师的专业知识判定,需要耗费过多的分析师的时间和精力,而且人工分析过程中,容易忽略掉一些重要的影响因素,导致预测得到的房屋成交量的结果并不准确。



技术实现要素:

本发明的主要目的在于提供一种成交量预测方法、装置、终端及计算机可读存储介质,旨在解决房屋成交量的预测结果不准确、效率低的技术问题。

为实现上述目的,本发明提供一种成交量预测方法,包括步骤:

获取目标地区多个预设时间段内的历史成交量,并将各预设时间段内的历史成交量作为目标变量;

获取每个所述预设时间段之前预设时长内的相关数据作为与每个目标变量对应的训练数据;

利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型;

获取目标时刻之前目标地区预设时长内的相关数据,并将所述目标时刻之前目标地区预设时长内的相关数据代入所述成交量预测模型得到所述目标时刻所述目标地区的成交量。

优选地,所述利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型的步骤包括:

根据各目标变量及对应的训练数据获取计算式;

将每个目标变量对应的训练数据代入计算式得到对应的计算值,并计算所述目标变量与对应的计算值之间的偏差;

判断所述偏差是否在第一预设范围内;

若所述偏差不在第一预设范围内,则根据所述偏差调整所述计算式;

将每个目标变量对应的训练数据重新代入调整后的计算式得到对应的计算值,并记录代入计算的次数,直到偏差在第一预设范围内;

若偏差在第一预设范围内,则将偏差在第一预设范围内时对应的计算式作为所述成交量预测模型。

优选地,所述根据所述偏差调整所述计算式的步骤包括:

根据偏差产生调整式;

将调整式与计算式的和作为调整后的计算式。

优选地,所述利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型的步骤包括:

若偏差不在第一预设范围内,则计算上次代入计算的偏差与本次代入计算的偏差的差值;

判断差值是否在第二预设范围内;

若差值在第二预设范围内,则返回步骤:根据各目标变量及对应的训练数据获取计算式;

若差值不在第二预设范围内,则执行步骤:根据所述偏差调整所述计算式。

优选地,所述利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型的步骤还包括:

若差值不在第二预设范围内,则判断所述代入计算的次数是否大于或等于预设次数;

若所述代入计算的次数大于或等于预设次数,则选择预设个距离所述目标时刻最近的预设时间段对应的历史成交量作为目标变量。

优选地,所述判断偏差是否在第一预设范围内的步骤包括:

将各计算值与目标变量的差值的平方的均值作为偏差参考值;

判断所述偏差参考值是否在第一预设范围内。

优选地,所述利用预设训练模型对训练数据和对应的目标变量进行训练得到成交量预测模型的步骤之前,所述成交量的预测方法还包括步骤:

获取多个样本数据及与每个样本数据对应的标准值;

利用多个训练方式根据样本数据及对应的标准值进行训练得到多个最优计算式;

将样本数据代入各个最优计算式得到多个参考值,并计算每个最优计算式对应的标准值与参考值的均方根误差值;

将均方根误差值最小的最优计算式对应的训练方式作为预设训练方式。

本发明还提供一种成交量预测装置,包括:

成交量获取模块,用于获取目标地区多个预设时间段内的历史成交量,并将各预设时间段内的历史成交量作为目标变量;

相关数据获取模块,用于获取每个所述预设时间段之前预设时长内的相关数据作为与每个目标变量对应的训练数据;

训练模块,用于利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型;

预测模块,用于获取目标时刻之前目标地区预设时长内的相关数据,并将所述目标时刻之前目标地区预设时长内的相关数据代入所述成交量预测模型得到所述目标时刻所述目标地区的成交量。

本发明还提供一种终端,所述终端包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的成交量预测程序,其中所述成交量预测程序被所述处理器执行时,实现如上任一项所述的成交量预测方法的步骤。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有成交量预测程序,其中所述成交量预测程序被处理器执行时,实现如上任一项所述的成交量预测方法的步骤。

本发明技术方案中,获取目标地区多个预设时间段内的历史成交量,并将各预设时间段内的历史成交量作为目标变量;获取每个预设时间段之前预设时长内的相关数据作为与每个目标变量对应的训练数据;利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型;获取目标时刻之前目标地区预设时长内的相关数据,并将目标时刻之前目标地区预设时长内的相关数据代入成交量预测模型得到目标时刻目标地区的成交量。如此,先利用预设训练方式根据目标变量及对应的训练数据训练得到成交量预测模型,然后将相关数据代入成交量预测模型即可预测目标时刻目标地区的成交量,相关数据可直接从数据库或相关管理单位获得,预测过程由成交量预测模型执行,从而可以准确地预测房屋成交量,而且可有提升预测房屋成交量的效率。

附图说明

图1为本发明实施例方案中涉及的终端的硬件结构示意图;

图2为本发明成交量预测方法第一实施例的流程示意图;

图3为本发明成交量预测方法第二实施例的流程示意图;

图4为本发明成交量预测方法第三实施例的流程示意图;

图5为本发明成交量预测方法第四实施例的流程示意图;

图6为本发明成交量预测方法第五实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例涉及的成交量预测方法主要应用于终端,该终端可以是pc、便携计算机、移动终端等具有显示和处理功能的终端。

参照图1,图1为本发明实施例方案中涉及的终端结构示意图。本发明实施例中,终端可以包括处理器1001(例如cpu),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口);存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的硬件结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及成交量预测程序。

在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的成交量预测程序,并执行以成交量预测方法的步骤。

基于上述终端的硬件结构,提出本发明成交量预测方法的各个实施例。

本发明提供一种成交量预测方法。

请参阅图2,在本发明一实施例中,成交量预测方法包括以下步骤:

s11:获取目标地区多个预设时间段内的历史成交量,并将各预设时间段内的历史成交量作为目标变量;

本发明实施例的成交量预测方法可由本发明实施例的终端执行。可先获取目标地区n个预设时间段内的房屋历史成交量,并作为目标变量。例如,当目标地区为上海市、预设时间段为2018年6月、7月、8月、9月和10月,可将上海市2018年6、7、8、9、10这5个月内的内的房屋历史成交量作为目标变量。历史成交量可以从目标地区的房管局获得。

s12:获取每个预设时间段之前预设时长内的相关数据作为与每个目标变量对应的训练数据;

预设时长为预测成交量所用到的历史相关数据的时间范围,预设时长可以是3个月,可获取上海市2018年3-9月的相关数据,其中3-5月的相关数据作为6月对应的目标变量的训练数据,4-6月的相关数据作为7月对应的目标变量的训练数据,5-7月的相关数据作为8月对应的目标变量的训练数据,6-8月的相关数据作为9月对应的目标变量的相关数据,7-9月的相关数据作为10月对应的目标变量的相关数据。当然在其他实施例中,预设时长也可以为其他时长,在此不做限制。

相关数据包括但不限于目标地区的税收收入绝对额、人民币存款余额、人民币贷款余额、保费收入、制造业pmi、商品房待销售面积、商品房竣工面积、商品房可售面积、常驻人口数量、价格指数、景气指数、股票价格指数、土地出让面积、开工面积、固定资产累计绝对额等,这些相关数据都可以从国家统计局获得。

s13:利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型;

先根据目标变量和对应的训练数据利用预设训练方式进行训练,训练出可根据训练数据得到与训练数据对应的目标变量的成交量预测模型。预设训练方式可以由开发人员预先设置。本实施例中,预设训练方式为gbrt。具体地,在利用gbrt进行训练时,可先将目标变量作为偏差确定最初的计算式,然后将各目标变量对应的相关数据分别代入计算式,得到多个计算值,然后比较多个计算值与对应的目标变量的偏差,根据偏差调整计算式,再将各相关数据代入调整后的计算式中,直到各计算值与对应的目标变量的偏差在预设范围内,将最终的计算式作为成交量预测模型。

s14:获取目标时刻之前目标地区预设时长内的相关数据,并将目标时刻之前目标地区预设时长内的相关数据代入成交量预测模型得到目标时刻目标地区的成交量。

得到成交量预测模型之后,该成交量预测模型可实现根据输入的相关数据输出成交量,那么将目标时刻之前目标地区预设时长内的相关数据代入成交量预测模型即可得到目标时刻目标地区的成交量。

本发明实施例中,获取目标地区多个预设时间段内的历史成交量,并将各预设时间段内的历史成交量作为目标变量;获取每个预设时间段之前预设时长内的相关数据作为与每个目标变量对应的训练数据;利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型;获取目标时刻之前目标地区预设时长内的相关数据,并将目标时刻之前目标地区预设时长内的相关数据代入成交量预测模型得到目标时刻目标地区的成交量。如此,先利用预设训练方式根据目标变量及对应的训练数据训练得到成交量预测模型,然后将相关数据代入成交量预测模型即可预测目标时刻目标地区的成交量,相关数据可直接从数据库或相关管理单位获得,预测过程由成交量预测模型执行,从而可以准确地预测房屋成交量,而且可有提升预测房屋成交量的效率。

需要说明的是,通过本实施例中的步骤s11-s13得到成交量预测模型之后,可保存该成交量预测模型。需要再次预测目标地区的房屋的成交量时,可以不执行s11-s13,而直接将目标时刻前预设时间段的相关数据代入成交量模型即可预测该目标地区目标时刻的成交量。

请参阅图3,基于上述实施例,步骤s13包括步骤:

s131:根据各目标变量及对应的训练数据获取计算式;

目标变量有多个,可将每个目标变量及对应的训练数据理解为1个散点,那么多个目标变脸及对应的训练数据则为多个散点,可根据多个散点随机确定一个与这些散点较接近的函数曲线,将该函数曲线对应的多项式作为计算式,训练过程可理解为通过调整计算式将该函数曲线调整至更接近这些散点或使得该函数曲线经过这些散点。

s132:将每个目标变量对应的训练数据代入计算式得到对应的计算值,并计算目标变量与对应的计算值之间的偏差;

将每个训练数据代入计算式得到的计算值即为该函数曲线对应的函数值。可通过计算值与目标变量之间的偏差反应该函数曲线与上述多个散点之间的偏差。

s133:判断偏差是否在第一预设范围内;

可通过判断偏差是否在第一预设范围内,来判断散点与该函数曲线的偏差。具体地,可先将各计算值与目标变量的差值的平方的均值作为偏差参考值;然后判断偏差参考值是否在第一预设范围内。例如,有5个目标变量时,那么对应的有5个计算值,将5个计算值与对应的目标变量比对,先将计算值减对应的目标变量的差值的平方,然后将各计算值减对应的目标变量的差值的平方的平均值作为偏差,再将偏差与第一预设范围比对,并判断偏差是否在第一预设范围内。第一预设范围例如可以为大于或等于0,小于或等于a,其中a为预设值。预设值可以由开发人员根据成交量预测的准确度的需求预先设定,例如,对成交量预测的准确度的需求较高时,可将预设值设定为较小值;对成交量预测的准确度的需求较低时,可将预设值设定为相对较大的值,这样可以缩短训练时间,可更快地得到成交量预测模型。

s134:若偏差不在第一预设范围内,则根据偏差调整计算式;

若偏差不在第一预设范围内,说明通过该计算式得到的计算值达不到成交量预测的准确度的要求,不能得到准确地成交量,则需要根据偏差调整计算式。本实施例中,先根据偏差产生调整式,然后将调整式与计算式的和作为调整后的计算式。当然,在其他实施例中,也可以通过调整计算式中的其他参数来调整计算式。

偏差不在第一预设范围内时,将每个目标变量对应的训练数据重新代入调整后的计算式得到对应的计算值,并记录代入计算的次数,直到偏差在第一预设范围内;

s135:若偏差在第一预设范围内,则将偏差在第一预设范围内时对应的计算式作为成交量预测模型。可理解为在步骤s134之后,循环执行步骤s132-s134,直到偏差在第一预设范围内。当偏差在第一预设范围内时,说明通过该计算式得到的计算值可达到成交量预测的准确度的要求,则可将偏差在第一预设范围内时对应的计算式作为成交量预测模型。如此,得到的成交量预测模型可准确地预测目标时刻目标地区的房屋成交量。

请参阅图4,基于上述实施例,步骤s13还包括步骤:

s136:若偏差不在第一预设范围内,则计算上次代入计算的偏差与本次代入计算的偏差的差值;

可将每执行一次步骤s132-s134理解为依次代入计算。将两次代入计算得到的偏差进行比较,得到偏差的差值。具体地,偏差为各计算值减对应的目标变量的差值的平方的平均值,将本次代入计算的偏差减去上次代入计算的偏差即可得到偏差的差值。

s137:判断差值是否在第二预设范围内;

偏差的差值反应本次代入计算得到的计算值相比较于上次代入计算的得到的计算值是否更接近于目标变量。第二预设范围为大于b,其中b→0,如果差值没有变化或者差值为正数,则说明本次代入计算得到的计算式并没有更接近目标变量,也即计算值已经收敛于另外的数值而不是目标变量,或者计算值朝着远离目标变量的方向变化,这种情况下继续调整计算式进行代入计算很可能无法使得偏差在第一预设范围内。因此需要通过判断差值是否在第二预设范围内,来判断本次代入计算得到的计算值相比较于上次代入计算的得到的计算值是否更接近于目标变量。

若差值在第二预设范围内,则返回步骤s131:根据各目标变量及对应的训练数据获取计算式;如果差值在第二预设范围内,则计算值已经收敛于另外的数值而不是目标变量,或者计算值朝着远离目标变量的方向变化,继续调整计算式进行代入计算很可能无法使得偏差在第一预设范围内,因此需要返回步骤s131,根据各目标变量及对应的训练数据重新获取计算式,在该计算式的基础上,进行新一轮的代入计算。如此,可在计算值已经收敛于另外的数值而不是目标变量,或者计算值朝着远离目标变量的方向变化时,重新确定计算式,有效地提高训练效率,从而有助于尽快得到成交量预测模型。

若差值不在第二预设范围内,则执行步骤s134:根据偏差调整计算式。

步骤s136和步骤s137在步骤s134之前执行。如果差值不在第二预设范围内,寿命本次代入计算得到的计算值相比较于上次代入计算的得到的计算值更接近于目标变量,可在该计算式的基础上继续进行代入计算,也即执行步骤s134:根据偏差调整计算式,并继续执行步骤s132和步骤s133。

请参阅图5,基于上述实施例,步骤s13还包括步骤:

s138:若差值不在第二预设范围内,则判断代入计算的次数是否大于或等于预设次数;

步骤s138在步骤s137之后执行,可在步骤s134之后执行,也可以与步骤s134同时执行,也可以在步骤s134之后执行。当差值不在第二预设范围内时,判断代入计算的次数是否大于或等于预设次数,这样当相关数据较多时,可能出现代入计算的次数较大,也即进行了长时间训练仍然没有得到成交量预测模型的情况,这样导致获得成交量预测模型的效率较低。因此,判断代入计算的次数是否大于或等于预设次数,以便于在进行了长时间训练仍然没有得到成交量预测模型时,采取对应的措施以加快训练速度,尽快地得到成交量预测模型。

s139:若代入计算的次数大于或等于预设次数,则选择预设个距离目标时刻最近的预设时间段对应的历史成交量作为目标变量。

若代入计算的次数大于或等于预设次数,则说明进行了长时间训练仍然没有得到成交量预测模型,那么在后续的代入计算的过程中,可通过选择预设个距离目标时刻最近的预设时间段对应的历史成交量作为目标变量来加快训练速度,也即减少目标变量的个数,在后续执行步骤s132时,只需要将预设个距离目标时刻最近的预设时间段对应的目标变量代入计算式得到计算值。例如,本来由5个目标变量,当代入计算的次数大于或等于预设次数时,则仅将距目标时刻最近的预设时间段对应的3个历史成交量作为目标变量,也即仅保留距目标时刻最近的预设时间段对应的3个目标变量。这样只需要3个目标变量对应的相关数据代入计算式的得到的计算值的偏差在第一预设范围内,即可将该计算式作为成交量预测模型,从而可以加快训练速度,尽快地得到成交量预测模型。

请参阅图6,基于上述实施例,步骤s11之前,成交量的预测方法还包括步骤:

s15:获取多个样本数据及与每个样本数据对应的标准值;

s16:利用多个训练方式根据样本数据及对应的标准值进行训练得到多个最优计算式;

s17:将样本数据代入各个最优计算式得到多个参考值,并计算每个最优计算式对应的标准值与参考值的均方根误差值;

s18:将均方根误差值最小的最优计算式对应的训练方式作为预设训练方式。

步骤s16中,利用多个训练方式根据样本数据及对应的标准值进行训练,训练出可根据样本数据可输出接近样本数据对应的标准值的最优计算式。然后步骤s17中,通过计算每个最优计算式对应的标准值与参考值的均方根误差值,来判断各个最优计算式的准确度,这样可选择出准确度较高的训练方式。步骤s18中将均方根误差值最小的最优计算式对应的训练方式作为预设训练方式,也即将准确度最高的最优计算式对应的训练方式作为预设训练方式。如此,在根据目标变量和对应的训练数据进行训练之前,选择出准确度最高的训练方式,有助于使得得到的成交量预测模型可更加准确地预测房屋的成交量。

此外,本发明还提供一种成交量预测装置。上述任一实施例的成交量预测方法可以由本实施例的成交量预测装置实现,成交量预测装置包括:

成交量获取模块,用于获取目标地区多个预设时间段内的历史成交量,并将各预设时间段内的历史成交量作为目标变量;

相关数据获取模块,用于获取每个预设时间段之前预设时长内的相关数据作为与每个目标变量对应的训练数据;

训练模块,用于利用预设训练方式根据目标变量和对应的训练数据进行训练得到成交量预测模型;

预测模块,用于获取目标时刻之前目标地区预设时长内的相关数据,并将目标时刻之前目标地区预设时长内的相关数据代入成交量预测模型得到目标时刻目标地区的成交量。

进一步地,训练模块包括:

计算式获取单元,用于根据各目标变量及对应的训练数据获取计算式;

代入单元,用于将每个目标变量对应的训练数据代入计算式得到对应的计算值,并计算目标变量与对应的计算值之间的偏差;

第一判断单元,用于判断偏差是否在第一预设范围内;

调整单元,用于在偏差不在第一预设范围内时,根据偏差调整计算式;

代入单元还用于将每个目标变量对应的训练数据重新代入调整后的计算式得到对应的计算值,并记录代入计算的次数,直到偏差在第一预设范围内;

执行单元,用于将差值在第一预设范围内时对应的计算式作为成交量预测模型。

进一步地,调整单元包括:

第一调整子单元,用于根据偏差产生调整式;

第二调整子单元,用于将调整式与计算式的和作为调整后的计算式。

进一步地,训练模块还包括:

差值计算单元,用于在偏差不在第一预设范围内时,计算上次代入计算的偏差与本次代入计算的偏差的差值;

第二判断单元,用于判断差值是否在第二预设范围内;

计算式获取单元还用于在差值在第二预设范围内时,根据各目标变量及对应的训练数据获取计算式;

调整单元还用于在差值不在第二预设范围内时,根据偏差调整计算式。

进一步地,训练模块还包括:

第三判断单元,用于在差值不在第二预设范围内时,判断代入计算的次数是否大于或等于预设次数;

选择单元,用于在代入计算的次数大于或等于预设次数时,选择预设个距离目标时刻最近的预设时间段对应的历史成交量作为目标变量。

进一步地,第一判断单元包括:

计算子单元,用于将各计算值与目标变量的差值的平方的均值作为偏差参考值;

判断子单元,用于判断偏差参考值是否在第一预设范围内。

进一步地,成交量的预测装置还包括:

样本获取模块,用于获取多个样本数据及与每个样本数据对应的标准值;

最优计算式获取模块,用于利用多个训练方式根据样本数据及对应的标准值进行训练得到多个最优计算式;

代入模块,用于将样本数据代入各个最优计算式得到多个参考值,并计算每个最优计算式对应的标准值与参考值的均方根误差值;

设定模块,用于将均方根误差值最小的最优计算式对应的训练方式作为预设训练方式。

其中,上述成交量预测装置中各个模块的功能实现与上述成交量预测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

此外,本发明还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有成交量预测程序,计算机可读存储介质上存储有成交量预测程序,其中成交量预测程序被处理器执行时,实现如上述任一实施例的成交量预测方法的步骤。

其中,成交量预测程序被执行时所实现的方法可参照本发明成交量预测方法的各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1