小区均价预估方法、电子装置及存储介质与流程

文档序号:17445163发布日期:2019-04-17 05:27阅读:122来源:国知局
小区均价预估方法、电子装置及存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种小区均价预估方法、电子装置及计算机可读存储介质。



背景技术:

房产估价的理论方法在过去很长一段时间已经得到充分验证,市场比较法是目前公认最有效的房产评估模型建设理论,但采用市场比较法有较高的门槛,具体表现在:第一,需要收集大量、正常的房地产交易数据。第二,采用市场比较法必须要求房价相对稳定。

传统的市场比较法估价模型过分依赖评估人员的主观经验,这不仅使得估价结果不可靠,更有可能引发道德风险,阻碍房地产估价业的良性发展。同时,市场比较法估价需要对大量的人文、社会、经济、地理数据进行采集、管理、分析和显示,传统的手工管理方式显然无法满足房产估价对大量信息的处理要求,利用新的技术手段改进估价模型、建立估价信息系统是估价行业发展的一个必然趋势。



技术实现要素:

鉴于以上内容,本发明提供一种小区均价预估方法、电子装置及计算机可读存储介质,其主要目的在于提高目标小区均价预估的准确性。

为实现上述目的,本发明提供一种小区均价预估方法,该方法包括:

s1、接收客户端发送的基于目标小区的均价预估请求;

s2、获取与所述目标小区之间的距离在预设范围内的周边小区,从所述周边小区中筛选出所述目标小区对应的多个相似小区,生成相似小区列表;

s3、从预设渠道获取所述相似小区列表中多个相似小区在预设时间内的历史记录,根据预设的小区均价预估规则分别确定所述多个相似小区的第一均价,其中,所述历史记录包括历史挂牌记录及历史成交记录;及

s4、根据所述多个相似小区的第一均价计算所述目标小区的均价,将所述目标小区的均价发送至客户端。

优选地,所述步骤s2包括:

s21、获取所述周边小区及所述目标小区的属性信息,并将所述属性信息指标化以确定所述周边小区及所述目标小区的第二属性指标;及

s22、将所述周边小区及所述目标小区的第二属性指标输入预先训练好的小区相似度模型,根据模型输出结果分析所述目标小区的相似小区列表。

优选地,所述步骤s3包括:

s31、根据所述历史记录分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价;及

s32、分别将所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价输入预先训练好的第一小区均价预估模型中,得到所述多个相似小区的第一均价。

优选地,所述步骤s31包括:

获取每条所述历史记录的描述信息,根据所述描述信息分别确定所述多个相似小区中各房源对应的历史记录;

分别分析并确定所述多个相似小区中各房源在预设时间内的历史挂牌价格及历史成交价格;及

分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

优选地,所述相似小区列表中包括多个相似小区及所述多个相似小区分别与所述目标小区的相似度,所述步骤s4包括:

根据所述多个相似小区与目标小区的相似度分别确定所述多个相似小区对应的权重;及

根据所述权重对所述多个相似小区的第一均价进行加权计算得到所述目标小区的第一均价。

优选地,所述步骤s4包括:

计算所述多个相似小区的第一均价的平均值得到所述目标小区的第一均价。

优选地,所述步骤s4可替换为:

s5、分别将所述多个相似小区在预设时间内的历史挂牌均价、历史成交均价及第一均价输入基于小波神经网络训练得到的第二小区均价预估模型,得到所述多个相似小区的第二均价;及

s6、根据所述多个相似小区的第二均价计算所述目标小区的均价。

此外,为实现上述目的,本发明还提供一种电子装置,该装置包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的小区均价预估程序,所述小区均价预估程序被所述处理器执行时,可实现如上所述小区均价预估方法中的任意步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括小区均价预估程序,所述小区均价预估程序被处理器执行时,可实现如上所述小区均价预估方法中的任意步骤。

本发明提出的小区均价预估方法、电子装置及计算机可读存储介质,从目标小区的周边小区中确定目标小区的相似小区,利用相似小区的历史记录对各相似小区的均价进行预估,然后根据相似小区的均价计算目标小区的均价,提高了目标小区均价预估的准确性;另外,通过对各相似小区的均价进行二次预估,提高了各相似小区均价预估的准确性,然后利用各相似小区二次预估均价计算目标小区的均价,提高了目标小区均价预估的准确性。

附图说明

图1为本发明小区均价预估方法较佳实施例的流程图;

图2为本发明小区均价预估方法另一个较佳实施例的流程图;

图3为本发明电子装置较佳实施例的示意图;

图4为图3中小区均价预估程序较佳实施例的程序模块示意图

图5为图3中小区均价预估程序另一个较佳实施例的程序模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种小区均价预估方法。参照图1所示,为本发明小区均价预估方法较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。

在所述小区均价预估方法的第一实施例中,该方法包括步骤s1-s4。

s1、接收客户端发送的基于目标小区的均价预估请求。

用户通过客户端提交预估请求,请求中包括预估标的:目标小区均价。

s2、获取与所述目标小区之间的距离在预设范围内的周边小区,从所述周边小区中筛选出所述目标小区对应的多个相似小区,生成相似小区列表。

预设范围可以举例为:在目标小区的半径1.5km的范围内。

需要说明的是,本实施例中的周边小区是有历史记录的小区,对于在目标小区半径1.5km的范围内、但没有历史记录的小区会被过滤掉,历史记录包括历史挂牌记录及历史挂牌记录。

在确定目标小区对应的相似小区过程中,需要根据各周边小区及目标小区的属性信息来判断,属性信息大致相同,可认为两小区互为相似小区。优选地,本实施例中的所述步骤s2包括:

s21、获取所述周边小区及所述目标小区的属性信息,并将所述属性信息指标化以确定所述周边小区及所述目标小区的第二属性指标。

属性信息包括:小区主要属性,包括楼栋数、户数、容积率、绿化率等;小区建筑类型,包括层高、户型面积等;小区周边配套设施,包括商业、医院、学校、公园等。

上述将所述目标小区的属性信息指标化的过程,以绿化率为例:

其中,α、β、c均为大于0、小于1的数,且α<β<c。

对上述属性信息指标化后,生成属性信息对应的单列矩阵,矩阵中各属性指标的顺序是预先确定的。

需要说明的是,在对属性信息进行指标化的过程中,还需要对各属性信息进行标准化及缺失值填补等处理。例如,当某两个指标之间差值较大时,采用z-score标准化方法对该指标进行处理,当某指标有缺失时,可利用missforest包对该指标的缺失值进行补充。

s22、将所述周边小区及所述目标小区的第二属性指标输入预先训练好的小区相似度模型,根据模型输出结果分析所述目标小区的相似小区列表。

本实施例中的模型输出结果为第一列表,第一列表中包括各周边小区及各周边小区对应的相似度。

优选地,为了提高相似小区的准确性,步骤s22还包括:

当存在相似度超过第一预设阈值的周边小区时,选择相似度超过第一预设阈值的周边小区作为相似小区,生成第二列表;当不存在相似度超过第一预设阈值的周边小区时,取预设数量的相似度最高的周边小区作为相似小区,生成第二列表。

得到模型输出的各周边小区与目标小区的相似度后,根据相似度的高低顺序对各周边小区进行排序,并选择相似度高的周边小区作为目标小区的相似小区,得到第二列表。

第二列表即为目标小区的相似小区列表。第一预设阈值及预设数量可根据需求进行调整,例如,第一预设阈值为0.65,预设数量为3。

在本实施例中,所述相似度小区模型的训练步骤包括:获取指定小区预设范围内(例如,在指定小区半径1.5km的范围内)的各周边小区的属性信息及价格信息,将各周边小区的属性信息指标化;利用k-means聚类方法,对各指定小区对应的周边小区进行聚类,得到各指定小区对应的周边小区的多个分类结果;分别判断各个分类结果中的周边小区与指定小区是否满足预设条件(例如,属性相近、价格差异小于等于10%);将满足上述预设条件的分类结果及对应的指定小区的属性信息作为x,对应的y为“1”,作为正样本;否则,将不满足上述预设条件的分类结果及对应的指定小区的属性信息作为x,对应的y为“0”,作为负样本,确定样本数据。将样本数据划分为训练集及测试集,利用训练集中的样本数据对bp(backpropagation)神经网络进行训练,得到小区相似度模型;利用测试集中的样本数据对bp神经网络进行测试,直到模型满足预设条件(例如,误差率小于或等于5%)为止。

需要说明的是,当所有的分类结果都无法同时满足属性相近、且价格差异小的情况时,可以对价格差异进行调整,例如,调整为15%。

进一步地,所述“利用k-means聚类方法,对各指定小区对应的周边小区进行聚类,得到各指定小区对应的周边小区的多个分类结果”的步骤包括:首先,从各指定小区对应的多个周边小区中任意选择k个周边小区的指标化后的属性信息及价格信息作为第一聚类中心;然后,分别计算多个周边小区的属性信息及价格信息与第一聚类中心的相似度,将多个周边小区依次分配至相似度最大值对应的聚类中心,得到k个聚类;其中,相似度算法为:先计算周边小区与各聚类中心的各个属性间的局部相似度,然后对各个局部相似度加权平均,即可得到综合的相似度。接着,再计算k个聚类的第二聚类中心(例如,取各聚类中所有对象的均值作为第二聚类中心);最后,不断重复这一过程直到标准测度函数开始收敛为止,本实施例采用均方差作为标准测度函数。

以建筑年代(y)这一属性指标为例,周边小区l与指定小区q的局部相似度的计算公式为:

zly=1-|yl-yq|/|δymax|

其中,zly为周边小区l与指定小区q在属性指标y上的局部相似度,yl为周边小区l的属性指标y对应的指标值,yq为指定小区q的属性指标y对应的指标值,δymax为所有周边小区中与指定小区建筑年代差的最大值。

s3、从预设渠道获取所述相似小区列表中多个相似小区在预设时间内的历史记录,根据预设的小区均价预估规则分别确定所述多个相似小区的第一均价。

不同城市的预设渠道可能不同,以深圳为例,预设渠道包括:链家、szhome、中原、家家顺、搜房等平台。在步骤s1之前,该方法还包括:预设所述多个预设渠道的优先级别。各渠道的优先级为专家根据各渠道数据的可信度制定的,例如,上述5个渠道的优先级为:链家>szhome>中原>家家顺>搜房。

优选地,本实施例中的所述步骤s3包括:

s31、根据所述历史记录分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

相似小区的历史挂牌均价与历史成交均价与该相似小区中每套房源的历史挂牌价格及历史成交价格紧密相关。因此,首先,确定相似小区中各房源对应的历史挂牌记录及历史成交记录,然后,分别确定各房源的历史挂牌价格及历史成交价格,最后,计算相似小区的历史挂牌均价及历史成交均价。需要说明的是,本发明并不要求同一套房源同时有历史挂牌记录及历史成交记录。

s32、分别将所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价输入预先训练好的第一小区均价预估模型中,得到所述多个相似小区的第一均价。

本实施例中的所述第一小区均价预估模型是基于多变量灰度关联预测模型训练得到的。所述第一均价即为对各相似小区均价进行一次预估的结果。

在模型训练过程中,自变量x=[(x1a,x1b),(x2a,x2b),…,(xia,xib)],因变量y=[y1,y2,…,yi],其中,xia表示指定小区i在2017.12-2018.7内的连续六个月(时间序列的长短可调整)的历史挂牌均价,xib表示指定小区i在2017.12-2018.7内的连续六个月(时间序列的长短可调整)的历史成交均价,且xia,xib均为历史挂牌均价、历史成交均价对应的时间序列;yi表示指定小区在2017.12-2018.7内的连续六个月(时间序列与x保持一致)的小区历史均价。

优选地,本实施例中的所述步骤s31包括:a1-a3,其中:

a1、获取每条所述历史记录的描述信息,根据所述描述信息分别确定所述多个相似小区中各房源对应的历史记录。上述描述信息中包括描述房源地理位置的位置信息,例如,xx市xx区xx路xx小区xx期xx单元xx楼xx号。利用所有历史记录的描述信息确定各相似小区对应的所有历史记录。

a2、分别分析并确定所述多个相似小区中各房源在预设时间内的历史挂牌价格及历史成交价格。

优选地,本实施例中的所述步骤a2包括:b1-b4,其中:

b1、当所述相似小区中同一房源对应一条历史挂牌记录/历史成交记录时,读取该历史挂牌记录/历史成交记录中的历史挂牌价格及历史成交价格,作为该房源的历史挂牌价格及历史成交价格;

b2、当所述相似小区中同一房源对应多条历史挂牌记录时,获取该多条历史挂牌记录对应的多个历史挂牌价格;

b3、当所述多个历史挂牌价格一致时,保留任意一个历史挂牌价格作为该房源的历史挂牌价格;或者

b4、当所述多个历史挂牌价格不一致时,取渠道优先级最高者作为该房源的历史挂牌价格。

假设某相似小区的某一房源同时在5个渠道上进行挂牌,那么,该房源存在5条历史挂牌记录,即该房源有5个历史挂牌价格。当5个历史挂牌价格相同时,取任意一个历史挂牌价格作为该房源的历史挂牌价格。当5个房源历史挂牌价格不同时,获取各历史挂牌价格对应的渠道优先级,选择渠道优先级别最高者对应的历史挂牌价格作为该房源的历史挂牌价格。一般情况下,同一个房源仅对应一条历史成交记录,故不用进行去重处理。

通过对相似小区中各房源的历史记录进行去重处理,为后续计算相似小区的历史挂牌均价及历史成交均价奠定基础。

a3、分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

优选地,本实施例中的所述步骤a3包括:c1-c3,其中:

c1、分别计算所述多个相似小区在预设时间内的小区历史均价。小区历史均价是根据相似小区在多个预设渠道中上个月的小区历史价格计算得到的,小区历史价格直接从多个渠道中获取。例如,从n个渠道获取相似小区在预设时间内的n个小区历史价格,分别计算n个小区历史价格的相对标准差;若相对标准差均小于或等于10%,则直接取n个小区历史价格的均值作为相似小区在预设时间内的小区历史均价;否则,先剔除n个小区历史价格中的最大值及最小值,取剩余(n-2)个小区历史价格的均值作为相似小区在预设时间内的小区历史均价。

c2、分别计算所述多个相似小区中各房源在预设时间内的历史挂牌价格和多个历史成交价格与所述小区历史均价的偏差,过滤掉偏差大于第二预设阈值的历史挂牌价格,过滤掉偏差大于第三预设阈值的历史成交价格。

c3、根据保留下来的历史挂牌价格、历史成交价格,分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

以相似小区p为例,小区p内的多个房源在同一期内的历史挂牌价格、历史成交价格均不相同。为了去除小区p的历史挂牌价格、历史成交价格中的异常值,例如,价格过高或者过低的情况,需先确定小区p中各房源的历史挂牌价格和历史成交价格与小区p的小区历史均价的偏差,过滤掉偏差超过预设范围(例如,第二预设阈值、第三预设阈值分别为40%、30%)的数据,然后分别对剩下的历史挂牌价格、历史成交价格求平均值,得到小区p在上个月的历史挂牌均价及历史成交均价。

其中,第二预设阈值及第三预设阈值可根据需求进行调整。

通过对相似小区多个房源的历史挂牌价格及历史成交均价进行过滤,为准确计算相似小区的历史挂牌均价及历史成交均价奠定基础。

需要说明的是,上述实施例中的历史成交价格、历史挂牌价格、历史成交均价、历史挂牌均价等都是指单价,不是总价。

s4、根据所述多个相似小区的第一均价计算所述目标小区的均价,将所述目标小区的均价发送至客户端。

计算的结果即为预测的目标小区的均价,然后将计算结果通过客户端发送给用户。

优选地,本实施例中的所述步骤s4包括:

根据所述多个相似小区与目标小区的相似度分别确定所述多个相似小区对应的权重;及

根据所述权重对所述多个相似小区的第一均价进行加权计算得到所述目标小区的第一均价。

各相似小区对应的权重之和为1。例如,目标小区的相似小区列表中有h个相似小区,其对应的相似度分别为:r1、r2、…、rh,各相似小区对应的权重的计算公式为:

其中,ωi为第i个相似小区对应的权重,ri为第i个相似小区与目标小区的相似度,1≤i≤h,i、h均为正整数。

假设目标小区的h个相似小区的第一均价分别为:p1、p2、…、ph,目标小区的第一均价的计算公式为:

其中,p为目标小区的第一均价,pi为第i个相似小区的第一均价,ωi为第i个相似小区对应的权重,1≤i≤h,i、h均为正整数。

在其他实施例中,所述步骤s4包括:

计算所述多个相似小区的第一均价的平均值得到所述目标小区的第一均价。

假设目标小区的h个相似小区的第一均价分别为:p1、p2、…、ph,目标小区的第一均价的计算公式为:

其中,p为目标小区的第一均价,pi为第i个相似小区的第一均价,1≤i≤h,i、h均为正整数。

本实施例提出的小区均价预估方法,通过获取目标小区的多个有历史记录的相似小区,并根据多个相似小区的历史记录对多个相似小区的均价进行预估,然后根据多个相似小区的均价计算目标小区的均价,提高了目标小区均价预估的准确性;另外,本实施例解决了依赖于目标小区的历史记录的问题,提高了本发明的普适性。

参照图2所示,为本发明小区均价预估方法另一个较佳实施例的流程图。

在所述小区均价预估方法的第二实施例中,所述步骤s4可替换为:

s5、分别将所述多个相似小区在预设时间内的历史挂牌均价、历史成交均价及第一均价输入基于小波神经网络训练得到的第二小区均价预估模型,得到所述多个相似小区的第二均价;及

s6、根据所述多个相似小区的第二均价计算所述目标小区的均价。

在本实施例中,所述第二小区均价预估模型是基于小波神经网络训练得到的。所述第二均价即为对目标小区均价进行二次预估的结果。

所述第二小区均价预估模型的训练步骤与上述第一小区均价预估模型的训练步骤大致相同,其区别在于:样本数据中的x为多个指定小区在指定时间区间内(2017.12-2018.7)的历史成交均价、历史挂牌均价、第一均价。其中,多个指定小区在指定时间区间内的第一均价通过上述第一小区均价预估模型确定,在此不作赘述。

目标小区的均价与上述实施例中根据各相似小区的第一均价计算目标小区的均价的实施方式大致相同,这里不再赘述。

本实施例提出的小区均价预估方法,通过对目标小区的多个相似小区的均价进行二次预估,提高了各相似小区均价预估的准确性;根据各相似小区二次预估均价计算目标小区的均价,提高了目标小区均价预估的准确性。

参照图3所示,为本发明电子装置1较佳实施例的示意图。

在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有数据处理功能的终端设备,所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器。

该电子装置1包括存储器11、处理器12,及网络接口13。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备,例如该电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括该电子装置1的内部存储单元也包括外部存储设备。

存储器11不仅可以用于存储安装于该电子装置1的应用软件及各类数据,例如小区均价预估程序10等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如小区均价预估程序10等。

网络接口13可选的可以包括标准的有线接口、无线接口(如wi-fi接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。例如,电子装置1通过网络接口13接收客户端(图中未标出)发送的小区均价预估请求,并将预估结果通过网络接口13反馈给客户端。

图3仅示出了具有组件11-13的电子装置1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

可选地,该电子装置1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。

可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organiclight-emittingdiode,oled)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。

在图3所示的电子装置1实施例中,作为一种计算机存储介质的存储器11中存储小区均价预估程序10的程序代码,处理器12执行小区均价预估程序10的程序代码时,实现如下步骤a1-a4。

a1、接收客户端发送的基于目标小区的均价预估请求。

用户通过客户端提交预估请求,请求中包括预估标的:目标小区均价。

a2、获取与所述目标小区之间的距离在预设范围内的周边小区,从所述周边小区中筛选出所述目标小区对应的多个相似小区,生成相似小区列表。

预设范围可以举例为:在目标小区的半径1.5km的范围内。

需要说明的是,本实施例中的周边小区是有历史记录的小区,对于在目标小区半径1.5km的范围内、但没有历史记录的小区会被过滤掉,历史记录包括历史挂牌记录及历史挂牌记录。

在确定目标小区对应的相似小区过程中,需要根据各周边小区及目标小区的属性信息来判断,属性信息大致相同,可认为两小区互为相似小区。优选地,本实施例中的所述步骤a2包括:

a21、获取所述周边小区及所述目标小区的属性信息,并将所述属性信息指标化以确定所述周边小区及所述目标小区的第二属性指标。

属性信息包括:小区主要属性,包括楼栋数、户数、容积率、绿化率等;小区建筑类型,包括层高、户型面积等;小区周边配套设施,包括商业、医院、学校、公园等。

上述将所述目标小区的属性信息指标化的过程,以绿化率为例:

其中,α、β、c均为大于0、小于1的数,且α<β<c。

对上述属性信息指标化后,生成属性信息对应的单列矩阵,矩阵中各属性指标的顺序是预先确定的。

需要说明的是,在对属性信息进行指标化的过程中,还需要对各属性信息进行标准化及缺失值填补等处理。例如,当某两个指标之间差值较大时,采用z-score标准化方法对该指标进行处理,当某指标有缺失时,可利用missforest包对该指标的缺失值进行补充。

a22、将所述周边小区及所述目标小区的第二属性指标输入预先训练好的小区相似度模型,根据模型输出结果分析所述目标小区的相似小区列表。

本实施例中的模型输出结果为第一列表,第一列表中包括各周边小区及各周边小区对应的相似度。

优选地,为了提高相似小区的准确性,步骤a22还包括:

当存在相似度超过第一预设阈值的周边小区时,选择相似度超过第一预设阈值的周边小区作为相似小区,生成第二列表;当不存在相似度超过第一预设阈值的周边小区时,取预设数量的相似度最高的周边小区作为相似小区,生成第二列表。

得到模型输出的各周边小区与目标小区的相似度后,根据相似度的高低顺序对各周边小区进行排序,并选择相似度高的周边小区作为目标小区的相似小区,得到第二列表。

第二列表即为目标小区的相似小区列表。第一预设阈值及预设数量可根据需求进行调整,例如,第一预设阈值为0.65,预设数量为3。

所述相似度小区模型的训练步骤上文相似,在此不再赘述。

a3、从预设渠道获取所述相似小区列表中多个相似小区在预设时间内的历史记录,根据预设的小区均价预估规则分别确定所述多个相似小区的第一均价。

不同城市的预设渠道可能不同,以深圳为例,预设渠道包括:链家、szhome、中原、家家顺、搜房等平台。在步骤a1之前,该方法还包括:预设所述多个预设渠道的优先级别。各渠道的优先级为专家根据各渠道数据的可信度制定的,例如,上述5个渠道的优先级为:链家>szhome>中原>家家顺>搜房。

优选地,本实施例中的所述步骤a3包括:

a31、根据所述历史记录分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

相似小区的历史挂牌均价与历史成交均价与该相似小区中每套房源的历史挂牌价格及历史成交价格紧密相关。因此,首先,确定相似小区中各房源对应的历史挂牌记录及历史成交记录,然后,分别确定各房源的历史挂牌价格及历史成交价格,最后,计算相似小区的历史挂牌均价及历史成交均价。需要说明的是,本发明并不要求同一套房源同时有历史挂牌记录及历史成交记录。

a32、分别将所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价输入预先训练好的第一小区均价预估模型中,得到所述多个相似小区的第一均价。

本实施例中的所述第一小区均价预估模型是基于多变量灰度关联预测模型训练得到的。所述第一均价即为对各相似小区均价进行一次预估的结果。

在模型训练过程中,自变量x=[(x1a,x1b),(x2a,x2b),…,(xia,xib)],因变量y=[y1,y2,…,yi],其中,xia表示指定小区i在2017.12-2018.7内的连续六个月(时间序列的长短可调整)的历史挂牌均价,xib表示指定小区i在2017.12-2018.7内的连续六个月(时间序列的长短可调整)的历史成交均价,且xia,xib均为历史挂牌均价、历史成交均价对应的时间序列;yi表示指定小区在2017.12-2018.7内的连续六个月(时间序列与x保持一致)的小区历史均价。

优选地,本实施例中的所述步骤a31包括:a1-a3,其中:

a1、获取每条所述历史记录的描述信息,根据所述描述信息分别确定所述多个相似小区中各房源对应的历史记录。上述描述信息中包括描述房源地理位置的位置信息,例如,xx市xx区xx路xx小区xx期xx单元xx楼xx号。利用所有历史记录的描述信息确定各相似小区对应的所有历史记录。

a2、分别分析并确定所述多个相似小区中各房源在预设时间内的历史挂牌价格及历史成交价格。

优选地,本实施例中的所述步骤a2包括:b1-b4,其中:

b1、当所述相似小区中同一房源对应一条历史挂牌记录/历史成交记录时,读取该历史挂牌记录/历史成交记录中的历史挂牌价格及历史成交价格,作为该房源的历史挂牌价格及历史成交价格;

b2、当所述相似小区中同一房源对应多条历史挂牌记录时,获取该多条历史挂牌记录对应的多个历史挂牌价格;

b3、当所述多个历史挂牌价格一致时,保留任意一个历史挂牌价格作为该房源的历史挂牌价格;或者

b4、当所述多个历史挂牌价格不一致时,取渠道优先级最高者作为该房源的历史挂牌价格。

假设某相似小区的某一房源同时在5个渠道上进行挂牌,那么,该房源存在5条历史挂牌记录,即该房源有5个历史挂牌价格。当5个历史挂牌价格相同时,取任意一个历史挂牌价格作为该房源的历史挂牌价格。当5个房源历史挂牌价格不同时,获取各历史挂牌价格对应的渠道优先级,选择渠道优先级别最高者对应的历史挂牌价格作为该房源的历史挂牌价格。一般情况下,同一个房源仅对应一条历史成交记录,故不用进行去重处理。

通过对相似小区中各房源的历史记录进行去重处理,为后续计算相似小区的历史挂牌均价及历史成交均价奠定基础。

a3、分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

优选地,本实施例中的所述步骤a3包括:c1-c3,其中:

c1、分别计算所述多个相似小区在预设时间内的小区历史均价。小区历史均价是根据相似小区在多个预设渠道中上个月的小区历史价格计算得到的,小区历史价格直接从多个渠道中获取。例如,从n个渠道获取相似小区在预设时间内的n个小区历史价格,分别计算n个小区历史价格的相对标准差;若相对标准差均小于或等于10%,则直接取n个小区历史价格的均值作为相似小区在预设时间内的小区历史均价;否则,先剔除n个小区历史价格中的最大值及最小值,取剩余(n-2)个小区历史价格的均值作为相似小区在预设时间内的小区历史均价。

c2、分别计算所述多个相似小区中各房源在预设时间内的历史挂牌价格和多个历史成交价格与所述小区历史均价的偏差,过滤掉偏差大于第二预设阈值的历史挂牌价格,过滤掉偏差大于第三预设阈值的历史成交价格。

c3、根据保留下来的历史挂牌价格、历史成交价格,分别计算所述多个相似小区在预设时间内的历史挂牌均价及历史成交均价。

以相似小区p为例,小区p内的多个房源在同一期内的历史挂牌价格、历史成交价格均不相同。为了去除小区p的历史挂牌价格、历史成交价格中的异常值,例如,价格过高或者过低的情况,需先确定小区p中各房源的历史挂牌价格和历史成交价格与小区p的小区历史均价的偏差,过滤掉偏差超过预设范围(例如,第二预设阈值、第三预设阈值分别为40%、30%)的数据,然后分别对剩下的历史挂牌价格、历史成交价格求平均值,得到小区p在上个月的历史挂牌均价及历史成交均价。

其中,第二预设阈值及第三预设阈值可根据需求进行调整。

通过对相似小区多个房源的历史挂牌价格及历史成交均价进行过滤,为准确计算相似小区的历史挂牌均价及历史成交均价奠定基础。

需要说明的是,上述实施例中的历史成交价格、历史挂牌价格、历史成交均价、历史挂牌均价等都是指单价,不是总价。

a4、根据所述多个相似小区的第一均价计算所述目标小区的均价,将所述目标小区的均价发送至客户端。

计算的结果即为预测的目标小区的均价,然后将计算结果通过客户端发送给用户。

优选地,本实施例中的所述步骤a4包括:

根据所述多个相似小区与目标小区的相似度分别确定所述多个相似小区对应的权重;及

根据所述权重对所述多个相似小区的第一均价进行加权计算得到所述目标小区的第一均价。

各相似小区对应的权重之和为1。例如,目标小区的相似小区列表中有h个相似小区,其对应的相似度分别为:r1、r2、…、rh,各相似小区对应的权重的计算公式为:

其中,ωi为第i个相似小区对应的权重,ri为第i个相似小区与目标小区的相似度,1≤i≤h,i、h均为正整数。

假设目标小区的h个相似小区的第一均价分别为:p1、p2、…、ph,目标小区的第一均价的计算公式为:

其中,p为目标小区的第一均价,pi为第i个相似小区的第一均价,ωi为第i个相似小区对应的权重,1≤i≤h,i、h均为正整数。

在其他实施例中,所述步骤a4包括:

计算所述多个相似小区的第一均价的平均值得到所述目标小区的第一均价。

假设目标小区的h个相似小区的第一均价分别为:p1、p2、…、ph,目标小区的第一均价的计算公式为:

其中,p为目标小区的第一均价,pi为第i个相似小区的第一均价,1≤i≤h,i、h均为正整数。

本实施例提出的电子装置1,通过获取目标小区的多个有历史记录的相似小区,并根据多个相似小区的历史记录对多个相似小区的均价进行预估,然后根据多个相似小区的均价计算目标小区的均价,提高了目标小区均价预估的准确性;另外,本实施例解决了依赖于目标小区的历史记录的问题,提高了本发明的普适性。

在其他实施例中,所述处理器12执行所述小区均价预估程序10的程序代码时,所述步骤a4可以替换为步骤a5-a6,其中:

a5、分别将所述多个相似小区在预设时间内的历史挂牌均价、历史成交均价及第一均价输入基于小波神经网络训练得到的第二小区均价预估模型,得到所述多个相似小区的第二均价;及

a6、根据所述多个相似小区的第二均价计算所述目标小区的均价。

在本实施例中,所述第二小区均价预估模型是基于小波神经网络训练得到的。所述第二均价即为对目标小区均价进行二次预估的结果。

所述第二小区均价预估模型的训练步骤与上述第一小区均价预估模型的训练步骤大致相同,其区别在于:样本数据中的x为多个指定小区在指定时间区间内(2017.12-2018.7)的历史成交均价、历史挂牌均价、第一均价。其中,多个指定小区在指定时间区间内的第一均价通过上述第一小区均价预估模型确定,在此不作赘述。

目标小区的均价与上述实施例中根据各相似小区的第一均价计算目标小区的均价的实施方式大致相同,这里不再赘述。

本实施例提出的电子装置1,通过对目标小区的多个相似小区的均价进行二次预估,提高了各相似小区均价预估的准确性;根据各相似小区二次预估均价计算目标小区的均价,提高了目标小区均价预估的准确性。

可选地,在其他的实施例中,小区均价预估程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。

参照图4所示,为图3中小区均价预估程序10的较佳实施例的程序模块示意图。

在小区均价预估程序10的第一实施例中,该小区均价预估程序10可以被分割为接收模块110、筛选模块120、第一预估模块130及第一计算模块140,所述模块110-140所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:

接收模块110,用于接收客户端发送的基于目标小区的均价预估请求;

筛选模块120,用于获取与所述目标小区之间的距离在预设范围内的周边小区,从所述周边小区中筛选出所述目标小区对应的多个相似小区,生成相似小区列表;

第一预估模块130,用于从预设渠道获取所述相似小区列表中多个相似小区在预设时间内的历史记录,根据预设的小区均价预估规则分别确定所述多个相似小区的第一均价,其中,所述历史记录包括历史挂牌记录及历史成交记录;及

第一计算模块140,用于根据所述多个相似小区的第一均价计算所述目标小区的均价,将所述目标小区的均价发送至客户端。

参照图5所示,为图3中小区均价预估程序10的另一个较佳实施例的程序模块示意图。

在小区均价预估程序10的第二实施例中,所述小区均价预估程序10中的模块140可被替换为:第二预估模块150及第二计算模块160。所述模块150-160所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:

第二预估模块150,用于分别将所述多个相似小区在预设时间内的历史挂牌均价、历史成交均价及第一均价输入基于小波神经网络训练得到的第二小区均价预估模型,得到所述多个相似小区的第二均价;及

第二计算模块160,用于根据所述多个相似小区的第二均价计算所述目标小区的均价。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括小区均价预估程序10,所述小区均价预估程序10被处理器执行时实现如下操作:

a1、接收客户端发送的基于目标小区的均价预估请求;

a2、获取与所述目标小区之间的距离在预设范围内的周边小区,从所述周边小区中筛选出所述目标小区对应的多个相似小区,生成相似小区列表;

a3、从预设渠道获取所述相似小区列表中多个相似小区在预设时间内的历史记录,根据预设的小区均价预估规则分别确定所述多个相似小区的第一均价,其中,所述历史记录包括历史挂牌记录及历史成交记录;及

a4、根据所述多个相似小区的第一均价计算所述目标小区的均价,将所述目标小区的均价发送至客户端。

本发明之计算机可读存储介质的具体实施方式与上述小区均价预估方法的具体实施方式大致相同,在此不再赘述。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1