一种基于异构图的房屋价值预测方法

文档序号:27323418发布日期:2021-11-10 00:57阅读:87来源:国知局
一种基于异构图的房屋价值预测方法

1.本发明属于机器学习和数据挖掘技术领域,特别是涉及一种基于异构图的房屋价值预测方法。


背景技术:

2.随着经济的高速发展,人民生活质量得到了极大提高,对住房质量、住房环境、小区配套服务等的要求也随之不断提高。在过去的几年时间里,房地产的价格快速地上涨,房价成了各种社会矛盾的焦点。住房问题本生就是关系国计民生的大问题,准确和最新的房屋估价对各种房地产利益相关者至关重要。传统上,房价评估是通过基于目标房产、周边地区和历史数据的专家知识的房地产评估来进行的,主要通过主要检查房价和一系列量化特征之间的关系,如房产大小、室内装修、卧室和设施的数量、到学校集水区的距离等,来自动化房屋估价。
3.现有的房地产估价方法不足以解决现实生活中房地产市场表现出的两个基本问题:数据新鲜度和稀疏性问题。这里的关键问题是两笔房产交易之间会有几年的间隔,在任何给定的时间内,市场上都只有少量的房子。新交易的数量不仅少,而且新交易的房屋分布在数以千计的家庭中的一个大的人口区域,使得很难对交易房屋之间的关系进行有效的建模和推理。此外,2000年以前的交易数据往往不是数字形式,这进一步降低了房屋交易数据的可用性。当前房屋交易数据的缺乏意味着先前方法所依赖的许多定价信息不能准确反映目标房屋的市场价值,鉴于复杂而动态的房地产市场,房屋交易的不连续性和稀缺性使得建立一个准确的房屋估价预测器变得极其复杂。


技术实现要素:

4.为了解决上述问题,本发明提出了一种基于异构图的房屋价值预测方法,在异构信息网络(hin)中组织房屋数据,其中图形节点是房屋实体和属性;使用图形卷积网络(gcn)从hin中提取房屋相关数据的空间信息,然后使用长短期记忆网络(lstm)对房屋交易数据的时间依赖性进行建模;能够准确反映目标房屋的市场价值,克服房屋交易的不连续性和稀缺性。
5.为达到上述目的,本发明采用的技术方案是:一种基于异构图的房屋价值预测方法,包括步骤:
6.s10,利用房屋信息获取元路径和元图,构建异构信息网络;
7.s20,计算两个房屋之间的估价相似度,利用相似度来表明任何两个房屋实例之间的连通性,构造加权邻接矩阵来存储房屋之间的语义相似度;
8.s30,通过主成分分析求出房屋的属性矩阵;
9.s40,加权邻接矩阵和房屋属性矩阵作为输入,将整体图拆分为多个重叠的子图,并对每个子图并行进行特征学习;
10.s50,使用图形卷积网络从异构信息网络中提取房屋相关数据的空间信息,然后使
用长短期记忆网络对房屋交易数据的时间依赖性进行建模;
11.s60,在长短期记忆网络提供的嵌入和价格标签之间添加一个多层感知器来解码,从而预测房价。
12.进一步的是,所述房屋信息包括地理信息、财务信息、设施信息和平面图信息;在所述步骤s10中利用房屋信息获取元路径和元图,构建异构信息网络,包括步骤:
13.s11,元路径是通过节点之间语义上有意义的关系连接一对网络节点的路径,枚举每两个房屋实体之间的所有现有关系,作为预定义的元路径,两个房屋之间具有任意数量的元路径;
14.s12,元图以有向无环图的形式,用作模板来捕获一对节点之间现有元关系的任意但有意义的组合。
15.进一步的是,在所述步骤s20中,计算两个房屋之间的估价相似度,利用相似度来表明任何两个房屋实例之间的连通性,构造加权邻接矩阵来存储房屋之间的语义相似度,包括步骤:
16.s21,元图数量由子串元路径计数的矩阵之间的哈达玛乘积来计数;相似性函数s(h
i
,h
i
)的核心是通过对不同的结构关系应用不同的权重来标准化房屋h
i
和房屋h
j
之间的元路径和元图的重要性;
17.s22,使用计算出的相似度来,通过n
×
n加权邻接矩阵来存储n个房屋之间的语义相似度。
18.进一步的是,在步骤s30中,通过主成分分析求出房屋的属性矩阵,包括步骤:
19.s31,使用独热编码来表示房屋数据中的每一个属性,将它们连接成一个数值向量,构成属性向量,使得属性向量与hin中的房屋实体相关联;
20.s32,通过主成分分析将属性向量的维数减少到d,我们最终形成房屋属性矩阵x,房屋属性矩阵x形状为n
×
d。
21.进一步的是,在所述步骤s40中,加权邻接矩阵和房屋属性矩阵作为输入,将整体图拆分为多个重叠的子图,并对每个子图并行进行特征学习;
22.s41,加权邻接矩阵a和房屋属性矩阵x作为输入;
23.s42,房屋在本质上被划分为相邻的地理区域,将整体图拆分为多个重叠的子图,并对每个子图并行进行特征学习。
24.进一步的是,在所述步骤s50中,使用图形卷积网络从异构信息网络中提取房屋相关数据的空间信息,然后使用长短期记忆网络对房屋交易数据的时间依赖性进行建模,包括步骤:
25.s51,对于第i个子图ai,使用图卷积神经网络来学习每月数值特征嵌入,并利用逐层传播规则获取房屋相关数据的空间信息;
26.s52,由于忽视价格标签中的时间差,从图卷积神经网络获得的房屋嵌入不能保证最新的价格信息。因此,利用长短期记忆网络来学习和更新每栋房子的估价,将图卷积神经网络的输出作为长短期记忆网络单位的输入;
27.s53,长短期记忆网络的输出将作为初始房屋属性传递给下一个图卷积神经网络单位;房屋的特征嵌入根据交易时间转化为时间序列,显著缓解了短期内房屋交易的不连续性;并在进行细粒度校准之前,将所有单个嵌入连接成
28.进一步的是,在所述步骤s60中,在长短期记忆网络提供的嵌入和价格标签之间添加一个多层感知器来解码,从而预测房价,包括步骤:
29.s61,在长短期记忆网络提供的嵌入和价格标签之间添加一个多层感知器来解码,从而预测房价;
30.s62,为每个子图实例化一个独立的图卷积神经网络,以并行获得它自己的特征嵌入;为了协调这些嵌入结果并形成一个整体画面,我们使用距离调节来校准嵌入。
31.进一步的是,还包括步骤s70,在图形卷积网络与长短期记忆网络单元在管道中展开多次任务,将预测结果用于训练后续的图形卷积网络与长短期记忆网络单元。
32.采用本技术方案的有益效果:
33.本发明为了为了解决房屋交易数据的空间和时间稀疏,提取有用的信息,在异构信息网络(hin)中存储与房屋相关的数据,采用hin来建模房屋实体之间的关系,如位置、设施或平面图,其中hin节点是房屋的不同类型的实体及其特征,而边表示一对实体之间的不同关系,充分利用特征学习中的房屋相似性和时间依赖性,精心考虑了数据的稀疏性,然后将一个大的hin划分成更小的子图,以便可以在更小的图上并行执行房屋数据表示的学习。根据构造的hin,计算出邻接矩阵和属性矩阵,邻接矩阵a与属性矩阵一起输入gcn和lstm中作为输入。
34.本发明为了同时捕捉房价的时间和空间特征,设计一个房价的终身预测模型,核心是建立在gcn和lstm基础上的深度神经网络。使用图形卷积网络(gcn) 从hin中提取房屋相关数据的空间信息,然后使用长短期记忆网络(lstm)网络对房屋交易数据对时间依赖性进行建模。为了避免内存不足,我们可以自然地将房屋图分成子图,由重叠区域内的房屋共同连接。相应地,我们将基本的gcn

lstm 训练单元分解成独立且并行的gcn

lstm实例,每个实例都被用于每个子图中的特征嵌入。这样的并行性最终会形成一个gcn

lstm阵列,从而大大加快特征学习的过程。
附图说明
35.图1为本发明的一种基于异构图的房屋价值预测方法流程示意图;
36.图2为本发明的一种基于异构图的房屋价值预测方法的原理框架示意图;
37.图3为本发明的元模式,元路径,元图示意图;
38.图4为本发明的特征学习的基本单元示意图;
39.图5为本发明优化实施例中的模型预测的结构原理示意图。
具体实施方式
40.为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
41.在本实施例中,参见图1和图2所示,本发明提出了一种基于异构图的房屋价值预测方法,包括步骤:
42.s10,利用房屋信息获取元路径和元图,构建异构信息网络;
43.s20,计算两个房屋之间的估价相似度,利用相似度来表明任何两个房屋实例之间的连通性,构造加权邻接矩阵来存储房屋之间的语义相似度;
44.s30,通过主成分分析求出房屋的属性矩阵;
45.s40,加权邻接矩阵和房屋属性矩阵作为输入,将整体图拆分为多个重叠的子图,并对每个子图并行进行特征学习;
46.s50,使用图形卷积网络从异构信息网络中提取房屋相关数据的空间信息,然后使用长短期记忆网络对房屋交易数据的时间依赖性进行建模;
47.s60,在长短期记忆网络提供的嵌入和价格标签之间添加一个多层感知器来解码,从而预测房价。
48.作为上述实施例的优化方案,如图3所示,所述房屋信息包括地理信息、财务信息、设施信息和平面图信息;在所述步骤s10中利用房屋信息获取元路径和元图,构建异构信息网络,包括步骤:
49.s11,元路径是通过节点之间语义上有意义的关系连接一对网络节点的路径,枚举每两个房屋实体之间的所有现有关系,作为预定义的元路径,两个房屋之间具有任意数量的元路径;
50.s12,元图以有向无环图的形式,用作模板来捕获一对节点之间现有元关系的任意但有意义的组合。
51.作为上述实施例的优化方案,在所述步骤s20中,计算两个房屋之间的估价相似度,利用相似度来表明任何两个房屋实例之间的连通性,构造加权邻接矩阵来存储房屋之间的语义相似度,包括步骤:
52.s21,元图数量由子串元路径计数的矩阵之间的哈达玛乘积来计数;相似性函数s(h
i
,h
i
)的核心是通过对不同的结构关系应用不同的权重来标准化房屋h
i
和房屋h
j
之间的元路径和元图的重要性;
53.s22,使用计算出的相似度来,通过n
×
n加权邻接矩阵来存储n个房屋之间的语义相似度。
54.作为上述实施例的优化方案,在步骤s30中,通过主成分分析求出房屋的属性矩阵,包括步骤:
55.s31,使用独热编码来表示房屋数据中的每一个属性,将它们连接成一个数值向量,构成属性向量,使得属性向量与hin中的房屋实体相关联;
56.s32,通过主成分分析将属性向量的维数减少到d,我们最终形成房屋属性矩阵x,房屋属性矩阵x形状为n
×
d。
57.进一步的是,在所述步骤s40中,如图4所示,加权邻接矩阵和房屋属性矩阵作为输入,将整体图拆分为多个重叠的子图,并对每个子图并行进行特征学习;
58.s41,加权邻接矩阵a和房屋属性矩阵x作为输入;
59.s42,房屋在本质上被划分为相邻的地理区域,将整体图拆分为多个重叠的子图,并对每个子图并行进行特征学习。
60.具体来说,将加权邻接矩阵a分成几个重叠的子图,它可以形式化为:
61.a=a1∪a2…
∪a
j

62.其中,j是划分的子图的总数。
63.作为上述实施例的优化方案,在所述步骤s50中,使用图形卷积网络从异构信息网络中提取房屋相关数据的空间信息,然后使用长短期记忆网络对房屋交易数据的时间依赖
性进行建模,包括步骤:
64.s51,对于第i个子图ai,使用图卷积神经网络来学习每月数值特征嵌入,并利用逐层传播规则获取房屋相关数据的空间信息,具体公式为:
[0065][0066]
其中是第i个子图的输入特征矩阵,是第l层第i个子图的参数矩阵;
[0067]
s52,由于忽视价格标签中的时间差,从图卷积神经网络获得的房屋嵌入不能保证最新的价格信息。因此,利用长短期记忆网络来学习和更新每栋房子的估价,将图卷积神经网络的输出作为长短期记忆网络单位的输入;长短期记忆网络的产出形式化公式为:
[0068][0069]
其中,θ
(i,t)
表示lstm单元的参数,是经过gcn训练后在第t 个月的第l层的第i个子图的输出结果;
[0070]
s53,长短期记忆网络的输出将作为初始房屋属性传递给下一个图卷积神经网络单位;房屋的特征嵌入根据交易时间转化为时间序列,显著缓解了短期内房屋交易的不连续性;并在进行细粒度校准之前,将所有单个嵌入连接成
[0071]
进一步的是,在所述步骤s60中,如图5所示,在长短期记忆网络提供的嵌入和价格标签之间添加一个多层感知器来解码,从而预测房价,包括步骤:
[0072]
s61,在长短期记忆网络提供的嵌入和价格标签之间添加一个多层感知器来解码,从而预测房价mlp是多层感知器计算函数;
[0073]
s62,为每个子图实例化一个独立的图卷积神经网络,以并行获得它自己的特征嵌入;为了协调这些嵌入结果并形成一个整体画面,我们使用距离调节来校准嵌入,确保不同子图之间的房屋在不同的gcn中具有紧密的嵌入方案:
[0074][0075]
其中,表示那些重叠房屋的集合,即g(p
α
) 表示包含p
α
房屋的子图的数量,表示p
α
房屋第t个月第β层gcn的嵌入。
[0076]
s63,使用以下损失函数来优化模型参数:
[0077][0078]
其中,为均方根误差(rmse);rmse可以形式化为:
[0079][0080]
其中,分别指第j栋房屋的预测价格和销售价格。
[0081]
在终身学习网络中,为了减小不同任务对特征学习有效性的影响。采用强化学习对损失函数进行校准:
[0082][0083]
其中:λ
i
表示惩罚系数,表示先前任务对当前任务的影响,表示个体传播损失。
[0084]
作为上述实施例的优化方案,还包括步骤s70,在图形卷积网络与长短期记忆网络单元在管道中展开多次任务,将预测结果用于训练后续的图形卷积网络与长短期记忆网络单元。为了建立一个能够对房价的终身预测框架,设计了一个多任务学习方案,其中图形卷积网络与长短期记忆网络单元在管道中展开多次。可以继承在t月获得的网络来预测未来t+1月的房价。同时,预测还将更新房屋 h
t+1
在时间t+1的嵌入,用于训练后续的图形卷积网络与长短期记忆网络单元。重复这个过程,直到目标是某个月t+n所有房屋的估价。
[0085]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1