信息处理方法及装置、系统、计算机及可读存储介质与流程

文档序号:17586933发布日期:2019-05-03 21:24阅读:146来源:国知局
信息处理方法及装置、系统、计算机及可读存储介质与流程

本发明涉及信息处理领域,尤其涉及一种信息处理方法及装置、系统、计算机及可读存储介质。



背景技术:

鉴于我国房地产市场经济越来越成熟,尤其是在我国即将推出房地产税的大背景下,房产信息系统需要大量采集和分析房地产信息,以支撑房地产税基评估、拆迁征收或抵押按揭等房地产经济活动。

现有房地产信息收集主要采取人工实地查勘、纸质记录、后期信息化和检查的方式。当有房地产信息批量调查任务时,调查人员根据业务需要进入查勘现场,特别是需要入户进行房地产户型、朝向、装修等特征信息采集。然而,由于现场电子化信息录入需要较长时间,难以及时更新相应的信息,使得房产信息系统的信息实时性较差。



技术实现要素:

本发明针对现有的房地产信息系统的实时性较差的问题,提供了一种信息处理方法及装置、系统、计算机及可读存储介质。

本发明就上述技术问题而提出的技术方案如下:

第一方面,本发明提供了一种信息处理方法,应用于房地产信息处理系统,所述方法包括:

获取包含房屋地址信息的记录数据;

从所述记录数据中提取出各个房屋所具有的多种房屋属性信息;

识别所述记录数据中所述房屋地址信息相互关联的房屋;

若相互关联的一房屋的房屋属性信息不完整,则依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息以使得相互关联的同种房屋属性信息一致。

根据上述的信息处理方法,在所述识别所述记录数据中所述房屋地址信息相互关联的房屋之后,所述方法还包括:

对所述相互关联的房屋的同种房屋属性信息进行比对;

若比对结果中的对比差异范围大于预设差异范围,则将其中一房屋所对应的同种房屋属性信息修改为与另一房屋所对应的同种房屋属性信息。

根据上述的信息处理方法,所述从所述记录数据中提取出各个房屋所具有的多种房屋属性信息包括:

在已知数据量较少或质量较差时,利用决策树算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息;

在已知数据量较多或质量较好时,利用人工神经网络算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息。

根据上述的信息处理方法,所述利用决策树算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息包括:

构建决策树训练集及决策树测试集以确定决策树模型,根据确定的所述决策树模型从所述记录数据中提取出各个房屋所具有的多种房屋属性信息;

所述利用人工神经网络算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息包括:

构建人工神经网络训练集及人工神经网络测试集以确定人工神经网络模型,根据确定的所述人工神经网络模型从所述记录数据中提取出各个房屋所具有的多种房屋属性信息。

根据上述的信息处理方法,所述获取包含房屋地址的记录数据包括:

获取原始记录数据;

利用自然语言处理技术从所述原始数据中提取出所述记录数据。

根据上述的信息处理方法,所述房屋属性信息包括以下中的一种或多种:

房屋所在的楼层、房屋朝向、房屋面积以及房屋的户型。

第二方面,本发明还提供一种信息处理装置,应用于房地产信息处理系统,所述装置包括:

获取模块,用于获取包含房屋地址信息的记录数据;

提取模块,用于从所述记录数据中提取出各个房屋所具有的多种房屋属性信息;

识别模块,用于识别所述记录数据中所述房屋地址信息相互关联的房屋;

信息补充模块,用于在相互关联的一房屋的房屋属性信息不完整时,依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息以使得相互关联的同种房屋属性信息一致。

第三方面,本发明还提供一种房地产信息处理系统,包括如上所述的信息处理装置。

第四方面,本发明还提供一种计算机,所述计算机包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前所述信息处理方法的步骤。

第五方面,本发明还提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述信息处理方法的步骤。

本发明实施例提供的技术方案带来的有益效果是:

通过获取包含房屋地址信息的记录数据,并从记录数据中提取出各个房屋所具有的多种房屋属性信息,在识别所述记录数据中所述房屋地址信息相互关联的房屋的前提下,在相互关联的一房屋的房屋属性信息不完整时,依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息,以使相互关联的同种房屋属性信息一致,从而实现对房屋属性信息不完整的房屋的信息补充,利于提升及时补充缺失的房屋信息,提升房地产信息处理系统的信息实时性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的信息处理方法的流程图;

图2是本发明提供的一实施例下的自然语言处理流程图;

图3是本发明提供的信息处理装置的模块图;

图4是本发明提供的房地产信息处理系统的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

参见图1,为本发明提供的信息处理方法的流程图,该信息处理方法可应用房地产信息处理系统,所述房地产信息处理系统可用于对房地产政策及相关信息进行分析,还可对房地产信息进行信息更新、管理、控制及信息输出等。

如图1所示,本实施方式的信息处理方法可包括如下步骤:

步骤101:获取包含房屋地址信息的记录数据,其中,所述记录数据可包括对人力记录的纸质记录、图像、录音进行识别所获取的数据,还可包括读取存于可读存储介质或访问指定服务器的数据库所获取的数据。

所述人力记录的纸质记录、图像、录音为原始记录数据,因而可利用自然语言处理技术从所述原始数据中提取出所述记录数据。如图2所示一实施例下的自然语言处理流程图,在获取到原始数据后,可经过步骤1011:剥离地址信息-步骤1012:剥离楼栋编码信息-步骤1013:提取楼栋名称-步骤1014:提取楼盘名称等处理步骤得到房屋的房屋属性信息。

本实施方式中,所述包含房屋地址信息的记录数据可通过对获取到的记录数据进行数据识别获得。具体地,当所述记录数据为对人力记录的纸质记录进行识别所获取的数据时,如识别出纸质记录对应的文字包括“广东省深圳市福田区益田路5033号平安金融中心幸福花园1栋1105”、“深圳市招商银行”时,通过文字识别技术识别出文字“广东省深圳市福田区益田路5033号平安金融中心幸福花园1栋1105”为包含房屋地址信息,而文字“深圳市招商银行”则不包含房屋地址信息。

步骤102:从所述记录数据中提取出各个房屋所具有的多种房屋属性信息,其中,所述房屋属性信息为能够反映房屋房产特性的信息,具体地,所述房屋属性信息可包括以下中的一种或多种:

房屋所在的楼层、房屋朝向、房屋面积以及房屋的户型。

步骤103:识别所述记录数据中所述房屋地址信息相互关联的房屋。此处,房屋地址信息相互关联可包括房屋地址信息所反映的房屋处于相同的房屋楼层、相同的房屋朝向、相同的房号末位两位数字、相同的房屋面积以及相同的房屋的户型等。

应当理解的是,在某些房屋的房屋属性信息相同时,还可使其他种类的房屋属性信息相同,如在房屋地址信息相互关联的关联关系为相同的房号末位两位数字时,且在两房屋同属一栋单元楼时,两房屋的其他房屋属性信息如房屋面积、房屋户型在极多数情形下是相同的。

步骤104:若相互关联的一房屋的房屋属性信息不完整,则依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息以使得相互关联的同种房屋属性信息一致。

此处,房屋属性信息不完整也即从所述记录数据中提取出房屋属性信息不能充分或较为充分地反映出房屋房产特性。当房屋属性信息所对应的房屋地址信息与其他房屋地址信息相关联时,可依据其他房屋地址信息所具有的同种房屋属性信息来补充该不完整的房屋属性信息。

在一具体应用例中,在一房屋地址信息为“幸福花园1栋1105,朝南,面积145m2”,提取出的房屋属性信息包括:a1)幸福花园;b1)幸福花园1栋;c1)幸福花园1栋1105;d1)幸福花园1栋1105,朝南;e1)幸福花园1栋1105,朝南,面积145m2

另一房屋地址信息为“幸福花园1栋1505”,提取出的房屋属性信息包括:a2)幸福花园;b2)幸福花园1栋;c2)幸福花园1栋1505,而缺失d2、e2两个房屋属性信息。

此时两房屋的房屋地址信息相关联,关联关系为相同的楼盘单元楼栋及相同的房号末位两位数字,据此,可依据一房屋地址的“d1)幸福花园1栋1105,朝南;e1)幸福花园1栋1105,朝南,面积145m2”补充另一房屋地址信息“幸福花园1栋1505”的同种房屋属性信息(即d2、e2),补充后另一房屋地址信息得到完整信息“幸福花园1栋1505,朝南,面积145m2”,其中,补充的另一房屋属性信息分别为“d2)幸福花园1栋1505,朝南”、“e2幸福花园1栋1505,朝南,面积145m2”。

本实施方式所提供的信息处理方法通过获取包含房屋地址信息的记录数据,并从记录数据中提取出各个房屋所具有的多种房屋属性信息,在识别所述记录数据中所述房屋地址信息相互关联的房屋的前提下,在相互关联的一房屋的房屋属性信息不完整时,依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息,以使相互关联的同种房屋属性信息一致,从而实现对房屋属性信息不完整的房屋的信息补充,利于提升及时补充缺失的房屋信息,提升房地产信息处理系统的信息实时性。

可以理解的是,上述依据相关联的房屋地址信息去补充同种房屋属性信息为基于一定的房屋通用设计规则所确定,因而对房屋有特殊改造的并不能完全适用,对此,可根据更后期的记录数据对应的信息录入对相应的房屋属性信息进行修正。

本实施方式中,在所述识别所述记录数据中所述房屋地址信息相互关联的房屋之后,在依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息以使得相互关联的同种房屋属性信息一致之前,还可对所述相互关联的房屋的同种房屋属性信息进行比对,比对结果中的对比差异范围大于预设差异范围,则将其中一房屋所对应的同种房屋属性信息修改为与另一房屋所对应的同种房屋属性信息,由此实现对相应信息的修正。其中,所述对比差异范围大于预设差异范围可以为二者间存在差异,也可为二者的差异在一定的范围区间内。

在一具体实施方式中,如一房屋的房屋地址信息为“幸福花园1栋1105,朝南”,另一房屋的房屋地址信息为“幸福花园1栋1505,朝北”,两房屋的房屋地址信息相关联,具体为一房屋的a3)幸福花园1栋对应另一房屋的a4)幸福花园1栋,一房屋的b3)幸福花园1栋1105对应另一房屋的b4)幸福花园1505,基于关联关系比对一房屋“c3)幸福花园1栋1105,朝南”、另一房屋“c4)幸福花园1栋1505,朝北”可知二者的同种房屋属性信息c3、c4存在差异,此时可将另一房屋的房屋属性信息c4修改为“幸福花园1栋1505,朝南”,由此使得c3与c4信息相一致。

应当理解的是,在确定以哪一房屋的房屋地址信息作为修改参考时,可依据房屋地址信息的完整度,房屋地址信息对应的记录数据的录入时间确定。如房屋地址信息的完整度越高,该信息通常更为准确;如房屋地址信息对应的记录数据的录入时间越迟,数据通常为最新,该信息通常更为准确。当然,还可结合多个条件以确定哪一房屋的房屋地址信息更为准确,从而作为另一房屋的修改参考。

本实施方式中,从所述记录数据中提取出各个房屋所具有的多种房屋属性信息可包括:

在已知数据量较少或质量较差时,利用决策树算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息;

在已知数据量较多或质量较好时,利用人工神经网络算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息。

其中,所述已知数据可包括数据库中存储的数据和/或当前获取的记录数据,而其量的大小判定取决于预设的数据量阈值,也即当已知数据量大于预设的数据量阈值时,判定当前的已知数据量较多,反之则判定当前的数据量较小。所述已知数据质量的较好或较差的判定,取决于数据所反映的信息准确程度和/或完整度,准确度、完整度越高则判定已知数据质量较好,反之则判定质量较差。

所述利用决策树算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息可包括:构建决策树训练集及决策树测试集以确定决策树模型,根据确定的所述决策树模型从所述记录数据中提取出各个房屋所具有的多种房屋属性信息。

所述利用人工神经网络算法从所述记录数据中提取出各个房屋所具有的多种房屋属性信息可包括:构建人工神经网络训练集及人工神经网络测试集以确定人工神经网络模型,根据确定的所述人工神经网络模型从所述记录数据中提取出各个房屋所具有的多种房屋属性信息。

参见图3,本发明还提供一种信息处理装置,图中,信息处理装置10可应用于房地产信息处理系统,可包括:

获取模块11,可以用于获取包含房屋地址信息的记录数据。

提取模块12,可以用于从所述记录数据中提取出各个房屋所具有的多种房屋属性信息。

识别模块13,可以用于识别所述记录数据中所述房屋地址信息相互关联的房屋。

信息补充模块14,可以用于在相互关联的一房屋的房屋属性信息不完整时,依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息以使得相互关联的同种房屋属性信息一致。

通过各个模块之间的配合,历经:通过获取包含房屋地址信息的记录数据,并从记录数据中提取出各个房屋所具有的多种房屋属性信息,在识别所述记录数据中所述房屋地址信息相互关联的房屋的前提下,在相互关联的一房屋的房屋属性信息不完整时,依据相互关联的另一房屋的同种房屋属性信息补充所述相互关联的一房屋的房屋属性信息,以使相互关联的同种房屋属性信息一致,从而实现对房屋属性信息不完整的房屋的信息补充,利于提升及时补充缺失的房屋信息,提升房地产信息处理系统的信息实时性。

参见图4,本发明还提供一种房地产信息处理系统,途中,房地产处理系统1包括信息处理装置10,以实现对房屋属性信息不完整的房屋的信息补充,利于提升及时补充缺失的房屋信息,提升房地产信息处理系统的信息实时性。

应当理解的是,所述房地产信息系统还可包括其他装置,如数据警报装置等,以实现在数据有较大的安全风险时进行警报的功能。当然,还可包括其他装置,在此不再赘述。

本发明还提供一种计算机,该计算机可包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,如信息处理程序。所述处理器执行所述计算机程序时,实现上述信息处理方法实施方式中的步骤,例如图1所示的步骤101至步骤104。或者,所述处理器执行所述计算机程序时实现上述装置实施例中各模块的功能。

所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1