基于住房监控平台的数据分析方法及装置与流程

文档序号:20017294发布日期:2020-02-25 10:48阅读:231来源:国知局
基于住房监控平台的数据分析方法及装置与流程

本发明涉及数据信息领域,具体地涉及一种基于住房监控平台的数据分析方法、一种基于住房监控平台的数据分析装置以及对应的存储介质。



背景技术:

目前数据挖掘公司对房产公司数据挖掘,主要通过数据采集、数据融合、数据分析以形成数据客户。该方式存在以下不足:由于数据挖掘公司往往涉及较多的领域,各个领域之间又往往是广而不深,因此生产的数据有很大程度上并不可靠,而且无法贴近房产公司的业务实际,进而无法对房产公司的业务产生精准的指导作用。而且相对于房产公司而言,拿到的客户数据是静态的,无法体现客户数据的动态变化。即这些客户数据是在数据分析完时刻的产出数据,后续这些客户信息发生变更将导致客户数据发生了变化,那么这变化部分也是不会体现在房产公司的客户数据中的。



技术实现要素:

本发明实施方式的目的是提供一种基于住房监控平台的数据分析方法及装置,以至少解决现有的获取到的客户数据存在精准性和动态性不足的问题。

为了实现上述目的,在本发明第一方面,提供了一种基于住房监控平台的数据分析方法,所述方法包括:

从所述住房监控平台选取待分析的区域和所述区域内与用户相关的数据维度,得到待分析的数据矩阵;

根据所述数据矩阵中的特征向量,从所述数据维度提取出重要维度;

从所述住房监控平台中筛选出与所述重要维度的相关性大于设定阈值的用户,形成目标用户。

可选的,所述待分析的数据矩阵,包括:以选取的区域为行,以选取的数据维度为列所构成的矩阵。

可选的,所述从所述数据维度提取出重要维度,采用主成分分析法。

可选的,所述从所述住房监控平台中筛选出与所述重要维度的相关性大于设定阈值的用户,包括:

获取某一区域中成交用户的重要维度的数据值;

计算所述区域中用户的重要维度的数据值与所述区域中成交用户的重要维度的数据值的相关性;

将所述相关性大于所述设定阈值的用户设为所述目标用户。

在本发明的第二方面,还提供了一种基于住房监控平台的数据分析装置,所述装置包括:

数据提取模块,用于从所述住房监控平台选取待分析的区域和所述区域内与用户相关的数据维度,得到待分析的数据矩阵;

数据分析模块,用于根据所述数据矩阵中的特征向量,从所述数据维度提取出重要维度;以及

用户筛选模块,用于从所述住房监控平台中筛选出与所述重要维度的相关性大于设定阈值的用户,形成目标用户。

可选的,所述待分析的数据矩阵,包括:以选取的区域为行,以选取的数据维度为列所构成的矩阵。

可选的,所述数据分析模块采用主成分分析法从所述数据维度提取出所述重要维度。

可选的,所述用户筛选模块,包括:

成交用户子模块,用于获取某一区域中成交用户的重要维度的数据值;

相关性计算子模块,用于计算所述区域中用户的重要维度的数据值与所述区域中成交用户的重要维度的数据值的相关性;以及

目标用户子模块,用于将所述相关性大于所述设定阈值的用户设为所述目标用户。

在本发明的第三方面,还提供了一种服务器,所述服务器包括前述的基于住房监控平台的数据分析装置。

在本发明的第四方面,还提供了一种存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述的基于住房监控平台的数据分析方法的步骤。

本发明上述技术方案通过基于住房监控平台进行数据分析,不仅使统计的数据更加全面,还能够智能化推荐客户,提升了营销效率和成交率,节省了公司的数据成本。

本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施方式的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施方式,但并不构成对本发明实施方式的限制。在附图中:

图1是本发明一种实施方式提供的基于住房监控平台的数据分析方法的示意图;

图2是本发明一种实施方式提供的基于住房监控平台的数据分析装置的结构示意图;

图3是本发明一种可选实施方式提供的基于住房监控平台的数据分析方法中的方法流程示意图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

在本发明实施方式中,在未作相反说明的情况下,使用的方位词如“上、下、顶、底”通常是针对附图所示的方向而言的或者是针对竖直、垂直或重力方向上而言的各部件相互位置关系描述用词。

图1是本发明一种实施方式提供的基于住房监控平台的数据分析方法的示意图。如图1所示,一种基于住房监控平台的数据分析方法,所述方法包括:

从所述住房监控平台选取待分析的区域和所述区域内与用户相关的数据维度,得到待分析的数据矩阵;

根据所述数据矩阵中的特征向量,从所述数据维度提取出重要维度;

从所述住房监控平台中筛选出与所述重要维度的相关性大于设定阈值的用户,形成目标用户。

如此,能够从海量的房产数据中选择携带信息量最多的数据,并根据信息量最多的特征,筛选出成交概率最大的潜在客户,从而使客户的需求分析更加精准,帮助公司做出更加有利的决策。

具体的,住房监控平台存在海量的数据,在做数据分析时需要知晓哪些数据具有重要信息。因此本发明的实施方式将待分析的区域和待分析的维度构成数据矩阵,并通过矩阵分析从其中提取出重要维度。该重要维度标识了该数据维度上携带的原有数据的信息最多,再采用此重要维度对住房监控平台中的海量客户进行分析,筛选出与成交用户关系最大的潜在客户,使客户经理能够实施更为精准的营销,以此提升营销效果和提高成交效率。

本发明提供的一种实施方式中,所述待分析的数据矩阵,包括:以选取的区域为行,以选取的数据维度为列所构成的矩阵。例如,在城市调研中,在一个区域选取七个维度进行分析,调研维度包括各区域房屋成交均价,各区域社区环境,各区域二手房占比,各区域人均收入,各区域住房交通情况,各区域住房成交周期,各区域特定人口住房成交情况等七个维度,进行数据录入。将这七个维度分别设为a1、b1、c1、d1、e1、f1、g1;同理可知,第n个区域的七个维度分别为an、bn、cn、dn、en、fn、gn,那么在两个维度上就将原始数据按行排列组成矩阵x,每一行代表一个区域,每一列代表一个统计维度,这里以两个区域为例:

通过对以上矩阵进行降维分析,将该矩阵中的样本数据投影到一个新的空间中去。对于一个矩阵来说,将其对角化即产生特征根及特征向量的过程,也是将其在标准正交基上投影的过程,而特征值对应的即为该特征向量方向上的投影长度,因此该方向上携带的原有数据的信息越多。

通过以上过程,使得分析客户需求更加精准,帮助公司做出更加有利的决策。

在本发明提供的一种实施方式中,所述提取所述数据矩阵中的重要维度,包括:采用主成分分析法从所述数据矩阵中提取出所述重要维度。针对以上七个维度数据,采用主要成分分析法(pca)进行降维分析。判断方式就是通过转换矩阵(特征向量)的长度。特征向量长就意味着,在这个维度(例如上述的可用性)上的变化明显,相反,若特征值短就意味着,在这个维度上,数据基本没有差异性因此没有分析价值,因为所有数据在该维度上都存在相同或相近的数据值。其提取重要维度的方法具体如下:

对x进行归一化,使x每一行减去其对应的均值,得到:

求x'的协方差矩阵:

求解c的特征值,利用线性代数知识或是matlab中eig函数可以得到:

μ1=m

μ2=n

对应的特征向量分别是:

将原数据降为一维,选择最大的特征值对应的特征向量,因此p为:

p=[lo]

降维后的数据为:

y=px′=[a″b″c″d″e″f″g″]

在本发明提供的一种实施方式中,所述从所述住房监控平台中筛选出与所述重要维度的相关性大于设定阈值的用户,包括:获取某一区域中成交用户的重要维度的数据值;计算所述区域中用户的重要维度的数据值与所述区域中成交用户的重要维度的数据值的相关性;将所述相关性大于所述设定阈值的用户设为所述目标用户。

根据前述的分析结果,进行数据落库,以及保存反映区域跟成交用户的相关关系数据。通过前述的分析,获取了海量数据库中的关系比较重要的维度,因此我们需要分析该维度下,用户与成交用户的相关性,以使经纪人化花时间在最有成交意向的客户上,促进成交效率,提升经纪人业绩。

其具体分析过程如下:相关系数是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式。相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。本实施方式以spss为实施软件,描述相关值的计算。

获取某一区域下成交用户的所述重要维度,比如成交用户的大多所选择的“各区域住房交通情况”,通过点击“分析”——“相关”——“双变量”,以成交用户的重要维度的值和每个用户的重要维度的实际值,进行相关系数计算。在“相关系数”框中可选择“pearson”,如果需要描述性分析,可以选择均值和标准差。由此每个用户可以得到一个与所述成交用户的重要维度的相关值δ,该相关值δ越大,表示该用户和成交用户之间越类似,其潜在的成交概率就越大。将该用户推荐给经纪人,也能够提升该经纪人的营销精准性。在实际的使用中,可以将相关值δ进行排序,每天推荐排名前若干名的客户推荐给经纪人,进行精准营销。也可以对相关值δ设定一定的阈值,对超过阈值的相关值δ的客户推荐给经纪人。

图2是本发明一种实施方式提供的基于住房监控平台的数据分析装置的结构示意图。如图2所示,本发明所提供的一种实施方式中,还提供一种基于住房监控平台的数据分析装置,所述装置包括:

数据提取模块,用于从所述住房监控平台选取待分析的区域和所述区域内与用户相关的数据维度,得到待分析的数据矩阵;

数据分析模块,用于根据所述数据矩阵中的特征向量,从所述数据维度提取出重要维度;以及

用户筛选模块,用于从所述住房监控平台中筛选出与所述重要维度的相关性大于设定阈值的用户,形成目标用户。

在一些实施方式中,所述待分析的数据矩阵,包括:以选取的区域为行,以选取的数据维度为列所构成的矩阵。

在一些实施方式中,所述数据分析模块采用主成分分析法从所述数据维度提取出所述重要维度。

在一些实施方式中,所述用户筛选模块,包括:成交用户子模块,用于获取某一区域中成交用户的重要维度的数据值;相关性计算子模块,用于计算所述区域中用户的重要维度的数据值与所述区域中成交用户的重要维度的数据值的相关性;以及目标用户子模块,用于将所述相关性大于所述设定阈值的用户设为所述目标用户。

关于本发明实施例系统的更多的细节可以参照上文关于基于住房监控平台的数据分析方法的描述,并能够取得与上述的基于住房监控平台的数据分析方法相同或相应的技术效果,故在此便不赘述。

本发明所提供的一种实施方式中,还提供一种基于住房监控平台的数据分析装置,所述装置包括:存储器和处理器;

所述存储器,用于存储程序指令;

所述处理器,用于调用所述存储器中存储的所述程序指令以实现前述的基于住房监控平台的数据分析方法,形成目标用户。其中,处理器可以包括但不限于通用处理器、专用处理器、常规处理器、多个微处理器、控制器、微控制器、专用集成电路(asic)、现场可编程门阵列(fpga)电路、其他任何类型的集成电路(ic)以及状态机等等。在常用的场景中,该装置优选为服务器。

图3是本发明一种可选实施方式提供的基于住房监控平台的数据分析方法中的方法流程示意图,如图3所示:

各城市调研,调研维度包括各区域房屋成交均价,各区域社区环境等多个维度进行数据录入;

针对以上多个维度数据,采用主要成分分析法(pca)进行降维分析。判断方式就是通过转换矩阵,即特征向量的长度。特征向量长就意味着,在这个维度上的变化明显,相反,若特征值短就意味着:在这个维度上,数据基本没有差异性因此没有分析价值。

根据上一步的分析结果,数据落库;取出各区域与成交用户的相关关系数据,采用统一变量法进行算法分析,取相同区域下成交用户相关关系数据,相同区域下成交用户相关关系越大的用户,设置的相关因子(δ)越高,每天将相关因子大的区域的用户推荐给经纪人。

本发明的实施方式还提供一种存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述的基于住房监控平台的数据分析方法的步骤。

本发明实施方式提供的上述技术方案,所述数据分析方法能够从海量数据中筛选出潜在成交客户,节省了公司的数据成本,提升了成交率。

以上结合附图详细描述了本发明的可选实施方式,但是,本发明实施方式并不限于上述实施方式中的具体细节,在本发明实施方式的技术构思范围内,可以对本发明实施方式的技术方案进行多种简单变型,这些简单变型均属于本发明实施方式的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施方式对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施方式的方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施方式的思想,其同样应当视为本发明实施方式所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1