一种基于生活数据的群租分析方法

文档序号:6623560阅读:807来源:国知局
一种基于生活数据的群租分析方法
【专利摘要】本发明公开了一种基于生活数据的群租分析方法,包含数据采集,数据模型建立和统计分析各个步骤。本发明通过建立包含各个生活数据维度的数据模型,维度包含所在省、市、区、小区、使用类型如自来水,电力和煤气,使用时间如年、月,周期采集小区单元的生活数据,通过数据模型和统计工具对小区单元、所在小区、所在城市的使用水电煤产生的生活数据进行历史统计和分析,获取当月和历史数据的各个维度的统计指标,包含平均值、期望值、方差、分布区间等统计指标,对数据异常或分布在异常区间的小区单元进行预警和提示群租的可能性。通过数据建模和统计学工具分析生活数据,提供了一种使用简单快捷的群租预警分析方法。
【专利说明】一种基于生活数据的群租分析方法

【技术领域】
[0001] 本发明涉及统计学和计算机软件【技术领域】,更具体地说,涉及一种基于生活数据 的群租分析方法。

【背景技术】
[0002] 随着社会的发展,大城市人口越来越多,群租成为了大城市普遍存在的现象,由于 群租房的环境和承租人的经济能力,导致群租房环境较差,存在各种安全隐患,同时对周边 住户产生了较大的影响。
[0003] 因此,政府经常对各种群租进行清理,以杜绝各种安全事故的发生,由于城市的巨 大,人口的众多,管理上很难及时到位,尽管付出了巨大的劳动,每年仍然发生不少由于群 租导致的安全事故。
[0004] 政府目前通过各种法令的方式,限制群租的发生,但是由于监控手段的不力,主要 是通过街道或物业的访查,群众的举报,效率较差,在未发生事情的情况下,无法或很难入 室进行实地查看,也无法及时获取群租的信息,难以有效地监控和防止群租的发生。
[0005] 如何利用现代计算机技术的发展,对群租进行自动化的监测,提高管理水平和效 率成为我们的一个课题。
[0006] 而群租的一个特点是,居住密度较大,这就会导致生活必须的资料,在同一个地 区、城市的消费水平的背景下,如自来水,电力,煤气的消耗相比较其他正常居住的单元更 多,在统计上就能通过分析将其找出,各个小区单元使用的生活资料的数据在统计学中属 于离散型的变量,通过统计数学工具,确定数据分布的模型和各种统计指标,包含期望值, 方差等统计指标,采集每户的生活资料的消耗数据,并根据模型进行各个维度和粒度的自 动分析,找出消费数据波动较大的小区或楼道,或分布在给定置信区间之外的对象,对异常 对象进行重点分析和预警,如方差反映了数据波动较大,对这些小区或楼道就可以进行重 点分析,与期望值或横向比较指标偏高的话则提示群租的高可能性,偏低的话就可能为空 置房,并有针对性地对这些异常单元进行重点检查,以此提高了对群租的管理效率。
[0007] 结合期望值,方差等统计工具,就可以排除小区档次,小区地域不同导致的消费水 平差异的差别或季节变化带来的数据的波动的影响,如高档小区的消费水平较高,如夏季 的用电因为空调的开启会变得更多,此时的阈值,就不能简单的与档次较低的小区的阈值 或与别的季节设定为一样,而通过期望值,方差和统计分布等统计工具,采集的样本数据就 可以排除掉这些差异的干扰。
[0008] 有鉴于此,本发明的目的在于提出一种简单易行,通过数据分析和处理技术的一 种基于生活数据的群租分析方法。


【发明内容】

[0009] 对群租特征进行归纳和总结,采集生活数据进行数据建模和统计分析,自动提取 群租可能性较高的对象,包含如下步骤: 1) 系统对小区生活数据进行数据建模; 2) 系统采集包含水电煤在内的生活数据并导入到系统; 3) 设定数据统计分析工具和统计指标和预警阈值; 4) 对生活数据进行统计和分析,获取各个维度的统计数据的指标; 5) 对统计指标或分布区间异常的小区单元进行预警。
[0010] 进一步的,通过所提供的一种基于生活数据的群租分析方法为一种防止群租的管 理的发展提供有力保障,满足用户各方要求,提升用户友好体验。
[0011] 为实现上述目的,本发明的一个方面提供了一种基于生活数据的群租分析方法, 该方法包括: 通过分析生活资料的计费信息和特征,建立包含时间,位置,包含小区单元,小区,城市 以及消费类型,消费额各个维度在内的数据模型。
[0012] 通过与生活数据的计费信息系统的数据采集接口,包含自来水,电力,煤气在内, 以小区单元为最小单位,按计费周期采集小区单元的使用数据,包含时间,地址,户号、小区 单元号以及当月使用量和计费信息,按照所建立的数据模型将获取的数据通过清洗,转换, 导入到系统数据库。
[0013] 按照数据维度和分析粒度,包含时间,省、市、区,小区、小区单元,选择各个维度和 粒度的统计分析指标和数据分布模型,至少包含采集周期和历史周期的算术平均值,加权 平均值,最大值,最小值,期望值,方差以及其他所需的统计指标以及这些离散数据服从的 包含正态分布在内的数据分布模型,并设定统计指标的预警阈值。
[0014] 通过确定的数据模型和统计指标对各个维度级别和粒度,包含时间和位置,消费 类型,对采集的生活数据进行历史分析,获取不同粒度,包含月度、季度甚至年度的省、市、 区、小区、小区单元各个维度的统计数据。
[0015] 本发明提供的一种基于生活数据的群租分析方法的一个实施例中,该方法还包 括: 获取各个指标的统计数据后,通过横向和纵向的对比计算,包含各个维度的同比,环 t匕,分析各个维度和粒度的统计指标值以及所在的分布区间,对统计指标超出设定的对应 指标的阈值以及统计对象的指标值所处区间异常的对象进行预警提示,提示群租的可能 性,对于统计指标偏低的数据则提示空置的可能性。
[0016] 通过归纳和总结群租或空置的特征,可以知道空置的特征就是生活资料的使用量 较少或为零,群租的特征就是使用的生活数据,在横向或纵向对比下,统计指标一定会超出 正常使用范围以及必定分布在设定阈值外的区间,系统通过一个或多个周期连续统计和观 察,筛选出统计指标偏离阈值的小区单元以及指标所在的区间处于设定阈值之外分布区间 的单元,可认定这些单元为异常的小区单元,认为其群租或空置,将这些小区单元数据自动 提取汇总,通知系统管理者,管理者随后可以对这些小区单元进行有针对性的管理。
[0017] 具体来说具有以下优点: 自动分析和预警: 通过统计学的数学工具,确定数据分布模型和统计指标,对采集的数据进行自动化的 统计分析和处理,进行自动汇总分析,获取异常消费生活资料的小区单元并进行自动化的 预警。
[0018] 提高管理效率: 通过系统自动筛选出高概率的群租单元,管理者无需上门检查,通过系统自动判断即 可及时获知高概率群租的小区单元信息,避免了人工方式获取举报信息或事后判断,极大 地提高了管理效率。
[0019]

【专利附图】

【附图说明】
[0020] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,在附图中: 图1为本发明系统模块结构的示意图。
[0021] 图2为本发明业务流程示意图。
[0022]

【具体实施方式】
[0023] 下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。
[0024] 为实现上述目的,提出了一种基于生活数据的群租分析方法。
[0025] 以下通过结合附图,对本发明的实施方式进行描述 实现一种基于生活数据的群租分析方法的关键点如下: 数据采集和导入: 通过对接各个收费系统平台,通过数据访问接口,周期性获取生活信息收费平台的收 费原始数据,包含时间,省,市,区,小区,单元,以及当月的生活资料用量信息,将这些原始 数据采集到系统平台,并在系统平台根据数据模型所需字段,将这些数据进行抽取,清洗和 转化,导入到系统的数据库中。
[0026] 数据模型: 系统建立一套数据模型,对采集和导入的离散数据进行建模,包含概念数据模型、逻辑 数据模型、物理数据模型,以此对获取的数据进行计算机方式的抽象,其中: 概念模型主要用来描述世界的概念化结构,它使数据库的设计人员在设计的初始阶 段,摆脱计算机系统及数据库管理系统的具体技术问题,集中精力分析数据以及数据之间 的联系等。
[0027] 逻辑模型这是用户从数据库所看到的模型,是具体的数据库管理系统所支持的数 据模型,如网状数据模型、层次数据模型等等。此模型既要面向用户,又要面向系统,主要用 于数据库管理系统的实现。
[0028] 物理模型是面向计算机物理表示的模型,描述了数据在储存介质上的组织结构, 它不但与具体数据库管理系统有关,而且还与操作系统和硬件有关。每一种逻辑数据模型 在实现时都有起对应的物理数据模型。
[0029] 统计分析: 采集的小区单元的数据在统计学中属于独立的离散型变量,系统根据建立的数据模型 和数据计算统计指标和获取其分布区间,包含均值,期望值,方差,所服从的数据分布,根据 采集样本可采用正态分布,对获取的数据进行各个维度的统计和分析,获取各个维度的统 计信息,例如,获取纵向的年度,季度,月度,横向的市,区,小区,小区单元的多维度的算术 平均值,加权平均值,期望值,方差,置信区间等数据,并找出超出统计指标阈值或处于置信 区间之外的小区单元,并对这些处于异常状态的小区单元进行预警,指示其高概率群租的 可能性。
[0030] 例如:计算小区或楼道的方差,找出分布波动较大的楼道或小区,并对这些小区进 行重点监测,计算所在小区的本月的平均值,与小区单元当月的数据进行当月或连续多月 进行比较,超出一定比例,如超出50%的比例,即可认为异常; 或设定数据服从正态分布的情况下,即)ΓΝ( μ,。2)时,设定95%的置信度α,计算采 集小区单元数据的数学期望值μ和标准差σ,即可计算出该置信度的置信区间,对处于置 信区间之外的数据即可认为异常。
[0031] 通过判断多种条件下的异常可能或连续多个周期的计算仍然数据异常或处于异 常区间的情况下,即可多次认定异常的小区单元并将其作为预警的对象。
[0032] 系统主要功能模块如图1所示: 系统包含三个组成部分,分别为生活信息收费平台,传输网和系统平台,其中,生活信 息收费平台部分包含如下模块: 自来水收费系统100: 城市的自来水收费系统,集中保存了自来水收费数据,包含收费地址,户号,用水量和 费用等信息。 煤气收费系统模块101 : 城市的煤气收费系统,集中保存了煤气、天然气收费数据,包含收费地址,户号,用气量 和费用等信息。。
[0033] 电力收费系统模块102 : 城市的电力收费系统,集中保存了电力收费数据,包含收费地址,户号,用电量和费用 等信息。
[0034] 传输网络部分: 数据传输通道104 : 在收费系统和系统平台之间进行数据传输的数据通道,可以是固定宽带网或移动宽带 网络。
[0035] 系统平台部分: 数据采集接口 105 : 系统与生活收费系统的数据访问和采集接口,通过数据采集接口获取各个收费平台的 收费原始信息。
[0036] 业务逻辑模块106 : 系统的业务逻辑和控制模块,控制系统平台的各个功能模块,按照业务逻辑进行调用 和执行。
[0037]数据库 107 : 系统端的数据库功能模块,保存数据和提供基于数据库的各种功能。
[0038] 数据采集模块108 : 负责采集收费系统的数据,通过数据采集接口获取收费信息。 数据处理模块109 : 数据处理模块负责对采集的数据进行处理,转换成系统数据模型接受的数据格式。
[0039] 管理配置模块110: 系统管理和配置模块,并对系统进行各种管理和参数设置。
[0040] 数据分析模块111: 数据分析模块负责对系统的数据按照数据模型和统计分析算法进行分析,获取超出正 常使用区间的小区单元。
[0041] 数据预警模块112: 数据预警模块根据数据分析模块得出的分析结论,对其中的异常小区单元进行预警通 知。
[0042] 下面举一个例子来说明本发明用户使用一种基于生活数据的群租分析方法的业 务过程,该实施例中,如图2所示,业务流程包括以下步骤: 步骤201 :系统周期性从生活收费信息系统采集数据; 步骤202 :系统根据数据模型和目标数据库的结构对数据进行处理后导入到系统数据 库; 步骤203 :系统根据数据模型和统计分析指标,对保存的数据进行计算和分析,获取预 设的各个维度的统计分析指标; 步骤204 :系统按照监测的逻辑寻找异常的小区单元对象,对分析结果进行判断是否 满足预警条件,例如小区单元对象超出预警设定的阈值或处于异常分布区间将进行预警通 知,否则返回步骤201,继续下一个周期的分析流程。
[0043] 本发明的描述是为了示例和说明起见而给出的,而并不是无遗漏的或者将本发明 限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描 述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理 解本发明从而设计适于特定用途的带有各种修改的各种实施例。
【权利要求】
1. 一种基于生活数据的群租分析方法,其特征在于,对群租特征进行归纳和总结,采集 生活数据进行数据建模和统计分析,自动提取群租可能性较高的对象,包含如下步骤: 1) 系统对小区生活数据进行数据建模; 2) 系统采集包含水电煤在内的生活数据并导入到系统; 3) 设定数据统计分析工具和统计指标和预警阈值; 4) 对生活数据进行统计和分析,获取各个维度的统计数据的指标; 5) 对统计指标或分布区间异常的小区单元进行预警。
2. 如权利要求1所述的一种基于生活数据的群租分析方法,系统对小区生活数据进行 数据建模,其特征在于,通过分析生活资料的计费信息和特征,建立包含时间,位置,包含小 区单元,小区,城市以及消费类型,消费额各个维度在内的数据模型。
3. 如权利要求1所述的一种基于生活数据的群租分析方法,系统采集包含水电煤在 内的生活数据并导入到系统,其特征在于,通过与生活数据的计费信息系统的数据采集接 口,包含自来水,电力,煤气在内,以小区单元为最小单位,按计费周期采集小区单元的使用 数据,包含时间,地址,户号、小区单元号以及当月使用量和计费信息,按照所建立的数据模 型将获取的数据通过清洗,转换,导入到系统数据库。
4. 如权利要求1所述的一种基于生活数据的群租分析方法,设定数据统计分析工具和 统计指标和预警阈值,其特征在于,按照数据维度和分析粒度,包含时间,省、市、区,小区、 小区单元和数据类型,选择各个维度和粒度的统计分析指标和数据分布模型,至少包含采 集周期和历史周期的算术平均值,加权平均值,最大值,最小值,期望值,方差以及其他所需 的统计指标以及这些离散数据服从的包含正态分布在内的数据分布模型,并设定统计指标 的预警阈值。
5. 如权利要求1所述的一种基于生活数据的群租分析方法,对生活数据进行统计和分 析,获取统计数据的指标,其特征在于,通过确定的数据模型和统计指标对各个维度级别和 粒度,包含时间和位置,消费类型,对采集的生活数据进行历史分析,获取不同粒度,包含月 度、季度甚至年度的省、市、区、小区、小区单元各个维度的统计数据。
6. 如权利要求1所述的一种基于生活数据的群租分析方法,对统计指标或分布区间 异常的小区单元进行预警,其特征在于,获取各个指标的统计数据后,通过横向和纵向的对 比计算,包含各个维度的同比,环比,分析各个维度和粒度的统计指标值以及所在的分布区 间,根据统计指标进行异常小区单元的筛选,对统计指标超出设定的对应指标的阈值以及 统计对象的指标值所处区间异常的对象进行预警提示,提示群租的可能性,对于统计指标 偏低的数据则提示空置的可能性。
7. 如权利要求6所述的对统计指标或分布区间异常的小区单元进行预警,根据统计指 标进行异常小区单元的筛选,其特征在于,通过归纳和总结群租或空置的特征,可以知道空 置的特征就是生活资料的使用量较少或为零,群租的特征就是使用的生活数据,在横向或 纵向对比下,统计指标一定会超出正常使用范围以及必定分布在设定阈值外的区间,系统 通过一个或多个周期连续统计和观察,筛选出统计指标偏离阈值的小区单元以及指标所在 的区间处于设定阈值之外分布区间的单元,可认定这些单元为异常的小区单元,认为其群 租或空置,将这些小区单元数据自动提取汇总,通知系统管理者,管理者随后可以对这些小 区单元进行有针对性的管理。
【文档编号】G06F19/00GK104123477SQ201410401820
【公开日】2014年10月29日 申请日期:2014年8月15日 优先权日:2014年8月15日
【发明者】顾健 申请人:上海博路信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1