一种精准识别贫困户的系统及识别方法与流程

文档序号:16756633发布日期:2019-01-29 17:27阅读:776来源:国知局
一种精准识别贫困户的系统及识别方法与流程

本发明涉及精准扶贫技术领域,具体涉及一种精准识别贫困户的系统及识别方法。



背景技术:

精准识别贫困户是一个复杂工作,在业务上涉及公安、国土、住建、工商、编办、财政、国税等多个政府部门,在数据对接上需要将精准识别系统的全区贫困户数据与上述各个政府部门的信息系统进行数据比对,由于该精准识别系统尚未与上述部门的信息系统进行联网,目前跨部门的数据比对工作只能采用人工方式进行,但是存在以下问题:(一)未能全面精准识别贫困户。目前,各县区扶贫工作人员通过精准识别系统将本行政区域的建档贫困户数据与本地其他相关部门的信息系统数据进行比对,数据比对的范围限定在本行政区域内。由于不是全口径数据,存在数据比对结果不完全真实的问题,导致帮扶数据存在漏报、错报、瞒报等问题,从而导致帮扶资金没有真正落实到需要帮扶对象上。例如:某县的在册建卡贫困户到省会买房就无法比对出来。

(二)比对效率极低。工作人员从精准识别系统中逐条将数据发送给其他部门进行比对,比对效率极低,且没有全区统一的数据传输渠道,数据安全也得不到保障,极易出现人为错误。

(三)很难做到精准帮扶。对于已经识别的贫困户和贫困村,由于缺乏相关部门数据支撑,目前仍不能做到深入分析致贫原因,无法科学制定并落实脱贫帮扶计划,从而使帮扶在一定程度上流于形式,造成帮扶资金使用不到位,效益低下。

(四)扶贫管理粗放。过渡依赖人工的系统,导致不能对扶贫对象进行全方位、全过程的监测,无法实时反映帮扶情况,无法做到对扶贫对象进行动态管理,无法为扶贫开发工作提供科学决策支持。

(五)扶贫考核与问责很难量化。实时、动态数据缺失,导致在一定时间周期内很难对扶贫效果进行量化考核,奖优罚劣。



技术实现要素:

为了解决上述问题,本发明提供了一种精准识别贫困户的系统及识别方法,具体技术方案如下:

一种精准识别贫困户的系统,包括后端和前端,所述后端包括数据上传模块、数据清洗校验模块、数据预处理模块、数据比对模块;

所述前端包括数据上传管理模块、数据监控管理模块、数据比对结果管理模块、报表管理模块、数据分析模块;

所述数据上传模块用于上传相关部门的贫困户数据并将上传的相关部门的贫困户数据快速写入数据库中;所述数据清洗校验模块用于对上传的相关部门的贫困户数据进行合法性校验和完整性校验;所述数据预处理模块用于对上传的相关部门的贫困户数据中的数据字段进行统一化,并对相关部门的贫困户数据进行初步判定;所述数据比对模块用于将上传的相关部门的贫困户数据与原始数据进行比对,并输出比对结果,比对结果为贫困户被否决、贫困户可疑、贫困户正常;

所述数据上传管理模块用于选择手动上传相关部门的贫困户数据或者自动上传相关部门的贫困户数据并显示贫困户数据上传结果和可进行人工校验贫困户数据;所述数据监控管理模块用于显示贫困户数据上传情况、贫困户数据统计情况和贫困户数据比对进度情况;所述数据比对结果管理模块用于展示数据比对结果;所述报表管理模块用于导出比对结果报表,其中否决结果报表、可疑结果报表和正常结果报表可分别导出;所述数据分析模块用于分析贫困户的分布情况、可疑贫困户的特征和被否决的贫困户特征。

优选地,所述前端还包括系统设置模块;所述系统设置模块用于用户管理、权限管理、数据字典管理、地址字典库管理;所述用户管理具体为配置系统访问的用户;所述权限管理具体为设置用户对应的使用权限;所述数据字典管理具体为配置数据字典,所述数据字典的内容包括数据上传部门、数据上传字段名称;所述地址字典库管理具体为将统计的地址数据导入地址库中,供地址数据校验,可添加、删除、修改。

优选地,所述前端还包括数据接口管理模块;所述数据接口模块用于根据不同相关部门显示专属定义的数据接口标准提供可下载的贫困户数据上传模板,且支持数据比对原则自定义编辑修改。

优选地,所述前端还包括日志管理模块,所述日志管理模块用于数据导入日志管理、数据比对日志管理、操作日志管理及其他日志管理;所述数据导入日志管理具体为显示相关部门的贫困户数据导入上传日志;所述数据比对日志管理具体为显示服务器数据比对日志;所述操作日志管理具体为显示比对结果报表导出日志和比对结果状态的人工修改日志;所述其他日志管理包括显示用户的登录日志。

优选地,所述前端还包括登录模块;所述登录模块通过账户、密码、ca数字证书实现登录系统。

优选地,所述相关部门包括公安厅、国家税务局、工商行政管理局、住房和城乡建设厅、财政厅、国土资源厅、机构编制委员会办公室、教育厅、人力资源和社会保障厅。

优选地,所述系统包括基础设备层、数据层、平台层、应用业务层、接入层、展示层。

采用精准识别贫困户的系统识别贫困户的方法包括以下步骤:

(1)通过数据上传管理模块选择手动上传相关部门的贫困户数据或者自动上传相关部门的贫困户数据,通过数据上传模块将各相关部门的贫困户数据导入并快速写入数据库中,并通过数据监控管理模块查看贫困户数据上传情况,通过数据上传管理模块查看贫困户数据上传结果;

(2)通过数据清洗校验模块对上传的相关部门的贫困户数据进行合法性校验和完整性校验;

(3)通过数据预处理模块对对上传的相关部门的贫困户数据中的数据字段进行统一化,并对相关部门的贫困户数据进行初步判定;

(4)通过数据比对模块将上传的相关部门的贫困户数据与原始数据进行比对,并输出比对结果,比对结果为贫困户被否决、贫困户可疑、贫困户正常;通过数据监控管理模块查看贫困户数据比对进度情况;通过数据比对结果管理模块查看数据比对结果;

(5)通过报表管理模块导出比对结果报表,其中否决结果报表、可疑结果报表和正常结果报表可分别导出;

(6)通过数据分析模块分析贫困户的分布情况、可疑贫困户的特征和被否决的贫困户特征。

本发明的有益效果为:通过本发明提供的精准识别贫困户的系统及识别方法,通过将相关部门的贫困户数据导入系统并进行比对,本发明建立了全方位、全口径、自动化数据比对机制,可以精准识别贫困户的财产拥有情况,进而精准识别贫困户,同时还可以分析贫困户的分布情况、可疑贫困户的特征和被否决的贫困户特征,为“精准扶贫、精准脱贫”的管理与决策提供数据支撑。

附图说明

图1为本发明中一种精准识别贫困户的系统的结构示意图;

图2为本发明中登录模块的逻辑示意图;

图3为本发明中一种精准识别贫困户的系统的分层示意图。

具体实施方式

为了更好的理解本发明,下面结合附图和具体实施例对本发明作进一步说明:

如图1所示,一种精准识别贫困户的系统,包括后端和前端,后端包括数据上传模块、数据清洗校验模块、数据预处理模块、数据比对模块;前端包括数据上传管理模块、数据监控管理模块、数据比对结果管理模块、报表管理模块、数据分析模块。

数据上传模块用于上传相关部门的贫困户数据并将上传的相关部门的贫困户数据快速写入数据库中,并进行数据分类存储。相关部门包括公安厅、国家税务局、工商行政管理局、住房和城乡建设厅、财政厅、国土资源厅、机构编制委员会办公室、教育厅、人力资源和社会保障厅。具体根据数据来源部门、来源县区、上报时间、上报批次等不同的分类方法进行分类数据存储,同时自动生成相应的原始数据数据库字段。

数据清洗校验模块用于对上传的相关部门的贫困户数据进行合法性校验和完整性校验,数据的合法性校验具体为:每次在导入各相关部门上报的贫困户数据时,先检索数据库中是否存在相同字段的数据。如发现存在批量数据重复,则可判断本次即将导入的数据不合法,需要对应相关部门重新校验数据合法性之后再作导入。数据的完整性校验具体为:各相关部门在提供上报贫困户数据时,需同时提供每次上报数据总量,在数据导入时分两次导入主备数据库中,当两次导入的数据的总量保持一致时,且与各相关部门提供的上报数据总量一致,则识别本次数据导入完整可靠。

数据预处理模块用于对上传的相关部门的贫困户数据中的数据字段进行统一化,并对相关部门的贫困户数据进行初步判定,具体为:对各相关部门上传的数据进行比对预处理,按照数据字段统一规范生成相应的字段名称,对各相关部门上传的数据统一化管理,确保数据信息完整有效,同时根据制定的扶贫判定标准,判定各相关部门上传的贫困户数据新增“可疑”、“否决”判定字段。

数据比对模块用于将上传的相关部门的贫困户数据与原始数据进行比对,并输出比对结果,比对结果为贫困户被否决、贫困户可疑、贫困户正常;具体为:建立数据模型,设计并行数据比对的计算方法,用原始数据与各相关部门上传的贫困户数据进行比对,比对的条件是“姓名”、“身份证”,并输出比对结果,比对结果包括贫困户被否决、贫困户可疑、贫困户正常,通过数据库分表存储“否决”、“正常”、“可疑”等不同状态人员数据,并生成静态数据。原始数据为原来的建档立卡数据。

数据上传管理模块用于选择手动上传相关部门的贫困户数据或者自动上传相关部门的贫困户数据并显示贫困户数据上传结果和可进行人工校验贫困户数据;贫困户数据采用excel或csv文件上传至数据上传模块,如果选择自动上传相关部门的贫困户数据,则可先查看自动导入的贫困户数据,再确认导入,显示导入结果。

数据监控管理模块用于显示贫困户数据上传情况、贫困户数据统计情况和贫困户数据比对进度情况;可采用大屏幕显示,数据监控管理模块分为两级页面,第一级页面显示省、区或直辖市各相关部门的贫困户上传情况、贫困户数据统计情况、贫困户数据比对进度情况,第二级页面显示对应省、区、直辖市的各市、行政区、县的贫困户上传情况、贫困户数据统计情况、贫困户数据比对进度情况。

数据比对结果管理模块用于展示数据比对结果;具体为:根据各相关部门分批次上传的贫困户数据,按批次展示数据比对结果,进而展示各相关部门的数据比对总体结果。通过数据比对模块对各相关部门上传的贫困户数据进行比对后,显示在对应页面的数据比对结果,可以通过人工审核修改状态确认对应人员是否为贫困户,如果无法确定,可以通过报表管理模块导出比对结果报表,再进行人工跟踪确认。

报表管理模块用于导出比对结果报表,其中否决结果报表、可疑结果报表和正常结果报表可分别导出。可根据所选过滤项自行定制统计范围,过滤项支持细分到按区县划分,同时允许操作员对统计结果进行导出操作,导出结果可选择不同文件格式(excel等)保存于本地。

数据分析模块用于分析贫困户的分布情况、可疑贫困户的特征和被否决的贫困户特征,其中贫困户的分布情况根据数据比对结果以柱状图的形式呈现。

前端还包括系统设置模块;系统设置模块用于用户管理、权限管理、数据字典管理、地址字典库管理;用户管理具体为配置系统访问的用户,具体为:为用户提供用户账户、密码,密码正确则进入系统首页,错误则提示相关错误信息。权限管理具体为设置用户对应的使用权限具体为:针对所有用户分别对各类对象信息进行访问控制和操作范围,如编辑权限、修改权限、新建权限;数据字典管理具体为配置数据字典,数据字典的内容包括数据上传部门、数据上传字段名称等;地址字典库管理具体为将统计的地址数据导入地址库中,供地址数据校验,可添加、删除、修改。

前端还包括数据接口管理模块,数据接口模块用于根据不同相关部门显示专属定义的数据接口标准提供可下载的贫困户数据上传模板,且支持数据比对原则自定义编辑修改。

前端还包括日志管理模块,日志管理模块用于数据导入日志管理、数据比对日志管理、操作日志管理及其他日志管理;数据导入日志管理具体为显示相关部门的贫困户数据导入上传日志;数据比对日志管理具体为显示服务器数据比对日志;操作日志管理具体为显示比对结果报表导出日志和比对结果状态的人工修改日志;其他日志管理包括显示用户的登录日志。

后端还包括快速缓存读写、数据路由。快速缓存读写运用分布式缓存的原理,建立多台缓存服务器,查询结果可直接从缓存服务器返回,具体为:修改数据字段状态的时候,采用消息队列的设计方式,定时处理批量数据,在数据比对的时候,将要比对的部门数据先加载到不同服务器的内存中,然后并发的比对,最后将比对结果合并后进行数据持久化存储。而对于海量数据的存储,系统采用的是数据分片的方式将数据进行切分并分配到各个机器中区,数据分片后,系统通过数据路由模型查找某一记录的存储位置,以此增加读操作的并发性又可以提高单次读的读取效率。

前端还包括登录模块;登录模块通过账户、密码、ca数字证书实现登录系统。密码输入正确时进入系统首页,密码输入错误时提示错误信息,未插入ca数字证书提示“请检查是否已插入ca”。具体逻辑图如图2所示。

图3为本发明中一种精准识别贫困户的系统的分层示意图,一种精准识别贫困户的系统包括基础设备层、数据层、平台层、应用业务层、接入层、展示层,具体如下:

基础设备层:包括网络硬件设备、服务器设备、信息安全基础设备、ca认证设备。

数据层:该层将数据进行了整合,通过“数据对接”从各相关部门获取了扶贫相关基础数据,将贫困基础数据落实到户,实现基础数据的精准;建立统一的扶贫数据交换标准和架构标准,实现了对杂乱数据的清洗、比对、封装和处理,为数据开发提供支持。

平台层:该层利用大数据数据框架和数据管理工具将大数据资源进行了整合,组成扶贫大数据仓库。扶贫大数据仓库存储的数据包括:贫困户基础信息库、扶贫项目库、扶贫资源库,还包括利用已有的应用系统或者互联网数据采集手段,将特定数据进行采集和入库的互联网数据库。将各项数据进行时间序列的匹配和空间信息的定位,可以实现基础数据的可视化展示,查询统计,专题图管理等基础功能。

应用业务层:业务层分为前端和后端。前端主要用于数据比对展示,包含数据上传管理模块、数据接口管理、数据比对结果管理模块、数据分析模块、数据监控管理模块、报表管理模块等。后端主要用于数据管理,包括数据上传模块、数据清洗校验模块、数据预处理模块、快速缓存读写模块、数据路由模块、数据比对模块。

接入层:通过建立访问门户站点实现与展现层的“政府各级领导”“各级扶贫干部”等对象的数据和业务连通,主要包含登录、访问控制、数据交换等功能。

展示层:精准识别贫困户的系统建设需要实现数据的可视化展示,展示层主要面向“政府各级领导”、“各级扶贫干部”等用户,提供比对结果展示,为政府提供高效的决策指挥工具,同时平台也更便捷、更直观、更精准的服务社会各界人士。

采用精准识别贫困户的系统识别贫困户的方法包括以下步骤:

(1)通过数据上传管理模块选择手动上传相关部门的贫困户数据或者自动上传相关部门的贫困户数据,通过数据上传模块将各相关部门的贫困户数据导入并快速写入数据库中,并通过数据监控管理模块查看贫困户数据上传情况,通过数据上传管理模块查看贫困户数据上传结果;

(2)通过数据清洗校验模块对上传的相关部门的贫困户数据进行合法性校验和完整性校验;

(3)通过数据预处理模块对对上传的相关部门的贫困户数据中的数据字段进行统一化,并对相关部门的贫困户数据进行初步判定。在数据字段统一化处理阶段,系统需先对上传的数据进行审核筛选,及时剔除不符合条件的数据,数据筛选完成后,系统根据预设的数据字段统一规范生成相应的字段名称,处理完成的数据最终会进行统一的管理,以确保数据信息完整有效;

(4)通过数据比对模块将上传的相关部门的贫困户数据与原始数据进行比对,并输出比对结果;具体为:建立数据模型,设计并行数据比对的计算方法,用原始数据与各相关部门上传的贫困户数据进行比对,比对的条件是“姓名”、“身份证”,并输出比对结果。比对结果为贫困户被否决、贫困户可疑、贫困户正常;通过数据监控管理模块查看贫困户数据比对进度情况;通过数据比对结果管理模块查看数据比对结果;

(5)通过报表管理模块导出比对结果报表,其中否决结果报表、可疑结果报表和正常结果报表可分别导出;

(6)通过数据分析模块分析贫困户的分布情况、可疑贫困户的特征和被否决的贫困户特征。

步骤(4)中数据模型的建立是通过现有数据按户建立家庭关系。人与人之间的关联规则是形如的蕴涵表达式,其中x和y是不相交的项集,即。关联规则的强度可以用它的支持度和置信度来度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定y在包含x的交易中出现的频繁程度。支持度和置信度这两种度量的形式定义如下:

通过上述算法建立家庭关系后,再针对公安厅、国家税务局、工商行政管理局、住房和城乡建设厅、财政厅、国土资源厅、机构编制委员会办公室、教育厅、人力资源和社会保障厅提供的基础数据及相关特征,接合国家关于贫困的相关定义文件,得到检索表达式。

各厅局具体检索公式如下:

公安厅:

从公安厅检索得到某农户是否拥有车辆的信息,同时从过往的信息中得到贫困户拥有车辆的概率p(car|poor)和非贫困户拥有车辆的概率p(car|npoor)。

国家税务局:

从国家税务局检索得到某农户是否拥有价值大于3万的车辆信息,同时从过往的信息中得到贫困户拥有价值大于3万的车辆的概率p(carprice|poor)和非贫困户拥有价值大于3万的车辆的概率p(carprice|npoor)。

工商行政管理局:

从工商行政管理局检索得到某农户是否登记有经营公司的信息,同时从过往的信息中得到贫困户登记开公司的概率p(company|poor)和非贫困户登记开公司的概率p(company|npoor)。

住房和城乡建设厅:

从住房和城乡建设厅检索得到某农户是否登记有商品房的信息,同时从过往的信息中得到贫困户登记商品房的概率p(house|poor)和非贫困户登记商品房的概率p(house|poor)。

财政厅:

从财政厅检索得到某农户是否登记财政供养的信息,同时从过往的信息中得到贫困户登记财政供养的概率p(salary|poor)和非贫困户登记财政供养的概率p(salary|npoor)。

国土资源厅:

从国土资源厅检索得到某农户是否登记住房面积的信息,同时从过往的信息中得到贫困户登记住房面积的概率p(livingspace|poor)和非贫困户登记住房面积的概率p(livingspace|npoor)。

机构编制委员会办公室:

从机构编制委员会办公室检索得到某农户是否登记有编制的信息,同时从过往的信息中得到贫困户登记有编制的概率p(station|poor)和非贫困户登记有编制的概率p(station|npoor)。

教育厅:

从教育厅检索得到某农户是否登记有学历的信息,同时从过往的信息中得到贫困户登记有学历的概率p(education|poor)和非贫困户登记有学历的概率p(education|npoor)。

人力资源和社会保障厅:

从人力资源和社会保障厅检索得到某农户是否登记有社保缴费基数、领养老金额度的信息,同时从过往的信息中得到贫困户登记社保缴费基数、领养老金额度的概率p(payment|poor)和非贫困户登记社保缴费基数、领养老金额度的概率p(payment|npoor)。

各厅局汇总检索关系满足:

应用上述检索关系表达式,使用朴素贝叶斯分类算法对贫困户和非贫困户进行分类:

公式要计算某农户在符合某些条件(比如拥有车、住房、公司)等情况下可能为贫困户和非贫困户的概率。公式中p(car|poor)表示贫困户拥有车的概率,而p(car|npoor)则为非贫困户拥有车的概率,以此类推。最后分别计算得到农户为贫困户的概率和农户为非贫困户的概率,根据统计学习理论中的期望风险最小化定理,结果只可能会出现>或者<两种情况。当>时,即农户为贫困户的概率>农户为非贫困户的概率,则该农户被认为是贫困户,当<时,即农户为贫困户的概率<农户为非贫困户的概率,该用户被认为是非贫困户。

本发明不局限于以上所述的具体实施方式,以上所述仅为本发明的较佳实施案例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1