一种基于关联分析的政务信息数据处理方法及系统与流程

文档序号:24130115发布日期:2021-03-02 17:20阅读:107来源:国知局
一种基于关联分析的政务信息数据处理方法及系统与流程

[0001]
本公开属于数据处理技术领域,尤其涉及一种基于关联分析的政务信息数据处理方法及系统。


背景技术:

[0002]
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
[0003]
目前的电子政务平台主要集中在政务服务器中进行数据的输入及输出工作,政务服务器处于局域网中,一般情况下,需要单独的服务器对政务服务器中存储的数据进行计算分析处理,这时则需要网络进行传输,但是上述政务数据在数据的传输过程中没有考虑数据传输的安全性及实时性。
[0004]
另外,目前的政务数据的处理仅仅限于数据的简单统计及图形展示,没有将政务信息进一步挖掘分析,没有充分利用数据之间的关联性,不能充分对数据进行展示。


技术实现要素:

[0005]
为克服上述现有技术的不足,本公开提供了一种基于关联分析的政务信息数据处理方法,能够实现对数据的安全传输及实时展示。
[0006]
为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:
[0007]
第一方面,公开了一种基于关联分析的政务信息数据处理方法,包括:
[0008]
通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
[0009]
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
[0010]
对获取的数据进行清洗及预处理,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
[0011]
将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
[0012]
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
[0013]
进一步的技术方案,对获取的数据进行清洗时,扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对数据进行分类,去除不需要字段、填充缺失内容。
[0014]
进一步的技术方案,对获取的数据进行清洗后,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图。
[0015]
进一步的技术方案,对获取的数据进行清洗后,接受经济社会发展相关指标对其消除数据量纲、进行标准化,将标准化后的指标数据采用主成分分析法进行处理。
[0016]
进一步的技术方案,调用第一数据列表及第二数据列表并进行数据关联分析时,
通过迭代,检索出关联规则模型中的所有频繁项集,完成连接步和剪枝步,利用频繁项集的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则,对关联结果进行分析并输出关联结果到界面。
[0017]
进一步的技术方案,将上述政务数据的关联结果进行发布时,通过通信方式将结果数据推送至用户终端或者共享云平台。
[0018]
进一步的技术方案,第一数据列表及第二数据列表分别暂存在存储器,为同一存储器或不同存储器。
[0019]
第二方面,公开了一种基于关联分析的政务信息数据处理系统,包括:
[0020]
数据获取模块,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
[0021]
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
[0022]
数据清洗模块,对获取的数据进行清洗及预处理;
[0023]
数据处理模块,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
[0024]
关联分析模块,将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
[0025]
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
[0026]
以上一个或多个技术方案存在以下有益效果:
[0027]
本公开技术方案在数据获取阶段,基于数据传输的安全性考虑,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护,确保数据的在传输阶段的安全性及准确性。
[0028]
本公开技术方案将不同的政务指标数据进行了关联处理,获得数据之间的关联性。
[0029]
本公开技术方案充分利用定量数据的分布分析方法以及主成分分析法将离散的政务公开数据转化为定量区间,并把海量的地方经济发展数据整合为综合指标,实现政务公开离散数据区间化、消除冗余数据,并实现经济社会发展信息整合。有效解决了离散数据难以导入计算模型的问题同时大大降低了运算量。
[0030]
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
[0031]
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
[0032]
图1为本公开实施例基于关联分析的政务信息数据处理系统结构示意图;
[0033]
图2为本公开实施例基于关联分析的政务信息数据处理apriori算法具体流程图。
具体实施方式
[0034]
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
[0035]
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0036]
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0037]
从大量的数据集中找到两者的关联关系这就需要用到数据挖掘技术,在大量的数据挖掘技术中apriori算法是解决此类问题的常用算法之一。apriori算法是一种挖掘关联规则的频繁项集算法,是目前影响最为广泛的挖掘布尔关联规则频繁项集的算法,其核心是基于两阶段频集思想的递推算法,该关联规则在分类上属于单维、单层、布尔关联规则。
[0038]
本发明选择apriori算法是因为此算法采用了逐层搜索的迭代的方法,过程简单明了,没有复杂的理论推导,也易于实现,目前apriori算法已经被广泛的应用到商业、网络安全等各个领域,因此apriori算法也同样适用于政务公开水平与经济社会发展的关联分析当中。
[0039]
实施例一
[0040]
本实施例公开了一种基于关联分析的政务信息数据处理方法,包括:
[0041]
通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
[0042]
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
[0043]
对获取的数据进行清洗及预处理,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
[0044]
将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
[0045]
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
[0046]
对获取的数据进行清洗时,扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对数据进行分类,去除不需要字段、填充缺失内容。
[0047]
对获取的数据进行清洗后,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图。
[0048]
对获取的数据进行清洗后,接受经济社会发展相关指标对其消除数据量纲、进行标准化,将标准化后的指标数据采用主成分分析法进行处理。
[0049]
参见附图1所示,调用第一数据列表及第二数据列表并进行数据关联分析时,通过迭代,检索出关联规则模型中的所有频繁项集,完成连接步和剪枝步,利用频繁项集的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则,对关联结果进行分析并输出关联结果到界面。
[0050]
将上述政务数据的关联结果进行发布时,通过通信方式将结果数据推送至用户终
端或者共享云平台。
[0051]
第一数据列表及第二数据列表分别暂存在存储器,为同一存储器或不同存储器。
[0052]
实施例子二
[0053]
惨啊进附图2所示,本实施例子公开了一种基于关联分析的政务信息数据处理系统,包括:
[0054]
数据获取模块,通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;
[0055]
判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作,读取时经过加密数据过滤及安全防护;
[0056]
数据清洗模块,对获取的数据进行清洗及预处理;
[0057]
数据处理模块,针对政务公开关键指标数据获得定量数据的分布分析图,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;
[0058]
关联分析模块,将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;
[0059]
调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果,将上述政务数据的关联结果进行发布。
[0060]
数据处理模块包括第一数据处理模块、第二数据处理模块,第一数据处理模块采用定量数据的分布分析方法对政务公开关键数据进行区间划分;第二数据模块采用主成分分析法对社会经济发展相关指标进行区间划分。在关联分析模块中利用apriori算法对对政务公开的关键指标数据以及该地经济发展综合指标数据进行关联分析,最终获得两组数据间的关联结果。
[0061]
数据清洗模块,用以扫描收集到的所有政务公开的关键指标数据以及该地经济发展相关的各项指标数据,对选取的某地政务公开关键指标评估得分数据(例如行政权力运行公开指标、政务公开保障机制指标等)和社会经济发展相关指标(例如地方人均gdp、地方标准化发展、依申请公开数量等)进行数据清洗,去除不需要字段、填充缺失内容;对数据进行分类分别传输到第一、第二数据处理模块。
[0062]
第一数据处理模块,接收政务公开关键指标数据对其进行量化、除去异常数据点,绘制定量数据的分布分析图;清洗完成的行政权力运行公开、政务公开保障机制等指标评估得分数据离散为多个区间;对行政权力运行公开、政务公开保障机制等指标评估得分数据进行定量数据的分布分析绘制频率分布直方图并修剪异常值,根据直方图频数分布情况把政务公开关键指标数据划分为高水平公开、中低水平公开和低水平公开区间。
[0063]
第二数据处理模块。接受经济社会发展相关指标对其消除数据量纲、进行标准化。将标准化后的指标数据采用主成分分析法进行处理,将处理后的综合指标划分为高发展水平、中低发展水平和低发展水平区间。
[0064]
具体为:清洗完成的地方人均gdp、地方标准化发展、依申请公开数量等数据使用主成分分析法消除数据量纲、进行标准化处理。将经济社会发展主成分得分离散化为多个区间包括:高发展水平、中低发展水平和低发展水平区间。
[0065]
关联分析模块。使用apriori算法对处理的标准化数据进行关联分析,获得两组数据间的关联结果,关联分析模块又可分为以下三个模块:频繁项集生成模块:通过迭代,检
索出关联规则模型中的所有频繁项集,完成连接步和剪枝步;关联规则计算模块:利用频繁项集模块生成的数据挖掘某地政务公开水平与经济社会发展水平之间的强关联规则;关联结果输出模块:获得两组数据间的关联结果,对产生的关联结果进行分析并输出分析结果。对关联结果进行分析并输出关联结果到界面。
[0066]
在具体实施例子中,将上述处理模块处理后的数据导入所述关联规则模型,形成数据集t={t1,t2,...,t
s
...}。对关联规则模型中的数据集t进行关联分析,使用apriori算法对数据集t进行关联分析,通过连接步和剪枝步迭代产生候选频繁项集,对频繁项集的每个候选集进行计数,抛弃小于最小支持度的项集,基于此频繁项集获取关联规则。根据频繁项集产生强关联规则,强关联规则满足最小支持度和最小置信度,在本发明中最小支持度设置为50%、最小置信度设置为70%,若关联规则高水平发展区间=>高发展水平区间,则认为政务公开水平和经济社会发展强关联。最终对关联结果进行分析并输出关联结果到界面。
[0067]
本公开技术方案有利于开展地方政府政务公开水平与经济社会发展之间的关联分析,根据计算的关联结果可以调整政务公开相关性影响因子的权重使政务公开工作更加合理化、规范化也可以促进政务公开工作的发展。
[0068]
实施例三
[0069]
本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例子一中的所述方法的步骤。
[0070]
实施例四
[0071]
本实施例的目的是提供一种计算机可读存储介质。
[0072]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行上述实施例子一中的所述方法的步骤。
[0073]
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本公开中的任一方法。
[0074]
本领域技术人员应该明白,上述本公开的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本公开不限制于任何特定的硬件和软件的结合。
[0075]
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
[0076]
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1