一种基于关联规则算法的政务服务事项推荐方法与流程

文档序号:23709577发布日期:2021-01-23 16:29阅读:177来源:国知局
一种基于关联规则算法的政务服务事项推荐方法与流程

[0001]
本发明公开一种推荐方法,涉及数据挖掘技术领域,具体地说是一种基于关联规则算法的政务服务事项推荐方法。


背景技术:

[0002]
随着“互联网+政务服务”等工作的深入推进,各级政府网站信息内容的快速增加与用户个性化需求之间的矛盾日益凸显。面对日益增多的办事服务,单纯依靠简化优化网站结构、细分服务栏目来降低信息查找难度的做法难以为继。


技术实现要素:

[0003]
本发明针对现有技术的问题,提供一种基于关联规则算法的政务服务事项推荐方法,通过分析历史办件数据,提取申报的事项集合,利用关联规则算法分析获取频率申报的事项集合、事项间的关联规则以及关联关系的强度,依据过往的申报记录,推荐相关度高的其他事项,自动化、定量分析事项集合的支持度和关联规则的置信度,达到个性化、智能化的申报服务目的。
[0004]
本发明提出的具体方案是:
[0005]
一种基于关联规则算法的政务服务事项推荐方法:从政务服务的办件库读取办件数据,获取办件申请人的身份标识及所办事项的事项编码,
[0006]
合并具有相同身份标识的事项编码,组成事项集合,
[0007]
利用关联规则算法计算事项频繁项集及频繁项集支持度,通过频繁项集支持度筛选获得适合的事项频繁项集,
[0008]
利用筛选获得的事项频繁项集确定适合的关联规则,
[0009]
利用适合的关联规则进行当前办理的政务服务所涉及的其他相关服务事项的推荐。
[0010]
优选地,所述的一种基于关联规则算法的政务服务事项推荐方法中将身份标识和事项编码组成一条记录,利用数据库表进行存储。
[0011]
优选地,所述的一种基于关联规则算法的政务服务事项推荐方法中按照不同的聚合条件,利用不同数据库表存储事项集合。
[0012]
优选地,所述的一种基于关联规则算法的政务服务事项推荐方法中所述利用数据库表存储关联规则,根据存储关联规则的数据库表,获得关联规则相关的事项集合,根据存储事项集合的数据库表,获得身份标识信息,针对身份标识信息的用户进行相关服务事项的推荐。
[0013]
优选地,所述的一种基于关联规则算法的政务服务事项推荐方法中利用数据库表存储关联规则,将存储关联规则的数据库表加载到数据库中缓存,对于数据库已存储的事项集合,对事项集合对应的身份标识信息办理过的前置事项添加关联规则对应的事件集合的事项编码,进行相关服务事项的推荐。
[0014]
优选地,所述的一种基于关联规则算法的政务服务事项推荐方法中计算事项频繁项集及频繁项集支持度前,设定事项集合支持度阈值,去除低于支持度阈值的事项频繁项集,减少计算复杂度。
[0015]
优选地,所述的一种基于关联规则算法的政务服务事项推荐方法中利用筛选获得的事项频繁项集计算获得关联规则和置信度阈值,去除低于置信度阈值的关联规则,获得适合的关联规则。
[0016]
一种基于关联规则算法的政务服务事项推荐系统,包括采集模块、合并模块、计算模块及推荐模块,
[0017]
采集模块从政务服务的办件库读取办件数据,获取办件申请人的身份标识及所办事项的事项编码,
[0018]
合并模块合并具有相同身份标识的事项编码,组成事项集合,
[0019]
计算模块利用关联规则算法计算事项频繁项集及频繁项集支持度,通过频繁项集支持度筛选获得适合的事项频繁项集,
[0020]
利用筛选获得的事项频繁项集确定适合的关联规则,
[0021]
推荐模块利用适合的关联规则进行当前办理的政务服务所涉及的其他相关服务事项的推荐。
[0022]
本发明的有益之处是:
[0023]
本发明提供一种基于关联规则算法的政务服务事项推荐方法,利用关联规则算法筛选获得适合的事项频繁项集,利用筛选获得的事项频繁项集确定适合的关联规则,利用适合的关联规则进行当前办理的政务服务所涉及的其他相关服务事项的推荐。利用本发明方法依托群众办件大数据的支撑,利用数据挖掘方法,对群众的办件数据进行分析,研判用户的潜在需求,结合用户定制信息,主动为用户推荐关联度高的事项办事服务。并且量化关联规则、推荐的效果,自动推导,可定时更新,省去了人工配置推荐规则的过程,能够为不同的区划、部门或跨层级、跨区域、跨部门的组织机构提供相应的办件数据分析,优化频繁申报的事项集合和多事项的办理流程。
附图说明
[0024]
图1是本发明方法利用关联规则推荐方式之一示意图;
[0025]
图2是本发明方法利用关联规则推荐方式之二示意图;
[0026]
图3是本发明方法流程示意图。
具体实施方式
[0027]
关联规则挖掘是一种基于规则的机器学习算法,该算法可以在大数据库中发现感兴趣的关系。利用一些度量指标来分辨数据库中存在的强规则。也即是说关联规则挖掘是用于知识发现,而非预测,所以是属于无监督的机器学习方法。常见的关联规则算法包括apriori算法,fp-growth算法,cfp-growth算法等。
[0028]
关联规则算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。
[0029]
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以
更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
[0030]
本发明提供一种基于关联规则算法的政务服务事项推荐方法:从政务服务的办件库读取办件数据,获取办件申请人的身份标识及所办事项的事项编码,
[0031]
合并具有相同身份标识的事项编码,组成事项集合,
[0032]
利用关联规则算法计算事项频繁项集及频繁项集支持度,通过频繁项集支持度筛选获得适合的事项频繁项集,
[0033]
利用筛选获得的事项频繁项集确定适合的关联规则,
[0034]
利用适合的关联规则进行当前办理的政务服务所涉及的其他相关服务事项的推荐。
[0035]
本发明方法利用数据挖掘的关联规则学习算法,获取事项间的关联规则。所谓事项间的关联规则,即在申办事项a的基础上再申办事项b。
[0036]
事项集合支持度:数据集中包含该项集的记录所占的比例。
[0037]
关联规则置信度:一条关联规则生效的概率。
[0038]
本发明涉及关系型数据库,用于保存从办件库读取的办件、申请人、事项关联数据。还可能涉及键值对存储数据库,比如redis,用于保存算法计算得出的关联规则。由于redis的存储介质是内存,可以快速响应用户的请求。
[0039]
具有应用时,可涉及大数据计算平台,比如spark读取分析数据库中的数据,挖掘事项间的关联关系。其中需要用到的类库可能有:
[0040]
spark.sql,用于读取、写入数据库数据;同时也支持通过sql语句操作数据
[0041]
spark.ml,包含一系列机器学习算法,本发明使用其关联规则挖掘算法进行数据挖掘。
[0042]
在本发明的一些实施例中,从办件库读取办件申请人的办件数据,获取办件申请人的身份标识,和他所办事项的事项编码,组成记录,利用数据库表存入数据库。对于个人用户,身份标识可以是身份证号码、护照号码等唯一标识身份的信息,对于法人用户,身份标识可以是社会统一信用代码等。存储身份标识和事项编码的数据库表结构参考表1数据库表biz_log。
[0043]
表1
[0044][0045]
将具有相同身份标识的事项编码的记录合并,就组成事项集合。
[0046]
按照不同的聚合条件,将biz_log的查询结果,分别写入三个数据库表,分别是fp_
items,该表存储全部的事项集合;fp_items_dept,该表存储按部门代码聚合的事项集合;fd_items_region,该表存储按区划代码聚合的事项集合。分别利用表2数据库表fp_items,表3数据库表fp_items_dept,表4数据库表fp_items_region表示,其结构如下:
[0047]
表2
[0048][0049]
表3
[0050][0051]
表4
[0052][0053]
可设定事项集合支持度阈值,在后续计算中去除低于支持度阈值的事项频繁项集,以减少计算的复杂度,可利用spark,使用setminsupport(0.5)进行设置。
[0054]
使用关联规则算法计算事项频繁项集和频繁项集的支持度,同样可利用spark使用fpgrowth算法,如下:
[0055]
fpgrowthmodel model=new fpgrowth()
[0056]
.setitemscol("items")
[0057]
.setminsupport(0.5)
[0058]
.setminconfidence(0.6)
[0059]
.fit(itemsdf);
[0060]
计算频繁项集,通过频繁项集支持度筛选获得适合的事项频繁项集,将结果写入事项集合的数据库表中,并可利用spark调用:model.freqitemsets().show();
[0061]
可以得到如下数据结构:
[0062][0063]
利用筛选获得的事项频繁项集确定适合的关联规则,可利用spark调用model.associationrules().show();
[0064]
可以得到如下数据结构:
[0065][0066]
将合适的关联规则写入数据库,可通过两种数据库表形式进行存储:
[0067]
a)利用spark计算推荐结果,将其写入数据库,表结构如表5数据库表fp_result_prediction所示。
[0068]
在spark中调用model.transform(itemsdf).show();
[0069]
得到如下数据结构:
[0070][0071]
表5
[0072][0073]
b)将关联规则写入数据库,表结构如表6数据库表fp_result_rule所示。
[0074]
表6
[0075]
字段名类型说明antecedentvchar前置事项集合consequentvchar推荐事项集合confidencenumber置信度g_timetime集合的生成时间
[0076]
利用关联规则进行推荐。与关联规则保存的方式相应,推荐方法也有两种。
[0077]
a)利用表fp_result_prediction的记录与表fp_items或表fp_items_dept或表fp_items_region按item_codes连接,得到prediction即预测的事项集合。在依据fp_items等表中的applicant_id可查询办件申请人信息,向该用户以手机短信或邮件等方式推荐其可能需要办理的事项。参考图1。
[0078]
b)加载关联规则表fp_result_rule到redis缓存,使用表中的前置事项集合antecedent作为redis缓存的键值,成为整条fp_result_rule记录。每当办件申请人进行用户登录,系统将从fp_items等表中查询其申报过的事项集合,再通过事项集合到redis查询fp_result_rule记录;也可以通过事项详情页面,将用户办理的前置事项加上该事项的事项编码,到redis缓存查询,向其动态推荐其他可能需要办理的事项。参考图2。
[0079]
本发明基于数据挖掘的关联规则算法,应用于政务服务领域,利用办件申请人历史办件数据,自动化挖掘事项间的关联规则,为用户办事提供事项推荐。
[0080]
本发明同时支持对不同类别、不同层级、不同区划范围、不同部门的历史办件数据的关联规则挖掘。为跨层级、跨区域、跨部门或单独的区划、部门提供相应的办件数据分析,为如何更好地提供政务服务提供数据支撑。
[0081]
同时,本发明还提供一种基于关联规则算法的政务服务事项推荐系统,包括采集模块、合并模块、计算模块及推荐模块,
[0082]
采集模块从政务服务的办件库读取办件数据,获取办件申请人的身份标识及所办事项的事项编码,
[0083]
合并模块合并具有相同身份标识的事项编码,组成事项集合,
[0084]
计算模块利用关联规则算法计算事项频繁项集及频繁项集支持度,通过频繁项集支持度筛选获得适合的事项频繁项集,
[0085]
利用筛选获得的事项频繁项集确定适合的关联规则,
[0086]
推荐模块利用适合的关联规则进行当前办理的政务服务所涉及的其他相关服务事项的推荐。
[0087]
上述系统内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
[0088]
需要说明的是,上述各流程和各系统结构中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
[0089]
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1