社保数据的治理方法和系统与流程

文档序号:33743646发布日期:2023-04-06 10:48阅读:287来源:国知局
社保数据的治理方法和系统与流程

本技术涉及数据治理,具体涉及一种社保数据的治理方法和系统。


背景技术:

1、数据治理,是组织中涉及数据使用的一整套管理行为。由数据治理部门发起并推行,关于如何制定和实施针对整个组织内部数据的商业应用和技术管理的一系列政策和流程。国际数据管理协会(dama)给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合。

2、国际数据治理研究所(dgi)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(who)能根据什么信息,在什么时间(when)和情况(where)下,用什么方法(how),采取什么行动(what)。

3、数据治理的最终目标是提升数据的价值,数据治理非常必要,是组织实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。从范围来讲,数据治理涵盖了从前端事务处理系统、后端业务数据库到终端的数据分析,从源头到终端再回到源头形成一个闭环负反馈系统(控制理论中趋稳的系统)。从目的来讲,数据治理就是要对数据的获取、处理、使用进行监管(监管就是我们在执行层面对信息系统的负反馈),而监管的职能主要通过五个方面的执行力来保证——发现、监督、控制、沟通、整合。

4、新设立的医保部门,是从人社部门、卫生健康部门、民政部门承接的医保险种管理职能,因为没有历史包袱,国医疗保障局一开始就全新制定了全国统一的业务标准和技术标准,全新建设了全国统一的信息平台和应用系统,要求中央及地方各级统筹区落地并使用统一的国家医疗保障服务平台和应用系统,在此基础之上再根据本地实际需求在遵循统一标准的前提下进行必要的扩建。

5、相关技术中,在系统实践中,由于受历史数据继承等主客观因素的影响,部分关键维度并没有彻底遵循最新的统一标准和规范,而是仍沿用旧的编码,而且业务系统中的编码、财务系统中的编码与现行最新国家标准或行业标准不一致甚至三者各不相同,业务含义和数据范围在变革前后有巨大差异导致全部指标口径不可比。


技术实现思路

1、为至少在一定程度上克服相关技术中存在的社保数据的一些关键维度没有统一标准,造成后续数据处理存在困难的问题,本技术提供一种社保数据的治理方法和系统。

2、根据本技术实施例的第一方面,提供一种社保数据的治理方法,包括如下步骤:

3、根据指定的数据维度确定对应的目标字段;

4、将待采集数据源中的目标字段在预设的字典表中进行对照映射,获得标准化的目标字段;所述字典表中存储有多种目标字段与标准化后的目标字段之间的对应关系;

5、基于标准化的目标字段,确认待采集数据源中社保数据的采集范围;

6、根据确认后的采集范围,从待采集数据源中批量抽取相应的社保数据;

7、基于预设的财务核算规则,对抽取的社保数据进行数据质量检验。

8、进一步地,指定的数据维度为:统筹区,对应的目标字段为:区划编码;

9、将待采集数据源中的目标字段在字典表中进行对照映射,包括如下步骤:

10、读取字典表中预先存储的一种或多种标准化的区划编码;其中,所述标准化后的区划编码包括国标编码;

11、遵循预设的优先级顺序,依次在一种或多种标准编码中进行匹配查询,确定对应的标准化后的区划编码;

12、如果在标准编码中未匹配到对应的区划编码,则通过字典表中的自定义编码进行匹配查询。

13、进一步地,指定的数据维度为:险种制度,则对应的目标字段为:险种编号;

14、将待采集数据源中的目标字段在字典表中进行对照映射,包括如下步骤:

15、通过险种编号进行物理结构映射,确定相应险种的起始年和/或终止年,并将所述起始年和/或终止年作为所述标准化的目标字段。

16、进一步地,指定的数据维度为:会计年度,则对应的目标字段为:数据采集年度;

17、将待采集数据源中的目标字段在字典表中进行对照映射,包括如下步骤:

18、当前有效的或涉及前后发生有效性变化的统筹区和/或险种制度,标注统筹区和/或险种制度对应的数据采集年度的字段值,并将标注结果作为所述标准化的目标字段;

19、如果数据采集年度的字段值的标注结果为空,表示当年及以后年度不再采集该数据采集年度对应的数据。

20、进一步地,从待采集数据源中批量抽取相应的社保数据,包括如下步骤:

21、每隔第一时间间隔执行一次定时批处理,抽取当年从年初到当前的凭证分录数据;

22、每隔第二时间间隔执行一次实时流处理,采集银行日记账/交易流水,或按需调用接口查询各银行账户的最新余额;

23、其中,第一时间间隔和第二时间间隔均为预设值,第一时间间隔大于第二时间间隔。

24、进一步地,基于预设的财务核算规则,对抽取的社保数据进行数据质量检验,包括如下步骤:

25、对抽取的社保数据进行统计学处理,检验不同指标的统计数据是否符合预设的财务核算规则。

26、进一步地,该方法还包括如下步骤:

27、对抽取的社保数据进行财务分析,获得各险种制的多个原生指标和/或衍生指标及对应的度量值;

28、基于获取到的各指标及其度量值生成可视化图表。

29、根据本技术实施例的第二方面,提供一种社保数据的治理系统,包括:

30、目标确定模块,用于根据指定的数据维度确定对应的目标字段;

31、对照映射模块,用于将待采集数据源中的目标字段在预设的字典表中进行对照映射,获得标准化的目标字段;所述字典表中存储有多种目标字段与标准化后的目标字段之间的对应关系;

32、范围确定模块,用于基于标准化的目标字段,确认待采集数据源中社保数据的采集范围;

33、数据抽取模块,用于根据确认后的采集范围,从待采集数据源中批量抽取相应的社保数据;

34、质量检验模块,用于基于预设的财务核算规则,对抽取的社保数据进行数据质量检验。

35、根据本技术实施例的第三方面,提供一种计算机设备,包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器中的计算机程序,以实现如上任意一种实施例所述方法的操作步骤。

36、根据本技术实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任意一种实施例所述方法的操作步骤。

37、本技术的实施例提供的技术方案具备以下有益效果:

38、本技术的方案通过预先维护一个涵盖各种不同标准的字典表,在实际执行抽取社保数据之前,先通过字典表的映射自动形成统一的数据标准,从而确定精准的数据抽取范围;因此本技术的方案与基金财务系统的功能和流程无缝衔接但与财务生产数据松散耦合,能够无缝适配各类数据源,为多数据源的社保数据治理提供了自动化解决方案。

39、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1