一种大型信息化系统数据流式稽核的实现方法及系统与流程

文档序号：11677702阅读：819来源：国知局

本发明涉及大型信息化系统的数据稽核分析领域，尤其是一种大型信息化系统的数据流式稽核实现方法及系统。

背景技术：

信息化有助于企业进行制度创新，提升企业综合竞争力。近年来，我国政企业信息化的应用水平逐步深入，大部分政企集团构建了自己的大型业务支持信息系统，大型业务支持信息系统由多个组件或网元构成，各个组件或网元为保证业务响应能力采用数据本地化，由此相关数据在各个相关系统进行了冗余存储。伴随着信息化时代的到来，业务支持信息化系统的工单、交易数据流量飞速增加，数据结构呈现出了多样性。政企业务支持系统在实际持续系统、业务和运营中，各个组件或网元的冗余数据不一致会导致各组件出现业务结果冲突，例如电信运营商由于这种数据差异的存在导致业务订购、计费及服务的不一致问题日趋严重，由此带来客户投诉增加，业务收入流失，客户服务水平和满意度降低，影响决策系统的可信性。政企集团对于各个组件或者网元数据不一致的情况逐渐重视，各个组件或者网元数据不一致的稽核处理结果的精准性要求也不断的提高。

通过建设数据流式稽核技术，开展大型信息化系统各组件、网元间的数据稽核同步，即通过系统的手段发现差异，是弥补大型信息化系统内部数据不一致缺陷的最直接有效的手段，确保大型信息系统的健壮性、可靠性、可控性。现有技术中数据稽核系统平台从ftp中转服务器上获取各个网元平台采集的数据，获取到数据之后再由数据稽核平台进行数据的比较和差异处理，这存在稽核结果准确度不高，不能有效排除异常数据对稽核结果影响的问题。

技术实现要素：

本发明针对上述存在的问题，提供一种利用时间差收集稽核元数据与差异比较法相结合的可大大提高稽核准确度的大型信息化系统数据流式稽核的实现方法及系统。

本发明采用的技术方案如下：

一种大型信息化系统的数据流式稽核实现方法，其特征在于包括

步骤(1)利用时间差分别从不同网元节点中收集稽核元数据；

步骤(2)将稽核元数据分布存储在流式稽核组件中；

步骤(3)进行数据流式稽核；

步骤(4)校准稽核结果；

步骤(5)存储稽核结果。

更进一步地，所述步骤(1)中提前δt时间开始从一网元节点中收集数据，提前δt’间结束从该网元节点中收集数据。

更进一步地，所述δt和δt’为数据在相邻网元节点间传递所用的时间。

更进一步地，所述δt的范围为0-1s，δt’的范围为0-1s。

更进一步地，所述步骤(2)稽核元数据分布存储前进行分批封装处理。

更进一步地，所述流式稽核组件包括计算中心和中间件库。

更进一步地，所述中间件库包括差异计算模型中间件。

更进一步地，所述步骤(3)包括实时自动数据流式稽核、按配置任务自动数据流式稽核和手动数据流式稽核。

更进一步地，所述步骤(4)中剔除相邻两次稽核的差异数据集的相同数据。

一种大型信息化系统的数据流式稽核实现系统，其特征在于包括利用时间差收集稽核元数据模块、分布存储稽核元数据模块、流式稽核模块、稽核结果校准模块和稽核结果存储模块。

综上所述，由于采用了上述技术方案，本发明的有益效果是：利用时间差从网元中收集稽核元数据和利用差异比较法校准稽核结果，可以有效规避异常数据对稽核结果的影响，大大提升流式稽核结果的准确性；分布存储稽核元数据可以实现自动容错，保证稽核的差异数据的准确度。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1为本发明所述的一种大型信息化系统的数据流式稽核实现方法流程图。

具体实施方式

本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

本说明书中公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换。即，除非特别叙述，每个特征只是一系列等效或类似特征中的一个例子而已。

一种大型信息化系统的数据流式稽核实现方法，其特征在于包括，

步骤(1)利用时间差分别从网元节点中收集稽核元数据；

步骤(2)将稽核元数据分布存储在流式稽核组件中；

步骤(3)进行数据流式稽核；

步骤(4)校准稽核结果；

步骤(5)存储稽核结果。

具体实施例以存在网元a和网元b分析，由于网络上数据流是串行的，在某一时间节点对网元a节点和网元b节点同时开始收集数据时，有部分数据已经通过网元a节点流向了网元b节点，这导致网元b节点中有一部分数据在网元a节点中不存在。同理，在某一时间节点对网元a节点和网元b节点同时停止收集数据时，一部分数据已经通过了网元a节点，但是未到达网元b节点，这导致网元a节点中有一部分数据在网元b节点中不存在。所以，由于网络传输、系统堵塞等原因造成相同时间段内获取的数据集合有差异，而这部分数据并不是真正意义上的差异，这部分应该被当做异常数据处理。

所述步骤(1)中提前δt时间开始从网元a节点中收集数据，提前δt时间在网元a节点获取正在由网元a节点流向网元b节点的数据，保证网元a节点和网元b节点有相同的开始数据流集；提前δt’间结束从网元a节点中收集数据，保证在网元a节点和网元b节点中的结束数据一致。利用时间差异从网元中分别收集数据，可以减少获取的网元数据中的异常数据。

所述δt和δt’为数据在相邻网元节点间传递所用的时间，选取一部分标识性的数据，获取这部分数据分别经过网元a节点的时间和经过网元b节点的时间，用数据到达网元b节点的时间值减去数据到达网元a节点的时间值，即为标准的△t时间，作为一种优选方式，δt与δt’相等。

进一步地，所述δt的范围为0-1s，δt’的范围为0-1s。

所述流式稽核组件包括计算中心和中间件库，将差异计算模型编写成一个或者多个中间件，并将中间件上传到流式稽核组件的中间件库，流式稽核组件的计算中心和中间件库通过心跳来判断是否有中间件加入或删除，如果计算中心判断有新的中间件加入，则会将该中间件加入到中间件库中，如果计算中心判断有中间件删除，则会将该中间件从中间库中删除。不管是新增中间件或删除中间件，都不需要对原有系统做任何的变更，中间件库的设计提高了流式稽核系统的通用性。

所述步骤(2)中稽核元数据分到达流式稽核组件后，将稽核元数据以时间片(秒级)为单位把稽核元数据拆分成一批批数据，排列在一个先进先出的队列。当开始进行差异稽核时，差异计算模型从队列出依次取出每一个批次的数据，把每一批次的数据封装成一个集合，然后开始进行流式稽核。把稽核元数据分批封装处理可以实现实时自动流式稽核。

采用分布存储方式对稽核元数据进行存储，数据在系统中存储多个副本，当某个存储节点出现故障时，系统自动将服务切换到其他副本，实现自动容错和容错透明，提高了流式稽核的准确度。

数据流式稽核包括实时自动数据流式稽核、按配置任务自动数据流式稽核和手动数据流式稽核。实时自动数据流式稽核确保了差异的实时性。

稽核结果校准步骤中中剔除相邻两次稽核的差异数据集的相同数据，相邻两次稽核的差异数据集都存在的数据为异常数据，将这部分数据剔除可以防止异常数据导致的稽核误差。

将流式稽核组件计算得出的差异结果集作为差异文件存储到数据库中，并提供查询接口，方便外部系统对差异结果的对接查询。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：龚历
技术所有人：电信科学技术第五研究所
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。