数据采集方法、装置、电子设备及存储介质与流程

文档序号:29747122发布日期:2022-04-21 22:19阅读:198来源:国知局
数据采集方法、装置、电子设备及存储介质与流程

1.本发明涉及数据处理领域,尤其涉及一种数据采集方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.随着大数据的日益发展,数据采集成为一个必不可少的流程,目前大数据的数据采集通常是基于nginx+flume+kafka等组件实现,其中,nginx组件用于接收用户行为日志反向代理写入磁盘里去,flume组件直接从磁盘目录里读取nginx组件不断写入的日志,以写入kafka组件中,但是在nginx到数据采集层flume,及flume到kafka存储层容易存在数据丢失的情况,从而导致数据采集的不够完整。


技术实现要素:

3.本发明提供一种数据采集方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现数据采集的零丢失,保障数据采集的完整性。
4.为实现上述目的,本发明提供的一种数据采集方法,包括:
5.识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;
6.在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中;
7.在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中;
8.将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。
9.可选地,所述采用主备复制的方式将所述业务数据库中待采集数据加载至数据同步组件中,包括:
10.配置所述数据同步组件的主采集节点和备采集节点;
11.利用所述主采集节点向所述业务数据库中采集所述待采集数据,实时监控所述主采集节点向所述业务数据库进行数据采集是否出现异常;
12.若所述主采集节点未出现异常,继续所述待采集数据的采集,并将采集的数据传输至所述数据同步组件中;
13.若所述主采集节点出现异常,切换所述备采集节点采集所述待采集数据,并将采集的数据传输至所述数据同步组件中。
14.可选的,所述利用所述主采集节点向所述业务数据库中采集所述待采集数据,包括:
15.在所述业务数据库配置所述主采集节点的日志文件,基于所述日志文件从所述业
务数据库中读取所述待采集数据。
16.可选地,所述基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中,包括:
17.实时监控所述数据同步组件的数据在存储过程中所述消息中间件是否出现异常;
18.若所述消息中间件出现异常,则将所述数据同步组件的数据暂存至本地磁盘中,直至所述消息中间件恢复异常后将所述本地磁盘的数据上传至所述消息中间件中;
19.若所述消息中间件未出现异常,则继续执行所述数据同步组件中的数据存储。
20.可选地,所述采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,包括:
21.采用反向代理的方式将所述前端页面中的待采集数据分发至预先部署多台日志采集系统的数据采集层中;
22.识别所述前端页面中的待采集数据在分发过程中所述日志采集系统是否出现宕机,并存在所述日志采集系统出现宕机时,将所述前端页面中的待采集数据转发至未出现宕机的日志采集系统的数据采集层中。
23.可选地,所述采用反向代理的方式将所述前端页面中的待采集数据分发至预先部署多台日志采集系统的数据采集层中,包括:
24.响应于所述前端页面中待采集数据的分发请求,采用负载均衡的方式将所述分发请求转发至所述预先部署多台日志采集系统的数据采集层中。
25.可选地,所述将所述缓存队列中的数据加载至所述日志采集系统的分发层中,包括:
26.响应于所述日志采集系统中分发层的数据采集需求,从所述缓存队列中拉取所述数据采集需求的目标数据;
27.采用故障转移的方式将所述目标数据加载在所述日志采集系统的分发层中。
28.为了解决上述问题,本发明还提供一种数据采集装置,所述装置包括:
29.数据类别识别模块,用于识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;
30.数据主备采集模块,用于在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中;
31.数据缓存模块,用于在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中;
32.数据分发采集模块,用于将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。
33.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
34.至少一个处理器;以及,
35.与所述至少一个处理器通信连接的存储器;其中,
36.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以实现上述所述的数据采集方法。
37.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的数据采集方法。
38.可以看出,本发明实施例通过识别待采集数据的数据类别,可以选取不同的数据采集方式执行数据采集,保障数据采集的可靠性,其次,本发明实施例在所述数据类别为业务数据时,通过主备复制方式,避免数据同步组件在向业务数据库进行数据采集时出现宕机的现象,并结合容错机制保障数据同步组件中的待采集数据向消息中间件进行存储时所述消息中间件出现宕机时的数据丢失,保障了向业务数据库进行数据采集的零丢失,保障了数据采集的完整性;进一步地,本发明实施例在所述数据类别为行为数据时,采用故障转移+缓存队列+容错机制,确保了通过日志采集系统向前端页面中进行数据采集时,及所述日志采集系统向消息中间件传输前端页面中的待采集数据时的数据零丢失,保障了数据采集的完整性。因此,本发明实施例提出的一种数据采集方法、装置、电子设备及计算机可读存储介质可以实现数据采集的零丢失,保障数据采集的完整性。
附图说明
39.图1为本发明一实施例提供的数据采集方法的流程示意图;
40.图2为本发明一实施例提供的数据采集方法中其中一个步骤的流程示意图;
41.图3为本发明一实施例提供的数据采集装置的模块示意图;
42.图4为本发明一实施例提供的实现数据采集方法的电子设备的内部结构示意图;
43.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
44.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
45.本发明实施例提供一种数据采集方法。所述数据采集方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之,所述数据采集方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
46.参照图1所示,为本发明一实施例提供的数据采集方法的流程示意图。在本发明实施例中,所述数据采集方法包括:
47.s1、识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据。
48.本发明实施例中,所述数据采集需求基于不同用户需求产生,如用户a的需求为采集用户身体健康数据,用户b的需求为采集用户身份数据,进一步地,本发明实施例通过识别数据采集需求的数据类别,以选取不同的数据采集方式执行数据的采集,保障数据采集的可靠性,其中,所述数据类别包括行为数据类别和业务数据类别,所述行为数据用于表征用户在网站或app中所浏览的数据,所述业务数据用于表征用户在网站或app中所填写的数
据,示例性,存在商城订单网站,用户在该商城订单网站中浏览了电子产品,并收藏了该商城订单网站的手机推荐产品,以及下订单购买了某型号的手机,于是,该用户的浏览和收藏行为所产生的数据可以作为本发明中行为数据,该用户下订单购买所填写的数据可以作为本发明中的业务数据。
49.作为本发明的一个实施例,所述识别所述数据采集需求的数据类别,包括:获取所述数据采集需求的采集对象,根据所述采集对象,识别所述数据采集需求的数据来源,若所述数据来源为前端页面,则将所述数据采集需求的数据类别划分为行为数据,若所述数据来源为后台数据库,则将所述数据采集需求的数据类别划分为业务数据。其中,所述采集对象是指所述数据采集需求的采集目标,其通过识别所述数据采集需求中的数据字段得到。
50.需要说明的是,所述前端页面是指人机交互的页面,其作为用户浏览页面数据的浏览载体,因此,本发明实施例将在所述前端页面所浏览的数据划分为行为数据,所述后台数据库用于保存用户在前端页面所填写的数据,常见的mysql数据库,其作为用户交互数据的存储载体,因此,本发明实施例将在所述前端页面所存储的数据划分为行为数据。
51.s2、在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中。
52.本发明实施例中,所述数据同步组件可以理解为数据中间件,其包括canal组件,用于监听数据库的数据变化,以实现数据库的数据采集,从而可以保障数据库中的数据同步备份,而在本发明实施例中,所述业务数据的数据来源为后台数据库,因此,本发明实施例通过从业务数据库中获取待采集数据,采用主备复制的方式将所述业务数据库中待采集数据加载至数据同步组件中,以实现业务数据库中待采集数据的零丢失采集,其中,所述主备复制的方式可以理解为在数据同步组件中配置主数据采集层和备数据采集层,在主数据采集层进行数据采集出现宕机的情况下,切换备数据采集层进行数据采集,从而保障数据采集的零丢失。
53.作为本发明的一个实施例,参阅图3所示,所述采用主备复制的方式将所述业务数据库中待采集数据加载至数据同步组件中,包括:
54.s201、配置所述数据同步组件的主采集节点和备采集节点;
55.s202、利用所述主采集节点向所述业务数据库中采集所述待采集数据,实时监控所述主采集节点向所述业务数据库进行数据采集是否出现异常;
56.s203、若所述主采集节点未出现异常,继续所述待采集数据的采集,并将采集的数据传输至所述数据同步组件中;
57.s204、若所述主采集节点出现异常,切换所述备采集节点采集所述待采集数据,并将采集的数据传输至所述数据同步组件中。
58.其中,所述主采集节点和备采集节点的配置可以通过java语言实现,所述主采集节点的异常监控可以通过监控脚本实现,所述监控脚本可以通过javascript脚本语言编译,所述备采集节点的切换可以通过配置中心zookeeper自动切换。其中,所述主采集节点的异常包括网络异常、服务器宕机以及线程崩溃等。
59.进一步地,本发明一可选实施例中,所述配置所述数据同步组件的主采集节点和备采集节点,包括:响应于业务需求,确定所述数据同步组件的服务器数量,根据所述服务
器数量,利用所述java语言编译所述数据同步组件的主服务器和从服务器,并将所述主服务器和所述从服务器分别作为所述主采集节点和备采集节点。
60.进一步地,本发明一可选实施例中,所述利用所述主采集节点向所述业务数据库中采集所述待采集数据,包括:在所述业务数据库配置所述主采集节点的日志文件,基于所述日志文件从所述业务数据库中读取所述待采集数据。其中,所述日志文件包括二进制日志文件,其用于监听所述业务数据库的数据变化状态,如数据新增、更新等状态。
61.进一步地,本发明实施例中,所述消息中间件是一种高吞吐量的分布式发布订阅消息系统,其包括kafka组件,用于实时处理和存储消费者在网站中的所有动作流数据,而在本发明实施例中,所述业务数据中的待采集数据为实时产生的用户数据,因此,本发明实施例将用户产生的实时数据存储至消息中间件中,以保障所述待采集数据的实时消费处理。
62.需要说明的是,在数据从数据同步组件传输至消息中间件的过程中,由于网络等原因会出现数据丢失的现象,因此,本发明实施例通过采用预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中,以保障数据采集的零丢失。其中,所述容错机制是指数据从数据同步组件传输至消息中间件的过程中,实时监控所述消息中间件是否出现异常,并在所述消息中间件出现异常时,将所述数据存储至本地磁盘中,以确保所述消息中间件异常恢复时数据的继续传输。
63.作为本发明的一个实施例,所述基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中,包括:实时监控所述数据同步组件的数据在存储过程中所述消息中间件是否出现异常,若所述消息中间件出现异常,则将所述数据同步组件的数据暂存至本地磁盘中,直至所述消息中间件恢复异常后将所述本地磁盘的数据上传至所述消息中间件中,若所述消息中间件未出现异常,则继续执行所述数据同步组件中的数据存储。可选的,所述消息中间件的异常监控可以通过上述监控脚本实现。
64.s3、在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中。
65.应该了解,在所述数据类别为行为数据时,表征待采集数据的数据来源为前端页面,其通过http协议进行数据传输,由于通过前端页面会产生大批量的数据,为保障后续日志采集系统可以全面接收前端页面的大批量数据,本发明实施例通过从前端页面中获取待采集数据,采用故障转移的方式将前端页面中的待采集数据加载至日志采集系统的数据采集层中,以实现所述待采集数据的数据零丢失采集。
66.其中,所述日志采集系统(flume)是指一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,所述日志采集系统的数据采集层可以理解为数据接收器,用于采集前端页面所产生的数据。
67.作为本发明的一个实施例,所述采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,包括:采用反向代理的方式将所述前端页面中的待采集数据分发至预先部署多台日志采集系统的数据采集层中,识别所述前端页面中的待采集数据在分发过程中所述日志采集系统是否出现宕机,并在所述日志采集系统出现宕机时,将所述前端页面中的待采集数据转发至未出现宕机的日志采集系统的数据采集层
中。
68.一个可选实施例中,所述采用反向代理的方式将所述前端页面中的待采集数据分发至预先部署多台日志采集系统的数据采集层中,包括:响应于所述前端页面中待采集数据的分发请求,采用负载均衡的方式将所述分发请求转发至所述预先部署多台日志采集系统的数据采集层中。其中,所述分发请求可以通过前置lvs(linux virtual server)触发,所述负载均衡的方式可以通过nginx实现。
69.进一步地,本发明实施例将所述数据采集层中的数据存入缓存队列中,以实现所述数据采集层中数据的异步处理,提高所述数据采集层中数据的处理效率。其中,所述缓存队列可以为所述日志采集系统的存储容器,如channel。
70.s4、将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。
71.本发明实施例通过将所述缓存队列中的数据加载至所述日志采集系统的分发层中,以实现待采集数据的异步采集,提高数据采集效率,可选的,所述将所述缓存队列中的数据加载至所述日志采集系统的分发层中,包括:响应于所述日志采集系统中分发层的数据采集需求,从所述缓存队列中拉取所述数据采集需求的目标数据,采用故障转移的方式将所述目标数据加载在所述日志采集系统的分发层中。
72.其中,所述数据采集需求基于不同业务场景产生,如对于医疗场景,所述数据采集需求可以为采集医疗数据,对于金融场景,所述数据采集需求可以为采集金融数据,所述目标数据的拉取可以根据所述数据采集需求中采集对象进行匹配得到,所述故障转移的方式可以参阅上述s3的描述,其用于保障在数据加载过程中的数据零丢失。
73.进一步地,本发明实施基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中,以保障消息中间件在采集前端页面中待采集数据的数据零丢失,保障存储数据的全面性,其中,所述预构建的容错机制可以参阅上述s2的描述,在此不做进一步地赘述。
74.可以看出,本发明实施例通过识别待采集数据的数据类别,可以选取不同的数据采集方式执行数据采集,保障数据采集的可靠性,其次,本发明实施例在所述数据类别为业务数据时,通过主备复制方式,避免数据同步组件在向业务数据库进行数据采集时出现宕机的现象,并结合容错机制保障数据同步组件中的待采集数据向消息中间件进行存储时所述消息中间件出现宕机时的数据丢失,保障了向业务数据库进行数据采集的零丢失,保障了数据采集的完整性;进一步地,本发明实施例在所述数据类别为行为数据时,采用故障转移+缓存队列+容错机制,确保了通过日志采集系统向前端页面中进行数据采集时,及所述日志采集系统向消息中间件传输前端页面中的待采集数据时的数据零丢失,保障了数据采集的完整性。因此,本发明实施例提出的一种数据采集可以实现数据采集的零丢失,保障数据采集的完整性。
75.如图3所示,是本发明数据采集装置的功能模块图。
76.本发明所述数据采集装置100可以安装于电子设备中。根据实现的功能,所述数据采集装置可以包括数据类别识别模块101、数据主备采集模块102、数据缓存模块103以及数据分发采集模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备的处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
77.在本实施例中,关于各模块/单元的功能如下:
78.所述数据类别识别模块101,用于识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;
79.所述数据主备采集模块102,用于在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中;
80.所述数据缓存模块103,用于在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中;
81.所述数据分发采集模块104,用于将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。
82.详细地,本发明实施例中所述数据采集装置100中的所述各模块在使用时采用与上述的图1中所述的数据采集方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
83.如图4所示,是本发明实现数据采集方法的电子设备1的结构示意图。
84.所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如数据采集程序。
85.其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备1的控制核心(control unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行数据采集程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
86.所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如数据采集程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
87.所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
88.所述通信接口13用于上述电子设备1与其他设备之间的通信,包括网络接口和员工接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备1之间建立通信连接。所述员工接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,员工接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的员工界面。
89.图4仅示出了具有部件的电子设备1,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
90.例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
91.应该了解,所述实施例仅为说明之用,在专利发明范围上并不受此结构的限制。
92.所述电子设备1中的所述存储器11存储的数据采集程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
93.识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;
94.在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中;
95.在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中;
96.将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。
97.具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
98.进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
99.本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备1的处理器所执行时,可以实现:
100.识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;
101.在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中;
102.在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中;
103.将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。
104.在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
105.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
106.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
107.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
108.因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
109.本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
110.本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
111.此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
112.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1