日志数据处理方法、装置、计算机设备和存储介质与流程

文档序号:17080160发布日期:2019-03-09 00:10阅读:139来源:国知局
日志数据处理方法、装置、计算机设备和存储介质与流程

本申请涉及互联网技术领域,特别是涉及一种日志数据处理方法、装置、计算机设备和存储介质。



背景技术:

随着互联网技术的迅速发展,电子邮件逐渐取代纸质信件成为人们常用的沟通手段,在电子邮件的发送过程中,邮件网关起到重要作用,邮件网关(例如ironport网关设备)在发送邮件后,会通过异步输出日志记录每封邮件的处理情况,通过解析日志可以获取邮件的发送结果。

传统技术中,由于日志文件中包含的信息众多,有很多无用的信息,邮件网关在解析日志文件获取邮件发送结果时,需要花费大量的时间,导致邮件发送结果的获取效率低下。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高邮件发送结果获取效率的日志数据处理方法、装置、计算机设备和存储介质。

一种日志数据处理方法,所述方法包括:

获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据所述创建时间的先后顺序从所述待解析日志文件集合中选取预设数量的待解析日志文件,将选取的所述待解析日志文件写入第一文件队列;

调用多个第一线程对所述第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件;

将拆分得到的所述接收日志文件写入第二文件队列;

调用多个第二线程从所述第二文件队列中读取接收日志文件,从读取到的所述接收日志文件中提取第一标识及与所述第一标识相关联的第二标识,将提取到的所述第一标识及其对应的第二标识关联存储至数据库中;

从拆分得到的状态日志文件中选取目标状态日志文件,将所述目标状态日志文件写入第三文件队列;

调用多个第三线程从所述第三文件队列中读取目标状态日志文件,从读取到的所述目标状态日志文件中提取状态描述信息及与所述状态描述信息对应的第二标识,根据所述第二标识将所述状态描述信息存储至所述数据库。

在其中一个实施例中,所述根据所述创建时间的先后顺序从所述待解析日志文件集合中选取预设数量的待解析日志文件,包括:

获取所述当前待解析日志文件集合中各个待解析日志文件的内存大小;

获取所述第一文件队列对应的当前可用内存容量;

根据各个所述待解析日志文件对应的内存大小及所述第一文件队列对应的当前可用内存容量确定所述待解析日志文件对应的选取数量。

在其中一个实施例中,所述调用多个第一线程对所述第一文件队列中的待解析日志文件进行拆分,包括:

获取预设的关键字,所述关键字包括第一类关键字和第二类关键字;

将所述第一类关键字与所述待解析日志文件进行匹配以得到对应的接收日志文件,将所述第二类关键字与所述待解析日志文件进行匹配以得到对应的状态日志文件。

在其中一个实施例中,所述方法还包括:

调用监控线程分别对所述第一文件队列、所述第二文件队列以及所述第三文件队列进行监控,根据各个文件队列的日志文件数量对各个文件队列对应的线程数量进行调整。

在其中一个实施例中,在所述将选取的所述待解析日志文件写入第一文件队列之后,还包括:

将选取的所述待解析日志文件写入第四文件队列,并将写入第四文件队列的所述待解析日志文件的状态标记为第一状态;

在调用多个第一线程对所述第一文件队列中的待解析日志文件进行拆分之后,所述方法还包括:

将拆分完成的待解析日志文件在所述第四文件队列中的状态更新为第二状态;

在将所述第一标识及其对应的第二标识关联存储至数据库中之后,还包括:

将完成数据库关联存储的第一标识及第二标识对应的待解析日志文件在第四文件队列中的状态更新为第三状态;

从拆分得到的状态日志文件中选取目标状态日志文件,包括:

根据所述第四文件队列中待解析日志文件的当前状态确定目标待解析日志文件,将所述目标待解析日志文件对应的状态日志文件确定为目标状态日志文件。

一种日志数据处理装置,所述装置包括:

待解析日志文件选取模块,用于获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据所述创建时间的先后顺序从所述待解析日志文件集合中选取预设数量的待解析日志文件,将选取的所述待解析日志文件写入第一文件队列;

拆分模块,用于调用多个第一线程对所述第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件;

接收日志文件写入模块,用于将拆分得到的所述接收日志文件写入第二文件队列;

标识提取模块,用于调用多个第二线程从所述第二文件队列中读取接收日志文件,从读取到的所述接收日志文件中提取第一标识及与所述第一标识相关联的第二标识,将提取到的所述第一标识及其对应的第二标识关联存储至数据库中;

目标状态日志文件写入模块,用于从拆分得到的状态日志文件中选取目标状态日志文件,将所述目标状态日志文件写入第三文件队列;

状态描述信息提取模块,用于调用多个第三线程从所述第三文件队列中读取目标状态日志文件,从读取到的所述目标状态日志文件中提取状态描述信息及与所述状态描述信息对应的第二标识,根据所述第二标识将所述状态描述信息存储至所述数据库。

在其中一个实施例中,所述待解析日志文件选取模块还用于获取所述当前待解析日志文件集合中各个待解析日志文件的内存大小;获取所述第一文件队列对应的当前可用内存容量;根据各个所述待解析日志文件对应的内存大小及所述第一文件队列对应的当前可用内存容量确定所述待解析日志文件对应的选取数量。

在其中一个实施例中,所述拆分模块用于获取预设的关键字,所述关键字包括第一类关键字和第二类关键字;将所述第一类关键字与所述待解析日志文件进行匹配以得到对应的接收日志文件,将所述第二类关键字与所述待解析日志文件进行匹配以得到对应的状态日志文件。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意实施例所述的日志数据处理方法所述的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意实施例所述的日志数据处理方法所述的步骤。

上述日志数据处理方法、装置、计算机设备和存储介质,首先按照创建时间先后顺序将待解析日志文件写入第一文件队列,然后调用多个第一线程对带解析日志文件进行拆分以得到接收日志文件及状态日志文件,将接收日志文件写入第二文件队列,然后调用多个第二线程读取接收日志文件并提取相互关联的第一标识和第二标识,并将第一标识和第一标识关联存储至数据库中,进一步获取目标状态日志文件并写入第三文件队列,接着调用多个第三线程读取目标状态日志文件以得到状态描述信息及其对应的第二标识,根据该第二标识将状态描述信息存储至数据库中,本申请中,通过设置多个队列,多个线程,同时对多个日志文件按照时间先后顺序进行解析处理,可以提高邮件发送结果的获取效率。

附图说明

图1为一个实施例中日志数据处理方法的应用场景图;

图2为一个实施例中日志数据处理方法的流程示意图;

图3为另一个实施例中日志数据处理方法的流程示意图;

图4为一个实施例中日志数据处理装置的结构框图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的日志数据处理方法,可以应用于如图1所示的应用环境中。其中,邮件网关104、数据库108分别与日志服务器106通过网络进行通信。邮件网关104发送邮件后异步输出日志文件,将日志文件推送到日志服务器106进行解析,对于需要解析的日志文件,日志服务器106按照创建时间先后顺序进行选取,将选取的日志文件加入第一文件队列,然后调用多个第一线程对第一文件队列中的日志文件分别进行拆分,得到接收日志文件和状态日志文件,将解析得到的接收日志文件加入第二文件队列,接着调用多个第二线程从第二文件队列中读取接收日志文件,从读取到的接收日志文件中提取第一标识及与第一标识相关联的第二标识,将第一标识及其对应的第二标识关联存储至数据库108中,进一步,日志服务器106从解析得到的状态日志文件中选取目标状态日志文件,将状态日志文件写入第三文件队列,然后调用多个第三线程从第三文件队列中读取状态日志文件,从读取到的状态日志文件中提取状态描述信息,将状态描述信息存储至数据库108,从而完成日志文件的解析及邮件发送结果的获取。其中,日志服务器106可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种日志数据处理方法,以该方法应用于图1中的日志服务器106为例进行说明,包括以下步骤:

步骤s202,获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,将选取的待解析日志文件写入第一文件队列。

具体地,待解析日志文件指的是由邮件网关输出的需要进行解析的日志文件,日志文件中包含了邮件对应的第一标识、第二标识及邮件发送的状态描述信息等,其中,第一标识为邮件系统生成邮件时为邮件分配的id(identification,标识),第二标识为邮件网关接收到邮件系统的邮件后为该邮件分配的id,用于在邮件网关中唯一标识该邮件,日志文件的创建时间指的是邮件网关输出该日志文件的时间。

在本实施例中,日志服务器定时扫描获取待解析日志文件,将获取到的所有的待解析日志文件按照创建时间的先后顺序进行排序,然后从创建时间最早的待解析日志文件开始依次选取预设数量的待解析日志文件,将这些日志文件写入第一文件队列。

步骤s204,调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件。

具体地,第一线程用于对第一文件队列中的待解析日志文件进行拆分,将每一个待解析日志文件拆分得到一个接收日志文件及一个状态日志文件,其中,接收日志文件中包含多个第一标识及多个第二标识,每一个第一标识存在唯一一个与之关联的第二标识,状态日志文件中包含多个第二标识及状态描述信息,状态描述信息用于描述某一封邮件的发送状态,与第二标识相关联,发送状态包括发送成功的状态,发送失败的状态及对应的原因描述。

步骤s206,将拆分得到的接收日志文件写入第二文件队列。

步骤s208,调用多个第二线程从第二文件队列中读取接收日志文件,从读取到的接收日志文件中提取第一标识及与第一标识相关联的第二标识,将提取到的第一标识及其对应的第二标识关联存储至数据库中。

具体地,日志服务器将拆分得到的接收日志文件依次写入第二文件队列,然后运行多个第二线程,其中,第二线程用于从第二文件队列中读取接收日志文件,并从读取到的接收日志文件中提取相互关联的第一标识及第二标识,并将提取的第一标识和第二标识关联存储至数据库中。

步骤s210,从拆分得到的状态日志文件中选取目标状态日志文件,将目标状态日志文件写入第三文件队列。

步骤s212,调用多个第三线程从第三文件队列中读取目标状态日志文件,从读取到的目标状态日志文件中提取状态描述信息及与状态描述信息对应的第二标识,根据第二标识将状态描述信息存储至数据库。

具体地,对于拆分得到的所有状态日志文件,日志服务器可以从中选取符合要求的状态日志文件作为目标状态日志文件,并将这些目标状态日志文件写入第三文件队列,然后调用多个第三线程对第三文件队列中的状态日志文件依次进行读取,并从读取到的状态日志文件中提取状态描述信息及与状态描述信息对应的第二标识,将提取到的第二标识与数据库中的第二标识进行匹配,当匹配成功时,将该状态描述信息与数据库中匹配上的第二标识进行关联存储。

在一个实施例中,对于大多数邮件而言,其对应的日志数据通常在同一个日志文件中,因此,为了确保后续的状态描述信息可以更快的存储进数据库中,日志服务器可以判断某个状态日志文件对应的接收日志文件(即与状态日志同属于一个待解析日志拆分得到的接收日志文件)中所有相互关联的第一标识及第二标识是否已经成功存储至数据库中,若是,则将该状态日志文件确定为目标状态日志文件。

在另一个实施例中,日志服务器可以判断某个状态日志文件对应的接收日志文件及该接收日志文件之前(即对应的待解析日志文件的创建时间早于该接收日志文件的接收日志文件)中所有相互关联的第一标识及第二标识是否已经成功存储至数据库中,若是,则将该状态日志文件确定为目标状态日志文件,这样可以避免有些邮件的接收日志数据(相互关联的第一标识与第二标识)与状态日志数据(状态描述信息)在不同的两个日志文件中时,由于状态日志数据对应的日志文件先被线程处理完,而导致该状态日志数据存储时由于无法匹配上第二标识而导致无法存储至数据库的情况。

上述日志数据处理方法中,日志服务器首先按照创建时间先后顺序将待解析日志文件写入第一文件队列,然后调用多个第一线程对带解析日志文件进行拆分以得到接收日志文件及状态日志文件,将接收日志文件写入第二文件队列,然后调用多个第二线程读取接收日志文件并提取相互关联的第一标识和第二标识,并将第一标识和第一标识关联存储至数据库中,进一步获取目标状态日志文件并写入第三文件队列,接着调用多个第三线程读取目标状态日志文件以得到状态描述信息及其对应的第二标识,根据该第二标识将状态描述信息存储至数据库中,本申请中,通过设置多个队列,多个线程,同时对多个日志文件按照时间先后顺序进行解析处理,可以提高邮件发送结果的获取效率;同时,由于日志解析由专门的日志处理服务器进行处理,可以节省邮件网关的运行资源。

在一个实施例中,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,包括:获取当前待解析日志文件集合中各个待解析日志文件的内存大小;获取第一文件队列对应的当前可用内存容量;根据各个待解析日志文件对应的内存大小及第一文件队列对应的当前可用内存容量确定待解析日志文件对应的选取数量。

具体地,可以设置各个待解析日志文件为相同大小的文件,则待解析日志文件对应的选取数量不超过第一文件队列对应的当前可用内存容量与待解析日志文件的内存大小的比值,如第一文件队列对应的当前可用内存容量为10.2m,待解析日志文件的内存大小为2m,则待解析日志文件对应的选取数量不超过5;若各个待解析日志文件为内存大小不同的日志文件,则保证选取的所有待解析日志文件的内存大小累加值不超过第一文件队列的当前可用内存容量即可。

上述实施例中,通过根据待解析日志文件的内存大小及第一文件队列对应的当前可用内存容量确定待解析日志文件的选取数量,可以防止第一文件队列中加载的日志文件过多而导致内存溢出的现象。

在一个实施例中,调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,包括:获取预设的关键字,关键字包括第一类关键字和第二类关键字;将第一类关键字与待解析日志文件进行匹配以得到对应的接收日志文件,将第二类关键字与待解析日志文件进行匹配以得到对应的状态日志文件。

其中,第一类关键字用于与待解析日志文件进行匹配以得到对应的接收日志文件,第一类关键字可以是描述第一标识的字段名称,例如,可以是“message-id”,第二类关键词用于与待解析日志文件进行匹配以得到对应的状态日志文件,第二类关键字为与邮件发送结果的描述信息相关的关键字,例如,与发送成功的结果相关的关键字“发送成功”、与发送失败的结果相关的关键字“地址错误”“adressnotfound”等等。

具体地,将第一类关键字与待解析日志文件进行匹配时,可以将第一类关键词与日志文件中的每一条日志数据进行全匹配,当任意一条日志数据中匹配到与第一类关键字相同的词时,将该条日志数据写入接收日志文件中,当与每条日志数据匹配完后,即得到接收日志文件;将第二类关键字与待解析日志文件匹配时,可以将逐一将每一个第二类关键字分别与日志文件中的每一条日志数据进行匹配,当任意一条日志数据中匹配到与第二类关键字相同或部分相同的词时,将该条日志数据写入状态日志文件中,当每一个第二类关键字分别与日志文件中每一条日志数据匹配完后,即得到状态日志文件。

上述实施例中,通过关键字匹配对日志文件进行拆分,可以过滤掉日志文件中的无用信息,从而提高对日志文件进行解析的效率,快速获取到邮件的发送结果。

在一个实施例中,上述方法还包括:调用监控线程分别对第一文件队列、第二文件队列以及第三文件队列进行监控,根据各个文件队列的日志文件数量对各个文件队列对应的线程数量进行调整。

具体地,当任意一个文件队列的日志文件数量超过第一预设阈值且持续时间超过第一预设时间时,增加该文件队列对应的线程数量;当某一个文件队列的日志文件数量小于第二预设阈值且持续时间超过第二预设时间时,减少该文件队列对应的线程数量。可以理解的是,本实施例中第一预设阈值、第二预设阈值、第二预设时间、第一预设时间可根据经验进行人工设定。

上述实施例中,通过设置监控线程对文件队列进行监控以对各个文件队列对应的线程数量进行动态调整,使得日志服务器的内存资源能够得到充分利用,同时,可以提高对日志文件的处理效率。

在一个实施例中,如图3所示,提供一种日志数据处理方法,包括以下步骤:

步骤s302,获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,将选取的待解析日志文件写入第一文件队列。

步骤s304,将选取的待解析日志文件写入第四文件队列,并将写入第四文件队列的待解析日志文件的状态标记为第一状态。

其中,第四文件队列中的日志文件为正在解析处理过程中的日志文件,第四队列中的日志文件的状态标记根据日志文件对应的处理进程进行实时更新。第一状态表示待解析日志文件处于待处理的状态。

步骤s306,调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件。

步骤s308,将拆分完成的待解析日志文件在第四文件队列中的状态更新为第二状态。

其中,第二状态表示待解析日志文件处于已拆分的状态。具体地,当第一文件队列中某个待解析日志文件拆分完成后,将第四文件队列中,该拆分完成的待解析日志文件的状态更新为第二状态。

步骤s310,将拆分得到的接收日志文件写入第二文件队列。

步骤s312,调用多个第二线程从第二文件队列中读取接收日志文件,从读取到的接收日志文件中提取第一标识及与第一标识相关联的第二标识,将提取到的第一标识及其对应的第二标识关联存储至数据库中。

步骤s314,将完成数据库关联存储的第一标识及第二标识对应的待解析日志文件在第四文件队列中的状态更新为第三状态。

其中,第三状态表示待解析日志文件处于已入库的状态,即该待解析日志文件中相互关联的第一标识与第二标识已关联存储至数据库中。具体地,当第二文件队列中,某个接收日志文件对应的所有相互关联的标识(第一标识及第二标识)在数据库中关联存储完成后,将第四文件队列中与该接收日志文件对应的待解析日志文件的状态更新为第三状态。

步骤s316,根据第四文件队列中待解析日志文件的当前状态确定目标待解析日志文件,将目标待解析日志文件对应的状态日志文件确定为目标状态日志文件。

具体地,日志服务器可以调用监控线程定时对第四文件队列进行扫描,获取第四文件队列中各个待解析日志文件的当前状态,当前状态用于表示该待解析日志文件的当前处理进行。在一个实施例中,当任意一个待解析日志文件的当前状态为第三状态时,将该待解析日志文件确定为目标待解析日志文件;在另一个实施例中,当任意一个待解析日志文件的当前状态为第三状态,且第四文件队列中,所有创建时间早于该待解析日志文件的待解析日志文件的当前状态均为第三状态,则将该待解析日志文件确定为目标待解析日志文件。进一步,服务器将目标待解析日志文件对应的状态日志文件确定为目标状态日志文件。

步骤s318,调用多个第三线程从第三文件队列中读取目标状态日志文件,从读取到的目标状态日志文件中提取状态描述信息及与状态描述信息对应的第二标识,根据第二标识将状态描述信息存储至数据库。

进一步,将读取到的状态日志文件所对应的待解析日志文件从第四文件队列中移除。

上述实施例中,通过将待解析日志文件写入第四文件队列,通过对第四文件队列中各个待解析日志文件进行实时状态更新,从而可以快速确定待解析日志文件的当前状态,提高日志文件的解析效率,从而快速获取邮件的发送结果。

应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图4所示,提供了一种日志数据处理装置400,包括:待解析日志文件选取模块402、拆分模块404、接收日志文件写入模块406、标识提取模块408、目标状态日志文件写入模块410和状态描述信息提取模块412,其中:

待解析日志文件选取模块402用于获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,将选取的待解析日志文件写入第一文件队列;

拆分模块404用于调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件;

接收日志文件写入模块406用于将拆分得到的接收日志文件写入第二文件队列;

标识提取模块408用于调用多个第二线程从第二文件队列中读取接收日志文件,从读取到的接收日志文件中提取第一标识及与第一标识相关联的第二标识,将提取到的第一标识及其对应的第二标识关联存储至数据库中;

目标状态日志文件写入模块410用于从拆分得到的状态日志文件中选取目标状态日志文件,将目标状态日志文件写入第三文件队列;

状态描述信息提取模块412用于调用多个第三线程从第三文件队列中读取目标状态日志文件,从读取到的目标状态日志文件中提取状态描述信息及与状态描述信息对应的第二标识,根据第二标识将状态描述信息存储至数据库。

在一个实施例中,待解析日志文件选取模块还用于获取当前待解析日志文件集合中各个待解析日志文件的内存大小;获取第一文件队列对应的当前可用内存容量;根据各个待解析日志文件对应的内存大小及第一文件队列对应的当前可用内存容量确定待解析日志文件对应的选取数量。

在一个实施例中,拆分模块用于获取预设的关键字,关键字包括第一类关键字和第二类关键字;将第一类关键字与待解析日志文件进行匹配以得到对应的接收日志文件,将第二类关键字与待解析日志文件进行匹配以得到对应的状态日志文件。

在一个实施例中,上述装置还包括:动态调整模块,用于调用监控线程分别对第一文件队列、第二文件队列以及第三文件队列进行监控,根据各个文件队列的日志文件数量对各个文件队列对应的线程数量进行调整。

在一个实施例中,上述装置还包括:

第一状态标记模块,用于将选取的待解析日志文件写入第四文件队列,并将写入第四文件队列的待解析日志文件的状态标记为第一状态;

第二状态标记模块,用于将拆分完成的待解析日志文件在第四文件队列中的状态更新为第二状态;

第三状态标记模块,用于将完成数据库关联存储的第一标识及第二标识对应的待解析日志文件在第四文件队列中的状态更新为第三状态;

拆分模块还用于根据第四文件队列中待解析日志文件的当前状态确定目标待解析日志文件,将目标待解析日志文件对应的状态日志文件确定为目标状态日志文件。

关于日志数据处理装置的具体限定可以参见上文中对于日志数据处理方法的限定,在此不再赘述。上述日志数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储第一标识、第二标识、状态描述信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种日志数据处理方法。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,将选取的待解析日志文件写入第一文件队列;调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件;将拆分得到的接收日志文件写入第二文件队列;调用多个第二线程从第二文件队列中读取接收日志文件,从读取到的接收日志文件中提取第一标识及与第一标识相关联的第二标识,将提取到的第一标识及其对应的第二标识关联存储至数据库中;从拆分得到的状态日志文件中选取目标状态日志文件,将目标状态日志文件写入第三文件队列;调用多个第三线程从第三文件队列中读取目标状态日志文件,从读取到的目标状态日志文件中提取状态描述信息及与状态描述信息对应的第二标识,根据第二标识将状态描述信息存储至数据库。

在一个实施例中,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,包括:获取当前待解析日志文件集合中各个待解析日志文件的内存大小;获取第一文件队列对应的当前可用内存容量;根据各个待解析日志文件对应的内存大小及第一文件队列对应的当前可用内存容量确定待解析日志文件对应的选取数量。

在一个实施例中,调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,包括:获取预设的关键字,关键字包括第一类关键字和第二类关键字;将第一类关键字与待解析日志文件进行匹配以得到对应的接收日志文件,将第二类关键字与待解析日志文件进行匹配以得到对应的状态日志文件。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:调用监控线程分别对第一文件队列、第二文件队列以及第三文件队列进行监控,根据各个文件队列的日志文件数量对各个文件队列对应的线程数量进行调整。

在一个实施例中,在将选取的待解析日志文件写入第一文件队列之后,处理器执行计算机程序时还实现以下步骤:将选取的待解析日志文件写入第四文件队列,并将写入第四文件队列的待解析日志文件的状态标记为第一状态;在调用多个第一线程对第一文件队列中的待解析日志文件进行拆分之后,处理器执行计算机程序时还实现以下步骤:将拆分完成的待解析日志文件在第四文件队列中的状态更新为第二状态;在将第一标识及其对应的第二标识关联存储至数据库中之后,处理器执行计算机程序时还实现以下步骤:将完成数据库关联存储的第一标识及第二标识对应的待解析日志文件在第四文件队列中的状态更新为第三状态;从拆分得到的状态日志文件中选取目标状态日志文件,包括:根据第四文件队列中待解析日志文件的当前状态确定目标待解析日志文件,将目标待解析日志文件对应的状态日志文件确定为目标状态日志文件。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取当前待解析日志文件集合中各个待解析日志文件的创建时间,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,将选取的待解析日志文件写入第一文件队列;调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,得到各个待解析日志文件对应的接收日志文件和状态日志文件;将拆分得到的接收日志文件写入第二文件队列;调用多个第二线程从第二文件队列中读取接收日志文件,从读取到的接收日志文件中提取第一标识及与第一标识相关联的第二标识,将提取到的第一标识及其对应的第二标识关联存储至数据库中;从拆分得到的状态日志文件中选取目标状态日志文件,将目标状态日志文件写入第三文件队列;调用多个第三线程从第三文件队列中读取目标状态日志文件,从读取到的目标状态日志文件中提取状态描述信息及与状态描述信息对应的第二标识,根据第二标识将状态描述信息存储至数据库。

在一个实施例中,根据创建时间的先后顺序从待解析日志文件集合中选取预设数量的待解析日志文件,包括:获取当前待解析日志文件集合中各个待解析日志文件的内存大小;获取第一文件队列对应的当前可用内存容量;根据各个待解析日志文件对应的内存大小及第一文件队列对应的当前可用内存容量确定待解析日志文件对应的选取数量。

在一个实施例中,调用多个第一线程对第一文件队列中的待解析日志文件进行拆分,包括:获取预设的关键字,关键字包括第一类关键字和第二类关键字;将第一类关键字与待解析日志文件进行匹配以得到对应的接收日志文件,将第二类关键字与待解析日志文件进行匹配以得到对应的状态日志文件。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:调用监控线程分别对第一文件队列、第二文件队列以及第三文件队列进行监控,根据各个文件队列的日志文件数量对各个文件队列对应的线程数量进行调整。

在一个实施例中,在将选取的待解析日志文件写入第一文件队列之后,计算机程序被处理器执行时还实现以下步骤:将选取的待解析日志文件写入第四文件队列,并将写入第四文件队列的待解析日志文件的状态标记为第一状态;在调用多个第一线程对第一文件队列中的待解析日志文件进行拆分之后,计算机程序被处理器执行时还实现以下步骤:将拆分完成的待解析日志文件在第四文件队列中的状态更新为第二状态;在将第一标识及其对应的第二标识关联存储至数据库中之后,计算机程序被处理器执行时还实现以下步骤:将完成数据库关联存储的第一标识及第二标识对应的待解析日志文件在第四文件队列中的状态更新为第三状态;从拆分得到的状态日志文件中选取目标状态日志文件,包括:根据第四文件队列中待解析日志文件的当前状态确定目标待解析日志文件,将目标待解析日志文件对应的状态日志文件确定为目标状态日志文件。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1