用于处理日志信息的方法和装置与流程

文档序号:15700463发布日期:2018-10-19 19:45阅读:144来源:国知局

本申请实施例涉及计算机技术领域,具体涉及用于处理日志信息的方法和装置。



背景技术:

一般地,对于网络设备或智能设备来说,通常利用大数据技术或者基于网络设备或智能设备上的Cookies(在本地终端上存储的能够用于辨别用户身份的数据)对各个设备的编号进行关联映射,从而得到某个网络设备或智能设备相关的其它设备。



技术实现要素:

本申请实施例提出了用于处理日志信息的方法和装置。

第一方面,本申请实施例提供了一种用于处理日志信息的方法,该方法包括:获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,第一概率用于表示第一主机标识出现的情况下,第二主机标识出现的概率;确定第一概率是否大于目标概率阈值;响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。

在一些实施例中,基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,包括:确定至少一个历史时间段中的各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,记为第一总和;确定至少一个历史时间段中的各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,记为第二总和;将第一总和除以第二总和得到的商确定为第一概率。

在一些实施例中,该方法还包括:基于第一总和,确定第一调节值和第二调节值;确定第一总和与第一调节值的乘积的双曲正切函数值;将第二调节值与双曲正切函数值的乘积确定为目标概率阈值。

在一些实施例中,至少一个历史时间段内的各个时间段的时间长度相同。

在一些实施例中,该方法还包括:解析包含目标主机标识的记录;基于解析结果,向第一主机标识对应的主机推送目标信息。

第二方面,本申请实施例提供了一种用于处理日志信息的装置,该装置包括:获取单元,被配置成获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;地址确定单元,被配置成对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;第一概率确定单元,被配置成基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,第一概率用于表示第一主机标识出现的情况下,第二主机标识出现的概率;比较单元,被配置成确定第一概率是否大于目标概率阈值;目标主机标识确定单元,被配置成响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。

在一些实施例中,第一概率确定单元进一步被配置成:确定至少一个历史时间段中的各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,记为第一总和;确定至少一个历史时间段中的各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,记为第二总和;将第一总和除以第二总和得到的商确定为第一概率。

在一些实施例中,该装置还包括:调节值确定单元,被配置成基于第一总和,确定第一调节值和第二调节值;双曲正切函数值确定单元,被配置成确定第一总和与第一调节值的乘积的双曲正切函数值;目标概率阈值确定单元,被配置成将第二调节值与双曲正切函数值的乘积确定为目标概率阈值。

在一些实施例中,至少一个历史时间段内的各个时间段的时间长度相同。

在一些实施例中,该装置还包括:解析单元,被配置成解析包含目标主机标识的记录;目标信息推送单元,被配置成基于解析结果,向第一主机标识对应的主机推送目标信息。

第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

本申请实施例提供的用于处理日志信息的方法和装置,通过先获取至少一个历史时间段内的请求日志,然后基于每个历史时间段内的请求日志中的各条记录中包含的主机标识和IP地址,确定第一主机标识出现的情况下,第二主机标识出现的概率,记为第一概率。然后,比较第一概率与目标概率阈值的大小关系,若第一概率较大,那么就将第二主机标识确定为目标主机标识,从而实现了基于请求日志中的各条记录的内容,确定第一主机标识出现的情况下,第二主机标识出现的概率,并根据确定的概率,对第二主机标识进行筛选,以得到目标主机标识。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请可以应用于其中的示例性系统架构图;

图2是本申请的用于处理日志信息的方法的一个实施例的流程图;

图3a是本申请的用于处理日志信息的方法的包含第一主机标识的记录的一个实施例的示意图;

图3b是本申请的用于处理日志信息的方法的包含第二主机标识的记录的一个实施例的示意图;

图4是根据本申请的用于处理日志信息的方法的一个应用场景的示意图;

图5是根据本申请的用于处理日志信息的方法的又一个实施例的流程图;

图6是根据本申请的用于处理日志信息的装置的一个实施例的结构示意图;

图7是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于处理日志信息的方法或用于处理日志信息的装置的示例性架构100。

如图1所示,系统架构100可以包括终端设备101、数据库102、网络103和服务器104。网络103用以在终端设备101、数据库102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

终端设备101、数据库102通过网络103与服务器104交互,以进行数据交互等。终端设备101上可以安装有各种客户端应用,如日志管理软件等。数据库102中可以存储有日志信息。

终端设备101可以是硬件,也可以是软件。当终端设备101为硬件时,可以是支持日志信息处理的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。

数据库102可以是建立在各种存储设备上的数据集合,也可以是数据平台。

服务器104可以是提供各种服务的服务器,例如为终端设备101、数据库102上存储的日志信息进行分析处理的日志处理服务器。日志处理服务器可以对日志文件或日志信息进行分析、统计等处理。

需要说明的是,本申请实施例所提供的用于处理日志信息的方法一般由服务器104执行,相应地,用于处理日志信息的装置一般设置于服务器104中。需要说明的是,上述日志文件或日志信息也可以直接存储在服务器104的本地,服务器104可以直接提取本地所存储的日志文件或日志信息并进行处理,此时,可以不存在终端设备101、和数据库102。

还需要指出的是,终端设备101中也可以安装有日志管理或日志处理类应用,终端设备101也可以日志管理或日志处理类应用对日志文件或日志信息进行处理。此时,用于处理日志信息的方法也可以由终端设备101执行,相应地,用于处理日志信息的装置也可以设置于终端设备101中。上述日志文件或日志信息可以从数据库102或服务器104获取。需要说明的是,上述日志文件或日志信息也可以直接存储在终端设备101的本地,此时,示例性系统架构100可以不存在数据库102、服务器104和网络103。

需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器104为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解,图1中的终端设备、数据库、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,示出了根据本申请的用于处理日志信息的方法的一个实施例的流程200。该用于处理日志信息的方法包括以下步骤:

步骤201,获取至少一个历史时间段内的请求日志。

在本实施例中,用于处理日志信息的方法的执行主体(如图1所示的服务器104)可以获取至少一个历史时间段内的请求日志。其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址。日志可以指网络设备、系统或服务程序在运行时产生的事件记录。一般地,日志由各条记录组成。每条记录可以记载着日期、时间、使用者、操作等相关的描述。通常情况下,网络设备、系统或服务程序等在运行时的所有操作都可以被日志文件或日志数据记录下来。

实践中,请求日志可以指任何日志文件或日志数据。请求日志也可以是涉及网络请求或响应的相关日志,此时,请求日志中的每条记录可以对应于一个网络请求或响应的相关操作。记录中可以包括请求主机的主机标识和接收请求的主机的IP地址。

其中,记录对应的操作涉及到网络中两个主机的交互时,那么可以将请求方作为请求主机,将被请求方作为接收请求的主机。主机可以指能够联网以进行网络通信设备,包括但不限于网络设备和智能设备等。网络设备包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机、台式计算机等。智能设备包括但不限于智能电视、智能手表、智能手环、智能蓝牙耳机、智能防丢设备、智能水杯和智能家居等。

主机标识可以是指能够用于标识主机的标识码。举例来说,主机标识可以是主机的IP地址、MAC(Media Access Control,媒体访问控制)地址等,也可以是主机的主机编号ID(例如智能电视的电视ID)、产品序列号等。IP地址可以包括每个网络或网络中的每个主机的逻辑地址、公网IP等。

实践中,历史时间段可以是由技术人员预先指定的一个时间段,也可以是基于一定逻辑,通过一定的计算确定出的一个时间段。一般地,日志文件中的每条记录都有时间信息,因此,可以将获取的一个或多个请求日志按照需求的时间段拆分为多个请求日志。也可以直接获取多个历史时间段内的请求日志,例如,获取此刻之前三个月内每天的请求日志。

在本实施例的一些可选的实现方式中,至少一个历史时间段内的各个时间段的时间长度相同。需要说明的是,当要获取两个或两个以上历史时间段内的请求日志时,各个历史时间段的时间长度可以相同,也可以不同。

实践中,上述执行主体可以从一个或多个服务器或者其它数据库、数据平台等获取上述至少一个历史时间段内的请求日志。

步骤202,对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合。

在本实施例中,上述执行主体可以基于每个历史时间段内的请求日志中的各条记录的内容,得到每个历史时间段对应的第一目标IP地址集合和第二目标IP地址集合。第一主机标识和第二主机标识可以是由技术人员预先指定的两个主机标识,也可以是请求日志中包含的主机标识。

具体地,对于每个历史时间段,可以通过如下步骤得到该历史时间段对应的第一目标IP地址集合:

1)确定该历史时间段内包含第一主机标识的记录,得到第一记录集合;

2)确定该历史时间段内包含第二主机标识的记录,得到第二记录集合;

3)确定第一记录集合和第二记录集合中均包含的IP地址作为第一目标IP地址,得到该历史时间段对应的第一目标IP地址集合;

4)确定第一记录集合中包含的IP地址作为第二目标IP地址,得到该历史时间段对应的第二目标IP地址集合。

应该可以理解,上述步骤中的步骤1)和2)的顺序不分先后,步骤3)和4)的顺序也不分先后。

对于上述步骤1)和2),可以利用各种方法来筛选出第一记录集合和第二记录集合。举例来说,例如可以对该历史时间段内的请求日志从头开始遍历,从而筛选出包含第一主机标识的记录,得到第一记录集合,以及筛选出包含第二主机标识的记录,得到第二记录集合。实践中,还可以先筛选出包含第一主机标识和第二主机标识的记录集合,然后再将该记录集合区分为第一记录集合和第二记录集合。

对于上述步骤3),举例来说,可以参考图3a和图3b。其中,图3a是包含第一主机标识“A”的记录,即第一记录集合的一个示意图。图3b是包含第二主机标识“B”的记录,即第二记录集合的一个示意图。其中,第一记录集合中包含5条记录,第二记录集合中包含7条记录。由图3a和图3b可以看出,第一记录集合和第二记录集合中均包含的IP地址包括:IP1和IP3。因此,IP1和IP3可以作为第一目标IP地址,得到该历史时间段对应的第一目标IP地址集合{IP1、IP3}。

对于上述步骤4),举例来说,可以继续参考图3a,由图3a可以看出,第一记录集合中包含的IP地址包括:IP1、IP2、IP3和IP4。因此,可以将IP1、IP2、IP3和IP4作为第二目标IP地址,得到该历史时间段对应的第二目标IP地址集合{IP1、IP2、IP3、IP4}。

步骤203,基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率。

在本实施例中,上述执行主体可以利用各种方法基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,得到第一概率。其中,第一概率可以表示第一主机标识出现的情况下,第二主机标识出现的概率。地址数目可以表示第一目标IP地址集合和第二目标IP地址集合中包含的元素的个数。举例来说,假设第一目标IP地址集合为{IP1、IP2},第二目标IP地址集合为{IP1、IP2、IP3}。即第一目标IP地址集合中包括2个元素,第二目标IP地址集合中包括3个元素。那么,对应的第一目标IP地址集合中的地址数目即为2,对应的第一目标IP地址集合中的地址数目即为3。

举例来说,可以通过如下所示的方法来确定第一概率:

1)确定各个历史时间段内的请求日志包含的记录的数目,并确定各个历史时间段内的请求日志包含的记录的数目的总和,可以记为记录总数目。

2)确定各个历史时间段对应的第一目标IP地址集合中的地址数目,可以记为第一地址数目,并计算各个历史时间段对应的第一地址数目的总和,得到第一地址总数目。以及确定每个历史时间段对应的第二目标IP地址集合中的地址数目,可以记为第二地址数目,并计算各个历史时间段对应的第二地址数目的总和,得到第二地址总数目。

3)将第一地址总数目除以记录总数目,得到第一中间结果;将第二地址总数目除以记录总数目,得到第二中间结果。

4)将第一中间结果除以第二中间结果,并将计算结果作为第一概率。

举例来说,还可以通过如下所示的方法来确定第一概率:

1)对于每个历史时间段,将该历史时间段对应的第一目标IP地址集合中的地址数目除以该历史时间段对应的第二目标IP地址集合中的地址数目,可以将计算结果记为第一中间概率。

2)计算各个历史时间段对应的第一中间概率的总和,可以记为第一中间总概率。

3)将第一中间总概率除以历史时间段的数目,并将计算结果作为第一概率。

在本实施例的一些可选的实现方式中,可以通过如下所示的方法来确定第一概率:

1)确定各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,可以记为第一总和。以及确定各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,可以记为第二总和。

2)计算第一总和除以第二总和,并将计算结果作为第一概率。

步骤204,确定第一概率是否大于目标概率阈值。

在本实施例中,上述执行主体可以比较第一概率和目标概率阈值的大小。其中,目标概率阈值可以是由技术人员基于历史经验或者实际需求预先指定的一个概率阈值。目标概率阈值也可以是基于一定的逻辑,通过计算得到的一个概率阈值。

在本实施例的一些可选的实现方式中,目标概率阈值可以通过如下步骤确定:

1)基于上述第一总和,确定第一调节值和第二调节值。

在本步骤中,第一调节值和第二调节值可以是0-1之间的任意一个具体的数值,可以包括两端的端点0和1。实践中,可以由技术人员基于上述第一总和,根据历史经验指定第一调节值和第二调节值。

实践中,在上述执行主体中也可以预先存储有调节值查询表。在调节值查询表中可以存储有第一总和与其对应的第一调节值和第二调节值,从而能够通过查询调节值查询表得到第一调节值和第二调节值。实践中,也可以是一个数值区间对应一个第一调节值和第二调节值。那么,可以先判读上述第一总和在哪个数值区间,然后查找该数值区间对应的第一调节值和第二调节值。上述调节值查询表可以是预先基于对大量的历史数据的统计而生成的。

一般地,第一调节值和第二调节值可以是正相关的关系。即第一调节值较小时,对应地,第二调节值也可以较小。第一调节值较大时,对应地,第二调节值也可以较大。

2)确定第一总和与第一调节值的乘积的双曲正切函数值。

在本步骤中,可以首先计算第一总和与第一调节值的乘积,可以记为第一乘积结果。然后计算第一乘积结果的双曲正切函数值。其中,双曲正切函数是双曲函数的一种。在数学语言上,双曲正切函数一般可以写作tanh,也可以简写为th。双曲正切函数是奇函数,其图形通过原点且关于原点对称。双曲正切函数的定义域为正负无穷之间。双曲正切函数是常见的一种双曲函数,因此,可以利用现有的双曲函数正切计算方法得到上述第一乘积结果的双曲正切函数值。在此,不再赘述。

3)将第二调节值与双曲正切函数值的乘积确定为目标概率阈值。

步骤205,响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。

在本实施例中,若上述步骤204判断出第一概率大于目标概率阈值,上述执行主体可以将第二主机标识确定为目标主机标识。实践中,上述执行主体还可以将选出的第二主机标识进行存储或进行输出。

继续参见图4,图4是根据本实施例的用于处理日志信息的方法的应用场景的一个示意图400。在图4的应用场景中,上述执行主体可以首先获取以当前时间为起点,昨天上午八点到十二点以及下午一点到五点两个历史时间段内的请求日志401和402。其中,请求日志401包括10条记录。请求日志402包括9条记录。

然后,针对昨天上午八点到十二点这一历史时间段,确定该历史时间段内包含第一主机标识“A”的记录,可以记为第一记录集合403,以及确定该历史时间段内包含第二主机标识“B”的记录,可以记为第二记录集合404。之后,选取第一记录集合403和第二记录集合404中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合{IP5}407。将第一记录集合403中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合{IP1、IP3、IP5}408。

同样地,针对昨天下午一点到五点这一历史时间段,确定该历史时间段对应的第一记录集合405和第二记录集合406。以及确定该历史时间段对应的第一目标IP地址集合{IP3、IP7}409和第二目标IP地址集合{IP3、IP5、IP7}410。

之后,可以确定昨天上午八点到十二点这一历史时间段对应的第一目标IP地址集合和第二目标IP地址集合中的地址数目分别为1和3。同样地,确定昨天下午一点到五点这一历史时间段对应的第一目标IP地址集合和第二目标IP地址集合中的地址数目分别为2和3。

之后,计算上述两个历史时间段对应的第一目标IP地址集合中的地址数目的总和为3(1+2=3),可以记为第一总和,以及对应的第二目标IP地址集合中的地址数目的第二总和为6(3+3=6),可以记为第二总和。然后,将第一总和除以第二总和,并将得到的结果0.5作为第一概率411。

之后,判断第一概率411是否大于目标概率阈值0.4,由于0.5大于0.4,所以将第二主机标识“B”确定为目标主机标识。

需要说明的是,由图4可以看出,请求日志401和402中包含的主机标识有很多(例如:“A”、“B”、“C”、“D”、“E”和“F”),包含的IP地址也有很多(例如“IP1”、“IP2”、“IP3”、“IP4”、“IP5”、“IP6”、“IP7”、“IP8”和“IP9”)。上述应用场景是对于第一主机标识为“A”和第二主机标识为“B”的情况下,确定出第二主机标识“B”为目标主机标识。应当可以理解,请求日志401和402中包含的各个主机标识都可以作为第一主机标识,也可以作为第二主机标识。利用上述同样的方法,还可以确定其他第一主机标识和第二主机标识的情况下,第二主机标是否是目标主机标识。例如,对于第一主机标识为“A”的情况下,可以分别将图4中的“B”、“C”、“D”、“E”和“F”依次作为第二主机标识,通过同样的方法确定第二主机标识是否是目标主机标识,从而可以得到第一主机标识“A”对应的目标主机标识集合。

本申请的上述实施例提供的方法通过先获取至少一个历史时间段内的请求日志,然后基于每个历史时间段内的请求日志中的各条记录中包含的主机标识和IP地址,确定第一主机标识出现的情况下,第二主机标识出现的概率,记为第一概率。然后,比较第一概率与目标概率阈值的大小关系,若第一概率较大,那么就将第二主机标识确定为目标主机标识,从而实现了基于请求日志中的各条记录的内容,对请求日志中包含的第二主机标识进行筛选,以得到目标主机标识。

进一步参考图5,其示出了用于处理日志信息的方法的又一个实施例的流程500。该用于处理日志信息的流程500,包括以下步骤:

步骤501,获取至少一个历史时间段内的请求日志。

步骤502,对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合。

步骤503,基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率。

步骤504,确定第一概率是否大于目标概率阈值。

步骤505,响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。

上述步骤501、502、503、504和505的具体的执行过程可参考图2对应实施例中的步骤201、202、203、204和205的相关说明,在此不再赘述。

步骤506,解析包含目标主机标识的记录。

在本实施例中,上述执行主体可以先获取包含目标主机标识的记录,然后对包含目标主机标识的记录进行解析。其中,可以从上述步骤501中得到的至少一个历史时间段内的请求日志中获取包含目标主机标识的记录,也可以从其他服务器、数据库或数据平台获取包含目标主机标识的记录。

实践中,可以利用现有的一些日志分析、日志挖掘、日志处理或日志解析相关的一些方法来解析包含目标主机标识的记录。举例来说,可以使用Unix或Linux操作系统下的各种日志处理指令(例如stats、join、awk、grep等)对包含目标主机标识的记录进行解析。举例来说,还可以通过专门用于分析日志的一些程序(例如Awstats、Webalizer等)对包含目标主机标识的记录进行解析。举例来说,还可以利用一些公司提供的与日志分析相关的软件或产品对包含目标主机标识的记录进行解析。应当可以理解,也可以使用多种日志分析方法分别对包含目标主机标识的记录进行解析,将分别得到的解析结果汇总后生成解析结果。

步骤507,基于解析结果,向第一主机标识对应的主机推送目标信息。

在本实施例中,上述执行主体可以基于对包含目标主机标识的记录的解析结果,向第一主机标识对应的主机推送目标信息。其中,目标信息可以由技术人员预先指定的任何信息,也可以是基于对包含目标主机标识的记录的解析结果而确定的推送的信息。

实践中,不同的日志解析方法或工具,得到的解析结果在方向、粒度或者内容上可能不同。可以根据具体的解析结果,确定向第一主机标识对应的主机推送的目标信息。举例来说,如果解析结果得到目标主机标识经常访问购物网站,那么可以向第一主机标识所标识的主机推送一些商品信息。如果解析结果得到目标主机标识长时间在同一个网络之内,那么可以向第一主机标识推送一些居家的产品信息。

实践中,上述执行主体可以通过各种信息推送方法或信息推送软件、信息推送平台向第一主机标识对应的主机推送目标信息。通常第一主机标识对应的主机在接收到上述目标信息之后,还可以对目标信息进行显示。第一主机标识对应的主机还可以基于目标信息,对目标信息再次进行处理(例如分析、筛选等),然后基于处理结果,对处理结果进行显示,或者向目标主机标识对应的主机推送处理结果等。

举例来说,若解析结果发现目标主机标识出现的时间段总是固定在一个确定时间段内,并且在该确定时间段内常常访问视频网站,并且大部分时间都在浏览音乐类节目,那么可以有针对性的在该确定时间段内,向第一主机标识对应的主机推送一些音乐类节目、声音类、舞蹈类节目的等的相关信息。之后,第一主机标识对应的主机上可以显示其接收到的音乐类节目、声音类、舞蹈类节目等的相关信息。第一主机标识对应的主机还可以基于此,对其之后的显示或推荐等方式做一些调整。例如,第一主机标识对应的主机可以之后将其开机页面上的广告投放为音乐类相关的节目或产品等。

从图5中可以看出,与图2对应的实施例相比,本实施例中的信息推送方法的流程500突出了在确定目标主机标识之后,还可以进一步地解析包含目标主机标识的记录,并且基于解析结果,向第一主机标识对应的主机推送目标信息的步骤。由此,本实施例描述的方案可以基于请求日志,对第二主机标识进行筛选,以得到目标主机标识,从而实现了富有针对性的选取待推送对象。而且基于对包含目标主机标识的记录的解析结果,可以向第一主机标识对应的主机推送目标信息,从而使得第一目标主机标识对应的主机能够接收到目标信息或与目标主机标识相关的信息。另外,第一主机标识对应的主机上还可以对接收到的目标信息进行显示等,从而有助于提升信息推送效果。

进一步参考图6,作为对上述各图所示方法的实现,本申请提供了用于处理日志信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图6所示,本实施例提供的用于处理日志信息的装置600包括获取单元601、地址确定单元602、第一概率确定单元603、比较单元604和目标主机标识确定单元605。其中,获取单元601被配置成获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址。地址确定单元602被配置成对于至少一个历史时间段中的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合。第一概率确定单元603被配置成基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,第一概率用于表示第一主机标识出现的情况下,第二主机标识出现的概率。比较单元604被配置成确定第一概率是否大于目标概率阈值。目标主机标识确定单元605被配置成响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。

在本实施例中,用于处理日志信息的装置600中:获取单元601、地址确定单元602、第一概率确定单元603、比较单元604和目标主机标识确定单元605的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203、步骤204和步骤205的相关说明,在此不再赘述。

在本实施例的一些可选的实现方式中,上述第一概率确定单元603进一步被配置成:确定至少一个历史时间段中的各个历史时间段对应的第一目标IP地址集合中的地址数目的总和,记为第一总和;确定至少一个历史时间段中的各个历史时间段对应的第二目标IP地址集合中的地址数目的总和,记为第二总和;将第一总和除以第二总和得到的商确定为第一概率。

在本实施例的一些可选的实现方式中,上述装置600还包括:调节值确定单元(图中未示出),被配置成基于第一总和,确定第一调节值和第二调节值;双曲正切函数值确定单元(图中未示出),被配置成确定第一总和与第一调节值的乘积的双曲正切函数值;目标概率阈值确定单元(图中未示出),被配置成将第二调节值与双曲正切函数值的乘积确定为目标概率阈值。

在本实施例的一些可选的实现方式中,上述至少一个历史时间段内的各个时间段的时间长度相同。

在本实施例的一些可选的实现方式中,上述装置600还包括:解析单元(图中未示出),被配置成解析包含目标主机标识的记录;目标信息推送单元(图中未示出),被配置成基于解析结果,向第一主机标识对应的主机推送目标信息。

本申请的上述实施例提供的装置,通过获取单元601先获取至少一个历史时间段内的请求日志,然后由地址确定单元602和第一概率确定单元603基于每个历史时间段内的请求日志中的各条记录中包含的主机标识和IP地址,确定第一主机标识出现的情况下,第二主机标识出现的概率,记为第一概率。然后,比较单元604比较第一概率与目标概率阈值的大小关系。若第一概率较大,由目标主机标识确定单元605就将第二主机标识确定为目标主机标识,从而实现了基于请求日志中的各条记录的内容,对请求日志中包含的第二主机标识进行筛选,以得到目标主机标识。

下面参考图7,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统700的结构示意图。图7示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的方法中限定的上述功能。

需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器,包括获取单元、地址确定单元、第一概率确定单元、比较单元和目标主机标识确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取至少一个历史时间段内的请求日志的单元,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址”。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取至少一个历史时间段内的请求日志,其中,请求日志包括至少一条记录,记录包括发起请求的主机的主机标识和接收请求的主机的互联网协议IP地址;对于至少一个历史时间段内的历史时间段,确定该历史时间段内包含第一主机标识的记录和包含第二主机标识的记录中均包含的IP地址作为第一目标IP地址,得到第一目标IP地址集合;将该历史时间段内包含第一主机标识的记录中包含的IP地址作为第二目标IP地址,得到第二目标IP地址集合;基于第一目标IP地址集合中的地址数目和第二目标IP地址集合中的地址数目,确定第一概率,其中,第一概率用于表示第一主机标识出现的情况下,第二主机标识出现的概率;确定第一概率是否大于目标概率阈值;响应于第一概率大于目标概率阈值,将第二主机标识确定为目标主机标识。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1