应用程序类型的识别方法及装置与流程

文档序号:17160149发布日期:2019-03-20 00:34阅读:264来源:国知局
应用程序类型的识别方法及装置与流程

本公开涉及通信技术领域,尤其涉及一种应用程序类型的识别方法及装置。



背景技术:

考虑到应用程序在预定时间段内具有相应特征,即,应用程序具有与时间有关的特征,因此,可以按照与时间有关的特征对应用程序进行分类,相应地,应用程序按照与时间有关的特征可以包括多种类型。

相关技术中,根据应用程序在局域网中的运行状态和规范性条件来提取应用程序的与时间有关的特征,用户需要根据经验和应用程序的与时间有关的特征来确定应用程序的类型,并且手动标记应用程序的类型。因此,前述相关技术的主观选择性较大并且用户需要手动对应用程序进行标记。

相关技术中,对网络流量数据进行特征工程,根据已知类型的应用程序的流量来构建训练集,由此,通过深度学习或传统的机器学习算法等,建立并训练应用分类模型,从而根据应用分类模型来识别应用程序的类型。然而,前述相关技术需要各种类型的应用程序的海量的流量数据,并且训练应用分类模型需要花费大量的训练时间。



技术实现要素:

有鉴于此,本公开提出了一种应用程序类型的识别方法及装置。

根据本公开的一方面,提供了一种应用程序类型的识别方法,包括:

采集所述应用程序在预设数量个监控周期的流量,单个所述监控周期包含多个单位时段,单个监控周期的流量包括与所述多个单位时段对应的流量;

根据所述预设数量个监控周期的流量,构建所述应用程序的流量基线,所述流量基线包括所述多个单位时段对应的流量基线值;

根据所述流量基线,确定所述应用程序的流量特征;

根据所述应用程序的流量特征,识别所述应用程序的类型。

根据本公开的另一方面,提供了一种应用程序类型的识别装置,包括:

采集模块,用于采集所述应用程序在预设数量个监控周期的流量,单个所述监控周期包含多个单位时段,单个监控周期的流量包括与所述多个单位时段对应的流量;

构建模块,用于根据所述预设数量个监控周期的流量,构建所述应用程序的流量基线,所述流量基线包括所述多个单位时段对应的流量基线值;

确定模块,用于根据所述流量基线,确定所述应用程序的流量特征;

识别模块,用于根据所述应用程序的流量特征,识别所述应用程序的类型。

本公开实施例提供的技术方案可以包括以下有益效果:根据采集的预设数量个监控周期的流量来构建应用程序的流量基线,根据构建的流量基线来确定应用程序的流量特征,并且根据应用程序的流量特征来识别应用程序的类型,由此,能够实时地自动识别应用程序的类型。

根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。

图1是根据一示例性实施例示出的一种应用程序类型的识别方法的流程图。

图2是根据一示例性实施例示出的一种应用程序类型的识别装置的框图。

图3是根据一示例性实施例示出的一种用于应用程序类型的识别装置的硬件结构框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。

图1是根据一示例性实施例示出的一种应用程序类型的识别方法的流程图。如图1所示,该识别方法可以包括如下步骤。

在步骤s110中,采集所述应用程序在预设数量个监控周期的流量,单个所述监控周期包含多个单位时段,单个监控周期的流量包括与所述多个单位时段对应的流量。

本实施例中,应用程序具有对应的预设数量个监控周期,每个监控周期包括相同的多个单位时段,并且应用程序在每个单位时段具有对应的一个流量,因此,在每个监控周期以每个单位时段为单位区间采集应用程序的流量,应用程序在每个单位时段具有对应的预设数量个流量,相应地,多个单位时段各自对应的预设数量个流量构成应用程序在预设数量个监控周期的流量。其中,针对不用类型的应用程序,其监控周期可能也不同。

示例性的,假设某类型的应用程序具有30个监控周期(即,预设数量为30)、单个监控周期为1天、并且单位时段为1小时,则每个监控周期都包括如下的24个单位时段:单位时段t1[00:00,1:00]、单位时段t2[01:00,02:00]、…、单位时段t23[22:00,23:00]、单位时段t24[23:00,24:00],每天以1小时为一个单位区间采集应用程序的流量,上述24个单位区间各自对应的30个流量构成了应用程序在30个监控周期的流量。

在步骤s130中,根据所述预设数量个监控周期的流量,构建所述应用程序的流量基线,所述流量基线包括所述多个单位时段对应的流量基线值。

本实施例中,流量基线是表示时间与流量的曲线,某一时间具有对应的流量。流量基线的参数例如包括监控周期、单位时段和流量,并且如步骤s110中所描述的,每个监控周期包括多个单位时段并且各单位时段具有对应的流量,因此流量基线记录了各单位时段对应的流量基线值。

在一种可能的实现方式中,步骤s130可以包括:

根据相同单位时段的所述预设数量个流量,确定该单位时段的流量基线值;

根据所述多个单位时段的流量基线值得到所述流量基线。

本实施例中,可以根据所采集的每个单位时段对应的预设数量个流量,计算每个单位时段对应的平均流量;每个单位时段对应的平均流量组成的曲线为应用程序的流量基线。其中,每个单位时段对应的平均流量为该单位时段对应的流量基线值。

在一种可能的实现方式中,步骤s130可以包括:采用最小二乘法对所采集的预设数量个监控周期的流量进行拟合,拟合得到的曲线为应用程序的流量基线。

在一种可能的实现方式中,在根据预设数量个监控周期的流量构建应用程序的流量基线之前,可以对预设数量个监控周期的流量进行过滤处理,以去除异常流量,并根据过滤处理后的流量构建应用程序的流量基线,从而提高流量基线的准确度。示例性的,可以去除每个单位时段对应的预设数量个流量中的最大值和最小值。

本实施例中,单个监控周期所包括的多个单位时段可以对应于一个时间段或多个时间段。在不对单个监控周期进行划分的情况下,单个监控周期包括一个时间段,该时间段包括单个监控周期所包括的多个单位时段。在将单个监控周期划分为第一时间段和第二时间段的情况下,单个监控周期包括第一时间段和第二时间段,单个监控周期所包括的多个单位时段包括第一时间段所包括的单位时段和第二时间段所包括的单位时段。

在一种示例中,对于办公类应用程序,单个监控周期为1周并且单位时段为1天,可以将1周划分为对应于工作日(例如,周一至周五)的第一时间段和对应于休息日(例如,周六至周日)的第二时间段。

在另一种示例中,对于财务类应用程序,单个监控周期为1个月并且单位时段为1天,可以将1个月划分为对应于月末(例如,25号至30/31号)的第一时间段和对应于非月末(例如,1号至24号)的第二时间段。

在又一种示例中,对于数据交换传输类应用程序,单个监控周期为1天并且单位时段为1小时,可以将1天划分为对应于日间(例如,8:00-17:00)的第一时间段和对应于夜间(例如,17:00-次日8:00)的第二时间段。

在步骤s150中,根据所述流量基线,确定所述应用程序的流量特征。

本实施例中,如步骤s130所描述的,流量基线是表示时间与流量的曲线,因此应用程序的流量特征例如是与应用程序在某时间段对应的流量有关的特征。

在一种实现方式中,在将应用程序的单个监控周期划分为第一时间段和第二时间段的情况下,上述步骤s150可以包括:

确定所述第一时间段包含的单位时段对应的流量基线值之和为第一时间段流量特征;

确定所述第二时间段包含的单位时段对应的流量基线值之和为第二时间段流量特征。

本实施例中,根据步骤s130所构建的流量基线确定第一时间段包含的各单位时段对应的流量基线值,将所确定的各流量基线值相加,相加的结果为第一时间段流量特征。采用类似方式可以确定出第二时间段流量特征。

示例性的,继续步骤s110中的示例,假设单位时段t1、t2、…、t23、t24对应的流量基线值分别为f1、f2、…、f23、f24,第一时间段包含单位时段t9、t10、…、t16、t17,并且第二时间段包含单位时段t1、t2、…、t6、t7、t8、t18、t19、…、t23、t24,则第一时间段流量特征s1为(f9+f10+f11+f12+f13+f14+f15+f16+f17),第二时间段流量特征s2为(f18+f19+f20+f21+f22+f23+f24+f1+f2+f3+f4+f5+f6+f7+f8)。

在步骤s170中,根据所述应用程序的流量特征,识别所述应用程序的类型。

本实施例中,由于不同类型的应用程序具有不同的流量特征,因此可以根据应用程序的流量特征识别应用程序的类型。应用程序的类型包括但不限于日间类应用程序、夜间类应用程序、月末类应用程序、非月末类应用程序、工作日类应用程序、以及休息日类应用程序等。其中,日间类应用程序表示该应用程序具有日间繁忙的特点,夜间类应用程序表示该应用程序具有夜间繁忙的特点。月末类应用程序表示该应用程序具有月末繁忙的特点,非月末类应用程序表示该应用程序具有非月末繁忙的特点。工作日类应用程序表示该应用程序具有工作日繁忙的特点,休息日类应用程序表示该应用程序具有休息日繁忙的特点。

在一种实现方式中,上述步骤s170可以包括:

确定所述第一时间段流量特征与第二时间段流量特征的比值,若该比值大于预设的第一阈值,则确定所述应用程序的类型为第一类型;或者

确定所述第二时间段流量特征与第一时间段流量特征的比值,若该比值大于预设的第二阈值,则确定所述应用程序的类型为第二类型。

本实施例中,第一阈值和第二阈值可以相同,并且例如是2-5之间的任意数值。示例性的,继续步骤s150中的示例,确定比值s1/s2,将第一阈值与比值s1/s2进行比较,若比值s1/s2大于第一阈值,则确定应用程序的类型为日间类应用程序,或者,确定比值s2/s1,将第二阈值与比值s2/s1进行比较,若比值s2/s1大于第二阈值,则确定应用程序的类型为夜间类应用程序。

本实施例的应用程序类型的识别方法,根据采集的预设数量个监控周期的流量来构建应用程序的流量基线,根据构建的流量基线来确定应用程序的流量特征,并且根据应用程序的流量特征来识别应用程序的类型,由此,能够实时地自动识别应用程序的类型,而无需用户自身来确定应用程序的类型,也无需训练应用分类模型。

由于无需用户自身来确定应用程序的类型,因此本公开不依赖于用户的主观选择并且不需要用户手动对应用程序进行标记。由于无需训练应用分类模型,因此本公开不需要各种类型的应用程序的海量的流量数据,并且不需要花费大量的训练时间来训练应用分类模型。

图2是根据一示例性实施例示出的一种应用程序类型的识别装置的框图。如图2所示,该识别装置可以包括采集模块210、构建模块220、确定模块230和识别模块240。

采集模块210用于采集所述应用程序在预设数量个监控周期的流量,单个所述监控周期包含多个单位时段,单个监控周期的流量包括与所述多个单位时段对应的流量。

构建模块220与采集模块210连接,用于根据所述预设数量个监控周期的流量,构建所述应用程序的流量基线,所述流量基线包括所述多个单位时段对应的流量基线值。

确定模块230与构建模块220连接,用于根据所述流量基线,确定所述应用程序的流量特征。

识别模块240与确定模块230连接,用于根据所述应用程序的流量特征,识别所述应用程序的类型。

在一种可能的实现方式中,将所述单个监控周期划分为第一时间段和第二时间段;

所述确定模块230被配置为:

确定所述第一时间段包含的单位时段对应的流量基线值之和为第一时间段流量特征;

确定所述第二时间段包含的单位时段对应的流量基线值之和为第二时间段流量特征。

在一种可能的实现方式中,所述识别模块240被配置为:

确定所述第一时间段流量特征与第二时间段流量特征的比值,若该比值大于预设的第一阈值,则确定所述应用程序的类型为第一类型;

或者,

确定所述第二时间段流量特征与第一时间段流量特征的比值,若该比值大于预设的第二阈值,则确定所述应用程序的类型为第二类型。

在一种可能的实现方式中,所述构建模块220被配置为:

根据相同单位时段的所述预设数量个流量,确定该单位时段的流量基线值;

根据所述多个单位时段的流量基线值得到所述流量基线。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图3是根据一示例性实施例示出的一种用于应用程序类型的识别装置的硬件结构框图。参照图3,该装置900可包括处理器901、存储有机器可执行指令的机器可读存储介质902。处理器901与机器可读存储介质902可经由系统总线903通信。并且,处理器901通过读取机器可读存储介质902中与应用程序类型的识别逻辑对应的机器可执行指令以执行上文所述的应用程序类型的识别方法。

本文中提到的机器可读存储介质902可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:ram(radomaccessmemory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。

以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1