基于弱特征累计的即时通讯业务识别方法及服务器与流程

文档序号:11732031阅读:249来源:国知局
基于弱特征累计的即时通讯业务识别方法及服务器与流程

本发明涉及通讯业务识别技术技术领域,尤其涉及一种基于弱特征累计的即时通讯业务识别方法及服务器。



背景技术:

净荷特征,是指在通讯业务中一个帧(包)中包含的用户数据部分。而现有的即时通讯业务在服务器端多是通过净荷特征进行业务类型的识别。这种识别方式虽然简单直接,但是却难以保证识别的准确度。

综上可知,现有技术在实际使用上显然存在不便与缺陷,所以有必要加以改进。



技术实现要素:

针对上述的缺陷,本发明的目的在于提供一种基于弱特征累计的即时通讯业务识别方法及服务器,其可以提高即时通讯业务识别的准确率。

为了实现上述目的,本发明提供一种基于弱特征累计的即时通讯业务识别方法,所述方法包括:

根据获取业务数据的端口,识别业务类型;

检测预定业务类型对应端口的业务数据的净荷特征;

若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同,则标记为该业务数据的弱特征;

检测具有所述业务数据的弱特征的报文;

若具有所述业务数据的弱特征的报文累积数超过总报文数的一半,则将所述业务数据的弱特征标记为强特征。

根据本发明的基于弱特征累计的即时通讯业务识别方法,所述通讯业务是基于四层模型的数据传输。

根据本发明的基于弱特征累计的即时通讯业务识别方法,所述若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同,则标记为该业务数据的弱特征步骤具体为:

若检测到所述业务数据的净荷特征具有连续32个报文的前4个字节相同,则标记为该业务数据的弱特征。

根据本发明的基于弱特征累计的即时通讯业务识别方法,所述方法还包括:

预设具有所述业务数据的弱特征的报文累积数的阈值;

所述若具有所述业务数据的弱特征的报文累积数超过总报文数的一半,则将所述业务数据的弱特征标记为强特征步骤进一步包括:

若具有所述业务数据的弱特征的报文累积数超过总报文数的一半,且具有所述业务数据的弱特征的报文累积数达到预设阈值,则将所述业务数据的弱特征标记为强特征。

本发明还提供一种基于弱特征累计的即时通讯业务识别服务器,所述服务器包括子板和主板,其中:

所述子板包括:

端口识别单元,用于根据获取业务数据的端口,识别业务类型;

特征检测单元,用于检测预定业务类型对应端口的业务数据的净荷特征,若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同时,则交由弱特征标记单元处理;

弱特征标记单元,用于将净荷特征标记为该业务数据的弱特征;

所述主板包括:

报文检测单元,用于检测具有所述业务数据的弱特征的报文,若具有所述业务数据的弱特征的报文累积数超过总报文数的一半,则交由强特征标记单元处理;

强特征标记单元,用于将所述业务数据的弱特征标记为强特征。

根据本发明的基于弱特征累计的即时通讯业务识别服务器,所述通讯业务是基于四层模型的数据传输。

根据本发明的基于弱特征累计的即时通讯业务识别服务器,所述特征检测单元检测到所述业务数据的净荷特征具有连续32个报文的前4个字节相同时,交由弱特征标记单元处理。

根据本发明的基于弱特征累计的即时通讯业务识别服务器,还包括:

阈值设置单元,用于预设具有所述业务数据的弱特征的报文累积数的阈值;

所述报文检测单元进一步用于若检测到具有所述业务数据的弱特征的报文累积数超过总报文数的一半,且具有所述业务数据的弱特征的报文累积数达到预设阈值,则交由强特征标记单元处理。

本发明通过根据获取业务数据的端口识别业务类型,然后检测预定业务类型对应端口的业务数据的净荷特征,若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同,则标记为该业务数据的弱特征。当检测到具所述业务数据的弱特征的报文累积数超过总报文数的一半,则将所述业务数据的弱特征标记为强特征。借此实现高准确率的业务识别。

附图说明

图1是本发明的服务器结构示意图;

图2是本发明的即时通讯业务识别方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

参见图1,本发明提供了一种基于弱特征累计的即时通讯业务识别服务器100,该服务器100是基于四层模型传输处理的服务器,其包括用于标记弱特征的子板10和标记强特征的主板20,具体的,

子板10包括:

端口识别单元11,用于根据获取业务数据的端口,识别业务类型。

特征检测单元12,用于检测预定业务类型对应端口的业务数据的净荷特征,若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同时,则交由弱特征标记单元处理。对于该处报文的数量并不仅限于32,其可以根据端口寄存器修改门限,进而调整检测的上述报文的数量。

弱特征标记单元13,用于将净荷特征标记为该业务数据的弱特征。

具体的,由于对应某一即时通讯业务的服务器100的端口使用固定端口,且在传输过程中报文四层净荷具有一定特征,因此,子板10按照“四层端口号=xxxx”并且“连续32个报文出现四层净荷前3~5个字节相同”的条件对报文进行识别并打上“xx”的弱特征。当然,在实际应用中,可将净荷特征的对比数量为前4个字节,因为在一般的即时通讯业务中,前四个字节即可基本体现该数据的特征。

主板20包括:

报文检测单元21,用于检测具有所述业务数据的弱特征的报文,若具有所述业务数据的弱特征的报文累积数超过总报文数的一半,则交由强特征标记单元处理22。

强特征标记单元22,用于将所述业务数据的弱特征标记为强特征。

主板20对标有“xx”弱特征的报文进行累积计数,当同时满足“符合“xx”特征的报文数占总报文数的一半以上时,主板将“xx”的弱特征值翻转标记为“yy”的强特征值,同时将该条连接的特征值染色为“yy”的特征值,完成对该通讯业务的识别。

优选的是,为增加强特征标记的准确性,本发明可以通过一阈值设置单元,预设具有所述业务数据的弱特征的报文累积数的阈值,并且所述报文检测单元21检测到具有所述业务数据的弱特征的报文累积数超过总报文数的一半,且具有所述业务数据的弱特征的报文累积数达到预设阈值时(即“符合“xx”特征的累积报文数达到设定的门限值”),则交由强特征标记单元22处理标记,借此完成即时通讯业务识别。

本发明基于报文累积数达到阈值并超过所有报文的一半,使得系统对通讯业务的识别更加精准。

再参见图2,本发明提供了一种基于弱特征累计的即时通讯业务识别方法,其可以通过如图1所示的服务器100实现,该方法包括:

步骤s201,根据获取业务数据的端口,识别业务类型。

步骤s202,检测预定业务类型对应端口的业务数据的净荷特征,若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同时,则执行步骤s203。

步骤s203,将净荷特征标记为该业务数据的弱特征。

具体的,由于对应某一即时通讯业务的服务器100的端口使用固定端口,且在传输过程中报文四层净荷具有一定特征,因此,子板10按照“四层端口号=xxxx”并且“连续32个报文出现四层净荷前3~5个字节相同”的条件对报文进行识别并打上“xx”的弱特征。当然,在实际应用中,可将净荷特征的对比数量为前4个字节,因为在一般的即时通讯业务中,前四个字节即可基本体现该数据的特征。

步骤s204,检测具有所述业务数据的弱特征的报文,若具有所述业务数据的弱特征的报文累积数超过总报文数的一半,则交由执行步骤s205。

步骤s205,将所述业务数据的弱特征标记为强特征。

主板20对标有“xx”弱特征的报文进行累积计数,当同时满足“符合“xx”特征的报文数占总报文数的一半以上时,主板将“xx”的弱特征值翻转标记为“yy”的强特征值,同时将该条连接的特征值染色为“yy”的特征值,完成对该通讯业务的识别。

优选的是,为增加强特征标记的准确性,本发明可以预设具有所述业务数据的弱特征的报文累积数的阈值,并且所述报文检测单元21检测到具有所述业务数据的弱特征的报文累积数超过总报文数的一半,且具有所述业务数据的弱特征的报文累积数达到预设阈值时(即“符合“xx”特征的累积报文数达到设定的门限值”),则交由强特征标记单元22处理将弱特征标记为强特征。

综上所述,本发明通过根据获取业务数据的端口识别业务类型,然后检测预定业务类型对应端口的业务数据的净荷特征,若检测到所述业务数据的净荷特征具有连续32个报文的前3~5个字节相同,则标记为该业务数据的弱特征。当检测到具所述业务数据的弱特征的报文累积数超过总报文数的一半,则将所述业务数据的弱特征标记为强特征。借此实现高准确率的业务识别。

当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1