一种IP应用场景的分类方法与流程

文档序号:11879509阅读:2066来源:国知局

本发明涉及超高精度的IP定位技术中IP应用场景分类技术领域,具体地,涉及一种IP应用场景的分类方法。



背景技术:

IP是互联网通信的基础,是互联网设备的标识。全球42亿IPV4,IP会被网络运营商、机构、组织等申请使用,网络运营商又可以将IP用于做企业专线、住宅用户等业务,所以每个IP都有其相应的用途即应用场景。

IP应用场景类型的确定,首先可以帮助IP地理位置定位系统,根据不同类型IP采取不同的定位策略,提高IP定位结果准确性,提供更好的IP地理位置定位服务;其次,结合IP应用场景和用户的网络行为轨迹,可以对其进行用户画像,从而给用户提供更好的上网服务。

目前,对IP应用场景的分类,相关行业研究和技术并没有统一标准。市场上,有公司将IP分为咖啡馆、网吧等,这种分类方法只是根据IP地理位置采集方式来确定IP的应用场景,表述IP被用到什么地方,并不能真实描述IP是如何被使用的。

为了能够对IP的应用场景进行准确的分类,有必要提出一套完整的IP应用场景分类方法,供学术研究和商业产品使用。



技术实现要素:

本发明的目的在于,针对上述问题,提出一种IP应用场景的分类方法,以实现对IP应用场景的准确分类。

为实现上述目的,本发明采用的技术方案是:一种IP应用场景的分类方法,主要包括以下步骤:

A、获取与IP相关的AS和Whois数据信息;

B、根据IP所属的网络服务商,对IP的应用场景初步分类;

C、根据IP的网络特征,对IP的应用场景进一步分类;

进一步地,所述步骤A具体为通过分布式网络爬虫技术,获取每个IP对应的AS和Whois数据信息。

进一步地,所述步骤B具体为,利用数据挖掘中的分词技术,对网络服务商的业务关键词进行学习,对IP应用场景初步分类为数据中心、学校、机构和网络运营商。

进一步地,所述步骤C具体为,利用大数据挖掘技术,分析IP的网络特征,建立IP应用场景数据模型,利用机器学习技术对IP应用场景进行分类,对网络运营商的IP进一步分类细分,最终将网络运营商的IP分为基础设施、企业专线、住宅用户、移动网络、WLAN和卫星。

进一步地,所述IP的网络特征包括IP块大小、活IP率、地理覆盖范围、时延大小、路由汇聚情况和与骨干网距离。

本发明各实施例的一种IP应用场景的分类方法,由于主要包括:从IP所属的服务商出发,根据IP的网络特征,将IP按应用场景进行分类;从而可以克服现有技术中对IP应用场景分类方法不确定,IP应用场景分类不准确的缺陷。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。

下面通过实施例,对本发明的技术方案做进一步的详细描述。

具体实施方式

以下对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

具体地,一种IP应用场景的分类方法,包括:

A、获取与IP相关的AS和Whois数据信息;

B、根据IP所属的网络服务商,对IP的应用场景初步分类;

C、根据IP的网络特征,对IP的应用场景进一步分类;

所述步骤A具体为通过分布式网络爬虫技术,获取并得到每个IP对应的AS和Whois数据信息。

所述步骤B具体为,利用数据挖掘中的分词技术,对网络服务商的业务关键词进行学习,对IP应用场景初步分类为数据中心、学校、机构和网络运营商。

所述步骤C具体为,利用大数据挖掘技术,分析IP的网络特征,建立IP应用场景数据模型,利用机器学习技术对IP应用场景进行分类,对网络运营商的IP进一步分类细分,最终将网络运营商的IP分为基础设施、企业专线、住宅用户、移动网络、WLAN和卫星。

所述IP的网络特征包括IP块大小、活IP率、地理覆盖范围、时延大小、路由汇聚情况和与骨干网距离。

本发明针对IP应用场景分类方法不确定的问题,提供一套完整的IP应用场景分类方法,从IP所属的服务商出发,根据IP的活跃程度(活IP率)、地理覆盖范围、时延大小等网络特征,将IP的应用场景进行分类。

为解决上述问题,本发明是通过以下技术方案实现的:

一套完整的IP应用场景分类方法,包含以下步骤:

步骤1、获取IP相关数据信息;

该步骤通过分布式网络爬虫技术,对IP相关的AS、Whois等信息进行获取。

步骤2、根据IP所属的网络服务商,初步给出IP的应用场景;

该步骤利用数据挖掘中的分词技术,对网络运营商的业务关键字进行学习,对IP应用场景进行数据中心、学校、机构和网络运营商的划分。

步骤3、根据IP的网络特征,对网络运营商IP的应用场景进行细分;

该步骤利用大数据挖掘技术,结合步骤2的分类,分析IP的网络特征,建立IP应用场景数据模型,然后利用机器学习技术对IP应用场景进行分类,将网络运营商的IP进行细分,最终将IP分为学校、数据中心、机构、基础设施、企业专线、住宅用户、移动网络、WLAN和卫星。

与现有技术相比,本发明首次根据IP用途,对IP的应用场景进行分类,并提出一套完整的IP应用场景分类方法。

在表1中,分别列出不同应用场景IP的网络特征。如活IP率,说明该类IP的活跃情况,如企业专线、数据中心、移动网络,其IP更多的是在较稳定的在线状态,即静态分配,而住宅用户是动态分配,处在较不稳定在线状态;时延大小、距离骨干网远近,说明网络状况,数据中心提供网络服务时延小,企业专线是光纤,住宅用户使用ADSL,时延稍大,移动网络涉及到切换网络,会使时延变大。

表1 IP的9类用途及其特征

结合真实数据集,对本发明进行进一步说明。数据集是全球IPV4,以3个IP举例,如表2所示。

表2 IP信息列表

步骤1、获取IP对应的AS及公司名称;

通过分布式网络爬虫,获取IP的AS和Whois信息(网络公开数据),得到表2中每个IP对应的AS及其对应的公司名称。

步骤2、根据AS及公司名称中的关键字,利用数据挖掘的分词技术,初步给出应用场景。由于2.2.2.2和3.3.3.3分别对应的是学校(包含学校字样)和数据中心(包含托管服务字样),所以该IP的应用场景已经确定,而1.1.1.1初步判断为网络运营商。

步骤3、通过分析应用场景的网络特征,建立9类应用场景的数据特征模型,然后利用机器学习,分析1.1.1.1的网络特征,发现其符合住宅用户的IP类型特征,则将该IP进一步划分为住宅用户。

经过上面3个步骤,最终将IP进行应用场景分类为学校、数据中心、机构、基础设施、企业专线、住宅用户、移动网络、WLAN和卫星。

至少可以达到以下有益效果:克服现有技术中对IP应用场景分类方法不确定,IP应用场景分类不准确的缺陷,实现对IP应用场景的准确分类,

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1