一种识别代理IP的方法及系统与流程

文档序号：11930949阅读：439来源：国知局

本发明涉及互联网
技术领域：
，具体地涉及一种识别代理IP的方法及系统。
背景技术：
：目前，互联网上存在各种安全风险，代理IP(InternetProtocol，网络之间互联的协议)就是其中之一。因为代理服务器技术的出现，一个国内的用户可以通过国外的代理服务器对目标服务器发动网络攻击，而目标服务器显示的用户IP地址为国外的服务器地址，因此无法通过IP地址与地理位置互查技术查找到具有攻击性的IP对应的用户的信息。因此在很多情况下，服务器只能够将正常IP与代理IP区分开来，采用不同的安全措施来应对。目前识别代理IP的方法主要是端口扫描的方式，即反向扫描目前互联网上的所有服务器，判断一些常用的代理端口是否开放。代理IP的方式有很多，如VPN(虚拟专用网络)代理，SOCKS(防火墙安全会话转换协议)代理，HTTP(超文本传输协议)代理，其中VPN代理主要有三种类型：PPTP(PointtoPointTunnelingProtocol，点对点隧道协议)、L2TP(LayerTwoTunnelingProtocol，第二层通道协议)、OpenVPN三种；其中VPN代理的端口固定，但是需要针对上述三种类型构建三种不同的协议到对应的端口来扫描识别；HTTP代理和SOCKS代理的端口不固定，需要针对不同的端口发起代理扫描，扫描周期很长。总之，发明人在应用上述方案时发现，现有的识别代理IP的方法效率低下。技术实现要素：鉴于上述现有的识别代理IP的方法效率低下的问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种识别代理IP的方法及系统。为了解决上述问题，本发明实施例公开了一种识别代理IP的方法，所述方法包括：采集各访问客户端的IP信息与对应的位置信息；分别针对各所述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将所述样本分散程度与设定分散程度比较；分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP。优选地，所述分别针对各所述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将所述样本分散程度与设定分散程度比较的步骤包括：分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离；分别针对各所述IP信息，对所述计算的距离求样本平均距离，并将所述样本平均距离与设定平均距离比较。优选地，所述分别针对各所述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将所述样本分散程度与设定分散程度比较的步骤包括：分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离；分别针对各所述IP信息，对所述计算的距离求样本标准差，并将所述样本标准差与设定标准差比较。优选地，所述设定分散程度包括白名单设定分散程度、灰名单设定分散程度；其中，所述分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP的步骤包括：如果所述IP信息对应的样本分散程度超过所述灰名单设定分散程度，则确认所述IP信息是代理IP；如果所述IP信息对应的样本分散程度小于所述白名单设定分散程度，则确认所述IP信息不是代理IP；如果所述IP信息对应的样本分散程度超过所述白名单设定分散程度且小于所述灰名单设定分散程度，则确认所述IP信息是可疑代理IP。进一步地，在所述分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP的步骤之后还包括：接收访问客户端的访问请求，从所述访问请求中提取所述访问客户端的IP信息；将所述IP信息与已经识别的IP信息进行匹配，确定所述IP信息是否为代理IP。更进一步地，在所述将所述IP信息与已经识别的IP信息进行匹配，确定所述IP信息是否为代理IP的步骤之后还包括：如果所述IP信息是代理IP，则屏蔽所述IP信息对应的访问客户端；如果所述IP信息不是代理IP，则接受所述IP信息对应的访问客户端的访问；如果所述IP信息是可疑代理IP，则标记所述IP信息为可疑代理IP。再进一步地，在所述如果所述IP信息是可疑代理IP，则标记所述IP信息为可疑代理IP的步骤之后还包括：扫描所述IP信息对应的服务器，判断所述服务器是否开放了代理端口；如果所述服务器开放了代理端口，则确认所述IP信息是代理IP，并屏蔽所述IP信息对应的访问客户端；如果所述服务器没有开放代理端口，则确认所述IP信息不是代理IP，并接受所述IP信息对应的访问客户端的访问。优选地，所述采集各访问客户端的IP信息与对应的位置信息的步骤包括：在接收到访问客户端的访问请求时，从所述访问请求中获取所述访问客户端的IP信息与对应的位置信息进行记录。进一步地，所述位置信息为所述访问客户端的GPS(GlobalPositioningSystem，全球定位系统)经纬度信息，或者由基站及基站信号强度信息得到的信号最强的基站的经纬度信息。优选地，在所述采集各访问客户端的IP信息与对应的位置信息的步骤之后，还包括：分别针对各所述IP信息，统计采集的位置信息的样本数量并去除异常样本，使得有效样本数量达到设定阈值。另一方面，本发明实施例还公开了一种识别代理IP的系统，所述系统包括：采集模块，用于采集各访问客户端的IP信息与对应的位置信息；计算比较模块，用于分别针对各所述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将所述样本分散程度与设定分散程度比较；识别模块，用于分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP。优选地，所述计算比较模块包括：第一距离计算模块，用于分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离；第一计算比较模块，用于分别针对各所述IP信息，对所述计算的距离求样本平均距离，并将所述样本平均距离与设定平均距离比较。优选地，所述计算比较模块包括：第二距离计算模块，用于分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离；第二计算比较模块，用于分别针对各所述IP信息，对所述计算的距离求样本标准差，并将所述样本标准差与设定标准差比较。优选地，所述设定分散程度包括白名单设定分散程度、灰名单设定分散程度；其中，所述识别模块包括：第一识别模块，用于如果所述IP信息对应的样本分散程度超过所述灰名单设定分散程度，则确认所述IP信息是代理IP；第二识别模块，用于如果所述IP信息对应的样本分散程度小于所述白名单设定分散程度，则确认所述IP信息不是代理IP；第三识别模块，用于如果所述IP信息对应的样本分散程度超过所述白名单设定分散程度且小于所述灰名单设定分散程度，则确认所述IP信息是可疑代理IP。进一步地，在所述第三识别模块之后，所述系统还包括：访问信息提取模块，用于接收访问客户端的访问请求，从所述访问请求中提取所述访问客户端的IP信息；访问IP识别模块，用于将所述IP信息与已经识别的IP信息进行匹配，确定所述IP信息是否为代理IP。更进一步地，在所述访问IP识别模块之后，所述系统还包括：第一应对模块，用于如果所述IP信息是代理IP，则屏蔽所述IP信息对应的访问客户端；第二应对模块，用于如果所述IP信息不是代理IP，则接受所述IP信息对应的访问客户端的访问；第三应对模块，用于如果所述IP信息是可疑代理IP，则标记所述IP信息为可疑代理IP。再进一步地，在所述第三应对模块之后，所述系统还包括：端口扫描模块，用于扫描所述IP信息对应的服务器，判断所述服务器是否开放了代理端口；第四应对模块，用于如果所述服务器开放了代理端口，则确认所述IP信息是代理IP，并屏蔽所述IP信息对应的访问客户端；第五应对模块，用于如果所述服务器没有开放代理端口，则确认所述IP信息不是代理IP，并接受所述IP信息对应的访问客户端的访问。优选地，所述采集模块包括：访问信息采集模块，用于在接收到访问客户端的访问请求时，从所述访问请求中获取所述访问客户端的IP信息与对应的位置信息进行记录。进一步地，所述位置信息为所述访问客户端的GPS经纬度信息，或者由基站及基站信号强度信息得到的信号最强的基站的经纬度信息。优选地，所述系统还包括：样本筛选模块，用于分别针对各所述IP信息，统计采集的位置信息的样本数量并去除异常样本，使得有效样本数量达到设定阈值。相对在先技术，本发明实施例具有以下优点：通过采集各访问客户端访问时的IP信息与对应的位置信息，分别通过比较各IP信息对应的位置信息的样本分散程度与设定分散程度，来识别上述各IP信息是否为代理IP，有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。附图说明图1为本发明实施例的应用场景简图；图2为本发明实施例一提供的一种识别代理IP的方法的流程图；图3为本发明实施例二提供的一种识别代理IP的方法的流程图；图4为本发明实施例三提供的一种识别代理IP的方法的流程图；图5为本发明实施例四提供的一种识别代理IP的系统的结构框图；图6为本发明实施例五提供的一种识别代理IP的系统的结构框图；图7为本发明实施例六提供的一种识别代理IP的系统的结构框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。参照图1所示，本发明实施例应用于具备GPS模块的终端(例如具备外置GPS模块的电脑、具备内置GPS模块的手机等，总之对此不作限制)，还有通过基站接入互联网的终端(手机等)，或者其它终端(运行于该终端的客户端能够获得该终端的位置信息，此处不做限制)通过本地IP或者代理IP，即通过代理服务器访问目标服务器的推荐场景。因为发明人在研究中发现，假设有一款用户量很大的APP(application，应用)，如微信，正常用户和攻击者都会使用该软件，攻击者会使用代理ip来访问微信，但是攻击者一定会有很多，而且来自天南地北，他们可能使用同一个代理ip发起攻击，但是他们伪装的终端的位置信息一定是不同的且分散的；即对于一个代理IP而言，可能被来自天南地北的用户使用，因此目标服务器获取到的代理IP的位置信息的分散程度很大；而对于一个正常用户的IP而言，因为用户一般有自己的生活范围，可能围绕该用户的居住地，因此目标服务器获取到的正常IP的位置信息的分散程度很小。基于上述代理IP与正常IP位置信息的分散程度的差异，作为本发明实施例的技术构思之一，通过目标服务器采集访问客户端的IP信息与对应的位置信息的样本，并统计各IP信息的位置信息的样本分散程度，将统计出的样本分散程度与设定分散程度比较，来识别上述样本分散程度对应的IP信息是否为代理IP。实施例一：参照图2所示，本发明实施例提供了一种识别代理IP的方法，具体可以包括步骤101-103：步骤101：采集各访问客户端的IP信息与对应的位置信息。采集各访问客户端的IP信息与对应的位置信息；上述各访问客户端为访问目标服务器的各类客户端(如网页客户端、手机客户端、普通客户端等，对此不作限制)；上述IP信息为上述各访问客户端在目标服务器显示的IP地址，可能为上述各访问客户端的本地IP地址，也可能为上述各访问客户端经过层层IP代理的最后一级代理服务器的IP地址。上述与IP信息对应的位置信息为在上述各访问客户端通过上述对应的IP地址访问目标服务器的过程中，目标服务器获取的包含该访问客户端位置的位置信息；可以通过GPS定位的方式，也可以通过分析基站信号强度的方式，也可以是其它能够获取各访问客户端位置信息的方式；上述各访问客户端可以通过预先加载获取GPS位置信息的代码或者获取基站信息及基站信号强度信息的代码，或者通过其他形式，因此通过上述各访问客户端访问目标服务器时可以被上述目标服务器获取位置信息；此外，上述采集各访问客户端的IP信息与对应的位置信息可以在线下进行，是对之前已经进行记录的各访问客户端的IP信息与对应的位置信息进行整理。步骤102：分别针对各所述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将所述样本分散程度与设定分散程度比较。分别针对各上述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将上述样本分散程度与上述设定分散程度比较。现有的获取位置信息的技术是通过GPS定位、基站信号强度信息定位等方式获取用户的位置，根据用户的位置，为用户提供更为精准、快捷的服务，比如天气预报、导航服务、餐饮住宿信息服务等；而在本发明实例中，需要分别针对各上述IP信息，对获取的对应的位置信息进行分析统计，计算每一个IP信息下各位置信息的样本分散程度；即对每一个上述IP信息而言，对应的位置信息的样本为上述采集得到的对应位置信息的样本，统计该样本的样本分散程度，一般可以通过计算样本平均值、样本方差、样本标准差等方式来表征该样本的样本分散程度；而上述位置信息的样本可以为通过GPS定位、基站信号强度信息等方式获得的经纬度信息，也可以为上述各经纬度信息对应的点之间的距离，也可以是其他形式。如果采用例如(X，Y)这样的经纬度信息来作为样本；其中X为经度信息，东经可为正值，西经可为负值，其中Y为纬度信息，北纬可为正值，南纬可为负值，例如(-123.23224，45.34221)为西经123.23224°，北纬45.34221°；则该样本宜采用样本方差或者样本标准差来表征样本分散程度，因为经度信息与纬度信息相互独立，因此例如样本方差D(X+Y)＝D(X)+D(Y)，即(X，Y)这样的经纬度信息的样本方差为其中经度信息的样本方差与纬度信息的样本方差之和；而一维信息的样本方差为一维信息各个数据分别与其平均数之差的平方的和的平均数。而如果采用上述各经纬度信息对应的点之间的距离来作为样本，可以参见本发明实施例二中的描述，在此不再赘述。而上述设定分散程度，可以通过统计计算正常用户的IP信息对应的位置信息的样本分散程度来确定，也可以通过经验预设和实践检验的方式，也可以通过其它形式。步骤103：分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP。分别根据各上述IP信息对应的比较结果，识别各上述IP信息是否为代理IP；例如可以如下的简单判定，如果上述IP信息下的各位置信息的分散程度超过设定分散程度，则确定上述IP信息是代理IP；如果上述IP信息下的各位置信息的分散程度小于设定分散程度，则上述IP信息不是代理IP；然后如果出现已经被识别的IP信息访问目标服务器，则可以根据上述识别结果，采取例如屏蔽、接受等对应的安全措施，本发明实施例对此不做限制。相对在先技术，本发明实施例具有以下优点：通过采集各访问客户端访问时的IP信息与对应的位置信息，分别通过比较各IP信息对应的位置信息的样本分散程度与设定分散程度，来识别上述各IP信息是否为代理IP，有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。实施例二：参照图3所示，本发明实施例提供了一种识别代理IP的方法，具体可以包括步骤201-207：步骤201：在接收到访问客户端的访问请求时，从所述访问请求中获取所述访问客户端的IP信息与对应的位置信息进行记录。在目标服务器接收到访问客户端的访问请求时，上述目标服务器从上述访问请求中获取上述访问客户端的IP信息与对应的位置信息进行记录；上述各访问客户端访问上述目标服务器，需要发送访问请求，访问请求中包含上述各访问客户端的IP信息，一般位于上述访问请求的报文头，该IP信息为对应客户端的本地IP，或者为对应客户端的代理服务器的IP地址；上述访问请求中还包括对应客户端此次访问时的位置信息，该位置信息可以由该客户端通过调用GPS模块获得对应的GPS位置信息，并加入访问请求中或者调用信号模块获取对应的基站信息及基站信号强度信息，并加入访问请求中，或者通过其他形式来获得。优选地，所述位置信息为所述访问客户端的GPS经纬度信息，或者由基站及基站信号强度信息得到的信号最强的基站的经纬度信息。上述位置信息为上述访问客户端的GPS经纬度信息，或者为由基站及基站信号强度信息得到的信号最强的基站的经纬度信息；上述位置信息为上述访问客户端在访问目标服务器时访问请求中的GPS经纬度信息；或者由上述访问客户端在访问目标服务器时访问请求中的基站及基站信号强度信息获得，例如可以从上述基站及基站信号强度信息中找到信号强度最强的那个基站信息，通过预置的基站&经纬度映射表(可从地图公司，如百度地图买入，或者通过其他方式)找到对应的经纬度信息；或者找到信号最强的三个基站信息，通过分析三个基站对应信号强度的比值获取与三个基站分别对应的距离的比值，再通过查找基站&经纬度映射表找到上述三个基站的经纬度信息，结合上述对应的三个对应距离的比值，可以计算得出上述访问客户端的经纬度信息，即位置信息；总之，如何获取上述访问客户端的位置信息，本发明对此不做限制。例如，访问客户端A访问目标服务器时，该客户端检测到对应终端存在GPS模块，因此调用GPS模块获得对应的GPS位置信息，为经纬度信息(123.23224，45.34221)，并将该GPS位置信息加入访问请求中，与访问请求中的IP信息134.27.12.32一起发送给目标服务器；在目标服务器接收到访问客户端A的访问请求时，上述目标服务器从上述访问请求中获取上述访问客户端A的IP信息134.27.12.32，以及对应的GPS位置信息(123.23224，45.34221)并进行记录。例如，访问客户端B访问目标服务器时，该客户端检测到对应终端没有GPS模块，因此调用或者不经过上述检测，直接调用信号模块获取基站信息及基站信号强度信息，获取到5个基站信息及对应的基站信号强度信息；选择基站信号强度最大的对应基站，其基站信息为：国家代码为460，网络号码为0，位置区域码为6308，基站编号为63451；根据预置的基站&经纬度映射表找到对应上述基站信息的经纬度信息为(26.26224，25.34221)，并将该基站的经纬度信息加入访问请求中，与访问请求中的IP信息134.27.12.32一起发送给目标服务器；在目标服务器接收到访问客户端B的访问请求时，上述目标服务器从上述访问请求中获取上述访问客户端B的IP信息134.27.12.32，以及对应的基站的经纬度信息(26.26224，25.34221)并进行记录。本发明实施例中，获取到的上述客户端的IP信息和对应的位置信息并进行记录，记录的表的一种优选方式可以如表一所示：表一步骤202：分别针对各所述IP信息，统计采集的位置信息的样本数量并去除异常样本，使得有效样本数量达到设定阈值。分别针对各上述IP信息，统计采集的位置信息的样本数量并去除异常样本，使得有效样本数量达到设定阈值；因为统计方法对应的有效样本数量越多，统计值才会越有效，因此需要统计采集的位置信息的样本数量并去除异常样本，使得有效样本数量至少达到上述设定阈值的数量；上述统计可以对在设定的时间段内采集的位置信息进行统计，比如以一周为时间段，也可以对所有采集的位置信息进行统计；例如统计一周内的样本，设定阈值可以为500，即统计一周内有效样本数量至少为500的IP信息的位置信息。上述异常样本即明显没有统计价值的样本，如果放入样本中将使整个样本的统计结果与实际差别太大，没有实际意义，甚至可能出错。例如以一个生活在大学内的学生而言，通过手机APP直接登录(不通过代理服务器)目标服务器，如果一个月内都在该大学内及周边活动，可以预知的是，目标服务器采集到的该APP的IP信息对应的位置信息必然是在该大学内的教室、食堂、宿舍、校外附近饭馆等，即位置信息很集中，样本分散程度很小，会确认该IP信息不是代理IP；但是如果该学生在月底通过飞机回到另外一个省的老家，并呆了两天，那么目标服务器很有可能还采集到多个该APP的IP信息对应的另外一个省的位置信息，如果将多个该位置信息纳入统计范围，则计算结果很有可能会显示整体的样本分散程度比较高，会确认该IP信息是代理IP。因此需要去除异常样本，可以通过对样本数据进行排序，去除排在最前面的固定比例或固定数量的样本，也可以通过计算样本的平均值，去除与上述平均值相差最大的固定比例的样本，也可以通过其他形式。本发明实施例中，分别针对各上述IP信息，统计采集的位置信息的样本数量一种优选方式，例如对参照上述表一中，针对IP信息为134.27.12.32的位置信息统计的表，可以如表二所示：IP信息134.27.12.32的位置信息(经纬度信息)60.78567，5.4629826.26224，25.3422134.45785，20.31084…表二例如对参照上述表一中，针对IP信息为064.57.80.80的统计的表，可以如表三所示：IP信息064.57.80.80的位置信息(经纬度信息)60.78567，5.4629875.08564，6.0657860.78562，5.46294…表三例如，对于表三中IP信息为064.57.80.80的位置信息的样本，可以根据排序去除最大的一个样本“75.08564，6.06578”，此处仅为示例。步骤203：分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离。分别针对各上述IP信息，依次以上述IP信息下每个位置信息对应的点作为基准点，计算上述基准点与上述IP信息下其它位置信息对应的点的距离；例如对于一个有效样本数量为5000的样本，依次以5000个位置信息对应的点做为基准点，计算与其它4999个点的距离，针对每个点计算5000次(可以包括与该点自己的距离，为零)。上述对点的距离的计算可以根据对应的位置信息，比如经纬度信息，还有地球的半径信息，将地球当做一个球形来计算；或者根据其它图表，或者其他形式计算。例如对于经纬度信息为(123.23224，45.34221)的点A与经纬度信息为(124.23212，44.12234)的点B而言，取地球半径为6371千米，首先计算B与A的经度差与纬度差的绝对值分别为0.99988°与1.21987°，将上述经度差与纬度差的绝对值换算为以弧度角为单位的数据，即0.017451rad与0.0212908rad，计算出A点与B点的东西距离为6371*0.017451＝111.2千米，南北距离为6371*0.0212908＝135.6千米，则A点与B点的距离为千米。步骤204：分别针对各所述IP信息，对所述计算的距离求样本平均距离，并将所述样本平均距离与设定平均距离比较。分别针对各上述IP信息，对上述计算的距离求样本平均距离，并将上述样本平均距离与设定平均距离比较；即计算上述各经纬度信息对应的点之间的距离，并采用上述计算的各经纬度信息对应的点之间的距离来作为样本，计算样本平均距离，其实就是计算样本平均值；例如对于上述有效样本数量为5000的经纬度信息而言，计算得到的各经纬度信息对应的点之间的距离的样本数量为50002，因此可以对计算得到的各经纬度信息对应的点之间的距离求和，除以对应的样本数量50002，可以得到样本的平均值，即样本平均距离；然后将上述样本平均距离与设定平均距离比较。上述设定分散程度包括白名单设定分散程度、灰名单设定分散程度，例如可以通过统计已知的正常ip的位置信息，例如以各位置信息对应的点之间的距离来表征位置信息，假设正常的IP的样本平均距离在5千米之内的占整个正常IP数量的比重为50％，超过5千米的且在50千米内的占比40％，超过50千米的占比10％，那么就可以根据上述数据将样本平均距离超过50千米的IP定义为代理IP黑名单，5<样本平均距离<50千米的IP定义为代理ip灰名单，小于5千米的IP定义为代理IP白名单；相应的，白名单设定平均距离为5千米，灰名单设定平均距离为50千米。如果上述IP信息对应的样本分散程度超过上述灰名单设定分散程度，则执行步骤205；如果上述IP信息对应的样本分散程度小于上述白名单设定分散程度，则执行步骤206；如果上述IP信息对应的样本分散程度超过上述白名单设定分散程度且小于上述灰名单设定分散程度，则执行步骤207。步骤205：如果所述IP信息对应的样本分散程度超过所述灰名单设定分散程度，则确认所述IP信息是代理IP。如果上述IP信息对应的样本分散程度超过上述灰名单设定分散程度，则确认上述IP信息是代理IP，然后执行步骤208。步骤206：如果所述IP信息对应的样本分散程度小于所述白名单设定分散程度，则确认所述IP信息不是代理IP。如果上述IP信息对应的样本分散程度小于上述白名单设定分散程度，则确认上述IP信息不是代理IP，然后执行步骤208。步骤207：如果所述IP信息对应的样本分散程度超过所述白名单设定分散程度且小于所述灰名单设定分散程度，则确认所述IP信息是可疑代理IP。如果上述IP信息对应的样本分散程度超过上述白名单设定分散程度且小于上述灰名单设定分散程度，则确认上述IP信息是可疑代理IP。例如，根据上述灰名单设定分散程度表征为灰名单样本平均距离为50千米，上述白名单设定分散程度表征为白名单样本平均距离为5千米，如果IP信息为134.27.12.32的对应的样本平均距离为150.8千米，则确认该IP信息是代理IP；如果IP信息为035.67.82.30的对应的样本平均距离为3.6千米，则确认该IP信息不是代理IP；如果IP信息为140.80.20.80的对应的样本平均距离为35.2千米，则确认该IP信息是可疑代理IP。优选地，在所述分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP的步骤207之后还包括：步骤S1：接收访问客户端的访问请求，从所述访问请求中提取所述访问客户端的IP信息。目标服务器接收访问客户端的访问请求，从上述访问请求中提取上述访问客户端的IP信息。例如，上述目标服务器接收到访问客户端A的访问请求，并从上述访问请求中提取出上述访问客户端A的IP信息134.27.12.32。步骤S2：将所述IP信息与已经识别的IP信息进行匹配，确定所述IP信息是否为代理IP。目标服务器将上述IP信息与已经识别的IP信息进行匹配，确定上述IP信息是否为代理IP；上述已识别的IP信息已经在识别之后存储对应的识别结果，因此将上述IP信息与上述已经识别的IP信息进行比对匹配，如果找到相应的IP信息的识别结果，则根据该识别结果确认对应的的IP信息是否为代理IP；如果没有找到相应的IP信息的识别结果，则无操作或者采用现有的端口扫描的方式来识别。例如，目标服务器将上述访问客户端A的IP信息134.27.12.32与已经识别的IP信息比对，可以是与储存的已经识别的IP信息的表比对，如果在该表中找到该IP信息的记录为是代理IP，则确定该IP信息134.27.12.32已经被识别，而且是代理IP；如果在该表中找到该IP信息的记录为不是代理IP，则确定该IP信息134.27.12.32已经被识别，而且不是代理IP；如果在该表中找到该IP信息的记录为可疑代理IP，则确定该IP信息134.27.12.32已经被识别，而且是可疑代理IP；如果在该表中没有找到该IP信息的记录，则无操作或者采用现有的端口扫描的方式来识别。进一步地，在所述将所述IP信息与已经识别的IP信息进行匹配，确定所述IP信息是否为代理IP的步骤S2之后还包括：步骤S21：如果所述IP信息是代理IP，则屏蔽所述IP信息对应的访问客户端。如果上述IP信息是代理IP，则屏蔽上述IP信息对应的访问客户端。例如，目标服务器已经在上述访问客户端A访问时，识别对应的IP信息134.27.12.32是代理IP，则目标服务器屏蔽该IP信息对应的访问客户端A的此次访问。步骤S22：如果所述IP信息不是代理IP，则接受所述IP信息对应的访问客户端的访问。如果上述IP信息不是代理IP，则接受上述IP信息对应的访问客户端的访问。例如，目标服务器已经在上述访问客户端A访问时，识别对应的IP信息134.27.12.32不是代理IP，则目标服务器接受该IP信息对应的访问客户端A的此次访问。步骤S23：如果所述IP信息是可疑代理IP，则标记所述IP信息为可疑代理IP。如果上述IP信息是可疑代理IP，则标记上述IP信息为可疑代理IP。例如，目标服务器已经在上述访问客户端A访问时，识别对应的IP信息134.27.12.32是可疑代理IP，则目标服务器标记该IP信息为可疑代理IP。更进一步地，在所述如果所述IP信息是可疑代理IP，则标记所述IP信息为可疑代理IP的步骤S23之后还包括：步骤S231：扫描所述IP信息对应的服务器，判断所述服务器是否开放了代理端口。目标服务器扫描上述IP信息对应的服务器，判断上述服务器是否开放了代理端口；如果上述服务器开放了代理端口，则执行步骤S232；如果上述服务器没有开放代理端口，则执行步骤S233。步骤S232：如果所述服务器开放了代理端口，则确认所述IP信息是代理IP，并屏蔽所述IP信息对应的访问客户端。如果上述服务器开放了代理端口，则确认上述IP信息是代理IP，并屏蔽上述IP信息对应的访问客户端。步骤S233：如果所述服务器没有开放代理端口，则确认所述IP信息不是代理IP，并接受所述IP信息对应的访问客户端的访问。如果上述服务器没有开放代理端口，则确认上述IP信息不是代理IP，并接受上述IP信息对应的访问客户端的访问。相对在先技术，本发明实施例具有以下优点：通过在访问客户端访问时，获取访问请求中的IP信息与对应的位置信息，使得样本的获取方便，容易积累大量样本；通过对异常样本的去除和有效样本数量的控制，使得针对样本的统计结果，即样本分散程度更加有效；通过位置信息对应的点之间的平均距离来表征样本分散程度，使得样本分散程度数据化，容易分析比较；通过将代理IP识别为代理IP、非代理IP、可疑代理IP，使得识别结果细致、有层次、有效；本发明实施例有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。因为本发明实施例的优选方式中，位置信息为上述访问客户端的GPS经纬度信息，或者由基站及基站信号强度信息得到的信号最强的基站的经纬度信息，使得位置信息获取方便，准确，获取方式灵活多样。因为本发明实施例的优选方式中，在接收访问客户端的访问请求时，获取上述访问请求中的IP信息与已识别的IP信息匹配来识别，使得IP识别迅速、准确，能够有效防止代理IP的访问；进一步地，根据IP识别的结果，采取针对性地安全措施，进一步提高了网络安全性；更进一步地，对可疑IP采取端口扫描的方式进一步识别，使得IP识别的范围进一步扩展，提高了IP识别的准确性，同时降低了传统端口扫描方式的工作量。实施例三：参照图4所示，本发明实施例提供了一种识别代理IP的方法，具体可以包括步骤301-304：步骤301：采集各访问客户端的IP信息与对应的位置信息。采集各访问客户端的IP信息与对应的位置信息，可以参照本发明实施例一的对应说明。步骤302：分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离。分别针对各上述IP信息，依次以上述IP信息下每个位置信息对应的点作为基准点，计算上述基准点与所述IP信息下其它位置信息对应的点的距离，可以参照本发明实施例二的对应说明。步骤303：分别针对各所述IP信息，对所述计算的距离求样本标准差，并将所述样本标准差与设定标准差比较。分别针对各上述IP信息，对上述计算的距离求样本标准差，并将上述样本标准差与设定标准差比较；即计算上述各经纬度信息对应的点之间的距离，并采用上述计算的各经纬度信息对应的点之间的距离来作为样本，计算上述距离样本的标准差，即样本标准差；例如对于上述有效样本数量为5000的经纬度信息而言，计算得到的各经纬度信息对应的点之间的距离的样本数量为50002，因此可以对计算得到的各经纬度信息对应的点之间的距离求和，除以对应的样本数量50002，可以得到样本的平均值，即样本平均距离；然后依次计算上述距离样本中各距离数据与其样本平均距离之差的平方，然后对各计算出的差值平方求和，并处以距离样本的数量，得到上述距离样本的方差，对上述方差开方，就得到对应的标准差；然后将上述样本标准差与设定标准差比较。步骤304：分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP。分别根据各上述IP信息对应的比较结果，识别各上述IP信息是否为代理IP，可以参照本发明实施例一的对应说明。相对在先技术，本发明实施例具有以下优点：通过采集各访问客户端访问时的IP信息与对应的位置信息，分别通过位置信息对应的点之间的平均距离的标准差来表征样本分散程度，并与设定标准差比较来识别代理IP，使得样本分散程度数据化，容易分析比较，而且精准性更高；本发明实施例有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。实施例四：参照图5所示，本发明实施例提供了一种识别代理IP的系统，具体可以包括：采集模块40，用于采集各访问客户端的IP信息与对应的位置信息；计算比较模块50，用于分别针对各所述IP信息，计算每一个IP信息下各位置信息的样本分散程度，并将所述样本分散程度与设定分散程度比较；识别模块60，用于分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP。相对在先技术，本发明实施例具有以下优点：通过采集各访问客户端访问时的IP信息与对应的位置信息，分别通过比较各IP信息对应的位置信息的样本分散程度与设定分散程度，来识别上述各IP信息是否为代理IP，有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。实施例五：参照图6所示，本发明实施例提供了一种识别代理IP的系统，具体可以包括：访问信息采集模块401，用于在接收到访问客户端的访问请求时，从所述访问请求中获取所述访问客户端的IP信息与对应的位置信息进行记录；优选地，所述位置信息为所述访问客户端的GPS经纬度信息，或者由基站及基站信号强度信息得到的信号最强的基站的经纬度信息；样本筛选模块70，用于分别针对各所述IP信息，统计采集的位置信息的样本数量并去除异常样本，使得有效样本数量达到设定阈值；第一距离计算模块501，用于分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离；第一计算比较模块502，用于分别针对各所述IP信息，对所述计算的距离求样本平均距离，并将所述样本平均距离与设定平均距离比较；所述设定分散程度包括白名单设定分散程度、灰名单设定分散程度；第一识别模块601，用于如果所述IP信息对应的样本分散程度超过所述灰名单设定分散程度，则确认所述IP信息是代理IP；第二识别模块602，用于如果所述IP信息对应的样本分散程度小于所述白名单设定分散程度，则确认所述IP信息不是代理IP；第三识别模块603，用于如果所述IP信息对应的样本分散程度超过所述白名单设定分散程度且小于所述灰名单设定分散程度，则确认所述IP信息是可疑代理IP。优选地，在所述第三识别模块603之后，所述系统还包括：访问信息提取模块，用于接收访问客户端的访问请求，从所述访问请求中提取所述访问客户端的IP信息；访问IP识别模块，用于将所述IP信息与已经识别的IP信息进行匹配，确定所述IP信息是否为代理IP。进一步地，在所述访问IP识别模块之后，所述系统还包括：第一应对模块，用于如果所述IP信息是代理IP，则屏蔽所述IP信息对应的访问客户端；第二应对模块，用于如果所述IP信息不是代理IP，则接受所述IP信息对应的访问客户端的访问；第三应对模块，用于如果所述IP信息是可疑代理IP，则标记所述IP信息为可疑代理IP。更进一步地，在所述第三应对模块之后，所述系统还包括：端口扫描模块，用于扫描所述IP信息对应的服务器，判断所述服务器是否开放了代理端口；第四应对模块，用于如果所述服务器开放了代理端口，则确认所述IP信息是代理IP，并屏蔽所述IP信息对应的访问客户端；第五应对模块，用于如果所述服务器没有开放代理端口，则确认所述IP信息不是代理IP，并接受所述IP信息对应的访问客户端的访问。相对在先技术，本发明实施例具有以下优点：通过在访问客户端访问时，获取访问请求中的IP信息与对应的位置信息，使得样本的获取方便，容易积累大量样本；通过对异常样本的去除和有效样本数量的控制，使得针对样本的统计结果，即样本分散程度更加有效；通过位置信息对应的点之间的平均距离来表征样本分散程度，使得样本分散程度数据化，容易分析比较；通过将代理IP识别为代理IP、非代理IP、可疑代理IP，使得识别结果细致、有层次、有效；本发明实施例有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。因为本发明实施例的优选方式中，位置信息为上述访问客户端的GPS经纬度信息，或者由基站及基站信号强度信息得到的信号最强的基站的经纬度信息，使得位置信息获取方便，准确，获取方式灵活多样。因为本发明实施例的优选方式中，在接收访问客户端的访问请求时，获取上述访问请求中的IP信息与已识别的IP信息匹配来识别，使得IP识别迅速、准确，能够有效防止代理IP的访问；进一步地，根据IP识别的结果，采取针对性地安全措施，进一步提高了网络安全性；更进一步地，对可疑IP采取端口扫描的方式进一步识别，使得IP识别的范围进一步扩展，提高了IP识别的准确性，同时降低了传统端口扫描方式的工作量。实施例六：参照图7所示，本发明实施例提供了一种识别代理IP的系统，具体可以包括：采集模块40，用于采集各访问客户端的IP信息与对应的位置信息；第二距离计算模块503，用于分别针对各所述IP信息，依次以所述IP信息下每个位置信息对应的点作为基准点，计算所述基准点与所述IP信息下其它位置信息对应的点的距离；第二计算比较模块504，用于分别针对各所述IP信息，对所述计算的距离求样本标准差，并将所述样本标准差与设定标准差比较；识别模块60，用于分别根据各所述IP信息对应的比较结果，识别各所述IP信息是否为代理IP。相对在先技术，本发明实施例具有以下优点：通过采集各访问客户端访问时的IP信息与对应的位置信息，分别通过位置信息对应的点之间的平均距离的标准差来表征样本分散程度，并与设定标准差比较来识别代理IP，使得样本分散程度数据化，容易分析比较，而且精准性更高；本发明实施例有效地解决了现有的识别代理IP的方法效率低下的问题，提高了代理IP识别的效率，提高了网络安全性。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马明;
技术所有人：同盾科技有限公司;
我是此专利的发明人

上一篇：一种新的西格列汀化合物的制作方法与工艺
上一篇：一种互联网音视频域名解析方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。