1.一种手机号码提取方法,其特征在于,所述方法包括:
从移动网络发送的超文本传输协议HTTP Get报文中,提取含有手机号码信息的移动网络统一资源定位符URL特征信息;
获取固网发送的HTTP Get报文;
依据所述移动网络URL特征信息,解析所述固网发送的HTTP Get报文,获得含有手机号码信息的固网URL特征信息;
从所述固网URL特征信息中提取第一手机号码信息;
从所述固网发送的HTTP Get报文中分离缓存文本Cookie字段信息;
通过解析邮箱用户名信息的方式,从所述Cookie字段信息中提取第二手机号码信息;
依据所述固网URL特征信息和所述Cookie字段信息,提取第三手机号码信息;
对所述第一手机号码信息、第二手机号码信息和第三手机号码信息,进行过滤,获得目标手机号码。
2.根据权利要求1所述的方法,其特征在于,在所述从移动网络发送的HTTPGet报文中,提取含有手机号码信息的移动网络URL特征信息的步骤之前,所述方法还包括:
获取移动网络发送的HTTP Get报文。
3.根据权利要求1所述的方法,其特征在于,所述通过解析邮箱用户名信息的方式,从所述Cookie字段信息中提取第二手机号码信息的步骤包括:
利用正则表达式,从所述Cookie字段信息中解析邮箱用户名信息;
过滤所述邮箱用户名信息,获得第二手机号码信息。
4.根据权利要求3所述的方法,其特征在于,所述依据所述固网URL特征信息和所述Cookie字段信息,提取第三手机号码信息的步骤包括:
从所述Cookie字段信息中提取包含手机号信息的数据;
依据固网URL特征信息对所述数据进行校验,统计可提取手机号信息的Cookie特征信息;
依据所述Cookie特征信息,从所述Cookie字段信息中提取第三手机号码。
5.根据权利要求4所述的方法,其特征在于,所述对所述第一手机号码信息、第二手机号码信息和第三手机号码信息,进行过滤,获得目标手机号码的步骤包括:
汇总第一手机号码信息、第二手机号码信息和第三手机号码信息,获得汇总信息;
提取所述固网发送的HTTP Get报文和所述移动网络发送的HTTP Get报文中的地域信息;
获取所述汇总信息中,各号码所对应的归属地信息;
利用所述地域信息和所述归属地信息,过滤所述汇总信息,获得目标手机号码。
6.一种手机号码提取装置,其特征在于,所述装置包括:
特征提取模块,用于从移动网络发送的超文本传输协议HTTP Get报文中,提取含有手机号码信息的移动网络统一资源定位符URL特征信息;
固网报文获取模块,用于获取固网发送的HTTP Get报文;
固网报文解析模块,用于依据所述移动网络URL特征信息,解析所述固网发送的HTTP Get报文,获得含有手机号码信息的固网URL特征信息;
第一手机号码提取模块,用于从所述固网URL特征信息中提取第一手机号码信息;
Cookie字段信息模块,用于从所述固网发送的HTTP Get报文中分离缓存文本Cookie字段信息;
第二手机号码提取模块,用于通过解析邮箱用户名信息的方式,从所述Cookie字段信息中提取第二手机号码信息;
第三手机号码提取模块,用于依据所述固网URL特征信息和所述Cookie字段信息,提取第三手机号码信息;
过滤模块,用于对所述第一手机号码信息、第二手机号码信息和第三手机号码信息,进行过滤,获得目标手机号码。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:移动网络报文获取模块,用于获取移动网络发送的HTTP Get报文。
8.根据权利要求6所述的装置,其特征在于,所述第二手机号码提取模块包括:
解析子模块,用于利用正则表达式,从所述Cookie字段信息中解析邮箱用户名信息;
过滤子模块,用于过滤所述邮箱用户名信息,获得第二手机号码信息。
9.根据权利要求8所述的装置,其特征在于,所述第三手机号码提取模块包括:
Cookie字段提取子模块,用于从所述Cookie字段信息中提取包含手机号信息的数据;
统计子模块,用于依据固网URL特征信息对所述数据进行校验,统计可提取手机号信息的Cookie特征信息;
手机号提取子模块,用于依据所述Cookie特征信息,从所述Cookie字段信息中提取第三手机号码。
10.根据权利要求9所述的终端,其特征在于,所述过滤模块包括:
汇总子模块,用于汇总第一手机号码信息、第二手机号码信息和第三手机号码信息,获得汇总信息;
地域信息子模块,用于提取所述固网发送的HTTP Get报文和所述移动网络发送的HTTP Get报文中的地域信息;
归属地信息子模块,用于获取所述汇总信息中,各号码所对应的归属地信息;
过滤执行子模块,用于利用所述地域信息和所述归属地信息,过滤所述汇总信息,获得目标手机号码。