获取设备特征ID方法和系统及用之判断虚拟设备的方法与流程

文档序号:11952936阅读:295来源:国知局
获取设备特征ID方法和系统及用之判断虚拟设备的方法与流程
本发明属于网络反作弊领域,具体地,涉及一种获取设备特征ID方法及系统。本发明还涉及一种利用设备特征ID判断虚拟设备的方法。
背景技术
:长久以来获得稳定而且可信赖的用户设备标识,是诸多行业最为基础的数据支持。虽然并不被人所熟知,但是却有很多种方法来帮助系统生产不同的ID。最基础的方法,就通过生产随机数,分配给不同的用户,这种常用于含有账户体系的业务场景。例如腾讯QQ,给每一个用户都分配一个不重复的QQ号码,作为其系统服务的ID。但也有其他的方式,主要通过采集设备使用者的信息来生产ID,例如通过采集音频数据、加速传感器数据或者生物指纹传感器的数据,这种可以服务于跨设备的用户标识。但是,如上两种方法,很难满足于移动广告行业反作弊的需求。主要原因有如下两点:1、移动广告交易主要是以设备为单元进行消耗的计费,例如CPC(按照点击设备数计费)、CPM(按照曝光设备数计费)、CPA(按照激活设备数计费),那么针对持有多设备的用户以及不具有账户体系的广告平台,随机数的方法是不适用的;2、广告作弊者主要是通过变换较为常见的设备标识进行伪装,通过采集使用者信息会有较多局限,第一是采集方法都是基于特质的传感器,不适用于大部分移动设备,第二是用户识别的方法复杂并且精准度有限。基于以上描述的背景,广告行业从业者进行诸多尝试,将基于操作系统的设备标识方法,用于移动广告交易及反作弊。基于操作系统的设备标识,主要通过获取系统的唯一性数据生成ID,具体来讲,主要采集操作系统的用户数据,例如插件安装情况、用户文件数、屏幕比例、CPU时钟等,将组合值生成设备ID。但是基于操作系统的设备标识有一个较为明显的缺陷,针对虚拟设备,例如通过计算机模拟的手机设备,也会生产一个随机有效地标识码,这显然无法满足移动广告的防作弊需求。技术实现要素:有鉴于此,本发明提供了一种获取设备特征ID方法和系统,可以解决现有技术基于操作系统的设备标识无法避免虚拟设备生成不真实标识码的问题。本发明通过以下技术方案实现:通过采集基于用户使用信息的设备信息,包括:用户的Wifi历史、系统应用创建时间、设备的传感器列表,将以上信息利用有加密性质的哈希算法进行计算得到字符串,对所得字符串进行组合,从而获得用户的唯一标识,由于其ID熵值足够大,能够唯一确定一台设备并且适合绝大部分设备与操作系统。提高了结果的准确性和方法的适用性。根据本发明的第一方面,本发明提供了一种获得设备特征ID的方法,所述方法包括以下步骤:接收来自用户终端的HTTP请求;获取与用户网络使用相关的特征信息;将所述与用户网络使用相关的特征信息利用哈希算法转换为字符串;将所述字符串组合从而得到基于网络使用特征的设备特征ID。优选地,在根据本发明所述的方法中,所述用户网络使用相关特征信息包括:用户的Wifi历史、系统应用创建时间、和设备的传感器列表中的一种或多种。在本发明的一些实施方式中,获取所述与用户网络使用相关的特征信息后通过加密的哈希算法转换为字符串,并不可逆地传输到服务器。通过这样的办法可以有效保护用户信息的安全。优选地,对计算得到的字符串进行组合,通过哈希计算生成基于网络使用特征的设备特征ID。优选地,将得到的字符串进行组合时通过哈希算法加密并转换为唯一的基于网络使用特征的设备特征ID。在本发明的一些实施方式中,所述方法还包括将得到的基于网络使用特征的设备特征ID与硬件层的设备特征ID组合作为用户特征ID。优选地,所述硬件层的设备特征ID包括MAC、IMEI、IMSI、IDFA、和CID中的一种或多种。更优选地,所述硬件层的设备特征ID通过私有API(PrivateAPI)获得。由于其ID熵值足够大,能够唯一确定一台设备并且适合绝大部分设备与操作系统。根据本发明的第二方面,本发明提供一种利用设备特征ID判断虚拟设备的方法,其包括:利用前述方法获得基于网络使用特征的设备特征ID;将获得的设备特征ID在设备特征ID库中比对,当有相同者时,判断该设备特征ID来自虚拟设备。在本发明的一些实施方式中,所述方法还包括将所述用户特征ID在现有用户特征ID库中比对,当有相同者时,判断所获得的设备特征ID来自虚拟设备。优选地,当判断设备特征ID是否来自虚拟设备时,基于各个特征通过加权计算得到的综合结果来判断。根据本发明的第三方面,本发明提供一种获得设备特征ID的系统;其包括:接收模块,接收来自用户终端的HTTP请求;采集模块,获取与用户网络使用相关的特征信息;转换模块,将所述与用户网络使用相关的特征信息利用哈希算法转换为字符串;处理模块,将所述字符串组合生成基于网络使用特征的设备特征ID;设备特征ID库模块,存储得到的设备特征ID。优选地,所述采集模块所获取的与用户网络相关的特征信息包括:用户的Wifi历史、系统应用创建时间、设备的传感器列表中的一个或多个特征信息。在本发明的一些实施方式中,获取所述与用户网络使用相关的特征信息后通过加密的哈希算法转换为字符串,并不可逆地传输到服务器。通过这样的办法可以有效保护用户信息的安全。在这些实施方式中,服务器(系统)中存储的设备特征ID为经过哈希算法转换过的字符串。在本发明的一些实施方式中,所述系统还包括用户特征ID库模块,其存储用户特征ID,所述用户特征ID是基于网络使用特征的设备特征ID与硬件层的设备特征ID的组合。与现有技术相比本发明使用用户在使用设备时留下的线索和痕迹:用户的Wifi历史、系统应用创建时间、设备传感器列表,将获取的信息分别利用有加密性质的哈希算法进行哈希计算,得到的字符串进行组合,即可获得一个用户的唯一标识。因为其ID熵值足够大,能够唯一确定一台设备并且适合绝大部分设备和操作系统,提高了准确性和适用性。附图说明通过阅读参考一下附图所作的对非限制性实施例所作的详细描述,本发明的其他特征、目的和有点将会变得更明显:图1是示意地表示本发明的一些实施方式的的结构图。图2是示意地表示本发明的一些实施方式的方法的流程图。具体实施方式在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。在本发明中,术语“用户网络使用特征信息”是指用户使用无线网络(例如Wifi、3G、4G或5G)时产生的信息。所述用户网络使用特征信息包括但不限于用户的Wifi历史、系统应用创建时间、设备传感器列表,例如接入无线网络的时间、断开时间、适配器名称、配置文件名称、传感器类型值、传感器参数值等。在本发明中,术语“私有API”(PrivateAPI)是指放在PrivateFrameworks框架中的API。在本发明中,术语“SSID”(ServiceSetIdentifier)是AP唯一的ID码,用来区分不同的网络,最多可以有32个字符,无线终端和AP的SSID必须相同方可通信。无线网卡设置了不同的SSID就可以进入不同网络,SSID通常由AP广播出来,通过XP自带的扫描功能可以相看当前区域内的SSID。出于安全考虑可以不广播SSID,此时用户就要手工设置SSID才能进入相应的网络。简单说,SSID就是一个局域网的名称,只有设置为名称相同SSID的值的电脑才能互相通信。在本发明中“BSSID”是BSS的名称。BSS是一种特殊的Ad-hocLAN的应用,一个无线网络至少由一个连接到有线网络的AP和若干无线工作站组成,这种配置称为一个基本服务装置BSS(BasicServiceSet)。一群计算机设定相同的BSS名称,即可自成一个group,而此BSS名称,即所谓BSSID。总体来说,本发明是通过从网络设备获取与用户网络使用相关的特征信息,信息包括:用户的Wifi历史、系统应用创建时间、设备的传感器列表,将获取的信息利用带有加密或不加密的哈希算法进行哈希处理,转换为字符串进行组合,再将所得字符串组合,利用哈希算法获得一个唯一的基于用户网络使用相关的特征信息的设备ID,成为设备特征ID组中的一员。与从硬件层采集到的其他设备特征ID组合作为用户特征ID可以用于区别用户。为使本发明的目的、技术方案和优点更加清晰,以下结合说明书附图说明本发明的一种获得设备特征ID的系统及方法。图1是示意地表示本发明一些实施方式的结构图。如图1所示在根据本发明所述的系统中,可以包括接收模块110、采集模块120、转换模块130、处理模块140、设备特征ID库模块150。其中,所述接收模块110可以用于接收来自用户终端的HTTP请求,通过步骤S210进行处理。所述采集模块120,可以基于所述请求,通过步骤S220,如利用移动终端操作系统的API获取用户终端中与用户网络使用相关的用户的Wifi历史、系统应用创建时间、设备的传感器列表的特征信息。所述转换模块130,通过步骤S230利用加密或不加密的哈希算法对采集到的特征信息进行哈希计算,将其转化为字符串。在本发明的一些实施方式中,在采集到与用户网络使用相关的信息时利用加密的哈希算法将采集到的信息转化为字符串存入服务器,这样可以保证用户信息的安全。所述处理模块通过步骤S240对转换模块130中计算得到的字符串进行组合得到唯一的基于与用户网络使用相关信息的设备特征ID。在本发明的一些实施方式中,所述组合是通过哈希算法对多个字符串进行加密,并转化为唯一的基于用户网络使用相关信息的设备特征ID。所述设备特征ID库模块150,存储计算得到的设备特征ID。在本发明的一些实施方式中,所述采集模块120也可以采集硬件层的设备特征ID。优选地,所述硬件层的设备特征ID包括MAC、IMEI、IMSI、IDFA、和CID中的一种或多种。在本发明的一些实施方式中,所述设备特征ID库模块150也可以存储硬件层的设备特征ID。在本发明的另一些实施方式中,所述系统还包括用户特征ID库模块160,其存储用户特征ID,所述用户特征ID是基于网络使用特征的设备特征ID与硬件层的设备特征ID的组合。通过用户特征ID库的存在有助于在对大数据分析的时候更好的识别用户,将多维度的数据与相对确定的个体(用户或用户终端)关联。接下来参照图2是示意地表示使用本发明一些实施方式的方法的流程图。步骤S210,接收来自用户终端的HTTP请求。用户在点击广告或打开有广告的网页时,都会对广告监测服务器发起HTTP请求。步骤S220,基于所述请求,获取用户终端中与用户网络使用相关的特征信息,所述的特征信息包括但不限于:用户的Wifi历史、系统应用创建时间、设备的传感器列表。在步骤S230中将采集到的与用户网络使用相关的特征信息利用哈希算法转化为字符串。在步骤S240中,将计算得到的字符串进行组合得到唯一的基于与用户网络使用相关信息的设备特征ID。在本发明的一些实施方式中,所述组合是通过哈希算法对多个字符串进行加密,并转化为唯一的基于用户网络使用相关信息的设备特征ID。使用此方法因为ID熵值足够大,能够唯一确定一台设备并且适合绝大部分设备和操作系统。实施例1广告监测服务器接收到大量用户终端对广告A网页发起的HTTP请求。用户的Wifi历史通过SDKAPI获取这些用户终端(例如手机)的历史Wifi连接记录列表,每一项包含AP的名称和MAC地址(无线接入点和无线接入点的Mac地址),获取的用户Wifi历史记录列表(WifiList)如表1所示。表1BssidSsid64%3A09%3A80%3A5f%3Adc%3Ae3CMCC-AUTO64%3A09%3A23%3A5f%3Adc%3Ae4CMCC4d%3A39%3Af9%3A4c%3A48%3A41houge反作弊SDK在获取到原始数据后直接采用哈希加密转换为字符串,以不可逆的方式上传到服务器端,仅仅作唯一标识用途,有效保护用户隐私。转换后的字符串为:becb5a2611c98d52bae9fbfd1204828c系统应用创建时间通过SDKAPI获取到OS应用(APP)的初始安装(激活)时的时间(unix时间戳)。获取的原始数据为:"ot":"1442244055595"所述原始数据可以通过哈希算法转换为字符串,也可直接作为字符串上传到服务器端。传感器列表通过SDKAPI获取到设备所支持的传感器列表,每一项均具有厂商,类型的属性,获取的原始传感器列表如表2所示:表2SvendorSnameStypeBoschBMI058+3-axis+Accelerometer1Lite-ONLTR558++Proximity+Sensor8BoschBMI058+gyroscope+Sensor4AKMAKM8963+Orientation+sensor3AKMAKM8963+3-axis+Magnetic+Field+sensor2Google+IncRotation+Vector+Sensor11Google+Inc.Gravity+Sensor9Google+IncGravity+Sensor9Google+Inc.Linear+Acceleration+Sensor10Google+Inc.Corrected+Gyroscope+Sensor4SDKAPI在获取到原始数据后采用哈希算法转换为字符串,转换后的字符串为:f4378df669d80ad992ea38f3c39146d7…………将前述所得的字符串进行组合,获得一个用户的唯一的基于用户网络使用相关信息的设备特征ID。使用此方法因为ID熵值足够大,能够唯一确定一台设备并且适合绝大部分设备和操作系统。所得的基于用户网络使用相关信息的设备特征ID与采集模块采集的其他设备特征ID,例如MAC、IMEI、IMSI、IDFA、和CID等均可以作为设备特征ID存入设备特征ID库模块。且,更进一步地,所述来自于同一真实设备的设备特征ID还可以组成用户ID存入用户ID库模块。在用于判断虚拟设备时,判断的依据如下:1.由于每个“真实用户”所连接过的wifi基本上很少会出现完全一致的情况,而“作弊用户”如果是通过重置改变OS系统参数的方式去作弊,会出现大量不同的设备而具有相同的WiFi列表记录的情况。因此当不同设备具有相同的WiFi列表记录时,这些设备是虚拟设备的可能性很大。2.正常情况下,在精确到毫秒的情况下,大量设备是很难在同一时间进行OS激活。所以在不需要重复刷ROM进行作弊设备下,如果表现出不同设备具有相同激活时间的特性,这些设备是虚拟设备的可能性很大。3.在“相同厂商”的“同一型号”的手机设备下,传感器列表数据会是相同的。如果情况不是这样,这些设备是虚拟设备的可能性很大。因此在判断时,一旦发现采集到的例如WiFi列表与设备特征ID库中相同,即可在该条指标下做出初步判断。需要说明的是:由于本发明用在大数据处理领域,判断是基于相关性而非因果性,因而最终的判断结果会综合各个参数的(加权)判断结果而做出,而非仅因为一个判断标准而确定。本发明提供了一种新的维度的判断标准和设备特征ID,丰富了设备特征ID库的内容,且本发明所提供的基于用户网络使用相关信息的设备特征ID防伪能力很高,模拟的可能性很小,因而可以作为判断虚拟设备的重要的参考指标。本发明不限于上述实施方式,在本发明思想的范围内可以进行各种变更。本发明已通过上述实施例进行了说明,但应当理解的是,上述实施例只是用于举例和说明的目的,而非意在将本发明限制于所描述的实施例范围内。此外本领域技术人员可以理解的是,本发明并不局限于上述实施例,根据本发明教导还可以做出更多种的变型和修改,这些变型和修改均落在本发明所要求保护的范围以内。本发明的保护范围由附属的权利要求书及其等效范围所界定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1