终端的标识信息的判定方法及装置与流程

文档序号:13883726阅读:298来源:国知局
终端的标识信息的判定方法及装置与流程
本发明涉及计算机
技术领域
,尤其涉及一种终端的标识信息的判定方法及装置。
背景技术
:手机刷量工具是指可以安装在手机上的可以生成虚假新用户的应用,这类应用可以随机或基于已有用户数据文件,生成手机设备号imei(即internationalmobileequipmentidentity,是国际移动设备身份码的缩写,是由15位数字组成的"电子串号"。每一只手机在组装完成后都将被赋予一个全球唯一的一组号码,这个号码从生产到交付使用都将被制造生产的厂商所记录)、imsi(即internationalmobilesubscriberidentificationnumber,是区别移动用户的标志,储存在sim卡中,可用于区别移动用户的有效信息)、mac地址、屏幕分辨率、机型、sim卡号、手机号、运营商编号或名称、手机操作系统(os)版本等各种参数,每个不同的imei代表一个新的用户。而针对手机刷量问题,传统的检测方法是通过采集手机app上报的数据,分析其用户质量来对刷量行为进行检测。但是现在刷量技术已经可以模拟用户真实的点击行为,传统的方法存在漏报的可能。这就使得手机刷量检测的准确度较低。技术实现要素:基于此,为解决传统技术中通过imei码或mac地址区分实体终端设备方式带来的流量统计准确性不足的技术问题,特提出了一种终端的标识信息的判定方法。一种终端的标识信息的判定方法,包括:接收上传的上报数据,获取所述上报数据对应的发送端标识;提取所述上报数据携带的与所述发送端标识对应的传感器数据;根据接收到的传感器数据对与所述传感器数据对应的发送端标识进行聚类,得到的每个聚类包含至少一个发送端标识;判定同一聚类下包含的发送端标识均对应同一终端设备。可选的,在一个实施例中,所述根据接收到的传感器数据对与所述传感器数据对应的发送端标识进行聚类包括:根据预设的哈希函数计算所述接收到的传感器数据的哈希值;将哈希值相同的传感器数据对应的发送端标识划入同一聚类。可选的,在一个实施例中,所述根据预设的哈希函数计算所述接收到的传感器数据的哈希值为:根据文档去重算法计算所述接收到的传感器数据的simhash值作为哈希值。可选的,在一个实施例中,所述将哈希值相同的传感器数据对应的发送端标识划入同一聚类还包括:获取哈希值相同的传感器数据的哈希值,以及所述哈希值相同的传感器数据对应的发送端标识的集合;对应存储所述哈希值与所述发送端标识的集合,所述集合为根据哈希值相同的传感器数据得到的聚类,所述哈希值为所述聚类的聚类标识。可选的,在一个实施例中,所述判定同一聚类下包含的发送端标识均对应同一终端设备之后还包括:接收携带目标发送端标识的上报数据,提取所述上报数据携带的与所述目标发送端标识对应的传感器数据;根据预设的哈希函数计算所述目标发送端标识对应的传感器数据的目标哈希值;查找已存储的与所述目标哈希值匹配的聚类标识,在查找到时,获取所述聚类标识对应的发送端标识的集合,将所述目标发送端标识添加到所述发送端标识的集合中。可选的,在一个实施例中,所述传感器组件包括加速度传感器、陀螺仪传感器、重力传感器、线性加速度传感器和旋转矢量传感器中的至少一种。可选的,在一个实施例中,所述传感器数据为上传所述上报数据的终端上的传感器组件的采集数值在预设时间长度内的积分值。可选的,在一个实施例中,所述传感器组件包括地理位置传感器、高度传感器和时钟中的至少一种。此外,为解决传统技术中通过imei码或mac地址区分实体终端设备方式带来的流量统计准确性不足的技术问题,特提出了一种终端的标识信息的判定装置。一种终端的标识信息的判定装置,包括:上报数据发送端标识获取模块,用于接收上传的上报数据,获取所述上报数据对应的发送端标识;传感器数据提取模块,用于提取所述上报数据携带的与所述发送端标识对应的传感器数据;聚类模块,用于根据接收到的传感器数据对与所述传感器数据对应的发送端标识进行聚类,得到的每个聚类包含至少一个发送端标识;终端设备判定模块,用于判定同一聚类下包含的发送端标识均对应同一终端设备。可选的,在一个实施例中,所述聚类模块还用于根据预设的哈希函数计算所述接收到的传感器数据的哈希值;将哈希值相同的传感器数据对应的发送端标识划入同一聚类。可选的,在一个实施例中,所述聚类模块还用于根据文档去重算法计算所述接收到的传感器数据的simhash值作为哈希值。可选的,在一个实施例中,所述聚类模块还用于获取哈希值相同的传感器数据的哈希值,以及所述哈希值相同的传感器数据对应的发送端标识的集合;对应存储所述哈希值与所述发送端标识的集合,所述集合为根据哈希值相同的传感器数据得到的聚类,所述哈希值为所述聚类的聚类标识。可选的,在一个实施例中,所述装置还包括发送端标识识别模块,用于接收携带目标发送端标识的上报数据,提取所述上报数据携带的与所述目标发送端标识对应的传感器数据;根据预设的哈希函数计算所述目标发送端标识对应的传感器数据的目标哈希值;查找已存储的与所述目标哈希值匹配的聚类标识,在查找到时,获取所述聚类标识对应的发送端标识的集合,将所述目标发送端标识添加到所述发送端标识的集合中。可选的,在一个实施例中,所述传感器组件包括加速度传感器、陀螺仪传感器、重力传感器、线性加速度传感器和旋转矢量传感器中的至少一种。可选的,在一个实施例中,所述传感器数据为上传所述上报数据的终端上的传感器组件的采集数值在预设时间长度内的积分值。可选的,在一个实施例中,所述传感器组件包括地理位置传感器、高度传感器和时钟中的至少一种。实施本发明实施例,将具有如下有益效果:采用了上述终端的标识信息的判定方法和装置之后,统计服务器不再依赖于终端上传的上报数据中携带的终端的imei码或mac地址等物理标识来对终端进行区分,而可通过终端实时采集的传感器数据来对实体终端设备进行甄别。由于真实环境下,用户实际操作的不同的终端对应的操作环境、地理位置环境、时间、终端的摆放或握持环境不同,因此不同的终端通常实时采集的传感器数据不同,相同终端实时采集的传感器数据相同,因此统计服务器根据传感器数据对发送端标识进行聚类之后,可判定每一个聚类下的发送端标识对应同一实体终端设备,而在进行流量统计时,通过统计聚类的数量即可得到真实的流量数据,从而使得流量统计的数据更加准确。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:图1为一个实施例中一种终端的标识信息的判定方法的流程示意图;图2为一个实施例中利用simhash算法计算传感器数据的哈希值的示意图;图3为一个实施例中一种终端的标识信息的判定装置的结构示意图;图4为一个实施例中运行前述终端的标识信息的判定方法的计算机系统的组成示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在现有的在线app推广渠道中,通常通过一些应用市场,游戏市场类型的平台性工具提供下载,而为了统计这些app推广渠道的推广流量,即通过应用市场下载或下载后安装某个app的数量,会在app中提供上报统计数据的机制,由统计服务器接收该统计数据,得到app推广渠道的推广流量。而统计服务器在计数下载量或安装量时,通常是根据上传上报数据的不同终端的数目来进行统计的,而在传统技术中,上报数据中通常包括imei、mac等物理唯一的标识来区分不同的终端,例如,若在手机应用中,若统计服务器接收到n个imei码相异的手机上传了上报数据,则统计的流量数量即为n。然而,如前所述,随着统计服务器统计方式的公开化,对于一些在流量统计上作弊的用户,则针对使用imei或mac等物理唯一的标识区分终端的方式进行刷量,通常通过在一台终端上伪造多个imei码,然后分别使用该多个imei码模拟用户操作产生多次数据上报,由于统计服务器通过imei码辨认上传上报数据的终端,使得统计服务器会产生多次统计,也就使得刷量用户使用少量的终端设备即可产生较大数目的统计数据,这就影响了统计服务器在统计流量时的准确性。因此,为解决传统技术中通过imei码或mac地址区分实体终端设备方式带来的流量统计准确性不足的问题,特提出了一种终端的标识信息的判定方法。该方法的实现可依赖于计算机程序,该计算机程序可运行于基于冯诺依曼体系的计算机系统之上,该计算机系统可以是接收终端上报数据进行统计的统计服务器,该计算机程序可运行于该统计服务器上,可以是统计服务器上针对上报数据的处理程序。具体的,如图1所示,该终端的标识信息的判定方法包括:步骤s102:接收上传的上报数据,获取所述上报数据对应的发送端标识。在本实施例中,统计服务器开放监听端口,监听多个终端上传的上报数据。用户在终端上下载或安装app后,则生成上报数据,并与统计服务器开放的监听端口建立连接,然后将上报数据上传给统计服务器。也就是说,统计服务器跟终端可以是一对多的关系。发送端标识即为app在被下载或安装后由app或应用市场等渠道工具向统计服务器上报数据时,用于标识自己特定的终端设备的标识信息,也可以由统计服务器根据连接来自行设置。例如,在一个基于手机app的应用场景中,发送端标识可以是手机的imei码,手机上的app或应用市场程序可读取手机的imei码信息然后添加到上报数据中。而在一个个人电脑的应用场景中,发送端标识可以是个人电脑的mac地址。在另一个实施例中,手机或个人电脑在上传上报数据时,也可不添加区分终端的标识信息。在手机或个人电脑与统计服务器建立连接后,统计服务器可根据手机或个人电脑的ip地址来对发送端进行标识,或者,也可以通过手机或个人电脑上登录的用户账户来区分发送端。在本实施例中,统计服务器持续接收上报数据,可多次接收上报数据,而该多次接收的上报数据可分别对应不同的发送端标识。例如,若统计服务器多次接收到了上报数据,而该多次上报数据分别对应5个不同的imei码,则统计服务器接收到了与5个不同的发送端各自对应的上报数据。但统计服务器不根据该发送端标识的数量来统计流量信息。步骤s104:提取上报数据携带的与发送端标识对应的传感器数据。在本实施例中,终端向统计服务器发送的上报数据中还需要加入传感器数据。即终端在需要统计的app下载完成或安装完成时,检测终端上的传感器的读数,然后将该读数添加到上报数据中发送给统计服务器。需要统计的app或应用市场程序的开发人员可预先在需要统计的app或应用市场程序中注册对传感器的监听程序,当需要统计的app下载完成或安装完成时,通过回调函数即可得到此时传感器的数据,然后加入到上报数据中。例如,在一个android系统的应用场景中,开发人员可预先在需要统计的app或应用市场程序中在mainactivity类中实现sensoreventlistener类,在回调程序中将传感器的数据添加到上报数据中。可选的,上传上报数据的终端上的传感器组件包括加速度传感器、陀螺仪传感器、重力传感器、线性加速度传感器和旋转矢量传感器中的至少一种。如表1所示:表1表1展示了本实施例中可参考的多种传感器的类型,以及采集的传感器的数据的类型。在此优选的实施例中,使用多种传感器采集的加速度类型的数值作为传感器数据进行上报。由于加速度类型的传感器数据能够更好地反映出终端当前的握持状态或放置状态,能够捕捉到终端当前的轻微的转动、晃动、震动、摇动等能够反映用户手持终端的操作,而不同用户由于所处场景不同、握持习惯不同,操作习惯(力度,角度)不同,使得在下载或安装app时,加速度类型的传感器数据也会体现的有一定差异,因此,加速度类型的传感器数据能够很好地区分不同用户握持或操作的终端。进一步的,终端还可先计算传感器组件的采集数值在预设时间长度内的积分值,将该积分值作为传感器数据添加到上报数据中。例如,若预设的时长为t,则在检测到下载或安装app后,可持续读取时长t内的传感器读数,然后根据积分公式:得到传感器组件的采集数值在预设时间长度t内的积分值s,将s作为传感器数据添加到上报数据中。采用将加速度类型的传感器数值进行积分生成传感器数据的方式,可使得微小的加速度值差异能够由于积分运算平均化,从而减小误差。使得终端上两个相似的晃动、震动等操作能够得到相近的传感器数据。可选的,上传上报数据的终端上的传感器组件包括地理位置传感器(gps、北斗等)、高度传感器(气压传感器)和时钟中的至少一种。用于刷量的终端通常摆放在静止的桌面上运行刷量自动化的刷量程序自行切换发送端标识上传上报数据,而该终端在切换发送端标识上传上报数据的过程中,由于自动化执行,因此多次上传上报数据之间的时间间隔很短,时钟传感器上的读数接近,且由于静止放置于桌面上,而不是握持着走动的用户,因此其地理位置也不会发生变化,海拔高度也不会发生变化。而且,同一时刻,在同一地理位置以及同一海拔高度,具有多个终端下载和安装app的概率较小,因此时钟、地理位置和海拔高度也可用于区分不同的终端设备。步骤s106:根据接收到的传感器数据对与传感器数据对应的发送端标识进行聚类,得到的每个聚类包含至少一个发送端标识。步骤s108:判定同一聚类下包含的发送端标识均对应同一终端设备。例如,若统计服务器接收到n个发送端标识对应的上报数据,而其中m1个发送端标识对应的上报数据中的传感器数据相近为s1,另外m2个发送端标识对应的上报数据中的传感器数据相近为s2,另外m3个发送端标识对应的上报数据中的传感器数据相近为s3,则可将将该n个发送端标识划分为3个聚类。如表2所示:表2聚类标识数量发送端标识的集合聚类1m11、3、6、8…聚类2m22、4…聚类3m35、7、9…由表2可看出,由于发送端标识的集合1、3、6、8…的传感器数据相近,因此均划分到聚类1中,发送端标识的集合2、4…的传感器数据相近,因此均划分到聚类2中,发送端标识的集合5、7、9…的传感器数据相近,因此均划分到聚类3中。如前所述,由于传感器数据的不同能够反映出下载或安装app的终端所处的用户环境不同,进而可用于区分不同的实体终端设备,而相近的传感器数据则有较大几率为同一实体终端设备使用不同的发送端标识掩盖其身份进行多次上传所致,因此,可将发送端标识1、3、6、8…对应的终端判定为同一实体终端设备,将发送端标识的集合2、4…对应的终端判定为另一实体终端设备。结合刷量用户的操作习惯,通常将终端摆放在特定位置连续不断地使用不同的发送端标识上传上报数据,但即使每次上报数据使用的发送端标识不同,但由于终端在整个过程中所处的握持状态或操作状态均类似,即处于摆放的状态,且摆放在特定的高度,这就使得每次使用不同发送端标识上报数据时,上传的传感器数据仍然相近,被划分为同一聚类,统计服务器即可根据传感器数据所属的聚类判断出这些上报数据均为同一实体终端设备切换不同的发送端标识上传,从而实现了对终端的标识信息的判定。可选的,在本实施例中,可采用预设的哈希函数对发送端标识进行聚类,即根据接收到的传感器数据对与所述传感器数据对应的发送端标识进行聚类可包括:根据预设的哈希函数计算接收到的传感器数据的哈希值;将哈希值相同的传感器数据对应的发送端标识划入同一聚类。例如,参考前述表2,可根据预设的哈希函数分别计算发送端标识1、2、3….8、9…对应的传感器数据的哈希值,若计算得到的发送端标识1、3、6、8…对应的传感器数据的哈希值为hash1,计算得到的发送端标识2、4…对应的传感器数据的哈希值为hash2,计算得到的发送端标识5、7、9…对应的传感器数据的哈希值为hash3,则可得到表2所示的三个聚类:聚类1对应传感器数据的哈希值为hash1的发送端标识的集合1、3、6、8…,聚类2对应传感器数据的哈希值为hash1的发送端标识的集合2、4…,聚类3对应传感器数据的哈希值为hash1的发送端标识的集合5、7、9…。进一步的,可根据文档去重算法计算接收到的传感器数据的simhash值作为哈希值。文档去重算法即为simhash算法。请参考图2所示,在图2中,一个发射端标识对应的上报数据中的传感器数据包括多个分量,每个分量可以是一种传感器的采集数值(瞬时读数或前述的预设时长的积分值均可),也可以是将较长的传感器数据截取为多个数据段,每个数据段作为一个分量。在此算法中,每个分量还对应有相应的权重系数w,可先将每个分量的采集数值转换成二进制码,然后将每一位设置为权重w,然后再将所有分量在各个位上的权重相加,然后将每一位上得到的权重和与0比较,若大于0则最终的simhash值在此位上值为1,小于或等于0则最终的simhash值在此位上值为0。通过此方式,可计算具有多个分量的传感器数据之间的相似度,相似度较高的传感器数据的simhash值相等或者接近。在本实施例中,可使用simhash值相等的多个传感器数据对应的发送端标识归为一个聚类。在此实施例中,由于使用了相似度计算较准确的simhash算法,使得对传感器数据的聚类更加准确,从而使得识别终端的准确度提高。在本实施例中,在通过哈希函数进行聚类之后,还可获取哈希值相同的传感器数据的哈希值,以及所述哈希值相同的传感器数据对应的发送端标识的集合;对应存储所述哈希值与所述发送端标识的集合,所述集合为根据哈希值相同的传感器数据得到的聚类,所述哈希值为所述聚类的聚类标识。如表3所示:表3聚类标识发送端标识的集合hash11、3、6、8…hash22、4…hash35、7、9…统计服务器可以此对应关系存储聚类以及聚类包含的发送端标识的集合,hash1即对应发送端标识的集合1、3、6、8…,hash1即对应发送端标识的集合2、4…,hash3即对应发送端标识的集合5、7、9…。在后续再次接收到上报数据时,例如,在统计服务器存储了如表3所示的数据映射结构的聚类信息之后,若目标发送端标识对应的终端上传了上报数据,则统计服务器可接收携带目标发送端标识的上报数据,提取所述上报数据携带的与所述目标发送端标识对应的传感器数据;根据预设的哈希函数计算所述目标发送端标识对应的传感器数据的目标哈希值;查找已存储的与所述目标哈希值匹配的聚类标识,在查找到时,获取所述聚类标识对应的发送端标识的集合,将所述目标发送端标识添加到所述发送端标识的集合中。即若目标发送端标识为15,统计服务器提取相应的上报数据中的传感器数据,并计算其对应的哈希值,若计算得到哈希值为hash1,则通过查询表3所示的已存储的聚类信息的数据结构,即可得到目标发送端标识15对应的实体终端设备与发送端标识为1、3、6或8对应的实体终端设备为同一设备,此上报数据为伪造的刷量数据。而若统计服务器通过查询表3所示的已存储的聚类信息的数据结构,未找到相应的哈希值,则判定目标发送端标识15对应的实体终端设备为不同的实体终端设备,也可添加到表3所示的已存储的聚类信息中。统计服务器后续通过统计哈希值的数量,即可得到真实的上传上报数据的实体终端设备的数量,从而使得统计的流量更加准确。此外,为解决传统技术中通过imei码或mac地址区分实体终端设备方式带来的流量统计准确性不足的技术问题,在一个实施例中,如图3所示,特提出了一种终端的标识信息的判定装置,该装置包括上报数据发送端标识获取模块102、传感器数据提取模块104、聚类模块106以及终端设备判定模块108,其中:上报数据发送端标识获取模块102,用于接收上传的上报数据,获取所述上报数据对应的发送端标识;传感器数据提取模块104,用于提取所述上报数据携带的与所述发送端标识对应的传感器数据;聚类模块106,用于根据接收到的传感器数据对与所述传感器数据对应的发送端标识进行聚类,得到的每个聚类包含至少一个发送端标识;终端设备判定模块108,用于判定同一聚类下包含的发送端标识均对应同一终端设备。可选的,在一个实施例中,上述聚类模块106还用于根据预设的哈希函数计算所述接收到的传感器数据的哈希值;将哈希值相同的传感器数据对应的发送端标识划入同一聚类。可选的,在一个实施例中,上述聚类模块106还用于根据文档去重算法计算所述接收到的传感器数据的simhash值作为哈希值。可选的,在一个实施例中,上述聚类模块106还用于获取哈希值相同的传感器数据的哈希值,以及所述哈希值相同的传感器数据对应的发送端标识的集合;对应存储所述哈希值与所述发送端标识的集合,所述集合为根据哈希值相同的传感器数据得到的聚类,所述哈希值为所述聚类的聚类标识。可选的,在一个实施例中,如图3所示,上述装置还包括发送端标识识别模块110,用于接收携带目标发送端标识的上报数据,提取所述上报数据携带的与所述目标发送端标识对应的传感器数据;根据预设的哈希函数计算所述目标发送端标识对应的传感器数据的目标哈希值;查找已存储的与所述目标哈希值匹配的聚类标识,在查找到时,获取所述聚类标识对应的发送端标识的集合,将所述目标发送端标识添加到所述发送端标识的集合中。可选的,在一个实施例中,上述传感器组件包括加速度传感器、陀螺仪传感器、重力传感器、线性加速度传感器和旋转矢量传感器中的至少一种。可选的,在一个实施例中,上述传感器数据为上传所述上报数据的终端上的传感器组件的采集数值在预设时间长度内的积分值。可选的,在一个实施例中,上述传感器组件包括地理位置传感器、高度传感器和时钟中的至少一种。实施本发明实施例,将具有如下有益效果:采用了上述终端的标识信息的判定方法和装置之后,统计服务器不再依赖于终端上传的上报数据中携带的终端的imei码或mac地址等物理标识来对终端进行区分,而可通过终端实时采集的传感器数据来对实体终端设备进行甄别。由于真实环境下,用户实际操作的不同的终端对应的操作环境、地理位置环境、时间、终端的摆放或握持环境不同,因此不同的终端通常实时采集的传感器数据不同,相同终端实时采集的传感器数据相同,因此统计服务器根据传感器数据对发送端标识进行聚类之后,可判定每一个聚类下的发送端标识对应同一实体终端设备,而在进行流量统计时,通过统计聚类的数量即可得到真实的流量数据,从而使得流量统计的数据更加准确。在一个实施例中,如图4所示,图4展示了一种运行上述终端的标识信息的判定方法的基于冯诺依曼体系的计算机系统。具体的,可包括通过系统总线连接的外部输入接口1001、处理器1002、存储器1003和输出接口1004。其中,外部输入接口1001可选的可至少包括网络接口10012和陀螺仪传感器10014。存储器1003可包括外存储器10032(例如硬盘、光盘或软盘等)和内存储器10034。输出接口1004可至少包括显示屏10042等设备。在本实施例中,本方法的运行基于计算机程序,该计算机程序的程序文件存储于前述基于冯诺依曼体系的计算机系统10的外存储器10032中,在运行时被加载到内存储器10034中,然后被编译为机器码之后传递至处理器1002中执行,从而使得基于冯诺依曼体系的计算机系统10中形成逻辑上的上报数据发送端标识获取模块102、传感器数据提取模块104、聚类模块106、终端设备判定模块108以及发送端标识识别模块110。且在上述终端的标识信息的判定方法执行过程中,输入的参数均通过外部输入接口1001接收,并传递至存储器1003中缓存,然后输入到处理器1002中进行处理,处理的结果数据或缓存于存储器1003中进行后续地处理,或被传递至输出接口1004进行输出。以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1