基于相机指纹特征的社交网络用户的识别方法和系统的制作方法

文档序号:9547825阅读:880来源:国知局
基于相机指纹特征的社交网络用户的识别方法和系统的制作方法
【技术领域】
[0001]本发明涉及网络识别领域。尤其涉及一种基于相机指纹特征的社交网络用户的识别方法和系统。
【背景技术】
[0002]随着互联网技术和电子技术的发展,社交媒体已经成为了当今社会主要的社交方式,人们通过各种社交媒体平台来分享各种形式的信息。然而由于各种原因,同一个人往往会拥有多个在线社交账户,而这些账户分布在一个或数个社交网站之上。从一方面来说,这种现象极大的丰富了互联网的多媒体信息资源,但是从另一方面来说,这种现象也产生大量的冗余信息。虽然这种冗余对互联网的发展造成了诸多不便,但是也为数据的统一提供了可能。通常来说,属于同一个自然人的多个网络账户应当具有一些相似的行为模式,例如人们会更倾向于浏览、发布自己所感兴趣的内容,或是通过一些网站所提供的定位服务来体现相近的地理位置信息,又或是具有相近的人际关系网络等;而这些行为模式可以用来判断两个账户是否属于相同的人,进而将网络用户与真实世界的人所联系起来。
[0003]从信息安全的角度来说,网络中多媒体信息鱼龙混杂,难免存在一些诸如暴力、恐怖、犯罪等违法的多媒体信息,而发布该类信息的网络用户会可以掩盖自己的个人资料,从而导致难以追踪用户的实际拥有者。如果能根据发布该类信息的账号的行为模式寻找到属于发布人的多个网络账户,并将多个账户的信息进行融合,就可以得到较为完整的发布人信息,从而将网络账户与实际个体联系起来,进而追踪到发布该类信息的实际拥有者。
[0004]从网络服务的角度来说,对于属于同一个个体的多个账户,网络服务提供商可以融合多个账户的信息从而得到账户拥有者更为全面的信息,进而对用户提供更为便捷的、定制化的网络服务,如按兴趣点推送相关信息、避免广告的重复推送等。
[0005]无论是从信息安全的角度还是网络服务的角度,其核心问题是如何从单个用户的碎片信息中得到有效的模式,从而精确的找出属于同一个个体的所有用户。由于单个用户所表现出的模式是碎片化的,那么如何找到一种在所有用户中都能得到体现的模式特征则是用户识别问题面临的主要挑战。
[0006]最近几年,用户识别问题吸引了众多研究机构的目光,并且产生了大量的研究成果Ο
[0007]—般来说,目前典型的用户识别的方法有以下几种,首先是基于用户资料的用户识别。用户的基本资料指的是可以直接获取的用户数据,包括用户名、注册邮箱、个人资料、IP地址、地理信息等。在很多情况下,人们更倾向于使用相同的用户名、邮箱等资料注册新的网络用户,同时,属于同一个个体的多个网络用户应当具有相对固定的IP地址、地理坐标等模式特征,那么如果用户间存在相同的基本资料,进而可以判断这些用户属于同一个个体。该类方法具有较高的计算效率,但是其中一个明显不足就是该类特征较为容易被篡改,特别是在互联网迅猛发展的今天,人们可以轻易的申请一个新的邮箱,或是改变IP地址和地理信息。如果人们出于各种原因而没有使用相同的模式来注册新的网络用户,那么该类方法就会产生较大的误差甚至失效。
[0008]另一种用户识别方法是基于用户文本的模式特征。在在线的社交网络中,人们通过博文、微博等文本形式来实现与他人的互动,而在用户所发布的内容中隐含了大量的个人习惯。比如,每个人都具有特定的用词习惯,或语气风格等。一种典型的方法就是对用户文本的用词、语序等特征进行分析,从而得到一种表示文本风格的模式特征,进而通过比较该特征来判断用户是否属于同一个个体。显然,大多数的用户在创作文本内容时会不自觉的使用较为习惯的语言表述方式,但对于一些刻意改变文本创作习惯的恶意用户来说,该类方法有很大的可能失效。此外,提取用户文本的特征模式往往需要大量的文本数据进行训练,而如今的新兴媒体如微博、Twitter等消息类社交网络平台也很难能提供足够的训练样本。
[0009]—种可能的解决方法是利用相机指纹来实现多个用户的识别。相机指纹,也被称为PRNU (光响应非一致噪声,Photo-Respond Non-Uniformity noise),主要由数码图像米集设备的感光敏感性的差异造成,是一种与相机唯一对应的数字特征。数码相机的感光部件是由数个硅晶片组成的阵列,每个硅晶片根据接受到的光子数量产生相应的电压,并经过A/D转换得到对应位置的像素值。然而每一个硅晶片的感光敏感性略有不同,那么由感光阵列得到的图像也与真实的场景存在微小的误差,而该误差即被称为PRNU。显然,图像的PRNU特征与相机唯一对应,即不同相机拍摄的图像具有不同的PRNU,因此也成PRNU为相机指纹。在用户识别时,如果能从用户图像中提取出相机指纹并进行特征匹配,那么具有相同相机指纹特征的用户则意味着共享同一部相机,即这些用户有很高的概率属于同一个个体,进而实现用户识别。相比之前的用户特征,相机指纹特征的一个巨大优势就在于其难以篡改和不可复制的特性,如果一个个体在不同的用户中使用相同相机拍摄的图像,那么无论其如何伪装,总能通过相机指纹找寻到相关用户,进而实现可靠性更高的用户识别。
[0010]然而,传统的相机指纹识别方法多用于法庭举证、图像来源鉴别等方面,即检测待识别图像是否由目标相机拍摄。主要步骤如下:
[0011 ] 由目标相机拍摄数张图像,并提取其PRNU特征,通过最大似然估计得到目标相机的相机指纹。
[0012]提取待识别图像的噪声残差,并计算目标相机的相机指纹与该残差的相关度,并根据相关系数来判断待识别图像是否由目标相机拍摄得到。
[0013]显然,这种方法并不完全适用于用户识别。首先,用户识别问题并非是判断一张图像是否由目标相机拍摄,而是判断一个用户的数张图像与另一个用户的数张图像是否由同一部相机拍摄;其次,由于用户能够提供的图像都是来源未知的,且大多数用户的图像由多部相机拍摄得到,那么上述的方法就难以有效估计图像的相机指纹。
[0014]因此,需要找到一种方法来解决这些问题。

【发明内容】

[0015]本发明的实施例提供了一种基于相机指纹特征的社交网络用户的识别方法和系统,能够对网络用户进行识别。
[0016]—种基于相机指纹特征的社交网络用户的识别方法,包括:
[0017]获取至少两个网络用户的原始图像;
[0018]提取各个所述网络用户的原始图像的噪声模式;
[0019]按照所述噪声模式相互的相关度大小,对各个所述网络用户的原始图像进行聚类;
[0020]根据所述网络用户的聚类后的各类原始图像的噪声模式,估计得到所述各类原始图像的相机指纹,并组合作为所述网络用户的相机指纹组;
[0021]根据两个所述网络用户的相机指纹组,计算两个所述网络用户之间的用户相关度;
[0022]当两个所述网络用户之间的用户相关度大于第一阈值时,则确定为所述两个网络用户共享至少一个相机。
[0023]根据两个所述网络用户的相机指纹组,计算两个所述网络用户之间的用户相关度的步骤包括:
[0024]根据两个所述网络用户的相机指纹组的峰值能量相关度,计算两个所述网络用户的相机指纹之间的相关系数;
[0025]选择数值最大的所述相关系数,作为两个所述网络用户之间的用户相关度。
[0026]所述根据两个所述网络用户的相机指纹组,计算两个所述网络用户的相机指纹特征之间的相关系数的步骤包括:
[0027]根据两个所述网络用户的相机指纹组的峰值能量相关度,计算两个所述网络用户的相机指纹特征之间的相关系数;或者
[0028]根据两个所述网络用户的相机指纹组的相关性,计算两个所述网络用户的相机指纹特征之间的相关系数。
[0029]所述提取各个所述网络用户的原始图像的噪声模式的步骤包括:
[0030]步骤A1,对所述网络用户的原始图像进行去噪处理,得到无噪图像;
[0031]步骤A2,将所述无噪图像与所述原始图像做差,得到所述原始图像的噪声残差,将所述原始图像的噪声残差作为所述原始图像的噪声模式。
[0032]所述提取各个所述网络用户的原始图像的噪声模式的步骤包括:
[0033]步骤A0,将所述网络用户的原始图像处理成为相同大小;
[0034]步骤A1,对处理成相同大小的图像进行去噪处理,得到无噪图像;
[0035]步骤A2,将所述无噪图像与处理后的相同大小的所述图像做差,得到所述原始图像的噪声残差,将所述原始图像的噪声残差作为所述原始图像的噪声模式。
[0036]所述按照所述噪声模式相互的相关度大小,对各个所述网络用户的原始图像进行聚类的步骤包括:
[0037]步骤一,获取所述网络用户的所有原始图像,作为当前原始图像组;
[0038]步骤二,计算所述当前原始图像组中的所有原始图像间的噪声模式的两两相关度;
[0039]步骤三,选择出相关度最大的一对原始图像,将选择出的所述一对图像划分到当前类;根据所述当前类中的所有原始图像,估计所述当前类的相机指纹特征;
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1