基于相似度的智能终端身份认证方法与流程

文档序号:11287092阅读:280来源:国知局

本发明属于身份认证技术领域,涉及一种智能终端身份认证方法,具体涉及一种基于相似度的智能终端身份认证方法,可用于智能手机、平板等用户身份认证。



背景技术:

身份认证是计算机系统的用户在进入系统或访问不同保护级别的系统资源时,系统确认访问者身份的过程。身份认证的思路主要是:若当前计算机系统的访问者所提供的身份认证信息与已经存在的合法用户的身份认证信息匹配,则认为当前访问者是合法的,允许其访问操作,否则拒绝其访问操作。身份认证的目的在于控制系统对用户的授权或者限制用户的某种权利,它是保证系统安全的第一道防线。

智能终端作为计算机系统的一种,已成为人们日常生活中必不可少的工具之一,其上所存储的个人隐私信息及敏感数据越来越多,因此安全问题也越来越受关注。为提高智能终端的安全性,现有智能终端身份认证方法中主要出现了两大类:显式认证和隐式认证。

显式认证通过匹配用户显式输入的认证信息与已经存在的认证信息,对用户进行认证,实现用户访问控制的目的。其是较为传统的认证方法,主要包括pin码认证、口令密码认证、手势图案认证等。这些方法由于简单、易用等特点被广泛用于智能终端的身份认证中,但却存在一定的安全缺陷:一些用户为使用方便设置较简单的密码,使得用户密码极易被恶意用户破解;在公共场合利用显式认证方法对智能终端认证时,很容易受到肩窥,导致密码泄露;2010年usenix安全座谈会中文章“smudgeattacksonsmartphonetouchscreens”指出用户手指划过屏幕进行认证时手指残留物会附着在触摸屏上很长时间,敌手只要简单分析工具即可得到密码,从而密码泄露,导致安全性降低。

隐式认证通过对比观察到的用户行为特征与已经存在的行为特征,来做出认证决定,主要利用用户使用智能终端过程中的行为特征来对用户身份进行认证。所用的行为特征主要有用户触屏特征、手势特征、击键特征等,具有唯一、随身、方便等特点。隐式认证方法的提出有效改善了显式认证的上述缺陷,是目前的研究热点,但其还处于发展阶段,仍存在一些缺陷。例如授权公告号为cn104134028b,名称为“基于手势特征的身份认证方法及系统”的发明专利,公开了一种应用于触摸屏设备的基于手势特征的身份认证方法,其通过将用户在触摸屏上的输入当前手势与多个预先录入手势粗略对比,从而得到粗略相似度;若达到,则计算当前输入手势每个时间片的加速度、角度、距离,并逐一判断是否分别在对应时间片的预先录入手势的加速度、角度、距离的上限和下限范围内,并根据判断结果计算最终相似度;若最终相似度达到第二预设阈值,则判定为身份认证成功。该发明根据用户输入手势的稳定性的不同,给出不同的密码保密等级,但其只是根据手势的上下限范围来判断当前输入手势与预先录入手势的相似度,认证准确度不高,无法保证安全性。



技术实现要素:

本发明的目的在于克服上述现有隐式认证技术中存在的缺陷,提出了一种基于相似度的智能终端身份认证方法,用于解决现有隐式认证方法中存在的认证准确度较低的技术问题。

为实现上述目的,本发明采取的技术方案包括训练阶段和认证阶段,实现步骤为:

训练阶段:

(1)智能终端获取用户的训练数据集:

(1a)用户预设认证口令,输入智能终端;

(1b)智能终端记录用户多次输入认证口令过程中的行为特征序列,形成用户的训练数据集;

(2)智能终端对训练数据集进行预处理,得到训练向量集合:

(2a)智能终端对训练数据集中各行为特征序列分别进行归一化:智能终端对训练数据集中各行为特征序列的每个特征值进行归一化,得到多个归一化行为特征序列;

(2b)智能终端对多个归一化行为特征序列分别进行特征重构:

(2b1)智能终端将区间[0,1]划分为n个相等的区间,其中n≥2;

(2b2)智能终端分别计算多个归一化行为特征序列中各归一化行为特征序列在每个区间上特征值的分布概率值,每个归一化行为特征序列得到n个分布概率值,将各个归一化行为特征序列的n个分布概率值按区间划分顺序表示为向量,从而得到多个行为特征分布概率向量,组成训练向量集合;

(3)智能终端利用训练向量集合训练用户行为特征模型:

(3a)智能终端计算训练向量集合中所有行为特征分布概率向量两两之间的相似度,得到个相似度值,其中,r表示训练向量集合中行为特征分布概率向量的数量,其中r≥2,相似度计算公式为:

其中,而h(xi)为行为特征分布概率向量xi={pi1,pi2,...,pin}的信息熵函数,其公式为:

其中,n代表区间划分总数,pin代表行为特征分布概率向量xi在第n个区间的分布概率;

(3b)智能终端对个相似度值求平均值,得到用户行为特征模型;

(4)用户预设身份认证阈值;

认证阶段:

(5)智能终端获取用户当前输入的认证口令及输入过程中的行为特征序列;

(6)智能终端判断用户当前认证口令与预设认证口令是否完全匹配,若是,对当前行为特征序列进行预处理,得到当前行为特征分布概率向量,并执行步骤(7),否则执行步骤(5),对当前行为特征序列进行预处理,实现步骤为:

(6a)智能终端对当前行为特征序列进行归一化,得到当前归一化行为特征序列;

(6b)智能终端对当前归一化行为特征序列进行特征重构:智能终端将区间[0,1]划分为n个相等区间,计算当前归一化行为特征序列在每个区间上特征值的分布概率值,将分布概率值按区间划分顺序表示为向量,得到当前行为特征分布概率向量;

(7)智能终端获取当前平均相似度:

(7a)智能终端计算当前行为特征分布概率向量与训练向量集合中各行为特征分布概率向量间的相似度,得到r个当前相似度值;

(7b)智能终端对r个当前相似度值求平均值,得到当前平均相似度;

(8)智能终端获取认证结果:

智能终端判断当前平均相似度与用户行为特征模型的差值百分比是否小于等于预设身份认证阈值,若是,则身份认证成功,否则,身份认证失败。

本发明与现有技术相比,具有如下优点:

1、本发明由于基于特征的相似度训练用户行为特征模型并进行身份认证,所基于的相似度计算方法具有较好的稳定性,提高了身份认证准确度,同时,在认证口令完全匹配时,利用行为特征序列的相似度作为辅助认证因子进行隐式认证,实现了双重认证,与现有技术相比,有效地提高了身份认证的安全性。

2、本发明由于利用行为特征序列的相似度作为辅助认证因子,在记录用户的行为特征序列时,用户无需刻意配合,与现有技术相比,在保证认证安全性的前提下用户体验良好。

附图说明

图1是本发明的实现流程图。

具体实施方式

下面结合附图和具体实施例,对本发明作进一步的详细描述。

本实施例以在智能终端的典型代表智能手机上触屏输入认证口令进行身份认证为例:

参照图1,基于相似度的智能终端身份认证方法,包括训练阶段和认证阶段,实现步骤为:

训练阶段:

步骤1、智能手机获取用户的训练数据集:

步骤1a)用户预设认证口令,输入智能手机;

步骤1b)用户多次触屏输入认证口令收集训练数据集,由于训练数据集规模的大小会影响认证结果,规模过小,认证准确度不高,规模过大,则计算开销增加,且数据采集麻烦,故本实施例取训练数据集规模大小为5,即训练数据集含有5个行为特征序列,用户需5次触屏输入认证口令,若认证口令含有k个口令字符,则本实施例的一个行为特征序列由k-1个相邻口令字符间的间隔时间、k个口令字符所持续的时间、k-1个口令字符输入频率、k个口令字符触屏压力这些数值型行为特征组成,故每个行为特征序列有4k-2个特征值,格式为:(interval1,hold1,freq1,press1,interval2,hold2,freq2,press2,...,intervalk,holdk,freqk,pressk),智能手机记录用户5次触屏输入认证口令过程中的行为特征序列,形成用户的训练数据集;

步骤2、智能手机对训练数据集进行预处理,得到训练向量集合:

步骤2a)智能手机对步骤1b)中得到的训练数据集中的5个行为特征序列分别进行归一化,对于一个行为特征序列(interval1,hold1,freq1,press1,interval2,hold2,freq2,press2,...,intervalk,holdk,freqk,pressk),其归一化的实现方法为:求其4k-2个特征值中的最大值和最小值,利用最值归一化公式对的每个特征值进行归一化,按原顺序排列得到的序列即为一个归一化行为特征序列,同理,对训练数据集中其它4个行为特征序列采用相同的归一化的实现方法,共得到5个归一化行为特征序列;

步骤2b)智能手机对步骤2a)中获得的5个归一化行为特征序列分别进行特征重构:

步骤2b1)智能手机将区间[0,1]划分为n个相等的区间,这个区间数量n可以根据一个行为特征序列的特征值总数4k-2来确定,本实施例取n值为2k,且同一个用户在对多个归一化行为特征序列进行特征重构时,区间数量n相同;

步骤2b2)智能手机分别对5个归一化行为特征序列中各归一化行为特征序列统计其4k-2个特征值在各个区间上的分布数,由于区间数量为2k,所以各归一化行为特征序列可统计得到2k个分布数,对得到的分布数分别除以一个行为特征序列的特征值总个数4k-2,得到分布概率值prn,r=1,2,..,5,n=1,2,..,2k,prn表示行为特征序列xr在第n个区间的分布概率,将各个归一化行为特征序列的n个分布概率值prn,n=1,2,..,2k按区间划分顺序表示为向量xr={pr1,pr2,...,pr2k},即得到5个行为特征分布概率向量,组成训练向量集合p={x5},其中,5是训练向量集合中行为特征分布概率向量的数量;

步骤3、智能手机利用训练向量集合训练用户行为特征模型:

步骤3a)对于度个行为特征分布概率向量xr间的相似度值,其计算公式为:

其中,而h(xi)为行为特征分布概率向量xi={pi1,pi2,...,pin}的信息熵函数,其公式为:

进一步的,当i=2,且即只有两个行为特征分布概率向量,分别为x1={p11,p12,...,p1n},x2={p21,p22,...,p2n}时,上面公式可转化为:

其中,n代表区间划分的总数2k,p1n代表行为特征序列x1在第n个区间的分布概率,p2n代表行为特征序列x2在第n个区间的分布概率;

本实施例中,由于计算的是训练向量集合p={x5}中5个行为特征分布概率向量xr,r=1,2,..,5两两之间的相似度值,故采用公式djs(x1||x2)来计算,得到个相似度值;

步骤3b)智能手机对步骤3a)得到的个相似度值求平均值,即得到用户行为特征模型该模型为一个相似度平均值,是用户身份认证的依据;

步骤4、用户预设身份认证阈值σ,其大小可由用户自己设定;

认证阶段:

步骤5、智能手机获取用户当前输入的认证口令及输入过程中的行为特征序列,其中,当前行为特征序列的格式与步骤1中的格式是一致的,在此不再赘述;

步骤6、智能手机判断用户当前认证口令与预设认证口令是否完全匹配,若是,对当前行为特征序列进行预处理,得到当前行为特征分布概率向量,并执行步骤7,否则执行步骤5,对当前行为特征序列进行预处理,其实现步骤为:

步骤6a)智能手手机首先对当前行为特征序列进行归一化,具体为:求其4k-2个特征值中的最大值和最小值,利用最值归一化公式对的每个特征值进行归一化,按原来顺序排列得到的序列即为当前归一化行为特征序列;

步骤6b)智能手机对当前归一化行为特征序列进行特征重构:由于在训练阶段区间划分数量为2k,且同一个用户的区间数量n相同,所以在对当前归一化行为特征序列统计分布个数时,也将区间[0,1]划分为2k个相等区间,统计其4k-2个特征值在各个区间上的分布数,由于区间的数量为2k,所以可统计得到2k个分布数,对得到的2k个分布数分别除以一个行为特征序列的特征值总个数4k-2,得到2k个分布概率值pi,其中,i=1,2,..,2k,按区间划分顺序表示为向量,即得到当前行为特征分布概率向量c=(p1,p2,...,p2k);

步骤7、智能手机获取当前平均相似度:

步骤7a)智能手机计算当前行为特征分布概率向量c=(p1,p2,...,p2k)与训练向量集合p={x5}中各行为特征分布概率向量xr={pr1,pr2,...,pr2k},r=1,2,...,5间的相似度,其与步骤(3a)中计算训练向量集合中所有行为特征分布概率向量两两之间的相似度的计算公式相同,在此不再赘述,最后,得到5个当前相似度值;

步骤7b)智能手机对5个当前相似度值求平均值,得到当前平均相似度

步骤8、智能手机获取认证结果:

智能手机判断当前平均相似度与用户行为特征模型的差值百分比是否小于等于预设身份认证阈值,若是,则身份认证成功,否则,身份认证失败,具体地:若则身份认证成功;若则当前用户身份认证失败。

由于用户的行为特征会随时间不断变化,为适应不断改变的行为特征,进一步提高认证准确度,本实施例还可通过重训练用户行为特征模型对其进行更新,实现方法为:删除训练向量集合p={x5}中最早得到的行为特征分布概率向量x1,将当前行为特征分布概率向量c=(p1,p2,...,p2k),以保证训练向量集合中行为特征分布概率向量的最大数量为5;再次训练用户行为特征模型,其与步骤(3)的训练用户行为特征模型方法一致,在此不再赘述;

以上所述的具体实施例,对本发明进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例,并不用于限定本发明的保护范围,对于本领域的技术人员来说,可以根据以上的技术方案和构思,做出各种相应的改变和变形,而所有的这些改变和变形都应该包括在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1