一种行为指纹数字特征提取方法、系统、介质和设备

文档序号:33776235发布日期:2023-04-18 23:08阅读:34来源:国知局
一种行为指纹数字特征提取方法、系统、介质和设备

本发明涉及用户识别,具体涉及一种行为指纹数字特征提取方法、系统、介质和设备。


背景技术:

1、目前,随着人类生活与各类科技产品的绑定越来越深,安全问题也成为当前迫切需要解决的问题,其中一个重要的领域是身份识别技术。目前常见身份识别技术主要是基于生物的生理特征,包括指纹、人脸以及声纹等,这类认证方式通常是在程序运行的某一个时间点进行认证,并且需要生物主动参与,同时,随着对抗网络技术的不断发展,一次性的认证方式也面临了更大的挑战,而基于用户行为指纹的认证方式,如用户的网络电视观看行为、键盘敲击行为、网页浏览行为等,一方面不需要用户主动参与,由系统隐式的获取用户的行为;另一方面可以持续的进行身份认证,可以作为现有身份识别技术的补充,以增强系统的安全性。

2、当前,基础的基于用户行为指纹的进行身份识别的方案为统计用户行为指纹中各个行为所发生的频率构成用户的数字特征向量,通过计算已知用户和未知用户之间数字特征向量的相似性来判断用户的身份,但是行为指纹往往比较稀疏,有研究者通过将连续的几个行为进行拼接构成一个新的行为来达到增强识别准确率的效果,但是该方案会显著增加所使用的空间以及时间,极大的浪费了计算资源,另外,现有的身份识别方案还存在识别准确率低的情况。


技术实现思路

1、为了克服现有技术存在的缺陷与不足,本发明提供一种行为指纹数字特征提取方法,在取得更好的身份识别效果的同时显著的降低了所提取的数字特征的种类,从而大幅度降低了识别所需要时间,并基于相似性距离计算提高身份识别时的准确率。

2、本发明的第二目的在于提供一种行为指纹数字特征提取系统;

3、本发明的第三目的在于提供一种计算机可读存储介质;

4、本发明的第四目的在于提供一种计算设备。

5、为了达到上述目的,本发明采用以下技术方案:

6、本发明提供一种行为指纹数字特征提取方法,包括下述步骤:

7、获取用户的行为指纹序列并提取用户的数字特征信息,为待匹配用户集和已知用户集分别构建数字特征向量矩阵,对于所获取到用户的行为指纹序列,提取出该用户的特征向量集;

8、基于相似性距离公式计算已知用户数字特征向量和待匹配用户数字特征向量之间的相似性距离;

9、根据预设的匹配策略判断用户的身份。

10、作为优选的技术方案,所述用户的行为指纹序列来源于各类系统的日志记录,抽取部分日志记录构成数据及,选取一个时间点,根据所述时间点将数据集切割为待匹配用户集和已知用户集。

11、作为优选的技术方案,所述获取用户的行为指纹序列并提取用户的数字特征信息,具体步骤包括:

12、对于所获取到用户u的行为指纹序列su,提取出该用户的n阶特征向量集

13、对所有用户的n阶特征向量集取并集并统计并集中每个数字特征向量出现的频率,用于生成元组*元组中的每个元素都由一个数字特征向量和其在元组中出现的频率构成;

14、根据元组*中每个数字特征向量的频率进行从大到小排序,构成排序后的元组,记为*

15、从排序后的元组*中提取设定的比例的特征组成元组

16、将所有用户n阶特征向量集进行融合,得到包括所有用户及其数字特征向量的行为频率矩阵。

17、作为优选的技术方案,基于fag方法提取出该用户的n阶特征向量集具体步骤包括:

18、创建时间滑动窗口sn,在用户u的行为指纹序列su上进行滑动,得到行为状态;

19、构建有向图其中,表示滑动窗口sn在用户u的行为指纹序列su上的第i次滑动时窗口内所包含的顶点集,e为有向图的边集;

20、提取有向图中的二维数字特征向量;

21、滑动窗口sn在长度为lu的行为指纹序列su上滑动,产生m个图,组成用户u的第n阶特征图集

22、获取用户u从第1阶到第n阶的特征向量构成其的n阶特征向量集具体表示为:

23、

24、其中m=l-n+1。

25、作为优选的技术方案,基于相似性距离公式计算已知用户数字特征向量和待匹配用户数字特征向量之间的相似性距离,具体包括:

26、相似性距离公式具体表示为:

27、

28、

29、

30、

31、

32、

33、其中,ux表示待匹配用户,uy表示已知用户,表示已知用户的特征向量矩阵,表示未知用户的行为概率向量,表示所有已知用户的行为概率矩阵,d(·||·)表示两个向量特征向量之间kl散度。

34、作为优选的技术方案,匹配策略包括最大相似性匹配策略和二部图匹配策略。

35、作为优选的技术方案,最大相似性匹配策略具体表示为:

36、

37、其中,表示预测的用户身份,如果则表明预测的用户身份与其实际身份相同,预测结果正确,wij表示两个用户特征向量之间的相似性距离,uy表示已知用户集;

38、二部图匹配策略具体表示为:

39、

40、设定条件为:

41、其中,ux是未知用户集,e表示二部图匹配的边,表示所预测的未知用户集中用户的身份。

42、为了达到上述第二目的,本发明采用以下技术方案:

43、一种行为指纹数字特征提取系统,包括:行为指纹序列获取模块、数字特征信息提取模块、相似性距离计算模块和用户判断模块;

44、所述行为指纹序列获取模块用于获取用户的行为指纹序列;

45、所述数字特征信息提取模块用于提取用户的数字特征信息,为待匹配用户集和已知用户集分别构建数字特征向量矩阵,对于所获取到用户的行为指纹序列,提取出该用户的特征向量集;

46、所述相似性距离计算模块用于基于相似性距离公式计算已知用户数字特征向量和待匹配用户数字特征向量之间的相似性距离;

47、所述用户判断模块用于根据预设的匹配策略判断用户的身份。

48、为了达到上述第三目的,本发明采用以下技术方案:

49、一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,所述程序被执行时实现如上述行为指纹数字特征提取方法。

50、为了达到上述第四目的,本发明采用以下技术方案:

51、一种计算设备,包括处理器和用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现上述行为指纹数字特征提取方法。

52、本发明与现有技术相比,具有如下优点和有益效果:

53、(1)本发明通过引入n阶特征向量的方式,拓展了用户的行为指纹,在一定程度解决了用户行为指纹稀疏性的问题,达到了提升识别准确率的效果。

54、(2)本发明将一维的行为指纹映射到多个二维图形中,可以更好地提取用户行为指纹中的数字特征,从而提升用户身份识别的准确率。

55、(3)本发明将高维特征转化为多个二维特征,使得所提取到的用户所有特征的种类都保持在二维上,以显著的降低所获取到数字特征的种类,从而降低所构建的数字特征向量矩阵的大小,从而缩短识别用户身份所需要的时间,解决高维特征种类爆炸的问题,显著降低识别时间。

56、(4)本发明通过改进现有的jaccard距离和jaccard containment距离,并结合kl距离,解决了现有相似性距离识别准确率不高的问题,达到了提升了识别准确率的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1