一种网络用户身份认证方法及系统的制作方法

文档序号:9581746阅读:548来源:国知局
一种网络用户身份认证方法及系统的制作方法
【技术领域】
[0001] 本发明设及一种网络安全技术,特别是设及一种网络用户身份认证方法及系统。
【背景技术】
[0002] 随着信息技术及互联网技术的发展,我国的上网人员的规模不断扩大,网上购物 和交易也越来越频繁,上网已成为了许多人生活中不可缺少的一部分,与此同时,网购交易 中的欺诈犯罪近年来也在急剧上升,人工骗术和技术手段相结合的新型网络欺诈已成为网 民线上生活的首要安全威胁。对网络用户进行身份认证是提供网络交易中的安全性的重要 方法。关于用户身份认证方面,可分为一次性认证和可持续认证两类。关于一次性认证,目 前主要有传统的基于口令的认证、基于智能卡的认证、基于用户的生物特征和行为特征的 认证等。但一次性验证只在某一时刻进行认证,认证通过则判断该用户身份合法,不能很好 地为用户提供安全保障,因而进一步提出了可持续性认证。目前关于可持续认证的研究相 对较少,现有的可持续认证主要从用户网址序列或者用户浏览内容之间的联系进行研究。 对用户浏览行为考虑的不够全面,认证效果有待提高。
[0003] 鉴于此,如何找到进一步提高网络用户身份认证安全性的技术方案就成了本领域 技术人员亟待解决的问题。

【发明内容】

[0004] 鉴于W上所述现有技术的缺点,本发明的目的在于提供一种网络用户身份认证方 法及系统,用于解决现有技术中网络用户身份认证安全性有待进一步提高的问题。
[0005] 为实现上述目的及其他相关目的,本发明提供一种网络用户身份认证方法,所述 网络用户身份认证方法包括:采集合法用户在设定时间段内的所有网页浏览记录,所述浏 览记录包括浏览网页网址、文本内容、时间戳;从所述浏览网页网址中抽取出网址顶级域 名,从所述文本内容抽取出关键字进而确定所述文本内容所属的内容类,将每一条所述浏 览记录处理成 < 网址顶级域名,内容类,时间戳〉的形式,将在所述设定时间段内得到的所 有所述浏览记录作为一个会话;获取所述合法用户的m个会话,针对每一个会话,作如下处 理:根据所述会话中的所有浏览记录,统计出用户最频繁访问的多个网址顶级域名,并利用 设定的第一算法挖掘出所述浏览记录中网址顶级域名与内容类之间的关系,利用设定的第 二算法挖掘出所述浏览记录中内容类与时间段之间的关系,进而得到所述用户浏览网页的 n个特征值;根据设定的第=算法对所获取的特征值进行处理,得到与所述特征值相对应 的权值矩阵;根据所述特征值W及相对应的权值矩阵计算得到所述会话的分数;根据所述 m个会话的分数,采用第四算法计算得到所述合法用户的分类阔值。
[0006] 可选地,所述网络用户身份认证方法还包括:获取一个新的会话,并计算出所述新 会话的分数;当所述分数落入所述分类阔值的范围时,判定当前用户是所述合法用户;当 所述分数不落入所述分类阔值的范围时,判定当前用户不是所述合法用户。
[0007] 可选地,所述特征值包括:会话包含的元素个数;会话包含的频繁访问网站个数; 会话所匹配的频繁项集个数;会话匹配的频繁项集中包含的频繁访问网站个数;会话所匹 配的最长频繁项集长度;会话所匹配的频繁项集均长度;会话所匹配的频繁项集的最大支 持度;会话所匹配的频繁项集的平均支持度;会话所匹配的频繁时间段个数;目标列。
[0008] 可选地,所述第一算法包括Apriori算法。
[0009] 可选地,所述第二算法包括:最大似然估计的方法从所述会话的浏览记录中计算 出用户对每个内容类的浏览时间所服从的正态分布的参数值。
[0010] 可选地,所述参数值包括
其中,timei为用户在 浏览内容类contenti时的相对时间。
[0011] 可选地,所述第S算法包括:LR逻辑回归算法。
[0012] 可选地,所述第四算法包括: 1则所 ,' 述分类阔值为
其中,score^.$i为第i个会话的分数,共m个会话。
[0013] 可选地,所述设定时间段包括30分钟。
[0014] 本发明提供还一种网络用户身份认证系统,所述网络用户身份认证系统包括:用 户会话获取模块,用于采集合法用户在设定时间段内的所有网页浏览记录,所述浏览记录 包括浏览网页网址、文本内容、时间戳;从所述浏览网页网址中抽取出网址顶级域名,从所 述文本内容抽取出关键字进而确定所述文本内容所属的内容类,将每一条所述浏览记录处 理成 < 网址顶级域名,内容类,时间戳〉的形式,将在所述设定时间段内得到的所有所述浏 览记录作为一个会话;会话分数计算模块,用于针对一个会话,根据所述会话中的所有浏览 记录,统计出用户最频繁访问的多个网址顶级域名,并利用设定的第一算法挖掘出所述浏 览记录中网址顶级域名与内容类之间的关系,利用设定的第二算法挖掘出所述浏览记录中 内容类与时间段之间的关系,进而得到所述用户浏览网页的n个特征值;根据设定的第= 算法对所获取的特征值进行处理,得到与所述特征值相对应的权值矩阵;根据所述特征值 W及相对应的权值矩阵计算得到所述会话的分数;分类阔值确定模块,用于获取合法用户 的多个会话分数,采用第四算法计算得到所述合法用户的分类阔值。
[0015] 可选地,所述网络用户身份认证系统还包括用户合法判断模块,用于获取一个新 的会话,并计算出所述新会话的分数;当所述分数落入所述分类阔值的范围时,判定当前用 户是所述合法用户;当所述分数不落入所述分类阔值的范围时,判定当前用户不是所述合 法用户。
[0016] 可选地,所述特征值包括:会话包含的元素个数;会话包含的频繁访问网站个数; 会话所匹配的频繁项集个数;会话匹配的频繁项集中包含的频繁访问网站个数;会话所匹 配的最长频繁项集长度;会话所匹配的频繁项集均长度;会话所匹配的频繁项集的最大支 持度;会话所匹配的频繁项集的平均支持度;会话所匹配的频繁时间段个数;目标列。
[0017] 可选地,所述第一算法包括Apriori算法。
[0018] 可选地,所述第二算法包括:最大似然估计的方法从所述会话的浏览记录中计算 出用户对每个内容类的浏览时间所服从的正态分布的参数值。
[0019] 可选地,所述参数值包括
其中,timei为用户在 浏览内容类contenti时的相对时间。
[0020] 可选地,所述第立算法包括:LR逻辑回归算法。
[0021] 可选地,所述第四算法包括
则所 述分类阔值为[."'。"一^',1];其中,3。0'6合法;为第;[个会话的分数,共1]1个会话。
[0022] 可选地,所述设定时间段包括30分钟。
[0023] 如上所述,本发明的一种网络用户身份认证方法及系统,具有W下有益效果:1) 将用户所浏览的(网址,内容),W及(内容,时间)两个因素进行序列的挖掘,而不是单纯 只考虑其中某个因素,从而使得本发明的认证方法符合用户的浏览习惯。2)利用关联规则, 将(网址,内容)联合进行用户浏览习惯的挖掘;基于正态分布,用W发现用户对各个内容 的频繁访问时间段。3)在用户浏览网页的过程中达到了持续性的认证的效果。
【附图说明】
[0024] 图1显示为本发明的一种网络用户身份
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1