基于鼠标行为的电子商务中用户异常行为应用系统及检测方法

文档序号:6526781阅读:194来源:国知局
基于鼠标行为的电子商务中用户异常行为应用系统及检测方法
【专利摘要】本发明涉及一种基于鼠标行为的电子商务中用户异常行为应用系统及检测方法,应用系统包括B2C电商网站、鼠标行为数据采集模块、检测模块、数据库。方法包括步骤一,正常用户模式提取;步骤二,匹配检测。本发明针对特殊应用环境,设计个性化的鼠标行为特征向量,增强身份认证可靠,保证电子商务的交易安全。
【专利说明】基于鼠标行为的电子商务中用户异常行为应用系统及检测方法
【技术领域】
[0001]本发明属于基于鼠标行为的身份认证辅助方法。
【背景技术】
[0002]随着社会的不断进步,互联网正以质的飞跃在发展,随之出现的通过网络进行商品和服务营销的电子商务已成为全球企业不可阻挡的趋势。从1997年至今,中国的电子商务蓬勃成长,从最初的阿里巴巴集团等几家网站竞争,已发展到了如今百家争鸣的状态,吸引越来越多的人通过网络交易和网上支付开展商务活动。 [0003]安全性是电子商务中一个至关重要的核心问题,它要求网络能提供一种端到端的安全解决方案。针对网站钓鱼,也出现了不同的防治技术手段,如邮件过滤(微软推出的IE7),电子邮件认证(微软推出的Sender ID Framework, Yahoo使用的DK计划),StandfordUniversity提出两种基于浏览器客户端的防范方法PwdHash和SpoofGuard,以及SSL数字证书等技术。这些手段的技术重点都定位在防范上面,目的在于预防用户遭到钓鱼攻击。为了保护受到钓鱼攻击的用户的权益,解决用户的身份验证问题也是必要的,从而在技术层面上保证参与网络交易的用户是“可信用户”。
[0004]本专利面向的情况是目前在网络交易中普遍采用数字证书的方法进行身份验证,这种机制最大的弊端就是口令等信息容易泄露,存在着严重的安全隐患。当口令较简单时,通过基于字典的暴力破解就能够破获。同时由于网络钓鱼和正规网站的信息泄露,黑客可以获取用户的数字证书,进而假冒用户身份进行商务活动,因此采用数字证书方式并不能完美地解决用户身份可信的问题,存在一定的缺陷。

【发明内容】

[0005]本发明目的在于公开一种基于鼠标行为的电子商务中用户异常行为检测方法,针对特殊应用环境,设计个性化的鼠标行为特征向量,增强身份认证可靠,保证电子商务的交
易安全。
[0006]本发明给出的技术方案为:
一种基于鼠标行为的电子商务中用户异常行为检测的应用系统,其特征在于,
包括B2C电商网站,为用户提供购物环境;
包括鼠标行为数据采集模块,用于收集用户购物过程中操作鼠标产生的数据;所述鼠标行为数据采集模块内嵌在电子商务网站中,使用JavaScript脚本语言。鼠标单击时采集的数据项主要有:页面序号,X、Y轴坐标值,时间戳等。采集鼠标移动时的数据,需要预设一个采样率,采集数据包括页面序号,Χ、y轴坐标值,时间戳,移动速度,加速度,移动角度值等,其中后三项无法直接采集,需要通过对采集的原始数据经过一系列数学运算而得出。 [0007]包括检测模块,利用聚类等算法对训练期间采集到的鼠标数据进行正常行为模式的固化,对当前用户行为模式进行计算生成,最后进行匹配检测操作。[0008]包括数据库,用于存储数据采集模块在用户购物过程中操作鼠标产生的数据,同时将已备的正常行为模式提供给检测模块用于对与当前用户行为模式进行匹配检测。
[0009]一种基于鼠标行为的电子商务中用户异常行为检测方法,其特征在于,
步骤一,正常用户模式提取:对训练期间采集的正常鼠标行为数据进行预处理,利用基于欧氏距离的K-means聚类算法等方法,提取用户的正常行为模式。
[0010]步骤二,匹配检测:对当前用户鼠标数据进行相同处理,得到当前用户的鼠标行为模式,与正常模式进行匹配分析。
[0011]本发明属于基于鼠标行为的身份认证方法,是通过研究鼠标这种计算机输入设备的行为特征,来识别用户的身份。该认证方法可从人机交互和生理层面对用户的鼠标行为进行研究。
[0012]鼠标行为数据采集模块,通过实时采集用户在进行电子商务过程中操作鼠标设备运动所产生的数据,并通过一定步骤的数学计算提取并存储必要的数据信息。
[0013]用户鼠标行为检测系统由正常用户模式提取和当前用户行为匹配检测两个模块构成。正常用户模式提取模块,对训练期间采集的正常鼠标行为数据进行预处理,利用基于欧氏距离的K-means聚类算法等方法,提取用户的正常行为模式。当前用户行为匹配检测模块,对当前用户鼠标数据进行相同处理,得到当前用户的鼠标行为模式,与正常模式进行匹配分析, 从而判断用户行为异常与否。
[0014]本发明的创新点及有益效果:
1、将计算机系统中基于鼠标行为进行身份认证的思想,运用在电子商务的用户异常行为检测中,作为数字认证的辅助手段。
[0015]2、结合电子商务中用户购物的流程,提出一种借鉴自动机想法的检测模型。
[0016]3、针对特殊应用环境,设计个性化的鼠标行为特征向量。
【专利附图】

【附图说明】
[0017]下面结合附图和实施方式对本发明作进一步的详细说明:
图1为系统整体架构图;
图2为窗口坐标系;
图3为检测模型;
图4为特征向量的提取流程图;
图5为匹配检测流程图。
【具体实施方式】
[0018]如图1、2所示:B2C电商网站用于模拟用户购物环境,鼠标行为数据采集模块收集和存储用户购物过程中操作鼠标产生的数据,检测模块则利用聚类等算法对训练期间采集到的鼠标数据进行正常行为模式的固化,对当前用户行为模式进行计算生成,最后进行匹配检测操作。
[0019]鼠标行为数据采集模块内嵌在电子商务网站中,使用JavaScript脚本语言。鼠标单击时采集的数据项主要有:页面序号,χ、y轴坐标值,时间戳等。采集鼠标移动时的数据,需要预设一个采样率,采集数据包括页面序号,Χ、y轴坐标值,时间戳,移动速度,加速度,移动角度值等,其中后三项无法直接采集,需要通过对采集的原始数据经过一系列数学运算儿而得到。采集数据时采用下图2设立的坐标系。
[0020]如图3所示:检测模块的工作原理,是选择用户在电商网站进行购物操作时,所发生的真正对用户利益可能有实质性伤害的有序行为进行分析。具体如图3所示,该检测模型借鉴了自动机中状态集、输入字符和转移函数的想法,每个圆表示一个状态,箭头表示转移函数,符号I和O分别表示行为模式匹配与否。每一次转移时,都需要用到定制的特征向量,分别为 FeatureVectorO, FeatureVectorl, FeatureVector2, FeatureVector3。对当前用户行为进行检测时,对生成的特征向量进行匹配,任意一次转移时匹配超出一定的阈值,都直接判断为异常。
[0021]如图4所示:特征向量的设计,则利用采集到的数据,同时考虑到应用环境为电子商务购物网站,为体现特性,故在购物过程中每个状态跳转都有自己定制的特征向量。具体地,如在登录状态转移时,考虑到每个用户的用户名与密码的长度、输入难度、输入手速等不同,把用户点击用户名文本框、密码文本框和登录按钮之间的时间差作为特征向量的一部分,取其平均值作为特征值;另一方面,用户在点击登录按键时的单击区域也因人而异,该坐标值也选为特征向量的一部分,将采集到的大量单击点坐标,通过基于欧氏距离的K-Means聚类算法,得到最密集簇的簇心坐标的坐标值作为特征值。定义为FeatureVectorO= (Tl, T2, Point),其中Tl表示单击用户名文本框和密码文本框之间的时间差,T2表示单击密码文本框和登录按钮之间的时间差,Point是最密集几个簇的簇心坐标点数据。在浏览选购状态时,不同用户喜好不同,生理习惯各异,将频繁单击区域和鼠标移动速度、加速度、移动角度值等均作为特征向量。定义FeatureVectorl= (Point, v, a,angle),其中Point是单击点分布最密集的几个簇的簇心坐标点数据集合,v表示移动速度的最小值、最大值和分布密集平均值数组,a表示移动加速度的最大值和分布密集平均值数组,angle表示移动角度值的分布密集值数组。
[0022]如图5所示:匹配检测的具体流程如下图所示。匹配时,直接计算特征向量之间的距离,由于每个特征向量的每个分量不同,故分别求相同类型的分量之间的距离,超过一定阈值(阈值由大量实验结果和经验总结得出),即判断为异常。
【权利要求】
1.一种基于鼠标行为的电子商务中用户异常行为检测的应用系统,其特征在于, 包括B2C电商网站,为用户提供购物环境; 包括鼠标行为数据采集模块,用于收集用户购物过程中操作鼠标产生的数据;所述鼠标行为数据采集模块内嵌在电子商务网站中,使用JavaScript脚本语言; 鼠标单击时采集的数据项主要有:页面序号,X、Y轴坐标值,时间戳等; 采集鼠标移动时的数据,需要预设采样率,采集数据包括页面序号,X、Y轴坐标值,时间戳,移动速度,加速度,移动角度值等,其中后三项需要通过对采集的原始数据经过间接数学运算后而得出; 包括检测模块,利用聚类等算法对训练期间采集到的鼠标数据进行正常行为模式的固化,对当前用户行为模式进行计算生成,最后进行匹配检测操作; 包括数据库,用于存储数据采集模块在用户购物过程中操作鼠标产生的数据,同时将已备的正常行为模式提供给检测模块用于对与当前用户行为模式进行匹配检测。
2.一种基于鼠标行为的电子商务中用户异常行为检测方法,其特征在于, 步骤一,正常用户模式提取:对训练期间采集的正常鼠标行为数据进行预处理,利用基于欧氏距离的K-means聚类算法等方法,提取用户的正常行为模式; 步骤二,匹配检测:对当前用户鼠标数据进行相同处理,得到当前用户的鼠标行为模式,与正常模式进行匹配分析。`
3.根据权利要求2所述的基于鼠标行为的电子商务中用户异常行为检测方法,其特征在于,所述模式提取是采用提取特征向量的方法来实现的,具体包括: 预处理阶段,对采集数据坐标点进行聚类处理并剔除异常点; 生成模式阶段,按照特征向量定义计算,并向数据库存储特征向量; 更新阶段,不定时的循环至预处理阶段对特征向量进行优化更新。
4.根据权利要求2所述的基于鼠标行为的电子商务中用户异常行为检测方法,其特征在于,所述匹配检测,其方法为: 匹配时,直接计算特征向量之间的距离,由于每个特征向量的每个分量不同,故分别求相同类型的分量之间的距离; 超过一定阈值(阈值由大量实验结果和经验总结得出),即判断为异常。
5.根据权利要求3所述的基于鼠标行为的电子商务中用户异常行为检测方法,其特征在于,所述特征向量的设计,则利用采集到的数据,同时考虑到应用环境为电子商务购物网站,为体现特性,故在购物过程中每个状态跳转都有自己定制的特征向量; 具体地,如在登录状态转移时,考虑到每个用户的用户名与密码的长度、输入难度、输入手速等不同,把用户点击用户名文本框、密码文本框和登录按钮之间的时间差作为特征向量的一部分,取其平均值作为特征值;另一方面,用户在点击登录按键时的单击区域也因人而异,该坐标值也选为特征向量的一部分,将采集到的大量单击点坐标,通过基于欧氏距离的K-Means聚类算法,得到最密集簇的簇心坐标的坐标值作为特征值; 定义为FeatureVectorO= (Tl,T2,Point),其中Tl表示单击用户名文本框和密码文本框之间的时间差,T2表示单击密码文本框和登录按钮之间的时间差,Point是最密集几个簇的簇心坐标点数据; 在浏览选购状态时,不同用户喜好不同,生理习惯各异,将频繁单击区域和鼠标移动速度、加速度、移动角度值等均作为特征向量; 定义FeatureVectorl= (Point, v, a, angle),其中Point是单击点分布最密集的几个簇的簇心坐标点数据集合,V表示移动速度的最小值、最大值和分布密集平均值数组,a表示移动加速度的最大值和分布密集平均值数组,angle表示移动角度值的分布密集值数组。
6.根据权利要求2所述的基于鼠标行为的电子商务中用户异常行为检测方法,其特征在于,所述匹配检测,是选择用户在电商网站进行购物操作时,所发生的真正对用户利益可能有实质性伤害的有序行为进行分析; 该检测模型借鉴了自动机中状态集、输入字符和转移函数的想法,每个圆表示一个状态,箭头表示转移函数,符号I和O分别表示行为模式匹配与否; 每一次转移时,都需要用到定制的特征向量,分别为FeatureVectorO, FeatureVectorl,FeatureVector2, FeatureVector3 ; 对当前用户行为进行检测时,对生成的特征向量进行匹配,任意一次转移时匹配超出一定的阈值,都直接判断为异常。
【文档编号】G06Q30/00GK103699822SQ201310747420
【公开日】2014年4月2日 申请日期:2013年12月31日 优先权日:2013年12月31日
【发明者】蒋昌俊, 陈闳中, 闫春钢, 丁志军, 马磊 申请人:同济大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1