基于关联分析的网站信用黑名单生成方法及系统的制作方法

文档序号:7771697阅读:182来源:国知局
基于关联分析的网站信用黑名单生成方法及系统的制作方法
【专利摘要】一种互联网信息安全【技术领域】的基于关联分析的网站信用黑名单生成方法及系统,首先对网站之间的关联关系进行分析并生成网站关联数据集,然后根据网站关联数据集生成网络信用黑名单,针对网络信用黑名单进行动态调整。本发明在对网站信用黑名单生成时,并未孤立地仅从单个网站信用值加以处理,而是考虑了站点之间的关联关系对其网络信用的影响,设计了一种基于关联分析的网站信用黑名单的生成方法;并且考虑了网站失信事件发生后,对网站信用及其关联站点的动态影响,设计了对应的网站信用黑名单动态调整方法。本发明可以系统性生成网络信用黑名单,并可针对网站失信事件做出对网站信用黑名单进行动态调整。
【专利说明】基于关联分析的网站信用黑名单生成方法及系统
【技术领域】
[0001]本发明涉及的是一种网络信用安全【技术领域】的方法及系统,具体是一种基于关联分析的网站信用黑名单生成方法及系统。
【背景技术】
[0002]现有的网站信用评价方法和系统倾向于以静态和孤立的方式实施网站信用评价,并生成网站信用黑名单,其间隔时间周期较长,缺乏系统性。在网站信用评估方法方面,主要是将一些传统的评估领域的方法应用在网站信用评估方面,国内外的学者已经在这方面进行了一些研究。Xiuli Cao在“Research on Evaluation of B to C E-commerce WebsiteBased on AHP and Grey Evaluation”一文中将AHP及灰度理论应用在B2C电子商务网站的信用评估。Hu Guo-sheng等在“The Study of Credit Evaluation of Business WebsitesUsing Support Vector Machines”一文中将支持向量机的方法应用在电子商务网站的信用评估上。上述方法并未考虑网站之间的关联关系对其站点网络信用的影响,缺乏系统性。
[0003]经过对现有技术的检索发现,中国专利文献号CN102647408,
【公开日】2012_08_22,公开了一种基于内容分析的判断钓鱼网站的方法,其中服务器具有黑白名单数据库、特征数据库以及分析机;所述服务器端接收客户端发送的未知网站的url数据,并进行黑白名单判断;在接收的url不在黑白名单数据库内时下载所述url的相关内容信息,并加载和解析特征数据库里的特征文件,然后利用分析机根据所下载的内容信息逐条和特征数据库里的特征进行匹配;最后将匹配反馈给其客户端。但该技术的缺陷和不足在于该方法并不直接涉及网站的网络信用生成过程,也没有给出如何对黑名单进行生成或更新。

【发明内容】

[0004]本发明针对现有技术存在的上述不足,提出一种基于关联分析的网站信用黑名单生成方法及系统,用于结合网站及其友情链接关系,综合生成网站信用黑名单列表。
[0005]本发明是通过以下技术方案实现的:
[0006]本发明涉及一种基于关联分析的网站信用黑名单生成方法,首先对网站之间的关联关系进行分析并生成网站关联数据集,然后根据网站关联数据集生成网络信用黑名单,针对网络信用黑名单进行动态调整。
[0007]本发明具体包括以下步骤:
[0008]步骤一、网站关联分析:根据待处理的网站数据集W中的站点个数为N,通过进行网站关联分析得到站点关联矩阵M,具体步骤包括:
[0009]1.1)初始化站点关联矩阵M为N*N矩阵,矩阵中的每个元素皆为O,并设置i=l。
[0010]1.2)关联站点全集Ri初始化为空集,通过手工方式或者友情链接查询工具,对网站数据集W中的网站Wi,将该网站对应的全部友情链接站点加入Ri,生成其关联站点全集Ri (j);
[0011]1.3)对于任意W中的网站wk,若wk是Ri的元素,则将站点关联矩阵M中第i行第k列位置所在的元素ηι?Λ赋值为I。
[0012]1.4) i值增加I,重复步骤1.2)-1.4),直到i>N为止,由此得到用于输出的站点关联矩阵M。
[0013]步骤二、网站信用黑名单生成:根据待处理的网站集W及其对应的网站信用集合Cred以及步骤一得到的站点关联矩阵M为输入,生成网站信用黑名单列表B和更新后的网站信用集合Cred,具体步骤包括:
[0014]2.1)设G为W与B的差集,逐一检查网站集合G中的每一个站点的网络信用,将所有网络信用值低于S的站点加入信用黑名单列表B中,其中:δ为网络信用黑名单的阈值,即将网络信用值低于δ的站点列入信用黑名单列表B中,网站信用黑名单列表B初始化时为空集,即设置changecred_f Iag=O。
[0015]2.2)对于G中的每一个站点Wi,其关联站点集Ri初始化为空集;若其所对应的站点关联矩阵M所在X行中存在mx,t=l,则将对应的Wt加入Ri。
[0016]2.3)对于G中的每一个站点Wi,若Ri与8的交集非空,则将该站点放入T中,并初始化j=l ;
[0017]2.4)对于T中的每一个站点W」,其网络信用为Credj,其关联站点集合为Rj, Rj中的站点数量为Nj,计数器Countj的值初始化为O。
[0018]2.5)对于站点Wj中的关联站点集合中&的每一个站点,逐次检查其是否在信用黑名单列表B中,若其在B中,计数器Counh的值加I,否则无操作。
[0019]2.6)计算 Credtemp 的值为 Credj*(1-Countj/(N」+3)),若所得 Credtemp 小于 δ,则将其放入黑名单列表集合B中并更新Credj的值为δ -1 ;若changecred_fIag=I,更新Credj 的值为 Credtemp。
[0020]2.7)更新」=」+1,重复步骤2.4)-2.6),直到]_>|1'|-1。
[0021]2.8)重复步骤2.1)-2.7),直到黑名单列表B无新的站点加入为止。
[0022]2.9)设置changecred_flag=l,重复执行步骤2.1)-2.7) —次。输出黑名单列表B和更新后的网站信用集合Cred。
[0023]步骤三、网站失信事件信用动态调整:根据网站失信时间告警和步骤二得到的Cred进行网站失信事件后的信用调整,并得到动态调整后的网站信用集合Cred。
[0024]所述的网站失信事件包括但不限于:商业失信事件、网络信息失信事件和网站安全失信事件等。商业失信事件主要见于电子商务网站,常见的商业失信事件有网络商业欺诈、价格欺骗、虚假宣传、物流失信以及售后服务不周等。网络信息失信事件主要指网站从事一些与备案主体不符的活动,网站发布或者允许注册会员发布一些失实、色情甚至反动的?目息。常见的网络?目息失/[目事件有网站发布违法?目息、网站的注册网民发布违法?目息以及网站未及时处理网民发布的违法信息。网站安全失信事件主要指网站本身的安全问题对用户造成了损失,从而影响网站的信用。常见的网站安全失信事件有网站存在木马等恶意代码、网站擅自使用用户个人信息以获得商业利益以及网站泄漏用户的个人信息等。
[0025]步骤三具体包括:
[0026]3.1)发生网站失信事件后,相关的网络站点集合为L,集合D为L与(W-B)的交集,则对于D其中的每一个网络站点Wi,设定其失信事件信用影响因子由此形成集合{ βΛ[0027]3.2)对于L中的每一个站点Wi,按照公式Credi=Credi* (1-β J,调整其网络信用值,并输出网站信用集合Cred。
[0028]3.3)根据步骤3.2)得到的更新后的信用集合Cred按照步骤二方式重新生成更新后的网站信用黑名单。
[0029]本发明涉及一种实现上述方法的系统,包括:网络关联分析模块、网站信用黑名单生成模块以及网站失信事件信用动态调整模块,其中:网络关联分析模块对站点集合W进行分析,形成站点关联矩阵M并输出至网站信用黑名单生成模块,网站信用黑名单生成模块根据信用集合Cred和站点关联矩阵M生成网站信用黑名单B和更新后的网站信用集合Cred,并将更新后的网站信用集合Cred输出至网站失信事件信用动态调整模块,当发生网站信用告警,则网站失信事件信用动态调整模块结合更新后的网站信用集合Cred生成动态调整后的网站信用集合Cred,并反馈至网站信用黑名单生成模块,网站信用黑名单生成模块重新生成网站信用黑名单B并再度更新网站信用集合Cred。
技术效果
[0030]与现有技术相比,本发明在对网站信用黑名单生成时,并未孤立地仅从单个网站信用值加以处理,而是考虑了站点之间的关联关系对其网络信用的影响,设计了一种基于关联分析的网站信用黑名单的生成方法;并且考虑了网站失信事件发生后,对网站信用及其关联站点的动态影响,设计了对应的网站信用黑名单动态调整方法。本发明可以系统性生成网络信用黑名单,并可针对网站失信事件做出对网站信用黑名单进行动态调整。
[0031]本发明在取得网站信用值的前提下,系统性生成网站信用黑名单,并为网络信用安全体系的建设提供技术性辅助手段。
【专利附图】

【附图说明】
[0032]图1为本发明方法流程图。
[0033]图2为实施例中的站点关系图。
【具体实施方式】
[0034]下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
[0035]如图1所示。本系统包括:网络关联分析模块、网站信用黑名单生成模块以及网站失信事件信用动态调整模块,其中:网络关联分析模块对站点集合W进行分析,形成站点关联矩阵M并输出至网站信用黑名单生成模块,网站信用黑名单生成模块根据信用集合Cred和站点关联矩阵M生成网站信用黑名单B和更新后的网站信用集合Cred,并将更新后的网站信用集合Cred输出至网站失信事件信用动态调整模块,当发生网站信用告警,则网站失信事件信用动态调整模块结合更新后的网站信用集合Cred生成动态调整后的网站信用集合Cred,并反馈至网站信用黑名单生成模块,网站信用黑名单生成模块重新生成网站信用黑名单B并再度更新网站信用集合Cred。
[0036]本实施例具体操作流程如下:[0037]以如图2中所示的站点集合作为样例。在样例中,站点W1友情链接指向W2和w3,W2友情链接指向W3, W3无友情链接关系。W1, W2和W3的初始网站信用值分别为95,70,50。由此得到站点集合
[0038]W=Iw1, w2, W3I和初始网站信用集{80,70,50},设定黑名单阈值δ =55,具体如图2所示;
[0039]1、网站关联分析
[0040]本步骤输入为待处理的网站数据集W,通过进行网站关联分析,输出为站点关联矩阵Μ。
[0041]具体而言,网站数据集W中的站点个数为3,步骤如下:
[0042]1.1)初始化站点关联矩阵M为3*3矩阵,矩阵中的每个元素皆为0,并设置i=l。得到
【权利要求】
1.一种基于关联分析的网站信用黑名单生成方法,其特征在于,首先对网站之间的关联关系进行分析并生成网站关联数据集,然后根据网站关联数据集生成网络信用黑名单,针对网络信用黑名单进行动态调整; 所述的方法包括以下步骤: 步骤一、网站关联分析:根据待处理的网站数据集W中的站点个数为N,通过进行网站关联分析得到站点关联矩阵M ; 步骤二、网站信用黑名单生成:根据待处理的网站集W及其对应的网站信用集合Cred以及步骤一得到的站点关联矩阵M为输入,生成网站信用黑名单列表B和更新后的网站信用集合Cred ; 步骤三、网站失信事件信用动态调整:根据网站失信时间告警和步骤二得到的Cred进行网站失信事件后的信用调整,并得到动态调整后的网站信用集合Cred。
2.根据权利要求1所述的方法,其特征是,所述的步骤一具体步骤包括: .1.D初始化站点关联矩阵M为N*N矩阵,矩阵中的每个元素皆为O,并设置i=l ; .1.2)关联站点全集Ri初始化为空集,通过手工方式或者友情链接查询工具,对网站数据集W中的网站wi,将该网站对应的全部友情链接站点加入Ri,生成其关联站点全集Ri (j); .1.3)对于任意W中的网站wk,若wk是Ri的元素,则将站点关联矩阵M中第i行第k列位置所在的元素叫』赋值为I ; .1.4) i值增加I,重复步骤1.2)-1.4),直到i>N为止,由此得到用于输出的站点关联矩阵M。
3.根据权利要求1所述的方法,其特征是,步骤二具体步骤包括: .2.1)设G为W与B的差集,逐一检查网站集合G中的每一个站点的网络信用,将所有网络信用值低于δ的站点加入信用黑名单列表B中,其中:δ为网络信用黑名单的阈值,SP将网络信用值低于δ的站点列入信用黑名单列表B中,网站信用黑名单列表B初始化时为空集,即设置 changecred_f Iag=O ; .2.2)对于G中的每一个站点Wi,其关联站点集Ri初始化为空集;若其所对应的站点关联矩阵M所在X行中存在mx,t=l,则将对应的wt加入Ri ; .2.3)对于G中的每一个站点Wi,若Ri与B的交集非空,则将该站点放入T中,并初始化J=1 ; . 2.4)对于T中的每一个站点Wp其网络信用为ere+,其关联站点集合为Rp Rj中的站点数量为Nj,计数器Countj的值初始化为O ; .2.5)对于站点Wj中的关联站点集合中Rj的每一个站点,逐次检查其是否在信用黑名单列表B中,若其在B中,计数器Countj的值加I,否则无操作; .2.6)计算 Credtemp 的值为 Credj* (1-Countj/ (Ν」+3)),若所得 Credtemp 小于 δ,则将其放入黑名单列表集合B中并更新Credj的值为δ -1 ;若changecred_fIag=I,更新Credj的值为Credtemp ; .2.7)更新」=」+1,重复步骤2.4)-2.6),直到j> |T|-1 ; .2.8)重复步骤2.1) -2.7),直到黑名单列表B无新的站点加入为止; .2.9)设置changecred_flag=l,重复执行步骤2.1)-2.7) 一次;输出黑名单列表B和更新后的网站信用集合Cred。
4.根据权利要求1所述的方法,其特征是,所述的网站失信事件包括:商业失信事件、网络彳目息失彳目事件和网站安全失彳目事件;商业失/[目事件见于电子商务网站,常见的商业失信事件有网络商业欺诈、价格欺骗、虚假宣传、物流失信以及售后服务不周;网络信息失信事件指网站从事一些与备案主体不符的活动,网站发布或者允许注册会员发布一些失实、色情甚至反动的信息;常见的网络信息失信事件有网站发布违法信息、网站的注册网民发布违法信息以及网站未及时处理网民发布的违法信息;网站安全失信事件指网站本身的安全问题对用户造成了损失,从而影响网站的信用;常见的网站安全失信事件有网站存在木马恶意代码、网站擅自使用用户个人信息以获得商业利益以及网站泄漏用户的个人信息。
5.根据权利要求1或4所述的方法,其特征是,所述的步骤三具体包括: 3.1)发生网站失信事件后,相关的网络站点集合为L,集合D为L与(W-B)的交集,则对于D其中的每一个网络站点Wi,设定其失信事件信用影响因子β i,0〈 β 由此形成集合{β山 3.2)对于L中的每一个站点Wi,按照公式Credi=Credi* (1-β J,调整其网络信用值,并输出网站信用集合Cred ; 3.3)根据步骤3.2)得到的更新后的信用集合Cred按照步骤二方式重新生成更新后的网站信用黑名单。
6.一种基于关联分析的网站信用黑名单生成系统,其特征在于,包括:网络关联分析模块、网站信用黑名单生成模块以及网站失信事件信用动态调整模块,其中:网络关联分析模块对站点集合W进行分析,形成站点关联矩阵M并输出至网站信用黑名单生成模块,网站信用黑名单生成模块根据信用集合 Cred和站点关联矩阵M生成网站信用黑名单B和更新后的网站信用集合Cred,并将更新后的网站信用集合Cred输出至网站失信事件信用动态调整模块,当发生网站信用告警,则网站失信事件信用动态调整模块结合更新后的网站信用集合Cred生成动态调整后的网站信用集合Cred,并反馈至网站信用黑名单生成模块,网站信用黑名单生成模块重新生成网站信用黑名单B并再度更新网站信用集合Cred。
【文档编号】H04L29/06GK103475669SQ201310443543
【公开日】2013年12月25日 申请日期:2013年9月25日 优先权日:2013年9月25日
【发明者】张保稳, 孔国栋, 林祥, 李建华 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1