基于web前端开发数据的网站鉴别方法、装置及存储设备与流程

文档序号:18561379发布日期:2019-08-30 23:20阅读:180来源:国知局
基于web前端开发数据的网站鉴别方法、装置及存储设备与流程

本发明实施例涉及网络安全领域,尤其涉及一种基于web前端开发数据的网站鉴别方法、装置及存储设备。



背景技术:

在安全研究工作中,经常需要鉴别网站的安全性和信誉度。常规的安全网站鉴别有以下两种方式:通过黑名单机制可以过滤掉含有低信誉特征的网站,但是这种方式会产生漏报,存在安全隐患;而另一方式为白名单机制,这种方式只能识别大部分已知的高信誉网站,对于新出现的高信誉网站不是很友好,准确性不足,容易造成误报。



技术实现要素:

基于上述存在的问题,本发明实施例提供一种基于web前端开发数据的网站鉴别方法、装置及存储设备,用以解决传统网站鉴别方式中,通过黑名单机制产生漏报,存在安全隐患;以及白名单机制只能识别大部分已知网站,对于新出现网站不能准确识别,容易造成误报的问题。

本发明实施例公开一种基于web前端开发数据的网站鉴别方法,包括:

收集安全网站页面前端开发数据;提取所述页面前端开发数据特征,并形成信息库;提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;若有任一项特征匹配,则该网站属性为安全。

进一步地,所述页面前端开发数据特征,包括:适配技术特征、框架技术特征、接口设计特征、外观设计特征以及网页内容特征;

其中,适配技术特征包括多个子特征,并且所述适配技术特征为适配代码;框架技术特征包括多个子特征,并且所述框架技术特征为框架中的关键字和/或关键词及其数量;接口设计特征包括多个子特征,并且所述接口设计特征为页面html中不包含其他语言代码;外观设计特征包含多个子特征,并且所述外观设计特征为图形组合特征和/或色彩数目特征和/或分辨率;网页内容特征包含多个子特征,并且所述网页内容特征为备案信息特征和/或版权信息特征和/或url特征和/或标题及注释特征。

进一步地,提取未知属性网站的页面前端开发数据特征,与信息库内的特征进行匹配,具体为:为信息库中每一特征设置阈值tn,tnan为信息库中每一特征的每一子特征设置的权值;提取未知属性网站页面的任一前端开发数据特征,其子特征与数据库中对应的子特征进行匹配,计算特征匹配度sn;若匹配度sn≥阈值tn,则该特征与信息库中对应的特征匹配,该网站属性为安全;若匹配度sn<阈值tn,继续选取其他特征进行匹配;其中,匹配度sn=tna1+tna2+…+tnan,,若子特征相互匹配,则tnan为信息库子特征设置的权值,如果子特征相互不匹配,则将对应子特征权值置零。

进一步地,若所有特征的匹配度sn均小于阈值tn,则采用以下方式鉴别未知网站属性:设置统计值p,p=1-(1-s1/t1)*(1-s2/t2)*(1-s3/t3)*……*(1-sn/tn);设置统计预设值若统计值该网站属性为安全;否则该网站属性为不安全。

进一步地,如需进一步对网站进行信誉度评价,则需要设置不同信誉度的信誉等级值rn;根据信息库中每一特征设置信誉权值snbn,对所有特征进行特征匹配度sn计算,并计算出网站的信誉值x,x=s1*s1b1+s2*s2b2+…+sn*snbn;比较信誉值x和信誉等级值rn,可以对网站进行信誉度评价。

本发明实施例公开一种基于web前端开发数据的网站鉴别装置,包括存储器和处理器,所述存储器用于存储多条指令,所述处理器用于加载所述存储器中存储的指令以执行:

收集安全网站页面前端开发数据;提取所述页面前端开发数据特征,并形成信息库;提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;若有任一项特征匹配,则该网站属性为安全。

进一步地,所述处理器还用于加载所述存储器中存储的指令以执行:

所述页面前端开发数据特征,包括:适配技术特征、框架技术特征、接口设计特征、外观设计特征以及网页内容特征;

其中,适配技术特征包括多个子特征,并且所述适配技术特征为适配代码;框架技术特征包括多个子特征,并且所述框架技术特征为框架中的关键字和/或关键词及其数量;接口设计特征包括多个子特征,并且所述接口设计特征为页面html中不包含其他语言代码;外观设计特征包含多个子特征,并且所述外观设计特征为图形组合特征和/或色彩数目特征和/或分辨率;网页内容特征包含多个子特征,并且所述网页内容特征为备案信息特征和/或版权信息特征和/或url特征和/或标题及注释特征。

进一步地,所述处理器还用于加载所述存储器中存储的指令以执行:

提取未知属性网站的页面前端开发数据特征,与信息库内的特征进行匹配,具体为:为信息库中每一特征设置阈值tn,tnan为信息库中每一特征的每一子特征设置的权值;提取未知属性网站页面的任一前端开发数据特征,其子特征与数据库中对应的子特征进行匹配,计算特征匹配度sn;若匹配度sn≥阈值tn,则该特征与信息库中对应的特征匹配,该网站属性为安全;若匹配度sn<阈值tn,继续选取其他特征进行匹配;其中,匹配度sn=tna1+tna2+…+tnan,,若子特征相互匹配,则tnan为信息库子特征设置的权值,如果子特征相互不匹配,则将对应子特征权值置零。

进一步地,所述处理器还用于加载所述存储器中存储的指令以执行:

若所有特征的匹配度sn均小于阈值tn,则采用以下方式鉴别未知网站属性:设置统计值p,p=1-(1-s1/t1)*(1-s2/t2)*(1-s3/t3)*……*(1-sn/tn);设置统计预设值若统计值该网站属性为安全;否则该网站属性为不安全。

进一步地,所述处理器还用于加载所述存储器中存储的指令以执行:

如需进一步对网站进行信誉度评价,则需要设置不同信誉度的信誉等级值rn;根据信息库中每一特征设置信誉权值snbn,对所有特征进行特征匹配度sn计算,并计算出网站的信誉值x,x=s1*s1b1+s2*s2b2+…+sn*snbn;比较信誉值x和信誉等级值rn,可以对网站进行信誉度评价。

本发明实施例同时公开一种基于web前端开发数据的网站鉴别装置,包括:

数据收集模块:收集安全网站页面前端开发数据;

特征提取模块:提取所述页面前端开发数据特征,并形成信息库;

匹配模块:提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;

鉴别模块:若有任一项特征匹配,则该网站属性为安全。

本发明实施例提供了一种存储设备,所述存储设备中存储有多条指令,所述指令适于由处理器加载并执行本发明实施例提供的基于web前端开发数据的网站鉴别方法步骤。

与现有技术相比,本发明实施例提供的一种基于web前端开发数据的网站鉴别方法、装置及存储设备,至少实现了如下的有益效果:

收集安全网站页面前端开发数据;提取所述页面前端开发数据特征,并形成信息库;提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;若有任一项特征匹配,则该网站属性为安全。本发明实施例通过总结多维度的web前端开发模式特征,能够更加准确地识别可信度高的网站,能够有效减少白名单机制下的误报产生,也能避免黑名单机制下的漏报产生。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于web前端开发数据的网站鉴别方法流程图;

图2为本发明实施例提供的又一基于web前端开发数据的网站鉴别方法流程图;

图3为本发明实施例提供的基于web前端开发数据的网站信誉度评价方法流程图;

图4为本发明实施例提供的基于web前端开发数据的网站鉴别装置结构图;

图5为本发明实施例提供的又一基于web前端开发数据的网站鉴别装置结构图。

具体实施方式

为了使本发明的目的,技术方案和优点更加清楚,下面结合附图,对本发明实施例提供的基于web前端开发数据的网站鉴别方法的具体实施方式进行详细地说明。应当理解,下面所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

本发明实施例提供了一种基于web前端开发数据的网站鉴别方法流程图,如图1所示,包括:

步骤11,收集安全网站页面前端开发数据;

步骤12,提取所述页面前端开发数据特征,并形成信息库;该信息库的可定期更新,且更新频率可根据需求进行调整。

步骤13,提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;

步骤14,若有任一项特征匹配,则该网站属性为安全。

其中,所述页面前端开发数据特征,包括:适配技术特征、框架技术特征、接口设计特征、外观设计特征以及网页内容特征;

其中,适配技术即产品为适应不同操作系统、浏览器、设备等能够自动调整为最佳表现形态的技术;适配技术特征包括多个子特征,包括但不限于平台适配特征,设备适配特征,界面适配特征,浏览器适配特征;并且所述适配技术特征为适配代码,例如“<metaname="viewport"content="width=device-width,initial-scale=1.0,user-scalable=0">”就是比较普遍的移动端界面标准适配代码。

框架技术特征包括多个子特征,包括但不限于:调用css框架、模块化开发框架、工具框架等框架中的关键字,关键词,调用方式等特殊标记;并且所述框架技术特征为框架中的关键字和/或关键词及其数量;例如,“aria-valuenow”就是css框架中的一个特有属性名称,即css框架关键词。

接口设计特征包括多个子特征,并且所述接口设计特征为页面html中不包含其他语言代码;例如,css代码单独通过url引用,不会混杂在html代码中。

外观设计特征包含多个子特征,包括但不限于:页面布局,色彩丰富度,配色方案,素材数量及质量;并且所述外观设计特征为图形组合特征和/或色彩数目特征和/或分辨率;通过图像处理及图像识别技术,将外观设计抽象为图像组合,色彩数目,分辨率等特征。

网页内容特征包含多个子特征,并且所述网页内容特征为备案信息特征和/或版权信息特征和/或url和/或标题及注释特征,例如标题格式通常简洁直观,字数控制在20字以内(英文10个单词以内),符号不超过3个,不包含运算符号,这样易于用户理解当前所处页面的核心内容。

本发明实施例提供的方法通过总结多维度的web前端开发模式特征,能够更加准确地识别可信度高的网站,能够有效减少白名单机制下的误报产生,也能避免黑名单机制下的漏报产生。

本发明实施例提供的又一基于web前端开发数据的网站鉴别方法流程图,如图2所示,包括:

步骤201,收集安全网站页面前端开发数据;

步骤202,提取所述页面前端开发数据特征,并形成信息库;

步骤203,为信息库中每一特征设置阈值tn,tnan为信息库中每一特征的每一子特征设置的权值;

步骤204,提取未知属性网站页面的任一前端开发数据特征,其子特征与数据库中对应的子特征进行匹配,计算特征匹配度sn;

其中,匹配度sn=tna1+tna2+…+tnan,若子特征相互匹配,则tnan为信息库子特征设置的权值,如果子特征相互不匹配,则将对应子特征权值置零。

步骤205,比较特征匹配度sn与阈值的大小;

若匹配度sn≥阈值tn,则该特征与信息库中对应的特征匹配,该网站属性为安全;若匹配度sn<阈值tn,继续选取其他特征进行匹配;

步骤206,若所有特征的匹配度sn均小于阈值tn,则设置统计值p以及统计预设值并比较统计值p与统计预设值的大小;

其中,p=1-(1-s1/t1)*(1-s2/t2)*(1-s3/t3)*……*(1-sn/tn);

预设值可以根据用户需求制定,若统计值该网站属性为安全;否则该网站属性为不安全;若该网站属性判定为不安全,则根据用户需求对不安全网站采取措施,包括但不限于:告警、禁止进一步操作,关闭网页,对该网站信息进行采集。

如已经判断网站属性为安全,而需进一步对网站进行信誉度评价,本发明实施例提供了一种基于web前端开发数据的网站信誉度评价方法流程图,如图3所示;

步骤301,网站属性为安全,设置不同信誉度的信誉等级值rn;

对于信誉等级值rn的设定,可以根据需求自行设定。

步骤302,对信息库中每一特征设置信誉权值snbn,并对所有特征进行特征匹配度sn计算,并计算出网站的信誉值x;

其中,x=s1*s1b1+s2*s2b2+…+sn*snbn;

步骤303,比较信誉值x和信誉等级值rn,可以对网站进行信誉度评价。

本发明实施例提供的方法通过总结多个维度的web前端开发模式,能够更加准确地识别可信度高的网站,且逻辑性强,易于理解;能够有效减少白名单机制下的误报产生,也能避免黑名单机制下的漏报产生;同时还可以进一步评估网站信誉度,为用户提供便利。

本发明实施例还提供了一种基于web前端开发数据的网站鉴别装置,如图4所示,包括:所述装置包括存储器410和处理器420,所述存储器410用于存储多条指令,所述处理器420用于加载所述存储器410中存储的指令以执行:

收集安全网站页面前端开发数据;提取所述页面前端开发数据特征,并形成信息库;提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;若有任一项特征匹配,则该网站属性为安全。

所述处理器420用于加载所述存储器410中存储的指令以执行:

所述页面前端开发数据特征,包括:适配技术特征、框架技术特征、接口设计特征、外观设计特征以及网页内容特征;

其中,适配技术特征包括多个子特征,并且所述适配技术特征为适配代码;框架技术特征包括多个子特征,并且所述框架技术特征为框架中的关键字和/或关键词及其数量;接口设计特征包括多个子特征,并且所述接口设计特征为页面html中不包含其他语言代码;外观设计特征包含多个子特征,并且所述外观设计特征为图形组合特征和/或色彩数目特征和/或分辨率;网页内容特征包含多个子特征,并且所述网页内容特征为备案信息特征和/或版权信息特征和/或url特征和/或标题及注释特征。

所述处理器420用于加载所述存储器410中存储的指令以执行:

提取未知属性网站的页面前端开发数据特征,与信息库内的特征进行匹配,具体为:

为信息库中每一特征设置阈值tn;

提取未知属性网站页面的任一前端开发数据特征,其子特征与数据库中对应的子特征进行匹配,计算特征匹配度sn;

若匹配度sn≥阈值tn,则该特征与信息库中对应的特征匹配,该网站属性为安全;若匹配度sn<阈值tn,继续选取其他特征进行匹配;

其中,匹配度sn=tna1+tna2+…+tnan,tnan为信息库中每一特征的每一子特征设置的权值,若子特征相互匹配,则tnan为信息库子特征设置的权值,如果子特征相互不匹配,则将对应子特征权值置零。

所述处理器420用于加载所述存储器410中存储的指令以执行:

若所有特征的匹配度sn均小于阈值tn,则采用以下方式鉴别未知网站属性:

设置统计值p,p=1-(1-s1/t1)*(1-s2/t2)*(1-s3/t3)*……*(1-sn/tn);

设置统计预设值

若统计值该网站属性为安全;否则该网站属性为不安全。

所述处理器320用于加载所述存储器310中存储的指令以执行:

如需进一步对网站进行信誉度评价,则需要设置不同信誉度的信誉等级值rn;

根据信息库中每一特征设置信誉权值snbn,对所有特征进行特征匹配度sn计算,并计算出网站的信誉值x,x=s1*s1b1+s2*s2b2+…+sn*snbn;

比较信誉值x和信誉等级值rn,可以对网站进行信誉度评价。

本发明实施例同时提供了又一种基于web前端开发数据的网站鉴别装置,如图5所示,包括:

数据收集模块51:收集安全网站页面前端开发数据;

特征提取模块52:提取所述页面前端开发数据特征,并形成信息库;

匹配模块53:提取未知属性网站页面前端开发数据特征,与信息库内的特征进行匹配;

鉴别模块54:若有任一项特征匹配,则该网站属性为安全。

本发明实施例还提供一种存储设备,所述存储设备中存储有多条指令,所述指令适于由处理器加载并执行本发明实施例提供的基于web前端开发数据的网站鉴别方法的步骤。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明实施例可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1