网页安全性检测方法及装置的制造方法_2

文档序号:9564773阅读:来源:国知局
[0048]比对模块300,用于将提取的字符信息与预置的关键字数据库进行比对;
[0049]上述预置的关键字数据库为用于进行安全检测的数据库,例如可以为钓鱼的关键字数据库。通过将提取的字符信息与钓鱼的关键字数据库比对,从而可以判断待检测的flash是否为钓鱼网站。具体地,比对过程可以为:判断字符信息中的每一个字符是否在关键字数据库中存在。
[0050]确定模块400,用于根据比对的结果,确定所述待检测网址的安全性。
[0051]将识别获得的所有字符信息中的每个字符与预置的关键字数据库进行比对后,根据待检测flash中的字符信息的字符数在预置的关键字数据库存在的字符,确定该待检测网址的安全性。本实施例中,根据安全程度可对待检测网址的安全性进行等级划分,例如可以分为安全和高危两个等级,其对应的待检测网址显示为安全网页和钓鱼网页。
[0052]本发明实施例通过获取从待检测网址下载的待检测flash,然后根据预置的光学字符识别算法从所述待检测flash提取字符信息,并将提取的字符信息与预置的关键字数据库进行比对,根据比对的结果,确定所述待检测网址的安全性;从而实现了 flash的安全性的检测。由于本发明是通过采用光学字符识别算法提取flash中的字符信息,并通过字符信息与预置的关键字数据库进行比对,达到安全性检测;因此实现了 flash内容的安全监测,相对于现有技术中通过比对flash库中的哈希签名确定网页的安全性,本发明提供的网页安全性检测方法提高了网页检测的可靠性,从而提高了网页使用的安全性。
[0053]进一步地,结合参照图3,基于上述实施例,本实施例中,上述提取模块200包括:
[0054]对象提取单元201,用于根据flash标准文件格式信息,从所述待检测flash中提取图片对象和文本资源对象;
[0055]字符提取单元202,用于根据所述预置的光学字符识别算法从所述图片对象中提取文本字符;
[0056]所述比对模块300用于将所述文本资源对象和文本字符与所述预置的关键字数据库进行比对。
[0057]上述flash包括图片对象和/或文本资源对象,上述文本资源对象为:以文本形式(text)编译在flash中的字符;上述图片对象为:以图片形式(shape)编译在flash中的图片。在编译flash的过程中,通常对图片对象和/或文本资源对象采用标准文件格式进行编译,得到flash文件。本实施例中,可根据flash标准文件格式信息进行反编译方式从待检测的flash中提取出编译时采用的图片对象和文本资源对象。然后根据上述光学字符识别算法提取该图片对象中的文本字符,最后将该文本资源对象和文本字符分别与预置的关键字数据库进行比对。
[0058]以下以一 QQ盗号的flash为例,作出详细说明。通过flash反编译技术提取到N张图片对象,然后对该N张图片对象进行光学字符识别算法依次获取N张图片中的文本字符。若其中一张图片对象中获取的文本字符为“登陆QQ邮箱”,另一图片对象中获取到的文本字符为“还没有QQ邮箱?立即注册网络太慢?使用基本版”,且预置的关键字数据库包括“登录、QQ邮箱、QQ号、注册”等关键字,则获取的文本字符中的“登录、QQ邮箱、注册”存在于预置的关键字数据库中,从而根据存在于预置的关键字数据库的这些字符确定当前检测的待检测网址安全性。
[0059]进一步地,参照图4,基于上述实施例,本实施例中,上述确定模块400包括:
[0060]判断单元401,用于根据比对的结果,判断所述字符信息与预置的关键字数据库的匹配度是否超过预设值;
[0061]确定单元402,用于当所述字符信息与预置的关键字数据库的匹配度超过预设值时,确定所述待检测网址的安全级别为第一预置安全级别;当所述字符信息与预置的关键字数据库的匹配度未超过预设值时,确定所述待检测网址的安全级别为第二预置安全级别。
[0062]上述匹配度的计算方式可根据实际需要进行设置,例如,可以采用字符信息中存在于数据库的字符数量之和进行计算;还可以对每个关键字进行权重设置,采用字符信息中存在于数据库的字符的权重和值进行计算;本实施例中,优选地,上述匹配度为所有目标字符的权重值之和,所述目标字符为存在于所述预置的关键字数据库的所述字符信息。上述预设值的大小可根据实际需要进行设置,在此不作进一步地限定。上述第一预置安全级别为存在风险的网页链接,即高危网页链接;上述第二预置安全级别为可信任的网页链接,即安全网页链接。
[0063]进一步地,参照图5,基于上述实施例,本实施例中,上述确定模块400还包括:
[0064]标记储存单元403,用于对所述安全级别为第一预置安全级别的待检测网址按照预置类别进行分类标记,并储存至预置数据库中。
[0065]上述预置类别可根据实际需要进行设置,例如该预置类别可以为钓鱼类网站、病毒类网站、木马类网站等等。在本实施例中,可以设置一钓鱼类网站和钓鱼标记。当检测到安全级别为第一预置安全级别的待检测flash时,将该待检测网址进行钓鱼标记,并将标记后的待检测网址储存至预置的数据库中,以供外部进行查询。例如在发送即时消息时,该消息存在URL链接,则可发送查询请求,以查询在该预置的数据库中是否储存有与该URL链接相同的待检测网址,当存在时,获取该待检测网址的分类标记,根据该标记显示相应的提示信息。从而有效防止用户的信用卡号、银行卡号、身份证号等信息的丢失。
[0066]本发明进一步提出了一种网页安全性检测方法。参照图6,该实施例的网页安全性检测方法包括以下步骤:
[0067]步骤S10,获取从待检测网址下载的待检测flash ;
[0068]本发明实施例提供的网页安全性检测应用于可以进行网页浏览的智能终端上;例如计算机、智能手机、PAD等。在通过智能终端进行网页浏览时,首先由终端发送浏览的待检测网址至网页服务器,由网页服务器进行响应,在由终端根据该响应对网页上的资源信息进行下载,并进行显示。该资源信息包括字符、图片和flash等。将获取网页中的所有flash,并将获取到的每一 flash作为一待检测flash,进行检测。可以理解的是,上述网页可以一个独立的flash,也可以在网页中嵌入多个flash。
[0069]步骤S20,根据预置的光学字符识别算法从所述待检测flash提取字符信息;
[0070]上述光学字符识别算法为OCR (Optical Character Recognit1n,光学字符识别),即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。具体地,可对获取的待检测flash展示的整体图像进行光学识别扫描,从而得到该flash中所有的字符信息,该字符信息包括文字信息、字母信息和数字信息。
[0071]步骤S30,将提取的字符信息与预置的关键字数据库进行比对;
[0072]上述预置的关键字数据库为用于进行安全检测的数据库,例如可以为钓鱼的关键字数据库。通过将提取的字符信息与钓鱼的关键字数据库比对,从而可以判断待检测的flash是否为钓鱼网站。具体地,比对过程可以为:判断字符信息中的每一个字符是否在关键字数据库中存在。
[0073]步骤S40,根据比对的结果,确定所述待检测网址的安全性。
[0074]将识别获得的所有字符信息中的每个字符与预置的关键字数据库进行比对后,根据待检测flash中的字符信息的字符数在预置的关键字数据库存在的字符,确定该待检测网址的安全性。本实施例中,根据安全程度可对待检测网址的安全性进行等级划分,例如可以分为安全和高危两个等级,其对应的待检测网址显示为安全网页和钓鱼网页。
[0075]本发明实施例通过获取从待检测网址下载的待检测flash,然后根据预置的光学字符识别算法从所述待检测flash提取字符信息,并将提取的字符信息与预置的关键字数据库进行比对,根据比对的结果,确定所述待检测网址的安全性;从而实现了 flash的安全性的检测。由于本发明是通过采用光学字符识别算法提取flash中的字符信息,并通过字符信息与预置的关键字数据库进行比对,达到安全性检测;因此实现了 flash内容的安全监测,相对于现有技术中通过比对flash库中的哈希签名确定网页
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1