一种基于网络热词识别的恶意样本捕获方法及系统的制作方法

文档序号:9261542阅读:868来源:国知局
一种基于网络热词识别的恶意样本捕获方法及系统的制作方法
【技术领域】
[0001]本发明涉及网络安全技术领域,尤其涉及一种基于网络热词识别的恶意样本捕获方法及系统。
【背景技术】
[0002]随着微博和搜索引擎等话题传播平台的兴起,伪装成热门话题或资源的恶意程序正在逐渐成为信息安全领域的一个重大威胁。目前,终端设备上恶意网址和恶意文件数量巨大,虽然用户有防范心理,但是面对命名为热门新闻和话题的恶意网址和文件,一旦因好奇被吸引点击或下载,就会将恶意代码安装到终端设备中,并导致恶意代码通过网络快速扩散。
[0003]从实现手段来看,黑客团伙首先建立若干挂马网站、钓鱼网站或通过漏洞入侵和控制其他网站的服务器,然后在网站中添加大量挂马网页或在已存在的网页中添加指向挂马网页的超链接或弹窗等。挂马网页中含有网友关注的热门词汇并针对搜索引擎进行了优化,从而提升了搜索引擎中的排名并增加了用户的信任度,用户在搜索或查阅热门词汇时,一旦点击进入此类网页,就会下载恶意代码到终端设备中,恶意代码将自动运行并扩散,从而威胁自己和他人的信息安全,可以导致账号密码等隐私数据被盗取,进而产生经济损失。
[0004]此外,在微博领域,黑客团伙通过添加网络热门词汇和话题或刷微博点击量等方法,使含有挂马网页网址的微博变成热门微博,用户在打开感兴趣的热门微博时,如果点击了微博中含有的链接地址,就会进入挂马网站或钓鱼网站。热门词汇除了可以用来伪装恶意网址外,还可以用来伪装热门资源,黑客团伙将恶意程序包装成视频、游戏和小说等资源并命名为当前热门话题,网友下载后如果不加注意直接运行,会导致个人信息被泄露并造成经济损失等严重后果。
[0005]通过将网络热词与恶意网址或资源进行结合,可以保证恶意网址或资源在搜索引擎和微博中的热度和关注度,吸引大量用户点击或下载,从而快速广泛地传播。事实上,从用户行为的角度来看,因为搜索网络热词而导致进入恶意网址或下载恶意文件的行为,有以下几个步骤:
从搜索引擎或微博的热门话题榜中找到感兴趣的话题或关键词;
通过关键词在搜索引擎或微博中搜索相应的排名靠前的网页或微博;
点击搜索到的网址,进入网页;点击搜索到的微博,进入网页或下载文件。
[0006]经过分析发现,目前针对网络热词可能带来的安全威胁,并没有可靠的检测方法。

【发明内容】

[0007]针对上述技术问题,本发明提供了一种基于网络热词识别的恶意样本捕获方法及系统,所述方法通过搜集网络热词,基于所述网络热词获取相关网页地址和可下载文件,对上述网页地址和可下载文件进行是否恶意的检测,从而有效捕获与网络热词相关的恶意代码。
[0008]本发明采用如下方法来实现:一种基于网络热词识别的恶意样本捕获方法,包括:
基于社交网络获取网络热词;
基于预设算法计算所述网络热词的热度,筛选出热度超过预设阈值的网络热词添加至热词库;
获取含有热词库中的网络热词并且排名在前的网页,保存网页地址到可疑地址表;若所述网页内含有链接地址,则将所述链接地址加入可疑地址表;
若所述可疑地址表中的网页地址指向可下载文件,则获取所述可下载文件;
对获取的网页地址和可下载文件进行是否恶意的检测。
[0009]进一步地,所述基于社交网络获取网络热词,还包括:获取网络热点话题,提取网络热点话题的关键词作为网络热词。
[0010]进一步地,所述预设算法为:统计所述网络热词的出现次数和下载频率,基于预设权值计算所述网络热词的热度。
[0011]进一步地,所述对获取的网页地址和可下载文件进行是否恶意的检测为:调用具备恶意网页地址和恶意文件检测能力的外部检测模块进行检测。
[0012]进一步地,所述对获取的网页地址和可下载文件进行是否恶意的检测后,还包括:将检测为恶意的网页地址添加至恶意网址列表中,将检测为恶意的可下载文件添加至恶意文件库中。
[0013]本发明采用如下系统来实现:一种基于网络热词识别的恶意样本捕获系统,包括:
热词捕获模块,用于基于社交网络获取网络热词;
热度计算模块,用于基于预设算法计算所述网络热词的热度,筛选出热度超过预设阈值的网络热词添加至热词库;
可疑地址获取模块,用于获取含有热词库中的网络热词并且排名在前的网页,保存网页地址到可疑地址表;若所述网页内含有链接地址,则将链接地址加入可疑地址表;
可下载文件获取模块,用于若所述可疑地址表中的网页地址指向可下载文件,则获取所述可下载文件;
检测模块,用于对可疑地址获取模块获取的网页地址和可下载文件获取模块获取的可下载文件进行是否恶意的检测。
[0014]进一步地,所述基于社交网络获取网络热词,还包括:获取网络热点话题,提取网络热点话题的关键词作为网络热词。
[0015]进一步地,所述预设算法为:统计所述网络热词的出现次数和下载频率,基于预设权值计算所述网络热词的热度。
[0016]进一步地,所述检测模块为具备恶意网页地址和恶意文件检测能力的外部检测模块。
[0017]进一步地,还包括入库模块,用于将检测为恶意的网页地址添加至恶意网址列表中,将检测为恶意的可下载文件添加至恶意文件库中。
[0018]综上所述,本发明提供了一种基于网络热词识别的恶意样本捕获方法及系统,首先基于不同的社交网络平台获取网络热词,并提取出热度在预设阈值以上的网络热词,从而获取含有该网络热词的网页地址和可下载文件,利用第三方检测模块对所述网页地址和可下载文件进行是否恶意的检测。本发明基于普通用户在面对网络热词时,可能采取的操作,从而分析感染恶意代码的途径,并提出利用网络热词识别的恶意样本捕获方法和捕获系统,从而有效检测被包装成为热门词汇或者热门话题的恶意代码。
【附图说明】
[0019]为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本发明提供的一种基于网络热词识别的恶意样本捕获方法实施例流程图; 图2为本发明提供的一种基于网络热词识别的恶意样本捕获系统实施例结构图。
【具体实施方式】
[0021]本发明给出了一种基于网络热词识别的恶意样本捕获方法及系统,为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明:
本发明首先提供了一种基于网络热词识别的恶意样本捕获方法实施例,如图1所示,包括:
SlOl基于社交网络获取网络热词;
所述社交网络包括有一定知名度、使用量大并且提供分析结果的社交平台或软件、手机APP等,不只限于搜索引擎和微博,此处以搜索引擎和微博进行举例说明:
例如:a、基于搜索弓I擎获取网络热词的方法为,从词汇搜索量排行榜中获取网络热词,通过记录搜索引擎和对应的词汇搜索量排行榜,通过爬虫程序自动获取近期预设时间段的网络热词,并进行保存;
b、基于微博获取网络热词的方法为,从微博服务商提供的热门主题榜和热门话题榜中获取关注度较高的网络热词,通过记录微博和对应的热门话题榜,获取近期预设时间段的网络热词,并进行保存;
S102基于预设算法计算所述网络热词的热度;
S103筛选出热度超过预设阈值的网络热词添加至热词库;
S104获取含有热词库中的网络热词并且排名在前的网页,保存网页地址到可疑地址表;
S105若所述网页内含有链
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1