一种基于视觉相似性镜像网站发现方法及系统与流程

文档序号:15615211发布日期:2018-10-09 21:11阅读:来源:国知局

技术特征:

技术总结
本发明提供一种基于视觉相似性镜像网站发现方法及系统,该方法的步骤包括:对网页页面进行初步分块,将得到的块作为DOM树的结点;对可分割的结点继续分割,将分出的新块作为该结点的孩子结点;对于不可分割的结点,将该结点的块作为页面块存入页面块池中,如此循环迭代分块,直至得到全部的页面块;检测出页面中的分隔条,确定分割条的权重;基于分割条的权重进行重建,得到语义块;将语义块转换成图像,提取图像的签名特征;根据上述步骤提取目标网页和基准网页的各语义块的签名特征,基于签名特征通过EMD距离算法计算目标网页和基准网页之间的距离,如果该距离小于一设定阈值,则判定该目标网页的网站属于镜像网站。

技术研发人员:李睿;杜翠兰;李鹏霄;张鹏;陈志鹏;杨兴东
受保护的技术使用者:中国科学院信息工程研究所;国家计算机网络与信息安全管理中心
技术研发日:2018.03.19
技术公布日:2018.10.09
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1