一种检测存在钓鱼欺诈风险的网站的方法和装置制造方法

文档序号:7810685阅读:169来源:国知局
一种检测存在钓鱼欺诈风险的网站的方法和装置制造方法
【专利摘要】本发明公开了一种检测存在钓鱼欺诈风险的网站的方法和装置。所述方法包括:对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级,根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表,综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。本发明的技术方案,通过对大量网页进行内嵌页检测,能够发现被黑的白网站,从而可以采取进一步的措施,从而保证了网络安全。
【专利说明】—种检测存在钓鱼欺诈风险的网站的方法和装置

【技术领域】
[0001]本发明涉及互联网【技术领域】,具体涉及一种检测存在钓鱼欺诈风险的网站的方法和装置。

【背景技术】
[0002]随着互联网技术的迅猛发展,人们的很多生活行为都在网络上完成,如通讯、购物等等。正因如此各种钓鱼行为也在威胁广大网民的信息安全以及财产安全。
[0003]之前大多数的钓鱼欺诈行为是通过恶意的黑网站的来进行的,当用户访问该黑网站时,个人信息安全、财产安全等会受到威胁。针对这种情况通过对地址栏进行检测过滤可以达到拦截的目的。
[0004]但是目前越来越多的钓鱼欺诈行为并不是直接构建一个黑网站,而是在通过黑掉一个正常的白网站,然后在这个白网站里面嵌入一个恶意的脚本,这个脚本会让整个网页发生变化,成为钓鱼的工具。对于这种情况对地址栏进行检测是没有用的,因此地址栏中的网站地址还是原来的白网站地址。且这种情况对那些被嵌入黑内容的网站带来了很大的威胁。


【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种检测存在钓鱼欺诈风险的网站的方法和装置。
[0006]依据本发明的一个方面,提供了一种检测存在钓鱼欺诈风险的网站的方法,该方法包括:
[0007]对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级;
[0008]根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表;
[0009]综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
[0010]可选地,在确定存在钓鱼欺诈风险的网站后,该方法进一步包括:
[0011]对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知;
[0012]或者,
[0013]对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息;
[0014]或者,
[0015]对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
[0016]可选地,所述输出该网站页面存在钓鱼欺诈风险的警示信息包括:
[0017]输出该网站页面的拦截页;
[0018]或者,
[0019]输出风险提示弹窗;
[0020]或者,输出该网站页面,但将该网站页面上的内嵌页跳黑
[0021]可选地,所述判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括:
[0022]判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致;
[0023]如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
[0024]可选地,所述判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括:
[0025]将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配;
[0026]如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
[0027]可选地,该方法在对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页之前,进一步包括:
[0028]根据预设策略判断是否检测该网站的网站页面的内嵌页,是则检测该网站的网站页面的内嵌页,否则不检测该网站的网站页面的内嵌页。
[0029]可选地,所述根据预设策略判断是否检测该网站的网站页面的内嵌页包括如下中的一项或多项:
[0030]如果该网站是第一网站名单中的网站,则不检测该网站的网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站;
[0031 ] 如果该网站的网站页面的内嵌页和该网站属于同域,则不检测该网站的网站页面的内嵌页;
[0032]如果该网站是第二网站名单中的网站,则检测该网站的网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站;
[0033]如果该网站的网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站的网站页面的内嵌页;
[0034]如果该网站的网站页面是利用浏览器漏洞进行内嵌的页面,则检测该网站的网站页面的内嵌页。
[0035]依据本发明的另一个方面,提供了一种检测存在钓鱼欺诈风险的网站的装置,该装置包括:
[0036]内嵌页检测单元,适于对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级;
[0037]列表维护单元,适于根据所述内嵌页检测单元的判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表;
[0038]分析单元,适于综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
[0039]可选地,该装置进一步包括:风险处理单元,适于执行以下操作中的一种或多种:
[0040]对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知;
[0041]或者,
[0042]对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息;
[0043]或者,
[0044]对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
[0045]可选地,所述风险处理单元输出该网站页面存在钓鱼欺诈风险的警示信息具体为:
[0046]所述风险处理单元输出该网站页面的拦截页,或者输出风险提示弹窗,或者输出该网站页面,但将该网站页面上的内嵌页跳黑。
[0047]可选地,所述内嵌页检测单元,适于判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致,如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
[0048]可选地,所述内嵌页检测单元,适于将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配,如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
[0049]可选地,该装置进一步包括:
[0050]检测筛选单元,适于对指定网站集合中的每个网站,根据预设策略判断是否检测该网站的网站页面的内嵌页,是则通知内嵌页检测单元检测该网站的网站页面的内嵌页,否则通知内嵌页检测单元不检测该网站的网站页面的内嵌页。
[0051]可选地,所述检测筛选单元,适于根据包括如下中的一项或多项的预设策略判断是否检测该网站的网站页面的内嵌页:
[0052]如果该网站是第一网站名单中的网站,则不检测该网站的网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站;
[0053]如果该网站的网站页面的内嵌页和该网站属于同域,则不检测该网站的网站页面的内嵌页;
[0054]如果该网站是第二网站名单中的网站,则检测该网站的网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站;
[0055]如果该网站的网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站的网站页面的内嵌页;
[0056]如果该网站的网站页面是利用浏览器漏洞进行内嵌的页面,则检测该网站的网站页面的内嵌页。
[0057]根据本发明的这种对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级,根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表,综合分析所述对应列表,确定存在钓鱼欺诈风险的网站的技术方案,通过对大量网页进行内嵌页检测,能够发现被黑的白网站,从而可以采取进一步的措施,从而保证了网络安全。
[0058]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。

【专利附图】

【附图说明】
[0059]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0060]图1示出了根据本发明一个实施例的一种检测存在钓鱼欺诈风险的网站的方法的流程图;
[0061]图2示出了根据本发明一个实施例的一种检测存在钓鱼欺诈风险的网站的装置的结构图;
[0062]图3示出了根据本发明又一个实施例的一种检测存在钓鱼欺诈风险的网站的装置的结构图;
[0063]图4A是本发明实施例中输出的警示信息的第一示例图;
[0064]图4B是本发明实施例中输出的警示信息的第二示例图。

【具体实施方式】
[0065]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0066]图1示出了根据本发明一个实施例的一种检测存在钓鱼欺诈风险的网站的方法的流程图。如图1所示,该方法包括:
[0067]步骤S110,对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级。
[0068]在本步骤中,可以根据实际情况确定指定网站集合。在本发明的实施例中,对网站页面的内嵌页进行检测,具体检测方法可以采用已有的一些防钓鱼检测策略。风险等级也可以根据实际情况而定,例如可以分为危险、高危和黑三个等级,其中黑是已经确认发现问题做了坏事的,危险是可疑但还不确定的,高危是危险系数很高的。
[0069]步骤S120,根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表。
[0070]本步骤中将大量的检测结果汇总成列表,方便后续步骤进行分析。一般来说这种对应列表包括三层关系:网站,具体可以表示为网站的地址栏中的域名;网站下的各个页面,具体可以表示为各个页面的地址;各个页面中的内嵌页以及内嵌页的检测结果。例如
edu.cn这个域名下面有页面1、页面2和页面3,经过内嵌页的检测可以得到页面I里包含了哪个黑网站,页面2里包含了什么黑链接以及黑链接的出现次数,页面3里面包含那些危险或高危的链接等等。即这三层关系可以总结为:白网站,白网站下面的白页面,白页面包含黑链接(黑的那些网址)。
[0071]步骤S130,综合分析该对应列表,确定存在钓鱼欺诈风险的网站。
[0072]根据该对应列表,确定存在钓鱼欺诈风险的网站,至于如何确定可以根据实际情况采用不同的策略。例如,当一个网站只有一个页面中被检测出有危险内嵌页,则可以先不确定其为存在钓鱼欺诈风险的网站,以免出现误报。但当一个网站中有页面被检测出有黑的内嵌页,则确定该网站存在钓鱼欺诈风险。当一个网站中有页面被检测出有高危的内嵌页,且高危内嵌页的数量达到了一个预设值,则确定该网站存在钓鱼欺诈风险等等。但这些只是举例说明,具体的确定方式在本发明中不做限定。
[0073]图1所示的方法,通过对大量网页进行内嵌页检测,能够发现被黑的白网站,从而可以采取进一步的措施。
[0074]在本发明的实施例中,图1所示的方法,在确定存在钓鱼欺诈风险的网站后,进一步执行如下操作中的一种:
[0075](I)对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知。即告知网站本身,其网页被内嵌了黑内容或高危内容,请其处理。
[0076](2)对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息。
[0077](3)对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
[0078]其中,输出该网站页面存在钓鱼欺诈风险的警示信息可以为:输出该网站页面的拦截页;或者,输出风险提示弹窗;或者,输出该网站页面,但将该网站页面上的内嵌页跳
m
O
[0079]例如,在本发明的实施例中,具体输出的警示信息可以如图4A或如图4B所示。图4A是本发明实施例中输出的警示信息的第一示例图。图4B是本发明实施例中输出的警示信息的第二示例图。
[0080]在本发明的一个实施例中,图1所示方法的步骤SllO中判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括:判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致;如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
[0081]这里,可以根据一个网站的地址栏判断其主旨内容。例如以edu.cn结尾的教育类网站其主旨内容是与教育相关的内容,以gov.cn结尾的政府类网站其主旨内容是与政策、民生等相关的内容。以edu.cn结尾的教育类网站为例,如果其网站页面中内嵌的内容与教育丝毫不相关,教育类网站根本没有内嵌这种内容的动机,则这种内嵌页就很可疑了,需要去防范和提醒用户。还可疑根据其他方面的信息来源获知一个网站的主旨内容,获知主旨内容的目的是用来判断网站是否有动机来内嵌某种内嵌页,如果完全没有动机,则可疑判定为黑。
[0082]在本发明的又一个实施例中,图1所示方法的步骤SllO中判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括:将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配;如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
[0083]这种方法是维护一个网页内容黑名单,具体可以根据之前的检出,或者通过其他各种途径获知的黑内容来构建该网页内容黑名单。
[0084]在本发明的一个实施例中,为了减少检测的消耗,在图1所示方法的在对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页之前,进一步包括:根据预设策略判断是否检测该网站的网站页面的内嵌页,是则检测该网站的网站页面的内嵌页,否则不检测该网站的网站页面的内嵌页。
[0085]这是因为一个用户一天可能访问几十、上百个网页,但是这些网页中的内嵌页的数量就没有上限了,一个网页就可能会有很多内嵌页,因此内嵌页的检测任务繁重,有必要减少一些不必要的消耗。
[0086]在本发明的一个实施例中,根据预设策略判断是否检测该网站的网站页面的内嵌页包括如下中的一项或多项:
[0087](I)如果该网站页面是第一网站名单中的网站的页面,则不检测该网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站。
[0088]第一网站名单中的网站是已知认为不会被恶意内嵌网页的网站,通常是一些访问量非常大的大型门户网站,例如像百度、腾讯、新浪、搜狐等这些重点可信的网站。但是不包括银行政府等的知名网站,因为这类网站虽然知名,但被黑的概率反而更高,因为它们没有很严格的体系。
[0089](2)如果该网站页面的内嵌页和该网站页面所在的网站属于同域,则不检测该网站页面的内嵌页。
[0090]如果一个网站内嵌的是一个自身网站的页面(同域或成为同缀),这个是不需要查的,因为同域的地址栏有问题的可能性很小。
[0091](3)如果该网站页面是第二网站名单中的网站的页面,则检测该网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站。
[0092]这里,第二网站名单中的网站是重点可查的网站。重点可查是指一些网站和重点网站已知可能潜藏风险。例如A网站本来是一个重点可信的网站,但最近出现过问题,则将该网站从第一网站名单转移到第二网站名单中,进行重点检测。
[0093](4)如果该网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站页面的内嵌页。
[0094]现有一些页面通过非http页面或者非正常的web页面去内嵌东西,对这种情况本实施例中进行加强防护。例如,给用户发一个本地的页面,然后用户双击打开的这个页面时,该页面里内嵌的是一个黑内嵌页,对此需要加强防护。
[0095](5)如果该网站页面是利用浏览器漏洞进行内嵌的页面,则检测所述网站页面的内嵌页。
[0096]利用浏览器的漏洞,比如说它是一个空白页,或者是一些特殊协议的比如data协议,则对此会加强防护。
[0097]通过本发明实施例中的上述方法,可以对一些本来是白网站,但是被内嵌黑内容后变成钓鱼网站情况进行检测,一但获知某个白网站被内嵌了黑内容则可以进行采取相应的措施,以净化网络环境。
[0098]图2示出了根据本发明一个实施例的一种检测存在钓鱼欺诈风险的网站的装置的结构图。如图2所示,该检测存在钓鱼欺诈风险的网站的装置200包括:
[0099]内嵌页检测单元201,适于对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级;
[0100]列表维护单元202,适于根据所述内嵌页检测单元的判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表;
[0101]分析单元203,适于综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
[0102]图2所示的装置,通过对大量网页进行内嵌页检测,能够发现被黑的白网站,从而可以采取进一步的措施。
[0103]图3示出了根据本发明又一个实施例的一种检测存在钓鱼欺诈风险的网站的装置的结构图。如图3所示,该检测存在钓鱼欺诈风险的网站的装置300包括:
[0104]内嵌页检测单元301,适于对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级;
[0105]列表维护单元302,适于根据所述内嵌页检测单元的判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表;
[0106]分析单元303,适于综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
[0107]此外,装置300进一步包括:风险处理单元304,适于执行以下操作中的一种或多种:
[0108](I)对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知。即告知网站本身,其网页被内嵌了黑内容或高危内容,请其处理。
[0109](2)对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息。
[0110](3)对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
[0111]在本发明的一个实施例中,风险处理单元304输出该网站页面存在钓鱼欺诈风险的警示信息具体为:风险处理单元304输出该网站页面的拦截页,或者输出风险提示弹窗,或者输出该网站页面,但将该网站页面上的内嵌页跳黑。
[0112]在本发明的一个实施例中,内嵌页检测单元301,适于判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致,如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
[0113]在本发明的一个实施例中,内嵌页检测单元301,适于将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配,如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
[0114]在本发明的一个实施例中,该装置300进一步包括:检测筛选单元305,适于对指定网站集合中的每个网站,根据预设策略判断是否检测该网站的网站页面的内嵌页,是则通知内嵌页检测单元检测该网站的网站页面的内嵌页,否则通知内嵌页检测单元不检测该网站的网站页面的内嵌页。
[0115]在本发明的一个实施例中,该装置300进一步包括:检测筛选单元305,适于根据包括如下中的一项或多项的预设策略判断是否检测该网站的网站页面的内嵌页:
[0116](I)如果该网站页面是第一网站名单中的网站的页面,则不检测该网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站。
[0117]第一网站名单中的网站是已知认为不会被恶意内嵌网页的网站,通常是一些访问量非常大的大型门户网站,例如像百度、腾讯、新浪、搜狐等这些重点可信的网站。但是不包括银行政府等的知名网站,因为这类网站虽然知名,但被黑的概率反而更高,因为它们没有很严格的体系。
[0118](2)如果该网站页面的内嵌页和该网站页面所在的网站属于同域,则不检测该网站页面的内嵌页。
[0119]如果一个网站内嵌的是一个自身网站的页面(同域或成为同缀),这个是不需要查的,因为同域的地址栏有问题的可能性很小。
[0120](3)如果该网站页面是第二网站名单中的网站的页面,则检测该网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站。
[0121]这里,第二网站名单中的网站是重点可查的网站。重点可查是指一些网站和重点网站已知可能潜藏风险。例如A网站本来是一个重点可信的网站,但最近出现过问题,则将该网站从第一网站名单转移到第二网站名单中,进行重点检测。
[0122](4)如果该网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站页面的内嵌页。
[0123]现有一些页面通过非http页面或者非正常的web页面去内嵌东西,对这种情况本实施例中进行加强防护。例如,给用户发一个本地的页面,然后用户双击打开的这个页面时,该页面里内嵌的是一个黑内嵌页,对此需要加强防护。
[0124](5)如果该网站页面是利用浏览器漏洞进行内嵌的页面,则检测所述网站页面的内嵌页。
[0125]利用浏览器的漏洞,比如说它是一个空白页,或者是一些特殊协议的比如data协议,则对此会加强防护。
[0126]综上所述,根据本发明的这种对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级,根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表,综合分析所述对应列表,确定存在钓鱼欺诈风险的网站的技术方案,通过对大量网页进行内嵌页检测,能够发现被黑的白网站,从而可以采取进一步的措施,从而保证了网络安全。
[0127]需要说明的是:
[0128]在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0129]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0130]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0131 ] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0132]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0133]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的检测存在钓鱼欺诈风险的网站的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0134]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0135]本发明的实施例公开了 Al、一种检测存在钓鱼欺诈风险的网站的方法,该方法包括:
[0136]对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级;
[0137]根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表;
[0138]综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
[0139]A2、如Al所述的方法,其中,在确定存在钓鱼欺诈风险的网站后,该方法进一步包括:
[0140]对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知;
[0141]或者,
[0142]对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息;
[0143]或者,
[0144]对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
[0145]A3、如A2所述的方法,其中,所述输出该网站页面存在钓鱼欺诈风险的警示信息包括:
[0146]输出该网站页面的拦截页;
[0147]或者,
[0148]输出风险提示弹窗;
[0149]或者,输出该网站页面,但将该网站页面上的内嵌页跳黑
[0150]A4、如Al所述的方法,其中,所述判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括:
[0151]判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致;
[0152]如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
[0153]A5、如Al所述的方法,其中,所述判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括:
[0154]将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配;
[0155]如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
[0156]A6、如Al所述的方法,其中,该方法在对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页之前,进一步包括:
[0157]根据预设策略判断是否检测该网站的网站页面的内嵌页,是则检测该网站的网站页面的内嵌页,否则不检测该网站的网站页面的内嵌页。
[0158]A7、如A6所述的方法,其中,所述根据预设策略判断是否检测该网站的网站页面的内嵌页包括如下中的一项或多项:
[0159]如果该网站是第一网站名单中的网站,则不检测该网站的网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站;
[0160]如果该网站的网站页面的内嵌页和该网站属于同域,则不检测该网站的网站页面的内嵌页;
[0161]如果该网站是第二网站名单中的网站,则检测该网站的网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站;
[0162]如果该网站的网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站的网站页面的内嵌页;
[0163]如果该网站的网站页面是利用浏览器漏洞进行内嵌的页面,则检测该网站的网站页面的内嵌页。
[0164]本发明的实施例还公开了 B8、一种检测存在钓鱼欺诈风险的网站的装置,该装置包括:
[0165]内嵌页检测单元,适于对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级;
[0166]列表维护单元,适于根据所述内嵌页检测单元的判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表;
[0167]分析单元,适于综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
[0168]B9、如B8所述的装置,其中,该装置进一步包括:风险处理单元,适于执行以下操作中的一种或多种:
[0169]对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知;
[0170]或者,
[0171]对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息;
[0172]或者,
[0173]对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
[0174]B10、如B9所述的装置,其中,所述风险处理单元输出该网站页面存在钓鱼欺诈风险的警示信息具体为:
[0175]所述风险处理单元输出该网站页面的拦截页,或者输出风险提示弹窗,或者输出该网站页面,但将该网站页面上的内嵌页跳黑。
[0176]B11、如B8所述的装置,其中,
[0177]所述内嵌页检测单元,适于判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致,如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
[0178]B12、如B8所述的装置,其中,
[0179]所述内嵌页检测单元,适于将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配,如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
[0180]B13、如B8所述的装置,其中,该装置进一步包括:
[0181]检测筛选单元,适于对指定网站集合中的每个网站,根据预设策略判断是否检测该网站的网站页面的内嵌页,是则通知内嵌页检测单元检测该网站的网站页面的内嵌页,否则通知内嵌页检测单元不检测该网站的网站页面的内嵌页。
[0182]B14、如B13所述的装置,其中,所述检测筛选单元,适于根据包括如下中的一项或多项的预设策略判断是否检测该网站的网站页面的内嵌页:
[0183]如果该网站是第一网站名单中的网站,则不检测该网站的网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站;
[0184]如果该网站的网站页面的内嵌页和该网站属于同域,则不检测该网站的网站页面的内嵌页;
[0185]如果该网站是第二网站名单中的网站,则检测该网站的网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站;
[0186]如果该网站的网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站的网站页面的内嵌页;
[0187]如果该网站的网站页面是利用浏览器漏洞进行内嵌的页面,则检测该网站的网站页面的内嵌页。
【权利要求】
1.一种检测存在钓鱼欺诈风险的网站的方法,其中,该方法包括: 对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级; 根据判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表; 综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
2.如权利要求1所述的方法,其中,在确定存在钓鱼欺诈风险的网站后,该方法进一步包括: 对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知; 或者, 对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息; 或者, 对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
3.如权利要求2所述的方法,其中,所述输出该网站页面存在钓鱼欺诈风险的警示信息包括: 输出该网站页面的拦截页; 或者, 输出风险提示弹窗; 或者,输出该网站页面,但将该网站页面上的内嵌页跳黑。
4.如权利要求1所述的方法,其中,所述判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括: 判断网站页面的内嵌页的内容是否与对应网站的主旨内容一致; 如果不一致则判定该内嵌页存在钓鱼欺诈的风险。
5.如权利要求1所述的方法,其中,所述判断网站页面的内嵌页是否存在钓鱼欺诈的风险包括: 将网站页面的内嵌页的内容与预设的网页内容黑名单进行匹配; 如果与网页内容黑名单的一项内容匹配,则判定内嵌页存在钓鱼欺诈。
6.如权利要求1所述的方法,其中,该方法在对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页之前,进一步包括: 根据预设策略判断是否检测该网站的网站页面的内嵌页,是则检测该网站的网站页面的内嵌页,否则不检测该网站的网站页面的内嵌页。
7.如权利要求6所述的方法,其中,所述根据预设策略判断是否检测该网站的网站页面的内嵌页包括如下中的一项或多项: 如果该网站是第一网站名单中的网站,则不检测该网站的网站页面的内嵌页;其中,第一网站名单中的网站是已知不会被恶意内嵌网页的网站; 如果该网站的网站页面的内嵌页和该网站属于同域,则不检测该网站的网站页面的内嵌页; 如果该网站是第二网站名单中的网站,则检测该网站的网站页面的内嵌页;其中,第二网站名单中的网站是已发现存在问题的网站; 如果该网站的网站页面是通过非http页面或者非正常的web页面进行内嵌的页面,则检测该网站的网站页面的内嵌页; 如果该网站的网站页面是利用浏览器漏洞进行内嵌的页面,则检测该网站的网站页面的内嵌页。
8.一种检测存在钓鱼欺诈风险的网站的装置,其中,该装置包括: 内嵌页检测单元,适于对于指定网站集合中的每个网站,检测该网站的网站页面的内嵌页,判断网站页面的内嵌页是否存在钓鱼欺诈的风险,以及风险等级; 列表维护单元,适于根据所述内嵌页检测单元的判断结果生成所述指定网站集合中的各网站与对应网站页面以及内嵌页判断结果之间关系的对应列表; 分析单元,适于综合分析所述对应列表,确定存在钓鱼欺诈风险的网站。
9.如权利要求8所述的装置,其中,该装置进一步包括:风险处理单元,适于执行以下操作中的一种或多种: 对于存在钓鱼欺诈风险的网站,向其服务器发送风险提示通知; 或者, 对于存在钓鱼欺诈风险的网站,当用户访问对其内嵌页存在钓鱼欺诈风险的网站页面时,输出该网站页面存在钓鱼欺诈风险的警示信息; 或者, 对于存在钓鱼欺诈风险的网站,当其内嵌页存在钓鱼欺诈风险的网站页面数量达到预设值时,对该网站的所有网站页面访问,均输出该网站页面存在钓鱼欺诈风险的警示信息。
10.如权利要求9所述的装置,其中,所述风险处理单元输出该网站页面存在钓鱼欺诈风险的警示信息具体为: 所述风险处理单元输出该网站页面的拦截页,或者输出风险提示弹窗,或者输出该网站页面,但将该网站页面上的内嵌页跳黑。
【文档编号】H04L29/08GK104301299SQ201410379749
【公开日】2015年1月21日 申请日期:2014年8月4日 优先权日:2014年8月4日
【发明者】钱军, 郑劲松, 肖鹏 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1