非法网站的检测方法及装置与流程

文档序号：23347562发布日期：2020-12-18 16:49阅读：402来源：国知局

本发明涉及网络安全技术领域，尤其涉及一种非法网站的检测方法及装置。

背景技术：

博彩网站等非法网站屡禁不止，为了封堵非法网站，首先需要将非法网站检测出来，现有技术中通常采用网站域名或目的ip过滤的方法检测非法网站，然而现阶段的非法网站大多采用了超文本传输安全协议（hypertexttransferprotocoloversecuresocketlayer，https）加密、经常变换域名或一个用户对应一个域名的方式以避免被检测出来，若继续采用现有技术中的检测方法检测非法网站，则会出现检测准确率低的问题。

技术实现要素：

因此，有必要提供一种非法网站的检测方法及装置，用以解决现有技术中的非法网站检测方法准确率低的技术问题。

第一方面，本发明实施例提供一种非法网站的检测方法，包括：

获取待检测网站的目标域名和预置的域名库，所述域名库中存储有若干合法网站的域名和若干非法网站的域名；

判断所述域名库中是否存在与所述目标域名相同的域名，若不存在，则基于预置的神经网络模型对所述目标网站进行检测，得到所述待检测网站的第一检测结果，所述第一检测结果为所述待检测网站为合法网站或非法网站；

若所述第一检测结果为所述待检测网站为非法网站，则根据所述待检测网站的页面内容获取所述待检测网站的第二检测结果，所述第二检测结果为所述待检测网站为合法网站或非法网站；

将所述第二检测结果作为对所述待检测网站进行检测的最终结果。

进一步地，基于预置的神经网络模型对所述目标网站进行检测之前还包括：

获取若干样本域名；

将每一所述样本域名及对应的样本网站的名称的和样本标签组成一个训练样本，得到若干所述训练样本；其中，所述样本标签用于标记所述样本网站为合法网站或非法网站；

将若干所述训练样本组成训练集，并基于所述训练集训练所述神经网络模型。

进一步地，获取若干样本域名包括：

获取预设时间段内的用户流量；

对所述用户流量进行解析，得到所述用户流量中携带的若干域名和每一域名的访问量；

将若干域名按照访问量由高到低的顺序进行排名，并将名次低于预设名次的每一域名作为待分析域名；

判断所述域名库中是否存在与所述待分析域名相同的域名，若不存在，则根据所述待分析域名对应的网站的页面内容获取所述网站的第三检测结果，所述第三检测结果为所述网站为合法网站或非法网站；

若所述第三检测结果为所述网站为非法网站，则将所述待分析域名作为所述样本域名，得到若干所述样本域名。

进一步地，所述域名库包括合法域名库和非法域名库，所述合法域名库中存储有若干合法网站的域名，所述非法域名库中存储有若干非法网站的域名，所述非法网站的检测方法还包括：

若所述第三检测结果为所述网站为非法网站，则将所述待分析域名存储至所述非法域名库；

若所述第三检测结果为所述网站为合法网站，则将所述待分析域名存储至所述合法域名库。

进一步地，所述非法网站的检测方法还包括：

遍历所述训练集；

获取所述训练集中的所述样本网站的名称的种类，判断所述种类与上一次遍历所获取的所述种类是否相同；

若不同，则基于所述训练集重新训练所述神经网络模型；

若相同，则获取所述训练集中的所述训练样本的数量，判断所述数量与上一次遍历所获取的所述数量是否相同，若不同，则基于所述训练集对所述神经网络模型进行增量训练。

进一步地，所述非法网站的检测方法还包括：

若所述合法域名库中存在与所述目标域名相同的域名，则将所述待检测网站为合法网站的检测结果作为对所述待检测网站进行检测的最终结果；

若所述非法域名库中存在与所述目标域名相同的域名，则将所述待检测网站为非法网站的检测结果作为对所述待检测网站进行检测的最终结果；

若所述第一检测结果为所述待检测网站为合法网站，则将所述待检测网站为合法网站的检测结果作为对所述待检测网站进行检测的最终结果。

进一步地，所述非法网站的检测方法还包括：

获取第一域名集合，所述第一域名集合包括多个域名；

将所述第一域名集合与所述域名库进行比对，将所述第一域名集合中与所述域名库中的域名相同的域名剔除，得到第二域名集合；

基于所述神经网络模型对所述第二域名集合中的各域名分别进行检测，以将所述第二域名集合中的各域名对应的网站划分为初始合法网站集合和初始非法网站集合；

根据所述初始非法网站集合中的各网站的页面内容，确定所述非法初始网站集合中的各网站的第四检测结果，所述第四检测结果为所述初始非法网站集合中的各网站为合法网站或非法网站；

选取所述初始合法网站中的预设比例的网站集合；

将所述网站集合中的各网站对应的域名分发给预先确定的多个终端进行检测，并获取多个所述终端反馈的第五检测结果，所述第五检测结果为所述网站集合中的各网站为合法网站或非法网站。

第二方面，本发明实施例提供一种非法网站的检测装置，包括：

获取模块，用于获取待检测网站的目标域名和预置的域名库，所述域名库中存储有若干合法网站的域名和若干非法网站的域名；

第一检测模块，用于判断所述域名库中是否存在与所述目标域名相同的域名，若不存在，则基于预置的神经网络模型对所述目标网站进行检测，得到所述待检测网站的第一检测结果，所述第一检测结果为所述待检测网站为合法网站或非法网站；

第二检测模块，用于若所述第一检测结果为所述待检测网站为非法网站，则根据所述待检测网站的页面内容获取所述待检测网站的第二检测结果，所述第二检测结果为所述待检测网站为合法网站或非法网站；

结果确定模块，用于将所述第二检测结果作为对所述待检测网站进行检测的最终结果。

第三方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所提供的非法网站的检测方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所提供的非法网站的检测方法的步骤。

本发明实施例提供的非法网站的检测方法及装置，将待检测网站的域名与预置的域名库进行比对，若域名库中不存在与目标域名相同的域名，则基于预置的神经网络模型对目标域名进行检测以得到待检测网站的第一检测结果，并在第一检测结果为待检测网站为非法网站时，根据待检测网站的页面内容获取待检测网站的第二检测结果，并将第二检测结果作为对待检测网站进行检测的最终结果。通过将域名库比对、神经网络模型检测和页面内容检测等方式相结合以共同用于对待检测网站进行检测，能够提高检测结果的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的非法网站的检测方法的应用场景示意图；

图2为本发明实施例提供的非法网站的检测方法流程图；

图3为本发明实施例提供的非法网站的检测装置的结构示意图；

图4为本发明实施例提供的电子设备的实体结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了更清楚地对本发明实施例提供非法网站的检测方法进行说明，首先对该方法的应用场景进行说明。图1为本发明实施例提供的非法网站的检测方法的应用场景示意图，如图1所示，该方法应用于运营商接入网中，该运营商接入网包括若干虚拟局域网（virtuallocalareanetwork，vlan）、若干数字用户线路接入复用器（digitalsubscriberlineaccessmultiplexer、dslam）、若干交换机（switch，sw）、若干宽带接入服务器（broadbandremoteaccessserver，bars）、若干深度报文检测（deeppacketinspection，dpi）和汇聚层等功能单元，各功能单元的电性连接关系已在图1中详细示出，此处不再赘述。

需要说明的是，将执行该方法的装置称为非法网站的检测装置，该装置可位于图1所示的运营商接入网中的任一能够监控到大量用户的上网流量的功能单元中，此处不对其进行限定。

图2为本发明实施例提供的非法网站的检测方法流程图，如图2所示，该方法包括：

步骤201，获取待检测网站的目标域名和预置的域名库，所述域名库中存储有若干合法网站的域名和若干非法网站的域名。

具体地，为了获取待检测网站的目标域名，首先需要获取用户实时流量，用户实时流量包括超文本传输协议（hypertexttransferprotocol，http）请求报文、https请求报文和域名服务器（domainnameserver，dns）响应报文等报文中的任意一种或多种；然后对获取到的用户实时流量进行解析，得到用户实时流量中携带的域名，需要说明的是，本发明实施例中的域名优选为顶级域名；最后将从用户实时流量中解析出的域名所对应的网站作为待检测网站，并将该域名作为待检测网站的目标域名。本发明实施例的目的就在于检测待检测网站，以判断待检测网站是否为非法网站。需要说明的是，本发明实施例中的非法网站优选为博彩网站。

预置的域名库包括合法域名库和非法域名库，其中，合法域名库中存储有若干合法网站的域名，非法域名库中存储有若干非法网站的域名。

步骤202，判断所述域名库中是否存在与所述目标域名相同的域名，若不存在，则基于预置的神经网络模型对所述目标网站进行检测，得到所述待检测网站的第一检测结果，所述第一检测结果为所述待检测网站为合法网站或非法网站。

具体地，依次将域名库中的每一域名与目标域名进行比对以判断两者是否相同，若判断两者相同，即域名库中存在与目标域名相同的域名，则停止比对并停止后续检测流程。

进一步地，若合法域名库中存在与目标域名相同的域名，则将待检测网站为合法网站的检测结果作为对待检测网站进行检测的最终结果，若非法域名库中存在与目标域名相同的域名，则将待检测网站为非法网站的检测结果作为对待检测网站进行检测的最终结果。

若域名库中不存在与目标域名相同的域名，则说明无法基于域名库判断待检测网站是否为非法网站，此时，基于预置的神经网络模型对目标域名进行检测，得到待检测网站的第一检测结果，其中，第一检测结果为待检测网站为合法网站，或待检测网站为非法网站。

需要说明的是，对于非法网站来说，其域名虽然经常变换，但通常具有一定的特征，特征之一为其域名由程序产生，特征之二为域名便于用于辨认，由于神经网络模型可以自动学习并发现该特征，因此采用神经网络模型对目标域名进行检测能够提高检测的准确率。

步骤203，若所述第一检测结果为所述待检测网站为非法网站，则根据所述待检测网站的页面内容获取所述待检测网站的第二检测结果，所述第二检测结果为所述待检测网站为合法网站或非法网站。

具体地，为了进一步保证检测结果的准确率，避免合法网站被神经网络模型误认为非法网站进而被封堵，若基于神经网络模型对目标域名进行检测的第一检测结果为待检测网站为非法网站，则进行二次检测，即主动访问待检测网站，根据待检测网站返回的页面内容得到待检测网站的第二检测结果，其中，第二检测结果为待检测网站为合法网站，或待检测网站为非法网站。

其中，根据待检测网站返回的页面内容得到待检测网站的第二检测结果具体可以为：判断页面内容中是否含有非法的词语、图片或视频，若含有，则确定第二检测结果为待检测网站为非法网站，否则确定第二检测结果为待检测网站为合法网站。

需要说明的是，由于在众多网站中，非法网站相较于合法网站来说数量非常少，因此被神经网络模型检测为非法网站的网站数量非常少，即需要进行二次检测的网站数量非常少，因此两次检测过程所占用的检测资源和时间也非常少，从而在保证检测结果准确率的基础上，还能够保证检测的时效性。

步骤204，将所述第二检测结果作为对所述待检测网站进行检测的最终结果。

具体地，若第二检测结果为待检测网站为合法网站，则将待检测网站为合法网站作为对待检测网站进行检测的最终结果，若第二检测结果为待检测网站为非法网站，则将待检测网站为非法网站作为对待检测网站进行检测的最终结果。

本发明实施例提供的方法，将待检测网站的域名与预置的域名库进行比对，若域名库中不存在与目标域名相同的域名，则基于预置的神经网络模型对目标域名进行检测以得到待检测网站的第一检测结果，并在第一检测结果为待检测网站为非法网站时，根据待检测网站的页面内容获取待检测网站的第二检测结果，并将第二检测结果作为对待检测网站进行检测的最终结果。通过将域名库比对、神经网络模型检测和页面内容检测等方式相结合以共同用于对待检测网站进行检测，能够提高检测结果的准确率。

基于上述实施例，本发明实施例提供的方法在基于预置的神经网络模型对所述目标网站进行检测之前还包括：

获取若干样本域名。

具体地，样本域名优选为非法网站的域名。样本域名的获取方式有多种，例如，将非法域名库中的域名作为样本域名；又例如，获取用户实时流量并对其进行解析得到其携带的域名，根据域名对应的网站的页面内容判断该网站是否为非法网站，若是，则将该域名作为样本域名；还例如，获取预设时间段内的用户流量并对其进行解析得到其携带的若干域名和每一域名的访问量，获取访问量较小的域名对应的网站的页面内容并根据页面内容判断该网站是否为非法网站，若是，则将该域名作为样本域名。其中，用户流量包括http请求报文、https请求报文和dns响应报文等报文中的任意一种或多种，此处不对其进行限定。

将每一所述样本域名及对应的样本网站的名称的和样本标签组成一个训练样本，得到若干所述训练样本；其中，所述样本标签用于标记所述样本网站为合法网站或非法网站。

具体地，将作为样本域名的域名所对应的网站称为样本域名对应的样本网站，样本网站的名称优选为网站标题，样本标签用于标记样本网站为合法网站或非法网站。需要说明的是，样本标签具体可以表示为数字，例如，使用0标记样本网站为合法网站，使用1标记样本网站为非法网站。将一个样本域名、该样本域名对应的样本网站的名称和样本标签组成一个训练样本，对获取的每一样本域名依次执行上述操作，则可得到若干训练样本。

将若干所述训练样本组成训练集，并基于所述训练集训练所述神经网络模型。

基于上述实施例，获取若干样本域名包括：

获取预设时间段内的用户流量。

具体地，预设时间段通常为包含多个小时的时间段，例如24小时，预设时间段所包含的小时数可根据实际情况进行灵活调整，通常大于或等于24小时，此处不对其进行限定。用户流量包括http请求报文、https请求报文和dns响应报文等报文中的任意一种或多种，此处不对其进行限定。

对所述用户流量进行解析，得到所述用户流量中携带的若干域名和每一域名的访问量。

将若干域名按照访问量由高到低的顺序进行排名，并将名次低于预设名次的每一域名作为待分析域名。

具体地，预设名次可以根据解析出的域名的数量与预设比例相乘得到，例如，域名的数量为1000，预设比例为80%，则预设名次为800，此时将1000个域名按照访问量由高到低的顺序进行排名，其中，访问量最高的域名的名次为名次1，访问量最低的域名的名次为1000，名次1000低于名次1，将名次低于800的域名也即名次为801-1000之间的每一域名作为待分析域名。

需要说明的是，由于非法网站的域名通常仅被极少数用户知晓，且其域名经常变换，因此其域名的访问量相较于合法网站来说更小，相应地，其域名的访问量的名次靠后，因此，为了节省检测所需的计算资源、时间和成本，本发明实施例选取访问量靠后的域名进行后续检测，且预设比例可根据用户流量的大小和/或执行该方法的装置自身的网络带宽确定，通常优选为80%-100%之间的百分比。

判断所述域名库中是否存在与所述待分析域名相同的域名，若不存在，则根据所述待分析域名对应的网站的页面内容获取所述网站的第三检测结果，所述第三检测结果为所述网站为合法网站或非法网站。

具体地，依次将域名库中的每一域名与待分析域名进行比对以判断两者是否相同，若判断两者相同，即判断域名库中存在与目标域名相同的域名，则停止比对，并针对下一个待分析域名执行上述比对流程。

若域名库中不存在与待分析域名相同的域名，则主动访问待分析域名对应的网站，根据该网站返回的页面内容得到该网站的第三检测结果，其中，第三检测结果为该网站为合法网站，或该网站为非法网站。

若所述第三检测结果为所述网站为非法网站，则将所述待分析域名作为所述样本域名，得到若干所述样本域名。

具体地，若第三检测结果为该网站为非法网站，则将待分析域名作为样本域名，对每一待分析域名依次执行上述操作，则可得到若干样本域名。

基于上述实施例，本发明实施例中的所述域名库包括合法域名库和非法域名库，所述合法域名库中存储有若干合法网站的域名，所述非法域名库中存储有若干非法网站的域名，所述非法网站的检测方法还包括：

若所述第三检测结果为所述网站为非法网站，则将所述待分析域名存储至所述非法域名库。

具体地，在构建训练集的过程中，还可对合法域名库进行更新，例如，对于一个待分析域名来说，若域名库中不存在与该待分析域名相同的域名，且根据该待分析域名对应的网站的页面内容判断该网站为合法网站，则将该待分析域名存储至合法域名库以对合法域名库进行更新。

若所述第三检测结果为所述网站为合法网站，则将所述待分析域名存储至所述合法域名库。

具体地，在构建训练集的过程中，还可对非法域名库进行更新，例如，对于一个待分析域名来说，若域名库中不存在与该待分析域名相同的域名，且根据该待分析域名对应的网站的页面内容判断该网站为非法网站，则将该待分析域名存储至非法域名库以对非法域名库进行更新。

基于上述实施例，所述非法网站的检测方法还包括：

遍历所述训练集。

具体地，可预先设定时间周期并根据时间周期定时遍历训练集，还可随机设定遍历训练集的时刻，此处不对其进行限定。

获取所述训练集中的所述样本网站的名称的种类，判断所述种类与上一次遍历所获取的所述种类是否相同。

若不同，则基于所述训练集重新训练所述神经网络模型。

需要说明的是，在其他实施例中，还可以在训练集发生其他情况的变化时才对神经网络模型进行重新训练，例如，遍历所述训练集，获取所述训练集中的所述样本网站的名称的种类，判断所述种类与上一次遍历所获取的所述种类是否相同，若不同，则判断所述训练集中是否至少存在一类名称所对应的样本域名的数量超过预设阈值，例如1000，若存在，则基于所述训练集对所述神经网络模型进行重新训练。

基于上述实施例，所述非法网站的检测方法还包括：

若所述合法域名库中存在与所述目标域名相同的域名，则将所述待检测网站为合法网站的检测结果作为对所述待检测网站进行检测的最终结果。

若所述非法域名库中存在与所述目标域名相同的域名，则将所述待检测网站为非法网站的检测结果作为对所述待检测网站进行检测的最终结果。

若所述第一检测结果为所述待检测网站为合法网站，则将所述待检测网站为合法网站的检测结果作为对所述待检测网站进行检测的最终结果。

与上述实施例中仅对一个网站进行检测的方法不同的是，本发明实施例提供的方法还可对多个网站进行检测，即，所述非法网站的检测方法还包括：

获取第一域名集合，所述第一域名集合包括多个域名。

具体地，根据用户实时流量或预设时间段内的用户流量还可解析出多个域名，第一域名集合即为包含所解析出的多个域名的集合。

将所述第一域名集合与所述域名库进行比对，将所述第一域名集合中与所述域名库中的域名相同的域名剔除，得到第二域名集合。

具体地，依次将第一域名集合中的一个域名与域名库中的域名进行比对，若在域名库中发现了与第一域名集合中的域名相同的域名，则剔除第一域名集合中的该域名，对第一域名集合中的每一域名执行上述比对流程，将第一域名集合中未被剔除的各域名所组成的集合称为第二域名集合。

基于所述神经网络模型对所述第二域名集合中的各域名分别进行检测，以将所述第二域名集合中的各域名对应的网站划分为初始合法网站集合和初始非法网站集合。

具体地，基于神经网络模型可对第二域名集合中的各域名分别进行检测，以判断该域名对应的网站为合法网站或非法网站，将判断出的所有合法网站所组成的集合称为初始合法网站集合，将判断出的所有非法网站所组成的集合称为初始非法网站集合。

根据所述初始非法网站集合中的各网站的页面内容，确定所述非法初始网站集合中的各网站的第四检测结果，所述第四检测结果为所述初始非法网站集合中的各网站为合法网站或非法网站。

具体地，对于初始非法网站集合，根据其中每一网站的页面内容判定该网站为合法网站或非法网站，并将判定结果作为对该网站的最终检测结果。

选取所述初始合法网站中的预设比例的网站集合。

具体地，对于初始合法网站，为了避免神经网络模型误将非法网站判定为合法网站，提高检测的准确性，此处将从初始合法网站集合中选取预设比例的网站集合，需要说明的是，预设比例通常可根据实际情况进行调整，此处不对其进行限定。

具体地，将初始合法网站中的预设比例的网站集合中各网站对应的域名发送给预先确定的多个终端，使每个终端的持有者主动访问接收到的域名所对应的网站，通过查看该网站的页面内容得到该网站的第五检测结果，其中，第五检测结果为该网站为合法网站或非法网站。

图3为本发明实施例提供的非法网站的检测装置的结构示意图，如图3所示，该装置包括：

获取模块301，用于获取待检测网站的目标域名和预置的域名库，所述域名库中存储有若干合法网站的域名和若干非法网站的域名；第一检测模块302，用于判断所述域名库中是否存在与所述目标域名相同的域名，若不存在，则基于预置的神经网络模型对所述目标网站进行检测，得到所述待检测网站的第一检测结果，所述第一检测结果为所述待检测网站为合法网站或非法网站；第二检测模块303，用于若所述第一检测结果为所述待检测网站为非法网站，则根据所述待检测网站的页面内容获取所述待检测网站的第二检测结果，所述第二检测结果为所述待检测网站为合法网站或非法网站；结果确定模块304，用于将所述第二检测结果作为对所述待检测网站进行检测的最终结果。

需要说明的是，本发明实施例提供的装置用于执行上述非法网站的检测方法的步骤，此处不再进行赘述。本发明实施例提供的装置，将待检测网站的域名与预置的域名库进行比对，若域名库中不存在与目标域名相同的域名，则基于预置的神经网络模型对目标域名进行检测以得到待检测网站的第一检测结果，并在第一检测结果为待检测网站为非法网站时，根据待检测网站的页面内容获取待检测网站的第二检测结果，并将第二检测结果作为对待检测网站进行检测的最终结果。通过将域名库比对、神经网络模型检测和页面内容检测等方式相结合以共同用于对待检测网站进行检测，能够提高检测结果的准确率。

图4为本发明实施例提供的电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器(processor)401、通信接口(communicationsinterface)402、存储器(memory)403和通信总线404，其中，处理器401，通信接口402，存储器403通过通信总线404完成相互间的通信。处理器401可以调用存储在存储器403上并可在处理器401上运行的计算机程序，以执行上述各实施例提供的方法，例如包括：获取待检测网站的目标域名和预置的域名库，所述域名库中存储有若干合法网站的域名和若干非法网站的域名；判断所述域名库中是否存在与所述目标域名相同的域名，若不存在，则基于预置的神经网络模型对所述目标网站进行检测，得到所述待检测网站的第一检测结果，所述第一检测结果为所述待检测网站为合法网站或非法网站；若所述第一检测结果为所述待检测网站为非法网站，则根据所述待检测网站的页面内容获取所述待检测网站的第二检测结果，所述第二检测结果为所述待检测网站为合法网站或非法网站；将所述第二检测结果作为对所述待检测网站进行检测的最终结果。

此外，上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器（rom，read-onlymemory）、随机存取存储器（ram，randomaccessmemory）、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法，例如包括：获取待检测网站的目标域名和预置的域名库，所述域名库中存储有若干合法网站的域名和若干非法网站的域名；判断所述域名库中是否存在与所述目标域名相同的域名，若不存在，则基于预置的神经网络模型对所述目标网站进行检测，得到所述待检测网站的第一检测结果，所述第一检测结果为所述待检测网站为合法网站或非法网站；若所述第一检测结果为所述待检测网站为非法网站，则根据所述待检测网站的页面内容获取所述待检测网站的第二检测结果，所述第二检测结果为所述待检测网站为合法网站或非法网站；将所述第二检测结果作为对所述待检测网站进行检测的最终结果。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程波;叶志钢
技术所有人：武汉绿色网络信息服务有限责任公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。