数据防爬方法、装置、设备及计算机可读存储介质与流程

文档序号：22500964发布日期：2020-10-13 09:33阅读：115来源：国知局

本发明涉及数据处理技术领域，尤其涉及一种数据防爬方法、装置、设备及计算机可读存储介质。

背景技术：

互联网数据安全一直是一个比较棘手的问题，黑客或者竞争对手往往会使用网络爬虫来非法获取公司的商业信息。网络爬虫是一种获取网页内容的程序，通过网页的链接地址来寻找网页。目前爬虫技术已经很成熟，通过设定的规则，爬虫可以轻易地抓取页面源代码中一些重要信息。目前，针对平安车险报价信息，已采取了一些防护措施，主要通过黑白名单的形式进行限制，这种方式限制了一大批非法访问系统报价信息的请求。但是不法分子的攻击形式也会升级。不法分子通过利用一些虚拟ip、机器模拟、切换基础参数等各种方式来获取敏感数据，因此，如何解决敏感数据的数据安全性低下的技术问题，成为了目前亟待解决的技术问题。

技术实现要素：

本发明的主要目的在于提供一种数据防爬方法、装置、设备及计算机可读存储介质，旨在解决敏感数据的数据安全性低下的技术问题。

为实现上述目的，本发明提供一种数据防爬方法，所述数据防爬方法包括以下步骤：

在接收到目标数据访问请求时，获取基于所述目标数据访问请求所确定的基础信息；

判断所述基础信息是否满足预设防爬规则，其中，所述防爬规则包括基础规则与基于大数据用户画像模型所制定的优化规则；

若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级；

在所述风险等级为高风险等级时，终止所述目标数据访问请求的发送端对目标数据的访问。

可选地，所述判断所述基础信息是否满足预设防爬规则的步骤包括：

在检测到所述基础信息满足所述基础规则时，将所述基础信息输入所述大数据用户画像模型，以得到所述基础信息对应的风险评分；

判断所述风险评分是否低于预设低风险阈值；

若是，则判定所述基础信息满足所述防爬规则。

可选地，所述大数据用户画像模型基于贝叶斯理论所创建；

设定x代表所述目标数据访问请求的发送端，y1至yn代表预设的n种用户群体类型，每一用户群体类型分别对应不同的风险评分，p(y1|x)至p(yn|x)分别代表所述目标数据访问请求的发送端对应的n种不同用户群体类型的概率值，p(yk|x)代表在所述n种不同用户群体类型的概率值中数值最大的用户群体概率；

用于判定所述目标数据访问请求的发送端对应的用户群体类型的公式为：

p(yk|x)＝max{p(y1|x),p(y2|x),...,p(yn|x)}，x∈yk。

可选地，所述若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级的步骤之后，还包括：

在所述风险等级为中风险等级时，根据所述优化规则中的预设ai人脸识别算法对所述基础信息中的面部信息进行识别；

在识别出所述面部信息与预设已授权的人脸面部数据不匹配时，终止所述目标数据访问请求的发送端对所述目标数据的访问。

可选地，所述若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级的步骤之后，还包括：

在所述风险等级为低风险等级时，输出交互验证信息，以在所述目标数据访问请求的发送端未通过基于所述交互验证信息的验证时，终止所述目标数据访问请求的发送端对所述目标数据的访问。

可选地，所述若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级的步骤之后，还包括：

将不满足所述防爬规则的基础信息保存至所述防爬规则的存储端，以利用未通过所述防爬规则的基础信息优化所述防爬规则中的优化规则。

可选地，所述判断所述基础信息是否满足预设防爬规则的步骤之后，还包括：

若所述基础信息满足所述防爬规则，则向所述目标数据访问请求的发送端开放所述目标数据的访问权限，其中，所述目标数据存储于区块链中。

此外，为实现上述目的，本发明还提供一种数据防爬方法装置，所述数据防爬方法装置包括：

基础信息获取模块，用于在接收到目标数据访问请求时，获取基于所述目标数据访问请求所确定的基础信息；

防爬规则判断模块，用于判断所述基础信息是否满足预设防爬规则，其中，所述防爬规则包括基础规则与基于大数据用户画像模型所制定的优化规则；

风险等级确定模块，用于若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级；

数据访问终止模块，用于在所述风险等级为高风险等级时，终止所述目标数据访问请求的发送端对目标数据的访问。

可选地，所述防爬规则判断模块包括：

用户画像判断单元，用于在检测到所述基础信息满足所述基础规则时，将所述基础信息输入所述大数据用户画像模型，以得到所述基础信息对应的风险评分；

风险阈值判断单元，用于判断所述风险评分是否低于预设低风险阈值；

判定通过单元，用于若是，则判定所述基础信息满足所述防爬规则。

可选地，所述数据防爬方法装置还包括：

用户模型创建模块，用于所述大数据用户画像模型基于贝叶斯理论所创建，设定x代表所述目标数据访问请求的发送端，y1至yn代表预设的n种用户群体类型，每一用户群体类型分别对应不同的风险评分，p(y1|x)至p(yn|x)分别代表所述目标数据访问请求的发送端对应的n种不同用户群体类型的概率值，p(yk|x)代表在所述n种不同用户群体类型的概率值中数值最大的用户群体概率；

用于判定所述目标数据访问请求的发送端对应的用户群体类型的公式为：

p(yk|x)＝max{p(y1|x),p(y2|x),...,p(yn|x)}，x∈yk。

可选地，所述数据防爬方法装置还包括：

人脸数据识别模块，用于在所述风险等级为中风险等级时，根据所述优化规则中的预设ai人脸识别算法对所述基础信息中的面部信息进行识别；

在识别出所述面部信息与预设已授权的人脸面部数据不匹配时，终止所述目标数据访问请求的发送端对所述目标数据的访问。

可选地，所述数据防爬方法装置还包括：

交互信息验证模块，用于在所述风险等级为低风险等级时，输出交互验证信息，以在所述目标数据访问请求的发送端未通过基于所述交互验证信息的验证时，终止所述目标数据访问请求的发送端对所述目标数据的访问。

可选地，所述数据防爬方法装置还包括：

数据样本优化模块，用于将不满足所述防爬规则的基础信息保存至所述防爬规则的存储端，以利用未通过所述防爬规则的基础信息优化所述防爬规则中的优化规则。

可选地，所述数据防爬方法装置还包括：

访问权限开放模块，用于若所述基础信息满足所述防爬规则，则向所述目标数据访问请求的发送端开放所述目标数据的访问权限，其中，所述目标数据存储于区块链中。

此外，为实现上述目的，本发明还提供一种数据防爬方法设备，所述数据防爬方法设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的数据防爬方法程序，其中所述数据防爬方法程序被所述处理器执行时，实现如上述的数据防爬方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有数据防爬方法程序，其中所述数据防爬方法程序被处理器执行时，实现如上述的数据防爬方法的步骤。

本发明提供一种数据防爬方法、装置、设备及计算机可读存储介质。所述数据防爬方法通过在接收到目标数据访问请求时，获取基于所述目标数据访问请求所确定的基础信息；判断所述基础信息是否满足预设防爬规则，其中，所述防爬规则包括基础规则与基于大数据用户画像模型所制定的优化规则；若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级；在所述风险等级为高风险等级时，终止所述目标数据访问请求的发送端对目标数据的访问。通过上述方式，本发明能够灵活定义及集成各种防爬方案来作为预设防爬规则，可合理利用基于大数据技术创建的用户画像模型在原有的基础的防爬规则的基础上进行优化补充，以对访问请求方的基础信息进行更为有效的判断；通过确定基础信息的风险等级，并直接终止高风险的基础信息所对应的访问请求方的数据访问请求，能够更大程度地限制住了非法用户请求，降低了敏感数据被直接爬取的可能性，提高了敏感数据的安全性，从而解决了敏感数据的数据安全性低下的技术问题。

附图说明

图1为本发明实施例方案中涉及的数据防爬方法设备的硬件结构示意图；

图2为本发明数据防爬方法第一实施例的流程示意图；

图3为本发明数据防爬方法第二实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例涉及的数据防爬方法主要应用于数据防爬方法设备，该数据防爬方法设备可以是pc、便携计算机、移动终端等具有显示和处理功能的设备。

参照图1，图1为本发明实施例方案中涉及的数据防爬方法设备的硬件结构示意图。本发明实施例中，数据防爬方法设备可以包括处理器1001(例如cpu)，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)；网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)；存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的硬件结构并不构成对数据防爬方法设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及数据防爬方法程序。

在图1中，网络通信模块主要用于连接服务器，与服务器进行数据通信；而处理器1001可以调用存储器1005中存储的数据防爬方法程序，并执行以下操作：

在接收到目标数据访问请求时，获取基于所述目标数据访问请求所确定的基础信息；

判断所述基础信息是否满足预设防爬规则，其中，所述防爬规则包括基础规则与基于大数据用户画像模型所制定的优化规则；

若所述基础信息不满足所述防爬规则，则确定所述基础信息的风险等级；

在所述风险等级为高风险等级时，终止所述目标数据访问请求的发送端对目标数据的访问。