数据评估方法和装置、服务器、存储介质与流程

文档序号：15493455发布日期：2018-09-21 21:07阅读：213来源：国知局

本发明实施例涉及互联网
技术领域：
，尤其涉及一种数据评估方法和装置、服务器、存储介质。
背景技术：
：互联网的发展使得各种领域、各种应用的数据海量增长。在这些数据中有一些是用户的使用数据，有一些是需要向用户展现或供用户查询的数据。例如，在地图或生活服务类应用中，地理位置、商家名称、商家电话以及服务介绍等数据都是要向用户展现并供用户查询的，因此，这些数据的准确性直接影响了用户的体验，而这些数据通常是由商家或其他主体单位上传的，通过对数据进行可靠性和安全性的评估、审核，可以为高质量的数据提供有效保障。然而目前，对数据的评估通常还处于人工阶段，例如，对于用户字段的审核，通常是人工整理出黑名单，通过黑名单来阻止恶意用户再次提交数据，而对于电话字段的审核，通常是人工拨打电话试错的方式来确定电话是否可信，若不可信则可加入黑名单，之后利用黑名单来排除不可信的电话。上述方法均存在效率低、不及时的问题，而且，有一些恶意用户或者恶意电话，审核人员可能根本就无法识别出来，从而制约了数据评估与审核的质量和效率。技术实现要素：本发明实施例提供一种数据评估方法和装置、服务器、存储介质，以解决现有技术中数据评估效率低、不及时以及无法确保数据质量的问题。第一方面，本发明实施例提供了一种数据评估方法，该方法包括：根据预设策略拦截存在不可信用户或不可信电话的数据；对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度；根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。第二方面，本发明实施例还提供了一种数据评估装置，该装置包括：拦截模块，用于根据预设策略拦截存在不可信用户或不可信电话的数据；可信度获取模块，用于对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度；风险程度确定模块，用于根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。第三方面，本发明实施例还提供了一种服务器，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任一实施例所述的数据评估方法。第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任一实施例所述的数据评估方法。本发明实施例通过对存在不可信用户或不可信电话的数据进行直接拦截，对于不存在不可信用户或不可信电话的目标数据，通过预先建立的用户信用库和电话信用库获取目标数据的用户可信度和电话可信度，并据此计算出目标数据的整体可信度，从而映射出目标数据的风险程度，该风险程度可以为人工评估目标数据提供参考，使得评估人员可以根据风险程度的不同而采取不同的审核操作，进一步提高了评估与审核的效率和准确度。附图说明图1是本发明实施例一提供的数据评估方法的流程图；图2是本发明实施例二提供的数据评估方法的流程图；图3是本发明实施例三提供的数据评估方法的流程图；图4是本发明实施例四提供的数据评估装置的结构示意图；图5是本发明实施例五提供的一种服务器的结构示意图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。实施例一图1是本发明实施例一提供的数据评估方法的流程图，本实施例可适用于对商家上传的数据进行评估、审核的情况，该方法可以由数据评估装置来执行，该装置可以采用软件和/或硬件的方式实现，并可集成在服务器中。如图1所示，该方法具体包括：s110、根据预设策略拦截存在不可信用户或不可信电话的数据。所述预设策略是指能够明确用户或电话属于不可信范畴而进行拦截的策略。例如，如果数据中的用户或电话属于预设黑名单中的用户或电话，则可以直接根据黑名单对该数据进行拦截。本实施例对该拦截策略不做任何限定。本实施例中的不可信用户是指上传数据的用户不可信。示例性的，所述不可信用户可以包括如下至少之一：命中用户黑名单、具有历史作弊行为或频繁递交数据。相应的拦截策略则可以通过判断是否属于用户黑名单，是否有历史作弊行为或是否属于频繁递交数据来决定是否进行拦截。其中，用户黑名单中记载了依据历史数据而整理出来的非法、不可信用户的名单；具有历史作弊行为是指某一用户在某一领域或应用曾经有过违法操作或作弊行为；频繁递交数据是指因为某种非法意图，多次在系统递交数据的情况。本实施例中的不可信电话是指用户上传的数据中的电话不可信。示例性的，所述不可信电话包括如下至少之一：电话格式错误、命中电话黑名单、命中第三方安全平台确定的诈骗电话、经模拟拨测确定为空号或存在于多个数据中。相应的拦截策略则可以通过判断电话格式是否错误、是否命中电话黑名单、是否命中第三方安全平台确定的诈骗电话、经模拟拨测是否为空号或者是否存在于多个数据中来决定是否进行拦截。其中，电话格式错误是指与国际上的电话格式均不符合的情况；电话黑名单中记载了依据历史数据而整理出来的非法、不可信用户的电话名单；第三方安全平台是专门用于坚定电话是否属于非法、不可信电话的平台，若第三方安全平台确定是诈骗电话，则可以直接拦截；模拟拨测是利用现有技术手段进行的针对某一电话的模拟拨号，从而可以鉴别出电话是否为空号；存在于多个数据中是指在收到的大量数据中，出现同一个电话号码的次数为多次。通过预设策略拦截存在不可信用户或不可信电话的数据，可以自动、高效地过滤掉低质量甚至是非法的数据，从而确保数据的质量。s120、对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度。有些数据可以通过预设策略直接进行拦截，有些数据则被过滤出来，作为不存在不可信用户或不可信电话的目标数据，但是这些目标数据并非都是高质量的安全数据，还需要进一步对其进行评估。具体的，预先会建立用户信用库和电话信用库，从用户信用库和电话信用库中可以获取到目标数据对应的用户可信度和电话可信度。该用户可信度和电话可信度用于评估用户和电话的安全可靠程度。s130、根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。用户和电话作为数据中的重要部分，根据用户可信度和电话可信度可以计算出目标数据的整体可信度，例如，通过求和来得到整体可信度。该整体可信度用于映射目标数据的风险程度，该风险程度传递给人工评估人员作为参考，人工评估人员若事先知道数据可信度的高低，则可以有效地提升审核的效率，通过对不能明确是否可信的数据进行分类和人工评估，从而进一步确保数据评估的准确度和数据的安全性。本实施例的技术方案通过对存在不可信用户或不可信电话的数据进行直接拦截，对于不存在不可信用户或不可信电话的目标数据，通过预先建立的用户信用库和电话信用库获取目标数据的用户可信度和电话可信度，并据此计算出目标数据的整体可信度，从而映射出目标数据的风险程度，该风险程度可以为人工评估目标数据提供参考，使得评估人员可以根据风险程度的不同而采取不同的审核操作，进一步提高了评估与审核的效率和准确度。实施例二图2是本发明实施例二提供的数据评估方法的流程图，本实施例是在上述实施例的基础上进一步进行优化。如图2所示，该方法具体包括：s200、获取预设时间段内的历史数据。历史数据是指在预设时间段内所有提交的数据信息，包括数据的内容以及数据通过与驳回的信息。预设时间段例如为3个月，本实施例对此不作限定。s210、依据所述历史数据，分别获取各用户和各电话通过的次数与驳回的次数。s220、依据各用户和各电话通过的次数与驳回的次数，计算各用户和各电话的数据通过比率。其中，可以计算通过的次数与驳回的次数的比值，该比值即为数据通过比率。s230、根据各用户的数据通过比率，在第一预设标准中映射得到各用户的信用值。s240、根据各电话的数据通过比率，在第二预设标准中映射得到各电话的信用值。表1通过驳回数据通过比率用户信用值＞40-90≤40-600≥3-00＜3-20＞0＞0(0,1]20＞0＞0(1,3]60＞0＞0＞390参考表1，表1示例性的给出了如何在第一预设标准中映射出用户的信用值。如表1所示，例如，当用户a的数据驳回次数或通过次数为0时，则无法计算得到数据通过比率，此时，根据通过次数或驳回次数的不同，分别映射出用户a信用值为90、60、0或20；当用户a的数据通过或驳回次数均大于0，则根据计算出来的数据通过比率所在的不同区间范围映射出用户a信用值分别为20、60或90。具体的，如表1中第4行所示，当用户a的数据没有一次通过，但驳回的次数大于等于3次，则说明用户a的可信度不高，可映射出用户a的用户信用值为0，也即用户a若下次再次提交数据，可以认为其可信度是最低的；再如表1中最后一行所示，当用户a的数据通过和驳回的次数均大于0，通过计算得知其数据通过的比率大于3，也即其多次提交的数据中，通过的次数远大于驳回的次数，可以认为用户a的可信度较高，映射出其用户信用值为90；以此类推，此处不再一一描述。需要说明的是，对于电话信用值的映射也可以根据表1或者类似表1的标准来进行。但是，表1仅仅是作为一个示例来说明，对于表1中的各项数据可以根据历史数据的情况进行调整，以便对数据的最终评估结果更加符合其真实情况。s250、根据各用户和各电话的信用值建立所述用户信用库和电话信用库。s260、根据预设策略拦截存在不可信用户或不可信电话的数据。s270、对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度。建立好的用户信用库和电话信用库记载了历史数据中出现过的数据中的用户和电话各自的信用值，可以供在线时使用，获取在线评估的目标数据对应的用户和电话的信用值，该信用值即用来衡量用户可信度和电话可信度。s280、根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。本实施例的技术方案利用历史数据预先建立用户信用库和电话信用库，以供在线对目标数据进行评估时获取目标数据的用户可信度和电话可信度，并据此计算出目标数据的整体可信度，从而映射出目标数据的风险程度，该风险程度可以为人工评估目标数据提供参考，使得评估人员可以根据风险程度的不同而采取不同的审核操作，进一步提高了评估与审核的效率和准确度。实施例三图3是本发明实施例三提供的数据评估方法的流程图，本实施例是在上述实施例的基础上进一步进行优化。如图3所示，该方法具体包括：s310、根据预设策略拦截存在不可信用户或不可信电话的数据。s320、对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度。s330、计算所述用户可信度和电话可信度的加权求和，得到目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，包括高可信、低可信和不确定，以为人工评估目标数据提供参考。其中，用户可信度和电话可信度各自的权重例如可以是50％与50％，也可以是40％与60％，可根据具体的应用场景以及历史数据的统计情况进行配置。对用户可信度和电话可信度进行加权求和，即得到目标数据的整体可信度。而由于数据通常都包含用户和电话两个重要维度，因此，从这两个重要维度来衡量数据整体是否可信、衡量数据的质量，可以达到更高的准确性。整体可信度可以映射出目标数据的风险程度，例如包括高可信、低可信和不确定，示例性的，其映射关系如下表2所示。表2整体可信度风险程度[1,20]低可信[21,80]不确定[81,99]高可信从表2中可以得知，当整体可信度在不同的区间时，映射出风险程度分别为低可信、不确定和高可信，其中，整体可信度的值越高，数据的可信度就越高，反之亦然。需要说明的是，整体可信度的不同区间值可以根据历史数据的统计情况进行调整，以便对数据的最终评估结果更加符合其真实情况。人工评估人员根据不同的风险程度可以进行分类处理，例如，对于低可信数据可以加重审核，对于高可信数据可以加快审核，对于不确定的数据则根据数据自身的情况适应性处理，从而可以提高数据评估的效率和准确度。此外，用户提交数据时候，还可以根据预先建立的信用库提示用户其当前的信用等级，对于高等级的用户，可以提高其用户权益，例如可提供加快审核服务等，反之亦然，严重者甚至会被禁止提交数据，以此来激励用户提交高质量的数据。在一种具体的实施方式中，可以由两个字段记录数据的评估情况，即数据预测打分score(范围在0-99)和数据状态status(1表示通过，0表示驳回)，其中，score对应整体可信度的分值，status对应数据最终的评估结果。在s310的自动审核拦截阶段，如果发现数据不可信(比如电话异常或用户违规)，会直接拦截，即score＝0，status＝0；在人工审核阶段(自动审核未被拦截的数据会进入该阶段，由人工判断)，score可以是[1,99]中任一数值，status则由人工最终确定等于0还是等于1。本实施例的技术方案结合自动审核阶段和人工审核阶段，在自动审核阶段对不可信数据直接拦截，在人工审核阶段，人工会根据系统根据预先建立的信用库自动计算出来的数据的整体可信度来分类处理，对高可信数据可加快处理，对低可信数据可加重处理，即以数据的风险程度作为参考，从而进一步提高了评估与审核的效率和准确度。实施例四图4是本发明实施例四提供的数据评估装置的结构示意图，本实施例可适用于对用户上传的数据进行评估、审核的情况。如图4所示，该装置包括拦截模块410、可信度获取模块420和风险程度确定模块430，其中：拦截模块410，用于根据预设策略拦截存在不可信用户或不可信电话的数据；可信度获取模块420，用于对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度；风险程度确定模块430，用于根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。本实施例的技术方案通过拦截模块对存在不可信用户或不可信电话的数据进行直接拦截，对于不存在不可信用户或不可信电话的目标数据，通过可信度获取模块从预先建立的用户信用库和电话信用库中获取目标数据的用户可信度和电话可信度，并通过风险程度确定模块据此计算出目标数据的整体可信度，从而映射出目标数据的风险程度，该风险程度可以为人工评估目标数据提供参考，使得评估人员可以根据风险程度的不同而采取不同的审核操作，进一步提高了评估与审核的效率和准确度。进一步的，所述不可信用户包括如下至少之一：命中用户黑名单、具有历史作弊行为或频繁递交数据。所述不可信电话包括如下至少之一：电话格式错误、命中电话黑名单、命中第三方安全平台确定的诈骗电话、经模拟拨测确定为空号或存在于多个数据中。进一步的，所述装置还包括信用库建立模块，用于建立所述用户信用库和电话信用库；其中，所述信用库建立模块具体包括：历史数据获取单元，用于获取预设时间段内的历史数据；通过与驳回次数获取单元，用于依据所述历史数据，分别获取各用户和各电话通过的次数与驳回的次数；通过比率计算单元，用于依据各用户和各电话通过的次数与驳回的次数，计算各用户和各电话的数据通过比率；用户信用值映射单元，用于根据各用户的数据通过比率，在第一预设标准中映射得到各用户的信用值；电话信用值映射单元，用于根据各电话的数据通过比率，在第二预设标准中映射得到各电话的信用值；信用库建立单元，用于根据各用户和各电话的信用值建立所述用户信用库和电话信用库。进一步的，风险程度确定模块430具体用于：计算所述用户可信度和电话可信度的加权求和，得到目标数据的整体可信度，其中，所述整体可信度映射出的目标数据的风险程度包括高可信、低可信和不确定。本发明实施例所提供的数据评估装置可执行本发明任意实施例所提供的数据评估方法，具备执行方法相应的功能模块和有益效果。实施例五图5是本发明实施例五提供的一种服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例性服务器512的框图。图5显示的服务器512仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。如图5所示，服务器512以通用服务器的形式表现。服务器512的组件可以包括但不限于：一个或者多个处理器516，存储装置528，连接不同系统组件(包括存储装置528和处理器516)的总线518。总线518表示几类总线结构中的一种或多种，包括存储装置总线或者存储装置控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(industrysubversivealliance，isa)总线，微通道体系结构(microchannelarchitecture，mac)总线，增强型isa总线、视频电子标准协会(videoelectronicsstandardsassociation，vesa)局域总线以及外围组件互连(peripheralcomponentinterconnect，pci)总线。服务器512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器512访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。存储装置528可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(randomaccessmemory，ram)530和/或高速缓存存储器532。服务器512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示，通常称为“硬盘驱动器”)。尽管图5中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘，例如只读光盘(compactdiscread-onlymemory，cd-rom),数字视盘(digitalvideodisc-readonlymemory，dvd-rom)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储装置528可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。具有一组(至少一个)程序模块542的程序/实用工具540，可以存储在例如存储装置528中，这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。服务器512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信，还可与一个或者多个使得用户能与该服务器512交互的设备通信，和/或与使得该服务器512能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口522进行。并且，服务器512还可以通过网络适配器520与一个或者多个网络(例如局域网(localareanetwork，lan)，广域网(wideareanetwork，wan)和/或公共网络，例如因特网)通信。如图5所示，网络适配器520通过总线518与服务器512的其它模块通信。应当明白，尽管图中未示出，可以结合服务器512使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(redundantarraysofindependentdisks，raid)系统、磁带驱动器以及数据备份存储系统等。处理器516通过运行存储在存储装置528中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的数据评估方法，该方法包括：根据预设策略拦截存在不可信用户或不可信电话的数据；对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度；根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。实施例六本发明实施例六还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例所提供的数据评估方法，该方法包括：根据预设策略拦截存在不可信用户或不可信电话的数据；对于不存在不可信用户或不可信电话的目标数据，则根据预先建立的用户信用库和电话信用库获取目标数据对应的用户可信度和电话可信度；根据所述用户可信度和电话可信度计算目标数据的整体可信度，其中，所述整体可信度用于映射目标数据的风险程度，以为人工评估目标数据提供参考。本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory，eprom，或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、射频(radiofrequency，rf)等等，或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冉煜;黄鹤南
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：一种智能晒场的制作方法
上一篇：一种离线式惯性测量数据采集装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。