学历信息验证方法以及装置与流程

文档序号:19419001发布日期:2019-12-14 01:13阅读:538来源:国知局
学历信息验证方法以及装置与流程

本申请涉及互联网技术领域,特别涉及一种学历信息验证方法。本申请同时涉及一种学历信息验证装置,一种计算设备,以及一种计算机可读存储介质。



背景技术:

随着互联网技术的发展,对用户的文化水平重视度也越来越高;无论是在用户迁户口,还是对用户进行工作面试,用户的学历信息都有着重要的作用,然而在应用到用户的学历信息的过程中,较为容易遇到用户提供的学历信息存在虚假的可能,无论是在经济上还是在时间上都会造成不必要的损失,即对用户的学历信息进行验证是较为重要的。

现有技术中,在对用户提供的学历信息进行验证的过程中,获取用户主动上传的学历信息以及用户的属性信息,根据用户的属性信息在学历信息查询网站中查询用户的真实学历信息,通过将真实学历信息和用户上传的学历信息进行对比,进而实现对用户上传的学历信息进行了验证。

然而,在通过学历信息查询网站查询用户的真实学历信息,并通过真实学历信息对用户上传的学历信息进行验证的过程中,将会消耗较长的时间才能够完成对学历信息的验证,并且在对大量学历信息进行验证的过程中,因为基数较大,短时间内通过学历信息查询网站对用户的学历信息进行验证,是很难实现的。



技术实现要素:

有鉴于此,本申请实施例提供了一种学历信息验证方法。本申请同时涉及一种学历信息验证装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。

根据本申请实施例的第一方面,提供了一种学历信息验证方法,包括:

获取用户上传的学历信息;

根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据;

通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

可选的,在所述属性数据包含位置数据的情况下,通过在所述位置维度对所述位置数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述位置数据获取所述用户的文本地址数据,以及所述学历信息中包含的地址数据;

计算所述文本地址数据与所述地址数据两者之间的文本地址重合度以及地理距离,并确定所述用户在所述时间段内查找所述地址数据的查询频次;

将所述文本地址重合度、所述地理距离以及所述查询频次作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述网络数据确定所述用户在所述时间段内的第一互联网协议地址;

通过对所述第一互联网协议地址进行解析,获得所述用户在所述时间段内的第一经纬度数据;

根据所述第一经纬度数据以及地图数据映射第一区域范围;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的第二互联网协议地址;

通过对所述第二互联网协议地址进行解析,获得所述学校的第二经纬度数据;

根据所述第二经纬度数据以及所述地图数据映射所述学校的第二区域范围;

计算所述第一区域范围与所述第二区域范围的相似度,将所述相似度作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

获取上传所述学历信息的用户终端连接网络的所述网络数据,并确定所述网络数据的服务集标识;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的基本服务集标识;

判断所述基本服务集标识是否包含所述服务集标识;

若是,将所述基本服务集标识包含所述服务集标识作为在所述位置维度的待验证数据;

若否,将所述基本服务集标识未包含所述服务集标识作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含社交数据的情况下,通过在所述行为维度对所述社交数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述社交数据确定所述用户在所述时间段内的社交网络数据;

检测所述社交网络数据中是否包含学历信息验证完成的用户;

若是,根据所述社交网络数据确定学历信息验证完成的用户与所述用户的关系数据,将所述关系数据作为在所述行为维度的待验证数据。

可选的,在所述属性数据包含行为数据的情况下,通过在所述行为维度对所述行为数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述行为数据确定所述用户在所述时间段内的信用数据;

基于所述信用数据确定所述用户的信用级别,将所述信用级别作为在所述行为维度的待验证数据。

可选的,在所述属性数据包含用户特征数据的情况下,通过在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述特征维度的待验证数据,包括:

根据所述用户特征数据确定所述用户的用户属性数据以及用户偏好数据;

检测所述用户属性数据以及所述用户偏好数据中是否包含学生属性数据;

若是,确定所述用户属性数据以及所述用户偏好数据中包含的学生属性数据,在所述用户属性数据以及所述用户偏好数据中提取所述学生属性数据作为在所述特征维度的待验证数据。

可选的,所述验证模型通过如下方式训练:

采集用户的学历信息,并确定所述学历信息对应的属性数据以及所述学历信息的验证结果;

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据以及所述学历信息的验证结果作为训练样本;

通过将所述训练样本输入至所述验证模型进行训练,确定所述待验证数据与所述学历信息的验证结果的关联关系。

可选的,所述属性数据包括下述至少一项:

位置数据、网络数据、社交数据、行为数据以及用户特征数据;

相应的,所述通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,包括:

通过在所述位置维度对所述位置数据以及所述网络数据进行分析,在所述行为维度对所述社交数据以及所述行为数据进行分析,在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述位置维度的第一待验证数据,在所述行为维度的第二待验证数据,在所述特征维度的第三待验证数据;

将所述第一待验证数据、所述第二待验证数据以及所述第三待验证数据、进行整合,根据整合结果确定所述待验证数据。

可选的,所述学历信息包含下述至少一项:

就读时间信息、就读学校名称信息、就读学校地址信息、就读学校办学属性信息以及就读学校历史变动信息。

可选的,所述通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,包括:

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,获得在各个维度的分析结果;

判断所述各个维度的分析结果是否均满足对应维度的预设阈值;

若否,根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤;

若是,根据所述分析结果确定所述学历信息的预测验证结果,以及根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤。

可选的,所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤执行之后,还包括:

判断所述预测验证结果与所述验证结果是否一致;

若否,将所述待验证数据以及所述学历信息的验证结果作为负训练样本,对所述验证模型进行训练;

若是,将所述待验证数据以及所述学历信息的验证结果作为正训练样本,对所述验证模型进行训练。

根据本申请实施例的第二方面,提供了一种学历信息验证装置,包括:

获取学历信息模块,被配置为获取用户上传的学历信息;

确定属性数据模块,被配置为根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据;

确定待验证数据模块,被配置为通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

验证学历信息模块,被配置为将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

根据本申请实施例的第三方面,提供了一种计算设备,包括:

存储器和处理器;

所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:

获取用户上传的学历信息;

根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据;

通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述学历信息验证方法的步骤。

本申请提供的学历信息验证方法,获取用户上传的学历信息,根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据,通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

本申请提供的学历信息验证方法中,通过确定所述用户的属性数据,并在不同的维度对所述属性数据进行分析,实现了可以在不同的维度确定所述用户的待验证数据,同时结合所述验证模型并将所述待验证数据作为所述验证模型的输入,所述验证模型的输出为所述学历信息的验证结果,实现了可以在较短的时间确定用户上传的学历信息的真实性,并且通过在不同的维度对用户的属性数据进行分析,有效的提高了所述学历信息验证结果的准确性。

附图说明

图1是本申请一实施例提供的一种学历信息验证方法的流程图;

图2是本申请一实施例提供的一种学历信息验证过程的处理流程图;

图3是本申请一实施例提供的一种学历信息验证装置的结构示意图;

图4是本申请一实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。

在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先,对本发明一个或多个实施例涉及的名词术语进行解释。

lbs:(locationbasedservice,基于位置的服务)是通过电信移动运营商的无线电通讯网络(如gsm(globalsystemformobilecommunications全球移动通信系统)网)或外部定位方式(如gps(globalpositioningsystem,全球定位系统))获取移动终端用户的位置信息(地理坐标,或大地坐标),在gis(geographicinformationsystem,地理信息系统)平台的支持下,为用户提供相应服务的一种增值业务。

poi:(pointofinterest,信息点),在地理信息系统中,一个poi可以是一栋房子、一个商铺、一个邮筒、一个公交站等,并且每个poi包含四方面信息,名称、类别、坐标、分类。

ip:(internetprotocol,互联网协议地址)是分配给用户上网使用的网际协议的设备的数字标签。

ssid:(servicesetidentifier,服务集标识)ssid技术可以将一个无线局域网分为几个需要不同身份验证的子网络,每一个子网络都需要独立的身份验证,只有通过身份验证的用户才可以进入相应的子网络,防止未被授权的用户进入本网络。并且在实际应用中,只有设置为名称相同ssid的值的终端才能互相通信。

bssid:(basicservicesetidentifier,基本服务集标识)它是一个长度为48位的二进制标识符,用来识别不同的bss(basicserviceset,基本服务集),其主要优点是它可以作为过滤之用。

在本申请中,提供了一种学历信息验证方法,本申请同时涉及一种学历信息验证装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。

图1示出了根据本申请一实施例提供的一种学历信息验证方法的流程图,包括步骤102至步骤108。

步骤102:获取用户上传的学历信息。

本申请一实施例中所述用户是指需要进行学历信息验证的用户,所述学历信息是指用户的教育经历,本实施例的一个或多个实施方式中,所述学历信息可以包含用户的就读时间信息、就读学校名称信息、就读学校地址信息、就读学校办学属性信息以及就读学校历史变动信息等信息,其中,所述就读时间信息为用户的受教育时间,所述就读学校历史变动信息为用户就读的学校在用户就读期间或者毕业后,出现过的具体的变动信息,例如学校名称更改、校址发生变化、学校发生拆分或者合并等变化的信息为就读学校的历史变动信息。

此处,以所述用户为应聘人员为例,对所述学历信息验证方法进行描述;基于此,在用户进行应聘的过程中,为了防止用户提供虚假学历信息,需要对用户提供的学历信息进行验证,在此过程中,通过对用户提供的学历信息进行验证其真实性,可以确认用户的信用,并且可以通过学历信息确定用户是否胜任其应聘的岗位,进而保证了应聘公司可以招聘到优质的员工。

本申请提供的学历信息验证方法,为了能够在保证验证用户的学历信息准确的情况下,还可以提高学历信息的验证效率,通过确定所述用户的属性数据,并在不同的维度对所述属性数据进行分析,实现了可以在不同的维度确定所述用户的待验证数据,同时结合所述验证模型并将所述待验证数据作为所述验证模型的输入,所述验证模型的输出为所述学历信息的验证结果,实现了可以在较短的时间确定用户上传的学历信息的真实性,并且通过在不同的维度对用户的属性数据进行分析,有效的提高了所述学历信息验证结果的准确性。

基于此,在验证用户学历信息的服务平台中,集成了全部高等学校、专科学校、研究院、成人教育学院等学校,通过将每个学校的所属地区、办学属性、教育水平信息进行整合确定每个学校的属性信息,并获取每个学校的poi信息、经纬度信息、文本地址信息进行整合确定每个学校的域名信息,实现了在验证用户学历信息的服务平台中提供了验证基础,可以有效的提高验证用户提供的学历信息的真实性。

除此之外,在某些特征场景中,可能需要对大量的用户的学历信息进行验证。例如通过真实的学历信息为用户提高其信用积分,在此情况下,通过本申请提供的学历信息验证方法可以有效的提高验证大量用户的学历信息的真实性,进而实现高效率验证学历信息的效果。

步骤104:根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据。

具体的,根据上述获取所述用户上传的学历信息的基础上,进一步的,根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据,其中,所述时间信息具体是指用户上传的学历信息中记录的在就读学校中的就读时间,所述属性数据具体是指用户在就读时间段内的属性数据,包括用户的位置数据,用户经常使用网络的网络数据,用户社交关系的社交数据,用户喜欢的运动以及购物情况的行为数据以及用户个人特征的特征数据。

基于此,确定所述用户在就读时间内的位置数据具体是指用户在上学期间的所在位置最多的位置信息;所述用户在就读时间内的网络数据具体是指用户在上学期间使用频次最多的网络信息;所述用户在就读时间内的社交数据具体是指用户在上学期间的社交网络信息;所述用户在就读时间内的行为数据具体是指用户在上学期间的运动信息和网购信息;所述用户在就读时间内的特征数据具体是指用户的年龄信息和教育信息。

除此之外,所述网络数据中还可以包含用户认证邮箱数据、用户网络用时数据等数据,所述行为数据还可以包含用户资产情况、履约情况、转账记录、金融借贷等数据,具体包含内容可以根据实际应用场景进行确认,本申请在此不做任何限定。

例如,用户上传的学历信息中包括:a大学毕业,于2014年7月1日至2018年7月1日在本校计算机专业接受教育,则根据就读时间2014年7月1日至2018年7月1日,确定用户在这4年中的位置数据、网络数据、行为数据、社交数据以及特征数据,即确定用户在这4年中使用频次最多的位置信息和网络信息,用户运动信息和购物信息,用户社交关系信息以及用户个人信息。

除此之外,在确定所述用户在所述时间段内的属性数据之外,还可以确定用户的实时属性数据,通过对实时的用户的属性数据进行后续的处理,进而可以判断出用户是否为在校学生,在确定用户是否为在校学生的服务当中,本申请提供的学历信息验证方法也起着重要的作用。

步骤106:通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据。

具体的,在上述确定用户在所述时间段内的属性数据的基础上,进一步的,根据所述属性数据中包含的数据,分别在所述位置维度、行为维度以及特征维度对所述属性数据中包含的数据在对应的维度进行分析,根据分析结果确定需要输入所述验证模型的待验证数据。

基于此,在所述属性数据中包含位置数据、网络数据、社交数据、行为数据以及用户特征数据的情况下,在所述位置维度需要对所述位置数据和网络数据进行分析,在所述行为维度需要对所述社交数据和行为数据进行分析,在所述特征维度需要对所述用户特征数据进行分析。

其中,所述位置数据具体是指用户和学校在地图上的位置信息,所述网络数据具体是指用户使用的网络信息和覆盖学校的网络信息,所述社交数据具体是指用户的社交网络数据(即用户的朋友所属的属性类别),所述行为数据具体是指用户经常运动的方式以及用户网购或者购物所买物品的类型,所述用户特征数据具体是指用户自身的特征信息。

本实施例的一个或多个实施方式中,在所述属性数据包括位置数据、网络数据、社交数据、行为数据以及用户特征数据的情况下,在各个维度对所述位置数据、所述网络数据、所述社交数据、所述行为数据以及所述用户特征数据进行分析的过程,具体实现方式如下所述:

通过在所述位置维度对所述位置数据以及所述网络数据进行分析,在所述行为维度对所述社交数据以及所述行为数据进行分析,在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述位置维度的第一待验证数据,在所述行为维度的第二待验证数据,在所述特征维度的第三待验证数据;

将所述第一待验证数据、所述第二待验证数据以及所述第三待验证数据进行整合,根据整合结果确定所述待验证数据。

具体的,通过在所述位置维度对所述位置数据进行分析,获得位置待验证数据;通过在所述位置维度对所述网络数据进行分析,获得网络待验证数据,将所述位置待验证数据与所述网络待验证数据进行整合,获得所述第一待验证数据;通过在所述行为维度对所述社交数据进行分析,获得社交待验证数据;通过在所述行为维度对所述行为数据进行分析,获得行为待验证数据,将所述社交待验证数据与所述行为待验证数据进行整合,获得所述第二待验证数据;通过在所述特征维度对所述用户特征数据进行分析获得特征待验证数据,将所述特征待验证数据作为所述第三待验证数据。

基于此,将所述第一待验证数据、所述第二待验证数据以及所述第三待验证数据进行整合,获得所述待验证数据;所述待验证数据中包含在不同维度对应的待验证数据。

其中,所述位置待验证数据可以是用户在时间信息对应的时间段内的经常应用的位置信息与学历信息中学校的位置信息之间的实际距离;所述网络待验证数据可以是用户经常应用的ip地址与学历信息中学校的ip地址是否相同;将实际距离和ip地址是否相同对应的数据组成所述第一待验证数据,即可以理解为在将所述待验证数据输入至所述验证模型之前,会根据学历信息以及属性数据对得到的待验证数据进行预处理,根据预处理会得到属性数据中包含的数据在对应维度的待验证数据,此时,已经初步确定待验证数据中的数据;

例如,用户经常应用的ip地址与学历信息中学校的ip地址是否相同,得出的结果为相同,则待验证数据中包含用户经常应用的ip地址与学历信息中学校的ip地址相同对应的数据,此时将包含用户经常应用的ip地址与学历信息中学校的ip地址相同对应的数据的待验证数据输入至验证模型,模型即可输出学历信息是否为真的结果,即可以理解为验证模型提供的是判断服务,通过不同维度的数据,判断学历信息在不同维度的可能为真的概率,最终将全部维度为真的概率进行整合,获得学历信息是否为真的概率以及学历信息为假的概率,在根据验证模型中设定的阈值,最终输出学历信息的验证结果。

同理,所述社交待验证数据可以是用户在时间信息对应的时间段内的所结交的朋友数据,根据朋友数据确定用户结交的朋友与用户的关系是否为同学关系;所述行为待验证数据可以是用户在时间信息对应的时间段内的信用数据,根据信用数据确定用户在信用平台的信用积分,确定用户是否为信用用户;通过在行为维度对用户结交的朋友与用户的关系是否为同学关系进行判断确定结果,以及对用户是否为信用用户进行判断确定结果,将确定结果对应的数据作为待验证数据输入所述验证模型即可,在所述行为维度的预处理过程与在所述位置维度的预处理过程相类似,本申请在此不再赘述。

同理,所述特征待验证数据可以是用户在时间信息对应的时间段内的运动方式最多的运动信息以及用户网购或者购物所买物品的类型信息,通过在特征维度确定用户经常运动的运动数据以及用户购物类型数据作为待验证数据输入验证模型即可,在所述特征维度的预处理过程与所述位置维度的预处理过程相类似,本申请在此不再赘述。

通过在不同的维度对所述属性数据中包含的数据进行分析,分别在不同的维度确定待验证数据,再将不同维度的待验证数据进行整合,确定为输入所述验证模型的待验证数据,实现了在不同的维度对所述属性数据进行预处理,通过所述验证模型对经过预处理的属性数据进行验证,即可确定学历信息的验证结果,很大程度上提高了对学历信息进行验证的准确性。

本实施例的一个或多个实施方式中,在所述属性数据包含位置数据的情况下,通过在所述位置维度对所述位置数据进行分析,根据分析结果确定在所述位置维度的待验证数据,确定所述位置维度的待验证数据的具体实现方式如下所述:

根据所述位置数据获取所述用户的文本地址数据,以及所述学历信息中包含的地址数据;

计算所述文本地址数据与所述地址数据两者之间的文本地址重合度以及地理距离,并确定所述用户在所述时间段内查找所述地址数据的查询频次;

将所述文本地址重合度、所述地理距离以及所述查询频次作为在所述位置维度的待验证数据。

具体的,根据所述属性数据中包含的位置数据,获取所述用户的文本地址数据,同时获取所述学历信息中包含的学校的地址数据,其中,所述用户的文本地址数据可以通过lbs服务确定,即获取用户实时地址的文本名称,以及学历信息中包含的学校的地址的文本名称;通过计算所述文本地址数据与所述地址数据两者之间的文本地址重合度,确定用户与学历信息中包含的学校两者之间的关系度,在计算所述文本地址重合度的过程中实则是通过用户实时地址的文本名称与学校的地址的文本名称的编辑距离确定的,即是两个字符串之间,由用户实时地址的文本名称的字符串转换到学校的地址的文本名称字符串所需的最少编辑操作次数,即可作为所述文本地址重合度(编辑次数越少,文本地址重合度越高,反之编辑次数越多,文本地址重合度越低);

根据所述文本地址数据以及所述地址数据确定所述地理距离,通过文本地址数据确定用户所处具体位置,以及文本地址数据确定学历中包含的学校的具体位置,计算用户位置和学校位置的实际距离,确定为地理距离;同时确定用户在所述时间段内使用学校地址的查询频次,即可理解为用户搜索学校地址的频次、用户通过网约车添加出发地或者目的地的地址应用学校地址的频次,将所述文本地址重合度、所述地理距离以及所述查询频次作为在所述位置维度的待验证数据。

基于此,是将用户实时地址的文本名称与学校的地址的文本名称的编辑次数、用户位置和学校位置的地理具体以及用户使用学校地址的频次作为在位置维度的待验证数据输入所述验证模型即可。

例如,用户此时在b大学,通过在某服务平台上对学历信息进行上传以获得更多的服务,用户将自身的学历信息上传至服务平台,学历信息中包含b大学名称、b大学地址,服务平台通过lbs服务确定用户的地址与b大学地址相同,并且用户经常通过网约车方式出门,则确定用户与b大学的文本地址重合度为100%,地理距离为0,查询b大学地址的频次在日常生活中比使用其他地址的频次较大,用户查询b大学地址的比例较大,即将用户与b大学的文本地址重合度100%、地理距离为0和用户查询b大学地址的比例作为在位置维度的待验证数据。

本实施例的一个或多个实施方式中,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,确定所述位置维度的待验证数据的具体实现方式如下所述:

根据所述网络数据确定所述用户在所述时间段内的第一互联网协议地址;

通过对所述第一互联网协议地址进行解析,获得所述用户在所述时间段内的第一经纬度数据;

根据所述第一经纬度数据以及地图数据映射第一区域范围;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的第二互联网协议地址;

通过对所述第二互联网协议地址进行解析,获得所述学校的第二经纬度数据;

根据所述第二经纬度数据以及所述地图数据映射所述学校的第二区域范围;

计算所述第一区域范围与所述第二区域范围的相似度,将所述相似度作为在所述位置维度的待验证数据。

具体的,根据所述属性数据中包含的网络数据,确定所述用户在就读时间段内的第一互联网协议地址(即ip地址),通过对ip地址进行解析,获得所述用户在所述就读时间段内的第一经纬度数据,其中,所述第一经纬度数据为通过对ip地址进行解析,确定ip地址的所属区域范围的经纬度数据,根据ip地址所属的经纬度数据确定第一经纬度数据,根据所述第一经纬度数据以及地图数据映射所述第一区域范围,是将用户的ip地址覆盖的区域范围在地图上圈定出的一个区域范围确定为所述第一区域范围;

获取所述学历信息中包含的所述学校数据,所述学校数据包括学校的名称,根据学校名称确定该学校的ip地址,通过对学校的ip地址进行解析,获得学校的第二经纬度数据,其中,所述第二经纬度数据为通过对学校ip地址进行解析,确定学校ip地址所属区域范围的经纬度数据,根据学校ip地址所属的经纬度数据确定第二经纬度数据,根据所述第二经纬度数据以及所述地图数据映射第二区域范围,是将学校ip地址覆盖的区域范围在地图上圈定出一个区域范围确定为学校的第二区域范围;

将确定的所述用户的第一区域范围与所述学校的第二区域范围进行比对,确定所述第一区域范围与所述第二区域范围的相似度,将相似度作为在所述位置维度的待验证数据;例如,第一区域范围是在城市a中位于a区的呈正方形且范围是2平方千米的区域范围,第二区域范围是在城市a中位于a区的呈长方形且范围是2.1平方千米的区域范围,则第一区域范围和第二区域范围的相似度为88%。

实际应用中,以用户的ip地址为255.255.0.0,以用户上传的学历信息中的c大学的ip地址为255.255.0.1为例,通过对用户ip地址255.255.0.0进行解析,确定用户的第一区域范围为城市b中的3平方千米的圆形区域范围,通过对c大学的ip地址为255.255.0.1进行解析,确定c大学的第二区域范围为城市b中2平方千米的正方形区域范围,通过计算第一区域范围和第二区域范围的相似度,确定第一区域和第二区域的相似度为61%,即将根据用户ip地址确定的第一区域范围与根据c大学ip地址确定的第二区域范围的相似度61%作为在位置维度的待验证数据。

除此之外,本实施例的一个或多个实施方式中,还提供了另外一种在位置维度分析网络数据的描述内容,具体描述内容如下所述:在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,确定所述位置维度的待验证数据的具体实现方式如下所述:

获取上传所述学历信息的用户终端连接网络的所述网络数据,并确定所述网络数据的服务集标识;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的基本服务集标识;

判断所述基本服务集标识是否包含所述服务集标识;

若是,将所述基本服务集标识包含所述服务集标识作为在所述位置维度的待验证数据;

若否,将所述基本服务集标识未包含所述服务集标识作为在所述位置维度的待验证数据。

具体的,获取上传所述学历信息的用户终端连接的所述网络数据,可以理解为用户在通过用户终端上传学历信息时,用户终端需要连接网络,连接网络的属性信息即为所述网络数据,其中,所述用户终端可以是手机或电脑等终端设备;根据所述网络数据确定用户终端的服务集标识(即ssid),同时获取学历信息中包含的学校数据,所述学校数据可以是学校的网络数据以及学校中的计算机设置的基本服务集标识(即bssid);

基于此,通过判断学校的基本服务集标识中是否包含所述用户的服务集标识,将判断结果作为在所述位置维度的待验证数据,其中判断结果包括若所述基本服务集标识中包含所述服务集标识,则将该包含关系作为在所述位置维度的待验证数据;若所述基本服务集标识中未包含所述服务集标识,则将基本服务集标识与服务集标识未存在包含关系作为在所述位置维度的待验证数据。

本实施例的一个或多个实施方式中,在所述属性数据包含社交数据的情况下,通过在所述行为维度对所述社交数据进行分析,根据分析结果确定在所述行为维度的待验证数据,确定所述行为维度的待验证数据的具体实现方式如下所述:

根据所述社交数据确定所述用户在所述时间段内的社交网络数据;

检测所述社交网络数据中是否包含学历信息验证完成的用户;

若是,根据所述社交网络数据确定学历信息验证完成的用户与所述用户的关系数据,将所述关系数据作为在所述行为维度的待验证数据;

若否,将用户社交网络数据中未存在学历信息验证完成对应的数据作为在行为维度的待验证数据。

具体的,根据所述社交数据确定所述用户在学历信息中包含的就读时间段内的社交网络数据,所述社交网络数据具体是指用户在就读时间段内的结交的朋友和用户的关系,例如,用户a通过打篮球结交了用户b,并且用户a和用户b都为d大学篮球校队的队员,则可以确定用户a和用户b是校友;以此为例,通过用户在就读时间段内的社交数据确定用户的所述社交网络数据;

基于此,检测用户在所述就读时间段内的社交网络数据中是否包含已经完成学历信息验证的用户,若是,说明用户的社交网络数据中包含已经完成学历信息验证的用户,具体是指用户的朋友中存在同学关系的用户,则将学历信息验证完成的用户与所述用户的关系数据作为在所述行为维度的待验证数据;若否,说明用户的社交网络数据中未包含已经完成学历信息验证的用户,具体是指用户的朋友中未存在同学关系的用户,则将用户社交网络数据中未存在学历信息验证完成对应的数据作为在行为维度的待验证数据。

例如,用户a有1000名朋友关系的用户,其中包括同学关系的用户、邻居关系的用户以及同事关系的用户,根据确定同学关系的用户存在500名,并且其中有200名用户完成了学历信息的验证,可以确定用户a的朋友当中有20%的用户完成了学历信息的验证,则将用户a的社交关系数据中存在20%完成学历信息验证的用户对应的数据作为在行为维度的待验证数据。

本实施例的一个或多个实施方式中,在所述属性数据包含行为数据的情况下,通过在所述行为维度对所述行为数据进行分析,根据分析结果确定在所述行为维度的待验证数据,确定所述行为数据的待验证数据的具体实现方式如下所述:

根据所述行为数据确定所述用户在所述时间段内的信用数据;

基于所述信用数据确定所述用户的信用级别,将所述信用级别作为在所述行为维度的待验证数据。

具体的,根据所述行为数据确定用户在所述就读时间段内的信用数据,具体是指用户在信用平台存在信用账户,信用平台会根据用户的信用事件在用户对应的信用账户中进行记录,从而可以确定用户的信用级别,若用户信用较差,则信用级别较低,若用户信用较好,则信用级别较高;基于此,在确定用户信用级别的基础上,将用户的信用级别作为在所述行为维度的待验证数据即可。

除此之外,在确定所述用户的信用级别之前,可以根据用户的信用数据确定用户的信用积分,所述信用积分可以是用户存在信用事件则增加积分,用户存在失信事件则减少积分,根据用户的信用积分情况,进而确定用户的信用级别。

本实施例的一个或多个实施方式中,在所述属性数据包含用户特征数据的情况下,通过在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述特征维度的待验证数据,确定所述特征维度的待验证数据的具体实现方式如下所述:

根据所述用户特征数据确定所述用户的用户属性数据以及用户偏好数据;

检测所述用户属性数据以及所述用户偏好数据中是否包含学生属性数据;

若是,确定所述用户属性数据以及所述用户偏好数据中包含的学生属性数据,在所述用户属性数据以及所述用户偏好数据中提取所述学生属性数据作为在所述特征维度的待验证数据;

若否,将所述用户属性数据以及所述用户偏好数据中未包含学生属性数据作为在所述特征维度的待验证数据。

具体的,根据所述特征数据确定所述用户的用户属性数据以及用户偏好数据,其中所述用户属性数据可以是用户的年龄、性别和住址等数据,所述用户偏好数据可以是用户喜欢的运动或者用户喜欢的游戏等数据,通过检测在所述用户属性数据以及所述用户偏好数据中是否包含学生属性数据,根据检测结果确定在所述特征维度的待验证数据;

基于此,若所述用户属性数据以及所述用户偏好数据中包含学生属性数据,则说明用户可能为学生的概率较高,则确定所述用户属性数据以及所述用户偏好数据中包含的学生属性数据,在所述用户属性数据以及所述用户偏好数据中提取所述学生属性数据作为在所述特征维度的待验证数据;若所述用户属性数据以及所述用户偏好数据中未包含学生属性数据,则说明用户为学生的概率较低,则将所述用户属性数据以及所述用户偏好数据中未包含学生属性数据作为在所述特征维度的待验证数据。

实际应用中,以用户年龄为20岁,喜欢打篮球和玩网络游戏为例,对在所述特征维度确定待验证数据进行描述,根据确定用户年龄符合上大学的年龄,并且偏好的运动为篮球,同时还喜欢玩网络游戏,可以判断出用户是大学生的概率较高,则将用户年龄为20岁,喜欢打篮球和玩游戏作为在特征维度的待验证数据。

除此之外,可以同时在不同的维度确定待验证数据,再将不同维度的待验证数据进行整合,将整合结果作为准备输入所述验证模型的待验证数据,即可实现同时在不同的维度对学历信息的验证,提高了验证的准确性。

通过分别在所述位置维度、所述行为维度以及所述特征维度对所述位置数据、网络数据、行为数据、社交数据以及所述用户特征数据进行分析,实现了可以在不同的维度对用户上传的学历信息的验证,避免了学历信息出现虚假的可能性发生,并且分别在不同的维度确定对应的待验证数据作为输入验证模型的待验证数据,使得在后续的验证模型输出的学历信息的验证结果更加准确。

在上述确定所述待验证数据的基础上,进一步的,本实施例的一个或多个实施方式中,在输入所述验证模型之前,可以根据所述分析结果进行预测,具体实现方式如下所述:

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,获得在各个维度的分析结果;

判断所述各个维度的分析结果是否均满足对应维度的预设阈值;

若否,根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤;

若是,根据所述分析结果确定所述学历信息的预测验证结果,以及根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤。

具体的,通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,分别获得在所述位置维度的分析结果,在所述行为维度的分析结果,在所述特征维度的分析结果,判断在所述位置维度的分析结果是否满足所述位置维度的预设阈值,在所述行为维度的分析结果是否满足所述行为维度的预设阈值,以及在所述特征维度的分析结果是否满足所述特征维度的预设阈值;

基于此,若在所述位置维度、所述行为维度以及所述特征维度中的任意一个维度的分析结果不满足对应的预设阈值的情况下,说明所述学历信息可能存在不真实的情况,则需要通过所述验证模型进行进一步的验证;若在所述位置维度、所述行为维度以及所述特征维度中的分析结果全部满足对应的预设阈值的情况下,说明所述学历信息可能为真的概率较大,确定该学历的预测验证结果,同时将待验证数据输入至所述模型进行进一步的验证,保证验证所述学历信息真实性的准确率更高。

具体实施时,所述位置维度的预设阈值可以是地理距离小于20千米,即可确定用户上传的学历信息在位置维度的验证是真实的概率较高,所述行为维度的预设阈值可以是用户的信用积分大于700积分,即可确定用户上传的学历信息在行为维度的验证是真实的概率较高,所述特征维度的预设阈值可以是用户年龄小于25岁,即可确定用户上传的学历信息在特征维度的验证是真实的概率较高,不同维度的预设阈值可以根据实际应用场景进行设定,本申请在此不做任何限定。

例如,用户在位置维度对位置数据的分析结果为地理距离为0,在位置维度对网络数据的分析结果为ip地址相同,在行为维度对社交数据的分析结果为同学关系用户较多,在行为维度对行为数据的分析结果为用户信用良好,在特征维度对用户特征数据的分析结果为年龄20岁,通过确定不同维度的预设阈值,确定该用户在不同维度的验证结果均为学历信息为真的概率较高,可以确定用户上传的学历信息的预测验证结果为真,再通过验证模型进行进一步验证。

通过在对所述待验证数据输入所述验证模型之前,可以根据在不同维度对所述属性数据的进行分析确定分析结果,进行初步的判断所述用户上传的学历信息的真假,能够进一步提高验证学历信息真实性的准确度。

步骤108:将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

具体的,根据上述在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析确定待验证数据的基础上,进一步的,将所述待验证数据输入至所述验证模型,对所述学历信息进行验证,所述验证模型输出所述学历信息的验证结果,其中,所述验证结果可以是学历信息为真或者学历信息为假。

具体实施时,所述验证模型可以是二分类模型,通过采用二分类模型作为所述验证模型,可以将模型的预测结果作为真实结果进行输出,避免了还需要对模型输出的结果进行分析,很大程度上提高了对学历信息进行验证的验证效率;除此之外,二分类模型可采用多种算法进行训练拟合,本申请在此不做过多赘述。

在上述通过所述验证模型对所述学历信息进行验证的基础上,进一步的,本实施例的一个或多个实施方式中,所述验证模型通过如下方式训练:

采集用户的学历信息,并确定所述学历信息对应的属性数据以及所述学历信息的验证结果;

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据以及所述学历信息的验证结果作为训练样本;

通过将所述训练样本输入至所述验证模型进行训练,确定所述待验证数据与所述学历信息的验证结果的关联关系。

具体的,在对所述验证模型进行训练的情况下,需要大量的训练样本,通过采集用户的学历信息以及确定学历信息得验证结果,在此基础上,通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,同时通过对学历信息为真对应的待验证数据添加真实标签,对学历信息为假对应的待验证数据添加虚假标签,将添加标签的待验证数据以及对应的学历信息的验证结果作为训练样本,对所述验证模型进行训练,确定所述待验证数据与所述学历信息的验证结果的关联关系。

此处,所述验证模型的验证过程可以理解为在所述验证模型中设置有阈值,分别在每个维度的数据与阈值进行比较,根据比较结果确定每个维度的数值,再将每个维度的数值进行相加,获得一个总数值,将该总数值与阈值进行比较,大于等于阈值即可确定为学历信息为真,小于阈值可以确定为学历信息为假。

具体实施时,在训练所述验证模型的情况下,训练样本中的学历信息的真假信息可以通过在学历信息查询网站上进行查询,能够保证训练样本的真实性,提高了所述验证模型的输出结果的准确性。

在上述确定所述学历信息预测验证结果的基础上,进一步的,本实施例的一个或多个实施方式中,因为所述预测验证结果是初步的判断结果,准确性不高,需要再次通过所述验证模型进行验证,进而可以确定学历信息验证结果的准确性,具体实现方式如下所述:

判断所述预测验证结果与所述验证结果是否一致;

若否,将所述待验证数据以及所述学历信息的验证结果作为负训练样本,对所述验证模型进行训练;

若是,将所述待验证数据以及所述学历信息的验证结果作为正训练样本,对所述验证模型进行训练。

具体的,根据上述确定的所述预测验证结果与所述模型输出的验证结果进行比较,在所述预测验证结果与所述验证结果一致的情况下,说明所述预测验证结果与所述验证结果都比较准确,则将所述预测验证结果与所述验证结果一致的待验证数据以及学历信息的验证结果作为正训练样本,对所述验证模型进行训练,在所述预测验证结果与所述验证结果不一致的情况下,说明预测验证结果与所述验证结果中可能存在验证不准确的,则将所述预测验证结果与所述验证结果不一致的待验证数据以及学历信息的验证结果作为负训练样本,对所述验证模型进行训练;上述过程,可以理解为通过正负训练样本对所述模型进行优化,使得所述验证模型的输出结果更加准确。

本申请提供的学历信息验证方法中,通过确定所述用户的属性数据,并在不同的维度对所述属性数据进行分析,实现了可以在不同的维度确定所述用户的待验证数据,同时结合所述验证模型并将所述待验证数据作为所述验证模型的输入,所述验证模型的输出为所述学历信息的验证结果,实现了可以在较短的时间确定用户上传的学历信息的真实性,并且通过在不同的维度对用户的属性数据进行分析,有效的提高了所述学历信息验证结果的准确性,再将所述待验证数据输入至所述验证模型之前,可以通过在各个维度对所述属性数据的分析获得预测验证结果,实现了初步对所述学历信息的验证,并将所述预测验证结果与所述验证结果进行比较,更进一步的提高了学历信息验证结果的准确性。

下述结合附图2,以本申请提供的学历信息验证方法在用户应聘过程中对学历的验证应用为例,对所述学历信息验证方法进行进一步说明。其中,图2示出了本申请一实施例提供的一种学历信息验证过程的处理流程图,具体步骤包括步骤202至步骤214。

步骤202:获取用户u的学历信息。

具体的,用户u在应聘a公司的岗位时,需要提供学历信息,a公司根据用户u提供的学历信息判断用户u是否适合该岗位;

基于此,用户u的学历信息中包含就读学校为s大学,就读时间为2012年至2016年,学校名称为s大学,学校地址在c城市c区经纬度数据为东经125度50分,北纬44度20分,同时根据学校名称确定s大学的ip地址。

步骤204:确定在就读时间内用户u的位置数据、网络数据、行为数据以及特征数据。

具体的,用户u的位置数据是指在就读时间2012年至2016年使用频次最多的地址数据,用户u的网络数据是指在就读时间2012年至2016年使用频次最多的ip地址,用户u的行为数据是指在就读时间2012年至2016年喜欢的运动,用户u的特征数据是指用户的年龄。

步骤206:通过在位置维度对用户u的位置数据和网络数据进行分析,获得位置维度的第一待验证数据。

具体的,通过在位置维度对用户u的位置数据进行分析,确定用户u在2012年至2016年使用频次最多的地址为s大学地址,通过在位置维度对用户u的网络数据进行分析,确定用户u在2012年至2016年使用频次最多的ip地址为s大学的ip地址;

基于此,获得位置维度的第一待验证数据为用户u经常使用s大学地址,并且ip地址与s大学ip地址一致。

步骤208:通过在行为维度对用户u的行为数据进行分析,获得行为维度的第二待验证数据。

具体的,通过在行为维度对用户u的行为数据进行分析,确定用户u在2012年至2016年经常打篮球;

基于此,获得行为维度的第二待验证数据为用户u喜欢打篮球。

步骤210:通过在特征维度对用户u的特征数据进行分析,获得特征维度的第三待验证数据。

具体的,通过在特征维度对用户u的特征数据进行分析,确定用户u年龄为24岁;

基于此,获得特征维度的第三待验证数据为用户u年龄24岁。

步骤212:将第一待验证数据、第二待验证数据以及第三待验证数据进行整合,作为输入验证模型的待验证数据。

步骤214:将待验证数据输入至验证模型,对用户u的学历信息进行验证,确定用户u的学习信息为真。

具体的,通过在位置维度确定用户u经常使用s大学的地址,并且用户u的ip地址与s大学的ip地址一致,通过在行为维度确定用户u喜欢打篮球,通过在特征维度确定用户u的年龄为24岁,将上述数据作为待验证数据输入至验证模型,确定用户u在各个维度数据均符合用户u提供的学历信息,则可以确定用户u的学历信息是和本人相符的,学历是真实的。

本申请提供的学历信息验证方法中,通过确定用户的位置数据、网络数据、行为数据以及特征数据,并在不同的维度对位置数据、网络数据、行为数据以及特征数据进行分析,实现了可以在不同的维度确定用户的待验证数据,同时结合验证模型并将待验证数据作为验证模型的输入,验证模型的输出为学历信息的验证结果,实现了可以在较短的时间确定用户上传的学历信息的真实性,并且通过在不同的维度对用户的位置数据、网络数据、行为数据以及特征数据进行分析,有效的提高了学历信息验证结果的准确性。

与上述方法实施例相对应,本申请还提供了学历信息验证装置实施例,图3示出了本申请一实施例提供的一种学历信息验证装置的结构示意图。如图3所示,该装置包括:

获取学历信息模块302,被配置为获取用户上传的学历信息;

确定属性数据模块304,被配置为根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据;

确定待验证数据模块306,被配置为通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

验证学历信息模块308,被配置为将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

一个可选的实施例中,在所述属性数据包含位置数据的情况下,通过在所述位置维度对所述位置数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述位置数据获取所述用户的文本地址数据,以及所述学历信息中包含的地址数据;

计算所述文本地址数据与所述地址数据两者之间的文本地址重合度以及地理距离,并确定所述用户在所述时间段内查找所述地址数据的查询频次;

将所述文本地址重合度、所述地理距离以及所述查询频次作为在所述位置维度的待验证数据。

一个可选的实施例中,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述网络数据确定所述用户在所述时间段内的第一互联网协议地址;

通过对所述第一互联网协议地址进行解析,获得所述用户在所述时间段内的第一经纬度数据;

根据所述第一经纬度数据以及地图数据映射第一区域范围;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的第二互联网协议地址;

通过对所述第二互联网协议地址进行解析,获得所述学校的第二经纬度数据;

根据所述第二经纬度数据以及所述地图数据映射所述学校的第二区域范围;

计算所述第一区域范围与所述第二区域范围的相似度,将所述相似度作为在所述位置维度的待验证数据。

一个可选的实施例中,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

获取上传所述学历信息的用户终端连接网络的所述网络数据,并确定所述网络数据的服务集标识;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的基本服务集标识;

判断所述基本服务集标识是否包含所述服务集标识;

若是,将所述基本服务集标识包含所述服务集标识作为在所述位置维度的待验证数据;

若否,将所述基本服务集标识未包含所述服务集标识作为在所述位置维度的待验证数据。

一个可选的实施例中,在所述属性数据包含社交数据的情况下,通过在所述行为维度对所述社交数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述社交数据确定所述用户在所述时间段内的社交网络数据;

检测所述社交网络数据中是否包含学历信息验证完成的用户;

若是,根据所述社交网络数据确定学历信息验证完成的用户与所述用户的关系数据,将所述关系数据作为在所述行为维度的待验证数据。

一个可选的实施例中,在所述属性数据包含行为数据的情况下,通过在所述行为维度对所述行为数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述行为数据确定所述用户在所述时间段内的信用数据;

基于所述信用数据确定所述用户的信用级别,将所述信用级别作为在所述行为维度的待验证数据。

一个可选的实施例中,在所述属性数据包含用户特征数据的情况下,通过在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述特征维度的待验证数据,包括:

根据所述用户特征数据确定所述用户的用户属性数据以及用户偏好数据;

检测所述用户属性数据以及所述用户偏好数据中是否包含学生属性数据;

若是,确定所述用户属性数据以及所述用户偏好数据中包含的学生属性数据,在所述用户属性数据以及所述用户偏好数据中提取所述学生属性数据作为在所述特征维度的待验证数据。

一个可选的实施例中,所述验证模型通过如下单元进行训练:

采集单元,被配置为采集用户的学历信息,并确定所述学历信息对应的属性数据以及所述学历信息的验证结果;

确定单元,被配置为通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

确定训练样本单元,被配置为将所述待验证数据以及所述学历信息的验证结果作为训练样本;

确定关联关系单元,被配置为通过将所述训练样本输入至所述验证模型进行训练,确定所述待验证数据与所述学历信息的验证结果的关联关系。

一个可选的实施例中,所述属性数据包括下述至少一项:

位置数据、网络数据、社交数据、行为数据以及用户特征数据;

相应的,所述确定待验证数据模块306,包括:

确定待验证数据单元,被配置为通过在所述位置维度对所述位置数据以及所述网络数据进行分析,在所述行为维度对所述社交数据以及所述行为数据进行分析,在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述位置维度的第一待验证数据,在所述行为维度的第二待验证数据,在所述特征维度的第三待验证数据;

整合单元,被配置为将所述第一待验证数据、所述第二待验证数据以及所述第三待验证数据、进行整合,根据整合结果确定所述待验证数据。

一个可选的实施例中,所述学历信息包含下述至少一项:

就读时间信息、就读学校名称信息、就读学校地址信息、就读学校办学属性信息以及就读学校历史变动信息。

一个可选的实施例中,所述确定待验证数据模块306,包括:

确定分析结果单元,被配置为通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,获得在各个维度的分析结果;

判断单元,被配置为判断所述各个维度的分析结果是否均满足对应维度的预设阈值;

若否,根据所述分析结果确定所述待验证数据,并运行所述验证学历信息模块308;

若是,根据所述分析结果确定所述学历信息的预测验证结果,以及根据所述分析结果确定所述待验证数据,并运行所述验证学历信息模块308。

一个可选的实施例中,所述学历信息验证装置,还包括:

判断模块,被配置为判断所述预测验证结果与所述验证结果是否一致;

若否,运行第一训练模块;

所述第一训练模块,被配置为将所述待验证数据以及所述学历信息的验证结果作为负训练样本,对所述验证模型进行训练;

若是,运行第二训练模块;

所述第二训练模块,被配置为将所述待验证数据以及所述学历信息的验证结果作为正训练样本,对所述验证模型进行训练。

本申请提供的学历信息验证装置中,通过确定所述用户的属性数据,并在不同的维度对所述属性数据进行分析,实现了可以在不同的维度确定所述用户的待验证数据,同时结合所述验证模型并将所述待验证数据作为所述验证模型的输入,所述验证模型的输出为所述学历信息的验证结果,实现了可以在较短的时间确定用户上传的学历信息的真实性,并且通过在不同的维度对用户的属性数据进行分析,有效的提高了所述学历信息验证结果的准确性。

上述为本实施例的一种学历信息验证装置的示意性方案。需要说明的是,该学历信息验证装置的技术方案与上述的学历信息验证方法的技术方案属于同一构思,学历信息验证装置的技术方案未详细描述的细节内容,均可以参见上述学历信息验证方法的技术方案的描述。

图4示出了根据本申请一实施例提供的一种计算设备400的结构框图。该计算设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。

计算设备400还包括接入设备440,接入设备440使得计算设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。

在本申请的一个实施例中,计算设备400的上述以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。

计算设备400可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备400还可以是移动式或静止式的服务器。

其中,处理器420用于执行如下计算机可执行指令:

获取用户上传的学历信息;

根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据;

通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

可选的,在所述属性数据包含位置数据的情况下,通过在所述位置维度对所述位置数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述位置数据获取所述用户的文本地址数据,以及所述学历信息中包含的地址数据;

计算所述文本地址数据与所述地址数据两者之间的文本地址重合度以及地理距离,并确定所述用户在所述时间段内查找所述地址数据的查询频次;

将所述文本地址重合度、所述地理距离以及所述查询频次作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述网络数据确定所述用户在所述时间段内的第一互联网协议地址;

通过对所述第一互联网协议地址进行解析,获得所述用户在所述时间段内的第一经纬度数据;

根据所述第一经纬度数据以及地图数据映射第一区域范围;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的第二互联网协议地址;

通过对所述第二互联网协议地址进行解析,获得所述学校的第二经纬度数据;

根据所述第二经纬度数据以及所述地图数据映射所述学校的第二区域范围;

计算所述第一区域范围与所述第二区域范围的相似度,将所述相似度作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

获取上传所述学历信息的用户终端连接网络的所述网络数据,并确定所述网络数据的服务集标识;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的基本服务集标识;

判断所述基本服务集标识是否包含所述服务集标识;

若是,将所述基本服务集标识包含所述服务集标识作为在所述位置维度的待验证数据;

若否,将所述基本服务集标识未包含所述服务集标识作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含社交数据的情况下,通过在所述行为维度对所述社交数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述社交数据确定所述用户在所述时间段内的社交网络数据;

检测所述社交网络数据中是否包含学历信息验证完成的用户;

若是,根据所述社交网络数据确定学历信息验证完成的用户与所述用户的关系数据,将所述关系数据作为在所述行为维度的待验证数据。

可选的,在所述属性数据包含行为数据的情况下,通过在所述行为维度对所述行为数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述行为数据确定所述用户在所述时间段内的信用数据;

基于所述信用数据确定所述用户的信用级别,将所述信用级别作为在所述行为维度的待验证数据。

可选的,在所述属性数据包含用户特征数据的情况下,通过在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述特征维度的待验证数据,包括:

根据所述用户特征数据确定所述用户的用户属性数据以及用户偏好数据;

检测所述用户属性数据以及所述用户偏好数据中是否包含学生属性数据;

若是,确定所述用户属性数据以及所述用户偏好数据中包含的学生属性数据,在所述用户属性数据以及所述用户偏好数据中提取所述学生属性数据作为在所述特征维度的待验证数据。

可选的,所述验证模型通过如下方式训练:

采集用户的学历信息,并确定所述学历信息对应的属性数据以及所述学历信息的验证结果;

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据以及所述学历信息的验证结果作为训练样本;

通过将所述训练样本输入至所述验证模型进行训练,确定所述待验证数据与所述学历信息的验证结果的关联关系。

可选的,所述属性数据包括下述至少一项:

位置数据、网络数据、社交数据、行为数据以及用户特征数据;

相应的,所述通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,包括:

通过在所述位置维度对所述位置数据以及所述网络数据进行分析,在所述行为维度对所述社交数据以及所述行为数据进行分析,在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述位置维度的第一待验证数据,在所述行为维度的第二待验证数据,在所述特征维度的第三待验证数据;

将所述第一待验证数据、所述第二待验证数据以及所述第三待验证数据、进行整合,根据整合结果确定所述待验证数据。

可选的,所述学历信息包含下述至少一项:

就读时间信息、就读学校名称信息、就读学校地址信息、就读学校办学属性信息以及就读学校历史变动信息。

可选的,所述通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,包括:

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,获得在各个维度的分析结果;

判断所述各个维度的分析结果是否均满足对应维度的预设阈值;

若否,根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤;

若是,根据所述分析结果确定所述学历信息的预测验证结果,以及根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤。

可选的,所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果指令执行之后,处理器420还用于执行如下计算机可执行指令:

判断所述预测验证结果与所述验证结果是否一致;

若否,将所述待验证数据以及所述学历信息的验证结果作为负训练样本,对所述验证模型进行训练;

若是,将所述待验证数据以及所述学历信息的验证结果作为正训练样本,对所述验证模型进行训练。

上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的学历信息验证方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述学历信息验证方法的技术方案的描述。

本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:

获取用户上传的学历信息;

根据所述学历信息中包含的时间信息,确定所述用户在所述时间信息对应的时间段内的属性数据;

通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果。

可选的,在所述属性数据包含位置数据的情况下,通过在所述位置维度对所述位置数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述位置数据获取所述用户的文本地址数据,以及所述学历信息中包含的地址数据;

计算所述文本地址数据与所述地址数据两者之间的文本地址重合度以及地理距离,并确定所述用户在所述时间段内查找所述地址数据的查询频次;

将所述文本地址重合度、所述地理距离以及所述查询频次作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

根据所述网络数据确定所述用户在所述时间段内的第一互联网协议地址;

通过对所述第一互联网协议地址进行解析,获得所述用户在所述时间段内的第一经纬度数据;

根据所述第一经纬度数据以及地图数据映射第一区域范围;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的第二互联网协议地址;

通过对所述第二互联网协议地址进行解析,获得所述学校的第二经纬度数据;

根据所述第二经纬度数据以及所述地图数据映射所述学校的第二区域范围;

计算所述第一区域范围与所述第二区域范围的相似度,将所述相似度作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含网络数据的情况下,通过在所述位置维度对所述网络数据进行分析,根据分析结果确定在所述位置维度的待验证数据,包括:

获取上传所述学历信息的用户终端连接网络的所述网络数据,并确定所述网络数据的服务集标识;

获取所述学历信息中包含的学校数据,并根据所述学校数据确定学校的基本服务集标识;

判断所述基本服务集标识是否包含所述服务集标识;

若是,将所述基本服务集标识包含所述服务集标识作为在所述位置维度的待验证数据;

若否,将所述基本服务集标识未包含所述服务集标识作为在所述位置维度的待验证数据。

可选的,在所述属性数据包含社交数据的情况下,通过在所述行为维度对所述社交数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述社交数据确定所述用户在所述时间段内的社交网络数据;

检测所述社交网络数据中是否包含学历信息验证完成的用户;

若是,根据所述社交网络数据确定学历信息验证完成的用户与所述用户的关系数据,将所述关系数据作为在所述行为维度的待验证数据。

可选的,在所述属性数据包含行为数据的情况下,通过在所述行为维度对所述行为数据进行分析,根据分析结果确定在所述行为维度的待验证数据,包括:

根据所述行为数据确定所述用户在所述时间段内的信用数据;

基于所述信用数据确定所述用户的信用级别,将所述信用级别作为在所述行为维度的待验证数据。

可选的,在所述属性数据包含用户特征数据的情况下,通过在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述特征维度的待验证数据,包括:

根据所述用户特征数据确定所述用户的用户属性数据以及用户偏好数据;

检测所述用户属性数据以及所述用户偏好数据中是否包含学生属性数据;

若是,确定所述用户属性数据以及所述用户偏好数据中包含的学生属性数据,在所述用户属性数据以及所述用户偏好数据中提取所述学生属性数据作为在所述特征维度的待验证数据。

可选的,所述验证模型通过如下方式训练:

采集用户的学历信息,并确定所述学历信息对应的属性数据以及所述学历信息的验证结果;

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,根据分析结果确定待验证数据;

将所述待验证数据以及所述学历信息的验证结果作为训练样本;

通过将所述训练样本输入至所述验证模型进行训练,确定所述待验证数据与所述学历信息的验证结果的关联关系。

可选的,所述属性数据包括下述至少一项:

位置数据、网络数据、社交数据、行为数据以及用户特征数据;

相应的,所述通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,包括:

通过在所述位置维度对所述位置数据以及所述网络数据进行分析,在所述行为维度对所述社交数据以及所述行为数据进行分析,在所述特征维度对所述用户特征数据进行分析,根据分析结果确定在所述位置维度的第一待验证数据,在所述行为维度的第二待验证数据,在所述特征维度的第三待验证数据;

将所述第一待验证数据、所述第二待验证数据以及所述第三待验证数据、进行整合,根据整合结果确定所述待验证数据。

可选的,所述学历信息包含下述至少一项:

就读时间信息、就读学校名称信息、就读学校地址信息、就读学校办学属性信息以及就读学校历史变动信息。

可选的,所述通过在位置维度、行为维度以及特征维度对所述属性数据进行分析,根据分析结果确定待验证数据,包括:

通过在所述位置维度、所述行为维度以及所述特征维度对所述属性数据进行分析,获得在各个维度的分析结果;

判断所述各个维度的分析结果是否均满足对应维度的预设阈值;

若否,根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤;

若是,根据所述分析结果确定所述学历信息的预测验证结果,以及根据所述分析结果确定所述待验证数据,并执行所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤。

可选的,所述将所述待验证数据输入至预先训练的验证模型,对所述学历信息进行验证,输出所述学历信息的验证结果步骤执行之后,还包括:

判断所述预测验证结果与所述验证结果是否一致;

若否,将所述待验证数据以及所述学历信息的验证结果作为负训练样本,对所述验证模型进行训练;

若是,将所述待验证数据以及所述学历信息的验证结果作为正训练样本,对所述验证模型进行训练。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的学历信息验证方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述学历信息验证方法的技术方案的描述。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1