基于位置服务的风险评估方法及装置与流程

文档序号:11144316阅读:665来源:国知局
基于位置服务的风险评估方法及装置与制造工艺

本发明涉及信息处理技术领域,尤其涉及一种基于位置服务的风险评估方法及装置。



背景技术:

现有银行、证券、保险等金融机构在给用户提供金融业务时,需采集并审核用户画像数据,以审核用户身份及财富状态,从而实现对其提供的金融业务的风险控制。其中,用户画像(即Persona)数据是真实用户的虚拟代表,是建立在一系统真实数据(Marketing Data/Usability Data)之上的目标用户模型。用户画像(即Persona)数据是通过用户调研去了解用户,并根据用户的目标、行为和观点的差异,将他们区分为不同类型,以抽取出典型特征,如用户姓名、身份识别特征(如指纹)、照片、联系方式、家庭住址、办公场所、职业和收入等。

现有金融机构在提供贷款或其他金融业务时,需用户填写相关的业务表格,每一业务表格中包括多项可完善用户画像数据的详细数据,包括但不限于用户姓名、家庭住址、办公场所、职业和收入等。现有金融机构通过用户填写业务表格方式采集用户画像数据时,金融机构无法对用户提供的用户画像数据的真实性和准确性进行审核,在用户提供虚拟的用户画像数据时存在货款无法收回的业务风险。而且,金融机构只能采集到用户在办理金融业务过程中的用户画像数据,无法实时跟进用户画像数据的变化情况,在用户画像数据发生较大变化时存在业务风险。如用户的家庭住址和办公场所等发生变化时,金融机构无法对用户画像数据实时跟进,可能导致金融机构无法顺利追讨贷款问题发生。



技术实现要素:

本发明要解决的技术问题在于,针对现有技术无法实时跟进用户画像数据变化而导致业务风险存在的不足,提供一种基于位置服务的风险评估方法及装置。

本发明解决其技术问题所采用的技术方案是:一种基于位置服务的风险评估方法,包括:

基于位置服务获取用户的地理位置信息,所述地理位置信息包括与时间相关联的POI信息;

对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集;

对所述办公区域数据集和住址区域数据集分别进行聚类分析,分别获取办公位置动态信息和住址位置动态信息;

将所述办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息;

其中,所述用户画像数据包括用户ID、办公场所和家庭住址。

优选地,所述对所述办公区域数据集和住址区域数据集分别进行聚类分析,分别获取办公位置动态信息和住址位置动态信息,包括:

采用DBSCAN聚类算法对所述办公区域数据集中的POI信息进行聚类,以获取若干办公子集群,每一办公子群集包括至少一个办公POI信息;采用DBSCAN聚类算法对所述住址区域数据集中的POI信息进行聚类,以获取若干住址子集群,每一住址子群集包括至少一个住址POI信息;

采用K-MEANS聚类算法对每一所述办公子集群进行迭代聚类,以获取所述办公子集群的办公质心POI信息;所述办公位置动态信息包括所述办公POI信息和所述办公质心POI信息;采用K-MEANS聚类算法对每一所述住址子集群进行迭代聚类,以获取所述住址子集群的住址质心POI信息;所述住址位置动态信息包括所述住址POI信息和所述住址质心POI信息。

优选地,所述将所述办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息,包括:

判断所述办公场所是否与所述办公质心POI信息相匹配并判断所述家庭住址是否与所述所述住址质心POI信息相匹配;

若均相匹配,输出低风险度评估信息;

若不均相匹配,则判断所述办公场所是否与所述办公子集群中的办公POI信息相匹配,和/或判断所述家庭住址是否与所述住址子集群中的住址POI信息相匹配;

根据判断结果输出高风险度评估信息或中风险度评估信息。

优选地,还包括:采用相似度检测算法将所述办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比。

优选地,所述用户画像数还包括管户人员ID;

还包括:在输出高风险度评估信息时,将所述办公位置动态信息和/或住址位置动态信息发送给所述管户人员ID对应的管户人员。

本发明还提供一种基于位置服务的风险评估装置,包括:

信息获取单元,用于基于位置服务获取用户的地理位置信息,所述地理位置信息包括与时间相关联的POI信息;

信息划分单元,用于对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集;

聚类分析单元,用于对所述办公区域数据集和住址区域数据集分别进行聚类分析,分别获取办公位置动态信息和住址位置动态信息;

评估结果输出单元,用于将所述办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息;

其中,所述用户画像数据包括用户ID、办公场所和家庭住址。

优选地,所述聚类分析单元包括:

第一聚类子单元,用于采用DBSCAN聚类算法对所述办公区域数据集中的POI信息进行聚类,以获取若干办公子集群,每一办公子群集包括至少一个办公POI信息;采用DBSCAN聚类算法对所述住址区域数据集中的POI信息进行聚类,以获取若干住址子集群,每一住址子群集包括至少一个住址POI信息;

第二聚类子单元,用于采用K-MEANS聚类算法对每一所述办公子集群进行迭代聚类,以获取所述办公子集群的办公质心POI信息;所述办公位置动态信息包括所述办公POI信息和所述办公质心POI信息;采用K-MEANS聚类算法对每一所述住址子集群进行迭代聚类,以获取所述住址子集群的住址质心POI信息;所述住址位置动态信息包括所述住址POI信息和所述住址质心POI信息。

优选地,所述评估结果输出单元包括:

第一判断子单元,用于判断所述办公场所是否与所述办公质心POI信息相匹配并判断所述家庭住址是否与所述所述住址质心POI信息相匹配;

第一处理子单元,用于若均相匹配,输出低风险度评估信息;

第二判断子单元,用于若不均相匹配,则判断所述办公场所是否与所述办公子集群中的办公POI信息相匹配,和/或判断所述家庭住址是否与所述住址子集群中的住址POI信息相匹配;

第二处理子单元,用于根据判断结果输出高风险度评估信息或中风险度评估信息。

优选地,所述评估结果输出单元,用于采用相似度检测算法将所述办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比。

优选地,所述用户画像数还包括管户人员ID;

还包括信息发送单元,用于在输出高风险度评估信息时,将所述办公位置动态信息和/或住址位置动态信息发送给所述管户人员ID对应的管户人员。

本发明与现有技术相比具有如下优点:本发明所提供的基于位置服务的风险评估方法及装置中,基于位置服务获取用户的地理位置信息,地理位置信息具有客观性和实时性。通过对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集,再对办公区域数据集和住址区域数据集分别进行聚类分析,以获取办公位置动态信息和住址位置动态信息。其中,划分办公区域数据集和住址区域数据集并分别聚类,使得办公区域数据集和住址区域数据集中的POI信息的数据量较小,有利于提高聚类效果,节省聚类处理时间。由于办公位置动态信息和住址位置动态信息具有客观性,使得利用办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对,输出的用户风险度评估信息具有客观性,可有效评估用户画像数据是否发生变化,可提高用户画像数据变动产生的风险的管控。由于实时采集用户的地理位置信息,并对预设期间内的地理位置信息进行聚类分析获取到的办公位置动态信息和住址位置动态信息可客观反映用户的用户画像数据,可将办公位置动态信息和住址位置动态信息实时更新为新的用户画像数据,以提高用户风险度评估信息的准确性。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例1中基于位置服务的风险评估方法的一流程图。

图2是本发明实施例2中基于位置服务的风险评估装置的一原理框图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。

实施例1

图1示出本实施例中基于位置服务的风险评估方法的一流程图。如图1所示,该基于位置服务的风险评估方法可以由银行、保险、证券等金融机构的后台服务器中执行。如图1所示,该基于位置服务的风险评估方法包括:

S1:基于位置服务获取用户的地理位置信息,地理位置信息包括与时间相关联的POI信息。

以任一用户一天的地理位置信息为例,该地理位置信息中包括0:00—24:00的POI信息,每一POI信息用于指示电子地图中的一点,包括POI点名称、经度和纬度等信息。基于用户的地理位置信息,可了解用户每天经过的家庭住址、办公场所、购物场所、娱乐场所、健身场所等信息。可以理解地,基于位置服务获取用户的地理位置信息,具有较强的客观性和可靠性。

基于位置服务(Location Based Service,简称LBS)是通过电信移动运营商的无线电通讯网络(如GSM网、CDMA网)或外部定位方式(如GPS)获取移动终端用户的位置信息(地理坐标,或大地坐标),在地理信息系统(Geographic Information System,简称GIS)平台的支持下,为用户提供相应服务的一种增值业务。总体来看,LBS由移动通信网络和计算机网络结合而成,两个网络之间通过网关实现交互。移动终端通过移动通信网络发出请求,经过网关传递给LBS服务平台;LBS服务平台根据用户请求和用户当前位置进行处理,并将结果通过网关返回给用户。POI(PointOfInterest,即兴趣点或信息点),包括名称、类型、经度、纬度等资料,以使POI可在电子地图上呈现,以标示电子地图上的某个地标、景点等地点信息。

本实施例中,基于位置服务的移动终端为智能手机,通过开启智能手机上的定位功能,以使LBS服务平台实时获取智能手机的地理位置信息,从而获取该智能手机对应的用户的地理位置信息。其中,POI信息与时间相关联,每一POI信息包括日期和时刻,通过该地理位置信息可了解用户在任一时刻所处的POI信息。可以理解地,地理位置信息与用户ID相关联,用户ID用于识别唯一识别用户,可以是身份证号或手机号。

可以理解地,为了减少数据处理量,提高处理效率,可预先设置时间阈值,以使基于位置服务获取用户的地理位置信息时,只获取用户在任一地点停留时间达到该时间阈值的POI信息,以避免采集到的与时间相关联的POI信息的数据量较多,导致处理效率低的问题。

S2:对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集。

其中,预设期间可以是当前系统时间之前的任意一段时间,可以为一个月、三个月或半年等,可根据需求自主设置。预设时间界限是用于划分办公时间和休息时间的界限。基于预设时间界限可将所有POI信息划分为办公区域数据集和住址区域数据集,以便基于办公区域数据集和住址区域数据集对用户画像数据进行跟进处理。本实施例中,将8:00-20:00作为办公时间,其对应的地理位置信息为办公区域数据集;相应地,20:00-次日8:00作为休息时间,其对应的地理位置信息为住址区域数据集。

S3:对办公区域数据集和住址区域数据集分别进行聚类分析,分别获取办公位置动态信息和住址位置动态信息。

其中,办公位置动态信息是对办公区域数据集中所有POI信息进行聚类分析的结果;住址位置动态信息是对住址区域数据集中所有POI信息进行聚类分析的结果。办公位置动态信息和住址位置动态信息可客观反映用户在预设期间内的日常生活轨迹,可利用办公位置动态信息和住址位置动态信息实现对用户画像数据实时跟进,以保证跟进后的用户画像数据的客观性。

本实施例中,先将用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集,再对办公区域数据集和住址区域数据集分别进行聚类分析,使得办公区域数据集和住址区域数据集中的POI信息的数据量较小,有利于提高聚类效果,节省聚类处理时间。

步骤S3具体包括:

S31:采用DBSCAN聚类算法对办公区域数据集中的POI信息进行聚类,以获取若干办公子集群,每一办公子群集包括至少一个办公POI信息。采用DBSCAN聚类算法对住址区域数据集中的POI信息进行聚类,以获取若干住址子集群,每一住址子群集包括至少一个住址POI信息。

其中,DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。DBSCAN聚类算法具有聚类速度快且能够有效处理噪声和发现任意形成的空间聚类的优点。

具体地,预设办公区域数据集的扫描半径(以下简称为eps)和最小包含点数(minPts),任选一个未被访问(unvisited)的POI信息开始,找出与其距离在eps之内(包括eps)的所有POI信息,将POI信息与距离在eps之内的所有POI信息作为一个办公子集群输出,办公子集群中的POI信息为办公POI信息。相应地,预设住址区域数据集的扫描半径(eps)和最小包含点数(minPts),任选一个未被访问(unvisited)的POI信息开始,找出与其距离在eps之内(包括eps)的所有POI信息,将POI信息与距离在eps之内的所有POI信息作为一个住址子集群输出,住址子集群中的POI信息为住址POI信息。

S32:采用K-MEANS聚类算法对每一办公子集群进行迭代聚类,以获取办公子集群的办公质心POI信息;办公位置动态信息包括办公POI信息和办公质心POI信息。采用K-MEANS聚类算法对每一住址子集群进行迭代聚类,以获取住址子集群的住址质心POI信息;住址位置动态信息包括住址POI信息和住址质心POI信息。

K-MEANS算法是很典型的基于距离的算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。其计算公式为其中,k个初始类聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机的选取任意k个对象作为初始聚类的中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给最近的簇。若一次迭代前后,J的值没有发生变化,说明算法已经收敛。K-MEANS算法可快速简单地对数据进行聚类,对大数据集具有较高的效率且可伸缩性,时间复杂度近于线性,而且适合挖掘大规模数据集。

本实施例中,采用K-MEANS算法对每一办公子集群中的POI信息进行迭代聚合,直到最后一次迭代时,迭代前后数值没有发生变化,则获取该办公子集群的办公质心POI信息,从而获取包括办公POI信息和办公质心POI信息的办公位置动态信息。相应地,采用K-MEANS算法对每一住址子集群中的POI信息进行迭代聚合,直到最后一次迭代时,迭代前后数值没有发生变化,则获取该住址子集群的住址质心POI信息,从而获取包括住址POI信息和住址质心POI信息的住址位置动态信息。

若用户某天的地理位置信息包括与时间相关联的如下POI信息:A、B、C、D、E、F、G、H、F、I、J、K……E、D、A,若A为家庭住址,B和C分别为家庭住址附近eps内的地点,D和E为工作路上获取的地点,F为办公地址,G为办公地址附近eps内的地点,H、I、J、K为消费场所等。步骤S31中采用DBSCAN聚类算法进行聚类时,通过设置扫描半径(eps)和最小包含点数(minPts),可将家庭住址和家庭住址附近eps内所有的POI信息聚类为一住址子集群输出,将办公场所和办公场所附近eps内所有的POI信息聚类为一办公子集群输出。步骤S32对每一办公子集群和住址子集群分别采用K-MEANS聚类算法进行迭代聚合,以获取每一办公子集群的办公质心POI信息,并获取每一住址子集群的住址质心POI信息。其中,办公质心POI信息是办公子集群的办公POI信息中的一个,住址质心POI信息是住址子集群的住址POI信息中的一个;办公位置动态信息包括办公POI信息和办公质心POI信息,住址位置动态信息包括住址POI信息和住址质心POI信息。

S4:将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息。

其中,用户画像数据包括用户ID、办公场所和家庭住址。用户画像数据可以是用户在办理相关业务时采集到的用户画像数据,也可以是基于位置服务实时跟进后存储的用户画像数据。利用办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对,由于办公位置动态信息和住址位置动态信息具有客观性,使得比对后输出的用户风险度评估信息具有客观性。其中,用户风险度评估信息包括低风险度评估信息、中风险度评估信息和高风险度评估信息。

进一步地,由于实时采集用户的地理位置信息,并对预设期间内的地理位置信息进行聚类分析获取到的办公位置动态信息和住址位置动态信息可客观反映用户的用户画像数据,可将办公位置动态信息和住址位置动态信息实时更新为新的用户画像数据,使得下次评估时可利用新的用户画像数据进行对比,以提高用户风险度评估信息的准确性。

步骤S4具体包括:

S41:判断办公场所是否与办公质心POI信息相匹配,并判断家庭住址是否与住址质心POI信息相匹配。

S42:若均相匹配,输出低风险度评估信息。

S43:若不均相匹配,则判断办公场所是否与办公子集群中的办公POI信息相匹配,和/或判断家庭住址是否与住址子集群中的住址POI信息相匹配;

S44:根据判断结果输出高风险度评估信息或中风险度评估信息。

本实施例中,设a为办公场所,b为家庭住址,A为办公质心POI信息,U为办公子集群,B为住址质心POI信息,Y为住址子集群;将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对的结果如下表所示,其中,=表示匹配,≠表示不匹配。

本实施例中,办公场所与办公质心POI信息或办公子集群的匹配状态有如下三种情况:办公场所与办公质心POI信息相匹配(a=A)、办公场所与办公子集群中的办公POI信息相匹配(a=U)和办公场所与办公子集群中的办公POI信息不相匹配(a≠U)。相应地,家庭住址与住址质心POI信息或住址子集群的匹配状态有如下三种情况:家庭住址与住址质心POI信息相匹配(b=B)、家庭住址与住址子集群中的住址POI信息相匹配(b=Y)和家庭住址与住址子集群中的住址POI信息不相匹配(b≠Y)。因此,将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对的结果有如上表所示九种状态。

若办公场所与办公质心POI信息相匹配且家庭住址与住址质心POI信息相匹配,即状态1,其对应的风险度评估等级为I级,输出低风险度评估信息,表示用户在预设期间内基于位置服务获取到的地理位置信息与其预先存储的用户画像数据相匹配,办公场所和家庭住址位置均没有变化。

在一具体实施方式中,若办公场所与办公子集群中的办公POI信息不相匹配,且家庭住址在住址子集群中的住址POI信息不相匹配,即状态9,其对应的风险度评估等级为VI级,根据业务需求,可将VI级的风险度评估等级作为高风险度评估信息输出,表示用户在预设期间内基于位置服务获取到的用户的地理位置信息与其预先存储的用户画像数据完全不相匹配,办公场所和家庭住址均发生变化。

在另一具体实施方式中,若办公场所与办公子集群中的办公POI信息不相匹配和/或家庭住址在住址子集群中的住址POI信息不相匹配,即状态3、6、7、8和9,其对应的风险度评估等级为IV级、V级和VI级,根据业务需求,可将IV级、V级和VI级的风险度评估等级作为高风险度评估信息输出,表示用户在预设期间内基于位置服务获取到的用户的地理位置信息与其预先存储的用户画像数据局部不相匹配,办公场所和/或家庭住址发生变化。

其中,在风险度评估信息中,低风险度评估信息和高风险度评估信息之外的状态对应中风险度评估信息。

在一具体实施方式中,步骤S4中采用相似度检测算法将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息。

具体地,采用相似度检测算法分别计算办公场所与办公质心POI信息的第一检测值和家庭住址与住址质心POI信息的第二检测值。若第一检测值大于第一阈值,则认定办公场所与办公质心POI信息相匹配,反之则不相匹配。若第二检测值大于第一阈值,则认定家庭住址与住址质心POI信息相匹配,反之则不相匹配。

相应地,采用相似度检测算法分别计算办公场所与办公子集群中的办公POI信息的第三检测值,和/或家庭住址与住址子集群中的住址POI信息的第四检测值。若第三检测值大于第二阈值,则认定办公场所与办公子集群中的办公POI信息相匹配,反之则不相匹配。若第四检测值大于第二阈值,则认定家庭住址与住址子集群中的住址POI信息相匹配,反之则不相匹配。

在一具体实施方式中,用户画像数还包括管户人员ID和管户人员联系方式。该基于位置服务的风险评估方法还包括:在输出高风险度评估信息时,将办公位置动态信息和/或住址位置动态信息发送给管户人员ID对应的管户人员。在输出高风险度评估信息时,表示其办公位置动态信息和住址位置动态信息均发生变化,或者办公位置动态信息和/或住址位置动态信息发生变化,因此,需将发生变化的办公位置动态信息和/或住址位置动态信息发送给管户人员ID,由管户人员ID对应的管户人员对用户画像数据进行跟进处理,如进行信息核实,用户画像数据更新等,避免因办公位置动态信息和/或住址位置动态信息发生变化而导致金融机构提供的贷款等金融业务的业务风险增大的问题出现。

本实施例所提供的基于位置服务的风险评估方法中,基于位置服务获取用户的地理位置信息,地理位置信息具有客观性和实时性。通过对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集,再对办公区域数据集和住址区域数据集分别进行聚类分析,以获取办公位置动态信息和住址位置动态信息。其中,划分办公区域数据集和住址区域数据集并分别聚类,使得办公区域数据集和住址区域数据集中的POI信息的数据量较小,有利于提高聚类效果,节省聚类处理时间。由于办公位置动态信息和住址位置动态信息具有客观性,使得利用办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对,输出的用户风险度评估信息具有客观性,可有效评估用户画像数据是否发生变化,可提高对用户画像数据变动产生的风险的管控。由于实时采集用户的地理位置信息,并对预设期间内的地理位置信息进行聚类分析获取到的办公位置动态信息和住址位置动态信息可客观反映用户的用户画像数据,可将办公位置动态信息和住址位置动态信息实时更新为新的用户画像数据,以提高用户风险度评估信息的准确性。

实施例2

图2示出本实施例中基于位置服务的风险评估装置的一流程图。如图2所示,该基于位置服务的风险评估装置可以设置在银行、保险、证券等金融机构的后台服务器上。如图2所示,该基于位置服务的风险评估装置包括信息获取单元10、信息划分单元20、聚类分析单元30、评估结果输出单元40和信息发送单元50。

信息获取单元10,用于基于位置服务获取用户的地理位置信息,地理位置信息包括与时间相关联的POI信息。

以任一用户一天的地理位置信息为例,该地理位置信息中包括0:00—24:00的POI信息,每一POI信息用于指示电子地图中的一点,包括POI点名称、经度和纬度等信息。基于用户的地理位置信息,可了解用户每天经过的家庭住址、办公场所、购物场所、娱乐场所、健身场所等信息。可以理解地,基于位置服务获取用户的地理位置信息,具有较强的客观性和可靠性。

基于位置服务(Location Based Service,简称LBS)是通过电信移动运营商的无线电通讯网络(如GSM网、CDMA网)或外部定位方式(如GPS)获取移动终端用户的位置信息(地理坐标,或大地坐标),在地理信息系统(Geographic Information System,简称GIS)平台的支持下,为用户提供相应服务的一种增值业务。总体来看,LBS由移动通信网络和计算机网络结合而成,两个网络之间通过网关实现交互。移动终端通过移动通信网络发出请求,经过网关传递给LBS服务平台;LBS服务平台根据用户请求和用户当前位置进行处理,并将结果通过网关返回给用户。POI(Point Of Interest,即兴趣点或信息点),包括名称、类型、经度、纬度等资料,以使POI可在电子地图上呈现,以标示电子地图上的某个地标、景点等地点信息。

本实施例中,基于位置服务的移动终端为智能手机,通过开启智能手机上的定位功能,以使LBS服务平台实时获取智能手机的地理位置信息,从而获取该智能手机对应的用户的地理位置信息。其中,POI信息与时间相关联,每一POI信息包括日期和时刻,通过该地理位置信息可了解用户在任一时刻所处的POI信息。可以理解地,地理位置信息与用户ID相关联,用户ID用于识别唯一识别用户,可以是身份证号或手机号。

可以理解地,为了减少数据处理量,提高处理效率,可预先设置时间阈值,以使基于位置服务获取用户的地理位置信息时,只获取用户在任一地点停留时间达到该时间阈值的POI信息,以避免采集到的与时间相关联的POI信息的数据量较多,导致处理效率低的问题。

信息划分单元20,用于对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集。

其中,预设期间可以是当前系统时间之前任意一段时间,可以为一个月、三个月或半年等,可根据需求自主设置。预设时间界限可以是用于划分办公时间和休息时间的界限。基于预设时间界限可将所有POI信息划分为办公区域数据集和住址区域数据集,以便基于办公区域数据集和住址区域数据集对用户画像数据进行跟进处理。本实施例中,将8:00-20:00作为办公时间,其对应的地理位置信息为办公区域数据集;相应地,20:00-次日8:00作为休息时间,其对应的地理位置信息为住址区域数据集。

聚类分析单元30,用于对办公区域数据集和住址区域数据集分别进行聚类分析,分别获取办公位置动态信息和住址位置动态信息。其中,办公位置动态信息是对办公区域数据集中所有POI信息进行聚类分析的结果;住址位置动态信息是对住址区域数据集中所有POI信息进行聚类分析的结果。办公位置动态信息和住址位置动态信息可客观反映用户在预设期间内的日常生活轨迹,可利用办公位置动态信息和住址位置动态信息实现对用户画像数据实时跟进,以保证跟进后的用户画像数据的客观性。

本实施例中,先将用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集,再对办公区域数据集和住址区域数据集分别进行聚类分析,使得办公区域数据集和住址区域数据集中的POI信息的数据量较小,有利于提高聚类效果,节省聚类处理时间。

聚类分析单元30具体包括第一聚类子单元31和第二聚类子单元32。

第一聚类子单元31,用于采用DBSCAN聚类算法对办公区域数据集中的POI信息进行聚类,以获取若干办公子集群,每一办公子群集包括至少一个办公POI信息。采用DBSCAN聚类算法对住址区域数据集中的POI信息进行聚类,以获取若干住址子集群,每一住址子群集包括至少一个住址POI信息。

其中,DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类算法)是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。DBSCAN聚类算法具有聚类速度快且能够有效处理噪声和发现任意形成的空间聚类的优点。

具体地,预设办公区域数据集的扫描半径(以下简称为eps)和最小包含点数(minPts),任选一个未被访问(unvisited)的POI信息开始,找出与其距离在eps之内(包括eps)的所有POI信息,将POI信息与距离在eps之内的所有POI信息作为一个办公子集群输出,办公子集群中的POI信息为办公POI信息。相应地,预设住址区域数据集的扫描半径(eps)和最小包含点数(minPts),任选一个未被访问(unvisited)的POI信息开始,找出与其距离在eps之内(包括eps)的所有POI信息,将POI信息与距离在eps之内的所有POI信息作为一个住址子集群输出,住址子集群中的POI信息为住址POI信息。

第二聚类子单元32,用于采用K-MEANS聚类算法对每一办公子集群进行迭代聚类,以获取办公子集群的办公质心POI信息;办公位置动态信息包括办公POI信息和办公质心POI信息。采用K-MEANS聚类算法对每一住址子集群进行迭代聚类,以获取住址子集群的住址质心POI信息;住址位置动态信息包括住址POI信息和住址质心POI信息。

K-MEANS算法是很典型的基于距离的算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。其计算公式为其中,k个初始类聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机的选取任意k个对象作为初始聚类的中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给最近的簇。若一次迭代前后,J的值没有发生变化,说明算法已经收敛。K-MEANS算法可快速简单地对数据进行聚类,对大数据集具有较高的效率且可伸缩性,时间复杂度近于线性,而且适合挖掘大规模数据集。

本实施例中,采用K-MEANS算法对每一办公子集群中的POI信息进行迭代聚合,直到最后一次迭代时,迭代前后数值没有发生变化,则获取该办公子集群的办公质心POI信息,从而获取包括办公POI信息和办公质心POI信息的办公位置动态信息。相应地,采用K-MEANS算法对每一住址子集群中的POI信息进行迭代聚合,直到最后一次迭代时,迭代前后数值没有发生变化,则获取该住址子集群的住址质心POI信息,从而获取包括住址POI信息和住址质心POI信息的住址位置动态信息。

若用户某天的地理位置信息包括与时间相关联的如下POI信息:A、B、C、D、E、F、G、H、F、I、J、K……E、D、A,若A为家庭住址,B和C分别为家庭住址附近eps内的地点,D和E为工作路上获取的地点,F为办公地址,G为办公地址附近eps内的地点,H、I、J、K为消费场所等。第一聚类子单元31中采用DBSCAN聚类算法进行聚类时,通过设置扫描半径(eps)和最小包含点数(minPts),可将家庭住址和家庭住址附近eps内所有的POI信息聚类为一住址子集群输出,将办公场所和办公场所附近eps内所有的POI信息聚类为一办公子集群输出。第二聚类子单元32对每一办公子集群和住址子集群分别采用K-MEANS聚类算法进行迭代聚合,以获取每一办公子集群的办公质心POI信息,并获取每一住址子集群住址质心POI信息。其中,办公质心POI信息是办公子集群的办公POI信息中的一个,住址质心POI信息是住址子集群的住址POI信息中的一个;住址位置动态信息包括住址POI信息和住址质心POI信息。

评估结果输出单元40,用于将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息。

其中,用户画像数据包括用户ID、办公场所和家庭住址。用户画像数据可以是用户在办理相关业务时采集到的用户画像数据,也可以是基于位置服务实时跟进后存储的用户画像数据。利用办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对,由于办公位置动态信息和住址位置动态信息具有客观性,使得比对后输出的用户风险度评估信息具有客观性。其中,用户风险度评估信息包括低风险度评估信息、中风险度评估信息和高风险度评估信息。

进一步地,由于实时采集用户的地理位置信息,并对预设期间内的地理位置信息进行聚类分析获取到的办公位置动态信息和住址位置动态信息可客观反映用户的用户画像数据,可将办公位置动态信息和住址位置动态信息实时更新为新的用户画像数据,使得下次评估时可利用新的用户画像数据进行对比,以提高用户风险度评估信息的准确性。

评估结果输出单元40具体包括第一判断子单元41、第一处理子单元42、第二判断子单元43和第二处理子单元44。

第一判断子单元41,用于判断办公场所是否与办公质心POI信息相匹配并判断家庭住址是否与住址质心POI信息相匹配。

第一处理子单元42,用于若均相匹配,输出低风险度评估信息。

第二判断子单元43,用于若不均相匹配,则判断办公场所是否与办公子集群中的办公POI信息相匹配,和/或判断家庭住址是否与住址子集群中的住址POI信息相匹配;

第二处理子单元44,用于根据判断结果输出高风险度评估信息或中风险度评估信息。

本实施例中,设a为办公场所,b为家庭住址,A为办公质心POI信息,U为办公子集群,B为住址质心POI信息,Y为住址子集群;将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对的结果如下表所示,其中,=表示匹配,≠表示不匹配。

本实施例中,办公场所与办公质心POI信息或办公子集群的匹配状态有如下三种情况:办公场所与办公质心POI信息相匹配(a=A)、办公场所与办公子集群中的办公POI信息相匹配(a=U)和办公场所与办公子集群中的办公POI信息不相匹配(a≠U)。相应地,家庭住址与住址质心POI信息或住址子集群的匹配状态有如下三种情况:家庭住址与住址质心POI信息相匹配(b=B)、家庭住址与住址子集群中的住址POI信息相匹配(b=Y)和家庭住址与住址子集群中的住址POI信息不相匹配(b≠Y)。因此,将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对的结果有如上表所示九种状态。

若办公场所与办公质心POI信息相匹配且家庭住址与住址质心POI信息相匹配,即状态1,其对应的风险度评估等级为I级,输出低风险度评估信息,表示用户在预设期间内基于位置服务获取到的地理位置信息与其预先存储的用户画像数据相匹配,办公场所和家庭住址位置均没有变化。

在一具体实施方式中,若办公场所与办公子集群中的办公POI信息不相匹配,且家庭住址在住址子集群中的住址POI信息不相匹配,即状态9,其对应的风险度评估等级为VI级,根据业务需求,可将VI级的风险度评估等级作为高风险度评估信息输出,表示用户在预设期间内基于位置服务获取到的用户的地理位置信息与其预先存储的用户画像数据完全不相匹配,办公场所和家庭住址均发生变化。

在另一具体实施方式中,若办公场所与办公子集群中的办公POI信息不相匹配和/或家庭住址在住址子集群中的住址POI信息不相匹配,即状态3、6、7、8和9,其对应的风险度评估等级为IV级、V级和VI级,根据业务需求,可将IV级、V级和VI级的风险度评估等级作为高风险度评估信息输出,表示用户在预设期间内基于位置服务获取到的用户的地理位置信息与其预先存储的用户画像数据局部不相匹配,办公场所和/或家庭住址发生变化。

其中,在风险度评估信息中,低风险度评估信息和高风险度评估信息之外的状态对应中风险度评估信息。

在一具体实施方式中,评估结果输出单元40采用相似度检测算法将办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行对比,输出用户风险度评估信息。

具体地,采用相似度检测算法分别计算办公场所与办公质心POI信息的第一检测值和家庭住址与住址质心POI信息的第二检测值。若第一检测值大于第一阈值,则认定办公场所与办公质心POI信息相匹配,反之则不相匹配。若第二检测值大于第一阈值,则认定家庭住址与住址质心POI信息相匹配,反之则不相匹配。

相应地,采用相似度检测算法分别计算办公场所与办公子集群中的办公POI信息的第三检测值,和/或家庭住址与住址子集群中的住址POI信息的第四检测值。若第三检测值大于第二阈值,则认定办公场所与办公子集群中的办公POI信息相匹配,反之则不相匹配。若第四检测值大于第二阈值,则认定家庭住址与住址子集群中的住址POI信息相匹配,反之则不相匹配。

在一具体实施方式中,用户画像数还包括管户人员ID和管户人员联系方式。该基于位置服务的风险评估装置还包括信息发送单元50,用于在输出高风险度评估信息时,将办公位置动态信息和/或住址位置动态信息发送给管户人员ID对应的管户人员。在输出高风险度评估信息时,表示其办公位置动态信息和住址位置动态信息均发生变化,或者办公位置动态信息和/或住址位置动态信息发生变化,因此,需将发生变化的办公位置动态信息和/或住址位置动态信息发送给管户人员ID,由管户人员ID对应的管户人员对用户画像数据进行跟进处理,如进行信息核实,用户画像数据更新等,避免因办公位置动态信息和/或住址位置动态信息发生变化而导致金融机构提供的贷款等金融业务的业务风险增大的问题出现。

本实施例所提供的基于位置服务的风险评估装置中,基于位置服务获取用户的地理位置信息,地理位置信息具有客观性和实时性。通过对用户在预设期间内所有POI信息按预设时间界限划分成办公区域数据集和住址区域数据集,再对办公区域数据集和住址区域数据集分别进行聚类分析,以获取办公位置动态信息和住址位置动态信息。其中,划分办公区域数据集和住址区域数据集并分别聚类,使得办公区域数据集和住址区域数据集中的POI信息的数据量较小,有利于提高聚类效果,节省聚类处理时间。由于办公位置动态信息和住址位置动态信息具有客观性,使得利用办公位置动态信息和住址位置动态信息与预先存储的用户画像数据进行比对,输出的用户风险度评估信息具有客观性,可有效评估用户画像数据是否发生变化,可提高对用户画像数据变动产生的风险的管控。由于实时采集用户的地理位置信息,并对预设期间内的地理位置信息进行聚类分析获取到的办公位置动态信息和住址位置动态信息可客观反映用户的用户画像数据,可将办公位置动态信息和住址位置动态信息实时更新为新的用户画像数据,以提高用户风险度评估信息的准确性。

本发明是通过几个具体实施例进行说明的,本领域技术人员应当明白,在不脱离本发明范围的情况下,还可以对本发明进行各种变换和等同替代。另外,针对特定情形或具体情况,可以对本发明做各种修改,而不脱离本发明的范围。因此,本发明不局限于所公开的具体实施例,而应当包括落入本发明权利要求范围内的全部实施方式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1