目标信息确定方法、装置和设备与流程

文档序号:22324453发布日期:2020-09-25 17:52阅读:144来源:国知局
目标信息确定方法、装置和设备与流程

本申请涉及大数据处理技术领域,特别涉及一种目标信息确定方法、装置和设备。



背景技术:

目前,一些不法人员可能会利用银行中的流程漏洞与银行用户合作,从而出现骗贷、洗钱等风险行为,从而会给银行带来一定的损失风险。

现有技术中的银行的审批系统,仅提供流程上的功能支持,例如:数据录入和数据存储等。需要相关业务人员的经验来对用户资料进行审核和筛选,以筛查出可能存在风险的数据。而业务人员仅通过用户提供的资料较难识别出用户与些不法人员之间的合作行为,需要花费较大成本和时间进行筛查工作,并且对业务人员的工作经验和专业素质要求较高。由此可见,采用现有技术中的技术方案无法高效、准确地对用户的数据进行挖掘和筛选。

针对上述问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请实施例提供了一种目标信息确定方法、装置和设备,以解决现有技术中无法高效、准确地对用户的数据进行挖掘和筛选的问题。

本申请实施例提供了一种目标信息确定方法,包括:采集用户数据集、第三方用户数据集和信息集,其中,所述信息集中包括至少一条资源转移信息,所述资源转移信息表示所述用户和/或所述第三方用户的资源转移情况;从所述用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中包括:实体、属性和实体间的关系;根据所述多组目标数据构建得到第一知识图谱;其中,所述第一知识图谱表示所述用户和所述第三方用户之间的关系;根据所述第一知识图谱,确定所述用户中目标用户的资源转移信息中的目标信息;其中,所述目标信息表示所述目标用户与所述第三方用户之间的资源转移特征。

在一个实施例中,根据所述第一知识图谱,确定所述用户中目标用户的资源转移信息中的目标信息,包括:获取所述第一知识图谱中各个实体之间的社会属性关系;根据所述第一知识图谱中各个实体之间的社会属性关系,将所述第一知识图谱对应的图结构转换为超图结构,得到第二知识图谱;根据所述第二知识图谱,确定所述目标用户的资源转移信息中的目标信息。

在一个实施例中,根据所述第二知识图谱,确定所述目标用户的资源转移信息中的目标信息,包括:根据所述第二知识图谱,确定所述目标用户与所述第三方用户中的目标第三方用户之间是否存在资源转移关系;在确定存在资源转移关系的情况下,从所述第二知识图谱中获取所述目标用户与所述目标第三方用户之间的目标资源转移数据;根据所述目标资源转移数据,确定所述目标用户转移给目标账户的资源中来源于所述目标第三方用户的比例是否在预设范围内;在确定所述目标用户转移给目标账户的资源中来源于所述目标第三方用户的比例在预设范围内的情况下,确定所述目标用户的资源转移信息中的目标信息。

在一个实施例中,在确定所述用户中目标用户的资源转移信息中的目标信息之后,还包括:从所述第二知识图谱中获取所述目标用户的相关信息和所述目标第三方用户的相关信息;从所述第二知识图谱中抽取包含所述目标用户和所述目标第三方用户的目标关系子图;根据所述目标用户的相关信息、所述目标第三方用户的相关信息和所述目标关系子图生成目标用户信息;获取所述目标用户对应的处理对象;将所述目标用户信息发送给所述处理对象。

在一个实施例中,从所述用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,包括:从所述用户数据集中抽取出用户实体、用户的属性和用户间的社会关系;从所述第三方用户数据集中抽取出第三方用户实体、第三方用户的属性和第三方用户间的社会关系;从所述信息集中抽取出各个实体之间的资源转移关系和资源转移属性;对抽取得到的所述用户实体、用户的属性、用户间的社会关系、第三方用户实体、第三方用户的属性、第三方用户间的社会关系、各个实体之间的资源转移关系和资源转移属性进行匹配,得到出多组目标数据。

在一个实施例中,所述第三方用户包括:金融机构、金融机构的员工、中介员工和中介公司。

本申请实施例还提供了一种目标信息确定装置,包括:数据采集模块,用于采集用户数据集、第三方用户数据集和信息集,其中,所述信息集中包括至少一条资源转移信息,所述资源转移信息表示所述用户和/或所述第三方用户的资源转移情况;数据抽取模块,用于从所述用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中包括:实体、属性和实体间的关系;构建模块,用于根据所述多组目标数据构建得到第一知识图谱;其中,所述第一知识图谱表示所述用户和所述第三方用户之间的关系;确定模块,用于根据所述第一知识图谱,确定所述用户中目标用户的资源转移信息中的目标信息;其中,所述目标信息表示所述目标用户与所述第三方用户之间的资源转移特征。

在一个实施例中,所述确定模块包括:获取单元,用于获取所述第一知识图谱中各个实体之间和社会属性关系;转换单元,用于根据所述第一知识图谱中各个实体之间和社会属性关系,将所述第一知识图谱对应的图结构转换为超图结构,得到第二知识图谱;确定单元,用于根据所述第二知识图谱,确定所述目标用户的资源转移信息中的目标信息。

本申请实施例还提供了一种目标信息确定设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述目标信息确定方法的步骤。

本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述目标信息确定方法的步骤。

本申请实施例提供了一种目标信息确定方法,通过采集用户数据集、第三方用户数据集和信息集,信息集中包括至少一条资源转移信息,所述资源转移信息表示所述用户和/或所述第三方用户的资源转移情况,可以使得用其构建得到的第一知识图谱中包含第三方用户的信息,从而可以全面的挖掘出目标信息。进一步的,可以从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,并以上述多组目标数据中的实体为节点构建得到第一知识图谱,其中,每组目标数据中包括:实体、属性和实体间的关系。由于上述第一知识图谱中包含了用户之间、用户和第三方用户之间以及第三方用户之间的所有资源转移信息,因此,可以根据第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息,其中,利用第一知识图谱可以高效、准确地进行数据挖掘,加快了银行审核的效率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。在附图中:

图1是根据本申请实施例提供的目标信息确定系统的示意图;

图2是根据本申请实施例提供的目标信息确定方法的步骤示意图;

图3是根据本申请实施例提供的第一知识图谱的示意图;

图4是根据本申请实施例提供的第二知识图谱的示意图;

图5是根据本申请实施例提供的目标信息确定装置的结构示意图;

图6是根据本申请实施例提供的目标信息确定设备的结构示意图。

具体实施方式

下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域的技术人员知道,本申请的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本申请公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

虽然下文描述流程包括以特定顺序出现的多个操作,但是应该清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。

所述知识图谱(knowledgegraph)可以是指一种揭示实体之间关系的语义网络,其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。

在本申请的一个场景示例中提供了一种目标信息确定系统,如图1所示,可以包括:终端设备101、银行服务器102,用户可以通过终端设备101在银行系统中发起资源转移请求,银行服务器102可以基于用户提交的资源转移请求操作,确定用户的资源转移信息中的目标信息,并在确定用户的资源转移信息中存在风险数据的情况下进行风险提示。进一步的,还可以将用户的资源转移信息中的目标信息的确定结果反馈至上述终端设备101。

上述终端设备101可以是用户操作使用的终端设备或者软件。具体的,终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表或者其它可穿戴设备等终端设备,也可以是机器人设备等等。当然,终端设备101也可以是能运行于上述终端设备中的软件。例如:银行系统应用、支付应用、浏览器、微信小程序等应用软件。

上述银行服务器102可以是单一的服务器,也可以是服务器集群,当然,服务器的功能也可以是通过云计算技术实现的。该银行服务器102可以与多个终端设备相连,也可以是具备一个强大的银行信息集库的服务器,可以基于用户发起资源转移申请以及银行信息集库中的信息集进行数据筛选。

请参阅图2,本实施方式可以提供一种目标信息确定方法。该目标信息确定方法可以用于在线上对用户提交的资源转移请求进行审核,并筛选出目标信息。上述目标信息确定方法可以包括以下步骤。

s201:采集用户数据集、第三方用户数据集和信息集,其中,信息集中包括至少一条资源转移信息,资源转移信息表示用户和/或第三方用户的资源转移情况。

在本实施方式中,用户数据集可以为与用户相关的数据的集合,可以包括:用户的资源信息数据、关系信息数据和基本信息数据,上述资源可以包括:虚拟货币、账户资金、黄金、房产等固定资产等。资源转移信息可以用于表示用户之间、用户和第三方用户之间或者第三方用户之间的资源转移情况,在一个实施例中,资源转移可以包括:转账、借贷、还贷、购买理财产品等。上述用户可以为当前正在申请进行资源转移的用户或者历史进行过资源转移的用户,具体的,可以为有借贷历史的用户、已提交借贷申请待审核的用户。

在一个实施方式中,上述用户数据集可以包括:身份证号码、预留电话号码、工作单位、银行账户信息、贷款账户号、首付款金额、贷款金额、贷款申请日期、银行账户开户日期、借贷申请的审批日期、房屋信息、各个用户之间的社会关系属性等。

在本实施方式中,上述第三方用户可以为在用户进行资源转移的过程中可能存在资源关联或者会使用户的资源来源存在潜在风险的第三方,上述第三方用户可以为公司、机构或者个人用户,本申请对此不作限定。上述第三方用户数据集可以为与第三方用户相关的数据的集合,可以包括:公司工商数据、人行征信数据、公积金数据、代发工资数据、对公客户信息数据、对私客户信息数据等。

上述信息集可以为用户之间、用户与第三方用户之间以及第三方用户之间的资源转移信息。在一个实施例中,上述信息集中可以包括:对私账户资金流水交易信息、对公账户资金流水交易信息等。当然在一些实施例中,上述用户数据集、第三方用户数据集和信息集还可以包括其它数据,具体的可以根据实际情况确定,本申请对此不作限定。

在本实施方式中,采集用户数据集、第三方用户数据集和信息集的方式可以包括:从预设数据库中拉取得到,或者,结合语料库使用规则抽取方法从文本描述中挖掘得到。其中,上述预设数据库可以为银行或者其它金融机构中存储历史数据以及用户实时提交、产生的数据的数据库。

s202:从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中包括:实体、属性和实体间的关系。

在本实施方式中,可以从上述用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中可以包括:实体、属性和实体间的关系,上述多组目标数据可以用于构建由“实体-关系-实体”三元组构成的网状关系网络,将独立数据转变成结构化的知识关联数据库。

在本实施方式中,由于数据可以简单的理解为一种符号,其表示形式主要包括有文字、图表、语音等,而信息则是数据所承载或表达的内容,知识则又是对信息的整合与抽象。因此,上述信息的抽取可以是知识图谱构建的基础和前驱,信息的抽取可以包括:实体抽取、关系抽取和属性抽取。

其中,实体抽取在技术可以称为ner(namedentityrecognition,命名实体识别),指的是从原始语料中自动识别出命名实体。关系抽取:可以通过人工构造语义规则以及模板的方法识别实体关系,或者,利用实体间的关系模型识别实体关系。属性抽取主要是针对实体而言的,由于实体的属性可以看成是实体与属性值之间的一种名称性关系,因此,在一些实施例中也可以将实体属性的抽取问题转换为关系抽取问题。

在本实施方式中,上述实体是知识图谱的基本单元,也是文本中承载信息的重要语言单位,例如:人名、地名、机构名。上述属性可以用于表征上述实体,通过属性可形成对实体的完整勾画,上述属性可以包括:身份证号、账户号、房贷标志、贷款账户号、首付款金额、贷款金额、申请日期、开户日期、审批日期、房屋信息、资源转移金额和资源转移时间等。上述实体间的关系可以用于解决实体间语义链接的问题,具体的,可以包括:工作关系、资源转移关系、社会关系等。

上述目标数据可以为类似(实体1,关系,实体2)的三元组数据,也可以为类似(实体、属性,属性值)的三元组数据,例如:(姚明,plays-in,nba),或者(姚明,身高,2.29m),当然可以理解的是,抽取得到的多组目标数据还可以为其它可能的形式,具体的本申请对此不作限定。

在本实施方式中,由于上述用户数据集、第三方用户数据集和信息集可以为非结构化数据、半结构化数据或者结构化数据,因此,可以针对不同类型的数据分别进行处理。在一个实施例中,可以对采集到的用户数据集、第三方用户数据集和信息集进行数据清洗和数据规范化的预处理,其中包含身份证验证、身份证清洗等步骤,清洗掉脏数据,以提高数据质量。

进一步的,可以对预处理后的非结构化数据、半结构化数据(例如:文本等)进行分词抽取处理,再基于分词抽取处理后的结果进行目标数据的抽取。而对于用户基本信息这一类结构化数据可以直接抽取相关字段,不需要进一步加工。

s203:根据多组目标数据构建得到第一知识图谱;其中,第一知识图谱表示用户和第三方用户之间的关系。

在本实施方式中,可以根据多组目标数据构建得到第一知识图谱,其中,多组目标数据中的实体为节点,第一知识图谱中每两个实体间通过关系进行连接得到边,每个节点和边都有其对应的属性,即实体的属性和关系的属性。上述实体的属性可以包括但不限于以下至少之一:身份证号、账户号、房贷标志、贷款账户号、首付款金额、贷款金额、申请日期、开户日期、审批日期、房屋信息等,上述关系的属性可以包括以下至少之一:资源转移金额、资源转移时间、社会关系属性(例如:配偶、上下级、朋友等)。

在本实施方式中,上述第一知识图谱可以用于表示用户和第三方用户之间的关系,在一个具体的实施例中,上述第一知识图谱可以如图3中所示,可以包括实体:公司a、员工a、员工b、员工c、用户a和用户b,可以理解的是,上述图3仅是本申请中的一个示例,并不用于限制本申请。

为了对第一知识图谱进行有效的存储以方便检索和调用,需要根据图谱的实际情况出发进行数据库的选择。数据库的类型主要有:关系型数据库、图数据库、nosql数据库等。其中,如果图谱结构、关系复杂,连接多,可采用图数据库,如neo4j;如果图谱侧重节点知识,关系简单,连接少,则关系型数据库或es即可满足要求;如果考虑图谱性能、扩展性和分布式等,可采用nosql数据库。在一些实施例中,还可以将上述多种数据库进行融合使用,具体的可以根据实际情况确定,本申请对此不作限定。

s204:根据第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息;其中,目标信息表示目标用户与第三方用户之间的资源转移特征。

在本实施方式中,由于上述第一知识图谱中包含了用户之间、用户和第三方用户之间以及第三方用户之间的所有资源转移信息,因此,可以根据上述第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息。

在本实施方式中,上述目标用户可以为需要进行审核的用户,上述目标用户的资源转移信息可以为与需要审核的资源相关联的资源转移信息。在一个实施例中,在需要审核的资源为贷款的情况下,与需要审核的资源相关联的资源转移信息可以包括:目标用户还款的资金来源、目标用户支付首付款的资金来源等。

在本实施方式中,上述目标信息可以为从第一知识图谱中筛选得到的用于表示目标用户与第三方用户之间的资源转移特征,上述目标信息可以为目标用户的资源转移信息中不符合目标用户常规资源转移行为的数据。其中,上述资源转移特征可以包括目标用户与第三方用户之间资源转移的时间、属性和性质等。在一个实施例中,一般用户的资源均来源于代发工资或者具有社会属性关系的用户,那么资源转移信息中目标用户资源部分或者全部来源于第三方用户的信息就属于目标信息。例如:上述资源转移特征可以为第三方用户在目标用户申请房贷的一个月前向目标用户转账50万元。

在一个实施方式中,还可以在确定得到目标用户的资源转移信息中的目标信息的情况下向目标用户的处理对象发送提示信息。在本实施方式中,在确定目标用户的资源转移信息中存在目标信息的情况下,说明目标用户可能会存在风险,此时需要对目标用户进行及时的处理。由于每个用户都有其对应的处理对象,可以根据目标用户的相关信息、涉及到的第三方用户的相关信息、第一知识图谱中包含目标用户和目标第三方用户的目标关系子图生成目标用户信息,并将生成的目标用户信息发送给与目标用户对应的处理对象。

在本实施方式中,上述处理对象可以为客户经理或者其他负责审核的工作人员,具体的本申请对此不作限定。

从以上的描述中,可以看出,本申请实施例实现了如下技术效果:通过采集用户数据集、第三方用户数据集和信息集,信息集中包括至少一条资源转移信息,资源转移信息表示用户和/或第三方用户的资源转移情况,可以使得用其构建得到的第一知识图谱中包含第三方用户的信息,从而可以全面的挖掘出目标信息。进一步的,可以从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,并以上述多组目标数据中的实体为节点构建得到第一知识图谱,其中,每组目标数据中包括:实体、属性和实体间的关系。由于上述第一知识图谱中包含了用户之间、用户和第三方用户之间以及第三方用户之间的所有资源转移信息,因此,可以根据第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息,其中,利用第一知识图谱可以高效、准确地进行数据挖掘,加快了银行审核的效率。

在一个实施方式中,由于第三方用户可能会与目标用户合作,出现骗贷、洗钱、套贷和囤房的风险行为,过程中第三方用户会向用户提供需要转移给目标账户的全部或部分资源。第三方用户会对达不到贷款资格的用户进行身份包装,使其能申请到与本身消费能力不符合的房贷,或者第三方用户借用多个有贷款资格用户的身份去申请多笔房贷进行囤房。由于用户本身没有相应首付款支付能力或者实际不由用户本身支付和还款,因此,需要第三方用户在贷款前后提供部分或全部需要转移给目标账户资源给用户。从而信息集能有效反映用户在贷款前后和第三方用户之间的资源转移情况,能有效追踪首付款或还款资金来源。因此,上述第三方用户可以包括:金融机构、金融机构的员工、中介员工和中介公司。

在本实施方式中,上述目标账户可以为进行资源转移时涉及的对手方账户,在一些实施例中,上述目标账户可以为银行的账户,例如,用户贷款后每月还款需要进行资源转移的账户,当然还可以为其它账户,具体的可以根据实际情况确定,本申请对此不作限定。

在上述第三方用户为中介员工和中介公司的情况下,构建的知识图谱中可能出现的实体、属性和关系可以包括:1)用户,在行内有业务活动的用户,属性包含身份证号、银行账户号、房贷标志等。房贷标志表示该用户是否有房贷,如果有房贷,用户的属性还包括贷款账户号、首付款金额、贷款金额、申请日期、开户日期、审批日期、房屋信息等。2)中介员工,属性包含身份证号,银行账户号等。3)中介公司,属性包含银行账户号等。4)中介员工-中介公司:关系类型有工作关系,表示该中介员工工作于该公司。5)中介员工-用户:关系类型有资源转移关系,表示该中介员工资源转移给该用户,资源转移关系属性包含资源转移金额和资源转移时间等。6)中介公司-用户:关系类型有资源转移关系,表示该中介公司资源转移给该用户,属性包含资源转移金额和资源转移时间等。7)用户-用户:关系类型包含资源转移关系和社会关系,其中资源转移关系属性包含资源转移金额和资源转移时间等,社会关系属性包含显示用户之间社会关系类型的标签,属性值有“配偶”、“朋友”等。

在本实施方式中,由于预设的数据库中没有直接的中介清单数据,因此,需要从第三方用户数据集中挖掘。在一个实施例中,可以首先建立中介语料库,然后通过工商数据表中的企业经营范围等字段,结合语料库使用规则抽取方法从文本描述中挖掘出中介公司,获得一份中介公司清单,并结合行内的公积金数据、代发工资数据和人行征信数据等数据挖掘出中介员工和中介员工的账户信息。其中,上述企业经营范围字段可以为一段文本描述,例如:某某公司的经营范围是“企业管理,计算机系统服务,电脑动画设计,经济信息咨询服务…”,可以通过这些文本描述挖掘出哪些公司是中介公司,从而可以得到中介公司清单。

在一个实施方式中,由于可能存在第三方用户将资金拆分后转入与用户相关的多个用户的账户,最后汇集到用户的账户作为转移给目标账户的资源的情况。因此,可以以用户为核心,挖掘与用户相关的其他用户。与用户相关的其他用户与用户有一定社会属性关系,且在行内有资源转移活动。在一个实施例中可以使用行内用户关系表,挖掘出与用户相关的其他用户,同时挖掘出两者之间的社会关系。在用户关系表中,存储了用户之间的关系。在用户之间的关系为文本描述的情况下,需要提取关系关键字,例如:“用户a和用户b为配偶关系”的文本描述需要提取出“配偶”关键字。

进一步的,在一个实施例中,可以先建立关系语料库,语料库里面包含所有关系词条,例如:“夫妻”、“丈夫”、“妻子”、“同学”、“母女”、“配偶”等词条。然后可以使用正则匹配技术提取各关系文本中的关系关键字,提取结束后进行关系融合,将相同词义关系合并成同一关系,例如:可以将“配偶”和“夫妻”均规范化为“配偶”关系,以剔除冗余关系连接。

在一个实施方式中,为了避免第三方用户团伙作案,将资金拆分到多人,然后由多人转入与用户相关的多个用户的账户,最后汇集到用户的账户作为转移给目标账户的资源的情况,可以获取第一知识图谱中各个实体之间的社会属性关系,根据第一知识图谱中各个实体之间的社会属性关系,将第一知识图谱对应的图结构转换为超图结构,得到第二知识图谱,其中,第二知识图谱可以如图4中所示。进一步的,可以根据第二知识图谱,确定目标用户的资源转移信息中的目标信息。

在本实施方式中,上述图结构一条边仅能连接两个节点,而超图结构一条边可以连接多个节点。上述第二知识图谱可以如图4中所示,虚线内的点在风险预警计算时回被融合成一个点,员工因为供职于同一家公司被融合为点公司a',用户a和b由于社会关系连接被融合成用户a'。将第一知识图谱对应的图结构转换为超图结构后,统计用户a与第三方用户之间的资源转移情况时,可以转化为统计公司a'与用户a'之间的资源转移,从而能够准确、有效地挖掘出第三方用户将资源拆分转移至用户账户的欺诈场景。

在本实施方式中,根据第二知识图谱,确定目标用户的资源转移信息中的目标信息,可以包括:根据第二知识图谱,确定目标用户与第三方用户中的目标第三方用户之间是否存在资源转移关系。其中,上述目标第三方用户可以为第二知识图谱中可能与目标用户之间存在资源转移关系的第三方用户。在确定存在资源转移关系的情况下,可以从第二知识图谱中获取目标用户与目标第三方用户之间的目标资源转移数据。

进一步的,可以根据上述目标资源转移数据,确定目标用户转移给目标账户的资源中来源于目标第三方用户的比例是否在预设范围内。在确定目标用户转移给目标账户的资源中来源于目标第三方用户的比例在预设范围内的情况下,确定目标用户的资源转移信息中的目标信息。在一些情况下,如果目标用户转移给目标账户的资源中来源于目标第三方用户的金额较少,可以判断目标信息中不存在风险,此时就需要先确定目标用户转移给目标账户的资源中来源于目标第三方用户的比例。在一个实施例中,可以按照以下公式判断目标用户的目标信息中是否存在风险:

其中,transt表示t时间范围内目标第三方用户给目标用户资源转移的总额;baseamt表示对比基础金额,例如:首付款或还款金额(月供等);β和α为阈值参数,β至α即为上述预设范围,β和α可以为大于0的任意数值,例如:0.5、0.83、1.0等,具体的可以根据实际需求设置,本申请对比不作限制。

当计算结果为1时表示目标用户的目标信息中存在风险数据,如果计算结果为0则表示无风险。在一个实施例中,可以通过参数t控制风险预警计算场景是首付款来源风险还是还款资金来源风险,例如:当选取的是目标用户提交借贷申请前n个月的数据,计算的则是首付款来源风险;选取目标用户开户后n个月的数据,计算的则是还款资金来源风险,一般t取目标用户提交借贷申请前或开户后三个月或者六个月等时间范围。上述公式可以表示目标用户在t时间范围内收到目标第三方用户的资源转移金额是baseamt金额上下浮动的β至α倍范围内时,判断目标用户的目标信息中中存在风险数据。

在一个实施方式中,在确定得到目标用户的资源转移信息中的目标信息的情况下可以进行提示,可以包括:从第二知识图谱中获取目标用户的相关信息和目标第三方用户的相关信息,并从第二知识图谱中抽取包含目标用户和目标第三方用户的目标关系子图。进一步的,可以根据目标用户的相关信息、目标第三方用户的相关信息和目标关系子图生成目标用户信息。为了准确地将挖掘出的目标用户信息进行实时反馈,可以获取目标用户对应的处理对象,并将目标用户信息发送给处理对象。

在本实施方式中,上述包含目标用户和目标第三方用户的目标关系子图可以为包含目标用户和目标第三方用户两个实体,以及两个实体的属性、两个实体之间的关系的子图,以使上述处理对象可以直观、清楚的了解目标用户所涉及的风险以及资源转移的全部过程。

在一个实施方式中,从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,可以包括:从用户数据集中抽取出用户实体、用户的属性和用户间的社会关系;从第三方用户数据集中抽取出第三方用户实体、第三方用户的属性和第三方用户间的社会关系;从信息集中抽取出各个实体之间的资源转移关系和资源转移属性。进一步的,可以对抽取得到的用户实体、用户的属性、用户间的社会关系、第三方用户实体、第三方用户的属性、第三方用户间的社会关系、各个实体之间的资源转移关系和资源转移属性进行匹配,得到出多组目标数据。

在本实施方式中,可以利用唯一id技术进行数据匹配,从而可以通过唯一id键将不同源数据进行关联,上述唯一id键可以为身份证号。利用唯一id技术进行数据匹配可以将用户与进行资源转移时未涉及的行内借记卡进行关联,从而获得该用户的所有资源转移信息,并且可以将第三方用户的相关数据进行整合,以保证数据的全面性,进而使得数据挖掘结果更加准确。

基于同一发明构思,本申请实施例中还提供了一种目标信息确定装置,如下面的实施例。由于目标信息确定装置解决问题的原理与目标信息确定方法相似,因此目标信息确定装置的实施可以参见目标信息确定方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图5是本申请实施例的目标信息确定装置的一种结构框图,如图5所示,可以包括:数据采集模块501、数据抽取模块502、构建模块503、确定模块504和风险提示模块505,下面对该结构进行说明。

数据采集模块501,可以用于采集用户数据集、第三方用户数据集和信息集,其中,信息集中包括至少一条资源转移信息,资源转移信息表示用户和/或第三方用户的资源转移情况。

数据抽取模块502,可以用于从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中包括:实体、属性和实体间的关系。

构建模块503,可以用于根据多组目标数据构建得到第一知识图谱;其中,第一知识图谱表示用户和第三方用户之间的关系。

确定模块504,可以用于根据第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息;其中,目标信息表示目标用户与第三方用户之间的资源转移特征。

在一个实施例中,上述确定模块504可以包括:获取单元,用于获取第一知识图谱中各个实体之间和社会属性关系;转换单元,用于根据第一知识图谱中各个实体之间和社会属性关系,将第一知识图谱对应的图结构转换为超图结构,得到第二知识图谱;确定单元,用于根据第二知识图谱,确定目标用户的资源转移信息中的目标信息。

本申请实施方式还提供了一种电子设备,具体可以参阅图6所示的基于本申请实施例提供的目标信息确定方法的电子设备组成结构示意图,电子设备具体可以包括输入设备61、处理器62、存储器63。其中,输入设备61具体可以用于输入用户数据集、第三方用户数据集和信息集。处理器62具体可以用于采集用户数据集、第三方用户数据集和信息集,其中,信息集中包括至少一条资源转移信息,资源转移信息表示用户和/或第三方用户的资源转移情况;从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中包括:实体、属性和实体间的关系;根据多组目标数据构建得到第一知识图谱;其中,第一知识图谱表示用户和第三方用户之间的关系;根据第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息;其中,目标信息表示目标用户与第三方用户之间的资源转移特征。存储器63具体可以用于存储第一知识图谱、风险数据等参数。

在本实施方式中,输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。输入设备还可以获取接收其他模块、单元、设备传输过来的数据。处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式等等。存储器具体可以是现代信息技术中用于保存信息的记忆设备。存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如ram、fifo等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、tf卡等。

在本实施方式中,该电子设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。

本申请实施方式中还提供了一种基于目标信息确定方法的计算机存储介质,计算机存储介质存储有计算机程序指令,在计算机程序指令被执行时可以实现:采集用户数据集、第三方用户数据集和信息集,其中,信息集中包括至少一条资源转移信息,资源转移信息表示用户和/或第三方用户的资源转移情况;从用户数据集、第三方用户数据集和信息集中抽取出多组目标数据,其中,每组目标数据中包括:实体、属性和实体间的关系;根据多组目标数据构建得到第一知识图谱;其中,第一知识图谱表示用户和第三方用户之间的关系;根据第一知识图谱,确定用户中目标用户的资源转移信息中的目标信息;其中,目标信息表示目标用户与第三方用户之间的资源转移特征。

在本实施方式中,上述存储介质包括但不限于随机存取存储器(randomaccessmemory,ram)、只读存储器(read-onlymemory,rom)、缓存(cache)、硬盘(harddiskdrive,hdd)或者存储卡(memorycard)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。

在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。

显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。

虽然本申请提供了如上述实施例或流程图所述的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述的方法的在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本申请的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1