一种授信用户动支意愿预测方法、装置和设备与流程

文档序号:18943970发布日期:2019-10-23 01:23阅读:513来源:国知局
一种授信用户动支意愿预测方法、装置和设备与流程

本发明涉及大数据、机器学习、互联网金融领域,具体而言,涉及一种授信用户动支意愿预测方法、装置、电子设备及计算机可读介质。



背景技术:

随着互联网金融的发展,各种无抵押贷款因其较高的收益率得到了快速的发展。在互联网金融平台中,信用贷款因其为不需要申请人提供任何的抵押物和担保,只凭借信用获得贷款的一种方式而备受关注。

然而新用户在通过授信得到额度之后,由于不了解贷款流程、不急需用钱等原因未进行首次贷款,导致每天发生首次贷款的用户数在授信数天后大幅下降,降低了收益率。为了提高整体的首贷率,目前的做法是在用户授信数天后介入营销手段,对全部处于授信未发生首贷的用户进行促动。但是由于用户数目过大以及用户行为特征的区分度较大,目前的做法缺少科学的指导依据,没有针对性,只是简单的通过提高营销覆盖率来指导营销,尽管耗费了大量的投入,却往往达不到想要的收益。

基于现有技术,为了向用户提供更加有针对性的服务,需要区分用户的动支意愿,从而针对性的推广业务,以及提高营销精准度。



技术实现要素:

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种高效、准确的授信用户动支意愿预测方法。

为解决上述技术问题,本发明的第一方面提出了一种授信用户动支意愿预测方法,包括如下步骤:从待预测的已授信且未动支用户数据中提取特征数据;将特征数据输入到授信未动支用户动支意愿预测模型,以获取预测动支概率;判断所述预测动支概率是否高于预定阈值,输出动支概率高于阈值的未动支用户的信息。

根据本发明的一种优选实施方式,所述方法进一步包括预先创建授信未动支用户动支意愿预测模型。

根据本发明的一种优选实施方式,所述预先创建授信未动支用户动支意愿预测模型,进一步包括:选取用户样本数据;并从所述用户样本数据中提取特征数据;将用户样本的特征数据作为输入训练参数,对所述授信未动支用户动支意愿预测模型进行建模训练,使所述预测模型能够根据输入的待预测用户的特征数据获得待预测用户的动支概率。

根据本发明的一种优选实施方式,所述用户特征数据包括用户行为数据,所述用户行为数据包括用户在特定事件前后的动支数据。

根据本发明的一种优选实施方式,所述特定事件是指营销事件。

根据本发明的一种优选实施方式,所述营销事件是指电话、短信、app消息推送,和/或渠道活动营销。

根据本发明的一种优选实施方式,所述方法还包括:将动支概率高于阈值的未动支用户的信息输出给营销系统。

根据本发明的一种优选实施方式,所述方法还包括:所述待预测的未动支用户数据是授信后未动支的时间在预定范围内的未动支用户数据。

根据本发明的一种优选实施方式,所述方法还包括:所述预定范围基于预测模型中用户意愿衰减曲线所确定。

本发明的第二方面提出一种授信用户动支意愿预测装置,包括:选取模块,用于从待预测的已授信且未动支用户数据中提取特征数据;预测模块,用于将特征数据输入到授信未动支用户动支意愿预测模型,以获取预测动支概率;推送模块,用于判断所述预测动支概率是否高于预定阈值,输出动支概率高于阈值的未动支用户的信息。

根据本发明的一种优选实施方式,所述装置还包括创建模块,用于预先创建授信未动支用户动支意愿预测模型。

根据本发明的一种优选实施方式,所述创建模块进一步包括:数据采集模块,用于选取用户样本数据;特征提取模块,用于从所述用户样本数据中提取特征数据;模型训练模块,用于将用户样本的特征数据作为输入训练参数,对所述授信未动支用户动支意愿预测模型进行建模训练;使所述预测模型能够根据输入的待预测用户的特征数据获得待预测用户的动支概率。

根据本发明的一种优选实施方式,所述用户特征数据包括用户行为数据,所述用户行为数据包括用户在特定事件前后的动支数据。

根据本发明的一种优选实施方式,所述特定事件是指营销事件。

根据本发明的一种优选实施方式,所述营销事件是指电话、短信、app消息推送,和/或渠道活动营销。

根据本发明的一种优选实施方式,所述推送模块还用于将动支概率高于阈值的未动支用户的信息输出给营销系统。

根据本发明的一种优选实施方式,所述待预测的未动支用户数据是授信后未动支的时间在预定范围内的未动支用户数据。

根据本发明的一种优选实施方式,所述预定范围基于预测模型中用户意愿衰减曲线所确定。

本发明的第三方面提出一种授信未动支用户动支意愿预测设备,该设备包括:处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-9中任一项所述的方法。

本发明的第四方面提出一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-9中任一项所述的方法。

本发明针对信贷领域已授信且未动支用户,采用预先训练的人工智能模型对待预测用户进行筛选,区分用户的动支意愿,仅将意愿较强的用户名单推送到相关部门进行外呼,解决了营销的盲目性,做到了精确推荐,降低成本的同时进一步提升了动支率与收益率。

附图说明

为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。

图1是本发明的授信用户动支意愿预测方法的流程示意图;

图2是本发明的授信用户动支意愿预测方法的具体实施例示意图;

图3是本发明的授信用户动支意愿预测装置的模块架构示意图;

图4是本发明的授信用户动支意愿预测设备的结构框架示意图;

图5是本发明的计算机可读存储介质示意图。

具体实施方式

现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。

在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。

在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。

术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

图1是本发明一种授信用户动支意愿预测方法的流程示意图。如图1所示,本发明的方法具有如下步骤:

s1、从待预测的已授信且未动支用户数据中提取特征数据。

首先,在信贷用户授权的基础上,通过信贷app或服务器获取信贷用户数据;该信贷用户数据包括用户基本信息,用户信用数据和用户行为数据。其中,用户基本信息包括性别、年龄、薪水、籍贯、教育背景、婚育、职业等;用户信用数据包括与用户相关的历史数据等;用户行为数据包括app个数等。

其次,根据信贷用户数据中的信息筛选出已授信且未动支用户数据作为待预测用户。

授信未动支用户是指在信贷授信后未发生首贷的用户。根据信贷用户数据中的信贷动支数据筛选出授信且未动支用户。为了更为准确的促动存量用户并增加用户粘性,可选择预定范围内的用户。本实施例是针对用户在授信后贷款意愿降低,在预定范围内未首次贷款而采取的营销策略,然而根据业务实际情况的不同,贷款意愿降低的范围也不同,因此可基于预测模型中用户意愿衰减曲线所确定预定范围,可选择用户意愿衰减曲线急剧下降的范围,在此范围内对用户进行营销促进,可有效提高用户动支率。例如,一般情况下,新用户在通过授信得到额度之后,每天发生首次贷款的用户在授信两天后大幅下降,因此一种优选实施方式,预定范围可选择为2-30天。

最后,从筛选出的授信未动支用户数据中提取特征数据。每个特征数据用于描述用户样本数据在某一方面的信息。在信用贷款业务中,提取用户特征可以包括用户基本信息和/或用户信用数据和/或用户行为数据中的一个或多个。

所确定的用户特征可以直接指定,或者,也可以通过预设规则从多个特征变量中进行选择。其中,预设规则可以根据实际业务场景的运营目标确定,或者,模型训练方向确定。在本实施例中,其营销目的是针对授信未动支用户,提高其动支率,因此除了用户的基本信息外,与用户是否会发生首次贷款直接的因素包括用户在营销事件前后的动支数据,用户的收入及负债状态、以及有哪些贷款类渠道,因此提取用户特征可为年龄、性别、月薪、授信金额、负债、贷款类app个数、营销事件前后的动支数据等,如图2中的步骤s1所示,示例性的列出了三个用户a、用户b和用户c的特征数据。

一般来说,特征数据类别越多,预测越准确,本申请对此并不限定。

s2、将特征数据输入到授信未动支用户动支意愿预测模型,以获取预测动支概率;

在将特征数据输入到授信未动支用户动支意愿预测模型之前,需预先创建授信未动支用户动支意愿预测模型,该过程主要分为三部分。

第一部分,选取用户样本数据;

首先从用户数据源中获取原始用户数据,原始用户数据可以从外部数据源中获取,也可以从内部数据源中获取,或者结合外部数据源与内部数据源共同获取。其中,该用户数据可以包括用户的属性数据、行为数据和信用数据、财产数据等数据。将原始用户数据转换成统一的格式,删除其中的异常数据和缺失数据,生成用户样本数据。

第二部分,从所述用户样本数据中提取所需特征数据;

根据实际需求,提取不同的用户样本特征数据的技术面信息可以创建不同的预测模型;提取多维特征数据,建立的模型就可以通过不同角度描述预测结果。在本实施例中,为了预测已授信且未动支用户的动支概率,提取了用户样本数据中的用户基本信息、用户信用数据和用户行为数据多个维度的特征数据。例如选取了与信贷业务相关的用户行为数据特征,授信金额、贷款类app个数等,就可以从信贷业务角度描述动支概率。

在建立多个预测模型或提取多维度用户特征训练模型的情况,后续的预测阶段也需要提取对应的特征数据以输入相对应的预测模型。

第三部分,将用户样本的特征数据作为输入训练参数,对所述授信未动支用户动支意愿预测模型进行建模训练,使所述预测模型能够根据输入的待预测用户的特征数据获得用户的动支概率。

在选取出预定数量的原始特征后,利用各个原始特征对算法进行模型训练,得到模型文件。本申请实施例中,分类算法采用的是二元xgboost算法,用训练集训练xgboost分类器时,将用户样本的特征数据作为输入训练参数,通过设置最大树深度、树的个数(即迭代次数)、迭代学习率(即迭代步长)、正则项系数等参数,能够获得的输出为每个样本的动支概率,动支概率为大于0且小于1的百分数,越接近1,则表示对应的用户样本的动支意愿越强烈。

在创建授信未动支用户动支意愿预测模型完成之后,进行动支概率预测。在预测时,将步骤s1中提取的待预测用户的用户特征数据输入到该模型中,输出得到预测结果,即输出得到待预测用户的动支概率。由于选取了多维用户特征,因此可从多角度进行未动支原因的分析以将更为准确的信息推送给营销系统。

如图2中的步骤s2所示,示例性的输出了三个用户的特征数据,用户a的概率为85%,用户b的概率为32%,用户c的概率为46%;其中用户a的概率最大,最接近1,即预测用户a的动支概率最高。

根据实际需要,可任意设置预测模型的运行频次,本实施例中设置为1次/每日。

s3、判断所述预测动支概率是否高于预定阈值,输出动支概率高于阈值的未动支用户的信息。

根据营销系统每日名单需求量或动支概率的经验值设定推送阈值,将步骤s2中预测的动支概率高于该预设阈值的用户数据输出至营销系统。其中,营销的方式有多种,例如电话、短信、app消息推送,和/或渠道活动营销等。

在本实施例中,如图2的s3所示,如果设定的阈值为50%,则将用户a的数据输出至电话营销系统。

实验表明,通过以上将筛选后的用户数据输出至营销系统进行用户促进,降低了营销成本的同时,动支率提升40%,收益提升30%。

本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、rom、ram等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。

下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。

图3是本发明一种授信用户动支意愿预测装置的架构示意图。本发明的装置包括:选取模块、预测模块和推送模块;除此之外,该装置还包括用于预先创建授信未动支用户动支意愿预测模型的创建模块。

选取模块用于从待预测的已授信且未动支用户数据中提取特征数据;具体来说,选取模块首先要在信贷用户授权的基础上,通过信贷app或服务器获取信贷用户数据;该信贷用户数据包括用户基本信息,用户信用数据和用户行为数据;

其次,选取模块根据信贷用户数据中的信息筛选出已授信且未动支用户数据作为待预测用户;本实施例是针对用户在授信后贷款意愿降低,在预定范围内未首次贷款而采取的营销策略,然而根据业务实际情况,贷款意愿降低的范围也不同,因此预定范围基于预测模型中用户意愿衰减曲线所确定,可选择用户意愿衰减曲线急剧下降的范围,例如,据统计,新用户在通过授信得到额度之后,每天发生首次贷款的用户在授信两天后大幅下降,一种优选实施方式,预定范围可选择为2-30天。

最后,选取模块从筛选出的授信未动支用户数据中提取特征数据。每个特征数据用于描述用户样本数据在某一方面的信息。在本实施例中,其营销目的是针对授信未动支用户,提高其动支率,因此除了用户的基本信息外,与用户是否会发生首次贷款直接的因素包含用户在营销事件前后的动支数据,用户的收入及负债状态、以及有哪些贷款类渠道,因此提取用户特征可为年龄、性别、月薪、授信金额、负债、贷款类app个数等。

预测模块用于将特征数据输入到授信未动支用户动支意愿预测模型,以获取预测动支概率;在创建授信未动支用户动支意愿预测模型完成之后,进行动支概率预测。在预测时,将选取模块提取的用户特征数据输入到该模型中,输出得到预测结果,即输出得到待预测用户的动支概率。

推送模块用于判断所述预测动支概率是否高于预定阈值,输出动支概率高于阈值的未动支用户的信息。根据营销系统每日名单需求量或动支概率的经验值设定推送阈值,将预测模块预测的动支概率高于该预设阈值的用户数据输出至营销系统。其中,营销的方式有多种,例如电话、短信、app消息推送,和/或渠道活动营销等。

所述创建模块进一步包括:数据采集模块,用于选取用户样本数据;特征提取模块,用于从所述用户样本数据中提取特征数据;模型训练模块,用于将用户样本的特征数据作为输入训练参数,对所述授信未动支用户动支意愿预测模型进行建模训练;使所述预测模型能够根据输入的待预测用户的特征数据获得用户样本的动支概率。本申请实施例中,分类算法采用的是二元xgboost算法,用训练集训练xgboost分类器时,将用户样本的特征数据作为输入训练参数,通过设置最大树深度、树的个数(即迭代次数)、迭代学习率(即迭代步长)、正则项系数等参数,能够获得的输出为每个样本的动支概率,动支概率为大于0且小于1的百分数,越接近1,则表示对应的用户样本的动支意愿越强烈。

本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。

图4是根据本发明的一种电子设备的示例性实施例的结构框图。下面参照图4来描述根据本发明该实施例的电子设备200。图4显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图1所示的步骤。

所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(rom)2203。

所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:从待预测的已授信且未动支用户数据中提取特征数据;将特征数据输入到授信未动支用户动支意愿预测模型,以获取预测动支概率;判断所述预测动支概率是否高于预定阈值,输出动支概率高于阈值的未动支用户的信息。采用预先训练的人工智能模型对待预测已授信且未动支用户进行筛选,仅将意愿较强的用户名单推送到相关部门进行外呼,解决了营销的盲目性,降低成本的同时进一步提升动支率与收益率。

所述计算机程序可以存储于一个或多个计算机可读介质上,如图5所示。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如java、c++等,还包括常规的过程式程序设计语言-诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1