一种定制信息推送方法及系统与流程

文档序号:17723070发布日期:2019-05-22 02:18阅读:426来源:国知局
一种定制信息推送方法及系统与流程

本说明书涉及互联网技术领域,尤其涉及一种定制信息推送方法及系统。



背景技术:

现阶段,随着互联网普及,定制信息的推送成为一种普遍的需求。定制信息是指专为特定用户或用户群制定的信息。在实现的应用中,定制信息可提供客户定制化需求,改善产品的用户体验,增加产品的用户粘性。例如,基于用户的定制化营销信息就是一种常见的定制信息。

例如,通过互联网申请金融信贷产品,其一般需要用户按照提示进行多个步骤的输入。例如,首先是输入手机、邮箱或社交账号进行注册;然后输入个人信息、要申请的金融产品等等;最后提交申请。但是,期间出现了不少用户在中途就放弃,没有完成申请的情况,比如没有点击“提交申请”。然而针对这些未完成申请的用户,其极有可能对其他金融信贷产品的定制信息(例如优惠)等感兴趣,更是增量市场的关键所在,有对推送定制信息的强烈需求。

但事实上,一方面,由于过程步骤流程设计缺陷、数据传输和存储可能发生疏漏,导致一些已完成的申请被错误记录为没有完成,使得用户被进一步错误地发送定制信息,造成用户的困扰,降低了用户体验,也对定制信息推送效率大打折扣。

另一方面,如果仅仅考虑“完成了申请”和“未完成申请”这两个情况,而无差别地对未完成申请的用户发送定制信息,则会使得一些用户被错误地发送与其具体需求根本无关的定制信息,仍然可能造成用户的困扰,定制信息针对性不强,效率和转化率低下。



技术实现要素:

鉴于上述问题,提出了本说明书以便提供一种克服上述问题或者至少部分地解决上述问题的定制信息推送方法及系统。

第一方面,本说明书提供一种定制信息推送方法,其特征在于,包括:

选取备选的未完成申请记录数据;将所述备选的未完成申请记录数据与已完成申请记录数据进行匹配;当没有匹配结果时,将所述备选的未完成申请记录数据确定为未完成申请记录数据;将所述未完成申请记录数据输入用户画像标签模型进行运算,以输出对应所述未完成申请记录数据的用户画像标签;根据所述用户画像标签向所述未完成申请记录数据所属的用户推送定制信息。

第二方面,本说明书提供一种定制信息推送系统,其特征在于,包括:

备选记录单元,用于选取备选的未完成申请记录数据;数据匹配单元,用于将所述备选的未完成申请记录数据与已完成申请记录数据进行匹配;确定单元,用于当没有匹配结果时,将所述备选的未完成申请记录数据确定为未完成申请记录数据;模型运算单元,用于将所述未完成申请记录数据输入用户画像标签模型进行运算,以输出对应所述未完成申请记录数据的用户画像标签;推送单元,用于根据所述用户画像标签相关的用户类型,向所述未完成申请记录数据所属的用户推送定制信息。

第三方面,本说明书提供一种服务器,包括处理器和存储器:所述存储器用于存储上述任一项所述方法的程序;所述处理器被配置为用于执行所述存储器中存储的程序实现上述任一项所述方法的步骤。

第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。

本说明书上述一个或多个技术方案,至少具有如下一种或多种技术效果:

在实施本说明书的技术方案中,利用了备选的未完成申请记录数据与已完成申请记录数据进行匹配,确定未完成申请记录数据,再通过用户画像标签模型对未完成申请记录数据进行分类运算并输出对应的用户画像标签,根据所述用户画像标签相关的用户类型向所述未完成申请记录数据所属的用户推送定制信息的方法,相较于传统推送方式只能在获得用户注册后才能进行推广,大大提高了数据挖掘的价值和推广效率,同时对用户的困扰降低到最小,不影响用户体验,显著增加了定制信息的推送效率。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本说明书的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一实施例的定制信息推送方法的流程图。

图2示出了根据本发明一实施例的定制信息推送系统的结构示意图。

图3示出了根据本发明一实施例中的计算设备的示意图。

具体实施方式

下面通过附图以及具体实施例对本说明书技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

实施例

请参考图1,本发明通过定制信息推送方法的一个实施例,包括:

步骤s110,选取备选的未完成申请记录数据。

其中,上述步骤可以从第一数据库中选取备选的未完成申请记录数据,所述第一数据库存储的数据包括通过设置数据埋点采集的各用户申请过程中的相关数据。比如,可以通过在客户端程序中设置数据埋点,或在申请页面中设置数据埋点的方式,采集各用户申请过程中的行为数据,作为备选的未完成申请记录数据存储到第一数据库中。

以在客户端程序中设置数据埋点为例,预先在客户端开发过程中在用户申请流程路径上涉及到业务框架设置数据埋点,得到用户申请业务流量通过的客户端业务调用链路上涉及到的所有接口参数和/或方法参数的追踪数据,基于上述追踪数据采集出各用户申请过程中的行为数据。这里的行为数据可以根据具体需要设置不同类型的特征,比如在基本信息页的驻留时间、项目输入顺序、点击下一步时检查出的未填项、身份证号格式检查、手机号格式校验、邮箱格式校验、银行账号格式校验、个人隐私信息页驻留时间、放弃申请注册所在页面、证明附件校验,和/或申请次数等。上述这些行为数据都可以通过在客户端程序中设置数据埋点的方式获取到,类似地,相比于客户端程序,仅在申请页面中设置数据埋点的方式可能局限性较高,获取到的行为数据类型特征较少,但也不影响实现本发明的方法。

进一步地,在数据结构上,设置包括存储收集已完成的申请记录的第二数据库,以及存储备选的未完成用户申请过程记录的第一数据库。一般而言,第二数据库是当用户申请完成时将记录存入的数据库,比如设置在注册中心或者申请中心的数据库,其数据内容价值较大也较为重要,因此其第二数据库与其他数据库是处于相对隔离的状态。而第一数据库记录的是所有用户即全量用户申请过程的行为数据,即无论是未完成申请的还是已完成申请的都会采集并记录。例如,在第一数据库中将未完成的申请记录可以打上“未完成”标签,但这种标签可能是不准确的,因此第二数据库中记录的已完成的申请记录是经过其他途径进行过核实的,此过程区别于第一数据库的数据,或者说甚至第二数据库是通过不同来源的数据进行收录的。这样,第一数据库中的数据需要根据第二数据库中的数据进行匹配验证,并做进一步筛选,

步骤s120,将所述备选的未完成申请记录数据与已完成申请记录数据进行匹配;当没有匹配结果时,将所述备选的未完成申请记录数据确定为未完成申请记录数据。

进一步地,判断所述已完成申请记录数据是否包含所述备选的未完成申请记录数据中的用户身份标识;当所述已完成申请记录数据不包含所述备选的未完成申请记录数据中的用户身份标识,则判断没有匹配结果;或者,当所述已完成申请记录数据包含所述备选的未完成申请记录数据中的用户身份标识,继续判断所述已完成申请记录数据是否包含所述备选的未完成申请记录数据中的关键申请数据,所述关键申请数据用于区分不同的申请;如果所述已完成申请记录数据不包含所述备选的未完成申请记录数据中的关键申请数据,则判断没有匹配结果。其中,用户身份标识可以包括用户身份证号、护照号、手机号、邮箱、社交应用账号或imei号等等。关键申请数据可以区分不同金融产品,比如产品名称、产品代号等。

另外,还可以基于已完成申请记录数据对备选的未完成申请记录数据进行匹配,剔除掉所述备选的未完成申请记录数据中匹配已完成申请记录数据的条目,从而筛选出未完成申请记录数据。

具体地,可以先获取第一数据库中备选的未完成申请记录数据中标识未完成的申请记录,将所述未完成的申请记录(包括注册信息和其它信息,同一个人可能申请过多个金融产品,要加以区分)在第二数据库中进行匹配(可以增加去重的步骤),通过用户身份标识查找,当第二数据库中已完成申请记录数据不包含所述备选的未完成申请记录数据中的用户身份标识,则判断没有匹配结果;或者,当所述已完成申请记录数据包含所述备选的未完成申请记录数据中的用户身份标识,继续判断所述已完成申请记录数据是否包含所述备选的未完成申请记录数据中的关键申请数据,所述关键申请数据用于区分不同的申请;如果所述已完成申请记录数据不包含所述备选的未完成申请记录数据中的关键申请数据,则判断没有匹配结果。

步骤s130,将所述未完成申请记录数据输入用户画像标签模型进行运算,以输出对应所述未完成申请记录数据的用户画像标签。

其中,所述用户画像标签模型是预先通过训练数据训练机器学习模型的方式得到。用户标签的目的是为了描述用户的类型,而用户画像的目的是为了预测用户的需求,因此用户画像标签是为了体现预测和描述用户的需求和类型,举例其具体是预测用户申请信贷需求和/或用户类型。

具体地,需要预先通过机器学习的方式训练一个用于生成用户画像标签的模型。当输入一未完成的申请记录数据,该模型可输出相应的用户画像标签。模型训练的过程也需要先在客户端程序中设置数据埋点,或在申请页面中设置数据埋点的方式,采集各用户申请过程中的行为数据,然后基于训练数据的各个特征维度需要,对采集的用户申请过程中的行为数据进行标注,从而生成大量的未完成申请用户的训练数据;对上述大量的训练数据进行机器学习模型训练,最终得到用户画像标签模型。其中,所述用户画像标签包括如下一种或多种的组合:尝试型客户、隐私敏感型客户、缺少信用数据型客户、潜在虚假信息客户、和/或无法判断类型客户等等。

对应地,上述这些不同类型的客户在放弃注册前的行为具有一定的特征,例如尝试型客户多为注册基本信息时就放弃注册了,这是因为申请贷款需要填写的基本信息较多,非真实需求的客户(即用户)往往不能坚持完成注册信息填写流程;再例如,隐私敏感型客户可能由于不愿输入全部个人隐私信息而放弃贷款,者通过埋点数据跟踪显示该类客户会在输入个人隐私信息的阶段放弃;注意,以上仅为示例客户画像和潜在的注册行为,不作为本发明的限制。

进一步地,不同的客户类型可以被定义,其注册行为也不是通过人工设定的方式,而是通过标注大量未完成申请用户数据作为训练数据,并通过机器学习方式训练一个用户画像标签模型来完成的。

所述用户画像标签模型可以基于二分类法、决策树、聚类、贝叶斯分类、支持向量机svm、em、adaboost以及神经网络等一种或多种的组合实现,其分析输入的所述未完成申请记录数据中包含的各用户申请过程中的行为数据,基于各用户申请过程中的行为数据中的一个或多个行为特征,对输入的各用户的未完成申请记录数据进行分类运算,得到对应未完成申请记录数据的特征标签。

所述分类运算后得到各用户的未完成申请记录数据对应的标签,即作为用户画像标签,输出与各记录数据的用户标识对应的用户画像标签。

其中,所述用户画像标签基于机器学习模型运算输出包括如下一种或多种的组合:尝试型客户、隐私敏感型客户、缺少信用数据型客户、潜在虚假信息客户、和/或无法判断类型客户等等。

步骤s140,根据所述用户画像标签向所述未完成申请记录数据所属的用户,推送定制信息。

其中,对模型输出的各种类型的用户画像标签,标注预测为同一个用户的用户画像。这其中以用户id作为用户唯一标识,汇总统一用户id的未完成记录数据,通过所述用户画像模型后,统计与同一用户id相关的所有用户画像标签,由这些相关的标签标注同一个用户的用户画像,从而确定该用户所属的用户类型。

根据该用户所属的用户类型,在定制信息库中得到类型匹配的定制信息。进一步,在得到用户类型后,系统将根据不同的类型发送对应的定制信息,具体途径可以包括短信、微信、邮件等,这里是通过用户在申请阶段填写的基本信息中获取到相应的手机号、微信号以及邮箱地址,将匹配的定制信息推送给该用户使用的终端设备。例如,对于尝试型客户,系统将发送普通的优惠信息;对于隐私敏感型客户,往往客户价值较高,定制信息更多的是提供无需担保,无需隐私数据的金融产品;通过以上方法,系统将在第一数据库中的未完成申请的用户进行自动分析,并分发对应的定制信息,加快转化这部分原本无法推广的用户。

请参考图2,本发明通过定制信息推送系统的一个实施例,包括:

备选记录单元210,用于选取备选的未完成申请记录数据;

数据匹配单元220,用于将所述备选的未完成申请记录数据与已完成申请记录数据进行匹配;

确定单元230,用于当没有匹配结果时,将所述备选的未完成申请记录数据确定为未完成申请记录数据

模型运算单元240,用于将所述未完成申请记录数据输入用户画像标签模型进行运算,以输出对应所述未完成申请记录数据的用户画像标签;

推送单元250,用于根据所述用户画像标签相关的用户类型,向所述未完成申请记录数据所属的用户推送定制信息。

具体地,所述定制信息推送系统,还包括:第一数据库,用于存储通过设置数据埋点采集的用户申请过程中的相关数据;所述备选记录单元,进一步用于从第一数据库中所述相关数据中选取备选的未完成申请记录数据。以在客户端程序中设置数据埋点为例,预先在客户端开发过程中在用户申请流程路径上涉及到业务框架设置数据埋点,得到用户申请业务流量通过的客户端业务调用链路上涉及到的所有接口参数和/或方法参数的追踪数据,基于上述追踪数据采集出各用户申请过程中的行为数据。这里的行为数据可以根据具体需要设置不同类型的特征,比如在基本信息页的驻留时间、项目输入顺序、点击下一步时检查出的未填项、身份证号格式检查、手机号格式校验、邮箱格式校验、银行账号格式校验、个人隐私信息页驻留时间、放弃申请注册所在页面、证明附件校验,和/或申请次数等。上述这些行为数据都可以通过在客户端程序中设置数据埋点的方式获取到,类似地,相比于客户端程序,仅在申请页面中设置数据埋点的方式可能局限性较高,获取到的行为数据类型特征较少,但也不影响实现本发明的方法。

进一步地,在数据结构上,设置包括存储收集已完成的申请记录的第二数据库,以及存储备选的未完成申请记录的第一数据库。一般而言,第二数据库是当用户申请完成时将记录存入的数据库,比如设置在注册中心或者申请中心的数据库,其数据内容价值较大也较为重要,因此其第二数据库与其他数据库是处于相对隔离的状态。而第一数据库记录的是所有用户即备选的未完成申请过程的行为数据,即无论是未完成申请的还是已完成申请的都会采集并记录。例如,在第一数据库中将未完成的申请记录可以打上“未完成”标签,但这种标签可能是不准确的,因此第二数据库中记录的已完成的申请记录是经过其他途径进行过核实的,此过程区别于第一数据库的数据,或者说甚至第二数据库是通过不同来源的数据进行收录的。这样,第一数据库中的数据需要根据第二数据库中的数据进行匹配验证,并做进一步筛选,

具体地,所述匹配单元,还用于,判断所述已完成申请记录数据是否包含所述备选的未完成申请记录数据中的用户身份标识;当所述已完成申请记录数据不包含所述备选的未完成申请记录数据中的用户身份标识,则判断没有匹配结果;或者,当所述已完成申请记录数据包含所述备选的未完成申请记录数据中的用户身份标识,继续判断所述已完成申请记录数据是否包含所述备选的未完成申请记录数据中的关键申请数据,所述关键申请数据用于区分不同的申请;如果所述已完成申请记录数据不包含所述备选的未完成申请记录数据中的关键申请数据,则判断没有匹配结果。其中,用户身份标识可以包括用户身份证号、护照号、手机号、邮箱、社交应用账号或imei号等等。关键申请数据可以区分不同金融产品,比如产品名称、产品代号等。

另外,还可以基于已完成申请记录数据对所述备选的未完成申请记录数据进行匹配,剔除掉所述备选的未完成申请记录数据中匹配已完成申请记录数据的条目,从而筛选出未完成申请记录数据。

具体地,可以先获取第一数据库中备选的未完成申请记录数据中标识未完成的申请记录,将所述未完成的申请记录(包括注册信息和其它信息,同一个人可能申请过多个金融产品,要加以区分)在第二数据库中进行匹配(可以增加去重的步骤),通过用户身份标识查找,当第二数据库中已完成申请记录数据不包含所述备选的未完成申请记录数据中的用户身份标识,则判断没有匹配结果;或者,当所述已完成申请记录数据包含所述备选的未完成申请记录数据中的用户身份标识,继续判断所述已完成申请记录数据是否包含所述备选的未完成申请记录数据中的关键申请数据,所述关键申请数据用于区分不同的申请;如果所述已完成申请记录数据不包含所述备选的未完成申请记录数据中的关键申请数据,则判断没有匹配结果。

进一步地,所述定制信息推送系统,还包括:采集单元,用于通过在客户端程序中设置数据埋点,或在申请页面中设置数据埋点的方式,采集各用户申请过程中的行为数据;训练数据生成单元,用于对采集的用户申请过程中的行为数据进行标注,生成大量的未完成申请用户的训练数据;模型训练单元,用于使用所述训练数据进行机器学习模型训练,得到用户画像标签模型。

其中,所述用户画像标签模型是预先通过训练数据训练机器学习模型的方式得到。用户标签的目的是为了描述用户的类型,而用户画像的目的是为了预测用户的需求,因此用户画像标签是为了体现预测和描述用户的需求和类型,举例其具体是预测用户申请信贷需求和/或用户类型。

具体地,需要预先通过机器学习的方式训练一个用于生成用户画像标签的模型。当输入一未完成的申请记录数据,该模型可输出相应的用户画像标签。模型训练的过程也需要先在客户端程序中设置数据埋点,或在申请页面中设置数据埋点的方式,采集各用户申请过程中的行为数据,然后基于训练数据的各个特征维度需要,对采集的用户申请过程中的行为数据进行标注,从而生成大量的未完成申请用户的训练数据;对上述大量的训练数据进行机器学习模型训练,最终得到用户画像标签模型。其中,所述用户画像标签包括如下一种或多种的组合:尝试型客户、隐私敏感型客户、缺少信用数据型客户、潜在虚假信息客户、和/或无法判断类型客户等等。

对应地,上述这些不同类型的客户在放弃注册前的行为具有一定的特征,例如尝试型客户多为注册基本信息时就放弃注册了,这是因为申请贷款需要填写的基本信息较多,非真实需求的客户(即用户)往往不能坚持完成注册信息填写流程;再例如,隐私敏感型客户可能由于不愿输入全部个人隐私信息而放弃贷款,者通过埋点数据跟踪显示该类客户会在输入个人隐私信息的阶段放弃;注意,以上仅为示例客户画像和潜在的注册行为,不作为本发明的限制。

进一步地,不同的客户类型可以被定义,其注册行为也不是通过人工设定的方式,而是通过标注大量未完成申请用户数据作为训练数据,并通过机器学习方式训练一个用户画像标签模型来完成的。

所述用户画像标签模型可以基于二分类法、决策树、聚类、贝叶斯分类、支持向量机svm、em、adaboost以及神经网络等一种或多种的组合实现,其分析输入的所述未完成申请记录数据中包含的各用户申请过程中的行为数据,基于各用户申请过程中的行为数据中的一个或多个行为特征,对输入的各用户的未完成申请记录数据进行分类运算,得到对应未完成申请记录数据的特征标签。

其中,所述模型运算单元,还用于,所述分类运算后得到各用户的未完成申请记录数据对应的用户画像标签,输出与各记录数据的用户标识对应的用户画像标签。所述分类运算后得到各用户的未完成申请记录数据对应的标签,即作为用户画像标签,输出与各记录数据的用户标识对应的用户画像标签。进一步地,所述用户画像标签基于机器学习模型运算输出包括如下一种或多种的组合:尝试型客户、隐私敏感型客户、缺少信用数据型客户、潜在虚假信息客户、和/或无法判断类型客户等等。

其中,所述推送单元,还用于,以用户id作为用户唯一标识,统计与同一用户id相关的用户画像标签,由相关标签标注用户画像,确定该用户所属的用户类型。进一步地,对模型输出的各种类型的用户画像标签,标注预测为同一个用户的用户画像。这其中以用户id作为用户唯一标识,汇总统一用户id的未完成记录数据,通过所述用户画像模型后,统计与同一用户id相关的所有用户画像标签,由这些相关的标签标注同一个用户的用户画像,从而确定该用户所属的用户类型。

另外,根据该用户所属的用户类型,在定制信息库中得到类型匹配的定制信息。进一步地,在得到用户类型后,系统将根据不同的类型发送对应的定制信息,具体途径可以包括短信、微信、邮件等,这里是通过用户在申请阶段填写的基本信息中获取到相应的手机号、微信号以及邮箱地址,将匹配的定制信息推送给该用户使用的终端设备。例如,对于尝试型客户,系统将发送普通的优惠信息;对于隐私敏感型客户,往往客户价值较高,定制信息更多的是提供无需担保,无需隐私数据的金融产品;通过以上方法,系统将在第一数据库中的未完成申请的用户进行自动分析,并分发对应的定制信息,加快转化这部分原本无法推广的用户。

本发明另一实施例还提供了一种图3示出了根据本发明一个实施例提供的一种计算设备结构示意图。该计算设备300包括:处理器310,以及存储有可在所述处理器310上运行的计算机程序的存储器320。处理器310,用于在执行所述存储器320中的计算机程序时执行本发明中方法的各步骤。存储器320可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。存储器320具有存储用于执行上述方法中的任何方法步骤的计算机程序331的存储空间330。计算机程序331可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(cd)、存储卡或者软盘之类的程序代码载体。为了便于说明,仅示出了与本说明书实施例相关的部分,具体技术细节未揭示的,请参照本说明书实施例方法部分。该计算设备,可以是包括各种电子设备形成的计算设备,pc电脑、网络云服务器,甚至手机、平板电脑、pda(personaldigitalassistant,个人数字助理)、pos(pointofsales,销售终端)、车载电脑、台式电脑等任意电子设备上设置的服务器功能。

基于这样的理解,本说明书实现上述第一实施例的方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1