一种信用决策数据优化提取系统及方法与流程

文档序号：18833006发布日期：2019-10-09 04:05阅读：191来源：国知局

本申请涉及计算机技术领域，特别涉及一种信用决策数据优化提取系统及方法。

背景技术：

伴随着互联网金融大潮，各类业务爆发式增长，面对个人信用体系不完善、恶意骗贷、坏账和逾期、债务收回成本较高等诸多挑战，信用决策始终是业务的重中之重。然而信用决策系统搭建成本高、信用决策专业人才严重紧缺、人工审核效率低下、流程繁琐，信用决策规则组件不能自由组合配置等诸多难题，如何实现智能高效的审批成为了越来越多的信用决策人关心的问题。

随着行业环境不断变化,特别是欺诈团伙逐渐呈现集团化、规模化、专业化等特点,需要信用决策体系不断迭代,这要求引擎设计上提高操作灵活性,增强其对业务复杂度的适应能力。

因此，信用决策应把握规则的有效性，需要快速迭代，因为用户时刻在发生变化，之前定的规则是否有效需要经常去关注、测试和修改。

传统的信用决策决策是写在代码里的，由于信用决策规则需要不断迭代和优化，在进行信用决策规则的迭代和优化时，往往是信用决策人员首先编写规则，然后由it人员在后台针对信用决策人员编写的规则进行代码的迭代和验证，这种通过it人员将规则开发进系统的方式需要连接大量内部数据，数据集成复杂，使得it人员不堪重负，耗时耗力，且迭代周期长，系统灵活性和适应性差。

技术实现要素：

有鉴于此，本申请的目的在于提供一种信用决策数据优化提取系统及方法，该系统能够对信用决策数据进行优化，提高信用决策数据的准确性。所有的决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义，没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义，策略调整之后实时生效，无需重新编译和上线。

为了实现本申请的上述目的，根据本申请的一个方面，本申请提供了一种信用决策数据优化提取系统，该系统包括：

用户管理模块，用于对决策优化用户接入的相应决策账号信息进行决策优化管理，将对应的决策优化用户数据进行收集；

决策数据总览模块，用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据；

决策日志获取模块，用于将收集的第一、第二决策数据集的决策数据抽取日志信息，查看第一、第二决策数据集的日志信息运行情况，并通过筛选对日志信息进行降噪处理；

决策数据优化模块，用于通过决策数据编辑功能，允许决策优化用户创建或编辑第一、第二决策数据集，并且对编辑完成的第一、第二决策数据集的有效程度进行优化。

优选地，所述决策数据总览模块包括：

数据预处理单元：用于将调用的决策优化用户数据获取的原始数据在经过第三方的数据接口数据的补充，以及特征提取脚本的计算与格式化规整以后，转换成特征变量列表数据，形成第一决策数据集；

数据集生成单元：用于根据第一决策数据集的变量列表建立第二决策数据集；

数据集测试单元：用于将决策优化用户数据获取的原始数据形成第一决策数据集和第二决策数据集进行测试，并将测试得到输出数据返还至数据预处理单元，其中，所述第二决策数据集用于将多个决策规则数据集按照预设的顺序进行排列。

优选地，所述数据预处理单元包括：

原始数据获取子单元：用于获取调用方的传入的原始数据；

外部数据调用子单元：用于从原始数据中选择决策数据参数，调用第三方的数据接口，以补充申请方的更多维度信息；

脚本编写子单元：用于编写决策优化用户数据特征提取脚本，所述特征提取脚本用于将调用方传入的原始数据和第三方接口获取的附加数据统一格式化为一组特征值。

优选地，所述第二决策数据集包括：

条件决策规则数据集和分数决策规则数据集，其中，

所述条件决策规则数据集包括串行规则集和并行规则集，对于串行规则集设置决定调用顺序的优先级，根据优先级进行判断，若命中在先的拒绝规则后直接执行拒绝决策，在后的规则不再判断，即靠后的串行规则不再判断；对于并行规则集跑完所有的规则后，有一条命中则拒绝，最终得出拒绝的结果可以是命中多条规则；

所述分数决策规则数据集包括使用二维表形式展示目标对象的各个属性，针对不同属性设置不同区段的条件，每个条件对应不同的分值，以实现对目标对象的评分计算。

优选地，所述数据集测试单元返还给数据预处理单元的输出数据的形式包括：若第二决策数据集中的决策规则数据集为条件决策规则数据集，则返回是否拒绝；若第二决策数据集中的决策规则数据集为分数决策规则数据集，则返回信用分。

优选地，所述数据集测试单元返还给数据预处理单元的输出数据还包括命中的决策规则数据集的具体信息。

优选地，用户管理模块具体用于查询、新建和删除决策优化用户接入的相应的决策账号信息，并收集对应的决策优化用户数据，其中，所述决策账号信息包括用户名称、手机号和账号创建日期。

优选地，所述第一、第二决策数据集的日志信息运行情况包括第一、第二决策数据集的决策数据所对应的决策优化用户账号名称、第一、第二决策数据集编码、第一、第二决策数据集调用时间、第一、第二决策数据集是否成功调用、调用第一、第二决策数据集的业务号以及调用第一、第二决策数据集的耗时。

为了实现本申请的上述目的，根据本申请的一个方面，本申请提供了一种信用决策数据优化提取方法，该方法基于上述信用决策数据优化提取系统实现，该方法包括：

获取业务部门整理的信用决策需求；

基于所述信用决策需求通过所述信用决策数据优化提取系统编辑决策规则；

在所述信用决策数据优化提取系统上对所述决策规则的有效程度进行测试；

在所述决策规则的有效程度合格后，存储所述决策规则；

获取预贷款用户信息，基于所述决策规则通过所述信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果，其中，所述判断结果用于表征是否为所述预贷款用户提供信用贷款。

优选地，所述基于所述信用决策需求通过所述信用决策数据优化提取系统编辑决策规则包括：

根据信用决策需求确认整套策略，并列出整套策略落地所需要的原始入参变量以及最终输出变量；

将原始入参变量和输出变量配入决策流管理模块，并建立与外部变量的一一对应关系；

在决策流管理模块内部将配入的原始入参变量处理成策略可用的字段；

使用决策流管理模块内部组件，完成入参到出参的转换；

将各个组件按照整套策略流程的先后顺序串起来形成决策规则。

由以上方案可知，本申请提供的一种信用决策数据优化提取系统，该系统包括用户管理模块，用于对决策优化用户接入的相应决策账号信息进行决策优化管理，将对应的决策优化用户数据进行收集；决策数据总览模块，用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据；决策日志获取模块，用于将收集的第一、第二决策数据集的决策数据抽取日志信息，查看第一、第二决策数据集的日志信息运行情况，并通过筛选对日志信息进行降噪处理；决策数据优化模块，用于通过决策数据编辑功能，允许决策优化用户创建或编辑第一、第二决策数据集，并且对编辑完成的第一、第二决策数据集的有效程度进行优化。相对于现有技术在进行信用决策规则的迭代和优化时，往往是信用决策人员首先编写规则，然后由it人员在后台针对信用决策人员编写的规则进行代码的迭代和验证，本申请能够以可视化方式编写业务策略，使非技术业务用户直接参与策略运营，能够对信用决策数据进行优化，提高信用决策数据的准确性。所有的信用决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义，没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义，策略调整之后实时生效，无需重新编译和上线。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种优选实施方式中信用决策数据优化提取系统的结构示意图；

图2为本申请提供的一种优选实施方式中信用决策数据优化提取方法的实现流程图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1所示，为本申请公开的一种信用决策数据优化提取系统的一种优选实施方式的结构示意图，该系统包括：

用户管理模块101，用于对决策优化用户接入的相应决策账号信息进行决策优化管理，将对应的决策优化用户数据进行收集；

决策数据总览模块102，用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据；

决策日志获取模块103，用于将收集的第一、第二决策数据集的决策数据抽取日志信息，查看第一、第二决策数据集的日志信息运行情况，并通过筛选对日志信息进行降噪处理；

决策数据优化模块104，用于通过决策数据编辑功能，允许决策优化用户创建或编辑第一、第二决策数据集，并且对编辑完成的第一、第二决策数据集的有效程度进行优化。

在本实施方式中，决策数据总览模块102包括：

数据预处理单元1021：用于将调用的决策优化用户数据获取的原始数据在经过第三方的数据接口数据的补充，以及特征提取脚本的计算与格式化规整以后，转换成特征变量列表数据，形成第一决策数据集；

数据集生成单元1022：用于根据第一决策数据集的变量列表建立第二决策数据集；

数据集测试单元1023：用于将决策优化用户数据获取的原始数据形成第一决策数据集和第二决策数据集进行测试，并将测试得到输出数据返还至数据预处理单元，其中，第二决策数据集用于将多个决策规则数据集按照预设的顺序进行排列。

在本实施方式中，数据预处理单元1021包括：

原始数据获取子单元10211：用于获取调用方的传入的原始数据；

外部数据调用子单元10212：用于从原始数据中选择决策数据参数，调用第三方的数据接口，以补充申请方的更多维度信息；

脚本编写子单元10213：用于编写决策优化用户数据特征提取脚本，特征提取脚本用于将调用方传入的原始数据和第三方接口获取的附加数据统一格式化为一组特征值。

在本实施方式中，第二决策数据集包括：

条件决策规则数据集和分数决策规则数据集，其中，

条件决策规则数据集包括串行规则集和并行规则集，对于串行规则集设置决定调用顺序的优先级，根据优先级进行判断，若命中在先的拒绝规则后直接执行拒绝决策，在后的规则不再判断，即靠后的串行规则不再判断，举例说明，对于串行规则集要判断先后顺序，比如数据先进行规则a的判断再进行规则b的判断，如果命中拒绝规则a后直接执行拒绝决策，规则b不再判断，即靠后的串行规则不再判断；；对于并行规则集跑完所有的规则后，有一条命中则拒绝，最终得出拒绝的结果可以是命中多条规则；

分数决策规则数据集包括使用二维表形式展示目标对象的各个属性，针对不同属性设置不同区段的条件，每个条件对应不同的分值，以实现对目标对象的评分计算。

在本实施方式中，数据集测试单元1023返还给数据预处理单元1021的输出数据的形式包括：若第二决策数据集中的决策规则数据集为条件决策规则数据集，则返回是否拒绝；若第二决策数据集中的决策规则数据集为分数决策规则数据集，则返回信用分。

在本实施方式中，数据集测试单元1023返还给数据预处理单元1021的输出数据还包括命中的决策规则数据集的具体信息。

在本实施方式中，用户管理模块101具体用于查询、新建和删除决策优化用户接入的相应的决策账号信息，并收集对应的决策优化用户数据，其中，决策账号信息包括用户名称、手机号和账号创建日期。

在本实施方式中，第一、第二决策数据集的日志信息运行情况包括第一、第二决策数据集的决策数据所对应的决策优化用户账号名称、第一、第二决策数据集编码、第一、第二决策数据集调用时间、第一、第二决策数据集是否成功调用、调用第一、第二决策数据集的业务号以及调用第一、第二决策数据集的耗时。

具体地，在本实施方式中，第一决策数据集为决策流，第二决策数据集为决策规则，决策数据优化模块104是一堆信用决策数据优化提取规则的集合，通过不同的分支、层层规则的递进关系进行运算，根据优先级对数据进行判断。

例如，无成本或低成本的规则优先于高成本的规则运行。

举例说明：借款用户的身份特定不符合信用决策要求的，诸如低于18岁的用户数据，则可优先运行。而一些通过对接外部三方征信的信用决策规则，需支出相关查询费用的，则靠后运行。此外，在外部三方征信的规则中，命中式收费的信用决策规则(如黑名单与反欺诈)又可以优先于每次查询式收费的信用决策规则(如征信报告)运行。

具体地，在本实施方式中，信用决策决策的核心思路是基于大量真实的样本数据，而对数据的提炼与作用过程，将使用到“参数”的定义。“参数”决定了区间和上下限范围，一条信用决策规则通常作用于某一数据类型，依据此数值是否满足“参数”的定义范围，得出是否可通过信用决策的结论。

具体地，本系统对于非刚需与必要的信用决策规则，能够“开关化”。

举例说明：第二决策数据集中的信用决策规则数据集做成“开关”。如校验用户的芝麻信用分是否高于500分，则可做成“开关”。待该规则上线后，可通过分析此项规则的触发率得出是否合理的判断。因为芝麻信用分是否可作为决策依据将主要取决于业务方向与用户群体，因为理论上芝麻信用分的高低主要与用户在芝麻信用体系内的数据绑定维度的多与少相关，并不一定绝对反映用户的信用程度。

具体地，本系统的信用决策规则上的“参数”可调整与灵活配置。

举例说明：该信用决策体系中会加入年龄的限制，诸如用户年龄需满18岁。其中的“18岁”便是所定义的参数，此处最好可调整与配置。因为考虑到经济能力和还款能力，参数可调整到23岁以上。

由以上方案可知，本申请提供的一种信用决策数据优化提取系统，该系统包括用户管理模块101，用于对决策优化用户接入的相应决策账号信息进行决策优化管理，将对应的决策优化用户数据进行收集；决策数据总览模块102，用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据；决策日志获取模块103，用于将收集的第一、第二决策数据集的决策数据抽取日志信息，查看第一、第二决策数据集的日志信息运行情况，并通过筛选对日志信息进行降噪处理；决策数据优化模块104，用于通过决策数据编辑功能，允许决策优化用户创建或编辑第一、第二决策数据集，并且对编辑完成的第一、第二决策数据集的有效程度进行优化。相对于现有技术在进行信用决策规则的迭代和优化时，往往是信用决策人员首先编写规则，然后由it人员在后台针对信用决策人员编写的规则进行代码的迭代和验证，本申请能够以可视化方式编写业务策略，使非技术业务用户直接参与策略运营，能够对信用决策数据进行优化，提高信用决策数据的准确性。所有的信用决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义，没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义，策略调整之后实时生效，无需重新编译和上线，大幅度降低业务人员与技术人员的沟通成本，花很少的时间处理数据，加速业务拓展，另外，本系统提供两种决策方式，一种是直接给出是否予以通过的结果，一种是给出信用分，由调用方决定是否通过。

本申请提供了一种信用决策数据优化提取方法，该方法基于上述信用决策数据优化提取系统实现，如图2所示，该方法包括：

s201，获取业务部门整理的信用决策需求；

在进行信用决策数据优化提取时，首先需要获取到业务部门整理的最新信用决策需求信息，以便于根据需求对信用决策数据优化提取系统中的第一、第二决策数据集进行更新，从而保证后续的决策结果的准确性。

s202，基于信用决策需求通过信用决策数据优化提取系统编辑第一、第二决策数据集；

获取到信用决策需求后，信用决策业务人员根据信用决策需求的相关内容在信用决策数据优化提取系统中通过界面方式创建或编辑与信用决策需求想匹配的第一、第二决策数据集。

s203，在信用决策数据优化提取系统上对第一、第二决策数据集的有效程度进行测试；

根据信用决策需求编辑好新的第一、第二决策数据集后，需要在在信用决策数据优化提取系统对决策规则进行测试，查看其是否能够按照既定设计策略运行。

s204，在第一、第二决策数据集的有效程度合格后，存储第一、第二决策数据集；

通过对新编辑的第一、第二决策数据集进行测试后，若其能够按照既定设计策略运行，则说明该第一、第二决策数据集的有效程度合格，此时则存储该第一、第二决策数据集，以便通过该第一、第二决策数据集进行后续的用户信息验证和判断。

s205，获取预贷款用户信息，基于第一、第二决策数据集通过信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果，其中，判断结果用于表征是否为预贷款用户提供信用贷款。

按照风控需求进行创建的第一、第二决策数据集测试成功并存储后，就可以通过该第一、第二决策数据集进行贷款用户信息的判断。此时，首先需要获取到需要贷款用户的基本信息，如年龄、征信信息等，然后将该基本信息作为输入数据输入到信用决策数据优化提取系统中，利用该系统中相应的第一、第二决策数据集对需要贷款用户的相关信息进行验证，并判断是否可以为该用户提供信用贷款。

在本发明的一种优选实施方式中，步骤s202包括：

根据信用决策需求确认整套策略，并列出整套策略落地所需要的原始入参变量以及最终输出变量；

将原始入参变量和输出变量配入决策数据优化模块，并建立与外部变量的一一对应关系；

在决策数据优化模块内部将配入的原始入参变量处理成策略可用的字段；

使用决策数据优化模块内部组件，完成入参到出参的转换；

将各个组件按照整套策略流程的先后顺序串起来形成决策规则数据集。

由以上方案可知，本申请提供的一种信用决策数据优化提取方法，首先获取业务部门整理的信用决策需求；然后基于所述信用决策需求通过所述信用决策数据优化提取系统编辑第一、第二决策数据集；接着在所述信用决策数据优化提取系统上对所述第一、第二决策数据集的有效程度进行测试；进而在所述第一、第二决策数据集的有效程度合格后，存储所述第一、第二决策数据集；最后获取预贷款用户信息，基于所述第一、第二决策数据集通过所述信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果，其中，所述判断结果用于表征是否为所述预贷款用户提供信用贷款。相对于现有技术在进行信用决策规则的迭代和优化时，往往是信用决策人员首先编写规则，然后由it人员在后台针对信用决策人员编写的规则进行代码的迭代和验证，本申请能够以可视化方式编写业务策略，使非技术业务用户直接参与策略运营，能够对信用决策数据进行优化，提高信用决策数据的准确性。所有的信用决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义，没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义，策略调整之后实时生效，无需重新编译和上线，大幅度降低业务人员与技术人员的沟通成本，花很少的时间处理数据，加速业务拓展，另外，本系统提供两种决策方式，一种是直接给出是否予以通过的结果，一种是给出信用分，由调用方决定是否通过。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种用户扩展方法、装置及系统进行了详细介绍，对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄妍昕;罗皓;王静
技术所有人：上海诚数信息科技有限公司
我是此专利的发明人

上一篇：一种汽车活塞环快速安装装置的制作方法
上一篇：散热组件及具有其的电路板组件、无人飞行器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。