处理金融数据的方法和设备的制造方法_3

文档序号:9579773阅读:来源:国知局
资产数据时,需要将该在该时刻之前的 金融行为数据输入到该第一随机森林模型中。输出的结果就是预测的在该时刻的最大净资 产数据。
[0047] 进一步,如果该Τ个用户中的一个用户的数据发生更新,则查找到该第一随机森 林模型中对应于该用户的决策树,从该第一森林模型中删除对应于该用户的决策树。使用 该用户更新的数据单独训练一个新的随机森林模型,该随机森林模型可以称为第二随机森 林模型。使用该第二随机森林模型和该第一随机森林模型确定更新随机森林模型。使用更 新后的随机森林模型对更新后的用户的金融资产进行预测。
[0048] 图3是根据本发明实施例提供的设备的结构框图。图3所示的设备可以执行图1 或图2的各个功能。如图3所示,设备300包括第一确定单元301、第二确定单元302和第 三确定单元303。
[0049] 第一确定单元301,用于根据第一用户集合中的用户的金融行为数据,从该第一用 户集合中确定目标用户集合。
[0050] 第二确定单元302,用于确定该目标用户集合中的每一个用户的金融行为数据和 第一时刻的最大净资产数据。
[0051] 第三确定单元303,用于使用第二确定单元302确定的该目标用户集合中所有用 户的金融行为数据和该第一时刻的最大净资产数据训练第一随机森林模型,以便使用该第 一随机森林模型确定该第一用户集合中的任一个用户在该第一时刻之后的任一时刻的最 大净资产数据。
[0052] 图3所示的设备300能够通过选定合适的训练样本训练用于确定用户资产的第一 随机森林模型。这样,可以使用该第一随机森林模型预测用户的金融资产,而不是仅估算用 户当前的金融资产。该第一随机森林模型是基于不同的训练样本确定的。因此,该第一随 机森林模型可以适用于具有不同特点的用户来估算金融资产。这样可以提高估算金融资产 的效率并且具有较高的准确率。
[0053] 该金融行为数据可以是以下的任一种或多种:交易记录、不动产估值、贷款数据 等。该交易记录可以包括以下任一种或多种:银行卡交易记录、信用卡交易记录、理财产品 交易记录等。
[0054] 该最大净资产数据可以是该第一时刻至第二时刻内按第一时间粒度统计的最大 资产总值与月供贷款的差值,其中该最大资产总值为该第一时刻至该第二时刻内案该第一 时间粒度统计的最大资金数值和不动产估值,该第二时刻在该第一时刻之前。该第二时刻 以及该第一时间粒度可以根据需要进行设置。
[0055] 第一确定单元301,具体用于根据该第一用户集合中的用户的金融行为数据,从该 第一用户集合中选择出用户组成该目标用户集合,其中该目标用户集合中的用户为一下任 一种或者同时属于以下多种用户中的至少两种用户:活跃用户、稳定用户以及月供用户,其 中该活跃用户为在第一时间段内平均转入资金高于第一门限的用户,在第二时间段内转出 资金至不属于该第一用户集合所属的机构的同名账户的次数低于第二门限的用户为该稳 定用户,该月供用户为有不动产月供贷款的用户。
[0056] 进一步,设备300还包括:第四确定单元304,用于使用该第一随机森林模型确定 该第一用户集合中的任一个用户在该第一时刻之后的任一时刻的金融资产。
[0057] 进一步,设备300还包括:第五确定单元305,用于从该目标用户集合中确定更新 用户,其中该更新用户在该第三时刻的最大净资产数据与该更新用户在该第一时刻的最大 净资产数据不同,该第一时刻在该第三时刻之前。在此情况下,第三确定单元303,还用于从 该第一随机森林模型中确定对应于该更新用户的决策树并从该第一随机森林模型中删除 对应于该更新用户的决策树。第三确定单元303,还用于使用该更新用户的金融行为数据和 第三时刻的最大净资产数据训练第二随机森林模型。第三确定单元303,还用于根据第一随 机森林模型和第二随机森林模型,确定更新随机森林模型,以便使用该更新随机森林模型 确定该第一用户集合中的任一个用户在该第三时刻之后的任一时刻的最大净资产数据。
[0058] 图4是根据本发明实施例提供的设备的结构框图。图4所示的设备可以执行图1 或图2的各个步骤。图4所示的设备400包括:处理器401和存储器402。
[0059] 设备400中的各个组件通过总线系统403f禹合在一起,其中总线系统403除包括 数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图 4中将各种总线都标为总线系统403。
[0060] 上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。 处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的 各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的 处理器401可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用 集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、 分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通 用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例 所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬 件及软件模块组合执行完成。软件模块可以位于随机存取存储器(RandomAccessMemory, RAM)、闪存、只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器或者电可擦写可编程 存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取 存储器402中的指令,结合其硬件完成上述方法的步骤。
[0061] 处理器401,用于根据第一用户集合中的用户的金融行为数据,从该第一用户集合 中确定目标用户集合。
[0062] 处理器401,用于确定该目标用户集合中的每一个用户的金融行为数据和第一时 刻的最大净资产数据。
[0063] 处理器401,用于使用处理器401确定的该目标用户集合中所有用户的金融行为 数据和该第一时刻的最大净资产数据训练第一随机森林模型,以便使用该第一随机森林模 型确定该第一用户集合中的任一个用户在该第一时刻之后的任一时刻的最大净资产数据。
[0064] 图4所示的设备400能够通过选定合适的训练样本训练用于确定用户资产的第一 随机森林模型。这样,可以使用该第一随机森林模型预测用户的金融资产,而不是仅估算用 户当前的金融资产。该第一随机森林模型是基于不同的训练样本确定的。因此,该第一随 机森林模型可以适用于具有不同特点的用户来估算金融资产。这样可以提高估算金融资产 的效率并且具有较高的准确率。
[0065] 该金融行为数据可以是以下的任一种或多种:交易记录、不动产估值、贷款数据 等。该交易记录可以包括以下任一种或多种:银行卡交易记录、信用卡交易记录、理财产品 交易记录等。
[0066] 该最大净资产数据可以是该第一时刻至第二时刻内按第一时间粒度统计的最大 资产总值与月供贷款的差值,其中该最大资产总值为该第一时刻至该第二时刻内案该第一 时间粒度统计的最大资金数值和不动产估值,该第二时刻在该第一时刻之前。该第二时刻 以及该第一时间粒度可以根据需要进行设置。
[0067] 处理器401,具体用于根据该第一用户集合中的用户的金融行为数据,从该第一用 户集合中选择出用户组成该目标用户集合,其中该目标用户集合中的用户为一下任一种或 者同时属于以下多种用户中的至少两种用户:活跃用户、稳定用户以及月供用户,其中该活 跃用户为在第一时间段内平均转入资金高于第一门限的用户,在第二时间段内转出资金至 不属于该第一用户集合所属的机构的同名账户的次数低于第二门限的用户为该稳定用户, 该月供用户为有不动产月供贷款的用户。
[0068] 进一步,处理器401,还可以用于使用该第一随机森林模型确定该第一用户集合中 的任一个用户在该第一时刻之后的任一时刻的金融资产。
[0069] 进一步,处理器401,还可以用于从该目标用户集合中确定更新用户,其中该更新 用户在该第三时刻的最大净资产数据与该更新用户在该第一时刻的最大净资产数据不同, 该第一时刻在该第三时刻之前。在此情况下,处理器401,还用于从该第一随机森林模型中 确定对应于该更新用户的决策树并从该第一随机森林模型中删除对应于该更新用户的决 策树。处理器401,还用于使用该更新用户的金融行为数据和第三时刻的最大净资产数据训 练第二随机森林模型。处理器401,还用于根据第一随机森林模型和第二随机森林模型,确 定更新随机森林模型,,以便使用
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1