商户评级方法、装置、设备及计算机可读存储介质与流程

文档序号:26595549发布日期:2021-09-10 22:19阅读:81来源:国知局
商户评级方法、装置、设备及计算机可读存储介质与流程

1.本发明涉及金融科技(fintech)领域,尤其涉及一种商户评级方法、装置、设备及计算机可读存储介质。


背景技术:

2.随着计算机技术的发展,越来越多的技术(大数据、分布式、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(fintech)转变,但由于金融行业的安全性、通用性要求,也对风险事件监控技术提出了更高的要求。
3.目前,对于入网商户,分别对商户的入网数据和交易数据进行风险评估,得到商户的静态风险数据和动态风险数据。当获取到商户评级指令时,根据从商户管理大数据处理平台中获取到的待评级商户的静态风险数据和动态风险数据确定商户的综合评级。具体地,先根据静态风险数据计算待评级商户的入网评分,以及根据动态风险数据计算待评级商户的交易评分;接着获取入网评分和交易评分对应的权重信息,根据入网评分、交易评分以及权重信息计算待评级商户的综合评分;最后根据待评级商户的综合评分所在的分数段确定待评级商户的评级。
4.但是,由于商户评级过程中,入网评分和交易评分对应的权重信息是通过人工进行设定的,而人工设定权重本身就是一个主观的因素,造成对待评级商户进行评级的误判率高,导致商户评级的准确性较低。
5.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。


技术实现要素:

6.本发明的主要目的在于提供一种商户评级方法、装置、设备及计算机可读存储介质,旨在解决现有商户评级的准确性较低的技术问题。
7.为实现上述目的,本发明提供一种商户评级方法,所述商户评级方法包括以下步骤:
8.定时获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;
9.将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;
10.若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;
11.将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级。
12.进一步地,所述将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果的步骤包括:
13.对所述待训练数据进行拆分,以获得k份子数据,将所述k份子数据中的任一份作
为检验集并将剩余k

1份作为训练集,得到k组训练样本;
14.对于每一组训练样本,将当前训练样本中的训练集输入所述商户评级决策模型进行模型训练,以获得子训练结果,并基于所述子训练结果以及当前训练样本中的验证集,验证训练后的商户评级决策模型;
15.若k组训练样本对应的训练后的商户评级决策模型验证通过,则基于k组训练样本对应的子训练结果确定所述商户评级结果。
16.进一步地,所述将当前训练样本中的训练集输入所述商户评级决策模型进行模型训练,以获得子训练结果;
17.将当前训练集输入所述商户评级决策模型之后,对于每一第一特征,将第一特征作为决策树的节点,通过所述商户评级决策模型基于当前训练集的评级种类以及评级种类占比,确定所述商户评级决策模型的第一信息熵;
18.通过所述商户评级决策模型各个第二特征作为所述决策树的判断节点时的第二信息熵;
19.通过所述商户评级决策模型确定第一信息熵与各个第二信息熵之间的信息熵差,并基于信息熵差确定决策树的节点的最佳特征;
20.在将所述当前训练集的所有特征插入至所述商户评级决策模型的决策树时,将所述商户评级决策模型的输出作为子训练结果,基于当前的决策树确定训练后的商户评级决策模型;
21.其中,所述当前训练集为当前训练样本中的训练集,评级种类占比为评级种类对应的样本数据在当前训练集中的比例,第一特征值为当前训练集的各个特征中的任一特征。
22.进一步地,所述基于所述子训练结果以及当前训练样本中的验证集,验证训练后的商户评级决策模型的步骤包括:
23.基于当前训练样本中的验证集以及所述子训练结果,确定混淆矩阵;
24.基于所述混淆矩阵,分别确定训练后的商户评级决策模型对应的分类准确度、召回率、虚警率和精确度;
25.基于所述分类准确度、召回率、虚警率和精确度,验证训练后的商户评级决策模型。
26.进一步地,所述将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果的步骤包括:
27.获取所述商户训练数据中降级商户的降级商户训练数据,并基于所述降级商户对应的原始商户评级以及商户评级结果在各个降级决策模型中,确定目标降级决策模型,其中,降级决策模型的数量为商户评级的级别数量

1;将所述降级商户训练数据输入所述目标降级决策模型进行模型训练,以获得降级结果;或者,
28.获取所述商户训练数据中晋级商户的晋级商户训练数据,并基于所述晋级商户对应的原始商户评级以及商户评级结果在各个晋级决策模型中,确定目标晋级决策模型,其中,晋级决策模型的数量为商户评级的级别数量

1;将所述晋级商户训练数据输入所述目标晋级决策模型进行模型训练,以获得晋级结果。
29.进一步地,所述基于所述晋级/降级结果更新所述待晋级/降级商户的评级的步骤
包括:
30.基于所述晋级/降级结果确定所述待晋级/降级商户中的晋级/降级商户,并输出所述晋级/降级商户对应的评级变化信息;
31.若接收到所述评级变化信息对应的确认信息,则更新所述确认信息对应的目标晋级/降级商户的评级。
32.进一步地,所述基于所述晋级/降级结果更新所述待晋级/降级商户的评级的步骤之后,还包括:
33.基于更新后的所述目标晋级/降级商户的评级,更新所述待训练数据,以获得更新后的待训练数据;
34.将更新后的待训练数据输入商户评级决策模型进行模型训练,以获得更新后的商户评级决策模型,并将更新后的商户评级决策模型作为所述商户评级决策模型;
35.在更新后的待训练数据中获取所述待晋级/降级商户的训练数据,将所述待晋级/降级商户的训练数据输入对应的晋级/降级决策模型进行模型训练,以获得更新后的晋级/降级决策模型,并将更新后的晋级/降级决策模型作为所述晋级/降级决策模型。
36.此外,为实现上述目的,本发明还提供一种商户评级装置,所述商户评级装置包括:
37.获取模块,用于获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;
38.训练模块,用于将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;
39.确定模块,用于若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;
40.评级模块,用于将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级。
41.此外,为实现上述目的,本发明还提供一种商户评级设备,所述商户评级设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的商户评级程序,所述商户评级程序被所述处理器执行时实现前述的商户评级方法的步骤。
42.此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有商户评级程序,所述商户评级程序被处理器执行时实现前述所述的商户评级方法的步骤。
43.本发明通过获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;接着将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;而后若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;然后将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级,通过待训练数据对商户进行自动评级,避免了用人工经验设置的权重而导致商户评级的误判,并且能够通过晋级/降级决策模型对需要进行评级便跟的商户进行及时变更,提高了商户评级的准确性。
附图说明
44.图1是本发明实施例方案涉及的硬件运行环境中商户评级设备结构示意图;
45.图2为本发明商户评级方法第一实施例的流程示意图;
46.图3为本发明商户评级装置一实施例的功能模块示意图。
47.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
48.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
49.如图1所示,图1是本发明实施例方案涉及的硬件运行环境中商户评级设备结构示意图。
50.本发明实施例商户评级设备可以是pc,也可以是智能手机、平板电脑、电子书阅读器、mp3(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)播放器、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
51.如图1所示,该商户评级设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
52.可选地,商户评级设备还可以包括摄像头、rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在商户评级设备移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别商户评级设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,商户评级设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
53.本领域技术人员可以理解,图1中示出的结构并不构成对商户评级设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
54.如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及商户评级程序。
55.在图1所示的商户评级设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的商户评级程序。
56.在本实施例中,商户评级设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的商户评级程序,其中,处理器1001调用存储器1005
中存储的商户评级程序时,并执行以下操作:
57.定时获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;
58.将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;
59.若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;
60.将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级。
61.进一步地,处理器1001可以调用存储器1005中存储的商户评级程序,还执行以下操作:
62.对所述待训练数据进行拆分,以获得k份子数据,将所述k份子数据中的任一份作为检验集并将剩余k

1份作为训练集,得到k组训练样本;
63.对于每一组训练样本,将当前训练样本中的训练集输入所述商户评级决策模型进行模型训练,以获得子训练结果,并基于所述子训练结果以及当前训练样本中的验证集,验证训练后的商户评级决策模型;
64.若k组训练样本对应的训练后的商户评级决策模型验证通过,则基于k组训练样本对应的子训练结果确定所述商户评级结果。
65.进一步地,处理器1001可以调用存储器1005中存储的商户评级程序,还执行以下操作:
66.将当前训练集输入所述商户评级决策模型之后,对于每一第一特征,将第一特征作为决策树的节点,通过所述商户评级决策模型基于当前训练集的评级种类以及评级种类占比,确定所述商户评级决策模型的第一信息熵;
67.通过所述商户评级决策模型各个第二特征作为所述决策树的判断节点时的第二信息熵;
68.通过所述商户评级决策模型确定第一信息熵与各个第二信息熵之间的信息熵差,并基于信息熵差确定决策树的节点的最佳特征;
69.在将所述当前训练集的所有特征插入至所述商户评级决策模型的决策树时,将所述商户评级决策模型的输出作为子训练结果,基于当前的决策树确定训练后的商户评级决策模型;
70.其中,所述当前训练集为当前训练样本中的训练集,评级种类占比为评级种类对应的样本数据在当前训练集中的比例,第一特征值为当前训练集的各个特征中的任一特征。
71.进一步地,处理器1001可以调用存储器1005中存储的商户评级程序,还执行以下操作:
72.基于当前训练样本中的验证集以及所述子训练结果,确定混淆矩阵;
73.基于所述混淆矩阵,分别确定训练后的商户评级决策模型对应的分类准确度、召回率、虚警率和精确度;
74.基于所述分类准确度、召回率、虚警率和精确度,验证训练后的商户评级决策模型。
75.进一步地,处理器1001可以调用存储器1005中存储的商户评级程序,还执行以下操作:
76.获获取所述商户训练数据中降级商户的降级商户训练数据,并基于所述降级商户对应的原始商户评级以及商户评级结果在各个降级决策模型中,确定目标降级决策模型,其中,降级决策模型的数量为商户评级的级别数量

1;将所述降级商户训练数据输入所述目标降级决策模型进行模型训练,以获得降级结果;或者
77.获取所述商户训练数据中晋级商户的晋级商户训练数据,并基于所述晋级商户对应的原始商户评级以及商户评级结果在各个晋级决策模型中,确定目标晋级决策模型,其中,晋级决策模型的数量为商户评级的级别数量

1;将所述晋级商户训练数据输入所述目标晋级决策模型进行模型训练,以获得晋级结果。
78.进一步地,处理器1001可以调用存储器1005中存储的商户评级程序,还执行以下操作:
79.基于所述晋级/降级结果确定所述待晋级/降级商户中的晋级/降级商户,并输出所述晋级/降级商户对应的评级变化信息;
80.若接收到所述评级变化信息对应的确认信息,则更新所述确认信息对应的目标晋级/降级商户的评级。
81.进一步地,处理器1001可以调用存储器1005中存储的商户评级程序,还执行以下操作:
82.基于更新后的所述目标晋级/降级商户的评级,更新所述待训练数据,以获得更新后的待训练数据;
83.将更新后的待训练数据输入商户评级决策模型进行模型训练,以获得更新后的商户评级决策模型,并将更新后的商户评级决策模型作为所述商户评级决策模型;
84.在更新后的待训练数据中获取所述待晋级/降级商户的训练数据,将所述待晋级/降级商户的训练数据输入对应的晋级/降级决策模型进行模型训练,以获得更新后的晋级/降级决策模型,并将更新后的晋级/降级决策模型作为所述晋级/降级决策模型。
85.本发明还提供一种商户评级方法,参照图2,图2为本发明商户评级方法第一实施例的流程示意图。
86.步骤s101,定时获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;
87.本实施例中,商户的交易数据在日终导入到收单商户大数据平台,即商户大数据平台每天日终收集商户所有交易信息,如果某一商户的行业信息或商户信息存在变动,则将变动后的新信息导入到商户大数据平台。
88.本实施例中,定时获取当前时刻之前预设时长内的待训练数据,其中,待训练数据包括商户交易信息以及商户入网信息,定时获取待训练数据的时间间隔可以进行合理设置,例如,该时间间隔与预设时长相同,该预设时长为n天,n可以为5、10等。
89.其中,商户交易信息包括商户基本信息、注册资金信息、法人证件信息、结算账户信息、法人年龄信息以及行业信息;商户交易信息包括高风险核查单金额占比、商户核查单数量占比、凌晨交易占比、信用卡交易占比、交易失败率占比以及大额交易占比。优选地,可预先设置商户交易信息以及商户入网信息在原始商户评级中的权重,例如,商户交易信息
中商户基本信息、注册资金信息、法人证件信息、结算账户信息、法人年龄信息以及行业信息的权重分别为:10%、10%、10%、30%、30%、10%,商户交易信息中高风险核查单金额占比、商户核查单数量占比、凌晨交易占比、信用卡交易占比、交易失败率占比以及大额交易占比的权重分别为:20%、20%、10%、10%、20%、20%。
90.步骤s102,将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;
91.本实施例中,在获取到待训练数据之后,将该待训练数据输入商户评级决策模型进行模型训练,通过商户评级决策模型的输出结果得到待训练数据对应的各个商户的商户评级结果。
92.具体地,本实施例中,可以先对待训练数据进行拆分,以获得k份子数据,将所述k份子数据中的任一份作为检验集、剩余k

1份作为训练集,得到k组训练样本,通过依次将k组训练样本分别输入商户评级决策模型进行模型训练,实现交叉验证,得到商户评级结果。
93.步骤s103,若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;
94.其中,原始商户评级是指待训练数据对应的各个商户在待训练数据进行模型训练之前的商户评级,例如商户评级可分为1、2、3、4这四个等级。
95.本实施例中,在获取到商户评级结果之后,判断商户评级结果中的各个商户评级与对应的原始商户评级是否一致,若商户评级结果中存在不一致的商户评级,则确定商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,其中不一致的商户评级对应的商户为待晋级/降级商户,进而,在待训练数据中获取待晋级/降级商户的商户训练数据。
96.步骤s104,将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级。
97.本实施例中,在获取到待晋级/降级商户的商户训练数据,将该商户训练数据输入晋级/降级决策模型进行模型训练,并将晋级/降级决策模型的输出作为晋级/降级结果。
98.具体地,晋级/降级决策模型包括与评级的数量对应的多个晋级决策模型以及降级决策模型,例如,商户评级可分为1、2、3、4这四个等级,评级的大小为1级大于2级大于3级大于4级,则晋级决策模型可包括4升3决策模型、3升2决策模型以及2升1决策模型,降级决策模型可包括1降2决策模型、2降3决策模型以及3降4决策模型。在获取到商户训练数据,先获取商户训练数据中的降级商户训练数据和/或晋级商户训练数据,对于降级商户训练数据,根据原始商户评级以及商户评级结果确定降级决策模型,例如,对于商户a,原始商户评级为2级、商户评级结果为3级,则选择2降3决策模型对商户a的降级商户训练数据进行训练,若商户评级结果为4级,则依次选择2降3决策模型以及3降4决策模型对商户a的降级商户训练数据进行训练;对于晋级商户训练数据,根据原始商户评级以及商户评级结果确定晋级决策模型,例如,对于商户b,原始商户评级为3级、商户评级结果为2级,则选择3升2决策模型对商户b的晋级商户训练数据进行训练,若商户评级结果为1级,则依次选择3升2决策模型以及2升1决策模型对商户b的晋级商户训练数据进行训练。
99.最后,基于所述晋级/降级结果更新所述待晋级/降级商户的评级,具体地,确定晋级/降级结果中与商户评级结果一致的目标评级结果,将目标评级结果作为该目标评级结果对应的商户的评级。
100.然而本实施例不限于此,于其他实施方式中,还可以输出该目标评级结果对应的确认信息,以通过人工确认目标评级结果对应的商户的评级是否需要变更,若接收到确认信息,则将目标评级结果作为该目标评级结果对应的商户的评级。
101.本实施例提出的商户评级方法,通过获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;接着将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;而后若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;然后将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级,通过待训练数据对商户进行自动评级,避免了用人工经验设置的权重而导致商户评级的误判,并且能够通过晋级/降级决策模型对需要进行评级便跟的商户进行及时变更,提高了商户评级的准确性。
102.基于第一实施例,提出本发明商户评级方法的第二实施例,在本实施例中,步骤s102包括:
103.步骤s201,对所述待训练数据进行拆分,以获得k份子数据,将所述k份子数据中的任一份作为检验集并将剩余k

1份作为训练集,得到k组训练样本;
104.步骤s202,对于每一组训练样本,将当前训练样本中的训练集输入所述商户评级决策模型进行模型训练,以获得子训练结果,并基于所述子训练结果以及当前训练样本中的验证集,验证训练后的商户评级决策模型;
105.步骤s203,若k组训练样本对应的训练后的商户评级决策模型验证通过,则基于k组训练样本对应的子训练结果确定所述商户评级结果。
106.本实施例中,在获取到待训练数据,对待训练数据进行拆分,以获得k份子数据,具体地,可以将待训练数据均分为k份子数据,而后将所述k份子数据中的任一份作为检验集并将剩余k

1份作为训练集,得到k组训练样本。
107.对于每一组训练样本,分别将当前训练样本中的训练集输入商户评级决策模型进行模型训练,以获得所述子训练结果,根据子训练结果对应的各个商户的评级以及当前训练样本中验证集对应的各个商户的评级,验证训练后的商户评级决策模型;若验证通过,则进行下一组训练样本的模型训练。
108.若k组训练样本对应的训练后的商户评级决策模型验证通过,通过k次模型训练的训练样本对应的子训练结果进行整合,得到商户评级结果,例如,将子训练结果中相同商户的评级进行合并,得到商户评级结果,若同一商户存在多种评级,则选取出现次数最多的评级作为该商户的最终评级。通过交叉验证得到该商户评级结果,以使尽可能多的数据作为训练集数据,每一次训练集数据和检验集数据都是相互独立的,并且完全覆盖了整个数据集,进而提高模型训练的准确性。
109.进一步地,一实施例中,该步骤s202包括:
110.步骤a,将当前训练集输入所述商户评级决策模型之后,对于每一第一特征,将第一特征作为决策树的节点,通过所述商户评级决策模型基于当前训练集的评级种类以及评级种类占比,确定所述商户评级决策模型的第一信息熵;
111.步骤b,通过所述商户评级决策模型各个第二特征作为所述决策树的判断节点时
的第二信息熵;
112.步骤c,通过所述商户评级决策模型确定第一信息熵与各个第二信息熵之间的信息熵差,并基于信息熵差确定决策树的节点的最佳特征;
113.步骤d,在将所述当前训练集的所有特征插入至所述商户评级决策模型的决策树时,将所述商户评级决策模型的输出作为子训练结果,基于当前的决策树确定训练后的商户评级决策模型;
114.其中,所述当前训练集为当前训练样本中的训练集,评级种类占比为评级种类对应的样本数据在当前训练集中的比例,第一特征值为当前训练集的各个特征中的任一特征。
115.对于每一组训练样本d,其混有c种评级商户的数据,在商户评级决策模型中,根据训练样本d选择任一第一特征a作为决策树的决策节点,商户评级决策模型基于当前训练集的评级种类以及评级种类占比,确定所述商户评级决策模型的第一信息熵,具体地,该第一信息熵的公式为:
[0116][0117]
其中,info(d)为第一信息熵,d为当前训练集,c为当前训练集中的评级数量,p
i
为评级种类占比,表示评级类别为i样本数量占d的比例。
[0118]
而后,商户评级决策模型选择第二特征a作为决策树判断节点,通过商户评级决策模型通过决策树对应的特征值作用后的信息熵公式计算在特征b作用后的第二信息熵,该第二信息熵的公式为:
[0119][0120]
其中,info
a
(d)为第二信息熵,k表示当前训练集d被分为k个部分,d
j
为第j部分样本的数量,d为当前训练集中样本的总数量,info(d
j
)为第j部分样本的信息熵,info(d
j
)可采用info(d)的公式计算得到。
[0121]
而后通过所述商户评级决策模型确定第一信息熵与各个第二信息熵之间的信息熵差,信息熵差gain(a)=info(d)

info
a
(d);并基于信息熵差确定决策树的节点的最佳特征,具体地,选择gain(a)值最大的特征作为该最佳特征。
[0122]
而后,采用上述相同的方式确定决策树中其他节点的最佳特征,以将当前训练集的所有特征插入至所述商户评级决策模型的决策树,将商户评级决策模型的输出作为子训练结果,并基于当前的决策树确定训练后的商户评级决策模型。
[0123]
进一步地,又一实施例中,该步骤s202包括:
[0124]
步骤e,基于当前训练样本中的验证集以及所述子训练结果,确定混淆矩阵;
[0125]
步骤d,基于所述混淆矩阵,分别确定训练后的商户评级决策模型对应的分类准确度、召回率、虚警率和精确度;
[0126]
步骤f,基于所述分类准确度、召回率、虚警率和精确度,验证训练后的商户评级决策模型。
[0127]
本实施例中,基于当前训练样本中的验证集以及所述子训练结果,确定混淆矩阵,
具体地,根据验证集中的评级以及子训练结果中的评级,确定当前训练中的p(positive sample,正例的样本数量)、n(negative sample,负例的样本数量)、tp(true positive,正确预测到的正例的数量),fp(false positive,把负例预测成正例的数量),fn(false negative,把正例预测成负例的数量),tn(true negative,正确预测到的负例的数量);根据tp、fp、fn以及tn确定该混淆矩阵。
[0128]
而后,基于所述混淆矩阵,分别确定训练后的商户评级决策模型对应的分类准确度、召回率、虚警率和精确度,其中,分类准确度=(tp+tn)/(p+n),召回率=(tp)/(p),虚警率=(fn)/(n),精确度=(tp)/(tp+fp)。
[0129]
最后,基于所述分类准确度、召回率、虚警率和精确度,验证训练后的商户评级决策模型,具体地,分别确定分类准确度、召回率、虚警率和精确度是否满足各自的预设条件,若分类准确度、召回率、虚警率和精确度均满足各自的预设条件,则确定训练后的商户评级决策模型验证通过。例如,预设条件包括分类准确度是否大于预设准确度,召回率是否小于预设召回率,虚警率是否小于预设虚警率,精确度是否大于预设精确度;则在分类准确度大于预设准确度、召回率小于预设召回率、虚警率小于预设虚警率且精确度大于预设精确度时,确定训练后的商户评级决策模型验证通过。
[0130]
本实施例提出的商户评级方法,通过对所述待训练数据进行拆分,以获得k份子数据,将所述k份子数据中的任一份作为检验集并将剩余k

1份作为训练集,得到k组训练样本;接着对于每一组训练样本,将当前训练样本中的训练集输入所述商户评级决策模型进行模型训练,以获得子训练结果,并基于所述子训练结果以及当前训练样本中的验证集,验证训练后的商户评级决策模型;而后若k组训练样本对应的训练后的商户评级决策模型验证通过,则基于k组训练样本对应的子训练结果确定所述商户评级结果,通过交叉验证得到商户评级结果,能够通过尽量多的数据得到商户评级结果,进而提高商户评级结果的准确性。
[0131]
基于第一实施例,提出本发明商户评级方法的第三实施例,在本实施例中,步骤s104包括:
[0132]
步骤s301,获取所述商户训练数据中降级商户的降级商户训练数据,并基于所述降级商户对应的原始商户评级以及商户评级结果在各个降级决策模型中,确定目标降级决策模型,其中,降级决策模型的数量为商户评级的级别数量

1;将所述降级商户训练数据输入所述目标降级决策模型进行模型训练,以获得降级结果;
[0133]
步骤s302,获取所述商户训练数据中晋级商户的晋级商户训练数据,并基于所述晋级商户对应的原始商户评级以及商户评级结果在各个晋级决策模型中,确定目标晋级决策模型,其中,晋级决策模型的数量为商户评级的级别数量

1;将所述晋级商户训练数据输入所述目标晋级决策模型进行模型训练,以获得晋级结果。
[0134]
本实施例中,降级决策模型的数量为商户评级的级别数量

1,例如,商户评级可分为1、2、3、4这四个等级,若评级的大小为1级大于2级大于3级大于4级,则降级决策模型可包括1降2决策模型、2降3决策模型以及3降4决策模型。
[0135]
本实施例中,在获取到商户训练数据,先获取商户训练数据中降级商户的降级商户训练数据,并基于降级商户对应的原始商户评级以及商户评级结果在各个降级决策模型中,确定目标降级决策模型,例如,例如,对于商户a,原始商户评级为2级、商户评级结果为3
级,则选择2降3决策模型作为目标降级决策模型,若商户评级结果为4级,则依次选择2降3决策模型以及3降4决策模型作为目标降级决策模型。
[0136]
接着,在得到目标降级决策模型之后,将降级商户训练数据输入目标降级决策模型进行模型训练,以获得降级结果,该降级结果为该降级商户的评级结果,例如,原始商户评级为2级、商户评级结果为3级,降级结果为2级或3级,若降级结果为2级则不对降级商户进行降级,若为3级则该降级商户可降级。若目标降级决策模型包括多个,则根据降级商户的原始商户评级依次通过目标降级决策模型训练降级商户训练数据,例如依次选择2降3决策模型以及3降4决策模型对商户a的降级商户训练数据进行训练。
[0137]
本实施例中,在获取到商户训练数据,先获取商户训练数据中晋级商户的晋级商户训练数据,并基于晋级商户对应的原始商户评级以及商户评级结果在各个晋级决策模型中,确定目标晋级决策模型,例如,例如,对于商户a,原始商户评级为3级、商户评级结果为2级,则选择3升2决策模型作为目标晋级决策模型,若商户评级结果为1级,则依次选择3升3决策模型以及2升1决策模型作为目标晋级决策模型。
[0138]
接着,在得到目标晋级决策模型之后,将晋级商户训练数据输入所述降级决策模型进行模型训练,以获得晋级结果,该晋级结果为该降级商户的评级结果,例如,原始商户评级为3级、商户评级结果为2级,晋级结果为2级或3级,若晋级结果为3级则不对晋级商户进行晋级,若为2级则该晋级商户可晋级。若目标晋级决策模型包括多个,则根据晋级商户的原始商户评级依次通过目标晋级决策模型训练晋级商户训练数据,例如依次选择3升2决策模型以及2升1决策模型对商户a的晋级商户训练数据进行训练。
[0139]
本实施例提出的商户评级方法,通过获取所述商户训练数据中降级商户的降级商户训练数据,并基于所述降级商户对应的原始商户评级以及商户评级结果在各个降级决策模型中,确定目标降级决策模型,接着将所述降级商户训练数据输入所述目标降级决策模型进行模型训练,以获得降级结果,或者,获取所述商户训练数据中晋级商户的晋级商户训练数据,并基于所述晋级商户对应的原始商户评级以及商户评级结果在各个晋级决策模型中,确定目标晋级决策模型,其中,晋级决策模型的数量为商户评级的级别数量

1;将所述晋级商户训练数据输入所述目标晋级决策模型进行模型训练,以获得晋级结果,通过降级决策模型对需要降级的商户进行再次确认以及晋级决策模型对需要晋级的商户进行再次确认,得到其评级结果,进一步提升商户评级的准确性。
[0140]
基于上述各个实施例,提出本发明商户评级方法的第四实施例,在本实施例中,步骤s104包括:
[0141]
步骤s401,基于所述晋级/降级结果确定所述待晋级/降级商户中的晋级/降级商户,并输出所述晋级/降级商户对应的评级变化信息;
[0142]
步骤s402,若接收到所述评级变化信息对应的确认信息,则更新所述确认信息对应的目标晋级/降级商户的评级。
[0143]
本实施例中,在获取到晋级/降级结果时,根据晋级/降级结果中的评级信息以及商户评级结果中的评级信息,确定待晋级/降级商户中的晋级/降级商户,也就是说,获取晋级/降级结果中的评级信息与商户评级结果中的评级信息一致的商户,并输出晋级/降级商户对应的评级变化信息,以供管理人员确定当前是否更改晋级/降级商户的评级。
[0144]
具体地,可以通过评级变化信息对应的按钮或按键确定更改晋级/降级商户的评
级,或者拒绝更改晋级/降级商户的评级,若接收到评级变化信息对应的确认信息,则更新所述确认信息对应的目标晋级/降级商户的评级,即将商户评级结果或者晋级/降级结果中目标晋级/降级商户的评级作为该目标晋级/降级商户新的评级。
[0145]
本实施例提出的商户评级方法,通过基于所述晋级/降级结果确定所述待晋级/降级商户中的晋级/降级商户,并输出所述晋级/降级商户对应的评级变化信息;接着若接收到所述评级变化信息对应的确认信息,则更新所述确认信息对应的目标晋级/降级商户的评级,通过对目标晋级/降级商户的评级更改的再次确认,提升商户评级的准确性。
[0146]
基于四实施例,提出本发明商户评级方法的第五实施例,在本实施例中,步骤s104之后,还包括:
[0147]
步骤s501,基于更新后的所述目标晋级/降级商户的评级,更新所述待训练数据,以获得更新后的待训练数据;
[0148]
步骤s502,将更新后的待训练数据输入商户评级决策模型进行模型训练,以获得更新后的商户评级决策模型,并将更新后的商户评级决策模型作为所述商户评级决策模型;
[0149]
步骤s503,在更新后的待训练数据中获取所述待晋级/降级商户的训练数据,将所述待晋级/降级商户的训练数据输入对应的晋级/降级决策模型进行模型训练,以获得更新后的晋级/降级决策模型,并将更新后的晋级/降级决策模型作为所述晋级/降级决策模型。
[0150]
本实施例中,在商户的评级更新之后,基于更新后的目标晋级/降级商户的评级,更新待训练数据,以获得更新后的待训练数据,即更新待训练数据中目标晋级/降级商户的评级。
[0151]
而后,将更新后的待训练数据输入商户评级决策模型进行模型训练,以获得更新后的商户评级决策模型,并将更新后的商户评级决策模型作为所述商户评级决策模型,同时在更新后的待训练数据中获取所述待晋级/降级商户的训练数据,将所述待晋级/降级商户的训练数据输入对应的晋级/降级决策模型进行模型训练,以获得更新后的晋级/降级决策模型,并将更新后的晋级/降级决策模型作为所述晋级/降级决策模型,进而实现商户评级决策模型以及晋级/降级决策模型的更新。
[0152]
本实施例提出的商户评级方法,通过基于更新后的所述目标晋级/降级商户的评级,更新所述待训练数据,以获得更新后的待训练数据;接着将更新后的待训练数据输入商户评级决策模型进行模型训练,以获得更新后的商户评级决策模型,并将更新后的商户评级决策模型作为所述商户评级决策模型;而后在更新后的待训练数据中获取所述待晋级/降级商户的训练数据,将所述待晋级/降级商户的训练数据输入对应的晋级/降级决策模型进行模型训练,以获得更新后的晋级/降级决策模型,并将更新后的晋级/降级决策模型作为所述晋级/降级决策模型,能够在商户评级更新后通过积累的风险数据对商户评级决策模型以及晋级/降级决策模型的更新,以提高后续进行商户评级的准确性。
[0153]
此外,本发明实施例还提出一种商户评级装置,参照图3,所述商户评级装置包括:
[0154]
获取模块10,用于获取当前时刻之前预设时长内的待训练数据,其中,所述待训练数据包括商户交易信息以及商户入网信息;
[0155]
训练模块20,用于将所述待训练数据输入商户评级决策模型进行模型训练,以获得商户评级结果;
[0156]
确定模块30,用于若所述商户评级结果中存在与原始商户评级不一致的待晋级/降级商户,则在所述待训练数据中确定待晋级/降级商户的商户训练数据;
[0157]
评级模块40,用于将所述商户训练数据输入晋级/降级决策模型进行模型训练,以获得晋级/降级结果,并基于所述晋级/降级结果更新所述待晋级/降级商户的评级。
[0158]
进一步地,训练模块20,还用于:
[0159]
对所述待训练数据进行拆分,以获得k份子数据,将所述k份子数据中的任一份作为检验集并将剩余k

1份作为训练集,得到k组训练样本;
[0160]
对于每一组训练样本,将当前训练样本中的训练集输入所述商户评级决策模型进行模型训练,以获得子训练结果,并基于所述子训练结果以及当前训练样本中的验证集,验证训练后的商户评级决策模型;
[0161]
若k组训练样本对应的训练后的商户评级决策模型验证通过,则基于k组训练样本对应的子训练结果确定所述商户评级结果。
[0162]
进一步地,训练模块20,还用于:
[0163]
将当前训练集输入所述商户评级决策模型之后,对于每一第一特征,将第一特征作为决策树的节点,通过所述商户评级决策模型基于当前训练集的评级种类以及评级种类占比,确定所述商户评级决策模型的第一信息熵;
[0164]
通过所述商户评级决策模型各个第二特征作为所述决策树的判断节点时的第二信息熵;
[0165]
通过所述商户评级决策模型确定第一信息熵与各个第二信息熵之间的信息熵差,并基于信息熵差确定决策树的节点的最佳特征;
[0166]
在将所述当前训练集的所有特征插入至所述商户评级决策模型的决策树时,将所述商户评级决策模型的输出作为子训练结果,基于当前的决策树确定训练后的商户评级决策模型;
[0167]
其中,所述当前训练集为当前训练样本中的训练集,评级种类占比为评级种类对应的样本数据在当前训练集中的比例,第一特征值为当前训练集的各个特征中的任一特征。
[0168]
进一步地,训练模块20,还用于:
[0169]
基于当前训练样本中的验证集以及所述子训练结果,确定混淆矩阵;
[0170]
基于所述混淆矩阵,分别确定训练后的商户评级决策模型对应的分类准确度、召回率、虚警率和精确度;
[0171]
基于所述分类准确度、召回率、虚警率和精确度,验证训练后的商户评级决策模型。
[0172]
进一步地,评级模块40,还用于:
[0173]
获取所述商户训练数据中降级商户的降级商户训练数据,并基于所述降级商户对应的原始商户评级以及商户评级结果在各个降级决策模型中,确定目标降级决策模型,其中,降级决策模型的数量为商户评级的级别数量

1;将所述降级商户训练数据输入所述目标降级决策模型进行模型训练,以获得降级结果;或者,
[0174]
获取所述商户训练数据中晋级商户的晋级商户训练数据,并基于所述晋级商户对应的原始商户评级以及商户评级结果在各个晋级决策模型中,确定目标晋级决策模型,其
中,晋级决策模型的数量为商户评级的级别数量

1;将所述晋级商户训练数据输入所述目标晋级决策模型进行模型训练,以获得晋级结果。
[0175]
进一步地,评级模块40,还用于:
[0176]
基于所述晋级/降级结果确定所述待晋级/降级商户中的晋级/降级商户,并输出所述晋级/降级商户对应的评级变化信息;
[0177]
若接收到所述评级变化信息对应的确认信息,则更新所述确认信息对应的目标晋级/降级商户的评级。
[0178]
进一步地,商户评级装置还包括:
[0179]
基于更新后的所述目标晋级/降级商户的评级,更新所述待训练数据,以获得更新后的待训练数据;
[0180]
将更新后的待训练数据输入商户评级决策模型进行模型训练,以获得更新后的商户评级决策模型,并将更新后的商户评级决策模型作为所述商户评级决策模型;
[0181]
在更新后的待训练数据中获取所述待晋级/降级商户的训练数据,将所述待晋级/降级商户的训练数据输入对应的晋级/降级决策模型进行模型训练,以获得更新后的晋级/降级决策模型,并将更新后的晋级/降级决策模型作为所述晋级/降级决策模型。
[0182]
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有商户评级程序,所述商户评级程序被处理器执行时实现如上述中任一项所述的商户评级方法的步骤。
[0183]
本发明计算机可读存储介质具体实施例与上述商户评级方法的各实施例基本相同,在此不再详细赘述。
[0184]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0185]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0186]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0187]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1