基于智能合约的企业信用动态评估模型

文档序号:27095165发布日期:2021-10-27 16:43阅读:112来源:国知局
基于智能合约的企业信用动态评估模型

1.本技术涉及计算机技术领域,具体而言,本技术涉及一种基于智能合约的企业信用动态评估模型。


背景技术:

2.随着科学技术的飞速发展,企业的数量逐渐增多,企业的类型也日益增多。企业在寻求合作时如想要了解合作对象的信息,需要在多个网站查询多种相关信息,如经营信息、招标信息、司法信息以及新闻舆论信息等,其数据的收集和查找都需要花费巨大的时间和精力。一个企业的好坏对整个社会的影响是重大的,企业的信用好坏能够很大程度上反映整个企业的好坏情况。
3.企业信用评估是建立社会信用体系的重要内容和基础。按照通常的定义,信用评估是信用评级服务机构以第三方的客观、公正立场,根据规范的评估指标体系,运用科学的评估方法,履行严格的评估程序,对企业、金融机构、债券发行者和社会组织等市场参与主体的信用记录、企业素质、管理能力、经营水平、外部环境、财务状况、发展前景等进行全面了解、考察调研、分析研究后,就其在未来一段时间履行承诺的能力、可能出现的各种风险所做的综合评价。企业信用是企业诚信经营的体现,现行的企业评价系统时通过第三方的征信机构通过一定的材料对企业信用做出等级评价,但是该种评价方式是完全通过主动寄送材料进行评价,且审核资料覆盖不够全面,评价结果的侧重性不足以让寻求合作的企业足够相应该企业,而且该评价方式的实效性较长,一般为三年,实效性较差。
4.如何有效避免传统评估办法无法应对行业特殊性及行业情况动态变化带来的影响及利用多个维度的评估指标来为企业进行信用评估,为中小微企业的信用评估提供更加准确的结论,是申请人及本领域的技术人员一致致力于解决的问题。


技术实现要素:

5.本技术的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术存在如何有效避免传统评估办法无法应对行业特殊性及行业情况动态变化带来的影响及利用多个维度的评估指标来为企业进行信用评估,为中小微企业的信用评估提供更加准确的结论的技术缺陷。
6.第一方面,提供了一种基于智能合约的企业信用动态评估模型,其特征在于,包括:
7.企业输入模块,用于接收企业上传的企业信息,并对所述企业信息进行分析处理,对所述企业进行分类、以及接收企业提交信用评估申请和授权;
8.模型创建模块,用于接收所述企业的行业数据,并基于所述行业数据创建对应的模型,并对所述模型进行更新,确定目标模型;
9.企业信用评估模块,用于采用所述目标模型对分类后的所述企业进行信用评估,得到所述企业的信用结果。
10.作为本技术一种可能的实施方式,在该实施方式中,所述企业输入模块包括:
11.用户注册单元,用于接收企业用户的注册请求,并为所述企业进行注册;
12.行业数据采集单元,用于采集所述企业所在行业的公共信息数据;
13.申请接收单元,用于接收所述企业的信用评估申请及所述信用评估的授权信息;
14.数据处理单元,用于对所述企业信息进行处理,形成所述企业的报表信息。
15.作为本技术一种可能的实施方式,在该实施方式中,所述模型创建模块包括:
16.企业信息采集单元,用于采集所述企业的数据信息;
17.行业分类单元,用于基于所述企业的数据信息确定所述企业所在的行业,并对所述企业进行分类;
18.模型训练单元,用于采用预设的方法对模型进行训练;
19.模型选择单元,用于根据预设的评估指标评价所述模型的适用程度,选择适用程度最高的目标模型。
20.作为本技术一种可能的实施方式,在该实施方式中,所述用于采用所述目标模型对分类后的所述企业进行信用评估,得到所述企业的信用结果,包括:
21.获取所述企业的企业信息、所述企业的报表信息、所述企业所在的行业信息以及所述行业的公共信息,采用所述目标模型对所述企业进行信用评估,得到评估结果。
22.作为本技术一种可能的实施方式,在该实施方式中,所述行业的公共信息数据包括欠税记录、民事判决记录、强制执行记录、行政处罚记录、社会保险参保缴费记录、住房公积金缴费记录、获得许可记录、获得认证记录、获得资质记录、获得奖励记录、拥有专利记录、出入境检验检疫绿色通道记录、进出口商品免检记录、进出口商品检验分类监管记录、上市公司或有事项记录、公用事业缴费记录、主题声明。
23.作为本技术一种可能的实施方式,在该实施方式中,所述模型训练单元在采用预设的方法对模型进行训练时,可以用于:
24.对收集到的所述企业的数据信息进行预处理;
25.对预处理之后的数据信息进行特征选择,确定特征向量;
26.基于所述特征向量确定各数据的重要性程度,并基于所述重要性程度匹配对应的预测函数,对所述企业进行分类。
27.作为本技术一种可能的实施方式,在该实施方式中,所述模型创建模块在对所述模型进行更新,确定目标模型时,可以用于:
28.构建随机森林模型,确定单棵决策树的分类精度;
29.计算各所述决策树的平均分类精度,将分类精度高于所述平均分类精度的决策树构建为目标随机森林模型。
30.作为本技术一种可能的实施方式,在该实施方式中,所述方法还包括:
31.基于所述目标随机森林的判断结果,采用预设的公式计算所述企业的授信概率的分数。
32.本技术实施例通过采用区块链技术,改善评估数据来源的真实性和可追溯性,根据行业进行特征选择,构建适合特定行业的评估模型。模型的升级迭代,使评估预测更加准确,削弱人工成本,将企业信用评估线上化,减少人工操作带来的失误和风险,提高评估效率,降低信用评估所需成本。
附图说明
33.为了更清楚地说明本技术实施例中的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
34.图1为本技术实施例提供的一种基于智能合约的企业信用动态评估模型的示意图;
35.图2为本技术实施例提供的一种企业输入模块的结构示意图;
36.图3为本技术实施例提供的一种模型创建模块的结构示意图;
37.图4为本技术实施例提供的一种基于智能合约的企业信用动态评估模型的结构示意图;
38.图5为本技术实施例提供的一种模型训练的方法的流程示意图。
39.结合附图并参考以下具体实施方式,本技术各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
具体实施方式
40.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
41.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
42.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
43.本技术提供的基于智能合约的企业信用动态评估模型,旨在解决现有技术的如上技术问题。
44.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本技术的实施例进行描述。
45.随着科学技术的飞速发展,企业的数量逐渐增多,企业的类型也日益增多。企业在寻求合作时如想要了解合作对象的信息,需要在多个网站查询多种相关信息,如经营信息、招标信息、司法信息以及新闻舆论信息等,其数据的收集和查找都需要花费巨大的时间和精力。一个企业的好坏对整个社会的影响是重大的,企业的信用好坏能够很大程度上反映整个企业的好坏情况。
46.企业信用评估是建立社会信用体系的重要内容和基础。按照通常的定义,信用评估是信用评级服务机构以第三方的客观、公正立场,根据规范的评估指标体系,运用科学的
评估方法,履行严格的评估程序,对企业、金融机构、债券发行者和社会组织等市场参与主体的信用记录、企业素质、管理能力、经营水平、外部环境、财务状况、发展前景等进行全面了解、考察调研、分析研究后,就其在未来一段时间履行承诺的能力、可能出现的各种风险所做的综合评价。
47.企业信用是企业诚信经营的体现,现行的企业评价系统时通过第三方的征信机构通过一定的材料对企业信用做出等级评价,但是该种评价方式是完全通过主动寄送材料进行评价,且审核资料覆盖不够全面,评价结果的侧重性不足以让寻求合作的企业足够相应该企业,而且该评价方式的实效性较长,一般为三年,实效性较差。
48.如何有效避免传统评估办法无法应对行业特殊性及行业情况动态变化带来的影响及利用多个维度的评估指标来为企业进行信用评估,为中小微企业的信用评估提供更加准确的结论,是申请人及本领域的技术人员一致致力于解决的问题。
49.区块链技术与供应链相结合,削弱人工成本,将企业信用评估线上化,减少人工操作带来的失误和风险,提高评估效率,降低信用评估所需成本。随机森林是一种基于决策树的集成分类算法,它克服了决策树过拟合问题,对不平衡样本、噪声和异常值有较好的容忍性,预测准确率较高,被广泛应用在金融决策、负载预测、生物信息、图像分类、信息检索和市场销售等领域。
50.本技术实施例中提供了一种基于智能合约的企业信用动态评估模型,如图1所示,该模型包括:
51.企业输入模块101,用于接收企业上传的企业信息,并对所述企业信息进行分析处理,对所述企业进行分类、以及接收企业提交信用评估申请和授权;
52.模型创建模块102,用于接收所述企业的行业数据,并基于所述行业数据创建对应的模型,并对所述模型进行更新,确定目标模型;
53.企业信用评估模块103,用于采用所述目标模型对分类后的所述企业进行信用评估,得到所述企业的信用结果。
54.作为本技术一种可能的实施方式,在该实施方式中,如图2所示,所述企业输入模块包括:
55.用户注册单元201,用于接收企业用户的注册请求,并为所述企业进行注册;
56.行业数据采集单元202,用于采集所述企业所在行业的公共信息数据;
57.申请接收单元203,用于接收所述企业的信用评估申请及所述信用评估的授权信息;
58.数据处理单元204,用于对所述企业信息进行处理,形成所述企业的报表信息。
59.作为本技术一种可能的实施方式,在该实施方式中,如图3所示,所述模型创建模块包括:
60.企业信息采集单元301,用于采集所述企业的数据信息;
61.行业分类单元302,用于基于所述企业的数据信息确定所述企业所在的行业,并对所述企业进行分类;
62.模型训练单元303,用于采用预设的方法对模型进行训练;
63.模型选择单元304,用于根据预设的评估指标评价所述模型的适用程度,选择适用程度最高的目标模型。
64.作为本技术一种可能的实施方式,在该实施方式中,如图4所示,为本技术实施例提供的基于智能合约的企业信用动态评估模型结构示意图,在本技术实施例中,供应链企业构建区块链网络,注册模块用于供应链企业通过客户端连接节点,调用注册智能合约,填入本企业信息完成注册,输入模块用于供应链企业通过客户端连接节点,调用业务智能合约,上传本企业业务信息数据至链上。调用报表生成智能合约,对企业链上数据进行数据交叉验证和企业报表分析。企业通过申请智能约合提交信用评估申请及相关授权;采集模块用于互联网模块通过爬虫各政府网站,获取相关企业信息,并进行数据处理,对于部分数据进行打分处理,部分数据进行计数处理。处理模块用于接收到企业注册的信息,依据输入信息生成的企业报表,以及采集模块从各政府官网爬取得到的信息。对该信息集合做数据预处理,对于异常数据(数据值过大或过小)可采取删除该条数据或者同缺失数据采用相同办法,使用该行业中该数据的中位数进行补充。分类模块用于根据处理后的得到的数据,依据行业特性选定特定行业,将行业特性体现。评估模块用于根据分类模块的结果,选择适用的行业评估模型,对处理模块处理后的数据行评估,根据随机森林判断结果,使用(公式授信决策树数量/总的决策树数量)*100,计算基于随机森林模型的企业授信概率的百分制分数。得出评估报告,该报告包含,企业优势项和劣势项,以及评估分数、评估分数走势图。输入模块用于采用数据集进行模型训练、使用区块链数据通过训练模型预测,将该数据加入训练数据集。分类模块,根据处理后的得到的数据,依据行业特性选定特定行业,将行业特性体现。训练模块,特征选择、根据行业类型进行特征选择,模型评价与选择数据预处理:将收集到的数据进行数据预处理,对于异常数据(数据值过大或过小)可采取删除该数据和缺失数据采用相同办法,使用该行业中该数据的中位数进行补充。特征选择包括根据行业数据特点进行行业划分,对原始数据预处理之后进行特征处理和加工,通过构建衍生变量来获取更有预测力和解释性的变量,最终生成更高维的特征宽表从输入数据的m个特征中随机抽取k个特征进行随机森林模型训练,(通常选取)特征重要性评估:特征重要性程度是各个特征的重要性值经过归一化的结果,特征重要性越高代表特征越匹配预测函数,这里通过计算基尼系数来得到每个特征的重要性。将数据集抽取70%作为训练集30%作为测试集,计算抽取k特征的基尼系数,进行决策树构建,组建随机森林。训练随机森林模型的参数,达到模型最优。
65.在本技术实施例中,采集模块用于通过互联网从政府、央行、海关等权威官网中搜索企业的公共信息,并记录于区块链内。公共信息包括欠税记录、民事判决记录、强制执行记录、行政处罚记录、社会保险参保缴费记录、住房公积金缴费记录、获得许可记录、获得认证记录、获得资质记录、获得奖励记录、拥有专利记录、出入境检验检疫绿色通道记录、进出口商品免检记录、进出口商品检验分类监管记录、上市公司或有事项记录、公用事业缴费记录、主题声明(如:环保局罚款已缴,环保局未更新),各银行贷款记录等。
66.在本技术实施例中,在进行客户端注册时,企业调用注册智能合约进行客户端注册将企业信息上链。基本信息包括身份信息(名称、注册地址、登记注册类型、登记注册号、登记注册日期、有效截止日期、组织机构代码、中征码、国税登记号、地税登记号)、主要出资人信息(出资方名称、证件类型、证件号码、出资占比)、高管人员信息(职务、姓名、证件类型、证件号码)、有直接关联企业信息(名称、中征码、关系)。通过企业注册的客户端连接区块链网络,调用节点安装的智能合约进行业务数据上传、上链。货物订单合同(货物编号、货
物货款信息)、物流订单合同(货物编号、物流款项信息);签收信息(货物编号、签收地址、时间、货物状态),调用智能合约从链上获取企业数据,进行数据验证、验证链上数据真实性形成交叉验证报告、分析企业业务数据报告、形成现金流量表、利润表。得出企业数据交叉验证报告和企业报表。
67.作为本技术一种可能的实施方式,在该实施方式中,模型的训练过程如图5所示,数据预处理包括将收集到的数据进行数据预处理,数据预处理包括:对于缺失数据,使用该行业中该数据的中位数进行补充。对于异常数据(数据值过大或过小)可采取删除该数据或采取处理缺失数据处理时办法,使用该行业中该数据的中位数进行补充。对于文本数据,使用tfidf技术提取文本数据中的关键词以及关键词词频,按提取出的关键词和关键词词频对文本数据进行分类处理,最后对文本数据进行贴标签分类处理。特征选择包括根据获得的企业数据、对企业数据进行行业划分(不同行业所关注的数据的重点不一致,如传统行业和新兴科技公司数据的特点存在不同),经行业划分后的数据所计算出的模型更有行业针对性,使得评估更加准确。在某一行业中,对原始数据预处理之后进行特征处理和加工,通过合并、分析构建衍生变量来获取更有预测力和解释性的变量,生成更高维的特征表。从输入数据的m个特征中随机抽取k个特征进行随机森林模型训练,k<m(通常选取),这样不同行业选取的特征向量会有所不同,所选特征向量具有本行业的特性,能够对本行业企业进行更有效准确的预测。特征重要性评估中,特征重要性程度是各个特征的重要性值经过归一化的结果,特征重要性越高代表特征越匹配预测函数,这里通过公式(1)计算基尼系数来得到每个特征的重要性。其中i表示分类结果,为该特征下分类结果为i的概率。
[0068][0069]
将数据集抽取70%作为训练集30%作为测试集,计算抽取k特征的基尼系数,进行决策树构建,组建随机森林。训练随机森林模型的参数,达到模型最优。
[0070]
在本技术实施例中,随机森林分类器包括以下模型参数:子模型的数量(n_estimators):关系到随机森林模型的复杂度,考虑到该模型用于信用评估,需要较高的预测准确度,这里以牺牲模型的复杂度为代价提高模型的预测准确度,所以此模型此处不进行设置,默认为能训练的最多子模型数量。每棵决策树的最大特征数(max_features):指定了在分裂时单棵树随机选取的最大特征数目,此模型设定为所选的特征数量。树的最大深度(max_depth):此模型设定为none(即不设限),划分时考虑所有的特征数,完全生长;节点最小分割的样本数(min_samples_split):限制了子树继续划分的条件,min_samples_split表示当前树节点还可以被进一步切割的最少样本数,此模型设定为默认值1。最大叶节点数(max_leaf_nodes):通过限制最大叶子节点数,防止过拟合,此模型设定为“none”(即不限制最大的叶子节点数),之后可通过交叉验证选取具体的值来加以限制;叶节点最小样本数(min_samples_leaf):指定每颗决策树完全生成,即叶子只包含单一的样本,此模型设定为默认值1。叶节点最小权重总值(min_weight_fraction_leaf):限制了叶子节点所有样本权重和的最小值,如果小于该阈值,则会和兄弟节点一起被剪枝,此模型设定为默认值0,即不考虑权重问题。
[0071]
构建较高精度的随机森林:利用验证集计算原始森林中每棵决策树的auc值,作为单棵决策树的分类精度。首先找到比原始森林f={t
i
,i=1,2,

,k}的单个决策树分类精
度平均值a更高的高精度随机森林subf,如公式(2)所示,其中auc
i
是第i棵决策t
i
的auc值。
[0072][0073]
如果subf中树的数量已经超过原始森林大小的2/3,则取subf作为高精度随机森林,否则需要降低选择标准。采用的策略是先计算原始森林中所有决策树auc值的标准差σ,再取auc大于等于a

σ的决策树组成高精度随机森林,如式(3)所示:
[0074]
subf={t
i
:auc
i
≥a

σ}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0075]
使用上述方法构建一个决策树数量为原始森林决策树数量2/3或以上的高精度随机森林。
[0076]
通过ks和auc来评估上述构建的较高精度的随机森林模型的整体效果,ks值不仅能够反映模型是否准确,还能够评估模型对好坏客户是否有足够的区分度;auc值能够保证在样本不均匀的情况下,准确评估模型的好坏与否,设定阈值,判断是否更新评估模型。
[0077]
根据高精度的随机森林判断结果,使用公式(授信决策树数量/总的决策树数量)*100,计算基于随机森林模型的企业授信概率的百分制分数。评估报告中包括当前评估分数,在评估过程中企业优势项,企业劣势项,给到企业相对较好的指导。并包括企业这一阶段性的评估分数变化趋势。
[0078]
本技术实施例通过采用区块链技术,改善评估数据来源的真实性和可追溯性,根据行业进行特征选择,构建适合特定行业的评估模型。模型的升级迭代,使评估预测更加准确,削弱人工成本,将企业信用评估线上化,减少人工操作带来的失误和风险,提高评估效率,降低信用评估所需成本。
[0079]
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0080]
以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1