基于大数据和机器学习的银行数字化转型成熟度评价系统的制作方法

文档序号:33458233发布日期:2023-03-15 03:01阅读:来源:国知局

技术特征:
1.一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,该系统包括:数据采集模块,用于多端采集银行业管理机构、官方协会、银行官方发布的与金融科技技术应用和成效相关的原始数据;数据处理模块,用于通过机器学习对采集的原始数据进行结构化处理、文档去重、关键词提取、指标相关性计算和指标分类分级,并输出评价领域、主题和要素三级指标体系;权重计算模块,用于通过神经网络模型对指标权重进行计算,得到各级指标权重值;指标成熟度计算模块,用于计算每个指标的标准化评价值,并根据标准化评价值和指标权重逐级向上加权汇总,得到被评价银行的数字化转型成熟度指数;成熟度评价模块,用于根据计算得到的数字化转型成熟度指数输出银行数字化转型成熟度评价结果;数据存储模块,用于存储收集到的数据和计算产生的数据,以及存储最终的成熟度指数和评价结果。2.根据权利要求1所述的一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,多端采集各官方机构原始数据,包括:所述官方机构,包括银行业管理机构、银行业官方认证协会、国有行和全国性股份制银行;所述多端采集方式,包括通过网络爬虫采集官方文档,以及通过usb、无线网络接口手动上传官方文档。3.根据权利要求1所述的一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,通过机器学习对采集的文档进行机构化处理、文档去重、关键词提取、指标相关性计算、指标分类分级,并输出三级评价指标体系,包括:使用深度学习图像文字识别技术对所述采集文档进行结构化处理,具体地,文字识别采用基于ctc的典型算法crnn,将非结构化的图像转为结构化文档;使用simhash算法将所述结构化文档的文本映射为数字形式的hash签名,并根据simhash值剔除重复文档;使用基于隐含主题模型的图方法tpr获取文档的主题分布和对应的关键词,综合不同主题上候选关键词的重要性,得到对候选关键词的最终排序,选取排序最高的若干为推荐关键词,作为初始指标库;使用dmi点互信息算法对初始指标进行相关性分析,两个指标之间的相关性程度可以表示为:其中,p(x)和p(y)表示其在文档中出现的概率,p(x|y)和p(y|x)表示其条件概率;筛选指标相关性小于阈值的指标作为评价指标;根据所述评价指标和文档主题的对应关系,设定文档主题为二级指标,各主题对应指标要素为三级指标;根据银行业数字化转型特点,对二级评价指标进行归类,总结评价领域作为一级数字化转型评价指标,包括:科技投入、生态建设、风险与安全、创新与竞争力、发展潜力、社会责任六个领域。
4.根据权利要求1所述的一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,使用神经网络模型对指标权重进行计算,得到各三级指标权重值,包括:采用bp神经网络模型,根据所述三级指标体系的指标数量确定输入层的输入单元数量;设置各层输出公式以及设置权重的初始化参数;通过样本集训练神经网络模型,其拓扑结构表示为:其中,表示指标权重预测结果向量;x表示输入层指标输入向量;v表示输入层到隐藏层的权值向量;p1表示输入层到隐藏层的偏置项;σ1表示输入层到隐藏层的激活函数;w表示隐藏层到输出层的权值向量;p2表示隐藏层到输出层的偏置项;σ2表示隐藏层到输出层的激活函数;损失函数表示为:其中,θ表示参数集合,y
i
表示第i个指标权重真实值,表示第i个指标权重预测值,l表示输出层单元个数;样本训练集的第i个指标对应的权重表示为:其中,v
ij
表示第i个指标的权重在第j个输出单元的权值;通过重复迭代训练神经网络模型,直到损失函数小于设定的阈值,则神经网络模型训练完成;将三级评价指标的初始值输入已经训练好的神经网络模型计算,得到各三级评价指标对应权重。5.根据权利要求1所述的一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,计算每个指标的行业平均值、样本标准差、标准评价值,并根据标准评价值和指标权重逐级向上加权汇总,得到被评价银行的数字化转型成熟度指数,包括:根据已经获取到的官方数据,针对每一个三级评价指标i计算其样本均值:计算样本标准差:其中,n表示银行机构的数量;针对第t个一级指标对应的第k个二级指标下的第u个三级指标,a
t,k,i,j
表示该指标第j个机构的实际取值,me
t,k,i
表示该指标的平均值,s
t,k,i
表示该指标的标准差。使用z-score变换得到每个指标的标准化评价值:
其中,x
t,k,i
表示被评价机构在第t个一级指标对应的第k个二级指标下的第i个三级指标的实际取值;y
t,k,i
表示被评价机构三级指标i的标准化评价值,取值范围为[0,100];应用算数加权法逐级向上汇总,得到被评价机构数字化转型的相对成熟度指数:三级指标加权汇总为二级指标标准化评价值:其中,v
t,k,i
表示被评价机构在第t个一级指标对应的第k个二级指标下的第i个三级指标的权重;i表示被评价机构的三级指标数量;z
t,k
表示被评价机构第t个一级指标对应的第k个二级指标标准化评价值;二级指标加权汇总为一级指标标准化评价值:其中,k表示被评价机构的二级指标数量;f
t
表示被评价机构第t个一级指标标准化评价值;一级指标加权汇总为成熟度指数:其中,t表示被评价机构的一级指标数量;r表示被评价机构数字化转型成熟度指数。6.根据权利要求1所述的一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,根据系统计算得到的数字化转型成熟度指数输出银行数字化转型成熟度评价结果,包括:银行数字化转型成熟度r取值范围为(0,100),其数值越大表示银行数字化转型成熟度越高,覆盖面越广,对外输出能力越强,客户体验越好,成长性越高。7.根据权利要求1所述的一种基于大数据和机器学习的银行数字化转型成熟度评价系统,其特征在于,将收集的数据和计算产生的数据进行存储,包括:所述存储数据包括采集的原始资料数据、抽取得到的关键词、相关性小于阈值的评价指标、指标相关性系数、神经网络模型计算得到的指标权重、指标行业平均值和标准差、指标标准化评价值、数字化转型的相对成熟度指数以及成熟度评价结果。8.一种基于大数据和机器学习的银行数字化转型成熟度评价电子设备,其特征在于,包括:存储器用于存储一个或多个程序,包括所述基于大数据和机器学习的银行数字化转型成熟度评价系统,以及权利要求1-7采集的数据和计算结果;处理器用于执行存储器中的计算机程序;通信总线用于处理器、存储器、输入、输出设备之间传递数据信息,包括数据总线、地址总线和控制总线;
通信接口用于计算机之间或计算机与其他终端之间的数据传输。9.一种包含计算机程序的非暂态计算机可读存储介质,其特征在于,该存储介质所包含的计算机程序被处理器执行时实现权利要求1至7所述的基于大数据和机器学习的银行数字化转型成熟度评价系统。

技术总结
本发明公开了一种基于大数据和机器学习的银行数字化转型成熟度评价系统,采集银行业相关机构官方发文数据;对采集的数据使用机器学习技术进行结构化处理、文档去重、智能分词、关键词提取、指标相关性分析等操作,确定数字化转型评价指标体系;以官方数据为基础,使用神经网络模型计算指标体系中的指标权重;根据国有行和股份制银行官方数据确定每个指标的行业平均值和样本标准差;根据银行机构每个指标的实际取值、该指标行业平均值和样本标准差,得到该指标的标准化评价值;根据每个指标的标准化评价值和对应的权重,逐级向上加权汇总,得到该银行数字化转型基于行业发展水平的相对成熟度指数。相对成熟度指数。相对成熟度指数。


技术研发人员:刘佳伟 景峰 杨国正 李益杰 肖郑进
受保护的技术使用者:易企银(杭州)科技有限公司
技术研发日:2022.10.12
技术公布日:2023/3/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1