一种基于深度循环神经网络的审计意见预测方法及装置

文档序号:26009838发布日期:2021-07-23 21:29阅读:207来源:国知局
一种基于深度循环神经网络的审计意见预测方法及装置

本发明属于数据分析技术领域,具体涉及一种基于深度循环神经网络的审计意见预测的方法及装置



背景技术:

审计意见类型往往能向外界传递很多关于企业的有用信息,准确的审计意见披露能对企业过去的经营状况评价与对企业未来的发展预测给予重要支持。注册会计师所出具的审计意见很大程度上能够帮助利益相关者,包括投资人、债权人和监管方对上市企业经营状况做出正确评估。探究影响审计意见的相关因素以及构建一个能准确预测审计意见的模型对于优化市场的资源配置和维护证券市场的经济秩序稳定有很大的帮助。

目前,统计学习和机器学习已经逐渐成为企业审计意见预测的主流方法,如逻辑回归、遗传算法、神经网络、支持向量机等,这些方法可以在一定程度上对企业的审计意见进行预测,但预测准确率都不高,应用价值较低。



技术实现要素:

为解决上述问题,提供一种基于深度循环神经网络的审计意见预测方法以及装置,本发明采用了如下技术方案:

本发明提供了一种基于深度循环神经网络的审计意见预测方法,用于基于财务数据预测企业的审计意见,其特征在于,包括如下步骤:步骤s1,对收集到的财务数据进行预处理得到财务审计数据;步骤s2,对步骤s1中的财务审计数据进行标准化处理建立训练集以及测试集;步骤s3,建立深度循环神经网络模型作为审计意见预测模型,该审计意见预测模型包括双向长短期记忆网络;步骤s4,将训练集输入审计意见预测模型进行训练;步骤s5,将测试集输入训练完成的审计意见预测模型,预测审计意见。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,审计意见预测模型中包括多个堆叠的双向长短期记忆网络。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,审计意见预测模型还包括dropout层。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,步骤s1包括如下步骤:步骤s1-1,对收集到的财务数据分析审计的影响因素得到原始财务审计数据;步骤s1-2,对原始财务审计数据进行数据清洗得到财务审计数据。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,步骤s1-2中,数据清洗包括平均值填补以及中位数填补。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,步骤s1-1中,对收集到的财务数据从财务指标、非财务指标、市场环境以及市场相对价值的方向分析审计的影响因素。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,步骤s2中,对财务审计数据采用z-score标准化方法以及smote过采样方法进行标准化处理。

本发明提供的基于深度循环神经网络的审计意见预测方法,还可以具有这样的特征,其中,步骤s5中,采用梯度下降法调整权重参数以及偏置参数减小误差。

本发明提供了一种基于深度循环神经网络的审计意见预测装置,用于基于财务数据预测企业的审计意见,其特征在于,包括:预处理部,用于将收集到的企业的财务数据基于预定分析方向分析审计的影响因素并进行数据清洗得到财务审计数据;以及审计意见预测部,用于基于财务审计数据进行审计意见的预测,其中,审计意见预测部包括审计意见预测模型,该审计意见预测模型包括双向长短期记忆网络。

发明作用与效果

根据本发明的一种基于深度循环神经网络的审计意见预测方法以及装置,用于基于财务数据预测企业的审计意见,该方法采用了包括有双向长短期记忆网络的审计意见预测模型,并将财务审计数据输入该模型中,进行训练以及预测。本发明的审计意见预测方法可以能够实现对审计意见的准确预测,可以帮助管理者及时识别企业的经营风险。进一步,本发明实施例的审计意见预测模型中的双向长短期记忆网络不仅解决了普通循环神经网络的梯度消失与梯度爆炸的问题,实现对时序数据的准确预测,还可以从前后两个方向考虑数据的历史信息,提高了特征学习和预测的能力。该审计意见预测模型可以对审计和财务数据进行有效地特征提取,具有较高的泛化能力,相较于现有技术中的审计意见预测方法,有着更高的精确度。

附图说明

图1是本发明实施例的基于深度循环神经网络的审计意见预测方法的流程图;

图2是本发明实施例的审计意见预测模型的模型结构图;

图3是本发明实施例的长短期记忆网络的单元结构图。

具体实施方式

以下结合附图以及实施例来说明本发明的具体实施方式。

<实施例>

本实施例提供一种基于深度循环神经网络的审计意见预测方法以及装置,用于基于财务数据预测企业的审计意见。

本实施例的实验环境为:使用gpu的是nvidiartx1050ti(4g内存)、cuda10.2.89和cudnn7.6.5.32、基于python开源工具箱keras。

本实施例以预测电网公司的审计意见为例。

本实施例的审计意见预测装置包括预处理部以及审计意见预测部。

预处理部用于将收集到的企业的财务数据基于预定分析方向分析审计的影响因素并进行数据清洗得到财务审计数据。

审计意见预测部用于基于财务审计数据进行审计意见的预测。

审计意见预测装置的工作流程即为本实施例的基于深度循环神经网络的审计意见预测方法。

图1是本发明实施例的基于深度循环神经网络的审计意见预测方法的流程图。

以下结合图1对本实施例的基于深度循环神经网络的审计意见预测方法的流程进行说明。

步骤s1,收集电网公司的相关财务数据,对收集到的财务数据进行预处理得到财务审计数据。

步骤s1包括以下子步骤:

步骤s1-1,对收集到的财务数据分析审计的影响因素得到原始财务审计数据;

步骤s1-2,对步骤s1-1中得到的原始财务审计数据进行数据清洗得到财务审计数据。

本实施例中,步骤s1-1中,对财务数据从财务指标、非财务指标、市场环境以及市场相对价值四个方向进行审计的影响因素分析。

具体地,企业财务指标包括经营能力、偿债能力、盈利能力、发展能力以及现金流分析。其中,经营能力包括应收账款周转率、存活周转率以及流动资产与收入比等变量值;偿债能力包括流动比率、速动比率以及权益对负债比率等变量值;盈利能力包括资产报酬率、总资产利润率以及流动资产净利润率等变量值;发展能力包括总资产增长率、营业收入增长率以及每股净资产增长率等变量值;现金流分析包括公司现金流等变量值。

上市企业非财务指标包括独立懂事比例、股权集中度等指标。

市场环境指标包括注册会计师相关指标以及预期使用者相关指标。注册会计师相关指标包括事务所规模以及上一年度审计意见等;预期使用者相关指标包括被分析师关注度等。

市场相对价值指标包括托宾q值以及账面市值比等。

本实施例中,步骤s1-2中,对步骤s1-1中得到的各个影响审计意见的变量值,即原始财务审计数据进行数据清洗,即针对数据中的缺失值、重复值以及异常值等,采用平均值填补、中位数填补等方法进行数据清洗得到财务审计数据。

审计意见预测模型的预处理部的工作流程即步骤s1。

步骤s2,对步骤s1得到的财务审计数据进行标准化处理建立训练集以及测试集。

本实施例中,对财务审计数据采用z-score标准化方法以及smote过采样方法进行标准化处理,其中,smote过采样技术解决样本不均衡的问题。

步骤s3,建立深度循环神经网络模型作为审计意见预测模型,该审计意见预测模型采用双向长短期记忆网络(bilstm)。

图2是本发明实施例的审计意见预测模型的模型结构图。

如图2所示,审计意见预测模型包括三个双向长短期记忆网络(bilstm)、三个dropout层、两个全连接层以及softmax分类器。

其中,三个dropout层分别设置在三个bilstm之后。

步骤s4,将训练集输入步骤s3建立的审计意见预测模型中进行训练。

具体地,双向长短期记忆网络(bilstm)使用了三个“门”结构来控制不同时刻的状态,包括“输入门”、“输出门”以及“遗忘门”,克服了梯度消失和梯度爆炸的问题。

图3是本发明实施例的长短期记忆网络的单元结构图。

如图3所示,具体审计意见预测模型建立以及训练过程为:

步骤t1,长短期记忆网络(lstm)通过遗忘门有选择性地从记忆单元中丢弃部分信息,计算如下:

ft=σ(wf·[ht-1,xt]+bf)(1)

其中,ht-1表示的上一个单元的输出,xt表示的是当前时刻的输入,σ表示的是sigmoid函数,wf和bf分别表示遗忘门的权重与偏差,ft为遗忘门的输出。

步骤t2,输入门决定加入新的信息到记忆单元中,这个过程包括两个步骤:

步骤t2-1,输入层中的sigmoid层决定需要更新的信息it;

步骤t2-2,利用tanh层生成备选的信息

步骤t2-1以及步骤t2-2的具体计算如下:

it=σ(wt·[ht-1,xt]+bi)(2)

步骤t3,记忆单元更新记忆信息,计算如下:

其中,ct和ct-1分别表示当前时刻和前一时刻的记忆信息。

步骤t4,输出门通过上述步骤的计算结果来确定最终的输出值。首先使用一个sigmoid层来确定记忆单元要输出的信息,然后使用tanh层计算得到最终的结果,计算如下:

ot=σ(wo·[ht-1,xt]+bo)(5)

ht=ot*tanh(ct)(6)

其中,ot和ht分别表示输出门的输出和lstm的输出。

步骤t5,bilstm对lstm进行了一定的改进,bilstm从正反两个方向考虑输入的历史信息,它的输出为:

其中,分别代表bilstm前后两个方向的输出,w为对应的权重,yt是bilstm层的输出结果。

步骤t6,bilstm层后使用dropout层随机“删除”网络中的隐藏神经元,减少神经元之间的相互协同关系,增加网络的鲁棒性,计算如下:

d=f(w·d(x))(9)

其中,p为dropout率,mask为1-p为概率的贝努利分布生成的二值向量。

步骤t7,全连接层输出预测结果,计算如下:

y=σ(wsx+bs)(11)

y表示预测结果。

y=0或1或2或3,分别代表审计意见中的标准无保留意见、带强调事项或其他事项的无保留意见、保留意见以及无法表示意见。

在网络的最后使用分类器实现对输入数据的分类。

本实施例中,使用梯度下降法调整权重参数和偏置参数来最小化输出值和真实值之间的误差。

步骤s5,将测试集输入训练完成的审计意见预测模型,预测审计意见得到审计意见预测结果。

本实施例的基于深度循环神经网络的审计意见预测方法得到的结果与其他方法得到的结果对比如表1所示:

表1各个方法得到的审计意见结果对比

表1中,macc为平均准确率,mfl为f1指标的均值,f1是分类任务的常用指标,它的计算方法如下:

pr=tp/(tp+fp)

re=tp/(tp+fn)

f1=(2pr*re)/(pr+re)

其中,pr和re分别表示精度和召回率,tp表示真阳性:预测为正,实际也为正;fp表示假阳性:预测为正,实际为负;fn表示假阴性:预测与负、实际为正;tn表示真阴性:预测为负、实际也为负,即mf1能够表示方法结果的精度以及召回率。

lr代表传统计算方法的逻辑回归(logisticregression,lr)方法,svm是机器学习中表现较好的支持向量机(supportvectormachine,svm)模型,bp是具有高度自适应性和自学习能力的bp(backpropagation)神经网络模型,bilstm为双向长短期记忆网络(即本实施例的审计意见预测模型)。

由表1的结果可以得到,各个模型方法得到的审计意见的结果中,本实施例的采用bilstm的审计意见预测模型的平均准确率(macc)以及平均f1指标(mf1)均接近100%,且在四种模型中均为最高值,表示本实施例的审计意见预测方法100具有很高的准确率、精度以及召回率,且相较于现有技术中的方法得到结果有着较大的提升,具有较高的应用价值。

审计意见预测模型的审计意见预测部的工作流程即为步骤s2~步骤s5。

实施例作用与效果

本实施例提供一种基于深度循环神经网络的审计意见预测方法及装置,用于基于财务数据预测企业的审计意见,该方法采用了包括有双向长短期记忆网络的审计意见预测模型,并将财务审计数据输入该模型中,进行训练以及预测。本实施例的审计意见预测方法可以能够实现对审计意见的准确预测,可以帮助管理者及时识别企业的经营风险。进一步,本实施例的审计意见预测模型中的双向长短期记忆网络不仅解决了普通循环神经网络的梯度消失与梯度爆炸的问题,实现对时序数据的准确预测,还可以从前后两个方向考虑数据的历史信息,提高了特征学习和预测的能力。该审计意见预测模型可以对审计和财务数据进行有效地特征提取,具有较高的泛化能力,相较于现有技术中的审计意见预测方法,有着更高的精确度。

进一步,本实施例提供的基于深度循环神经网络的审计意见预测方法的审计意见预测模型中,在双向长短期记忆网络中使用了dropout正则化技术,使得模型在训练过程中按照一定概率随机切断输入神经元,可以防止过拟合且降低了网络参数更新的复杂度,这加快了网络的训练速度并提高了模型的预测准确率。

进一步,本实施例提供的基于深度循环神经网络的审计意见预测方法中,对收集到的财务数据先进行分析审计的影响因素,再通过平均值填补以及中位数填补等方法进行数据清洗得到财务审计数据,使得模型的输入数据更为有效以及精确,进一步提升了本实施例的审计意见预测方法的准确度。

进一步,本实施例提供的基于深度循环神经网络的审计意见预测方法中,还对财务审计数据进行了标准化以及smote过采样技术,解决了样本不均衡的问题。

进一步,本实施例提供的基于深度循环神经网络的审计意见预测方法中,还使用了梯度下降法调整权重参数和偏置参数来最小化输出值和真实值之间的误差。

上述实施例仅用于举例说明本发明的具体实施方式,而本发明不限于上述实施例的描述范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1