一种财务报表质量预警方法与流程

文档序号:24160538发布日期:2021-03-05 16:13阅读:109来源:国知局
一种财务报表质量预警方法与流程

[0001]
本发明属于金融科技领域,包括信息分析、证券投资分析、企业信用分析、信用投资风险管理、信用风险预警,具体涉及到一种财务报表质量预警方法。


背景技术:

[0002]
现代企业制度所形成的两权分离,赋予上市公司管理层经营管理权,因此,上市公司管理层有义务及时、准确地向投资者等利益相关者提供能够真实地反映财务状况、经营业绩和现金流量的财务报表。这些财务报表是普通投资者获取公司信息的主要载体。在我国资本市场上,存在新股发行、再融资、维持上市资格等刚性监管指标,造假事件层出不穷手段多样,严重扰乱了资本市场的良性发展,对市场投资者带来巨大的损失。
[0003]
上市公司的年度报告,通常截至日期是第二年的四月底,且只能由专业人员解读和分析,判断是否存在财务造假的嫌疑。但由于资源的限制,往往不能在较短的时间内处理大量的财务报告,无法及时给出意见,影响投资决策。另外目前财务造假案例的缺乏,一般的识别模型无法训练得到正确的模型参赛,在命中率和准确率上无法平衡,严重影响了模型的表现。更重要的是,传统的识别模型是“黑箱”模型,得到的预测结果往往是单一指标/指数,但是财务造假问题并非简单的是与非问题,这种形式的预测结果难以提供有效的决策性信息,缺少有效的结论输出。
[0004]
有鉴于此,资本市场投资者需要能及时有效的识别目标公司的财务造假行为,并给出其判断依据。


技术实现要素:

[0005]
本发明的目的,是解决财务报表粉饰识别和风险预警中面临的问题,辅助财务报表使用者在财务基本面分析前,对财务报表质量进行预警,提高准确性;以历年财务报表为基础,通过多种技术手段,自我驱动构建财务报表造假识别的规则集,提高预警能力;时效性方面,在公司年度财报披露后及时给予财务质量预测;解释性方面,全面检查财务报表的可疑科目。
[0006]
本专利基于专家经验归纳财务指标,应用萤火虫仿生智能算法,自动挖掘财务指标之间的深层次关联,发现高维度的复杂规则集,不仅提供对财务报表质量的预测结果,更提供支持这一结论的可疑财务指标清单,整体逻辑清晰,较目前一般的技术或者模型解释性更强。
[0007]
本专利包括如下内容:
[0008]
一种财务报表质量预警方法,所述的财务报表质量预警方法包括如下步骤:
[0009]
步骤一、定义关键财务指标和选择训练样本集;
[0010]
步骤二、根据萤火虫算法,生成随机规则并更新随机规则,生成分类规则集;
[0011]
步骤三、针对需要评估的财务报表,运用规则集进行分类投票;根据生成的规则及规则对应的准确率,计算每个子规则库下各个规则集的综合准确率及对应子规则库的平均
准确率;
[0012]
步骤四、根据步骤三的初步投票结果,根据风险等级高低,依次为重点关注,中高关注,适当关注和无明显异常;结合外审意见,企业性质,财报数据完整性作为调整因子获得最终的分类结果和风险等级。
[0013]
优选地,所述的财务报表质量预警方法的财务报表包括资产负债表、利润表、现金流量表以及财务附注相关信息。
[0014]
优选地,所述的财务报表质量预警方法的步骤一中,包括如下过程;
[0015]
一、通过分析历史上监管机构关于对上市公司财务造假的行政处罚决定书,以及收集行业内专家学者关于财务造假的研究文献,归纳和整理与财务造假具有较强关联性的财务指标,作为识别财务是否造假的关键指标;
[0016]
二、将监管机构在过去10年即2010-2019年期间定性为财务造假的上市公司,确定为模型训练的财务造假样本集,并从媒体报道、专家分析和财报外审意见等其他维度对该样本集进行补充,同时,选择财务基本面良好,历史信用优质的公司组成正常样本集,使得造假样本集以及正常样本集的比例达到1∶1。
[0017]
优选地,所述的财务报表质量预警方法中所述的步骤二包括如下过程:
[0018]
一、计算财务指标,进行数据转换;
[0019]
二、编码规则,确定目标函数;
[0020]
三、定义正负样本,对不均衡样本进行处理;
[0021]
四、对正样本进行5折交叉验证,通过萤火虫引擎找到最优规则,标记该规则触发的样本,重复训练直到覆盖90%及以上的正样本,获得规则集;对负样本适用同样方法获得另一识别规则集。
[0022]
优选地,所述的财务报表质量预警方法的步骤二中,根据目标函数决定萤火虫发光的亮度的规则,确定判断财务是否造假的目标函数,采用敏感性与特异性的乘积作为目标函数。
[0023]
目标函数=灵敏度*特异度
[0024]
其中,
[0025][0026]
真阳性=造假公司被识别为造假
[0027]
真阴性=正常公司被识别为正常
[0028]
假阴性=造假公司被识别为正常
[0029]
假阳性=正常公司被识别为造假
[0030]
[0031]
其中,v1,v2∈[0,1],μ1∝
正样本个数,μ2∝
负样本个数。
[0032]
优选地,所述的财务报表质量预警方法步骤二的过程二中,针对同一个样本,共得到3个或者3个以上的规则库;所述的规则库内包括识别造假规则集与识别正常规则集。
[0033]
优选地,所述的财务报表质量预警方法中所述的萤火虫算法在迭代后期,需要对标准算法进行改进;采用基于可变步长的萤火虫算法(fssfa):α=ζ
t
[0034]
其中,ζ是可变步长的系数,取值范围是[0,1],t为当前迭代步数。
[0035]
优选地,所述的财务报表质量预警方法的所述的步骤三中,规则r的平均准确率定义如下:
[0036][0037]
其中n
tot
是包含项集x的例子的总数量,n
c
是类y
c
的例子中包含项集x的实例数量。
[0038]
子规则库s的综合准确率定义如下:
[0039][0040]
假设子规则库s规则集m中有m1条规则判别为y
c
,有m2条规则判别为y
d
,可得m1条规则的平均准确率和m2条规则的平均准确率,依次类推,可得子规则库的综合准确率,根据绝对大小判定类别。
[0041]
优选地,所述的财务报表质量预警方法的步骤四中,所述的外审意见,企业性质,财报数据完整性作为调整因子的评价规则为,对于外审意见:标准无保留外审意见不调整,带强调事项的无保留外审意见调整为至少中高关注,其他意见调整为重点关注;
[0042]
对于企业性质,中央国企风险等级下调2档,地方国企风险等级下调1档;
[0043]
对于财报数据完整性,财报关键指标可以计算的数量小于设定阈值个数,则风险等级至少为适当关注。
[0044]
本专利中涉及到基于规则的分类算法以及萤火虫优化算法,在这里做一个整体描述。一、基于规则的分类算法算法简介
[0045]
基于规则的分类算法是使用一组"if...then..."规则来对记录进行分类的技术。模型的规则用析取范式r=(r1∨r2∨..∨r
k
)表示,其中r称作规则集,r
i
是分类规则或析取项。每一个分类规则可以表示为如下形式:
[0046]
r
i
:(条件
i
)

y
i
举一个例子:
[0047]
rule:if age=youth and student=yes then buys_computer=yes规则中的

if

部分被称为规则前件或前提(rule antecedent or precondition)。规则前件,它是属性测试的合取:
[0048]
if r
i
=(a
1 op v1)∧(a
2 op v2)∧..∧(a
j op v
j
)
[0049]
其中(a
j
,v
j
)是属性-值对,op是运算比较比较符号,取自集合(=,≠,<,>,≤,≥)。每一个属性测试(a
j
,v
j
)称为一个合取项。规则中

then

部分称为规则的结论或后件(rule consequent),包含预测类y
i
。如果规则r的前件和记录x的属性匹配,则称r覆盖x。当r覆盖给定的记录时,称r被激发或触发。
[0050]
工作原理
[0051]
一般来说,相对很多黑箱模型,基于规则的分类器可以用来产生更易于解释的描
述性模型,而模型的表达能力几乎等价于决策树,因为决策树可以用互斥和穷举的规则集表示。基于规则分类器和决策树分类器都对属性空间进行直线划分,并将类指派到每个划分。然而,如果基于规则的分类器允许一条记录触发多条规则的话,就可以构造一个更加复杂的决策边界。
[0052]
为了建立基于规则的分类器,需要提取一组规则来识别数据集的属性和类标号之间的关键联系。一般来说,提取分类规则的方法有两大类:
[0053]
1.直接方法,直接从数据中提取分类规则;
[0054]
2.间接方法,从其他分类模型(如决策树和神经网络)中提取分类规则。
[0055]
间接方法使用分类规则为较复杂的分类模型提供简洁的描述,对于样本不会平衡的数据集,许多文献研究发现实际效果分类规则并不理想,这里,模型采用直接方法来提取规则,通过有限穷举的方法建立无序规则集,采用基于萤火虫优化算法构建规则分类器。
[0056]
关于萤火虫优化算法
[0057]
1、萤火虫算法的仿生思路
[0058]
萤火虫算法(firefly algorithm,fa)是基于萤火虫的闪光行为,它是一种用于全局优化问题的智能随机算法,由剑桥学者yang xin-she(2009)提出。
[0059]
萤火虫算法模拟了萤火虫的自然现象。真实的萤火虫自然地呈现出一种离散的闪烁模式,而萤火虫算法假设它们总是在发光。为了模拟萤火虫的这种闪烁行为,yang xin-she提出了了三条规则:
[0060]
1.萤火虫不分性别,它将会被其它更亮的萤火虫吸引过去;
[0061]
2.萤火虫的亮度决定其吸引力的大小,较亮的萤火虫吸引较暗的萤火虫。如果没有萤火虫比被考虑的萤火虫更亮,它就会随机移动;
[0062]
3.函数的最优值与萤火虫的亮度成正比。
[0063]
2、萤火虫算法描述
[0064]
萤火虫算法包含两个要素即亮度和吸引度。亮度体现了萤火虫所处位置的优劣并决定其移动方向,吸引度决定了萤火虫移动的距离,通过亮度和吸引度的不断更新,从而实现目标优化。光强(i)与光源距离(r)服从平方反比定律,因此由于空气的吸收,光的强度(i)随着与光源距离的增加而减小,这种现象将萤火虫的可见性限定在了非常有限的半径内:
[0065][0066]
在算法实现前,我们首先给出如下定义:
[0067]
定义一:相对荧光亮度
[0068][0069]
其中,i0为萤火虫的最大荧光亮度,即自身(r=0处)荧光亮度,与目标函数值有关,目标函数值越优自身亮度越高;γ为光强吸收系数,因为荧光亮度会随着距离的增加和传播媒介的吸收逐渐减弱,所以设置光强吸收系数以体现此特性;r
ij
为萤火虫i和j之间的空间距离。有时也采用单调递减函数,如下式所示:
[0070][0071]
定义二:吸引度
[0072][0073]
其中,β0为最大吸引度,即光源处的吸引度。
[0074]
定义三:种群位置更新
[0075][0076]
其中,x
i
,x
j
为萤火虫i和j所处的空间位置;α为步长因子,是[0,1]上的常数;rand为[0,1]上服从均匀分布的随机因子。
[0077]
3、萤火虫算法实现
[0078]
规则编码(rule encoding)
[0079]
若把萤火虫作为一条分类规则,对于每一个财务指标,我们采用3个数字进行编码。第一个数字表示财务指标的基准值(beachmark),第二个数字为[0,1]的随机数,表示运算符号(operation sign),当其大于0.5时为>,否则表示<,第三个数字为0或1的布尔值,表示是否包含该指标(existance)。
[0080][0081][0082]
上表即代表了一条规则,即
[0083]
if attribute_1<0.87 and attribute_3>0.54 then class_i
[0084]
目标函数(fitness function)
[0085]
目标函数决定了萤火虫发光的亮度。在判断财报造假上,可以选择敏感性(sensitivity)和特异性(specificity)之积作为目标函数。
具体实施方式
[0086]
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
[0087]
实施例:
[0088]
我们以预测某药业公司2019年年报是否造假为例,介绍如何通过萤火虫仿生智能算法,生成分类识别规则集,并输出预测结果和支持该预测结果的信息或依据的具体步骤。
[0089]
1、定义关键财务指标和训练样本集
[0090]
通过分析历史上监管机构关于对上市公司财务造假的行政处罚决定书,以及收集行业内专家学者关于财务造假的研究文献,归纳和整理与财务造假具有较强关联性的财务指标,作为识别财务是否造假的关键指标,如下表所示:
[0091][0092][0093]
未来随时间推移,暴露的造假案例将逐步增多,后期需要对关键财务指标进行调整以提高模型的预测准确性。根据该药业公司披露的2019年年报,其关键指标计算如下:
[0094]
[0095][0096]
我们把监管机构在过去10年即2010-2019年期间定性为财务造假的上市公司,确定为模型训练的财务造假样本集,并从媒体报道、专家分析和财报外审意见等其他维度对该样本集进行补充。同时,选择财务基本面良好,历史信用优质的公司组成正常样本集,使得造假样本集以及正常样本集的比例达到1:1。
[0097]
2、生成分类规则集
[0098]
下面以随机规则1作为说明对象,介绍如何生成随机规则并更新随机规则。初始随机规则中财务指标的组合及阈值大小和方向均通过编码手段作为随机确定,假设随机规则1描述如下:
[0099][0100]
依次类推,共生成60条不同的初始随机规则。将灵敏度和特异度之积作为目标函数,并约定灵敏度和特异度的的下限值,计算以上60条初始随机规则对应的目标函数的大小:
[0101][0102]
对于随机规则1,若存在其他随机规则的目标函数值大于该随机规则1,则基于比较的随机规则,对随机规则1进行更新,使其财务指标或者判断阈值等向比较的随机规则移
动,直至遍历所有随机规则,假设更新后的随机规则1描述如下:
[0103][0104]
依次更新剩余的59条随机规则,直到最终60条随机规则收敛成一条相似规则或者终止于约定的条件,选择目标函数值最高的一条随机规则,确定此次训练用作分类的最优规则,最终得到一条识别财务造假的规则并记录:
[0105][0106]
标记造假样本集中命中的样本,重复以上步骤,直至覆盖90%以上的样本,则训练结束,生成一个规则集。若对以上过程重复20次,定义20个规则集为一个子规则库,根据五折交叉验证,每个样本集可得5个子规则库。由于规则库对训练样本比较敏感,可以基于多个样本集确定多个规则库。经过多次训练,对于可识别财务造假的规则库,截取其中一个规则集,具体描述如下:
[0107][0108]
同样的,截取其中一个识别财务无明显异常的规则集描述如下:
[0109][0110]
3、运用规则集进行分类投票
[0111]
根据生成的规则及规则对应的准确率,计算每个子规则库下各个规则集的综合准确率及对应子规则库的平均准确率,如下表:
[0112]
[0113][0114]
观察得到,规则库1中5个子规则库中识别为财务造假的规则集的平均综合准确率均高于识别为财务无明显异常的规则集,且规则库2、规则库3亦如此,采用相对多数投票认为该药业公司2019年财报有较大概率造假。最后统计所有规则集中各个关键财务指标出现的频率,进行降序排列,并选择排名相对靠前的财务指标作为决策支持信息输出:
[0115][0116]
此外,需要说明的是,本说明书中所描述的具体实施例,其步骤的所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1