基于卷积神经网络模型的审计方法、系统和可读存储介质与流程

文档序号:19350531发布日期:2019-12-06 21:20阅读:179来源:国知局
基于卷积神经网络模型的审计方法、系统和可读存储介质与流程

本发明涉及人工智能和数据处理技术领域,尤其涉及一种基于卷积神经网络模型的审计方法、系统和可读存储介质。



背景技术:

近年来,随着计算机技术和信息化建设的飞速发展,经济管理活动的信息化广度和深度也与时俱进,作为经济活动监督、评价和鉴证的审计,遇到了前所未有的挑战,传统的手工审计已无法适应信息化条件下的审计需求,审计对象的信息化和审计自身的发展都要求审计作业方式必须与时俱进,做出相应的调整。因此,顺应信息化发展趋势,更新审计监督理念,创新审计方法迫在眉睫。

模拟人类实际神经网络的数学方法问世以来,人们已慢慢习惯了把这种人工神经网络直接称为神经网络。神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景,特别在智能控制中,人们对神经网络的自学习功能尤其感兴趣,并且把神经网络这一重要特点看作是解决自动控制中控制器适应能力这个难题的关键钥匙之一。如何利用神经网络提供一种审计方法,以替代传统的手工审计,从而改善审计方式、提高审计效率,是当前需要解决的问题。



技术实现要素:

为了解决上述至少一个技术问题,本发明提出了一种基于卷积神经网络模型的审计方法、系统和可读存储介质。

为了实现上述目的,本发明第一方面提出了一种基于卷积神经网络模型的审计方法,所述方法包括:获取审计对象的至少一项业务的业务数据;

将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值。

进一步地,所述方法还包括:生成所述预设的风险预测模型;包括:

获取所述审计对象的各项业务的历史业务数据和风险信息;所述风险信息包括:风险值和/或造成风险的异常值;

利用所述历史业务数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

进一步地,所述历史业务数据,包括:非结构化数据集;所述非结构化数据集包括:至少一个非结构化数据;

所述获取审计对象的至少一项业务的业务数据之后,所述方法还包括:

根据所述非结构化数据集中每个非结构数据的上下文信息,构建所述非结构化数据集中每个非结构数据之间的层级结构;

提取与每个层级对应的非结构化数据以生成节点,构建与所述非结构化数据集对应的树形数据集;

根据所述非结构化数据的上下文信息,对所述非结构化数据进行数据挖掘,提取非结构化数据对应的目标数据,并确定所述非机构化数据与其他非结构化数据之间的关联关系;

相应的,所述将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,包括:

利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型;所述目标数据携带有其对应的非结构化数据与其他非结构化数据之间的关联关系。

进一步地,所述获取所述审计对象的各项业务的历史业务数据和风险信息之后,所述方法还包括:

对所述历史业务数据和风险值进行数据清洗、业务梳理和数据修正,具体包括以下至少一种:

对所述历史业务数据中重复记录的内容进行排查处理,并对重复内容进行删除处理;

对所述历史业务数据中的异常数值进行检查,对数值漏写、笔误进行修正。

进一步地,所述利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型,包括:

将所述至少一项业务对应的所述所述目标数据和风险信息,分别输入卷积神经网络模型的一个输入通道;结合卷积层、特征融合层和输出层,对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

进一步地,所述风险预测模型,包括:n个输入通道的输入层、m第一巻积层、特征融合层以及输出层;所述n和m大于等于1;

所述输入通道的数量大于等于业务项数;所述输入层,用于接收所述风险预测模型的输入数据;所述输入数据,包括:所述至少一项业务对应的所述所述目标数据和风险信息;

所述巻积层,用于对所述输入数据的数据特征逐层进行卷积计算,输出特征数据;

所述特征融合层,用于对所述特征数据进行特征融合;

所述输出层,用于对特征融合后的数据特征进行数据分类或回归,并输出审计结果;

所述风险网络模型的训练采用以下损失函数:

其中,li表示第i个样本的损失值,xi∈rd表示第i个样本在风险网络模型的巻积层的输出值,yi表示第i个样本的标签,wj表示卷积层与融合层之间的权重的第j列,b表示偏置项,n表示总样本的类别数,λ表示权重系数,m表示决策边缘。

本发明第二方面还提出一种基于卷积神经网络模型的审计系统,所述审基于卷积神经网络模型的审计系统包括:存储器及处理器,所述存储器中包括一种审计方法程序,所述审计方法程序被所述处理器执行时实现如下步骤:

获取审计对象的至少一项业务的业务数据;

将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值。

进一步地,所述基于卷积神经网络模型的审计方法程序被所述处理器执行时,还包括:生成所述预设的风险预测模型;包括:

获取所述审计对象的各项业务的历史业务数据和风险信息;所述风险信息包括:风险值和/或造成风险的异常值;

利用所述历史业务数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

进一步地,所述历史业务数据,包括:非结构化数据集;所述非结构化数据集包括:至少一个非结构化数据;

所述获取审计对象的至少一项业务的业务数据之后,所述方法还包括:

根据所述非结构化数据集中每个非结构数据的上下文信息,构建所述非结构化数据集中每个非结构数据之间的层级结构;

提取与每个层级对应的非结构化数据以生成节点,构建与所述非结构化数据集对应的树形数据集;

根据所述非结构化数据的上下文信息,对所述非结构化数据进行数据挖掘,提取非结构化数据对应的目标数据,并确定所述非机构化数据与其他非结构化数据之间的关联关系;

相应的,所述将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,包括:

利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型;所述目标数据携带有其对应的非结构化数据与其他非结构化数据之间的关联关系。

进一步地,所述获取所述审计对象的各项业务的历史业务数据和风险信息之后,所述方法还包括:

对所述历史业务数据和风险值进行数据清洗、业务梳理和数据修正,具体包括以下至少一种:

对所述历史业务数据中重复记录的内容进行排查处理,并对重复内容进行删除处理;

对所述历史业务数据中的异常数值进行检查,对数值漏写、笔误进行修正。

本发明第三方面还提出一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于卷积神经网络模型的审计方法程序,所述基于卷积神经网络模型的审计方法程序被处理器执行时,实现如以上任一项所述的一种基于卷积神经网络模型的审计方法的步骤。

本发明实施例提供了一种基于卷积神经网络模型的审计方法、系统和存储介质,获取审计对象的至少一项业务的业务数据;将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值。结合当前热门的神经网络,设计一种审计系统,以替代人工审计,节约人力成本,提高审计效率。

本发明的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

图1为本发明实施例提供的一种基于卷积神经网络模型的审计方法的流程示意图;

图2为本发明实施例提供的一种基于卷积神经网络模型的审计系统的结构示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

图1为本发明实施例提供的一种基于卷积神经网络模型的审计方法的流程示意图;如图1所示,所述方法可以应用于加载由审计系统的服务器、计算机等智能电子设备;所述方法包括:

步骤101、获取审计对象的至少一项业务的业务数据;

步骤102、将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值。

本实施例中,所述方法还包括:生成所述预设的风险预测模型;包括:

获取所述审计对象的各项业务的历史业务数据和风险信息;所述风险信息包括:风险值和/或造成风险的异常值;

利用所述历史业务数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

这里,所述获取审计对象的至少一项业务的业务数据;包括以下至少一种:

向至少一个审计对象对应的至少一个数据库发送数据采集指令,接收至少一个数据库发送的至少一项业务的业务数据;

向至少一个审计对象对应的至少一个数据库发送访问指令,接收至少一个数据库发送的同意消息后,运用webservice、http服务方法访问所述至少一个数据库以获取所述至少一项业务的业务数据;

向中心数据库发送数据采集指令,接收所述中心数据库发送的所述至少一项业务的业务数据;其中,所述中心数据库,用以周期性从所述至少一个审计对象对应的至少一个数据库获取所述至少一项业务的业务数据;

向所述中心数据库发送访问指令,接收中心数据库发送的同意消息后,运用webservice、http服务方法访问所述中心数据库以获取所述至少一项业务的业务数据。

需要说明的是,每个审计对象可能拥有多个数据库来保存业务数据,因此,这里可以对多个数据库分别发送采集指令,获得业务数据。同一审计对象的数据库可以对应同一身份标识,从而服务器根据身份标识可以确定哪些数据库是对应哪一审计对象。

本实施例中,所述历史业务数据,可以包括:结构化数据集和非结构化数据集;所述结构化数据集,包括至少一个结构化数据;所述非结构化数据集包括:至少一个非结构化数据。

这里,所述结构化数据指严格按照某一标准保存的数据,其逻辑关系清晰、数据结构规则、数据表达完整。而所述非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、xml,html、各类报表、图像和音频/视频信息等,因此这里需要对非结构化数据进行数据提取,以获得可以进行审计的业务数据。

具体来说,所述获取审计对象的至少一项业务的业务数据之后,所述方法还包括:

根据所述非结构化数据集中每个非结构数据的上下文信息,构建所述非结构化数据集中每个非结构数据之间的层级结构;

提取与每个层级对应的非结构化数据以生成节点,构建与所述非结构化数据集对应的树形数据集;

根据所述非结构化数据的上下文信息,对所述非结构化数据进行数据挖掘,提取非结构化数据对应的目标数据,并确定所述非机构化数据与其他非结构化数据之间的关联关系。

这里,提取的非结构化数据对应的目标数据,可以是与所述结构化数据的保存方式相同。

相应的,所述将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,包括:

利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型;所述目标数据携带有其对应的非结构化数据与其他非结构化数据之间的关联关系。

需要说明的是,所述业务,包括:财务域业务和跨业务域;不同业务对应的业务数据可不同,例如:财务域业务数据,可以包括:日常费用报销、差旅费报销、工程付款、电费支付、薪酬支付等业务数据;跨业务域数据,可以包括:工程项目、工程合同、物资合同、工程概预算、物资出入库单、项目结算报告、营销财务对账、电费应收实收。

这里是考虑到某些业务之间存在相互关系,则业务数据之间也存在一定关联,考虑到这些关联可能导致的数据差异,这里将数据之间的关联关系也一并确认,并作为检测依据之一。

本实施例中,所述获取所述审计对象的各项业务的历史业务数据和风险信息之后,所述方法还包括:

对所述历史业务数据和风险值进行数据清洗、业务梳理和数据修正,具体包括以下至少一种:

对所述历史业务数据中重复记录的内容进行排查处理,并对重复内容进行删除处理;

对所述历史业务数据中的异常数值进行检查,对数值漏写、笔误进行修正。

本实施例中,其中,所述利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型,包括:

将所述至少一项业务对应的所述所述目标数据和风险信息,分别输入卷积神经网络模型的一个输入通道;结合卷积层、特征融合层和输出层,对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

具体来说,所述风险预测模型,包括:n个输入通道的输入层、m第一巻积层、特征融合层以及输出层;所述n和m大于等于1;

所述输入通道的数量大于等于业务项数;所述输入层,用于接收所述风险预测模型的输入数据;所述输入数据,包括:所述至少一项业务对应的所述所述目标数据和风险信息;

所述巻积层,用于对所述输入数据的数据特征逐层进行卷积计算,输出特征数据;

所述特征融合层,用于对所述特征数据进行特征融合;

所述输出层,用于对特征融合后的数据特征进行数据分类或回归,并输出审计结果;

所述风险网络模型的训练采用以下损失函数:

其中,li表示第i个样本(即目标数据)的损失值,xi∈rd表示第i个样本在风险网络模型的巻积层的输出值,yi表示第i个样本的标签(即对应的风险信息),wj表示卷积层与融合层之间的权重的第j列,b表示偏置项,n表示总样本的类别数,λ表示权重系数,m表示决策边缘。

本实施例中,所述将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值,包括:

确定所述业务数据中包括的非结构化数据集,根据其包括的非结构化数据集中每个非结构数据的上下文信息,构建所述非结构化数据集中每个非结构数据之间的层级结构;提取与每个层级对应的非结构化数据以生成节点,构建与所述非结构化数据集对应的树形数据集;根据所述非结构化数据的上下文信息,对所述非结构化数据进行数据挖掘,提取非结构化数据对应的目标数据,并确定所述非机构化数据与其他非结构化数据之间的关联关系;

将所述非结构化数据对应的目标数据输入所述预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值。

这里,将所述非结构化数据对应的目标数据输入所述预设的风险预测模型之前,所述方法还可以包括:

对所述目标数据进行数据清洗、业务梳理和数据修正;具体可以采用与上述历史业务数据进行进行数据清洗、业务梳理和数据修正相同的方法,这里不再赘述。

图2为本发明实施例提供的一种基于卷积神经网络模型的审计系统的框图。如图2所示,本发明第二方面还提出一种基于卷积神经网络模型的审计系统2,所述基于卷积神经网络模型的审计系统2包括:存储器21及处理器22,所述存储器21中包括一种基于卷积神经网络模型的审计方法程序,所述基于卷积神经网络模型的审计方法程序被所述处理器22执行时实现如下步骤:

获取审计对象的至少一项业务的业务数据;

将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,获取所述各项业务的风险值以及造成风险的异常值。

需要说明的是,本发明的系统可以在服务器、pc、手机、pad等终端设备中进行操作。

需要说明的是,所述处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

进一步的,所述方法还包括:生成所述预设的风险预测模型;包括:

获取所述审计对象的各项业务的历史业务数据和风险信息;所述风险信息包括:风险值和/或造成风险的异常值;

利用所述历史业务数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

进一步的,所述历史业务数据,包括:非结构化数据集;所述非结构化数据集包括:至少一个非结构化数据;

所述获取审计对象的至少一项业务的业务数据之后,所述方法还包括:

根据所述非结构化数据集中每个非结构数据的上下文信息,构建所述非结构化数据集中每个非结构数据之间的层级结构;

提取与每个层级对应的非结构化数据以生成节点,构建与所述非结构化数据集对应的树形数据集;

根据所述非结构化数据的上下文信息,对所述非结构化数据进行数据挖掘,提取非结构化数据对应的目标数据,并确定所述非机构化数据与其他非结构化数据之间的关联关系;

相应的,所述将所述至少一项业务中各项业务的业务数据输入至预设的风险预测模型,包括:

利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型;所述目标数据携带有其对应的非结构化数据与其他非结构化数据之间的关联关系。

进一步的,所述获取所述审计对象的各项业务的历史业务数据和风险信息之后,所述方法还包括:

对所述历史业务数据和风险值进行数据清洗、业务梳理和数据修正,具体包括以下至少一种:

对所述历史业务数据中重复记录的内容进行排查处理,并对重复内容进行删除处理;

对所述历史业务数据中的异常数值进行检查,对数值漏写、笔误进行修正。

进一步的,所述利用所述非结构化数据对应的目标数据和风险信息对预设的卷积神经网络模型进行修正,获得预设的风险预测模型,包括:

将所述至少一项业务对应的所述所述目标数据和风险信息,分别输入卷积神经网络模型的一个输入通道;结合卷积层、特征融合层和输出层,对预设的卷积神经网络模型进行修正,获得预设的风险预测模型。

进一步地,所述风险预测模型,包括:n个输入通道的输入层、m第一巻积层、特征融合层以及输出层;所述n和m大于等于1;

所述输入通道的数量大于等于业务项数;所述输入层,用于接收所述风险预测模型的输入数据;所述输入数据,包括:所述至少一项业务对应的所述所述目标数据和风险信息;

所述巻积层,用于对所述输入数据的数据特征逐层进行卷积计算,输出特征数据;

所述特征融合层,用于对所述特征数据进行特征融合;

所述输出层,用于对特征融合后的数据特征进行数据分类或回归,并输出审计结果;

所述风险网络模型的训练采用以下损失函数:

其中,li表示第i个样本的损失值,xi∈rd表示第i个样本在风险网络模型的巻积层的输出值,yi表示第i个样本的标签,wj表示卷积层与融合层之间的权重的第j列,b表示偏置项,n表示总样本的类别数,λ表示权重系数,m表示决策边缘。

本发明第三方面还提出一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于卷积神经网络模型的审计方法程序,所述基于卷积神经网络模型的审计方法程序被处理器执行时,实现如上述的一种基于卷积神经网络模型的审计方法的步骤。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1