一种基于审计知识库的数据分析方法及系统的制作方法

文档序号:8943118阅读:644来源:国知局
一种基于审计知识库的数据分析方法及系统的制作方法
【技术领域】
[0001]本发明涉及审计数据分析领域,尤其涉及一种审计知识库的数据分析方法及系统。
【背景技术】
[0002]审计数据一般来讲,包括数据库数据和文本数据,其中数据库数据是经过筛选处理后的结构化数据,可以方便地对其进行加工利用。而在实际情况下,审计数据更多的是文本数据,如审计报告、审计意见、审计案例和法规制度等等都属于文本数据的范畴。相对结构化的数据库数据,这些非结构化的文本数据具有数量大、种类多、关联性强的特点。了解并运用这些文本数据将有助于预测审计项目的风险减少审计过程中所犯的错误。
[0003]现有的审计信息检索和分析技术对于海量的审计数据处理显得不尽人意,审计知识库的审计经验、数据价值的获取常常是通过组织专家进行人整理、提炼得到,或者通过开放平台由相关人员自主新增和修改相关规则。这样做容易造成审计知识库的组织结构混乱和不规范,拖慢检索分析的效率,对后续的管理和维护带来很大麻烦。另外,人工更新和管理审计知识库的成本高、周期长、各子库之间版本不同步的缺点同样很明显。
[0004]因此现有的审计数据分析系统和方法需要进一步改进和完善。

【发明内容】

[0005]本发明的目的在于提供一种基于审计知识库的数据分析方法及系统,旨在解决现有现有审计数据分析系统和方法存在的审计知识库架构混乱、检索分析效率低、更新周期长、管理和维护成本高的技术问题。
[0006]本发明所设计的技术方案如下:
[0007]—种基于审计知识库的数据分析方法,其中,包括如下步骤:
[0008]步骤S1:建立基于过往审计数据的数据池;
[0009]步骤S2:通过对数据池进行挖掘和分析,建立分类表;
[0010]步骤S3:依据分类表对新建的项目进行分类,确定项目类型;
[0011]步骤S4:设定知识库的关联规则;
[0012]步骤S5:知识库根据关联规则和项目类型对审计文本进行分析并生成反馈报告;
[0013]步骤S6:将新项目数据添加到数据池内,并自主修改知识库的关联规则。
[0014]所述的基于审计知识库的数据分析方法,其中,所述步骤S2包括如下步骤:
[0015]步骤S21:对数据池中的文本数据进行析取、转换和清洗操作;
[0016]步骤S22:将文本数据中的特征部分抽取出来,做统计分析,形成特征集;
[0017]步骤S23:从特征集中按权重高低选取部分特征来表示该文本数据;
[0018]步骤S24:根据选取的部分特征将该文本数据归类,形成分类表。
[0019]所述的基于审计知识库的数据分析方法,其中,所述步骤S3包括如下步骤:
[0020]步骤S31:新建项目文件;[0021 ] 步骤S32:抽取新建项目文件的文本数据特征;
[0022]步骤S33:根据步骤S22的特征集选取部分特征作为该文本数据的代表;
[0023]步骤S34:依据文本数据的特征确定该项目文件的类型。
[0024]所述的基于审计知识库的数据分析方法,其中,所述知识库包括风险问题库、法律法规库、企业制度库、审计案例库、审计人才库和项目类型库;所述步骤S4包括如下步骤:
[0025]步骤S41:设定风险问题库的规则;
[0026]步骤S42:设定法律法规库的规则;
[0027]步骤S43:设定企业制度库的规则;
[0028]步骤S44:设定审计案例库的规则;
[0029]步骤S45:设定审计人才库的规则;
[0030]步骤S46:设定项目类型库的规则;
[0031]步骤S47:设定风险问题库、法律法规库、企业制度库、审计案例库、审计人才库和项目类型库之间的关联规则。
[0032]所述的基于审计知识库的数据分析方法,其中,所述步骤S5包括如下步骤:
[0033]步骤S51:根据知识库的关联规则和项目类型对审计项目进行审前风险点预判;
[0034]步骤S52:生成审计方案;
[0035]步骤S53:生成审计问题报告;
[0036]步骤S54:生成审计评估报告;
[0037]—种基于审计知识库的数据分析系统,其中,包括数据采集模块、文本挖掘模块、知识分类模块、知识存储模块和业务生成模块;所述数据采集模块用于审计文本数据的采集和预处理;所述文本挖掘模块用于审计文本数据的特征挖掘和表示;所述知识分类模块用于审计文本数据特征的分析、整理和归类;所述知识存储模块用于存储各种审计特征、建立各个库之间的内部关联;所述业务生成模块用于审计项目的风险预判并生成反馈报告。
[0038]所述的基于审计知识库的数据分析系统,其中,所述业务生成模块包括关联查询模块、风险预判模块、审计方案生成模块和审计报告生成模块;所述关联查询模块用于审计文本数据特征的关联检索查询;所述风险预判模块用于审计项目实施前对可能出现的风险点进行预判分析;所述审计方案生成模块根据项目的分类和风险预判分析,生成相应的升级实施方案;所述审计报告生成模块用于审计项目实施后生成相应的审计问题报告和实施评估报告。
[0039]综上所述,本发明所提供的一种基于审计知识库的数据分析方法及系统,基于过往审计数据的基础上,通过系统地统计和分析;然后将非结构性数据(文本数据)通过数据清洗、转换、提取操作,把特征部分提炼出来,形成分类表,该分类表用于指导确立新审计项目的类型;接着根据审计知识库中的关联规则生成相应的审计报告,最后把处理完毕的审计项目的数据放入数据池供日后使用。因此本方案相比传统的审计数据处理具有数据架构逻辑清晰,检索分析效率高,自主修正缺陷,数据更新周期缩短,自主管理和维护节省人力成本的优点。旨在解决现有现有审计数据分析系统和方法存在的审计知识库架构混乱、检索分析效率低、更新周期长、管理和维护成本高的技术问题。
【附图说明】
[0040]图1是本发明所提供的数据分析方法的总体流程图一。
[0041]图2是本发明所提供的数据分析方法中步骤S2的处理流程图。
[0042]图3是本发明所提供的数据分析方法中步骤S3的处理流程图。
[0043]图4是本发明所提供的数据分析方法中步骤S4的处理流程图。
[0044]图5是本发明所提供的数据分析方法中步骤S5的处理流程图。
[0045]图6是本发明所提供的数据分析系统的总结构示意图。
[0046]图7是本发明所提供的业务生成模块的结构示意图。
[0047]图8是本发明所提供的数据分析方法的总体流程图二。
【具体实施方式】
[0048]为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明作进一步说明。
[0049]如图1和图8所示,本发明公开了一种基于审计知识库的数据分析方法,其中,包括如下步骤:
[0050]步骤S1:建立基于过往审计数据的数据池;
[0051 ] 步骤S2:通过对数据池进行挖掘和分析,建立分类表;
[0052]步骤S3:依据分类表对新建的项目进行分类,确定项目类型;
[0053]步骤S4:设定知识库的关联规则;
[0054]步骤S5:知识库根据关联规则和项目类型对审计文本进行分析并生成反馈报告;
[0055]步骤S6:将新项目数据添加到数据池内,并自主修改知识库的关联规则。
[0056]为了使本实施例所涉及的技术方案更加清楚、明确,现结合图1至图5对上述步骤展开描述,具体如下:
[0057]步骤S1:建立基于过往审计数据的数据池。
[0058]以前积累了大量的审计数据,这些数据中包含重要的审计知识和审计经验,具有重要的参考价值,因此步骤SI是建立在以前的审计数据的基础上对其进行挖掘利用。
[0059]步骤S2:通过对数据池进行挖掘和分析,建立分类表。
[0060]步骤S2的作用是将大量杂乱无章,逻辑不清的审计数据提取出来了,整理成分类表。其中如图2所示还包含如下步骤:
[0061]步骤S21:对数据池中的文本数据进行析取、转换和清洗操作。
[0062]由于数据池中的数据皆为文本数据,属于非结构化数据,在提取操作时要求对文中冗余信息进行清洗,提取出重要、简要的文字部分;对于需要格式转化的数据(如非标准形式的货币、日期和计量单位)则进行转换。
[0063]步骤S22:将文本数据中的特征部分抽取出来,做统计分析,形成特征集。
[0064]不同类型的文本数据有不同的特点,反映的审计问题也不尽相同,因此从每个文本数据中抽出一个或多个特征来代表该文本,有助于梳理庞大数据池的逻辑和文件结构,便于审计人员快速查找和分析问题。
[0065]步骤S23:从特征集中按权重高低选取部分特征来表示该文本数据。
[0066]由于文本数据的表示可能抽出多个不同的特征,为了选出最能代表该文本的一至三个特征,本实施例将按照权重的高低来排列这些特征,权重最高的前三位将作为该文本的代表;但是,审计人员认为结果需要调整时,也可以选取其他特征作为代表。所述权重高低可以理解为该特征在文中出现频率的高低,或者该特征在文中的地位及重要性的高低,或者该
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1