一种基于文本挖掘分析技术的审计稽核方法与系统与流程

文档序号:15492492发布日期:2018-09-21 20:54阅读:887来源:国知局

本发明涉及审计数据挖掘领域,具体而言,是一种基于文本挖掘技术的审计稽核方法及系统。



背景技术:

随着大数据时代的来临,审计作为一个综合的经济监督部门也必将面临其带来的巨大挑战,在企业系统中产生了海量的非结构化数据,仅靠人工进行审计,成效杯水车薪,针对非结构化数据的审计已经成为审计业务的盲区,利用高科技手段与工具实现非结构化数据的分析与挖掘为审计业务提供数据支撑的需求已迫在眉睫。

文本挖掘用于从非结构化文本信息中获取用户感兴趣或者有用的信息,文本挖掘涵盖多种技术,包括信息抽取、信息检索、自然语言处理和数据挖掘技术,它的主要用途是从原本未经使用的文本中提取出未知的知识。

现有的审计一般都是人工提取数据,容易出现数据疏漏的问题,而且当前在审计领域对非结构化数据还未形成自动化的稽核系统。



技术实现要素:

本发明解决的技术问题是:目前审计领域还没有形成自动化的稽核系统。

本发明解决其技术问题的解决方案是:一方面,一种基于文本挖掘分析技术的审计稽核方法,包括步骤:

s1、从企业合同管理系统中提取企业合同数据,并提取合同关键信息,进行结构化存储;

s2、将提取的合同关键信息与资金流数据进行稽核。

进一步,所述企业合同数据包括合同文件,所述合同文件的文档格式为pdf、doc、docx任一种。

进一步,所述合同关键信息包括:合同付款信息、合同总价、第一次付款时间、第一次付款金额、第二次付款时间、第二次付款金额。

进一步,包括:在步骤s1中:

s11、采用文档读取技术读取合同文件;

s12、制定合同关键信息提取规则库,并利用所述规则库通过文本提取技术提取所述合同关键信息;

s13、建立数据表,将步骤s12提取的合同关键信息存储于数据表中。

进一步,包括:在步骤s2中:

s21、从财务系统提取资金流数据;

s22、将所述资金流数据与步骤s12提取的合同关键信息根据预制定的审计规则进行匹配;

s23、将匹配不合格的合同关键信息进行分组。

另一方面,提供一种基于文本挖掘分析技术的审计稽核系统,包括:数据采集模块、合同关键信息抽取模块、审计稽核模块,所述数据采集模块用于提取企业合同数据;所述合同关键信息抽取模块用于从所述企业合同数据中提取合同关键信息;所述审计稽核模块用于将所述合同关键信息与资金流数据通过预制定的审计规则进行匹配。

进一步,本系统还包括前端展示模块,所述前端展示模块包括:用于展示所述数据采集模块提取的企业合同数据、用于展示所述合同关键信息抽取模块从所述企业合同数据提取的合同关键信息。

本发明的有益效果是:一方面,本发明所提供的审计稽核方法,是通过文本挖掘技术,自动从企业合同中提取合同关键信息,形成结构化数据,与财务系统中银行返回的资金流数据进行比对,通过制定审计问题规则,发现审计问题并分组,实现对审计问题归类,以便对同类问题进行集中审计。与以往的企业合同审计数据方法相比,本发明有以下优点:一、自动提取企业合同中的合同关键信息,与以往的人工提取相比,节省了很大的人财力成本;二、将合同数据与银行返回的资金流数据进行自动稽核,可以发现任何不匹配的问题,避免因人为疏忽漏掉一些问题。

另一方面,本发明还提供执行该方法的系统。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单说明。显然,所描述的附图只是本发明的一部分实施例,而不是全部实施例,本领域的技术人员在不付出创造性劳动的前提下,还可以根据这些附图获得其他设计方案和附图。

图1是本发明审计稽核方法的步骤流程图;

图2是本发明审计稽核系统的系统框图。

具体实施方式

以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。另外,文中所提到的所有联接/连接关系,并非单指构件直接相接,而是指可根据具体实施情况,通过添加或减少联接辅件,来组成更优的联接结构。本发明创造中的各个技术特征,在不互相矛盾冲突的前提下可以交互组合。

实施例1,本发明公开了一种基于文本挖掘技术的审计稽核方法,其中,包括如下步骤:

s1、从企业合同管理系统中提取企业合同数据,并提取合同关键信息,进行结构化存储;其中,所述企业合同数据包括合同文件,所述合同文件的文档格式为pdf、doc、docx任一种;所述合同关键信息包括:合同付款信息,如合同总价、第一次付款时间、第一次付款金额,第二次付款时间、第二次付款金额。

s2、将提取的合同关键信息与资金流数据进行稽核;

结合图1,详细说明上述步骤的具体实施过程,内容如下:

s11、采用文档读取技术读取合同文件;

s12、针对合同关键信息制定规则库,并利用所述规则库通过文本提取技术提取所述合同关键信息;

s13、在数据库中建立数据表,将步骤s12提取的合同关键信息存储于数据表中;

步骤s13通过建立数据表实现非结构化信息的结构化存储。

s21、从财务系统提取资金流数据;

步骤s21中,资金流数据为从银行返回的财务系统数据,包括:付款时间、付款金额、付款单位。

s22、将所述资金流数据与步骤s12提取的合同关键信息根据预制定的审计规则进行匹配;

例如:通过资金流数据抓取付款时间c1、付款金额c2,通过文本技术抓取b公司合同中的付款时间数据d1、付款金额数据d2,根据审计规则,对比付款时间c1和d1,付款金额c2与d2主体之间的活动是不是符合审计规则。

s23、将匹配不合格的合同关键信息进行标号分组。

步骤s23通过将匹配不合格的合同关键信息进行标号分组,可方便对同一类审计问题集中处理。

所述合同关键信息包括:合同付款信息,如合同总价、第一次付款时间、第一次付款金额,第二次付款时间、第二次付款金额,这些信息以固定的格式,针对所述合同关键信息制定规则库,并利用所述规则库通过文本提取技术提取所述合同关键信息;例如要提取“合同总价”、“第一次付款时间”的数据,制定提取规则为:关键词“合同总价”+金额(正则表达式为

((^[-]?([1-9]\d*))|^0)(\.\d{1,2})?$|(^[-]0\.\d{1,2}$));关键词“第一次付款时间”+时间格式数据(yyyy/mm/dd形式的时间,正则表达式为^\d{4}(\-|/|\.)\d{1,2}\1\d{1,2}$)。本实施例制定的规则库和文本抓取技术均采用pcre工具。

其中,步骤s22所述的预制定的审计规则,所述预制定的审计规则可根据关注的审计问题(如未按合同条款执行付款a1,提前付款a2,付款金额不一致a3)定义审计问题规则,形式为b*:a*…a*,如b1:a1、b2:a2、b3:a3、b4:a2a3,其中b*为规则编号,a*…a*为规则所满足的条件。

综上所述,本实施例所提供的审计稽核方法,是通过文本挖掘技术,自动从企业合同中提取合同关键信息,形成结构化数据,与财务系统中银行返回的资金流数据进行比对,通过制定审计问题规则,发现审计问题并分组,实现对审计问题归类,以便对同类问题进行集中审计。

与以往的企业合同审计数据方法相比,本发明有以下优点:一、自动提取企业合同中的合同关键信息,与以往的人工提取相比,节省了很大的人财力成本;二、将合同数据与银行返回的资金流数据进行自动稽核,可以发现任何不匹配的问题,避免因人为疏忽漏掉一些问题。

参考图2,所述系统包括数据采集模块a10、合同关键信息抽取模块a20和审计稽核模块a30。所述数据采集模块a10采集存储于企业合同管理系统的合同文件数据,并通过前端展示模块a4展示。所述信息抽取模块a20从所述合同文件中提取合同关键信息、从财务系统提取资金流数据,并通过前端展示模块a4进行展示,通过前端展示模块a4可使人们及时知道提取的合同关键信息是否正确,

所述审计稽核模块a30包括审计规则制定模块a31、匹配模块a32。所述的审计规则制定模块a31可根据关注的审计问题制定审计规则。所述的匹配模块a32用于对提取的合同关键信息、资金流数据进行匹配,并通过制定的审计规则发现审计问题,并通过前端展示模块a4进行可视化展示。

以上对本发明的较佳实施方式进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变型或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1