一种搜索引擎式审计分析方法与流程

文档序号:12124269阅读:452来源:国知局
一种搜索引擎式审计分析方法与流程

本发明涉及信息审计技术领域,具体地,涉及一种搜索引擎式审计分析方法。



背景技术:

在现有的信息审计技术领域中,主要采用基于参数化的SQL语句审计分析方法,即通过由审计软件开发工程师根据现有的审计法律法规或审计分析事项而构建的审计模型对所有待审计数据进行审计分析,然后将分析结果反馈给审计人员。这种审计分析方法对于审计人员的计算机水平较高,缺乏普遍地可操作性,同时由于待审计数据的海量增加(很容易达到千万行级别及以上级别),如仍采用这种方法将会使得执行效率大幅度地下降(需要几分钟甚至几十分钟才能产生分析结果),难以满足快速获取疑点的要求。



技术实现要素:

针对前述现有技术的问题,本发明提供了一种搜索引擎式审计分析方法,先针对海量的待审计数据建立基于索引词的数据反向索引表,然后在审计执行时根据该数据反向索引表查找目标待审计数据,最后应用多维分析组件对目标待审计数据进行查询式审计分析,如此可以快速地且多维度地输出审计分析结果,提高执行效率和审计质量,同时由于不涉及语句编程,还可以降低对审计人员的计算机水平要求,便于实际推广和应用。

本发明采用的技术方案,提供了一种搜索引擎式审计分析方法,包括如下步骤:S101.从数据存储系统中读取所有的待审计数据;S102.针对各份待审计数据,应用分词组件对数据中的字段或数据节点进行分词处理,得到对应的多个索引词;S103.根据待审计数据与索引词的对应关系,应用索引组件构建基于索引词的数据反向索引表,然后存储所述数据反向索引表,所述数据反向索引表包含所有的索引词及与各个索引词对应的若干个待审计数据的数据标识和存储地址;S104.根据来自人机交互设备的检索语句对所述数据反向索引表进行检索,查找到符合所述检索语句要求的索引词及与索引词对应的所有待审计数据的数据标识和存储地址;S105.根据查找所得的数据标识和存储地址,从数据存储系统中读取对应的待审计数据;S106.将来自人机交互设备的用户自定义多维分析条件导入到多维分析组件中,然后通过该多维分析组件对读取的待审计数据进行审计分析,得到审计分析结果;S107.向人机交互设备反馈所述审计分析结果。

优化的,在所述步骤S102中,若待审计数据为非结构化数据,则在进行分词处理前还包括如下步骤:从该待审计数据中提取关键词,然后将所述关键词作为将该待审计数据转换为关系型数据中的字段或作为将该待审计数据转换为非关系型数据中的数据节点。

优化的,在所述步骤S103之前,还包括如下步骤:应用语言处理组件对所有索引词进行语言处理,使所有的检索词都转变为词根式检索词。

优化的,在所述步骤S104中且在根据来自人机交互设备的检索语句对所述数据反向索引表进行检索的步骤中包括如下步骤:先对所述检索语句进行词法分析,识别其中的检索词和逻辑词,进而根据逻辑词的逻辑规则构建一个检索语法树,最后使用所述检索语法树对所述数据反向索引表进行检索。进一步优化的,在构建检索语法树前还包括如下步骤:应用语言处理组件对所有检索词进行语言处理,使所有的检索词都转变为词根式检索词。

优化的,在所述步骤S106之前还包括如下步骤:将来自人机交互设备的数据过滤条件导入到数据过滤组件中,然后应用该数据过滤组件对读取的待审计数据进行过滤。

优化的,在所述步骤S106中包括如下步骤:在所述步骤S107中包括如下步骤:将来自人机交互设备的自定义显示参数导入到数据可视化组件中,然后应用该数据可视化组件对所述审计分析结果进行可视化处理,最后将经可视化处理的审计分析结果反馈给人机交互设备。

优化的,所述数据存储系统包括关系型数据库系统和/或非关系型数据库系统。

综上,采用本发明所提供的一种搜索引擎式审计分析方法,具有如下有益效果:(1)该方法先针对海量的待审计数据建立基于索引词的数据反向索引表,然后在审计执行时根据该数据反向索引表查找目标待审计数据,最后应用多维分析组件对目标待审计数据进行查询式审计分析,如此可以快速地且多维度地输出审计分析结果,提高执行效率和审计质量;(2)可以将非结构化数据也纳入到数据反向索引表中,解决因数据结构复杂而无法进行检索审计的问题,适用的数据对象更广;(3)可以对得到的审计分析结果进行自定义地可视化处理,从而可以以图形化、列表式或矩阵型等多种数据可视化方式展示审计分析结果,使审计人员能够直观快捷地锁定审计疑点;(4)由于不涉及语句编程,还可以降低对审计人员的计算机水平要求,便于实际推广和应用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的搜索引擎式审计分析方法的流程示意图。

图2是本发明提供的数据反向索引表的数据结构示意图。

具体实施方式

以下将参照附图,通过实施例方式详细地描述本发明提供的搜索引擎式审计分析方法。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B三种情况,本文中术语“/和”是描述另一种关联对象关系,表示可以存在两种关系,例如,A/和B,可以表示:单独存在A,单独存在A和B两种情况,另外,本文中字符“/”,一般表示前后关联对象是一种“或”关系。

实施例一

图1示出了本发明提供的搜索引擎式审计分析方法的流程示意图,图2示出了本发明提供的数据反向索引表的数据结构示意图。本实施例提供的所述搜索引擎式审计分析方法,包括步骤如下。

S101.从数据存储系统中读取所有的待审计数据。

在所述步骤S101中,所述数据存储系统包括关系型数据库系统和/或非关系型数据库系统,其中,所述关系型数据库系统用于存储关系型的待审计数据,在关系型数据的数据结构中,存在至少一个字段;所述非关系型数据库系统用于存储非关系型的待审计数据,在非关系型数据的数据结构中,存在至少一个数据节点。

S102.针对各份待审计数据,应用分词组件对数据中的字段或数据节点进行分词处理,得到对应的多个索引词。

在所述步骤S102中,所述分词组件为现有的可进行分词处理的软件模块,其主要完成如下任务:(1)将目标内容分成单独的词;(2)去除标点号;(3)去除诸如“The”或“This”等停词,最后得到有效的索引词。此外优化的,若待审计数据为非结构化数据,则在进行分词处理前还包括如下步骤:从该待审计数据中提取关键词,然后将所述关键词作为将该待审计数据转换为关系型数据中的字段或作为将该待审计数据转换为非关系型数据中的数据节点。如此可以将非结构化数据(其数据形式通常为文本片断、文档、语音、图像和视频等)也纳入到后续的数据反向索引表中,解决因数据结构复杂而无法进行检索审计的问题,适用的数据对象更广。

S103.根据待审计数据与索引词的对应关系,应用索引组件构建基于索引词的数据反向索引表,然后存储所述数据反向索引表,所述数据反向索引表包含所有的索引词及与各个索引词对应的若干个待审计数据的数据标识和存储地址。

在所述步骤S103中,所述数据反向索引表的数据结构如图2所示,针对各个索引词,还可以但不限于包含与该索引词对应的数据频次(即有多少份待审计数据包含该索引词)和在对应的单个待审计数据中该索引词的词频(即在待审计数据中包含有几个该索引词)。此外优化的,在所述步骤S103之前,还包括如下步骤:应用语言处理组件对所有索引词进行语言处理,使所有的检索词都转变为词根式检索词。通过前述语言处理,可以大幅度的减少索引词数及所述数据反向索引表的数据量,加快后续的检索进程。

S104.根据来自人机交互设备的检索语句对所述数据反向索引表进行检索,查找到符合所述检索语句要求的索引词及与索引词对应的所有待审计数据的数据标识和存储地址。

在所述步骤S104中,所述检索语句可以但不限于由审计人员在人机交互设备(例如触控显示屏)显示的搜索引擎文字输入框中输入而得,使得审计人员能够快速的利用所述检索语句完成条件检索,得到目标待审计数据。此外优化的,在根据来自人机交互设备的检索语句对所述数据反向索引表进行检索的步骤中包括如下步骤:先对所述检索语句进行词法分析,识别其中的检索词和逻辑词,进而根据逻辑词的逻辑规则构建一个检索语法树,最后使用所述检索语法树对所述数据反向索引表进行检索。所述检索词为与前述索引词对应的词,以便根据检索词与索引词的匹配结果,在所述数据反向索引表中查找到符合所述检索语句要求的索引词,所述逻辑词为具有逻辑语义的约束词,例如:“AND”的逻辑语义是前后两检索词的“和”关系,“OR”的逻辑语义是前后两检索词的“或”关系,“NOT”的逻辑语义是后检索词的“非”关系等,如此可以构建一个隐含多个检索约束条件的检索语法树。进一步优化的,在构建检索语法树前还包括如下步骤:应用语言处理组件对所有检索词进行语言处理,使所有的检索词都转变为词根式检索词。

S105.根据查找所得的数据标识和存储地址,从数据存储系统中读取对应的待审计数据。

S106.将来自人机交互设备的用户自定义多维分析条件导入到多维分析组件中,然后通过该多维分析组件对读取的待审计数据进行审计分析,得到审计分析结果。

在所述步骤S106中,所述用户自定义多维分析条件可以但不限于由审计人员在人机交互设备(例如触控显示屏)显示的关于多维分析条件自定义组件栏中输入而得。所述多维分析组件为现有的且可对待分析数据(在本实施例中即为待审计数据)进行全方位、多角度、多层次的查询和计算,从而深入了解待分析数据中蕴含的信息及内涵的软件模块,例如采用汉蓝(北京)公司提供的多维分析模块,其性能优异,对于十万级别的检索结果数据(即所述检索读取的待审计数据)的处理可以瞬间得到分析结果,同时其可以直接应用在IE浏览器中(无需单独安装客户端软件程序),然后由审计人员使用鼠标并通过拖拽方式进行自定义多维分析条件的设置,其设置的条件内容主要包括如下几个方面:自定义行标题字段(多个)、自定义列标题字段(多个)、自定义值字段(多个)、自定义值汇总方式(求和、计数等)、自定义图标展现形式(例如数据表、热度图、线形图、柱状图和饼图等等),最后由该多维分析模块对待审计数据进行分析处理,得到用户想要的审计分析结果,此外,也可以采用其他软件模块,例如诸如“COGNOS Analysis”和“BO Analysi”等国外的BI组件多维分析模块或诸如“用友华表多维模块”和“Smartbi Analysis”等国内的BI组件多维分析模块。如此通过应用多维分析组件对目标待审计数据进行查询式审计分析,可以多维度地得到审计分析结果,保障审计质量。此外优化的,在所述步骤S106之前还包括如下步骤:将来自人机交互设备的数据过滤条件导入到数据过滤组件中,然后应用该数据过滤组件对读取的待审计数据进行过滤。所述数据过滤条件可以但不限于由审计人员在人机交互设备(例如触控显示屏)显示的数据过滤组件栏中输入而得,使得审计人员可以对前次检索而得的目标待审计数据进行二次条件过滤,进一步降低审计分析的数据量,加快后续的多维分析进程。

S107.向人机交互设备反馈所述审计分析结果。

在所述步骤S107中,优化的,包括如下步骤:在所述步骤S107中包括如下步骤:将来自人机交互设备的自定义显示参数导入到数据可视化组件中,然后应用该数据可视化组件对所述审计分析结果进行可视化处理,最后将经可视化处理的审计分析结果反馈给人机交互设备。所述自定义显示参数可以但不限于由审计人员在人机交互设备(例如触控显示屏)显示的数据可视化自定义组件栏中输入而得,使得最终可得到以图形化、列表式或矩阵型等多种数据可视化方式展示审计分析结果,例如:(1)针对财务数据而进行的跨年度的科目余额动态多维图表;(2)针对财政支付数据而进行按不同数据类目的动态多维图表;(3)针对工商数据进行公司间关联关系分析并提供关系网络图。

综上,本实施例所提供的搜索引擎式审计分析方法,具有如下技术效果:(1)该方法先针对海量的待审计数据建立基于索引词的数据反向索引表,然后在审计执行时根据该数据反向索引表查找目标待审计数据,最后应用多维分析组件对目标待审计数据进行查询式审计分析,如此可以快速地且多维度地输出审计分析结果,提高执行效率和审计质量;(2)可以将非结构化数据也纳入到数据反向索引表中,解决因数据结构复杂而无法进行检索审计的问题,适用的数据对象更广;(3)可以对得到的审计分析结果进行自定义地可视化处理,从而可以以图形化、列表式或矩阵型等多种数据可视化方式展示审计分析结果,使审计人员能够直观快捷地锁定审计疑点;(4)由于不涉及语句编程,还可以降低对审计人员的计算机水平要求,便于实际推广和应用。

如上所述,可较好地实现本发明。对于本领域的技术人员而言,根据本发明的教导,设计出不同形式的搜索引擎式审计分析方法并不需要创造性的劳动。在不脱离本发明的原理和精神的情况下对这些实施例进行变化、修改、替换、整合和变型仍落入本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1