一种用于财务数据录入的辅助系统的制作方法

文档序号:19072762发布日期:2019-11-08 20:55阅读:325来源:国知局
一种用于财务数据录入的辅助系统的制作方法

本发明涉及会计设备领域,具体涉及一种用于财务数据录入的辅助系统。



背景技术:

在录入财务数据时,若源文件是可编辑的文本,则可通过复制粘贴来实现财务数据的录入,而当源文件是不可编辑文件时,如图片,则需要用户手动进行录入,但是财务数据中主要是大量的数字数据,再录入时,出错的概率较高,对于录入者的注意力和耐心都有很高的要求,且在录入完成后,为了保证数据准确,仍然需要反复对比,费时费力,现有的ocr识别装置虽然能识别出文字,在实际使用时,源文件的排版差异以及对大量数据类型的识别速度会导致识别成功率不高和使用体验较差的问题。因此需要一种能够辅助用户录入以及校验财务数据的系统。

眼动仪用于记录人在处理视觉信息时的眼动轨迹特征,广泛用于注意、视知觉、阅读等领域的研究。用户在使用产品界面或与产品互动时,运用眼动追踪方法收集详细的技术信息,并记录用户观看(和没有观看)的位置,以及观看的时间。在用户读取文本和图像时,眼动追踪记录了注视和扫视的过程,并完整地判断出眼睛浏览和停留的位置。这种技术清晰地解释用户的眼睛看过哪些位置,没有看哪些位置。

ocr(opticalcharacterrecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术,且如何除错或利用辅助信息提高识别正确率,是ocr最重要的课题。



技术实现要素:

为了解决上述的技术问题,本发明的目的在于提供一种用于财务数据录入的辅助系统,在录入财务数据时,通过视线追踪模块准确定位视线注视的区域,并配合输入采集模块和视线内容识别模块识别输入的内容和看到的财务数据,并通过校验模块将两者进行对比,在发现输入内容与看到内容不一致时,对输入的内容进行标记,提醒用户修改,进而实现数据录入过程的辅助校验功能。

本发明所要解决的技术问题为:

a.如何解决从不可编辑文件中录入大量财务数据时,需要人工进行录入,而导致的录入出错率高以及校验繁琐的问题。

本发明的目的可以通过以下技术方案实现:

一种用于财务数据录入的辅助系统,包括视线追踪模块,该系统还包括程序识别模块、文件识别模块、输入采集模块、视线内容识别模块、校验模块;

所述程序识别模块用于监控用户打开的程序,并在用户打开编辑软件时,获取编辑软件的显示区域,同时向视线追踪模块发出第一启动指令;

所述文件识别模块用于监控用户打开的文件,并在用户打开不可编辑文件时,获取不可编辑文件的显示区域,同时向视线追踪模块发出第二启动指令;

所述视线追踪模块用于在收到第一启动指令和第二启动指令后,追踪用户的视线移动,并定位用户的注视区域,作为光标区域显示在屏幕上;

所述视线内容识别模块用于在视线追踪模块定位至一个光标区域且光标区域位于不可编辑文件的显示区域内时,获取光标区域内的所有数字数据作为样本数据;

所述输入采集模块用于定位用户输入数字数据的位置并获取输入的数字数据,并作为输入数据;

所述校验模块用于将样本数据和输入数据进行对比,若两者相同,则通过校验,若两者不相同,则在输入数据上添加提醒标签,并在选取添加有提醒标签的输入数据时,弹出关联的样本数据。

进一步的,所述视线内容识别模块包括图片生成单元、光标区域分区单元、ocr识别单元、编号生成单元;

所述图片生成单元用于将光标区域内的显示内容生成样本图片;

所述ocr识别单元用于对样本图片进行文字识别,筛选后得到若干组数字数据;

所述光标区域分区单元用于将光标区域分为若干个依次连接的校验分区,并根据各组数字数据所在的校验分区对各个数字数据标记校验优先级,并将标记有校验优先级的数字数据作为样本数据;

所述编号生成单元用于对样本数据分配样本编号。

进一步的,所述输入采集模块包括输入定位单元、内容获取单元、编号关联单元;

所述输入定位单元用于通过光标区域选定输入数据的输入位置;

所述内容获取单元用于获取输入位置中的数字数据并作为输入数据;

所述编号关联单元用于将输入数据与同一校验工序的样本数据的样本编号进行关联。

进一步的,该系统的工作步骤如下:

s1、用户打开编辑软件后,被程序识别模块识别,确定编辑软件的显示范围并发出第一启动指令;用户在打开不可编辑文件时,被文件识别模块识别,确定不可编辑文件的显示范围并发出第二启动指令,当接收到第一启动指令和第二启动指令后,视线追踪模块启动;

s2、视线追踪模块在光标区域落入不可编辑文件的显示范围内时,启动视线内容识别模块,并在光标区域落入编辑软件的显示区域内时,启动输入采集模块;

s3、视线内容识别模块中的图片生成单元获取光标区域内的样本图片,并将样本图片传输至ocr识别单元和光标区域分区单元,ocr识别单元识别出样本图片中的所有数字数据,并将数字数据与样本图片关联,同时光标区域分区单元将光标区域分为中心和外沿两个校验分区,且将中心处的校验分区内的数字数据标记为高校验优先级,对外沿处的校验分区内的数字数据标记为低校验优先级,并将标记后的数字数据作为样本数据发送至编号生成单元,编号生成单元将同一校验工序内的样本数据分配样本编号;

s4、输入采集模块中的定位单元在光标区域悬停在编辑软件的显示范围内的可编辑区域一段时间后,选定该可编辑区域作为输入位置,当用户在该可编辑区域完成输入后,获取该可编辑区域的定位信息,同时内容获取单元读取输入位置内的数字数据作为输入数据,编号关联单元将输入数据分别与定位信息和同一校验工序内的样本编号关联,再将输入数据发送至校验模块;

s5、校验模块在获取输入数据和样本数据,输入数据先与所有高校验优先级的样本数据进行比对,若两者相同,则通过校验,若两者不同,再与所有低校验优先级的样本数据进行比对,若两者相同,则通过校验,若两者不同,则在该输入数据上添加提醒标签,用户选择该输入数据后,弹出输入数据关联的样本图片。

本发明的有益效果:

(1)在录入财务数据时,通过视线追踪模块准确定位视线注视的区域,并配合输入采集模块和视线内容识别模块识别输入的内容和看到的财务数据,并通过校验模块将两者进行对比,在发现输入内容与看到内容不一致时,对输入的内容进行标记,提醒用户修改,进而实现数据录入过程的辅助校验功能,提高录入和识别的效率。

(2)在用户再次选中被标记的输入数据时,同时显示对应的样本图片,可方便用户将输入数据与原始文件中的数据进行比对,便于修改。

(3)在录入时,通过视线追踪模块与程序识别模块的配合使用,能够辅助用户选定输入位置,方便用户使用,录入提高效率。

附图说明

下面结合附图对本发明作进一步的说明。

图1是本发明的系统框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,本实施例提供了一种用于财务数据录入的辅助系统,包括视线追踪模块,该系统还包括程序识别模块、文件识别模块、输入采集模块、视线内容识别模块、校验模块;

所述程序识别模块用于监控用户打开的程序,并在用户打开编辑软件时,获取编辑软件的显示区域,同时向视线追踪模块发出第一启动指令;编辑软件如常用的office套件,显示区域即为程序窗口化的范围,可人工调节大小。

所述文件识别模块用于监控用户打开的文件,并在用户打开不可编辑文件时,获取不可编辑文件的显示区域,同时向视线追踪模块发出第二启动指令;不可编辑文件如pdf、图片格式等,无法直接获取其中的文字。

所述视线追踪模块用于在收到第一启动指令和第二启动指令后,追踪用户的视线移动,并定位用户的注视区域,作为光标区域显示在屏幕上;视线追踪模块采用眼动仪实现,如tobiipro,可实现鼠标的指针悬停、单击、双击操作的模拟。

所述视线内容识别模块用于在视线追踪模块定位至一个光标区域且光标区域位于不可编辑文件的显示区域内时,获取光标区域内的所有数字数据作为样本数据;

单个光标区域内的数字数据数量越少越好,可通过缩放不可编辑文件,来将光标区域与其中的数字数据调整至合适的比例,光标区域为一个近似圆或椭圆的区域,可表示视线注视的范围。且数字数据包括数字以及数学符号。

所述输入采集模块用于定位用户输入数字数据的位置并获取输入的数字数据,并作为输入数据;可通过鼠标点击确定输入位置,也可配合视线追踪模块进行选定。

所述校验模块用于将样本数据和输入数据进行对比,若两者相同,则通过校验,若两者不相同,则在输入数据上添加提醒标签,并在选取添加有提醒标签的输入数据时,弹出关联的样本数据。

所述视线内容识别模块包括图片生成单元、光标区域分区单元、ocr识别单元、编号生成单元;

所述图片生成单元用于将光标区域内的显示内容生成样本图片;且一个校验工序中可能采集到多张样本图片。

所述ocr识别单元用于对样本图片进行文字识别,筛选后得到若干组数字数据;

一个样本图片中可能只有一组数字数据,也可能有多组数字数据。先通过视线内容识别模块采集样本数据,在一段时间内,如30s内,再通过输入采集模块采集输入数据,则两组数据属于同一校验工序。

所述光标区域分区单元用于将光标区域分为若干个依次连接的校验分区,并根据各组数字数据所在的校验分区对各个数字数据标记校验优先级,并将标记有校验优先级的数字数据作为样本数据;

所述编号生成单元用于对样本数据分配样本编号。样本编号用于将样本图片、样本数据、输入数据、定位信息相互联系。

所述输入采集模块包括输入定位单元、内容获取单元、编号关联单元;

所述输入定位单元用于通过光标区域选定输入数据的输入位置;

所述内容获取单元用于获取输入位置中的数字数据并作为输入数据;

所述编号关联单元用于将输入数据与同一校验工序的样本数据的样本编号进行关联。

该系统的工作步骤如下:

s1、用户打开编辑软件后,如excel程序,被程序识别模块识别,确定编辑软件的显示范围,如excel半屏显示,并发出第一启动指令;用户在打开不可编辑文件时,如含有财务数据的png格式的图片,被文件识别模块识别,确定不可编辑文件的显示范围并发出第二启动指令,当接收到第一启动指令和第二启动指令后,视线追踪模块启动;通过发出两个启动指令时,可判定用户需要录入财务数据,此时触发视线追踪模块启动,以实现功能。

s2、视线追踪模块在光标区域落入不可编辑文件的显示范围内时,启动视线内容识别模块,并在光标区域落入编辑软件的显示区域内时,启动输入采集模块;落入相应的区域需要使用对应的模块进行处理,因此通过光标区域的位置作为视线内容识别模块和输入采集模块的触发条件。

s3、视线内容识别模块中的图片生成单元获取光标区域内的样本图片,并将样本图片传输至ocr识别单元和光标区域分区单元,ocr识别单元识别出样本图片中的所有数字数据,并将数字数据与样本图片关联,同时光标区域分区单元将光标区域分为中心和外沿两个校验分区,如外沿的校验分区呈圆环型,中心处的校验分区呈圆形,也可根据实际情况,设定划分更多的校验区间,且将中心处的校验分区内的数字数据标记为高校验优先级,对外沿处的校验分区内的数字数据标记为低校验优先级,若存在数字数据处于两个校验分区之间,则将判定该数字数据为高校验优先级,并将标记后的数字数据作为样本数据发送至编号生成单元,编号生成单元将同一校验工序内的样本数据分配样本编号;

样本编号依次由工序识别位、图片识别位和数据识别位构成,对于同一校验工序内的多个样本图片,如短时间内在注视过jpg图片上的两个位置,就会产生两组样本图片,此时样本编号可记为011.001.003和011.002.001,其中样本编号为011.001.003对应第11轮校验工序中第1张样本图片中的第3个样本数据,样本编号为011.002.001对应第11轮校验工序中第2张样本图片中的第1个样本数据,上述两个样本数据为同一校验工序中的两个样本图片中的独立的两个样本数据。

s4、输入采集模块中的定位单元在光标区域悬停在编辑软件的显示范围内的可编辑区域一段时间后,如2秒中,选定该可编辑区域作为输入位置,当用户在该可编辑区域完成输入后,获取该可编辑区域的定位信息,同时内容获取单元读取输入位置内的数字数据作为输入数据,编号关联单元将输入数据分别与定位信息和同一校验工序内的样本编号关联,再将输入数据发送至校验模块;

可编辑区域为excel中的单元格或是ppt中的文字框等。定位信息如单元格的横纵坐标b1或是c3等。

s5、校验模块在获取输入数据和样本数据,输入数据先与所有高校验优先级的样本数据进行比对,若两者相同,则通过校验,若两者不同,再与所有低校验优先级的样本数据进行比对,若两者相同,则通过校验,若两者不同,则在该输入数据上添加提醒标签,用户选择该输入数据后,弹出输入数据关联的样本图片。

以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1