信息处理装置以及信息处理程序的制作方法

文档序号:24156072发布日期:2021-03-05 11:45阅读:76来源:国知局
信息处理装置以及信息处理程序的制作方法

[0001]
本发明涉及一种信息处理装置以及信息处理程序。


背景技术:

[0002]
例如,专利文献1中记载了一种文字识别处理评估处理方法,对文字识别装置的文字识别率进行评估。所述文字识别处理评估处理方法是将带有文字的文字影像(image)与该文字的属性信息一起保存到文字保存装置上,针对文字识别装置,制作使用从文字保存装置读出并显示且选择的文字影像的票据影像,并输入所述票据影像。
[0003]
而且,专利文献2中记载了一种评估处理方法,对fax-ocr(文字识别)装置的文字识别率、文字识别时间进行评估。所述评估处理方法将应记述在一票据中的字符串作为一个记录(record)而保存至填写文字保存文件(file),从所述填写文字保存文件逐个记录地读出。而且,所述评估处理方法是将所读出的记录分割为每个项目,在指定了字体(font)名、文字样式、文字大小来作为固定格式(format)的应嵌入项目的文字属性信息的各项目中,嵌入所分割的字符串,逐张地自动生成票据。而且,所述评估处理方法将自动生成的票据从fax发送装置自动发送至fax-ocr装置,对保存有由fax-ocr装置进行了文字识别的结果的识别结果文件的各记录、与保存有与记录对应的期待文字数据的填写文字保存文件的记录进行对比,判定是正确读取、还是未读取、还是误识别并进行总计。而且,所述评估处理方法至少将识别率、识别时间保存至验证结果文件,从所保存的验证结果文件读出识别率、识别时间,并显示于显示器上,或者印刷到纸上。
[0004]
[现有技术文献]
[0005]
[专利文献]
[0006]
专利文献1:日本专利特开平8-44828号公报
[0007]
专利文献2:日本专利特开平11-341210号公报


技术实现要素:

[0008]
[发明所要解决的问题]
[0009]
此外,有一种票据业务系统,其针对作为识别对象的票据图像,对要识别的区域、适用的辞典等进行定义,识别票据图像,进行识别结果的确认作业,并输出确认结果。在实际运用所述票据业务系统后,有时会在票据业务的各工序(读取工序、识别工序及确认工序等)中的精度、工时、成本等方面发现问题,但无法在票据业务系统的运用开始前预先评估各工序中的精度、工时、成本等是否妥当。
[0010]
本发明的目的在于提供一种信息处理装置以及信息处理程序,能够在开始票据业务系统的运用之前,预先评估票据业务的至少一个工序的妥当性。
[0011]
[解决问题的技术手段]
[0012]
为了达成所述目的,第一方案的信息处理装置包括处理器,所述处理器获取评估用票据图像,所述评估用票据图像将项目与所述项目的识别结果的正解数据预先相关联,
当在票据业务的至少一个工序中对所述获取的评估用票据图像进行处理时,输出与所述票据业务的工序相关的评估结果。
[0013]
而且,第二方案的信息处理装置是根据第一方案的信息处理装置,其中,所述票据业务具有多个工序,所述处理器针对所述多个工序的每一个,输出以不同的评估项目来评估工序的评估结果。
[0014]
而且,第三方案的信息处理装置是根据第二方案的信息处理装置,其中,所述多个工序包括确认工序,所述确认工序获得确认结果,所述确认结果是对所述评估用票据图像的识别结果进行确认作业所得的结果,所述处理器针对所述确认工序,进一步输出包含每个确认者的确认结果的正答率及处理时间的至少一者的评估结果。
[0015]
而且,第四方案的信息处理装置是根据第二方案的信息处理装置,其中,所述多个工序进一步包含识别工序,所述识别工序获得识别结果,所述识别结果是对所述评估用票据图像进行识别所得的结果,所述处理器针对所述识别工序,进一步输出包含每个识别用辞典的识别结果的正答率及处理时间的至少一者的评估结果。
[0016]
而且,第五方案的信息处理装置是根据第二方案的信息处理装置,其中,所述多个工序进一步包含读取工序,所述读取工序获得读取结果,所述读取结果是对所述评估用票据图像的印刷物进行读取的结果,所述处理器进一步输出包含所述读取工序的处理时间的评估结果。
[0017]
而且,第六方案的信息处理装置是根据第一方案至第五方案中任一方案的信息处理装置,其中,所述评估用票据图像是如下所述的图像,即,在未填写票据的对应项目中配置有对所述正解数据进行转换所得的手写字体。
[0018]
而且,第七方案的信息处理装置是根据第一方案的信息处理装置,其中,所述正解数据是基于预先定义有与所述票据业务相关的运用环境的评估用环境定义数据而生成的数据。
[0019]
而且,第八方案的信息处理装置是根据第六方案的信息处理装置,其中,所述手写字体是基于预先定义有与所述票据业务相关的运用环境的评估用环境定义数据,而由所述正解数据转换所得的字体。
[0020]
而且,第九方案的信息处理装置是根据第七方案或第八方案的信息处理装置,其中,所述运用环境包含与票据关联的地域、与票据关联的法人名、票据的填写人的年龄层、以及票据的填写人的性别中的至少一个。
[0021]
进而,为了达成所述目的,第十方案的信息处理程序使计算机执行:获取评估用票据图像,所述评估用票据图像将项目与所述项目的识别结果的正解数据预先相关联,当在票据业务的至少一个工序中对所述获取的评估用票据图像进行处理时,输出与所述票据业务的工序相关的评估结果。
[0022]
[发明的效果]
[0023]
根据第一方案及第十方案,具有下述效果,即,能够在开始票据业务系统的运用之前,输出与票据业务的至少一个工序相关的评估结果。
[0024]
根据第二方案,具有下述效果,即,能够输出针对多个工序的每一个而利用不同的评估项目来评估各工序的评估结果。
[0025]
根据第三方案,具有下述效果,即,针对确认工序,能够预先评估每个确认者的确
认结果的正答率及处理时间。
[0026]
根据第四方案,具有下述效果,即,针对识别工序,能够预先评估每个识别用辞典的识别结果的正答率及处理时间。
[0027]
根据第五方案,具有下述效果,即,针对读取工序,能够预先评估读取工序的处理时间。
[0028]
根据第六方案,具有下述效果,即,与未使用由正解数据所生成的评估用票据图像的情况相比,能够不耗费工夫而评估工序的妥当性。
[0029]
根据第七方案,具有下述效果,即,与未使用接近实际运用环境的条件的正解数据的情况相比,能够精度良好地评估工序的妥当性。
[0030]
根据第八方案,具有下述效果,即,与未使用接近实际运用环境的条件的手写字体的情况相比,能够精度良好地评估工序的妥当性。
[0031]
根据第九方案,具有下述效果,即,与未使用反映出与票据关联的地域、法人名、年龄层及性别中的至少一个来作为运用环境的评估用票据图像的情况相比,能够精度良好地评估工序的妥当性。
附图说明
[0032]
图1是表示实施方式的票据业务系统的结构的一例的图。
[0033]
图2是表示实施方式的服务器装置的电气结构的一例的框图。
[0034]
图3是表示实施方式的服务器装置的功能结构的一例的框图。
[0035]
图4是供将实施方式的所有工序作为对象的工序评估处理的说明的图。
[0036]
图5是供将实施方式的一部分工序作为对象的工序评估处理的说明的图。
[0037]
图6是供将实施方式的一部分工序作为对象的、另一工序评估处理的说明的图。
[0038]
图7是供将实施方式的一部分工序作为对象的、又一工序评估处理的说明的图。
[0039]
图8是表示实施方式的信息处理程序所进行的处理流程的一例的流程图。
[0040]
图9是供实施方式的正解数据生成处理的说明的图。
[0041]
图10是表示实施方式的正解数据生成处理流程的一例的流程图。
[0042]
图11是供实施方式的评估用票据图像生成处理的说明的图。
[0043]
图12是表示实施方式的评估用票据图像生成处理流程的一例的流程图。
[0044]
图13是表示实施方式的正解数据、未填写票据及评估用票据用纸的一例的图。
[0045]
图14是表示实施方式的数据录入(data entry)结果评估画面的一例的正面图。
[0046]
图15是表示实施方式的数据录入结果评估画面的另一例的正面图。
[0047]
图16是表示实施方式的数据录入中途经过画面的一例的正面图。
[0048]
图17是表示实施方式的数据录入结果报告画面的一例的正面图。
[0049]
符号的说明
[0050]
10:服务器装置
[0051]
11:控制部
[0052]
11a:cpu
[0053]
11b:rom
[0054]
11c:ram
[0055]
11d:i/o
[0056]
12:存储部
[0057]
12a:信息处理程序
[0058]
13:显示部
[0059]
14:操作部
[0060]
15:通信部
[0061]
20:正解数据生成部
[0062]
21:评估用票据图像生成部
[0063]
22:票据评估部
[0064]
23:识别处理部
[0065]
24:评估结果输出部
[0066]
40、40a、40b:确认者用终端装置
[0067]
60:图像读取装置
[0068]
70:管理者用终端装置
[0069]
90:票据业务系统
具体实施方式
[0070]
以下,参照附图来详细说明用于实施本发明的方式的一例。
[0071]
图1是表示本实施方式的票据业务系统90的结构的一例的图。
[0072]
如图1所示,本实施方式的票据业务系统90包括服务器装置10、确认者用终端装置40a、40b、

、图像读取装置60以及管理者用终端装置70。另外,服务器装置10是信息处理装置的一例。
[0073]
服务器装置10经由网络n而与确认者用终端装置40a、40b、

、图像读取装置60及管理者用终端装置70各自可通信地连接。对于所述服务器装置10,作为一例,适用服务器计算机、个人计算机(personal computer,pc)等通用计算机。而且,对于所述网络n,作为一例,适用国际互联网(internet)、局域网(local area network,lan)、广域网(wide area network,wan)等。
[0074]
图像读取装置60具备下述功能:以光学方式读取纸介质的票据而获取图像,并将所获取的图像(以下称作“票据图像”)发送给服务器装置10。另外,作为此处所说的票据,例如使用包含住所或姓名等项目的各种票据。在所述票据中,关于这些项目分别填写有手写文字、印刷文字等。具体而言,如后述的那样,服务器装置10对于从图像读取装置60接收的票据图像,进行光学文字识别(optical character recognition,ocr)处理,获取关于与各个项目对应的图像的识别结果。另外,在所述识别结果中,作为一例,包含表示一个文字以上的文字串的字符串等。而且,在票据中,以框等而规定有可填写与项目对应的记载的区域,可填写记载的区域被定义为识别对象区域。将所定义的区域(以下称作“定义区域”)作为对象来进行ocr处理,获取关于与各个项目对应的图像的字符串。
[0075]
确认者用终端装置40a是进行确认作业的确认者(用户)u1所操作的终端装置,确认者用终端装置40b是进行确认作业的确认者u2所操作的终端装置。在不需要区别说明所述多个确认者用终端装置40a、40b、

的情况下,也将确认者用终端装置40a、40b、

总称为
确认者用终端装置40。而且,在不需要区别说明所述多个确认者u1、u2、

的情况下,也将确认者u1、u2、

总称为确认者u。对于所述确认者用终端装置40,作为一例,适用个人计算机(pc)等通用计算机或者智能电话(smartphone)、平板终端等可携带的终端装置等。另外,在确认者用终端装置40中,安装(install)有供确认者u进行确认作业的确认作业应用程序(application program)(以下也称作“确认作业应用”),生成并显示确认作业用的用户接口(user interface,ui)画面。另外,此处所说的确认作业是指对票据图像内所含的文字等的识别结果进行确认的作业、或者对识别结果进行确认及订正的作业。
[0076]
管理者用终端装置70是系统管理者se所操作的终端装置,由系统管理者se经由票据定义画面(省略图示)来设定票据定义数据。另外,所谓票据定义数据,是指识别票据图像时所需的数据,作为一例,对用纸尺寸、与识别框相关的信息(识别框的项目名、大小、坐标、文字种类、识别用辞典等)进行定义。对于所述管理者用终端装置70,作为一例,适用个人计算机(pc)等通用计算机或者智能电话、平板终端等可携带的终端装置等。
[0077]
服务器装置10在对票据图像中所含的各项目的图像(以下称作“项目图像”)进行识别所得的识别结果的确信度小于阈值的情况下,进行借助人手的确认作业,在确信度为阈值以上的情况下,不进行借助人手的确认作业,并作为最终的识别结果而输出。另外,所谓确信度,是指表示识别结果的可靠度的指标,确信度的值越高,则表示项目图像与所述识别结果一致的概率越高。
[0078]
在进行所述确认作业的情况下,服务器装置10进行使项目图像与通过ocr处理而获得的字符串相关联地显示于确认者用终端装置40的ui画面上的控制。确认者u一边查看所述项目图像,一边确认与所述项目图像对应的字符串是否正确。确认者u在确认结果为正确的情况下,直接将字符串输入至ui画面,在不正确的情况下,将正确的字符串输入至ui画面。确认者用终端装置40将经由ui画面而受理了输入的字符串作为确认结果发送至服务器装置10。服务器装置10进行下述控制,即,基于来自确认者用终端装置40的确认结果来输出最终的识别结果,并使其显示于确认者用终端装置40的ui画面。
[0079]
另外,在所述确认作业中,设定表示进行确认作业的方式的录入方式。作为所述录入方式的一例,设定“复式录入(double entry)”及“单式录入(single entry)”中的任一种。“复式录入”是由多位确认者进行确认作业的方式,“单式录入”是由一位确认者进行确认作业的方式。
[0080]
图2是表示本实施方式的服务器装置10的电气结构的一例的框图。
[0081]
如图2所示,本实施方式的服务器装置10包括控制部11、存储部12、显示部13、操作部14及通信部15。
[0082]
控制部11包括中央处理器(central processing unit,cpu)11a、只读存储器(read only memory,rom)11b、随机存取存储器(random access memory,ram)11c以及输入/输出接口(i/o)11d,所述各部经由总线(bus)而分别连接。
[0083]
在i/o 11d,连接有包含存储部12、显示部13、操作部14及通信部15的各功能部。这些各功能部经由i/o 11d而可与cpu 11a相互通信。
[0084]
控制部11既可构成为对服务器装置10的一部分动作进行控制的子控制部,也可构成为对服务器装置10的整体动作进行控制的主控制部的一部分。对于控制部11的各区块(block)的一部分或全部,例如使用大规模集成电路(large scale integration,lsi)等集
成电路或者集成电路(integrated circuit,ic)芯片组(chip set)。对于所述各区块,既可使用独立的电路,也可使用集成了一部分或全部的电路。既可将所述各区块彼此作为一体而设,也可使一部分区块独立地设置。而且,在所述各区块的各个中,其一部分也可独立地设置。对于控制部11的集成化,并不限于lsi,也可使用专用电路或通用处理器。
[0085]
作为存储部12,例如使用硬盘驱动器(hard disk drive,hdd)、固态硬盘(solid state drive,ssd)、快闪存储器(flash memory)等。在存储部12中,存储本实施方式的信息处理程序12a。另外,所述信息处理程序12a也可存储在rom 11b中。
[0086]
信息处理程序12a例如也可预先安装在服务器装置10中。信息处理程序12a也可存储在非易失性的非临时(non-transitory)存储介质中,或者通过经由网络n来发布,并适当安装于服务器装置10中来实现。另外,作为非易失性的非临时存储介质的示例,设想只读光盘(compact disc read only memory,cd-rom)、磁光盘、hdd、只读数字多功能光盘(digital versatile disc read only memory,dvd-rom)、快闪存储器、存储卡(memory card)等。
[0087]
对于显示部13,例如使用液晶显示器(liquid crystal display,lcd)或有机电致发光(electro luminescence,el)显示器等。显示部13也可一体地具有触控面板(touch panel)。在操作部14,例如设有键盘(keyboard)或鼠标(mouse)等操作输入用的设备。显示部13及操作部14从服务器装置10的用户受理各种指示。显示部13显示根据从用户受理的指示而执行的处理的结果、或针对处理的通知等各种信息。
[0088]
通信部15连接于国际互联网、lan、wan等网络n,与图像读取装置60、确认者用终端装置40及管理者用终端装置70的各个之间可经由网络n来进行通信。
[0089]
此外,在开始票据业务系统的运用之前,必须预先评估票据业务的各工序(读取工序、识别工序及确认工序等)中的精度、工时、成本等是否妥当。
[0090]
本实施方式的服务器装置10的cpu 11a通过将存储在存储部12中的信息处理程序12a写入至ram 11c并予以执行,从而作为图3所示的各部分发挥功能。另外,cpu 11a是处理器的一例。
[0091]
图3是表示本实施方式的服务器装置10的功能结构的一例的框图。
[0092]
如图3所示,本实施方式的服务器装置10的cpu 11a作为正解数据生成部20、评估用票据图像生成部21、票据评估部22、识别处理部23及评估结果输出部24发挥功能。
[0093]
在本实施方式的存储部12中,作为一例,存储有所述票据定义数据与评估用环境定义数据。另外,评估用环境定义数据是预先定义了与票据业务相关的运用环境的数据。在所述运用环境中,包含与票据关联的地域、与票据关联的法人名、票据的填写人的年龄层、及票据的填写人的性别中的至少一个。
[0094]
正解数据生成部20生成正解数据。所述正解数据是指表示与票据图像的各项目相关联地生成的伪识别结果的文字数据,作为一例,若项目为“姓名”,则作为表示“姓名”的文字数据(例如“山田太郎”等)而表示。所述正解数据也可为基于所述评估用环境定义数据而生成的数据。此时,例如可获得与票据关联的地域、与票据关联的法人名、票据的填写人的年龄层、及票据的填写人的性别中的至少一个相应的正解数据。即,可获得接近实际运用环境的条件的正解数据。因此,评估的精度提高。关于所述正解数据的具体的生成处理将后述。
[0095]
评估用票据图像生成部21生成评估用票据图像。所述评估用票据图像是在未填写票据的对应项目中配置有将正解数据转换所得的手写字体的图像。所述手写字体是将正解数据转换所得的、手写文字的字体数据。所述手写字体也可为基于所述评估用环境定义数据,由正解数据转换所得的字体。此时,例如可获得与票据的填写人的年龄层及票据的填写人的性别中的至少一者相应的手写字体。即,可获得接近实际运用环境的条件的手写字体。因此,评估的精度提高。关于所述评估用票据图像的具体的生成处理将后述。
[0096]
另外,这些正解数据生成部20及评估用票据图像生成部21也可不设在服务器装置10内,正解数据与评估用票据图像也可由票据业务系统90外部的其他服务器装置来生成。
[0097]
票据评估部22获取将项目与对应于所述项目的识别结果的正解数据预先相关联的评估用票据图像。具体而言,票据评估部22获取由评估用票据图像生成部21所生成的评估用票据图像。票据评估部22在以票据业务的至少一个工序来对所获取的评估用票据图像进行处理的情况下,导出表示所述工序的处理能力的值。
[0098]
识别处理部23将评估用票据图像作为输入,针对每个项目,按照票据定义数据的设定内容来执行ocr处理。识别处理部23将项目图像、识别结果及其确信度关联于票据的每个项目而输出。
[0099]
评估结果输出部24输出与票据业务的工序相关的评估结果,所述评估结果包含由票据评估部22所导出的表示处理能力的值。在票据业务具有多个工序的情况下,评估结果输出部24针对多个工序的每一个,输出以不同的评估项目来评估各工序的结果即评估结果。即,在各工序中,想要评估的项目不同,因此以与各工序对应的适当的评估项目,来输出各工序的评估结果。
[0100]
具体而言,多个工序包含确认工序。所述确认工序是获得确认结果的工序,所述确认结果是对评估用票据图像的识别结果进行确认作业的结果。如上所述,所述确认作业是通过确认者用终端装置40来实施。此时,评估结果输出部24针对确认工序,输出包含每个确认者的确认结果的正答率(%)及处理时间(分钟)的至少一者的评估结果。另外,每个确认者的确认结果的正答率及处理时间是由票据评估部22予以导出。在确认工序的情况下,正答率是作为正确的确认结果相对于全部确认件数的比例而表示。处理时间是作为从处理结束时间减去处理开始时间所得的时间而表示。
[0101]
另外,确认工序的评估结果也可包含确认工序的处理时间、确认工序的确认结果的正答率、及票据的每个项目的确认结果的正答率中的至少一个。
[0102]
而且,多个工序包含识别工序。所述识别工序是获得识别结果的工序,所述识别结果是对评估用票据图像进行识别的结果。所述评估用票据图像的识别是由识别处理部23来实施。此时,评估结果输出部24针对识别工序,输出包含每个识别用辞典的识别结果的正答率(%)及处理时间(分钟)的至少一者的评估结果。另外,每个识别用辞典的识别结果的正答率及处理时间是由票据评估部22予以导出。在识别工序的情况下,正答率是作为正确的识别结果相对于所有识别件数的比例而表示。处理时间是作为从处理结束时间减去处理开始时间所得的时间而表示。
[0103]
另外,识别工序的评估结果也可包含识别工序的处理时间、识别工序的识别结果的正答率、及票据的每个项目的识别结果的正答率中的至少一个。
[0104]
而且,多个工序包含读取工序。所述读取工序是获得读取结果的工序,所述读取结
果是对表示评估用票据图像的印刷物的评估用票据用纸进行读取的结果。所述评估用票据用纸是由与服务器装置10连接的印刷装置(省略图示)来印刷,评估用票据用纸的读取是由图像读取装置60来实施。此时,评估结果输出部24输出包含读取工序的处理时间(分)的评估结果。另外,读取工序的处理时间是由票据评估部22予以导出。处理时间是作为从处理结束时间减去处理开始时间所得的时间而表示。
[0105]
即,每当开始票据业务系统90的运用时,服务器装置10使用评估用票据图像或评估用票据用纸,输出评估结果,所述评估结果包含表示票据业务的各工序(读取工序、识别工序及确认工序)中的处理能力的值。并且,基于所述评估结果,来判断票据业务的各工序中的精度、工时、成本等是否妥当。
[0106]
接下来,参照图4至图7,具体说明使用评估用票据图像来评估票据业务的各工序的处理(以下称作“工序评估处理”)。
[0107]
图4是供将本实施方式的所有工序作为对象的工序评估处理的说明的图。
[0108]
如图4所示,票据评估部22进行下述控制,即,获取由评估用票据图像生成部21所生成的评估用票据图像,并将所获取的评估用票据图像发送至印刷装置。由所述印刷装置所印刷的评估用票据图像的印刷物即评估用票据用纸被供给至读取工序。在读取工序中,使用图像读取装置60,输出对评估用票据用纸进行读取所得的读取数据。此时,票据评估部22获取读取工序的处理内容。在所述读取工序的处理内容中,包含处理页数、处理开始时间及处理结束时间等。票据评估部22基于所获取的读取工序的处理内容,导出作为读取工序的处理能力的一例的处理时间(分钟)、处理速度(页/分钟)等。
[0109]
接下来,在读取工序中输出的读取数据被供给至识别工序。在识别工序中,使用识别处理部23,输出按照票据定义数据来对读取数据进行识别所得的识别结果。此时,票据评估部22获取识别工序的处理内容。在所述识别工序的处理内容中,包含处理页数、处理开始时间、处理结束时间、识别用辞典及识别结果等。处理页数表示所有识别件数。票据评估部22基于所获取的识别工序的处理内容,针对每个识别用辞典而导出作为识别工序的处理能力的一例的正答率(%)、处理时间(分钟)及处理速度(页/分钟)等。另外,票据评估部22针对每个读取数据来判定识别结果是否正确。
[0110]
接下来,在识别工序中输出的识别结果跟读取数据一同被供给至确认工序。在确认工序中,使用确认者用终端装置40,对将读取数据与识别结果设为对的数据群实施识别结果的确认作业,输出确认结果。在确认作业中,如上所述,若相对于读取数据而识别结果的字符串有误,则由确认者订正为正确的字符串。此时,票据评估部22获取确认工序的处理内容。在所述确认工序的处理内容中,包含处理页数、处理开始时间、处理结束时间、确认者名及确认结果等。处理页数表示所有确认件数。票据评估部22基于所获取的确认工序的处理内容,针对每个确认者而导出作为确认工序的处理能力的一例的正答率(%)、处理时间(分钟)及处理速度(页/分钟)等。另外,票据评估部22针对每个读取数据来判定确认结果是否正确。
[0111]
图4的示例中,对于读取工序、识别工序及确认工序的所有工序,实施使用评估用票据图像的评估。另外,此处所说的评估包含导出表示各工序中的处理能力的值。并且,各工序中的改善要否是通过将表示各工序中的处理能力的值与针对每个工序预先规定的目标值进行比较来进行。例如,在读取工序中,若处理时间小于目标值,则判断为需要改善。此
时,例如采取变更图像读取装置60等应对。而且,在识别工序中,若正答率小于目标值、或者处理时间小于目标值,则采取变更识别用辞典,或者变更ocr软件等应对。而且,在确认工序中,若正答率小于目标值、或者处理时间小于目标值,则采取增加确认者,或者变更确认者等应对。另外,也可将用户基于评估结果而应采取的应对跟评估结果一同予以输出。
[0112]
而且,也可为,已掌握处理能力的工序不输出评估结果,而仅对尚未掌握处理能力的工序输出评估结果。
[0113]
图5是供将本实施方式的一部分工序作为对象的工序评估处理的说明的图。
[0114]
如图5所示,在已掌握确认工序的处理能力的情况下,也可仅对读取工序及识别工序分别评估处理能力。
[0115]
图6是供将本实施方式的一部分工序作为对象的、另一工序评估处理的说明的图。
[0116]
如图6所示,在已掌握读取工序及确认工序各自的处理能力的情况下,也可仅对识别工序评估处理能力。此时,取代读取数据而将评估用票据图像直接供给至识别工序。此时,也可模仿实际的读取数据,对评估用票据图像适当赋予噪声或畸变等。
[0117]
图7是供将本实施方式的一部分工序作为对象的、又一工序评估处理的说明的图。
[0118]
如图7所示,在已掌握读取工序及识别工序各自的处理能力的情况下,也可仅对确认工序评估处理能力。此时,取代读取数据而将评估用票据图像直接供给至确认工序,并且将评估用票据图像的识别结果供给至确认工序。此时,也可模仿实际的识别结果,以任意的正答率来使错误混入评估用票据图像的识别结果中。
[0119]
接下来,参照图8来说明本实施方式的服务器装置10的作用。
[0120]
图8是表示本实施方式的信息处理程序12a所进行的处理流程的一例的流程图。
[0121]
首先,当指示服务器装置10执行工序评估处理时,由cpu 11a启动信息处理程序12a,执行以下的各步骤。
[0122]
图8的步骤100中,cpu 11a获取评估用票据图像。所述评估用票据图像既可为从评估用票据图像生成部21获取的图像,也可为从票据业务系统90外部的其他服务器装置获取的图像。
[0123]
步骤101中,cpu 11a判定是否评估读取工序。若判定为要评估读取工序(肯定判定的情况下),跳转至步骤102,若判定为不评估读取工序(否定判定的情况下),则跳转至步骤106。
[0124]
步骤102中,cpu 11a指示评估用票据图像的印刷。将所述评估用票据图像的印刷物即评估用票据用纸供给至读取工序。在读取工序中,使用图像读取装置60,输出对评估用票据用纸进行读取所得的读取数据。
[0125]
步骤103中,cpu 11a获取读取工序的处理内容。在所述读取工序的处理内容中,如上所述,包含处理页数、处理开始时间及处理结束时间等。
[0126]
步骤104中,cpu 11a基于在步骤103中获取的读取工序的处理内容,导出作为读取工序的处理能力的一例的处理时间(分钟)、处理速度(页/分钟)等。
[0127]
步骤105中,cpu 11a将包含在步骤104中导出的表示处理能力的值的、读取工序的评估结果作为一例而输出至显示部13,结束本信息处理程序12a所进行的一连串处理。
[0128]
另一方面,步骤106中,cpu 11a判定是否评估识别工序。若判定为要评估识别工序(肯定判定的情况下),则跳转至步骤107,若判定为不评估识别工序(否定判定的情况下),
则跳转至步骤110。
[0129]
步骤107中,cpu 11a获取识别工序的处理内容。在所述识别工序的处理内容中,如上所述,包含处理页数、处理开始时间、处理结束时间、识别用辞典及识别结果等。
[0130]
步骤108中,cpu 11a基于在步骤107中获取的识别工序的处理内容,针对每个识别用辞典而导出作为识别工序的处理能力的一例的正答率(%)、处理时间(分钟)及处理速度(页/分钟)等。
[0131]
步骤109中,cpu 11a将包含在步骤108中导出的表示处理能力的值的、识别工序的评估结果作为一例而输出至显示部13,结束本信息处理程序12a所进行的一连串处理。
[0132]
另一方面,步骤110中,cpu 11a判定是否评估确认工序。若判定为要评估确认工序(肯定判定的情况下),则跳转至步骤111,若判定为不评估确认工序(否定判定的情况下),则返回步骤101而待机。
[0133]
步骤111中,cpu 11a获取确认工序的处理内容。在所述确认工序的处理内容中,如上所述,包含处理页数、处理开始时间、处理结束时间、确认者名及确认结果等。
[0134]
步骤112中,cpu 11a基于在步骤111中获取的确认工序的处理内容,针对每个确认者而导出作为确认工序的处理能力的一例的正答率(%)、处理时间(分钟)及处理速度(页/分钟)等。
[0135]
步骤113中,cpu 11a将包含在步骤112中导出的表示处理能力的值的、确认工序的评估结果作为一例而输出至显示部13,结束本信息处理程序12a所进行的一连串处理。
[0136]
接下来,参照图9来具体说明正解数据生成处理。
[0137]
图9是供本实施方式的正解数据生成处理的说明的图。
[0138]
如图9所示,正解数据生成部20可参照住所数据列表、姓名数据列表及关键字列表(keyword list)。住所数据列表是成为范例(sample)的住所及属性(例如地区、县、

)的列表,姓名数据列表是成为范例的姓名及属性(例如性别、年龄、

)的列表,关键字列表是成为范例的关键字及属性(例如医疗机构名、政府机关名、银行名、企业名、

)的列表。这些住所数据列表、姓名数据列表及关键字列表被存储在存储部12中。
[0139]
而且,评估用格式定义数据及评估用环境定义数据(参照图3)被存储在存储部12中。评估用格式定义数据是所述票据定义数据的一部分,对评估用票据图像的格式进行定义。所谓评估用票据图像的格式,是指将框与项目相关联者,作为一例,如第一框中为姓名、第二框中为性别、第三框中为住所、第四框中为

、等那样。而且,如上所述,评估用环境定义数据是预先定义了与票据业务相关的运用环境的数据。
[0140]
图10是表示本实施方式的正解数据生成处理流程的一例的流程图。
[0141]
首先,当指示服务器装置10执行正解数据生成处理时,由cpu 11a启动信息处理程序12a,执行以下的各步骤。
[0142]
图10的步骤120中,cpu 11a作为正解数据生成部20,获取评估用格式定义数据及评估用环境定义数据。
[0143]
步骤121中,cpu 11a作为正解数据生成部20,根据在步骤120中获取的评估用格式定义数据及评估用环境定义数据而生成正解数据的一记录。具体而言,从住所数据列表中提取适合于评估用环境定义数据的住所。同样地,从姓名数据列表中提取适合于评估用环境定义数据的姓名。从关键字列表中提取适合于评估用环境定义数据的关键字。使用这些
提取的住所、姓名及关键字,生成正解数据的一记录。作为一例,正解数据的一记录如“铃木一郎,男,千叶县


…”
等那样。例如,若评估用环境定义数据是“对象数据的填写人为福冈县的〇
×
中学的学生”,则从住所数据列表中提取与福冈关联的住所,从姓名数据列表中提取在福冈且多的姓名。
[0144]
步骤122中,cpu 11a作为正解数据生成部20,判定在评估用环境定义数据中预先设定的记录数的正解数据的生成是否已完成。若判定为预先设定的记录数的正解数据的生成尚未完成(否定判定的情况下),则返回步骤121而重复处理。而且,若判定为预先设定的记录数的正解数据的生成已完成(肯定判定的情况下),则结束本信息处理程序12a所进行的正解数据生成处理。
[0145]
接下来,参照图11来具体说明评估用票据图像生成处理。
[0146]
图11是供本实施方式的评估用票据图像生成处理的说明的图。
[0147]
如图11所示,评估用票据图像生成部21可参照手写字体数据库。在手写字体数据库中,将字体名及属性(例如年龄层、性别、

)关联于多种手写字体而予以保存。所述手写字体数据库被存储在存储部12中。
[0148]
图12是表示本实施方式的评估用票据图像生成处理流程的一例的流程图。
[0149]
首先,当指示服务器装置10执行评估用票据图像生成处理时,由cpu 11a启动信息处理程序12a,执行以下的各步骤。
[0150]
图12的步骤130中,cpu 11a作为评估用票据图像生成部21,获取票据定义数据及评估用环境定义数据。
[0151]
步骤131中,cpu 11a作为评估用票据图像生成部21,获取正解数据的一记录。
[0152]
步骤132中,cpu 11a作为评估用票据图像生成部21,基于票据定义数据、评估用环境定义数据及正解数据来生成评估用票据图像的一记录。具体而言,从手写字体数据库中选择适合于评估用环境定义数据的手写字体,将正解数据的字符串转换为所选择的手写字体。继而,根据由票据定义数据所定义的布局信息,将通过转换所获得的手写字体配置到未填写票据的对应项目中。由此,生成评估用票据图像的一记录。例如,若评估用环境定义数据是“对象数据的填写人为福冈县的〇
×
中学的学生”,则选择与中学生的年龄层相应的手写字体。
[0153]
步骤133中,cpu 11a作为评估用票据图像生成部21,判定正解数据的所有记录数的评估用票据图像的生成是否已完成。若判定为正解数据的所有记录数的评估用票据图像的生成尚未完成(否定判定的情况下),则返回步骤131而重复处理。而且,若判定为正解数据的所有记录数的评估用票据图像的生成已完成(肯定判定的情况下),则跳转至步骤134。
[0154]
步骤134中,cpu 11a作为评估用票据图像生成部21,指示印刷装置(省略图示)进行上文生成的评估用票据图像的印刷,结束本信息处理程序12a所进行的评估用票据图像生成处理。
[0155]
另外,在上文中,评估用票据图像的印刷物即评估用票据用纸被用于评估读取工序时。
[0156]
图13是表示本实施方式的正解数据、未填写票据及评估用票据用纸的一例的图。
[0157]
图13所示的正解数据的字符串被转换为适合于所述评估用环境定义数据的手写字体。根据由所述的票据定义数据所定义的布局信息,将通过转换所获得的手写字体配置
到未填写票据的对应项目中,制成评估用票据图像。继而,印刷所述评估用票据图像而制成评估用票据用纸。
[0158]
接下来,参照图14至图17来具体说明与本实施方式的工序评估处理相关的画面例。
[0159]
图14是表示本实施方式的数据录入结果评估画面的一例的正面图。
[0160]
图14所示的数据录入结果评估画面是显示与票据业务的工序相关的评估结果的画面,作为一例,被显示于显示部13。作为一例,图14所示的数据录入结果评估画面包含识别结果评估画面及确认结果评估画面。作为一例,识别结果评估画面及确认结果评估画面各自包含综合评估、处理量及票据的每个项目的正答率。综合评估表示票据的每个项目的正答率的平均值。处理量表示评估用票据图像的页数、票据的项目数及文字数。票据的每个项目的正答率表示公司名、邮政编码、电话号码等每个项目的正答率。如图14所示,识别工序的评估结果也可包含识别工序的识别结果的正答率(综合评估)及票据的每个项目的识别结果的正答率。另外,识别工序的评估结果也可包含识别工序的处理时间。而且,确认工序的评估结果也可包含确认工序的确认结果的正答率(综合评估)及票据的每个项目的确认结果的正答率。另外,确认工序的评估结果也可包含确认工序的处理时间。
[0161]
根据图14的评估结果可知的是,仅靠识别工序无法获得足够的正答率,需要确认工序。而且可知的是,在识别工序中,“公司名”的正答率也低,确认工序的负载增大。作为其对策,也可考虑实现在识别工序中使用的ocr软件自身性能的提高,降低确认工序的负载。另一方面,若在确认工序中可获得足够的正答率,且无处理时间等其他问题,则判断为可开始票据业务。如上所述的、针对评估结果的判断也可与评估结果一同予以显示。
[0162]
图15是表示本实施方式的数据录入结果评估画面的另一例的正面图。
[0163]
图15所示的数据录入结果评估画面是显示与票据业务的工序相关的评估结果的画面,作为一例,被显示于显示部13。作为一例,图15所示的数据录入结果评估画面包含按识别用辞典区分的评估结果及按确认者区分的确认结果评估画面。作为一例,按识别用辞典区分的评估结果包含辞典d的评估、处理量及票据的每个项目的正答率。辞典d的评估表示适用辞典d时的票据的每个项目的正答率的平均值。处理量表示评估用票据图像的页数、识别工序所需的处理时间及处理速度。票据的每个项目的正答率表示适用辞典d时的每个项目的正答率。而且,作为一例,按确认者区分的确认结果评估画面包含确认者a的评估、处理量及票据的每个项目的正答率。确认者a的评估表示确认者a进行确认作业时的票据的每个项目的正答率的平均值。处理量表示评估用票据图像的页数、确认工序所需的处理时间及处理速度。票据的每个项目的正答率表示确认者a进行确认作业时的票据的每个项目的正答率。
[0164]
根据图15的评估结果,关于识别工序已知按识别用辞典区分的评估结果,因此,假设在辞典d的正答率低的情况下,可考虑采取变更为正答率相对较高的其他辞典等的对策。而且,关于确认工序已知按确认者区分的评估结果,因此,假设在确认者a的正答率低的情况下,可考虑采取变更为正答率相对较高的其他确认者等的对策。上文中,是将正答率作为判断基准,但也可将处理时间(或处理速度)作为判断基准,还可将正答率及处理时间(或处理速度)作为判断基准。如上所述的、基于评估结果的对策也可也与评估结果一同予以显示。
[0165]
图16是表示本实施方式的数据录入中途经过画面的一例的正面图。
[0166]
图16所示的数据录入中途经过画面是显示与票据业务的工序相关的中途经过的画面,作为一例,被显示于显示部13。作为一例,图16所示的数据录入中途经过画面包含分别关于读取工序、识别工序及确认工序的中途经过画面。在读取工序中,作为一例,表示了进展状况、开始时刻、当前时刻及处理性能。另外,处理性能表示为处理速度(页/分钟)。在识别工序中,作为一例,表示了进展状况、开始时刻、当前时刻、处理性能、正答率及每个项目的正答率。另外,正答率表示为每个项目的正答率的平均值。确认工序在本例中尚未开始,但与识别工序同样,表示了进展状况、开始时刻、当前时刻、处理性能、正答率及每个项目的正答率。
[0167]
如图16所示,通过按照工序来参照中途经过,即使不等工序的处理完成,也能进行工序的评估。
[0168]
图17是表示本实施方式的数据录入结果报告画面的一例的正面图。
[0169]
图17所示的数据录入结果报告画面是显示与票据业务的工序相关的处理完成的画面,作为一例,被显示于显示部13。图17所示的数据录入结果报告画面表示了图16所示的数据录入中途经过画面上的各工序的处理已完成的情况。
[0170]
根据图17的结果报告,识别工序中的“公司名”的正答率低,确认工序有可能需要时间。因此,也可考虑变更识别工序中所用的ocr软件自身,或者变更ocr软件的设定,并再次进行评估。而且,由于确认工序需要时间,因此也可考虑采取增加确认者等的对策。
[0171]
如上所述,根据本实施方式,在开始票据业务系统的运用之前,输出票据业务的至少一个工序的评估结果。因此,可在运用开始前对存在问题的工序采取必要的对策。
[0172]
另外,所述各实施方式中,所谓处理器,是指广义上的处理器,包含通用处理器(例如中央处理器(central processing unit,cpu)等)或者专用处理器(例如图形处理器(graphics processing unit,gpu)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)、可编程逻辑元件等)。
[0173]
而且,所述各实施方式中的处理器的动作也可并非仅由一个处理器完成,而是由位于在物理上分离的位置的多个处理器协同完成。而且,处理器的各动作的顺序并不仅限定于所述各实施方式中记载的顺序,也可适当变更。
[0174]
以上,作为实施方式的信息处理装置的一例,例示了服务器装置进行说明。实施方式也可设为用于使计算机执行服务器装置所具备的各部的功能的程序的形态。实施方式也可设为存储有这些程序的计算机可读取的非临时存储介质的形态。
[0175]
除此以外,所述实施方式中说明的服务器装置的结构是一例,也可在不脱离主旨的范围内根据状况来变更。
[0176]
而且,所述实施方式中说明的程序的处理流程也是一例,也可在不脱离主旨的范围内删除多余的步骤,或者追加新的步骤,或者调换处理顺序。
[0177]
而且,所述实施方式中,对下述情况进行了说明,即,通过执行程序,从而利用计算机而通过软件结构来实现实施方式的处理,但并不限于此。实施方式例如也可通过硬件结构、或硬件结构与软件结构的组合来实现。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1