信息处理装置及信息处理方法

文档序号:9708721阅读:352来源:国知局
信息处理装置及信息处理方法
【专利说明】信息处理装置及信息处理方法
[0001]本申请享受2014年9月29日在先提出的日本专利申请2014-198825的优先权,其全部内容援引于此。
技术领域
[0002]实施方式涉及信息处理装置及信息处理方法。
【背景技术】
[0003]以往,已知通过计算机等将使用票单的业务自动化的技术。作为这样的技术的实例,已知利用了票单中包含的文字及图形等的图案识别处理的票单鉴别技术。在利用票单鉴别技术的多数票单鉴别系统中,存储表示构成票单的格线的位置等票单形式的空票单,通过将输入的票单和空票单进行比较,来鉴别票单的种类。
[0004]在现有技术中,在无法通过票单的形式来鉴别票单的种类的情况下,无法从多个票单的种类中确定一个票单的种类。

【发明内容】

[0005]实施方式的信息处理装置具备:存储部、受理部、识别部、确定部。存储部存储将多种票单的填写信息按照所述票单的每个种类及填写区域来蓄积的蓄积信息。受理部受理所述票单。识别部识别由所述受理部受理的所述票单中包含的所述填写信息。确定部通过将所述蓄积信息和由所述识别部识别的所述填写信息进行比较,确定由所述受理部受理的所述票单的种类。
【附图说明】
[0006]图1是识别实施方式的信息处理装置的构成例的图。
[0007]图2是表示票单的例子的图。
[0008]图3A是表示实施方式的空票单的例子的图。
[0009]图3B是表示实施方式的填写区域形式信息的例子的图。
[0010]图4是表示无法通过票单的形式信息来鉴别票单的种类的情况的例子的图。
[0011]图5是表示实施方式的信息处理方法的例子的流程图。
[0012]图6是识别实施方式的信息处理装置的硬件构成的例子的图。
【具体实施方式】
[0013]以下,参照附图详细说明信息处理装置、信息处理方法及程序的实施方式。
[0014]图1是表示实施方式的信息处理装置100的构成例的图。实施方式的信息处理装置100具备:存储部1、受理部2、识别部3、鉴别部4、确定部5、显示控制部6、显示部7及输入部8。
[0015]存储部I存储信息。存储部I存储例如票单模型11、识别词典12及蓄积信息13。票单模型11、识别词典12及蓄积信息13的说明留待后述。
[0016]受理部2受理票单。受理部2将票单输入到识别部3。
[0017]另外,受理部2受理票单的方法是任意的。受理部2受理例如表示票单的图像。图像例如可以是通过将票单扫描而读取来制作的图像文件,也可以是通过摄像机拍摄票单而制作的图像文件。
[0018]图2是表示票单的例子的图。图2表示在汽车销售公司的业务中使用的票单的例子。例如,在商品名中记载着轿车A。以下,将票单中填写的信息称为填写信息,将填写了填写信息的部位称为填写区域。例如图2的票单的填写区域是姓名、性别、住址、商品名、单价、个数及合计金额的栏。
[0019]回到图1,识别部3从受理部2受理票单。识别部3识别票单的形式信息和票单中包含的填写信息。
[0020]填写信息包含表示填写内容(文字串、记号及数字等)的信息和表示填写内容的票单上的位置的信息。
[0021]形式信息是表示票单的形式的信息。形式信息例如包括表示构成票单的格线的位置的格线信息、表示预印文字串(输入栏的说明等)的位置和内容的预印文字串信息、以及填写区域形式信息。关于填写区域信息的说明,参照图3B留待后述。
[0022]具体地说,识别部3利用识别词典12来识别形式信息及填写信息。识别词典12是用于识别文字及图形等的图案的词典,将从图案得到的特征信息和与其对应的文字种类或图形图案种类建立关联地存储。识别部3根据通过进行图案识别处理而得到的图案识别结果信息,使用识别词典12来识别票单的形式信息及填写信息。
[0023]识别部3将形式信息输入到鉴别部4。此外,识别部3将填写信息输入到确定部5。
[0024]鉴别部4从识别部3受理形式信息。鉴别部4通过将形式信息和票单模型11进行比较,鉴别票单的种类。此外,鉴别部4通过将形式信息和票单模型11进行比较,判定是否能够鉴别票单的种类。
[0025]在此,说明票单模型11。票单模型11按照每个票单的种类存储空票单及填写区域形式信息。
[0026]图3A是表示空票单的例子的图。如图3A所示,空票单是填写信息尚未填写的状态的票单。空票单表示构成票单的格线的位置和预印文字串(输入栏的说明等)的位置和内容。在图3A的例子中,预印文字串(输入栏的说明等)是姓名、性别、男?女、住址、商品名、单价、个数及合计金额。
[0027]图3B是表示填写区域形式信息的例子的图。填写区域形式信息按照每个填写区域表示在填写区域填写的填写信息的输入形式。在图3B的填写区域形式信息的例子中,例如姓名的填写区域的输入形式表示填写了名字的名字区域。此外,在例如单价的填写区域和合计金额的填写区域填写的填写信息的输入形式表示填写金额的金额区域。另外,数字区域及金额区域也可以与位数等的信息建立关联。
[0028]回到图1,具体地说,鉴别部4将形式信息中包含的格线信息及预印文字串信息与票单模型11的空票单进行比较,将形式信息中包含的填写区域形式信息与票单模型11的填写区域形式信息进行比较。
[0029]鉴别部4能够鉴别票单的种类的情况下,将表示一个票单的种类的信息输入到确定部5。鉴别部4无法鉴别票单的种类的情况下,将表示通过鉴别部4的处理而确认的多个票单的种类的信息输入到确定部5。
[0030]另外,鉴别部4的具体的鉴别处理可以使用任意的方法。例如可以使用专利文献I公开的方法。
[0031]在此,说明鉴别部4无法通过形式信息来鉴别票单的种类的情况。
[0032]图4是表示无法通过形式信息来鉴别票单的种类的情况的例子的图。图4表示票单A(九州汽车订货单)、票单B (東北化妆品订货单)及票单C(关东报申请单)的空票单的例子。票单A和票单C、以及票单B和票单C能够通过形式信息区分,但是票单A和票单B无法通过形式信息来区分。因此,由受理部2受理的票单为票单A的情况下,鉴别部4将形式信息中包含的格线信息及预印文字串信息和票单模型11的空票单进行比较时,由于票单A及票单B —致,因此无法鉴别票单的种类。
[0033]参照填写区域形式信息的情况也同样,鉴别部4将形式信息中包含的填写区域形式信息和票单模型11的填写区域形式信息进行比较时,票单A及票单B—致,因此无法鉴别票单的种类。
[0034]回到图1,确定部5从识别部3受理填写信息,从鉴别部4受理表示票单的种类的信息。在从鉴别部4受理的表示票单的种类的信息为多个的情况下,确定部5按照每个票单的种类将填写信息和蓄积信息13进行比较,从而确定票单的种类。
[0035]在此,说明蓄积信息13。蓄积信息13将多种票单的填写信息按照票单的每个种类及填写区域蓄积。例如,蓄积信息13按照票单的每个种类及填写区域表示由识别部3在过去识别的多个填写信息。这种情况下,存储过去识别的填写信息本身、或者在识别后人工修改的填写信息。存储的填写信息可以将识别到的多个填写信息全部存储,也可以存储过去的一定期间的填写信息。
[0036]此外,蓄积信息13也可以存储加工或统计的填写信息。即,蓄积信息13的存储形式可以是任意的。例如,与图2例示的票单的商品名的栏对应的填写区域的情况下,可以像轿车A、轿车B、卡车C、旅行车A、轿车B、..?那样单纯地作为时间序列的填写履历来存储蓄积信息13。此外,例如可以像轿车A:100、轿车B:50、轿车C:70、..?那样将名称和名称的出现次数作为组来存储蓄积信息13。
[0037]此外,蓄积信息13将表示填写信息的类别的类别信息与填写信息建立关联地存储。类别是根据填写信息的填写内容来分类的信息。例如,填写内容为轿车A的情况下,类别为汽车。此外,例如填写内容为口红A的情况下,类别为化妆品。
[0038]表示从鉴别部4受理的票单的种类的信息为多个的情况下,具体地说,确定部5基于规定的算式来计算票单的种类的可靠度P,按照可靠度P从高到低的顺序将多个票单的种类排序。在此,说明计算可靠度P的规定的算式。确定部5例如通过下述式(I)来计算可靠度P。
[0039]P = wl XA+w2XB+w3XC...(I)
[0040]在此,wl、w2及w3是表不规定的权重的常数。此外,A是表不填与彳目息是否包含在蓄积信息13中的变量。例如,填写信息包含在蓄积信息13中的情况下,设为A = 1,填写信息不包含在蓄积信息13中的情况下,设为A = O0此外,B是表示填写信息在蓄积信息中包含的比例)的变量。例如,B取O?I的值。此外,C是表示与填写信息同一类别的填写信息在蓄积信息中包含的比例)的变量。例如C取O?I的值。
[0041]具体说明式(I)的计算结果。在此,说明使用图4的票单A(九州汽车订货票)及票单B (東北化妆品订货票)的商品名的栏(商品名区域)来计算可靠度P的情况。另外,为了简单起见,设为wl = w2 = w3 = I ο具体说明填写信息的填写内容为轿车A的情况。在蓄积信息13的票单A的商品名区域包含轿车A,轿车A的比例为50%,在与轿车A相同的类别即汽车中包含的填写信息的比例为80%。此外,在蓄积信息13的票单B的商品名区域包含轿车A,轿车A的比例为1%,在与轿车A相同的类别即汽车中包含的填写信息的比例为2%。
[0042]这时,票单的种类为票单A的情况下的可靠度P为P = 1+0.5+0.8 = 2.3。此外,票单的种类为票单B的情况下的可靠度P为P = 1+0.01+0.02 = 1.03。由此,确定部5在受理部2受理了票单A时,即使在鉴别部3无法通过形式信息来鉴别票单的种类的情况下,也能够确定出可靠度P高的票单为票单A。
[0043]另外,确定部5可以按照每个票单来任意地决定计算可靠度P时使用的填写区域。此外,确定部5也可以基于多个填写区域的可靠度P来确定票单。此外,确定部5
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1