手写文档处理设备和方法

文档序号:8909180阅读:348来源:国知局
手写文档处理设备和方法
【专利说明】手写文档处理设备和方法
[0001]相关申请的交叉引用
[0002]此申请基于2012年8月17日提交的2012-180958号日本专利申请并要求其优先权的利益,其全部内容通过引用被合并到本文中。
技术领域
[0003]在这里描述的实施例一般地涉及一种手写文档处理设备和方法。
【背景技术】
[0004]已知在包括笔输入界面的应用程序中的用于提取表格格子线、表单的格子线等等,并且出于整齐的副本的目的而将它们成形的技术。
【附图说明】
[0005]图1是根据实施例的手写文档处理设备的方框图;
[0006]图2显示笔划数据的显示实例;
[0007]图3是显示笔划数据的柱状图的曲线;
[0008]图4是显示笔划的高宽比的视图;
[0009]图5是用于解释分类器的处理结果的视图;
[0010]图6A和6B是用于解释区域划分的视图;
[0011]图7是显示区域划分结果的视图;
[0012]图8是通过判断器的处理的流程图;
[0013]图9是用于解释基于单元格区域的统计量的计算的视图;
[0014]图10是显示判断器的处理结果的视图;
[0015]图11是显示判断器的处理结果的视图;
[0016]图12是显示基于除格子线以外的笔划的判断处理的视图;
[0017]图13是显示基于线段的比率的小扩展格子线的判断处理的视图;
[0018]图14是显示单元格区域的分组的视图;
[0019]图15是显示外接格子线的估算的视图;
[0020]图16是显示外接格子线的位置校正的视图;
[0021]图17是显示手写格子线的线转换的视图;
[0022]图18是用于解释外接格子线的显示模式的视图;
[0023]图19A、19B和19C是显示笔划数据的数据结构实例的视图;
[0024]图20是显示硬件配置实例的方框图;以及
[0025]图21是显示网络配置实例的视图。
【具体实施方式】
[0026]总的来说,根据一个实施例,手写文档处理设备包括输入器、分类器、分割器和判断器。输入器输入笔划数据。分类器把笔划数据分类为多条格子线的数据和除格子线以外的笔划数据。分割器将包括多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域。判断器判断在第二区域中的格子线是格子线不连接至其一个端点的第一格子线,还是虚拟的外接格子线连接至其一个端点的第二格子线。
[0027]以下将参考附图描述实施例。
[0028]根据此实施例的手写文档处理设备被用于,例如,包括笔输入界面的笔记本应用程序。这个应用程序允许用户在自由的布局中在不使用任何图形绘制工具的情况下手动地手写表格。在这种情况下,格子线的长度经常可以是不均匀的,或者格子线可以经常变成非竖直的、弯曲的线。此外,当他或她手写输入表格时,用户可以经常忽略外框的格子线(以下称为外接格子线)O此实施例涉及为应付这些情形而需要的用户界面的改进,并且能够适当地处理手写格子线以使表格成形。
[0029]图1是根据本实施例的手写文档处理设备的方框图。手写文档处理设备2处理,例如,使用笔输入界面的手写输入。设备2的主要部分3包括用于输入笔划数据I的输入器4、把笔划数据I分类为格子线和其它数据的分类器5、将包括格子线的区域划分为第一和第二区域的分割器6以及将判断处理应用至第二区域中的格子线的判断器7。
[0030]设备2包括估算,例如,外接格子线的估算器8以及基于估算器8的估算结果显示成形的表格的显示器9。可以修改此实施例以使得估算器8被包括在主要部分3中。做为选择,也可以修改此实施例以使得设备2不包括估算器8和显示器9,并且判断器7的结果被用作最后的输出数据。
[0031]输入器4输入笔划数据1,该笔划数据I经由,例如,笔输入界面被提供。图2显示笔划数据I的显示实例10。笔划数据I具有对于每个笔划分类的坐标时间序列的数据,并且例如,被表示为如下:
[0032]笔划1: (X (I, I),y (1,I)),(X (1,2),y (1,2)),...,(X (I, N(I)),y (I, N(I)))
[0033]笔划2: (x(2, l),y(2, I)), (x(2, 2),y(2, 2)),..., (x (2, N(2)), y (2, N(2)))
[0034]...
[0035]在此N(i)是在采样笔划i的时候的点的数目。随后将描述笔划数据I (手写数据)的更详细的结构的实例。
[0036]分类器5将笔划数据I分类为多个格子线数据和除格子线以外的笔划数据。表格的格子线的特征在于(I)笔划长度相对较大,和(2)由笔划的开始和结束点决定的高宽比是极端地大/小。这样,笔划数据I能够基于这些标准被分类为格子线和其它数据。
[0037]图3显示笔划长度的分布图。在图3中的分布图L中,具有超过阈Th的笔划长度的笔划,是格子线(或格子线候选者)。这对应于以上条件(I)。图4显示由笔划的开始和结束点决定的高宽比。参考图4,因为具有起点SI和终点El的笔划在水平方向上比在垂直方向上极端地长,所以它被分类为格子线。同样,因为具有起点S2和终点E2的笔划在垂直方向上比在水平方向上极端地长,所以它也被分类为格子线。图4所示的实例对应于以上条件⑵。
[0038]图5是用于解释分类器5的处理结果的视图。参考图5,引用符号RL表示在笔划数据I中的多个格子线数据;并且HW表示除在笔划数据I中的格子线以外的笔划数据。注意笔划数据HW对应于输入至手写表格的单元格的手写字符串(在这个实例中,是“好影響”,“悪影響”,“内部環境”,...,“夕'口一化”)。
[0039]分割器6将包括由分类器5分类的多条格子线的区域划分为对应于以四条格子线为界的单元格的的第一区域,和包括最多三条格子线的第二区域。在这种情况下,注意力仅仅集中在笔划数据I中分类为格子线的数据上。如图6A所示,检测出笔划的交点(IPl至IP9)和端点(EPl至EP9)。接下来,从端点(EPl至EP9)中选择位于矩形的各个边的最末端的位置的多个端点以获得包括由分类器5分类的多条格子线(也就是说,所有的格子线)的区域。这个包含的区域不需要总是一个矩形,而是可以是多个矩形的组合,如图6B所示。接下来,基于交点(IPl至IP9),该包含的区域被分成多个区域R(图6B)。这些多个区域R包括第一区域RAl至RA4和第二区域RBl至RB9,如图7所示。
[0040]例如,第一区域RAl对应于以图6A所示的四个交点IP1、IP2、IP3和IP4为界的单元格(包括手写字符串“技術力高U”)。同样地,第一区域RA2对应于以四个交点IP2、IP3、IP5和IP6为界的单元格(包括手写字符串“機動力弱
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1