字符识别设备、方法和程序的制作方法

文档序号:8367487阅读:516来源:国知局
字符识别设备、方法和程序的制作方法
【专利说明】字符识别设备、方法和程序
[0001]相关申请的交叉引用
[0002]此申请基于2012年9月26日提交的2012-213199号日本专利申请并要求其优先权的利益,其全部内容通过引用被合并到本文中。
技术领域
[0003]在这里描述的实施例一般地涉及一种字符识别设备、方法和程序。
【背景技术】
[0004]使用,例如,笔输入的手写字符输入方案已经被广泛地利用。按照不仅个人数字助理(PDA)终端,而且智能电话、平板计算机、游戏机等等的发展,具有笔输入功能的设备的数目正在增大。
[0005]在这种情况下,用户能够使用通过电子地跟随纸张和笔被获得的直观的输入工具来容易地创建文档。然而,不同于使用诸如键盘的工具直接地输入文本数据的情况,由以上提到的输入工具创建的文档的文本或字符串不能被直接地搜索。总的来说,为了作为数字数据处理文档,必须在手写文档上进行字符识别。
[0006]在输入手写字符的时候,特别是,在自由的布局中,要求识别准确度的增强。存在对于其中打印字符和手写字符被混合的文档采用的方法。这个方法包括从手写字符中区分打印字符,然后使具有比较高的识别准确度的打印字符经受光学字符识别(OCR),并且如果用于手写字符的识别候选被包括在OCR结果中,则采用OCR结果。结果,能够增强手写字符的识别准确度。
[0007]引证列表
[0008]专利文献
[0009]专利文献1:JP-A 2006-92097
[0010]专利文献2: JP-A 2002-259912
【附图说明】
[0011]图1是图解字符识别设备的方框图;
[0012]图2是图解用户词典生成单元的操作的流程图;
[0013]图3是图解在用户词典生成单元中的提取处理的实例的视图;
[0014]图4是图解根据该实施例的用户词典的实例的视图;
[0015]图5是图解字符分离估算单元的操作的流程图;
[0016]图6是图解在字符分离估算单元中的检测和估算处理的实例的视图;
[0017]图7是在字符分离估算单元中的字符类型估算处理的实例;
[0018]图8是图解格子框架生成单元和格子框架查找单元的操作的流程图;
[0019]图9是对解释手写字符和笔划之间的关系有用的视图;
[0020]图10是图解字符段和笔划数据之间的关系的视图;
[0021]图11是图解格子框架结构的实例的视图;
[0022]图12是图解其中精确地进行字符识别处理的实例的视图;以及
[0023]图13是图解与当进行字符识别时的目标文本数据相联系的字符识别结果的视图。
【具体实施方式】
[0024]当对基于页面创建的手写文档进行字符识别时,如果一行字符串被简单地检测并经受字符识别,则与页面的布局相联系的符号(例如,用于逐条记载的索引符号“*”)可以与字符的一个笔划混合。更进一步,对于技术术语,诸如公司部门的简称、公司词条和标记,字符识别的精确度不会简单地通过应用一般的N-gram或语言模型被改进。
[0025]总的来说,根据一个实施例,字符识别设备包括第一生成单元、估算单元、第二生成单元和查找单元。第一生成单元被配置成,通过从由用户创建或由用户使用的文本数据项中的至少一个文本数据项中提取字符,来生成用户词典,在用户词典中将字符登记为偏爱的字符。估算单元被配置成基于目标文本的布局和标记信息中的至少一个来估算字符之间的第一分离,该目标文本是用于识别处理的文本,该标记信息与附加于该目标文本的标记有关。第二生成单元被配置成通过基于第一分离估算由笔划表示的字符段来生成格子框架结构,该格子框架结构是由字符段和字符段之间的路径形成并且与包括在提供该布局的块中的第一字符串有关。查找单元被配置成,如果格子框架结构包括对应于该偏爱的字符的路径,则在该格子框架结构中查找路径以获得字符识别结果。
[0026]现在参考附图,将详细地描述根据实施例的字符识别设备、方法和程序。
[0027]参考图1的方框图,将描述本实施例的字符识别设备100。
[0028]字符识别设备100包括文本数据收集单元101、用户词典生成单元102、用户词典存储器103、布局分析单兀104、字符分尚估算单兀105、格子框架生成单兀106、格子框架查找单元107和输出单元108。
[0029]文本数据收集单元101收集由用户创建的打印文档数据和在浏览的过程中所利用的打印文档数据。使用另一个设备或应用程序进行这些数据项的收集。也就是,打印文档数据包括通过使用邮寄者应用程序所创建的文档、和通过使用文档编辑应用程序所创建的文档。
[0030]文本数据收集单元101也收集包括在特定的域文档中的打印文档数据,诸如商务数据。特定的域文档是在用户归属的组织、或用户使他们自己从事于其中的领域中所利用的文档。这类文档包含用户经常看见的词条,与他们是否实际地创建或利用该文档无关。包含在该特定的域文件中的词条包括,例如,部门的简称、公司词条和标记、以及在该技术领域中的技术术语。文本数据收集单元101进一步地收集由用户手写的文档数据。手写文档数据包括,例如,通过使用,例如,笔装置或手指经由触摸面板手写输入的数据、以通过OCR处理的图像的形式输入的手写数据、诸如对打印文档数据中的文本作出的下划线或包围线的标记数据、以及以边缘上的注释的形式输入的数据。以下,除非另有说明,否则打印文档数据和手写文档数据将被共同地称为文本数据。
[0031]用户词典生成单元102从文本数据收集单元101中接收一个以上文本数据项以从一组文本数据或包括在手写文档中的打印文档数据中提取字和符号,从而生成其中提取的字和符号被记录为偏爱的字符的用户词典。偏爱的字符之一是,例如,以高频率出现在文档中的字符。随后将参考图2描述生成用户词典的处理。
[0032]用户词典存储器103从用户词典生成单元102中接收用户词典、并存储它。用户词典存储器103也从随后描述的字符分离估算单元105中接收项目符号字符,并将它存储为偏爱的字符。项目符号字符是与整页布局相联系的符号,并且是,例如,诸如中点“籲”的索引符号。
[0033]布局分析单元104外部地接收文本数据作为处理目标、与划线和行相联系地分析目标文本数据、并且提取布局分析结果和指示附加于目标文本数据的标记的标记信息。目标文本数据是字符识别的目标。布局分析结果和标记信息的提取是通过,例如,估算图表区域和字符区域、并且将区域划分为行,从而分析对该文本所做的标记来进行的。在布局分析单元104中的提取处理能够利用已知的笔划处理或OCR处理被进行,因此不会详细描写。
[0034]字符分离估算单元105从布局分析单元104接收布局分析结果、标记信息和目标文本数据,并且估算在多个行中共同的项目符号字符和符号以获得估算结果。字符分离估算单元105可以估算表格中的字符的类型,并且将估算的字符类型包括在估算结果中。字符类型包括汉字字符、日语假名字符、数字、字母表等等。
[0035]格子框架生成单元106从字符分离估算单元105中接收估算结果和目标文本数据,并且从布局分析单元104中接收布局分析结果和标记信息。格子框架生成单元106估算由形成字符的笔划表示的字符段,并且生成格子框架结构(也称为图形)。格子框架结构指示字符段之间的结合关系,其是由对应于字符本身或部分字符(例如,“左手的部首”或“右手的部首”)的字符段和字符段之间的路径实现的。
[0036]格子框架查找单元107从格子框架生成单元106接收格子框架结构。格子框架查找单元107参照存储在用户词典存储器103中的偏爱的字符。如果存在对应于该偏爱的字符的路径,则查找该
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1