字符识别装置、字符识别方法以及记录介质与流程

文档序号:31697383发布日期:2022-10-01 06:09阅读:52来源:国知局
字符识别装置、字符识别方法以及记录介质与流程

1.本发明涉及字符识别装置、字符识别方法以及记录介质。


背景技术:

2.提出如下那样的技术:对于手写输入识别的一连串字符串,不需要按要修正的每1字符使其识别候补字符依次显示并进行选择操作而容易地修正为所期望的识别候补字符。(例如日本特开2008-299431号公报)
3.包括日本特开2008-299431号公报记载的技术在内,在成为修正的候补的多个字符中没有所期望的字符的情况下,需要再度进行基于手写的字符识别处理。


技术实现要素:

4.本发明鉴于上述那样的实情而提出,其目的在于,提供能有效活用手写输入的内容且从大的范围的候补接受所期望的字符的选择的字符识别装置、字符识别方法以及记录介质。
5.本发明的一方式特征在于,具备:输入部,其基于手写形式下的输入操作来接受字符图像;字符导出部,其对所述输入部中接受到的字符图像执行识别处理,从该字符图像导出第1字符;和显示控制部,其使所述字符导出部中导出的所述第1字符作为用户所期望的字符的候补显示,所述输入部关于所述第1字符,能接受表示虽不是所述用户所期望的字符但却是与所述用户所期望的字符类似的字符的意思的指定操作,所述字符导出部在由所述输入部接受到所述指定操作时,进一步导出与所述第1字符有给定的关联性的第2字符,所述显示控制部使所述字符导出部中导出的所述第2字符作为所述用户所期望的字符的追加候补显示。
6.发明的效果
7.根据本发明,能有效活用手写输入的内容,从大的范围的候补接受所期望的字符的选择。
附图说明
8.图1是表示本发明的一实施方式所涉及的电子辞典的外观结构的图。
9.图2是表示该实施方式所涉及的电子辞典的电子电路的功能结构的框图。
10.图3是表示该实施方式所涉及的对手写输入的字符的处理内容的流程图。
11.图4是表示该实施方式所涉及的图3的笔画数据补正处理的详细的处理内容的子例程的流程图。
12.图5是例示该实施方式所涉及的手写字符输入和其识别结果的画面的图。
13.图6是表示该实施方式所涉及的导出多个补正笔画数据的过程的图。
14.图7是表示该实施方式所涉及的触控面板式显示部的画面的过渡的图。
15.图8是表示该实施方式所涉及的触控面板式显示部的画面的过渡的图。
16.图9是例示该实施方式所涉及的存储于各种表格存储区域的偏旁型表格的一部分的图。
17.图10是说明该实施方式所涉及的从用户输入的笔画数据导出偏旁型的汉字候补的过程的图。
18.图11是表示该实施方式所涉及的将用户输入的笔画数据置换成最接近的字符形状的构成要素的示例的图。
具体实施方式
19.以下参考附图来说明将本发明运用于电子辞典的情况的一实施方式。
20.[结构]
[0021]
图1是表示该实施方式所涉及的电子辞典10的外观结构的主视图。另外,本实施方式不仅能构成为以下说明的电子辞典10,还能构成为具备辞典功能的平板型的pc(personal computer,个人计算机)、智能手机、电子书、便携游戏机、通信网络上的服务器等。
[0022]
电子辞典10具备其主体壳体11和盖体壳体12能经由铰链部13展开/合上的折叠型壳体而构成。在将折叠型壳体展开的主体壳体11的表面设有包含[主菜单]键14a、功能指定键14b、字符输入键14c、[决定]键14d、[返回]键14e、[box]键14f、光标移动键14g、[切换]键14h等的键输入部14(硬件键)、声音输出部(包含扬声器)15以及声音输入部(包含麦克风)16等。
[0023]
此外,在盖体壳体12的表面设有触控面板式显示部17。触控面板式显示部17是检测电子辞典10的用户用笔、手指触碰的位置的触碰位置检测装置和显示装置成为一体的构造,在带背光灯的液晶画面层叠透明的触控面板而构成。即,触控面板式显示部17作为基于手写形式下的输入操作来接受字符图像的输入部发挥功能。
[0024]
键输入部14的[主菜单]键14a是用于使键输入部14显示主菜单画面的键。虽未特别图示,显示对应于本电子辞典10的初始设定或用户操作而登记的多个图标。各图标是用于实现与该图标的标记对应的功能的图面、记号。例如,包含使利用辞典内容物、学习内容物的功能(应用)直接启动的应用图标、使属于1个类目的多个功能的图标的一览画面显示的分组图标。
[0025]
键输入部14的功能指定键14b是用于直接指定在各键标记的辞典内容物等的键。功能指定键14b中,包含:特意不确定辞典内容物的类目的[多辞典]键、指定该类目的键([日语]键、[古语]键、[汉日]键、[英英日]键等)、和使辞典内容物一览显示的[内容物一览]键、作为工具的1个类目的[学习簿]键。
[0026]
此外,键输入部14的键通过在接着操作[切换]键14h后进行操作,不是作为在该键顶无框标记的键发挥功能,而是作为框住标记的键发挥功能。例如,若在[切换]键14h的操作后操作[删除]键,则不是作为[删除]键发挥功能,而是作为[设定]键发挥功能。
[0027]
在图1中,示出选择[日语辞典]、在位于触控面板式显示部17的上部的检索字符串输入部41选择假名输入标签(
あいう
)、字母输入标签(abc)当中假名输入标签的状态。
[0028]
在检索字符串输入部41已经输入了字符串[日光]。在检索字符串输入部41下部的候补显示部42,示出列表显示与字符串[日光]对应的例如3个词条的状态。进而,在候补显
示部42的下部显示2字符的量的手写字符输入部43,为了等待接着字符串[日光]的字符的手写输入,而示出成为空白的状态。
[0029]
图2是表示电子辞典10的电子电路的功能结构的框图。
[0030]
电子辞典10的电子电路具备作为计算机的控制部(cpu:central processing unit,中央处理器)21。控制部21遵循预先存储于闪速rom等存储部22的控制程序来控制电路各部的动作。cpu等处理器可以是1,也可以是个以上。
[0031]
另外,控制程序以及后述的辞典数据的至少一方可以从存储卡等外部记录介质23由记录介质读取部24读取并存储到存储部22,也可以将经由通信部25从外部的未图示的网络上的web服务器等下载的部分存储到存储部22。
[0032]
在控制部21经由数据总线以及控制总线除了连接存储部22、记录介质读取部24、通信部25以外,还连接键输入部14、声音输出部15、声音输入部16、触控面板式显示部17。
[0033]
存储部22除了存储负责本电子辞典10的整体的动作的系统程序、用于经由通信部25与外部的设备通信连接的通信程序以外,还确保了检索处理程序存储区域22a、辞典数据存储区域22b、检索历史记录存储区域22c、作业数据存储区域22d等存储用于由本电子辞典10执行各种功能的程序、数据的存储区域。
[0034]
检索处理程序存储区域22a是存储控制程序、执行与词条的字符输入以外的输入相应的检索时使用的各种表格存储区域22a1等的区域,其中,该控制程序基于在辞典数据存储区域22b中作为辞典数据存储的各种辞典内容物(英英日辞典/英和辞典/日英辞典/英英辞典/日语辞典/百科事典/...),来检索用户所期望的词条和与该词条对应的译词、词义、用例、解说等说明信息并使其显示。
[0035]
在各种表格存储区域22a1中,存储包含预先确定对汉字的各字符数据能怎样分割成为构成要素的部首的偏旁型表格的多个表格。
[0036]
在检索历史记录存储区域22c中,在遵循与用户操作相应的检索将词条和其说明信息作为检索结果来显示时,将设为检索对象的词条和其检索次数的信息一起作为检索历史记录来存储。
[0037]
在作业数据存储区域22d中,伴随由控制部21实施的遵循控制程序的电路各部的动作的控制,根据需要暂时存储(保持)对应于用户操作而输入的数据、由控制部21取得或生成等的各种数据。
[0038]
通信部25例如除了基于无线pan(personal area network,个人局域网)技术之一的ble(bluetooth(注册商标)low energy)标准来与存在于周围的同样的电子辞典等外部设备无线连接以外,还经由无线路由器等与外部的未图示的网络上的web服务器等无线连接,从而下载控制程序等。
[0039]
[动作]
[0040]
接下来说明本实施方式的动作。
[0041]
在本实施方式中,说明在日语辞典的功能选择时对手写输入的字符图像识别的结果不是用户所期望的汉字的情况的修正处理的动作。
[0042]
在此,例如说明如下情况:通过手写输入将字符串[日光]的字符图像输入作为检索字符串并如所期望那样识别,接着同样通过手写输入将字符[浴]的字符图像输入,在所输入的字符图像的识别结果的字符候补中没有所期望的字符[浴]。
[0043]
图5的(a)表示从图1所示的触控面板式显示部17的显示状态进一步由电子辞典10的用户用手写笔p在手写字符输入部43笔写输入字符[浴]的字符图像的情况的画面。
[0044]
如图示那样,手写字符输入部43具有2字符的量的输入区。另一方面,例如在左侧进行手写的笔写输入后,在右侧使用手写笔p指示对该输入字符的识别处理的执行。
[0045]
与利用手写笔p的识别处理的执行指示对应,控制部21执行字符识别处理,按照评价为类似度从高到低的顺序将识别结果即字符候补列表显示。即,控制部21作为字符导出部和显示控制部发挥功能,其中,字符导出部对输入部中接受到的字符图像执行识别处理,从该字符图像导出第1字符,显示控制部使字符导出部中导出的第1字符作为用户所所期望的字符的候补来显示。
[0046]
图5的(b)表示对候补字符显示部44中评价为类似度高的汉字候补进行列表显示的状态。由于在该候补字符显示部44内,不含所期望的汉字[浴],因此用户需要进行用于对手写输入的字符的修正的操作。
[0047]
图3是表示控制部21所执行的对手写输入的字符的处理内容的流程图。
[0048]
在处理最初,控制部21取得作为识别结果而符合的候补字符的信息(步骤s101),如图5的(b)所示那样,对这些候补的字符在候补字符显示部44进行列表显示。
[0049]
从对该汉字候补进行列表显示的状态起,控制部21通过重复判断是否对认为最接近的一个候补(步骤s103)进行了长按操作、是否选择了一个候补(步骤s107)、是否进行了对列表显示的取消的操作(步骤s109),来等待进行这任意一者的输入。
[0050]
在步骤s107,在判断为进行了对列表显示的取消的操作的情况下(步骤s109“是”),控制部21在此结束图3的处理。
[0051]
图7的(a)揭示了从图5的(b)所示的触控面板式显示部17的画面起由用户用手写笔p长按操作了手写字符输入部43中的汉字候补[洽]的状态。
[0052]
在步骤s103,在判断为进行了对1个候补的长按操作的情况下,控制部21为了根据手写输入的原本的输入笔画数据和视作类似度最高而选择的候补的汉字的字符形状来导出多个补正笔画数据,执行笔画数据补正处理(步骤s104)。
[0053]
图6是例示导出多个补正笔画数据的过程的图。将图6的(a)所示的手写输入的字符的笔画数据和图6的(b)所示的用户所选择的判断为最接近而选择的字符[洽]的形状合起来,控制部21导出图6的(c)所示的补正笔画数据1和图6的(d)所示的补正笔画数据2。
[0054]
图4是表示控制部21在步骤s104执行的笔画数据的补正处理的详细的子例程的流程图。在其最初,扫描用户的输入笔画数据,导出包含外形框、空白信息、密集信息的字形解析数据(步骤s201)。
[0055]
控制部21,基于导出的字形解析数据来参考存储于各种表格存储区域22a1的偏旁型表格,导出针对用户所输入的笔画数据的偏旁型候补(步骤s202)。
[0056]
图9是例示存储于各种表格存储区域22a1的偏旁型表格的一部分的图。如该图所示那样,汉字的部首结构能分类成图9的(a)所示的由“偏”和“旁”构成的结构、图9的(b)所示的由“冠”和“脚”构成的结构、图9的(c)所示的包含“绕”的结构、图9的(d)所示的包含“垂”的结构、图9的(e)所示的包含其他的“构”的结构、图9的(f)所示的其他不划分为部首的结构等。
[0057]
图10是说明从用户输入的笔画数据导出偏旁型的汉字候补的过程的图。如图10的
(a)所示那样,对于图5的(a)、图6的(a)所示的用户输入的笔画数据,在上下方向和左右方向上,分别以一个方向依次进行扫描。
[0058]
图10的(b)表示根据扫描的结果来导出基于字符图像的疏密的笔画数据的外形框of、空白信息si、密集信息ci的结果。根据这些导出结果,如图10的(c)所示那样,识别为图9的(a)所示的由偏rix1和旁rix2这2个部首构成的结果,考量长按操作的汉字候补来导出类似度高的偏旁型候补。
[0059]
在图10的(c)中,识别为用户输入的笔画数据是图9的(a)所示的由“偏”和“旁”构成的结构,另一方面,在图7的(a)中,用户用手写笔p在手写字符输入部43中手写输入的汉字候补[洽]也是图9的(a)所示的由“偏”和“旁”构成的结构。如此地,在根据手写输入的字符图像判断出的偏旁型、和视作更接近于字形而选择的字符的偏旁型一致的情况下,将偏旁型候补限定在1个。另一方面,在根据手写输入的字符图像判断的偏旁型和视作更接近于字形而选择的字符的偏旁型不一致的情况下,将各个偏旁型导出,作为偏旁型候补。即,导出2个偏旁型候补的控制部21,从导出的偏旁型候补中选择未选择的一个候补(步骤s203)。控制部21若选择了一个未选择的候补、例如图9的(a)所示的“偏”和“旁”,例如就根据[偏]和[旁]导出[2],作为针对该选择的偏旁型候补的笔画数据的构成要素数(步骤s204)。
[0060]
接着,控制部21选择用户输入的构成要素之一、例如[偏](步骤s205)。控制部21对于所选择的构成要素[偏]选择一个用户所选择的最接近的字符[洽]的构成要素,例如[三点水](步骤s206)。
[0061]
控制部21进一步对于该选择的构成要素例如[三点水]判断是否能省略后述的置换等处理(步骤s207)。这是为了通过设置不在“旁”的构成要素配置“偏”的构成要素等制约、来减轻不需要的用户输入的笔画数据和最接近字符的各构成要素的置换等处理工序的处置。
[0062]
在步骤s207,例如在以用户输入的笔画数据选择的构成要素为[偏]、以最接近字符[洽]选择为构成要素的为[旁]侧的[合]的情况下等,判断为能省略(步骤s207“是”),控制部21视作省略针对在该时间点选择的构成要素的处理,返回步骤s206起的处理,进行下一最接近的字符形状的构成要素的选择。
[0063]
此外,在步骤s207,在判断为不能省略所选择的构成要素的情况下(步骤s207“否”),控制部21将例如以用户输入的笔画数据选择的[偏]侧的构成要素置换为最接近字符[洽]的相同的构成要素[三点水](步骤s208)。然后,将基于置换的构成要素的汉字候补作为补正笔画数据进行保存(步骤s209)。
[0064]
控制部21通过判断是否结束了全部最接近的构成要素的选择,来确认:有未选择的最接近的字符的构成要素,且并不是选择了全部最接近的构成要素结束后(步骤s210)。
[0065]
在步骤s210,在判断为未结束全部最接近的构成要素的选择的情况下(步骤s210“否”),返回步骤s206起的处理,执行与最接近的字符的其他构成要素对应处理。
[0066]
如此地,关于用户输入的笔画数据的构成要素[旁]侧,执行置换成最接近字符[洽]的[旁]侧的构成要素[合]来设为补正笔画数据的处理。
[0067]
在步骤s210,在判断为全部最接近字符的构成要素的选择结束且没有未选择的最接近字符的构成要素的情况下(步骤s210“是”),控制部21通过判断是否结束了用户输入的笔画数据的全部构成要素的选择,来确认:有未选择是构成要素,且并非选择全部构成要素
结束后(步骤s211)。
[0068]
在步骤s211,在判断为用户输入的笔画数据的全部构成要素的选择未结束、且有未选择的构成要素的情况下(步骤s211“否”),控制部21返回步骤s205起的处理,对用户输入的笔画数据的其他构成要素执行同样的处理。
[0069]
此外,在步骤s211,在判断为用户输入的笔画数据的全部构成要素的选择结束、且没有未选择的构成要素的情况下(步骤s211“是”),控制部21通过判断是否结束了全部偏旁型候补的选择,来确认:有未选择的偏旁型候补,且并不是全部候补的选择结束后(步骤s212)。
[0070]
在步骤s212,在判断为并未结束全部偏旁型候补的选择的情况下(步骤s212“否”),控制部21返回步骤s203起的处理,执行基于未选择的偏旁型的候补的同样的处理。
[0071]
此外,在步骤s212,在判断为结束了全部偏旁型候补的选择的情况下(步骤s212“是”),控制部21在此结束与图4的笔画数据的补正处理相关的子例程,返回图3的主例程。
[0072]
如前述那样,在根据手写输入的字符图像判断的偏旁型和视作更接近于字形而选择的字符的偏旁型一致的情况下,将偏旁型候补限定在1个。
[0073]
另一方面,在根据手写输入的字符图像判断的偏旁型和视作更接近于字形而选择的字符的偏旁型不一致的情况下,由于导出2个偏旁型候补,因此重复执行步骤s203以后的处理。
[0074]
图11表示与由用户在触控面板式显示部17的候补字符显示部44长按操作的字符[洽]对应地,将用户输入的笔画数据置换成偏旁型的最接近的字符的构成要素的补正笔画数据的示例。针对用户输入的笔画数据,图11的(a)是所选择的最接近的字符形状的汉字候补[洽]。与其偏rix1即[三点水]对应的部分成为图11的(c)所示的补正笔画数据2,同样,与其旁rix2即[合]对应的部分成为图11的(b)所示的补正笔画数据1。在该图11中,最终的补正笔画数据数成为[2],对它们进行后述的字符识别处理。
[0075]
在图3中,在步骤s104中执行笔画数据的补正处理后,依次执行针对多个补正数据的手写识别处理,导出作为针对多个补正数据的识别结果的补正汉字候补(步骤s105)。
[0076]
控制部21在对导出的补正汉字候补重新在触控面板式显示部17进行列表显示的基础上(步骤s106),为了等待对该显示的汉字候补的操作,返回步骤s103起的处理。
[0077]
图7的(b)是例示从在图7的(a)中通过用手写笔p进行长按操作而选择了汉字[洽]的状态起、通过前述的一系列处理来参考手写输入的笔画数据使汉字候补显示的状态的图。在图7的(b)中,将补正汉字候补显示部45的中心设为所选择的汉字[洽]的位置,在其左侧45a列表显示与旁[合]对应的2个汉字候补[哈]、[恰],同样,夹着汉字[洽]在其右侧45b列表显示2个汉字候补[浴]、[沿]。左侧45a的2个汉字候补[哈]、[恰]显示的是对图6的(c)所示的补正笔画数据1执行步骤s105中的手写识别处理而导出的候补。另一方面,右侧45b的2个汉字候补[浴]、[沿]显示的是对图6的(d)所示的补正笔画数据2执行步骤s105中的手写识别处理而导出的候补。
[0078]
在该情况下,也可以通过将相同偏旁型的汉字彼此例如[哈]和[恰]、[浴]和[沿]分别用相同颜色的框包围进行显示,来表现是相同的偏旁型。
[0079]
此外,并不限于颜色,通过进行区分显示,以使得能按每个相同的偏旁型视觉地识别框线的种类、显示位置等,用户能容易地理解字符识别的结果。
[0080]
在电子辞典10的用户在列表显示的汉字候补中找到所期望的汉字的情况下,该用户通过触碰操作来选择该所期望的汉字。
[0081]
控制部21如图3中前述的那样,通过重复判断是否长按操作了认为最接近的一个候补(步骤s103)、是否选择了一个候补(步骤s107)、是否进行了对列表显示的取消的操作(步骤s109),来等待进行这任意一者的输入。
[0082]
因此,在通过触碰操作选择了用户所期望的一个字符的情况下,控制部21在步骤s107判断为选择了一个候补(步骤s107“是”),确定所选择的汉字候补,将接着已经输入的字符串进行输入(步骤s108),以上结束图3的处理。
[0083]
图8的(a)表示从图7的(a)的显示状态起触碰操作了补正汉字候补显示部45的右侧45b的汉字候补[浴]的状态。与该触碰操作对应,控制部21将汉字候补[浴]确定为是接着已经在检索字符串输入部41输入的字符串[日光]的字符。
[0084]
因此,如图8的(b)所示那样,在检索字符串输入部41中,从暂时的输入状态的包含误识别的字符[信]的字符串[日光信]取代成伴随补正处理而确定的结果[日光浴]。同时,在手写字符输入部43中,为了准备汉字确定后的下一次手写输入,将显示内容清空。
[0085]
如此地,在未通过手写输入识别到所期望的汉字的情况下,例如也通过对认为最接近识别结果的其他字符进行长按操作等操作,作为与通常的触碰操作不同的操作,来将用户输入的笔画数据按汉字的每个部首分解来得到补正笔画数据,并重新进行字符解析。为此,即使在手写输入的汉字的一部分以多少不正确的形式输入的情况下,也能对其进行补正从而提升能得到所期望的汉字的可能性,能有利于手写输入的效率化。
[0086]
另外,例如在日语辞典等辞典功能选择时,针对在用户作为词条的一部分而输入的检索字符串中手写输入的字符,在考虑其前后已经输入的字符串的基础上,关于认为不会成为候补的字符,通过从候补除外,由此能避免过分地列表显示大量的候补。
[0087]
此外,在图7的(b)以及图8的(a)所示的触控面板式显示部17的显示画面中,在不管在补正汉字候补显示部45的汉字候补45a、45b的哪个都依然未显示所期望的汉字的情况下,再度从它们当中选择认为形状最接近的字符并进行长按操作,由此重复执行图4所示的笔画数据的补正处理。
[0088]
进而,在即使通过长按操作重复选择好几次认为形状接近的汉字也未显示所期望的汉字作为候补的情况下,还考虑在手写字符输入部43再度进行手写输入自身。在这样的再度的手写输入时,通过进行降低之前作为候补显示的同时未作为所期望的字符选择的字符的作为候补的出现率这样的选择处理,能提升识别的精度。
[0089]
[实施方式的效果]
[0090]
根据以上详述那样的本实施方式,能有效活用手写输入的内容,从而从大的范围的候补接受所期望的字符的选择。
[0091]
此外,特别在本实施方式中,将用户手写输入的笔画数据导出为偏旁型的候补,从而得到补正笔画数据,其中,该偏旁型的候补基于的是参考存储于各种表格存储区域22a1的偏旁型表格来解析能怎样分割每个部首的构成要素的结果。通过采用这样的处理过程,虽然其他也可以例如一并执行进行基于字符识别处理中的学习、机器学习数据等的加权的图像处理,但无论如何,都能减轻控制部21中的电路处理的负担,从而更迅速地取得识别结果。
[0092]
此外,本实施方式中虽未说明,但在用户最终选择所期望的字符的候补时,也可以将该选择的字符和手写输入的字符分别对应于偏旁型进行分割,按分割的每个部位将其对应关系作为学习数据更新存储到各种表格存储区域22a1。在该情况下,各种表格存储区域22a1作为存储部发挥功能,其存储表示将手写输入的字符分割的部位与成为确定结果的字符的对应的部位的关联性的信息,作为在控制部21重新进行字符识别时所用的信息。在下次以后的手写输入的字符识别时包含同样的笔迹的情况下,通过对应于学习的内容自动进行补正,使用得越多则越能学习用户的手写的习惯,能更提高识别率。
[0093]
此外,本技术发明并不限定于上述实施方式,在实施阶段,能在不脱离其要旨的范围内进行种种变形。此外,各实施方式可以尽可能适宜组合来实施,在该情况下,能得到组合的效果。进而,在上述实施方式中包含各种阶段的发明,能够通过公开的多个构成要件中的适当的组合提取各种发明。例如在即使从实施方式所示的全构成要件删除几个构成要件也能解决发明要解决的课题的栏中叙述的课题、也能得到在发明的效果的栏叙述的效果的情况下,该删除了构成要件的结构也能作为发明来提取。
[0094]
此外,上述的各种程序能作为能使计算机执行的程序存放到存储卡(rom卡、ram卡等)、磁盘(floppy(注册商标)盘、硬盘等)、光盘(cd-rom、dvd等)、半导体存储器等非临时的计算机可读的记录介质并进行分发。并且,电子设备的控制部(cpu)将记录于该记录介质的程序读入到存储装置,通过用该读入的程序控制动作,能实现上述的实施方式中说明的各种功能。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1