一种识别手写输入的方法及一种电子笔记本的制作方法

文档序号:6613457阅读:207来源:国知局
专利名称:一种识别手写输入的方法及一种电子笔记本的制作方法
技术领域
本发明涉及信息处理技术,特别是涉及一种识别手写输入的方法及一种电 子笔记本。
背景技术
目前市场上存在着种类繁多的电子阅读器,电子阅读器是指一种手持阅读 设备,通过将电脑上的各种电子文档转换为指定的阅读格式并存储,提供电子 文档的阅读功能。支持阅读显示并支持格式转换是绝大多数电子阅读器的必备 功能,而其中部分型号还具有手写识别和批注功能,可以通过手写输入在阅读 文档上标注信息。
这些支持手写识别的电子阅读器(以下简称手写设备)主要通过规则识别 法(基于字体组成结构的识别算法)、统计识别法(基于用字频率和字体特征 相结合的识别算法)、网络神经法(基于神经网络提取字体骨架特征的识别算
法)等识别技术对手写输入信息进行识别处理,基本能达到95%以上的识别率, ^f旦广泛存在如下缺点
其一,绝大多数手写设备采用单字级识别和词组级识别机制,这种识别机 制类似于电脑输入法,用户输入一个字或一个词组,系统会提示一组候选结果 供用户选择。因此,在识别过程中需要与用户进行大量的交互,而且,由于硬 件限制导致手写识别处理速度较慢,用户在输入和识别过程中存在明显的"停 顿"现象,使用流畅度不足,尤其是在需要快速记录文字信息(如会场听写、 会议笔记、驾驶员听写)的场合,当前的识别设备和识别方案难以令人满意;
其二,目前的手写设备难以一次性做到100°/0的识别正确率,当出现识别 错误时,必须人工干预进行修改和确认,而这种交互同样会产生"停顿,,现象, 影响手写记录效率。

发明内容
本发明所要解决的技术问题是提供一种识别手写输入的方法及一种电子 笔记本,以解决目前支持手写识别的电子阅读器在识别过程中存在"停顿"现象,影响手写记录效率的问题。
为解决上述技术问题,根据本发明提供的具体实施例,本发明公开了以下
技术方案
一种识别手写输入的方法,包括
将原始手写输入信息转换为可识别处理的笔迹信息记录,并保存; 同时,对所述笔迹信息记录不^:识别处理,而即时将其还原得到原始手写 输入信息并显示;
当输入批量信息后,利用识别算法对所述笔迹信息记录进行批量识别。 优选的,所述方法还包括利用单字识别算法对所述批量识别结果进行后 期修改。
优选的,所述批量识别过程还结合词组联合识别、上下文识别、容差纠错、 异常输入处理机制。
一种电子笔记本,包括
显示处理模块,用于将原始手写输入信息转换为可识别处理的笔迹信息记
录;同时,对所述笔迹信息记录不^L识别处理,而即时将其还原得到原始手写
输入信息并输出到显示设备上;
批量识别模块,用于利用识别算法对所述笔迹信息记录进行批量识别;
存储器,用于存储笔迹信息记录、识别算法、批量识别结果。
优选的,所述存储器包括笔迹信息库,用于存储笔迹信息记录;文档库,
用于存储批量识别结果;识别支持库,用于存储识别算法。
优选的,所述识别支持库还存储用于词组联合识别、上下文识别、容差纠
错、异常输入处理的识别帮助信息,所述批量识别模块结合各种帮助信息进行
批量识别。
优选的,所述电子笔记本还包括单字识别模块,用于利用识别支持库中 存储的单字识别算法对文档库中的批量识别结果进行后期修改。 根据本发明提供的具体实施例,本发明公开了以下技术效果 首先,针对目前的手写设备农然大规模釆用单字识别技术,本发明实施例 提供了一种新颖的手写输入识别方法,采用"即时记录,后期识别"模式,先将 手写输入转换为设备可识别处理的笔迹信息记录并保存,作为后期识别处理的
依据,同时将采集到的原始输入信息不做识别处理而直接反馈到显示设备上,供用户在手写过程中阅读,而保存的笔迹信息记录在后期再进行批量识别处 理。由于在手写记录过程中不需要进行即时识别和确认,减少了单字识别的独 立处理,而用户又完全能够阅读本人的手写字体,所以在记录过程中不需要同 设备频繁交互,极大减少了记录过程中的停滞时间,用户的使用流畅感大大增 强。
而且,后期的批量识别过程也不需要与用户交互,所以对用户使用不造成 影响。批量识别后,用户可对识别结果进行确认和调整修改,对于个别误识结 果,用户可以进行删除或再输入操作,并通过单字识别技术予以确认。用户在 整个记录识别过程中仅需要进行极少量的交互确认即可获得较为满意的识别 效果,真正实现了 "批量识别,个别纠错"。
其次,本方案在单字识别技术基础上进行多字批量识别,结合词组联合识 别、上下文识别、容差纠错等算法,并对连笔、相似字、不规范笔顺、手写干 扰等异常输入进行分析处理,整体文档的识别准确率能显著提高,识别准确率
(接近99% )较传统的OCR ( Optical Character Recognition,光学字符识别) 批量识别技术(约95%)得到实质性的提高。
再次,本方案在处理数据量和处理速度上比OCR识别技术具有更大的优 势。OCR技术是将原始输入信息作为图像通过扫描进行识别处理,而图像占 用存储空间大,因此影响处理速度。而本方案是将原始输入信息转换为笔迹信 息记录进行存储,并通过转换的逆过程还原得到原始输入来即时显示。 一方面, 笔迹信息记录比图像数据节省存储空间;另一方面,根据笔迹信息记录还原得 到原始输入的过程比扫描图像得到原始输入的速度快。


图1是本发明实施例所述识别手写输入的方法流程图2是本发明实施例所述一种电子笔记本的硬件框架示意图3是图2所示电子笔记本中显示处理模块21的转换结果示意图4是图2所示电子笔记本中识别处理模块22的识别结果示意图。
具体实施例方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和
具体实施方式
对本发明作进一步详细的说明。
针对目前的手写设备依然大规模釆用单字识别技术带来使用"停顿"的现 象,本发明实施例提供了一种新颖的手写输入识别方法,采用"即时记录,后 期识别"模式,先将手写输入转换为设备可识别处理的笔迹信息记录并保存, 作为后期识别处理的依据,同时将采集到的原始输入信息不做识别处理而直接 反馈到显示设备上,供用户在手写过程中阅读,而保存的笔迹信息记录在后期 再进行批量识别处理。批量识别后,用户可对识别结果进行确认和调整修改, 对于个别误识结果,用户可以进行再输入,并通过单字识别技术予以确认。
参照图1,是本发明实施例所述识别手写输入的方法流程图。
步骤IOI,手写输入。
用户通过电子笔等输入设备(或手触方式),在手写设备的显示屏上进行 各种文字及图形的手写输入。
步-骤102,信息转换。
在信息转换过程中,设备获取手写过程中的笔尖信息(或手指轨迹),并 按时间釆样后进行转换处理,转换为设备可以识别并处理的笔迹信息记录。所 述笔迹信息记录主要包括笔尖在不同时间段的轨迹、长度,以及在特定时间点 的位置、方向等信息。经过转换处理后,每个独立字得到一组对应的转换后笔 迹信息记录,这些记录可被识别算法处理,是后期批量识别的重要依据。
步骤103,信息存储及显示。
完成信息转换后,设备将笔迹信息记录进行保存,用于后期批量识别。同 时,执行上述转换过程的逆过程,根据笔迹信息记录得到原始输入信息,即用 户的手写字体;此时对原始输入不做识别处理而直接输出到显示设备上,供用
户在手写过程中阅读。
识别的独立处理,而用户又完全能够阅读本人的手写字体,所以在手写输入过 程中用户不需要同设备频繁交互,极大减少了记录过程中的停滞时间,用户的 使用流畅感大大增强。
而且,上述对用户原始输入信息的转换处理是本实施例的优选方案,在处
理数据量和处理速度上比OCR识别技术具有更大的优势。传统对原始输入的处理方法是采用OCR识别技术,OCR识别技术是利用摄像头采用光学拍摄的 方式将文字资料转变成图像文件,然后通过OCR系统识别^:件将图像文件转 换成可随意修改、编辑的文件资料的过程。由此可知,OCR技术是将原始输 入信息作为图像通过扫描进行识别处理,而图像占用存储空间大,因此影响处 理速度。而本方案是将原始输入信息转换为笔迹信息记录进行存储,并通过转 换的逆过程还原得到原始输入来即时显示。 一方面,笔迹信息记录比图像数据 节省存储空间,当用户输入量比较大的情况下,这一点显得更为重要;另一方 面,根据笔迹信息记录还原得到原始输入的过程,比通过扫描图像得到原始输 入的处理速度要快。
步骤104,后期批量识别。
当用户停止输入后,可以对一段时间内输入的信息进行批量识别。批量识 别基于单字识别技术,并结合其他识别机制,对已转换存储的笔迹信息记录进 行批量处理。在批量识别过程中,首先通过与上述转换方法相匹配的识别方法, 根据笔迹信息记录确定组成字符的笔画;然后,利用规则识别法(基于字体组 成结构的识别算法)、统计识别法(基于用字频率和笔画组合特征等因素的识 别算法)、网络神经法(基于神经网络提取字体骨架特征的识别算法)等单字 识别方法,进行批处理识別。其中,具体的识别技术可以由生产手写设备的厂 商选择并封装到设备中;优选的,用户还可以通过网络下载等形式更新所述具 体识别方法。
优选的,由于批量识别是针对整体文档的辨认识别,所以如果结合原文的 上下文支持、强大的词组联合识别、容差纠错等识别帮助机制,并对连笔、相 似字、不规范笔顺、手写干扰等异常输入进行分析处理,整体文档的识别准确 率能显著提高,识别准确率(接近99%)较传统的OCR批量识别技术(约95%) 得到实质性的提高。同时,由于批量识别过程也不需要用户交互,所以对用户 使用不造成任何影响。这种基于单字识别技术特点的整体批量识别机制能极大 提高文档整体识别率,确保记录成果的有效性和准确性。
优选步骤105,人工确认。
经批量识别处理后,用户可对识别结果进行确认和调整修改。由于再强大 的识别技术也无法保证100%的识别率,所以后期批量识别结果难免存在错误。
7对于个别误识结果,用户可以进行删除或再输入操作,并通过单字识别技术予 以确认。用户在整个记录尔别过程中仅需要进行极少量的交互确认即可获得较 为满意的识别效果,真正实现"批量识别,个别纠错"。
针对上述手写识别方法,本发明实施例还提供了 一种用于批量识别处理的 电子笔记本。参照图2,是所述电子笔记本的硬件框架示意图。
器202和存储器203。其中,中央处理器202的芯片植入显示处理模块21与 识别处理模块22。优选的,为便于管理,存储器203按照信息内容包含文档 库31、笔迹信息库32与识别支持库33。考虑到文档库31、识别支持库33对 设备容量的要求,笔记本的存储体系应有较大的设定量,并允许扩充。
中央处理器202的显示处理模块21主要负责信息转换处理,用于将用户 通过显示及输入设备201输入的手写字体,转换为识别处理模块22可以识别 的笔迹信息记录,并存入笔迹信息库32,供后期批量识别时由识别处理模块 22调用。同时,将用户输入的手写字体输出到显示及输入设备201上显示, 供用户在输入过程中阅读。所述笔迹信息记录主要记录了笔尖在不同时间段的 轨迹、长度,以及在特定时间点的位置、方向等信息,参照图3,是所述显示 处理才莫块21的转换结果示意图。
中央处理器202的识别处理模块22主要负责对笔迹信息记录进行批量识 别,并将用户多次修改确认后的最终识别文稿存入文档库31,供用户查阅。 当用户完成记录后发起后期识别处理,识别处理模块22调用笔迹信息库32 中相应的笔迹信息记录,并调用识别支持库33中的相关识别算法进行批量识 别,然后将用户确认的识别文稿存入文档库31中。参照图4,是所述识别处 理模块22的识别结果示意图。
优选的,所述识别支持库33中还保存了上下文识别、词组联合识别、容 差纠错等识别帮助信息,以及对连笔、相似字、不规范笔顺、手写干扰等异常 输入处理的帮助信息,用于识别处理模块22调用。其中,所述词组联合识别 是指支持库33中保存了常用词组以及常用的联合词组,当用户只输入部分词 组时设备也能补充识别。所述上下文识别是指记录整体文档中已经识别出的信 息,当再次出现时根据上下文相关性进行识别利用。识别处理模块22在调用识别算法进行批量识别处理时,如果结合上下文识别、词组联合识别、容差纠 错、异常输入处理等识别帮助信息,将提高识别准确率。
优选的,在用户确认批量识别结果时,对于个别错误结果,还可能调用单
字识别算法进行处理,因此中央处理器202的识别处理才莫块22将单字识别和 批量识别功能分开设置,即包括批量识别单元和单字识别单元。所述批量识别 单元负责上述批量识别处理,所述单字识别单元负责调用识别支持库33中保 存的单字识别算法,对用户重新输入的信息进行识别处理,并更新到文档库 33中。其中,所述识别支持库33中保存的单字识别算法可以是规则识别法(基 于字体组成结构的识别算法)、统计识别法(基于用字频率和笔画组合特征等 因素的识别算法)、网络神经法(基于神经网络提取字体骨架特征的识别算法) 等算法。
优选的,所述电子笔记本还设有外设接口 204,负责与外部设备(如PC
机等)连接并交互。所述外设接口 204可以是USB接口,也可扩展为红外、
蓝牙等无线通讯接口。通过所述外设接口 204,用户可以/人互联网上下载更新 识别支持库33中保存的内容。例如,为提高识别效率,可通过电脑从厂商网
站下载定期更新的识别算法补丁和识别支持库补丁,并替换植入笔记本芯片。 以下举例说明所述电子笔记本的应用
假设一名记者在采访现场用电子笔记本听写记录了近两千字信息,基于本 方案的笔记本通过信息转换和信息存储环节,将记录内容以笔迹信息数据形式 记录在存储介质中供后期识别调用。由于用户能识别自己的字迹特征,因此在 记录过程中无需进行识别判读,笔记本同时将用户笔迹直接显示供用户阅读, 即"所见即所写"。
会议结束后,用户需要对采访记录内容进行处理。用户在电子笔记本上调 出需要处理的记录档案(此时笔记本以用户笔迹方式完整复现手写信息),启 动"后期识别,,功能。识别算法在出产时已植入电子笔记本芯片(以统计识别 法为例),电子笔记本调用识别处理模块对记录档案进行全文档的批量识别处 理。所述统计识别法基于统计学原理,依据用字频率、笔画组合特征等因素对 笔迹信息做出识别决策,识别算法将通过类似电脑输入法词库的帮助库对识别 处理提供决策和容差支持(如加入常用词组库等)。批处理识别后,笔记本把识别结果在显示屏上对用户进行展示,由用户进 行个别识别错误的校正和整体文稿的确认。如某个字识别错误,用户可以通过 交互界面把该字删除,或者重新输入,并以单字识别的方式进行输入和纠正。
综上所述,使用基于单字独立识别的传统电子笔记本批注功能,由于识别
效率太低,用户无法进行有效的大信息量记录;而用户使用基于本方案的电子 笔记本,能在阅读批注、现场记录上获得较高的笔记效率,又能通过后期整体 识别,获得拥有理想正确率的电子笔记内容,而传统笔记本既有的批注、单字 修改识别等功能,均能在本方案产品中得到继承和兼容。
图2所示装置中未详述的部分可以参见图1所示方法的相关部分,为了篇 幅考虑,在此不再详述。
以上对本发明所提供的一种识别手写输入的方法及一种电子笔记本,进行
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于 本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均 会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
10
权利要求
1、一种识别手写输入的方法,其特征在于,包括将原始手写输入信息转换为可识别处理的笔迹信息记录,并保存;同时,对所述笔迹信息记录不做识别处理,而即时将其还原得到原始手写输入信息并显示;当输入批量信息后,利用识别算法对所述笔迹信息记录进行批量识别。
2、 根据权利要求1所述的方法,其特征在于,还包括利用单字识别算 法对所述批量识别结果进行后期修改。
3、 根据权利要求1所述的方法,其特征在于所述批量识别过程还结合 词组联合识别、上下文识别、容差纠错、异常输入处理机制。
4、 一种电子笔记本,其特征在于,包括显示处理模块,用于将原始手写输入信息转换为可识别处理的笔迹信息记 录;同时,对所述笔迹信息记录不做识别处理,而即时将其还原得到原始手写 输入信息并输出到显示设备上;批量识别模块,用于利用识别算法对所述笔迹信息记录进行批量识别; 存储器,用于存储笔迹信息记录、识别算法、批量识别结果。
5、 根据权利要求4所述的电子笔记本,其特征在于所述存储器包括笔 迹信息库,用于存储笔迹信息记录;文档库,用于存储批量识别结果;识别支 持库,用于存储识别算法。
6、 根据权利要求5所述的电子笔记本,其特征在于所述识别支持库还 存储用于词组联合识别、上下文识别、容差纠错、异常输入处理的识别帮助信 息,所述批量识别模块结合各种帮助信息进行批量识别。
7、 根据权利要求5所述的电子笔记本,其特征在于,还包括单字识别 模块,用于利用识别支持库中存储的单字识别算法对文档库中的批量识别结果 进行后期修改。
全文摘要
本发明公开了一种识别手写输入的方法及一种电子笔记本,解决目前支持手写识别的电子阅读器在识别过程中存在“停顿”现象,影响手写记录效率的问题。所述电子笔记本采用“即时记录,后期识别”模式,先将手写输入转换为设备可识别处理的笔迹信息记录并保存,作为后期识别处理的依据,同时将采集到的原始输入信息不做识别处理而直接反馈到显示设备上,供用户在手写过程中阅读,而保存的笔迹信息记录在后期再进行批量识别处理。由于在手写记录过程中不需要进行即时识别和确认,减少了单字识别的独立处理,而用户又完全能够阅读本人的手写字体,所以在记录过程中不需要同设备频繁交互,极大减少了记录过程中的停滞时间,用户的使用流畅感大大增强。
文档编号G06F3/041GK101458583SQ200710172378
公开日2009年6月17日 申请日期2007年12月11日 优先权日2007年12月11日
发明者超 杨, 陈逢源 申请人:中国银联股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1