一种自动切分电子化笔记本中手写条目的方法

文档序号:6383270阅读:222来源:国知局
专利名称:一种自动切分电子化笔记本中手写条目的方法
技术领域
本发明属于电子计算机技术领域,涉及一种自动切分电子化笔记本中手写条目的方法。
背景技术
在日常生活中,人们经常需要拍摄纸质文档,保存成JPEG格式的照片,或者生成PDF格式的文档,从而实现纸质文档的电子化,方便管理。智能手机就是常用的将纸质文档电子化的工具之一。因为智能手机上一般都带有摄像头,利用手机上的摄像头可以拍摄纸质文档,并将拍摄得到的电子文档进行一定的图像处理后再转换成JPEG格式的照片,或者生成PDF格式的文档。具备上述功能的应用软件也已经比较普及了,如苹果应用商店和google应用商店中的应用CamScanner。这些应用软件可以从拍摄的图像中自动监测出所拍摄文档的四条边,以此为基准切除图像中文档区域外面的背景,并对文档区域进行校正和图像增强等处理,获得一个类似于用扫描仪扫描得到的整洁干净的电子化文档的效果,以用户指定的格式进行保存和管理。常见的需要进行电子化的纸质文档是纸件笔记本页面,长期以来人们经常用纸件笔记本来做各种记录,如会议记录,备忘事项记录等等,一本纸件笔记本中会有几十甚至上百页纸,而且同一类型的笔记本,其所有用来记录的纸页的样式一般是统一的。在实际使用中,用户经常需要在笔记本上用手写方式记录下一个个的条目,比如说一个用户在笔记本页面上分成3行写下周末可能的活动选项1、逛街,2、看电影,3、去公园;拍摄了这个笔记本页面的图像进行电子化以后,用户在这3个选项中做出了决定,选择2、看电影,他需要把这个决定保存到待办事项中去就需要在电子设备中再输入一次文字,这就很不方便。理想的做法是用户只要在电子设备上显示出来的这个笔记本页面的电子化文档中点击一下“2、看电影”,笔迹所在的区域就自动把包含“2、看电影”笔迹的图像区域切分出来,加入到待办事项里面去。很多的笔记本都会印上分行线,用户手写的时候手写笔迹经常会与预先印制的分行线重叠,有些笔记本甚至会在页面上印上背景图案,这些都会给获得用户点击的位置以后自动从图像中切分出“2、看电影”这个手写笔迹所在的图像区域带来干扰,造成切分不准。

发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种自动切分电子化笔记本中手写条目的方法,用于解决现有技术中无法自动提取电子文档中特定位置的内容的问题。为实现上述目的及其他相关目的,本发明提供一种自动切分电子化笔记本中手写条目的方法。一种自动切分电子化笔记本中手写条目的方法,所述自动切分电子化笔记本中手写条目的方法包括
拍摄需要电子化的笔记本的纸质页面图像;通过图像中的直线检测方法确定所述纸质页面图像的四条边缘线,并将四条边缘线所限定的页面区域校正为方形区域;根据所述纸质页面图像确定所述纸质页面的类型,获得预先保存的所述类型笔记本的纸质页面空白切分模板,所述空白切分模板由若干文字块组成;确定所述方形区域中用户手写笔迹所在的文字块,以文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。优选地,所述纸质页面的类型由该纸质页面的大小和格式决定;所述纸质页面的格式包括纸质页面包括的文字块的数目、大小、间隔。优选地,所述文字块能够与相邻的文字块合并,以合并后的文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。优选地,在所述纸质页面的类型为预先已知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为人工指定所述纸质页面的类型。优选地,在所述纸质页面的类型为预先已知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为在所述纸质页面上的固定位置处印刷有一类型标记;检测所述纸质页面图像上的类型标记,将该检测到的类型标记与预先已知的类型标记进行一一比较,找出所述纸质页面所属的类型。优选地,在所述纸质页面的类型为预先不知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为创建新的纸质页面的类型,输入该未知的纸质页面的大小和格式。如上所述,本发明所述的自动切分电子化笔记本中手写条目的方法,具有以下有益效果本发明通过在对笔记本的纸质页面进行电子化的时候,用预先保存的空白切分模板辅助来获取并分割纸质页面上的用户手写的文字,因为所述空白切分模板由若干个文字块组成,所以每个文字块均可以作为切分页面上字迹的单位,从而获得包含了内容完整的手写条目,实现了电子化文档内容的自动切分和提取。


图1显示为本发明所述的自动切分电子化笔记本中手写条目的方法的流程示意图。
具体实施例方式以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式
加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。请参阅附图。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。 下面结合实施例和附图对本发明进行详细说明。实施例一本实施例提供一种自动切分电子化笔记本中手写条目的方法,如图1所示,所述自动切分电子化笔记本中手写条目的方法包括拍摄需要电子化的笔记本的纸质页面图像。本实施例中,所述需要电子化的笔记本的纸质页面可以为任意类型,如该纸质页面上印刷有分类标识区域、页码区域、标题区域、分行线、或/和分列线等等,也可以是上述各项的任意方式组合。通过图像中的直线检测方法确定所述纸质页面图像的四条边缘线,并将四条边缘线所限定的页面区域校正为方形区域。具体地,通过图像中的直线检测方法获取代表纸质页面图像中的四条页面外边缘的直线,切除掉图像中这四条页面外边缘直线限定的范围以外的背景区域,并以这四条页面外边缘直线为基准对拍摄的纸质页面图像进行校正,把这四条页面外边缘直线所限定的页面区域校正成长方形区域。根据所述纸质页面图像确定所述纸质页面的类型,获得预先保存的所述类型笔记本的纸质页面空白切分模板,所述空白切分模板由若干文字块组成。本实施例中,所述纸质页面的类型由该纸质页面的大小和格式决定;所述纸质页面的格式包括纸质页面包括的文字块的数目、文字块的大小、以及相邻文字块之间的间隔。也就是说,所述纸质页面可以由任意形状的块区域组成,每个块区域即为一个文字块。该文字块正好可以完整地分割纸质页面上的用户手写笔迹。本发明中所拍摄的笔记本的纸质页面图像属于现有CamScanner等应用软件事先已经保存的页面类型,因此能够参照预先保存的该类型的纸质页面的空白切分模板来获取用户手写笔迹所在的图像区域(即一个文字块或合并后的多个文字块所在的区域),显然准确性会大大提高。确定所述方形区域中用户手写笔迹所在的文字块,以文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。其中,所述文字块也能够与相邻的文字块合并,即可以以合并后的文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。在校正后的笔记本纸质页面图像中,参照所述预先保存的该笔记本纸质页面的空白切分模板,确定笔记本页面中的用户手写笔迹在空白切分模板中的位置,并把用户的手写笔迹切分成代表了不同的文字行的文字块。通过本发明所述的方法,用户可以通过简单的操作人工把临近的代表了构成完整含义的多个文字块的区域合并成一个。这些切分出来的代表了构成完整含义的文字块中的内容可以用来加入到电子设备中的代办事项的列表中,也可以利用现有的手写识别技术来识别出其中的文字来,省去用户在电子设备上手工输入文字的麻烦。本发明通过在对笔记本页面进行电子化的时候,用预先保存的空白切分模板中文字块辅助来获取并分割用户手写的文字区域,得到包含了内容完整的手写条目的图像块(也称文字块),从而方便纸质页面的分区电子化,及电子化后的文档的使用和管理。也就是说,本发明通过在对笔记本的纸质页面进行电子化的时候,用预先保存的空白切分模板辅助来获取并分割纸质页面上的用户手写的文字,因为所述空白切分模板由若干个文字块组成,所以每个文字块均可以作为切分页面上字迹的单位,从而获得包含了内容完整的手写条目,实现了电子化文档内容的自动切分和提取。实施例二本实施例提供一种自动切分电子化笔记本中手写条目的方法,其与实施例一所述的自动切分电子化笔记本中手写条目的方法的区别在于预先已知所述纸质页面的类型,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为人工指定所述纸质页面的类型;即用户在拍摄图像之前,或者拍摄图像之后处理图像之前,人工指定笔记本的纸质页面所属的类型,比如从预先保存在camScanner等应用软件中的一系列笔记本页面类型中选择一个。实施例三本实施例提供一种自动切分电子化笔记本中手写条目的方法,其与实施例一和二所述的自动切分电子化笔记本中手写条目的方法的区别在于预先已知所述纸质页面的类型,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为在所述纸质页面上的固定位置处印刷有一类型标记;所述类型标记可以为文字、符号、图形或者任意两项或三项的结合。检测所述纸质页面图像上的类型标记,将该检测到的类型标记与预先已知的类型标记进行一一比较,找出所述纸质页面所属的类型。在所述纸质页面上的固定位置处印刷有一类型标记;即预先在笔记本的每一张纸质页面的指定位置印刷上一个预先设计好的标记(即类型标记),在拍摄获取了笔记本的纸质页面的图像以后,先在图像中检测出笔记本的纸质页面的四条外边缘,以该四条外边缘为参照在纸质页面的图像中确定所述标记的大致位置,从而实现所述标记在图像中的检测,然后把检测到的标记跟预先保存的代表多个不同类型的笔记本的纸质页面的标记进行一一比较,找出所拍摄的笔记本的纸质页面所属的类型。将检测到的标记跟预先保存的代表多个不同类型的笔记本纸质页面的标记进行一一比较,找出所拍摄的笔记本的纸质页面所属的类型,这一步骤涉及手写识别,文字识另IJ,图像匹配等本领域中的成熟技术,在此不作赘述。实施例四本实施例提供一种自动切分电子化笔记本中手写条目的方法,其与实施例一所述的自动切分电子化笔记本中手写条目的方法的区别在于预先不知所述纸质页面的类型,在此种情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为创建新的纸质页面的类型,输入该未知的纸质页面的大小和格式。即如果所拍摄的笔记本的纸质页面不属于CamScanner等应用软件事先已知的印刷了加粗或/和加长的分行线、或/和分列线、或/和标题区域的纸质页面的类型,则在后续的步骤中先将该未知的纸质页面的类型添加到新创建的纸质页面的类型中后,再进行后续的处理。本发明通过在对笔记本的纸质页面进行电子化的时候,用预先保存的空白切分模板辅助来获取并分割纸质页面上的用户手写的文字,因为所述空白切分模板由若干个文字块组成,所以每个文字块均可以作为切分页面上字迹的单位,从而获得包含了内容完整的手写条目,实现了电子化文档内容的自动切分和提取。综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
权利要求
1.一种自动切分电子化笔记本中手写条目的方法,其特征在于,所述自动切分电子化笔记本中手写条目的方法包括 拍摄需要电子化的笔记本的纸质页面图像; 通过图像中的直线检测方法确定所述纸质页面图像的四条边缘线,并将四条边缘线所限定的页面区域校正为方形区域; 根据所述纸质页面图像确定所述纸质页面的类型,获得预先保存的所述类型笔记本的纸质页面空白切分模板,所述空白切分模板由若干文字块组成; 确定所述方形区域中用户手写笔迹所在的文字块,以文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。
2.根据权利要求1所述的自动切分电子化笔记本中手写条目的方法,其特征在于所述纸质页面的类型由该纸质页面的大小和格式决定;所述纸质页面的格式包括纸质页面包括的文字块的数目、大小、间隔。
3.根据权利要求1所述的自动切分电子化笔记本中手写条目的方法,其特征在于所述文字块能够与相邻的文字块合并,以合并后的文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。
4.根据权利要求1所述的自动切分电子化笔记本中手写条目的方法,其特征在于在所述纸质页面的类型为预先已知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为人工指定所述纸质页面的类型。
5.根据权利要求1所述的自动切分电子化笔记本中手写条目的方法,其特征在于在所述纸质页面的类型为预先已知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为 在所述纸质页面上的固定位置处印刷有一类型标记; 检测所述纸质页面图像上的类型标记,将该检测到的类型标记与预先已知的类型标记进行一一比较,找出所述纸质页面所属的类型。
6.根据权利要求1所述的自动切分电子化笔记本中手写条目的方法,其特征在于在所述纸质页面的类型为预先不知的情况下,根据所述纸质页面图像确定所述纸质页面的类型的具体实现方式为 创建新的纸质页面的类型,输入该未知的纸质页面的大小和格式。
全文摘要
本发明提供一种自动切分电子化笔记本中手写条目的方法,该方法包括拍摄需要电子化的笔记本的纸质页面图像;通过图像中的直线检测方法确定纸质页面图像的四条边缘线,并将四条边缘线所限定的页面区域校正为方形区域;根据纸质页面图像确定纸质页面的类型,获得预先保存的类型笔记本的纸质页面空白切分模板,空白切分模板由若干文字块组成;确定方形区域中用户手写笔迹所在的文字块,以文字块为单位自动切分提取处于任意一个文字块中的用户手写笔迹。本发明用预先保存的空白切分模板辅助来获取并分割电子化后的纸质页面上的用户字迹,而空白切分模板由若干个文字块组成,所以每个文字块均可作为切分单位,实现了电子化文档内容的自动切分和提取。
文档编号G06K9/32GK103020619SQ20121051716
公开日2013年4月3日 申请日期2012年12月5日 优先权日2012年12月5日
发明者陈青山, 罗希平 申请人:上海合合信息科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1