可自动录入文字、图像的手机及其录入与处理方法

文档序号:7562329阅读:299来源:国知局
专利名称:可自动录入文字、图像的手机及其录入与处理方法
技术领域
本发明涉及一种移动通信产品,更确切地说是涉及一种可自动录入文字、图像信息的手机装置及其自动录入、处理的方法。
背景技术
为保持社交和商务交流活动的延续性,就需要保留联系人及其联系方式的相应信息,名片作为一种传统的联系人信息承载介质,以其方便携带且价兼实用等优势,已得到了广泛的使用,但其有不易保存、更新快且查找困难的缺点。
电话本功能是目前手机中的一项重要功能,用户使用其电话本功能可随时随地记录联系人及其联系电话,就可方便地使用这些信息即时地与联系人进行通信且方便信息更新。
随着手机的日益普及和手机计算能力的日益强大,如何将名片信息自动快速输入到手机中去并进行管理,已成为商务手机的一种重要需求。
现有的手机录入名片信息的方式大致有如下三种第一种是键盘方式手工输入,主要通过手机键盘,靠手工方式将联系人的名片信息逐字录入手机的电话本中;第二种是手写方式手工输入,在手机上配置手写输入功能,通过手写触摸屏,经过人工手写将联系人的名片信息逐字输入手机的电话本中;第三种是电脑外接扫描仪的方式,扫描仪扫描名片,将扫描信息输入电脑,再由电脑将联系人的名片信息输入手机的电话本中。
上述三种方式的主要缺点是手机键盘的手工输入方式,逐字输入不仅麻烦而且输入速度较慢,特别在输入名片中的Email与网址信息时,需要反复作中英文切换,实际上造成了手机电话本功能的使用障碍,此外还缺乏输入名片上logo等图形信息(如公司图形标记、产品商标图案等)的手段。
使用手写触摸屏的手写输入方式,同样需逐字/词输入,输入速度较慢,由于需要手机提供手写输入功能,增加了手写触摸屏硬件,不适合在键盘式手机上应用,此外也同样缺乏对名片上logo等图形信息的输入手段。
使用电脑外接名片扫描仪的输入方式,因为需要配置个人电脑和名片扫描仪,既增加了成本又不便携,而且其扫描、识别、输出模块均是在个人电脑中实现的,因此也不能解决将联系人名片信息直接输入手机电话本的问题,而且基于电脑的名片扫描识别系统目前仍需要存储整张名片的图像信息,对存储容量的要求较高。
目前,虽然带有照像功能的手机产品已经面世,但仅仅是照像和在显示屏上显示,仍需要借助于PC,才能将名片上的信息整合到手机电话本中去。

发明内容
本发明的目的是设计一种可自动录入文字或图像的手机及其录入与处理方法,可在手机上实现对名片一类图像及文字信息的全自动识别、录入和处理。
本发明的目的是通过以下技术方案实现的一种可自动录入文字、图像的手机,包括摄像头,摄像头的摄像信号输出端与手机中的中央处理器连接;所述手机设置有系统总控制模块、摄像头驱动模块、数据库模块和显示驱动模块,其特征在于所述手机还设置有版面处理与增强处理模块、智能版面分析模块、字符识别模块、后处理模块、数据交换模块和关联应用模块;在系统总控制模块的控制下,由版面处理与增强处理模块、智能版面分析模块、字符识别模块和后处理模块顺序工作,对摄像信号进行预处理与增强处理,和按文字、图像的属性分类存储在数据库模块中,再由数据交换模块通过本地网络连接或者远程网络连接实现与电脑间或与其它手机间的数据交换,和/或由显示驱动模块通过操作界面将操作结果显示在手机显示屏上,和/或由关联应用模块对选中的信息进行关联应用。
本发明的目的还通过以下技术方案实现一种手机自动录入与处理文字、图像的方法,其特征在于A.手机摄像头通过摄像头驱动模块将版面上的文字、图像拍照成像,获取版面上文字、图像的电子信息;B.由版面处理与增强处理模块对版面上的文字、图像电子信息进行文字、图像预处理及增强处理;C.由智能版面分析模块对版面结构进行分析,分割提取出各种文字区域和图形区域,将各种文字区域的预处理及增强处理结果送字符识别模块,将图形区域的预处理及增强处理结果送图形压缩模块,图形压缩模块将压缩后的图形数据存入数据库模块中;D.由字符识别模块对各种文字区域中的预处理及增强处理结果进行字符识别,获得字符识别结果;E.由后处理模块对字符识别结果进行修正,并结合逻辑结构模式库中版面的逻辑结构模式对字符识别结果进行逻辑分类,并将分类结果存入数据库模块中;F.由关联应用模块将数据库模块中的分类结果与手机的相关应用关联起来,启动一种手机应用时,同时从数据库模块中调用与该应用相关联的文字分类信息执行该应用;和/或根据手机操作结果,由显示驱动模块将数据库模块中的信息显示在手机显示屏上;和/或由数据交换模块,通过本地网络连接或远程网络连接,将所述数据库模块中的信息与电脑进行数据交换或与其它手机进行数据交换。
所述步骤A中版面上的文字、图像是名片上的联系人信息及Logo图形。
本发明通过手机上的摄像头,对版面如名片,拍照成像后进行图像处理、智能版面分析和字符识别,然后将获得的名片信息按一定格式存储在手机的数据库中,名片信息与手机的各种应用相关联,在启动某一种应用时,即自动调用与该应用相关联的名片信息,就可自动地按调用的信息执行相应的应用,如电话拨号、Email电子邮件、浏览器等,选中某个联系人名片,即可快速实现电话自动拨号,发送电子邮件或浏览对方主页信息等。在手机上实现对名片信息的全自动录入、识别和管理。
采用本发明方法实施的手机,与现有的带摄像头的手机比较,具有如下优点一次拍照即可实现名片信息输入,无需逐字逐词输入,速度快,输入信息量大,而且操作方便;可以同时输入名片上的logo等图形信息,并以VCARD、XML等标准格式存储,方便传统介质名片到标准电子名片间的信号转换;不需要存储整个名片上的文字与图像,可以按照需要提取名片上必要的信息并存贮到VCARD等标准电子名片格式中去,对手机存储空间的要求低;无需使用个人电脑和扫描仪,直接通过手机上的内置摄像头,在手机上实现对名片信息的全自动识别、录入和处理,在没有增加手机硬件成本、也没有影响其便携特点的情况下,实现了手机名片识别录入功能。


图1是本发明手机的装置外形结构示意图;图2是利用本发明手机录入、识别名片信息的示意图;图3是名片信息全自动处理、分析及识别的流程框图;图4是实现本发明方法的软件模块结构关系示意图。
具体实施例方式
本发明提出的新型手机,利用设置在手机上的摄像头,实现用手机对名片一类文字、图像信息进行全自动识别、录入和管理。
下面仍以对名片信息的处理为例进一步说明本发明的技术。
参见图1、图2,在手机上内置摄像头1,对名片3拍照成像并在显示屏2上显示,经过图像处理、智能版面分析和字符识别后,将名片信息按一定格式存储在手机的数据库中,完成名片信息的全自动识别、录入。
参见图3,图中示出名片信息的全自动识别、录入流程。
步骤301,摄像头拾取名片上的图像、文字信息,由摄像头驱动模块在中央处理器的控制下,对名片进行拍照成像,以获取名片上图像、文字的电子信息;步骤302,由版面处理与增强模块对获取的名片上的图像、文字电子信息进行预处理,由于用手机内置摄像头拍摄名片,背景复杂,不规则变形较多,图像质量参差不齐,所以须先进行版面预处理及增强处理,包括302-a、302-b、302-c、302-d四个过程,其中步骤302-a,是进行高斯平滑去噪声处理;步骤302-b是进行亮度及对比度归一化处理,以满足不同光照条件下的名片信息摄入;302-c是进行背景去除处理;302-d是进行射影变换校正处理,以满足不同拍摄角度(非垂直角度)下的名片录入,上述步骤a、b、c与d的处理顺序可以按图示顺序进行,也可以不按该顺序做,可以全部做,也可以选择其中的1至3项做;步骤303,由版面分析模块对名片版面进行智能分析,手机在收到名片的图像、文字信息后,对名片信息进行智能版面分析,即分割提取出不同区域,包括名字区域、文字区域、logo区域等,确定各区域相应的排版方向、版面大小、在名片上的位置区域等,然后根据这些区域的不同属性送入不同的模块,如将名字区域、文字区域送入字符识别(OCR)模块,将logo区域送logo图形压缩模块;步骤304,由字符识别(OCR)模块对送入的名字区域、文字区域进行字符信息识别,再将识别后的结果数据送后处理模块;步骤305,由logo图形压缩模块对logo区域的图像信息进行压缩处理,压缩处理后的结果直接送名片信息数据库存储;上述步骤304与305可以并行进行。
步骤306,由后处理模块对字符识别后的结果数据进行修正,修正是结合名片逻辑结构模式库进行的,包括修正、分类处理、以及模式库的更新过程,具体为识别结果的修正,对字符识别(OCR)模块的识别结果进行确认,对错误进行修改,和对结果数据进行编辑;结合名片逻辑结构模式库对名片信息进行分类处理,对智能版面分析后的不同区域,进一步根据字符识别(OCR)模块的识别结果和名片逻辑结构模式库,进行逻辑分类,如姓名,地址,邮编,电话,职务、邮箱,网址等;如果遇到名片逻辑结构模式库确实无法处理的名片逻辑结构模式,可将该名片逻辑结构加入到模式库中去,进行模式库的更新;步骤307,数据库模块将后处理模块获得的名片分类信息和logo图形压缩数据按VCARD、XML等规定格式送入名片信息数据库,以备检索和输出。
系统维护两个数据库联系人名片信息数据库和名片逻辑结构模式库。
步骤308、309、310,根据用户需要调用名片信息数据库,由显示驱动模块(可利用原手机上的显示驱动模块)通过手机操作界面,将名片信息显示在手机显示屏上;由名片数据交换模块,通过本地连接或者远程网络连接,与电脑交换名片数据,或者与其它手机交换名片数据;和由关联应用模块,将名片信息与其它相关应用如拨号程序、Email电子邮件发送程序、浏览器程序等关联起来,例如选中某个联系人的名片,即可自动并快捷地电话拨号、发送电子邮件或浏览对方主页信息等。
本发明在实施时,可利用原手机的摄像头驱动模块(带摄像头的手机)及显示驱动模块,并利用目前已趋成熟的图像、文字处理、识别及版面分析等技术,将它们组合到手机中,从而实现用手机对名片信息进行自动录入、分类及关联应用等。
参见图4,图中示出实现本发明目的所涉及的软件模块结构关系。包括摄像头驱动模块401、版面处理与增强模块402、版面分析模块403、字符识别模块404、文字后处理模块405、数据库模块406、名片数据交换模块407、显示驱动模块408、关联应用模块409和系统总控模块410。由系统总控模块410完成对各模块的调度和模块之间的切换。系统总控模块410可利用手机原系统模块,但需对原系统模块进行功能增强。
其中的版面分析模块将分割出的文字区域中的预处理及增强处理结果送字符识别模块404,将分割出的Logo图形数据经压缩后直接送数据库模块存储。数据库模块406中有名片的文字信息库与名片的逻辑结构模式库,后处理模块利用逻辑结构模式库中已有的模式指导名片上文字信息的分类,将文字分类结果送名片的文字信息库保存,当逻辑结构模式库中已有的模式不能指导当前名片上文字信息的分类时,将该当前名片的逻辑结构模式存入逻辑结构模式库中,对名片逻辑结构模式库进行更新。
名片数据交换模块407、显示驱动模块408、关联应用模块409分别根据用户需要从数据库模块中调用相应的文字分类信息、Logo图形信息。
本发明提供的新型手机,直接通过手机上的内置摄像头,在手机上实现对名片信息的全自动识别、录入和管理,可以快速、方便地将联系人的名片信息输入到手机当中,从而方便用户与联系人的通信。
为方便叙述以手机获取名片信息为例,但不仅仅局限于名片。任何不脱离本发明原理、对本发明所进行的等效修改或变更,均应包含在本发明的保护范围内。
权利要求
1.一种可自动录入文字、图像的手机,包括摄像头,摄像头的摄像信号输出端与手机中的中央处理器连接,所述手机设置有系统总控制模块、摄像头驱动模块、数据库模块和显示驱动模块,其特征在于所述手机还设置有版面处理与增强处理模块、智能版面分析模块、字符识别模块、后处理模块、数据交换模块和关联应用模块;在系统总控制模块的控制下,由版面处理与增强处理模块、智能版面分析模块、字符识别模块和后处理模块顺序工作,对摄像信号进行预处理与增强处理,和按文字、图像的属性分类存储在数据库模块中,再由数据交换模块通过本地网络连接或者远程网络连接实现与电脑间或与其它手机间的数据交换,和/或由显示驱动模块通过操作界面将操作结果显示在手机显示屏上,和/或由关联应用模块对选中的信息进行关联应用。
2.一种手机自动录入与处理文字、图像的方法,其特征在于A.手机摄像头通过摄像头驱动模块将版面上的文字、图像拍照成像,获取版面上文字、图像的电子信息;B.由版面处理与增强处理模块对版面上的文字、图像电子信息进行文字、图像预处理及增强处理;C.由智能版面分析模块对版面结构进行分析,分割提取出各种文字区域和图形区域,将各种文字区域的预处理及增强处理结果送字符识别模块,将图形区域的预处理及增强处理结果送图形压缩模块,图形压缩模块将压缩后的图形数据存入数据库模块中;D.由字符识别模块对各种文字区域中的预处理及增强处理结果进行字符识别,获得字符识别结果;E.由后处理模块对字符识别结果进行修正,并结合逻辑结构模式库中版面的逻辑结构模式对字符识别结果进行逻辑分类,并将分类结果存入数据库模块中;F.由关联应用模块将数据库模块中的分类结果与手机的相关应用关联起来,启动一种手机应用时,同时从数据库模块中调用与该应用相关联的文字分类信息执行该应用;和/或根据手机操作结果,由显示驱动模块将数据库模块中的信息显示在手机显示屏上;和/或由数据交换模块,通过本地网络连接或远程网络连接,将所述数据库模块中的信息与电脑进行数据交换或与其它手机进行数据交换。
3.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述步骤A中版面上的文字、图像是名片上的联系人信息及Logo图形。
4.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述步骤B中的预处理与增强处理进一步包括B1.高斯平滑去噪声处理;B2.亮度及对比度的归一化处理;B3.背景去除处理;B4.射影变换校正处理。
5.根据权利要求4所述的手机自动录入与处理文字、图像的方法,其特征在于按B1、B2、B3、B4的顺序执行全部步骤;或者,不按B1、B2、B3、B4的顺序执行全部步骤;或者,从B1、B2、B3、B4中选择执行其中的一至三个步骤。
6.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述的步骤C中,分割提取出各文字区域和图形区域,还包括确定各区域的排版方向、各区域的版面大小和各区域在版面中的位置。
7.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述的步骤E中,所述的修正是对字符识别结果进行确认与编辑,和修改发现的错误;所述的逻辑分类是对步骤C分割出的各文字区域,根据步骤D获得的字符识别结果和版面的逻辑结构模式库,逻辑分类为包括联系人姓名、地址、邮编、联系电话、职务、邮箱、网址的分类信息。
8.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述的步骤E中,还包括版面的逻辑结构模式库的更新处理,是在版面的逻辑结构模式库不能利用已有的版面模式指导逻辑分类时,将当前的版面模式存入版面的逻辑结构模式库中。
9.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述步骤F中,所述的关联包括将手机的电话拨号程序、发送电子邮件程序、浏览对方主页信息的程序与数据库模块中的分类结果相关联,选中联系人,即实现电话拨号功能或发送电子邮件或浏览对方主页功能。
10.根据权利要求2所述的手机自动录入与处理文字、图像的方法,其特征在于所述步骤C中,存入数据库模块中的图形数据,和所述步骤E中存入数据库模块中的分类结果,是按包括VCARD格式、XML格式的规定格式进行存储的。
全文摘要
本发明涉及一种可自动录入文字、图像的手机及其录入与处理方法,例如在手机上实现对名片信息的全自动识别、录入和处理。手机包括摄像头,其摄像信号输出端与手机的中央处理器连接。在总控制模块的控制下,摄像头驱动模块将名片上的文字、图像拍照成像;由版面处理与增强模块、智能版面分析模块、字符识别模块和后处理模块顺序工作,对摄像信号进行预处理与增强处理,分割出各文字区域与图形区域,对文字区域的字符进行识别与分类,分类结果与图形压缩结果存储在数据库模块中。可由数据交换模块通过本地网或远程网连接实现与电脑间或与其它手机间的数据交换;由显示驱动模块驱动显示;由关联应用模块对选中的名片信息,进行关联应用。
文档编号H04N5/225GK1630302SQ200310121279
公开日2005年6月22日 申请日期2003年12月17日 优先权日2003年12月17日
发明者吴强, 刘积堂, 肖柏华 申请人:大唐移动通信设备有限公司, 上海大唐移动通信设备有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1