手机名片识别装置的制作方法

文档序号:7646252阅读:224来源:国知局
专利名称:手机名片识别装置的制作方法
技术领域
本发明涉及数字图像处理领域、模式识别领域及嵌入式设备领域,特别 涉及一种手机名片识别装置。
背景技术
随着手持设备的发展和普及,手机已经越来越成为人们日常生活必不可 少的联系工具,而名片是商务人士简明美观的信息载体,如何使繁忙的商务 人士从繁复的手动名片输入解放出来,手机名片识别的实现将满足了商务人 士快速录入名片内容的需求,嵌入式平台系统所具有的内存运行空间小、运 行速度慢以及系统平台多样化特点也对名片识别系统开发的系统结构建造
和系统的移植能力提出了挑战。而如何使用更低配置(最低104MHZ主频 arm处理器)的手机实现名片拍照识别的功能,独立于照相机和名片扫描管 理,在嵌入式的手机平台上实现通过手机上的数码摄相机(带有近拍功能)识 别拍摄进来的整张名片图像,手动操作来实现名片的扫描输入、识别、分 类到手机通讯录。

发明内容
本发明的目的是提供一种名片识别装置。 本发明的目的是通过以下技术方案实现的-
一种手机的名片识别装置,包括电话簿,其特征在于,还有图像识别 (OCR)引擎单元,用于将名片数字图像中的字符转换成字符标准内码; 一个适配器单元,用于连接不同OCR引擎的接口,从而实现多OCR引
擎产品的快速整合;
一个至少具有130万像素且具有微距功能的拍摄单元,用于拍摄获取名 片的数字图像;
一个图像预处理单元,用于将拍摄的图像转换成OCR引擎所能识别的 图像格式,通过二值化方式将图像压缩,用于提升识别速度;
一个用户界面单元,用于与用户交互,向导用户使用该用户界面;以及
一个储存管理单元,用于显示储存管理识别结果。
其中,该OCR引擎单元包括
引擎库单元,用于存储字符特征向量;
引擎设置单元,用于设置运行模式或数字图像参数;
引擎启动单元,用于分配运行空间、将引擎库装载入内存,启动该引擎 启动单元为可执行状态;
引擎版面分析单元,用于划分版面,分割各区域,将可识别字符用连通 区域框定;
引擎识别单元,用于识别连通区内的数字图像,根据数字图像直观形象 提取特征进行识别;
引擎关闭单元,释放内存空间,关闭所述各引擎单元。 该适配器单元包括-
初始化接口单元;识别名片接口单元;图像载入接口单元;版面分析接口 单元;引擎退出接口单元。它们用于传递界面向OCR引擎的请求,以及引擎 向界面传递结果的统一接口。
该图像预处理单元:从照相设备单元获取数字图像,该图像分辨率在 1280x960以上,Jpg图像经过硬件解码转为16位rgb图像,从16位rgb图 像转化为8位灰度bmp格式图像,然后对图像进行二值化处理。
二值图像是指整幅图像画面内仅黑(灰度值为0)白(灰度值为1) 二 值的图像,在它们上面不呈现出灰度的变化。在数字图像处理中,二值图像 占有非常重要的地位。这是因为在实用的图像处理系统中,要求处理的速度
高、成本低,信息量大的浓淡图像处理花销太大,不是上策。而且二值化后 的图像能够用几何学中的概念进行分析和特征描述,比起灰度图像来说方便 得多。因而二值图像处理目前已成为图像处理中的一个独立的、重要分支而 获得广泛的应用。
设表示像素在(i,j)位置的灰度值,二值化处理为下式所示。
<formula>formula see original document page 6</formula>
这里t为二值化阈值(Threshold)。像素的8-邻域(8-Neighbor),除去d-近邻的像素外,余下的对角线上的4个像素,称为(i,j)的非直接邻域,符
号是i-近邻。某个像素的连接数可以用这个像素的8-邻域值y"Q)…,"7) 来计算。
A'=0,2,4.6
当A 时,令x8 =x0
对于一个像素的8-邻域的所有可能存在的值,按照上式进行计算,其连接 数总是取0-4之间的值。文字的自动识别过程中,需要把二值图像进行细化, 还可以大大减少冗余的信息。
二值化图像细化图像
ABC ABC
用户界面单元包括预览界面,版面分析界面,条目选择界面,名片储 存管理界面。
本发明的优点是1、实用性强,满足了商务人士快速录入名片的需求; 2、使用低配置,由手机实现名片拍摄,独立于照相机和名片扫描管理,由 手动操作来实现名片的扫描输入、识别、分类到手机通讯录、效率高、操作 方便。


图1为本发明实施例的结构框图2为本发明实施例的流程示意图3为本发明实施例的engine流程示意图。
图4-l 图4-4为本发明实施例的用户界面单元的操作流程示意图。
具体实施例方式
下面根据图1 图4-4给出本发明一个较好实施例,并予以详细描述,使 本技术领域的技术人员能更易于理解本发明的结构特征和功能特色,而不是 用来限定本发明的范围。
请参阅图1所示,本发明的手机名片识别装置包括由图像识别(OCR) 引擎5,用于将名片数字图像中的字符转换成字符标准内码;适配器接口单 元l,用于连接不同OCR引擎产品的接口,用以实现多OCR引擎产品的快 速整合;用户界面2,用于与用户交互,向导用户使用该功能界面;图像预 处理单元3,用于将拍摄的图像转换成OCR引擎与所能识别的图像格式, 通过将图像二值化压縮,以提升识别速度;照相设备(即拍摄单元4),用于 拍摄获取名片的数字图像,其至少具有130万像素且具有微距功能;以及电 话簿6。
所述的适配器接口单元l,其包括引擎初始化单元11、图像载入单元12、 版面分析单元13、选择名片条目14、识别名片单元15、和引擎退出单元16。
所述的用户界面2包括预览界面21、提示界面22、设置界面23、版面 分析界面24、条目选择界面25、退出界面26。
所述的照相设备4包括相机预览41、相机调节42、相机拍照43和相机 退出43。
所述的OCR引擎5包括引擎设置51、名片版面分析52、识别名片条目 53、字符识别54和引擎关闭55。
请参阅图2所示,本发明装置的运行流程100,其步骤包括
S100q,处于退出状态;
S1001,初始化,包括OCR引擎初始化和相机初始化,如果初始化失败 则退回Sk)oo,
S1002,名片预览,包括相机预览和相机调节,若对预览不满意,执行S1WX),
S1003,名片拍摄,包括相机拍摄和图像转换,若拍摄失败,则返回Snx)2。
Sl004,版面分析,包括可识别区域显示与框定,若无可识别区域,则返 回执行S1()。2。
S1005,选择识别,包括选取识别区域、选择区域条目类别,OCR引擎字 符识别和名片内容显示编辑,若不能进行名片内容显示编辑,则返回执行 S1004;
S1006,名片结果,包括将结果存入电话簿、若此步骤还要继续下去,则
跳回执行S^2;若步骤结束,则跳回执行S,o()()、处于退出状态。
请参阅图3所示,其示出OCR引擎的运行流程200,如图所示
S2,,启动操作;
S20(m,启动名片识别引擎;
S2002,设置名片引擎属性;
S2003,名片图像处理;
S2004, 名片输出,
S2005,判断是否还有名片输出?若还有输出,则返回执行S,3,若没有 名片输出,则执行S2()()6;
S2006,关闭名片识别引擎; S2oo7,程序200运行结束。
请参阅图4-1~图4-4,其示出了本发明的用户界面单元的操作流程,如 图所示,具体流程为1'、拍摄名片,预览名片图像。2'、点击"识别", 几秒钟后,名片上出现栏目画框;例如,通过键盘或触笔选择了 "中国上海 西姆通科技有限公司"栏目。3'、弹出备选栏目名菜单;例如选择"公司", 则刚才选择的名片图象上的"中国上海西姆通科技有限公司"栏内容就被识
别入该条通讯录的"公司"字段栏目中。4'、重复执行"继续"+ "识别" 操作后,完成对整张名片图象上各栏目内容归类,点击"完成"来结束识别 过程,"完成"后显示所有识别结果编辑界面,点击"保存"存入系统通讯 录中。
权利要求
1、一种手机名片识别装置,包括电话簿,其特征在于,还有一OCR引擎单元,用于将名片数字图像中的字符转换成字符标准内码;一适配器单元,用于连接不同OCR引擎接口,以实现多个OCR引擎产品的快速整合;一拍摄单元,用于拍摄获取名片的数字图像,其至少具有130万像素且具有微距功能;一图像预处理单元,用于将拍摄的图像转换成OCR引擎所能识别的图像格式并将图像进行二值化压缩,以提升识别速度;一用户识别单元,用于与用户交互,向导用户使用该界面;一储存管理单元,用于显示储存管理识别结果。
2、 根据权利要求1所述的名片识别装置,其特征在于,所述OCR引擎 单元包括引擎库单元,用于存储字符特征向量;引擎设置单元,用于设置运行模式或数字图像参数;引擎启动单元,用于分配运行空间,将引擎库装载入内存,启动该引擎 启动单元为可执行状态;引擎版面分析单元,用于划分版面,分割各区域,将可识别字符用连通 区域框定;引擎识别单元,用于识别连通区内的数字图像,根据数字图像直观形象 提取特征进行识别;引擎关闭单元,释放内存空间,关闭所述各引擎单元。
3、 根据权利要求1所述的名片识别装置,其特征在于,所述的适配器 单元包括初始化接口单元、图像载入接口单元、版面分析接口单元、引擎 退出接口单元。
4、根据权利要求1所述的名片识别装置,其特征在于,所述的用户界 面单元,包括预览界面、版面分析界面、条目选择界面和名片储存管理界面。
全文摘要
本发明公开了一种手机名片识别装置,包括电话簿,其特征在于还有一个拍照设备单元;一个UI单元;一个字符特征图像识别引擎(OCR engine)单元;一个适配器接口单元。本发明具有实用性强,输入方便,效率高的优点。
文档编号H04M3/487GK101339618SQ20071004354
公开日2009年1月7日 申请日期2007年7月6日 优先权日2007年7月6日
发明者健 杨 申请人:上海思必得通讯技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1