手持终端电子名片自动识别和管理系统的制作方法

文档序号:6523873阅读:175来源:国知局
专利名称:手持终端电子名片自动识别和管理系统的制作方法
技术领域
本发明涉及信息处理技术,特别是涉及一种包括手机、PDA等手持终端上的电子名片信息的自动识别和管理系统的技术。
背景技术
目前的现有技术中,利用手机彩信处理识别名片图像的方法,主要工作原理是采用客户端一服务器方式,手机只负责扫描名片为彩信格式,发送到服务器端进行光学符号(Optical Character RecognitionOCR)识别;该方法的缺点是需要服务器的配合与交互,实现手段复杂,特别是由于彩信的传送成功率较低,所以其可靠性较差;另外在现有技术中,也有在客户端实现识别功能的,但主要实现的是摄像头+OCR识别模块的方式,仅仅进行了OCR识别,缺少后续识别内容的智能处理,包括对名片信息的格式转换、归类、修改和备份等功能,而名片的个性化差异导致尽管能够识别出文字,但是还需要用户手工对应选择字段、转换格式,使用很不方便。

发明内容
针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种操作方便,可靠性高的手持终端电子名片自动识别和管理系统;本发明所要解决的另一个技术问题是提供一种能够保证非常高概率的字段自动识别和匹配功能,有较高字段识别自动化程度的手持终端电子名片自动识别和管理系统。
为了解决上述技术问题,本发明提供的一种手持终端电子名片自动识别和管理系统,包括一摄像头;一OCR识别模块,与所述摄像头连接,用于识别(转换)摄像头输入的图像信息;其特征在于,还包括一电子名片处理模块,与所述OCR识别模块连接,用于处理由所述OCR识别模块输入的文本信息并输出标准名片格式的文本信息;所述电子名片处理模块中设有格式转换单元、归类单元、修改单元、交换单元和备份单元,分别用于名片文本信息的格式转换、归类、修改,以及标准名片格式文本信息的交换和备份。
较佳地,所述格式转换单元中设有专家数据库和匹配策略(库),在字段的自动识别过程中,包括容易字段、姓名、职务、较难字段的识别,先调用专家数据库完成识别,再调用匹配策略(库),不同的字段采用不同的识别策略组合以完成识别,最后手工完成备注字段的识别。
较佳地,所述专家数据库包括各类字段、前缀特征、百家姓、职称头衔特征、地址特征、中国城市特征、公司名称特征、部门特征等数据库。
较佳地,所述匹配策略(库)包括字段优先策略、字段特征匹配策略、相对位置匹配策略、前缀匹配策略和排除策略。
较佳地,所述归类单元中在备注字段中增加关键字,以方便归类。
较佳地,所述修改单元中调出发生变更的电子名片进行修改。
较佳地,所述交换单元利用对外接口及PIM标准化平台进行电子名片信息交换和共享。
较佳地,所述备份单元利用无线接口及PIM标准化平台进行电子名片信息的网上备份。
利用本发明提供的手持终端电子名片自动识别和管理系统,由于采用在客户端实现识别和处理,以现有的手持终端软硬件和平台技术,足够支持在客户端的实现,简单方便,可靠性高,具有智能化管理能力,用户界面十分友好;而且能够自动生成基于开放标准的名片和文件格式,方便不同用户之间的名片共享、存储备份等操作;由于采用了专门针对名片特性而特别设计的基于字段匹配专家数据库和字段匹配策略的组合自动识别架构;从而能够保证非常高概率的字段自动识别和匹配功能,极大地提高了字段识别的自动化程度。
本专利的手持终端电子名片自动识别和管理系统的特点1)基于开放标准组织的架构实现OMA组织;2)纯软件实现,尽可能利用已有移动手持终端体系架构A)硬件方面只是利用了摄像头模块,不影响手持终端的射频和基带部分;B)仅在应用软件部分增加了一些业务实现流程和功能模块;3)符合运营商的业务运营需求结合了中国移动的PIM终端规范实现;4)一体化的名片解决方案集合了名片识别、后期智能处理、存储备份和共享等三大功能于一体,极大方便了用户的操作;5)使用标准化的、统一的名片格式,方便了名片共享、存储和备份;6)智能化的名片管理功能既综合了名片格式转换、归类、修改、交换和备份等多种功能,大多数功能又能够自动化实现,同时也给了用户定制的空间,兼顾了使用的方便性和灵活性。


图1是本发明实施例的电子名片自动识别和管理系统的架构框图;图2是本发明实施例中格式转换单元中字段的自动识别过程的流程框图;图3是本发明实施例的自动识别过程的匹配策略功能模块的框图;图4是本发明实施例将标准格式的名片信息在PIM平台上进行备份的流程框图;图5是本发明实施例中电子名片自动识别和管理系统在手机体系架构中的关系示意框图。
具体实施例方式
以下结合

对本发明的实施例作进一步详细描述,但本实施例并不用于限制本发明,凡是采用本发明的相似结构及其相似变化,均应列入本发明的保护范围。
参见图1所示,本发明实施例所提供的一种手持终端电子名片自动识别和管理系统,包括一摄像头(例如三洋IGT99353M-ST模块);一OCR识别模块(例如OCR软件,代表产品清华综合集成文字识别系统,又名清华文通TH-OCR软件),与所述摄像头连接,用于识别(转换)摄像头输入的图像信息;其特征在于,还包括一电子名片处理模块,与所述OCR识别模块连接,用于处理所述OCR识别模块输入的文本信息和输出标准名片格式的文本信息;所述电子名片处理模块中设有格式转换单元、归类单元、修改单元、交换单元和备份单元,分别用于名片文本信息的格式转换、归类、修改,以及标准名片格式文本信息的交换和备份。
手机的体系架构和本发明的电子名片自动识别和管理系统的关系可以参考图5,图中虚线标出的CMOS传感器、OCR识别软件模块和电子名片处理模块三个功能模块是本专利的电子名片自动识别和管理系统。其中CMOS传感器就是摄像头的核心部件,它和手机的基带及应用子系统有标准的接口连接。OCR识别软件模块和电子名片处理模块都属于应用子系统的上层软件部分,对手机的硬件不构成任何变动和修改。CMOS将名片扫描以后,存放到应用子系统连接的存储模块(例如MMC SD卡等存储介质)中,由OCR识别模块调用存储模块中的数据(名片扫描后的图像文件),识别完成以后发送给电子名片处理模块。由电子名片处理模块负责生成标准的电子名片文件,该数据可以经过应用子系统连接的无线数字基带子系统保存在SIM卡中,或者手机附带的任何存储介质中,或者经由应用子系统连接的USB接口、IrDA红外接口或者蓝牙接口与其他系统共享名片信息;电子名片处理模块可以通过手机的标准API接口,调用手机现成的功能模块,例如应用子系统连接的键盘和LCD显示,进行手工修改名片内容,增加新的信息等。在图5中,无线数字基带子系统通过模拟基带子系统、手机射频模块,连接收发天线。
本电子名片自动识别和管理系统支持简体中文、繁体中文以及英文名片的自动识别,也支持各种汉字字体的识别(现有的OCR产品一般都支持),为了简单起见,以下的实施例中实现模块说明以简体中文版本为例。
在电子名片自动识别和管理系统中,为了能够最大程度将各字段自动识别匹配为标准名片格式中的字段,需要一个强大的字段匹配专家数据库,以及一个智能化的匹配策略的支持。所述格式转换单元中设有专家数据库和匹配策略(库),是电子名字处理模块中最重要的子功能单元。
参见图2所示,格式转换单元工作流程1)字段的自动识别步骤A)容易字段识别按照表1中优先级(01~07)次序逐一字段进行识别;a、调用专家数据库完成识别比较规范的名片一般都含有字段部分,例如“地址”,在这种情况下,一般只需要调用专家数据库就能完成识别,因为如果字段和专家数据库符合,则字段后面紧跟空格或者“”,其后的字符串就是该字段对应的内容,例如“电话021-56043221”。
b、调用匹配策略完成识别不同的字段采用不同的识别策略组合,增加识别成功的概率。
B)姓名识别按照表1中优先级(08)a、调用专家数据库的百家姓数据库等完成识别;b、调用匹配策略的排除策略、相对位置匹配策略等完成识别;C)职务识别按照表1中优先级(09)a、调用专家数据库完成识别b、调用匹配策略的排除策略、相对位置匹配策略等完成识别;D)较难字段识别按照表1中优先级(10~12)次序逐一字段进行识别;a、调用专家数据库完成识别b、调用匹配策略的排除策略等完成识别;c、不能识别的字段统一放到最后一项,也就是备注字段项中,便于用户进行手工修改操作;E)备注字段按照表1中优先级(13);2)字段的手工识别步骤逐一字段复制填充成标准名片格式。
参见图3所示,所述匹配策略(库)包括以下子功能模块A)字段优先策略最容易识别的字段先识别,例如电子邮件,公司网址,邮政编码,移动电话,办公室电话,住宅电话,传真等B)字段特征匹配策略不同字段有不同的关键字特性,可以用来辅助识别,例如姓名的字段特征a、字长在2,3或者4之内b、两字姓名的往往中间有空格c、姓名后面的字段一般是职务或者头衔d、…C)相对位置匹配策略;D)前缀匹配策略电话/传真/移动电话字段前面一般有”(086)”;E)排除策略针对较难识别的字段,缩小识别范围。
表1不同字段识别详细说明




格式转换单元的功能A)提取各种格式的名片的关键字段,例如“姓名”、“公司地址”等;B)支持中英文格式;C)支持模糊字段自动匹配功能,例如“电邮”、“电子邮件”、“邮件”、“电子信箱”或者“Email”等;
D)支持手工修改模式,以便对无法自动匹配的字段进行人工修改;E)可以将正确提取的名片信息转换成为标准的名片格式(例如vCard)或者短信格式,或者增强型的彩信格式,方便后面的名片交换、存储和备份管理。
归类单元的工作原理电子名片最后一个字段是备注字段,可以在其中增加一些关键字说明,例如朋友、亲戚、同事等,以方便电子名片处理模块对该名片进行归类。归类过的名片可以统一存储在手机的存储介质中进行管理。可以与手机的短信群发等组通信模块结合起来,方便用户进行群操作。
归类单元的功能A)名片积累到一定数量以后,如果不进行有效的分类管理,用户使用起来会感觉非常不方便;B)名片归类可以方便用户的联络(例如分类进行群发),保护用户个人隐私,屏蔽骚扰性的广告和其他短信来源;C)可以将名片分成以下几类分别进行管理a、01一般好友;b、02家人亲戚;c、03私密好友;d、04公司客户;e、05公司同事;f、06同学;g、07黑名单;h、…。
修改单元的工作原理修改单元为用户提供了一个修改电子名片的操作接口。当某个联系人的地址、电话或者其他联络信息发生变更的时候,可以调出该电子名片进行修改。
交换单元的工作原理交换单元可以利用手机所支持的各种标准化的对外接口,例如USB接口、红外接口、蓝牙接口等,与外部设备进行电子名片信息交换和共享;或者利用PIM等标准化的信息共享备份协议通过手机的无线接口在网络侧进行名片信息备份。
交换单元的功能利用格式转换单元输出的各种名片格式信息,可以将名片信息与好友或者他人共享;在电子名片处理模块通过对外接口(USB,蓝牙,红外,无线模块等),可以很方便的实现名片共享和交换功能;例如,如果将本电子名片自动识别和管理系统在手机上应用,可以将用户的电子名片通过接口,利用手机的短信、WAP、MMS等方式发送给他人,实现名片交换功能。
备份单元的工作原理参见图4所示,图中的流程是完全遵循中国移动PIM终端规范中定义的手机和PIM平台之间的同步流程,可以用来将标准格式的名片信息在PIM平台上进行备份;手机发起到中央PIM平台OTA同步消息流程说明如下1)用户启动PIM 0TA同步服务;2)同步通信模块发起GPRS数据连接请求;3)NAS/GGSN发送计费起始请求(AccountingStart)给RADIUS服务器;4)RADIUS服务器将计费包(包括IP地址和MSISDN)转发到WAP GW;5)代理服务器将响应返回给RADIUS;6)RADIUS将计费应答包给NAS/GGSN;
7)NAS/GGSN将分配给手机的私网IP地址返回给手机;8)同步通信模块请求SyncML会话连接到代理服务器;9)代理服务器转发SyncML连接请求到中央PIM平台;10)中央PIM平台检查用户归属地,发现用户归属省没有自建PIM平台;11)中央PIM平台响应会话请求;12)代理服务器转发响应到手机的同步通信模块,会话建立。
13)同步通信模块将用户选择的个人信息数据发送到代理服务器;14)代理服务器转发到中央PIM平台;15)中央PIM平台检查所得到的数据是否为更新的数据,如果是则更新数据库;16)如果不是则直接发送结束信息到代理服务器;17)中央PIM平台产生计费信息(中央PIM平台无更新数据时);18)代理服务器转发同步结束信息到手机的同步通信模块;19)同步通信模块显示同步完成信息。
16a)若中央PIM平台有待更新数据时,将更新数据返回代理服务器;17a)代理服务器转发数据更新内容;18a)手机的同步通信模块同步新的数据;19a)手机的同步通信模块返回同步完成信息到代理服务器;19b)同时显示同步成功信息给用户;20a)代理服务器转发同步完成信息;21a)中央PIM平台产生计费信息。
备份单元的功能A)利用PIM技术,结合电子名片格式,可以充分实现电子名片在运营商服务器上的备份,以及与PIM PC客户端之间的信息共享;B)必要时候可以利用已有的安全加密技术,对电子名片信息进行加密,保护用户的隐私和安全;C)由于手机的被盗和遗失经常发生,电子名片的备份功能可以保护用户的名片信息,同时可以方便用户对遗失后的手机上的电子名片信息进行封锁或者销毁处理(在具备相应技术的条件下)。
本发明的电子名片格式遵从vCard2.1(地址本)规范的要求,包括以下字段a、姓名;b、公司名称;c、公司地址;d、所在部门;e、职务;f、移动电话;g、办公室电话;h、住宅电话;i、传真;j、Email地址;k、邮政地址;l、备注(用于补充信息说明)。
在本发明的上述实施例中,所述手持终端也可以是PDA。
在本发明的上述实施例中,作为手持终端电子名片自动识别和管理系统的网络配合部分,和运营商的网络端以下模块相关,(但是不需要对网络端做任何修改)
移动承载网络(GSM,GPRS,或者WCDMA);业务平台系统(包括PIM平台);WAP网关;PIM PC客户端。
权利要求
1.一种手持终端电子名片自动识别和管理系统,包括一摄像头;一OCR识别模块,与所述摄像头连接,用于识别摄像头输入的图像信息;其特征在于,还包括一电子名片处理模块,与所述OCR识别模块连接,用于处理由所述OCR识别模块输入的文本信息并输出标准名片格式的文本信息;所述电子名片处理模块中设有格式转换单元、归类单元、修改单元、交换单元和备份单元,分别用于名片文本信息的格式转换、归类、修改,以及标准名片格式文本信息的交换和备份。
2.根据权利要求1所述的手持终端电子名片自动识别和管理系统,其特征是,所述格式转换单元中设有专家数据库和匹配策略(库),在字段的自动识别过程中,包括容易字段、姓名、职务、较难字段的识别,先调用专家数据库完成识别,再调用匹配策略库,不同的字段采用不同的识别策略组合以完成识别,最后手工完成备注字段的识别。
3.根据权利要求2所述的手持终端电子名片自动识别和管理系统,其特征是,所述专家数据库包括各类字段、前缀特征、百家姓、职称头衔特征、地址特征、中国城市特征、公司名称特征、部门特征等数据库。
4.根据权利要求2所述的手持终端电子名片自动识别和管理系统,其特征是,所述匹配策略库包括字段优先策略、字段特征匹配策略、相对位置匹配策略、前缀匹配策略和排除策略。
5.根据权利要求1所述的手持终端电子名片自动识别和管理系统,其特征是,所述归类单元中在备注字段中增加关键字,以方便归类。
6.根据权利要求1所述的手持终端电子名片自动识别和管理系统,其特征是,所述修改单元中调出发生变更的电子名片进行修改。
7.根据权利要求1所述的手持终端电子名片自动识别和管理系统,其特征是,所述交换单元利用对外接口及PIM标准化平台进行电子名片信息交换和共享。
8.根据权利要求1所述的手持终端电子名片自动识别和管理系统,其特征是,所述备份单元利用无线接口及PIM标准化平台进行电子名片信息的网上备份。
全文摘要
本发明公开了一种针对手持终端的电子名片自动识别和管理系统,全部在手持终端客户端实现,首先利用手持终端的摄像头将普通名片拍摄下来保存为图形文件,然后利用OCR软件在手持终端内部将图形文件识别成为文本,由于名片的布局、字段非常个性化,本发明针对名片的特点设计了一套自动识别名片字段的功能模块,利用了详细准确的专家数据库和针对各字段特性设计的字段匹配策略,其独特的设计原理保证了较高的名片识别成功率,保证了识别的自动化程度。
文档编号G06F17/30GK1716234SQ200510028169
公开日2006年1月4日 申请日期2005年7月27日 优先权日2005年7月27日
发明者王晓琦, 闻泰来 申请人:王晓琦, 闻泰来
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1