具有ocr识别功能的手机的制作方法

文档序号:6473138阅读:575来源:国知局
专利名称:具有ocr识别功能的手机的制作方法
技术领域
本实用新型涉及一种手机,特别涉及一种具有OCR识别功能的手机。
(二)
背景技术
在日常生活中,我们从报纸、杂志上看到许多资料非常有保存价 值,而一般人手头又没有复印设备,用笔记录下来又显得格外麻烦。 如果能把它储存到手机中随时查阅将是非常方便的,但是用拼音或是 手写功能把它们拼写到手机中既耗时又耗力!
(三) 发明内容
本实用新型为了弥补现有技术的不足,提供了一种使用方便的具 有OCR识别功能的手机。
本实用新型是通过如下技术方案实现的
一种具有OCR识别功能的手机,包括手机主体、摄像头、主板硬 盘,其特殊之处在于所述主板硬盘上安装有一集成有OCR识别系统 的0CR芯片。
本实用新型的具有OCR识别功能的手机,所述OCR识别系统经过 摄像头的影像输入,依次进入影像前处理、文字特征抽取、比对识别, 经人工校正将认错的文字更正,将结果输出。
OCR (Optical Character Recognition)光学字符识别。OCR中文意 思就是通过光学技术对文字进行识别。这种技术能够使设备通过光学 的机制来识别字符。人类用眼睛来识别许多事物,其方式就是一种光 学机制。
本实用新型将0CR功能加到手机中,方便读书人储存资料。本实 用新型利用手机的摄像头把一些资料"拍"到手机里储存起来,所说 的"拍"是利用已有的OCR系统把资料记录到手机中。OCR系统并不 是把资料以图片的形式记录下来,而是利用其具有的自动编辑功能把
资料以文本的形式储存到手机里,可以随时翻阅,方便人们随时翻阅, 进而重复记忆,达到掌握该知识的目的!本实用新型将OCR功能成功 植入手机后,将大大有利于经常读书看报的人及广大学生存储平面媒 体上的资料。
(四)

以下结合附图对本实用新型作进一步的说明。
图1为本实用新型的结构示意图2为本实用新型OCR识别系统的结构框图。
图中,l手机主体,2摄像头,3主板硬盘,4 0CR芯片。
具体实施方式附图为本实用新型的一种具体实施例。该实施例包括手机主体1、
摄像头2、主板硬盘3,主板硬盘3上安装有一集成有OCR识别系统 的0CR芯片4;OCR识别系统经过摄像头的影像输入,依次进入影像 前处理、文字特征抽取、比对识别,经人工校正将认错的文字更正, 将结果输出。
OCR (Optical Character Recognition)光学字符识别。它属于图型 识别的一门学问,其目的就是要让计算机知道它到底看到了什么,尤 其是文字资料。由于OCR是一门与识别率拔河的技术,因此如何除错 或利用辅助信息提高识别正确率,是0CR最重要的课题。而根据文字 资料存在的媒体介质不同,及取得这些资料的方式不同,就衍生出各 式各样、各种不同的应用。
一个0CR识别系统,其目的很简单,只是要把影像作一个转换, 使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一 律变成手机文字,使能达到影像资料的储存量减少、识别出的文字可 再使用及分析,当然也可节省因键盘输入的人力与时伺。其处理流程 如下
从影像到结果输出,须经过影像输入、影像前处理、文字特征抽 取、比对识别、最后经人工校正将认错的文字更正,将结果输出。 在此逐一介绍
影像输入需要OCR处理的资料须通过摄像头将影像转入到手机
中。现在各大通信器材公司生产的中高档手机一般都安装有摄像头, 具有照相和摄像功能。同时随着科技的进歩,摄像头的分辨率将会越 来越高,从而使成图质量也越来越清晰,这会大大提高OCR系统的读 取及自动编辑速度。
影像前处理影像前处理是OCR系统中,须解决问题最多的一个 模块,从得到一个不是黑就是白的二值化影像,或灰阶、彩色的影像, 到独立出一个个的文字影像的过程,都属于影像前处理。包含了影像 正规化、去除噪声、影像矫正等的影像处理,及图文分析、文字行与 字分离的文件前处理。在影像处理方面,在原理及技术方面都已达成
熟阶段,因此在市面上或网站上有不少可用的链接库;在文件前处理 方面,则凭各家本领了;影像须先将图片、表格及文字区域分离出来, 甚至可将文章的编排方向、文章的提纲及内容主体区分开,而文字的 大小及文字的字体亦可如原始文件一样的判断出来。
文字特征抽取单以识别率而言,特征抽取可说是OCR的核心, 用什么特征、怎么抽取,直接影响识别的好坏,也所以在OCR研究初 期,特征抽取的研究报告特别的多。而特征可说是识别的筹码,简易 的区分可分为两类 一为统计的特征,如文字区域内的黑/白点数比,
当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就 成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。 而另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端 点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法, 进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方 法为主。
对比数据库当输入文字算完特征后,不管是用统计或结构的特 征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应 包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所 得的特征群组。
对比识别这是可充分发挥数学运算理论的一个模块,根据不同 的特征特性,选用不同的数学距离函数,较有名的比对方法有,欧式 空间的比对方法、松弛比对法(Relaxation)、动态程序比对法
(Dynamic Programming, DP),以及类神经网络的数据库建立及比对、 HMM (Hidden Markov Model)…等著名的方法,为了使识别的结果更 稳定,也有所谓的专家系统(Experts System)被提出,利用各种特 征比对方法的相异互补性,使识别出的结果,其信心度特别的高。
字词后处理由于OCR的识别率并无法达到百分之百,或想加强 比对的正确性及信心值, 一些除错或甚至帮忙更正的功能,也成为OCR 系统中必要的一个模块。字词后处理就是一例,利用比对后的识别文 字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑 的词,做更正的功能。
字词数据库为字词后处理所建立的词库。
人工校正 一个好的OCR软件,除了有一个稳定的影像处理及识 别核心,以降低错误率外,人工校正的操作流程及其功能,亦影响OCR 的处理效率。
结果输出其实输出是件简单的事,但却须看使用者用OCR到底 为了什么?有人只要文本文件作部分文字的再使用之用,所以只要一 般的文字文件、有人要漂漂亮亮的和输入文件一模一样,所以有原文 重现的功能、有人注重表格内的文字,所以要和Excel等软件结合。 无论怎么变化,都只是输出档案格式的变化而已。
权利要求1.一种具有OCR识别功能的手机,包括手机主体(1)、摄像头(2)、主板硬盘(3),其特征在于所述主板硬盘(3)上安装有一集成有OCR识别系统的OCR芯片(4)。
2. 根据权利要求1所述的具有OCR识别功能的手机,其特征在于-所述OCR识别系统经过摄像头的影像输入,依次进入影像前处理、 文字特征抽取、比对识别,经人工校正将认错的文字更正,将结 果输出。
专利摘要本实用新型公开了一种手机,特别公开了一种具有OCR识别功能的手机。该具有OCR识别功能的手机,包括手机主体、摄像头、主板硬盘,其特殊之处在于所述主板硬盘上安装有一集成有OCR识别系统的OCR芯片;所述OCR识别系统经过摄像头的影像输入,依次进入影像前处理、文字特征抽取、比对识别,经人工校正将认错的文字更正,将结果输出。本实用新型利用手机的摄像头把一些资料“拍”到手机里储存起来,方便人们随时翻阅,进而重复记忆,达到掌握该知识的目的。本实用新型将OCR功能成功植入手机后,将大大有利于经常读书看报的人及广大学生存储平面媒体上的资料。
文档编号G06K9/20GK201191870SQ20082002075
公开日2009年2月4日 申请日期2008年4月25日 优先权日2008年4月25日
发明者王爱磊 申请人:王爱磊
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1