用于捕捉图像的方法和系统的制作方法

文档序号:7620320阅读:153来源:国知局
专利名称:用于捕捉图像的方法和系统的制作方法
技术领域
本发明总体上涉及使用数码相机来捕捉图像的方法和系统。尤其(但非排他地)涉及一种捕捉例如名片等文档的图像的方法和系统。
背景技术
增强的小型化数码相机技术导致了数码相机在各种手持电子装置中广泛使用。例如,现今数码相机通常结合到移动电话、个人数字助理(PDA)以及膝上型电脑中。数码相机的这种普遍存在的可用性产生了许多新颖的用于数字图像的商业应用。例如,商业人员能够使用结合到移动电话中的数码相机来快速、便利地捕捉名片中的数字图像。然后,对名片的数字图像执行光学字符识别(OCR),并将印刷在名片上的姓名、地址及其它信息自动存储在电话的联系文件(contactfile)中。
OCR可定义为将文本图像数据转换成字符代码格式的处理过程,所述字符代码格式例如文字处理应用软件可读取的ASCII码。在原始的文本图像数据中,文本字符和例如图形或线条的其它类型的图像数据一样是由各个像素组成。在转换为字符代码格式后,文本字符的原始图像常常不再可用来对转换结果进行编辑和纠错。因此,为了将图像转换成特殊的字符代码,OCR处理过程需要质量相当高的单个字符图像。
然而,现在使用数码相机的许多环境,对于捕捉高质量的图像并不理想。例如,试图捕捉名片图像的数码相机的用户只是用一只手随意地拿住名片放在相机镜头前,同时用另一只手拿住相机,然后拍照。在那种情况下,诸如镜头到名片的距离,及相机的图像平面相对于名片正面的角度这样的可变因素是不理想的。因此,最后所得到的图像可能包含象射影变形这样的缺陷。


为了使本发明易于理解,并有效地付诸实践,参考附图所示的示范实施例,其中在遍及各个视图中,相同的数字表示同样的或功能类似的元件。结合下面详细描述并且组成说明书一部分的附图,有助于进一步说明依据本发明的实施例并且解释依据本发明的各种原理和优点,其中图1示出了依据本发明实施例的相机系统的正面示意图。
图2示出了依据本发明实施例的相机系统的背面示意图。
图3示出了图像射影变形原理的示意图。
图4示出了通过相机系统的预览视窗所观察到的显著射影变形的名片图像。
图5是依据本发明实施例用于描绘名片预览图像的预览视窗示意图。
图6示出了依据本发明一个实施例的捕捉物体正面图像方法的步骤流程图,该物体具有至少两个基本上直的边缘。
熟练的技术人员应当理解到为了简单清晰地说明附图中的元件,无需按照一定比例绘图。例如,为了增进理解本发明的实施例,附图中的一些元件尺寸可以相对于其它元件放大些。
具体实施例方式
在详细描述依据本发明的实施例之前,应当注意到,实施例主要在于涉及用于捕捉图像的方法和系统的方法步骤和装置的组件。因此,装置件件和方法步骤通过常用符号适当的表示在附图中,这里仅仅示出了那些和理解本发明实施例有关的具体细节,以免对于受益于这里描述的本领域普通技术人员来说是容易理解的细节使得本公开难懂。
在该文件中,相关术语如左和右、上和下等等仅用来区别一实体或动作和其他的实体或动作,无需要求或暗示这种实体或动作之间的任何实际的这种关系或次序。术语“包括”、“包含”或其任何其它的变体规定为覆盖一个非专有包括,使得包括元件列表的过程、方法、项(article)或装置并不仅仅包括那些已述元件,而且还包括其它未特别列出的元件或这种过程、方法、项目或装置固有的元件。无需更多的约束条件,为一个元件加上前言“包含一……”并不排除在包括该元件的过程、方法、项目或装置中出现另外完全相同的元件。
参考图1所示,示出了依据本发明实施例的相机系统100的示意图。和大多数相机一样,系统100包括结合一正面110的相机外壳105。正面110包括一适合于接收图像的图像传感器115。图像传感器115可以包括常规的透镜和光学器件,以及数字图像传感器,例如电荷耦合装置(CCD)传感器、CMOS传感器,等等。
参考图2,示出了相机系统100的背面120的示意图。背面120包括一预览视窗125,该预览视窗适合于显示图像传感器115接收到的图像表示。和许多数码相机一样,本领域的技术人员应当认识到,预览视窗125可充当常规相机的取景器,并且实时显示位于图像传感器115前的场景的任何移动图像。典型地,在预览视窗125中所显示的这种实时图像仅仅是瞬时的,并且只有当用户启动快门按扭(未示出)、定时器或其它图像捕捉触发机构时,该实时图像才能被捕捉到系统100的内存中。本发明的一个实施例进一步包括模式选择开关130,该模式选择开关可以用来将相机系统100设置成各种照相模式。例如,和许多现有技术的设备一样,模式选择开关130可以用来将系统100设置成标准静态图像模式、视频模式、低光线模式、高速模式,等等。依据本发明,模式选择开关130还可以用来将系统100设置成文档捕捉模式。当模式选择开关130被设置成文档捕捉模式时,基准线135显示在预览视窗125中。本领域的技术人员应当认识到,模式选择开关130可以是位于相机外壳105上的物理开关或触发按扭,或例如可以是使预览视窗125启动的软件开关。外壳105的内部还包括处理器140,该处理器可操作地连接到图像传感器115、预览视窗125以及模式选择开关130,有助于控制那些元件之间的交互作用,并且用于处理图像数据。
依据本发明不同的实施例,基准线135可包括各种尺寸、形状、颜色及格式,并且可以是半透明或不透明的。在使用基准线135期间,基准线135用来指导系统100的用户使图像传感器115位于相对于例如名片物体的适当方位上。因此,在使用基准线135定位期间,基准线135通常相对于预览视窗125固定。依据本发明的另一个实施例,基准线135可以被印刷在预览视窗125上,或以别的方式永久地叠印在预览视窗125上。
如图2所示,在实施本发明一个实施例的操作期间,用户常常通过如下确定基准线135的位置来试图确定文档的框架使基准线135基本上平行的紧邻预览视窗125中所显示的文档表示的直线边缘205或基本上平行的位于直线边缘205之上。在这样的定位中,系统100被设计来捕捉良好聚焦并且清晰的文档图像,该系统具有适当的分辨率,以使得印刷在文档上的任何文本的光学字符识别有效并且可靠。
参考图3,示出了图像射影变形原理的示意图,如本领域技术人员所了解的。所示的光线305通过透镜315从物体平面310传播到图像平面320上。至于本发明,物体平面310相当于将要映像的物体表面,例如名片的表面,透镜315相当于相机系统100的图像传感器115的元件,图像平面320相当于接收到的图像,例如在系统100的预览视窗125中所显示的预览图像。在物体平面310和图像平面320不能达到基本平行的情况下,透镜315使得印刷在物体平面310上的图像描绘按照已知的射影变形方式在图像平面320上发生变形。例如,在物体平面上的区域“P”的形状可以通过透镜315放大,并且通过射影变形扭曲成图像平面上不同形状的区域“Q”。
参考图4,示出了通过相机系统100的预览视窗125所观察到的显著射影变形的名片图像。尽管名片左侧上的印刷文本保持清晰并且易读,但由于名片的表面倾斜于系统100的图像平面320,因此显示出的名片右侧上的印刷文本是模糊的并且不易读取。正如本领域技术人员所知的,相机系统100的有限景深和射影变形使得图像右侧变得模糊不清。
本发明能够通过确保被映像的物体的正面基本上平行于相机系统100的图像平面320来减少图像的射影变形。例如,当系统100处于文档捕捉模式时,仅仅当名片的直线边缘205基本上平行于预览视窗125中所显示的相应的基准线135时,系统100才为用户提供捕捉物体的图像,例如名片。
参考图5,是依据本发明具体实施例用于描绘名片预览图像的预览视窗125的示意图。为了达到说明的目的,所示名片倾斜于系统100的图像平面320,使得卡片的顶部直线边缘205不能达到基本平行于相应的顶部基准线135。在这样的定位中,当系统100在上述文档捕捉模式中操作时,系统100显示出物体平面310和图像平面320达不到基本平行,因此不能捕捉到最终的名片图像。正如本领域中众所周知的,可使用图像边缘检测技术来可靠地计算出具体的基准线135和文档预览图像中相应的直线边缘205之间的角度。在图5中,示出了3条基准线135;然而,根据本发明公开的内容,本领域技术人员应当认识到,依据本发明不同的实施例可以使用不同数量的基准线135,例如二条、三条、四条或更多的基准线135。此外,所有的基准线135不必是直交的。因此,例如相机系统100可以使用三角形排列的三条基准线135来校准三角形状的文档。
可以使用各种技术来向用户指示适当数量的基准线135基本上平行于预览视窗125中所描绘的物体的相应直线边缘205。例如,可以提供由声音组成的警报,象从相机系统100输出的哔哔声。同样,还可以是在预览视窗125上照亮的光线或在相机系统100其它别的地方上照亮的光线。此外,图象指示器可以显示在预览视窗125上,例如,其中当每一条基准线135基本上平行于相应的直线边缘205时,该基准线135可以单独地改变颜色或闪烁。作为替换,当预览视窗125上所显示的直线边缘205基本上平行于相应的基准线135时,系统100能够自动捕捉所选择的图像,为用户提供或不提供指示。
依据本发明的另一个实施例,可使用附加的几何校准技术来测量物体平面310是否和图像平面320对齐。例如,依据本领域技术人员已知的标准图像分析技术来测量在预览视窗125中所描绘的不同直线边缘205的长度。基于“没影点(vanishing point)”的效应,当边205之一离图像传感器115更远时,按照二维图像的显示,矩形文档的两条相对平行的直线边缘205具有不同的长度。因而在图5中,离相机系统100较远的名片右侧的垂直直线边缘205比名片左侧的垂直直线边缘205短。因此,在本发明的实施例中增加了额外的灵敏度,其中仅仅当预览视窗125中所显示的物体的两平行直线边缘205基本上具有相同的长度并且基本上与相应的基准线135平行时,才可以捕捉到图像。
本领域技术人员应当认识到,小型化数码相机技术使得相机外壳105、图像传感器115及预览视窗125几乎可以是任意尺寸的,因而本发明的实施例可以结合到各种电子装置中,例如移动电话、个人数字助理及膝上型电脑。此外,基准线135可以被设计成与不同类型物体的直线边缘205一致。例如这种物体可以包括矩形、三角形或其它形状的纸件,如名片,或其它具有直线边缘205和一表面的物体,其中将该表面定位在平行于相机系统100的图像平面320的方向上有助于减少射影变形。
参考图6,示出了依据本发明一个实施例的捕捉物体正面图像方法的步骤流程图,该物体具有至少两个基本上直的边缘205。首先,在步骤605,系统100的图像传感器115接收预览图像。预览图像描绘了物体的直线边缘205。如上所述,该预览图像通常是瞬时图像,用于适当地确定或校准相机系统100相对于物体平面的方向。接下来,在步骤610,显示出预览图像表示,其描绘了与相机系统100相关的预览视窗125中的直线边缘205和同时存在的至少两条基准线135,其中每一条基准线135对应于一条直线边缘205。依据本发明的一个实施例,在用户选择一种文档捕捉模式之后,基准线135才显示在相机系统100中;作为替换,基准线可以被永久地叠印到预览视窗125上。接下来,在步骤615,当预览视窗125中所显示的直线边缘205基本上与相应的基准线135平行时,为用户提供一个指示。在步骤620,仅仅当预览视窗125中所显示的直线边缘205基本上与相应的基准线135平行时,才提供用于捕捉物体图像。最后,在步骤625,对捕捉到的物体图像执行光学字符识别。
方法600中的步骤625可以使用存储在相机系统100中的软件来执行,或作为替换在远程位置执行步骤625。例如,相机系统100可以仅用来捕捉精确、清晰的文本数据图像,在执行任何光学字符识别之前,可将该图像下载到另一个位置。
总之,本发明是用于捕捉至少具有两条基本上直的边缘205的物体正面图像的改进方法和系统。本发明的实施例采用象模式选择开关130和预览视窗125这种相机系统100常见的特征使得用户在使用中友好并且直观。因而本发明有助于用户精确、可靠地捕捉物体正面的图像,其中物体平面310基本上平行于图像平面320。因此,减少了图像中的射影变形,使图像更加清楚、精确。在减少射影变形的情况下,更有可能高精确度地执行加速图像捕捉处理过程,例如对文本图像所执行的光学字符识别处理过程。
上面的详细描述仅仅提供了示范实施例,并不意味着限制本发明的范围、适用性或构造。相反地,示范实施例的详细描述为本领域的技术人员提供了用于实施本发明示范实施例的可执行描述。应该理解,在不脱离所附权利要求所阐述的本发明的精神和范围内,能够作出对元件的功能和配置及步骤进行的各种变化。应当理解这里所描述的实施例可由一个或多个常规处理器和控制一个或多个处理器运行的唯一存储的程序指令组成,结合特定的非处理器电路,这里所描述的用于捕捉物体正面图像的一些、大多数或所有功能。该非处理器电路可以包括(但不限于)无线电接收机,无线电发射机,信号驱动器,时钟脉冲电路,电源电路,以及用户输入设备。同样地,这些功能可以被解释为执行捕获物体正面图像方法的步骤。作为替换,一些或全部的功能可以通过不具有存储程序指令的状态机来实现,或在一个或多个特定用途集成电路(ASIC)中实现,其中每一项功能或某些特定功能的结合作为常规逻辑电路来实现。当然,也可以结合两种方法来使用。因而,这里描述了执行这些功能的方法和装置。此外,希望普通技术人员在这里所公开的原理和原则的指导下,使用最小限度的实验就能够容易地生成这类软件指令和程序以及IC,尽管可能付出巨大努力,以及基于如可利用的时间、当前技术和经济上的考虑激发出多种设计选择。
在前述的说明中,描述了本发明的具体实施例。然而,本领域的普通技术人员应当理解,在不脱离如权利要求所阐述的本发明范围内,对本发明可作出各种修改和变化。因此,说明书及附图应当认为是对本发明的解释而非限定,以及所有这样的修改都意味着包括在本发明的范围内。该利益、优点、问题的解决方法以及可产生任何利益、优点、或发生或变得更为显著的解决方法的任意成份,都不能解释为任一或全部权利要求的重要、必需或基本的特征或成份。本发明由所附权利要求单独定义,在该申请未决期间所作出的任何修改以及那些权利要求的所有等价物都包含在其内。
权利要求
1.一种用于捕捉至少具有两条基本上直的边缘的物体正面图像的方法,该方法包括在照相机的图像传感器上接收预览图像,所述预览图像描绘了直线边缘;在与照相机相关的预览视窗中显示预览图像的表示,所述预览图像描绘了直线边缘和同时存在的至少两条基准线,其中每一条基准线对应于一条直线边缘;及仅仅当预览视窗中所显示的直线边缘基本上平行于相应的基准线时,才提供用于捕捉物体图像。
2.根据权利要求1所述的方法,其中至少有三条基准线显示在所述预览视窗中。
3.根据权利要求1所述的方法,其中,当所述预览视窗中所显示的直线边缘基本上平行于相应的基准线时,自动地捕捉图像。
4.根据权利要求1所述的方法,其中,仅仅当所述预览视窗中所显示的平行直线边缘基本上具有相同的长度,并且每条直线边缘基本上平行于相应的基准线时,才捕捉图像。
5.根据权利要求1所述的方法,进一步包括在捕捉物体图像前,当预览视窗中所显示的直线边缘基本上平行于相应的基准线时,为用户提供指示。
6.根据权利要求1所述的方法,进一步包括对捕捉到的物体图像执行光学字符识别。
7.根据权利要求1所述的方法,其中,所述基准线被永久地叠印在所述预览视窗上。
8.一种用于捕捉物体正面图像的照相机系统,所述物体具有至少两条基本上平行的直线边缘,该照相机系统包括图像传感器,适合于接收描绘了直线边缘的预览图像;及预览视窗,可操作地连接到所述图像传感器,并且适合于显示所述预览图像的表示,所述预览图像描绘了直线边缘和同时存在的至少两条基准线,其中每条基准线对应于一条直线边缘;其中,仅仅当所述预览视窗中所显示的直线边缘基本上平行于相应的基准线时,才能捕捉物体图像。
9.根据权利要求8所述的系统,其中至少有三条基准线显示在所述预览视窗中。
10.根据权利要求8所述的系统,其中,当所述预览视窗中所显示的直线边缘基本上平行于相应的基准线时,自动地捕捉图像。
11.根据权利要求8所述的系统,其中,在捕捉物体图像前,当所述预览视窗中所显示的直线边缘基本上平行于相应的基准线时,为用户提供指示。
12.根据权利要求8所述的系统,其中,仅仅当所述预览视窗中所显示的平行直线边缘基本上具有相同的长度,并且每一条直线边缘基本上平行于相应的基准线时,才能捕捉物体的图像。
13.根据权利要求11所述的系统,其中,所述物体是名片,并且所述指示包括声音发生器、光线或显示在所述预览视窗上的指示器。
14.根据权利要求8所述的系统,其中所述基准线被永久地叠印在所述预览视窗上。
全文摘要
一种用于捕捉至少具有两条基本上直的边缘(205)的物体正面图像的方法系统,有助于减少图像中的射影变形。该方法包括在相机(100)的图像传感器(115)上接收预览图像,其中该预览图像描绘了直线边缘(205)。随后描绘了直线边缘(205)和同时存在的至少两条基准线(135)的预览图像显示在与相机系统(100)相关的预览视窗(125)中,其中每条参考线(135)对应于一条直线边缘(205)。仅仅当预览视窗(125)中所显示的直线边缘(205)基本上平行于相应的基准线(135)时,才捕捉物体的图像。
文档编号H04N5/225GK1897644SQ20051008199
公开日2007年1月17日 申请日期2005年7月15日 优先权日2005年7月15日
发明者罗希平, 彭刚, 镇立新 申请人:摩托罗拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1