可训练手持光学字符识别系统和方法与流程

文档序号：11729802阅读：169来源：国知局

相关申请交叉引用

本申请为提交于2014年10月23日、标题为“可训练手持光学字符识别系统和方法”的共同未决美国专利申请序列号14/521,508的部分接续申请，上述申请为2012年8月21日提交的美国专利申请序列号13/590,744、现为2014年10月28日的标题为“可训练手持光学字符识别系统和方法”的美国专利号8,873,892的接续申请，所有申请在此通过引用并入本文。

关于联邦赞助研发的声明

不可用。

背景技术：

本技术涉及成像系统，更特别地，涉及具有可训练光学字符识别功能的手持扫描仪。

包含光学字符识别(ocr)的光学成像系统被用于例如读取包装或物品上的字体或其他符号。这些成像系统中最常用的一种是手持扫描仪。ocr一般被认为是从手写的，用打字机打出的或印刷的文本电子至机器可编码文本的可扫描图像的电子转换。对于成像系统而言重要的是获得品质扫描，从而图像可被电子搜索，更紧凑地存储，在线显示，并被用在诸如机器翻译，文本到语音，和文本挖掘应用之类的机器过程中。

为了改进扫描结果，某些光学成像系统利用标准化的机器可读字体，诸如ocr-a和ocr-b，其为使ocr过程更为准确而被创建。标准化字体使解码图像中的字体较为不复杂，因为成像系统被制成意识到它企图扫描的简化的字体，且字体中个别字符被设计为易于辨别。例如，数字“0”包含裂口从而帮助与字母“o”(小写)和“o”(大写)相区分。无论如何，多个成像应用，特别是其中手持扫描仪期望来扫描对象或物品的应用，没有使用标准化字体。

某些现代ocr系统可被“训练”以识别可替代的字体和其他符号。但是，训练过程是复杂且费时的过程，其中必须扫描每个字体和/或符号，然后手动地与期望的电子字符或数据相关联。该训练过程涉及使用计算机，其中用户可查看所扫描的图像并将该图像与期望的数据相匹配。一旦所有字体或符号与期望的数据相关联，可生成具有所有关联数据的电子文件，且然后该文件可被传递至成像系统，由该成像系统使用以改进扫描结果。

存在具有有限ocr功能的当前的手持扫描仪，这些当前的手持扫描仪要求预先配置的机器可读字体，诸如ocr-a和ocr-b。训练当前手持扫描仪关于可选的字体或符号并非可行，因为手持扫描仪并不具有处理功能和用户界面以提供字体和符号与期望数据之间的关联。此外，与任何成像设备一样，考虑到影响图像扫描质量的大量变量，提供每个图像扫描的品质结果可能是困难的。

需要允许根据可选字体和/或符号来训练手持扫描仪的系统与方法。还需要可通过改变影响图像扫描质量的变量来改进每个图像扫描的质量的系统与方法。

技术实现要素：

通过将视觉软件与手持扫描仪结合来允许该手持扫描仪被训练用于ocr，本实施例克服了现有技术的劣势。在某些实施例，该手持扫描仪可包括用户界面，以允许用户关联标记图像与该标记的电子数据。该用户界面，以及测距器，还可被用于改变影响图像扫描质量的变量，由此改进图像扫描和/或解码过程的结果的质量。在其它实施例，该手持扫描仪在该解码过程期间可使用字体描述文件。在某些实施例，可利用字符的合成图像文件来生成该字体描述文件。该合成图像文件可通过解释标记字体文件而建立。在其它实施例，该手持扫描仪可使用通过解释标记字体文件而生成的字体描述文件。

因此，某些实施例包括手持扫描仪。该手持扫描仪包括扫描仪子组件。该扫描仪子组件可包括视觉传感器、耦合于该视觉传感器的处理器和耦合于该处理器的存储器。用户界面可耦合于该扫描仪子组件，该用户界面包括视觉显示器，用于浏览要扫描的标记的至少一部分的现场图像，该视觉显示器包括在该视觉显示器上的可浏览的感兴趣区域，该感兴趣区域能使用户为了该手持扫描仪的最佳x-y位置而定位该手持扫描仪。并且，视觉软件可由该处理器执行，该视觉软件可操作以数字地解释标记字体文件以解码该标记的后续图像，该标记字体文件描述该标记。

其他实施例包括手持扫描仪。该手持扫描仪包括扫描仪子组件。该扫描仪子组件可包括视觉传感器、耦合于该视觉传感器的处理器和耦合于该处理器的存储器。测距器可耦合于该扫描仪子组件，该测距器从该扫描仪子组件的面延伸一预定义距离，该预定义距离提供用于扫描的最佳工作距离，该测距器从该扫描仪子组件的该面基本平行于该视觉传感器的光轴而延伸出去。并且，视觉软件可由该处理器执行，该视觉软件可操作以数字地解释标记字体文件以解码该标记的后续图像，该标记字体文件描述该标记。

另一实施例包括手持扫描仪。该手持扫描仪包括扫描仪子组件。该扫描仪子组件可包括视觉传感器、耦合于该视觉传感器的处理器以及耦合于该处理器的存储器。用户界面可耦合于该扫描仪子组件，该用户界面包括视觉显示器，用于浏览要扫描的标记的至少一部分的现场图像，该视觉显示器包括在该视觉显示器上的可浏览的感兴趣区域，该感兴趣区域能使用户为了该手持扫描仪的最佳x-y位置而定位该手持扫描仪。测距器可耦合于该手持扫描仪子组件，该测距器从该扫描仪子组件的面延伸一预定义距离，该预定义距离提供用于扫描的最佳工作距离，该测距器从该扫描仪子组件的该面基本平行于该视觉传感器的光轴而延伸。并且，视觉软件可由该处理器执行，该视觉软件可操作以数字地解释标记字体文件以解码该标记的后续图像，该标记字体文件描述该标记。

根据上文，某些实施例包括用于在对象上扫描标记的方法。该方法包括提供手持扫描仪，该手持扫描仪包括视觉传感器、耦合于该视觉传感器的处理器、耦合于该处理器的存储器、用户界面和测距器；启用该用户界面上的视觉显示器，该视觉显示器用于浏览该标记的至少一部分的现场图像；观察该视觉显示器，同时移动该手持扫描仪以使该视觉显示器显示该标记的至少一部分的现场图像；定位该标记的至少一部分的现场图像接近或处于该视觉显示器上的可浏览的感兴趣区域内，用于对齐反馈；定位该手持扫描仪以使该测距器的远端接触或基本接近该对象；并且数字地执行该视觉软件，用于解释标记字体文件和用于解码该标记的后续图像，该标记字体文件描述该标记。

在某些实施例，该方法可进一步包括数字地执行该视觉软件，用于数字地关联该标记字体文件与希望的电子数据并用于生成字体描述文件，该字体描述文件可用于解码该标记的后续图像。

在某些实施例，数字地关联进一步包括利用该用户界面以便关联该标记的电子图像与希望的电子数据。

在某些实施例，该方法可进一步包括数字地解释该标记字体文件以便建立合成图像文件。

在某些实施例，该方法可进一步包括数字地关联该合成图像文件与希望的电子数据以便生成该字体描述文件。

在某些实施例，该方法可进一步包括启用该手持扫描仪的触发器以便启用该视觉显示器。

在某些实施例，该方法可进一步包括释放该手持扫描仪的触发器，以启动该标记的扫描。

在某些实施例，该方法可进一步包括解码该标记的图像，并在该显示器屏幕上显示经解码的标记。

在某些实施例中，该方法可进一步包括：将标记的现场图像定位成接近或处于该视觉显示器上的可浏览的感兴趣区域内；定位该手持扫描仪，以使该测距器的远端接触或基本接近该对象；启动该标记的第二扫描以生成该标记的第二电子图像；访问存储于该存储器中的字体描述文件；并利用所访问的字体描述文件解码该标记的第二电子图像。

对于前述和相关的目标的成就，本技术则包括下文中完整描述的特征。以下描述和所附附图详细阐述了本技术的多方面。然而，这些方面只表示能运用本技术原理的多种方式中的一小部分。通过结合附图参考对本技术的以下详细描述，本技术的其它方面，优点和新颖特征将变得显而易见。

附图说明

图1是根据本实施例的手持扫描仪的一个实施例的示意图，并示出可用于ocr功能的任选的计算机；

图2是图1中所示的手持扫描仪的俯视图；

图3是图1中所示的手持扫描仪的透视图，并示出在扫描一对象之前位于一定位置的手持扫描仪；

图4是来自根据本实施例的手持扫描仪的显示屏幕的视图，并以部分视图示出一对象上的标记且仅该标记的一部分位于感兴趣区域内；

图5是图4中所示的显示屏幕的视图，现以全部视图示出该标记但仍然仅该标记的一部分位于感兴趣区域内；

图6是图5中所示的显示屏幕的视图，现以全部视图示出该标记且该标记位于感兴趣区内；

图7是图3中所示的手持扫描仪的透视图，现位于扫描位置，该对象与该手持扫描仪之间具有预定间距；

图8和9是与该手持扫描仪相关联的方法的流程图；

图10为方法流程图，用于生成合成图像文件；

图11为字体描述文件的示意图；

图12为关联于训练该手持扫描仪的方法的流程图；以及

图13为关联于利用字体描述文件解码经扫描的图像的方法。

虽然本技术允许多种修改和替代形式，但具体实施例将通过附图中的示例示出并将在本文中进行详细描述。然而应当理解，这里对具体实施例的描述并不意图将本技术限于所公开的特定形式，相反，其意图覆盖属于如所附权利要求所限定的本技术的精神和范围内的所有修改，等同物以及替换。

具体实施方式

现在参考附图描述本技术的各个方面，其中在若干视图中相似的附图标记对应于类似的元素。然而应该理解，下文所涉及的附图和详细描述并不意图将所要求保护的主题限制为所公开的特定形式。相反，本发明将包含处于所要求保护的主题的精神和范围内的所有修改，等同物和替换。

如本文所使用的，术语“组件”，“系统”，“设备”等意图指硬件，硬件和软件的组合，软件或者是执行中的软件。本文中所使用的词语“示例性”表示作为示例，实例或说明。在此被描述为“示例性”的任何方面或设计并不一定要被解释为相比其他方面或设计更优选或有利。

此外，所公开的主题被实现为可以通过使用标准编程和/或工程技术和/或编程来产生硬件，固件，软件或其任何组合以控制基于电子的设备的系统，方法，装置或制品，以实施在此详细描述的各个方面。

除非另外指定或限制，术语“连接”和“耦合”及其变型被广泛地使用，并且包含直接和间接的安装，连接，支承和耦合。此外，“连接”和“耦合”不限于物理或机械连接或耦合。如本文中所使用的，除非另行明确表述，“连接”是指一个元件/特征直接或间接地连接到另一元件/特征，并且不一定是电气地或机械地。类似地，除非另行明确表述，“耦合”是指一个元件/特征直接或间接地耦合到另一元件/特征，并且不一定是电地或机械地。

如此处所使用地，术语“处理器”可包括一个或多个处理器和多个存储器和/或一个或多个可编程硬件元件。如此处所使用地，术语“处理器”意在包括任何类型的处理器，cpu，微控制器，数字信号处理器或能执行软件指令的其他设备。

如此处所使用的，术语“存储介质”包括非易失性介质，例如磁介质或硬盘，光学存储或闪存；诸如系统存储器之类的易失性介质，例如诸如dram，sram，edoram，rambusram，drdram之类的随机存取存储器(ram)；或者其上可存储计算机程序和/或可缓存数据通信的安装介质，诸如软件介质，例如cd-rom或软盘。术语“存储介质”还可包括其他类型的存储器或其组合。

下面通过使用示图来说明用于实施本技术的实施例的实施例的结构或处理来描述本技术的实施例。以这种方式使用示图来呈现本技术的实施例不应被解释为对其范围的限制。本技术考虑用于训练手持光学字符识别系统的电子设备配置和系统及方法。

现在将结合手持扫描仪来描述成像系统的各实施例，所述手持扫描仪适于被训练以执行于定制和可选字体和其他符号上的ocr。这是因为本技术的特征和优点很好地适于该目的。而且应该理解，本技术的各方面可被用于可从ocr功能中受益的其他形式的成像系统。

现在参见图1，在手持扫描仪20的环境中描述一个示例性实施例，除了其他组件外，该手持扫描仪20包括扫描仪子组件22、用户界面24和任选的测距仪26。作为非限制性示例，示例性手持扫描仪20可用于存储，制造，装配，自动化，和/或控制应用等。示例性手持扫描仪20可使用图像采集软件30，图像采集软件30可用于执行多种类型的图像采集中的任何一种。作为非限制性示例，该手持扫描仪20可执行机器视觉任务，包括扫描并解码包含字体和/或符号的图像。

仍然参见图1，扫描仪子组件22可包括被用于扫描过程的各种组件。例如，扫描仪子组件22可包括视觉传感器32。当拉动或释放触发器40时，视觉传感器32用于将从对象34和位于该对象上的相关联的标记38(图示为形式化的s)反射的光转换为电子，以在视场(fov)36中创建该标记38的电子图像48。在某些实施例中，透镜组件42可位于视觉传感器32之上或之前，以向视觉传感器32提供fov36中的对象34的视图。

扫描仪子组件22还可包括处理器44，用于例如图像处理和解码。处理器44耦合至视觉传感器32，且可以是视觉传感器32的一部分或可局部链接至视觉传感器32。处理器44可用图像采集软件30编码，除其他事情外，可被配置为控制照明、采集图像数据和将所采集的图像数据处理/解码为可用的信息等。处理器44还可耦合至一个或多个视觉反馈设备46和/或一个或多个听觉反馈设备50以向用户提供表示扫描和/或解码过程的结果(如，成像的标记的质量是否满足或超过基线质量评估值)的反馈。例如，视觉反馈设备46可包括灯或发光二极管46且听觉反馈设备50可包括小型扬声器或呼叫器设备50。在至少某些情况下，可使用不同led颜色来表示标记质量是否通过基线值测试(如，绿色led可表示高标记质量而红色led表示没有通过质量测试的标记)。

扫描仪子组件22还可包括耦合至视觉传感器22和/或处理器44的存储器介质52。该存储器介质可被用于存储所扫描或处理的图像48、字体描述文件58、标记字体文件170和缓冲数据与通信等。通信端口54也可耦合至处理器44，并向任选的计算机56提供连接点。计算机56可被用于上传和下载例如经扫描的或经处理的图像48、字体描述文件58和标记字体文件170。应理解，还考虑了无线通信。

参见图1，以及图2，手持扫描仪20还可包括用户界面24以允许用户影响来自扫描仪的结果的质量。在某些实施例中，例如，用户界面可包括运行microsoftwindowsce平台的小型便携式数据终端或类似设备。

用户界面24可包括显示屏幕60和键盘62，且可以与扫描仪子组件22集成，或可为可操作地耦合至扫描仪子组件22的可移除设备。在某些实施例中，显示屏幕60可包括触摸屏功能，从而消除或减少键盘62所可能包括的键的数量。显示屏幕60提供位于手持扫描仪20的fov36的至少一部分内的现场反馈视图64。

示例性显示屏幕60可包括位于显示屏幕60上的所显示的或者以其他方式为用户可见的感兴趣区(roi)区域66。通过允许用户总体上看到视觉传感器32在fov36中正看到的现场图像以及重新放置该手持扫描仪20从而期望的标记38被最优地放置在roi66中以便于扫描，现场反馈视图64和roi66允许用户手动地影响至少一个成像变量来改进来自扫描的结果的质量。例如，当触发器40被拉动时可启用现场反馈视图64，或任选地，当手持扫描仪20被加电并准备扫描时可启用现场反馈视图64。

参见图3，用户将手持扫描仪20放置在距离对象34和将被扫描的相关联的标记38一特定距离处。在某些实施例中，然后用户接合该触发器40来允许显示屏幕60显示现场反馈视图64。诸如用覆盖框，roi66一般可以是永久地位于显示屏幕60上(比如具有一覆盖层)，或者roi66是可调节的图像，可对于特定应用来调节其高度和宽度，并与现场反馈视图64一起显示在显示屏幕60上。将理解的是，roi66不需要是如图所示的正方形，而可以是位于显示屏幕60上允许用户重新放置手持扫描仪20来改进来自扫描的结果的质量的任何指示。例如，可使用圆圈、“x”、点或箭头或任意组合。

参见图4，示出显示屏幕60的示例性视图，其中标记38部分地位于视觉传感器32的fov36内且因此部分地显示在显示屏幕60上。用户，在看到标记38仅部分地被显示时，然后可调节手持扫描仪20的位置，企图重新放置手持扫描仪20(或重新放置标记38)以使标记38位于roi66内。图5示出其中标记38位于fov36内且部分地具有roi66的示例。在某些实施例中，可在此处扫描该标记38。为了改进来自扫描的结果的质量，用户可进一步重新放置手持扫描仪20(或重新放置标记38)以使标记38基本或完全位于roi66内。图6示出其中标记38完全位于roi66内的显示屏幕60的视图。

在某些实施例中，可使用视觉反馈设备46和/或听觉反馈设备50来向用户提供反馈从而表示标记38的位置，如，该标记是部分地或完全地在roi内。

现在参见图7，手持扫描仪20的实施例可包括测距仪26。单独地或与显示屏幕60和相关联的roi66组合地，测距仪26也可用于改进来自扫描的结果的质量。当使用传统手持扫描仪时，对象34和相关联的标记38相对于手持扫描仪的物理位置不可避免地在标记扫描中引入不确定性。显示屏幕60和相关联的roi66改进手持扫描仪20和标记38中的一个或两个的x-y位置，并在z位置或工作距离中提供某种改进，同时使用测距仪26可为最优工作距离和比例来放置手持扫描仪20，同时还帮助x-y位置。

在具有测距仪26的实施例中，假设手持扫描仪20与对象34和相关联的要扫描的标记38具有预定最优距离72从而使得在不要求处理器44执行大量计算以企图改进标记38的聚焦的情况下该图像大致是焦点对准的，可改进扫描的结果。该最优工作距离对于确定图像中标记的比例以及确保足够的聚焦是重要的。在其他实施例中，透镜组件42可以是定焦或“变焦”透镜组件42，可被用于为较广范围的工作距离提供不变的放大。

在图示实施例中，测距仪26包括从基座90(见图2)延伸的多个指状物86。在这个配置中，对于可能正看着对象34上的标记38的用户而言，标记38可保持可见。在其他实施例中，测距仪26可以在形状上更为管状或矩形而没有任何如指状物86所设置的间隙，由此部分地或基本上减少使对象34上的实际标记38可视化的用户能力。

如图7中所示，测距仪26可从手持扫描仪20的前端面74延伸。测距仪26可以是刚性元件，沿着基本平行于fov36的中间轨迹(未示出)的轨迹而延伸。在操作中，在启动手持扫描仪20之前，用户可放置手持扫描仪20以使测距仪26的远端76接触与将被读取的标记38相邻的对象34的第一表面80。此处，测距仪26的长度82(见图2)被设计为使得当远端76接触第一表面80时最优成像距离72位于手持扫描仪20和第一表面80之间。因此，在至少某些实施例中，测距仪26也可帮助消除或减少至少一个成像变量。

例如，仍然参见图7，尽管测距仪26被图示为刚性且与手持扫描仪20一体地形成，在某些实施例中，例如，测距仪26可以是柔性的，可以像无线电天线一样伸缩，且可折叠至存储位置。在某些实施例中，测距仪26可以是可移除的。例如，使用耦合至手持扫描仪20的前面74的夹或轭(collar)84等，测距仪26可附连在该前面74处。测距仪26还可由漫射材料制成，由此利用可用手持扫描仪20获得的照明选项。然后，来自手持扫描仪20的照明可穿过漫射材料并提供附加的漫射照明优势以改进来自扫描的结果的质量。

在某些实施例中，测量设备92(诸如用于距离测量的已知的led或激光二极管92)可被包括以便与测距仪26组合或替换测距仪(见图2)。当达到最优工作距离时，激光二极管92可与显示屏幕60一致地操作以提供指示。测量设备92可作为测距仪，诸如飞行时间激光测距仪。可使用测量设备92来确定到用于训练的标记38的距离和到用于扫描的标记38的距离。然后可了解训练与扫描配置之间的比例差异，且可通过标准机器视觉技术来补偿该放大，诸如调整图像大小或在ocr算法中补偿比例。

再次参见图1，手持扫描仪20可被训练为对定制和可选字体和任何其他符号来执行ocr。以此方式，用户能控制什么样的字体和符号手持扫描仪20能准确地扫描并解码。

与现有手持扫描仪相关的问题在于其被限于扫描标准化的机器可读字体，诸如已知字符组ocr-a和ocr-b，且不能按照用户要求被训练。这些已知字符组被设计为易于读取和识别。现有手持扫描仪不能读取定制和可选字体和其他符号，其可使用不同印刷方法印刷，诸如点阵、热转印、喷墨、激光标记，且它们不能读取被印刷在消费品(诸如薯片包装袋)上的字符。这些扫描应用经常涉及非典型读取状况，包括变化的灯光、变化的景深、各种印刷方法和变化的角度读取。这些状况引起在现有能进行ocr的手持扫描仪中未解决的问题。在某些实施例中，被训练的手持扫描仪20与显示屏幕60和测距仪26结合以识别字体与符号就解决了这些非典型读取状况。

为了训练该手持扫描仪20，在某些实施例中，可使用计算机56来创建将图像区域与字符相关联的字体描述文件58。图像区域可为任何形状，并可包括看起来像一字符的像素块，或任何预定义形状，诸如字符“s”，作为一非限制实施例。可使用手持扫描仪20来采集字符(如，标记38)的电子图像48，例如标记38。可将图像48下载至计算机56，其中可以使用诸如来自cognex公司的软件之类的视觉软件96来将该图像48与字体相关联。一旦创建了字体描述文件58，字体描述文件58可被上传至手持扫描仪20中的存储器52。然后该手持扫描仪20可被配置以读取该字体描述文件58，这允许该手持扫描仪20扫描并解码该字体。

在可选实施例中，可省去计算机54且该关联过程与字体描述文件58生成可发生在手持扫描仪20上。用户界面24或存储介质52可包括视觉软件96，且键盘62可包括足够的功能以完成该关联过程。

图8、9和12示出手持扫描仪20的使用方法的实施例。图8、9和12中所示方法可与以上附图所示的任何系统或设备等结合使用。在多个实施例中，所示方法元素中的某些可被同时执行、按与所示顺序不同的顺序执行、或者可被省略。也可按需执行附加的方法元素。

参见图8，示出方法120用于扫描位于对象34上的标记38。第一个步骤可以是提供包括用户界面24和测距仪26的手持扫描仪20，如过程框122中所示。在过程框124，用户可挤压触发器40来启用视觉显示器60。在过程框126，然后用户可观察视觉显示器60，同时移动该手持扫描仪20，从而将标记38放置为相当可能地靠近roi66或位于roi66内。然后在过程框130，用户可放置手持扫描仪20，以使测距仪20的远端76触碰或相当靠近对象34和标记38的第一表面80，从而提供用于扫描的最优工作距离。将理解的是，该手持扫描仪20可能已经位于这个最优距离位置。当用户将标记38放置在roi66内(见图7)且测距仪26的远端76触碰到对象34时，在过程框132，用户释放触发器40来启动扫描。任选地，在过程框134，处理器44然后可解码该扫描的图像。任选地，如过程框136所示，通过启动一个或多个反馈设备46、50和/或通过将经解码的图像显示在显示屏幕60上供用户查看，手持扫描仪20可提供图像扫描和/或解码成功的指示。然后对于将扫描的下一个标记来重复该过程。

参见图9，示出为标记38的ocr而训练手持扫描仪20的方法150。第一个步骤可以是提供包括存储器52和用户界面24的手持扫描仪20，如过程框152中所示。在过程框154，可启动在用户界面24上的视觉显示器60。视觉显示器60可用于查看标记38的现场图像。在过程框156，然后用户可以观察该视觉显示器60，同时移动或放置该手持扫描仪20，以使视觉显示器60显示该标记38的现场图像。在过程框160，可启动标记38的扫描来生成该标记的电子图像。然后该标记38的电子图像可被存储在存储器52中，如过程框162处所示。接着，在过程框164，可将标记38的电子图像与期望的电子数据相关联。然后可生成字体描述文件58，该字体描述文件58将电子图像与期望的电子数据相关联，如过程框166处所示，且在过程框168处，字体描述文件58可被存储在存储器52中。

在其它实施例中，字体描述文件58可直接或间接地生成自一标记字体文件170。该标记字体文件170可为基于软件的描述172，即一个或多个字符集合如何利用特定标记技术被打印。作为非限制示例，字符集合可包括某些或所有字母数字字符，(见标记38，作为形式化字母“s”的示例)或其他预定义的字符集合。

如上所讨论，存在多种类型的字符标记技术，作为非限制示例，包括点阵、热转印、喷墨和激光标记。存在多个标记厂商，包括打印机，其能够利用任何这些技术标记一项目。某些企业提供使用多种标记技术的多种产品，而其他企业专长于单个标记技术。由于存在多种标记技术和利用这些技术的多个企业，标记产业中很少有标记字体文件170的格式标准。

某些标记字体文件可直接映射至特定标记38应如何应对印刷，而其他标记字体文件不直接映射至特定标记应如何应对印刷。

直接映射的标记技术的一个示例为热印刷过程，其可按大于每英寸600点(dpi)进行印刷。热印刷技术通常使用truetype或其他相似可缩放标记字体文件，并且存在专用于厂商和标记技术的其他已知格式。用于热印刷过程的标记字体文件170可为软件描述，其数学地描述可被打印机缩放和绘制的特定标记38的轮廓。

典型地不直接映射的标记技术的示例为激光标记技术。激光标记可按某些不同的方式之一建立标记。标记器(诸如利用激光标记技术的激光打印机)可烧掉外层，留下下方的层可见。激光标记可利用有机化合物烧焦一表面或多个表面，建立与周边区域的反差。激光标记还可修改材料属性，诸如通过熔化塑料或金属，其随后可建立反射率的变化。用于激光标记的标记字体文件170可为软件描述，即激光如何被引导，通常通过控制镜的倾斜，以建立特定标记38。用于激光标记的简单标记字体文件170例如可将标记38建模为可在一表面上绘制标记38的激光笔画。

另一通用标记技术为连续喷墨或cij。cij打印机以稳定速率喷射墨滴流。这些墨滴被加电而且通过在具有受控的电荷的盘片之间传送加电的液滴而修改加电的液滴的轨迹。为形成特定标记，墨滴典型地被施加在单行中，其位置由墨滴上的电荷和盘片上的电荷确定。标记38的第二维度来自被打印机打印的对象的运动。用于cij标记的标记字体文件170可为软件描述，其定义表示理想液滴位置的点的二维理想化网格以建立特定标记38。具有缓慢移动对象的真实世界cij标记，诸如一张纸，可看上去非常接近这种理想化网格。快速移动该对象建立可看上去从理想化网格偏斜的标记。另一效果为：随着该对象移动进一步远离cij印刷喷嘴，单个液滴相分离而不是接触。

在某些实施例，标记字体文件170可由ocr算法使用。标记字体文件170还可被数字地翻译为一格式，诸如字体描述文件58，其可由ocr算法使用。在某些实施例，当ocr算法的操作细节和标记字体文件170格式为已知时，这可在单个步骤中完成。在其它实施例，作为中间步骤，标记字体文件170可被数字地翻译为可由ocr算法利用理想化合成图像文件178使用的格式。如果ocr文件格式未知，利用合成图像文件178的这个中间步骤可以是必要的，并且因为标准ocr算法允许用户从图像中“训练”，即，允许用户设置图像区域和实际字符之间的对应关系。换言之，生成合成图像文件178，然后将图像区域标识为特定字符180，诸如形式化字母“s”。

参考图10，解释算法176、计算机56或处理器44可数字地解释标记字体文件170，以直接地或间接地建立一个或多个字符的合成图像文件178，例如特定字符180(诸如标记38的形式化字母“s”)或多个字符(诸如所有字母数字字符)。然后解释算法176知道特定字符(例如，特定字符180)被绘制于标记字体文件170的特定区域。然后该信息可被传递至ocr算法作为特定字符180的输入。合成图像文件178可为电子数据文件，其提供特定字符180的理想化字符图案的电子数据定义。合成图像文件178可取代用于生成字体描述文件58的电子图像48或与之相结合使用。

因为标记字体文件170描述打印机将如何印刷每个特定字符，例如字符180，字符的电子图像48不需要被获取以将该字符的图像像素与该字符的字体描述文件58匹配。可以不需要其他输入或交互来将获取的图像中的字符与独立字符的字体描述文件58匹配。具有质量标记的“金色样本”可能不需要被建立用于训练目的。

为训练手持扫描仪20，字体描述文件58可被上传至手持扫描仪20中的存储器52。然后手持扫描仪20可被配置以获取一图像，诸如图像48，并读取字体描述文件58，其允许手持扫描仪20扫描和解码特定字符，诸如字符180。

在某些实施例，标记字体文件170可从计算机56例如经由通信端口54被下载至存储器介质52并被存储于手持扫描仪20中。当因为ocr文件格式未知而需要合成图像文件178时，解释算法176可解释标记字体文件170以直接地或间接地建立特定字符180的合成图像文件178。合成图像文件178可存储于存储器介质52或可上传至计算机56。字体描述文件58然后可被生成，其关联合成图像文件178与字符184，以便用于ocr过程期间(参见图11)。该配置可允许理想标记和运行时实际打印内容之间更好地匹配，因为标记字体文件170可为物理标记过程的改进描述，然后其可由ocr算法建模。

例如，cij点的间隔和偏斜可被测量并且更能代表运行时特性的ocr字体可被生成。在cij印刷中，独立的液滴可被描述于标记字体文件170中，但该信息可在经历建立合成图像文件178的中间步骤时丢失。该信息可由ocr算法使用以更好地处理诸如液滴/点位置基于来自喷墨嘴的部分位置而增加或减少时的情况。

第二示例为激光标记。如上所讨论，激光笔划宽度可受激光功率和被标记的材料属性影响。并且如果该信息被给予ocr算法，ocr算法可更好地处理与理想的偏离，因为ocr算法典型地被配置以使用该类型的信息。

在其它实施例，标记字体文件170可位于计算机56上。计算机56可存储并使用解释算法176，当需要时，解释标记字体文件170以直接地或间接地建立特定字符180的合成图像文件178。合成图像文件178可被存储于计算机56上或合成图像文件178可被下载至存储器介质52并被存储于手持扫描仪20中。字体描述文件58然后可在计算机56上或手持扫描仪20中被生成，以关联特定字符180的合成图像文件178与字符184，以便用于ocr过程期间。

在标记字体文件170和字体描述文件58之间翻译的其他特征被明确考虑。例如，标记字体文件170不必要直接地被使用。例如，中间文件格式，诸如一般激光字体描述，可被使用于标记字体文件170和字体描述文件58之间的翻译。

对于某些标记字体文件170，理想标记字符可能偏离于运行时标记属性。当字符偏离被识别时，运行时字符的其他属性，诸如尺度，可被标识，其在训练时和运行时图像是经由手持扫描仪20获取时并非必要。

参考图12，训练手持扫描仪20进行字符180的ocr的可选的方法190被示出。第一步骤可为解释标记字体文件170，如处理框192表示。可选地，标记字体文件170可利用解释算法176来解释。解释算法176可建立合成图像文件178，如在处理框194表示。合成图像文件178可提供特定字符(诸如字符180)的理想化字符图案的电子数据定义。可选地，在处理框198，合成图像文件178可用于生成字体描述文件58。在处理框200，字体描述文件58可被存储于计算机56上或存储器介质52中。

参考图13，利用手持扫描仪20扫描对象34上的标记38的方法204被示出。在处理框206，用户启动标记38的图像获取。在处理框208，处理器44然后可尝试通过比较经扫描的图像与字体描述文件58来解码经扫描的图像。可选地，如在处理框210表示，通过启动一个或多个反馈设备46、50和/或通过在显示器屏幕60上显示经解码的图像以使用户看见，手持扫描仪20可提供图像获取和/或解码成功的表示。该过程然后可对标记的下一个图像获取而重复。

虽然已参考优选实施例描述了本技术，但是本领域技术人员将意识到，可在形式和细节上作出改变而不脱离本技术的精神和范围。例如，本技术不限于本文所示的手持扫描仪及关联设备的实施例，并且可利用其它扫描仪和相机来实施。

以上公开的特定实施例仅仅是说明性的，因为本技术可按不同却等效的方式来修改和实现，这对受益于本文教导的本领域技术人员而言是显而易见的。此外，并非意图限制本文所示以及所附权利要求中所述的构造或设计的细节。因此，以上公开的特定实施例显然可被更改或修改，并且所有改变被认为处于本技术的范围和精神。因此，在所附权利要求中声明所述本文所要求的保护。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J·A·内格罗;C·W·格斯特
技术所有人：康耐视公司
我是此专利的发明人

上一篇：确定图像中的感兴趣区域的轮廓的方法和系统与流程
上一篇：文字信息获取方法、装置及移动终端与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。