一种扫描输入装置及扫描输入方法

文档序号：6489308阅读：191来源：国知局

一种扫描输入装置及扫描输入方法
【专利摘要】本发明公开了一种扫描输入装置，包括：图像传感器，用于对扫描介质上的字符聚焦成像，生成图像，送入控制器进行处理；控制器，用于对所述图像进行处理，并根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符。本发明通过将字符或符号等信息印于可携带的模拟键盘上，实现了控制命令和字符无障碍输入，单词的随意查询，并实现了计算器功能。控制命令和字符无障碍输入，使设备摆脱键盘，降低成本，缩小体积。同时，与手写输入相比，具有较高的输入效率，节省了用户的操作时间。
【专利说明】一种扫描输入装置及扫描输入方法
【技术领域】
[0001]本发明涉及光学字符识别领域，具体涉及一种扫描输入装置与扫描输入方法，通过扫描进行控制命令和字符的输入。
【背景技术】
[0002]在现有的计算机、便携设备中，主要输入方式为按键、触摸屏、手写等。按键输入方式与触摸屏输入方式需要硬件支持，增加成本的同时，增大设备的体积。手写输入方式受用户手写速度限制，导致输入效率较低。
[0003]光学字符识别(Optical Character Recognition, OCR)技术的出现,为大规模文本的快速输入提供了便利，使得纸质文档转为电子存储方式成为可能。
[0004]利用软件识别技术，专利申请号为200620077723.2的专利文献公开了一种用文字扫描或摄像技术直接查阅电子字典。所述电子字典采用数字转换模式，将内置的扫描输入装置所拍摄的文字单词图像信息，转换成数字信息，与存储在字库里的信息相对照，继而直接查找出该单词，并进行翻译。
[0005]专利申请号为200620123568的专利文献公开了一种便携式图像识别装置。所述装置的图像传感器获取图像后，识别转换器截取第一个单词，通过OCR转换和字典查找，完成一个取词-识别-翻译-显示的过程。
[0006]上述专利文献公开的方案均实现了单词的快速录入，对于印刷有单词的纸质文档，利用图像采集设备采集图像，并实现了图像识别查词技术。
[0007]然而，虽然专利文献200620123568与专利文献200620077723.2所采用的图像识
别技术可以实现单词的快速录入，但是该技术只能录入并查找纸质文档中已有的单词，对于保存于复杂介质中的单词，如印在复杂背景的图像上的字符或手写字符，识别率不高。另夕卜，黑板上，广告牌上或口述字符，无法通过扫描进行输入，无法完成录入及查词工作，因此该技术无法满足用户多样化的录入需求。
[0008]而且在上述专利文献中，通过执行键，确认扫描，当翻译结果错误时，用上下键选择一个正确单词来修正。这些按键支持增加设备体积，使装置外观不够简洁，操作动作繁琐，降低用户友好。

【发明内容】

[0009]本发明公开了一种扫描输入装置，可实现控制命令和字符的扫描输入，并且实现了字符和控制命令的切换，设备外观简洁，操作更加流畅，增强了用户友好，该扫描输入装置带有模拟键盘，扫描输入装置可实现字符的自由输入，满足用户的多样化需求。
[0010]本发明提出的扫描输入装置包括:图像传感器，用于对扫描介质上的控制命令或字符聚焦成像，生成图像，送入控制器进行处理，所述扫描介质上制作有控制命令和字符的至少一种，所述扫描介质上的控制命令或字符由手写或印刷形成；控制器，用于对所述图像进行处理，并根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符信息。
[0011]其中，该扫描输入装置进一步包括触发装置、光路装置和光学镜头，其中触发装置用于当扫描输入装置接触扫描介质进行扫描时，产生工作信号，来控制光路装置形成光路，光路产生的光经扫描介质反射后，再经光学镜头汇聚到图像传感器中用于图像传感器成像。
[0012]其中，该控制器进一步包括:图像处理单元，用于对所述图像进行图像预处理；识别引擎，对经图像处理单元处理后的图像进行识别，识别结果为输入的图像；判断单元，用于根据多帧图像位移来判断扫描输入是控制命令还是字符、或者通过按键信号判断输入的是控制命令还是字符、或者根据对扫描输入图像的识别结果判断输入的是控制命令还是字符，若判断输入的是控制命令，则执行此图像代表的命令，若输入的是字符则保存识别结果O
[0013]所述字符包括数字、字母或文字，所述控制命令包括符号或图案，控制命令不限于结束命令、删除命令、拼首命令、查词翻译命令、返回命令、退出命令、语目切换命令、左移命令、上移命令、下移命令和/或右移命令；所述扫描介质上制作的控制命令和字符的至少一种形成键盘布局。
[0014]本发明还提出一种扫描输入方法，包括:步骤1，对扫描介质上的控制命令或字符聚焦成像，生成图像，送入控制器进行处理，所述扫描介质上制作有控制命令和字符的至少一种，所述扫描介质上的控制命令或字符由手写或印刷形成；步骤2，对所述图像进行处理，并根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符。
[0015]其中步骤I进一步包括按照以下三种方式中的一种来输入字符和控制命令:第一种方式:当需要输入控制命令时，将扫描输入装置置于扫描介质控制命令上，挤压触发装置，扫描输入装置静止不动，采集控制命令，当需要输入字符时，将扫描输入装置置于扫描介质字符上，挤压触发装置，移动扫描输入装置来采集输入字符；第二种方式:当需要输入控制命令时，通过挤压触发装置，同时按住扫描输入装置的某一按键来扫描输入控制命令，而输入字符时则不按所述按键；第三种方式:当需要输入控制命令时，采集代表控制命令的特定图像，需要输入字符时，则采集不同于所述特定图像的图像。
[0016]其中步骤2进一步包括按照以下三种方式中的一种来判断输入的是字符还是控制命令:第一种方式:根据多帧图像位移来判断扫描输入是控制命令还是字符；第二种方式:通过按键信号判断输入的是控制命令还是字符；第三种方式:根据对扫描输入图像的识别结果判断输入的是控制命令还是字符，若判断输入是控制命令，则执行此图像代表的命令，若输入是字符则保存识别结果。
[0017]本发明还提出另外一种扫描输入装置，该装置包括:扫描单元，用于对扫描介质上的控制命令或字符聚焦成像，生成图像，送入控制器进行处理，所述扫描介质上制作有控制命令和字符的至少一种，所述扫描介质上的控制命令或字符由手写或印刷形成；图像处理单元，对所述图像进行处理，并根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符。
[0018]其中所述扫描单元按照以下三种方式中的一种来输入字符和控制命令:第一种方式:当需要输入控制命令时，将扫描输入装置置于扫描介质控制命令上，挤压触发装置，扫描输入装置静止不动，采集控制命令，当需要输入字符时，将扫描输入装置置于扫描介质字符上，挤压触发装置，移动扫描输入装置来采集输入字符；第二种方式:当需要输入控制命令时，通过挤压触发装置，同时按住扫描输入装置的一按键来扫描输入控制命令，而输入字符时则不按所述按键；第三种方式:当需要输入控制命令时，采集代表控制命令的特定图像，需要输入字符时，则采集不同于所述特定图像的图像；
[0019]所述图像处理单元按照以下三种方式中的一种来判断输入的是字符还是控制命令:第一种方式:根据多帧图像位移来判断扫描输入是控制命令还是字符；第二种方式:通过按键信号判断输入的是控制命令还是字符；第三种方式:根据对扫描输入图像的识别结果判断输入的是控制命令还是字符，若判断输入是控制命令，则执行此图像代表的命令，若输入是字符则保存识别结果。
[0020]本发明通过将字符或符号等信息印于可携带扫描介质上，在该扫描介质上形成模拟键盘，或者是在扫描介质上书写需要采集输入的内容，扫描输入装置通过扫描需要输入的字符或控制命令，实现了控制命令和字符的无障碍输入。借此，实现了单词的随意查询，并实现了计算器功能。控制命令和字符无障碍输入，使设备摆脱键盘，降低成本，外观简洁，缩小体积。同时，与手写输入相比，具有较高的输入效率，节省了用户的操作时间。
【专利附图】

【附图说明】
[0021]图1为本发明扫描输入装置的结构示意图；
[0022]图2a为本发明的包括字母和符号的模拟键盘示意图；
[0023]图2b为本发明的又一包括字母和符号的模拟键盘示意图；
[0024]图2c为本发明的再一包括数字和符号的模拟键盘示意图；
[0025]图3为本发明扫描输入方法流程图；
[0026]图4为利用本发明的扫描输入方法输入单词与词组的流程图；
[0027]图5为利用本发明的扫描输入方法进行计算的流程图。
【具体实施方式】
[0028]为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。
[0029]本发明提供一种扫描输入装置和扫描输入方法，可实现控制命令输入和字符输入，该扫描输入装置可配备有一个模拟键盘，并可以不同方式扫描模拟键盘上或其他扫描介质上的字符或符号，通过图像识别技术，实现控制命令输入和字符输入的自由切换，从而实现字符的无键盘快速输入，不借助键盘与手写，将各种介质中的字符进行输入，实现无障碍输入。
[0030]图1为本发明扫描输入装置的功能结构图。参照图1，该扫描输入装置包括壳体1，控制器2，图像传感器3，显示屏4，光学镜头5、开孔6、触发装置7、光路装置8。
[0031]控制器2设置在壳体I内部，优选为嵌入式处理器，用于控制文字扫描输入，进行文字识别等处理。图像传感器3设置在壳体I内部，且与控制器2相连，用于对扫描介质上的文字聚焦成像，生成图像，送入控制器2进行图像增强、灰度处理或图像二值化等图像预处理和识别处理，控制器2的处理结果显示在显示屏4上，图像传感器3能够获取模拟键盘或其它扫描介质上的字符或控制命令的图像。在外壳I与图像传感器3对应的位置处开设一开孔6，使得图像传感器3透过开孔6获取模拟键盘或扫描资料上的字符。触发装置7用于当扫描输入装置接触扫描介质进行扫描时，产生工作信号，来控制光路装置8形成光路，光路产生的光经扫描介质反射后，再经光学镜头5直接汇聚到图像传感器3中用于图像传感器3成像。光路装置8优选使用光路照明LED。
[0032]上述模拟键盘可以为任何便于携带的可识别介质，如本设备的包装皮套或纸质材料等，具有体积小，方便携带的特点。模拟键盘上包括但不仅限于数字、字母、符号，也可以是其它字符、控制命令或其它图形。另外模拟键盘可以为任何便于携带的可识别介质，如本设备的包装皮套或纸质材料。上述其他扫描介质上的字符或符号可以由用户在可识别介质上书写形成。
[0033]图2a为本发明一种模拟键盘的示意图。如图2a所示，该模拟键盘包括字母和符号。其中“=”约定为结束符，符号“一”约定为删除操作，空白图像约定为空格。
[0034]图2b为本发明另外一种模拟键盘的示意图。如图2b所示，该模拟键盘包括字母和符号，其中“掛”约定为拼音命令,“查”约定为查词翻译命令，“删”约定为删除命令，
Θ约定为返回命令，“一”约定为左移，“丨”约定为上移，“丨”约定下移，“一”约定为右移。
[0035]扫描输入装置可按照下面三种方式中的任一种来输入控制命令和字符:第一种方式:当需要输入控制命令时，将扫描输入装置置于模拟键盘或其它扫描介质控制命令上，通过挤压触发装置7，打开LED照明，光学镜头5工作，扫描输入装置静止不动，采集控制命令并通过图像传感器送入控制器2，扫描输入装置当需要输入字符时，将扫描输入装置置于模拟键盘或其它扫描介质上，通过挤压触发装置7，打开LED照明，光学镜头5工作，移动扫描装置，采集输入字符并通过图像传感器送入控制器2。第二种方式:当需要输入控制命令时，移动扫描输入装置同时按住某按键，字符输入时只移动扫描输入装置，不按按键。第三种方式:当需要输入控制命令时，采集代表控制命令的特定图像，需要输入字符时，则采集不同于所述特定图像的图像，在这种方式中，控制命令和字符都是通过移动扫描输入装置的方式输入，或者都是通过点击的方式输入。
[0036]控制器2进一步包括图像处理单元201、识别引擎202和判断单元203。
[0037]图像处理单元201对所扫描的字符和控制命令进行图像预处理，包括图像增强，灰度处理以及二值化处理等。所述图像增强是通过一定手段对原图像附加一些信息或变换数据，有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征，使图像与视觉响应特性相匹配。所述图像二值化就是将图像上的像素点的灰度值设置为O或1，也就是将整个图像呈现出明显的黑白效果。图像的二值化有利于凸显的进一步处理，使图像变得简单，而且数据量减小，能凸显出感兴趣的目标的轮廓。
[0038]识别引擎202对经图像处理单元201处理后的图像进行识别。识别引擎202进一步包括OCR弓丨擎和分类器识别引擎。
[0039]如果扫描输入装置是按照上述第一种和第二种方式输入字符和控制命令，则判断单元203可直接根据多帧图像位移和按键信号来判断输入的是字符还是控制命令，如果输入的是字符，则调用OCR引擎识别，若是控制命令，则直接调用分类器识别。
[0040]如果扫描输入装置是按照上述第三种方式输入字符和控制命令，则识别引擎202首先调用OCR引擎进行识别，根据识别距离等识别信息判断识别结果可信度，若识别结果不可信，则判断单元203判断输入的为自定义的控制命令，该自定义的控制命令为用户自定义的控制命令，如删等，标准内码库中没有这些控制命令，需继续进行分类器识别，得到控制命令的识别结果。若OCR识别结果可信，则分为两种情况，一为输入的是字符，二为输入的是在标准内码库中可查找到的控制命令，如‘一’等，本发明对此种控制命令的含义预先进行约定，如果识别为这样的控制命令，则根据约定的含义执行相应的控制命令。
[0041]OCR引擎对二值图像进行识别，主要包括:字符提取，字符特征提取，特征比较，识别结果后处理。所述字符提取是指提取图像中间字符所在区域，过滤掉该字符上下存在的其它黑像素、空白行与该字符左右的空白列。所述特征提取与特征比较是指计算上述字符的特征，与字库中的特征模板进行比较，得到特征最相近字符作为识别结果。所述识别结果后处理是指根据使用环境对上述识别结果进行处理，修改不合理的结果。
[0042]分类器识别是指将控制命令图像的特征作为分类依据，对应不同的识别分类器，需要的图像特征也不同，识别分类器利用现有技术比较此图像特征与分类器识别引擎中预先保存的各控制命令标准模板的特征之间的距离，选择特征与此图像特征相距最近的标准模板对应的控制命令作为此图像的识别结果。
[0043]图3为本发明扫描输入方法的流程图。参照图3，该方法包括了以下各步骤:
[0044]步骤1，利用扫描输入装置获取各种介质或模拟键盘上的字符或控制命令的图像。在该步骤，按照以下三种方式中的一种来输入字符和控制命令:
[0045]第一种方式:当需要输入控制命令时，将扫描输入装置置于扫描介质控制命令上，挤压触发装置，扫描输入装置静止不动，采集控制命令，当需要输入字符时，将扫描输入装置置于扫描介质字符上，挤压触发装置，移动扫描输入装置来采集输入字符。
[0046]第二种方式:当需要输入控制命令时，通过挤压触发装置，同时按住扫描输入装置的一按键来扫描输入控制命令，而输入字符时则不按所述按键。
[0047]第三种方式:当需要输入控制命令时，采集代表控制命令的特定图像，需要输入字符时，则采集不同于所述特定图像的图像，在这种方式中，控制命令和字符都是通过移动扫描输入装置的方式输入，或者都是通过点击的方式输入。
[0048]所采集输入的字符或控制命令通过图像传感器3送入控制器2的处理单元201。
[0049]步骤2，利用控制器2中的图像处理单元201对所扫描的字符和控制命令进行图像预处理。所述图像预处理包括图像增强、灰度处理或二值化等。
[0050]所述图像增强是通过一定手段对原图像附加一些信息或变换数据，有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征，使图像与视觉响应特性相匹配。
[0051]所述图像灰度处理是对灰度图像进行分析和处理。灰度图像反映了整幅图像的亮度等级的分布，每个像素点的变化范围为0-255。灰度处理包含生成灰度直方图、灰度修正、提取图像特征、图像锐化等处理。
[0052]所述图像二值化就是将图像上的像素点的灰度值设置为O或1，也就是将整个图像呈现出明显的黑白效果。图像的二值化有利于凸显的进一步处理，使图像变得简单，而且数据量减小，能凸显出感兴趣的目标的轮廓。
[0053]步骤3，利用控制器中的识别引擎202对上述处理后的图像进行识别。[0054]识别引擎202进一步包括OCR引擎和分类器识别装置。如果在步骤I选择第一种和第二种方式来输入字符和控制命令，则判断单元203可直接根据多帧图像位移和按键信号来判断输入的是字符还是控制命令，如果输入的是字符，则调用OCR引擎识别，若是控制命令，则直接调用分类器识别。
[0055]但如果在步骤I中选择第三种输入方式进行输入字符和控制命令，则在该步骤3中，首先用OCR技术识别后，根据识别距离等识别信息判断识别结果可信度，若识别结果不可信，则输入的为自定义的控制命令，该自定义的控制命令为用户自定义的控制命令，如删等，标准内码库中没有这些控制命令，需继续进行分类器识别，得到控制命令的识别结果。若OCR识别结果可信，则分为两种情况，一为输入的是字符，二为输入的是在标准内码库中可查找到的控制命令，如‘一’等，本发明对此种控制命令的含义预先进行约定，如果识别为这样的控制命令，则根据约定的含义执行相应的控制命令。
[0056]OCR引擎对二值图像进行识别，主要包括:字符提取，字符特征提取，特征比较，识别结果后处理。所述字符提取是指提取图像中间字符所在区域，过滤掉该字符上下存在的其它黑像素、空白行与该字符左右的空白列。所述特征提取与特征比较是指计算上述字符的特征，与字库中的特征模板进行比较，得到特征最相近字符作为识别结果。所述识别结果后处理是指根据使用环境对上述识别结果进行处理，修改不合理的结果。
[0057]分类器识别是指将控制命令图像的特征作为分类依据，对应不同的识别分类器，需要的图像特征也不同，识别分类器利用现有技术比较此图像特征与识别引擎中预先保存的各控制命令标准模板的特征之间的距离，选择特征与此图像特征相距最近的标准模板对应的控制命令作为此图像的识别结果。
[0058]步骤4，根据步骤3中的识别结果执行相应的动作，若输入的是控制命令则执行该命令，否则保存字符信息。
[0059]下面通过举例的方式来进一步说明本发明利用模拟键盘进行扫描输入的方法，在下面的例子中，扫描输入装置以扫描笔为例来进行说明。
[0060]〈例1>
[0061]在该例子中采用上述步骤I中的第一种方式进行字符和控制命令的输入。字符输入时移动扫描笔；控制命令输入时，扫描笔置于控制命令上方，笔静止，采集图像。控制器也由此判断输入的是字符还是控制命令。即如步骤I的第一种方式，扫描笔移动扫描时，输入的为字符，扫描笔静止采集图像时，输入的为控制命令。如果输入的是控制命令，控制器调用分类器识别，如果输入的是字符，则控制器调用OCR引擎。例如要查询单词BALL，则如图4所示，执行以下步骤:
[0062]步骤1，移动扫描笔扫描资料中单词“BALL”。因为要输入字符“BALL”，所以将扫描笔置于扫描资料上方，移动扫描笔，采集帧图像序列，然后将图像帧序列拼接成一幅全景图像。
[0063]步骤2，对全景图像进行图像处理及及识别。其中图像处理包含图像增强和图像二值化处理。图像增强采用中值滤波法来减弱噪声。中值滤波法是一种非线性平滑技术，它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。图像二值化采用OtSU方法，即最大类间方差法。此方法按图像的灰度特性，将图像分成背景和前景两部分。背景和前景之间的类间方差越大，说明构成图像的两部分的差别越大，当部分前景错分为背景或背景错分为前景都会导致两部分差别变小。因此，是类间方差最大的分割意味着错分概率最小。
[0064]由于扫描笔是通过移动的方式来进行扫描输入的，因此控制器可根据帧图像位移直接判断出所输入的是字符，因此调用OCR引擎对输入的字符进行识别，OCR技术识别处理过程为，首先进行字符切分，得到每一个字符，然后对每一个字符进行识别。字符识别过程，首先提取各字符中间字符所在区域，过滤到字符上下存在的背景像素，然后提取字符特征并与字符库中模板特征进行比较，找到字库中特征最近的字符作为识别结果，最后根据使用环境对识别结果进行调整。
[0065]假设扫描输入装置的识别结果为“BALI”，最后一个字符识别错误，可以执行步骤3进行修改，也可以执行步骤4直接查词，因为词典会给出最相近的单词列表，通过上下选择得到正确结果。
[0066]步骤3，修改单词最后一个字符，然后查词，步骤如下:
[0067]步骤3.1，显示屏中光标此时位于字符“I”处，将扫描笔置于模拟键盘“⑩上方，笔静止，采集图像并进行图像处理及分类器识别处理。控制器检测到此次输入为K W叩-令，执行此输入图像代表的命令，即删除字符“I”，在该步骤，由于扫描笔处于静止状态采集图像，因此判断为控制命令，所以针对控制命令来调用分类器识别。
[0068]步骤3.2，将扫描笔置于模拟键盘“L”上方，移动扫描笔扫描图像并进行图像处理及OCR识别处理。控制器检测到此次输入为字符，保存识别结果“L”。此时单词“BALL”拼写正确。
[0069]步骤3.3，将扫描笔放在“ ? ”上方，笔静止，采集图像并进行图像处理及分类器识别处理。控制器检测到此次输入为控制命令，调用分类器识别，根据识别结果执行此输入图像代表的命令，进行查词，查词结果显示在显示屏上。
[0070]步骤4，扫描笔放在“ @ ”上方，笔静止，采集图像并进行图像处理及分类器识别处理。控制器检测到此次输入为控制命令，执行此输入图像代表的命令，进行查词，单词“BALI”未查到，词典给出最相近的单词列表:BALL，BALT。
[0071]步骤5，将扫描笔放在“丨”上方，笔静止，采集图像并进行图像处理及分类器识别处理。控制器检测到此次输入为控制命令，执行此输入图像代表的命令，向下选择单词“BALL”，并给出翻译结果显示在显示屏上。
[0072]< 例 2>
[0073]在该例子中采用步骤I中的第二种方式进行字符和控制命令的输入。
[0074]根据步骤I中的第二种方式输入时，扫描笔移动同时检测到按键按压信号时，表示输入的是控制命令；扫描笔移动但没有按键按压信号时，表示输入的是字符。因此，控制命令的输入方式为移动扫描笔的同时按住笔外壳上某按键，采集图像；字符输入时，只移动扫描笔，不按按键。控制器2可根据按键信号直接判断输入的是控制命令还是字符，如果是控制命令，则调用分类器识别，如果输入的是字符，则调用OCR引擎。例如要查询单词“lovely” 及 “love”，步骤如下:
[0075]步骤1，移动扫描笔扫描资料中单词“lovely”，扫描笔外壳上设置的功能健没有被按压时，表示扫描输入字符。扫描过程与〈例1>中的扫描过程相同。扫描笔外壳上设置的功能键可以判断是否是输入控制命令专用的按键，也可以是外壳上已有按键的复用。[0076]步骤2，对全景图像进行图像处理及OCR技术识别处理。图像预处理及字符识别处理同〈例1>中相同
[0077]，待识别完成后保存识别结果“lovely”。
[0078]步骤3，扫描笔放在“g”上方，移动扫描笔同时拇指按住某按键，采集图像并进行图像处理及分类器识别处理。控制器2检测到此次输入为控制命令，执行此输入图像代表的命令，进行查词，查询结果显示在显示屏上。
[0079]步骤5，显示屏中光标此时位于字符“y”处，将扫描笔置于模拟键盘“删”上方，移动扫描笔同时拇指按住某按键，采集图像并进行图像处理及分类器识别处理。控制器检测到此次输入为控制命令，执行此输入图像代表的命令，删除字符“y”。
[0080]步骤6，操作同步骤5，删除字符“ I ”。
[0081 ] 步骤7，操作同步骤4，显示屏上显示“ love”查词结果。
[0082]〈例3>
[0083]在该例子中采用步骤I中的第三种方式进行字符和控制命令的输入。
[0084]扫描笔移动扫描字符或控制命令，控制器首先用OCR技术识别后，根据识别距离等识别信息判断识别结果可信度，若识别结果不可信，则输入的为自定义的控制命令，需继续进行分类器识别，得到控制命令的识别结果。若OCR识别结果可信，则分为两种情况，一为输入的是字符，二为输入的是在标准内码库中可查找到的控制命令，如果识别为控制命令，则根据约定的含义执行相应的控制命令。
[0085]例如通过扫描笔来查询词组look at,具体步骤如下:
[0086]步骤I，将扫描笔置于模拟键盘中字母“ I ”上方，摄像头采集字母“ I ”的图像并通过图像传感器传送到处理单元进行图像预处理，将图像处理结果送到OCR识别装置对此图像进行处理与识别，并将识别结果保存。
[0087]在该步骤，模拟键盘采用图2a所示的键盘。图像预处理包含图像增强和图像二值化处理，图像二值化采用OtSU方法，即最大类间方差法。此方法按图像的灰度特性，将图像分成背景和前景两部分。背景和前景之间的类间方差越大，说明构成图像的两部分的差别越大，当部分前景错分为背景或背景错分为前景都会导致两部分差别变小。因此，是类间方差最大的分割意味着错分概率最小。
[0088]图像增强采用中值滤波法来减弱噪声。中值滤波法是一种非线性平滑技术，它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。
[0089]步骤2，依照步骤I的方式分别采集并输入“O” “O” “k”。
[0090]步骤3，输入空格。预先约定输入空白图像时为空格，将扫描笔置于模拟键盘空白处，采集空白图像，此字符作为空格保存。
[0091]步骤4，然后按照步骤I的方式采集相应图像输入“a” “t”。
[0092]步骤5，输入结束字符。约定“=”作为结束符，将扫描笔置于模拟键盘“=”字符上方，取字符并进行图像处理和光学字符识别处理，识别结果判定为结束符，则输入结束。
[0093]步骤6，查词并将翻译结果显示在显示屏上。
[0094]其中结束字符不被保存，将已有的输入字符组成一个完成的单词或词组，查找词典进行翻译。从而得到词组look at的解释等信息，最后将词组和解释信息显示在显示屏上。[0095]若字符输入错误，需要清除，可将扫描笔置于模拟键盘中“一”上方，输入“一”字符，进行字符删除。
[0096]< 例 4>
[0097]本发明不仅可用于单词查询，还可实现计算器功能，如图5的流程图所示。
[0098]图2c为印有数字与计算符号的模拟键盘。计算符号不限于模拟键盘上所印字符，也可包含其它复杂运算符号。例如需要计算(39+47)*62。将扫描输入装置依次置于模拟键盘中“(”“3” “9”“ + ”……等字符上方，采集其图像并进行处理与识别。作为算式，最后输入结束标记“ = ”，以确定输入完成。最后进行计算，其结果为5332，将结果显示在显示屏上。其中处理及识别方法与〈例1>中所用方法相同。
[0099]以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【权利要求】
1.一种扫描输入装置，包括: 图像传感器，用于对扫描介质上的控制命令或字符聚焦成像，生成图像，送入控制器进行处理，所述扫描介质上制作有控制命令和字符的至少一种，所述扫描介质上的控制命令或字符由手写或印刷形成；控制器，用于对所述图像进行处理，根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符。
2.根据权利要求1所述的装置，其特征在于，该扫描输入装置进一步包括触发装置、光路装置和光学镜头，其中触发装置用于当扫描输入装置接触扫描介质进行扫描时，产生工作信号，来控制光路装置形成光路，光路产生的光经扫描介质反射后，再经光学镜头汇聚到图像传感器中用于图像传感器成像。
3.根据权利要求2所述的装置，其特征在于，控制器进一步包括: 图像处理单元，用于对所述图像进行图像预处理；识别引擎，对经图像处理单元处理后的图像进行识别，识别结果为输入的字符或控制命令; 判断单元，用于根据多帧图像位移来判断扫描输入的是控制命令还是字符、或者通过按键信号判断输入的是控制命令还是字符、或者根据对扫描输入图像的识别结果判断输入的是控制命令还是字符，若判断输入的是控制命令，则执行此图像代表的命令，若输入的是字符则保存识别结果。
4.根据权利要求3所述的装置，其特征在于，所述字符包括数字、字母或文字，所述控制命令包括符号或图案，并且不限于结束命令、删除命令、拼音命令、查词翻译命令、返回命令、退出命令、左移命令、上移命令、下移命令和/或右移命令；所述扫描介质上制作的控制命令和字符的至少一种形成键盘布局。
5.—种扫描输入方法,该方法包括步骤: 步骤I，对扫描介质上的控制命令或字符聚焦成像，生成图像，送入控制器进行处理，所述扫描介质上制作有控制命令和字符的至少一种，所述扫描介质上的控制命令或字符由手写或印刷形成；步骤2，对所述图像进行处理，并根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符。
6.根据权利要求5所述的方法，其特征在于，步骤I进一步包括按照以下三种方式中的一种来输入字符和控制命令:第一种方式:当需要输入控制命令时，将扫描输入装置置于扫描介质控制命令上，挤压触发装置，扫描输入装置静止不动，采集控制命令，当需要输入字符时，将扫描输入装置置于扫描介质字符上，挤压触发装置，移动扫描输入装置来采集输入字符；第二种方式:当需要输入控制命令时，通过挤压触发装置，同时按住扫描输入装置的一按键来扫描输入控制命令，而输入字符时则不按所述按键；第三种方式:当需要输入控制命令时，采集代表控制命令的特定图像，需要输入字符时，则采集不同于所述特定图像的图像；步骤2进一步包括按照以下三种方式中的一种来判断输入的是字符还是控制命令:第一种方式:根据多帧图像位移来判断扫描输入是控制命令还是字符；第二种方式:通过按键信号判断输入的是控制命令还是字符；第三种方式:根据对扫描输入图像的识别结果判断输入的是控制命令还是字符，若判断输入的是控制命令，则执行此图像代表的命令，若输入的是字符则保存识别结果。
7.根据权利要求6所述的方法，其特征在于，所述字符包括数字、字母或文字，所述控制命令包括符号或图案，并且不限于结束命令、删除命令、拼音命令、查词翻译命令、返回命令、退出命令、左移命令、上移命令、下移命令和/或右移命令；所述扫描介质上制作的控制命令和字符的至少一种形成键盘布局。
8.一种扫描输入装置，该装置包括: 扫描单元，用于对扫描介质上的控制命令或字符聚焦成像，生成图像，送入控制器进行处理，所述扫描介质上制作有控制命令和字符的至少一种，所述扫描介质上的控制命令或字符由手写或印刷形成；图像处理单元，对所述图像进行处理，并根据扫描方式或识别结果判断所扫描的图像是字符还是控制命令，若输入的是控制命令则执行该命令，否则保存字符信息。
9.根据权利要求8所述的装置，其特征在于，所述扫描单元按照以下三种方式中的一种来输入字符和控制命令:第一种方式:当需要输入控制命令时，将扫描输入装置置于扫描介质控制命令上，挤压触发装置，扫描输入装置静止不动，采集控制命令，当需要输入字符时，将扫描输入装置置于扫描介质字符上，挤压触发装置，移动扫描输入装置来采集输入字符；第二种方式:当需要输入控制命令时，通过挤压触发装置，同时按住扫描输入装置的一按键来扫描输入控制命令，而输入字符时则不按所述按键；第三种方式:当需要输入控制命令时，采集代表控制命令的特定图像，需要输入字符时，则采集不同于所述特定图像的图像；所述图像处理单元按照以下三种方式中的一种来判断输入的是字符还是控制命令:第一种方式:根据多帧图像位移来判断扫描输入是控制命令还是字符；第二种方式:通过按键信号判断输入的是控制命令还是字符；第三种方式:根据对扫描输入图像的识别结果判断输入的是控制命令还是字符，若判断输入是控制命令，则执行此图像代表的命令，若输入是字符则保存识别结果。
10.根据权利要求9所述的装置，其特征在于，所述字符包括数字、字母或文字，所述控制命令包括符号或图案，并且不限于结束命令、删除命令、拼音命令、查词翻译命令、返回命令、退出命令、语言切换命令、左移命令、上移命令、下移命令和/或右移命令；所述扫描介质上制作的控制命令和字符的至少一种形成键盘布局。
【文档编号】G06K9/20GK103699890SQ201210365732
【公开日】2014年4月2日申请日期:2012年9月27日优先权日:2012年9月27日
【发明者】刘迎建, 刘正珍, 张娜, 李玉梅, 万鑫, 闫江震申请人:汉王科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘迎建;刘正珍;张娜;李玉梅;万鑫;闫江震;
技术所有人：汉王科技股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。