文字处理方法、装置和电子翻译笔的制作方法

文档序号：6432326阅读：247来源：国知局

专利名称：文字处理方法、装置和电子翻译笔的制作方法
技术领域：
本发明涉及文字处理技术，尤其涉及一种文字处理方法、装置和电子翻译笔。
背景技术：
电子翻译笔(简称翻译笔)是OCR (Optical Character Recognition,光学字符识另|J)技术的重要应用之一。在进行翻译操作时，翻译笔的光学摄像头按照一定频率对被扫描资料进行连续拍照，获取被扫描资料的图像帧序列，然后将图像帧序列拼接成一幅全景图像，并对全景图像中的文字进行识别，调用翻译笔内部的词典，对识别得到的识别结果进行翻译，获得翻译结果O在西文文字中，为了适应显示行的长度，处在行尾的单词可能被拆分成两部分进行显示，拆分后的单词的前半部分在本行的行尾进行显示，并在本行的行尾处带有连字符，拆分后的单词的后半部分在下一个的行首显示。用户使用上述翻译笔对扫描得到的字符进行翻译时，对于被拆分成两部分的单词或者由于不能够查找到对应的释义，而翻译失败；或者找到与原文本意不同的释义，而使翻译错误，从而影响翻译笔的使用效果。

发明内容
本发明的实施例提供一种文字处理方法、装置和电子翻译笔，能够提高翻译的准确率。为达到上述目的，本发明的实施例采用如下技术方案一种文字处理方法，包括将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本；从所述待译文本中获取被拆分显示的待译字符串；将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。一种文字处理装置，包括拍摄单元，用于将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本；获取单元，用于从所述待译文本中获取被拆分显示的待译字符串；查找单元，用于将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。一种电子翻页笔，包括所述文字处理装置。本发明实施例提供的文字处理方法、装置和电子翻译笔，将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，从待译文本中获取被拆分显示的待译字符串；将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，使翻译结果准确率提闻。

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图I为本发明实施例提供的一种文字处理方法的流程图；图2为本发明实施例中电子翻译笔的结构示意图；图3为本发明实施例中电子翻译笔的各个组件的连接关系示意图；图4为本发明实施例提供的另一种文字处理方法的流程图；图5为本发明实施例提供的一种文字处理装置的结构图；图6为本发明实施例提供的另一种文字处理装置的结构图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。本发明实施例提供了一种文字处理方法，如图I所示，包括101、将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本。102、从待译文本中获取被拆分显示的待译字符串。103、将被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。本实施例提供的文字处理方法，将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，从待译文本中获取被拆分显示的待译字符串；将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，使翻译结果准确率提高。作为本实施例的一种改进，本发明实施例提供另一种文字处理方法，本实施例以电子翻译笔为例，详述本实施例提供的文字处理方法。首先，对电子翻译笔的结构做介绍如图2所示，电子翻译笔包括用于封装并固定电子翻译笔各个组件的壳体I、用于处理具有连字符的文本的处理模块2、用于集成电子翻译笔各个组件的电路板3、用于为电子翻译笔各个组件供电的电池4、用于对被扫描字符进行连续拍摄以得到含有被扫描字符的图像帧序列的光学传感器5、用于触发操作的按键
6、用于装载字符识别引擎的存储模块7、液晶屏8、用于驱动液晶屏8的显示单元10、用于输出语音的TTS模块11、用于摄取图像信息的镜头组12、用于照明待扫描字符的照明单元13。各部分的连接关系如图3所示，其中，光学传感器5、存储模块7、处理模块2、显示单元10、TTS模块11和USB模块9集成在电路板3上。液晶屏8、电池4、按键6和电路板3封装在壳体I内。按键6与电路板3上的光学传感器5连接，控制光学传感器5进行拍摄。处理模块2分别连接存储模块7、光学传感器5、显示单元10和TTS模块11。如图4所示,包括401、将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别。具体的，可以采用光学识别技术从实物资料上获取文字信息，文字信息包含当前待处理字符串和前一个字符串。OCR (Optical Character Recognition,光学字符识别)技术,是指电子设备(如扫描仪、数码相机、电子翻译笔)检测纸上打印的字符，通过检测暗、亮的模式确定字符形状，然后采用字符识别方法将字符形状翻译成计算机文字的过程。即，对文本资料进行扫描，然后对扫描图像进行分析处理，获取文字及版面信息的过程。关于OCR技术，是本领域技术人员所熟知的，在此不再详述。采用电子翻译笔对待扫描字符进行扫描时，在扫描待扫描字符时，光学传感器5对文字行中的被扫描字符进行连续高速拍摄，以得到含有被扫描字符的图像帧序列，图像帧序列中相邻图像帧内容会有重叠部分，处理模块2对图像帧序列中的各图像帧进行剪切和重组，将拼接后得到的全景图像进行字符识别。进一步可选的，处理模块2调用存储模块7中的字符识别引擎对拼接得到的全景图像进行识别前，首先对拼接得到的全景图像进行倾斜校正。402、获取当前待处理字符串。在处理模块2的控制下，用户通过按键6触发，将控制信号发送到光学传感器5，启动光学传感器5进行图像信息采集，得到图像帧序列，处理模块2对输入的图像帧序列进行拼接，形成全景图像后识别出当前待处理字符串，在预设的词库中查找当前待处理字符串对应的匹配释义。403、判断所述当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处。若所述当前待处理字符串是位于所述当前待处理字符串所在文字行的行首处，则执行步骤404 ;若当前待处理字符串不是位于所述当前待处理字符串所在文字行的行首处，则执行步骤408。获取所述当前待处理字符串的前一个字符串之前，判断当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处，即判断所述当前待处理字符串对应的全景图像的左侧是否紧邻一个空白区域；当输入的图像帧序列对应为文字行的行首时，拼接形成的全景图像为行首部位的全景图像，由于文本页页面均存在白边，页面书写顺序为从左至右，故行首部位对应的页面白边位于左侧，拼接形成的全景图像的左侧具有空白区域；行尾部位对应的页面白边位于右侧，拼接形成的全景图像的右侧具有空白区域；因此，若所述当前待处理字符串对应的全景图像的左侧紧邻一个空白区域，则所述当前待处理字符串位于当前待处理字符串所在文字行的行首处。若所述当前待处理字符串是位于所述当前待处理字符串所在文字行的行首处，则获取所述当前待处理字符串的前一个字符串。404、获取当前待处理字符串的前一个字符串。对屏幕上显示的当前待处理字符串进行在词库中进行查找，如果用户对当前待处理字符串，如字根信息等，进行进一步记忆，则可将其单独标识，如果当前待处理字符串不为用户需要的单词，则点击对应的按键，产生触发信号，从而加载当前待处理字符串的前一个字符串。进一步可选的，本步骤的实现可以根据用户触发获取当前待处理字符串的前一个字符串。用户连续对字符串进行获取时，如果当前待处理字符串的前一个字符串的末字符为连字符，则不对当前待处理字符串的前一个字符串在词库中进行查找，直接调用存储的当前待处理字符串的前一个字符串。作为本实施例的一种优选的实施方式，还可以根据用户的触发获取当前待处理字符串的前一个字符串；用户间歇性的对字符串进行获取时，根据用户的触发对屏幕上显示的当前待处理字符串进行在词库中进行查找，如果用户对当前待处理字符串，如字根信息等，进行进一步记忆，则可将其单独标识，如果当前待处理字符串不为用户需要的单词，则点击对应的按键，产生触发信号，从而加载当前待处理字符串的前一个字符串。405、检测前一个字符串的结尾处的字符是否为连字符。若前一个字符串的结尾处的字符是连字符，说明前一个字符串是被拆分的单词的前半部分，则执行步骤405，若前一个字符串的结尾处的字符不是连字符，说明前一个字符串是一个独立的单词，执行步骤407。406、将前一个字符串与当前待处理字符串进行拼接并删除连字符，得到待译字符
串O作为本实施例的一种实施方式，还可以将前一个字符串中的连字符替换为当前待处理字符串，得到待译字符串。将前一个字符串中的连字符替换为当前待处理字符串，得到重组后的一个字符串，重组后的字符串即为被拆分前的单词。407、将被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找待译字符串对应的匹配释义并进行显示。具体的，查找替换后的前一个字符串对应的匹配释义作为前一个字符串和当前待处理字符串共同的匹配释义。在得到了重组后的单词后，直接获取该单词的匹配释义即可，作为前一个字符串和当前待处理字符串共同的匹配释义。具体的，处理模块2将全景图像中的各字符形成水平文字行后再调用字符识别引擎进行识别。对识别得到的识别结果在存储模块中预设的词库里进行搜索，预设的词库中包括一个或一个以上类别的词典。具体的，处理模块2将待处理单词在预设的词库中进行搜索，得到待处理单词对应的匹配释义，显示单元10将待处理单词对应的匹配释义在液晶屏8上进行显示，处理模块2可根据控制信号将被扫描字符的字符编码发送到TTS模块11，由TTS模块11输出语音，该次文字处理过程结束。作为本实施例的一种优选的实施方式，镜头组12的焦距为5至7mm，光圈10以上，保证了镜头组12达到的景深为30至50mm，可以有效的将文字信息进行扫描，保证了良好的应用效果。408、获取下一个待处理字符串。如果当前待处理字符串的前一个字符串的结尾处的字符不是连字符，则当前待处理字符串不是被拆分显示的单词的一部分，而应该是一个独立的单词，因此，直接查找当前待处理字符串对应的匹配释义，该次文字处理过程结束；重复执行上述步骤401至406，执行将待处理文件中的每个字符串都处理完毕。本实施例中对作为处理对象的文字信息的获取方式不做限定，例如，也可以是通过网络或其它方式获得的，用户通过鼠标选择相关文字信息，对网页、电子文档中对带有连字符的当前行末尾的字符串与当前行的下一行的行首位置对应的字符串进行处理。本实施例提供的文字处理方法，将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，从待译文本中获取被拆分显示的待译字符串；将被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，使翻译结果准确率提高。为了实现上述实施例提供的文字处理方法，本发明实施例提供了一种文字处理装置,如图5所示,包括拍摄单元51、获取单元52、查找单元53。拍摄单元51，用于将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别。获取单元52，用于从待译文本中获取被拆分显示的待译字符串；查找单元53，用于将被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。本实施例提供的文字处理装置，拍摄单元将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，获取单元从待译文本中获取被拆分显示的待译字符串；查找单元在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，使翻译结果准确率提高。为了实现上述实施例提供的文字处理方法，本发明实施例提供另一种文字处理装置，如图6所示,包括拍摄单元61、获取单元62、查找单元63。其中，获取单元62包括第一获取模块621、判断模块622、第二获取模块623，查找单元63包括第一检测模块631、第一拼接模块632。拍摄单元61，用于将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本。获取单元62，用于从待译文本中获取被拆分显示的待译字符串；具体的,所述获取单元62包括第一获取模块621，用于获取当前待处理字符串；判断模块622，用于判断当前待处理字符串是否位于当前待处理字符串所在文字行的行首处；第二获取模块622，用于获取所述当前待处理字符串的前一个字符串；
查找单元63，用于将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。具体的，第一检测模块631，用于检测所述前一个字符串的结尾处的字符是否为连
字符；第一拼接模块632，用于若所述前一个字符串的结尾处的字符是连字符，则将所述前一个字符串与所述当前待处理字符串进行拼接并删除连字符，得到所述待译字符串。第二获取模块623获取当前待处理字符串的前一个字符串可以为第二获取模块623根据用户的触发获取当前待处理字符串的前一个字符串。具体的，第二获取模块623获取当前待处理字符串的前一个字符串可以为若判断模块622判断出当前待处理字符串是位于当前待处理字符串所在文字行的行首处，则第二获取模块623获取当前待处理字符串的前一个字符串。判断模块622判断当前待处理字符串是否位于当前待处理字符串所在文字行的行首处为判断模块622判断当前待处理字符串对应的全景图像的左侧是否紧邻一个空白区域，若当前待处理字符串对应的全景图像的左侧紧邻一个空白区域，则当前待处理字符串位于当前待处理字符串所在文字行的行首处。本实施例提供的文字处理装置，拍摄单元将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，获取单元从待译文本中获取被拆分显示的待译字符串；查找单元在预设的词库中查找待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，使翻译结果准确率提高。本发明实施例提供了一种电子翻页笔，包括所述文字处理装置。本实施例提供的电子翻页笔，由于包含了所述文字处理装置，拍摄单元将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，获取单元从待译文本中获取被拆分显示的待译字符串；查找单元在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，使翻译结果准确率提高。通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘，硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。以上所述，仅为本发明的具体实施方式
，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种文字处理方法，其特征在于，包括将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本；从所述待译文本中获取被拆分显示的待译字符串；将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找对应的匹配释义并进行显示。
2.根据权利要求I所述的文字处理方法，其特征在于，所述从所述待译文本中获取被拆分显示的待译字符串包括获取当前待处理字符串；获取所述当前待处理字符串的前一个字符串；所述将所述被拆分显示的待译字符串的拆分标记删除包括检测所述前一个字符串的结尾处的字符是否为连字符；若所述前一个字符串的结尾处的字符是连字符，则将所述前一个字符串与所述当前待处理字符串进行拼接并删除连字符，得到所述待译字符串。
3.根据权利要求2所述的文字处理方法，其特征在于，所述获取所述当前待处理字符串的前一个字符串为根据用户的触发获取所述当前待处理字符串的前一个字符串。
4.根据权利要求2所述的文字处理方法，其特征在于，所述获取所述当前待处理字符串的前一个字符串之前，所述方法还包括判断所述当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处；所述获取所述当前待处理字符串的前一个字符串为若所述当前待处理字符串是位于所述当前待处理字符串所在文字行的行首处，则获取所述当前待处理字符串的前一个字符串O
5.根据权利要求4所述的文字处理方法，其特征在于，所述判断所述当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处为判断所述当前待处理字符串对应的全景图像的左侧是否紧邻一个空白区域，若所述当前待处理字符串对应的全景图像的左侧紧邻一个空白区域，则所述当前待处理字符串位于当前待处理字符串所在文字行的行首处。
6.一种文字处理装置，其特征在于，包括拍摄单元，用于将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本；获取单元，用于从所述待译文本中获取被拆分显示的待译字符串；查找单元，用于将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。
7.根据权利要求6所述的文字处理装置，其特征在于，所述获取单元包括第一获取模块，用于获取当前待处理字符串；第二获取模块，用于获取所述当前待处理字符串的前一个字符串；所述查找单元包括第一检测模块，用于检测所述前一个字符串的结尾处的字符是否为连字符；第一拼接模块，用于若所述前一个字符串的结尾处的字符是连字符，则将所述前一个字符串与所述当前待处理字符串进行拼接并删除连字符，得到所述待译字符串。
8.根据权利要求7所述的文字处理装置，其特征在于，所述第二获取模块获取所述当前待处理字符串的前一个字符串为所述第二获取模块根据用户的触发获取所述当前待处理字符串的前一个字符串。
9.根据权利要求7所述的文字处理装置，其特征在于，还包括判断模块，用于判断所述当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处；所述第二获取模块获取所述当前待处理字符串的前一个字符串为若所述判断模块判断出当前待处理字符串是位于所述当前待处理字符串所在文字行的行首处，则所述第二获取模块获取所述当前待处理字符串的前一个字符串。
10.根据权利要求9所述的文字处理装置，其特征在于，所述判断模块判断所述当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处为所述判断模块判断所述当前待处理字符串对应的全景图像的左侧是否紧邻一个空白区域，若所述当前待处理字符串对应的全景图像的左侧紧邻一个空白区域，则所述当前待处理字符串位于当前待处理字符串所在文字行的行首处。
11.一种电子翻页笔，其特征在于，包括权利要求6至10任一项所述的文字处理装置。
全文摘要
本发明实施例提供了一种文字处理方法、装置和电子翻译笔，涉及文字处理领域。当文字行中有被拆分显示的单词时，能够将被拆分的单词重新组合，恢复原来的单词，之后对恢复后的单词进行翻译，能够提高翻译的准确率。该方法包括将拍摄印刷体文本得到的图像帧进行处理，形成全景图像后识别出待译文本，从待译文本中获取被拆分显示的待译字符串；将所述被拆分显示的待译字符串的拆分标记删除后，在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。主要用于文字翻译。
文档编号G06F17/28GK102982326SQ201110258960
公开日2013年3月20日申请日期2011年9月2日优先权日2011年9月2日
发明者刘昌平, 刘正珍, 仝慧媛申请人:汉王科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘昌平;刘正珍;仝慧媛
技术所有人：汉王科技股份有限公司
我是此专利的发明人

上一篇：一种基于手指高级特征的手势识别方法
上一篇：虚拟化系统中的安全强制的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。