图像中的文本的翻译和显示的制作方法

文档序号:6378571阅读:473来源:国知局
专利名称:图像中的文本的翻译和显示的制作方法
技术领域
此处描述的系统和方法通常涉及通信设备,更特别的,涉及通过通信设备显示文本。
背景技术
诸如蜂窝电话之类的通信设备已经渐渐变得通用。例如,蜂窝电话经常包括照相功能,这使得用户能够拍摄照片,其捕捉数字图像。现在,使用在蜂窝电话和便携式通信设备上的照相机的特征被限制为捕捉和传输图像。

发明内容
根据一个方面,该方法包括接收包含文本的图像;将该文本翻译为另一种语言;并且在接收到的图像的部分上叠加并显示翻译的文本。另外该方法可以进一步包括在接收到的图像上执行光字符识别(OCR)。另外该方法可以进一步包括从用户接收输入选择用于执行OCR处理的语言。另外该方法可以进一步包括从用户接收输入选择另一种语言。另外,接收到的图像可以包括数字图像或视频流的至少之一。另外,翻译的文本可以以比接收到的图像中的文本更突出的方式显示。另外,将该文本翻译成另一种语言可以由服务器执行,并且其中在接收到的图像的部分上显示翻译的文本是被显示在移动终端上。根据另一个方面,提供移动终端。该移动终端包括被配置为产生图像的照相机;显示器;和逻辑,被配置为从照相机接收图像,在图像上执行光字符识别(OCR)以产生文本,将文本翻译为另一种语言,并且控制显示器显示翻译的文本。另外,逻辑可进一步被配置为在接收到的图像的至少一部分上叠加并显示翻译的文本。另外,逻辑可进一步被配置为接收与OCR处理相关联的语言选择。另外,逻辑可进一步被配置为接收另一种语言的选择。另外,逻辑可进一步被配置为基本上与接收到的图像中的文本相同的尺寸来显示翻译的文本。另外,逻辑可进一步被配置为以比翻译的文本暗淡的或较不突出的方式显示接收到的图像中的文本。根据另一个方面,提供一种方法。该方法包括接收图像;在接收到的图像上执行光字符识别(OCR)处理以便产生以第一语言的文本;将以第一语言的文本翻译为以第二语言的文本;以暗淡化的方式显示接收到的图像;并且在显示的接收到的图像上叠加和显示以第二语言的文本。另外,该方法可进一步包括接收识别第一和第二语言的选择。另外,可以由服务器执行在接收到的图像上执行OCR处理。另外,显示以第二语言的文本可以包括在位于服务器远端的移动终端上显示文本。另外,该方法可进一步包括将接收到的图像传输到服务器。另外,该方法可进一步包括将以第一语言的文本从服务器传输到移动终端。另外以第二语言叠加和显示的文本可以包括不止一种尺寸的文本。

此处描述的系统和方法的其他特征和优势从以下详细描述中对于本领域的这些技术人员将变得显而易见。示出和描述的实施方式提供了实施这些实施例的最好的模式的示范。因此,附图将视为本质上的示出,而非作为限制。


参照附图,其中相同的参考标记指示的元件可以始终代表同样的元件。图I是示范性系统的图表,可以在其中实施此处描述的方法和系统;
图2是图I的示范性服务器的图表;
图3示出了示范性移动终端;
图4是图3的示范性移动终端的图表;
图5是示出移动终端示范性处理的流程 图6A-6B示出了在移动终端上的示范性显示;
图7是示出移动终端的另外的示范性处理的流程 图8A-8D示出了在移动终端上的示范性显示;并且 图9A-9F示出了在移动终端上的示范性显示。
具体实施例方式下述详细的说明参考了附图。在不同图中的相同参考标记指的是相同或相似的元件。同样的,下述详细的说明不限于此处所描述的系统和方法。而是,本发明的范围由所附权利要求和其等价物所定义。图I是示范性系统100的图表,可以在其中实施此处描述的方法和系统。系统100可包括移动终端110、120和130,网络140,和服务器150。应当理解的是系统100可包括其它数目的移动终端和服务器。系统100也可包括用于在移动终端110-130之间传递信息的多个基站和基站天线。此处描述的方法和系统可在移动终端的背景下实施,例如一个或多个移动终端110、120和130。如此处所使用的,术语“移动终端”可包括带有多行显示的蜂窝式无线电话;可以将数据处理、传真和数据通信能力与蜂窝式无线电话相结合的个人通信系统(PCS)终端;包括无线电话、寻呼机、互联网/内联网接入、网络浏览器、组织者(organizer)、计算器和/或全球定位系统(GPS)接收机的个人数字助理(PDA);无线电(AM/FM)接收机;以及包括无线电话收发器的便携式电脑和/或掌上型电脑接收机或其它装置。移动终端也可称为“普适计算技术”设备,可以与其它设备通过短消息服务(SMS)协议或其它允许同时传送声音、数据、音乐和视频信息的协议进行通信。网络140可包括一个或多个网络,这些网络包括蜂窝蜂窝网络,例如全球移动通信系统(GSM)的通信网络、卫星网络、互联网、电话网络,例如公共交换电话网(PSTN),城域网(MAN)、广域网(WAN)或局域网(LAN)。移动终端110、120和130通过有线、无线或光连接经由网络140彼此通信。在示范性实施中,网络140包括用于在移动终端110-130之间传输数据和消息的蜂窝网络。例如,蜂窝网络的部件可包括基站天线(未示出),从其邻近范围内的移动终端传输和接收数据。蜂窝网络的其它部件,例如,也可包括基站(未示出),连接到基站天线并与其它设备,例如依据已知技术的交换机和路由器(未示出),通信。
服务器150可包括一个或多个由软件使能的处理器或微处理器以执行功能,例如数据存储和传输,以及例如与其它服务器(未示出)、移动终端110-130和网络140相接口。服务器150也可包括数据存储器,例如随机存取存储器(RAM)或另一个动态存储设备,存储涉及到接收、处理和变换从移动终端110-130接收到的图像和文本的信息。图2是服务器150的示范性结构的图表。服务器150可以包括总线210、处理器220、存储器230、只读存储器(ROM)240、存储设备250、输入设备260、输出设备270、通信接口 280以及翻译模块290。服务器150也可包括一个或多个电源(未示出)。本领域技术人员将意识到服务器150可以若干其他方式被配置,可包括其它或不同的元件。总线210允许在服务器150的部件之间通信。处理器220可包括任何类型的处理器、微处理器、或者可解释和执行指令的处理逻辑。处理器220也可包括可以解码媒体文件例如音频文件、视频文件等的逻辑,并可产生到例如扬声器、显示器等的输出。存储器230可包括随机存储器(RAM)或另一个动态存储设备,存储被处理器220执行的信息和指令。存储器230也可被用于存储临时变量或处理器220执行指令过程中的其它中间信息。R0M240可包括ROM设备和/或另一个存储用于处理器220的静态信息和指令的静态存储设备。存储设备250可包括用于存储信息和指令的磁盘或光盘和其相应的驱动和/或一些其它类型的磁或光记录介质和其相应的驱动。存储设备250也可包括用于存储信息和指令的闪存(例如电可擦除可编程只读存储器(EEPROM))设备。输入设备260可包括一个或多个机构,允许用户向服务器150输入信息,例如键盘、鼠标、麦克风、笔、声音识别和/或生物学机构等。输出设备270可包括一个或多个机构,向用户输出信息,包括显示器、打印机等。通信接口 280可包括任何类似收发器的机构,使得服务器150与其他设备和/或系统通信。例如,通信接口 280可包括到LAN的调制解调器或以太网接口。通信接口 280可包括通过网络,例如网络140,用于通信的其他机构。例如,通信接口 280可包括一个或多个射频(RF)发射机,以及一个或多个RF接收机,和用于传输和接收RF信号的天线。翻译模块290可包括用于接收图像以及在接收到的图像上执行光字符识别(OCR)处理以产生文本的硬件和/或软件。例如翻译模块290可接收从移动终端110传送的视频流或图像,并从接收到的图像上识别和产生文本。翻译模块290可进一步包括过滤和动作处理软件,以在执行OCR处理之前处理接收到的视频流。翻译模块290也可为每种语言存储目录,并可执行从一种语言到另一种语言的文本翻译。翻译模块290可通过以词为基础执行文本翻译,或者使用文法或句法规则翻译文本,以便按照逐个句子的方式或者以短语为基础执行翻译。处理器220和/或翻译模块290可执行翻译处理并通过例如通信接口 280向移动终端110回传翻译的文本。根据示范性实施,响应于处理器220执行包括在存储器230中的指令序列,服务器150可执行各种处理。从另一个计算机可读介质,例如存储器设备250,或通过通信接口 280从单独的设备可将这样的指令读入存储器230。应当理解的是计算机可介质可包括一个或多个存储器设备或载波。包括在存储器230中的指令执行序列使得处理器220执行此后将要描述的行为。在可替换实施例中,硬连线电路可被用于代替软件指令或与之结合,以实施该实施例的各方面。因此,此处描述的系统和方法不限于硬件电路和软件的任何特定结合。图3示出了示范性移动终端110,可包括外壳301、小键盘310、控制键320、扬声器330、显示器340、麦克风350、照相机360和定位笔370。外壳301可包括配置用来容纳用在移动终端110中的设备和部件的结构。例如,外壳301可由塑料、金属或合成物组成,可被配置为支持小键盘310、控制键320、扬声器330、显示器340、麦克风350、照相机360和手写笔 370。 小键盘310可包括可用于操作移动终端110的设备和/或逻辑。小键盘310可进一步适于接收用户输入,直接或通过其他设备,例如手写笔370,向移动终端110输入信息。在一个实施中,可通过激活小键盘310中的键来控制移动终端110的通信功能。键的实施可拥有与之相关联的键信息,例如数字、字母、符号等。用户可操作小键盘310中的键以便发出呼叫、向移动终端110输入数字、命令以及文本消息。键的指定功能可形成和/或操纵可显示在显示器340上的图像。控制键320可包括按钮,允许用户与移动终端110交互以执行特定的动作,例如与显示器340交互等。例如,用户可使用控制键320从选择菜单中选择,该选择菜单可包括选择翻译模式。扬声器330可包括向移动终端110的用户提供可听见信息的设备。扬声器330可放置于移动终端110的任何地方,例如当用户使用移动终端110进行通信时可用作听筒。扬声器330也可用作例如用于播放音乐或在紧急情况下产生告警音频的输出设备。显示器340可包括向用户提供可视图像的设备。例如,显示器340可向用户显示文本,例如菜单(如图3所示)。显示器340也可向移动终端110的用户显示关于输入/输出呼叫、文本消息、电话簿、音量设置等的图形信息。显示器340可用黑白或彩色显示器,例如液晶显示器(IXD)来实现。在一个实施例中,显示器340可用作用户输入接口,例如,触摸屏、或可显示的面板。例如,显示器340可包括压力敏感的(例如电阻性的)、电敏感的(例如电容性的)、声敏感的(例如表面声波)、光敏感的(例如红外线的)、和/或任何其他类型的允许显示器作为输入设备使用的显示器覆盖物。麦克风350可包括将语音或其他声信号转化为移动设备110使用的电信号的设备。麦克风350可放置在移动终端110的任何地方,可被配置为,例如,将口语单词或短语转化为移动终端110使用的电信号。照相机360可包括任何类型的数字照相设备,使得用户能够捕获和存储视频和/或图像(例如照片)。手写笔370可包括附属工具,可用于操作显示器340、控制键320、和/或小键盘310,例如输入数据。在一个实施中,手写笔370可以是指示器或无墨水笔,可用于写信息或选择呈现在显示器340上的文本信息或图像。手写笔370可与显示器340的触摸屏的类型相对应。例如,如果显示器340包括压力敏感的表面,手写笔370就可包括带有尖头的延长轴,用于接触显示器340的表面。另外,如果显示器340包括电敏感的表面、声敏感的表面、或者光敏感的表面,手写笔370就可分别包括发射电荷、声音或光的末端,可被引导到显不器340的表面。手写笔370可包括一个或多个表面特征和/或轮廓,以便用户抓住和/或操作。手写笔370例如可包含在移动终端110的外壳301内的狭槽中。图4是移动终端110的示范性部件的图表。如图4所示,移动终端110可包括处理逻辑410、存储器420、用户接口 430、通信接口 440、天线组件450、以及翻译存储器460。处理逻辑410可包括处理器、微处理器、专用集成电路(ASCI)、现场可编程门阵列(FPGA)等等。处理逻辑410可包括数据结构或软件程序以控制移动终端110及其部件的操作。存储器420可包括随机存取存储器(RAM)、只读存储器(ROM)、和/或其他类型的存储器,以存储可被处理逻辑410使用的数据和指令。 用户接口 430可包括用于向移动终端110输入信息和/或从移动终端110输出信息的机构。输入和输出机构的例子可包括接收电信号并输出音频信号的扬声器330,接收音频信号并输出电信号的麦克风350,产生数字图像的照相机360,允许数据和控制命令被输入到移动终端110中的控制按钮320和/或小键盘310上的键,以及输出视觉信息的显示器 340。通信接口 440可包括,例如,可将来自处理逻辑410的基带信号转变为射频(RF)信号的发射机,和/或可将RF信号转变为基带信号的接收机。可替换地,通信接口 440可包括执行发射机和接收机双方的功能的收发机。通信接口 440可连接到天线组件450,用于传输和接收RF信号。天线组件250可包括一个或多个天线以便经由空中传输和接收RF信号。天线组件450可从通信接口 440接收RF信号,经由空中传输它们,经由空中接收RF信号,并将其提供给通信接口 440。翻译存储器460可包括用于接收图像和在接收到的图像上执行光学字符识别(OCR)处理以产生文本的硬件和/或软件。例如,翻译存储器460可从照相机360接收视频流或图像,并从接收到的图像上识别并产生文本。翻译存储器460可进一步包括过滤器和运动处理软件,以便在执行OCR处理之前处理接收到的视频流。翻译存储器460也可存储与许多语言中的每一个相应的字典,并可以执行从一种语言到另一种语言的文本翻译。翻译存储器460可以词为基础执行文本翻译,或者可以使用文法和语法规则翻译文本,或按照逐个短语的方式、按照逐个句子的方式等等,执行翻译。如下述详细描述的,移动终端110可响应于处理逻辑410执行软件指令而执行操作,以使用包括在计算机可读介质,例如存储器420,中的应用程序显示和传输图像。计算机可读介质可定义为物理或逻辑存储器设备和/或载波。软件指令可从另一个计算机可读介质中或者从另一个设备中通过通信接口 440读入存储器420中。包含在存储器420中的软件指令可使得处理逻辑410执行稍后描述的处理。可替换地,硬连线电路可被用于替代软件指令或与之结合,以执行与实施例一致的处理。因此,此处描述的实施方式不限于任何特定的硬件电路和软件的结合。图5示出了移动终端110执行的示范性处理500。处理可开始于,例如,输入翻译信息(动作510)。例如,使用控制键320,移动终端110的用户可从显示菜单中选择翻译模式,如图3所示。一旦在翻译模式中,用户就可输入或选择用于翻译要“从中”进行翻译和要翻译“到”的语言,例如。例如,用户可能在外国(例如瑞典)休假,需要将文本“从”外国语言(例如瑞典语)翻译“到”他的本国语言英语。在该例子中,用户可将翻译信息输入到移动终端110以便从瑞典语翻译到英语(动作510)。在其他实施例中,例如当OCR处理可自动识别和鉴别文本的语言时,用户可仅仅输入或选择要翻译“到”的语言。在进一步的实施例中,语言的选择可如下所述的使用默认设置、或使用移动终端110的标识号、或者使用与移动终端110的位置相关的GPS信息自动地执行。一旦输入翻译参数,可从照相机360接收图像(动作520)。例如,移动终端110的用户可在外国,需要读在警报标记牌上的文本,该标记牌上的文本位于商店的外面等。在该实例中,用户可使用照相机360获得该标记牌的图像。照相机360捕获的图像接着被处理逻辑410和翻译存储器460接收(动作520)。可以通过显示器340显示的接收到的图像的实例如图6A所示。在该实例中,在标记牌上的文本的语言是瑞典语,文本“Oppet Tradgardoch Caf6” 翻译为英文的 “Open Garden and Caf6”。
在从照相机接收图像之后,包含在接收到的图像中的文本被处理和翻译(动作530 )。例如,翻译存储器460可在接收到的图像上执行OCR处理(如图6A所示),并将“OppetTradgard och Caf6”识别为瑞典语文本。在对接收到的图像执行OCR处理之后,识别的文本可以被翻译为如在动作510中输入的翻译参数所定义的另一种语言。在该实例中,假定英语已经被选择作为文本将要翻译成的语言。翻译存储器460接着可以使用存储的字典将“Oppet Tradgard och Caf6”从瑞典语翻译为英语“Open Garden and Caf6”。在其他实施例中,从照相机360接收的图像如上所描述的,可从移动终端110传输到服务器150用于文本处理和翻译(以执行动作530)。例如,在服务器150中的翻译模块290可在接收到的图像或视频流上执行OCR处理,以识别文本,并将识别的文本翻译为另一种确定的语言。服务器150可接着通过通信接口 280将翻译的文本传送回移动终端110。在其他实施例中,服务器150也可接收可以用于选择在翻译过程中使用的语言的移动终端110的标识号和/或位置。例如,如果接收到的移动终端110的位置确定为在法国,则法语将被选择作为源语言。同样,例如服务器150可将移动终端110的标识号与目标语言例如德语相联系,从该移动终端接收的传输将自动翻译为德文。一旦文本已经被处理和翻译,原始图像可被处理并与翻译的文本一起显示(动作540)。例如,如图6B所示,原始图像可以被暗淡化,或者以更亮或不同的显示模式被显示,翻译的文本(“Open Garden and Cafg”)可以被叠加到原始图像的显示上。可以通过显示器340以加黑、加粗方式或者以某种其他方式高亮显示从而比原始图像更加突出的方式来显示翻译的文本,以便移动终端110的用户可以清楚的看见。例如,原始图像以灰度级的方式示出,此处每个像素的亮度(灰度)可被减少以使得显示的翻译的文本更加明显(动作540)。在处理和显示带有翻译的文本的图像之后,移动终端110的用户可接着操作显示的图像(动作550)。例如,使用手写笔370或控制键320,显示在图6B中的文本在尺寸上将被缩小或放大,或者可以被旋转。文本或者文本的选择的部分也可被翻译为另一种选择的语言或者可以在移动终端110包含的另一个应用程序中被使用。例如,文本可被用于移动终端110包括的记事本应用程序中。即,“Oppet Tradgard och Cafg”的文本“Open Gardenand Cafg”可被选择和复制到记事本应用程序、电子邮件消息、短消息服务(SMS)消息等。在进一步的实施例中,通过选择淡化显示的翻译的文本可进一步操作显示的图像,从而产生和显示原始接收的图像,或者原始接收的图像可被完全淡化出去仅显示翻译的文本。图7示出了移动终端110执行的另外的示范性处理700。例如,处理可通过从照相机360接收图像开始(动作710)。例如移动终端110的用户可使用照相机360拍摄可以在图像中包括文字的照片。照相机360产生的图像可接着被处理逻辑410和翻译存储器460接收。接收到的图像的一个实例(通过显示器340所示出的)示出在图8A中。在该实例中,接收到的图像包括瑞典语文字“Oppet Tradgard och Cafg”。一旦接收到图像,图像中的文本被处理和显示(动作720)。例如使用手写笔370,用户可将接收到的图像中的文本围起来或圈起来,如在图8A中的圈起部分810所示出的,其中所围起来的文本可由OCR处理来处理和识别。在该实施例中,如图SB所示的,处理逻辑410和翻译存储器460可产生一个显示。即,翻译存储器460已经使用OCR将在图8A中的图像中的文本的选择部分转换为文本。文本接着被进一步处理。在该实例中,当用户已 经圈定文本“Oppet Tradgard och Cafg”时,即在图8B中以加粗的方式被显示的文本。由于词“Oppet”没有被圈起部分810圈入,所以该词不作为文本被处理和显示。如上面在图5中所述的,在动作720中的显示文本可以被叠加在原始接收的图像上,此处原始接收的图像以暗淡化或更亮的方法被显示。同样作为例子,用户可沿着文本页移动照相机360以产生与文本页相关联的图像的视频流。使用手写笔370,例如,用户可在实时的视频流中划下划线、高亮或者圈入文本,以便选择图像的一部分用于执行用于文本/翻译目的的OCR处理。 在其它实施例中,包括在图像中并被OCR处理识别的所有的文本可以以本国语言被自动显示(动作720 )。图9A和9D示出了自动识别、处理和显示文本的实例。图9A示出了接收到的图像(动作710),并且在该实例中,在图像中的所有文本可以如图9D所示被自动处理和显示(动作720)。在其它实施例中,包括在图像视频流中的文本可被OCR处理所识别,并可以自动以本国语言显示(动作720)。例如,移动终端110的用户可以通过沿着书中的文本的行移动照相机360捕获图像的视频流(动作710)。在该实施例中,翻译存储器460可在视频流图像的每个帧上执行OCR处理。假定例如照相机360每秒产生15帧(图像),在一秒的周期内扫描文本的一行可产生15幅图像,每一个都可以被OCR处理。在该实例中,在文本行的扫描图像中的每个词可以被识别和跟踪。例如,文本的扫描行可包括8个词,每个识别的词可以被跟踪并编号(I 一 8)。另外,在每一幅图像中识别的词的OCR处理可以被存储在翻译存储器460中。例如,如果德语词“wagen”是包括在文本的扫描行中的第三个词,该词出现在15幅图像的7幅中,则跟踪的词可编号“3”并识别为(7次)“wagenWagen”、“wagon”、“Z00m”、“wegen”、“fgUn”以及“vagon”。翻译存储器460可包括先进先出(FIFO)缓冲器,以存储每个识别的(或编号的)词的每个OCR处理输出。为每个跟踪和识别的词存储多个OCR处理的词,提供了识别的词的“过滤效果”。在该实例中,由于词“wagen”比任何其他存储在FIFO缓冲器中的OCR处理的词更经常出现时,词“ragen”可以被翻译存储器460作为文本来提供(动作720)。在其他实例中,在视频流中的文本可以在没有提供词的多个OCR处理和过滤时被立即显示。在进一步的实施例中,在接收到的图像中的所有识别的文本可被自动处理、翻译和显示(动作720)。例如,图9A示出了接收到的图像(动作710),图9B示出了自动提供和显示在接收到的图像中识别的所有文本的翻译文本(动作720)。在该实施例中,除了 OpenGarden and Cafg的翻译之外,与用于“花(flowers)”(图9B中的910所示)的瑞典语词相应的文本已经作为英语词“flowers”被示出 。在该实例中,文本最初以相似于在原始图像中的文本的尺寸被显示。使用高分辨率图像,例如,选择和显示的文本(例如在该实例中的词flowers)可在没有失真时变得更大(放大功能),如果用户需要的话。例如,通过激活“翻译”按钮两次或者从通过显示器340提供的菜单中选择“翻译全部”的功能,可以使得能够实现该实施例。在进一步的实施例中,包括在图像的视频流中的文本可被OCR处理识别,并可被自动翻译和显示(动作720)。参见上述扫描包括词“wagen”的文本行的实例,如果选择的OCR处理语言是德语,选择的要翻译到的语言是英语,如上所描述的,词“wagen”可由翻译存储器460执行OCR处理、过滤和识别。当翻译模式已经被选择后,当图像的视频流被显示时,词“car”(英语)可以在识别的词“wagen”(德语)上被提供和显示(动作720)。在接收到的图像中的所有或一些文本在任何上述示范性实施例中被处理和显示之后,文本可被复制、选择或翻译(动作730)。例如,使用手写笔370,用户可圈定文本“Tradgard”以选择该文本,如图8C中所示。图9C和9E也示出了文本的显示,此处圈入的文本已经被选择(动作730)。同样例如,用户可使用手写笔370圈定多于一个的文本区域。例如,用户可能已经拍摄报纸头版的照片,并可能已经圈定了两个单独的标题(动作730)。在该实例中,文本的两个圈入的部分都可被选择或复制到记事本应用程序中或另一个由移动终端110执行的应用程序中。在文本已经被选择之后(动作730),判断是否更多的文本处理将被执行(动作740)。例如,如果移动终端110的用户促使另一个控制键320或使用手写笔370激活另一个文本处理特征(例如动作740“是”),则可执行进一步的处理。例如,用户可能已经选择文本“Tradgard”,如图8C所示,并可如图8D中所示的通过翻译文本进一步处理该选择的文本。如图8D所示,词“Tradgard”已经被翻译为词“garden”,并可以通过显示器340显示。图9E和9F也示出了进一步的文本处理的实例(动作740)。在这些实例中,动作730中选择的文本可以通过被复制到剪贴板功能可被进一步处理或进一步翻译。一旦复制,文本可用于短消息服务(SMS)文本消息、即时消息、电子邮件等中,或者可被合并到移动终端110中的另一个应用程序中。例如,复制的文本例如名字、电话号和约会可被插入到联系人列表或日历应用程序中。例如,在复制到消息之前,文本也可被通过编辑来进一步处理。
结论
与此处描述的系统和方法相一致的实施允许移动终端的用户识别和翻译在图像中的文本。文本和图像也可被移动终端进一步处理。实施例的前述描述提供了说明和描述,但是并没有打算穷举实施方式,也没有打算要将所述实施方式限制为所公开的精确形式。根据以上教导是可以进行修改和改变的,或者可从实现实施例的实践中获得。例如,已经在通过网络通信并采用文本翻译特征的移动终端的背景下描述了实施例。该实施例可在其他设备或系统和/或网络中实施。另外,在一些实施例中,以上描述的由移动终端110或服务器150执行的功能也可由其他设备来执行,例如其他移动终端之一。例如,没有文本翻译能力的移动终端可向有文本翻译能力的另一个移动终端转发图像。另外,虽然已经参考图5和7描述了一系列的动作,但是在其他实施方式中动作的顺序可被改变。更进一步的,非从属动作可被并行执行。对于本领域的普通技术人员同样显而易见的是,以上描述的实施方式的各方面可在蜂窝通信设备/系统、方法、和/或计算机程序产品中实施。因此,这些实施可在硬件和/或软件(包括固件、常驻软件、微代码等)中被具体化。另外,这些实施可采取计算机可使用或计算机可读存储介质上的计算机产品的形式,该计算机可使用或计算机可读存储介质具有在介质中被具体化的计算机可使用或计算机可读程序代码,被指令执行系统使用或结合指令执行系统使用。用于实现实施例的各方面的实际的软件代码或者专门的控制硬件不限于描述的系统和方法。因此,各方面的操作和 行为没有参考特定的软件代码来描述一可以理解的是本领域的普通技术人员之一基于此处的描述将能够设计软件并控制硬件以实施各方面。另外,实施例的特定部分被作为“逻辑”被实施,该“逻辑”实施一个或多个功能。该逻辑可包括硬件,例如处理器、微处理器、专用集成电路或者现场可编程门阵列、软件或硬件和软件的组合。应该强调的是在该说明书中使用的术语“包括”是用于指出一定的特征、整数、步骤或部件的存在,但不排除或增加一个或多个其他特征、整数、步骤、部件或其组的存在。在本申请的说明书中使用的元件、动作或指令不应被解释为对于所描述的系统和方法是关键的或实质的,除非明确的这样描述了。同样,如此处所使用的,冠词“a”试图包括一个或多个项目。只试图包含一个项目的地方,使用术语“one”或类似的语言。另外,作为此处使用的短语“基于”,试图意味着“至少部分的基于”,除非有另外清楚的陈述。此处描述的发明的范围由权利要求和其等同物所定义。
权利要求
1.一种由移动设备执行的方法,包括 经由所述移动设备的显示器显示图像; 接收对所述图像的一部分的第一用户选择; 识别所述图像的所选择部分中的文本; 经由所述显示器显示识别的文本; 接收对所述识别的文本的至少一部分的第二用户选择; 将识别的文本的所述部分从第一语言翻译为不同于第一语言的第二语言;和 经由所述显示器在所述图像上以第二语言显示翻译的文本。
2.权利要求I的方法,其中经由所述显示器在所述图像上以第二语言显示翻译的文本还包括 将所述翻译文本覆盖在图像的所述部分上。
3.权利要求2的方法,其中在将翻译的文本覆盖在图像的所述部分上时,图像的所述部分中的至少一些在翻译的文本后是可看见的。
4.权利要求I的方法,其中翻译的文本以比所述图像更加突出的方式显示。
5.权利要求I的方法,还包括 在图像的所述部分上执行光学字符识别(OCR)处理。
6.权利要求5的方法,还包括 从用户接收选择用于执行所述OCR处理的语言的输入。
7.权利要求I的方法,还包括 从用户接收选择第二语言的输入。
8.权利要求I的方法,其中所述图像包括数字图像或视频流的至少之一。
9.权利要求I的方法,还包括 确定与所述移动设备相关联的位置信息;和 基于所述位置信息识别所述图像的所选择的部分中的文本。
10.权利要求I的方法,还包括 基于与所述移动设备相关联的识别信息确定所述第二语言。
11.权利要求I的方法,其中将识别的文本的所述部分翻译为第二语言还包括 由所述移动设备将识别的文本的所选择的部分经由网络传送到服务器; 由所述服务器将识别的文本的所述部分翻译为第二语言;和 由所述移动设备经由网络从所述服务器接收所述翻译的文本。
12.权利要求11的方法,还包括 将与所述移动设备相关联的识别信息传送到所述服务器;和 由所述服务器基于与所述移动设备相关联的识别信息确定第二语言。
13.—种移动通信设备,包括 照相机,被配置为产生图像; 显不器;和 处理器,被配置为 控制所述显示器显示所述图像; 接收对所述图像的一部分的第一用户选择;识别所述图像的所选择的部分中的文本; 经由所述显示器显示所述识别的文本; 接收识别所述识别的文本的至少一部分的第二用户选择; 将识别的文本的所述部分从第一语言翻译为不同于第一语言的第二语言;和 经由所述显示器以第二语言显示覆盖所述图像的翻译的文本。
14.权利要求13的所述移动通信设备,其中当显示覆盖所述图像的翻译的文本时,至少图像的所述部分在翻译的文本后是可看见的。
15.权利要求13的所述移动通信设备,其中翻译的文本以比所述图像更加突出的方式显不O
16.一种由移动通信设备执行的方法,包括 经由所述移动通信设备的照相机捕获图像,其中所述图像包括静态图像或视频流; 经由所述移动通信设备的显示器显示所述图像; 接收对所述图像的一部分的第一用户选择; 识别所述图像的所选择的部分中的文本; 经由所述显示器显示所述识别的文本; 接收对识别的文本的至少一部分的第二用户选择; 将识别的文本的所述部分经由网络传送到服务器,其中所述服务器被配置为将识别的文本的所述部分从第一语言翻译为不同于第一语言的第二语言; 经由所述网络从所述服务器接收基于所述翻译而被翻译的文本;和 经由所述显示器在所述图像上以第二语言显示所述翻译的文本。
17.权利要求16的方法,其中识别在所述图像的所选择的部分中的文本还包括 确定所述第一语言;和 基于所述第一语言在图像的所述部分上执行光学字符识别(OCR)处理。
18.权利要求17的方法,还包括 将与所述移动通信设备相关联的识别信息传送到所述服务器, 其中所述服务器被配置成基于与所述移动通信设备相关联的识别信息识别第二语言。
19.权利要求16的方法,其中经由所述显示器在所述图像上以第二语言显示翻译的文本还包括 以基本上与所述识别的文本相同的尺寸显示翻译的文本。
20.权利要求16的方法,其中经由所述显示器在所述图像上以第二语言显示翻译的文本还包括 将所述翻译的文本覆盖在图像的所述部分上,使得图像的所述部分在所述翻译的文本后是可看见的。
全文摘要
一种由移动终端执行的方法,可包括接收包含文本的图像,将该文本翻译为另一种语言,在接收的图像上叠加并显示翻译的文本。
文档编号G06K9/78GK102866991SQ20121038171
公开日2013年1月9日 申请日期2007年9月11日 优先权日2007年3月22日
发明者H.M.恩隆德, S.莱辛 申请人:索尼爱立信移动通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1