呈现图像中描绘的文本的翻译的制作方法_6

文档序号：9925310阅读：来源：国知局

可与有资格被用于呈现关于为其选择呈现场境的图像中所描述的文本的附加信息的一个或多个用户界面相关联。例如，基于用于所选择的呈现场境的优选用户界面和/或有资格的用户界面和附加信息的可读性度量，可以选择用于所选择的呈现场境的用户界面中的一个，如上面所描述的。
[0195]使用所选择的用户界面来呈现附加信息(1616)。例如，用户设备可以生成用户界面并使用所选择的用户界面来呈现附加信息。
[0196]附加实现细节
[0197]本说明书中所描述的主题和操作的实施例可以以数字电子电路、或者以计算机软件、固件或硬件的形式被实现，包括本说明书中公开的结构和他们的结构等效物，或以他们中一个或多个的组合的形式被实现。本说明书中所描述的主题的实施例可被实现为一个或多个计算机程序，即，计算机程序指令的一个或多个模块，所述计算机程序指令被编码在计算机存储介质上用于由数据处理装置执行或控制数据处理装置的操作。替选地或附加地，程序指令可以被编码在人工生成的传播的信号上，例如机器生成的电子、光或电磁信号，其被生成以编码信息用于传输至合适的接收端装置，用于被数据处理装置执行。计算机存储介质可以是或被包括在计算机可读存储设备、计算机可读存储基板、随机或串行存取存储器阵列或设备、或他们中一个或多个的组合中。此外，计算机存储介质不是传播的信号，计算机存储介质可以是被编码在人工生成的传播的信号上的计算机程序指令的源或目的地。计算机存储介质还可以是一个或多个物理组件或介质(例如，多个CD、盘或其他存储设备)，或被包括在所述一个或多个物理组件或介质之中。
[0198]本说明书中所描述的操作可被实现为由数据处理装置在数据上执行，所述数据被存储在一个或多个计算机可读存储设备上或从其他的源被接收。
[0199]术语“数据处理装置”包括用于处理数据的所有种类的装置、设备和机器，包括通过示例形式的可编程处理器、计算机、片上系统或以上的多个或组合。装置可以包括专用逻辑电路，例如，FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件以外，装置还可以包括为正在探讨的计算机程序创建执行环境的代码，例如，构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或或他们中一个或多个的组合的代码。装置和执行环境可以实现多种不同的计算模型基础架构，诸如web服务、分布式计算和网格式计算基础架构。
[0200]计算机程序(也被称为程序、软件、软件应用、脚本或代码)可以任意形式的编程语言被编写，包括编译或解释型语言、声明性的或过程的语言，并且其可以以任意形式被部署，包括作为独立程序或模块、组件、子例程、对象或适合用在计算环境中的其他单元。计算机程序可以但不是必须对应于文件系统中的文件。程序可以被存储在保持其他程序或数据(例如，存储在标记语言文档中的一个或多个脚本)的文件的一部分中，在专用于正在讨论的程序的单个文件中，或在多个协调文件(例如，存储一个或多个模块、子程序、或部分代码的文件)中。计算机程序可被部署为在一个计算机上或位于一个地点或分布于多个地点且通过通信网络相连的多个计算机上被执行。
[0201]本说明书中描述的过程和逻辑流程可通过执行一个或多个计算机程序的一个或多个可编程处理器被执行，以通过对输入数据进行操作并生成输出来执行动作。还可以通过专用逻辑电路执行所述过程和逻辑流程，装置也可以被实现为专用逻辑电路，例如FPGA(现场可编程门阵列)或ASICX专用集成电路)。
[0202]适合用于计算机程序的执行的处理器包括例如通用和专用微处理器，以及任意类型的数字计算机的任意一个或多个处理器。一般地，处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于根据指令执行动作的处理器和用于存储指令和数据的一个或多个存储器设备。一般地，计算机也将包括或被操作耦接，以从用于存储数据的一个或多个大容量储存设备(例如，磁、磁光盘或光盘)接收数据，或向其传送数据，或两者。然而，计算机不需要具有这样的设备。此外，计算机可以被嵌入进另一设备中，例如，移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏机、全球定位系统(GPS)接收器或便携式存储设备(例如，通用串行总线(USB)闪存驱动)，仅举几个例子。适合于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备，通过示例的形式包括半导体存储器设备，例如EPR0M、EEPR0M和闪速存储器设备;磁盘，例如内部硬盘或可拆卸盘;磁光盘;和⑶-ROM以及DVD-ROM盘。处理器和存储器可以通过专用逻辑电路被补充，或被合并在专用逻辑电路中。
[0203]为了提供与用户的交互，本说明书中描述的主题的实施例可以在具有以下的计算机上被实现:用于向用户显示信息的显示设备，例如，CRT(阴极射线管)或IXD(液晶显示器)监视器;和键盘以及指示设备，例如鼠标或轨迹球，用户可以通过其向计算机提供输入。其他类型的设备还可被用于提供与用户的交互;例如，提供给用户的反馈可以是任意形式的感知反馈，例如视觉反馈、听觉反馈或触觉反馈;并且来自用户的输入可以以任意形式被接收，包括声学的、语音的、或触觉输入。此外，计算机可以通过发送文档至用户使用的设备并从用户使用的设备接收数据与用户交互;例如，通过响应于从用户的用户设备上的web浏览器接收的请求而将网页发送至该web浏览器。
[0204]本说明书中描述的主题的实施例可以被实现在计算系统中，所述计算系统包括后端组件，例如，作为数据服务器，或其包括中间件组件，例如应用服务器，或其包括前端组件，例如，具有用户可通过其与本说明书中描述的主题的实现交互的图形用户界面或web浏览器的用户计算机，或者一个或多个这样的后端、中间件或前端组件的任意组合。系统的组件可以通过任意形式或介质的数字数据通信例如通信网络被相互连接，例如，通信网络。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、互联网络(例如，互联网)以及对等网络(例如，自组对等网络)。
[0205]计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并典型地通过通信网络交互。客户端和服务器的关系通过在相应的计算机上运行并相互具有客户端-月艮务器关系的计算机程序发生。在一些实施例中，服务器将数据(例如，HTML页面)传输给客户端设备(例如，为了显示数据至与用户设备交互的用户或从所述用户接收用户输入的目的)。在客户端设备处生成的数据(例如，用户交互的结果)可以在服务器处从用户设备接收。
[0206]虽然本说明书包含很多特定的实现细节，这些不应该被解释为对任意发明或可以要求保护的内容的范围的限制，但可作为特定于特定发明的特定实施例的特征的描述。在本说明书中在单独的实施例的上下文中描述的某些特征也可在单个实施例中结合地被实现。相反地，在单个实施例的上下文中描述的各种特征还可以单独在多个实施例中或在任意合适的子组合中被实现。此外，尽管特征可在上面被描述为在某些组合中起作用并且初始地如此要求，但是来自所要求保护的组合的一个或多个特征可以在某些情况下从组合中被去除，并且所要求保护的组合可以指向子组合或子组合的变化。
[0207]类似地，虽然操作在附图中以特定的顺序被描绘，这不应被理解为要求这样的操作以示出的特定顺序或连续顺序被执行，或者所有图示说明的操作被执行，以获得期望的结果。在某些情况下，多任务和并行处理可以是有益的。此外，以上描述的实施例中的多个系统组件的分离不应该被理解为在所有实施例中都要求这样的分离，并且应理解所描述的程序组件和系统通常可以在单个软件产品中被整合在一起或打包进多个软件产品。
[0208]因此，主题的特定实施例已经被描述。其他实施例在所附权利要求的范围内。在一些情况下，权利要求中记载的动作可以以不同顺序被执行且仍可以获得期望的结果。此外，附图中描绘的过程不必要求所示的特定顺序或连续顺序，以获得期望的结果。在某些实现中，多任务和并行处理可以是有益的。
【主权项】
1.一种由数据处理装置执行的方法，所述方法包括: 接收图像；识别所述图像中描绘的文本；基于所述图像中描绘的所述文本的布置，从多个呈现场境中为所述图像选择呈现场境，其中，每个呈现场境对应于图像内的文本的特定布置，并且每个呈现场境具有对应的用户界面，所述对应的用户界面用于呈现与所述图像中描绘的所述文本相关的附加信息，其中，用于每个呈现场境的用户界面不同于用于其他呈现场境的用户界面；识别对应于所选择的呈现场境的用户界面；以及使用所识别的用户界面，为所述图像中描绘的所述文本的至少部分呈现附加信息，所述用户界面在所述图像之上的覆盖中呈现所述附加信息。2.根据权利要求1所述的方法，其中，所述附加信息包括所识别的文本的所述至少部分的语言翻译。3.根据权利要求1所述的方法，其中，为所述图像选择所述呈现场境包括: 识别所述图像中描绘的多个单独的文本块；以及基于所述图像中描绘的所述多个单独的文本块，为所述图像选择所述呈现场境。4.根据权利要求1所述的方法，其中，为所述图像选择所述呈现场境包括: 基于所述图像中描绘的所述文本的所述布置，确定所述文本的第一部分相较于所述文本的至少一个其他部分被更突出地呈现；以及响应于所述确定，从所述多个呈现场境中选择突出场境。5.根据权利要求4所述的方法，其中: 识别对应于所选择的呈现场境的用户界面包括识别对应于所述突出场境的突出用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括在所述文本的所述第一部分之上的覆盖中呈现所述文本的所述第一部分的语言翻译。6.根据权利要求1所述的方法，其中，为所述图像选择所述呈现场境包括: 确定所述图像中描绘的所述文本包括地址；以及响应于所述确定，从所述多个呈现场境中选择地图场境。7.根据权利要求6所述的方法，其中: 识别对应于所选择的呈现场境的所述用户界面包括识别对应于所述地图场境的地图用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括在地图的图像内呈现所述地址的语言翻译。8.根据权利要求6所述的方法，其中: 识别对应于所选择的呈现场境的用户界面包括识别对应于所述地图场境的地图用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括呈现与所述地图的图像内的所述地址相对应的标题，所述标题以与呈现所述地图的所述图像的设备相关联的用户的语言被呈现。9.根据权利要求1所述的方法，其中，为所述图像选择所述呈现场境包括: 识别所述图像中描绘的多个单独的文本块；基于所述单独的文本块的布置以及所述单独的文本块的呈现，确定所述多个单独的文本块属于文本的集合;以及响应于所述确定，从所述多个呈现场境中选择集合场境。10.根据权利要求9所述的方法，其中: 识别对应于所选择的呈现场境的用户界面包括识别对应于所述集合场境的集合用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括在所述图像之上的覆盖中呈现每个单独的文本块中描绘的文本的语言翻译，每个语言翻译被呈现在语言翻译的对应文本块之上。11.一种系统，包括: 数据处理装置；以及与所述数据处理装置数据通信的存储器存储装置，所述存储器存储装置存储可由所述数据处理装置执行的指令，并且所述在这样的执行之后使得所述数据处理装置执行操作，所述操作包括: 接收图像；识别所述图像中描绘的文本；基于所述图像中描绘的所述文本的布置，从多个呈现场境中为所述图像选择呈现场境，其中，每个呈现场境对应于图像内的文本的特定布置，并且每个呈现场境具有对应的用户界面，所述对应的用户界面用于呈现与所述图像中描绘的所述文本相关的附加信息，其中，用于每个呈现场境的用户界面不同于用于其他呈现场境的用户界面；识别对应于所选择的呈现场境的用户界面；以及使用所识别的用户界面，为所述图像中描绘的所述文本的至少部分呈现附加信息，所述用户界面在所述图像之上的覆盖中呈现所述附加信息。12.根据权利要求11所述的系统，其中，所述附加信息包括所识别的文本的所述至少部分的语言翻译。13.根据权利要求11所述的系统，其中，为所述图像选择所述呈现场境包括: 识别所述图像中描绘的多个单独的文本块；以及基于所述图像中描绘的所述多个单独的文本块，为所述图像选择所述呈现场境。14.根据权利要求11所述的系统，其中，为所述图像选择所述呈现场境包括: 基于所述图像中描绘的所述文本的所述布置，确定所述文本的第一部分相较于所述文本的至少一个其他部分被更突出地呈现；以及响应于所述确定，从所述多个呈现场境中选择突出场境。15.根据权利要求14所述的系统，其中: 识别对应于所选择的呈现场境的用户界面包括识别对应于所述突出场境的突出用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括在所述文本的所述第一部分之上的覆盖中呈现所述文本的所述第一部分的语言翻译。16.根据权利要求11所述的系统，其中，为所述图像选择所述呈现场境包括: 确定所述图像中描绘的所述文本包括地址；以及响应于所述确定，从所述多个呈现场境中选择地图场境。17.根据权利要求16所述的系统，其中: 识别对应于所选择的呈现场境的用户界面包括识别对应于所述地图场境的地图用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括在地图的图像内呈现所述地址的语言翻译。18.根据权利要求16所述的系统，其中: 识别对应于所选择的呈现场境的用户界面包括识别对应于所述地图场境的地图用户界面；以及为所述图像中描绘的所述文本的至少部分呈现附加信息包括呈现与所述地图的图像内的所述地址相对应的标题，所述标题以与呈现所述地图的所述图像的设备相关联的用户的语言被呈现。19.根据权利要求11所述的系统，其中，为所述图像选择所述呈现场境包括: 识别所述图像中描绘的多个单独的文本块；基于所述单独的文本块的布置以及所述单独的文本块的呈现，确定所述多个单独的文本块属于文本的集合;以及响应于所述确定，从所述多个呈现场境中选择集合场境。20.—种编码有计算机程序的计算机存储介质，所述程序包括指令，所述指令在由数据处理装置执行时使得所述数据处理装置执行操作，所述操作包括: 接收图像；识别所述图像中描绘的文本；基于所述图像中描绘的所述文本的布置，从多个呈现场境中为所述图像选择呈现场境，其中，每个呈现场境对应于图像内的文本的特定布置，并且每个呈现场境具有对应的用户界面，所述对应的用户界面用于呈现与所述图像中描绘的所述文本相关的附加信息，其中，用于每个呈现场境的用户界面不同于用于其他呈现场境的用户界面；识别对应于所选择的呈现场境的用户界面；以及使用所识别的用户界面，为所述图像中描绘的所述文本的至少部分呈现附加信息，所述用户界面在所述图像之上的覆盖中呈现所述附加信息。
【专利摘要】包括编码在计算机存储介质上的计算机程序的方法、系统和装置，用于呈现图像描绘的文本的附加信息。一方面，方法包括接收图像。识别所述图像中描绘的文本。基于所述图像中描绘的所述文本的布置，为所述图像选择呈现场境。每个呈现场境对应于图像内的文本的特定布置。每个呈现场境具有用于呈现关于所述文本的附加信息的对应的用户界面。用于每个呈现场境的所述用户界面不同于用于其他呈现场境的所述用户界面。识别对应于所选择的呈现场境的用户界面。使用所识别的用户界面，为所述图像中描绘的所述文本的至少部分呈现附加信息。所述用户界面在所述图像之上的覆盖中呈现所述附加信息。
【IPC分类】G06F17/28
【公开号】CN105706077
【申请号】CN201480061355
【发明人】亚历山大·J·卡思贝尔特, 约舒阿·J·埃斯泰勒
【申请人】谷歌公司
【公开日】2016年6月22日
【申请日】2014年11月5日
【公告号】WO2015069737A2, WO2015069737A3

完整全部详细技术资料下载

当前第6页1 2 3 4 5 6