具有文本提取功能的主机设备及其提取方法

文档序号:6563181阅读:338来源:国知局
专利名称:具有文本提取功能的主机设备及其提取方法
技术领域
本发明一般概念涉及具有文本提取功能的主机设备及其相应的提取方法。更具体地说,本发明涉及能够在图像内的文本上完成某种操作或作业的具有文本提取功能的主机设备及其相应的提取方法。
背景技术
一般来说,随着更多通讯技术的发展和个人计算机的普及,使用因特网的人口数量已经显著增加。另外,使用英特网的年龄群已经从低龄人群扩展到高龄人群,因此使用英特网的人数在持续增长。
因特网上有大量的信息,世界各地的网站与因特网相连以便通过因特网交流各种信息并且实现信息的全球化。
因特网用户可以通过因特网获得想要的信息,因特网用户也可以下载或者复制所获得的信息以便按照自己的意愿对下载的信息进行编辑。
因特网上的信息包括图像和文本,并且图像可包括图像化文本。图像化文本不能脱开其作为一部分而所属的图像被单独复制、存储和打印。
相应地,如果想得到包含在图像中的文本,用户就要手动输入想要的文本。因此,如果图像里包括大量的文本,为使用文本就要花费不必要的时间和努力。

发明内容
相应地,本发明一般概念提供了一种利用应用程序在图像里提取文本以便用户能够在所提取文本上完成操作的主机设备,以及相应的提取文本的方法。
本发明一般概念的其它方面,一部分将在接下来的描述中被阐明,一部分将是描述中显而易见的,或者可以通过本发明一般概念的实践被了解。
本发明一般概念的前述和/或其它的方面和优点可以通过提供包含至少一个带有文本提取功能的、并且执行某个文档的应用程序的主机设备来获得,所述的至少一个应用程序包括用户接口部分,用于输入选择信号以选择对包含在所执行文档中的图像所执行的操作;文本提取部分,用于从所述的图像中提取文本;和文本处理部分,用于在所提取的文本上执行所选择的操作。
用户接口部分可以接收第二选择信号以选择包含所要提取文本的图像,并且文本提取部分可以从所选择的图像中提取文本。
文本提取部分可以利用图像里的色差提取文本。所述的文本提取部分可以是光学字符识别引擎(OCR)。
所选择的在文本上所执行的操作可以至少是存储操作、打印操作、复制操作和翻译操作之一。如果执行翻译操作,文本处理部分可以提供翻译程序来翻译所提取的文本。
用户接口部分可以提供一个显示可选择操作的菜单,使用户能够选择在文本上所执行的操作。
所述的应用程序可以是网页浏览器、翻译程序和文档编制程序之一。
本发明一般概念的前述和/或其他的方面可以通过提供在图像生成系统上可执行的应用程序来获得,所述的程序包括文本提取部分,用于将作为图像的一部分的、图像格式的文本条目转换为文本格式;和处理部分,使得在所转换的文本格式的文本条目上能够执行一个或多个操作。
本发明一般概念的前述和/或其他的方面也可以通过在含有从图像中提取图像化文本的文本提取器的应用程序中可使用的用户接口单元来获得,所述的用户接口单元包括图像显示部分,用于显示其中带有图像化文本的图像;以及与图像显示部分相邻的菜单部分,用于显示当被选择时在所提取的文本上可执行的一个或多个可选择的操作。
本发明一般概念的前述和/或其他的方面也可以通过提供一种提取文本的方法来获得,所述的方法包括执行某个文档,从所执行文档包含的图像中提取文本,以及在所提取的文本上执行所选择的操作。
所述的方法可以进一步包括接收第一选择信号以选择从中提取文本的图像,其中,文本的提取可以包括从对应于所选择图像的输入第一选择信号的图像中提取文本。
所述的方法可以进一步包括接收所选择图像操作的第二选择信号,其中,所选择操作的执行包括执行对应于在所提取文本上操作的第二选择信号的所选择的操作。
文本的提取可以包括利用图像中的色差来提取文本。文本的提取可以包括通过使用光学字符识别(OCR)引擎来提取文本。
在文本上所要执行的操作可以至少是存储操作、打印操作、复制操作和翻译操作之一。
本发明一般概念的前述和/或其它的方面也可以通过提供包含提取文本的可执行代码的计算机可读介质来获得,所述的介质包括执行某个文档的可执行代码,从所执行文档包含的图像中提取文本的可执行代码,以及在所提取文本上执行所选择操作的可执行代码。
本发明一般概念的前述和/或其他的方面也可以通过提供图像形成装置网络来获得,所述的网络包括带有应用程序的主机设备,该应用程序在主机设备上运行以将属于图像一部分的文本提取成文本格式;以及与主机设备通信的图像形成装置,该装置以文本格式接收与所提取文本相关的打印数据并打印所提取文本。


通过结合附图对实施例的以下描述,本发明一般概念的这些和/或其它方面将变得显而易见而且更加容易理解,附图中图1为根据本发明一般概念实施例的带有文本提取功能的主机设备的方框图;图2为图1的应用程序的功能的视图;以及图3为根据本发明一般概念实施例的文本提取方法的流程图。
具体实施例方式
现将给出本发明一般概念的实施例的详细参考,附图中示出了本发明一般概念实施例的若干实例,其中,类似的参考数字在全文中指类似的元素。所述的实施例被描述如下以便参考附图解释本发明的一般概念。为简明清晰起见,以下描述中省略了本领域技术人员应当知道的功能和配置的详细描述。
图1为根据本发明一般概念的实施例的带有文本提取功能的主机设备100的方框图。
参考图1,根据本发明一般概念的实施例的带有文本提取功能的主机设备100包括应用程序110、存储部分120、图形设备接口(GDI)130、图像形成设备驱动部分140、显示设备驱动部分150、图像形成设备接口部分160和显示设备接口部分170。
应用程序110是安装在主机设备100中的普通应用程序,它根据用户操作产生新文档,或者执行用户选择的文档。换句话说,应用程序110可由一个或多个用户输入进行操作以创建、编辑、或查看各种类型的文档和文件。
应用程序110可以是网页浏览器、翻译程序、和文档编制程序之一。如果应用程序110为网页浏览器,应用程序110执行用户所连接网站的网页并给用户提供所述的网页。翻译程序可以将所提取的文本从一种语言(如,韩语)翻译成另一种语言(如,英语)。
应用程序110从所述文档内的图像中提取文本,并在所提取的文本上执行某种操作。为此,应用程序110包括用户接口部分112、文本提取部分114、和文本处理部分116。换句话说,作为图像一部分出现的文本(即,图像化文本)能够被提取为非图像格式的文本。应用程序110可以将所述图像中的图像化文本识别为字母。例如,应用程序110能够从*.JPEG图像(或其它图像格式)中提取图像文本并提供ASCII代码。这样,不需提供典型地要求更多信息来表示图像化文本的图像数据,所提取的文本能够利用ASCII字符所用的比特组合来表示。
用户接口部分112提供用户和主机设备100之间的接口。在本实施例中,所述的用户接口部分112输入表示从中提取文本的图像的第一选择信号,以及表示在从所选择的图像中提取的文本上所执行的操作的第二选择信号。
用户接口部分112提供一个显示可选择的操作(即,作业)的菜单,以便用户能选择对文本执行的操作(即,作业)。用户接口部分112所提供的菜单可以包括“存储图像中包含的文本”(即,存储文本功能),“打印图像中包含的文本”(即,打印文本功能),“复制图像中包含的文本”(即,复制文本功能),以及“翻译图像中包含的文本”(翻译文本功能)。
如果用户通过用户接口部分112输入图像的第一选择信号,文本提取部分114从图像的输入第一选择信号所对应的图像中提取文本。
文本提取部分114可以包括提取图像中包含的文本的图像处理模块。所述的图像处理模块能够利用图像中的色差提取文本。
文本提取部分114可以是光学字符识别(OCR)引擎。OCR引擎将所述的图像或位图分成明亮部分和黑暗部分以分析明亮部分和黑暗部分。如果检测到文本字符,文本提取部分114能够通过将文本转换为ASCII代码来提取文本。
文本处理部分116执行用于对文本提取部分114所提取的文本执行操作的第二选择信号所对应的操作(即,作业)。所述操作的第二选择信号通过用户接口部分112被输入。文本处理部分116对文本所执行的操作包括存储、打印、复制和翻译,它们对应于用户接口部分112所提供的、显示用户可以选择的各种功能的菜单。
如果执行存储操作,文本处理部分116控制存储部分120来存储由文本提取部分114所提取的数据。
如果执行打印操作,文本处理部分116将文本提取部分114所提取的数据通过GDI 130提供给图像形成设备驱动部分140。
如果执行复制操作,文本处理部分116控制存储部分120暂时存储文本提取部分114所提取的数据。依赖于应用程序110所述的文本可以被存储到剪贴板。
如果执行翻译操作,文本处理部分116将文本提取部分114所提取的数据传送给翻译程序。此时,应用程序110可以是网页浏览器或文档编制程序,并且所述的翻译程序是存在于主机设备100内或者正在主机设备100上运行的程序。
存储部分120存储某些文档。所述的某些文档可以由应用程序110产生。如果应用程序110是网页浏览器,下载的图像可以被暂时存储到存储部分120。所述的图像从用户所连接的网站被下载以便从所述的网站提取文本。另外,如果所述的存储操作由文本处理部分116来执行,所述的存储部分120可以在文本处理部分116的控制下存储文本。
所述的GDI 130是一类操作系统(例如微软的视窗),它提供应用程序110和图像形成设备驱动部分140之间的接口,或者应用程序110和显示设备驱动部分150之间的接口。
换句话说,所述的GDI 130将从应用程序110发送的打印命令和打印数据发送给图像形成设备驱动部分140,将来自应用程序110的显示数据发送给显示设备驱动部分150。
所述的图像形成设备驱动部分140将从应用程序110通过GDI 130传送的打印命令和打印数据转换为图像形成设备200可读取的数据形式。
所述的显示设备驱动部分150将从应用程序110通过GDI 130传送的显示数据转换为显示设备300可读取的数据形式。显示数据可以包括应用程序110所执行的文档和用户接口部分112所提供的菜单。
所述的图像形成设备接口部分160提供主机设备100和图像形成设备200之间的接口,并且由图像形成设备驱动部分140将被转换成图像形成设备200可读取数据形式的数据传送给图像形成设备200。
所述的显示设备接口部分170提供主机设备100和显示设备300之间的接口,由显示设备驱动部分150将被转换成显示设备300可读取数据形式的数据传送给显示设备300。
所述的图像形成设备200为从主机设备100通过图像形成设备接口部分160接收的打印数据执行打印作业(操作)。在本实施例中,如果文本处理部分116所执行的操作是打印操作,图像形成设备200执行打印作业。
所述的显示设备300显示从主机设备100通过显示设备接口部分170传送的显示数据。在本实施例中,在显示设备300上所显示的显示数据包括应用程序110所执行(访问)的文档。
图2为图1的应用程序110的功能的视图。
参考图1和图2,将解释当应用程序110假定为网页浏览器时应用程序110的功能。用户通过网页浏览器连接到某个网站,并且所述的网页浏览器执行网站提供的文档以给用户提供所述的文档(即,相应的内容)。因此,用户能够对网页浏览器提供的文档执行操作,如复制操作、存储操作、打印操作、以及翻译操作。
如图2所示,提供给用户的文档包括文本和图像A,并且图像A可以包括图像化文本B。图像A中包含的图像化文本B以与图像A相同的方式被综合,因此,用户不能用传统的方法获得独立于图像A的图像化文本B。换句话说,图像化文本B是图像A的文件的一部分。
根据本发明一般概念的实施例,应用程序110的用户接口部分112提供用于为图像化文本B选择操作的菜单,例如,“存储图像中包含的文本”C(即,存储文本功能),“打印图像中包含的文本”D(即,打印文本功能),“复制图像中包含的文本”E(即,复制文本功能),以及“翻译图像中包含的文本”F(即,翻译文本功能)。用户接口部分112也可以包括一个或多个其它的一般菜单。
如果用户选择从中提取文本的图像A,用户接口部分112给用户提供选择想要的操作的菜单,包括提供用于为图像化文本B选择操作的菜单。因此,用户可为图像A中包含的图像化文本B选择诸如存储操作、打印操作、复制操作和翻译操作的操作之一。
用户可借助应用程序110的文本提取部分114和文本处理部分116为图像化文本B选择作业以获得图像A中包含的图像化文本B。
图3为根据本发明一般概念的实施例的文本提取方法的流程图。图3所述的方法可以被图1的主机设备100执行。因此,为了说明方便,将参考图1到图3来解释根据本实施例的文本提取方法。
应用程序110执行用户选择的文档。例如,如果应用程序110是网页浏览器,则网页浏览器与用户输入的网站地址的网站相连并且执行网站提供的文档(操作S400)。
如果用户仅希望使用由应用程序110提供的文档所包含的图像A中的图像化文本B,则用户选择从中提取文本的图像A(操作S410)。
如果用户选择从中提取文本的图像A,则应用程序110通过用户接口部分112为选择针对图像化文本B的操作提供所述的菜单C、D、E和F(操作S420)。例如,所述的菜单可以被显示以响应图像A的选择。
如果提供了如图2所示的菜单C、D、E和F,则用户能够选择针对图像化文本B的想要的操作。当用户选择针对从中提取文本的图像A以及图像化文本B的想要的操作时,图像和操作(即,作业)的第一和第二选择信号通过用户接口部分112被输入应用程序110(操作S430)。
应用程序110的文本提取部分114从所述的图像A中提取文本(操作S440)。如果文本提取部分114从图像A中提取了文本,则文本处理部分116执行与用户所选择操作的第二选择信号对应的操作(操作S450)。
已经解释了当应用程序110是网页浏览器时提取文本的方法。然而,这不应当被认为是对本发明一般概念的范围的限制。所述的应用程序110可以是其它的文档创建/编辑/查看程序,如一般的文档编制程序或翻译程序。
如果应用程序110是翻译程序,应用程序110的文本提取部分114提取图像化文本B,并且文本处理部分116允许翻译模块对所提取的文本进行翻译,以便能够翻译包含在文档中的所有文本。
另外,所述的应用程序110可以是被嵌入到网页浏览器中执行的翻译程序。所述的翻译程序可以随着通过网页浏览器打开的文档一起被执行,或者可先执行所述的翻译程序,再通过网页浏览器打开文档。
就是说,根据本发明一般概念的实施例,应用程序110可以被外加到各种程序,如网页浏览器、文档编制程序、翻译程序,并且能够根据用户输入对文档中包含的文本执行诸如编辑和翻译的操作。或者,应用程序110可以被预先设置以自动执行一个或多个操作。例如,所述的网页浏览器可以被预先设置以在所选择图像中提取文本并自动保存所提取文本的拷贝和/或自动将所提取文本的拷贝翻译成另一种语言。
本发明一般概念的实施例可以被具体化为计算机可读记录介质上的计算机可读代码。所述的计算机可读记录介质可以包括任何能存储此后被计算机系统读取的数据的数据存储设备。计算机可读记录介质的实例包括只读存储器(ROM)、随机访问存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储设备、以及载波(例如通过互联网的数据传输)。所述的计算机可读记录介质也可以分布在与计算机系统相连的网络上,以便计算机可读记录介质以分布的方式被存储和执行。本发明一般概念的实施例也可以在硬件中或在软件和硬件的结合中被具体化。
根据本发明一般概念的实施例,带有文本提取功能的主机设备以及文本提取的方法通过一个应用程序提取包含在图像中的文本并且执行某些操作以便用户能获得包含在文档中的所有文本。另外,所述的主机设备从图像中提取文本并将所提取的文本提供给用户以便能够减少由不必要的图像打印所造成的墨水消耗。因此,打印速度也可以提高。
虽然以文中的某些实施例为参考已经展示和描述了本发明一般概念,但本领域的技术人员应当理解,在不脱离由所附权利要求书所限定的本发明一般概念的精神和范围的情况下,可以在形式和细节上对实施例进行修改。
权利要求
1.一个装有至少一个带文本提取功能以执行某个文档的应用程序的主机设备,所述的至少一个应用程序包括用户接口部分,用于输入选择信号以选择对包含在所执行文档中的图像所执行的操作;文本提取部分,用于从图像中提取文档;以及文本处理部分,用于对所提取的文本执行所选择的操作。
2.如权利要求1所述的设备,其中,所述的用户接口部分接收第二选择信号以选择从中提取文本的图像,以及所述的文本提取部分从所选择的图像中提取文本。
3.如权利要求1所述的设备,其中,所述的文本提取部分利用图像中的色差来提取文本。
4.如权利要求1所述的设备,所述的文本提取部分是光学字符识别引擎OCR。
5.如权利要求1所述的设备,其中,所选择的对文本所执行的操作是存储操作、打印操作、复制操作以及翻译操作中的至少之一。
6.如权利要求5所述的设备,其中,如果执行翻译操作,所述的文本处理部分提供翻译程序以对所提取的文本进行翻译。
7.如权利要求1所述的设备,其中,用户接口部分提供一个其上显示可选择操作的菜单,使用户能够选择对所提取的文本所执行的操作。
8.如权利要求1所述的设备,其中,所述的应用程序是网页浏览器、翻译程序和文档编制程序之一。
9.一个在图像形成系统上可执行的应用程序,所述的程序包括文本提取部分,用于将作为图像一部分的、图像格式的文本条目转换成文本格式;以及处理部分,使得以文本的格式在所转换的文本条目上能够执行一个或多个操作。
10.如权利要求9所述的程序,其中,所述的文本格式包括ASCII代码。
11.如权利要求9所述的程序,其中,所述的图像格式的文本条目基本大于文本格式的所转换的文本条目。
12.如权利要求9所述的程序,其中,所述的文本提取部分接收来自网页的文本条目。
13.如权利要求9所述的程序,其中,所述的处理部分包括以文本格式将所转换的文本条目从第一种语言翻译成第二种语言的翻译程序。
14.如权利要求9所述的程序,其中,所述的文本提取部分包括将图像分为明亮部分和黑暗部分以对明亮部分和黑暗部分进行分析的OCR引擎。
15.如权利要求9所述的程序,进一步包括用户接口部分,用于接收从多个图像中选择其中的文本条目被转换为文本格式的图像的第一选择信号,以及指示在所转换的文本条目上所要执行的一个或多个操作的第二选择信号。
16.如权利要求9所述的程序,其中,所述的一个或多个操作包括存储文本操作,用于在主机设备内本地存储所转换的无图像的文本条目;复制文本操作,用于复制所转换的无图像的文本条目;以及打印文本操作,用于打印所转换的无图像的文本条目;翻译文本操作,用于翻译所转换的文本条目。
17.如权利要求9所述的程序,其中,所述的处理部分被设置在所转换的文本条目上自动执行所述的一个或多个操作。
18.一种提取文本的方法,所述的方法包括执行某个文档;从所执行文档所包含的图像中提取文本;以及在所提取文本上执行所选择的操作。
19.如权利要求18所述的方法,进一步包括接收第一选择信号以选择从中提取文本的图像,其中,文本提取包括从与所选择图像的输入第一选择信号对应的图像中提取文本。
20.如权利要求18所述的方法,进一步包括接收针对所述图像的所选择操作的第二选择信号,其中,所选择操作的执行包括执行与针对所提取文本的操作的第二选择信号对应的所选择的操作。
21.如权利要求18所述的方法,其中,所述的文本提取包括利用图像中的色差提取文本。
22.如权利要求18所述的方法,其中,所述的文本提取包括利用光学字符识别OCR引擎提取文本。
23.如权利要求18所述的方法,其中,在文本上所执行的操作是存储操作、打印操作、复制操作以及翻译操作中的至少之一。
24.一种包含提取文本的可执行代码的计算机可读取介质,所述的介质包括执行某个文档的可执行代码;从所执行文档中包含的图像中提取文本的可执行代码;以及在所提取的文本上执行所选择的操作的可执行代码。
25.一种图像形成系统网络,所述的网络包括主机设备,装有在其上运行的将作为图像一部分的文本提取成文本格式的应用程序;以及图像形成装置,与主机设备通信以接收对应于文本格式的所提取文本的打印数据并打印所提取文本。
全文摘要
一种带有文本提取功能的主机设备及其相应的文本提取方法。所述的主机设备有至少一个带有文本提取功能并执行某个文档的应用程序,所述的应用程序包括用于输入选择信号以选择在所执行文档所包含的图像上所执行的操作的用户接口部分,用于从图像中提取文本的文本提取部分,以及用于为所提取文本执行所选择操作的文本处理部分。因此,用户能够获得文档所包含的所有文本。
文档编号G06K9/20GK1932802SQ20061015153
公开日2007年3月21日 申请日期2006年9月11日 优先权日2005年9月16日
发明者金炅玉 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1