组合的图像与文本文档的制作方法

文档序号:7738373阅读:352来源:国知局
专利名称:组合的图像与文本文档的制作方法
组合的图像与文本文档
背景技术
打印的或其它纸质文档可以扫描为图像以及存储为电子文档。文档的扫描图像提供诸如文档的文本、手写笔记、书写的签名、水印和/或其它可见的标记之类的文档内容的精确的可见的表示。然而,在扫描图像中的文档的文本不能进行搜索、选择和/或复制。光学字符识别(OCR)技术典型地被利用来把来自原始文档的文档文本、或在扫描图像中的文档文本转换成可编辑的文本表示,它使得该文本能够被搜索、选择和/或复制。 然而,文档文本的文本表示典型地作为文本文件被生成,它不保持原始文档的可见的外观或表示。例如,当文档的文本文件被生成时,诸如原始文档的格式、布局和人工痕迹那样的原始文档特征,以及手写笔记、书写的签名、水印和/或其它可见的标记不被保持。

发明内容
本发明内容被提供来介绍组合的图像和文本文档的简化的概念。该简化的概念在下面在具体实施方式
中被进一步描述。本发明内容不打算标识请求保护的主题的必要特征,也不打算用于确定请求保护的主题的范围。描述了组合的图像与文本文档。在实施例中,通过利用扫描应用可以生成文档的扫描图像,通过利用字符识别应用可以生成被包括在文档中的文本的文本表示。文本表示的位置数据可以与在文档的扫描图像中的对应文本的位置相关联。在扫描图像与文本表示是用户可独立地选择用于显示的情况下,扫描图像然后可以被再现,以便与作为透明覆层的文本表示相重叠地显示。用户可选择的输入可以被接收,以便显示不带有扫描图像的文本表示、不带有文本表示的扫描图像、或显示与扫描图像相邻的文本表示。在组合的图像与文本文档的其它实施例中,可以生成标记(markup)文档,其包括文本表示、相关联的显示对准信息、和对用于显示的扫描图像的参考。选择的文本可以从文本表示中搜索,所选择文本的透明覆层可以被加亮,以便显示在扫描图像中的对应文本被加亮的外观。在替换的实施例中,文本表示可以被再现为可见覆层,用于显示在扫描图像上,以便图示文本表示与扫描图像中的对应文本的比较,该比较反映字符识别应用的精确度。另外,扫描图像可以以第一颜色被显示,其同以与第一颜色形成对比的第二颜色被显示的文本表示重叠,从而进一步图示文本表示与在扫描图像中的对应文本的比较。


参照以下的附图描述组合的图像与文本文档的实施例。相同的标号被贯穿各图使用,以指代相同的特征和部件
图1图示可以实施组合的图像与文本文档的实施例的示例的系统; 图2图示按照一个或多个实施例的示例的组合的图像与文本文档; 图3图示按照一个或多个实施例的用于组合的图像与文本文档的示例的方法; 图4图示按照一个或多个实施例的用于组合的图像与文本文档的示例的方法; 图5图示可以实施组合的图像与文本文档的实施例的示例的设备的各种部件。
具体实施例方式组合的图像与文本文档的实施例提供文档可被扫描来生成文档的扫描图像。然后可以从原始的文档或从扫描图像生成被包括在文档中的文本的文本表示。可以生成标记文档,其包括被包含在原始文档中的文本的文本表示,相关联的显示对准信息、和对于扫描图像的参考。然后可以显示扫描图像,并与作为扫描图像的透明覆层的文本表示重叠。在实施例中,所选择的文本可以在文本表示中进行搜索,和/或在标记文档中进行搜索,以及可以加亮所选择文本的透明覆层,以便显示在扫描图像中的对应文本被加亮的外观。扫描图像与文本表示也可以是用户可独立地选择用于显示的。例如,用户可以发起用户输入,以在显示器上显示与扫描图像相邻的文本表示,这样,扫描图像和文本表示是可并排地观看的。替换地,用户可以选择仅仅显示文本表示而不带有扫描图像,或仅仅显示扫描图像而不带有文本表示。虽然所描述的用于组合的图像与文本文档的系统和方法的特征和构思可以在任何数目的不同的环境、系统、和/或各种配置下被实施,但组合的图像与文本文档的实施例是在以下的示例的系统和环境的情境中进行描述的。图1图示可以实施组合的图像与文本文档的各种实施例的示例的系统100。示例的系统100是文档表示系统,它包括示例的文档102、可被实施来处理文档的设备104、以及显示设备106。示例的文档102包括文本108、手写的签名110、手写的笔记112、和图像 114。示例的文档还可以包括水印、页码、多个页、和/或其它可见的标记。设备104可被实施为包括扫描和复制文档的文档处理特征的计算机设备。替换地或此外,设备104可被连接到扫描、复制和/或另外管理和处理文档的多功能设备或独立的设备。设备104可以利用处理器、通信部件、数据输入装置、存储器部件、处理与控制电路、 和内容再现系统来实施。设备104还可以利用如参照图5所示的示例设备所描述的任何数目的不同部件和这些部件的组合来实施。设备104也可以与操作设备的用户(即,个人) 和/或实体相关联,使得设备描述包括用户、软件和/或设备的组合的逻辑设备。在本例中,设备104包括一个或多个处理器116 (例如,任何的微处理器、控制器等等),它处理各种计算机可执行的指令来实施组合的图像与文本文档的实施例。替换地或此外,设备104可以用硬件、固件、或结合处理与控制电路被实施的固定逻辑电路的任一项或它们的组合来实施。虽然未示出,但设备104可包括耦合设备内的各种部件,或耦合到其它设备的系统总线或数据传送系统。设备104还可以包括通信接口,其可被实施为串行和 /或并行接口、无线接口、任何类型的网络接口、调制解调器、和/或任何其它类型的通信接口。通信接口提供设备104与通信网络(例如,LAN, WLAN)和/或其它文档处理设备之间的连接和/或通信链路。客户设备104还可包括设备管理器118(例如,控制应用、软件应用、信号处理与控制模块、对于特定设备的本机码、对于特定设备的硬件抽象层等等)。客户设备104还包括再现系统120,该再现系统可被实施来再现扫描图像、文本表示、和/或用户接口,以用于在显示设备106上显示,以便实施组合的图像与文本文档的实施例。设备104还包括存储介质122,用于存储或另外保存各种数据与信息。存储介质 122可被实施为任何类型的存储器、磁盘或光盘存储装置、和/或其它适当的电子数据存储装置。存储介质122也可指或被实施为计算机可读的介质,诸如一个或多个存储器部件,它们提供用来存储各种设备应用1 和任何其它类型的信息和/或与设备104的运行方面有关的数据的数据存储机制。例如,操作系统和/或软件模块和部件可以利用存储介质122 作为计算机应用被保存,并在处理器116上被执行。设备104包括字符识别应用126、扫描应用128、和显示应用130,每个可以被实施为计算机可执行的指令,并且由处理器116执行,以便实施组合的图像与文本文档的实施例。字符识别应用126、扫描应用128、和显示应用130是设备应用124的例子,它们可以被存储介质122保存。虽然被图示和被描述为设备104的应用,但设备应用以及用来实施这里描述的各种实施例的其它功能可作为服务或作为与设备104分开的设备被提供(例如, 在分开的设备上或通过第三方服务被提供)。扫描应用1 可被实施来扫描文档和生成扫描图像132,该扫描图像可利用在设备104处的存储介质122来保存。例如,扫描应用1 可以扫描文档102,和生成文档的扫描图像134,如在显示设备106上显示的。扫描图像可以以任何可应用的格式被生成,以及可以利用压缩方案,诸如TIFF, FAX G3/G4, PNG, JPEG, MRC, XPS, PDF等等。字符识别应用1 可被实施来扫描文档和生成被包括在文档中的文本的文本表示136。例如,字符识别应用1 可以扫描文档102和生成被包括在文档102中的文本108 的文本表示138,如在显示设备106上显示的。文本表示可以通过利用任何可应用的光学字符识别(OCR)技术或算法而被生成。在本例中,文本表示138与扫描图像134相邻地被显示在显示设备106上。在实施例中,扫描图像Π4和文本表示138是用户可独立地选择用于显示的。显示应用130可以接收在设备104处的用户可选择的输入,以发起与扫描图像134相邻的文本表示138的显示,使得扫描图像与文本表示可并排地观看。替换地,显示应用130可以接收在设备104 处的用户可选择的输入,以发起不带有扫描图像的文本表示138的显示,或不带有文本表示的扫描图像134的显示。字符识别应用1 也可以被实施成当生成文本表示用于显示时, 将文本表示138的位置数据与在文档102的扫描图像134中对应的原始文本108的位置进行相关。显示应用130可被实施成与再现系统120进行相关,以便管理扫描图像与文本表示在显示设备106上的显示。显示应用130还可被实施成生成标记文档140,其包括文本表示138、相关联的显示对准信息、和对于扫描图像134的参考。标记文档140可以被实施为基于XML的标记,或以描述用于在显示设备106上显示的页的任何其它可应用的格式。在实施例中,标记文档可包括表示用于显示的扫描图像134和文本表示138的数据。在实施方案中,标记文档140和包含扫描图像134与标记文档140的文档包可以在扫描设备上直接生成和/或利用扫描应用1 而生成。对于在本例中的扫描图像134与文本表示138的标记文档140的例子可包括
权利要求
1.一种方法(300),包括利用扫描应用(128)生成(302)文档(102)的扫描图像(134);利用字符识别应用(126)生成(304)被包括在文档(10 中的文本(108)的文本表示 (138);将文本表示(138)的位置数据与在文档(10 的扫描图像(134)中对应文本的位置进行相关(306);以及再现(310)扫描图像(134),以便与作为透明覆层O02)的文本表示(138)相重叠地显示,扫描图像(134)与文本表示(138)是用户可独立地选择用于显示的。
2.如在权利要求1中所述的方法,还包括生成标记文档,其包括文本表示、相关联的显示对准信息、和对用于显示的扫描图像的参考。
3.如在权利要求1中所述的方法,还包括接收用户可选择的输入,以便显示不带有扫描图像的文本表示或不带有文本表示的扫描图像中的至少一项。
4.如在权利要求1中所述的方法,还包括接收用户可选择的输入,以便显示与扫描图像相邻的文本表示。
5.如在权利要求1中所述的方法,还包括再现作为用于在扫描图像上显示的可见覆层的文本表示,以便说明文本表示与在扫描图像中的对应文本的比较,其反映字符识别应用的精确度。
6.如在权利要求5中所述的方法,其中扫描图像以第一颜色被显示,其同以与第一颜色形成对比的第二颜色被显示的文本表示重叠,以进一步说明文本表示与在扫描图像中的对应文本的比较。
7.如在权利要求5中所述的方法,还包括接收用户可选择的输入,以便显示不带有扫描图像的文本表示或不带有作为可见覆层的文本表示的扫描图像中的至少一项。
8.如在权利要求1中所述的方法,还包括在以透明的颜色被显示在扫描图像上的文本表示中,搜索所选择的文本;以及加亮所选择的文本的透明覆层,以便显示在扫描图像中的对应文本被加亮的外观。
9.一种文档表示系统(100),包括由扫描应用(128)生成的文档(102)的扫描图像(134);字符识别应用(126),被配置成生成被包括在文档(10 中的文本(108)的文本表示 (138),和将文本表示(138)的位置数据与在文档(102)的扫描图像(134)中的对应文本的位置进行相关;以及显示应用(130),被配置成发起扫描图像(134)与作为透明覆层(20 的文本表示 (138)相重叠的显示,扫描图像(134)与文本表示(138)是用户可独立地选择用于显示的。
10.如在权利要求9中所述的文档表示系统,其中显示应用还被配置成生成标记文档, 其包括文本表示、相关联的显示对准信息、和对用于显示的扫描图像的参考。
11.如在权利要求9中所述的文档表示系统,其中显示应用还被配置成接收用户可选择的输入,以发起不带有扫描图像的文本表示,或不带有文本表示的扫描图像中的至少一项的显示。
12.如在权利要求9中所述的文档表示系统,其中显示应用还被配置成接收用户可选择的输入,以便发起与扫描图像相邻的文本表示的显示。
13.如在权利要求9中所述的文档表示系统,其中显示应用还被配置成发起作为用于在扫描图像上显示的可见覆层的文本表示的显示,以便说明文本表示与在扫描图像中的对应文本的比较,其反映字符识别应用的精确度。
14.如在权利要求13中所述的文档表示系统,其中显示应用还被配置成发起扫描图像以第一颜色的显示,其同以与第一颜色形成对比的第二颜色被显示的文本表示重叠,从而进一步说明文本表示与在扫描图像中的对应文本的比较。
15.如在权利要求9中所述的文档表示系统,其中显示应用还被配置成 接收对于所选择的文本的文本搜索请求;在以透明的颜色被显示在扫描图像上的文本表示中发起对于所选择的文本的搜索;以及加亮所选择的文本的透明覆层,以便显示在扫描图像中的对应文本被加亮的外观。
全文摘要
描述了组合的图像与文本文档。在实施例中,通过利用扫描应用可以生成文档的扫描图像,通过利用字符识别应用可以生成被包括在文档中的文本的文本表示。文本表示的位置数据可以与在文档的扫描图像中的对应文本的位置相关联。在扫描图像与文本表示是用户可独立地选择用于显示的情况下,扫描图像然后可以被再现用于与作为透明覆层的文本表示相重叠地显示。用户可选择的输入可以被接收,以便显示不带有扫描图像的文本表示、不带有文本表示的扫描图像、或显示与扫描图像相邻的文本表示。
文档编号H04N1/387GK102273186SQ200980154158
公开日2011年12月7日 申请日期2009年12月3日 优先权日2009年1月8日
发明者J. 米歇利斯 A., H. 费尔 O. 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1