根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置的制作方法

文档序号:6469964阅读:398来源:国知局
专利名称:根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置的制作方法
相关申请本申请要求2000年5月1日提交的美国临时申请序列号60/201570的优先权。
背景阅读诸如书或杂志文章等印刷出版物的人可能想要有关某个主题的更多信息。一般来说,想要在因特网上寻找信息的人们使用搜索引擎。搜索引擎允许用户对包含感兴趣信息的网页进行关键词搜索。但是,这种搜索经常是失败的。在搜索引擎搜集了可能网站的长列表之后,搜索人必须手动地在各页之间搜索信息。此过程是耗时的。另外,传统的万维网搜索并不包括印刷出版物的搜索。
经常将阅读印刷出版物的人们引导到特定网页,在那里可以找到特别按作者或出版商选择的更多信息。达到这个目的的一种方法是在印刷出版物中印刷统一资源定位器(URL)(如www.publisher.com/booktitle/moreinfo)。将读者引导到网页的另一种机制是在印刷出版物上印刷条形码。然后,读者扫描这种条形码,同时相关软件将连接计算机引导到适当的网页。但是,在印刷出版物中放置大量的URL和/或条形码将分散读者的注意力,另外浪费了印刷出版物中为内容保留的空间。另外,键入长的URL是很麻烦的,并且许多人没有连接到他们的计算机的条形码阅读器。
在一个实施例中,从客户机设备接收搜索查询的步骤包括接收数字图像的步骤。在一些实施例中,从客户机设备接收搜索查询的步骤包括接收从数字图像得到文字的步骤。
根据本发明的另一方面,提供了一种根据印刷出版物向客户机设备提供网页的方法。该方法包括从印刷数据生成搜索索引的步骤。印刷数据最好表示印刷出版物,而搜索索引最好从逻辑上将印刷出版物中的多个词和/或短语中的每一个与每个这样的词或短语在印刷出版物中出现的一个或多个页码关联。该方法还包括从授权出版商接收多个页码链接的步骤。每个页码链接最好从逻辑上将印刷出版物中的特定页与网络地址关联。更进一步,该方法包括经网络从客户机设备接收出版物查询的步骤。出版物查询可包括出版物标识符以及搜索项。更进一步,该方法包括根据搜索索引,使出版物查询与印刷出版物的目标页码相关的步骤。该方法还包括根据目标页码从多个页码链接检索目标网络地址,以及经网络将与目标网络地址有关的数据发送到客户机设备的步骤。
在一个实施例中,从印刷数据生成搜索索引的步骤包括在与印刷出版物相关的印刷过程中,从印刷数据生成搜索索引的步骤。在另一实施例中,从印刷数据生成搜索索引的步骤包括光扫描印刷出版物以产生多个数字化页面,以及在数字化页面上进行字符识别过程的步骤。在一个实施例中,从印刷数据生成搜索索引的步骤包括根据与某个词相关的可视指示符,选择该词以包括在多个词中的步骤。在这种情况下,选择词以包括在多个词中的步骤可包括根据至少字体、字形、字号、图形指示符、图标以及与该词相关的边框来选择词的步骤。
在另一实施例中,存储多个页码链接的步骤包括存储章链接的步骤。在这种情况下,章链接最好从逻辑上将印刷出版物中的一组连续页与网络地址关联。章链接最好以比特定页码链接低的优先次序存储。类似的,存储多个页码链接的步骤可包括存储出版物标题链接的步骤。在这种情况下,出版物标题链接最好从逻辑上将印刷出版物中的所有页与网络地址关联。出版物标题链接最好以比任何章链接低的优先次序存储。更进一步,存储多个页码链接的步骤可包括存储出版商链接的步骤。在这种情况下,出版商链接最好从逻辑上将第一印刷出版物中的所有页和第二印刷出版物中的所有页与网络地址关联。出版商链接最好以比任何出版物标题链接低的优先次序存储。
在一个实施例中,从客户机设备接收出版物查询的步骤包括接收出版物标题、页码、注册短语以及外语指示符中的至少一个的步骤。在一个实施例中,发送与目标网络地址有关的数据的步骤包括发送重定向消息、网页数据、超级链接数据以及第二印刷出版物的数字版本中至少一个的步骤。
另外根据本发明的另一方面,提供了一种根据印刷出版物向客户机设备提供网页的装置。该装置包括存储设备,它存储在从印刷出版物相关的印刷过程期间使用的印刷数据生成的搜索索引。印刷数据最好表示印刷出版物。存储设备还存储多个链接。每个链接最好从逻辑上将来自搜索索引的索引项与网络地址关联。该装置还包括网络接收器,它被配置为经网络从客户机设备接收查询;以及网络发送器,它被配置为经网络将与目标网络地址相关的数据发送到客户机设备。更进一步,该装置包括控制器,它在工作时耦合到存储设备、网络接收器以及网络发送器。控制器最好被配置为根据搜索索引以及多个链接使查询与目标网络地址相关。控制器最好还被配置为使网络发送器经网络将与目标网络地址相关的数据发送到客户机设备,以响应于查询。
在一个实施例中,该装置还包括光扫描仪,它被配置为将印刷出版物转换为位图;以及光学字符识别系统,它被配置为将位图转换为印刷数据。


图1是说明用于本发明的例示环境的通信系统的高级框图。
图2是图1所示的客户机设备之一的更详细框图。
图3是示意图1所示的出版物链接服务器的一个实施例的更详细框图。
图4是示意图1所示的出版物链接服务器的另一实施例的更详细框图。
图5是程序的流程图,该程序被配置为使嵌入在图1的出版物链接服务器中的微处理器创建搜索索引和链接数据库。
图6是另一程序的流程图,该程序被配置为使其能够使嵌入在图1的出版物链接服务器中的微处理器根据印刷出版物,将客户机设备引导到网页。
图7是说明两个例示出版物链接的表,其中包括出版物命中规范以及相关网络地址。
优选实施例详述一般来说,本文中描述的系统生成与来自不同出版商的多个印刷出版物相关的搜索索引和超级链接数据库。搜索索引包括来自印刷出版物的多个词和/或短语。搜索索引最好根据从相关出版商收到的印刷数据。超级链接数据库从逻辑上将出版物命中规范与网络地址关联。出版物命中规范标识印刷数据的一部分。例如,出版物命中规范可以是数据记录,它按国际标准图书编号(ISBN)对书进行识别,按页码识别书中的一页或多页,按词的文本识别书中的一个或多个词。网络地址最好指向网页。超级链接数据库根据从出版商授权的管理员那里收到的网络地址(如由内容创作者和/或版权所有者提供了口令的人)。随后,系统能够通过利用搜索索引以及超级链接数据库使收到的查询与网络地址相关,将客户机设备引导到特定网页,以响应于从客户机设备收到的搜索查询。
图1中示意了能够采用本发明的内容的例示通信系统100的高级框图。一般来说,系统100包括一个或多个客户机设备102、一个或多个出版物链接服务器104、一个或多个网页服务器106、一个或多个出版商服务器107以及索引器120。这些设备中的每一个可以经因特网或某种其它广域网108的连接互相进行通信。
一般来说,出版物链接服务器104存储由客户机设备120使用的多个文件、程序和/或网页。一个出版物链接服务器104可处理来自大量客户机102的信息。因此,出版物链接服务器104一般是具有大存储容量、一个或多个快速微处理器以及一个或多个高速网络连接的高端计算机。相反地,相对与典型的服务器104,各个客户机设备102一般包括较低存储容量、单个微处理器以及单个网络连接。
一个或多个SQL(结构化查询语言)服务器110最好与出版物链接服务器104进行通信。SQL服务器110最好至少包括搜索索引110a、链接数据库110b以及人口统计数据库110c。搜索索引110a包括来自印刷出版物的多个词和/或短语。如本文所使用的,术语“印刷出版物”指的是任何类型的印刷出版物,比如书、杂志、论文集、小册子等。索引词或和短语最好从逻辑上与这些词和/或短语在印刷出版物中出现的一个或多个页码关联。搜索索引110a最好由索引器120从印刷数据112中生成。印刷数据112是表示印刷出版物的数据。例如,印刷数据112可以是在与出版物相关的印刷过程114期间使用的数据。以这种方式,在印刷过程114期间,可以自动生成一些或所有的搜索索引110a。但是,本领域的普通技术人员将容易地理解,可以在使用印刷数据112生成印刷出版物之前和/或之后生成搜索索引110a。类似的,可以使用任何类型的计算机可读媒体和/或网络以将印刷数据112发送到索引器120,其中可以有或没有相关印刷过程114。或者,通过光扫描仪116可以使现有出版物数字化,并且可由光学字符识别过程118以众所周知的方法进行处理。这个备选方法对于绝版的出版物特别有用。
可以根据任何已知的索引标准来选择从印刷数据112提取的词和短语。例如,可以选择某些预定关键词。每个出版物中的所有词最好全部是带索引的。但是,可以从索引中去掉某些诸如“is(是)”、“and(和)”、“but(但是)”、“or(或)”、“the(该)”、“a(一个)”等高频率出现的词。在一个实施例中,由一个或多个标记表示印刷数据112中的关键短语。标记可以在印刷出版物印刷时使可视表示与短语相关。另外,标记可被用于标记词或短语,从而表示该词或短语应该被包括在搜索索引110a中。例如,可以为搜索索引110a中的每个短语或词建立一个或多个属性(如字体属性、图形属性和/或不可见属性)。字体属性包括但不限于,字体(如Arial、Courier、Times等)、字形(如斜体字、反向斜体字、带下划线的粗体等)和/或字号(如10号、12号等)。图形属性包括但不限于,图标、符号、图片和/或边框。例如,可以将短语放在边框中或图标旁边。不可见属性可以是诸如元标记的任何类型的已知嵌入码。如下所述,通过使用诸如字体属性和图形属性等可见属性,可以可见地通知出版物的读者,加亮短语可能被用作“出版物链接”。在一个实施例中,标记包括超文本标记语言(HTML)标记。例如,可移植文档格式(PDF)文件可能明确地包括超级链接。
链接数据库110b最好包括多个出版物链接(见图7)。每个出版物链接从逻辑上将一个或多个出版物命中规范与诸如因特网地址(如URL)的网络地址关联。出版物命中规范标识印刷数据的一部分。例如,出版物命中规范可以是数据记录,它通过国际标准图书编号(ISBN)识别书、通过页码识别书中的一页或多页、以及通过词中的文本识别书中的一个或多个词。当然,本领域的普通技术人员将容易地理解,可以在出版物命中规范中使用标识任何出版物的任何部分的任何数据。例如,可以使用出版物类型、出版物标题、出版物日期等。网络地址可以是诸如因特网协议(IP)地址的任何类型的网络地址。网络地址最好指向位于网页服务器106上的网页。除词和页之外,印刷出版物的其它方面可以具有相关网络地址。例如,书的一章或多章、整本书和/或书的出版商可以具有相关的网络地址。
如果一个以上的网络地址从逻辑上与同一词或页关联,则建立优先次序。单独的页最好具有比章更高的优先级,而章具有比书更高的优先级,书又具有比出版商更高的优先级。例如,假设书A从逻辑上与地址A关联,书A的第一章从逻辑上与地址B关联,第一章的第一页从逻辑上与地址C关联,并且第一章的第二页没有单独与一个地址关联。第一页上的“命中”(下面进行详细描述)将用户引导到地址C,但是第二页上的命中将用户引导到地址B。类似的,如果书A中的某一页没有单独与一个地址关联,并且该页的章没有从逻辑上与一个地址关联,则将地址A(该地址从逻辑上与整本书关联)用作那页的命中。以这种方式,出版商能够为印刷出版物的每一页建立链接,并没有建立大量单个链接的负担。另一方面,如果需要,出版商能够创建页特有的链接。
图2中示意了客户机设备102的更详细框图。为了简化描述,在本描述中,个人计算机被用作例示客户机设备102。但是,本领域的普通技术人员将容易地理解,任何通信设备可被用作客户机102。例如,无线电话或个人数字助理(PDA)可以是客户机设备102。在一个实施例中,无线电话或PDA包括数字照相机。在本实施例中,搜索查询可以是页的数字图像。
客户机102包括控制器202,控制器202最好包括中央处理单元(CPU)204,CPU 204通过地址/数据总线206电耦合到存储设备208以及一个或多个接口电路210。CPU 204可以是诸如Intel PentiumTM处理器的任何类型的已知CPU。存储设备208最好包括易失性存储器和非易失性存储器。如下所述,存储设备208最好存储软件程序,它与出版物链接服务器104交互作用。该程序208可以由CPU 204以众所周知的方式执行。存储设备208还可以存储数字数据,这些数字数据表示从出版物链接服务器104检索的、和/或从网页服务器106检索的、和/或经输入设备212载入的文档、文件、程序、网页等。
可以使用任何类型的已知接口标准实现接口电路210,比如以太网和/或通用串行总线(USB)。可以将一个或多个输入设备212连接到一个或多个接口电路210,用于将数据和命令输入控制器202中。例如,输入设备212可以是键盘、数字照相机、鼠标、触摸屏、轨迹板、轨迹球、isopoint(同位点)和/或语音识别系统。
也可以经一个或多个接口电路210将一个或多个显示器、打印机和/或其它输出设备214连接到控制器202。显示器214可以是阴极射线管(CRT)、液晶显示器(LCD)或任何其它类型的显示器。显示器214生成在客户机102的操作期间生成的数据的可见显示。显示器214一般用于显示从出版物链接服务器104和/或网页服务器106收到的网页。可见显示可包括用于操作员输入、运行时间统计、计算值、检验数据等的提示。
客户机102还可以经与网络108的连接与其它设备交换数据。网络连接可以是任何类型的任何连接形式的修改,比如以太网连接、数字用户线(DSL)、电话线、同轴电缆、无线连接等。可以要求系统100的用户向出版物链接服务器104注册。在这种情况下,各用户可选择用户标识符以及激活业务可能需要的口令。可以使用嵌入在用户浏览器中的加密经因特网108传递用户标识符和口令。或者,可以由出版物链接服务器104分配用户标识符和/或口令。
图3示意了出版物链接服务器104的更详细框图。与客户机设备102类似,出版物链接服务器104中的控制器302最好包括中央处理单元(CPU)304,CPU 304通过地址/数据总线306电耦合到存储设备308和网络接口电路310。但是,服务器控制器302一般比客户机控制器更强大。另外,CPU 304可以是诸如Intel PentiumTM处理器的任何类型的已知CPU,并且存储设备308最好包括易失性存储器和非易失性存储器。存储设备308最好存储实现全部或部分以下所述的方法的软件程序。可以由CPU 304以众所周知的方式执行该程序。但是,可以手动或不使用出版物链接服务器104而执行下述在方法中所述的一些步骤。存储设备308和/或SQL服务器110也存储文件、程序、网页以及客户机设备102使用的其它数据。
出版物链接服务器104可以经到网络108的连接与其它设备交换数据。可以使用诸如以太网收发信机的任何数据收发信机实现网络接口电路310。网络108可以是诸如局域网(LAN)、广域网(WAN)和/或因特网的任何类型的网络。
图4中示意了出版物链接服务器104的另一实施例的更详细框图。在本实施例中,出版物链接服务器104包括多个互连模块402-410。模块中的一些可以由执行软件指令的微处理器和/或常规电子电路来实现。另外,本领域的普通技术人员将容易地理解,可以根据常规的设计约束条件组合或划分某些模块。
为了接收网页请求、购买请求、出版物连接、出版物命中规范、网络地址、网页链接、用户名称、口令、一般搜索查询、出版物特定查询(其中每一个最好包括出版物标识符和搜索项)以及其它数据,出版物链接服务器104包括网络接收器402。网络接收器402在工作时以众所周知的方式耦合到网络108。例如,网络接收器402可以是以太网接口电路,该电路经以太网电缆电耦合到因特网。
为了发送与“目标”网络地址相关的数据(即响应查询而最后选择的网络地址),出版物链接服务器104包括网络发送器404。发送数据可包括一个或多个网页、超级链接、重定向消息、数字出版物和/或其它数据。网络发送器404在工作时以众所周知的方式耦合到网络108。例如,网络发送器404还可以是以太网接口电路,该电路经以太网电缆电耦合到因特网。
为了从印刷机系统412(或印刷数据112的任何其它源)接收印刷数据112并根据印刷数据112生成搜索索引,出版物链接服务器104包括索引生成模块406。索引生成模块406在工作时耦合到印刷机系统412。印刷数据112最好表示由印刷机系统412生成的印刷出版物。搜索索引便利了印刷数据112的搜索。当然,本领域的普通技术人员将容易地理解,索引生成模块406可以是另一计算设备而不是出版物链接服务器104的一部分。
可以以一般用于生成常规印刷书索引的众所周知的方式,完成由索引生成模块406执行的索引过程。例如,特定印刷出版物中的每个词可以与该词出现的每个页码相关。另外,可以在索引中保存词的次序,以便利短语搜索。或者,多个预选词和/或短语中的每一个可以从逻辑上与预选词和/或短语出现的每个页码相关。预选词和/或短语可以包括在公共数据字典中,和/或预选词和/或短语可以用电子方式指定为印刷数据112中的一个或多个标记。如果需要,不需要在印刷出版物中印刷一些或所有标记(即一个或多个标记可以是读者“看不见”的)。在任何情况下,标记向索引生成模块406表示特定词或短语应该被包括在搜索索引中。另外,如果标记是可见的,或者在印刷出版物中形成可见效果,则标记向读者表示可见的加亮词或短语被包括在搜索索引中。
为了存储搜索索引和出版物链接(包括出版物命中规范以及网络地址),出版物链接服务器104包括SQL服务器110以及数据库接口模块408。数据库接口模块408在工作时耦合到索引生成模块406以及网络接收器402。数据库接口模块408从索引生成模块406接收搜索索引,并将搜索索引存储在SQL服务器110中。类似的,数据库接口模块408从网络接收器402接收出版物链接,并将出版物链接存储在SQL服务器110中。
出版商服务器107最好将出版物链接发送到出版物链接服务器104(在印刷出版物之前、之中和/或之后)。只有出版商授权的链接管理员才能访问与该出版商相关的链接。例如,可能需要特定用户名称和口令以提交出版物链接,它将特定出版商的出版物命中规范与网络地址关联。每个出版物链接可以将词、页、章、标题、出版商和/或任何其它识别数据的书与网络地址关联。
章链接从逻辑上使一组页与单个网络地址相关,其中该组页按印刷出版物中的章相关。最好将章链接以比页码链接低的优先次序存储。换句话说,可以在指定某页的一个链接和指定该页所在章的另一链接中定位该页。特定页链接的优先级最好高于章链接。以这种方式,出版商可以将印刷出版物中的所有页快速分配给某一链接,并且接着返回并通过分配特定页链接而将某些页处理为特殊。类似的,出版物标题链接从逻辑上将一组页与单个网络地址关联,其中该组页按出版物相关。最好以比章链接低的优先次序存储出版物标题链接。出版商链接从逻辑上将一组页与一个网络地址关联,其中该组页按出版商相关。最好以比出版商标题链接低的优先次序存储出版商链接。
为了确定目标网络地址,出版物链接服务器104包括相关单元410。相关单元410在工作时耦合到网络接收器402、SQL服务器110以及网络发送器404。相关单元410经网络接收器402从客户机设备102接收查询。查询最好包括一个或多个搜索项。每个搜索项可以是单个词或排序短语(如“salt water”以及“fishing for dummies”)。或者,出版物查询可以包括出版物标识符(例如书名=“The UltimateSalt Water Fishing Guide”)以及搜索项(例如“Big Eye Tuna”)。此外,出版物查询可以包括出版商、页码、外语指示符、限制对出版物链接和/或其它数据的搜索的搜索参数。如果包括在出版物查询中,则外语指示符指定在出版物查询中使用的语言。以这种方式,可以通过语言翻译步骤以众所周知的方式预处理(即在使用查询识别一个或多个页码之前)出版物查询。
随后,相关单元410使用SQL服务器的搜索索引部分以及收到的查询对一个或多个出版物命中规范进行识别。例如,搜索索引可以表示在“The Ultimate Salt Water Fishing Guide”中第23页出现的短语“Big Eye Tuna”。然后,相关单元410通过在链接数据库110b中查找所示页码来确定目标网络地址。例如,可以将“The U1timate SaltWater Fishing Guide”第23页链接到www.SportFishWorld.com/Tuna。
一旦相关单元410确定目标网络地址,网络发送器404就经网络108将与目标网络地址相关的数据发送到客户机设备102。发送的数据可以是超级链接、网页数据、重定向消息、印刷出版物的数字版本和/或其它数据。对于超级链接的情况,客户机设备102可以这样一种形式接收目标地址本身用户可以通过选择超级链接(例如“点击这里检索www.SportFishWorld.com/Tuna”)来请求位于网络108的目标地址上的内容。对于网页数据的情况,出版物链接服务器104从位于目标地址的网页服务器106检索内容,并将检索到的内容发送到客户机设备102(例如将位于www.SportFishWorld.com/Tuna的网页数据发送到客户机)。对于重定向消息的情况,出版物链接服务器104将目标地址连同到客户机的命令一起发送到客户机设备102,从而自动从位于目标地址上的网页服务器106检索内容(例如,命令无需用户干涉,到www.SportFishWorld.com/Tuna)。对于印刷出版物的数字版本的情况,可以使用以上任何方法(例如可向客户机设备发送到印刷出版物的数字版本的超级链接,和/或可向客户机设备发送到印刷出版物的数字版本的重定向消息)。或者,可以在本地将数字出版物和/或其它内容存储在SQL服务器110中。在这种情况下,出版物链接服务器104最好检索数字出版物,并且经网络108以众所周知的方法将数字出版物发送到客户机102。
图5示意了用于创建搜索索引以及链接数据库的过程500的流程图。最好将过程500嵌入在软件程序中,其中该软件程序存储在出版物链接服务器存储器308中并由服务器CPU 304以众所周知的方式执行。但是,可以手动和/或由另一设备执行过程500的一些或所有步骤。尽管参考图5示意的流程图对过程500进行描述,但是本领域的普通技术人员将容易地理解,可以使用执行与过程500相关的动作的许多其它方法。例如,可以改变许多步骤的次序,并不背离本发明的范围或精神。另外,以下所述的许多步骤是可选的。
一般来说,过程500使得出版物链接服务器304生成并存储搜索索引和链接服务器。搜索索引最好根据从出版商107、印刷过程412、存储印刷数据112的存储器和/或光学字符识别过程118收到的印刷数据112。链接数据库最好根据从适当的出版商授权的管理员那里收到的出版物命中规范和相关网络地址。
当框502接收表示印刷出版物的印刷数据112时,过程500开始。印刷数据112最好包括诸如ASCII字符的编码文本。一旦收到印刷数据112,框504将印刷数据112分析为关键词和/或关键短语。可以根据任何已知的索引标准确定关键词和关键短语。最好印刷数据112中所有或几乎所有的词都是带索引的。但是,可以选择或忽略在数据字典中列出的某些预定关键词的出现。类似的,可以选择或忽略频繁出现的词和/或短语。另外,框506可以在印刷数据112中搜索与预定属性相关的词和/或短语,比如可见指示符和/或嵌入标记。例如,可以使用预定字体(如Arial、Courier、Times等)、字形(如斜体字、反向斜体字、带下划线的粗体等)和/或字号(如10号、12号等)来表示相关短语应该包括在搜索索引中。
然后,框508通过存储从逻辑上与各个词/短语出现的页码(和/或其它的书标识符)相关的各个词/短语来创建至少部分搜索索引。接着,当框510存储从逻辑上与各个出版物命中规范相关网络地址时,就创建了链接数据库。最好经网络108从出版商服务器107接收网络地址和相关出版物命中规范。一旦创建了搜索索引和链接数据库,出版物链接服务器104可以开始根据印刷出版物,将客户机102引导到网页。
图6示意了根据印刷出版物,将客户机102引导到网页的过程600的流程图。最好将过程600嵌入在软件程序中,其中该软件程序存储在出版物链接服务器存储器308中,并且由服务器CPU 304以众所周知的方式执行。但是,可以手动和/或通过另一设备执行过程600的一些或所有步骤。尽管参考图6所示的流程图对过程600进行了描述,但是本领域的普通技术人员将容易地理解,可以使用执行与过程600相关的动作的许多其它方法。例如,可以改变许多步骤的次序,并不背离本发明的范围或精神。另外,以下所述的许多步骤是可选的。
一般来说,过程600使得出版物链接服务器304根据客户机查询、搜索索引以及链接数据库确定目标网络地址。然后,利用目标地址发送客户机数据。当框602从客户机设备102接收查询时,过程600开始。在一个实施例中,这种查询是基于文本的查询,比如通过键盘输入的词“Big Eye Tuna”。在另一实施例中,这种查询是基于图形的查询,比如数字相机拍摄的数字图像。在这种实施例中,最好通过字符识别过程来分析图形,以确定一个或多个词。这种分析可以由客户机102和/或服务器104、106执行。
接着,框604使用搜索索引使查询与一个或多个出版物命中规范相关。例如,搜索索引可以表示短语“Big Eye Tuna”出现在“TheUltimate Salt Water Fishing Guide”的第23页。然后框606通过在链接数据库110b中查找所示出版物命中规范来确定目标网络地址。例如,可以将“The Ultimate Salt Water Fishing Guide”的第23页链接到www.SportFishWorld.com/Tuna。
一旦框606确定目标网络地址,框608就经网络发送器404和网络108将与目标网络地址相关的数据发送到客户机设备102。如上所述,发送数据可以是超级链接、网页数据、重定向消息、印刷出版物的数字版本和/或如上文详细描述的其它数据。之后,框610可以存储与该处理相关的人口统计数据。例如,如果用户的身份是已知的(例如经cookie或登录过程),出版物链接服务器104可以将与表示用户身份的数据相结合的目标地址存储在人口统计数据库110c中。随后,诸如出版商的授权用户可以检索存储在人口统计数据库110c中的数据。
总的来说,本领域的普通技术人员将容易地理解,已经提供了一种用于根据印刷出版物为客户机设备提供网页的方法和装置。实现本发明内容的系统的用户在因特网上搜索与印刷信息有关的更多信息时可以获得精确的搜索结果。
之前的描述是用于说明并描述本发明。它并无意于穷举或将本发明限制在公开的精确形式内。根据以上内容,许多修改和变型都是可能的。本发明的范围不由本文的详细描述限制,而且由本文所附的权利要求书进行限制。
权利要求
1.一种为客户机设备提供网页的方法,所述方法包括以下步骤从第一出版商接收第一印刷数据,所述第一印刷数据表示第一印刷出版物;从第二出版商接收第二印刷数据,所述第二印刷数据表示第二印刷出版物,所述第一印刷数据不同于所述第二印刷数据,所述第一出版商不同于所述第二出版商;从所述第一印刷数据和所述第二印刷数据生成搜索索引,所述搜索索引便利了所述第一印刷数据和所述第二印刷数据的全文搜索;从所述第一出版商授权的第一链接管理员那里接收第一多个出版物链接,所述第一多个出版物链接中的每一个将第一多个出版物命中规范中的每一个与第一多个网络地址中的每一个关联,所述第一多个出版物命中规范中的每一个标识所述第一印刷数据的一部分;从所述第二出版商授权的第二链接管理员那里接收第二多个出版物链接,所述第二多个出版物链接中的每一个将第二多个出版物命中规范中的每一个与第二多个网络地址中的每一个关联,所述第二多个出版物命中规范中的每一个标识所述第二印刷数据的一部分;所述第一多个出版物链接不同于所述第二多个出版物链接,所述第一链接管理员没有提交将所述第二多个出版物命中规范的出版物命中规范与任何网络地址关联的出版物链接的授权,所述第二链接管理员没有提交将所述第一多个出版物命中规范的出版物命中规范与任何网络地址关联的出版物链接的授权;经网络从所述客户机设备接收搜索查询;根据所述搜索索引,使所述查询与包含在所述第一多个出版物命中规范以及所述第二多个出版物命中规范中的至少一个出版物命中规范相关;确定包含在所述第一多个网络地址中的目标网络地址,所述目标网络地址通过所述第一多个出版物链接与所述至少一个出版物命中规范关联;以及将与所述目标网络地址相关的数据经所述网络发送到所述客户机设备。
2.如权利要求1所述的方法,其特征在于接收第一多个出版物链接的所述步骤包括接收页链接的步骤,所述页链接包括表示所述第一印刷出版物中的单个页的出版物命中规范,所述页链接使所述单个页与第一网络地址相关。
3.如权利要求2所述的方法,其特征在于接收第一多个出版物链接的所述步骤包括接收章链接的步骤,所述章链接包括表示与所述第一印刷出版物中的章相关的一组页的出版物命中规范,所述章链接将所述页的组与第二网络地址关联,所述第二网络地址不同于所述第一网络地址,所述章链接具有比所述页链接低的优先次序。
4.如权利要求1所述的方法,其特征在于从所述客户机设备接收搜索查询的所述步骤包括接收搜索参数的步骤,所述搜索参数表示限制到所述搜索索引的搜索。
5.如权利要求1所述的方法,其特征在于还包括使用所述搜索查询搜索网页索引的步骤。
6.如权利要求4所述的方法,其特征在于从所述客户机设备接收搜索查询的所述步骤包括接收数字图像的步骤。
7.如权利要求4所述的方法,其特征在于从所述客户机设备接收搜索查询的所述步骤包括接收从数字图像得到的文本的步骤。
8.如权利要求4所述的方法,其特征在于从所述客户机设备接收搜索查询的所述步骤包括接收出版物标识符的步骤。
9.如权利要求1所述的方法,其特征在于发送与所述目标网络地址有关的数据的所述步骤包括发送重定向消息的步骤。
10.如权利要求1所述的方法,其特征在于发送与所述目标网络地址有关的数据的所述步骤包括发送网页数据的步骤。
11.如权利要求1所述的方法,其特征在于发送与所述目标网络地址有关的数据的所述步骤包括发送超级链接数据的步骤。
12.如权利要求1所述的方法,其特征在于还包括存储与所述搜索查询有关的人口统计信息的步骤。
13.一种根据印刷出版物为客户机设备提供网页的方法,所述方法包括以下步骤从印刷数据生成搜索索引,所述印刷数据表示所述印刷出版物,所述搜索索引使所述印刷出版物中的多个词与所述多个词在所述印刷出版物中出现的多个页码相关;从授权出版商接收多个页码链接,各个页码链接使所述印刷出版物中的特定页与一个网络地址相关;经网络从所述客户机设备接收出版物查询;所述出版物查询包括出版物标识符和搜索项;根据所述搜索索引使所述出版物查询与所述印刷出版物的目标页码相关;根据所述目标页码从所述多个页码链接检索目标网络地址;以及经所述网络将与所述目标网络地址相关的数据发送到所述客户机设备。
14.如权利要求13所述的方法,其特征在于从印刷数据生成搜索索引的所述步骤包括在与所述印刷出版物相关的印刷过程期间,从所述印刷数据生成所述搜索索引的步骤。
15.如权利要求13所述的方法,其特征在于从印刷数据生成搜索索引的所述步骤包括以下步骤光扫描所述印刷出版物,以产生多个数字化页;以及在所述数字化页上执行字符识别过程。
16.如权利要求13所述的方法,其特征在于从印刷数据生成搜索索引的所述步骤包括根据与某个词相关的可见指示符选择词,以包括在所述多个词中的步骤。
17.如权利要求16所述的方法,其特征在于选择词以包括在所述多个词中的所述步骤包括根据与所述词相关的字体、字形以及字号中的至少一个选择所述词的步骤。
18.如权利要求16所述的方法,其特征在于选择词以包括在所述多个词中的所述步骤包括根据与所述词相关的图形指示符选择所述词的步骤。
19.如权利要求18所述的方法,其特征在于根据与所述词相关的图形指示符选择所述词的所述步骤包括根据与所述词相关的图标和边框中的至少一个选择所述词的步骤。
20.如权利要求13所述的方法,其特征在于存储多个页码链接的所述步骤包括存储章链接的步骤,所述章链接表示通过所述印刷出版物中的章相关的一组页。
21.如权利要求20所述的方法,其特征在于存储章链接的所述步骤包括以低于定位所述章中的页的特定页码链接的优先次序存储所述章链接的步骤。
22.如权利要求21所述的方法,其特征在于存储多个页码链接的所述步骤包括存储出版物标题链接的步骤,所述出版物标题链接表示所述印刷出版物中的所有页,所述出版物标题链接以低于所述章链接的优先次序进行存储。
23.如权利要求22所述的方法,其特征在于存储多个页码链接的所述步骤包括存储出版商链接的步骤,所述出版商链接表示所述印刷出版物中的所有页以及第二印刷出版物中的所有页,所述出版商链接以低于所述出版物标题链接的优先次序存储。
24.如权利要求13所述的方法,其特征在于存储多个页码链接的所述步骤包括使所述印刷出版物中的所述特定页与因特网地址相关的步骤。
25.如权利要求13所述的方法,其特征在于从所述客户机设备接收出版物查询的所述步骤包括接收出版物标题、页码、注册短语以及外语指示符中的至少一个的步骤。
26.如权利要求13所述的方法,其特征在于从所述客户机设备接收出版物查询的所述步骤包括接收在所述客户机设备输入的声音输入的步骤。
27.如权利要求13所述的方法,其特征在于经网络从所述客户机设备接收出版物查询的所述步骤包括经所述因特网从所述客户机设备接收所述出版物查询的步骤。
28.如权利要求13所述的方法,其特征在于发送与所述目标网络地址相关的数据的所述步骤包括发送重定向消息、网页数据以及超级链接数据中的至少一个的步骤。
29.如权利要求13所述的方法,其特征在于发送与所述目标网络地址相关的数据的所述步骤包括发送第二印刷出版物的数字版本的步骤。
30.如权利要求13所述的方法,其特征在于还包括存储与所述出版物查询相关的人口统计信息的步骤。
31.一种用于根据印刷出版物为客户机设备提供网页的装置,所述装置包括存储设备,它存储(i)在与所述印刷出版物相关的印刷过程期间所用的印刷数据生成的搜索索引,所述印刷数据表示所述印刷出版物,以及(ii)多个链接,各个链接使来自所述搜索索引的索引项与网络地址相关;网络接收器,它被配置为经网络从所述客户机设备接收查询;网络发送器,它被配置为经所述网络将与目标网络地址相关的数据发送到所述客户机设备;以及控制器,它在工作时耦合到所述存储设备、所述网络接收器以及所述网络发送器,所述控制器被配置为根据所述搜索索引和所述多个链接,使所述查询与所述目标网络地址相关,所述控制器被配置为所述网络发送器经所述网络将与所述网络地址有关的数据发送到所述客户机设备,以响应于所述查询。
32.如权利要求31所述的装置,其特征在于还包括光扫描仪,它被配置为将所述印刷出版物转换为位图;以及光学字符识别系统,它被配置为将所述位图转换为所述印刷数据。
33.如权利要求31所述的装置,其特征在于所述控制器被配置为检测与所述印刷数据中的词相关的预定义可见指示符,所述控制器还被配置为将与所述预定义可见指示符相关的所述词存储在所述存储设备中,作为所述搜索索引的一部分。
34.如权利要求33所述的装置,其特征在于所述控制器还被配置为检测预定义字体、预定义字形、预定义字号、预定义图标以及预定义边框中的至少一种。
35.如权利要求31所述的装置,其特征在于存储在所述存储设备中的所述搜索索引包括多个页码链接,各个页码链接使所述印刷出版物中的特定页与特定网络地址相关。
36.如权利要求35所述的装置,其特征在于存储在所述存储设备中的所述搜索索引包括章链接,所述章链接表示按所述印刷出版物中的章相关的一组页,以比定位所述章中的页的特定页码链接低的优先次序存储所述章链接。
37.如权利要求31所述的装置,其特征在于与所述网络地址相关的所述数据包括重定向消息、网页以及超级链接中的至少一个。
38.如权利要求31所述的装置,其特征在于与所述网络地址相关的所述数据包括第二印刷出版物的数字版本。
39.一种用于经网络为客户机设备提供与印刷出版物相关的网页的装置,所述装置包括印刷机系统;索引生成模块,它在工作时耦合到所述印刷机系统,所述索引生成模块被配置为从所述印刷机系统接收印刷数据,所述印刷数据表示所述印刷出版物,所述索引生成模块被配置为使用所述印刷数据生成搜索索引,所述搜索索引使所述印刷出版物中的多个词与所述多个词在所述印刷出版物中出现的多个页码相关;链接数据库,所述链接数据库保存多个页码链接,各个页码链接使所述印刷出版物中的特定页与网络地址相关;网络接收器,它在工作时耦合到所述网络,所述网络接收器被配置为接收出版物查询;相关单元,它在工作时耦合到所述网络接收器和所述链接数据库,所述相关单元被配置为根据所述搜索索引以及所述出版物查询确定所述印刷出版物的目标页码,所述相关单元被配置为根据所述目标页码从所述链接数据库中检索目标网络地址;以及网络发送器,它在工作时耦合到所述网络以及所述相关单元,所述网络发送器被配置为经所述网络将与所述目标网络地址相关的数据发送到所述客户机设备。
40.如权利要求39所述的装置,其特征在于所述索引生成系统还被配置为根据与所述多个词相关的标记确定所述多个词,所述标记包括在从所述印刷机系统收到的所述印刷数据中。
全文摘要
本文所述系统生成与来自不同出版商的多个印刷出版物相关的搜索索引和超级链接数据库。搜索索引包括来自印刷出版物的多个词和/或短语。搜索索引最好根据从相关出版商收到的印刷数据。超级链接数据库从逻辑上使出版物命中规范与网络地址相关。出版物命中规范标识印刷数据的一部分。例如,出版物命中规范可以是通过国际标准图书编号(ISBN)标识书的数据记录,按页码识别的书中的一页或多页,以及按词的文本识别的书中一个或多个词。网络地址最好指向网页。超级链接数据库根据从出版商授权的管理员(例如由内容创作者和/或版权所有者提供了口令的人)收到的网络地址。随后,系统能够通过使用搜索索引和超级链接数据库使从客户机设备收到的搜索查询与网络地址相关,从而将客户机设备引导到特定网页,以响应于收到的查询。
文档编号G06F17/30GK1439135SQ01811707
公开日2003年8月27日 申请日期2001年5月1日 优先权日2000年5月1日
发明者M·B·本特森 申请人:R.R.唐纳利父子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1