高精确度因特网局部搜索的制作方法

文档序号:6606932阅读:143来源:国知局
专利名称:高精确度因特网局部搜索的制作方法
技术领域
本发明通常涉及搜索因特网。更具体而言,本发明涉及通过将可搜索的空间关键 字插入地像中来改进在万维网上的搜索。
背景技术
尽管因特网上的搜索引擎用于定位来自全世界的内容,但其对于进行局部搜索并 不是特别有用。例如,对于搜索查询“CA旧金山市场街1号3英里内房屋出售”,搜索引擎 不会产生很好的结果。某些搜索引擎提供商已开始维持包含局部商业位置或其它关注点的 局部数据库,因此实现例如“94114附近的星巴克”的搜索。然而,此局部搜索对于搜索引擎 来说是昂贵的,因为空间加索引和搜索需要搜索提供商将新技术整合到其索引编制器和搜 索算法二者中。为了使用传统搜索引擎技术来执行精确局部搜索,作为索引建立过程的一 部分必须从网站剪切地址并将其地理编码为经度和纬度。地理编码容易出错误、慢且昂贵。 此外,在万维网页中识别地址是困难的,且地址格式是以非标准方式明确地给出的。另一选 择是,某些像雅虎(Yahoo) !黄页的服务使用经地理编码的黄页数据库。此数据库是昂贵 的且需要周期性更新-因此其不是万维网的空间搜索,而仅仅是黄页(非常小的数据集合) 的空间搜索。因此,需要一种万维网搜索技术,其就搜索提供商来说能够用最小的整合成本实 现高精确的局部万维网搜索。

发明内容
本发明实现能够在因特网上执行的高精确度局部搜索。地像再现软件提供 商将空间关键字嵌入到地图中,然后又提供给因特网内容的制作者,例如地图提供商、广告 商、商业万维网站点、个人万维网站点等。例如,房主可在万维网布告板上贴出为其出售房 屋做广告且包含显示所述房屋位置的地图的消息。当搜索引擎的万维网浏览器遇到具有嵌入图像中的空间关键字的页时,为所述空 间关键字连同万维网页上的其它内容加索引。由于空间关键字优选地识别小的地理区域, 因此为所述内容与所述空间关键字加索引将允许对搜索查询进行区域限制但仍提供有用 的结果。因此,在为其房屋做广告的房主的实例中,随后搜索房主区域中“房屋出售”的搜索引擎用户将被引导到房主的万维网页以及满足地理和内容搜索词的其它万维网页。


图1图解说明其中可实施本发明的系统100的一个实施例。图2是根据本发明的实施例图解说明一种用于与万维网页相关联地为空间关键 字加索引的方法的流程图。图3是根据本发明的实施例图解说明一种用于检索与空间关键字相关联的URL的 方法的流程图。
图4图解说明根据本发明的实施例边界框可如何全部在关注区域内、全部在关注 区域外或边界框可如何横切关注区域。图5图解说明根据本发明的实施例将空间关键字值整合到图像中。图6图解说明根据本发明的实施例如何使用地图产生器来加密或解密空间关键 字和边界框。所述图式仅出于图解说明的目的描绘本发明的优选实施例。根据以下的论述,所 属领域的技术人员应易于了解,在不违背本文所述本发明原理的前提下,也可采用本文图 解说明的结构及方法的替代实施例。
具体实施例方式本发明通过将空间关键字嵌入显示为万维网页的一部分的地图中来实现高精确 度因特网局部搜索。通过为空间关键字连同万维网页的相关内容加索引,搜索引擎因此能 够返回与局部信息查询相关的内容。加利福尼亚圣何塞的地开达公司(deCarta,Inc.)提供基于空间关键字的空间搜 索能力。空间关键字是数值,通常为32位数字,其可用作空间参考和用于空间搜索。在文件“丰富的地图引擎软件库核、路线寻找、属性编辑和数据库叠加API参考 手册(Rich Map Engine Software Libraries :Core, Route Finding, Attribute Edit, and Database Overlay API Reference manual),” 和“向下钻取服务器参考手册(Drill DownServer Reference Manual,) ”中进一步描述了空间关键字,所述文件分别作为附件A 和B包含在此,且其形成本申请案揭示内容的一部分。许多万维网页(例如,关于房地产的万维网页)已包含与所述页内容(例如,列出 的房地产)相关的地图。使用本发明,供应其中包含空间关键字的所述地图,由此使用现有 分布信道将空间关键字附加到代管局部内容的网站。使用本发明的系统,搜索引擎万维网浏览器不再需要执行对地址的地理编码。即 使是不具有昂贵地理编码器的最简单的搜索引擎也可为局部内容进行空间加索引且执行 高成熟的万维网空间搜索。图1图解说明其中可实施本发明的系统100的一个实施例。万维网页112包含文 本106以及地图URL的参考108。当图像再现软件110接收地图(在地图URL108指定的 URL处)请求时,其返回用空间关键字编码的所请求地图的图像和空间关键字引擎112供应 的边界框。当搜索引擎102浏览万维网页112时,其为万维网页112的内容与嵌入从系统 100检索的地图中的空间关键字加索引。
图2是根据本发明的实施例图解说明一种用于为万维网页和相关联的空间关键 字加索引的方法的流程图。如以上所描述,万维网页112包含显示万维网页中描述的事物(例如,房地产列 表、餐馆查看等)的位置的地图。万维网搜索引擎102浏览202万维网且到达万维网页112。应注意搜索引擎102 可出于除已浏览万维网页112以外的原因为万维网页112加索引——例如,其可已被赋予 为所述页加索引的明确指令或出于某些其它原因。一旦搜索引擎102已到达页112,其跟随地图URL 108以从 通过URL识别的源中检 索204地像,其通常列在地图的HTML “图像源”属性中。如上文所述和下文进一步描 述,通过图像再现引擎110返回的地图包含通过空间关键字引擎112嵌入的空间关键字且 在一个实施例中还包含边界框。已从系统100检索经再现地图之后,搜索引擎102接下来从所包含的二进制数据 中提取206空间关键字和相关联边界框,且然后与万维网页的URL和万维网页112的内容 相关联地为地图的空间关键字加索引208。应注意尽管在图1中将页的非地图内容识别为 文本106,但所述内容也可以是图形、声音或不失通用性的其它类型的内容。在替代实施例中,空间边界区域以图形收敛方式(steganographically)包含在 不存在空间关键字的地图中。在此实施例中,加索引搜索引擎102产生对应于边界区域的 一个或多个空间关键字。参考图3,执行搜索包含接收302搜索查询,从所述搜索查询确定304空间关键字 和检索306被索引到一个或一个以上空间关键字和其它查询词的URL。例如,在一个实施例 中,如果用户访问搜索引擎102且输入查询“寻找在公路101北1英里内的所有出售房屋”, 那么搜索引擎102确定覆盖公路101北的空间关键字并检索被索引到一个或一个以上空间 关键字和“出售房屋”的所有URL。在一个实施例中,地像编码空间关键字和边界框。在此实施例中,所述边界框 由两点界定。如所述,空间关键字是用于执行加空间索引和搜索的常规技术。空间关键字 覆盖可比地图所显示的可见区域大的经界定地理区域。因此,地像也可优选地编码边 界框。在替代实施例中,使用能够容纳两点以上的边界区域。万维网浏览搜索引擎102记 录地图的空间关键字和边界框。对比搜索引擎索引执行的初始查询可从空间关键字值范围 中提取URL。可执行子过滤以消除具有落在查询关注区域外的边界框的URL。图4图解说明边界框404、406、408可如何全部在关注区域408内,例如边界框 404 ;全部在关注区域外,例如边界框402 ;或边界框可如何横切关注区域,例如边界框406。我们现在提供如何以假定位像的红、绿和蓝(RGB)值来以图形收敛的方式编 码32位空间关键字和空间边界框的实例。尽管我们使用32位空间关键字用于此实例,但 无疑地可使用其它长度的关键字,如所属领域的技术人员将理解。假设· K是32位空间关键字· Xfflin是32位有符号整数坐标空间中的X,Y边界框的最小X坐标角· Xfflax是32位有符号整数坐标空间中的边界框的最大X坐标· Yfflin是32位有符号整数坐标空间中的X,Y边界框的最小Y坐标角· Yfflax是32位有符号整数坐标空间中边界框的最大Y坐标
应注意经度和纬度可通过乘以100,000且去掉或约掉余数来转换为32位有符号 整数坐标。使图像中的每一 RGB值均被表示为24位十六进制的数。通常看到表示为(例 如)“OxFFAABB”的RGB值,此意指8位红像素具有FF的十六进制值,绿像素具有AA值且 蓝像素具有BB值。使用每一 RGB值来编码3位信息。优选地,使用红、绿和蓝像素的最低有效位 (LSB)。可通过用位屏蔽“0x010101”对RGB值进行与运算来从给定RGB值中提取由RGB值 编码的3个位。所述位屏蔽技术已为业内所熟知。此后,当我们提及图像的字节时,我们指个别R、G或B值。对于每一 R、G或B值, 我们仅使用最低有效位(LSB)来以图形收敛的方式编码信息。图5图解说明图像的字节。 “B0”指示图像的字节零,“B31”指示字节31等。为了以图形收敛的方式编码32位空间关 键字K,我们优选地使用图像的第一 32个字节。在每一字节中,我们将使用所述字节的最低 有效位来存储K的位。如所属领域的技术人员将理解,可代替地使用其它字节。以相同方式对Xmin、Ymin、Xmax和Ymax进行图形收敛编码。在替代实施例中,对额外(X,Y)坐标对进行图形收敛编码以容纳不受限于两个坐 标的边界区域。在替代实施例中,在经编码坐标之后对额外数据进行编码,如以下进一步描述。对于传输明文形式(例如可缩放矢量图形(SVG))的图像的向量格式来说,可使用 文本文件中的注释来嵌入空间关键字。所述十六进制值可表示经加密或未加密空间关键 字< ! 一空间关键字=0x34567854-〉以类似方式对边界框进行编码。尽管已相对于位图和SVG图像描述了本发明,但是所属领域的技术人员将理解本 发明还适用于使用JPEG、GIF、PNG和各种其它图像格式的系统。除空间关键字和边界框之外,本发明的替代实施例还允许将任意信息图形收敛地 编码在图像中。例如,某人可能需要将指南等级附加到显示餐馆位置的地图。某人可能以图形收敛的方式编码在地像中的额外信息的无穷尽的实例包 含0 照片0任意的关键字/值对0 自由文本0 URL0 邮政编码优选地,使用以下方法中的一者来允许浏览万维网的搜索引擎102能够从不含有 空间关键字的地图中区分含有空间关键字的地图。可信源在此方法中,图像的URL足够确定源字节含有空间关键字。例如,考虑贴在房地产 中的雅虎!地图的URL,所述URL贴出http://maps.yahoo.com/maps_result ? addr =Somerv ille+Road+at+Me1i ta&c sz = santa+r+CA&country = US在此情形中,"http:/ /maps,yahoo, com/maps_resuit ? ” 足够确定到雅虎!地图 的链接点。如果由雅虎!产生的每个地图嵌入空间关键字和边界框,那么万维网浏览搜索 引擎102可从以“http://maps, yahoo, com/maps_resuit ? ”开始的所有URL中提取空间关 键字和边界框。检杳和在此实施例中,使用紧随第一 160个字节之后的字节提供第一若干字节的32位检 查和,例如经图形收敛编码的160个字节或位。万维网浏览器102对照第一 160个字节检查所述检查和。应注意使用此方法,知 道检查和算法的任一方有可能在空间上键控任一图像。数字签名使用紧随第一若干字节(例如160个字节)之后的字节对图像的数字签名(例如, PGP签名)进行图形收敛编码。使用私人钥匙通过系统100产生签名。读取图像的万维网 浏览器102必须知道公共钥匙以验证图像和其经图形收敛编码的空间关键字和边界框。此通过可信源的方法的一个优点是在空间上被键控的图像可从其原始源下载并 再贴在不同的URL上。同样,此通过简单检查和的方法的优点是其允许识别图像的创作者。 万维网浏览器102维持在空间上经键控的地图的各种提供商的公共钥匙列表且在需要时 针对每一提供商运行公共钥匙验证以执行区分。 Μ许多图像格式支持注解。注解可以是呈如以上针对向量格式所述的注释形式或在 作为文件格式本身的一部分的注解机构中。在有注解的地方,注解可用来识别含有经图形 收敛编码的空间关键字和边界框的图像。MM可需要加密来防止空间关键字技术的逆向工程设计或允许地像的制作者 (例如,“maps. xyz. com")保持独有的读取空间关键字的能力一因此产生用于由xyz. com制 作的地图的独有空间万维网搜索能力。可采用常规已知的算法(例如DES或RSA)来达成此加密。例如,加密(K+Xmin+Ymin+Xmax+Ymax+Pad)->密码文本显示在空间关键字、边界框和可选填充值的级联上运行以产生经加密值(密码文 本)的加密算法。所述填充值可用来消除不安全密码文本的产生。加密机构可采用隐私钥匙来加密空间关键字和边界框。图6图解说明根据本发明的实施例可如何使用加密。地图数据供应商614向图像 再现引擎110提供包含经加密的图形收敛空间关键字和边界框的地图数据616,然后如以 上所述,所述图像再现引擎110向搜索引擎102提供经再现地图。当搜索引擎102向系统 100提供地图和正确的加密钥匙时,优选地返回经解密空间关键字和边界框(未图示)。在一个实施例中,图像的制作者可提供其自己的空间关键字和边界框加密。可能 有用的一些原因包含1)地像再现软件提供商已使图像制作者不希望与其共享空间关键字的若干 方可获得解密软件;
2)图像制作者不希望与其共享空间关键字的若干方可以使用公共解密钥匙;或3)代替或除地像再现软件提供商所提供的加密之外,图像制作者期望提供其 自己的加密。根据本发明的实施例再次图解说明查询和响应考虑以下实例用户输入查询“寻找公路1 01北1英里内的所有房屋。”a.搜索引擎对查询执行语义分析。b.搜索引擎识别“房屋”为所需搜索结果c.搜索引擎识别“1英里内”为空间限定语d.搜索引擎识别“公路101N”为路e.搜索引擎使用叠加插件来检索覆盖所选定几何形状的公路IOlN周围1英里地 带(关注区域)的空间关键字范围。(出于实例的目的,认为覆盖关注区域的返回关键字范 围为

。f.搜索引擎通过在其数据库中搜索来检索所有URL和匹配“房屋”标准且具 有正确空间关键字的相关联边界框。以下是用于数据库查询的伪码“SELECT URL AND B0UNDING_B0X WHERE KEYWORD =' home | house | townhome | cabin' AND (SPATIALKEY > = Ox 12345671 AND SPATIALKEY < = Ox 12345674) OR (SPATIALKEY > = 0x12345695 AND SPAT IALKEY <= Ox 12345699)“g.搜索引擎简洁表述搜索结果网页,其丢弃从步骤6的查询返回的其边界框没有 横切步骤5中所用的公路101N周围的关注区域的URL。已针对有限数目的实施例特别详细地描述了本发明。所属领域的技术人员将了解 本发明可另外在其它实施例中实践。首先,组件的特定命名、术语的大写、属性、数据结构或 者任何其它编程或结构方面均不是强制性或具有特殊意义的,且实施本发明或其特征的机 制可具有不同的名称、格式或协议。此外,系统可如所述那样经由硬件和软件的组合来实 施,或者完全在硬件元件中实施。同样,本文所述的各种系统组件之间的功能性的特定划分 仅仅是例示性的,而不是强制性的;由单个系统组件实施的功能可代替地由多个组件来实 施,且由多个组件实施的功能可代替地由单个组件来实施。例如,可以许多或一个模块提供 地像再现软件供应商、地像供应商等的特定功能。以上说明的某些部分就算法和关于信息的符号操作表示方面呈现本发明的特征。 这些算法描述和表示是所属万维网搜索领域的技术人员用来向所属领域的其它技术人员 最有效地传达其工作实质的手段。从功能上和逻辑上进行描述的这些运算应理解为由计算 机程序来实施。此外,已经证明有时将操作的这些布置称为模块或代码装置也是方便的,不 会丧失通用性。然而,应知道,所有这些术语或类似术语都与适当的物理量相关联且仅是应用于 这些物理量的方便标记。除非根据本论述显而易见地另有具体指定,否则应了解,在本说明 的通篇中,利用例如“处理”或“计算”或“运算”或“确定”或“显示”或类似词语进行的论 述是指计算机系统或类似电子计算装置所进行的动作和过程,所述计算机系统或类似电子 计算装置对在计算机系统存储器或寄存器或其它此类信息存储、传输或显示装置中被表示 成物理(电子)量的数据进行处理及变换。本发明的某些方面包含本文中以算法的形式描述的过程步骤和指令。应注意,本发明的过程步骤和指令可体现在软件、固件或硬件中,且当体现在软件中时,可进行下载以 驻留在由实时网络操作系统使用的不同平台上,并通过所述平台来操作。本发明还涉及一种用于执行本文中的操作的设备。此设备可以针对所需的用途进 行专门构造,或者其可包括通用计算机,所述通用计算机由存储于所述计算机中的计算机 程序有选择地启动或重新配置。此计算机程序可存储在计算机可读存储媒体中,例如但不 限于任何类型的磁盘,包括软盘、光盘、⑶-ROM、磁光盘、只读存储器(ROM)、随机存取存储器 (RAM)、EPR0M、EEPR0M、磁卡或光卡、专用集成电路(ASIC)或适于存储电子指令且每一者均 耦合到计算机系统总线的任何类型 的媒体。此外,在本说明书中提及的计算机可包含单个 处理器,或可以是采用多处理器设计以用于增加计算能力的构架。本文中所提供的算法及显示并非与任何特定计算机或其它设备内在地相关。各种 通用系统还可根据本文中的教示与程序一起使用,或者可证明便于构造用于实施所需方法 步骤的更专门的设备。从上文的说明中将显露各种所述系统的所需结构。另外,本发明未 参照任何特定编程语言加以阐述。应了解,可使用各种编程语言来实施如本文所述的本发 明的教示,且对特定语言的任何提及是为了揭示本发明的可行性和最佳模式而提供的。最后,应注意,本说明书中所使用的语言原则上是出于易读性和指导性目的而选 择的,而不是为描述或限制发明的标的物而选择的。因此,本发明的揭示内容旨在图解说明 而非限制本发明的范围。
权利要求
一种为万维网页加索引的方法,所述方法包括由第一计算机检索万维网页,所述万维网页包含第一内容和指定地图内容的源地址;在所述万维网页中指定的所述源地址处从第二计算机检索地图内容,所述地图内容包括经嵌入空间关键字;从所述所检索的地图内容中提取所述经嵌入空间关键字;及在计算机可读存储媒介上存储所述所提取的空间关键字与所述第一内容之间的关联性,其中所述方法进一步包括从所述所检索的地图内容中提取边界框;及维持所述边界框与所述第一内容之间的关联性。
2.如权利要求1所述的方法,其中所述边界框由两个点限定。
3.一种为万维网页加索引的方法,所述方法包括由第一计算机检索万维网页,所述万维网页包含第一内容和指定地图内容的源地址; 在所述万维网页中指定的所述源地址处从第二计算机检索地图内容,所述地图内容包 括经嵌入空间关键字;从所述所检索的地图内容中提取所述经嵌入空间关键字;及在计算机可读存储媒介上存储所述所提取的空间关键字与所述第一内容之间的关联性,其中所述方法进一步包括从所述所检索的地图内容中提取边界区域,所述边界区域由两个以上的点限定;及 维持所述边界区域与所述第一内容之间的关联性。
4.一种为万维网页加索引的方法,所述方法包括由第一计算机检索万维网页,所述万维网页包含第一内容和指定地图内容的源地址; 在所述万维网页中指定的所述源地址处从第二计算机检索地图内容,所述地图内容包 括经嵌入空间关键字;从所述所检索的地图内容中提取所述经嵌入空间关键字;及在计算机可读存储媒介上存储所述所提取的空间关键字与所述第一内容之间的关联性,其中所述方法进一步包括接收搜索查询,所述搜索查询包含查询和位置;识别与所述所接收的位置相关的空间关键字;识别网页组,所述网页组具有与所述搜索查询匹配且与所述所识别的空间关键字相关 的内容;及返回所述所识别的网页组的标记。
5.如权利要求4所述的方法,其中所述标记包括URL。
6.如权利要求4所述的方法,其中所述标记包括所述组中的文件。
7.一种为万维网页加索引的方法,所述方法包括由计算机在广域网络上浏览多个万维网页,每个万维网页具有文本内容和至少一个具 有经嵌入的空间关键字的图像;对于所述所浏览的万维网页中的每一者从所述图像中提取所述空间关键字;及在计算机可读媒介上存储所述文本内容与所述空间关键字之间的关联性。
8.如权利要求7所述的方法,其进一步包括接收搜索请求,所述搜索请求包含查询和位置;确定与所述位置相关的至少一个空间关键字;识别具有与所述搜索查询有关的文本内容的所述所浏览的万维网页,所述文本内容具 有相关的空间关键字,所述相关的空间关键字与和所述位置相关的所述空间关键字匹配; 及响应于所述所接收的询问而提供所述所识别的万维网页。
9.如权利要求7所述的方法,其中在托管所述万维网页的服务器之外的服务器上托管 具有空间关键字的所述至少一个图像。
10.如权利要求9所述的方法,其中托管所述图像的所述服务器是由URL识别。
11.如权利要求7所述的方法,其中所述图像是地图。
12.如权利要求7所述的方法,其中以图形收敛的方式将所述空间关键字编码为所述 图像的红、绿和蓝值。
13.如权利要求7所述的方法,其中所述至少一个图像包括以图形收敛的方式编码的 等级数据,且所述方法进一步包括存储所述文本内容和所述所编码的数据之间的关联性。
14.如权利要求7所述的方法,其中所述至少一个图像包括以图形收敛的方式编码的 照片数据,且所述方法进一步包括存储所述文本内容和所述所编码的数据之间的关联性。
15.如权利要求7所述的方法,其中所述至少一个图像包括以图形收敛的方式编码的 关键字/值对,且所述方法进一步包括存储所述文本内容和所述所编码的数据之间的关联 性。
16.如权利要求7所述的方法,其中所述至少一个图像包括以图形收敛的方式编码的 等级数据,且所述方法进一步包括存储所述文本内容和所述所编码的数据之间的关联性。
17.如权利要求7所述的方法,其中所述至少一个图像包括以图形收敛的方式编码的 自由文本,且所述方法进一步包括存储所述文本内容和所述所编码的数据之间的关联性。
18.如权利要求7所述的方法,其中所述至少一个图像包括以图形收敛的方式编码的 URL数据,且所述方法进一步包括存储所述文本内容和所述所编码的数据之间的关联性。
19.如权利要求7所述的方法,其中将所述空间关键字与检查和以图形收敛的方式编 码在所述图像中。
20.如权利要求7所述的方法,其中将数字签名以图形收敛的方式编码在所述图像中。
21.如权利要求7所述的方法,其中所述空间关键字是经加密的且提取所述空间关键 字包括解密所述空间关键字。
22.—种为广域网络上的万维网页加索引的计算机程序产品,所述计算机程序产品存 储在计算机可读媒介中,且所述计算机程序产品包括程序码,所述程序码用于当将其载入 存储器中并由处理器执行时执行下列步骤浏览广域网络上的多个万维网页,每个万维网页含有文本内容和具有嵌入的空间关键 字的至少一个图像;对于所述所浏览的万维网页中的每一者 从所述图像中提取所述空间关键字;及在计算机可读媒 介上存储所述文本内容与所述空间关键字之间的关联性。
全文摘要
在因特网上执行高精确度局部搜索。地像再现软件供应商将空间关键字嵌入地图中,然后将所述地图提供给因特网内容的制作者(例如地图供应商)。例如,房主可在万维网布告板上贴出消息,所述消息为其出售房屋做广告且包含显示所述房屋的位置的地图。当搜索引擎的万维网浏览器遇到具有嵌入到图像中的空间关键字的页时,为所述空间关键字与所述页上的其它内容加索引。由于所述空间关键字识别较小的地理区域,因此为所述内容与所述空间关键字加索引将允许对搜索查询进行区域限制但仍提供有用结果。因此,搜索特定区域中“房屋出售”的搜索引擎用户将被引导到满足地理和内容搜索词的万维网页。
文档编号G06F17/30GK101877013SQ201010242519
公开日2010年11月3日 申请日期2006年12月8日 优先权日2005年12月8日
发明者杰弗里·亨德雷, 理查德·波彭 申请人:德卡尔塔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1