地图目标的自动优先化的制作方法

文档序号:6004111阅读:101来源:国知局
专利名称:地图目标的自动优先化的制作方法
技术领域
本发明大体而言涉及计算机化制图法。具体而言,本发明涉及根据地图要素的性质自动为这些要素指配优先权。
背景技术
在制作州、省、国家或地区的地图(无论用手还是通过使用计算机程序)时,通常的作法是将城市显示为带标记的点。由于并非所有的城市均同等重要,因此对城市进行优先排序。显示并标记较重要的城市-即广大查看者更有可能在地图上查找的城市;而不太重要的城市则只在其不妨碍显示更重要的城市时加以显示及标记。通常,当显示具有不同优先权的城市时,以更大或更粗的符号来显示最重要的城市,并以更大或更粗的字型或以全大写字母来显示其名称。为城市指配优先权的最常用方法是按人口来指配。最突出显示人口数大于某一数目P1的城市;不太突出地显示人口数小于P1但大于某一数目P2的城市;更不太突出地显示人口数小于P2但大于某一数目P3的城市;依次类推,直至完全不显示人口数小于某一数目 Pn的城市为止。然而,纯粹基于人口数来指配优先权的方法并非始终是最佳的。有些城市人口数虽小却很重要。例如,人们通常期望在包括国家的地图上找到所述国家的首都城市。美国首都华盛顿特区在2000年人口普查时人口数为572,059,使其仅成为美国的第二十一大城市-小于威斯康星(Wisconsin)州的密尔沃基(Milwaukee)市(第十九大城市)。尽管密尔沃基的人口数更大,但在全国地图上找到密尔沃基而找不到标记在该全国地图上的华盛顿那将看起来很奇怪。为了考虑到这一点,地图制作者往往对城市的优先权进行调整,以确保适当地显示比其人口数所包含的意义更重要的城市。进行这些种类的调整的困难在于地图制作者需要得知关于正在绘制地图的国家或地区的政治及其他文化方面的知识,且虽然相对容易确定华盛顿是美国的首都,但不太清楚从绘制地图的观点看,内华达(Nevada)州的拉斯维加斯(Las Vegas,人口数478,434) 比新墨西哥州(New Mexico)的阿尔伯克基(Albuquerque,人口数448,607)重要得多。虽然拉维加斯与阿尔伯克基的大小大致相同,但拉斯维加斯是美国的主要旅游中心(且因此人们常在地图上查找),而阿尔伯克基则不然。
由于人们正在使用计算机制作越来越多数目的地图,因此需要在不单纯依赖人口数据的情况下自动确定应包括哪些城市,而无需地图制作者具备关于正在绘制地图的区域的广泛的政治及文化知识。

发明内容
本发明通过为考虑要显示在地图上的城市列表中的每一城市指配优先权来实现自动地图生成。地图绘制引擎确定每一城市的提及计数,所述提及计数指示所述城市多频繁地出现在一个或一个以上文档语料库(corpus)中。针对所述地图的既定用途视需要选择所述文档语料库本身。根据所述提及计数,并视情况根据例如人口数及政治重要性等其他数据,为每一城市指配优先权得分。然后,根据所述城市的优先权得分来将每一城市指配到复数个类别中的一个类别。然后,生成地图,其包括来自规定的最高数目的类别的城市。 在一个实施例中,以比下一最高得分类别中的城市更显著的方式(例如以大写字母、粗体字型等等)来呈现具有较高得分的类别中的城市。在替代实施例中,将某些城市布置在所述地图上而不将其指配到各类别。在此实施例中,将规定数目的城市(例如具有最高优先权得分的10个城市,或最前面的40个城市,或最前面的60个城市等等)布置在所述地图上。或者,可将最高百分比的城市布置在所述地图上,或在再一替代形式中,用户可实时地改变布置在所述地图上的城市数目以适合其偏好。


图1为说明根据本发明的一实施例用于自动生成地图的系统的方块图。图2为说明根据本发明的一实施例用于自动生成地图的方法的流程图。这些图式只是出于说明目的来描绘本发明的优选实施例。在阅读下文说明后,所属领域的技术人员将容易认识到,在不背离本文中所述的本发明原理的情况下,也可采用本文中所阐释的结构及方法的替代实施例。
具体实施例方式现在参见图1,图中显示根据本发明的实施例用于自动生成地图的系统100。系统 100包括地图绘制引擎104 ;地图源数据存储器102 ;及全集106。图中还显示输出地图108。 在实施例中,地图108为纸张地图或其他实体地图;在替代实施例中,地图108则是以电子方式提供(例如)在网页上。下文将参照图2来阐述所述地图绘制引擎的功能性。地图源数据102包括城市列表及每一城市的属性。在实施例中,属性包括位置及人口数。在另一实施例中,属性还包括关于每一城市的其他数据,例如其是不是所述国家或地区的首都,等等。地图源数据102可起源于多个源,例如人口调查局、商业部、邮局、商家、寸寸。通常,由于地图的尺寸,源数据102中包括有多于地图108所能容纳的城市。因此, 必须选择所述城市的子集来布置于地图108上,而且必须选择所述子集的子集来更突出地或不太突出地显示。此选择是由地图绘制引擎104实施。地图绘制引擎104为地图源数据102中的每一城市指配优先权。根据城市在文档全集106中出现的频率来确定优先权。针对所述地图的预定用途,视需要选择文档全集106。例如,在万维网上构建通用地图时,全集106优选包括一组通过搜索引擎检索的网页。 例如通过对为“< 城市名称 >,〈州缩写 >”或“< 城市名称 >,〈州名称 >”形式的字符串实施搜索来确定在全集106中提到城市的次数。存在几种用于对全集中的用语实施搜索的已知方法,且系统100可使用任何一种方法来获得每一城市在全集106中的频率计数。在一实施例中,地图绘制引擎104所使用的量度为包括所述城市名称的页面数目。在替代实施例中, 所述计数为所述城市名称出现的次数-即对在页面中出现两次的城市进行两次计数,而在前一实施例中只对其进行一次计数。在另一实施例中,使用系统100来构建地图108以在提供新闻的网站上使用。在此种情况下,全集106包括新闻故事档案。因此,地图绘制引擎104所生成的地图108将包括其中较频繁地出现新闻(或被报道)的城市。在另一实施例中,生成地图108以在专门针对感兴趣的专题(例如加利福尼亚的历史)的网站上使用。在此实施例中,地图绘制引擎104搜索与加利福尼亚历史相关的文档全集并对提及每一城市的次数进行计数。作为附加实例,在构建在公司内参考的地图时, 全集106可由客户列表组成并位于城市中的每一客户可被作为对该城市的提及进行计数。一旦得到确定,所述提及计数-即每一城市在所述全集中的计数次数-便由地图绘制引擎104用来确定优先权次序,即按重要性分类的城市排序列表。在一实施例中,所述优先权次序是通过下述方式获得通过将每一城市的提及计数c及人口数ρ分别乘以某一常数Iq及1 并将结果相加来组合所述参考计数c与所述人口数P,从而得到优先权得分 Ic1 X c+k2 X ρ。在一替代实施例中,所述优先权得分是通过对这些数的对数实施相同的运算获得的Gc1Xlog c+k2Xlog ρ)。然后,地图绘制引擎104优选按优先权得分下降的次序对这些城市进行分类,即将具有较大优先权得分的城市视为较重要的城市,从而以一任意方式打破关系。在替代实施例中,地图绘制引擎104则按优先权得分上升的次序对各城市进行分类。在另一实施例中,单独根据每一城市的人口数并同样单独根据每一城市的提及计数来对每一城市进行排列。例如,在生成美国地图时,如果华盛顿特区为在全集106中最频繁提到的城市,则就提及计数而沿其等级为1。华盛顿为美国的第21个人口最多的城市,因此就人口数而沿其等级为21。然后,将这些等级编号进行组合,以根据组合等级来获得最终优先权得分。例如,可简单地通过取这两个编号中的较小者来组合这些等级编号,因而纽约 (就人口数而沿其等级为1)及华盛顿(就提及计数而沿其等级为1) 二者均具有为1的优先权得分。或者,在组合前,可按类似于上文针对组合人口数与提及计数所述的方式来对各等级编号进行加权。在组合所述等级编号后,地图绘制引擎104然后按优先权得分来对所述城市进行分类。在另一实施例中,按提及计数减小的次序而不考虑人口数来对城市进行排序。使用上文所述的公式,此可表达为IqXc+l^Xp,其中Ic1 = 1且1 = 0。在优选实施例中,根据每一城市的等级来将城市指配到复数个类别中的一个类别。可按多种方式来指配各类别之间的等级阈值。例如,在一个实施例中,一开始就确定所述等级阈值,例如将10个最高等级的城市指配到第一类别,将接下来的40个城市指配到第二类别,依次类推。或者,使用百分率阈值,例如将各城市中具有最高等级的1 %指配到第一类别,将各城市中接下来的等级的4%指配到第二类别,依次类推。在另一实施例中,所述等级阈值是由用户根据其爱好加以确定。现在参见图2,图中显示说明根据本发明实施例用于自动生成地图的方法的流程图。首先,如上文所述,地图绘制引擎104为地图源数据102中的每一城市确定202提及计数。然后,如上文所述,通过将所述城市的人口数与其提及计数、或其人口数等级与其提及计数等级相组合来为其指配204优先权得分。接下来,地图绘制引擎104为每一类别确定 206优先权得分阈值。如上文所述,阈值可自动指配或由用户指配。使用所确定的阈值,地图绘制引擎104然后将每一城市指配到208 —类别。最后,地图绘制引擎104生成210包括指配到最高类别的城市的地图108。在替代实施例中,不将各城市指配到各类别,且地图绘制引擎104通过选择最频繁出现在全集106中的η个城市并将其包含在所生成的地图108 上来生成地图108。在替代实施例中,使用两个或两个以上不同的全集来获得提及计数。对每一城市的及来自每一全集的提及计数进行加权并随后将其与来自额外全集的提及计数及(视需要)人口数相组合,以确定优先权得分。或者,可根据上文针对单个全集所述的方式相对于每一全集为每一城市确定等级并随后视需要将其与人口数等级相组合。虽然到现在为止在地图上定位城市的情形下进行描述,但本发明也适用于在地图上对其他种类的目标进行定位-县、乡村、公园、机场等等。也就是说,系统100可根据上文所述的方法来绘制可在全集中进行提及计数的任何实体的地图。在替代实施例中,全集106中的文档的年龄会影响城市的提及计数。如果所述全集中较新的文档比较旧的文档更重要,则使用一种浮动折算法,其中在较新文档中的提及的计数要重于在较旧文档中的提及。在一实施例中,将在年龄为t天的文档中的提及按照 cer_kt次提及进行计数,其中c及k为常数且e为自然对数的基数。在替代实施例中,全集106包括对搜索引擎的询问,以便即使所述全集中不存在许多对所述城市的提及,大量关于城市的询问也会产生大的提及计数。本发明提供一种用于频繁地并自动地重绘地图以方便参考的方法。假定例如与新闻相关的网站提供美国地图以供其站点的访问者参考。优选使用在由最近的新闻故事构成的全集106中的提及计数作为所述提及计数,来使地图绘制引擎104自动对地图源数据102中的城市进行优先化,并自动以规定时间间隔(例如每周或每夜或者甚至按需) 来重绘地图108。如果新闻故事发生在一在其他方面不重要的城市-例如加利福尼亚的 Victorville,则对该城市的提及次数将增加,且增大的提及次数自动地将所述城市恰如其分地放置于所述地图上。在一实施例中,进一步将全集106限制至只包括以某一语言或某些语言写成的网页。因而,例如,可使用由法语文档构成的全集来对西班牙地图上的城市进行优先权排序, 从而显示那些对讲法语的人重要的西班牙城市。上文已参照有限数目的实施例特别详细地阐述了本发明。所属领域的技术人员应了解,本发明也可另外以其他实施例形式来实施。首先,组件的具体命名、用语的大写、 属性、数据结构、或任何其他编程或结构方面均并非是强制性的或重要的,且构建本发明或其特征的机理可具有不同的名称、格式、或协议。此外,所述系统可通过如上文所述的硬件与软件组合或完全以硬件元件形式来构建。而且,本文中所述各种系统组件之间的功能性具体划分只是实例性的,而不是强制性的;由单个系统组件实施的功能可改为由多个组件实施,而由多个组件实施的功能也可改为由单个组件实施。例如,对提及次数进行计数、生成优先权得分及存储所述得分等等的具体功能可提供在许多模块中,或者提供在一个模块中。上文说明中的某些部分用信息运算的算法及符号表示形式来呈现本发明优选实施例的特征。这些算法说明及表示形式是计算机化制图法领域的技术人员用来最有效地将其工作的实质传达给所属领域的其他技术人员的途径。这些运算虽然是在功能上或逻辑上加以阐述,但应理解为由计算机程序执行。此外,还已证明,有时方便地将这些运算方案称作模块或代码装置而不失其一般性。不过,应记住,所有这些及类似用语将与适当的物理量相关联且只是应用至这些量的方便标签。除非根据本说明显而易见另有具体规定外,应了解,在通篇说明中,利用例如“处理”或“计算(computing) ”或“计算(calculating) ”或“确定”或“显示”或例如此类的用语进行的论述是指计算机系统或类似电子计算装置进行的操作及处理,所述计算机系统或类似电子计算装置操纵并变换在计算机系统存储器或寄存器或其他此类信息存储、 传输或显示装置内表示成物理(电子)量的数据。本发明的某些方面包括本文中以算法形式阐述的过程步骤及指令。应注意,本发明的过程步骤及指令可包含于软件、固件或硬件中,且当包含于软件中时,可下载驻存于由实时网络操作系统所使用的不同平台上并可自所述不同平台运行。本发明还涉及一种用于实施本文所述操作的设备。此设备可特别针对所需目的来构造,或其可包括通用计算机,由存储于所述计算机中的计算机程序来有选择地启动或重新配置。此种计算机程序可存储于计算机可读存储媒体中,例如(但不限于)任一磁盘类型(包括软盘、光盘、CD-ROM、磁光盘)、只读存储器(ROM)、随机存取存储器(RAM)、EPR0M、 EEPR0M、磁卡或光卡、应用专用集成电路(ASIC)、或适于存储电子指令并分别耦接至计算机系统总线的任一媒体类型。此外,本说明书中所指的计算机可包括单个处理器或可为采用多个处理器设计来增强计算能力的架构。本文中所提供的算法及显示并非与任一特定计算机或其他设备固有地相关。各种通用系统均可与根据本文教示内容的程序一起使用,或者可证明便于构造更专门的设备来实施所需方法步骤。根据上文说明将看出各种这些系统的所需结构。另外,本发明并不是参照任一特定编程语言加以阐述。将了解,可使用多种编程语言来构建本文中所述的本发明教示内容,且对专用语言的任何提及均旨在揭示本发明的授权及最佳模式。最后,应注意,本说明书中所使用的语言原则上是出于易读和说明目的而选取,而可能不是为了刻化或限定本发明的标的物而选取。因此,本发明的揭示内容旨在例示而非限制本发明的范围。
权利要求
1.一种用于在数字地图上对若干标的加标签的方法,所述方法包括确定所述若干标的的每一者关于一文档语料库的提及次数,所述提及次数指示所述标记在所述语料库中出现的频率;根据所述标的的所述提及次数来将一优先权与所述若干标的的每一者相关联;及呈现一包含至少一些所述若干标的的数字地图,每个标的包含一标签,所述标签具有一外观,所述外观反映与所述被加标签的标的相关联的所述优先权。
2.如权利要求1所述的方法,其中具有第一优先权的第一标的包含一具有一粗体外观的标签,且具有低于所述第一优先权的第二优先权的第二标的包含一不具有粗体外观的标签。
3.如权利要求1所述的方法,其中每个标的是一城市。
4.如权利要求1所述的方法,其中每个标的是一乡村。
5.如权利要求1所述的方法,其中每个标的是一机场。
6.一种用于在数字地图上对城市加标签的方法,所述方法包括确定复数个城市中的每一者的优先权得分,所述优先权得分是根据所述城市在一文档语料库中出现的频率来确定的;根据所确定的优先权得分对每个城市划分种类;及呈现一包含至少一些所述城市的数字地图,每个所包含的城市具有一标签,所述标签的外观至少部分的由所述城市属于的所述类别来确定。
7.如权利要求6所述的方法,其中优先权得分低于一阈值的城市不包含在所述被呈现的地图中。
8.如权利要求7所述的方法,其中所述阈值根据一用户的输入而可变。
9.如权利要求6所述的方法,其中所述语料库中的所述文档是网页。
10.如权利要求6所述的方法,其中所述语料库中的所述文档是客户记录,每个客户记录包含所述客户所位于的城市。
11.如权利要求6所述的方法,其中为一城市确定所述优先权得分进一步包含根据所述城市的人口来权重所述城市在所述语料库中出现的频率。
12.如权利要求6所述的方法,其中所述语料库中的每个文档具有一年龄,且为一城市确定所述优先权得分进一步包含根据所述城市出现的所述文档的所述年龄来权重所述得分。
13.如权利要求6所述的方法,其中所述语料库包括对一搜索引擎的查询。
14.如权利要求6所述的方法,其中所述语料库中的每个文档是用相同的语言来书写
全文摘要
本发明涉及地图目标的自动优先化。本发明通过为考虑要显示在地图上的城市列表中的每一城市指配优先权来实现自动地图生成。地图绘制引擎确定每一城市的提及计数,所述提及计数指示所述城市多频繁地出现在一个或一个以上文档语料库中。根据所述提及计数,并视情况根据例如人口数及政治重要性等其他数据,为每一城市指配优先权得分。然后,根据所述城市的优先权得分来将每一城市指配到复数个类别中的一个类别。然后,生成地图,其包括来自规定的最高数目的类别的城市。在一个实施例中,以比下一最高得分类别中的城市更显著的方式(例如以大写字母、粗体字型等等)来呈现具有较高得分的类别中的城市。
文档编号G01C21/32GK102175255SQ20111002638
公开日2011年9月7日 申请日期2005年7月22日 优先权日2004年7月23日
发明者埃里克·韦尔斯, 戴维·亨金斯, 理查德·波彭 申请人:德卡尔塔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1