聚合联合平台的制作方法

文档序号:6456587阅读:283来源:国知局
专利名称:聚合联合平台的制作方法
聚合联合平台
鹏斩青做X,
本申请要求2006年11月28日递交的题为"AGGREGATION SYNDICATION PLATFORM"的美国专利申请No.l 1/605,810的权益,该 在先申请的全部内容通过弓I用被结合于此。
駄舰
本发明一般地涉及用于利用传感器处理数据并访问来自服务器的数据 的系统和方法。
背景技术
当用户访问来自因特网或甚至私有内联网的数据时,被访问的数据一 般以不同的格式存储在各种不同的位置。基于数据存储在何处以及数据具 有何种格式,访问数据的用户可以被限制为仅基于非常有限并且非常特定 的搜索来访问数据。另外,如果用户寻找关于地理位置的数据,该数据可 能不包含地理标识符(更普遍地称之为"地理码"(geocode))。
例如,如果用户希望定位一特定地理区域中的住宅,用户则可以容易
地搜索这些住宅,但是将只有具有针对可搜索性被适当格式化的列表项
(listing)的住宅被提供给用户。很多住宅列表项可能无法被用户获得。
另外,如果用户希望只被告知距离公共交通步行距离之内的住宅,用户则
必须执行附加搜索。当然,仍旧存在这样的问题,不是所有公共交通位置 都将具有针对容易的可搜索性被适当格式化的位置信息。在运行两个单独
的搜索之后,用户面临如下艰巨任务,即,确定那些住宅处于公共交通的 步行距离之内。
再比如,假设用户不仅希望搜索住宅,还希望知道在搜索到的任意住 宅附近是否曾经发生任何犯罪行为。虽然用户可能很容易搜索到一地理区域中的住宅,但是通过阅读本地报纸的网站来确定何处曾发生犯罪行为的 做法是非常耗时的。因此,存在对于能够针对易搜索性来标准化数据并对 数据进行地理编码的系统和方法的需求。

发明内容
为了满足上述需求,也为了克服现有技术中存在多个缺陷和其他限 制,本发明提供了一种用于处理多个辅助数据集合的系统和方法。这些辅 助数据集合包括来自多个源的数据,所述多个源包括第一、第二和第三方 源。例如,这些辅助数据集合可以包括来自任意传统因特网或内联网站点
的数据,但是也可以包括来自目录服务(例如由加州桑尼维尔的Yahoo!公 司提供的目录服务)的数据以及来自最终用户计算机的数据。
该系统包括处理器;与处理器通信的存储单元,用于存储主要数据集 合;以及具有一组处理器可执行指令的存储器单元。所述处理器可执行指 令将处理器配置用于(a)聚合所述辅助数据集合,以形成包含所述辅 助数据集合的主要数据集合;(b)联合所述主要数据集合中的每个所述 辅助数据集合,以对每个所述辅助数据集合的格式进行标准化;以及 (c)利用地理码对所述主要数据集合中的每个所述辅助数据集合进行地 理编码。所述地理码指示与所述辅助数据集合中包含的信息相关的地理位
另外,本发明还提供了用于从服务器访问多个辅助数据集合的系统和
方法。该系统包括与服务器通信的具有处理器的客户端;与服务器通信
的用于存储主要数据集合的存储单元;与服务器通信的存储器单元,该存 储器单元具有一组处理器可执行指令。所述处理器可执行指令将处理器配
置用于标识至少一个感兴趣的地理位置;标识至少一个感兴趣的类别; 将所述至少一个感兴趣的地理位置和所述至少一个感兴趣的类别传输到所 述服务器。此后,处理器从服务器接收至少一个辅助数据集合,该至少一 个辅助数据集合具有与先前传输的至少一个感兴趣的类别相关的至少一种 类别类型以及与先前传输的至少一个感兴趣的地理位置相关的地理码。 在通过参考附图和权利要求而阅读以下描述之后,本发明技术人员将更容易理解本发明的更多目的、特征和优点,其中所附附图和权利要求构 成本说明书的一部分。


图1示出一系统,其用于利用服务器处理并从服务器访问辅助数据集合.
图2是示出处理多个辅助数据集合的方法的流程图;以及 图3是示出访问辅助数据集合的方法的流程图。
参考图1,结合网络22、客户端24和服务器26示出了用于聚合和联 合数据的系统10。系统10包括内容聚合/联合平台(CASPER)服务器 12,其与存储设备14通信。应该理解,存储设备14可以集成在CASPER 服务器12中或者如图所示与CASPER服务器12相分离。存储设备14可 以是磁存储设备、光存储设备、固态存储设备或任意适合于存储电子信息 的存储设备。
CASPER服务器12包括处理器16,其与存储设备14和存储器单元 18通信。如下文在详细描述中将说明的,存储器单元18包含指令集合, 用于配置处理器对数据进行聚合、联合、地理编码,以及可选地,进行分 类和/或重复数据删除。
同样与处理器16通信的还有网络接口 20。网络接口 20使得系统10 能够与网络22通信。网络22可以是因特网或者可以是私有内联网,或者
是公共和私有网络的任意组合。
系统10 —般经由连接到web服务器26的客户端24来访问。客户端 24可以是通用计算机或者可以是能够访问电子数据的专用设备。Web服 务器26具有连接到网络22的网络接口 28。例如,客户端24可以向web 服务器26发送HTTP请求(在附图中用箭头30指示)。Web服务器26 随后向CASPER服务器12发送CASPER请求(箭头32) 。 CASPER服务 器12随后向存储设备14发送结构化査询语言(SQL)请求(箭头33)。
9在响应时,存储设备14利用一对象作为响应(箭头35)。系统10的 CASPER服务器12随后向web服务器26发送RSS响应(箭头34)。最 后,web服务器26向客户端24发送HTML返回信号(箭头36)。可替 换地,客户端24可以使用web浏览器,该web浏览器运行其自己的嵌入 式RSS客户端。如果是这种情况,CASPER服务器12则可以生成 geoRSS,该geoRSS被直接提供到运行在客户端24上的浏览器,以用于 直接应用。
参考图1和2,用于聚合、联合、地理编码和(可选地)分类数据和/ 或进行重复数据删除的方法40被示出。方法40可以被实现为处理器可执 行指令的集合,该指令集合存储在存储器单元18中以用于被系统10的处 理器16所执行。当然,应该理解,方法40可以被存储在任意计算机可读 介质中。
在步骤42中,辅助数据集合被聚合以形成主要数据集合,该主要数 据集合包含多个辅助数据集合。这些辅助数据集合可以包括来自第一方、 第二方或第三方源的数据。例如,辅助数据集合可以包括来自已经分类的 第一方源(例如由加州桑尼维尔的Yahoo!公司提供的目录服务)的数 据。另外,辅助数据集合可以来自第三方源,例如在因特网上找到的任意 源。最后,辅助数据集合可以来自第二方源,例如存储在客户端24上的 数据。存储在客户端24上的数据可以包括电子邮件信息、日历信息或存 储在客户端24上的任意其他数据。
如步骤44所示, 一旦辅助数据集合被聚合成主要数据集合,辅助数 据集合就随后被联合。聚合步骤对辅助数据集合进行编辑以形成主要数据 集合。联合步骤按允许可搜索性和可访问性的标准化格式对主要数据集合 中的辅助数据集合进行格式化,同时使访问和搜索辅助数据集合所需的处 理器周期的数目最小化。
可选地,在步骤45中,可以对主要数据集合中的辅助数据集合进行 重复数据删除。重复数据删除可删除任意不必要的重复数据集合,以使得 辅助数据集合的数目最小化。这样一来,存储设备14所需的存储量最小 化。可选地,在步骤46中,主要数据集合中的辅助数据集合随后可以被分类到各种类别中。这些类别本质上可以是分层的。例如,这些类别可以
被最好地视为无环有向图(acyclic directed graph),其中顶点是类别项目 而边指示"包含"关系,某一 "根"顶点指示分类从其开始的起始点。这 些类别还可以包括预定义的类别,例如商业列表项、事件、景点、天气、 新闻、体育、电影、个人信息、汽车、购物和房地产。当然,也可以考虑 附加类别。
在步骤48中,主要数据集合中的辅助数据集合随后被地理编码。地 理码是标识关于辅助数据集合中的信息的地理位置的一种代码。例如,假 设将被地理编码的辅助数据集合包含关于特定地址处的事件的信息。地理 码将被添加到辅助数据集合,从而提供该事件的经度和纬度位置。地理码 还可以包括海拔值,从而有助于指示与该事件相关的海拔。例如,海拔值 可以指示事件发生在建筑物的哪一层。
通过执行上述方法40,来自多个源的数据可以被聚合、联合(以统 一格式收集和放置)、删除重复数据、分类和地理编码。方法40的执行 允许客户端24容易地搜索和访问相关的辅助数据集合。
参考图1和3,用于从系统IO访问辅助数据集合的方法50被示出。 方法50 —般是处理器可执行的方法,其可以被存储在任意计算机可读介 质上。方法50的步骤可以按任意合适的方式执行。例如,操作客户端24 的用户可以在网页或其他用户界面中输入信息。在动作之后,网页被客户 端24发送到服务器26以进行进一步的处理。
在步骤52中,客户端24的用户标识感兴趣的地理区域。该感兴趣的 地理区域可以是特定地址,或者可以是经度和纬度坐标,或者可以是任意 其他合适的位置标识信息或数据。接下来,如步骤54所示,客户端24的 用户标识感兴趣的类别。该感兴趣的类别可以包括商业列表项、事件、景 点、天气、新闻、体育、电影、个人信息、汽车、购物和房地产。
在步骤56中,客户端24与CASPER服务器12的处理器16通信。所 通信的信息包括感兴趣的地理区域和感兴趣的类别。这可以通过从客户端 24 (箭头30)向web服务器26发送HTTP请求来实现。此后,web服务 器向系统10发送CASPER请求(箭头32)。在步骤58中,客户端24从CASPER服务器12接收具有分别与感兴 趣的类别和感兴趣的地理区域相关的类别类型和地理码的辅助数据集合。 例如,响应于从客户端24接收到HTTP请求,CASPER服务器12通过向 存储设备14发送SQL请求(箭头33)以及从存储设备14接收对象(箭 头35)来访问存储在存储设备14上的相关辅助数据集合。应该理解,这 仅仅是访问存储设备14的一种方式,用于访问存储设备14的任意合适的 方法都可以被利用。
此后,CASPER服务器12向web服务器26发送真实简单联合 (RSS)响应(箭头34)。此后,web服务器26向客户端24发送HTML 返回信号(箭头36) 。 HTML返回信号(箭头36)包含具有分别与感兴 趣的类别和感兴趣的地理区域相关的类别类型和地理码的辅助数据集合。
为了更好地说明方法50,提供以下示例。假设客户端24的用户是在 密歇根州安阿伯的密歇根大学的研究生。客户端24的用户需要(1) 一住 宅,该住宅应(2)在安阿伯城内,(3)在公共交通的步行距离之内,并 且(4)位于很少有犯罪事件发生的地点。客户端24的用户标识出感兴趣 的地理区域(密歇根州安阿伯并且在公共交通的步行距离之内)和感兴趣 的类别(住宅以及犯罪事件)。感兴趣的地理区域和感兴趣的类别随后被 发送到系统10。由于系统10已经对来自多个不同源的辅助数据集合进行 了聚合、联合、分类和地理编码,因此系统10能够快速搜索和访问相关 辅助数据集合。系统10随后将相关辅助数据集合传输到客户端24。相关 辅助数据集合将包括位于密歇根州安阿伯并且在公共交通的步行距离之内 的住宅的辅助数据集合,同时还提供关于感兴趣的那些地理区域内的任意 犯罪事件的信息。
如本领域技术人员将容易意识到的,以上描述希望说明本发明的原理 的实现方式。该描述不希望限制本发明的范围或应用,因为在不脱离本发 明的精神的情况下容易对本发明进行修改、变化和改变,如所附权利要求 书所限定的。
权利要求
1.一种用于处理多个辅助数据集合的方法,该方法包括以下步骤聚合所述辅助数据集合,以形成包含所述辅助数据集合的主要数据集合;联合所述主要数据集合中的每个所述辅助数据集合,以对每个所述辅助数据集合的格式进行标准化;以及利用地理码对所述主要数据集合中的每个所述辅助数据集合进行地理编码,所述地理码指示与所述辅助数据集合中包含的信息相关的地理位置。
2. 如权利要求1所述的方法,其中所述辅助数据集合包含来源于第一 方源、第二方源和第三方源中的至少一个的信息。
3. 如权利要求1所述的方法,还包括按至少一种类别类型对每个所述 辅助数据集合进行分类的步骤。
4. 如权利要求3所述的方法,其中所述至少--种类别类型按分层结构 布置。
5. 如权利要求4所述的方法,其中所述分层结构是无环有向图,其屮 所述无环有向图包括具有类别项目的顶点和指示关系的边。
6. 如权利要求1所述的方法,还包括对所述主要数据集合屮的所述辅 助数据集合进行重复数据删除的步骤,用于删除重复的辅助数据集合。
7. 如权利要求1所述的方法,其中所述地理码包括纬度坐标和经度坐标。
8. 如权利要求7所述的方法,其中所述地理码还包括海拔值。
9. 一种从服务器访问多个辅助数据集合的方法,该方法包括以下步标识至少一个感兴趣的地理位置; 标识至少一个感兴趣的类别;将所述至少一个感兴趣的地理位置和所述至少一个感兴趣的类别传输 到所述服务器,所述服务器具有存储单元,存储包含所述多个辅助数据柒合的主要数据集合,每个所述辅助数据集合具有统一格式、至少一种类别类型和地理码, 所述地理码指示与包含在所述辅助数据集合中的信息相关的地理位置;以 及从所述服务器接收至少一个辅助数据集合,该至少一个辅助数据集合 具有与先前传输的所述至少一个感兴趣的类别相关的至少一种类别类型以 及与先前传输的所述至少一个感兴趣的地理位置相关的地理码。
10. 如权利要求9所述的方法,其中所述辅助数据集合包含来源于第 一方源、第二方源和第三方源中的至少一个的信息。
11. 如权利要求9所述的方法,其中所述至少一种类别类型按分层结构布置。
12. 如权利要求11所述的方法,其中所述分层结构是无环有向图,其 中所述无环有向图包括具有类别项目的顶点和指示关系的边。
13. 如权利要求9所述的方法,其中所述地理码包括纬度坐标和经度 坐标。
14. 如权利要求13所述的方法,其中所述地理码还包括海拔伍。
15. —种用于处理多个辅助数据集合的系统,包括 处理器;与所述处理器通信的存储单元,用于存储主要数据集合; 具有一组处理器可执行指令的存储器单元,所述处理器可执行指令将 所述处理器配置用于聚合所述辅助数据集合,以形成包含所述辅助数据集合的主耍数 据集合;联合所述主要数据集合中的每个所述辅助数据集合,以对毎个所 述辅助数据集合的格式进行标准化;以及利用地理码对所述主要数据集合中的每个所述辅助数据集合进行 地理编码,所述地理码指示与所述辅助数据集合中包含的信息相关的 地理位置。
16. 如权利要求15所述的系统,其中所述辅助数据集合包含来源于第一方源、第二方源和第三方源中的至少一个的信息。
17. 如权利要求15所述的系统,还包括按至少一种类别类型对每个所 述辅助数据集合进行分类的步骤。
18. 如权利要求17所述的系统,其中所述至少一种类别类型按分层结 构布置。
19. 如权利要求18所述的系统,其中所述分层结构是无环有向图,其 中所述无环有向图包括具有类别项目的顶点和指示关系的边。
20. 如权利要求15所述的系统,其中所述处理器可执行指令还将所述 处理器配置用于对所述主要数据集合中的所述辅助数据集合进行重复数据 删除,用于删除重复的辅助数据集合。
21. 如权利要求15所述的系统,其中所述地理码包括纬度坐标和经度 坐标。
22. 如权利要求21所述的系统,其中所述地理码还包括海拔值。
23. —种用于从服务器访问多个辅助数据集合的系统,该系统包括-与所述服务器通信的具有处理器的客户端; 与所述服务器通信的用于存储主要数据集合的存储单元; 与所述处理器通信的存储器单元,该存储器单元具有一组处现器可执行指令,所述处理器可执行指令将所述处理器配置用于 标识至少一个感兴趣的地理位置; 标识至少一个感兴趣的类别;将所述至少一个感兴趣的地理位置和所述至少一个感兴趣的类別 传输到所述服务器,每个所述辅助数据集合具有统一格式、至少一种类别类型和地理 码,所述地理码指示与包含在所述辅助数据集合中的信息相关的地理 位置;以及从所述服务器接收至少一个辅助数据集合,该至少一个辅助数据 集合具有与先前传输的所述至少一个感兴趣的类别相关的至少-'种类别类型以及与先前传输的所述至少一个感兴趣的地理位置相关的地理 码。
24. 如权利要求23所述的系统,其中所述辅助数据集合包含来源于第 一方源、第二方源和第三方源中的至少一个的信息。
25. 如权利要求23所述的系统,其中所述至少一种类别类型按分层结 构布置。
26. 如权利要求25所述的系统,其中所述分层结构是无环有向图,其 中所述无环有向图包括具有类别项目的顶点和指示关系的边。
27. 如权利要求23所述的系统,其中所述地理码包括纬度坐标和经度 坐标。
28. 如权利要求27所述的系统,其中所述地理码还包括海拔值。
29. 在存储有可由被编程的处理器执行的、用于处理多个辅助数据集 合的指令的计算机可读存储介质中,所述存储介质包含用于以下操作的指 令聚合所述辅助数据集合,以形成包含所述辅助数据集合的主要数据集合.联合所述主要数据集合中的每个所述辅助数据集合,以对每个所述辅 助数据集合的格式进行标准化;以及利用地理码对所述主要数据集合中的每个所述辅助数据集合进行地理 编码,所述地理码指示与所述辅助数据集合中包含的信息相关的地理位 置。
30. 如权利要求29所述的指令,其中所述辅助数据集合包含来源于第 --方源、第二方源和第三方源中的至少--个的信息。
31. 如权利要求29所述的指令,还包括按至少—'种类别类型对每个所 述辅助数据集合进行分类的步骤。
32. 如权利要求31所述的指令,其中所述至少一种类别类型按分层结 构布置。
33. 如权利要求32所述的指令,其中所述分层结构是无环有向图,其 中所述无环有向图包括具有类别项目的顶点和指示关系的边。
34. 如权利要求29所述的指令,还包括用于对所述主要数据集合屮的 所述辅助数据集合进行重复数据删除的步骤,用于删除重复的辅助数据集合。
35. 如权利要求29所述的指令,其中所述地理码包括纬度坐标和经度 坐标。
36. 如权利要求35所述的指令,其中所述地理码还包括海拔值。
37. 在存储有可由被编程的处理器执行的、用于从服务器访问多个辅 助数据集合的指令的计算机可读存储介质中,所述存储介质包含用于以下 操作的指令标识至少一个感兴趣的地理位置; 标识至少一个感兴趣的类别;将所述至少一个感兴趣的地理位置和所述至少一个感兴趣的类别传输 到所述服务器,所述服务器具有存储单元,存储包含所述多个辅助数据集 合的主要数据集合,每个所述辅助数据集合具有统一格式、至少一种类别类型和地理码, 所述地理码指示与包含在所述辅助数据集合中的信息相关的地理位置;以 及从所述服务器接收至少一个辅助数据集合,该至少--个辅助数据柒合 具有与先前传输的所述至少一个感兴趣的类别相关的至少一种类别类型以 及与先前传输的所述至少一个感兴趣的地理位置相关的地理码。
38. 如权利要求37所述的指令,其中所述辅助数据集合包含来源于第 一方源、第二方源和第三方源中的至少一个的信息。
39. 如权利要求37所述的指令,其中所述至少一种类别类型按分层结 构布置。
40. 如权利要求39所述的指令,其中所述分层结构是无环有向图,其 中所述无环有向图包括具有类别项目的顶点和指示关系的边。
41. 如权利要求37所述的指令,其中所述地理码包括纬度坐标和经度 坐标。
42. 如权利要求41所述的指令,其中所述地理码还包括海拔值。
全文摘要
一种用于处理多个辅助数据集合的系统和方法,包括聚合辅助数据集合,以形成包含辅助数据集合的主要数据集合;联合主要数据集合中的每个辅助数据集合,以对每个辅助数据集合的格式进行标准化;以及利用地理码对主要数据集合中的每个辅助数据集合进行地理编码,所述地理码指示与辅助数据集合中包含的信息相关的地理位置。
文档编号G06F17/00GK101542467SQ200780044246
公开日2009年9月23日 申请日期2007年10月1日 优先权日2006年11月28日
发明者基思·马洛, 贾斯汀·奥'奈尔 申请人:雅虎公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1