源搜索引擎的制作方法

文档序号:6455282阅读:180来源:国知局
专利名称:源搜索引擎的制作方法
源搜索引擎
要求其全部内容通过引用包括于此的美国临时专利申请No. 60/747,735 (于2006年5月19日提交于美国专利商标局)的优先权。
背景
随着计算机、信息网络、以及因特网的演进,用户己可访问大量的文档。 例如,因特网用户可访问来自遍布全世界的海量资源的网页。随着文档和/或内 容量随着时间迅速增长,用户定位关于他们所感兴趣的主题的相关文档已经变 得困难。
因此,伴随着因特网和其他网络(例如,内联网)的出现,开发出了搜索 引擎。搜索引擎允许用户输入搜索项并能够从这些搜索项接收去往文档的索引
(例如,因特网链接)。这些索引可以是指示用户的web浏览器通过因特网下 载感兴趣的文档(例如,网页)的因特网链接的形式。
然而,许多搜索引擎有诸多能力上的缺陷,从而可能导致搜索引擎效率低 下。例如,当用户输入搜索项(例如,"HIV")时,搜索引擎可产生许多与 该搜索项的主题有关的页面。然而,由于可能存在海量的与该搜索项相关联的 文档,因此搜索引擎可能试图将找到的文档的相关度分级以向用户提供对他们 而言可能最感兴趣的文档的访问。遗憾的是, 一些引擎可能使用不一定向用户 提供最可信和最相关的信息的程序(例如,算法)。因此,虽然一些搜索引擎 可能帮助用户定位网页,但这些搜索引擎可能在提供和帮助用户定位对用户最 有用的文档或信息上仍然效率较低。例如,如果用户向搜索引擎输入搜索项
"HIV",结果的量可能是惊人的,而用户最初可见的结果相关度可能是非常 有限的。
因此,许多搜索引擎的一个限制是它们对文档相关度进行分级的方式(即, 它们在搜索引擎结果中出现的次序)。从搜索引擎的搜索产生的文档的分级可 能呈现随机性。相关度可以基于用户链接到该页面的量、与该页面相关联的链接的量、或其它经验手段。然而,许多搜索引擎并不使用网络上所能访问的文 档的、可使得搜索引擎得到可靠相关性分级的实质相关度特性。例如,许多搜 索引擎并未使用文档的源(例如,作者)作为将搜索引擎结果的相关度分级的 因素。
概要
实施例涉及一种方法,包括从接口 (例如,个人计算机上的web浏览器) 接收至少一个搜索项(例如,HIV)。该方法可从网络搜索包括该搜索项的至 少一部分的文档(例如,网页)。该方法可确定文档的源(例如,诸如国家地 理或国家寻问者等新闻出处)并基于源将文档分类。相应地,根据实施例,搜 索引擎可实现一种使用文档的源从而基于源来评定搜索结果的资格(例如,分 类)的方法。例如,从国家地理(常被认为可信新闻源)发布的关于论题"HIV" 的文章将被给予比由国家寻问者(常被视为可不靠新闻源)发布的文章更多的 相关度。
通过基于源将文档分类,可向用户提供更为相关的搜索结果。在实施例中, 具有使用源来针对相关度进行分类的搜索引擎的图形用户接口可得到对最终 用户有用的更为相关的搜索结果。在实施例中,来自搜索引擎的搜索结果可通 过向用户列出源来增强。根据实施例,源可以连同搜索结果一起指示。根据实 施例,用户可选择源从而将用户导航至基于源而言与其最为相关的文档。相应 地,根据实施例,使用源搜索引擎可允许用户对于因特网上日益增长的海量可 用文档具有更高效的访问。
附图
示例图l-9示出了根据实施例包括示例输入和输出的源搜索引擎接口。 示例图9-15示出了根据实施例可由源搜索引擎执行的过程的框图流程图。 示例

图16-19示出了根据实施例的用户接口与网络之间的交互的框图。
描述
示例图l-9示出了根据实施例的源搜索引擎的示例接口。搜索引擎18可被包括在计算机硬件(例如,服务器、个人计算机、或其它电子设备)中。用 户终端(例如,具有web浏览器的个人计算机、具有图形用户接口的服务器、 具有小键盘输入的蜂窝电话、或其它计算接口机制)可通过网络16 (例如,因 特网、内联网、或其他计算机网络)连接至搜索引擎或直接连接到搜索引擎18。 搜索项输入10可被输入到用户终端14中。同样,搜索输出20可从用户终端 14输出。
示例图1示出了响应于输入一搜索项输出一文档列表的源搜索引擎。窗口 12是用户终端14上用户接口——在那里输入一搜索项(例如,"HIV")—— 的示例屏幕截图。在该搜索项通过网络16从用户终端14被传送到搜索引擎18 之后,搜索结果(例如,文档形式的结果)可通过搜索输出20从用户终端14 输出。窗口22示出了响应于搜索项"HIV"通过源搜索引擎输出的相关文档的 示例屏幕截图。如窗口 22中所示,题为"HIV历史"的文档最先出现在文档 列表中,其后跟随题为"HIV药物分析"的文档,而其后跟随题为"HIV来自 外星人"的文档。根据实施例,这些示例搜索结果以基于各文档的源的相关度 被排序。
示例图2类似于示例图1中所示的实施例。然而,搜索输出20可具有包 括伴随文档标题一起的文档的源的指示的窗口 24。例如,题为"HIV历史"的 文档被指示为来自期刊国家地理。同样,题为"HIV药物分析"的文档被指示 为来自政府源国家卫生研究所(NIH)。此外,题为"HIV来自外星人"被指 示为源自期刊国家寻问者。可用来对相关度进行排序的文档的源的指示可帮助 用户针对他们的兴趣选择最相关的文档。
在图1和2中所示的实施例中,文章标题可包括可通过网络来访问的到这 些文档的链接。
示例图3示出了类似于图1和2中示出的实施例的实施例,然而搜索项输 入IO和搜索输出20允许用户在搜索项输入10中指示源。如窗口 26中所示, 源搜索引擎允许输入搜索项和用户感兴趣的源。在窗口 26中所示的示例中, 搜索项是"HIV"且源被指示为"国家地理"和"NIH"。如示例窗口 28中所 示的,所列的文档仅来自源国家地理和NIH。在实施例中,在窗口26中输入 的源可被考虑为预先限定的源,以允许用户限定哪些信息源可被用来输出最相
7关的搜索结果。在实施例中,搜索引擎可替换被视为与用于输出相关搜索结果 的这些输入源等价的其它源。
示例图4示出了类似于示例图1-3中所示的实施例的实施例,然而搜索输
出20输出源结果来代替文档结果。如示例窗口 30中所示的,基于搜索项"HIV" 的输入,源结果被输出。在该示例中,来自搜索项"HIV"的源结果被指示为 "国家地理"、"国家卫生研究院"、以及"国家寻问者"。在实施例中,用 户可选择其中一个源以查看来自该源的文档列表。各个源可基于各源的已建立 可信度、各源可访问的文档数目、各源的其它实质性预定特性、其它经验数据、 和/或因素组合来排序。在实施例中,由于用户可选择源,所以用户能够访问与 其需求最相关的文档。
示例图5示出了与图4中所示的实施例相类似的实施例。如窗口 32所示, 源结果的输出可给出与源相关联的文档的其它信息。例如,在源结果中,可以 有与该源相关联的文档的数目的指示。例如,在窗口 32中,指示有两篇文档 与从搜索项"HIV"得到的期刊"国家地理"相关联。同样,指示有一篇文档 来自源"国家卫生研究院"以及一篇文档来自源"国家寻问者"。同样,在图 6中,窗口34中所示的源结果可指示源的资格水平。例如,窗口34中的源结 果将国家地理和国家卫生研究院显示为"高资格",而国家寻问者被指示为具 有"低资格"。对于将某物评定资格为高或低或某一标度的确定可以基于来自 用户的反馈、搜索引擎算法中使用的实质确定、和/或经验数据。经验数据的示 例可以是对来自该源的文章的访问量、访问方式、观看文档的时间花费、和/ 或其它因素。
示例图7示出了与示例图l-6中所示的实施例相类似的实施例,其中搜索输 出包括对源以及与源相关联的文档这两者的指示。如窗口 36所示,可选择源 以显示与该源相关联的文档列表。在该示例中,源"国家地理"被选择以显示 题为"HIV历史"和"HIV在非洲的影响"的文章。尽管源"国家卫生研究院" 和"国家寻问者"可能未被选择,但它们作为源结果仍是可见的。与图7中所 示的实施例类似,图8中所示实施例可显示与源结果相关联的所有文档、或选 定文档或最合资格的文档。
源可包括创作文档的人、文档中援引的人、创作文档的实体(例如,公司、机构、政府实体、或任何其它组织)、文档中援引的实体、和/或与搜索项相关 联的任何其它人(和/或实体)。在实施例中,可用算法按重要性(例如,与文 档相关联的频率、发布文档的媒体出处的可信度、与文档相关联的组织的可信 度等)顺序将各源排序。
示例图9-15示出了根据实施例可在搜索引擎中实现的算法。本领域的普 通技术人员将认识到,可对算法作出修改而不会背离实施例的精神实质。如示
例图9中所示的,搜索引擎可从接口接收搜索项(框40)。搜索引擎可从网络 搜索文档(框42)。搜索引擎可确定各文档的源(框44)。搜索引擎可基于 源将文档分类(框46)。搜索引擎可将搜索结果输出到接口 (框48)。
在图10中所示的实施例中,基于源的文档分类可包括基于源确定文档的 相关度(框50)。如在示例图ll中所示的,基于源的文档分类可包括基于源 和搜索项确定文档的相关度(框52)。如示例图12中所示的,根据实施例, 基于源的文档分类可包括对源进行限定(框54)和/或基于源确定文档的相关 度(框56)。
图13-15中所示的实施例,搜索结果向接口的输出可以不同方式来完成。 如示例图13中所示的,搜索结果可通过向接口输出文档的标识(框58)来输 出到接口,这与示例图l相类似。如示例图14所示的,搜索结果向接口的输 出可包括向接口输出源的标识(框60),这与示例图3-6相类似。如示例图 15所示的,向接口输出搜索结果可包括向接口输出源和文档的标识(框62), 这与示例图7-8相类似。
示例图16-18示出了根据实施例的用户接口 64与网络66之间的交互。如 示例图16中所示的,搜索项可被输入到用户接口 64,随后通过网络66被传达。 网络可与搜索引擎交互以向用户接口 64输出文档列表,随后被显示给用户。 如示例图17中所示的,根据实施例,可向用户接口 64输入搜索项。用户接口 可通过网络66将该搜索项传达给搜索引擎,由此向用户接口 64输出将被显示 给用户的源列表。如示例图18中所示的,可向用户接口 64输入搜索项。搜索 项可从用户接口 64被传达给网络66。网络66可包括向用户接口 64输出将被 显示给用户的源和文档列表的搜索引擎。
示例图19示出根据实施例的与用户接口 68的用户交互。如所示的,用户
9可向用户接口 64输入搜索项。用户接口可根据实施例输出源列表。用户可从
源列表中向用户接口 68输入源以致使文档列表的显示。在实施例中,用户从
源列表中选择源并非是必要的。在实施例中,源列表包括文档列表。本领域的 普通技术人员将认识到源列表和文档列表以及搜索项及用户所选的源的各种 组合以从搜索引擎接收最相关的文档。
各实施例涉及包括从接口接收至少一个搜索项的方法。在实施例中,接口 可以是因特网接口。在实施例中,接口可以是内联网接口。在实施例中,接口 可以是允许输入搜索项的各种其它类型的计算机接口或个人接口 。在实施例 中,搜索项可包括字和/或文件输入。输入字可包括要搜索的项、源列表、或其 他相关信息。
实施例涉及包括从网络搜索包括输入搜索项的至少一部分的文档的方法。 在实施例中,网络可以是因特网。在实施例中,网络可以是内联网。在实施例 中,网络可以是包括开放网络或封闭网络的任何类型的计算机网络。在实施例 中,搜索引擎可以是源搜索引擎和/或其它类型的搜索引擎。在实施例中,网络 可以是设计成帮助寻找存储在计算机系统上的信息的信息检索系统。
在实施例中,文档可包括网页。在实施例中,文档可包括发布的文章。在 实施例中,文档可包括音频剪辑。在实施例中,文档可包括视频剪辑。在实施 例中,文档可包括物理文档。在实施例中,文档可包括电子文档。在实施例中, 文档可包括网络上可访问或可标识的任何其它类型的内容。
实施例涉及包括确定文档的源的方法。在实施例中,源可以是创作文档的 个人。在实施例中,源可以是发布文档的个人。在实施例中,源可以是文档中 援引的个人。在实施例中,源可以是与搜索项相关联的个人。在实施例中,源 可以是创作文档的组织。在实施例中,源可以是发布文档的组织。在实施例中, 源可以是文档中援引的组织。在实施例中,源可以是与搜索项相关联的组织。
实施例涉及包括基于文档的源将文档分类的方法。在实施例中,方法可包 括基于文档的源确定文档的相关度。在实施例中,基于文档的源确定文档的相 关度可被包括在基于文档的源将文档分类中。在实施例中,确定文档的相关度 可基于文档的源。在实施例中,确定相关度可基于文档的匹配质量。在实施例 中,确定文档的相关度可基于文档的源和文档的匹配质量。在实施例中,确定文档的相关度可包括限定文档的源。限定文档的源可以 经验地(例如,文档和相关文档的统计分析)来执行。在实施例中,文档的限 定可基于用户输入或搜索引擎参数。用户输入可包括用户最感兴趣的预先限定 的源。在实施例中,搜索引擎可使用预先限定的源的等价物来寻找相关文档。 在实施例中,用户接口可以从确定的最相关到确定的最不相关的次序来显示文 档列表。
在实施例中,接口可以基于源的相对资格的方式输出文档的源的标识。在 实施例中,更加合资格的源可被列在不太合资格的源之前。在实施例中,文档 可按源来分组。
在实施例中,文档可作为可选源被输出到用户接口。用户可选择源以允许 输出与该被选择的源相关联的文档。
在实施例中,评定源的资格可基于源的声誉。在实施例中,源的声誉可基 于创作该源的文档的人的信誉。在实施例中,源的声誉可基于从该源发布的文 档的人的信誉。在实施例中,源的声誉可基于来自该源的文档中援引的人的信 誉。在实施例中,源的声誉可基于来自该源的文档中与搜索项相关联的人的信 誉。在实施例中,源的声誉可基于来自源的所创作的文档的组织的信誉。在实 施例中,源的声誉可基于从源发布文档的组织的信誉。在实施例中,源的声誉 可基于源的文档中援引的组织的信誉。在实施例中,源的声誉可基于来自源的 文档中与一个搜索项相关联的组织的信誉。本领域的普通技术人员将认识到可
指派源的声誉的其他方式。
在实施例中,评定文档的源的资格可基于在搜索期间所找到的来自该源的 文档的相关量。在实施例中,评定文档的源的资格可基于该源是至少一个优选 源之一。优选源的实施例可由管理员用算法指派到搜索引擎或者可由搜索引擎 的特定用户确定。
以上实施例(例如,源搜索引擎)和优点仅是示例性的,而不应被理解为 限制所附权利要求。如本领域的普通技术人员所认识到的,以上教义也可应用 于其他装置和方法。许多替换方案、修改、和变形对于本领域的技术人员将是 显而易见的。
权利要求
1. 一种方法,包括从接口接收至少一个搜索项;从网络搜索包括所述至少一个搜索项的至少一部分的文档;确定所述文档中每一个的源;以及基于所述文档的源将所述文档分类。
2. 如权利要求l所述的方法,其特征在于 所述接口是互联网接口和内联网接口中的至少一者;以及 所述网络是互联网和内联网中的至少一者。
3. 如权利要求1所述的方法,其特征在于,所述搜索网络是通过搜索引 擎来执行的。
4. 如权利要求l所述的方法,其特征在于,文档包括以下至少一项 网页;发布的文章; 音频剪辑; 视频剪辑; 物理文档;以及 电子文档。
5. 如权利要求l所述的方法,其特征在于,所述源是以下至少一项 创作文档的人;发布文档的人; 文档中援引的人;与所述至少一个搜索项相关联的人;创作文档的组织;发布文档的组织;文档中援引的组织;以及与所述至少一个搜索项相关联的组织。
6. 如权利要求1所述的方法,其特征在于,包括至少基于所述文档的源确定所述文档的相关度。
7. 如权利要求6所述的方法,其特征在于,所述确定所述文档的相关度 是基于所述文档的源和所述文档与所述至少一个搜索项的匹配质量。
8. 如权利要求6所述的方法,其特征在于,所述确定所述文档的相关度 包括评定所述文档的源的资格。
9. 如权利要求8所述的方法,其特征在于,包括以基于所述文档的相对相关度的方式向所述接口输出所述文档的标识。
10. 如权利要求9所述的方法,其特征在于,所述基于所述文档的相对相 关度的方式包括以从最相关到最不相关的次序列出所述文档。
11. 如权利要求8所述的方法,其特征在于,包括以基于所述源的相对资 格的方式向所述接口输出所述文档的源的标识。
12. 如权利要求11所述的方法,其特征在于,所述基于源的相对资格的 方式包括以从最合资格到最不合资格的次序列出各源。
13. 如权利要求11所述的方法,其特征在于,包括以基于所述源的相对 资格的方式向所述接口输出按所述源分组的文档的标识。
14. 如权利要求ll所述的方法,其特征在于,所述输出包括 输出所述文档的至少一个源; 接收对所述至少一个源中至少一个的选择;以及 输出与所述至少一个被选源相关联的所述文档中的至少一篇。
15. 如权利要求14所述的方法,其特征在于,所述输出所述文档的所述 至少一个源包括输出所述至少一个源的资格特性。
16. 如权利要求8所述的方法,其特征在于,所述评定所述文档的源的资 格是基于所述源的声誉。
17. 如权利要求16所述的方法,其特征在于,所述源的声誉是基于以下 至少一项创作文档的人的信誉; 发布文档的人的信誉; 文档中援引的人的信誉; 与所述至少一个搜索项相关联的人的信誉;创作文档的组织的信誉; 发布文档的组织的信誉; 文档中援引的组织的信誉;以及 与所述至少一个搜索项相关联的组织的信誉。
18. 如权利要求8所述的方法,其特征在于,所述评定所述文档的源的资 格是基于在所述搜索期间寻找到的来自所述源的文档的相关量。
19. 如权利要求8所述的方法,其特征在于 所述至少一个搜索项包括至少一个优选源;以及所述评定所述文档的源是基于所述源是所述至少一个优选源之一。
20. —种装置,配置成 从接口接收至少一个搜索项;从网络搜索包括所述至少一个搜索项的至少一部分的文档; 确定所述文档中每一个的源;以及 基于所述文档的源将所述文档分类。
全文摘要
一种方法,包括从接口(64)(例如,个人计算机上的web浏览器)接收至少一个搜索项(例如,HIV)。该方法可从网络(66)搜索包括该搜索项的至少一部分的文档(例如,网页)。该方法可确定文档的源(例如,诸如国家地理或国家寻问者等新闻出处)并基于源将文档分类。搜索引擎可实现一种使用文档的源从而基于源来评定搜索结果的资格(例如,分类)的方法。
文档编号G06F7/00GK101501631SQ200780023184
公开日2009年8月5日 申请日期2007年5月18日 优先权日2006年5月19日
发明者约恩·吕森根 申请人:约恩·吕森根
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1