识别和改变个人信息的制作方法

文档序号:6476594阅读:144来源:国知局
专利名称:识别和改变个人信息的制作方法
技术领域
本发明涉及用于促进识别个人信息、改变和/或移除这种信息,以及基 于所识别的信息生成主观的个人声誉得分或评定的方法、系统和装置。
背景技术
自1990年代初以来,使用万维网和因特网的人数已经以很大的速率 增长。当更多的用户通过在网站上注册、以电子方式发表评论和信息,或 简单地与发表关于他人的信息的公司(例如,在线报纸或社交网站)交互, 来利用因特网上可利用的服务时,越来越多的关于用户的信息是在线公开 可利用的。自然地,因为即使是关于大多数临时的因特网用户的在线内容 也可能是有危害的、造成伤害的,或者甚至是虚假的,因此个人、组织和 公司(例如专业人员、家长、大学申请者、求职者、雇主、慈善机构和企 业)已经提高了对处理越来越多的他们在因特网上可利用的信息的认真且 合理的关注。
对在多种专业和/或个人背景中的用户进行评价的过程已经变得对因 特网上的关于该用户的可利用信息的类型和数量日益^:感。用户可能期望
这样的声誉,即,该声誉通常是正面的或负面的或者关于他们的声誉的某一方面是正面的或负面的。用户与另 一个用户的示例性的交互包括如开始 浪漫的关系、提供雇佣或商业机会或者参与金融交易。当关于用户的在线 可利用的信息量增加时,筛选所有的那种信息、评估它的相对重要性、对 它进行分类以及将它综合为对用户的公开、在线、声誉的综合评估的过程 变得更加艰巨。
因此,存在对这样的方法、装置和系统的需要,即,这些方法、装置
的信息不是错误的、污蔑的、诽谤的或以其它方式损害他们的名誉或安宁。 还存在对这样的系统的需要,即,这些系统将允许各方迅速且大致地了解 其它个人、组、组织,和/或公司可如何基于因特网上可利用的关于他们的 信息来认识到他们的声誉。

发明内容
用于分析关于用户的信息的系统、装置和方法被提出,这些系统、装
置和方法包括基于至少一个描述所述用户的搜索词从于数据源获得至少 一个搜索结果;接收所述至少一个搜索结果的合意性的指示;和基于所述 至少一个搜索结果的所述合意性(desirability)来执行动作。
用于确定表示用户的声誉的声誉得分的系统、装置和方法也被提出, 这些系统、装置和方法包括从数据源收集至少一个搜索结果;确定来自 于所述数据源的所述至少一个搜索结果对所述用户的所述声誉的影响;和 基于所确定的来自于所述数据源的所述至少 一个搜索结果对所述用户的 所述声誉的影响,为所述用户计算声誉得分。
用于分析关于用户的信息的系统、装置和方法也^皮提出,这些系统、 装置和方法包括基于描述所述用户的至少一个搜索词获得至少一个搜索 结果;确定所述至少一个搜索结果的相关性;向所述用户呈现所述至少一 个搜索结果;从所述用户接收所述至少一个搜索结果的搜索结果的相关性 或合意性的指示;和基于所述搜索结果的所述合意性执行动作。
在一些实施方式中,这些系统、装置和方法也可包括基于所述
10至少 一个搜索结果确定额外的搜索词,和使用所述额外的搜索词来获得搜 索结果。确定额外的搜索词可被自动地执行和/或由代理人或所述用户执 行。
在一些实施方式中,搜索结果可能是不期望的搜索结果的指示可被接 收。被执行动作可使得在数据源除改变或移除所述不期望的搜索结果,所 述不期望的搜索结果从所述数据源获得。所述不期望的搜索结果可包括关 于所述用户的可能是不正确的或者可能对所述用户的声誉有害的数据。被
执行的动作可包括确定所述不期望的搜索结果是否能够在数据源处被改 变或移除,所述获得不期望的搜索结果从所述数据源获得,和如果所述不 期望的搜索结果可在所述数据源处被改变或移除,那么使得在数据源处改 变、校正或移除所述不期望的搜索结果。
在一些实施方式中,确定所述至少一个搜索结果的相关性可包括确 定所述至少一个搜索结果是否包含与所述用户相关联的信息和/或如果搜 索结果不包含与所述用户相关联的信息那么忽略所述搜索结果。在一些实 施方式中,如果所述至少一个搜索结果不包括与所述用户相关联的信息, 那么排除性的搜索词可被添加至随后的搜索中,其中所述排除性的搜索词 可被设计为排除不包含与所述用户相关联的信息的所述至少一个搜索结 果。
在一些实施方式中,获得至少一个搜索结果可被执行多次,并且额外 的步骤可被执行,例如基于来自于获得步骤的多次执行的至少一个搜索 结果产生搜索排序系统,和基于所述搜索排序系统对另外的搜索结果进行 归类。产生搜索排序系统可通过使用贝叶斯网络而被执行。所述贝叶斯网 络可利用无关指示的语言符号的语料库和相关指示的语言符号的语料库。
在一些实施方式中,所述至少一个搜索结果可被周期地获得。执行获 得步骤的周期可基于用户特征或数据源特征而被确定。
在一些实施方式中,获得至少一个搜索结果可被执行多次并且额外的 步骤可纟皮:执行,例如为当前获得的4叟索结果确定签名、将所述签名与用 于以前获得的搜索结果的以前获得的签名进行比较,和当所述当前获得的 签名与所述以前获得的签名不同时确定所述搜索结果的相关性。在一些实施方式中,确定相关性可包括将所述至少一个搜索结果呈 现给代理人、从所述代理人获得所述至少一个搜索结果的分类的指示,和 基于来自于所述代理人的所述指示自动地对所述至少一个搜索结果进行 分类。
在一些实施方式中,获得所述至少一个搜索结果可包括从如代理人 或用户接收至少一个搜索结果,和确定它的相关性。确定所述搜索结果的 所述相关性可包括从如所述代理人或用户获得所述至少一个搜索结果的 分类的指示,和基于来自于如所述代理人或用户的所述指示自动地对所述 至少 一个搜索结果进行分类。
还提出了系统、方法和装置,其通过从数据源收集数据、确定来自于 所述数据源的所述数据对用户的声誉的影响,和基于来自于所述lt据源的 所述数据对声誉的影响确定所述用户的声誉得分,来确定所述用户的声 誉。在一些实施方式中,所述系统、方法和装置可进一步包括在用户的 请求下将所述声誉得分呈现给第三方以便担保所述用户如所述得分指示 的声誉好,在第三方的请求下将所述声誉得分呈现给所述第三方以便担保 所述用户如所述得分指示的声誉好,其中所述数据源包括如信货机构数据 库、刑事数据库、保险数据库、社交网络数据库,和/或新闻数据库。
在一些实施方式中,确定对声誉的影响可包括根据至少一个搜索结 果的倾向性(mood)和/或重要性对所述至少一个搜索结果的元素进行分 类,和使对声誉的影响基于所述倾向性和/或重要性的分类。在一些实施方 式中,确定对声誉的影响可包括根据正面到负面的标准关联所述至少 一个 搜索结果的元素,和是对声誉的影响基于正面到负面的关联。
在一些实施方式中,确定用户的声誉得分可包括基于来自于所述数 据源的搜索结果对声誉的影响来为所述用户确定至少一个声誉子得分。声 誉子得分的类型可包括任何合适的声誉属性,例如作为雇员、雇主、重 要的其它职业、律师的声誉,或者作为可能的家长的声誉。
附图的简要说明被并入本说明书并且构成了本说明书的 一部分的随附的附图示出了 本发明的实施方式,并且与该描述一起用于解释本发明的原理。在这些附 图中


图1是描绘了用于分析关于用户的信息的示例性的系统的方框图。
图2是描绘了从数据源改变和/或移除有害搜索结果的过程的流程图。
图3是描绘了对搜索结果进行归类(sort)的过程的流程图。
图4是描绘了用于确定记录的搜索结果的签名是否与以前记录的搜索 结果的签名相同的流程图。
图5是描绘了用于指示搜索结果的分类(categorization)的过程的流 程图。
图6是描绘了用于计算用户的声誉得分的过程的流程图。 具体实施方法
现在将详细地参考本发明的示例性的实施方式,在随附的附图示出了 这些实施方式的实施例。只要在可能的情况下,相同的参考号码将在所有 附图中^皮^使用以指示相同的或类似的部件。
图1是描绘用于分析关于用户的信息的示例性的系统100的方框图。 在示例性的系统100中,搜索模块120被耦合于用户信息处理模块110、 数据存储模块130和网络140。搜索模块120经由网络140或经由其它耦 合技术(未画出)也被耦合于至少一个数据源,例如数据源151、 152和/ 或153。数据源151、 152和/或153可为包含关于一个或更多个用户161、 162和/或163的信息的专有数据库。示例性的数据源151、 152和/或153 可为如"博客"或网站,例如社交网站、通讯社网站、私人网站或7>司网 站。示例性的数据源151、 152和/或153也可为存储于搜索数据库中的緩 存的(cached)信息,例如GoogleTM或Yahoo!TM维护的那些緩存的信息。 示例性的数据源151、 152和/或153可进一步是如刑事数据库或列表、信 货机构数据源、保险数据库,或关于用户161、 162和/或163的任何电子或其它信息源。系统100可包括任何数量的数据源151、 152和/或153, 并且系统100可被任何数量的用户、代理人(human agent)和/或第三方使 用。
一个或更多个用户161、 162和/或163可通过如个人计算机、个人数 据设备、电话或其它设备(未画出)来与用户信息处理模块110交互,所 述个人计算机、个人数据设备、电话或其它设备借助于网络140或借助于 他们可通过其与信息处理模块110交互的其它耦合技术而被耦合于用户信 息处理模块110。
一个或多个用户161、 162和/或163可直接地或间接地给用户信息处 理模块IIO提供识别用户的信息或搜索词。用户信息处理模块IIO或搜索 模块120可使用识别信息或搜索词来构造搜索以查找关于用户的信息或搜 索结果。然后,搜索模块120可通过使用至少一个搜索词对数据源151、 152和/或153进行搜索以找到关于用户的信息。关于用户的搜索结果可被 存储在数据存储模块130中和/或通过用户信息处理模块110进行分析。参 照图2、 3、 4、 5和6对分析和存储关于用户的数据的具体实施方式
进行 描述。
网络140可为如因特网、内联网、局域网、广域网、校园网、城域网、 外联网、私人外联网、任何一组耦合的两个或更多个电子设备,或这些或 其它合适的网络的任何组合。
模块之间的耦合或者模块与网络140之间的耦合可包括但不局限于电 子连接、同轴电缆、铜线和光纤,它们包括包含网络140的线路。耦合也 可采用声波或光波的形式,例如激光和在无线电波和红外数据通信过程中 产生的那些。耦合也可借助于通过一个或更多个网络向其它数据设备传输 控制信息或数据来完成。
上述逻辑模块或功能模块中的每一个可包括多个模块。这些模块可被 单独地实现或者它们的功能可与其它模块的功能结合。进一步地,这些模 块中的每一个可在单个组件上被实现,或者这些模块可被实现为组件的组 合。例如,用户信息处理模块IIO、搜索模块120和数据存储模块130中 的每一个可通过这样的设备实现,即,现场可编程门阵列(FPGA)、专用集成电路(ASIC)、复杂的可编程逻辑器件(CPLD)、印刷电路板(PCB)、 可编程逻辑组件与可编程互连的组合、单CPU芯片、结合在主板上的CPU 芯片、通用计算机,或能够执行模块110 、 120和/或130的任务的设备或 模块的任何其它组合。数据存储模块130可包括随机存取存储器(RAM)、 只读存储器(ROM)、可编程的只读存储器(PROM)、现场可编程的只读 存储器(FPROM),或用于存储将被用户信息处理模块IIO或搜索模块120 使用的信息和指令的其它动态存储设备。数据存储模块130也可包括数据 库、目录结构中的一个或更多个计算机文件,或任何其它合适的数据存储 机制,如存储器。
图2是描绘了用于从数据源查找和改变和/或移除关于至少一个用户 的有害搜索结果的过程的流程图。在步骤210中,例如系统或装置接收用 于指导包括至少一个搜索词的搜索的指令。这些指令可被从,如直接的用 户、第三方,或者用户或第三方可能注册的在线数据搜索服务接收。这些 指令也可从存储设备中接收。
用户或第三方可经由如个人计算机、个人数据设备或者经由网站注册 在线数据搜索服务。当注册时,用户或第三方可提供关于他们自己的或可 被如信息处理模块或搜索模块使用的另 一用户的识别信息,以构造与该用 户或另一个用户有关的搜索。在一些实施方式中,接收的指令和/或至少一 个搜索词可与如用户、组、组织或公司有关。
在步骤220中,搜索模块可基于所接收的指令和/或至少一个搜索词获 得至少一个搜索结果。搜索结果可从数据源处获得。搜索结果可经由在公 共可利用的搜索引擎(如GoogleTM搜索或Yahoo!TM搜索)或私人搜索引擎 (如WestlawTM搜索或LexisNexisTM搜索)上的"屏幕抓取"获得。搜索结 果也可经由搜索应用程序接口 (API)或结构化的数据交换(例如可扩展 标记语言)获得。可通过使用基于如用户或第三方提供的信息而被提供或 产生的至少一个搜索词来执行搜索。在示例性的搜索中,用户可提供搜索 词,例如她的家乡、居住城市和母校,这些搜索词可作为用于搜索的搜索 词单独使用或彼此结合使用。可基于指令和/或至少一个搜索词自动地或由 用户、第三方或代理人手动地获得搜索结果。在步骤220中获得的搜索结果可被保存(步骤230 )。
一旦获得了搜索结果,则搜索结果的相关性(relevancy)就可净皮确定, 如步骤240中所述。例如,可基于搜索结果的某些类型的数据或单元在搜 索结果中出现的次数自动地确定相关性。搜索结果的相关性可基于如获得 它所来自于的数据源、搜索结果的内容或找到的搜索结果的类型。此外或 可选择地,搜索结果的相关性可由如代理人或用户直接确定。
获得的搜索结果的相关性可包括确定搜索结果的倾向性(mood)和 /或重要性。搜索结果的倾向性可包括与搜索结果的内容有关的数据并且可 涉及如搜索结果或它的数据源的情绪环境或者搜索结果中的陈述的性质。 搜索结果的倾向性的确定和/或分配可基于它对声誉的正面或负面的影响。 例如,基于搜索结果的内容,搜索结果的不同部分可具有不同的倾向性。 倾向性和子倾向性可被分配数值。下面将进一步详细地讨论计算搜索结果 的倾向性或子倾向性对声誉的影响。
此外或可选择地,获得的搜索结果的相关性可包括确定和/或分配搜索 结果或数据源的重要性。例如,重要性可从高到低排列。搜索结果或数据 源的重要性可被分配权重值,以使当与较不重要的搜索结果或数据源进行 比较时更重要的搜索结果或数据源被确定为具有和/或被分配更高的重要 性。搜索结果或数据源可被确定和/或分配如高、中或低重要性。可基于如 数据源的入站链路的数量、将报告到数据源的入站链路的搜索引擎的数 量,或正比于到数据源的入站链路的数量的综合测度(synthetic measure), 来确定或分配数据源的重要性。示例性的高重要性的数据源包括 MyFace.comTM、 iTunesTM或NYtimes.comTM。
可基于如搜索用户的姓名的引用与搜索结果中的词汇总数的比值、搜 索结果的标题中用户姓名的存在、围绕用户的姓名的字体设计或图形元 素,或在数据源的姓名查询中的用户姓名的排序,来确定和/或分配搜索结 果的重要性。可基于如数据源被访问的频率或数据源被熟知的程度来给数 据源分配重要性。示例性的高重要性搜索结果可包括在数据源上显著地或 重复地提到的用户的姓名。下面将进一步详细地讨论计算搜索结果的倾向 性或子倾向性对声誉的影响。
16在一些实施方式中,步骤240可包括产生搜索结果排序系统,和/或基 于搜索结果排序系统对^_索结果进行归类,图3描绘了它们的实施例。在 步骤250中,搜索结果可被输出或显示给如用户、代理人或软件程序。搜 索结果的相关性也可输出或显示给如用户、代理人或软件程序。搜索结果 和/或它的相关性可经由电子邮件、传真、网页或以任何其它合适的方式被 输出或显示。搜索结果和/或它的相关性可被显示为如原始搜索结果的副 本、到搜索结果的链接、搜索结果的屏幕截图,或任何其它合适的表征。
在步骤260中,额外的搜索词可被期望用于搜索。如果额外的搜索词 被期望用于搜索,那么额外的搜索词可被用于获得额外的搜索结果(步骤 270)。例如,如果对用户姓名的搜索阐明了用户工作的城市,那么城市的 名称可被添加至搜索词以用于至少一个将来的搜索。作为另外的实施例, 如果用户的新别名或用户名^丸发现,那么它可被用作用于搜索的额外搜索 词。进一步地,可确定搜索结果是否与相同的用户相关。如果搜索结果与 相同的用户相关,那么搜索词可如上所述3皮添加。如果搜索词与不同的用 户相关或者另外地不与该用户相关,那么排除性搜索词可被添加至用于搜 索的搜索词。例如,如果用户^皮命名为乔治华盛顿,那么作为步骤270的 一部分添加排除性的词可能是适当的,以确保不会返回与"乔治华盛顿大 学"、"乔治华盛顿总统"或"乔治华盛顿卡佛"有关的搜索结果。
用于搜索的额外搜索词可通过任何合适的方法来被确定。例如,搜索 结果可被呈现给用户并且该用户可选择额外搜索词。可选择地,代理人可 审查搜索结果并提供额外的搜索词。也可通过如搜索模块、用户信息处理 模块或代理人自动地确定额外的搜索词。额外的搜索词的自动确定可基于 任何合适的计算或分析。例如,如果特殊的搜索词通常出现在与用户有关 的先前搜索中,那么该特殊的搜索词可被用作用于新的搜索的额外搜索 词。
在步骤280中,有害搜索结果可被标记。可由如用户、代理人或计算 机软件程序借助于如web接口、至代理人的电子邮件、邮件或传真,来以 电子方式执行对搜索结果的标记。可通过将合适的标记放置在如数据存储 模块中或者另外地指示搜索结果将被移除或改变而对搜索结果进行标记。
17在步骤290中,被标记的搜索结果可酌情被移除和/或改变。用户可请
求在搜索结果中的关于她的所有信息被标记和改变和/或移除或者只有搜 索结果内的具体信息被改变或移除。被标记的结果的移除或改变可经由用
于相关数据源的API完成。例如,结构化的数据源可具有允许从数据源改 变或移除数据的API。搜索模块或其它合适的模块可使用数据源的API来 向数据源指示用于用户的信息将被移除或改变。当用户和/或代理人呼叫、 发电子邮件、发邮件或以其它方式接触负责从数据源改变或移除信息的代 理人时,被标记的结果也可被移除或改变。在一些情况下,步骤290可包 括如律师的代理人,他们代表用户起草信件以说服负责数据源的代理人改
变或移除与该用户有关的数据。在其它情况下,步骤290可包括对负责数 据源的代理人或公司发起民事诉讼或刑事诉讼,以使司法机构可能迫使负 责lt据源的代理人或公司改变或移除与用户有关的数据。
在一些实施方式中,步骤220-270可以定期地、不定期地或随机的间 隔被执行。例如,步骤220-270可每小时、每天或以任何适当的间隔被执 行。对于一些用户,步骤220-270可基于如更新的可能性、居住的时区、 用户偏好等用户特征而比其它用户更经常地被执行。进一步地,对于一些 数据源,步骤220-270可比其它数据源更经常地被执行。例如,如果已知 社交网站比公司网站更经常^皮更新,那么对于社交网站来说步骤220-270 可比公司网站更经常被执行。
图3是描绘了用于对搜索结果进行归类的过程的流程图。在步骤310 中,所获得的搜索结果的相关性被确定和/或指示一或者自动地或者通过上 述人为干预。在步骤320中,搜索结果排序系统可被产生。搜索结果排序 系统可基于一个或多个考虑因素对搜索结果进行排序,所述考虑因素如它 们的相关性、倾向性或重要性、结果的年龄、结果对用户有多大的损害、 益处或结果对用户无害,或者任何其它合适的排序工具。在步骤330中, 搜索结果可基于它们在搜索结果排序系统中的排序被归类。搜索结果被归 类的顺序可定义如何显示搜索结果。例如,搜索结果可被归类,以使最新 的和/或最有害的搜索结果被首先显示,然后是下一个最新的和/或最有害 的搜索结果。在一些实施方式中,步骤320和330可通过使用神经网络、贝叶斯分 类器或用于产生搜索排序系统的任何其它合适的工具而#1执行。如果贝叶 斯分类器被使用,那么它可通过使用如代理人和/或用户输入被建造。在一 些实施方式中,代理人和/或用户可指示搜索结果为"相关的"或"无关的"。 每次,搜索结果被标记为"相关的"或"无关的,,,来自于搜索结果的语 言符号可被添加至合适的数据语料库中,例如"相关指示的结果语料库" 或"无关指示的结果语料库"。在收集用于搜索的数据之前,贝叶斯网络 可被例如用从用户收集的词(例如家乡、职业、性别,等)或另一个源来 进行播种(seed)。在将搜索结果分类为相关指示或无关指示以后,搜索结 果中的语言符号(token)(例如词或短语)可被添加至相应的语料库中。 在一些实施方式中,只有一部分搜索结果可被添加至相应的语料库中。例 如,如"一个"、"该"和"和"等普通的词语或语言符号可能不被添加至
语料库。
作为维护贝叶斯分类器的部分,语言符号的散列表可基于语料库中的 语言符号的出现次数而产生。此外,对于任何一个语料库或两个语料库中 的语言符号,也可产生"conditionalProb"散列表以指示包含该语言符号的 搜索结果是相关指示或无关指示的条件概率。搜索结果是相关的或无关的 条件概率可基于任何合适的计算而被确定,反过来,任何合适的计算可以 是基于相关指示的语料库和无关指示的语料库中的语言符号的出现次数 的。例如,语言符号相对于用户是无关的条件概率可由下面方程定义
prob=max(MIN—RELEVANT—PROB,
min(MAX一IRRELEVANT—PROB,irrelevatProb/tota1)),
其中
MIN—RELEVANT—PROB = 0.01 (相关性概率的阈值下限),
MAX—IRRELEVANT—PROB = 0.99 (相关性概率的阈值上限),
Letr = RELEVANT—BIAS* (出现在"相关指示"的语料库中的语言符 号的次数),
Let i = IRRELEVANT—BIAS* (出现在"无关指示"的语料库中的语言符号的次数),
RELEVANTJBIAS = 2.0,
IRRELEVANT—BIAS= 1.0 (在一些实施方式中,与"无关指示"词 相比,应该更多地偏向"相关指示,,词,以便偏向错误的正面而远离错误 的负面,这就是为什么相关的偏差可比无关的偏差大),
nrel二相关指示的语料库中项目的总数,
nirrel =无关指示的语料库中项目的总数,
relevantProb = min(l.O, r/nrel),
irrelevantProb = min(l.O, i/nirrel),和
total = relevantProb + irrelevantProb 。
在一些实施方式中,如果相关指示的语料库和无关指示的语料库被播 种并且特定的语言符号被给予默认的无关的条件概率,那么可使用默认值 对如上被计算出的条件概率进行平均。例如,如果用户被指定他去哈弗大 学,那么语言符号"哈弗"可被指示为相关指示的种子并且存储的用于语 言符号哈弗的条件概率可为0.01 (只有1%的无关的可能性)。在该情况下, 如上被计算出的条件概率可使用默认值0.01被平均。
在一些实施方式中,如果对于任何一个语料库或两个组合的语料库中 的语言符号来说,存在小于项目的某个阈值的情况,那么可不计算语言符 号是无关指示的条件概率。当搜索结果的相关被指示时,语言符号是无关
指示的条件概率可基于最新指示的搜索结果被更新,例如,作为步骤320 的一部分。
当新的搜索结果被获得时,搜索结果的内容可被分解为至少一个语言 符号。语言符号是相关指示和/或无关指示的概率可然后基于如排序系统而 被确定。语言符号中的相关指示和/或无关指示的最大概率可然后被用于计 算贝叶斯概率。例如,如果最大的N个概率被放在被称作"probs"的阵列 中,那么然后可基于朴素的贝叶斯分类器规则计算贝叶斯组合概率,如下
<formula>formula see original document page 20</formula>搜索的结果可通过每个搜索结果是相关和/或无关的概率而被归类。
上面计算出的贝叶斯概率可表示搜索结果是"相关的,,和/或"无关的" 的概率。这仅仅是一个重复应用贝叶斯定理的公式。其它的公式也可^皮用
于基于无条件概率来计算条件概率,例如Papoulis,A.的"Bayes'Theorem in Statistics"和"Bayes'Theorem in Statistics (Reexamined)", 一魔,、 #經在过症中的§3-5和4-4(第二版,纽约McGraw-Hill,第38-39、 78-81 和112-114页,1984年,此后被称作"(Papoulis 1984)")中所描述的一个 或多个公式。在(Papoulis 1984的)第38-39页描述的贝叶斯定理的示例 性的可选择形式也可被用于计算搜索结果是"相关的"和/或"无关的"的 概率。相似的过程可被用于关联和/或确定搜索结果或数据源的倾向性和/ 或重要性。
图4是描绘了用于确定为当前搜索结果记录的签名是否与以前记录的 签名相同的过程的流程图。搜索结果的签名可为如关联的网页的散列、搜 索结果或来自于搜索结果的信息的缩写形式、搜索结果的散列或基于搜索 的内容的其它计算。例如,散列可基于完整的搜索结果或者基于搜索结果 的一部分,例如围绕至少一个搜索词的搜索结果的一部分。搜索结果可包 括如网站或网站内的网页。为搜索结果记录的签名可包括识别搜索结果的 信息,例如搜索结果的统一资源定位符(URL),或搜索结果的类型的分 类,和/或网站的签名(signature )。在步骤420中,搜索结果的签名可接着 与以前获得的搜索结果的以前获得的签名进行比较。
在步骤430中,可确定当前搜索结果的签名是否与以前获得的搜索结 果的签名相同。如果当前的搜索结果与以前获得的搜索结果相同,那么当 前的搜索结果可能不被进一步分析并且图4中描绘的过程可结束。如果当 前获得的搜索结果的签名与以前获得的搜索结果的签名不同,那么当前搜 索结果的内容可被进一步分析(步骤440)。例如,如果社交网站包括关于 用户的信息并且代表用户每天搜索该站点,那么然后最近获得的搜索结果 的签名(例如关联网页的散列)可与以前获得的搜索结果的签名进行比 较。如果两个签名是相同的,那么搜索结果的内容还未被改变并且无需进一步分析最近获得的搜索结果,至少到该源被下一次搜索到为止。
图5是描绘用于指示搜索结果的分类的过程的流程图。在步骤510中, 搜索结果可经由如网络界面(web interface),计算机程序的图形用户界面 或经由任何其它合适的工具,被呈现给如用户和/或代理人。显示的搜索结 果可经由任何合适的工具获得。例如,当经由一个或更多个公共搜索引擎 (例如Google 或Yahoo! )、私人搜索系统(例如LexisNexis 或 Westlaw )或任何数据源执行搜索时,搜索的结果可被显示给如用户和/ 或^理人。
在步骤520中,搜索结果可被如代理人或用户识别。在步骤525中, 可确定搜索结果的分类。分类可由如代理人、用户或贝叶斯分类器确定。 示例性的分类包括对于用户的相关性、结果对于用户有多大的损害,或 者搜索结果的源类型(社交网站、新闻数据库,等)。搜索结果可基于如 代理人或用户的判断、标准规则(例如涉及用户的包含咒骂语(expletive) 的任何页面可被标记为有害的)或针对用户的规则(例如用户可请求将对 于她或她的以前的工作的所有引用标记为有害的)而^f皮分类。
在步骤530中,搜索结果的分类可被指示到合适的系统或模块。例如, 如果代理人正在使用网络浏览器搜索关于用户的信息并且确定搜索结果 应该被分类为有害的,那么代理人可能使用她的计算机鼠标"点击""书 签工具"以指示该搜索结果可能是有害的。分类可经由如"书签工具"、 可编程按钮、用户界面元素或任何其它合适的工具而被指示。书签或可编 程按钮可为至少部分地作为网络浏览器的部分运行的计算机程序,或者可 为耦合到网络浏览器的计算机程序。书签工具可为图形按钮,当该按4丑被 点击时,它可使脚本或程序执行,这可给用户信息处理模块、服务器模块 或任何其它合适的模块发送关于搜索结果将被标记的指示。当用户界面元 素被选择时,它可使动作将被执行,这可指示被察看的搜索结果将被标记。 搜索结果和与该搜索结果相关联的一个或多个标记可被存储在数据存储 模块中。被指示的标记可被部分地使用以确定搜索结果的相关性,或者当 搜索结果被显示时被指示的标记可被示出。
图6是描述用于计算声誉得分的过程的流程图。声誉得分可表示如通
22常作为雇员、雇主、重要的其它职业、可能的家长的用户的声誉,或任何
其它合适的量纲(dimension)或考虑事项。此外,声誉得分可包括一个或 更多个声誉子得分,它们可能是基于用户的声誉的子元素,例如交互的具 体领域的资料或类型。例如,个人的声誉得分通常可包括作为个体、商业 伙伴、雇员、雇主、重要的其它职业、可能的家长的他们的声誉的子得分。 声誉得分可能基于其它得分和信息,例如信用得分、eBay卖家得分,或如 SlashdotTM的网站上的因果值(karma),或任何其它合适的构造块。
图6中的步骤可被执行以确定单个声誉得分、多个类型的声誉得分, 或者一个或更多个声誉子得分,它们中的任何可被结合以计算总计的声誉 得分。声誉评分是这样的工具,例如,它对用户的声誉得分的影响使关于 如用户的搜索结果简化为简单的概要得分、等级或任何其它合适的测度。 声誉得分可允许如用户或代理人集中于可能影响声誉得分的主要在线影 响项目。声誉得分也允许如用户或代理人追踪数据、搜索结果的签名和/ 或搜索结果的相关改变。
在步骤610中,搜索结果可被合计。被合计的搜索结果可为来自于任 何数据源的与如用户或第三方有关的任何数据。^皮合计的搜索结果可为经 由图2、 3、 4和/或5的过程获得的数据。^皮合计的搜索结果也可为经由其 它工具收集的数据,或者可由如用户或代理人直接地提交。
在步骤620中,被合计的搜索结果可被分析以确定它们对声誉的影响。 该确定可为人工的或自动的。例如,代理人或用户可将来自于被合计的搜 索结果中的一项搜索结果或该搜索结果的一段标记为损害或有益于用户 的声誉的某些方面。然后,代理人或用户可沿着一个或多个系列(spectrum) 指示搜索结果是如何影响声誉得分的。
确定被合计的搜索结果对声誉得分的影响可通过分析搜索结果并基 于如搜索结果的内容、倾向性或重要性进行指示而被执行。在一些情况下, 该确定和/或它的指示是自动的。例如,如果作为雇主的用户的声誉被确定 并且被合计的搜索结果包括在指定为用于发表关于"坏老板,,的信息的地 点的网站上的评论用户的记录,那么可自动地产生一项指示以指出该网络 记录对作为雇员的用户的声誉可能是有害的。在一些实施方式中,系统可通过确定相关性指示语言符号周围的语言 符号的任何一个是根据上下文"正面的"还是根据上下文"负面的",来 确定搜索结果是正面地或负面地影响用户的声誉。 一组周围的语言符号可
被定义为N个相关指示语言符号内的一组语言符号,其中N是任何正整数。
在一些实施方式中, 一组周围的语言符号可被定义为搜索结果中的所有语 言符号或者可按照任何其它合适的方式被定义。该系统可通过在根据上下 文正面的语言符号的表或数据库中查询它们,来确定周围的语言符号是否 是根据上下文正面的。并行的程序可被用于识别根据上下文负面的语言符
号。例如,涉及用户并且在相关指示的语言符号的N个语言符号内包含咒
骂语的搜索结果可自动地被分类为对用户的声誉得分是有害的。
此外,声誉得分可部分地基于任何根据上下文正面的、根据上下文负 面的和/或指示围绕相关指示语言符号的一组语言符号中找到的语言符号 的倾向性^皮计算。才艮据上下文负面的或坏的倾向性语言符号可不利地影响 或另外的在数值上降低用户的声誉得分。而根据上下文正面的或好的倾向 性语言符号可在数值上增加或另外地改善声誉得分。在一些实施方式中, 根据上下文正面的和/或根据上下文负面的语言符号可具有与它们相关联 的数值权重或乘数。同样地,数值权重或乘数可基于它们的相关性和/或重 要性与语言符号相关联。被更多地加权的语言符号可具有对用户的声誉得 分的更大的影响。 一些正面的和负面的内容确定也可是用户特定的。例如, 对于教育部长,在网站上讨论当事人的提及用户的记录对声誉得分可能比
大学生更有害。步骤620也可包括自动地确定和/或通过一个或更多个用户 或代理人确定关于搜索结果对声誉得分的影响。
在步骤630中,声誉得分可被计算。声誉得分可能基于任何合适的计 算。例如,声誉得分可能是合计的搜索结果中正面引用的个数的总和减去 负面引用的个数的总和。声誉得分也可为被合计的搜索结果对用户的声誉 的影响的加权和或平均值。此外或可选择地,声誉得分也可为声誉子得分 的和或加^l平均,它们可如上所述^皮计算。
誉得分被计算,它可被报告给请求方,如在步骤640中所述。 例如,如果可能的雇员希望了解雇主的声誉,那么可能的雇员可请求该雇 24主的声誉得分的报告。声誉得分也可被报告给用户。
在一些实施方式中,在用户请求下声誉得分可被报告给第三方,并且根据这里的实施方式中的每一个,计算和呈现声誉得分的一方可在呈现用户的声誉得分时对用户进行"担保"。例如,如果用户正在试图成为另一个人的室友并且用户的声誉得分通过声誉报告公司被报告给该另 一个人,那么声誉报告公司将担保该用户如用户声誉得分所指示的声誉好。
图2、 3、 4、 5和6的示例性流程图中描绘的步骤可由用户信息处理模块IIO、搜索模块120或任何其它合适的模块、设备、装置或系统执行。进一步地,这些步骤中的一些步骤可由一个模块、设备、装置或系统执行,而另一些步骤可由一个或更多个其它模块、设备、装置或系统执行。此外,在一些实施方式中,图2、 3、 4、 5和6中的步骤可按照不同的顺序和/或以比这些图中或这里的描述中描绘的更少或更多的步骤执行。
根据这里公开的本发明的说明和实践,对于本领域那些技术人员来说,本发明的其它实施方式将是明显的。意图是该说明和实施例被认为仅仅是示例性的,真正的范围和精神由下面的权利要求指示。
2权利要求
1.一种用于分析关于用户的信息的方法,其包括如下步骤基于至少一个描述所述用户的搜索词从数据源获得至少一个搜索结果;接收所述至少一个搜索结果的合意性的指示;和基于所述至少一个搜索结果的所述合意性来执行动作。
2. 才艮据权利要求1所述的方法,其进一步包括如下步骤基于所述至少一个搜索结果确定额外的搜索词;和在所述获得步骤中使用所述额外的搜索词。
3. 根据权利要求2所述的方法,其中确定所述额外的搜索词是被自动地执行的。
4. 根据权利要求2所述的方法,其中确定所述额外的搜索词是由代理人或所述用户4丸行的。
5. 根据权利要求1所述的方法,其中在所迷接收步骤中接收所述至少一个搜索结果是不期望的搜索结果的指示,并且其中所执行的所述动作包括使得在所述数据源处移除或改变所述不期望的搜索结果,所述不期望的搜索结果从所述数据源获得。
6. 根据权利要求1所述的方法,其中在所述接收步骤中接收所述至少一个搜索结果是不期望的搜索结果的指示,并且其中所执行的所述动作包括确定所述不期望的搜索结果是否可在所述数据源处被改变,所述不期望的搜索结果从所述数据源获得;和基于所述不期望的搜索结果可在所述数据源处被改变的确定,使得在所述数据源处改变所述不期望的搜索结果。
7. 根据权利要求1所述的方法,其中在所述接收步骤中接收所述至少一个搜索结果是不期望的搜索结果的指示,并且其中所执行的所述动作包括确定所述不期望的搜索结果是否能够从所述数据源移除,所述不期望的搜索结果从所述数据源获得;和基于所述不期望的搜索结果能够从所述数据源移除的确定,使得从所述数据源移除所述不期望的搜索结果。
8. 根据权利要求5所述的方法,其中所述不期望的搜索结果包括关于所述用户的不正确的凄W居。
9. 根据权利要求5所述的方法,其中所述不期望的搜索结果包括对所述用户的所述声誉有害的数据。
10. 根据权利要求1所述的方法,其进一步包括确定所述至少 一个搜索结果的相关性。
11. 根据权利要求IO所述的方法,其中确定所述至少一个搜索结果的所述相关性的步骤包括确定所述至少 一个搜索结果是否包括与所述用户相关联的信息。
12. 根据权利要求11所述的方法,其进一步包括如果所述至少一个搜索结果不包括与所述用户相关联的信息,那么忽略所述至少一个:f臾索结果。
13. 根据权利要求11所述的方法,其进一步包括当所述至少一个搜索结果不包括与所述用户相关联的信息时,确定排除性的搜索词,其中所述排除性的搜索词排除了不包括与所述用户相关联的信息的搜索结果;和使用所述排除性搜索词获得所述用户的至少一个搜索结果。
14. 根据权利要求1所述的方法,其进一步包括获得至少 一个额外的搜索结果;基于所述至少一个搜索结果或所述至少一个额外的搜索结果产生搜索排序系统;和基于搜索排序系统对所述搜索结果进行归类。
15. 根据权利要求14所述的方法,其中贝叶斯网络^R用于产生所述搜索排序系统。
16. 根据权利要求15所述的方法,其中所述贝叶斯网络利用无关指示的语言符号的语料库和相关指示的语言符号的语料库。
17. 根据权利要求1所述的方法,其进一步包括为所述至少一个搜索结果确定签名;将所述签名与用于以前获得的搜索结果的以前获得的签名进行比较;和当所述签名和所述以前获得的签名不相同时,确定所述至少一个搜索结果的所述相关性。
18. 根据权利要求1所述的方法,其中获得至少一个搜索结果的所述步骤被周期地执行。
19. 根据权利要求18所述的方法,其中执行所述获得步骤的周期是基于用户特征的。
20. 根据权利要求18所述的方法,其中执行所述获得步骤的周期是基于数据源特征的。
21. 根据权利要求1所述的方法,其进一步包括将所述至少一个搜索结果呈现给代理人;从所述代理人获得所述至少一个搜索结果的分类的指示;和基于来自于所述代理人的所述指示自动地对所述至少一个搜索结果进行分类。
22. 根据权利要求1所述的方法,其中获得至少一个搜索结果的所述步骤包括从代理人接收至少一个搜索结果,并且所述方法进一步包括从所述代理人获得所述至少一个搜索结果的分类的指示;和基于来自于所述代理人的所述指示自动地对所述至少一个搜索结果进行分类。
23. 根据权利要求1所述的方法,其进一步包括从所述用户或代理人接收所述至少一个搜索结果的所述相关性的指示。
24. 根据权利要求1所述的方法,其中获得所述至少一个搜索结果的所述步骤包括从代理人接收至少一个搜索结果,并且所述方法进一步包括从所述代理人获得所述至少 一个搜索结果的分类的指示;和基于来自于所述代理人的所述指示自动地对所述至少一个搜索结果进行分类。
25. —种用于确定表示所述用户的声誉的声誉得分的方法,其包括从数据源收集至少 一 个搜索结果;确定来自于所述数据源的所述至少一个搜索结果对所述用户的所述声誉的影响;和基于所确定的来自于所述数据源的所述至少一个搜索结果对所述用户的所述声誉的影响,为所述用户计算声誉得分。
26. 根据权利要求25所述的方法,其进一步包括在所述用户的请求下将所述声誉得分呈现给第三方,以担保所述用户如所述得分所指示的声誉好。
27. 才艮据权利要求25所述的方法,其进一步包括在第三方的请求下将所述声誉得分呈现给所述第三方,以担保所述用户如所述得分指示的声誉好。
28. 根据权利要求25所述的方法,其中所述数据源是信货机构数据库、刑事数据库、保险数据库、社交网络数据库,或新闻数据库中之一。
29.根据权利要求25所述的方法,其进一步包括将至少一个搜索结果分类为正面的或反面的;和基于所述至少一个搜索结果的正面的分类或反面的分类,确定所述至少 一个搜索结果对所述用户的所述声誉的影响。
30,根据权利要求25所述的方法,其进一步包括根据正面到负面的标准关联至少一个搜索结果;和基于所述至少 一个搜索结果的正面到负面的关联,确定所述至少 一个搜索结果对所述用户的所述声誉的影响。
31. 根据权利要求25所述的方法,其进一步包括基于来自于所述数据源的所述至少一个搜索结果对所述用户的声誉的影响,为所述用户计算至少一个声誉子得分。
32. 根据权利要求25所述的方法,其进一步包括确定表示所述至少 一 个搜索结果的相关性的数值。
33. 根据权利要求32所述的方法,其进一步包括将数值权重与用于所述至少 一个搜索结果的所述相关性的所述数值相关3关;和使用所述搜索结果的所述相关性的所述数值和所述数值权重来计算所述声誉得分。
34. 根据权利要求25所述的方法,其进一步包括确定表示所述至少 一个搜索结果的倾向性的数值。
35. 根据权利要求34所述的方法,其进一步包括将数值权重与表示所述至少 一个搜索结果的所述倾向性的所述数值相关:f关;和使用所述搜索结果的所述倾向性的所述数值和所述数值权重来计算所述声誉得分。
36. 根据权利要求25所述的方法,其进一步包括确定表示所述数据源的重要性的数值。
37. 根据权利要求36所述的方法,其进一步包括将数值权重与表示所述数据库的所述重要性的所述数值相关联;和使用所述数据源的所述重要性的所述数值和所述数值权重来计算所述声誉得分。
38. 根据权利要求36所述的方法,其中所述数据源的所述重要性是基于所述数据源的评价的。
39. —种用于分析关于用户的信息的装置,其包括至少一个模块,所述^lt块被编程为基于描述所述用户的至少 一 个搜索词从数据源获得至少 一 个搜索结果;将所述至少一个搜索结果呈现给所述用户;从所述用户接收所述至少 一个搜索结果的合意性的指示;和基于所述至少一个搜索结果的所述合意性执行动作。
40. —种用于确定用户的声誉的装置,其包括至少一个模块,所述模块寻皮编程为基于描述所述用户的至少一个搜索词从数据源获得至少一个搜索结果;确定来自于所述数据源的所述至少一个搜索结果对所述用户的声誉的影响;和基于所确定的来自于所述数据源的所述至少一个搜索结果对所述用户的声誉的影响,为所述用户计算声誉得分。
41. 一种用于分析关于用户的信息的系统,所述系统包括至少一个模块,所述模块被配置为执行如下步骤基于描述所述用户的至少一个搜索词从数据源获得至少一个搜索结果;将所述至少一个搜索结果呈现给所述用户;接收所述至少一个搜索结果的合意性的指示;和基于所述至少 一个搜索结果的所述合意性执行动作。
42. —种用于确定表示用户的声誉的声誉得分的系统,所述系统包括至少一个模块,所述模块被配置为执行如下步骤基于描述所述用户的至少 一 个搜索词从数据源获得至少 一 个搜索结果;确定来自于所述数据源的所述搜索结果对所述用户的声誉的影响;和基于所确定的来自于所述数据源的所述搜索结果对所述用户的所述声誉的影响,为所述用户计算声誉得分。
全文摘要
提出了用于分析关于用户的信息的系统、装置和方法,其包括根据描述用户的至少一个搜索词获得至少一个搜索结果;将至少一个搜索结果提供给用户;从用户接收搜索结果的合意性的指示;以及根据搜索结果的合意性执行动作。还提供了用于确定表示用户的声誉的信誉得分的系统、装置和方法,其包括从数据源收集搜索结果,确定来自数据源的搜索结果对用户的声誉的影响,以及根据所确定的来自数据源的搜索结果对用户的声誉的影响来为用户计算声誉得分。
文档编号G06F17/30GK101675429SQ200880007535
公开日2010年3月17日 申请日期2008年1月30日 优先权日2007年1月31日
发明者B·凯莉, D·汤普森, J·奥布里, M·费尔蒂克, R·加布里尔 申请人:名誉捍卫者公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1