基于用户对话的智能引导搜索的制作方法

文档序号:6455349阅读:184来源:国知局

专利名称::基于用户对话的智能引导搜索的制作方法基于用户对话的智能引导搜索些旦冃尿联网和计算技术的进步使得计算机能够从执行基本文字处理和计算低级数学计算的低性能/高成本设备转变成能够执行无数不同功能的高性能/低成本机器。例如,可采用消费级计算设备来协助用户支付帐单、跟踪花费、经由电子邮件或即时消息收发跨远距离与朋友或家人近乎瞬时地通信、从网络化数据储存库获取信息以及各种其它功能/活动。在企业中,计算机可便于通信、机器的控制和监视、存储、数据的检索和分析等等。计算机及与之相关联的外设因此成为现代社会的螺丝钉,用于个人和企业活动两者。因特网和万维网就信息量和用户数目而言继续迅速扩张。因特网是互连计算机网络的集合。万维网即web,是经由超链接和统一资源定位符(URL)连接各个因特网可访问站点的服务。总体上,web提供用于所有类型的信息的累积、交换和散布的全球空间。例如,经由在线报纸、杂志、广告、书籍、照片、音频、视频等提供信息。除了提供传统信息以外,web还提供对以往由于访问信息所需的艰巨步骤而实际上不可用的数据(例如,法律、银行业务、政府和教育信息)的容易访问。而且,信息也由个人经由个人web页面、留言板、博客和协同工作(例如,Wikipedia、Reference.com、answers.com.)等提供。使用率的增长主要由与用户需求有关的可用信息的数量日益增长驱动。作为示例,web和因特网一开始完全用于交换信息的研究。现在,人们利用web来管理银行帐户、完税、査看产品信息、出售和购买产品、下载音乐、选修课程、研究课题以及寻找驾车方向等。由于其它相关信息在web上变为可用,使用将继续活跃。为了最大化在大量数据中定位相关信息的可能性,在web上通常采用搜索引擎。Web搜索引擎,简称为搜索引擎,是基于包含一个或多个关键词的搜索查询的输入便于web导航的工具。当接收查询时,搜索引擎检索网站的列表,该列表通常是基于与查询的相关性来排序的。用户之后可巻动通过多个返回站点以试图确定站点是否与用户的兴趣有关。然而,这可能是极端耗时且令人挫败的过程,因为搜索引擎可能会返回大量站点。多半用户必须通过更改和/或添加关键词来迭代地縮小搜索以获得包含相关信息的网站的身份。不论信息是由计算机提供还是生成的(例如,搜索引擎、数据分析...),仍存在这类信息的相对程度不可信。这种不可信源于各种因素,诸如普通的不习惯以及缺乏对计算技术和/或底层软件(例如,黑箱)的理解。计算机和计算机程序对于隐错、假信号、病毒等的易受攻击性也造成了这种不可信。而且,web提供用于张贴用户想要的任何东西而无论其真实性的公共论坛的事实也影响其中驻留的信息的可信度。结果,用户通常相当怀疑计算机生成和/或提供的信息,从而不能对所提供的内容进行完全和高效的使用。概述以下呈现了简化的概述,以对所要求保护的主题的某些方面提供基本理解。本概述不是广泛的概观。它并不旨在标识关键/重要元素,也不旨在描绘所要求保护的主题的范围。其唯一的目的是以简化的形式来介绍一些概念,作为稍后提出的更为详细的描述的序言。简而言之,此处所述的实施例涉及确认结合计算机生成和/或提供的数据(例如,搜索结果、张贴、博客、新闻馈源…)等提供的信息的准确性或真实性以便提高提供可靠信息的概率。所接收到的信息的准确性可通过各种方式提高或确认。例如,可根据已知且可靠的信息源来引导搜索,和/或可采用咨询者(referral)来验证信息等。因此,用户就信息的有效性可获取增加的置信度级别。根据一个特定的实施例,可对个体进行轮询,使得向一组用户提供或以其它方式标识包括回答或结果的基于计算机的信息,并接收关于信息真实性的投票。作为示例而非限制,可在社会网络论坛、博客、即时消息收发会话等内提供信息和接收投票。根据本发明的另一方面,信息也可无需来自其他个体的直接输入而被验证。更具体地,提供可仔细核查信息源,例如通过将结果与其他相似数据进行比较以检测相似性或矛盾、或测量其距一组已知可靠源的距离的系统和方法。也可采用基于机器学习的方法来便于标识信息真实性。根据本发明的又一方面,可通过推断来引导计算机搜索(例如,web搜索、因特网搜索、内联网搜索...)以便于标识相关信息。更具体地,可使用学习和推理系统来便于至少部分地基于查询和对系统询问的响应收敛到可靠的主题上。而且,信息可从用户处直接收集,或者信息可以自动方式(例如,在按用户共享数据的策略进行确认的情况下)从用户的系统或数据的其他数据库请求。为实现上述及相关目的,在此结合以下描述和附图描述了所要求保护的主题的某些说明性方面。这些方面指示可实践本主题的各种方式,它们均落在所要求保护的主题的范围之内。当结合附图阅读以下详细描述时,本发明的其他优点和新颖特征将变得很清楚。附图简述图l是验证系统的框图。图2是包括界面的验证系统的框图。图3是基于咨询的验证系统的框图。图4是基于调查的验证系统的框图。图5是基于分析的验证系统的框图。图6是分析组件的框图。图7是采用上下文来标识验证机制的验证系统的框图。图8是验证组件的框图。图9是web搜索系统的框图。图IO是推断组件的框图。图11是验证计算机提供/生成的数据的方法的流程图。图12是利用咨询验证数据的方法的流程图。图13是利用轮询验证数据的方法的流程图。图14是分析验证方法的流程图。图15是验证计算机数据的方法的流程图。图16是搜索方法的流程图。图17是引导搜索方法的流程图。图18是示出用于本发明各方面的合适的操作环境的示意性框图。图19是示例计算环境的示意性框图。详细描述现在将参考附图描述本发明的各个方面,全部附图中相同的标号指的是相同或相应的元素。然而,应理解,附图及其有关的详细描述不旨在将所要求保护的主题限于所公开的特定形式。相反,其意图是覆盖落在所要求保护的主题的精神和范围内的所有修改、等效和替换方案。一开始参考图1,根据本发明的实施例示出了验证系统100。尽管计算机非常善于提供有用的信息,但存在基于计算机的信息的相对程度的不可信。验证系统100便于确定计算机生成和/或提供的信息的真实性。基于该信息,用户可决定他/她是否和/或以何种程度依赖于计算机结果。系统100包括接收器组件110和验证组件120。接收器组件110可接收、检索或以其他方式获得或获取计算机提供的结果和与结果有关的信息。作为示例,如果利用计算机来分析心电图(EKG),则接收器组件IIO可接收EKG以及分析的结果(例如,正常、心肌梗死...)。在替换示例中,结果可对应于网页,且信息可驻留在网页以及査询本身内。结果和相关联的信息可被提供给验证组件120或使其可用于供验证组件120访问。验证组件120从接收器组件110接收或检索信息,并可便于确定结果或回答的有效性。在第一示例中,判断可对应于给定EKG分析结果是否是准确的。在第二示例中,可评定网页上提供的信息的有效性。这种判断可用各种不同方式作出,例如如以下进一步描述地,验证组件120可将结果或结果信息映射到已知信息和/或请求并接收外部信息。更具体地,验证组件120可生成指示结果真实性的有效性度量。在一个示例中,这可以是指示结果是正确还是不正确、是真还是假等的二元值。或者,度量根据以下示例性表可以是多值的。有效性度j含义<table>tableseeoriginaldocumentpage9</column></row><table>表1也应理解,除了提供有效性度量或分数以外,验证组件120也可标识如何/为何产生这样的分数。这种信息可便于提供解释,使得用户不必盲目地信任有效性分数。例如,可以注意到,接收特定的网页,其分数为"3"(有可能假),因为基于与提供这样的信息的其他网页的比较,缺乏事实的相关或相似性。作为示例,界面或应用程序可在度量旁提供对解释的链接,使得用户可容易地访问信息,同时显示不与这样的数据混杂。在图2中,根据本发明的一方面描绘验证系统200。类似于图1的系统100,系统200包括接收器组件110和验证组件120。简而言之,接收器组件110可获取结果和与之相关联的信息,并提供这样的数据或使这样的数据可供验证组件120访问。验证组件120可便于仔细核査结果,并生成标识结果是正确、不正确还是处于两者之间的某种情况的度量。除了这些组件以外,系统200包括通信耦合至接收器组件IIO和验证组件120的用户界面组件210。用户界面组件210允许用户与验证计算机结果的过程交互。例如,组件210可向用户显示计算机结果和相关联的信息。用户可随后启动验证和/或经由验证组件120从界面组件210接收有效性度量。此外,用户也可利用用户界面来指定目标有效性范围。作为示例,用户可用用户界面组件120查看所显示的计算机结果,该结果可能与web搜索相关联。用户然后可决定他们是否期望验证信息,且如果是,则验证到何种程度。如果用户仅为了琐碎的数据而web冲浪,则他们可能不希望验证正提供的信息。然而,如果用户将要以某种方式依赖信息,则他们可能希望验证。同样地,取决于依赖的程度,用户可指示验证组件120检査以确保结果是完全真的、有可能真或假或某个特定的真实性值。这样的判断可取决于等待时间和/或金钱等的成本,例如与有可能真或假相比,验证结果是百分之百的真或假成本可能更高。如本领域的技术人员在阅读该详细描述时将认识到,可按照多种不同形式显现用户界面组件210以便与数据交互。例如,用户界面组件410可包括一个或多个不同的区域,并在例如个人计算机、PDA、移动电话或其他合适设备的屏幕上显示多个图形对象,诸如文本、图形、音频、视频、按钮、菜单和文本框等。可以理解,存在其他布局或方向,它们均落在所附权利要求书的范围之内。另外或作为替换,系统200可包括应用程序编程接口(API)组件220。API组件220提供允许其他应用程序和系统使用系统200而非作为单机系统的机制。根据本发明的一个方面,API组件可便于与搜索引擎交互。在这样的实例中,搜索引擎可提供网页和/或接收有效性分数。搜索引擎例如可基于有效性分数增进结果排序。例如,假定相同的相关性分数,则具有较高有效性分数的网页的排序将高于具有较低分数的网页。搜索引擎也可随搜索引擎结果显示真实性信息,以允许用户基于这种信息决定他们想要査看哪些结果。而且,用户可指定阈值,且搜索引擎可仅返回满足该阈值的结果。作为替换或除此以外,浏览器、浏览器工具栏、电子邮件客户端或即时消息客户端可经由API组件220与系统200交互。在应用时,当用户访问真实性较差的网页时,浏览器可主动警告或以其他方式通知用户。图3示出了根据本发明的一方面的咨询验证系统300。系统300包括如前所述的接收器组件IIO、验证组件120和界面组件210。简而言之,接收器组件120获取计算机提供的结果和/或与之相关联的信息,并将其提供给验证组件120。验证组件120可生成标识结果真实性的度量,并经由界面组件210将该度量单独或结合结果和相关联的信息提供给用户。系统300也包括通信耦合至验证组件310的咨询组件310、咨询者存储320和通信组件330。验证组件120可采用咨询组件310来从一个或多个个体(即,人)取得意见。基于结果或回答,咨询组件310可搜索咨询者存储320来査找验证回答的适当个体。可以注意到,用户界面组件210耦合至咨询者存储320,因此可便于添加和/或移除咨询者,或以其他方式实现咨询组件310作出的选10择。例如,用户可标识验证某些结果或事实的第一个体和验证其他事实的第二个体。而且,用户可指定验证特定结果的一组优先级个体,使得如果第一个体不可用,则咨询组件310可便于联系第二个体,并依此类推。通信组件330通信耦合至咨询组件MO。通信组件330从咨询组件310接收、检索或以其他方式获取咨询者和结果信息。咨询者信息可包括个体的身份(例如,真名、用户名...)以及一个或多个联系方法。结果信息可包括关于计算机提供结果的数据以及可任选地结果本身。通信组件330可用于与一个或多个咨询者建立因特网通信会话。通信会话可在社会网络、博客、即时消息收发、电子邮件、VoIP(因特网协议上的语音)等上下文中建立。一旦建立,通信会话即可用于向咨询者传送结果信息和/或结果,以及接收响应。通信组件也耦合至第三方界面组件340。界面组件340可提供协助咨询者査看和响应所获取的结果信息的环境。在一个实例中,界面组件340可对应于丰富图形用户界面。用户可经由界面组件340获取结果和结果信息。随后或并发地,第三方用户可分析结果以确定结果是否正确。用户也可采用用户界面来启动与他人的通信,例如用于咨询。而且,应理解,可不向用户提供结果,以不使响应偏向。相反,用户将简单地提供响应。例如假定,用户(例如,技师)使计算机分析巴氏涂片,并确定在该涂片中很有可能存在癌前细胞。用户也可能同意基于计算机的发现,但也想要第二技师或医生的意见。系统可自动打包关于诊断的信息(例如,涂片的图像、结论(这将在接收第二人的输入之后向第二人展示以便不会使第二诊断有所偏向)),将其提供给第二人,并接收响应。应注意到,第二人甚至可能位于地球的另一边(例如,印度),通过提供常规上如果由另一个美国医生执行则成本太过高昂的第二意见,以降低成本但改善医疗。转而关注图4,示出了根据本发明的一方面的调查验证系统400。类似于系统200和300,系统400包括如上所述的接收器组件110、验证组件120和用户界面组件210。简而言之,接收器组件110可获取结果和结果信息等,并将其提供给验证组件120或使其可供验证组件访问。用户界面组件210通信耦合至接收器组件110和验证组件120,并提供用于通过控制验证组件120如何验证数据来与系统400交互的机制。系统400也包括通信耦合至验证组件120的调査组件410。调查组件410便于标识适当的调査源并将调査输入提供回验证组件120。更具体地,可从调査源存储420标识调查源。存储420容纳多个源,诸如个体和电子论坛等。这些源可以但不限于由用户经由通信耦合的用户界面210标识和存储。基于结果和/或结果信息,调査组件410可从存储420选择一个或多个调査源,将其提供给通信组件330或使其可供通信组件访问。通信组件330然后可建立用于接收调査结果的通信会话。作为示例而非限制,通信组件330可建立中央网站以接收在给定结果信息的情况下关于结果的真实性的投票,并向特定个体发出将其引导到该网站进行投票的电子邮件。或者,可对于社会网络设置群组以接收投票。用户可采用第三方用户界面组件来査看结果和结果信息,并启用投票。例如,界面组件340可显示投票网站。一旦接收到结果,它们即可通过第三方界面组件340、通信组件330和调査组件410传输回验证组件120。基于投票结果,验证组件120可确定结果的真实性,并生成度量以经由用户界面组件210向用户提供。参考图5,示出了根据本发明一方面的基于分析的验证系统500。类似于系统200、300和400,系统500包括如上所述的接收器组件110、验证组件120和用户界面组件210。而且,系统500包括通信耦合在一起并分别耦合至验证组件120和用户界面组件210的分析组件510和数据源520。当验证组件120请求时,分析组件510可根据各个数据源仔细核査结果。数据源520可容纳已知或用户标识为可信的数据源的身份和/或数据。这些源可包括特定网站、在线书籍或其他出版物等。例如,用户可标识他们相信可靠的多个网站,并将这些身份存储在数据源存储520中。随后,他们可启动结果的验证。验证组件120然后可从分析组件510请求数据。分析组件510然后可就一个或多个数据源520提供的信息分析结果以及其他相关信息。分析的结果然后可被提供回验证组件120。例如,如果正针对web上的其他数据验证网站数据,则分析组件120可指示五分之四的可信数据源赞同/不同意结果。基于这种信息,验证组件120可生成验证度量以经由用户界面组件210提供给用户。图6根据本发明一方面更详细地示出了分析组件510。组件510包括将计12算机提供的结果与数据源进行比较以确定结果是否准确的源分析器组件610。此外,分析器组件610通信耦合至挖掘组件620。挖掘组件620向分析器组件610提供数据源以仔细核查。更具体地,挖掘组件620可利用结果和/或与结果有关的信息例如通过检査与之相关联的元数据来匹配或标识相关数据源。然后可向分析器组件610标识相关源。分析器组件610可将数据源身份提供给源检索组件630,后者可随后或并发地定位信息并将信息返回给分析器组件610以便分析。分析器组件620也可利用各种其他技术以便于真实性判断。例如,分析器组件620可比较一个或多个文档。分析器组件620也可分析信息源与已知可靠源之间的关系距离以提供给验证组件。例如,包括对已知可靠源的多个链接的网页可能比不包括这类链接的网页更可信。另外或替换地,可釆用各种机器学习技术来根据各种因素推断真实性。参考图7,示出了根据本发明一方面的计算机结果验证系统700。类似于以上的一些系统,系统700包括接收器组件110、验证组件120和用户界面组件210。如前所述,接收器组件110接收或检索结果、结果信息等,并使其可供用户界面组件210以及验证组件120使用。可采用用户界面组件210来启动经由验证组件120的结果验证,其结果通过界面组件120提供回用户。可以注意到,验证系统700可采用各种机制来便于真实性判断。例如,系统可采用关于图3、4和5描述的参考、调查和数据源分析中的一个或多个。为便于这样的选择,提供上下文组件710。上下文组件710通信耦合至用户界面组件210和验证组件120两者。上下文组件710可标识或确定关于用户的信息、用户周围环境、结果和/或有助于确定所需验证级别的结果信息。这种信息可与用户相关联,并由用户界面组件210提供。信息可包括用户概况信息,诸如名字、年龄、性别、种族、生日、喜欢的网站等,且可由用户提供或由界面210例如通过监视交互(例如,经由cookie..)来确定。也可确定或推断其他上下文信息,诸如一天中的时间、一周中的日子、事件(例如,节日、博览会…)等。基于这种信息,验证组件120可确定验证的最佳方法。例如,如果时间是重要的,则验证组件120可选择利用数据源分析来验证数据。在另一实例中,可将调査或投票机制确定为在给定时间、准确性和成本要求情况下给定结果的最佳验证机制。或者,如果准确性是重要的,例如对于医疗,则验证组件可选择采用咨询。另外或替换地,验证组件120可选择在其处理中利用所有机制来确定真实性。在这样的情况中,可根据其可靠性对各种机制加权,例如使咨询者意见的权重高于数据分析。图8描绘了根据本发明一方面的验证组件120。简而言之,验证组件120便于验证计算机生成或提供的数据的真实性。验证组件可包括标识要采用以验证结果或回答的一个或多个验证机制的选择组件810。如前面所公开地,可利用各种机制,包括但不限于咨询、调查和数据分析机制。至少部分地基于要验证的主题和其他上下文信息,选择组件810可确定要采用的至少一种机制。作为示例,假定用户为即将到来的音乐会搜索web并接收到会议中心的驾车方向。尽管期望准确的方向,但它们不是至关重要的。从而,选择组件可排除咨询机制,尤其是这种机制成本高昂,且结果不能以及时方式获取。因此,选择组件810可选择使用数据分析和调查机制中的一个或两个。按照数据分析机制,可定位有可能包括方向信息的诸如网站的数据源,诸如与场地、乐队和/或票务代理相关联的网站。可关于结果方向分析这样的数据以确定其准确性。也可采用调査机制以例如在一个或多个相关聊天室中张贴方向并接收关于方向是否准确的投票。验证组件120也包括便于表达结果的真实性的度量生成组件820。基于一个或多个选择所提供的结果,度量生成组件820可产生结果真实性的有意义表示。例如,度量可以是布尔真或假,或指示某物是正确或不正确的可能性的标量值。参考图9,示出了根据本发明的一方面的web搜索系统900。搜索系统900允许由试探和/或上下文信息引导的web搜索。系统包括搜索引擎910。如本领域中已知地,搜索引擎910可接收査询,并响应于其而提供相关结果。搜索引擎910通信耦合至推断组件920。在操作中,界面组件920能够部分基于试探和用户提供的信息等引导搜索査询和结果。推断组件920可与知识存储930交互以便于推断相关搜索结果。例如,知识存储930可包括多个知识捕捉规则。推断组件920可采用这些规则中的一个或多个来引导并最终便于检索更相关结果。具体地,推断组件920可请求并检索信息,或单单接收信息,并基于规则14便于査询增进。例如,推断组件920可向用户演示关于搜索的一系列问题,并基于回答返回相关结果。更具体地,可用关于类型、风格和/或品牌的问题满足对"轿车"的搜索査询,这然后可启动另一系列问题以进一步限定试图查找什么东西。随后的问题由此可依赖于对之前问题的回答。从而,可以理解,推断组件920和知识库930可一起形成机器学习和推理系统的至少一部分,尽管本发明并不限于此。根据本发明的一方面,推断组件920(或专家系统)可便于主题分层结构或群集的导航。例如,搜索域可被分类为搜索树,其中朝上是较宽泛的主题,而粒度较细的主题被推到底部。作为示例,树的一部分可包括朝上的汽车,这被进一步分成轿车、卡车、厢式货车等,这些主题中的每一个被进一步限为两用轿车、跑车等。另外或替换地,可基于其关系利用主题的群集。推断组件可利用原始搜索项以及如下所述的其他上下文信息在树或群集内定位起始点。然后可与原始査询和上下文信息一起采用问题和回答来导航树或群集。查询修改组件930可从通信耦合的推断组件920接收信息。査询修改组件920可用于更改提供给搜索引擎910的査询以反映推断出的信息。这种经修改或新的査询然后可由搜索引擎910执行以返回相关数据。每当信息被提供给推断组件920时或按照任何其他间隔,可执行这种过程。在一个实例中,査询修改组件930可利用主题分层结构或群集以及其中当前位置来确定应如何修改査询。而且,修改组件930可利用域和分类知识来生成对用户而言并非直观的査询。此外,修改组件930可生成利用搜索引擎910所支持的査询语言的全部表达能力的査询。以此方式,可用瞄准兴趣主题的紧密控制来细化査询。这可显著地改善结果以及获取这样的结果的效率,尤其对于利用少数关键词且可能是一个或两个连词的典型用户査询。新手用户因此将能够以与专业搜索者或搜索顾问相同的技巧来进行搜索。也应注意,系统900包括通信耦合至搜索引擎910和推断组件920两者的搜索上下文组件940。上下文组件940可用于确定或检索与搜索有关的上下文信息。上下文信息可由用户手动输入和/或从用户交互确定或推断(例如,性别、年龄、喜欢的网页...)。而且,上下文信息可从外部源接收或确定(例如,一周中的一天、节日、天气、当前事件...)。上下文信息可被提供给推断组件110,后者可引导至少部分基于其上的搜索。在一个情形中,代替向用户演示要回答的问题,回答可由上下文信息自动提供。因此,仅需向用户询问其答案不能基于当前信息在置信度的阈值水平内确定的问题。更具体地,可使用统计机器学习和推理方法来推断不同结果的使用,来推断与向用户提供有价值搜索结果的目标的相关性的状态的一组可能性,以及推断关于可能向用户询问的不同问题的回答的结果的可能性。可采用这样的信息来计算与每一潜在对话动作相关联的信息的预期价值,即从用户或从系统获取关于目标、人口统计或其他信息的不同输入的价值。对这样的信息价值的计算可用于筛余和限制向用户询问或从数据库提取的问题。这样的计算可经由预先准备或问题群集的方法来考虑序列,或可以贪婪、顺序的方式用来生成用户的问题,借此可用每一响应更新可能性。图10示出了根据本发明一方面的示例性推断组件920。具体地,推断组件920包括处理器组件1010、对话组件1020、知识库界面1030和更新组件1040。处理器组件1010关于对话组件1020和界面组件1030处理信息。对话组件1020生成经由搜索引擎或相关联的界面提供给用户的问题,并接收对其的回答。处理器组件规定所生成的问题,并处理所接收的信息。更具体地,处理器组件1010可经由知识存储界面组件1030从知识存储检索试探法或规则(例如,捕捉主题分层结构或群集)。这些规则可确定和/或影响对话组件120提供的问题以及推断用户正在查找或他/她可能感兴趣的内容所需的信息。更新组件1040通信耦合至对话组件1020和界面1030,且可用于监视对话交互等,以及经由界面1030更新知识库。随着时间的流逝,这可使得界面组件120学习更有针对性或个性化的对话,和用这样的对话与用户交互。以此方式,接收相关信息需要的信息可能较少。而且,更新组件1040也可便于建议用户可能感兴趣的搜索。已经关于若干组件之间的交互描述了前述系统。应该理解,这样的系统和组件可以包括此处指定的那些组件或子组件,所指定组件或子组件中的一些和/或另外的组件。子组件也可以被实现为通信耦合至其他组件而非被包括在父组件内的组件。而且,一个或多个组件和/或子组件可以被组合成提供聚集功能的单个组件。组件也可以与出于简明考虑而在此未具体描述但本领域的技术人员16已知的一个或多个其他组件交互。而且,如可以理解,以上公开的系统以及以下方法的各个部分可以包括或包含人工智能、机器学习或基于知识或规则的组件、子组件、进程、装置、方法或机制(例如,支持向量机、神经网络、专家系统、贝叶斯置信网络、模糊逻辑、数据融合引擎、分类器...)。这样的组件和其他组件可以自动化执行某些机制或进程,由此使得系统和方法的各部分更为自适应、高效及智能。考虑到以上描述的示例性系统,参考图11-17的流程图将可以更好地理解根据所公开的主题实现的方法。尽管出于说明简单的目的,各方法被显示和描述为一系列框,但应该理解和领会,所要求保护的主题不受框次序的限制,因为一些框能够以不同的次序和/或与在此描绘和描述的其他框同时发生。而且,并非所有示出的框都是实现以下描述的方法所必需的。另外还应该明白,下文以及本说明书全文中所公开的方法能够被存储在制品上,以便于把此类方法传送和转移到计算机。如在此使用的术语"制品"旨在涵盖可以从任何计算机可读设备或介质访问的计算机程序。参考图11,示出了根据本发明一方面验证计算机生成的和/或提供的数据的方法1100。在参考标号1110,获取关于计算机结果的信息。例如,结果可对应于对数据或检索到的网页的分析。在标号1120,按照各种不同方式(例如,咨询、调査、分析...)确定结果的真实性。在参考标号1130,生成指示结果真实性的真实性度量。可从一个或多个真实性测量编译度量。此外,度量可以是布尔值,诸如真或假,或者是标量,诸如真、可能真、可能假、假。在参考标号1140,可将度量提供给用户,例如单独提供或结合结果提供。转而关注图12,示出了根据本发明一方面验证数据的方法1200。更具体地,方法1200便于通过一个或多个咨询者来进行验证。在参考标号1210,标识咨询者。咨询者可以是已知或用户标识的可信个体。此外,该个体可以是主题专用咨询者,例如使得医学博士不会被标识为关于桥梁构造的咨询者。在标号1220,启动与一个或多个咨询者的因特网通信会话以便于信息的传送。会话可以是安全网页、聊天会话、电话会议和/或视频会议等。另外或替换地,会话可简单地对应于电子邮件消息或其线索。在参考标号1230,经由通信会话将结果信息提供给一个或多个寻求咨询的人。结果信息可包括用来生成或提供结果的数据和/或结果本身。例如,结果信息可以是用来生成结果的数据,诸如EKG数据。在这样的情形中,有可能希望仅提供结果信息,而不使评估偏向。在其他情形中,结果可以是对诸如网页的所感兴趣的内容的信息验证。从而,在这种情况中,提供结果是重要的。在参考标号1240,经由通信会话或其他介质接收一个或多个咨询者意见。如所述地,如果原来未提供结果,则意见可以是结果本身。或者,如果提供了结果,例如给定了用于确定结果的信息,则意见可涉及结果的真实性或有效性。图13描绘了根据本发明一方面验证数据的轮询或调查方法1300。在参考标号1310,启动因特网通信会话。会话可以是网页、博客、聊天会话、电话会议和/或视频会议等。在1320,结果信息和/或结果本身经由因特网通信会话提供。从通信会话接收关于结果真实性的投票。作为示例,可在社会网络内建立标识正质疑其真实性的网页的网页或博客。社会网络网页可接收关于其他页面内容的真实性的投票和/或意见。尽管可用人来验证数据,但这样的过程也可自动化。图14示出了根据本发明一方面验证数据的分析方法1400。在参考标号1410,可仔细核査数据源。换言之,调查源的可信程度(例如,类型、特定源...)。作为示例,在个人网页上提供的数据可被标识为与商业在线百科全书相关联的数据相比较不可信。在简单的实现中,源和相关联的值可被纳入数据库中,且仔细核查源可包括标识源以及查找与之相关联的值。可信程度的这种度量也可不时地更新以确保准确的值。在参考标号1420,可挖掘数据以便确证和/或反驳数据。例如,如果断言了事实,则可定位并分析多个数据源以确定所断言事实的真实性。参考图15,示出了根据本发明一方面的验证方法1500。在参考标号1510,获取设法验证的计算机结果信息。获取要验证的数据周围的上下文信息等。例如,上下文信息可涉及请求验证的个体或实体以及要验证的数据的种类或类型(例如,银行业、医疗、个人、娱乐…)等。在参考标号1530,给定要验证的信息和上下文,确定可接受的有效性水平。例如,如果试图要验证的是医生的医疗数据,则可接受的有效性水平将相当高,尤其是与爱好者的体育比赛的曰期和位置相比。在标号1540,基于所指定的有效性水平选择并采用一个或多个验证机制。在医疗信息示例中,这可对应于允许另一医生审阅数据的咨询机制。18对体育数据,轮询和/或数据分析机制被认为是适当的。图16示出了根据本发明一方面的搜索方法1600。在参考标号1610,经由搜索引擎接收搜索查询,诸如web査询。在1620,关于可能的所需项目进行推断。这样的推断可基于一个或多个试探以及上下文信息作出。例如,如果可根据试探或上下文确定一个人对黑色的运动型多用途车(SUV)感兴趣。在标号1630,基于推断修改搜索查询,从而指定更相关的数据。按照以上示例,可修改对轿车或卡车的查询以聚焦对黑色SUV的査询。在参考标号1640,执行修改后的査询,并返回结果。图17示出了根据本发明一方面web搜索的方法1700的流程图。在参考标号1710,接收搜索査询。在1720,提供根据査询的执行生成的结果。至此,方法1700可对应于由常规搜索引擎执行的过程。然而,在参考标号1730,向用户提供关于其査询的问题。问题的目标在于恳求进一步限定査询或搜索的类别的信息。例如,如果输入了查询"土星",则可生成诸如"你在査找'土星,汽车还是行星'土星,?"的问题。尽管可按照这样的开放方式询问问题,但回答也可基于"是"和"否"问题来恳求。例如,"你是否指的是行星'土星'?"如果回答为"否",则它可自动推断你指的是汽车和/或生成另一问题来确认。此外,应理解,问题也可由上下文引导。从而,询问你是否指的是行星的初始问题可基于从偏好、之前的搜索和当前事件等标识的与行星、天文等相关的上下文信息智能选择。而且,询问问题的判断和/或问题本身可基于指示最好是取回这样的答案而非从用户信息或上下文检索和/或推断这样的答案的信息期望值或价值(例如,包括不同结果的利用、关于距提供相关结果的目标的相关性状态的可能性、可被询问的不同问题的回答的结果的可能性...)。当信息值超过阈值时,可生成问题。在标号1740,作出是否响应于所提供的问题接收到结果或答案的判断。如果否,则方法继续至1740的循环。如果是,则方法前进至标号1750,在那里基于查询和一个或多个响应标识结果。例如,查询可基于所接收到的对问题的回答来证明合格。方法可在1730继续,在那里向用户提供另一问题。该问题可基于查询和/或之前的响应两者。该方法然后可继续循环以进一步限定查19询,从而进一步限定结果粒度。以此方式,可由问题及其响应来智能引导搜索。在一个情形中,问题和回答可自动导航主题分类分层结构或群集。另外,可向分类分层结构或群集提供结果以允许用户按需进一步细化或拓宽其搜索(例如,上巻、下降)。而且,可以注意到,无需提供结果直到满足特定的知识阈值。换言之,不必提供搜索结果,直到搜索被细化到某一范围,例如基于匹配得到的数目等。如此处所使用地,术语"组件"和"系统"等旨在指计算机相关实体,或者是硬件、硬件和软件的组合、软件或执行中的软件。例如,组件可以但不限于在处理器上运行的进程、处理器、对象、实例、可执行代码、执行的线程、程序和/或计算机。作为说明,运行在计算机上的应用程序和计算机本身都可以是组件。一个或多个组件可以驻留在进程和/或执行的线程内,并且组件可以位于一个计算机上和/或分布在两个或更多的计算机之间。在此使用的词语"示例性"意味着用作示例、实例或说明。在此被描述为"示例性"的任何方面或设计并不一定要被解释为相比其它方面或设计更优选或有利。类似地,在此提供的示例只是出于清楚和理解的目的并且并不意味着以任何方式限制本发明或其部分。可以理解,本可呈现多个其他或替换示例,但已出于简明的目的而省略了。根据将在下文中描述的本发明的一个或多个方面,可结合执行推断和/或概率判断和/或基于统计的判断来采用基于人工智能的系统(例如,显式和/或隐式训练的分类器)。如此处所使用地,术语"推论"或"推断"通常指的是从经由事件和/或数据捕捉的一组观察结果来推理或推断系统、环境、和/或用户状态的过程。例如,推断可用于标识特定的上下文或动作,或可生成状态的概率分布。推断可以是概率性的——即,基于数据和事件的考虑计算感兴趣的状态的概率分布。推断也可以指用于从一组事件和/或数据合成更高级事件的技术。这类推断导致从一组观察到的事件和/或储存的事件数据中构造新的事件或动作,而无论事件是否在相邻时间上相关,也无论事件和数据是来自一个还是若干个事件和数据源。各种分类方案和/或系统(例如,支持矢量机、神经网络、专家系统、贝叶斯信任网络、模糊逻辑、数据融合引擎……)可结合执行关于本发明的自动化和/或推断的动作来采用。而且,本发明的所有或部分可使用标准编程和/或工程设计技术而被实现为方法、装置或制品,来生产软件、固件、硬件或其任何组合以控制计算机实现所公开的发明。如在此使用的术语"制品"旨在涵盖可以从任何计算机可读设备或介质访问的计算机程序。例如,计算机可读介质可以包括但不限于磁存储设备(例如,硬盘、软盘、磁带……)、光盘(例如,紧致盘(CD)、数字多功能盘(DVD)……)、智能卡和闪存设备(例如,卡、棒、跳转驱动器……)。另外应该明白,载波可以被用于承载计算机可读电子数据,例如那些用于发送和接收电子邮件或用于访问如因特网或局域网(LAN)等网络的数据。当然,本领域的技术人员将会认识到,在不背离所要求保护的主题的范围或精神的前提下可以对这一配置进行许多修改。为了对所公开的主题的各个方面提供上下文,图18和19以及以下讨论旨在提供其中可实现所公开的主题的各方面的合适环境的简要、大体描述。尽管以上在运行在一台和/或多台计算机上的计算机程序的计算机可执行指令的一般上下文中描述了本主题,但本领域的技术人员将认识到,本发明也可结合其他程序模块实现。一般,程序模块包括执行特定任务和/或实现特定抽象数据类型的例程、程序、组件、数据结构等。而且,本领域的技术人员可以理解,本发明的方法可用其他计算机系统配置实现,包括单处理器或多处理器计算机系统、小型计算设备、大型计算机、以及个人计算机、手持式计算设备(例如,个人数字助理(PDA)、电话、手表...)、基于微处理器或可编程消费者或工业电子设备等。所示各方面也可在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实现。然而,所要求保护的本发明的某些方面(即使不时全部方面)可在单机计算机上实现。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备中。参考图18,用于实现此处所公开的各方面的示例性环境1810包括计算机1812(例如,台式机、膝上型计算机、服务器、手持式、可编程消费者或工业电子...)。计算机1812包括处理器单元1814、系统存储器1816和系统总线1818。系统总线1818将包括但不限于系统存储器1816的系统组件耦合到处理单元1814。处理单元1814可以是各种可用处理器中的任意一种。双微处理器和其它多处理器体系结构(例如,多核)也可用作处理单元1814。21系统总线1818可以是若干类型的总线结构中的任一种,包括存储器总线或存储器控制器、外围总线或外部总线、和/或使用各种可用的总线体系结构中的任一种的局部总线,可用的总线体系结构包括,但不限于,ll位总线、工业标准体系结构(ISA)、微通道体系结构(MCA)、扩展的ISA(EISA)、智能驱动器电子接口(IDE)、VESA局部总线(VLB)、外围部件互连(PCI)、通用串行总线(USB)、高级图形接口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)以及小型计算机系统接口(SCSI)。系统存储器1816包括易失性存储器1820和非易失性存储器1822。基本输入/输出系统(BIOS)包含诸如在启动期间在计算机1812的元件之间传送信息的基本例程,其存储在非易失性存储器1822中。作为说明而非局限,非易失性存储器1822可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除ROM(EEPROM)或者闪存。易失性存储器1820包括用作外部高速缓冲存储器的随机存取存储器(RAM)。计算机1812还包括可移动/不可移动、易失性/非易失性计算机存储介质。例如,图18示出了大容量或辅助存储1824。大容量存储1824包括但不限于诸如磁盘驱动器、软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡、或者记忆棒之类的设备。此外,大容量存储1824可以包括独立的或者与其它存储介质结合的存储介质,包括但不限于诸如紧致盘ROM设备(CD-ROM)、可记录CD驱动器(CD-R驱动器)、可重写CD驱动器(CD-RW驱动器)或者数字多功能盘ROM驱动器(DVD-ROM)这样的光盘驱动器。为了便于将大容量存储设备1824连接到系统总线1818,通常使用诸如接口1826等可移动或不可移动接口。可以理解,图18描述了用户与在合适的操作环境1810中描述的基本计算机资源之间担当中介的软件。这样的软件包括操作系统1828。可被存储在大容量存储1824并加载到系统存储器1816的操作系统1828,用来控制和分配系统1812的资源。系统应用程序1830通过存储在系统存储器1816中或大容量存储1824上的程序模块1832和程序数据1834来利用操作系统1828对资源的管理。可以理解,本发明可用各种操作系统或操作系统的组合来实现。用户通过输入设备1836把命令或信息输入到计算机1812中。输入设备221836包括但不限于诸如鼠标、跟踪球、指示笔、触摸垫等定点设备、键盘、话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、TV调谐卡、数码相机、数码摄像机、网络摄像头等等。这些以及其它输入设备通过系统总线1818经由接口端口1838连至处理单元1814。接口端口1838包括,例如串行端口、并行端口、游戏端口、以及通用串行总线(USB)。输出设备1840利用和输入设备1836相同类型的某些端口。因此,例如,USB端口可以用来向计算机1812提供输入,以及把来自计算机1812的信息输出到输出设备1840。提供输出适配器1842以示出,存在如显示器(例如,平板、CRT、LCD、等离子…)、扬声器和打印机等其他输出设备1840的要求特殊适配器的某些输出设备1840。输出适配器1842包括,作为说明而非局限,提供输出设备1840和系统总线1818之间的连接手段的显卡和声卡。应该注意到,其它设备和/或设备系统提供了输入和输出能力,诸如远程计算机1844。计算机1812可以使用至诸如远程计算机1844等一个或多个远程计算机的逻辑连接在网络化环境中操作。远程计算机1844可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的电器、对等设备或者其它常见的网络节点等,且通常包括相对于计算机1812所描述的很多或者全部元件。为了简明起见,对远程计算机1846仅示出了存储器存储设备1844。远程计算机1844经由网络接口1848被逻辑地连接到计算机1812,并且然后经由通信连接1850物理地连接(例如,有线或无线地)。网络接口1848涵盖诸如局域网(LAN)和广域网(WAN)这样的通信网络。通信连接1850指的是用于把网络接口1848连接到总线1818的硬件/软件。虽然为了清楚地举例说明,通信连接1850被示为在计算机1816的内部,但其也可以在计算机1812的外部。连接至网络接口1848所需的硬件/软件仅为示例性目的包括内部和外部技术,诸如包括常规电话级调制解调器、线缆调制解调器、电源调制解调器和DSL调制解调器等调制解调器、ISDN适配器以及以太网卡或组件。图19是本发明可与其交互的示例计算环境1900的示意框图。系统1900包括一个或多个客户机1910。客户机1910可以是硬件和/或软件(例如,线程、进程、计算设备)。系统1900还包括一个或多个服务器1930。因此,系统190023可对应于两层客户机服务器模型或多层模型(例如,客户机、中间层服务器、数据服务器)以及其他模型。服务器1930也可以是硬件和/或软件(例如,线程、进程、计算设备)。服务器1930可以容纳各线程以通过例如利用本发明执行转换。客户机1910和服务器1930之间的一种可能的通信可以是在两个或多个计算机进程之间传输的数据分组形式的。系统1900包括可以用来使客户机1910和服务器1930之间通信更容易的通信框架1950。客户机1910可在操作上连接至可用来存储对客户机1910本地的信息的一个或多个客户机数据存储1960。同样地,服务器1930可在操作上连接到可以用来存储对服务器1930本地的信息的一个或多个服务器数据存储1940。以上所已经描述的内容包括所要求保护的主题的各方面的例子。当然,出于描绘所要求保护的主题的目的而描述每一个可以想到的组件或方法的组合是不可能的,但本领域内的普通技术人员应该认识到,所要求保护的主题的许多进一步的组合和排列都是可能的。从而,所公开的主题旨在涵盖落入所附权利要求书的精神和范围内的所有这样的变更、修改和变化。而且,就术语"包含"、"具有"或"含有"或其形式的变型在详细描述或权利要求书中使用而言,这样的术语旨在以类似于术语"包括"在用作权利要求书中的过渡词时所解释的方式为包含性的。2权利要求1.一种包括以下计算机实现的组件的web搜索系统接收查询并标识与所述查询有关的网页的搜索引擎;以及至少部分地基于从设计成协助标识相关网页的一系列问题和用户提供的回答得出的推断来影响所述查询的推断组件。2.如权利要求1所述的系统,其特征在于,所述推断组件包括生成所述问题并接收响应的对话组件。3.如权利要求2所述的系统,其特征在于,所述推断组件包括针对封装查询细化技术的试探法处理所接收的响应的处理器组件。4.如权利要求3所述的系统,其特征在于,还包括基于搜索引擎交互添加、删除和/或更改试探法的组件。5.如权利要求3所述的系统,其特征在于,所述试探法专用于定义分类分层结构或群集的网页的子集。6.如权利要求3所述的系统,其特征在于,所述试探法由谓词逻辑规则封装。7.如权利要求6所述的系统,其特征在于,所述问题是"是"或"否"问题。8.如权利要求3所述的系统,其特征在于,所述处理器组件参考上下文信息处理所接收的响应。9.如权利要求3所述的系统,其特征在于,还包括根据由所述推断组件所推断的数据启动搜索査询的查询修改组件。10.如权利要求l所述的系统,其特征在于,所述搜索引擎基于有可能的査询细化条款而群集结果。11.一种web搜索系统,包括用于接收和处理web查询的计算机实现的装置;以及用于经由用户与机器学习和推理系统的交互来迭代地细化所述査询的计算机实现的装置。12.如权利要求11所述的系统,其特征在于,还包括用于至少部分基于所述查询和/或与所述学习和推理组件的所述交互更改与所述学习和推理系统相关联的知识库的计算机实现的装置。13.—种包括以下计算机实现的动作的web査询细化方法接收搜索査询;推断特定用户感兴趣的项目;以及至少部分地基于推断出的感兴趣的项目来修改所述査询。14.如权利要求13所述的方法,其特征在于,还包括执行所修改的査询以生成结果。15.如权利要求13所述的方法,其特征在于,推断感兴趣的项目包括生成和接收对一系列一个或多个问题的响应。16.如权利要求15所述的方法,其特征在于,还包括基于从所述用户和所述关于用户的信息中的至少一个接收不同回答的一组推断出的可能性来计算信息的价值;以及当所述信息价值大于阈值时,生成问题。17.如权利要求15所述的方法,其特征在于,基于与搜索域分类有关的试探规则生成问题。18.如权利要求17所述的方法,其特征在于,基于之前的响应生成问题。19.如权利要求18所述的方法,其特征在于,还包括至少部分地基于从交互学习到的知识修改所述试探归组中的一个或多个。20.如权利要求15所述的方法,其特征在于,还包括从上下文信息推断感兴趣的项目。全文摘要提供了用于引导计算机搜索(例如,web、因特网、内联网…)的机制。与搜索引擎一起采用机器学习和推理机制以便于基于查询和对计算机生成的询问的响应智能引导查询和结果。而且,公开了允许用户验证基于计算机的信息的机制。用户可接收与计算机生成或提供的结果相关联的、指示这样的结果的真实性的有效性度量。公开了便于确定结果的真实性的验证系统和方法,包括采用人工(例如,咨询、投票…)和/或自动化手段(例如,源分析、数据挖掘…)的系统和方法。文档编号G06F17/30GK101479727SQ200780024382公开日2009年7月8日申请日期2007年6月25日优先权日2006年6月28日发明者B·A·布鲁内尔,E·J·霍维茨,G·W·弗雷克,J·C·普拉特,J·T·古德曼,K·A·莫斯,O·赫斯特-席勒,R·E·奥齐,W·H·盖茨三世申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1