知晓时间-位置的移动查询建议的制作方法

文档序号:6440363阅读:130来源:国知局
专利名称:知晓时间-位置的移动查询建议的制作方法
技术领域
本发明涉及通过集成时间和位置来推荐移动查询建议的技术。
背景技术
搜索引擎公司向用户提供方便的搜索服务,诸如个人计算机(PC)web搜索。最近, 搜索引擎公司正在实现用于移动计算设备的移动搜索引擎应用程序。移动搜索在若干方面不同于PC web搜索。一个区别是对于移动搜索查询,用户往往键入更短的文本输入,因为在移动计算设备上输入文本通常是困难或笨拙的。另一个区别是进行移动搜索的用户通常喜欢所返回的搜索结果与查询时间和/或用户的当前位置相关。又一个区别是移动搜索查询的结果由于移动计算设备具有比PC少的带宽和小得多的屏幕来显示信息而受限。上面提及的搜索引擎公司中的大多数通过提供查询建议来简化移动搜索的查询输入。例如,在用户开始输入文本输入时,搜索引擎通过提供与该用户正在输入的文本串在语义上相关的查询的列表来提供实时查询建议以帮助用户。然而,移动搜索引擎往往基于 PC web搜索来调整查询建议技术,而不会为了满足移动搜索查询的需求来作出改变。因此, 变得难以在为移动搜索查询提供查询建议时集成其他因素。

发明内容
本发明内容描述通过将时间和位置信息集成在对在移动计算设备上提交的查询输入的响应中来推荐移动查询建议。对移动查询建议的推荐集成了当查询输入被提交时的当前时间和移动计算设备的当前位置。在一种实现中,一过程通过从移动搜索日志提取查询来构建二分图。该过程为查询中的每一个标识发送查询的用户、用户发送查询的时间和用户发送查询的位置。该过程基于二分图并至少部分基于以下之间的相似性来计算用户之间的相似性(1)查询,(2)用户提交查询的时间,和C3)用户提交查询的位置。然后,该过程从特定的用户的移动计算设备接收与当前时间和移动计算设备的当前位置关联的查询输入。然后,该过程可以响应于查询输入的接收而从二分图标识候选查询,候选查询至少包含由先前已经提交过所接收的查询输入的用户先前提交的查询的部分。接着,该过程至少部分基于以下来计算候选查询中的每一个与查询输入的相关性(1)提交候选查询的各个用户和特定的用户之间的所计算的相关性,( 与所接收的查询输入关联的当前时间和当提交候选查询时的时间之间的差异,以及C3)与所接收的查询输入关联的当前位置和提交候选查询的位置之间的距离。在另一实现中,一过程从特定的用户的移动计算设备接收与当前时间关联并与移动计算设备的当前位置关联的查询输入。至少部分基于对所接收的查询输入的响应,该过程访问从移动搜索日志构建的查询-用户图,移动搜索为多个查询中的每一个而标识发送查询的用户、用户发送查询的时间和用户发送查询的位置。该过程还至少部分基于以下来标识与查询输入相关的候选查询至少部分基于查询之间的相似性、用户提交查询的时间和用户提交查询的位置来计算来自的查询-用户图用户之间的相似性。通过至少部分基于以下来计算候选查询中的每一个与所接收的查询输入的相关性,该过程还来标识候选查询(i)与所接收的查询输入关联的当前时间和提交候选查询的时间之间的差异,以及 (ii)与所接收的查询输入关联的当前位置和发送候选查询的位置之间的距离。提供本发明内容以便以简化形式描述下面在具体实施方式
中进一步描述的概念选集。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。


参考附图描述具体实施方式
。附图中,参考数字最左边的数字标识该参考数字首次在其中出现的图。在不同的图中使用相同的参考数字指示相似的或相同的项或特征。图1示出用于响应于查询输入而将时间和位置信息集成到移动查询建议中的说明性体系结构环境。图2是示出用于提供移动查询建议以供图1的体系结构使用的说明性高级阶段的流程图。图3是示出预处理移动搜索日志以便构建二分图并评估流量模式的说明性过程的流程图。图4阐释查询流量模式的线图(plot)的示例图。图5示出记录查询和用户之间的历史交互的说明性查询-用户图。图6是示出基于查询发出历史来计算用户之间的相似性的说明性过程的流程图。图7是示出计算相关性和推荐移动查询建议的说明性过程的流程图。图8示出确定查询和候选查询相关性之间的说明性二分图。图9是示出可与图1的体系结构一起使用的说明性服务器的框图。
具体实施例方式概览本发明内容描述集成与查询输入关联的时间和位置信息以便改善移动查询建议。 举例来说,时间-位置知晓(TLA)应用程序可以作为移动搜索引擎而操作以提供相关的查询建议,这些查询建议是供用户进行进一步搜索的推荐。度量相似的查询之间的距离的典型方法包括使用关键字或查询短语,在查询之间匹配关键字,将通常被点击的统一资源定位符(URL)与查询关联起来,或计算与查询关联的被点击的文档之间的相似性。TLA应用程序还将这些方法分类成两种类型,即基于内容的方法和基于链接的度量。基于内容的方法基于串匹配或语义相似性来建议查询。基于链接的度量通过开拓查询节点之间的链接来建议相关的查询而不考虑查询的内容和语义信息。在下列讨论中,TLA应用程序应用基于链接的度量。TLA应用程序响应于时间和位置敏感的查询输入而提供移动查询建议。举例来说,想象用户在大约下午五点在纽约市(NYC)华尔街附近提交对“饭店”的查询。TLA应用程序将该输入捕捉为用户提交查询的时间特性(在此为午餐时间左右)和用户提交查询时移动计算设备的位置(在此为纽约市华尔街地区附近)。然后,当向用户提供查询建议时,TLA应用程序可以考虑此所捕捉的时间和位置。在一些实例中,TLA应用程序将查询建议提供为以降序的相关查询的已排名项。举例来说,TLA应用程序可以提供最相关的查询 "Delmonico's” (位于华尔街附近的历史上著名的餐馆)、“Bayard’ s” (靠近华尔街的法国餐厅饭店)、“Harry’s Cafeand Steak”(华尔街附近的牛排饭店)和纽约市华尔街地区周围的其他饭店。因而,TLA应用程序基于至少三种输入来提供移动查询建议查询输入、查询输入的时间(例如,午餐时间等)和用于提交查询输入的移动计算设备的当前位置(例如,靠近纽约市华尔街等)。起初,TLA应用程序从已经许可收集他们的数据的用户接收或收集移动搜索日志。 TLA应用程序构建查询-用户图(例如,二分图)以从移动搜索日志提取提交查询的用户。 此信息可以称为查询发出历史,其捕捉已经由用户提交的查询以标识对时间和位置敏感的查询模式。TLA应用程序将时间(例如,何时)和位置(例如,何地)信息与所提交的查询关联起来。当前位置是指提交查询的用户的计算设备的位置。TLA应用程序还基于用户的查询发出历史来计算两个用户之间的相似性。TLA应用程序可以将TLA转换应用到查询-用户图。TLA转换是通过考虑在转换期间的外出邻居来计算从第一节点到第二节点的概率的马尔可夫转换过程。TLA应用程序还将相关性度量应用于标识相关查询以得到移动查询建议。传统的查询建议方法通过两个查询的公共用户或URL来度量两个查询之间的相关性。然而,TLA应用程序确定候选查询是否与查询输入相关、候选查询和查询输入何时由许多相似的用户在大约相似的时间和在大约相似的位置提交(例如,发出)。通过基于候选查询和查询输入的发出历史和用户组来度量候选查询和查询输入之间的相关性,TLA应用程序将基于链接的度量应用于捕捉此信息。TLA应用程序通过进一步开拓与链接关联的时间和位置信息来产生结果。此外,TLA应用程序计算候选查询的时间和位置和当前正在被提交的查询输入的时间和位置的距离,以及候选查询的时间和位置和已经被提交的查询输入的时间和位置的距离。集成了时间和位置信息的移动查询建议可以用于搜索引擎和网站。在一些实现中,移动查询建议可以被呈现在因特网浏览器、网站、本地数据库或本地操作系统的下拉列表中。尽管所描述的技术的诸方面可以在任何数量的不同的计算系统、环境和/或配置中实现,但在下列示例计算环境的上下文中描述诸实现。说明性环境图1阐释示例体系结构环境100,其通过将时间和位置信息集成到建议中来提供移动查询建议。体系结构环境100包括被阐释为移动计算设备的示例计算设备102。计算设备102被配置为经由一个或多个网络104连接以供用户108访问移动搜索服务106。计算设备102可以采用各种形式,包括但不限于便携式手持计算设备(例如,个人数字助理、智能电话、蜂窝式电话)、个人导航设备、膝上型计算机、便携式媒体播放器或能够访问移动搜索服务106的任何其他设备。网络104表示任何类型的通信网络,包括基于有线的网络(例如,公用电话交换网络、有线电视网络和数据网络)和无线网络(例如,蜂窝式网络、卫星网络、WiFi网络和蓝牙网络)。移动搜索服务106表示可以作为任何数量的在线服务提供器例如搜索引擎、社交网络站点等等的部分而操作的应用程序服务。用户108在计算设备102上输入查询文本。 移动搜索服务106可以“实时”推荐移动查询建议110,“实时”被定义为以与接收输入基本上相同的时间产生建议。在一种实现中,移动搜索服务106可以在完成查询输入之后提供移动查询建议110。另外,移动搜索服务106可以包括另外的模块或可以与诸模块一起工作以便执行下面讨论的操作。在所阐释的示例中,移动搜索服务106被主控在可以经由网络104访问的一个或
多个服务器例如服务器112(1)、112 (2).....112 (S)。服务器112 (I)-(S)可以被配置成多
个独立的服务器,或可以被配置成服务器的集合,这些服务器被配置为执行用于移动查询建议的处理功能。服务器112(1)-( 可以由向计算设备102和从计算设备102提供移动搜索服务106的网络服务提供器管理或主控。移动搜索服务106可以在运行时间-位置知晓(TLA)应用程序114的服务器 112(1)-(S)中的一个或多个上执行。TLA应用程序114利用查询输入、查询输入的时间和与用户108关联的计算设备102的当前位置来建议动态地变化的查询结果。在所阐释的示例中,计算设备102可以包括在计算设备102的显示器上呈现的用户界面(UI) 116。UI 116促进对提供实时网络化通信系统的移动搜索服务106的访问。在一种实现中,UI 116是呈现从TLA应用程序114接收的页面的基于浏览器的UI。例如,用户 108采用UI 116来提交对来自移动搜索服务106的移动查询建议的请求。例如,UI 116可以允许不同的类型的输入,例如文本或言语。此外,尽管体系结构100将TLA应用程序114 阐释为网络可访问的应用程序,但在其他实例中计算设备102可以主控TLA应用程序114。在阐释中,用户108使用他们的计算设备102经由网络104访问移动搜索服务106 或TLA应用程序114。移动搜索服务106呈现用户界面(UI) 116以接收查询输入(例如, “饭店”)。然后,移动搜索服务106关联查询输入的当前时间(例如,上午、下午等)和计算设备102的当前位置(例如,在堪萨斯州威奇托市、在华盛顿州温哥华市等)。然后,移动搜索服务106基于由二分图确定的相关查询、相似性计算和相关性度量来提供移动查询建议 110。这些功能性中的每一种都将更详细地讨论。在所阐释的示例中,用户108在上午某个时间在温哥华市的第五大街附近提交查询“饭店”。作为响应,移动搜索服务106的TLA应用程序114至少部分基于查询、用户108 提交查询的时间和用户108提交查询时移动设备102的位置(且因此是用户108的位置) 来生成一个或多个查询建议110。在此示例中,移动搜索服务106生成“bagel spot”(温哥华市第五大街上的饭店)的查询建议110、“caf6”(温哥华市第六大街上的饭店)和“N 个”可以包括靠近第五大街和第六大街的其他饭店的其他相关查询。正如所阐释的那样,环境100可以包括数据库118,其可以被存储在分离的服务器上或被存储在可经由网络104访问的代表性的服务器组112上。数据库118可以存储由 TLA应用程序114生成的移动查询搜索建议110。此外,数据库118可以主控用户的移动搜索日志以供构建二分图、计算用户之间的相似性和计算候选查询与查询输入的相关性之用,其中的每一个都在下面详细讨论。说明性过程图2-图3和图6-图7是示出示例过程的流程图。这些过程被阐释为逻辑流程图中的框的集合,这些框表示可以以硬件、软件或组合实现的操作序列。出于讨论目的,参考图1中示出的计算环境100描述这些过程。然而,可以使用不同的环境和设备来执行这些过程。此外,在此描述的环境和设备可以用于执行不同的过程。为便于理解,这些方法被描绘成被表示为图中的独立的框的分离的步骤。然而,这些分离地描绘的步骤不应被解释成它们的性能必定依赖于次序。描述过程的次序不旨在被解释成限制,且任何数量的所描述的过程框可以以任何次序组合以实现该方法或替换的方法。此外,也可能忽略所提供的步骤中一个或多个。图2是示出由移动搜索服务106和/或TLA应用程序114执行的高级函数的示例过程200的流程图。过程200可以被分成五个阶段预处理移动搜索日志以构建二分图的初始阶段202,使用用户和查询之间的历史交互来构建二分图的第二阶段204,基于来自二分图的查询发出历史来计算用户之间的相似性的第三阶段206,接收与查询输入的时间和计算设备的当前位置关联的查询输入的第四阶段208,以及基于若干因素来计算候选查询与查询输入的相关性的第五阶段210。所有阶段都可以用于图1的环境、可以分离地执行或组合执行,且没有任何特定的次序。第一阶段是预处理移动搜索日志以构建二分图202。在此,TLA应用程序114收集或接收包括个体用户的数据、查询和与查询关联的时间和位置信息在内的移动搜索日志。第二阶段包含使用查询和用户之间的历史交互来构建二分图204。TLA应用程序 114通过从移动搜索日志提取提交查询的用户来构建二分图。然后,TLA应用程序114形式化移动搜索日志,其中在一些实例中,移动搜索日志的每一记录被表示为四元条目(查询, 用户,时间,位置)。二分图用对应于用户和查询之间的边的时间和位置信息来组织发出或提交查询(例如,示出为一顶点)的用户(例如,示出为另一顶点)。第三阶段是基于来自二分图的查询发出历史来计算用户之间的相似性206。TLA 应用程序114计算已经在大约相似的时间和大约相似的位置发出相似的查询的用户之间的相似性。第四阶段是接收与查询输入的时间和计算设备的当前位置关联的查询输入208。 查询输入可以经由文本或言语来提供。用户108对寻找涉及他或她的当前时间和当前位置的信息感兴趣。第五阶段是基于若干因素来计算候选查询与查询输入的相关性210。如果候选查询和查询输入均由许多相似的用户在大约相似的时间和大约相似的位置发出,那么TLA应用程序114确定候选查询是否与查询输入相关。通过基于查询的发出历史和用户组来度量查询之间的相关性,TLA应用程序114应用基于链接的方法来捕捉此信息。图3是示出预处理移动搜索日志以构建二分图的说明性过程202(以上以高级讨论)的流程图。此信息标识查询的时间和位置敏感的诸方面。TLA应用程序114接收提交查询的用户的移动搜索日志300。移动搜索日志可以从全球定位系统(GPQ跟踪单元获得,GPS在车辆或人员靠近于GPS设备时标识车辆或人员的位置或跟踪车辆或人员的移动。例如,经由GPS设备或具有GPS功能性的移动计算设备而记录位置或移动。位置获取技术及其在人们生活中的使用的不断增加的普及使得可以每日收集GPS信息。移动搜索日志集合包括以小时和分钟表示的时间以及由经度和纬度对的GPS坐标表示的位置。在跟踪或共享用户的移动和位置之前,向个体用户中的每一个询问他们的GPS数据是否可以作为移动搜索日志集合的部分而被包括在内。选项是个体用户可以选择决定参与或决定不参与他们的GPS数据的跟踪或共享。因而,GPS数据的跟踪可以要求明确的用户同意。TLA应用程序114通过移除某些类型的查询(例如,含有不能采用的内容)和没有记录时间和位置信息的查询来预处理移动搜索日志。TLA应用程序114还可以使用Porter 词干提取算法(Porter Stemming algorithm)来处理查询字。移动搜索日志可以包括超过一百万的唯一查询和超过一百五十万的用户。TLA应用程序114将一天分成任何数量的“N”个时间范围302。在一个示例中, TLA应用程序114将一天下列四个时间范围上午,从上午6点到中午12点;下午,从中午 12点到下午6点;晚上,下午6点到午夜12点;以及夜间,从午夜12点到上午6点。TLA应用程序114还将来自移动搜索日志的查询分成2N个类别304(例如,24= 16 个类别)。TLA应用程序114通过4位二进制代码来命名每一类别,4位二进制例如“0101”, 其中“1”是指在相应的时间范围内发出或提交查询的频率。“1”被认为是比发出或提交的平均频率高的频率。TLA应用程序114标识带有单个“1”的四种典型的类别代码和它们的流行的查询,这些类别代码在下面的表I中示出。表I示例查询类别和流行的查询
权利要求
1.一种至少部分地由处理器(900)实现的方法,所述方法包括通过从移动搜索日志(500(a))中提取查询(502)并且标识发送所述查询(502、600) 的用户(504)、所述用户(504)发送所述查询(502)的时间以及所述用户(504)发送所述查询(502)的位置,构造二分图(204.500(b));至少部分地基于查询(502)、所述用户(504)提交所述查询(50 的时间以及所述用户 (504)提交所述查询(502)的位置之间的相似性来从所述二分图中计算所述用户(504)之间的相似性(206,602);从特定用户(108)的移动计算设备(10 接收与所述计算设备的当前时间和当前位置相关联的查询输入O08);以及至少部分地响应于接收到所述查询输入O08)从所述二分图(500(b))、600)中标识由先前已经提交所述查询输入O08)的用户 (504)先前提交的一个或多个查询(502),所述一个或多个其他查询(50 包括候选查询 (702);以及至少部分地基于以下各项来计算所述候选查询中的每一个与所接收到的查询输入 (210)的相关性(1)提交所述候选查询的相应用户与所述特定用户之间的计算出的相似性006、602),(2)与所接收到的查询输入相关联的当前时间同提交所述候选查询的时间之间的差异(208、604)以及C3)与所接收到的查询输入相关联的当前位置同提交所述候选查询的位置之间的差异008、604)。
2.如权利要求1所述的方法,其特征在于,所述计算所述用户的相似性包括 使用分布向量来表示第一用户和第二用户提交所述查询的时间;基于作为用于标识一天中的钟点的计数的M维向量来表示所述第一用户和所述第二用户提交所述查询的时间;以及应用余弦相似性函数来计算表示所述第一用户和所述第二用户提交所述查询的时间的分布向量的距离以标识所述分布向量之间的小时数。
3.如权利要求1所述的方法,其特征在于,还包括至少部分地基于所述候选查询中的每一个与所接收到的查询输入的所计算出的相关性来对所述候选查询进行排名;以及至少部分地基于所述排名来建议所述候选查询的至少一部分。
4.如权利要求1所述的方法,其特征在于,还包括至少部分地基于所述候选查询中的每一个与所接收到的查询输入的所计算出的相关性来对所述候选查询进行排名;以及至少部分地基于以下各项来推荐所述候选查询的至少一部分所述候选查询与所接收到的查询输入具有许多公共用户,两者都几乎同时提交所接收到的查询输入,并且两者都在移动计算设备的几乎相同位置提交所接收到的查询输入。
5.如权利要求1所述的方法,其特征在于,还包括以至少部分地基于所述候选查询中的每一个与所述查询输入的所计算出的相关性的降序提供所述候选查询中的一个或多个作为查询建议。
6.如权利要求1所述的方法,其特征在于,所述计算所述相关性还包括至少部分地基于度量(1)所述用户先前提交所接收到的查询输入的时间和位置与(2)所述当前时间和所述当前位置之间的距离来计算先前提交所接收到的查询输入的用户的权重。
7.一种系统,包括存储器(902);处理器(900),其操作地耦合至存储器(902);二分图模块(908),其被存储在所述存储器(90 中并且可以在所述处理器(900)上执行,以便从移动搜索日志(500(a))中构造二分图(500(b))以从移动搜索日志(500(a))中标识查询(50 并且为所述查询(50 中的每一个标识发送查询(50 的用户(504)、所述用户(504)发送所述查询(502)的时间以及所述用户(504)发送所述查询(502)的位置; 以及相似性模块(910),其被存储在所述存储器(90 中并且可以在所述处理器(900)上执行,以便至少部分地基于以下各项之间的相似性来从所述二分图(500(b))中计算所述用户(504)之间的相似性(206,602) (1)所述查询(502) “2)所述用户(504)提交所述查询 (502)的时间以及(3)所述用户(504)提交所述查询(502)的位置。
8.如权利要求7所述的系统,其特征在于,还包括时间-位置知晓应用模块,其被存储在所述存储器中并且可以在所述处理器上执行, 以便从特定用户的移动计算设备接收与所述移动计算设备的当前时间和当前位置相关联的查询输入;以及相关性模块,其被存储在所述存储器中并且可以在所述处理器上执行,以便至少部分地基于以下各项来计算多个候选查询中的每一个与所述查询输入的相关性所述用户之间的计算出的相似性、计算与所接收到的查询输入相关联的当前时间与提交所述候选查询的时间之间的差异以及计算与所接收到的查询输入相关联的当前位置与提交所述候选查询的位置之间的差异。
9.如权利要求7所述的系统,其特征在于,所述二分图模块还可以在所述处理器上执行以便通过以下操作来构造所述二分图将每一个用户表示为顶点,将所述用户发送的所述查询表示为另一顶点以及将所述用户发送所述查询的时间和所述用户发送所述查询的位置表示为边,所述边表示提交所述查询时来自所述用户的发出动作。
10.如权利要求7所述的系统,其特征在于,还包括时间-位置知晓应用模块,其被存储在所述存储器中并且可以在所述处理器上执行, 以便从特定用户的移动计算设备接收与所述移动计算设备的当前时间和当前位置相关联的查询输入;并且其中所述二分图模块还可以在所述处理器上执行以便通过将所述用户中的每一个以及所述用户发送的查询表示为两个节点并且通过将所述用户发送所述查询的时间以及所述用户发送所述查询的位置表示为所述二分图的边,来构造所述二分图;以及计算所述当前时间和所述当前位置与对于所述两个节点之间的边的时间和位置之间的差异。
全文摘要
本发明公开了知晓时间-位置的移动查询建议。各种技术描述了响应于在移动计算设备上提交的查询输入通过集成时间和位置来推荐移动查询建议。一过程通过从移动搜索日志中提取提交查询的用户并将时间和位置与所提交的查询相关联来构造二分图。该过程确定用户相似地在相似的时间和相似的位置提交相似的查询。该过程接收与移动计算设备的当前时间和当前位置相关联的查询输入。接着,该过程基于已经提交候选查询和查询输入两者的用户组之间的相似性以及该用户先前发出查询输入和候选查询的时间和位置的距离来计算候选查询与查询输入的相关性。
文档编号G06F17/30GK102521335SQ201110404728
公开日2012年6月27日 申请日期2011年11月28日 优先权日2010年11月29日
发明者倪晓川, 孙建涛, 陈正 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1