利用更新层的数据库分区的制作方法_3

文档序号:9620906阅读:来源:国知局
动、或特定的搜索项)改变。作为一个实例,并非通过限制的方式,预定的点击阈值数可以由包含在每个搜索项的预定百分比(例如,99%)内的“点击”的数量确定。在【具体实施方式】中,预定的点击阈值数可以至少部分根据计算装置(例如,服务器)的索引到项目服务器分配比、改变预定的点击阈值数延迟或吞吐量分析、用于给分区聚合器44或者从该划分聚合器中发送项目服务器46倒排列表的聚合网络率、包含特定搜索项的搜索查询的频率、特定搜索项的实时更新的频率、特定一族搜索项的特有的约束条件或其任何组合确定。作为一个实例,并非通过限制的方式,特定一族搜索项的特有的约束条件可以是,如果允许用户具有多达5000个朋友,那么搜索项“朋友”的预定的点击阈值数可以设置为5000,以便所有“朋友”倒排列表包含在项目服务器46内。
[0031]在【具体实施方式】中,顶部聚合器40可以被配置为接收分布给每个划分42的划分聚合器44的搜索查询。作为一个实例,并非通过限制的方式,搜索查询可以作为由社交网络系统的一个或多个计算装置(例如,上述服务器162)托管的服务器过程实现。作为一个实例,并非通过限制的方式,顶部聚合器40可以将搜索查询“Gangnam Style”解析成搜索项,例如,(〈GangnamXstyle〉),这可以返回可以与搜索查询匹配的任何内容对象类型的搜索结果。
[0032]在【具体实施方式】中,顶部聚合器40可以基于搜索项的列表(例如,散列集)将每个搜索项分类,该列表的内容对象的数量高于预定的点击阈值数。在适当的情况下,在本文中描述的“短”搜索项可以表示不包含在散列集内的搜索项,并且“长”搜索项可以表示包含在散列集内的搜索项。在【具体实施方式】中,每个划分42的划分聚合器44可以从顶部聚合器40中解析搜索查询,并且从搜索查询中提取与划分42相关的特定“短”搜索项。在【具体实施方式】中,每个划分42的划分聚合器44可以执行对应于与划分42相关的搜索项的包含在散列集内的一个或多个“长”搜索项的提取。作为一个实例,并非通过限制的方式,搜索查询“Gangnam style”可以由顶部聚合器40解析成搜索项〈Gangnam〉和〈Style〉。而且,搜索项〈Gangnam〉可以不包含在散列集内,并且可以被视为“短”搜索项,而〈Style〉可以包含在散列集内,并且可以被视为“长”搜索项。在【具体实施方式】中,从顶部聚合器40中接收搜索项的划分聚合器44可以执行特定功能,以将发送给查询的特定的“短”搜索项(例如,〈Gangnam〉)映射到一个或多个项目服务器46中。在【具体实施方式】中,划分聚合器44可以从一个或多个项目服务器46中检索一个或多个倒排列表,所述倒排列表包括识别在对应于特定的“短”搜索项的社交网络系统上“张贴”的特定内容对象的信息。
[0033]在【具体实施方式】中,每个划分42的划分聚合器44可以执行对应于与划分42相关的搜索项的包含在散列集内的一个或多个“长”搜索项的提取。作为一个实例,并非通过限制的方式,搜索查询“Gangnam style”可以由顶部聚合器40解析成搜索项〈Gangnam〉和〈Style〉。从顶部聚合器40中接收搜索项的划分聚合器44可以执行特定功能,以将发送给查询的特定的“短”搜索项映射到一个或多个项目服务器46中。在【具体实施方式】中,划分聚合器44可以从一个或多个项目服务器46中检索一个或多个倒排列表,所述倒排列表包括识别在对应于特定的“短”搜索项的社交网络系统上“张贴”的特定内容对象的信息。项目服务器46可以将对应于特定的“短”搜索项的检索的倒排列表发送给划分聚合器44。
[0034]在【具体实施方式】中,顶部聚合器40的搜索查询可以由每个划分聚合器44修改,以使用对应于“短”搜索项的项目服务器46的一个或多个倒排列表代替一个或多个“短”搜索项。作为一个实例,并非通过限制的方式,可以根据项目服务器46的倒排列表生成修改的搜索查询,例如,〈style>:〈5,7,10>。在【具体实施方式】中,划分聚合器44可以将修改的搜索项发送给相应的索引服务器48。划分聚合器44可以接收包括识别在对应于特定的“长”搜索项的社交网络系统上“张贴”的特定内容对象的信息的一个或多个索引服务器48的一个或多个倒排列表以及项目服务器46的搜索结果。作为一个实例,并非通过限制的方式,在对应于搜索项〈style〉的索引服务器48上的倒排列表可以包括对应于内容项〈3,4,7,10>的标识符信息,并且修改的搜索查询的结果可以是〈7,10>。
[0035]在另一个实施方式中,每个划分42的划分聚合器44可以不储存与“长”或“短”搜索项相关联的信息。相反,划分聚合器44可以将所有解析的搜索项发送给相关联的项目服务器46。在【具体实施方式】中,项目服务器46可以包括“短”和“长”搜索项的列表。作为一个实例,并非通过限制的方式,发送给项目服务器46的每个搜索项可以返回包括识别在对应于特定的“短”搜索项的社交网络系统上“张贴”的特定内容对象的信息的一个或多个倒排列表。而且,项目服务器46可以返回表示一个或多个解析的搜索项是“长”搜索项并且用于“长”搜索项的查询应路由给索引服务器48的标志。在【具体实施方式】中,用于“长”搜索项的查询应通过划分聚合器44路由给索引服务器48。在【具体实施方式】中,用于“长”搜索项的查询应由项目服务器46直接路由给索引服务器48。如上所述,索引服务器48可以从一个或多个项目服务器46中检索一个或多个倒排列表,所述倒排列表包括识别在对应于特定的“长”搜索项的社交网络系统上“张贴”的特定内容对象的信息。
[0036]在【具体实施方式】中,顶部聚合器40可以在从顶部聚合器40中接收的搜索结果上执行一个或多个操作。作为一个实例,并非通过限制的方式,顶部聚合器40可以将搜索结果返回给用户,即,项目服务器46和索引服务器48的所有搜索项的搜索结果的交集。例如,对应于搜索项〈Gangnam〉的搜索结果的项目服务器46的查询可以产生对应于社交网络系统上张贴的特定内容对象的标识符信息〈5,7,10>。作为另一个实例,索引服务器48可以产生对应于用于搜索项〈style〉的内容项〈3,4,7,10>的标识符信息。根据从划分42的项目服务器46和索引服务器48中发送给划分聚合器44的搜索结果的交集,返回给用户的搜索结果可以是〈7,10>。
[0037]在【具体实施方式】中,社交网络系统可以至少部分根据用户在社交网络系统上的活动(例如,内容对象(例如,图像)上传或者生成)或者与内容对象相关联的活动(例如,“喜欢”或评论)更新搜索索引的一个或多个划分42。而且,搜索索引的一个或多个划分42可以通过预定的间隔更新,例如,每周一次。在【具体实施方式】中,每个索引服务器48的倒排列表可以包括具有可以通过预定的间隔更新的标识符信息的基础层以及具有可以响应于在社交网络系统上的活动(例如,新内容对象上传给社交网络系统)更新的具有标识符信息的更新层。作为一个实例,并非通过限制的方式,具有发送给索引服务器48的“长”搜索项的查询可以访问倒排列表,其包括基础层的标识符信息以及对应于在社交网络系统上的最近活动的更新层的标识符信息。在【具体实施方式】中,在预定的间隔期间,基础层的标识符信息可以更新,以包括更新层的标识符信息。而且,在通过更新层的标识符信息更新基础层的标识符信息之后,更新层可以返回初始状态。在【具体实施方式】中,划分聚合器44的倒排列表的标识符信息可以定期更新,以包括在预定间隔期间发生的最近活动。
[0038]在【具体实施方式】中,更新层的标识符信息可以表示响应于相应内容对象的状态变化,删除内容对象,作为与特定搜索项相关联的搜索结果,例如,删除或“不喜欢”内容对象。在【具体实施方式】中,索引服务器48可以在从基础层中提供的标识符信息与由更新层提供的标识符信息之间提供信息区分。在【具体实施方式】中,划分聚合器42可以确定由用于“短”项目查询的项目服务器46和用于“长”搜索项查询的索引服务器48提供的标识符信息的交集。而且,划分聚合器42可以整合项目服务器46的更新层的标识符信息和由项目服务器46以及索引服务器48提供的标识符信息的交集。作为一个实例,并非通过限制的方式,对相应项目服务器46的搜索项〈Gangnam〉的查询可以产生标识符信息〈5,7,10>,对相应索引服务器48的搜索项〈style〉的查询可以产生标识符信息〈3,4,7,10>,并且查询的交集是〈7,10>。而且,如果与标识符信息〈20>相关联的内容对象加入与搜索项〈style〉相关联的索引服务器48的更新层中,那么搜索项〈style〉的查询也可以产生〈20>,作为搜索结果。作为另一个实例,在更新索引服务器48的基础层之后在社交网络系统上的活动(例如,删除内容对象)可以去除与标识符信息〈10>相关联的内容对象,并且在更新层上表示去除标识符信息〈10>。在从搜索结果中去除删除的内容对象〈10>之后,搜索项〈GanghamXstyle>的查询的搜索结果可以产生〈7>。
[0039]在【具体实施方式】中,每个项目服务器46和索引服务器48的倒排列表可以包括具有可以通过预定的间隔更新的标识符信息的基础层以及具有可以响应于在社交网络系统上的活动更新的标识符信息(例如,上传给社交网络系统的新内容对象)的更新层。在【具体实施方式】中,可以比较与最近上传的内容对象相关联的一个或多个搜索项和上述散列列表,以确定标识符信息是否与项目服务器46、索引服务器48和这两者的倒排列表相关。作为一个实例,并非通过限制的方式,确定最近活动与“短”搜索项相关,可以使用对应于最近上传的内容对象的标识符信息,更新相应项目服务器46的更新层。作为另一个实例,确定最近活动与“长”搜索项相关,可以使用对应于最近上传的内容对象的标识符信息,更新相应索引服务器48的更新层。在【具体实施方式】中,可以将对应于删除的内容对象的标识符信息广播给所有划分42,并且从包含特定的标识符信息的项目服务器46和索引服务器48的所有倒排列表中去除相应的标识符信息。
[0040]在【具体实施方式】中,与特定的搜索项相关联的特定项目服务器46的标识符信息可以“提升”为一个或多个索引服务器48的倒排列表,并且响应于超过预定的点击阈值数的特定搜索项的点击数量,从特定项目服务器46的倒排列表中去除标识符信息。作为一个实例,并非通过限制的方式,可以生成在一个或多个项目服务器46内的一个或多个倒排列表,以使一个或多个搜索项首先加入社交网络系统。可以至少部分根据预定的点击阈值数,可以将搜索项从项目服务器46 “提升”到索引服务器48。作为一个实例,并非通过限制的方式,只要倒排列表的内容对象的数量小于预定的点击阈值数,就可以给在项目服务器46倒排列表内的新项目生成倒排列表。对应于与最近增加的搜索项相关联的倒排列表的内容对象的标识符信息可以标有上述内容对象类型(例如,图像或状态更新)。确定倒排列表的内容对象的数量超过预定的点击阈值数,根据在与搜索项相关联的项
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1