导航内容的确定方法和装置制造方法

文档序号:6489800阅读:105来源:国知局
导航内容的确定方法和装置制造方法
【专利摘要】本申请公开了一种导航内容的确定方法和装置,其中,该方法包括:获取输入的搜索词;根据历史访问记录获取搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率;根据获取到的点击率确定所需要展示的类目,将确定出的上述需要展示的类目作为导航内容在网页上进行展示,并展示上述确定出的类目下的搜索结果。本申请解决了现有技术中直接将搜索词对应的所有叶子节点对应的类目都进行展示而造成的搜索效率低下的技术问题,达到了提高搜索效率的技术效果。
【专利说明】导航内容的确定方法和装置
【技术领域】
[0001]本申请涉及互联网领域,具体而言,涉及一种导航内容的确定方法和装置。
【背景技术】
[0002]目前,在搜索引擎、门户网站以及电子商务平台等应用平台中,为了方便用户查找相关的内容,一般会将搜索结果按照一定的分类标准进行组织,一般常用的是按照类目的形式对结果进行展示,用户对类目进行进一步筛选,以缩小搜索结果的范围,从而帮助用户更快更准地找到满足自身搜索需求的目标内容。然而,由于用户知识领域的局限性,初始输入的查询词有时并不能真实有效地表达用户真实的或者是确切的意图,通过上述类目导航的方式就可以提示用户更准确地表达自己的需求意图,从而引导用户通过点击导航信息进一步地明确自己的查询需求。
[0003]在常见的电子商务网站中,网站根据商品信息的不同分类建立自己的类目体系,建立的类目体系一般是以树的结构进行组织,比如,和手机相关的所有商品信息都归入手机类目中,和mp3相关的所有商品信息都划入mp3类目中。搜索引擎在对商品信息进行搜索之前,会首先建立索引,并将所有要搜索的商品信息分别打上标签,该标签用来标识这个商品信息是属于哪一个或多个叶子节点对应的类目,其中,叶子节点对应的类目就是叶子类目,其中,叶子节点对应的类目用于表示类目体系的树结构中不可再分的类目单元,举例来说:数码、电脑- >手机通讯- >手机,对于这样的类目树,其中的手机是不可再分的类目单元,手机便是该类目树的叶子节点对应的类目。
[0004]目前,常见的导航一般都是基于叶子节点对应的类目的,在接收到用户的查询请求后,会根据搜索返回的所有结果所属的叶子节点对应的类目将其展现给用户以供用户进行筛选和导航,通过这种方式可以实现导航的目的,然而这种方式仅适用于用户需求比较具体、明确的搜索。例如,用户搜索连衣裙,这种搜索词已经很明确地表明了用户的搜索意图,且相对已经比较具体,这种搜索词所对应的搜索结果对应的类目一般也都是叶子节点对应的类目。在这种情况下,直接展示叶子节点对应的类目给用户是合理的,然而,用户经常会输入一些比较宽泛的搜索词,例如:用户输入“家居”作为搜索词,对于这种比较宽泛的搜索词,可能表明用户想搜索住宅家具也可能想搜索床上用品等多种搜索意图,因此,获取的搜索结果也比较宽泛,有时会包括多个行业或者多个类目。
[0005]如果所有查询都按照叶子节点对应的类目的方式来确定导航内容会出现以下问题:
[0006]首先,对于宽泛查询如果直接定位到一个非常精确的叶子节点对应的类目下,可能会出现显示的叶子节点对应的类目和用户所希望的搜索结果之间没有任何关系的情况,使得搜索结果不准确,降低了用户的体验度。此时,用户会重新输入其他的查询词进行重新搜索,由于客户端向搜索引擎服务器多次发出查询请求,在搜索用户数量众多的情况下会对搜索引擎服务器造成巨大的查询压力。
[0007]其次,对于宽泛查询如果定位到多个叶子节点对应的类目下,则所召回的搜索结果数普遍偏多,且结果可能会跨多个叶子节点对应的类目以及多个非叶子节点对应的类目,有时分布的行业也可能会有多个。一方面搜索结果的数量会比较多,在展示位置有限的情况下,展示结果很难覆盖用户的全部意图;另一方面,多个行业的叶子节点对应的类目混合在一起进行展示容易给用户产生比较错乱的感觉,用户体验会比较差。再一方面,由于需要在多个叶子节点对应的类目下进行查询匹配操作,导致查询匹配的数据量巨大,导致搜索结果的效率降低,并且对于将获取到的数量较多的搜索结果传送给用户客户端时,也将会由于数据量的巨大导致网络传输速度下降,进一步影响搜索效率。
[0008]针对上述问题,尚未提出有效的解决方法。

【发明内容】

[0009]本申请提供了一种导航内容的确定方法和装置,以至少解决现有技术中直接将搜索词对应的所有叶子节点对应的类目都进行展示而造成的搜索效率低下的技术问题。
[0010]根据本申请的一个方面,提供了一种导航内容的确定方法,包括:获取输入的搜索词;根据历史访问记录获取上述搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率;根据获取到的点击率确定所需要展示的类目,将确定出的上述需要展示的类目作为导航内容在网页上进行展示,并展示上述确定出的类目下的搜索结果。
[0011]优选地,根据获取到的点击率确定所需要展示的类目,将确定出的上述需要展示的类目作为导航内容在网页上进行展示,并展示上述确定出的类目下的搜索结果包括:当上述搜索词所对应的搜索结果在上述类目树中的第一叶子节点对应的类目的点击率大于或等于第一预定阈值时,将上述第一叶子节点对应的类目作为上述导航内容进行展示;或者当上述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都未大于第一预定阈值,但是在一个或多个叶子节点对应的类目的点击率大于第二预定阈值且上述一个或多个叶子节点对应的类目属于同一个父节点时,将上述父节点下的叶子节点对应的类目作为上述导航内容进行展示。
[0012]优选地,根据获取到的点击率确定所需要展示的类目,将确定出的上述需要展示的类目作为导航内容在网页上进行展示,并展示上述确定出的类目下的搜索结果包括:当上述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都小于第一预定阈值、且上述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率大于第二预定阈值的多个叶子节点对应的类目不属于同一个父节点时,根据各个类目之间的父子关系进行层级展示。
[0013]优选地,根据各个类目之间的父子关系进行层级展示包括:确定每个叶子节点对应的类目的父节点的点击率,其中,上述父节点的点击率是上述父节点下的所有子节点对应的类目的点击率的和;将点击率大于或等于第三预定阈值的父节点,以及上述点击率大于或等于第三预定阈值的父节点下的所有子节点对应的类目作为第一待展示的导航内容;将上述第一待展示的导航内容中上述父节点以及上述父节点下的所有子节点对应的类目按照父子节点之间的关系进行层级展示。
[0014]优选地,在确定每个叶子节点对应的类目的父节点的点击率之后,上述方法还包括:确定小于上述第三预定阈值的父节点的上层节点的点击率,其中,上述上层节点的点击率是上述上层节点下的所有子节点对应的类目的点击率的和;将点击率大于或等于第四预定阈值的上层节点,以及上述点击率大于或等于第四预定阈值的上层节点下的所有子节点对应的类目作为第二待展示的导航内容;将上述第一待展示的导航内容和上述第二待展示的导航内容按照相互之间的父子关系进行层级展示。
[0015]优选地,上述历史访问记录包括:上述搜索词对应的搜索结果的点击率,和/或上述搜索词对应的导航内容中各个类目的点击率。
[0016]优选地,根据历史访问记录获取上述搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率包括:根据上述历史访问记录为各个类目设置权重值,其中,点击次数多的类目对应大的权重值,点击次数少的对应小的权重值;根据为各个类目设置的权重值确定上述各个类目的点击率。
[0017]根据本申请的另一个方面,提供了一种导航内容的展示装置,包括:第一获取单元,用于获取输入的搜索词;第二获取单元,用于根据历史访问记录获取上述搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率;确定单元,用于根据获取到的点击率确定所需要展示的类目,将确定出的上述需要展示的类目作为导航内容在网页上进行展示,并展示上述确定出的类目下的搜索结果。
[0018]优选地,上述确定单元包括:第一展示模块,用于当上述搜索词所对应的搜索结果在上述类目树中的第一叶子节点对应的类目的点击率大于或等于第一预定阈值时,将上述第一叶子节点对应的类目作为上述导航内容进行展示;或者第二展示模块,用于当上述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都未大于第一预定阈值,但是在一个或多个叶子节点对应的类目的点击率大于第二预定阈值且上述一个或多个叶子节点对应的类目属于同一个父节点时,将上述父节点下的叶子节点对应的类目作为上述导航内容进行展示。
[0019]优选地,上述确定单元包括:第三展示模块,用于当上述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都小于第一预定阈值、且上述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率大于第二预定阈值的多个叶子节点对应的类目不属于同一个父节点时,根据各个类目之间的父子关系进行层级展示。
[0020]在本申请中,通过分析用户的历史点击行为,以获得当前搜索词的相关类目的点击情况,从而根据不同的情况确定不同的导航内容进行展示,使得展示的导航内容更加准确,避免了用户由于显示的导航内容不准确而产生的重新搜索,减小了由于重新搜索所造成的对搜索引擎服务器的查询压力;同时,由于返回的是较为准确的导航内容(叶子节点对应的类目)而不是与搜索词对应的所有叶子节点对应的类目,因此,在保证准确性的情况下降低了返回的导航内容(叶子节点对应的类目)下的搜索结果的数量,降低了网络传输的搜索结果的数量,提高了搜索结果的返回速度和搜索效率。通过上述方式有效地解决了现有技术中直接将搜索词对应的所有叶子节点对应的类目都进行展示而造成的搜索效率低下的技术问题,达到了提高搜索效率的技术效果。
【专利附图】

【附图说明】
[0021]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0022]图1是根据本申请实施例的导航内容的确定系统的一种优选结构框图;[0023]图2是根据本申请实施例的导航内容的确定装置的一种优选结构框图;
[0024]图3是根据本申请实施例的带有导航内容的待展示网页的一种优选示意图;
[0025]图4是根据本申请实施例的导航内容的确定装置的另一种优选结构框图;
[0026]图5是根据本申请实施例的类目树的一种优选示意图;
[0027]图6是根据本申请实施例的类目树的另一种优选示意图;
[0028]图7是根据本申请实施例的导航内容的确定方法的一种优选流程图;
[0029]图8是根据本申请实施例的导航内容的确定方法的另一种优选流程图;
[0030]图9是根据本申请实施例的导航内容的确定系统的一种优选架构示意图;
[0031]图10是根据本申请实施例的导航内容的确定方法的另一种优选流程图。
【具体实施方式】
[0032]下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0033]在描述本申请的各实施例的进一步细节之前,将参考图1来描述可用于实现本申请的原理的一个合适的计算体系结构。在以下描述中,除非另外指明,否则将参考由一个或多个计算机执行的动作和操作的符号表示来描述本申请的各实施例。由此,可以理解,有时被称为计算机执行的这类动作和操作包括计算机的处理单元对以结构化形式表示数据的电信号的操纵。这一操纵转换了数据或在计算机的存储器系统中的位置上维护它,这以本领域的技术人员都理解的方式重配置或改变了计算机的操作。维护数据的数据结构是具有数据的格式所定义的特定属性的存储器的物理位置。然而,尽管在上述上下文中描述本申请,但它并不意味着限制性的,如本领域的技术人员所理解的,后文所描述的动作和操作的各方面也可用硬件来实现。
[0034]转向附图,其中相同的参考标号指代相同的元素,本申请的原理被示为在一个合适的计算环境中实现。以下描述基于所述的本申请的实施例,并且不应认为是关于此处未明确描述的替换实施例而限制本申请。
[0035]图1示出了可用于这些设备的一个示例计算机体系结构的示意图。出于描述的目的,所绘的体系结构仅为合适环境的一个示例,并非对本申请的使用范围或功能提出任何局限。也不应将该计算系统解释为对图1所示的任一组件或其组合具有任何依赖或需求。
[0036]本申请的原理可以使用其它通用或专用计算或通信环境或配置来操作。适用于本申请的众所周知的计算系统、环境和配置的示例包括但不限于,个人计算机、服务器,多处理器系统、基于微处理的系统、小型机、大型计算机、以及包括任一上述系统或设备的分布式计算环境。
[0037]在其最基本的配置中,图1中的导航内容的确定系统100至少包括:一个网站的服务器102以及一个或多个客户端104。服务器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置、用于存储数据的存储装置以及与客户端通信的传输装置;客户端104可以包括:微处理器MCU、与服务器通信的传输装置、与用户交互的显示装置。在本说明书和权利要求书中,“系统”也可以被定义为能够执行软件、固件或微码来实现功能的任何硬件组件或硬件组件的组合导航内容的展示系统100甚至可以是分布式的,以实现分布式功能。[0038]如本申请所使用的,术语“模块”、“组件”或“单元”可以指在导航内容的展示系统100上执行的软件对象或例程。此处所描述的不同组件、模块、单元、引擎和服务可被实现为在导航内容的展示系统100上执行(例如,作为单独的线程)的对象或进程。尽管此处所描述的系统和方法较佳地以软件来实现,但是硬件或软件和硬件的组合的实现也是可能并被构想的。
[0039]实施例1
[0040]图2是根据本申请实施例导航内容的确定装置200的一种优选的结构示意图,优选的,本实施例中的装置位于服务器102上或者客户端104上。
[0041]在本申请实施例中,显示的网页主要由两部分组成,如图3所示,包括:导航区和搜索结果区,其中,导航区展示相关的导航信息,用于向用户展示可以点击的类目分类,从而使得用户更方便的进行搜索;搜索结果区用于展示用户输入的搜索词所对应的搜索结果,或者是展示用户点击导航信息中的某个类目后所触发的搜索结果。
[0042]优选的,如图2所示的导航内容的确定装置200可以包括:第一获取单元202,第二获取单元204以及确定单元206。下面对这几个结构进行具体描述。
[0043]第一获取单元202,用于获取输入的搜索词;
[0044]第二获取单元204,与第一获取单元202耦合,用于根据历史访问记录获取类目树中各层上的各个类目中所对应的搜索结果的点击率;
[0045]例如,用户输入搜索词“家居”,相应的就获取以“家居”作为搜索词时对应的搜索结果的历史访问记录,优选地,历史访问记录包括:搜索词对应的搜索结果的点击率,和/或搜索词对应的导航内容中各个类目的点击率。在本优选实施方式中,用户的历史访问记录指代网站数据库中存储的所有用户基于该搜索词的历史访问记录而并不单指该用户的历史访问记录。同时,上述的历史访问记录可以是对应于每个具体的搜索结果的用户的点击率,也可以是对应于“家居”的导航内容中各个类目所对应的点击率。例如,搜索“家居”时,用户对“沙发”的点击率是30%,用户对“餐桌”的点击率是20%等等,那么通过历史访问记录统计出的这些数据就是所需要得到的对应于搜索词的点击率。其中,上述的导航可以是用于在某种类目体系下对用户的搜索或者浏览进行相应的引导,类目就是和文本或者产品主题相关的分类体系,可以在搜索中起到导航的作用,辅助用户进行搜索。
[0046]确定单元206,与第二获取单元204耦合,用于根据获取到的点击率确定所需要展示的类目,将确定出的所述需要展示的类目作为导航内容在网页上进行展示,并展示所述确定出的类目下的搜索结果。
[0047]在上述实施例中,通过分析用户的历史点击行为,以获得当前搜索词的相关类目的点击情况,从而根据不同的情况确定不同的导航内容进行展示,使得展示的导航内容更加准确,避免了用户由于显示的导航内容不准确而产生的重新搜索,减小了由于重新搜索所造成的对搜索引擎服务器的查询压力;同时,由于返回的是较为准确的导航内容(叶子节点对应的类目)而不是与搜索词对应的所有叶子节点对应的类目,因此,在保证准确性的情况下降低了返回的导航内容(叶子节点对应的类目)下的搜索结果的数量,降低了网络传输的搜索结果的数量,提高了搜索结果的返回速度和搜索效率。通过上述方式有效地解决了现有技术中直接将搜索词对应的所有叶子节点对应的类目都进行展示而造成的搜索效率低下的技术问题,达到了提高搜索效率的技术效果。[0048]在获取到搜索词在各个类目中所对应的搜索结果的点击率后,可以基于点击率分布的不同确定其具体的导航展示的方式。在一个优选实施方式中,如图4所示,确定单元206可以包括:第一展示模块402和第二展示模块404。
[0049]第一展示模块402,用于当搜索词所对应的搜索结果在第一叶子节点对应的类目的点击率大于或等于第一预定阈值时,将第一叶子节点对应的类目作为导航内容进行展示;例如,如果某个搜索词所对应的历史访问记录中某个叶子节点的点击率为99%,则可以确定用户的搜索需求在该叶子节点对应的类目下就可以得到满足,因此可以直接显示该叶子节点对应的类目以及该叶子节点对应的类目所对应的搜索结果即可,用户通过一次搜索就可以得到自己想要搜索的东西,将其称之为类目直达。其中,叶子节点对应的类目是类目树中最小的且不可再分的类目单元,例如“连衣裙”等这些较为具体的搜索词。
[0050]然而,并不是所有的搜索词对应的搜索结果都集中在一个叶子节点对应的类目,也可能集中在某一个非叶子节点对应的类目所对应的多个叶子节点对应的类目中,对于这种情况,可以将其称之为类目聚焦,其对应的导航展示方式可以是将该非叶子节点对应的类目下的所有叶子节点对应的类目都进行展示,也可以仅将该非叶子节点对应的类目下的几个较为集中的叶子节点对应的类目作为导航内容进行展示,其中,所谓集中是一个相对的概念,可以根据每个节点的历史点击行为判断点击的集中程度,优选地,这里的集中程度是指对所有用户的一个点击率进行统计后得到的该节点在自身所在的类目树层级中的点击率大小,然后确定其是否大于预设的一个预定阈值,从而确定类目中较为集中的类目。在一个优选实施方式中,第二展示模块404用于当搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都未大于第一预定阈值,但是在一个或多个叶子节点对应的类目的点击率大于第二预定阈值且该一个或多个叶子节点对应的类目属于同一个父节点时,将父节点所对应的所有叶子节点作为导航内容进行展示。下面以一个具体实施例对类目聚焦进行具体说明:
[0051 ] 如图5所示是类目树的一种优选示意图,由图5所显示的内容可知,在所有的叶子节点对应的类目中,仅有B21和B23是集中的,找出所有集中的节点,作为最终展示的节点。例如可以设定叶子节点对应的类目中点击率大于30%就算作该层中较为集中的类目(又可以称为节点)。同时可以发现B21和B23都是B2的叶子节点对应的类目,因此,可以想到用户的点击需求在B2下也就几乎可以得到满足了。因此,可以将B2的直接子节点对应的类目:B21、B22以及B23作为待显示的导航内容进行显示。优选地,也可以仅显示B21和B23或者是也可以将B2也作为导航内容进行展示,这就是所谓的类目聚焦。
[0052]在实际应用中,也有可能出现对应某个搜索词对应的历史访问记录中点击率较高的几个叶子节点对应的类目不属于同一个非叶子节点对应的类目的情况,这样通过上述类目聚焦的方式进行展现需要展现的内容也就会比较多,在这种情况下,就可以按照类目之间的父子关系进行层级展示。即,按照每个类目的点击率确定展示哪些非叶子节点对应的类目,及其对应的叶子节点对应的类目,对于这种展现方式可以叫做类目层级。在一个优选实施方式中,确定单元包括:第三展示模块,用于当搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都小于第一预定阈值,且点击率大于第二预定阈值的多个叶子节点对应的类目不属于同一个父节点时,根据各个类目之间的父子关系进行层级展示。
[0053]具体的,在进行类目层级展示的时候,可以确定叶子节点对应的类目的父节点的点击率是否相对集中,优选地,如果父节点的点击率不集中可以继续向上层推直至对应叶子节点对应的类目的父辈或者祖辈的属于其对应的层中较为集中的节点或者是推到根节点为止。即,如果一个搜索词对应的叶子节点对应的类目在其对应的最下面一层是较为分散的,即其对应的点击率较低,就确定其父节点的点击率在父节点对应的层中是否是相对集中的,即对应的点击率是否比较高,如果是,则将其对应的父节点下的所有子节点对应的类目都作为最终导航内容进行展示,如果该叶子类目对应的父节点的点击率也不高,则基于其父节点继续向上层判断直至找到在对应层属于较为集中的节点或者是根节点为止。优选地,每个上层节点的点击率都可以通过其对应的下层节点的点击率进行累加运算得到。下面以一个具体例子对类目层级展示进行具体说明:
[0054]如图6所示是类目树的另一种优选示意图,类目层级是按照从叶子节点对应的类目向上查找的方式进行的,直至找到对应的父节点或者是祖辈节点在其对应层中是集中的情况下,才停止查找判断。在如图6所示的类目树中,因B12在其对应层是分散的,因此确定其父节点(BI)是否是集中,在确定是的情况下,将BI和其对应的所有子节点对应的类目(BlU B12)都作为导航内容进行展示,同样的,对于Cll和C12,自身是分散的,其对应的父节点(Cl)也是分散的,然而其对应的祖辈节点(C)是集中的,因此,将其祖辈节点C和其祖辈节点的子节点对应的类目(Cll和C12)作为导航内容进行展示。因此,对于图6所示的类目树,最终作为导航内容进行层级展示的就是:C:C1、C2 ;B1:B11、B12 ;B2:B21、B22、B23 ;E3:E31、E32。其中,层级展示的方式可以是如图3所示的展示方式,S卩,按照相互之间的父子关系进行层级展示。
[0055]在上述各个优选实施方式中,上述历史访问记录包括但不限于搜索词对应的搜索结果的点击率,和/或搜索词对应的导航内容中各个类目的点击率。
[0056]为了更好地确认类目结构中每个类目节点的点击率,可以为每个类目设置权重值,对应的设置的权重值可以根据历史访问记录中的点击情况确定,点击率高的就可以设置大的权重,点击率低的就可以设置小的权重。在一个优选实施方式中,根据用户的历史访问记录获取搜索词在各个类目中所对应的搜索结果的点击率包括:根据历史访问记录为各个类目设置权重值,其中,点击次数多的类目对应大的权重值,点击次数少的对应小的权重值;根据为各个类目设置的权重值确定各个类目的点击率。
[0057]实施例2
[0058]在本申请实施例中,显示的网页主要由两部分组成,如图3所示,包括:导航区和搜索结果区,其中,导航区展示相关的导航信息,用于向用户展示可以点击的类目分类,从而使得用户更方便的进行搜索;搜索结果区用于展示用户输入的搜索词所对应的搜索结果,或者是展示用户点击导航信息中的某个类目后所触发的搜索结果。
[0059]在图2和图4所示的装置的基础上,本申请提供了一种优选的导航内容的确定方法。如图7所示,该方法可以包括如下步骤:
[0060]步骤S702:获取输入的搜索词;
[0061]步骤S704:根据历史访问记录获取搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率;
[0062]例如,用户输入搜索词“家居”,相应的就获取以“家居”作为搜索词时对应的搜索结果的历史访问记录,优选地,历史访问记录包括:搜索词对应的搜索结果的点击率,和/或搜索词对应的导航内容中各个类目的点击率。在本优选实施方式中,用户的历史访问记录指代网站数据库中存储的所有用户基于该搜索词的历史访问记录而并不单指该用户的历史访问记录。同时,上述的历史访问记录可以是对应于每个具体的搜索结果的用户的点击率,也可以是对应于“家居”的导航内容中各个类目所对应的点击率。例如,搜索“家居”时,所有用户对“沙发”的点击率是30%,对“餐桌”的点击率是20%等等,那么通过历史访问记录统计出的这些数据就是所需要得到的对应于搜索词的点击率。其中,上述的导航可以是用于在某种类目体系下对用户的搜索或者浏览进行相应的引导,类目就是和文本或者产品主题相关的分类体系,可以在搜索中起到导航的作用,辅助用户进行搜索。
[0063]步骤S706:根据获取到的点击率确定所需要展示的类目,将确定出的所述需要展示的类目作为导航内容在网页上进行展示,并展示所述确定出的类目下的搜索结果。
[0064]在上述实施例中,通过分析用户的历史点击行为,以获得当前搜索词的相关类目的点击情况,从而根据不同的情况确定不同的导航内容进行展示,使得展示的导航内容更加准确,避免了用户由于显示的导航内容不准确而产生的重新搜索,减小了由于重新搜索所造成的对搜索引擎服务器的查询压力;同时,由于返回的是较为准确的导航内容(叶子节点对应的类目)而不是与搜索词对应的所有叶子节点对应的类目,因此,在保证准确性的情况下降低了返回的导航内容(叶子节点对应的类目)下的搜索结果的数量,降低了网络传输的搜索结果的数量,提高了搜索结果的返回速度和搜索效率。通过上述方式有效地解决了现有技术中直接将搜索词对应的所有叶子节点对应的类目都进行展示而造成的搜索效率低下的技术问题,达到了提高搜索效率的技术效果。
[0065]在获取到搜索词在各个类目中所对应的搜索结果的点击率后,可以基于点击率分布的不同确定其具体的导航展示的方式。优选地,可以按照以下几种方式进行导航内容的展示:
[0066]当搜索词所对应的搜索结果在第一叶子节点对应的类目的点击率大于或等于第一预定阈值时,将第一叶子节点对应的类目作为导航内容进行展示;即,在这个时候可以在导航区域内仅展示该点击率大于或等于第一预定阈值的叶子节点对应的类目,而在结果展示区直接展示对应于该搜索词的搜索结果。例如,如果某个搜索词所对应的历史访问记录中某个叶子节点的点击率为99%,则可以确定用户的搜索需求在该叶子节点对应的类目下就可以得到满足,因此可以直接显示该叶子节点对应的类目以及该叶子节点对应的类目所对应的搜索结果即可,用户通过一次搜索就可以得到自己想要搜索的东西,将其称之为类目直达。其中,叶子节点对应的类目是类目树中最小的且不可再分的类目单元,例如“连衣裙”等这些较为具体的搜索词。
[0067]然而,并不是所有的搜索词对应的搜索结果都集中在一个叶子节点对应的类目,也可能集中在某一个非叶子节点对应的类目所对应的多个叶子节点对应的类目中,对于这种情况,可以将其称之为类目聚焦,其对应的导航展示方式可以是将该非叶子节点对应的类目下的所有叶子节点对应的类目都进行展示,也可以仅将该非叶子节点对应的类目下的几个点击率较高的叶子节点对应的类目作为导航内容进行展示,其中,所谓集中是一个相对的概念,可以根据每个节点的历史点击行为判断点击的集中程度,优选地,这里的集中程度是指对所有用户的一个点击率进行统计后得到的该节点在自身所在的类目树层级中的点击率大小,然后确定其是否大于预设的一个预定阈值,从而确定类目中较为集中的类目。在一个优选实施方式中,当搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都未大于第一预定阈值,但是在一个或多个叶子节点对应的类目的点击率大于第二预定阈值且一个或多个叶子节点对应的类目属于同一个父节点时,将该父节点下的所有叶子节点对应的类目作为导航内容进行展示。
[0068]下面以一个具体实施例对类目聚焦进行具体说明:
[0069]如图5所示是类目树的一种优选示意图,由图5所显示的内容可知,在所有的叶子节点对应的类目中,仅有B21和B23是集中的,找出所有集中的节点,作为最终展示的节点。例如可以设定叶子节点对应的类目中点击率大于30%就算作该层中较为集中的类目(又可以称为节点)。同时可以发现B21和B23都是B2的叶子节点对应的类目,因此,可以想到用户的点击需求在B2下也就几乎可以得到满足了。因此,可以将B2的直接子节点对应的类目:B21、B22以及B23作为待显示的导航内容进行显示。优选地,也可以仅显示B21和B23或者是也可以将B2也作为导航内容进行展示。这就是所谓的类目聚焦。
[0070]在实际应用中,也有可能出现对应某个搜索词对应的历史访问记录中点击率较高的几个叶子节点对应的类目不属于同一个非叶子节点对应的类目的情况,这样通过上述类目聚焦的方式进行展现需要展现的内容也就会比较多,在这种情况下,就可以按照类目之间的父子关系进行层级展示。即,按照每个类目的点击率确定展示哪些非叶子节点对应的类目,及其对应的叶子节点对应的类目,对于这种展现方式可以叫做类目层级。在一个优选实施方式中,根据用户的历史访问记录获取搜索词在各个类目中所对应的搜索结果的召回率包括:当搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都小于第一预定阈值,且点击率大于第二预定阈值的多个叶子类目不属于同一个父节点时,根据各个类目之间的父子关系进行层级展示。
[0071]具体的,在进行类目层级展示的时候,可以按照如图8所示的方式实现,包括以下步骤:
[0072]步骤S802:确定每个叶子节点对应的类目的父节点的点击率,其中,父节点的点击率是父节点下的所有子节点对应的类目的点击率的和;
[0073]步骤S804:将点击率大于或等于第三预定阈值的父节点,以及该父节点下的所有子节点对应的类目作为第一待展示的导航内容;
[0074]步骤S806:确定小于第三预定阈值的父节点的上层节点的点击率,其中,上层节点的点击率是上层节点下的所有子节点的点击率的和;
[0075]步骤S808:将点击率大于或等于第四预定阈值的上层节点,以及该上层节点下的所有子节点作为第二待展示的导航内容,即,将确定的上层节点以及其对应的直接的子节点对应的类目都作为导航内容进行展示;优选地,对于上述的第三阈值和第四阈值可以是根据每个层级的特性确定的数值,和第一和第二阈值之间没有必然的联系。
[0076]步骤S810:将第一待展示的导航内容和第二待展示的导航内容按照相互之间的父子关系进行层级展示。
[0077]S卩,确定叶子节点对应的类目的父节点的点击率是否相对集中,优选地,如果父节点的点击率不集中可以继续向上层推直至对应叶子节点对应的类目的父辈或者祖辈的属于其对应的层中较为集中的节点或者是推到根节点为止。即,如果一个搜索词对应的叶子节点对应的类目在其对应的最下面一层是较为分散的,即其对应的点击率较低,就确定其父节点的点击率在父节点对应的层中是否是相对集中的,即对应的点击率是否比较高,如果是,则将其对应的父节点下的所有子节点都作为最终导航内容进行展示,如果该叶子节点对应的父节点的点击率也不高,则基于其父节点继续向上层判断直至找到在对应层属于较为集中的节点或者是根节点为止。优选地,每个上层节点的点击率都可以通过其对应的下层节点的点击率进行累加运算得到。下面以一个具体例子对类目层级展示进行具体说明:
[0078]如图6所示是类目树的另一种优选示意图,类目层级是按照从叶子节点对应的类目向上查找的方式进行的,直至找到对应的父节点或者是祖辈节点在其对应层中是集中的情况下,才停止查找判断。在如图6所示的类目树中,因B12在其对应层是分散的,因此确定其父节点(BI)是否是集中,在确定是的情况下,将BI和其对应的所有子节点对应的类目(B11、B12)都作为导航内容进行展示,同样的,对于Cll和C12,自身是分散的,其对应的父节点(Cl)也是分散的,然而其对应的祖辈节点(C)是集中的,因此,将其祖辈节点C和其祖辈节点的子节点对应的类目(Cll和C12)作为导航内容进行展示。因此,对于图6所示的类目树,最终作为导航内容进行层级展示的就是:C:C1、C2 ;B1:B11、B12 ;B2:B21、B22、B23 ;E3:E31、E32。其中,层级展示的方式可以是如图3所示的展示方式,S卩,按照相互之间的父子关系进行层级展示。
[0079]在上述各个优选实施方式中,上述历史访问记录包括但不限于搜索词对应的搜索结果的点击率,和/或搜索词对应的导航内容中各个类目的点击率。
[0080]为了更好地确认类目结构中每个类目节点的点击率,可以为每个类目设置权重值,对应的设置的权重值可以根据历史访问记录中的点击情况确定,点击率高的就可以设置大的权重,点击率低的就可以设置小的权重。在一个优选实施方式中,根据用户的历史访问记录获取搜索词在各个类目中所对应的搜索结果的点击率包括:根据历史访问记录为各个类目设置权重值,其中,点击次数多的类目对应大的权重值,点击次数少的对应小的权重值;根据为各个类目设置的权重值确定各个类目的点击率。
[0081]实施例3
[0082]本申请实施例提供了 一种优选的实施例来进一步对本申请进行解释,但是值得注意的是,该优选实施例只是为了更好的描述本申请,并不构成对本申请不当的限定。
[0083]针对现有技术中存在的以下不足:首先,完全展示叶子节点对应的类目给用户导航形式过于单一;其次,对于宽泛查询的导航内容不友好,导航类目展示较为混乱,不利于用户找到自己所需结果类目的集合。直接进行叶子节点对应的类目的导航很难精确确定用户搜索的真实意图,有时会给出错误的定位。
[0084]在本申请所提供的方法中,能够通过对用户的搜索词的分析以及根据用户的历史访问记录确定搜索结果中各个类目的点击率的分布情况,并按照不同的需求给出不同的导航形式,即,对于宽泛和精确的查询给出基于不同粒度的导航,优选地,可以包括以下几种方式:类目直达、类目聚焦、类目层级以及类目平铺等,从而有效确定用户的搜索意图以便更精确地确定搜索结果。其中,
[0085]类目直达,就是将用户的搜索词直接定位到某个最相关的类目,以使得用户进行一次筛选就可以得到想要搜索的结果。
[0086]类目聚焦,就是针对搜索词直接展示几个最相关的类目,并自动屏蔽掉其他非相关的类目,以缩小用户的筛选范围提升筛选效率。
[0087]类目层级,就是基于用户所给的搜索词按照类目树结构展示不同的子树,给出类目父子关系的路径,在用户进行宽泛搜索的时候帮助用户以较快的速度确定搜索意图。
[0088]类目平铺,就是用户的搜索意图特别宽泛的时候,直接展示所有和搜索词相关的叶子节点对应的类目。
[0089]下面对上述几种方式进行具体的描述:
[0090]按照历史访问记录中的点击率的分布确定每个叶子节点对应的类目的点击情况以给出不同的导航形式:
[0091]I)对于宽泛查询,类目的搜索结构包括多个非叶子节点对应的类目,这种情况下可以按照类目的体系结构,对结果进行分层展示,称之为类目层级,也可以叫做层级导航;
[0092]2)对于比较精确具体的查询,搜索结果所属的叶子节点对应的类目相对集中,一般普遍集中在某个非叶子节点对应的类目下的叶子节点对应的类目,这种情况可以直接定位到该非叶子节点下的叶子节点以供用户进行筛选,称之为类目聚焦;
[0093]3)对于非常精确具体的搜索词,且对应的搜索结果大部分属于一个叶子节点对应的类目时,可直接将搜索结果定位到这一个叶子节点对应的类目,而自动通过搜索引擎过滤掉其他叶子节点对应的类目的结果,称之为类目直达;
[0094]4)如果搜索结构的分布可以被多个叶子节点(即上文的叶子节点对应的类目)覆盖,但是无法具体到某些具体的上层节点,则可以直接将覆盖搜索结果的几个叶子节点作为导航内容进行显示,这种方式成为类目平铺。
[0095]即根据不同的查询意图,给出用户不同的导航形式,具体有四种:类目直达,类目聚焦,类目层级,以及类目平铺。
[0096]在上述方式中,首先根据文本之间的相关性以及大规模的历史用户行为分析用户的原始查询和所点选的类目之间的相关性,从而将用户的查询意图定位到所有相关的叶子节点对应的类目,然后判断具体的导航展示形式,一方面分析查询词的意图范围,即确定用户的查询意图是宽泛还是具体,一方面借助类目体系结构,将所有相关叶子节点对应的类目构建称其对应的类目树结构,并且所有树节点会根据点击情况赋予不同的权重,最后通过阈值分析判断展示的层级。
[0097]本申请实施例还提供了一种实现上述搜索方式的系统总体架构,如图9所示,该系统包括四部分:
[0098]前端服务器,用于接收用户的查询,分发请求给smartquery平台(包含导航算法的平台)和搜索引擎;
[0099]smartquery平台,是一个用于处理查询的算法平台,上述的导航显示方法服务就可以部署在这个平台的机器上;
[0100]搜索引擎,用于查询结果;
[0101 ] 运营工具服务器,用于进行人工运营。
[0102]基于上述的系统架构,本申请实施例还提供了一种优选的处理流程,如图10所示,包括(步骤S1002至步骤S1012):
[0103]步骤S1002:获取搜索引擎前端请求过来的搜索词。
[0104]步骤S1004:通过分析大规模的用户历史日志中历史访问记录,判断搜索词的类目倾向,在该步骤中的类目指代的是类目结构中的叶子节点对应的类目。
[0105]步骤S1006:判断是否是类目直达,优选地,类目直达是对于用户搜索非常明确的查询词,并且通过网站的历史行为分析几乎全部(99%)的用户点击行为都集中在这个类目,也就是用户的需求在这个类目下基本都可以得到满足的情况,导航将会以类目直达的方式进行展现,最终展现的效果是虽然用户仅进行了一次查询词搜索,但是实际得到的结果是这个搜索词得到的结果经过该类目过滤后的结果,从而使得用户查询得到的结果更为精确,有效缩短了用户搜索的路径,提升了用户的体验效果。
[0106]步骤S1008:判断是否是类目聚焦,类目聚焦是指对于用户的搜索词,搜索引擎返回结果可能分布在多个类目,但是用户的历史点击行为普遍集中在某几个类目(比如3个),也就是用户的需求在这几个类目下基本可以全部得到满足。这种情况下,导航会以类目聚焦的方式进行展示。最终体现给用户的效果是用户的某个搜索词返回的结果分布在多个类目,然而导航只展示其中的某几个类目,通过这种方式可以有效减少用户的筛选范围,帮助用户自动屏蔽掉其他非相关的类目,达到了降低筛选成本,提高用户体验的效果。
[0107]步骤S1010:判断是否是类目层级,类目层级一般是在用户搜索词比较宽泛,返回的搜索结果以及用户的历史点击行为也相对较为分散的情况下使用的,一方面叶子节点对应的类目分布数量较多,另一方面这些叶子节点对应的类目的父节点也有多个,即分布在多个不同的类目上,对于这种搜索情况很难直接将用户的搜索意图定位到某些具体的叶子节点对应的类目,如果将所有的叶子节点对应的类目直接展示给用户的话,需要展示的叶子节点对应的类目的数量太多而且很繁杂,没有条理性,从而很难让用户以较小的代价找到自己需要的类目导航,用户体验会比较差,影响导航区用户的点击行为,在这种情况下,就可以按照层级导航的方式,即将所有的叶子节点对应的类目按照在类目树中的结构体系,进行分堆,根据用户点击概率等在类目树中抽取出合适的类目子树作为类目分类方法,最终展示的效果是按照用户的历史点击和偏好将类目按照高层父节点组织成不同的子树结构,通过这种方式展示的导航条理比较清晰,同时便于不同的用户选择不同的子树结构,提高了搜索效率。
[0108]S卩,如上述图6所示,以类目树为三级类目为例进行说明,按照类目体系结构构建一颗类目树,再根据每个类目的点击行为判断点击的集中程度。在类目层级中,是按照从叶子节点对应的类目向上查找的方式进行的,直至找到对应的父节点或者是祖辈节点在其对应层中是集中的情况下,才停止查找判断。
[0109]在图6所示的类目树中,因B12在其对应层是分散的,因此确定其父节点(BI)是否是集中,在确定是的情况下,将BI和其对应的所有子节点都作为导航内容进行展示,同样的,对于CU和C12,自身是分散的,其对应的父节点(Cl)也是分散的,然而其对应的祖辈节点(C)是集中的,因此,将其祖辈节点C和其祖辈节点的子节点(Cll和C12)作为导航内容进行展示。因此,对于图6,最终展示的是:C:C1、C2 ;B1:B11、B12 ;B2:B21、B22、B23:E3:E31、E32。
[0110]步骤S1012:如果不满足上面的所有场景,则表明该搜索词对应的搜索结果可以在一定数量的叶子节点对应的类目中被覆盖到,然而无法合理地分配到某种场景下,这种情况就可以采用类目平铺的展示方式,即,将能将其覆盖的所有叶子节点对应的类目都作为最终的导航内容进行展示。[0111]在上述实施方式中,通过分析用户的历史点击行为,以获得当前搜索词的所有相关叶子节点对应的类目,然后根据不同的场景,按照类目直达,类目聚焦,类目层级以及类目平铺的顺序进行判定,当确定某个符合的场景就退出,作为最终的导航内容的输出结果,通过上述方式可以根据搜索词的不同给出适合的导航内容进行展示从而提高了搜索效率,也提升了用户体验。
[0112]通过以上的描述可知,本申请具有以下优势:通过分析用户的历史点击行为,以获得当前搜索词的相关类目的点击情况,从而根据不同的情况确定不同的导航内容进行展示,使得展示的导航内容更加准确,避免了用户由于显示的导航内容不准确而产生的重新搜索,减小了由于重新搜索所造成的对搜索引擎服务器的查询压力;同时,由于返回的是较为准确的导航内容(叶子节点对应的类目)而不是与搜索词对应的所有叶子节点对应的类目,因此,在保证准确性的情况下降低了返回的导航内容(叶子节点对应的类目)下的搜索结果的数量,降低了网络传输的搜索结果的数量,提高了搜索结果的返回速度和搜索效率。通过上述方式有效地解决了现有技术中直接将搜索词对应的所有叶子节点对应的类目都进行展示而造成的搜索效率低下的技术问题,达到了提高搜索效率的技术效果。
[0113]显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
[0114]以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
【权利要求】
1.一种导航内容的确定方法,其特征在于,包括: 获取输入的搜索词; 根据历史访问记录获取所述搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率; 根据获取到的点击率确定所需要展示的类目,将确定出的所述需要展示的类目作为导航内容在网页上进行展示,并展示所述确定出的类目下的搜索结果。
2.根据权利要求1所述的方法,其特征在于,根据获取到的点击率确定所需要展示的类目,将确定出的所述需要展示的类目作为导航内容在网页上进行展示包括: 当所述搜索词所对应的搜索结果在所述类目树中的第一叶子节点对应的类目的点击率大于或等于第一预定阈值时,将所述第一叶子节点对应的类目作为所述导航内容进行展示;或者 当所述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都未大于第一预定阈值,但是在一个或多个叶子节点对应的类目的点击率大于第二预定阈值且所述一个或多个叶子节点对应的类目属于同一个父节点时,将所述父节点下的叶子节点对应的类目作为所述导航内容进行展示。
3.根据权利要求1所述的方法,其特征在于,根据获取到的点击率确定所需要展示的类目,将确定出的所述需要展示的类目作为导航内容在网页上进行展示包括: 当所述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都小于第一预定阈值、且所述搜索词所对应 的搜索结果在每个叶子节点对应的类目的点击率大于第二预定阈值的多个叶子节点对应的类目不属于同一个父节点时,根据各个类目之间的父子关系进行层级展示。
4.根据权利要求3所述的方法,其特征在于,根据各个类目之间的父子关系进行层级展示包括: 确定每个叶子节点对应的类目的父节点的点击率,其中,所述父节点的点击率是所述父节点下的所有子节点对应的类目的点击率的和; 将点击率大于或等于第三预定阈值的父节点,以及所述点击率大于或等于第三预定阈值的父节点的所有子节点对应的类目作为第一待展示的导航内容; 将所述第一待展示的导航内容中所述父节点以及所述父节点下的所有子节点对应的类目按照父子节点之间的关系进行层级展示。
5.根据权利要求4所述的方法,其特征在于,在确定每个叶子节点对应的类目的父节点的点击率之后,所述方法还包括: 确定小于所述第三预定阈值的父节点的上层节点的点击率,其中,所述上层节点的点击率是所述上层节点下的所有子类目的点击率的和; 将点击率大于或等于第四预定阈值的上层节点,以及所述点击率大于或等于第四预定阈值的上层节点下的所有子节点对应的类目作为第二待展示的导航内容; 将所述第一待展示的导航内容和所述第二待展示的导航内容按照相互之间的父子关系进行层级展示。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述历史访问记录包括:所述搜索词对应的搜索结果的点击率,和/或所述搜索词对应的导航内容中各个类目的点击率。
7.根据权利要求1至5中任一项所述的方法,其特征在于,根据历史访问记录获取所述搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率包括: 根据所述历史访问记录为各个类目设置权重值,其中,点击次数多的类目对应大的权重值,点击次数少的对应小的权重值; 根据为各个类目设置的权重值确定所述各个类目的点击率。
8.一种导航内容的确定装置,其特征在于,包括: 第一获取单元,用于获取输入的搜索词; 第二获取单元,用于根据历史访问记录获取所述搜索词在类目树中各层上的各个类目中所对应的搜索结果的点击率; 确定单元,用于根据获取到的点击率确定所需要展示的类目,将确定出的所述需要展示的类目作为导航内容在网页上进行展示,并展示所述确定出的类目下的搜索结果。
9.根据权利要求8所述的装置,其特征在于,所述确定单元包括: 第一展示模块,用于当所述搜索词所对应的搜索结果在所述类目树中的第一叶子节点对应的类目的点击率大于或等于第一预定阈值时,将所述第一叶子节点对应的类目作为所述导航内容进行展示;或者 第二展示模块,用于当所述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都未大于第一预定阈值,但是在一个或多个叶子节点对应的类目的点击率大于第二预定阈值且所述一个或多个叶子节点对应的类目属于同一个父节点时,将所述父节点下的叶子节点对应的类目作为所述导航内容进行展示。`
10.根据权利要求8所述的装置,其特征在于,所述确定单元包括: 第三展示模块,用于当所述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率都小于第一预定阈值、且所述搜索词所对应的搜索结果在每个叶子节点对应的类目的点击率大于第二预定阈值的多个叶子类目不属于同一个父节点时,根据各个类目之间的父子关系进行层级展示。
【文档编号】G06F17/30GK103729362SQ201210387331
【公开日】2014年4月16日 申请日期:2012年10月12日 优先权日:2012年10月12日
【发明者】宁伟, 顾湘余 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1