生成蹊径的方法和装置与流程

文档序号:19615543发布日期:2020-01-07 08:06阅读:159来源:国知局
生成蹊径的方法和装置与流程

本发明涉及互联网技术领域,尤其涉及一种生成蹊径的方法和装置。



背景技术:

蹊径是一种搜索引擎的广告推广样式,在普通推广内容中融入多条子链,使推广服务具备更多信息表达功能,其展现子链被称为“蹊径子链”。

蹊径子链与网站主链接在同一个页面展示,用户可以通过点击主链接进入网站首页,再通过多次点击,查找到想要的页面(目标页面),也可以通过点击蹊径子链,直接到达目标页面。因此,蹊径子链可以大大缩短用户点击过程,提高转化率。由此可知,如果设置的蹊径子链为用户关注的内容,那么会提高网站的点击率。

现有技术中,蹊径主要由搜索营销人员根据经验或者商业需求设置的,主观性较强,往往不能满足用户的真实需求,因此存在人为主观设定的蹊径与用户真实需求不匹配的问题。



技术实现要素:

有鉴于此,本发明提供一种生成蹊径的方法和装置,能够解决现有技术中人为主观设定的蹊径与用户真实需求不匹配的问题。

依据本发明一个方面,提供了一种生成蹊径的方法,所述方法包括:

获取各个页面的访问信息;

确定所述访问信息在各个页面中的页面排名;

根据所述页面排名,提取所述访问信息对应的各个页面的来源关键词;

查找出包含所述来源关键词的所有推广单元;

从查找到的所有推广单元中获取目标推广单元,所述目标推广单元为包含来源关键词最多的推广单元;

将对应所述目标推广单元的至少一个页面的统一资源定位符url确定为蹊径子链。

依据本发明另一个方面,提供了一种生成蹊径的装置,所述装置包括:

获取单元,用于获取各个页面的访问信息;

排序单元,用于确定所述访问信息在各个页面中的页面排名;

提取单元,用于根据所述页面排名,提取所述访问信息对应的各个页面的来源关键词;

查找单元,用于查找出包含所述提取单元提取的所述来源关键词的所有推广单元;

所述获取单元,还用于从所述查找单元查找到的所有推广单元中获取目标推广单元,所述目标推广单元为包含来源关键词最多的推广单元;

确定单元,用于将对应所述获取单元获取的所述目标推广单元的至少一个页面的统一资源定位符url确定为蹊径子链。

借由上述技术方案,本发明提供的生成蹊径的方法和装置,能够在获取用户访问网站的访问信息后,对各个页面进行排序,获得前n名页面,然后查找到包含前n名页面中每个页面的来源关键词的所有推广单元,并从中获得目标推广单元,最后将对应目标推广单元的至少一个页面的url确定为蹊径子链。与现有技术中通过人为主观确定蹊径子链相比,本发明通过对用户访问网站的访问信息进行分析,先获得用户关注度高的页面(即前n名页面),再获得包含前n名页面的来源关键词最多的推广单元(即目标推广单元),最后将对应目标推广单元的至少一个页面的url确定为蹊径子链,从而使得生成的蹊径子链为用户真实需求的蹊径子链,进而提高了用户进入目标页面的效率。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种生成蹊径的方法的流程图;

图2示出了本发明实施例提供的一种生成蹊径的装置的组成框图;

图3示出了本发明实施例提供的另一种生成蹊径的装置的组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种生成蹊径的方法,如图1所示,该方法包括:

101、获取各个页面的访问信息。

在实际应用中,广告主终端可以通过多种数据采集技术采集到用户访问网站的访问信息,然后将这些访问信息存储在数据仓库中,便于后续分析和管理。其中,用户访问网站的访问信息包括用户所使用的操作系统类型、浏览器类型、搜索页面所使用的关键词(即页面的来源关键词)、用户浏览各个页面的时间和用户的基本信息(如账号)等。在获得上述基本信息后,通过对所有访问信息进行统计与分析,还可以获得对应各个页面的其他信息,例如页面的浏览量、转化率和跳出率等。

需要说明的是,终端在采集网站服务器上的数据时,会采集到一些脏数据,例如重复的数据,与用户访问信息无关的其他数据,因此当终端获得原始数据后,会先对该原始数据进行清洗、格式转化等优化操作,以便获得有效数据,再将这些有效数据保存到数据仓库中进行后续管理与分析。

此外,由于用户在不同阶段所关注的内容会有所不同,所以可以采集近期用户访问网站的访问信息,以便通过对近期访问信息进行分析,获得近期用户关注度较高的信息。

102、确定所述访问信息在各个页面中的页面排名。

当获得用户访问各个页面的访问信息后,可以按照某个指标对各个页面进行排序(例如按照页面的浏览量进行排序),从而获得前n名页面。其中,n为正整数。

在实际应用中,可以采用多种方式对页面进行排名,例如olap(onlineanalyticalprocessing,联机分析处理)技术、数据挖掘技术等。

103、根据所述页面排名,提取所述访问信息对应的各个页面的来源关键词。

由于访问信息中包含搜索页面所使用的关键词(即页面的来源关键词),所以终端可以从访问信息中提取对应前n名页面中每个页面的来源关键词,从而获得n个来源关键词集合。

需要说明的是,终端所获得的各个来源关键词集合中的来源关键词为不同用户对各个页面进行搜索时所使用的关键词,而同一个页面所对应的来源关键词是相同或者相近的,因此终端所获得的每个来源关键词集合中的来源关键词可能是重复的。之所以将用户的每一次访问行为所包含的页面来源关键词都记录在来源关键词集合中,而不进行去重处理,是因为用户的每一次访问行为都是对对应页面的一次关注,同一个页面的相同来源关键词越多,说明用户对该页面的关注度越多,若进行去重处理,则无法准确得到用户对该页面的实际关注情况。

104、查找出包含来源关键词的所有推广单元。

其中,推广单元可以为搜索引擎营销(searchenginemarketing,缩写为sem)中用来管理关键词、搜索创意内容等。例如,某推广单元中的关键词均为旅游景点类的关键词,另一个推广单元中的关键词均为英语培训班类的关键词。

当获得对应前n名页面中每个页面的来源关键词后,需要在本地查找对应每个来源关键词的推广单元,即查找哪个推广单元中包含有前n名页面的至少一个来源关键词。

105、从查找到的所有推广单元中获取目标推广单元。

其中,目标推广单元为包含来源关键词最多的推广单元。当查找到包含前n名页面的至少一个来源关键词的所有推广单元后,终端会统计每个推广单元中所包含的来源关键词的数量,以便获得包含来源关键词数量最多的推广单元,从而确定哪一类内容是目前用户最关注的。

106、将对应目标推广单元的至少一个页面的url确定为蹊径子链。

当获得包含来源关键词最多的目标推广单元后,终端会选择出至少一个页面的url作为蹊径子链。其中,该至少一个页面为存在至少一个来源关键词包含在目标推广单元中的页面。在实际应用中,可以将存在至少一个来源关键词包含在目标推广单元中的所有页面的url(uniformresourcelocator,统一资源定位符)确定为蹊径子链,也从中选择出部分页面的url确定为蹊径子链。

本发明实施例提供的生成蹊径的方法,能够在获取用户访问网站的访问信息后,对各个页面进行排序,获得前n名页面,然后查找到包含前n名页面中每个页面的来源关键词的所有推广单元,并从中获得目标推广单元,最后将对应目标推广单元的至少一个页面的url确定为蹊径子链。与现有技术中通过人为主观确定蹊径子链相比,本发明通过对用户访问网站的访问信息进行分析,先获得用户关注度高的页面(即前n名页面),再获得包含前n名页面的来源关键词最多的推广单元(即目标推广单元),最后将对应目标推广单元的至少一个页面的url确定为蹊径子链,从而使得生成的蹊径子链为用户真实需求的蹊径子链,进而提高了用户进入目标页面的效率。

进一步的,在获得用户访问网站各个页面的访问信息后,需要确定所述访问信息在各个页面中的页面排名。其中,确定页面排名的具体实现方式为:首先,根据排序规则对各个页面进行排序;然后,利用所述排序的结果,确定所述访问信息在各个页面中的页面排名;其中,所述页面的排名,为根据预设条件在所述排序中选取的。

在实际应用中,排序规则可以为以某个指标信息为依据进行排序,也可以为以若干指标信息的综合情况为依据进行排序。例如,终端可以根据浏览量的大小对各个页面进行排序。又如,终端可以根据浏览量、跳出率和转化率的综合情况(如50%浏览量+30%跳出率+20%转化率)对各个页面进行排序。再如,终端可以先根据浏览量进行排序,当出现若干页面的浏览量相同的情况时,可以再根据跳出率进行排序,当出现若干页面的跳出率相同的情况时,可以再根据转化率进行排序。

进一步的,在上述实施例中提及,对页面进行排序所采用的技术方式可以有多种,其中一种方式为:在olap技术下,根据排序规则对各个页面进行排序。其中,olap可以从数据仓库中抽取详细数据的一个子集,并经过必要的聚集存储到olap存储器中供前端分析工具读取与分析。

进一步的,当确定目标推广单元后,终端会将对应目标推广单元的至少一个页面的url确定为蹊径子链。然而随机选取的至少一个页面的url不一定是用户最需要的,因此为了进一步使得设置的蹊径子链与用户需要的蹊径子链相匹配,可以采用如下方案:计算包含在目标推广单元中的每个页面的来源关键词的个数,并将个数最多的至少一个页面的url确定为蹊径子链。

具体的,终端分别计算包含在目标推广单元中的各个页面的来源关键词的个数,然后将个数从大到小进行排序,最后将个数排名位于前m名的页面的url确定为蹊径子链。其中,m为正整数,且m≤n。

示例性的,若n为10,且存在至少一个来源关键词位于目标推广单元的页面为页面1、页面3、页面4、页面5、页面7和页面10,则终端分别统计包含在目标推广单元中的各个页面的来源关键词的个数,统计结果为页面1的来源关键词个数为100个、页面3为200个、页面4为160个、页面5为240个、页面7为150个、页面10为300个。此时,若设置的蹊径子链的个数为4,则将来源关键词个数为前4名的页面的url确定为蹊径子链,即将页面10、页面5、页面3和页面4的url确定为蹊径子链。

此外,一般情况下,一组蹊径子链从左到右依次展示在页面上,而用户习惯从左到右依次进行点击,所以为了进一步简化用户进入目标页面的操作步骤,可以根据个数排名的先后顺序依次展示对应的蹊径子链,即上述例子中依次将对应页面10、页面5、页面3和页面4的蹊径子链从左向右依次展示在页面上。在具体实现过程中,一般只需要将页面10的url设置为第一个蹊径子链,将页面5的url设置为第二个蹊径子链,将页面3的url设置为第三个蹊径子链,将页面4的url设置为第四个蹊径子链即可。

进一步的,当确定蹊径子链的url之后,还需要设置蹊径子链的名称。由于页面标题可以概括页面的主题内容,所以终端可以将页面标题设置为对应页面的蹊径子链的名称。例如,页面标题为北京酒店预订,则可以将对应该页面的蹊径子链的名称设置为北京酒店预订。

进一步的,在实际应用中,部分页面标题可能比较长,为了使蹊径子链的名称更加简洁,可以从页面标题中提取至少一个关键字,并将该至少一个关键字设置为对应页面的蹊径子链的名称。例如,页面标题为北京酒店预订-北京酒店价格-北京酒店查询,则可以提取北京酒店作为对应该页面的蹊径子链的名称。

此外,一个页面的来源关键词有多个,这些来源关键词可能对应不同的推广单元,同一个推广单元中也可能包含同一个页面的多个来源关键词。当目标推广单元中包含某个页面的多个来源关键词时,可以提取这些来源关键词的相同部分作为对应该页面的蹊径子链的名称。例如,目标推广单元中含有某一页面的三个来源关键词,即北京酒店预订、北京酒店价格、北京酒店查询,则可以提取北京酒店作为对应该页面的蹊径子链的名称。

进一步的,依据上述方法实施例,本发明的另一个实施例还提供了生成蹊径的装置,如图2所示,该装置包括:获取单元21、排序单元22、提取单元23、查找单元24和确定单元25。其中,

获取单元21,用于获取各个页面的访问信息;

排序单元22,用于根据获取单元21获取的访问信息确定所述访问信息在各个页面中的页面排名;

提取单元23,用于根据所述页面排名,提取所述访问信息对应的各个页面的来源关键词;

查找单元24,用于查找出包含提取单元23提取的来源关键词的所有推广单元;

获取单元21,还用于从查找单元24查找到的所有推广单元中获取目标推广单元,目标推广单元为包含来源关键词最多的推广单元;

确定单元25,用于将对应获取单元21获取的目标推广单元的至少一个页面的统一资源定位符url确定为蹊径子链。

本发明实施例提供的生成蹊径的装置,能够在获取用户访问网站的访问信息后,对各个页面进行排序,获得前n名页面,然后查找到包含前n名页面中每个页面的来源关键词的所有推广单元,并从中获得目标推广单元,最后将对应目标推广单元的至少一个页面的url确定为蹊径子链。与现有技术中通过人为主观确定蹊径子链相比,本发明通过对用户访问网站的访问信息进行分析,先获得用户关注度高的页面(即前n名页面),再获得包含前n名页面的来源关键词最多的推广单元(即目标推广单元),最后将对应目标推广单元的至少一个页面的url确定为蹊径子链,从而使得生成的蹊径子链为用户真实需求的蹊径子链,进而提高了用户进入目标页面的效率。

进一步的,排序单元22,用于根据排序规则对各个页面进行排序;利用所述排序的结果,确定所述访问信息在各个页面中的页面排名;其中,所述页面的排名,为根据预设条件在所述排序中选取的。

进一步的,排序单元22,用于在联机分析处理olap技术下,根据排序规则对各个页面进行排序。

进一步的,如图3所示,确定单元25,包括:

计算模块251,用于计算包含在目标推广单元中的每个页面的来源关键词的个数;

确定模块252,用于将计算模块251计算的个数最多的至少一个页面的url确定为蹊径子链。

进一步的,如图3所示,该装置还包括:

设置单元26,用于将页面标题设置为对应页面的蹊径子链的名称。

进一步的,如图3所示,设置单元26,包括:

提取模块261,用于从页面标题中提取至少一个关键字;

设置模块262,用于将提取模块261提取的至少一个关键字设置为对应页面的蹊径子链的名称。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的生成蹊径的方法和装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1