预读关键词集合的获取方法、网页访问设备及电子设备与流程

文档序号:14870736发布日期:2018-07-06 23:20阅读:189来源:国知局

本发明涉及互联网技术领域,更具体地,涉及一种预读关键词集合的获取方法及网页访问设备。



背景技术:

随着互联网技术的发展和智能终端的普及,通过安装在智能终端(如手机、平板电脑等)的如浏览器这样的具有网页访问服务的应用,访问互联网网页获取时下热点信息,已经成为互联网用户的日常。

而网页访问速度是反映网页访问服务质量的关键因素,通过提供网页预读功能来提升网页访问速度,是浏览器、类似浏览器的移动应用提升用户网页访问体验的常用手段。

所谓网页预读,是将例如“下一页”、“下页”等作为网页预读的关键词来构建预读关键词集合,在用户访问某个网页时,根据预读关键词集合确定该网页中包含的与预读关键词匹配的预读链接,将预读链接指向的网页内容预先加载,当用户实际点击该预读链接时,立即将该网页显示给用户,从而能减少用户打开网页是的实际等待时间,提升网页访问速度。

在实际应用中,互联网上可访问的网页来源于世界各地的站点,各个国家使用的语言不同,对应的网页所使用的语言集也不同,同时,各个站点的开发者开发网页时,所基于编码集也各不相同,使得互联网上存在语言集类型不同、编码集类型不同的各种网页,而语言集类型不同或编码集类型不同,对应的预读关键词集合也并不相同。

而浏览器或者类似的应用在安装于对应的设备中时,通常会针对面对的用户群体,预先加载对应不同类型的语言集和编码集的预读关键词集合,使得能适应用户的应用场景,例如,面对中国大陆用户,安装浏览器应用时,会预先加载语言集类型是简体中文、编码集类型是utf-8等常用的编码集类型分别组合对应的多个预读关键词集合,使得能支持对中国大陆用户可能访问的各种网页进行预读。但是,为避免影响应用安装、运行的效率,通常不会加载分别对应所有不同的语音集类型和编码集类型的所有预读关键词集合,这就会导致在实际应用场景中,已加载对应编码集类型或语言集类型的预读关键词集合,并不适用于网页预读,出现网页预读失效。

例如,用户访问的某些站点使用的编码集类型比较少见,例如gb2312/gbk/gb180302,通过已有的预读关键词集合进行预读,会无法匹配确定与网页预读关键词对应链接,无法有效预读网页;或者,某些站点会根据用户使用的设备定位来反回对应语言集类型的网页,例如,中国大陆的用户到美国出差,其之前访问的某个站点www.abc.com就会由之前返回utf-8的语言集类型是简体中文的网页,变为www.abc.com就会由之前返回utf-8的语言集类型是美式英文的网页,由于未预先加载语言集类型是美式英文的预读关键词集合,出现网页预读失效;又或者,某些站点提供让用户手动切换访问不同语言集类型的网页的功能,中国大陆的用户如果手动将语言集类型由简体中文切换到法文,也会导致网页预读失效,等等。

因此,发明人认为,有必要对上述现有技术中存在的问题进行改进。



技术实现要素:

本发明的一个目的是提供一种用于获取网页预读关键词集合以提供网页预读服务的新技术方案。

根据本发明的第一方面,提供了一种预读关键词集合的获取方法,包括:

根据所获取的连续网页列表,统计对应的连续网页的数目,

其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页;

当所述连续网页的数目大于预设阈值时,

获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

可选地,该方法还包括:

跟踪用户访问的网页,生成所述连续网页列表并存储以供获取;

和/或

在执行所述目标预读关键词集合添加步骤后,删除对应的所述连续网页列表。

可选地,所述生成所述连续网页列表的步骤包括:

识别用户访问的当前网页的编码集类型和语言集类型;

当已有的预读关键词集合中,不存在与所述编码集类型和语言集类型对应的预读关键词集合时,获取与所述编码集类型和语言集类型对应的网页访问队列中记录的最后一个网页的地址;

当最后一个网页与当前网页符合连续网页条件时,将当前网页的地址增加到所述网页访问队列的末尾;

或者,当最后一个网页与当前网页不符合连续网页条件时,统计所述网页访问队列已记录的网页数目,

当所述网页数目大于连续阈值时,生成对应的所述连续网页列表,否则,清空所述网页访问队列中已记录的网页地址,将当前网页的地址作为第一个网页的地址添加到所述网页访问队列中。

可选地,所述连续网页条件是,最后一个网页的地址与当前网页的地址的路径相同,并且最后一个网页的地址与当前网页的引用网页的地址相同。

可选地,所述获取与所述编码集类型和语言集类型对应的网页访问队列中记录的最末网页的地址步骤还包括:

当不存在与所述编码集类型和语言集类型对应的网页访问队列时,创建所述网页访问队列,并将当前网页的地址作为第一个网页的地址添加到所述网页访问队列中。

可选地,所述连续网页列表中至少包括一条连续网页记录,

所述连续网页记录中包括语言集类型、编码集类型、访问与所述语言集类型和编码集类型对应的连续网页的时间点、以及所述连续网页的数目。

可选地,

根据预设的周期,触发执行所述预读关键词集合的获取方法;

或者,

在用于访问网页的网页访问设备冷启动时,触发执行所述预读关键词集合的获取方法。

根据本发明的第二方面,提供一种网页访问设备,包括:

统计单元,用于根据所获取的连续网页列表,统计对应的连续网页的数目,

其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页;

获取单元,用于当所述连续网页的数目大于预设阈值时,获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

可选地,所述网页访问设备还包括:

生成单元,用于跟踪用户访问的网页,生成所述连续网页列表并存储以供获取;

和/或

删除单元,用于在执行所述目标预读关键词集合添加步骤后,删除对应的所述连续网页列表。

根据本发明的第三方面,还提供一种电子设备,包括存储器和处理器,

其中,存储器用于存储可执行指令,所述可执行指令用于在所述电子设备运行时控制所述处理器执行如本发明的第一方面的任意一项预读关键词集合获取方法,包括:

根据所获取的连续网页列表,统计对应的连续网页的数目,其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页;

当所述连续网页的数目大于预设阈值时,获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

本发明的发明人发现,在现有技术中,并不存在可以针对不同的网页访问场景,自适应地动态加载预读关键词集合用于网页预读的技术方案。因此,本发明所要实现的技术任务或者所要解决的技术问题是本领域技术人员从未想到的或者没有预期到的,故本发明是一种新的技术方案。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是显示可用于实现本发明的实施例的电子设备的硬件配置的例子的框图。

图2示出了本发明的实施例的预读关键词集合的获取方法的流程图。

图3示出了本发明的实施例的生成连续网页列表的流程图。

图4示出了本发明的实施例的预读关键词集合的获取方法的例子的示意图。

图5示出了本发明的实施例的网页访问设备的框图。

图6示出了本发明的实施例的电子设备的框图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

<硬件配置>

图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的框图。

电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器cpu、微处理器mcu等。存储器1200例如包括rom(只读存储器)、ram(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括usb接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括wifi通信、蓝牙通信、2g/3g/4g/5g通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。

图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中,电子设备1000的所述存储器1200用于存储可执行指令,所述可执行指令用于在电子设备1000运行时控制所述处理器1100进行操作以执行本发明实施例提供的任意一项预读关键词更新方法,包括:根据所获取的连续网页列表,统计对应的连续网页的数目,其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页;当连续网页的数目大于预设阈值时,获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

本领域技术人员应当理解,尽管在图1中对电子设备1000示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。

本发明的总体构思,是提供一种预读关键词集合获取的新技术方案,可以针对不同的网页访问场景,获取适用的预读关键词集合,实现自适应地动态加载预读关键词集合,避免预读关键词集合不适用网页访问场景而使得网页预读失效,确保网页预读的有效性,提升网页预读效率。

<实施例>

<方法>

本实施例中提供一种预读关键词集合的获取方法,如图2所示。

预读关键词集合中包含与特定的语言集类型和编码集类型对应的用于网页预读的预读关键词。预读关键词应用于网页预读中,是在用户访问某个网页时,根据预读关键词集合确定该网页中包含的与预读关键词匹配的预读链接,将预读链接指向的网页内容预先加载,当用户实际点击该预读链接时,立即将该网页显示给用户,实现网页预读。

语言集类型是网页所使用的语言集的类型,语言集对应网页所使用的语言。例如,常见的语言集类型可以包括:简体中文(zh-cn)、英文(en)、美式英文(en-us)等。

通常,网页访问设备例如移动浏览器,被安装于对应的电子设备例如手机后,会使用手机的语言设置作为语言集类型的缺省设置。比如,中国大陆地区的用户,由于手机的语言设置一般是简体中文,所以其在手机上安装移动浏览器也会使用简体中文作为缺省的语言集类型。

或者,移动浏览器在发起的网页访问请求的http请求头中,也可以通过以下声明来向对应网页服务器说明移动浏览器希望获取哪些语言集类型的网页,例如,通过下述声明向网页服务器说明希望获取语言集类型为简体中文(zh-cn)、英文(en)、美式英文(en-us)的网页:

accept-language:zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3。

编码集类型是网页所使用的编码集类型,编码集对应网页所使用的字符编码。例如,常见的编码集类型由utf-8、gb2312、gbk、gb18030等。utf-8(8-bitunicodetransformationformat)是一种针对unicode的可变长度字符编码,又称万国码,用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文);gb2312是信息交换用汉字编码字符集,适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆,新加坡等地也采用此编码;gbk是汉字内码扩展规范,可以向下兼容gb2312;gb18030是信息技术中文编码字符集,在gbk基础上增加了cjk统一汉字扩充a的汉字。

网页服务器(例如web服务器)通常在网页请求应答的http应答头的字段中进行声明来通知对应的网页访问设备例如移动浏览器,其返回的网页使用何种编码集类型,例如,通过下述声明网页使用的编码集类型为utf-8:

content-type:text/html;charset=utf-8。

或者,网页服务器也可以在返回的网页例如html页面中通过meta标签来声明该网页所使用的编码集类型,例如,通过下述html页面中meta标签来声明网页使用的编码集类型为utf-8:

上述已经说明本实施例中涉及的预读关键词集合、语言集类型以及编码集类型。

应当理解的是,不同的语言集类型或编码集类型,对应的预读关键词集合不同。

如图2所示,本实施例中提供的预读关键词集合的获取方法,包括:

步骤s2100,根据所获取的连续网页列表,统计对应的连续网页的数目,

其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页。

通过实施本实施例的网页访问设备,比如移动浏览器访问网页时,移动浏览器通常已预先加载某些与特定的语言集类型、编码集类型对应的预读关键词集合,在用户访问某个网页时,根据预读关键词集合确定网页中包括的与预读关键词的预读链接,预先加载与该预读链接对应的网页的内容,实现网页预读。

但是,发明人发现,基于网页访问设备已有的预读关键词集合,对用户访问的网页进行网页预读时,已有的预读关键词集合并不支持该网页的语言集类型或编码集类型,因此无法匹配确定该网页的预读链接,网页预读失效,已有的预读关键词集合不适用于对该网页进行预读。

在连续网页列表中,记录的是用户已访问的、不适用已有的预读关键词集合进行预读的连续网页。

连续网页是多个依次具有连续访问关系的网页。例如,用户可以通过点击网页p中的超链接打开网页n,意味着网页n是用户点击网页n衍生访问的网页,对应的,网页p和网页n属于连续网页。

具体地,连续网页列表中至少包括一条连续网页记录,所述连续网页记录中包括语言集类型、编码集类型、访问与所述语言集类型和编码集类型对应的连续网页的时间点、以及所述连续网页的数目。

例如,对于语言集类型为l编码集类型e的连续网页记录,可以记录为如下形式:

在上述连续网页记录中,记录对应语言集类型为l编码集类型e,用户在分别在2016年1月1日三个时间点08点05时21分、08点23时18分、09点01时55分访问的不适用已有预读关键词集合进行网页预读的9个具有连续访问关系的连续网页、15个具有连续访问关系的连续网页以及12个具有连续访问关系的连续网页。

针对上述的连续网页列表,对于语言集类型为l、编码集类型e,统计得到对应的连续网页的数目为9+15+12=36。

在本实施例中,可以通过挖掘用户的网页访问历史记录,来生成所述连续网页列表。或者,可以通过跟踪用户访问的网页,生成所述连续网页列表。

在生成所述连续网页列表之后,可以存储在实施本实施例的网页访问设备的本地存储中,例如网页访问设备为移动浏览器时,存储在移动浏览器的应用缓存区域,实现持久化保存,以供实施本实施例的预读关键词集合的获取方法时,由网页访问设备通过读取、调用等方式来获取。

在一个例子中,跟踪用户访问的网页,生成所述连续网页列表的步骤可以如图3所示,包括:

步骤s2101,识别用户访问的当前网页的编码集类型和语言集类型。

识别当前网页的编码集类型,可以通过在当前网页对应的网页服务器对网页请求的应答的http应答头中的对应编码集类型的声明字段或者当前网页的html页面中的meta标签来识别,上文已经描述,在此不再赘述。

识别当前网页的语言集类型,可以通过实施本实施例的网页访问设备的缺省语言集类型或者请求当前网页的http请求头中的对应语言集类型的声明字段进行识别,上文已经描述,在此不再赘述。

假设当前网页为网页p,识别出网页p的编码集类型为e,语言集类型为l。

步骤s2102,当已有的预读关键词集合中,不存在与所述编码集类型和语言集类型对应的预读关键词集合时,获取与所述编码集类型和语言集类型对应的网页访问队列中记录的最后一个网页的地址。

在实施本实施例的网页访问设备中,当已有的预读关键词集合中不存在与编码集类型e、语言集类型l对应的预读关键词集合时,从与编码集类型e、语言集类型l对应的网页访问队列中获取队列中记录的最后一个网页n的地址n_address。

与编码集类型e、语言集类型l对应的网页访问队列中,记录的与编码集类型e、语言集类型l对应的用户已访问的连续网页的地址,具体可以是如下形式:

encode=e`lang=l{

n1_address,n2_address,……,n_address}

如果当前不存在与编码集类型e、语言集类型l对应的网页访问队列时,可以创建对应的网页访问队列,并将当前网页即网页p的地址p_address作为第一个网页的网页地址加入该网页访问队列中,可以得到:

encode=e`lang=l{

p_address}

在创建网页访问队列后,结束不再执行后续步骤,在用户访问下一个网页时,进入步骤s2101,以实现跟中用户访问的网页,持续生成连续网页列表。

步骤s2103,确定最后一个网页与当前网页符合连续网页条件时,将当前网页的地址增加到所述网页访问队列的末尾。

连续网页条件是描述两个网页属于具有连续访问关系的网页所必须的条件。当两个网页符合连续网页条件,即为具有连续访问关系的连续网页。

具体地,连续网页条件是,最后一个网页的地址与当前网页的地址的路径相同,并且最后一个网页的地址与当前网页的引用网页的地址相同。

引用网页的地址,对应是当前网页的http请求协议中的referer字段所体现的网页的地址。referer字段标识链接到当前网页的另一个网页的地址。通过当前网页的http请求协议中referer字段,可以获知当前网页是从哪个网页触发的,这个触发的网页就是引用网页。

例如,网页访问队列中最后一个网页n的n_address为:

http://www.cankaoxiaoxi.com/roll10/bd/20170807/2217393.shtml;

当前网页p的地址p_address为:

http://www.cankaoxiaoxi.com/roll10/bd/20170807/2217393_2.shtml;

将网页的网址去掉对应的网页文本名称可以得到网页的路径,对于网页n、网页p,两者的路径均为:

http://www.cankaoxiaoxi.com/roll10/bd/20170807;

并且,当前网页p的地址p_address的引用网页的地址为:

http://www.cankaoxiaoxi.com/roll10/bd/20170807/2217393.shtml,与网页n的地址n_address相同,因此,最后一个网页n与当前网页p是具有连续访问关系的网页,将当前网页的p地址p_address增加到对应的网页访问队列中:

encode=e`lang=l{

n1_address,n2_address,……,n_address,p_address}

步骤s2104,确定最后一个网页与当前网页不符合连续网页条件时,统计所述网页访问队列已记录的网页数目。

最后一个网页p和当前网页n不符合连续网页条件,不属于具有访问关系的连续网页,统计当前的网页访问列表中已记录的网页数目。

例如,网页访问队列为:

encode=e`lang=l{

n1_address,n2_address,n3_address,n_address},

统计得到已记录的网页数目为4。

步骤s2105,当所述网页数目大于连续阈值时,生成对应的所述连续网页列表。

连续阈值是用于触发生成连续网页列表时的连续网页的网页数目。可以根据具体的网页访问场景设置,可以是历史经验值或者实验仿真值。例如,连续阈值可以设置为3。

在上例中,得到的网页数目为4,已经大于连续阈值3,对应地,可以生成对应连续网页列表,假设当前时间点为2016年1月3日10时51分12秒,生成的连续网页列表如下:

encode=e`lang=l{

tm=2016-01-03_10:51:12,count=4}

当然,如果与编码集类型e、语言集类型l对应的连续网页列表已存在,也可以生成一条新的连续网页记录,添加到对应的连续网页列表中:

encode=e`lang=l{

……

tm=2016-01-03_10:51:12,count=4}

此后,当用户访问下一个网页时,再进入步骤s2101,以实现跟中用户访问的网页,持续生成连续网页列表。

步骤s2106,当所述网页数目不大于连续阈值时,清空所述网页访问队列中已记录的网页地址,将当前网页的地址作为第一个网页的地址添加到所述网页访问队列中。

基于上例,假设对应编码集类型e、语言集类型l的网页访问队列为:

encode=e`lang=l{

n1_address,n_address},

统计得到的网页数目为2,小于连续阈值3,清空该网页访问队列,将当前网页p的网页地址p_address作为第一个网页的地址添加到所述网页访问队列中:

encode=e`lang=l{

p_address}

此后,当用户访问下一个网页时,再进入步骤s2101,以实现跟中用户访问的网页,持续生成连续网页列表。

上述已经结合附图和示例说明了本实施例中提供的预读关键词集合的获取方法的步骤s2100,

步骤s2200,当所述连续网页的数目大于预设阈值时,获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

预设阈值是用于触发获取关键词集合的连续网页的数目。

当根据连续网页列表统计的连续网页数据大于预设阈值时,意味着已有的预读关键词集合已经不适用当前的网页访问场景,需要针对当前的网页访问场景,获取对应的目标预读关键词集合。

预设阈值可以根据历史经验或者实验仿真结果进行设置,例如,预设阈值可以设置为100。

假设语言集类型l、编码集类型e的连续网页列表为:

统计得到对应的连续网页的数目为9+15+12+14+12+18+18+18=116,大于连续阈值100,获取与连续网页对应的预读关键词集合。

具体地,根据该连续网页对应的语言集类型l、编码集类型e,获取与该语言集类型e、编码集类型l对应的目标预读关键词集合。

可以通过实施本实施例的网页访问设备在可访问的资源库中搜索获取与语言集类型e、编码集类型l对应的目标预读关键词集合,也可以通过向该网页设备的后台服务器请求获取,例如,可以通过向移动浏览器的后台服务器请求加载来获取,在此不一一列举。

在获取与连续网页对应的目标预读关键词集合后,添加到本地,使得后续网页预读过程中,可以针对此前已有的预读关键词集合不适用进行网页预读的网页访问场景,根据目标预读关键词集合,匹配确定预读链接进行网页预读,避免网页预读失效,确保网页预读的有效性,提升网页预读效率。

在本实施例中,还可以在执行所述目标预读关键词集合添加步骤后,删除对应的所述连续网页列表,避免对已有预读关键词集合保留连续网页列表,提升本地存储利用效率。

以上已经说明如图2所示的本实施例的预读关键词集合的获取方法,在本实施例中,可以根据预设的周期,触发执行如图2所示的预读关键词集合的获取方法。

该周期可以根据具体应用需求设置,例如,实施本实施例的网页访问设备,在初始化时并未加载任何预读关键词集合,预设的周期设置为1小时,每24小时触发如图2所示的预读关键词集合获取的方法,在几轮周期之后,就可以获取适用用户常用的网页浏览场景的预读关键词集合,使得可以无需预先加载任何预读关键词集合,提升网页访问设备初始化的效率。

或者,可以在网页访问设备冷启动时,触发执行如图2所示的预读关键词集合的获取方法。

当网页访问设备启动时,支持网页访问设备运行的操作系统后台,没有与网页访问设备启动对应的进程,这时操作系统会重新创建一个新的进程分配给该网页访问设备启动,这个启动方式是网页网文设备的冷启动。

在网页访问设备冷启动时,触发执行预读关键词集合的获取方法,可以避免频繁触发执行预读关键词集合的获取方法,降低对网页访问设备处理资源的消耗。

<例子>

以下将结合图4所示的例子进一步说明本实施例中提供的预读关键词集合的获取方法。

在本例中,实施预读关键词集合的获取方法的设备为移动浏览器。

如图4所示,预读关键词结合的获取方法包括:

步骤s201,移动浏览器冷启动时,根据应用缓存区域中读取的多个连续网页列表,计算每个连续网页列表对应的连续网页的数目;

在本例中,获取连续网页列表的方法如图3所示,在此不再赘述,移动浏览器从应用缓存区域获取的连续网页列表包括:

(1)编码集类型为e、语言集类型为l的连续网页列表:

(2)编码集类型为e、语言集类型为l1的连续网页列表:

统计得到与编码集类型为e、语言集类型为l对应的连续网页的数目为116,与编码集类型为e1、语言集类型为l1对应的连续网页的数目为33;

步骤s202,判断每个统计得到的连续网页数目是否大于连续阈值,若大于,进入步骤s203,否则,回到步骤s201;

在本例中,连续阈值为100;

步骤s203,连续网页数目大于连续阈值时,移动浏览器从后台服务器加载与连续网页数目对应的编码集类型、语言集类型对应的预读关键词集合,并从应用缓存区域中删除对应的连续网页列表;

在本例中,移动浏览器加载与编码集类型为e、语言集类型为l对应的预读关键词集合后,删除应用缓存区域中与编码集类型为e、语言集类型为l对应的连续网页列表,当前应用缓存区域中还存储有与编码集类型为e、语言集类型为l1的连续网页列表。

执行步骤s203之后,转回步骤s201。

以上通过附图和例子说明本实施例提供预读关键词结合的获取方法,可以针对不同的网页访问场景,获取适用的预读关键词集合,实现自适应地动态加载预读关键词集合,避免预读关键词集合不适用网页访问场景而使得网页预读失效,确保网页预读的有效性,提升网页预读效率。

<网页访问设备>

在本实施例中,提供一种网页访问设备3000,如图5所示,包括统计单元3100、获取单元3200,可选地,还包括生成单元3300、以及删除单元3400,用于实施本实施例中提供的任意一项预读关键词集合的获取方法,在此不再赘述。

网页访问设备3000,包括:

统计单元3100,用于根据所获取的连续网页列表,统计对应的连续网页的数目,

其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页;

获取单元3200,用于当所述连续网页的数目大于预设阈值时,获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

可选地,所述网页访问设备3000还包括:

生成单元3300,用于跟踪用户访问的网页,生成所述连续网页列表并存储以供获取;

和/或

删除单元3400,用于在执行所述目标预读关键词集合添加步骤后,删除对应的所述连续网页列表。

在本实施例中,网页访问设备3000可以是软件形式存在的具有网页访问功能的应用程序,例如移动浏览器、可以访问网页的社交类应用程序等,或者,网页访问设备3000可以是实体设备,例如,如图1所示的电子设备1000。

本领域技术人员应当明白,可以通过各种方式来实现网页访问设备3000。例如,可以通过指令配置处理器来实现网页访问设备3000。例如,可以将指令存储在rom中,并且当启动设备时,将指令从rom读取到可编程器件中来实现网页访问设备3000。例如,可以将网页访问设备3000固化到专用器件(例如asic)中。可以将网页访问设备3000分成相互独立的单元,或者可以将它们合并在一起实现。网页访问设备3000可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。

<电子设备>

在本实施例中,还提供一种电子设备4000,如图6所示,包括存储器4100和处理器4200,其中,存储器4100用于存储可执行指令,所述可执行指令用于在所述电子设备4000运行时控制4200所述处理器执行如本实施例中的任意一项预读关键词集合获取方法,包括:

根据所获取的连续网页列表,统计对应的连续网页的数目,其中,所述连续网页列表用于记录用户已访问的、不适用已有的预读关键词集合进行预读的连续网页;

当所述连续网页的数目大于预设阈值时,获取与所述连续网页对应的目标预读关键词集合,添加到本地以供预读网页使用。

在本实施例中,电子设备4000可以是例如手机、平板电脑、掌上电脑、笔记本电脑等电子设备,在一个例子中,电子设备4000,可以如图1所示的电子设备1000。

以上已经结合附图和例子说明了本发明的实施例,在本发明的实施例中,提供一种预读关键词集合的获取方法、网页访问设备及电子设备,通过统计不适用已有预读关键词集合进行网页预读的连续网页的数目,在连续网页的数目大于连续阈值时,获取与连续网页对应的目标预读关键词集合,使得可以针对不同的网页访问场景,获取适用的预读关键词集合,实现自适应地动态加载预读关键词集合,避免预读关键词集合不适用网页访问场景而使得网页预读失效,确保网页预读的有效性,提升网页预读效率。

本领域技术人员公知的是,随着诸如大规模集成电路技术的电子信息技术的发展和软件硬件化的趋势,要明确划分计算机系统软、硬件界限已经显得比较困难了。因为,任何操作可以软件来实现,也可以由硬件来实现。任何指令的执行可以由硬件完成,同样也可以由软件来完成。对于某一机器功能采用硬件实现方案还是软件实现方案,取决于价格、速度、可靠性、存储容量、变更周期等非技术性因素。因此,对于电子信息技术领域的普通技术人员来说,更为直接和清楚地描述一个技术方案的方式是描述该方案中的各个操作。在知道所要执行的操作的情况下,本领域技术人员可以基于对所述非技术性因素的考虑直接设计出期望的产品。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1