一种网页页面的预读取方法、装置及智能终端设备的制造方法_4

文档序号:9826311阅读:来源:国知局
的可靠性。
[0104] 生成预读取列表就是以推荐概率的大小进行排序的方式将包含源网页信息和目 标网页信息的多条点击路径汇聚成列表,即多条点击路径以推荐概率的大小在列表中进行 有序排列。当然,也可以采用无序排列,或者以其他方式排列;但采用无序排列时,会影响预 读取网页的速度。所以,优选采用按推荐概率的大小进行有序排列,但也可以采用有利于快 速预读取网页的其他排序方式。
[0105] 在另一个优选实施例中,如果统计出的点击路径数目非常多,可以先筛选掉推荐 概率低的点击路径,以减少数据的运算量,还可以避免将用户不会浏览的网页数据预读取 并载入本地缓存,从而节省缓存空间资源的占用。可以根据经验值来预设推荐概率阈值,筛 选掉推荐概率低于推荐概率阈值的点击路径。为了减少数据的运算量,可以在生成所述预 读取列表之前或过程中,先筛选掉推荐概率低于推荐概率阈值的点击路径。当选择的时间 段的时长不一样,用户的数目不一样,推荐概率阈值可以相应地设定不同的值。
[0106] 步骤S205 :从预读取列表中查询当前浏览的网页页面的点击路径,从而预读取相 应待浏览的目标网页数据。
[0107] 当用户浏览当前网页时,从预读取列表中查询以当前网页作为源网页的点击路 径,可以选择最大推荐概率的点击路径来预读取相应待浏览的目标网页;当然为了保证预 读取相应待浏览的目标网页的准确率,还可以按推荐概率的降序方式预读取多个相应待浏 览的目标网页,例如预读取2个、3个、4个或更多目标网页,并且可以将其网页数据载入本 地缓存。
[0108] 如果用户不请求新的网页而直接停止浏览网页,如关闭浏览器,则释放预读取的 网页数据,避免没有使用的预读取的网页数据占用大量的本地缓存资源。
[0109] 本发明实施例提供的网页页面预读取方法,其有益效果是:通过不同用户的相似 度来获得最相似用户,利用最相似用户计算点击路径的推荐概率并且生成预读取列表,根 据预读取列表查询该最相似用户从当前网页将要点击浏览的目标网页,由此提前给用户预 读取出网页数据,该预读取的命中概率和覆盖率大大提高,进而保证了预读取的高准确性 和高有效性,在预读取高概率的网页数据并保存到本地缓存后,提高了用户打开网页页面 的速度,提升了用户体验。
[0110] 综上所述,本发明在结合图2描述的另一种网页页面的预读取方法中提供了多个 实施例,通过将各种实施例或优选实施例进行任意组合,可以保证预读取的高准确性和高 有效性,提升用户体验。
[0111] 在以上提及的各个阈值都可以基于经验值而设定,其中当选择的时间段的时长不 一样,用户的数目不一样,各个阈值可以相应地设定不同的值。
[0112] 图3是本发明的网页页面预读取装置的结构示意图。如图3所示,本发明的网页 页面预读取装置包括:获取模块301、确定模块302、分析模块303、和第一预读取模块304, 其中:
[0113] 所述获取模块301用于获取多个用户中的每一个用户在一个时间段内对多个网 页页面的访问信息;
[0114] 所述确定模块302用于确定该多个用户中两两用户之间的相似度以及按相似度 的大小确定1个或多个最相似用户;
[0115] 所述分析模块303用于在用户浏览当前网页的过程中,按一定的预测策略分析出 所述最相似用户从当前网页将要点击浏览的目标网页;
[0116] 所述第一预读取模块304用于预读取出所分析出的目标网页。
[0117] 所述网页页面预读取装置实施例中各个模块的具体功能和交互方式可参见图1 对应实施例的记载,在此不再赘述。
[0118] 进一步的,所述获取模块301包括预处理模块,用于对网页数据进行数据清洗。
[0119] 进一步的,所述确定模块302包括相似度计算模块,用于通过计算余弦相似度来 确定相似度。
[0120] 进一步的,所述确定模块302包括筛选模块,用于先筛选掉访问不同网页的页面 数低于页面数访问阈值的用户。
[0121] 进一步的,所述确定模块302包括倒排表建立模块,用于以多个用户访问的相同 网页作为共同特征,建立倒排表。
[0122] 进一步的,所述确定模块302包括最相似用户确定模块,用于通过筛选掉相似度 低于相似度阈值的相似用户来确定1个或多个最相似用户。
[0123] 本发明实施例提供的网页页面预读取装置,其有益效果是:通过不同用户的相似 度来获得最相似用户,利用预测策略分析该最相似用户从当前网页将要点击浏览的目标网 页,由此提前给用户预读取出网页数据,该预读取的命中概率和覆盖率大大提高,进而保证 了预读取的高准确性和高有效性,在预读取高概率的网页数据并保存到本地缓存后,提高 了用户打开网页页面的速度,提升了用户体验。
[0124] 综上所述,本发明在结合图3描述的一种网页页面预读取装置中提供了多个实施 例,通过将各种实施例或优选实施例进行任意组合,可以保证预读取的高准确性和高有效 性,提升用户体验。
[0125] 图4是本发明的另一网页页面预读取装置的结构示意图。如图4所示,本发明的 网页页面预读取装置包括:获取模块401、确定模块402、计算和生成模块403、和第二预读 取模块404,其中:
[0126] 所述获取模块401用于获取多个用户中的每一个用户在一个时间段内对多个网 页页面的访问信息;
[0127] 所述确定模块402用于确定该多个用户中两两用户之间的相似度以及按相似度 的大小确定1个或多个最相似用户;
[0128] 所述计算和生成模块403用于利用最相似用户计算点击路径的推荐概率并且生 成预读取列表;
[0129] 所述第二预读取模块404用于从预读取列表中查询当前浏览的网页页面的点击 路径,从而预读取相应待浏览的目标网页数据。
[0130] 所述网页页面预读取装置实施例中各个模块的具体功能和交互方式可参见图2 对应实施例的记载,在此不再赘述。
[0131] 进一步的,所述获取模块401包括预处理模块,用于对网页数据进行数据清洗。
[0132] 进一步的,所述确定模块402包括相似度计算模块,用于通过计算余弦相似度来 确定相似度。
[0133] 进一步的,所述确定模块402包括筛选模块,用于先筛选掉访问不同网页的页面 数低于页面数访问阈值的用户。
[0134] 进一步的,所述确定模块402包括倒排表建立模块,用于以多个用户访问的相同 网页作为共同特征,建立倒排表。
[0135] 进一步的,所述确定模块402包括最相似用户确定模块,用于通过筛选掉相似度 低于相似度阈值的相似用户来确定1个或多个最相似用户。
[0136] 进一步的,所述计算和生成模块403包括推荐概率计算模块,用于计算每条点击 路径的推荐概率。
[0137] 进一步的,所述计算和生成模块403包括生成模块,用于生成预读取列表。
[0138] 本发明实施例提供的网页页面预读取装置,其有益效果是:通过不同用户的相似 度来获得最相似用户,利用最相似用户计算点击路径的推荐概率并且生成预读取列表,根 据预读取列表查询该最相似用户从当前网页将要点击浏览的目标网页,由此提前给用户预 读取出网页数据,该预读取的命中概率和覆盖率大大提高,进而保证了预读取的高准确性 和高有效性,在预读取高概率的网页数据并保存到本地缓存后,提高了用户打开网页页面 的速度,提升了用户体验。
[0139] 综上所述,本发明在结合图4描述的另一种网页页面预读取装置中提供了多个实 施例,通过将各种实施例或优选实施例进行任意组合,可以保证预读取的高准确性和高有 效性,提升用户体验。
[0140] 另外,在以上提及的各个阈值都可以基于经验值而设定,其中当选择的时间段的 时长不一样,用户的数目不一样,各个阈值可以相应地设定不同的值。
[0141] 另外,本发明还提供了一种智能终端设备,包括如上所述的网页页面预读取装置。
[0142] 本发明实施例所提供的网页页面预读取方法的计算机程序产品,包括存储了程序 代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述 的方法,具体实现可参见方法实施例,在此不再赘述。
[0143] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置 的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0144] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以 存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说 对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计 算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个 人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。 而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取 存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0145] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1. 一种网页页
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1