网页生成方法和装置的制造方法

文档序号:9375780阅读:336来源:国知局
网页生成方法和装置的制造方法
【技术领域】
[0001]本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及网页生成方法和和装置。
【背景技术】
[0002]信息推送,又称为“网络广播”,是通过一定的技术标准或协议,在互联网上通过推送用户需要的信息来减少信息过载的一项技术。信息推送技术通过主动推送信息给用户,可以减少用户在网络上搜索所花的时间。
[0003]然而,现有的信息推送方式通常是在网页上直接加载各种推送信息,这些推送信息与所在网页的内容有明显的差异,从而,存在着网页内容相关数据利用不足,信息推送缺乏针对性的问题。

【发明内容】

[0004]本申请的目的在于提出一种改进的网页生成方法和装置,来解决以上【背景技术】部分提到的技术问题。
[0005]第一方面,本申请提供了一种网页生成方法,所述方法包括:接收用户的网页浏览请求,其中,所述网页浏览请求包括网址;对所述网址所对应的网页页面进行内容解析,提取关键词集合;基于所述关键词集合与各条候选推送信息之间的匹配关系,选取至少一条候选推送信息生成推送信息集合;基于所述网页页面的内容和所述推送信息集合,生成新网页。
[0006]在一些实施例中,所述对所述网址所对应的网页页面进行内容解析提取关键词集合,包括:对所述网址所对应的网页页面的内容进行统计分析和/或语义分析,提取至少一个关键词;基于所述至少一个关键词,生成关键词集合。
[0007]在一些实施例中,所述基于所述至少一个关键词,生成关键词集合,包括:对于所述至少一个关键词中的单个关键词,进行扩展以生成扩展关键词,其中,所述扩展关键词包括所述单个关键词和以下中的至少一项:所述单个关键词的同义词、所述单个关键词的近义词、所述单个关键词的关联词;基于所述扩展关键词,生成关键词集合。
[0008]在一些实施例中,所述基于所述关键词集合与各条候选推送信息之间的匹配关系,选取至少一条候选推送信息生成推送信息集合,包括:对各条候选推送信息进行内容解析,分别提取候选推送信息关键词集合;将所述关键词集合分别与各个候选推送信息关键词集合进行相似度计算;基于相似度计算的结果,选取至少一条候选推送信息生成推送信白隹A
心、口 O
[0009]在一些实施例中,所述基于相似度计算的结果,选取至少一条候选推送信息生成推送信息集合,包括:基于相似度计算的结果以及预设的推送信息的量值,选取所述量值个数的候选推送信息生成推送信息集合。
[0010]在一些实施例中,所述基于所述网页页面的内容和所述推送信息集合,生成新网页,包括:以所述推送信息集合中的推送信息与所述网页页面的内容中的相应关键词相关联的方式,生成新网页。
[0011]在一些实施例中,所述基于所述网页页面的内容和所述推送信息集合,生成新网页,包括:以所述推送信息集合中的推送信息与所述网页页面的内容分开设置的方式,生成新网页。
[0012]第二方面,本申请提供了一种网页生成装置,所述装置包括:接收单元,配置用于接收用户的网页浏览请求,其中,所述网页浏览请求包括网址;解析单元,配置用于对所述网址所对应的网页页面进行内容解析,提取关键词集合;信息选取单元,配置用于基于所述关键词集合与各条候选推送信息之间的匹配关系,选取至少一条候选推送信息生成推送信息集合;生成单元,配置用于基于所述网页页面的内容和所述推送信息集合,生成新网页。
[0013]在一些实施例中,所述解析单元包括:分析模块,配置用于对所述网址所对应的网页页面的内容进行统计分析和/或语义分析,提取至少一个关键词;生成模块,配置用于基于所述至少一个关键词,生成关键词集合。
[0014]在一些实施例中,所述生成模块进一步配置用于:对于所述至少一个关键词中的单个关键词,进行扩展以生成扩展关键词,其中,所述扩展关键词包括所述单个关键词和以下中的至少一项:所述单个关键词的同义词、所述单个关键词的近义词、所述单个关键词的关联词;基于所述扩展关键词,生成关键词集合。
[0015]在一些实施例中,所述信息选取单元包括:解析模块,配置用于对各条候选推送信息进行内容解析,分别提取候选推送信息关键词集合;相似度计算模块,配置用于将所述关键词集合分别与各个候选推送信息关键词集合进行相似度计算;选取模块,配置用于基于相似度计算的结果,选取至少一条候选推送信息生成推送信息集合。
[0016]在一些实施例中,所述选取模块进一步配置用于:基于相似度计算的结果以及预设的推送信息的量值,选取所述量值个数的候选推送信息生成推送信息集合。
[0017]在一些实施例中,所述生成单元进一步配置用于:以所述推送信息集合中的推送信息与所述网页页面的内容中的相应关键词相关联的方式,生成新网页。
[0018]在一些实施例中,所述生成单元进一步配置用于:以所述推送信息集合中的推送信息与所述网页页面的内容分开设置的方式,生成新网页。
[0019]本申请提供的网页生成方法和装置,通过对用户请求的网址所对应的网页页面进行内容解析以便提取关键词集合,而后基于关键词集合与各条候选推送信息之间的匹配关系来选取推送信息,最后基于网页页面的内容和推送信息来生成新网页,从而有效利用了网页的内容数据,实现了富于针对性的信息推送。
【附图说明】
[0020]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0021]图1是本申请可以应用于其中的示例性系统架构图;
[0022]图2是根据本申请的网页生成方法的一个实施例的流程图;
[0023]图3是根据本申请的网页生成方法的一个应用场景的示意图;
[0024]图4是根据本申请的网页生成方法的又一个实施例的流程图;
[0025]图5是根据本申请的网页生成装置的一个实施例的结构示意图;
[0026]图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
【具体实施方式】
[0027]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0028]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0029]图1示出了可以应用本申请的网页生成方法或网页生成装置的实施例的示例性系统架构100。
[0030]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0031]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0032]终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Aud1 Layer III,动态影像专家压缩标准音频层面3)、MP4 (Moving PictureExperts Group Aud1 Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1