显示网页信息的方法及装置与流程

文档序号:11155273阅读:来源:国知局

技术特征:

1.一种显示网页信息的方法,其特征在于,应用于用户终端,所述方法包括:

获取当前网页的原始页面内容;

从所述原始页面内容中提取满足用户需求的目标信息;

将所述目标信息展示在当前终端显示界面。

2.根据权利要求1所述的方法,其特征在于,所述从所述原始页面内容中提取目标信息,包括:

解析所述当前网页的页面信息,确定所述当前网页的页面类型,其中,所述页面信息包括以下至少一项:页面内容、统一资源定位符URL、标签信息;

根据所述当前网页的页面类型,按照预设策略从所述原始页面内容中提取目标信息。

3.根据权利要求2所述的方法,其特征在于,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

根据所述当前网页的页面信息,采用预设网页分类模型对所述当前网页进行分类,确定所述当前网页的页面类型,其中,所述预设网页分类模型包括以下至少一种:

软件下载网页分类模型;

多图片网页分类模型;

知识科普型网页分类模型。

4.根据权利要求2所述的方法,其特征在于,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

检测所述原始页面内容中是否包括软件名称和软件下载链接;

当所述原始页面内容中包括软件名称和软件下载链接时,确定所述当前网页为软件下载网页。

5.根据权利要求2所述的方法,其特征在于,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

统计所述原始页面内容中包含的图片链接地址的数量;

当所述图片链接地址的数量大于预设阈值时,确定所述当前网页为多图片网页。

6.根据权利要求2所述的方法,其特征在于,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

对所述原始网页内容进行分词并提取关键词;

根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页。

7.根据权利要求2所述的方法,其特征在于,所述方法还包括:

基于所述当前网页的网页类型,提供至少一个用于下载所述目标信息包含内容的用户操作入口。

8.一种显示网页信息的装置,其特征在于,设置于用户终端中,所述装置包括:

网页获取模块,被配置为获取当前网页的原始页面内容;

信息提取模块,被配置为从所述原始页面内容中提取满足用户需求的目标信息;

显示模块,被配置为将所述目标信息展示在当前终端显示界面。

9.根据权利要求8所述的装置,其特征在于,所述信息提取模块包括:

页面类型确定子模块,被配置为解析所述当前网页的页面信息,确定所述当前网页的页面类型,其中,所述页面信息包括以下至少一项:页面内容、统一资源定位符URL、标签信息;

信息提取子模块,被配置为根据所述当前网页的页面类型,按照预设策略从所述原始页面内容中提取目标信息。

10.根据权利要求9所述的装置,其特征在于,所述页面类型确定子模块包括:

模型分类模块,被配置为根据所述当前网页的页面信息,采用预设网页分类模型对所述当前网页进行分类,确定所述当前网页的页面类型,其中,所述预设网页分类模型包括以下至少一种:

软件下载网页分类模型;

多图片网页分类模型;

知识科普型网页分类模型。

11.根据权利要求9所述的装置,其特征在于,所述页面类型确定子模块包括:

检测模块,被配置为检测所述原始页面内容中是否包括软件名称和软件下载链接;

第一页面确定模块,被配置为在所述原始页面内容中包括软件名称和软件下载链接的情况下,确定所述当前网页为软件下载网页。

12.根据权利要求9所述的装置,其特征在于,所述页面类型确定子模块包括:

统计模块,被配置为统计所述原始页面内容中包含的图片链接地址的数量;

第二页面确定模块,被配置为在所述图片链接地址的数量大于预设阈值的情况下,确定所述当前网页为多图片网页。

13.根据权利要求9所述的装置,其特征在于,所述页面类型确定子模块包括:

关键词提取模块,被配置为对所述原始网页内容进行分词并提取关键词;

第三页面确定模块,被配置为根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页。

14.根据权利要求9所述的装置,其特征在于,所述装置还包括:

操作入口提供模块,被配置为基于所述当前网页的网页类型,提供至少一个用于下载所述目标信息包含内容的用户操作入口。

15.一种显示网页信息的装置,其特征在于,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

获取当前网页的原始页面内容;

从所述原始页面内容中提取满足用户需求的目标信息;

将所述目标信息展示在当前终端显示界面。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1