显示网页信息的方法及装置与流程

文档序号:11155273阅读:391来源:国知局
显示网页信息的方法及装置与制造工艺

本公开涉及计算机通信技术领域,尤其涉及一种显示网页信息的方法及装置。



背景技术:

随着互联网技术的飞速发展,从网络中获取需要的资源已经成为人们获取资讯的重要组成部分。然而,由于网页中经常包含很多广告信息和虚假信息,导致用户在寻找目标信息的过程中需要投入过多的时间和精力,导致用户浏览网页的体验差。

以用户从软件下载网页下载一款应用软件为例,相关技术中,软件下载页面中经常设置很多弹窗广告,或者将推广软件地址伪装成目标软件的下载链接地址,诱导用户点击,而将真正的软件下载地址放在不显眼角落,导致用户需要花费大量的时间和精力才能找到真正的软件链接,用户体验差。



技术实现要素:

有鉴于此,本公开提供一种显示网页信息的方法及装置,可以快捷地获取有效信息内容。

根据本公开实施例的第一方面,提供了一种显示网页信息的方法,应用于用户终端,所述方法包括:

获取当前网页的原始页面内容;

从所述原始页面内容中提取满足用户需求的目标信息;

将所述目标信息展示在当前终端显示界面。

可选地,所述从所述原始页面内容中提取目标信息,包括:

解析所述当前网页的页面信息,确定所述当前网页的页面类型,其中,所述页面信息包括以下至少一项:页面内容、统一资源定位符URL、标签信息;

根据所述当前网页的页面类型,按照预设策略从所述原始页面内容中提取目标信息。

可选地,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

根据所述当前网页的页面信息,采用预设网页分类模型对所述当前网页进行分类,确定所述当前网页的页面类型,其中,所述预设网页分类模型包括以下至少一种:

软件下载网页分类模型;

多图片网页分类模型;

知识科普型网页分类模型。

可选地,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

判断所述原始页面内容中是否包括软件名称和软件下载链接;

当所述原始页面内容中包括软件名称和软件下载链接时,确定所述当前网页为软件下载网页。

可选地,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

统计所述原始页面内容中包含的图片链接地址的数量;

当所述图片链接地址的数量大于预设阈值时,确定所述当前网页为多图片网页。

可选地,所述解析所述当前网页的页面信息,确定所述当前网页的页面类型,包括:

对所述原始网页内容进行分词并提取关键词;

根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页。

可选地,所述显示网页信息的方法还包括:

基于所述当前网页的网页类型,提供至少一个用于下载所述目标信息包含内容的用户操作入口。

根据本公开实施例的第二方面,提供了一种显示网页信息的装置,设置于用户终端中,所述装置包括:

网页获取模块,被配置为获取当前网页的原始页面内容;

信息提取模块,被配置为从所述原始页面内容中提取满足用户需求的目标信息;

显示模块,被配置为将所述目标信息展示在当前终端显示界面。

可选的,所述信息提取模块包括:

页面类型确定子模块,被配置为解析所述当前网页的页面信息,确定所述当前网页的页面类型,其中,所述页面信息包括以下至少一项:页面内容、统一资源定位符URL、标签信息;

信息提取子模块,被配置为根据所述当前网页的页面类型,按照预设策略从所述原始页面内容中提取目标信息。

可选的,所述页面类型确定子模块包括:

模型分类模块,被配置为根据所述当前网页的页面信息,采用预设网页分类模型对所述当前网页进行分类,确定所述当前网页的页面类型,其中,所述预设网页分类模型包括以下至少一种:

软件下载网页分类模型;

多图片网页分类模型;

知识科普型网页分类模型。

可选的,所述页面类型确定子模块包括:

检测模块,被配置为检测所述原始页面内容中是否包括软件名称和软件下载链接;

第一页面确定模块,被配置为在所述原始页面内容中包括软件名称和软件下载链接的情况下,确定所述当前网页为软件下载网页。

可选的,所述页面类型确定子模块包括:

统计模块,被配置为统计所述原始页面内容中包含的图片链接地址的数量;

第二页面确定模块,被配置为在所述图片链接地址的数量大于预设阈值的情况下,确定所述当前网页为多图片网页。

可选的,所述页面类型确定子模块包括:

关键词提取模块,被配置为对所述原始网页内容进行分词并提取关键词;

第三页面确定模块,被配置为根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页。

可选的,所述显示网页信息的装置还包括:

操作入口提供模块,被配置为基于所述当前网页的网页类型,提供至少一个用于下载所述目标信息包含内容的用户操作入口。

根据本公开实施例的第三方面,提供了一种显示网页信息的装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

获取当前网页的原始页面内容;

从所述原始页面内容中提取满足用户需求的目标信息;

将所述目标信息展示在当前终端显示界面。

本公开的实施例提供的技术方案可以包括以下有益效果:

本公开中,当用户终端获取用户点击的当前网页的原始网页内容后,首先对原始网页内容进行处理,去除原始网页内容中包含的干扰信息,获取满足用户需求的目标信息,之后在终端的显示界面中如网络浏览器的应用界面中显示目标信息,方便用户直接获取有效信息内容,提升终端的用户体验。

本公开中,用户终端在从当前网页的原始页面内容中获取目标信息时,可以首先根据当前网页的页面信息,综合从页面内容、URL、标签信息等至少一项的网页信息中提取特征信息,然后根据上述特征信息准确判定当前网页的网页类型,进而可以根据网页类型按照预设策略提取目标信息,提高了信息提取效率和准确率。

本公开中,用户终端可以根据当前网页的页面信息,采用已训练还好的预设网页分类模型确定当前网页的页面类型,提高网页分类的准确率和分类效率。

本公开中,用户终端在判断当前网页是否属于软件下载网页时,可以通过分析上述原始页面内容中是否既包括软件名称又包括软件下载链接,若是,可以确定当前网页属于软件下载网页,简单快速地确定软件下载网页,提高网页分类效率。

本公开中,用户终端在判断当前网页是否属于多图片网页时,可以通过分析上述原始页面内容中包括图片链接地址的数量是否大于预设阈值,若是,可以确定当前网页属于多图片网页,简单快速地判断当前网页是否属于多图片网页,提高网页分类效率。

本公开中,用户终端在判断当前网页是否属于知识科普型网页时,可以采用对所述原始网页内容进行分词并提取关键词;然后根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页,简单快速地判断当前网页是否属于知识科普型网页,提高网页分类效率。

本公开中,用户终端在获取目标信息之后,在当前终端显示界面中显示目标信息的同时,还会在显示界面的预设位置设置供用户下载目标信息的用户操作入口,方便用户获取目标资源,简化用户操作,提高用户下载目标资源的速率,节约用户时间,提升终端的用户体验。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是本公开根据一示例性实施例示出的一种显示网页信息的方法流程图;

图2是本公开根据一示例性实施例示出的另一种显示网页信息的方法流程图;

图3-1是本公开根据一示例性实施例示出的另一种显示网页信息的方法流程图;

图3-2是本公开根据一示例性实施例示出的另一种显示网页信息的方法流程图;

图3-3是本公开根据一示例性实施例示出的另一种显示网页信息的方法流程图;

图4是本公开根据一示例性实施例示出的另一种显示网页信息的方法流程图;

图5是本公开根据一示例性实施例示出的另一种显示网页信息的方法流程图;

图5-1是本公开根据一示例性实施例示出的一种显示网页信息的应用场景示意图;

图5-2是本公开根据一示例性实施例示出的另一种显示网页信息的应用场景示意图;

图5-3是本公开根据一示例性实施例示出的另一种显示网页信息的应用场景示意图;

图5-4是本公开根据一示例性实施例示出的另一种显示网页信息的应用场景示意图;

图6是本公开根据一示例性实施例示出的一种显示网页信息的装置框图;

图7是本公开根据一示例性实施例示出的另一种显示网页信息的装置框图;

图8是本公开根据一示例性实施例示出的另一种显示网页信息的装置框图;

图9是本公开根据一示例性实施例示出的另一种显示网页信息的装置框图;

图10是本公开根据一示例性实施例示出的另一种显示网页信息的装置框图;

图11是本公开根据一示例性实施例示出的另一种显示网页信息的装置框图;

图12是本公开根据一示例性实施例示出的另一种显示网页信息的装置框图;

图13是本公开根据一示例性实施例示出的一种用于显示网页信息的装置的一结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

参照图1根据本公开一示例性实施例示出的一种显示页面信息的方法流程图,该方法可以应用在用户终端上,其中,用户终端可以是任何具有上网功能的智能终端,例如,可以具体为智能手机、PDA(Personal Digital Assistant,个人数字助理)、平板电脑、可穿戴设备等电子设备,上述方法可以包括以下步骤:

在步骤11中,获取当前网页的原始页面内容;

当用户使用用户终端在网页浏览器的地址输入栏中输入预设网址或者通过搜索引擎查找到需要的网页时,用户终端获取所述网页的原始页面内容。

相关技术中,用户查找的当前网页的原始页面内容中,往往不仅包括用户需要的有效信息,还包括一些干扰信息,比如繁多的弹窗广告。以上述当前网页为软件下载网页为例,上述干扰信息还可能包括广告推广软件等信息,上述广告推广软件的下载链接经常被伪装成目标软件的下载链接,诱导用户误点。

在步骤12中,从所述原始页面内容中提取满足用户需求的目标信息;

本公开实施例中,用户终端在获取到一个网页的原始页面内容之后,并不立即通过网页浏览器显示上述原始网页信息,而是首先过滤掉原始页面内容中的干扰信息,获取满足用户需求的有效信息。

参照图2根据本公开一示例性实施例示出的另一种显示页面信息的方法流程图,上述步骤12可以包括:

在步骤121中,解析所述当前网页的页面信息,确定所述当前网页的页面类型;

本公开实施例中,首先确定当前网页的类型,然后再根据不同的网页类型提取其中的有效信息。

在网页分类时,除了利用网页的内容特征之外,可能用到URL的特征、HTML的结构特征、网站特征和标签特征等信息,以提高网页分类的准确率。

因此,上述当前网页的页面信息包括以下至少一项:页面内容、统一资源定位符信息、标签信息;

其中,页面内容除了包括正文,还可以包括下载链接,用户终端可以根据正文中的关键词以及下载链接确定网页类型。其中,所谓下载链接,是指在网页中出现的可以供给资源目标项,通过下载链接,可以下载用户需要的资源,比如软件、图片、文件等。

一个网页对应一个网址,即统一资源定位符(Uniform Resource Locator,URL)。URL地址格式排列为:scheme://host:port/path,例如http://www.sohu.com/domain/HXWZ就是一个典型的URL地址。其中,scheme代表Internet资源类型,用于指出WWW客户程序用来操作的工具,例如,“http://”表示WWW服务器;“ftp://”表示FTP服务器;“gopher://”表示Gopher服务器。Host代表服务器地址,用于指出WWW页所在的服务器域名。Port代表端口,对某些资源的访问来说,需给出相应的服务器提供端口号。Path代表路径,用于指明服务器上某资源的位置,通常由目录/子目录/文件名组成。在URL地址中,路径与端口并非总是需要的。当URL地址包含路径时,可以根据其中的文件名确定网页类型。

网页信息中还可以包括:网络标签Tag,网络标签Tag是一种相关性很强的关键字,它可以轻松地描述分类内容,以便于检索。

因此,用户在对当前网页进行分类时,可以综合上述网页信息中包含的各种特征项,提高网页分类的准确率。

在本公开一实施例中,用户终端的可以采用预设网页分类模型对当前网页进行的分类,确定所述当前网页的页面类型。

根据相关知识,网页分类的基本步骤可以包括:定义分类体系,将预先分类过的网页作为训练集,从训练集中得出分类模型,然后用训练获得的分类模型对其它网页进行分类。

本公开实施例中,可以预先定义三种网页类型,分别为:软件下载网页、多图片网页、知识科普型网页。对应的,上述预设网页分类模型包括:软件下载网页分类模型、多图片网页分类模型、知识科普型网页分类模型。

具体的,采用预设网页分类模型对当前网页进行分类可以包括:模型训练阶段和匹配阶段。

模型训练阶段的目的在于获取网页分类模型,过程如下:获取一定数量的预设种类的网页样本,比如软件下载网页,作为训练样本集。根据每一个网页样本的网页信息提取网页样本特征,采用一种机器学习算法对上述网页样本特征进行训练,训练出该类型网页适用的一种网页分类模型,比如软件下载网页分类模型。

在匹配阶段,首先基于当前网页的网页信息提取当前网页的网页特征,然后,将提取出的网页特征作为所述网页分类模型的输入,进行相关性计算,若相关性大于预设阈值,可以确定当前网页属于对应类型的网页。本公开实施例中的使用的网页分类模型可以但不限于支持向量机(Support Vector Machine,SVM)模型。

在一种情况下,假设当前网页同时与上述三种网页分类模型中的至少两种匹配成功,则可以将该当前网页确定为复合型网页。

在本公开另一实施例中,也可以采用相对简单的分析方法确定当前网页的网页类型。根据网页类型的不同,上述步骤121可以包括以下几种情况:

第一种情况,主要用于对软件下载型网页的判断,参照图3-1根据本公开一示例性实施例示出的另一种显示页面信息的方法流程图,上述步骤121可以包括:

在步骤121-11中,检测所述原始页面内容中是否包括软件名称和软件下载链接地址;

本公开实施例中,可以从页面内容的标题以及正文中提取关键词,检测上述关键词中是否包括软件名称,比如“迅雷”,同时检测页面内容中是否包括下载链接。

在步骤121-12中,当所述原始页面内容中包括软件名称和软件下载链接时,确定所述当前网页为软件下载网页。

若所述当前网页的原始页面内容中既包括软件名称又包括软件下载链接,则可以确定当前网页属于软件下载网页。否则,确定当前网页不属于软件下载网页,可以继续采用其他方法判断当前网页是否属于其他预设类型网页,比如多图片网页或者知识科普型网页。

第二种情况,主要用于多图网页的判断,参照图3-2根据本公开一示例性实施例示出的另一种显示页面信息的方法流程图,上述步骤121可以包括:

在步骤121-21中,统计所述原始页面内容中包含的图片链接地址的数量;

如果当前网页属于多图片网页,则在页面内容的图片链接地址中会包括有图片格式信息,比如gif、jpg,根据上述图片格式信息可以统计的图片链接地址的数量N。

在步骤121-22中,当所述图片链接地址的数量大于预设阈值时,确定所述当前网页为多图片网页。

上述预设阈值可以是预先设定的一个经验值,比如2,当N大于等于2时,则判定当前网页属于多图片网页,否则,判定所述当前网页不属于多图片网页。接下来,可以采用预设分类方法继续判断当前网页是否属于其它类型的网页。

第三种情况,主要用于知识科普型网页的判断,参照图3-3根据本公开一示例性实施例示出的另一种显示页面信息的方法流程图,上述步骤121可以包括:

在步骤121-31中,对所述原始网页内容进行分词并提取关键词;

在步骤121-32中,根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页。

本公开实施例中,可以对原始网页内容进行分词,并采用预设文档分类方法,比如TF-IDF(term frequency-inverse document frequency,词频-逆向文件频率)方法提取当前网页中的关键词并计算各个关键词与当前网页的相关性,当表示关键词与当前网页相关性的数值大于预设阈值时,则确定所述当前网页属于知识科普型网页。

其中,TF-IDF的主要思想是:如果某个词或短语在一个网页中出现的频率高,并且在其他网页中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。当一个网页中出现的关键词的数量相对于整个网页的分词数量的比值,超过预设阈值时,则可以确定该网页属于知识科普型网页。

在步骤122中,根据所述当前网页的页面类型,按照预设策略从所述原始页面内容中提取目标信息。

参照图4根据一示例性实施例示出的另一种显示网页信息的方法流程图,在确定所述当前网页类型为软件下载网页时,上述步骤122可以包括:

在步骤122-1中,将所述当前网页的网址匹配预设网址白名单,确定当前网页是否属于安全软件下载网页,其中,所述预设网址白名单记录了预设数量的、安全的、软件下载网站的网址信息;

根据上述URL的结构分析,可以根据当前网址中包括服务器地址即“host”字段匹配预设网址白名单。如果所述预设网址白名中包括当前网页网址中的host字段,则确定当前网页的信息来自安全的服务器,即确定该网页属于安全软件下载网页。

在步骤122-2中,当所述当前网页属于安全软件下载网页时,从所述原始网页内容中提取软件名称;

以http://dl.pconline.com.cn/download/85058.html对应的网页内容为例,该软件下载网页中包括很多软件的名称,比如“暴风影音”“金山词霸”“驱动精灵”等软件名称,还包括很多推广软件的名称。

在步骤122-3中,查询预设软件白名单中是否包括所述软件名称,所述预设软件白名单记录了常用软件的软件名称;

本公开实施例中,可以在用户终端中预设一个软件白名单,该软件白名单中包括一些常用软件的名称。用户终端在获取当前网页中包括的软件名称之后,可以基于每个软件名称,遍历查询所述预设软件白名单,判断该软件白名单中是否包含当前网页中的软件名称,如果有则保留,如果没有则滤除。通过此方法,可以过滤掉一些推广软件广告,保留目标软件的信息。

在步骤122-4中,如果所述预设软件白名单中包括所述软件名称,同时所述原始网页内容中包括所述软件的下载链接地址,则将所述软件名称和对应的软件下载链接地址确定为目标软件下载信息。

由于软件下载网页的网页内容中不仅包括软件名称还包括软件下载链接,一般情况下,用户需要下载的软件是网页标题指示的软件,因此可以根据标题中的软件名称与网页中的软件下载链接进行的相关性判断,将与标题中软件名称具有相关性的下载链接确定为目标软件链接。进而,目标软件名称和对应的下载链接作为目标软件下载信息。

对于多图片网页或知识科普型网页可以按照相关技术去除网页中的广告信息,获取满足用户需求的有效信息即目标信息。

在步骤13中,将所述目标信息展示在当前终端显示界面。

用户终端在进行网页内容的有效信息提取之后,将获得的目标信息展示在当前终端的显示界面中,如网络浏览器应用的显示界面中。相对于上述原始网页内容的页面显示,本公开实施例对目标信息的显示方式可以包括以下至少一种:

方式一、将上述目标信息在终端显示界面的醒目位置进行显示。比如,当上述目标信息为应用软件的虚拟下载按钮时,可以将上述虚拟按钮显示在显示界面的中间位置、右上方位置等显眼位置,方便用户快速获取有效信息。

方式二、将上述目标信息在终端显示界面中进行标识显示。比如,当上述目标信息知识科普型信息时,可以将文本信息和/或图片信息在网页中以黄色高亮方式显示,方便用户快速识别有效信息。

方式三、利用上述目标消息替代上述原始网页内容在终端显示界面中显示,自动屏蔽原始网页中的广告信息、虚假信息等干扰信息,方便用户直接获取有效信息,提升终端的用户体验。

参照图5根据一示例性实施例示出的另一种显示网页信息的方法流程图,在上述任一实施例的基础上,所述方法还可以包括:

在步骤14中,基于所述当前网页的网页类型,提供至少一个用于下载所述目标信息包含内容的用户操作入口。

不同类型网页对应的目标信息所包含的内容也不同,比如包括软件下载、文本、图片等信息中的一种或几种。

本公开可以根据目标信息包含内容的不同,提供至少一个用于下载目标消息内容的用户操作入口。比如,对于软件下载网页,上述目标消息的内容可能包含软件名称、简介、链接地址等信息,可以提供一个供用户下载目标软件的用户操作入口。对于包含图片的网页,上述目标消息中可能包括多幅图片,可以在终端显示界面中提供一个用于下载图片的虚拟按钮,进一步地,当用户触发此按钮时,用户终端还可以提供子界面,供用户自由选择当前显示界面中的一个、多个或者全部图片。如果上述目标消息中还包括文档信息,可以在终端显示界面中提供一个用于下载文本信息的用户操作入口。

上述用户操作入口可以是虚拟按钮等。上述用户操作入口可以显示在当前终端显示界面的预设位置,比如方便用户操作且容易发现的居中位置或右上角位置等。

下面结合不同的网页类型对应的应用场景示意图进行示例性说明:

当所述当前网页为软件下载网页时,显示目标软件下载信息,并在当前显示界面的预设位置设置用于下载所述目标软件的第一用户操作入口;参照图5-1根据一示例性实施例示出的一种显示网页信息的场景示意图,在用户终端100显示的整个网页的页面中,仅包括软件下载的有效信息,并在网页的中间位置设置下载按钮201,当用户点击该按钮后,可以下载该软件。

当所述当前网页为多图片网页时,显示所述多个图片,并在当前显示界面的预设位置设置用于下载所有图片的第二用户操作入口;参照图5-2根据一示例性实施例示出的另一种显示网页信息的场景示意图,用户终端100显示多幅图片PIG1、PIG2、PIG3、PIG4,并在网页的右上角设置有图片下载按钮202,当用户按照预设动作信息触发该按钮,比如点击该按钮后,用户终端响应上述触发操作,从一个或多个服务器开始下载上述四幅图片。

当所述当前网页为知识科普型网页时,显示网页主体内容信息,并在当前显示界面的预设位置设置用于下载所述主体内容的第三用户操作入口;参照图5-3根据一示例性实施例示出的另一种显示网页信息的场景示意图,在用户终端显示正文信息,且在当前显示页面的左上角设置有第三用户操作入口203,当用户触发该操作入口后,用户终端可以自动将当前网页的显示内容保存为预设格式的文档,比如PDF格式文档,存储在终端的预设指定位置或者用户指定的存储位置。当然,当用户触发第三用户操作入口后,还可以提供供用户选择存储文档格式的二级窗口,方便用户将当前显示的页面内容存储为多种文档格式中的一种,比如word文档、HTML文档、PDF格式文档或TXT等文档。

当所述当前网页属于复合型网页时,显示过滤干扰信息后的各部分目标信息,并在当前显示界面中设置各部分目标信息对应的用户操作入口,其中,所述复合型网页至少包括以下两部分内容:图片、文字、文件链接地址。参照图5-4根据一示例性实施例示出的另一种显示网页信息的场景示意图,当上述目标信息中包括文字、图片等信息时,可以在当前显示界面中设置用于下载全部图片的第二用户操作入口202,和用于下载当前全部目标信息的第三用户操作入口203,以便用户根据不同需要触发不同的用户操作入口。

综上,采用本公开实施例提供的显示网页信息的方法,当用户终端获取用户点击的当前网页的原始网页内容后,首先对原始网页内容进行处理,去除原始网页内容中包含的干扰信息,获取满足用户需求的目标信息,之后在终端的网络浏览器中显示目标信息并在显示界面中提供方便用户下载目标信息的用户操作入口,使用户通过简单触发所述用户操作入口即可方便下载目标资源,简化用户操作,提高了用户获取目标资源的效率,提升了终端的用户体验。

对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。

其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。

与前述应用功能实现方法实施例相对应,本公开还提供了应用功能实现装置及相应的终端的实施例。

参照图6根据一示例性实施例示出的一种显示网页信息的装置框图,该装置可以设置于用户终端中,所述装置可以包括:

网页获取模块21,被配置为获取当前网页的原始页面内容;

信息提取模块22,被配置为从所述原始页面内容中提取满足用户需求的目标信息;

显示模块23,被配置为将所述目标信息展示在当前终端显示界面。

参照图7根据一示例性实施例示出的另一种显示网页信息的装置框图,在图6所示实施例的基础上,信息提取模块22可以包括:

页面类型确定子模块221,被配置为解析所述当前网页的页面信息,确定所述当前网页的页面类型,其中,所述页面信息包括以下至少一项:页面内容、统一资源定位符URL、标签信息;

信息提取子模块222,被配置为根据所述当前网页的页面类型,按照预设策略从所述原始页面内容中提取目标信息。

参照图8根据一示例性实施例示出的另一种显示网页信息的装置框图,在图7所示实施例的基础上,所述页面类型确定子模块221可以包括:

模型分类模块221-11,被配置为根据所述当前网页的页面信息,采用预设网页分类模型对所述当前网页进行分类,确定所述当前网页的页面类型,其中,所述预设网页分类模型包括以下至少一种:

软件下载网页分类模型;

多图片网页分类模型;

知识科普型网页分类模型。

参照图9根据一示例性实施例示出的另一种显示网页信息的装置框图,在图7所示实施例的基础上,所述页面类型确定子模块221可以包括:

检测模块221-21,被配置为检测所述原始页面内容中是否包括软件名称和软件下载链接;

第一页面确定模块221-22,被配置为在所述原始页面内容中包括软件名称和软件下载链接的情况下,确定所述当前网页为软件下载网页。

参照图10根据一示例性实施例示出的另一种显示网页信息的装置框图,在图7所示实施例的基础上,所述页面类型确定子模块221可以包括:

统计模块221-31,被配置为统计所述原始页面内容中包含的图片链接地址的数量;

第二页面确定模块221-32,被配置为在所述图片链接地址的数量大于预设阈值的情况下,确定所述当前网页为多图片网页。

参照图11根据一示例性实施例示出的另一种显示网页信息的装置框图,在图7所示实施例的基础上,所述页面类型确定子模块221可以包括:

关键词提取模块221-41,被配置为对所述原始网页内容进行分词并提取关键词;

第三页面确定模块221-42,被配置为根据所述关键词,采用预设文档分析算法确定所述当前网页是否属于知识科普型网页。

参照图12根据一示例性实施例示出的另一种显示网页信息的装置框图,在图6所示实施例的基础上,所述装置还可以包括:

操作入口提供模块24,被配置为基于所述当前网页的网页类型,提供至少一个用于下载所述目标信息包含内容的用户操作入口。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中上述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

本公开还提供了一种显示网页信息的装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:

获取当前网页的原始页面内容;

从所述原始页面内容中提取满足用户需求的目标信息;

将所述目标信息展示在当前终端显示界面。

图13是根据一示例性实施例示出的一种显示网页信息的装置1300的结构示意图。例如,装置1300可以是终端,可以具体为移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理,可穿戴设备如智能手表、智能眼镜、智能手环、智能跑鞋等。

参照图13,装置1300可以包括以下一个或多个组件:处理组件1302,存储器1304,电源组件1306,多媒体组件1308,音频组件1310,输入/输出(I/O)的接口1312,传感器组件1314,以及通信组件1316。

处理组件1302通常控制装置1300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1302可以包括一个或多个处理器1320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1302可以包括一个或多个模块,便于处理组件1302和其他组件之间的交互。例如,处理组件1302可以包括多媒体模块,以方便多媒体组件1308和处理组件1302之间的交互。

存储器1304被配置为存储各种类型的数据以支持在设备1300的操作。这些数据的示例包括用于在装置1300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件1306为装置1300的各种组件提供电力。电源组件1306可以包括电源管理系统,一个或多个电源,及其他与为装置1300生成、管理和分配电力相关联的组件。

多媒体组件1308包括在上述装置1300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1308包括一个前置摄像头和/或后置摄像头。当设备1300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1310被配置为输出和/或输入音频信号。例如,音频组件1310包括一个麦克风(MIC),当装置1300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1304或经由通信组件1316发送。在一些实施例中,音频组件1310还包括一个扬声器,用于输出音频信号。

I/O接口1312为处理组件1302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1314包括一个或多个传感器,用于为装置1300提供各个方面的状态评估。例如,传感器组件1314可以检测到设备1300的打开/关闭状态,组件的相对定位,例如上述组件为装置1300的显示器和小键盘,传感器组件1314还可以检测装置1300或装置1300一个组件的位置改变,用户与装置1300接触的存在或不存在,装置1300方位或加速/减速和装置1300的温度变化。传感器组件1314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件1316被配置为便于装置1300和其他设备之间有线或无线方式的通信。装置1300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信部件1316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置1300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1304,上述指令可由装置1300的处理器1320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1