一种信息采集方法和装置,以及一种智能终端与流程

文档序号:11199183阅读:1447来源:国知局
一种信息采集方法和装置,以及一种智能终端与流程

本申请涉及终端技术领域,特别是涉及一种信息采集方法和装置,以及一种智能终端。



背景技术:

随着终端技术的发展,智能终端设备被越来越多的用户所使用。用户通过终端设备可以完成的事务也越来越多,例如,可以通过终端设备访问网页、网上聊天、听音乐、看电影和导航等。由于用户在终端设备上的操作行为在一定程度上反映了用户的偏好、习惯和兴趣等,故,可以通过对用户在终端设备上的信息的采集来对用户的偏好、习惯和兴趣等进行分析。

目前,常用的信息采集方案有:“埋点”采集方案。其中,所述“埋点”采集方案主要基于平台提供的标准接口来实现。例如,常见的标准接口有:事件响应接口和页面跳转接口等,所述“埋点”方案也即:分别在事件响应接口和页面跳转接口等位置处设置埋点(也即,设置用于获取所述事件响应接口位置处和所述页面跳转接口位置处信息的函数);然后,根据设置的埋点来收集所述事件响应接口位置处和所述页面跳转接口位置处的信息。

由上可见,目前采用的“埋点”采集方案存在诸多问题:其一,“埋点”采集方案受限于各个平台所提供的标准接口,只能在平台开放的标准接口处设置埋点,对标准接口处的信息进行采集,能够采集的信息是有限的。其二,“埋点”采集方案将会对“埋点”的接口中的所有信息进行采集,采集得到的信息较笼统,不能对采集的信息的重要程度进行有效的区分,例如,某部分信息用户只访问了一次,并不是用户感兴趣的内容,但是由于该信息是通过所述“埋点”的接口实现的,故,所述某部分信息也将被采集。可见,现有的“埋点”采集方案采集得到的信息较笼统,准确性差。



技术实现要素:

鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至 少部分地解决上述问题的一种信息采集方法和装置,以及一种智能终端。

为了解决上述问题,本申请公开了一种信息采集方法,包括:

获取内核层用户事件;

根据所述内核层用户事件,从页面中提取信息。

本申请还公开了一种信息采集装置,包括:

获取模块,用于获取内核层用户事件;

提取模块,用于根据所述内核层用户事件,从页面中提取信息。

本申请还公开了一种智能终端,所述智能终端包括:存储器、显示器、处理器和输入单元,其中,所述输入单元包括:触摸屏;

所述处理器用于执行上述信息采集方法。

与现有技术相比,本申请实施例包括以下优点:

一般地,用户对页面的具体操作行为可以准确反映出用户的偏好,而用户对页面的具体操作行为又以用户事件的形式被记录在内核层,可见,获取内核层用户事件,根据内核层用户事件从页面中提取信息,保证了提取的信息与用户偏好的匹配度。

进一步的,根据所述内核层用户事件可以准确定位到用户感兴趣的具体内容,相较于现有技术,本申请实施例所述的信息采集方案除了可以确定出用户感兴趣的页面之外,更是能准确的确定出用户对所述确定的感兴趣的页面中的具体的哪部分内容感兴趣。例如,根据内核层记录的pinchupdate事件可以准确的确定出用户对页面中的具体的哪一部分内容进行了缩放;根据内核层记录的select事件可以准确的确定出用户对页面中的具体哪一部分内容进行了选择。可见,根据内核层用户事件从页面中提取信息,可以准确提取得到用户具体缩放的内容,以及,用户具体选择的内容,换而言之,通过本申请实施例所述的信息采集方案提取得到的信息更细致、更具体、粒度级更小;进而,保证了后续在根据提取的信息进行分析时的分析结果的准确性。

此外,本申请实施例所述的信息采集方案可以直接根据所述内核层用户事件从页面中提取信息,不受限于第三方所提供的接口,本申请实施例所 述的信息采集方案适用范围更广,可提取的信息更全面、更具体。

附图说明

图1是本申请实施例中一种信息采集方法的步骤流程图;

图2是本申请实施例中另一种信息采集方法的步骤流程图;

图3是本申请实施例中一种用于实现所述信息采集方法的系统的架构图;

图4是本申请实施例中一种信息采集装置的结构框图;

图5是本申请实施例中另一种信息采集装置的结构框图;

图6是本申请实施例中一种智能终端的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。

信息采集通常是指在终端设备上,通过适当的方式对用户关心的内容进行采集。目前,通常采用的信息采集方法有“埋点”方法。例如,针对某一购物类的app(application,应用程序),可以通过采用在关键操作上进行“埋点”的方式来收集各类信息。例如,可以在所述购物类的app中的用于响应点击事件的接口a处设置埋点a,进而可以通过在接口a处设置的埋点a来收集商品被点击的次数。然而,虽然上述“埋点”方法可以比较有效地采集到用户所关心的信息,但是上述“埋点”方法所能采集的信息依赖于所述购物类的app所提供的接口,故,造成了采集的信息是有限的,且信息较为笼统,不够具体。申请实施例提出了一种信息采集方法、装置和智能终端以解决上述问题。

参照图1,示出了本申请实施例中一种信息采集方法的步骤流程图。在本实施例中,所述信息采集方法可以包括:

步骤102,获取内核层用户事件。

一般地,用户在终端设备中执行的操作会在内核层中留下事件痕迹,换而言之,内核层中记录有对应于用户操作的事件,简称用户事件。在本实施 例中,可以通过任意一种适当的方式从内核层中获取所述内核层中记录的用户事件。

步骤104,根据所述内核层用户事件,从页面中提取信息。

在本实施例中,以用户针对终端中显示的页面的操作为例进行说明,其中,所述页面包括但不仅限于:web页面和/或应用程序的内置页面等。

一般地,用户对页面的具体操作行为可以准确反映出用户的偏好。例如,当用户对页面中的某一内容感兴趣时,可能会停留在当前位置以对该内容进行详细阅读,此时页面的滚动速度远远小于用户对页面的平均滚动速度。又例如,当用户对页面中的某一内容感兴趣时,可能会选中该内容,并进行复制、粘贴等操作。再例如,当用户对页面中的某一内容感兴趣时,可能会对该部分内容进行放大阅读。

而用户对页面的各类操作行为(如,针对页面中的内容的选择、复制、粘贴和长按等操作,以及,针对页面的滚动、缩放等操作等)在内核层中均有对应的事件记录。例如,对应于用户操作行为的内核层用户事件包括但不仅限于:scrollstart事件(开始滚动页面)、scrollupdate事件(不断滚动页面)、scrollend事件(结束页面的滚动)、pinchstart(开始缩放操作)、pinchupdate事件(正在缩放操作中)、pinchend事件(结束缩放)、longpress事件(长按)、click事件(点击某处内容)、select事件(选中某处内容)、copy事件(拷贝选中区域内容)等,在此不一一说明。

由上可见,由于用户对页面的具体操作行为可以准确反映出用户的偏好,而用户对页面的具体操作行为又以用户事件的形式被记录在内核层,因此,根据内核层用户事件来从页面中提取信息,保证了提取的信息与用户偏好的匹配度。

进一步的,根据所述内核层用户事件可以准确定位到用户感兴趣的具体内容,相较于现有技术,本实施例所述的信息采集方法除了可以确定出用户感兴趣的页面之外,更是能准确的确定出用户对所述确定的感兴趣的页面中的具体的哪部分内容感兴趣。例如,根据pinchupdate事件可以准确的确定出用户对页面中的具体的哪一部分内容进行了缩放,根据select事件可以准 确的确定出用户对页面中的具体哪一部分内容进行了选择,进而,根据内核层用户事件从页面中提取信息时,可以准确提取得到用户具体缩放的那部分内容,以及,用户具体选择的那部分内容,可见,通过本实施例所述的信息采集方法提取得到的信息更细致、更具体,粒度级更小;保证了后续在根据提取的信息进行分析时的分析结果的准确性。

此外,根据所述内核层用户事件从页面中提取信息,避免了接口的限制,适用范围更广,可提取的信息更广泛、更全面。

下面,以一个web引擎内核环境下所述信息采集方法的应用为例进行说明。当然本领域技术人员应当明了的是,本实施例所述信息采集方法可以应用于任一适当的系统内核环境下。需要说明的是,通过本实施例所述的信息采集方法从页面中提取的信息包括但不仅限于:文本信息、图片信息、音频信息、视频信息和网址链接中的至少一种。

参照图2,示出了本申请实施例中另一种信息采集方法的步骤流程图。在本实施例中,所述信息采集方法可以包括:

步骤202,获取内核层用户事件。

在本实施例中,所述获取内核层用户事件具体可以是指:获取排版引擎的内核中记录的用户事件。其中,所述排版引擎的内核中记录的用户事件根据用户手势操作确定。

需要说明的是,所述排版引擎可以理解为是终端设备中负责应用程序界面呈现、事件处理的模块。其中,常见的典型的排版引擎有:web引擎,pdf阅读器,os(operatingsystem,操作系统)上的ui(userinterface,用户界面)框架等。由前所述,本实施例是以web引擎内核为例进行说明,换而言之,所述获取内核层用户事件具体可以是:获取web引擎内核中记录的用户事件。

步骤204,根据所述内核层用户事件,从页面中提取信息。

在本实施例中,所述步骤204具体可以包括:

子步骤2042,确定所述内核层用户事件的事件类型。

子步骤2044,根据确定的所述事件类型,从页面中提取信息。

其中,在本实施例中,所述事件类型包括但不仅限于:页面滚动事件、页面缩放事件和页面编辑事件中的至少一种。

为便于理解,下面对在不同的事件类型下上述子步骤2044的实现流程分别进行说明。

a、当所述事件类型为页面滚动事件时:

在本实施例的一优选方案中,当所述事件类型为页面滚动事件时,上述子步骤2044的具体实现流程可以如下:对所述页面滚动事件进行解析,获取页面滚动速率;根据所述页面滚动速率,从页面中提取信息。

其中,所述根据所述页面滚动速率,从页面中提取信息,具体可以包括:将所述页面滚动速率与设定速率阈值进行比较;在所述页面滚动速率小于设定速率阈值时,确定所述页面滚动事件对应的页面起始位置和页面结束位置;提取所述页面中从所述页面起始位置至所述页面结束位置内的信息。

需要说明的是,所述页面滚动速率具体可以是指:在页面滚动事件发生时,x轴和y轴两个方向上的滚动速率。其中,所述设定速率阈值可以是预先设置的,例如,假设人眼正常阅读时页面的滚动速率时so,则可以预先将所述so设置为所述设定速率阈值。其中,所述页面滚动速率小于设定速率阈值可以是x轴和y轴任意一个方向上的页面滚动速率小于所述设定速率阈值。

在本实施例的另一优选方案中,当所述事件类型为页面滚动事件时,上述子步骤2044的具体实现流程可以如下:对所述页面滚动事件进行解析,获取页面滚动时间;根据所述页面滚动时间,从页面中提取信息。

其中,一优选的,所述页面滚动时间可以包括:所述页面滚动事件的触发时间和所述页面的打开时间。则,所述根据所述页面滚动时间,从页面中提取信息,具体可以包括:计算所述页面滚动事件的触发时间与所述页面的打开时间的差值,得到第一时间差值;在所述第一时间差值大于第一设定时间阈值时,从所述页面中提取屏幕可视区域内的信息。

需要说明的是,所述页面滚动事件的触发时间具体可以是指:触发所述 页面滚动事件时的时间;所述页面的打开时间具体可以是指:所述页面打开时的时间。

其中,另一优选的,所述页面滚动时间可以包括:当前页面滚动事件的触发时间,和,前一页面滚动事件的触发时间。则,所述根据所述页面滚动时间,从页面中提取信息,具体可以包括:计算所述当前页面滚动事件的触发时间与所述前一页面滚动事件的触发时间的差值,得到第二时间差值;在所述第二时间差值大于第二设定时间阈值时,从所述页面中提取当前屏幕可视区域内的信息。

需要说明的是,所述当前页面滚动事件的触发时间具体可以是指:触发所述当前页面滚动事件时的时间;所述前一页面滚动事件的触发时间具体可以是指:触发所述前一页滚动事件时的时间;所述当前页面滚动事件与所述前一页面滚动事件是相连的两个页面滚动事件。

本领域技术人员应当明了的是,所述第一设定时间阈值和所述第二设定时间阈值也是可以预先设置的。例如,假设人眼正常阅读完屏幕当前可视区域内的所有内容所需要的时间为n秒,则,可以将所述n配置为所述第一设定时间阈值,以及,将所述n配置为所述第二设定时间阈值。本实施例对此不作限制。

b、当所述事件类型为页面缩放事件时:

在本实施例中,优选的,当所述事件类型为页面缩放事件时,上述子步骤2044的具体实现流程可以如下:对所述页面缩放事件进行解析,获取所述页面缩放事件对应的第一坐标;从所述页面中提取所述第一坐标处的信息。

需要说明的是,对于所述页面缩放事件而言,所述页面缩放事件对应的第一坐标具体可以是指:多个接触点的中心点坐标。其中,所述多个接触点可以是指用户在实现缩放操作时所涉及的接触点。

c、当所述事件类型为页面编辑事件时:

在本实施例中,优选的,当所述事件类型为页面编辑事件时,上述子步骤2044的具体实现流程可以如下:对所述页面编辑事件进行解析,获取所 述页面编辑事件对应的第二坐标;从所述页面中提取所述第二坐标处的信息。

需要说明的是,在本实施例中,所述页面编辑事件包括但不仅限于:针对所述页面中的信息的点击、选择、复制、粘贴、剪切和悬停操作事件中的至少一种。对于所述页面编辑事件而言,所述页面编辑事件对应的第二坐标具体可以是指:多个编辑操作对应的坐标。例如,选择操作对应的坐标、点击操作对应的坐标等。

此外,所述页面编辑事件对应的编辑对象应当非空。页面编辑事件对应的编辑对象非空有效的避免了无效采集情况的发生,保证了信息采集操作的有效性。

在本实施例的一优选方案中,如上所述,由于本实施例在根据所述内核层用户事件从页面中提取信息时会涉及到各类事件发生时的时间信息,因此,为了保证各类事件对应的时间的一致性,以及保证提取结果的准确性,所述信息采集方法还可以包括:

步骤206,重置所述内核层用户事件的事件时间。

在本实施例中,可以在任意适当的时候对所述内核层用户事件的事件时间进行重置。例如,可以在一次信息提取完成后重置所述事件时间,或者,可以在页面发生切换时重置所述事件时间,或者在终端设备锁屏时重置所述事件时间,或者,在信息提取完成后重置所述事件时间,或者,在信息提取之前重置所述事件时间,本实施例对此不作限制。

如上,由于可以在任意适当的时间对所述内核层用户事件的事件时间进行重置,故,上述步骤206可以在上述步骤202-204中的任意步骤之前或之后执行,本实施例对此不作限制。通过上述步骤206对事件时间的重置,保证了各类用户事件的事件时间的一致性,特别是保证了上述第一时间差值以及上述第二时间差值计算结果的准确性,避免了因时间计算错误而导致的信息误提取或漏提取问题,提高了信息提取的准确性。

需要说明的是,在本实施例中,可以采用任意一种适当的方式从页面中提取信息。例如,所述从页面中提取信息(如,上述的从所述页面中提取所 述第一坐标处的信息,和/或,从所述页面中提取所述第二坐标处的信息)可以基于web排版引擎的hittest机制实现。其中,hittest机制可以用于决定usercontrol是否接收如下操作事件:mouseup、mousedown、mouseover、click和dblclick。当然,信息的提取方式并不仅限于所述hittest机制,本实施例对此不作限制。

综上所述,由于用户对页面的具体操作行为可以准确反映出用户的偏好,而用户对页面的具体操作行为又以用户事件的形式被记录在内核层,因此,获取内核层用户事件,根据内核层用户事件从页面中提取信息,保证了提取的信息与用户偏好的匹配度。

进一步的,根据所述内核层用户事件可以准确定位到用户感兴趣的具体内容,相较于现有技术,本实施例所述的信息采集方法除了可以确定出用户感兴趣的页面之外,更是能准确的确定出用户对所述确定的感兴趣的页面中的具体的哪部分内容感兴趣。例如,根据内核层记录的pinchupdate事件可以准确的确定出用户对页面中的具体的哪一部分内容进行了缩放;根据内核层记录的select事件可以准确的确定出用户对页面中的具体哪一部分内容进行了选择。可见,根据内核层用户事件从页面中提取信息,可以准确提取得到用户具体缩放的内容,以及,用户具体选择的内容,换而言之,通过本实施例所述的信息采集方法提取得到的信息更细致、更具体、粒度级更小;进而,保证了后续在根据提取的信息进行分析时的分析结果的准确性。

此外,本实施例所述的信息采集方法可以直接根据所述内核层用户事件从页面中提取信息,不受限于第三方所提供的接口,本实施例所述的信息采集方法适用范围更广,可提取的信息更全面、更具体。

为了使所述信息采集方法的实现流程更清楚,本实施例结合一种用于实现所述信息采集方法的系统对所述信息采集方法的流程进行详细说明。

参照图3,示出本申请实施例中一种用于实现所述信息采集方法的系统的架构图。其中,用于实现所述信息采集方法的系统具体可以包括:input/ouputsystem(输入/输出系统)、layoutengine(排版引擎)和display system(显示系统)。

其中:

a、input/ouputsystem(输入/输出系统)

input/ouputsystem(输入/输出系统)可以用于接收用户针对终端设备的输入操作,以及,将用于响应所述输出操作的输出数据信息发送给用户

b、layoutengine(排版引擎)

如图3所示,所述layoutengine(排版引擎)中具体可以包括:eventdispatcher模块(事件调度模块)、eventcollector(事件收集器)和layoutandrendering模块(布局和渲染模块)。

其中,eventdispatcher模块可以用于使内核层用户事件允许被侦听。eventcollector(事件收集器)可以用于获取内核层用户事件。layoutandrendering模块(布局和渲染模块)可以用于根据内核层用户事件从页面中提取信息。其中,所述layoutandrendering模块在根据内核层用户事件从页面中提取信息时,具体可以基于hittest机制从页面中提取信息。

c、displaysystem(显示系统)

displaysystem(显示系统)可以用于显示页面中的信息。

综上所述,由于用户对页面的具体操作行为可以准确反映出用户的偏好,而用户对页面的具体操作行为又以用户事件的形式被记录在内核层,因此,获取内核层用户事件,根据内核层用户事件从页面中提取信息,保证了提取的信息与用户偏好的匹配度。

进一步的,根据所述内核层用户事件可以准确定位到用户感兴趣的具体内容,相较于现有技术,本实施例所述的信息采集方法除了可以确定出用户感兴趣的页面之外,更是能准确的确定出用户对所述确定的感兴趣的页面中的具体的哪部分内容感兴趣。例如,根据内核层记录的pinchupdate事件可以准确的确定出用户对页面中的具体的哪一部分内容进行了缩放;根据内核层记录的select事件可以准确的确定出用户对页面中的具体哪一部分内容进行了选择。可见,根据内核层用户事件从页面中提取信息,可以准确提取得到用户具体缩放的内容,以及,用户具体选择的内容,换而言之,通过本实 施例所述的信息采集方法提取得到的信息更细致、更具体、粒度级更小;进而,保证了后续在根据提取的信息进行分析时的分析结果的准确性。

此外,本实施例所述的信息采集方法可以直接根据所述内核层用户事件从页面中提取信息,不受限于第三方所提供的接口,本实施例所述的信息采集方法适用范围更广,可提取的信息更全面、更具体。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。

在上述方法实施例的基础上,本实施例还提供了一种信息采集装置。参照图4,示出了本申请实施例中一种信息采集装置的结构框图。在本实施例中,所述信息采集装置可以包括:

获取模块402,用于获取内核层用户事件。

提取模块404,用于根据所述内核层用户事件,从页面中提取信息。

一般地,用户对页面的具体操作行为可以准确反映出用户的偏好,而用户对页面的具体操作行为又以用户事件的形式被记录在内核层,可见,根据内核层用户事件来从页面中提取信息,保证了提取的信息与用户偏好的匹配度。

进一步的,根据所述内核层用户事件可以准确定位到用户感兴趣的具体内容,相较于现有技术,本实施例所述的信息采集装置除了可以确定出用户感兴趣的页面之外,更是能准确的确定出用户对所述确定的感兴趣的页面中的具体的哪部分内容感兴趣。例如,根据pinchupdate事件可以准确的确定出用户对页面中的具体的哪一部分内容进行了缩放,根据select事件可以准确的确定出用户对页面中的具体哪一部分内容进行了选择,进而,提取模块404在从页面中提取信息时,可以准确提取得到用户具体缩放的那部分内容, 以及,用户具体选择的那部分内容,可见,通过本实施例所述的信息采集装置提取得到的信息更细致、更具体,粒度级更小;保证了后续在根据提取的信息进行分析时的分析结果的准确性。

此外,根据所述内核层用户事件从页面中提取信息,避免了接口的限制,适用范围更广,可提取的信息更广泛、更全面。

在本实施例的一优选方案中,参照图5,示出了本申请实施例中另一种信息采集装置的结构框图。

优选的,所述提取模块404具体可以包括:确定子模块4042,用于确定所述内核层用户事件的事件类型;提取子模块4044,用于根据确定的所述事件类型,从页面中提取信息。

在本实施例中,所述事件类型包括但不仅限限于:页面滚动事件、页面缩放事件和页面编辑事件中的至少一种。

其中,当事件类型不同时,上述提取子模块4044的具体实现方式也不同。具体地:

a、当所述事件类型为页面滚动事件时:

在本实施例的一优选方案中,当所述事件类型为页面滚动事件时,所述提取子模块4044具体可以包括:第一获取子单元40442,用于对页面滚动事件进行解析,获取页面滚动速率;第一提取子单元40444,用于根据所述页面滚动速率,从页面中提取信息。

其中,所述第一提取子单元40444,具体可以用于将所述页面滚动速率与设定速率阈值进行比较;在所述页面滚动速率小于设定速率阈值时,确定所述页面滚动事件对应的页面起始位置和页面结束位置;提取所述页面中从所述页面起始位置至所述页面结束位置内的信息。

在本实施例的另一优选方案中,当所述事件类型为页面滚动事件时,所述提取子模块4044具体可以包括:第二获取子单元40446,用于对所述页面滚动事件进行解析,获取页面滚动时间;第二提取子单元40448,用于根据所述页面滚动时间,从页面中提取信息。

其中,一优选的,所述页面滚动时间可以包括:所述页面滚动事件的触发时间和所述页面的打开时间。则,所述第二提取子单元40448,具体可以用于计算所述页面滚动事件的触发时间与所述页面的打开时间的差值,得到第一时间差值;在所述第一时间差值大于第一设定时间阈值时,从所述页面中提取屏幕可视区域内的信息。

另一优选的,所述页面滚动时间包括:当前页面滚动事件的触发时间,和,前一页面滚动事件的触发时间。则,所述第二提取子单元40448,具体可以用于计算所述当前页面滚动事件的触发时间与所述前一页面滚动事件的触发时间的差值,得到第二时间差值;在所述第二时间差值大于第二设定时间阈值时,从所述页面中提取当前屏幕可视区域内的信息。

b、当所述事件类型为页面缩放事件时:

在本实施例中,优选的,当所述事件类型为页面缩放事件时,所述提取子模块4044具体可以包括:第三获取子单元404410,用于对所述页面缩放事件进行解析,获取所述页面缩放事件对应的第一坐标;第三提取子单元404412,用于从所述页面中提取所述第一坐标处的信息。

c、当所述事件类型为页面编辑事件时:

在本实施例中,优选的,当所述事件类型为页面编辑事件时,所述提取子模块4044具体可以包括:第四获取子单元404414,用于对所述页面编辑事件进行解析,获取所述页面编辑事件对应的第二坐标;第四提取子单元404416,用于从所述页面中提取所述第二坐标处的信息。

其中,所述页面编辑事件包括:针对所述页面中的信息的点击、选择、复制、粘贴、剪切和悬停操作事件中的至少一种。所述页面编辑事件对应的编辑对象非空。

在本实施例的一优选方案中,所述信息采集装置还可以包括:重置模块406,用于重置所述内核层用户事件的事件时间。

优选的,所述获取模块402具体可以用于获取排版引擎的内核中记录的用户事件;其中,所述排版引擎的内核中记录的用户事件根据用户手势操作确定。

优选的,从页面中提取的信息包括但不仅限于:文本信息、图片信息、音频信息、视频信息和网址链接中的至少一种。

综上所述,由于用户对页面的具体操作行为可以准确反映出用户的偏好,而用户对页面的具体操作行为又以用户事件的形式被记录在内核层,因此,获取内核层用户事件,根据内核层用户事件从页面中提取信息,保证了提取的信息与用户偏好的匹配度。

进一步的,根据所述内核层用户事件可以准确定位到用户感兴趣的具体内容,相较于现有技术,本实施例所述的信息采集装置除了可以确定出用户感兴趣的页面之外,更是能准确的确定出用户对所述确定的感兴趣的页面中的具体的哪部分内容感兴趣。例如,根据内核层记录的pinchupdate事件可以准确的确定出用户对页面中的具体的哪一部分内容进行了缩放;根据内核层记录的select事件可以准确的确定出用户对页面中的具体哪一部分内容进行了选择。可见,根据内核层用户事件从页面中提取信息,可以准确提取得到用户具体缩放的内容,以及,用户具体选择的内容,换而言之,通过本实施例所述的信息采集装置提取得到的信息更细致、更具体、粒度级更小;进而,保证了后续在根据提取的信息进行分析时的分析结果的准确性。

此外,本实施例所述的信息采集装置可以直接根据所述内核层用户事件从页面中提取信息,不受限于第三方所提供的接口,本实施例所述的信息采集装置适用范围更广,可提取的信息更全面、更具体。

在上述实施例的基础上,本实施例还公开了一种智能终端。

参照图6,示出了本申请实施例中一种智能终端的结构框图。在本实施例中,所述智能终端可以包括:存储器610、显示器620、处理器630和输入单元640。

其中,该输入单元640可用于接收用户输入的数字或字符信息,以及控制信号。具体地,本申请实施例中,该输入单元640可以包括触摸屏641,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触摸屏641上的操作),并根据预先设定的程式驱动相应的 连接装置。当然,除了触摸屏641,输入单元640还可以包括其他输入设备,如物理键盘、功能键(比如音量控制按键、开关按键等)、鼠标等。

显示器620包括显示面板,可选的,可以采用液晶显示器(liquidcrystaldisplay,lcd)或有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板。其中,触摸屏可以覆盖显示面板,形成触摸显示屏,当该触摸显示屏检测到在其上或附近的触摸操作后,传送给处理器630以执行相应的处理。

在本申请实施例中,通过调用存储该存储器610内的软件程序,和/或,模块,和/或,数据,处理器630可以用于获取内核层用户事件;根据所述内核层用户事件,从页面中提取信息。

可选的,所述根据所述内核层用户事件,从页面中提取信息,包括:

确定所述内核层用户事件的事件类型;

根据确定的所述事件类型,从页面中提取信息。

可选的,所述事件类型包括:页面滚动事件。

可选的,所述根据确定的所述事件类型,从页面中提取信息,包括:

对页面滚动事件进行解析,获取页面滚动速率;

根据所述页面滚动速率,从页面中提取信息。

可选的,所述根据所述页面滚动速率,从页面中提取信息,包括:

将所述页面滚动速率与设定速率阈值进行比较;

在所述页面滚动速率小于设定速率阈值时,确定所述页面滚动事件对应的页面起始位置和页面结束位置;

提取所述页面中从所述页面起始位置至所述页面结束位置内的信息。

可选的,所述根据确定的所述事件类型,从页面中提取信息,包括:

对所述页面滚动事件进行解析,获取页面滚动时间;

根据所述页面滚动时间,从页面中提取信息。

可选的,所述页面滚动时间包括:所述页面滚动事件的触发时间和所述页面的打开时间;

其中,所述根据所述页面滚动时间,从页面中提取信息,包括:

计算所述页面滚动事件的触发时间与所述页面的打开时间的差值,得到第一时间差值;

在所述第一时间差值大于第一设定时间阈值时,从所述页面中提取屏幕可视区域内的信息。

可选的,所述页面滚动时间包括:当前页面滚动事件的触发时间,和,前一页面滚动事件的触发时间;

其中,所述根据所述页面滚动时间,从页面中提取信息,包括:

计算所述当前页面滚动事件的触发时间与所述前一页面滚动事件的触发时间的差值,得到第二时间差值;

在所述第二时间差值大于第二设定时间阈值时,从所述页面中提取当前屏幕可视区域内的信息。

可选的,所述事件类型包括:页面缩放事件。

可选的,所述根据确定的所述事件类型,从页面中提取信息,包括:

对所述页面缩放事件进行解析,获取所述页面缩放事件对应的第一坐标;

从所述页面中提取所述第一坐标处的信息。

可选的,所述事件类型包括:页面编辑事件;其中,所述页面编辑事件包括:针对所述页面中的信息的点击、选择、复制、粘贴、剪切和悬停操作事件中的至少一种。

可选的,所述根据确定的所述事件类型,从页面中提取信息,包括:

对所述页面编辑事件进行解析,获取所述页面编辑事件对应的第二坐标;

从所述页面中提取所述第二坐标处的信息。

可选的,所述页面编辑事件对应的编辑对象非空。

可选的,所述方法还包括:

重置所述内核层用户事件的事件时间。

可选的,所述获取内核层用户事件,包括:

获取排版引擎的内核中记录的用户事件;其中,所述排版引擎的内核中 记录的用户事件根据用户手势操作确定。

可选的,从页面中提取的信息包括:文本信息、图片信息、音频信息、视频信息和网址链接中的至少一种。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

在一个典型的配置中,所述计算机设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的 界定,计算机可读介质不包括非持续性的电脑可读媒体(transitorymedia),如调制的数据信号和载波。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且 还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种信息采集方法和装置以及一种智能终端,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1