画像元数据获得方法、装置、存储介质及电子设备与流程

文档序号:14940897发布日期:2018-07-13 20:44阅读:135来源:国知局

本发明涉及信息处理技术领域,具体而言,涉及一种画像元数据获得方法、装置、存储介质及电子设备。



背景技术:

移动浏览器作为浏览移动互联网的主要入口,是移动端用户获取信息的一个重要工具。移动浏览器对其用户进行相对准确的画像,可以为更好的向用户推送感兴趣信息提供较好的数据基础。



技术实现要素:

本发明实施例的目的在于提供一种画像元数据获得方法、装置、存储介质及电子设备。为了实现上述目的,本发明实施例采取的技术方案如下:

第一方面,本发明实施例提供了一种画像元数据获得方法,应用于一电子设备中,所述方法包括获取用户用于通过所述电子设备对网页进行访问的访问行为;判断所述访问行为是否为主动意愿程度值大于预设值的预设访问行为;在为是时,确定所述网页相关的网页信息为画像元数据。

第二方面,本发明实施例提供了一种画像元数据获得装置,运行于一电子设备中,所述装置包括:获取单元、判断单元和确定单元。获取单元,用于获取用户用于通过所述电子设备对网页进行访问的访问行为。判断单元,用于判断所述访问行为是否为主动意愿程度值大于预设值的预设访问行为。确定单元,用于在所述判断单元判断的结果为是时,确定所述网页相关的网页信息为画像元数据。

第三方面,本发明实施例提供了一种存储介质,所述存储介质存储有程序代码,所述程序代码在被处理器读取并运行时,执行上述的方法。

第四方面,本发明实施例提供了一种电子设备,包括处理器和存储器,所述处理器和所述存储器通过总线电连接;所述存储器中存储有程序代码;所述处理器,用于通过所述总线从所述存储器中读取并运行所述程序代码,执行上述的方法。

通过本发明实施例提供的一个或多个实施例的结合,至少可以实现如下技术效果:

由于在获取用户用于通过所述电子设备对网页进行访问的访问行为后,会判断所述访问行为是否为主动意愿程度值大于预设值的预设访问行为,并且在为是时,才确定所述网页相关的网页信息为画像元数据。即在本发明实施例中,通过判断的动作,能够确保将用户有主动意愿访问的网页信息作为画像元数据,进而实现对用户进行相对准确画像的技术效果。

本发明实施例的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明实施例的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例的应用环境示意图;

图2为一种可应用于本发明实施例中的电子设备的结构框图;

图3为本发明实施例提供的第一种画像元数据获得方法的流程图;

图4为本发明实施例提供的第二种画像元数据获得方法的流程图;

图5为本发明实施例提供的第三种画像元数据获得方法的流程图;

图6为本发明实施例提供的第四种画像元数据获得方法的流程图;

图7为本发明实施例提供的第五种画像元数据获得方法的流程图;

图8为本发明实施例提供的一种画像元数据获得装置的结构框图;

图9为本发明实施例提供的另一种画像元数据获得装置的结构框图;

图10为本发明实施例提供的再一种画像元数据获得装置的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

本申请发明人在实现本发明实施例中的技术方案的过程中,发现现有技术为获取用户访问网页的内容,作为画像元数据,基于这些画像元数据,做出用户画像,即不管是不是体现用户意愿的内容,均作为画像元数据,因此获取到的画像元数据中可能存在不属于该用户意愿的操作,导致用户画像的不准确,进而后续给用户推荐错误的信息。进一步地,本申请发明人发现现有技术中存在获取的画像元数据不准确、冗余等技术问题。

本申请发明人为了改善上述技术问题,发明本发明实施例中提供的技术方案。下面将结合具体例子及附图,对本发明实施例中提供的实施例进行详细描述。

本发明下述各实施例如无特别说明均可应用于如图1所示的环境中,如图1所示,用户终端110通过网络200与服务器210连接。所述网络200可以是有线或无线网络。本发明实施例中,用户终端110和服务器210能够通过通信网络直接连接。用户终端110、服务器210可以在wi-fi(无线保真)网络、2g/3g/4g网络或局域网中建立通信连接。

请参阅图2,示出了一种可应用于本发明实施例中的电子设备100的结构框图。电子设备100可以包括存储器102、存储控制器104、一个或多个(图2中仅示出一个)处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116和画像元数据获得装置。

存储器102、存储控制器104、处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。画像元数据获得方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器102中的软件功能模块,例如所述画像元数据获得装置包括的软件功能模块或计算机程序。

存储器102可以存储各种软件程序以及模块,如本申请实施例提供的画像元数据获得方法及装置对应的程序指令/模块。处理器106通过运行存储在存储器102中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的画像元数据获得方法。

存储器102可以包括但不限于随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。

处理器106可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108、处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。

输入输出模块110用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出模块110可以是,但不限于,鼠标和键盘等。

音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

显示模块114在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示模块114可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器106进行计算和处理。

射频模块116用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通信网络或者其他设备进行通信。

可以理解,图2所示的结构仅为示意,电子设备100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。

于本发明实施例中,电子设备100可以作为用户终端110。该电子设备100可以为pc(personalcomputer)电脑、平板电脑、手机、笔记本电脑、智能电视、机顶盒、车载终端等终端设备。电子设备100中安装有客户端,该客户端可以是浏览器,与服务器(server)端相对应。

请参阅图3,本发明实施例提供了一种画像元数据获得方法,应用于一电子设备中,所述方法可以包括步骤s200、步骤s210和步骤s220。

步骤s200:获取用户用于通过所述电子设备对网页进行访问的访问行为。

步骤s210:判断所述访问行为是否为主动意愿程度值大于预设值的预设访问行为。

进一步地,基于步骤s210,判断所述访问行为是否为所述用户在地址栏输入网页地址进行网页访问的行为、所述用户扫二维码进行网页访问的行为、所述用户点击收藏夹进行网页访问的行为、所述用户点击浏览历史链接进行网页访问的行为、或所述用户利用与当前网页地址的域名相同的referrer地址的域名进行网页访问的行为。

在本实施例中,在用户行为方面,如果用户访问某个站点网页时,符合以下的条件,可以定义为主动意愿程度值大于预设值的预设访问行为,即“主动浏览行为”,可以包括5种:

(1)用户在地址栏输入网页地址进行网页访问的行为;

(2)用户扫二维码进行网页访问的行为;

(3)用户点击收藏夹进行网页访问的行为;

(4)用户点击浏览历史链接进行网页访问的行为;

(5)用户利用与当前网页地址的域名相同的referrer地址的域名进行网页访问的行为。也即用户点击该站点网页而衍生同域名的网页访问的行为。

例如,用户从搜索引擎的结果页面点击链接访问站点s,这一行为不算作“主动浏览行为”,因为用户在该阶段并没有对该站点产生主动浏览意愿,而更多的是验证搜索结果是否符合自己的期望。例如,用户从站点t的网页,点击链接产生到站点s的网页访问,该行为也不算作“主动浏览行为”,因为其更多的是对链接所呈现的主题产生一定的兴趣。

步骤s220:在为是时,确定所述网页相关的网页信息为画像元数据。

所述网页信息可以包括所述网页的摘要信息、访问行为的类别。

根据判断结果得出所述访问行为为用户利用与当前网页地址的域名相同的referrer地址的域名进行网页访问的行为,所述网页信息还可以包括referrer地址。

例如,当前网页地址为www.baidu.com,用户点击该页面下的地图,即map.baidu.com,属于当前网页地址而衍生同域名的网页访问的行为。

基于以上步骤,用户进入某个网页进行访问,再进行多种访问,将每一次获取到的画像元数据标记为一条记录。每条画像元数据可以包括用户标识信息、网页信息。

请参阅图4,为了避免频繁上报画像元数据,在步骤s220之后,所述方法还可以包括:

步骤s230:判断与所述访问行为相关的当前参数信息是否满足预设触发上报条件,在为是时,将所述当前参数信息对应累计的多条画像元数据发送给服务器。

进一步地,请参阅图5,于本发明的一种具体实施方式中,步骤s230可以包括步骤s230a:判断当前时刻与上一次发送时刻之间的间隔时长是否大于等于第一预设时间长度,在为是时,将所述间隔时长内累计的多条画像元数据发送给所述服务器。

所述第一预设时间长度可以根据实际情况设置。在本实施例中,第一预设时间长度可以为3小时。一天24小时,每隔3小时上报,即使用户每时每刻在线,上报画像元数据的次数也最多为8次,以此避免频繁地上报。例如,在本地存储每一次获取到的画像元数据,在用户进行网页访问中,查询到当前时刻为14:00,上一次发送时刻为12:00,当前时刻14:00与上一次发送时刻12:00之间的间隔时长为2小时,小于第一预设时间长度3小时,不上报画像元数据。用户可能不会一直保持在网页访问中,会关机,会离线等,例如,查询到当前时刻为17:00,上一次发送时刻为12:00,当前时刻17:00与上一次发送时刻12:00之间的间隔时长为5小时,大于第一预设时间长度3小时,将所述间隔时长5小时内累计的多条画像元数据发送给所述服务器。

进一步地,请参阅图6,于本发明的另一种具体实施方式中,步骤s230可以包括步骤s230b:判断所述用户访问网页的时间长度是否大于等于第二预设时间长度,在为是时,将在所述时间长度内累计的多条画像元数据发送给所述服务器。

所述第二预设时间长度可以根据实际情况设置。在本实施例中,第二预设时间长度可以为3小时。判断所述用户访问网页的时间长度是否大于等于第二预设时间长度如3小时,在为是时,将在所述时间长度内累计的多条画像元数据发送给所述服务器。在用户一直处于网页访问下,更能避免频繁上报画像元数据。

进一步地,请参阅图7,于本发明的再一种具体实施方式中,步骤s230可以包括步骤s230c:判断当前时刻与上一次发送时刻之间累计的多条画像元数据的条数值是否等于预设阈值,在为是时,将所述条数值内累计的多条画像元数据发送给所述服务器。

所述预设阈值可以根据实际情况设置。例如,预设阈值可以根据电子设备的存储容量进行设置。在本实施例中,预设阈值可以为100条。

例如,查询到当前时刻为17:00,上一次发送时刻为12:00,之间累计的多条画像元数据的条数值为100条,等于预设阈值100,将累计的100条画像元数据发送给所述服务器。

可以理解的是,可以通过本发明实施例提供的一个或多个实施例的结合能够更高效,可以结合步骤s230a、s230b、s230c中的实施方式中的至少两种,例如判断当前时刻与上一次发送时刻之间的间隔时长是否大于等于第一预设时间长度,在为是时,判断当前时刻与上一次发送时刻之间累计的多条画像元数据的条数值是否等于预设阈值,在为是时,将所述条数值内累计的多条画像元数据发送给所述服务器;判断当前时刻与上一次发送时刻之间累计的多条画像元数据的条数值是否等于预设阈值,在为是时,判断当前时刻与上一次发送时刻之间的间隔时长是否大于等于第一预设时间长度,在为是时,将所述间隔时长内累计的多条画像元数据发送给所述服务器。

在步骤s230之后,为了释放本地的存储空间,可持续循环地执行,所述方法还可以包括:

清除所述多条画像元数据。重置间隔时间或记录数,开始新一轮的获取画像元数据。

本发明实施例提供的一种画像元数据获得方法,由于在获取用户用于通过所述电子设备对网页进行访问的访问行为后,会判断所述访问行为是否为主动意愿程度值大于预设值的预设访问行为,并且在为是时,才确定所述网页相关的网页信息为画像元数据。即在本发明实施例中,通过判断的动作,能够确保将用户有主动意愿访问的网页信息作为画像元数据,进而实现对用户进行相对准确画像的技术效果。仅仅保留用户主观浏览意愿的浏览信息,能够更好地向用户推送感兴趣信息提供数据基础。

请参阅图8,本发明实施例提供了一种画像元数据获得装置300,运行于一电子设备中,所述装置300可以包括获取单元310、判断单元320和确定单元330。

获取单元310,用于获取用户用于通过所述电子设备对网页进行访问的访问行为。

判断单元320,用于判断所述访问行为是否为主动意愿程度值大于预设值的预设访问行为。

判断单元320可以包括判断子单元321。

判断子单元321,用于判断所述访问行为是否为所述用户在地址栏输入网页地址进行网页访问的行为、所述用户扫二维码进行网页访问的行为、所述用户点击收藏夹进行网页访问的行为、所述用户点击浏览历史链接进行网页访问的行为、或所述用户利用与当前网页地址的域名相同的referrer地址的域名进行网页访问的行为。

确定单元330,用于在所述判断单元判断的结果为是时,确定所述网页相关的网页信息为画像元数据。

所述装置300还可以包括发送单元340。

发送单元340,用于判断与所述访问行为相关的当前参数信息是否满足预设触发上报条件,在为是时,将所述当前参数信息对应累计的多条画像元数据发送给服务器。

所述发送单元340可以包括第一发送子单元341。

第一发送子单元341,用于判断当前时刻与上一次发送时刻之间的间隔时长是否大于等于第一预设时间长度,在为是时,将所述间隔时长内累计的多条画像元数据发送给所述服务器。

请参阅图9,所述发送单元340可以包括第二发送子单元342。

第二发送子单元342,用于判断所述用户访问网页的时间长度是否大于等于第二预设时间长度,在为是时,将在所述时间长度内累计的多条画像元数据发送给所述服务器。

请参阅图10,所述发送单元300可以包括第三发送子单元343。

第三发送子单元343,用于判断当前时刻与上一次发送时刻之间累计的多条画像元数据的条数值是否等于预设阈值,在为是时,将所述条数值内累计的多条画像元数据发送给所述服务器。

所述装置300还可以包括清除单元350。

清除单元350,用于清除所述多条画像元数据。

以上各单元可以是由软件代码实现,此时,上述的各单元可存储于存储器102内。以上各单元同样可以由硬件例如集成电路芯片实现。

本发明实施例提供的画像元数据获得装置300,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。

本发明实施例提供了一种存储介质,所述存储介质存储有程序代码,所述程序代码在被处理器读取并运行时,执行上述的方法。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1