基于智能电视的家庭用户行为数据采集方法、装置及计算机可读存储介质与流程

文档序号:15848894发布日期:2018-11-07 09:31阅读:197来源:国知局
基于智能电视的家庭用户行为数据采集方法、装置及计算机可读存储介质与流程

本发明涉及用户数据采集技术领域,具体涉及一种基于智能电视的家庭用户行为数据采集方法、装置及计算机可读存储介质。

背景技术

智能电视系统基于android开发,并分别具有个人和家庭观影属性。构建智能电视的家庭用户画像包含基础数据:用户的基本属性、用户的使用行为以及产生使用行为的媒资数据信息。其中,用户属性来源于用户的注册及其它互通账号信息,用户在智能电视上的行为包含:点击、播放、使用时长、使用时段、使用媒资信息、使用功能、使用app等。

现有的智能电视构建用户家庭画像的数据都是基于用户在智能电视上的使用行为数据,难以区分屏幕前的实际使用人及人数,因此不能实现针对家庭不同的使用人构造用户画像,进行更为准确的节目推荐。那么如何获取用户所在家庭中更多信息,从而用于构造更为准确的用户家庭画像,是目前亟待解决的问题。



技术实现要素:

有鉴于此,本申请提供一种基于智能电视的家庭用户行为数据采集方法、装置及计算机可读存储介质,解决或者至少部分解决上述存在的问题。

为解决以上技术问题,本发明提供的技术方案是一种基于智能电视的家庭用户行为数据采集方法,包括:

判断是否收到智能电视的用户行为数据,若是,则生成当前用户行为日志,并进入下一步,若否,则不动作;

获取智能电视所在家庭网络的在线设备数据并生成当前在线设备日志,对当前在线设备日志进行预处理;

根据当前用户行为日志和预处理后的当前在线设备日志生成家庭用户行为日志数据并存储。

更优的,所述获取智能电视所在家庭网络的在线设备数据并生成当前在线设备日志的方法,包括:

读取智能电视所在家庭网络的网络设备的arp表,生成当前在线设备日志;其中,所述当前在线设备日志包括日志时间、智能电视mac、在线设备mac和在线设备ip;

过滤不需保存的当前在线设备日志。

更优的,所述过滤不需保存的当前在线设备日志的方法,包括:

获取待过滤日志设备mac集合,过滤当前在线设备日志中的在线设备mac与待过滤日志设备mac集合中的设备mac相同的当前在线设备日志;

过滤当前在线设备日志中的在线设备mac为智能电视mac的当前在线设备日志;

过滤当前在线设备日志中的在线设备ip后缀为.1和.255的当前在线设备日志。

更优的,所述对当前在线设备日志进行预处理的方法,包括:

确定当前在线设备日志中的在线设备mac对应的设备类型,将所述当前在线设备日志更新为包括日志时间、智能电视mac、在线设备mac和设备类型;

按照预设的日志筛选条件筛选出待分析的当前在线设备日志,遍历所述待分析的当前在线设备日志,更新当前在线设备mac列表。

更优的,所述确定当前在线设备日志中的在线设备mac对应的设备类型的方法,包括:

获取设备mac对应设备类型列表;

在所述设备mac对应设备类型列表中查询并获得当前在线设备日志中的在线设备mac对应的设备类型;

若在所述设备mac对应设备类型列表中未能查询到,则通过其他在线方式查询在线设备mac对应的设备类型,并将在线设备mac与查询到的对应设备类型更新到设备mac对应设备类型列表中。

更优的,所述生成当前用户行为日志的方法,包括:

接收智能电视的用户行为数据,生成当前用户行为日志;所述当前用户行为日志包括日志时间、智能电视mac和用户行为数据。

更优的,所述根据当前用户行为日志和预处理后的当前在线设备日志生成家庭用户行为日志数据并存储的方法,包括:

获取当前用户行为日志和当前在线设备mac列表,生成家庭用户行为日志数据并存储;其中,所述家庭用户行为日志数据包括日志时间、智能电视mac、用户行为数据和当前在线设备mac列表。

更优的,所述采集方法还包括:

判断存储的所述家庭用户行为日志数据是否达到预设上传条件,若是,则将所述存储的家庭用户行为日志数据上传,若否,则不动作。

本发明还提供一种基于智能电视的家庭用户行为数据采集装置,包括:

用户行为数据处理模块,用于判断是否收到智能电视的用户行为数据,若是,则生成当前用户行为日志,并进入在线设备数据处理模块,若否,则不动作;

在线设备数据处理模块,用于获取智能电视所在家庭网络的在线设备数据并生成当前在线设备日志,对当前在线设备日志进行预处理;

家庭日志数据生成模块,用于根据当前用户行为日志和预处理后的当前在线设备日志生成家庭用户行为日志数据并存储。

更优的,所述在线设备数据处理模块包括:

在线设备数据采集单元,用于读取智能电视所在家庭网络的网络设备的arp表,生成当前在线设备日志;其中,所述当前在线设备日志包括日志时间、智能电视mac、在线设备mac和在线设备ip;

在线设备数据过滤单元,用于过滤不需保存的当前在线设备日志。

更优的,所述在线设备数据过滤单元包括:

第一日志过滤组件,用于获取待过滤日志设备mac集合,过滤当前在线设备日志中的在线设备mac与待过滤日志设备mac集合中的设备mac相同的当前在线设备日志;

第二日志过滤组件,用于过滤当前在线设备日志中的在线设备mac为智能电视mac的当前在线设备日志;

第三日志过滤组件,用于过滤当前在线设备日志中的在线设备ip后缀为.1和.255的当前在线设备日志。

更优的,所述在线设备数据处理模块还包括:

在线设备类型识别单元,用于确定当前在线设备日志中的在线设备mac对应的设备类型,将所述当前在线设备日志更新为包括日志时间、智能电视mac、在线设备mac和设备类型;

在线设备日志筛选单元,用于按照预设的日志筛选条件筛选出待分析的当前在线设备日志,遍历待分析的当前在线设备日志,更新当前在线设备mac列表。

更优的,所述在线设备类型识别单元包括:

设备类型获取组件,用于获取设备mac对应设备类型列表;

设备类型查询组件,用于在所述设备mac对应设备类型列表中查询并获得当前在线设备日志中的在线设备mac对应的设备类型;

设备类型更新组件,用于当在所述设备mac对应设备类型列表中未能查询到,则通过其他在线方式查询在线设备mac对应的设备类型,并将在线设备mac与查询到的对应设备类型更新到设备mac对应设备类型列表中。

更优的,所述用户行为数据处理模块包括:

用户行为数据处理单元,用于接收智能电视的用户行为数据,生成当前用户行为日志;所述当前用户行为日志包括日志时间、智能电视mac和用户行为数据。

更优的,所述家庭日志数据生成模块包括:

家庭日志数据生成单元,用于获取当前用户行为日志和当前在线设备mac列表,生成家庭用户行为日志数据并存储;其中,所述家庭用户行为日志数据包括日志时间、智能电视mac、用户行为数据和当前在线设备mac列表。

更优的,所述采集装置还包括:

家庭日志数据上传模块,用于判断存储的所述家庭用户行为日志数据是否达到预设上传条件,若是,则将所述存储的家庭用户行为日志数据上传,若否,则不动作。

本发明还提供一种基于智能电视的家庭用户行为数据采集装置,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序以实现上述基于智能电视的家庭用户行为数据采集方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于智能电视的家庭用户行为数据采集方法的步骤。

本申请与现有技术相比,其有益效果详细说明如下:本申请提供的基于智能电视的家庭用户行为数据采集方法,通过在采集智能电视的用户行为数据的同时采集智能电视所在家庭网络的在线设备数据,采集的数据经处理后生成家庭用户行为日志数据以供云端服务器使用。生成的家庭用户行为日志数据能够用于用户家庭画像的构建以及针对不同家庭用户的个性化节目推荐,提升了用户体验,进一步满足了客户对智能电视的个性化推荐要求。

附图说明

图1为本发明实施例一提供的一种基于智能电视的家庭用户行为数据采集方法的流程示意图;

图2为本发明实施例二提供的另一种基于智能电视的家庭用户行为数据采集方法的流程示意图;

图3为本发明实施例三提供的一种基于智能电视的家庭用户行为数据采集装置的结构示意图;

图4为本发明实施例四提供的一种基于智能电视的家庭用户行为数据采集装置的结构示意图。

具体实施方式

为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步的详细说明。

如图1所示,本发明实施例一提供一种基于智能电视的家庭用户行为数据采集方法,包括:

s1:判断是否收到智能电视的用户行为数据,若是,则进入s21,并进入s22,若否,则不动作;

s21:生成当前用户行为日志;

s22:获取智能电视所在家庭网络的在线设备数据并生成当前在线设备日志,进入s23;

s23:对当前在线设备日志进行预处理;

s3:根据当前用户行为日志和预处理后的当前在线设备日志生成家庭用户行为日志数据并存储。

需要说明的是,步骤s22中获取智能电视所在家庭网络的在线设备数据并生成当前在线设备日志的方法,包括:

s221:读取智能电视所在家庭网络的网络设备的arp表,生成当前在线设备日志;其中,所述当前在线设备日志包括日志时间、智能电视mac、在线设备mac和在线设备ip;

s222:过滤不需保存的当前在线设备日志。

具体的,步骤s222中过滤不需保存的当前在线设备日志的方法,包括:

s2221:获取待过滤日志设备mac集合,过滤当前在线设备日志中的在线设备mac与待过滤日志设备mac集合中的设备mac相同的当前在线设备日志;

s2222:过滤当前在线设备日志中的在线设备mac为智能电视mac的当前在线设备日志;

s2223:过滤当前在线设备日志中的在线设备ip后缀为.1和.255的当前在线设备日志。

其中,步骤s2221中获取待过滤日志设备mac集合的方法,可以包括:(1)获取智能电视的mac,监听智能电视联网广播;(2)通过智能电视mac向云端服务器device_server提供的api接口获取某个智能电视的待过滤日志设备mac集合exclude_device_temp。(3)如果未成功获取exclude_device_temp,则使用智能电视已经存在的exclude_device,如果获取成功则将原exclude_device替换为exclude_device_temp的值。其中,网络设备可以为路由器、交换机等网络设备。

具体的,当用户没有对智能电视进行操作时,也可以每间隔一定时间(比如3分钟),智能电视通过本地的arp表获取当前的arp信息,并生成当前在线设备日志,当前在线设备日志为<日志时间,电视mac,设备mac,设备ip>。

当过滤掉待过滤设备mac对应的当前在线设备日志后,如果还存在需上传的当前在线设备日志device_log,则进行下一步骤,否则等待下一次数据收集。下一步骤包括过滤智能电视自己mac以及ip后缀为xxx.1(网关)和xxx.255(广播)的当前在线设备日志。

需要说明的是,步骤s23中对当前在线设备日志进行预处理的方法,包括:

s231:确定当前在线设备日志中的在线设备mac对应的设备类型,将所述当前在线设备日志更新为包括日志时间、智能电视mac、在线设备mac和设备类型;

s232:按照预设的日志筛选条件筛选出待分析的当前在线设备日志,遍历待分析的当前在线设备日志,更新当前在线设备mac列表。

具体的,步骤s231中确定当前在线设备日志中的在线设备mac对应的设备类型的方法,包括:

s2311:获取设备mac对应设备类型列表;

s2312:在所述设备mac对应设备类型列表中查询并获得当前在线设备日志中的在线设备mac对应的设备类型;

s2313:若在所述设备mac对应设备类型列表中未能查询到,则通过其他在线方式查询在线设备mac对应的设备类型,并将在线设备mac与查询到的对应设备类型更新到设备mac对应设备类型列表中。

其中,步骤s2311中获取设备mac对应设备类型列表的方法,可以通过连接云端服务器,云端服务器的device_server用于保存智能电视及所在家庭网络环境设备mac及对应设备类型,存储格式为<电视mac,设备mac,设备类型>,获取设备mac对应设备类型列表也可以通过读取本地存储的设备mac对应设备类型列表。

步骤s2313中,通过其他在线方式查询在线设备mac对应的设备类型,可以通过第三方api实现。查询到以后,需要将在线设备mac与查询到的对应设备类型更新到设备mac对应设备类型列表中,可以通过本地更新或者上传到云端服务器更新。

具体的,步骤s23中对当前在线设备日志进行预处理的方法,还可以包括:

s233:过滤掉异常或者缺失字段的当前在线设备日志。对当前在线设备日志进行预处理后生成为log_clear。

具体的,步骤s232中按照预设的日志筛选条件筛选出待分析的当前在线设备日志的方法,可以过滤选出当前在线设备中设备类型为手机的日志log_phone,保存格式为<日志时间,电视mac,设备mac,设备类型,在线时长>。其中在线时长为采集间隔时间。

具体的,步骤s232中遍历待分析的当前在线设备日志,更新当前在线设备mac列表的方法,包括:(1)依次遍历每一个设备mac的日志集合,(2)以30分钟为一个时段,将mac的在线时长累加,(3)如果某时段超过30分钟,则对比前30分钟或者后30分钟是否超过30分钟,未超过则将多余部分加到其相对时间段。

需要说明的是,步骤s21中生成当前用户行为日志的方法,包括:

接收智能电视的用户行为数据,生成当前用户行为日志;所述当前用户行为日志包括日志时间、智能电视mac和用户行为数据。

需要说明的是,步骤s3中根据当前用户行为日志和预处理后的当前在线设备日志生成家庭用户行为日志数据并存储的方法,包括:

获取当前用户行为日志和当前在线设备mac列表,生成家庭用户行为日志数据并存储;其中,所述家庭用户行为日志数据包括日志时间、智能电视mac、用户行为数据和当前在线设备mac列表。

其中,当前在线设备mac列表可以为设备类型为手机的在线设备mac列表。用户行为数据包含:影片点击、播放(包含时长)、收藏等。

如图2所示,本发明实施例二还提供一种基于智能电视的家庭用户行为数据采集方法,在实施例一的基础上,采集方法还包括:

s4:判断存储的所述家庭用户行为日志数据是否达到预设上传条件,若是,则进入s5,若否,则不动作;

s5:将所述存储的家庭用户行为日志数据上传。

具体的,将家庭用户行为日志上传至云端服务器的条件可以为:(1)监控文件大小是否超过1m,如果超过则上传;(2)定时(每1分钟)将日志文件上传。

云端服务器接收日志并清洗的方法包括:(1)日志服务器接收日志,(2)清洗数据,包括数据缺失或者格式不标准的数据,(3)如果同一影片有播放事件,则去除相应的点击事件。

如图3所示,本发明实施例三提供一种基于智能电视的家庭用户行为数据采集装置,包括:

用户行为数据处理模块,用于判断是否收到智能电视的用户行为数据,若是,则生成当前用户行为日志,并进入在线设备数据处理模块,若否,则不动作;

在线设备数据处理模块,用于获取智能电视所在家庭网络的在线设备数据并生成当前在线设备日志,对当前在线设备日志进行预处理;

家庭日志数据生成模块,用于根据当前用户行为日志和预处理后的当前在线设备日志生成家庭用户行为日志数据并存储。

需要说明的是,在线设备数据处理模块包括:

在线设备数据采集单元,用于读取智能电视所在家庭网络的网络设备的arp表,生成当前在线设备日志;其中,所述当前在线设备日志包括日志时间、智能电视mac、在线设备mac和在线设备ip;

在线设备数据过滤单元,用于过滤不需保存的当前在线设备日志。

其中,在线设备数据过滤单元包括:

第一日志过滤组件,用于获取待过滤日志设备mac集合,过滤当前在线设备日志中的在线设备mac与待过滤日志设备mac集合中的设备mac相同的当前在线设备日志;

第二日志过滤组件,用于过滤当前在线设备日志中的在线设备mac为智能电视mac的当前在线设备日志;

第三日志过滤组件,用于过滤当前在线设备日志中的在线设备ip后缀为.1和.255的当前在线设备日志。

具体的,在线设备数据处理模块还包括:

在线设备类型识别单元,用于确定当前在线设备日志中的在线设备mac对应的设备类型,将所述当前在线设备日志更新为包括日志时间、智能电视mac、在线设备mac和设备类型;

在线设备日志筛选单元,用于按照预设的日志筛选条件筛选出待分析的当前在线设备日志,遍历待分析的当前在线设备日志,更新当前在线设备mac列表。

其中,在线设备类型识别单元包括:

设备类型获取组件,用于获取设备mac对应设备类型列表;

设备类型查询组件,用于在所述设备mac对应设备类型列表中查询并获得当前在线设备日志中的在线设备mac对应的设备类型;

设备类型更新组件,用于当在所述设备mac对应设备类型列表中未能查询到,则通过其他在线方式查询在线设备mac对应的设备类型,并将在线设备mac与查询到的对应设备类型更新到设备mac对应设备类型列表中。

需要说明的是,用户行为数据处理模块包括:

用户行为数据处理单元,用于接收智能电视的用户行为数据,生成当前用户行为日志;所述当前用户行为日志包括日志时间、智能电视mac和用户行为数据。

需要说明的是,家庭日志数据生成模块包括:

家庭日志数据生成单元,用于获取当前用户行为日志和当前在线设备mac列表,生成家庭用户行为日志数据并存储;其中,所述家庭用户行为日志数据包括日志时间、智能电视mac、用户行为数据和当前在线设备mac列表。

如图4所示,本发明实施例四还提供一种基于智能电视的家庭用户行为数据采集装置,在实施例三的基础上,采集装置还包括:

家庭日志数据上传模块,用于判断存储的所述家庭用户行为日志数据是否达到预设上传条件,若是,则将所述存储的家庭用户行为日志数据上传,若否,则不动作。

图3和图4所对应实施例中特征的说明可以参见图1和图2所对应实施例的相关说明,这里不再一一赘述。

本发明实施例五还提供一种基于智能电视的家庭用户行为数据采集装置,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序以实现上述基于智能电视的家庭用户行为数据采集方法的步骤。

本发明实施例六还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于智能电视的家庭用户行为数据采集方法的步骤。

本发明的发明原理:普通家庭均使用一个路由器,并且现有智能设备均可联网。通过读取本地arp表获取当前网络中的设备信息,与获取的用户对智能电视的操作信息结合处理后定时/定量的将数据上报至大数据中心(云端服务器),大数据中心通过对数据分析挖掘用户的家庭网络其它设备使用行为、网络中智能设备数量(手机、电脑、pad、音箱等)运转情况、不同时段家庭用户成员数及正在使用设备的成员、家庭智能设备的运转情况构建家庭用户画像。

以上对本发明实施例所提供的一种基于智能电视的家庭用户行为数据采集方法、装置和计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1