一种信息推荐方法及装置、计算机可读存储介质与流程

文档序号:17587850发布日期:2019-05-03 21:29阅读:183来源:国知局
一种信息推荐方法及装置、计算机可读存储介质与流程
本发明涉及大数据分析与计算领域,尤其涉及一种信息推荐方法及装置、计算机可读存储介质。
背景技术
:互联网的蓬勃发展带来了海量信息的爆发,为了提高用户在海量信息中有针对性地获取所需信息的效率,可以通过留存分析用户兴趣获得用户需求,进而有针对性的推荐用户感兴趣的信息。目前主流的留存分析计算方法是对数据进行采集,上传至高吞吐量的分布式发布订阅消息系统,用于处理网站中的所有动作流数据,如网页浏览、搜索或者其他访问对象的访问数据,该留存分析使用hive脚本语言,根据用户主动标识、用户关注关系或者分析用户特征来获取推荐信息。然而,现有的留存分析计算方法为一种t+1模式的离线计算模型,对离线的数据进行留存分析,存在准确度低的问题,且现有的留存分析仅仅基于留存分析结果直接获取推荐信息,存在信息推荐缺乏灵活性的问题。技术实现要素:为解决上述技术问题,本发明实施例期望提供一种信息推荐方法及装置、计算机可读存储介质,能够基于访问对象进行有针对性的推荐,提升了信息推荐的灵活性。本发明的技术方案是这样实现的:第一方面,本发明实施例提供一种信息推荐方法,所述方法包括:获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果;根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。第二方面,本发明实施例提供一种信息推荐装置,所述装置包括:获取单元,用于获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;确定单元,用于根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;聚类单元,用于根据所述各访问方对于所述各被访问对象的访问留存量,对所述各访问方进行聚类;推荐单元,用于根据聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。第三方面,本发明实施例提供一种信息推荐装置,其中,所述信息推荐装置至少包括处理器、存储有所述处理器可执行指令的存储器、通信接口,以及用于连接所述处理器、所述存储器和所述通信接口的总线,当所述指令被执行时,所述处理器执行时实现上述实施例提供的信息推荐方法。第四方面,本发明实施例提供一种计算机可读存储介质,其上存储计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的信息推荐方法。本发明实施例提供了一种信息推荐方法及装置、计算机可读存储介质,该信息推荐方法包括:获取实时流数据;实时流数据包括:各被访问对象的标识与各访问方对于各被访问对象的登录时刻的映射关系;根据映射关系,确定各访问方对于各被访问对象的访问留存量;根据访问留存量,对各访问方进行聚类,得到聚类结果;根据聚类结果,向各访问方推荐与聚类中心相对应的被访问对象。也就是说,一方面,本发明实施例获取实时流数据,能够基于实时流数据进行实时有效的留存分析,另一方面,在获取访问留存信息之后,还利用留存信息对各访问方进行聚类,并针对聚类结果进行信息推荐,如此,能够基于各访问方进行有针对性的推荐,提高了信息推荐的灵活性和准确性。附图说明图1为本发明实施例提供的一种信息推荐方法的实现流程示意图一;图2为本发明实施例提供的一种信息推荐方法的实现流程示意图二;图3为本发明实施例提供的一种信息推荐方法的实现流程示意图三;图4为本发明实施例提供的一种信息推荐方法的实现流程示意图四;图5为本发明实施例提供的一种信息推荐方法的实现流程示意图五;图6为本发明实施例提供的一种信息推荐方法的实现流程示意图六;图7为本发明实施例提供的一种信息推荐方法的实现流程示意图七;图8为本发明实施例提供的一种信息推荐装置组成结构示意图一;图9为本发明实施例提供的一种信息推荐装置组成结构示意图二。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。实施例一本发明实施例提供一种信息推荐方法,应用于信息推荐装置中,图1为本发明实施例提供的一种信息推荐方法的实现流程示意图一,如图1所示,在本发明实施例提供的一种信息推荐方法中的信息推荐装置实现信息推荐方法可以包括步骤101至步骤104。如下:步骤101、获取实时流数据。本发明实施例中,为了解决目前的留存分析采用离线计算模型存在的计算数据量大和无法得到实时有效留存分析的问题,本发明实施例通过信息推荐装置获取实时流数据,其中,实时流数据包括:各被访问对象的标识与各访问方对于各被访问对象的登录时刻的映射关系。需要说明的是,信息推荐装置包括实时流系统和业务系统,该实时流系统是将业务系统产生的数据进行实时收集,交由流处理框架进行数据处理、统计,入库,并通过可视化的方式对统计结果进行实时展示;留存分析是判断各访问方访问各被访问对象是否持久的一种统计方法,可以最直观的监测到各访问方是否转化成为稳定的访问方,从而让各被访问对象的运营商以及开发了解访问方对各被访问对象的吸引程度。本发明实施例中,上述各被访问对象的标识用于表征访问方访问各被访问对象上的页面或者元素。需要说明的是,在访问方进行访问的过程中,访问类型包括注册访问类型和登录访问类型,依据不同的访问类型,对应的处理方式不同,因此,本发明实施例在获取实时流之前需要先确定访问方的访问类型。进一步,本发明实施例中信息推荐装置获取实时数据流可以包括:获取各访问方访问各访问对象的访问信息;当确定访问类型为登录访问时,获取各被访问对象的登录时刻;根据登录时刻和各被访问对象的标识,获取实时流数据。需要说明的是,访问信息包括各访问对象的标识和访问类型,访问类型用于表征各访问方的访问行为是登录访问还是注册访问,当确定是登录类型时,获取访问标识和登录时刻,生成的实时数据流可以是login—访问方—登录时刻—被访问对象的标识;当确定是注册类型时,表明该用户刚注册,需要记录下一次登录时刻,进而得到实时流数据。示例性的,实时数据流可以是login—a—2018-06-26—a页面。步骤102、根据映射关系,确定各访问方对于各被访问对象的访问留存量。本发明实施例中,信息推荐装置在获取实时流数据之后,根据映射关系,确定各访问方对于各被访问对象的访问留存量。需要说明的是,访问留存量可以表示为访问方—第一次登录时刻—登录时间差—被访问对象的标识—次数,其中,登录时间差是根据各访问方对于各被访问对象的登录时刻确定的,次数是根据各访问方在该登录时刻访问各访问对象的次数确定的。示例性地,访问留存量可以是a—2018-06-24—10—a页面—n,通过该访问留存量可以得到访问方a在第一次登录被访问对象为2018-06-24之后,间隔10天访问该被访问对象的标识对应的a页面的次数为n。需要说明的是,信息推荐装置根据映射关系,确定各访问方对于各被访问对象的访问留存量可以包括:对预设时间段内的实时数据流对应的映射关系进行去重处理,得到去重后的映射关系;对去重后的映射关系进行留存分析,得到各访问方对于各被访问对象的访问留存量,其中访问留存量包括被访问对象的留存量和访问方留存量。步骤103、根据访问留存量,对各访问方进行聚类,得到聚类结果。本发明实施例中,信息推荐装置在根据所述映射关系,确定各访问方对于各被访问对象的访问留存量之后,根据各访问方对于各被访问对象的访问留存量,对各访问方进行聚类,得到聚类结果。需要说明的是,信息推荐装置可以通过k-means聚类算法对各访问方对于各被访问对象的访问留存量进行分析,实现对各访问方进行聚类,其中,k-means算法是一个重复移动类中心点的过程,把类的中心点即质心,移动到其包含成员的平均位置,然后重新划分其内部成员。其中,k是算法计算出的超参数,表示类的数量;k-means可以自动分配样本到不同的类,但是不能决定究竟要分几个类;k必须是一个比训练集样本数小的正整数;类的数量可以是由问题内容指定的;k-means的参数是类的质心位置和其内部观测值的位置,其与广义线性模型和决策树类似,k-means参数的最优解也是以成本函数最小化为目标。成本函数是各个类畸变程度之和,每个类的畸变程度等于该类中心与其内部成员位置距离的平方和。若类内部的成员彼此间越紧凑则类的畸变程度越小,反之,若类内部的成员彼此间越分散则类的畸变程度越大。求解成本函数最小化的参数就是一个重复配置每个类包含的观测值,并不断移动类质心的过程。实际上,质心位置可以随机选择观测值的位置。每次迭代的时候,k-means算法会把观测值分配到离它们最近的类,然后把质心移动到该类全部成员位置的平均值,该k-means成本函数如公式(1)为:其中,成本函数为v,k聚类个数,xj代表数据集,si代表xj数据集维度,ui代表聚类中心。步骤104、根据聚类结果,向各访问方推荐与聚类中心相对应的被访问对象。本发明实施例中,信息推荐装置在对各访问方进行聚类之后,根据聚类结果,向各访问方推荐与聚类中心相对应的被访问对象。需要说明的是,聚类结果可以是通过k-means聚类算法得到k个聚类中心,再通过该k个聚类中心可以得到各访问方相对应的被访问对象,即可以得到各访问方感兴趣的被访问对象,并将其推荐给对应的访问方。示例性地,访问方a通过k-means算法得到该访问方a属于聚类中心a,则表明聚类中心a对应的页面或者元素为访问方a感兴趣的页面或者元素,将聚类中心a对应的页面或者元素作为待推荐信息,推荐给访问方象a。图2为本发明实施例提供的一种信息推荐方法的实现流程示意图二,如图2所示,在本发明实施例提供的一种信息推荐方法中的信息推荐装置根据映射关系,确定各访问方对于各被访问对象的访问留存量,即步骤102的过程可以包括步骤102a和步骤102b。如下:步骤102a、根据映射关系,确定各访问方访问各被访问对象的访问次数。本发明实施例中,信息推荐装置根据各被访问对象的标识与各访问方对于各被访问对象的登录时刻的映射关系,确定各访问方访问各被访问对象的访问次数。需要说明的是,如果访问方在某个日期访问了被访问对象,则表明访问方访问被访问对象的访问次数为1次,如果访问方在该日期再次访问了该被访问队形,则表明该访问方访问被访问对象的访问次数为2次,依次对访问次数进行累加,即可统计得到各访问方访问各访问对象的访问次数。示例性地,实时数据流为login—a—2018-06-30—a页面,访问方a在2018-06-30再次访问了a页面为n次,则在2018-06-30这一天访问方a访问a页面的访问次数为n+1。步骤102b、根据访问次数以及各访问方访问各被访问对象的登录时刻,确定各访问方对于各被访问对象的访问留存量。本发明实施例中,信息推荐装置在得到各访问方访问被各访问对象的访问次数和登录时刻之后,可以根据该访问次数和登录时刻来得到各访问方对于各被访问对象的访问留存量。示例性地,实时访问数据流是login—a—2018-06-30—a页面,对应第一次访问时间为2018-06-24,访问时间差为6,访问次数为3,则可以得到访问留存量为a—2018-06-24—6—a页面—3,表示访问方a在第一次访问时间2018-06-24间隔6天后访问a页面的访问次数为3。图3为本发明实施例提供的一种信息推荐方法的实现流程示意图三,如图3所示,在本发明实施例提供的一种信息推荐方法中的信息推荐装置根据访问次数以及各访问方访问各被访问对象的登录时刻,确定各访问方对于各被访问对象的访问留存量,即步骤102b的过程包括步骤102b1、步骤102b2和步骤102b3。如下:步骤102b1、根据各访问方,从预设数据库中查找各访问方访问各被访问对象的第一次登录时刻。本发明实施例中,信息推荐装置中预设数据库存储的是各访问方第一次访问各访问对象的时刻或者各访问方注册各访问对象的时刻。示例性地,该预设数据库存储的信息可以为:login—a—2018-06-24—a页面、login—b—2018-05-24—a页面、login—c—2018-04-24—a页面。进一步,信息推荐装置根据各访问方,从预设数据库中查找各访问方访问各被访问对象的第一次登录时刻,包括:根据各访问方,从预设数据库中获取各访问方访问各被访问对象的历史标识和历史登录时刻;当确定历史标识与各被访问对象的标识一致时,将历史登录时间作为各访问方访问各被访问对象的第一次登录时刻。需要说明的是,信息推荐装置如果得到的实时数据流是login—访问方—登录时刻—各被访问对象标识,则需要通过各访问方从预设访问数据库中查找出该访问方访问各访问对象对应的历史数据流,历史数据流包括该访问方第一次访问各访问对象的历史标识对应的历史登录时刻;如果得到的实时数据流是register—访问方—注册时刻,则记录下一次的访问时刻,然后基于下一次访问时刻进行处理,得到对应的留存量。如果确定历史标识与被访问对象的标识一致,则表明该访问方访问了相同的历史标识,便可以从数据库中查找到第一次访问该历史标识的历史登录时刻;如果确定预设数据库中没有与被访问对象的标识一致的历史标识,则表明该访问方是第一次访问该被访问对象的该访问标识,对此,需要将该访问方访问该被访问对象的信息进行记录,存储在预设数据库中,便于进行下次计算。示例性地,实时数据流为login—a—2018-06-30—a页面,从预设数据中查找对应的历史数据流为login—a—2018-06-24—a页面,则确定历史标识与被访问对象的标识一致,对应地可以得到访问a页面的第一次登录时刻为2018-06-24。当实时数据流为login—a—2018-06-30—a页面,对应的预设数据库中访问方a没有访问过访问标识对应的a页面,则将该访问方访问该被访问对象的信息进行记录,即login—a—2018-06-30—a页面,存储在预设数据库中。步骤102b2、根据各访问方访问各被访问对象的登录时刻和第一次登录时刻,获取登录时刻差。本发明实施例中,信息推荐装置在得到实时数据流的登录时刻和第一次登录时刻之后,通过对该登录时刻和第一次登录时刻进行差值处理,便可以得到登录时刻差。示例性地,查找预设数据库得到的第一次登录时刻为2018-06-24,各访问方访问各被访问对象的登录时刻为2018-06-30,则对应的登录时刻差为6。步骤102b3、根据登录时刻差和访问次数,确定各访问方对于各访问对象的访问留存量。本发明实施例中,信息推荐装置在获取登录时刻差和访问次数之后,可以根据登录时刻差和访问次数,确定各访问方对于各访问对象的访问留存量。示例性地,如果实时数据流为login—a—2018-06-30—a页面,在2018-06-30当天再次访问过a页面,其在预设数据库中对应的历史数据流为login—a—2018-06-24—a页面,则可以得到对应的登录时刻差为6,访问次数为2,进而根据登录时刻差和访问次数,确定该访问方a访问a页面的留存量为a—2018-06-24—2—a页面—2。图4为本发明实施例提供的一种信息推荐方法的实现流程示意图四,如图4所示,在本发明实施例提供的一种信息推荐方法中的信息推荐装置在根据访问留存量,对各访问方进行聚类之前,即步骤103之前,信息推荐装置还可以包括步骤105。如下:步骤105、根据各访问方在预定时间长度内对于各被访问对象的访问留存量是否低于预设值,判定各访问方的类型。本发明实施例中,信息推荐装置在对各访问方进行聚类之前,可以根据访问方在预定时间长度内对于各被访问对象的访问留存量是否低于预设值,判定各访问方的类型。需要说明的是,访问方类型可以包括忠诚访问方和非忠诚访问方,其中,忠诚访问方用于表征在预定时间长度内对于各被访问对象的访问留存量高于预设值;非忠诚访问方用于表征该访问方在预定时间长度内对于各被访问对象的访问留存量低于预设值。本发明实施例中,信息推荐装置通过访问方在预设时间长度内对于各被访问对象的访问留存量,可以得到各访问方访问各被访问对象的次数,进而可以通过访问次数和预设值进行比较,来确定各访问方的类型,当访问次数高于预设值,确定各访问方为忠诚的访问方,当访问次数低于预设值,确定各访问方为非忠诚访问方。需要说明的是,预设时间长度可以根据实际需求进行设置,例如可以设置预设时间长度为一个月。示例性地,访问方a在预设时间长度内对于各被访问对象的访问留存量为:a—2018-06-24—n—a页面—n、a—2018-06-24—n—b页面—q、a—2018-06-24—n—c页面—x,可得,访问方a访问各被访问对象的次数为n+q+x。信息推荐装置在通过访问次数和预设值进行比较,来确定各访问方的类型之前,还需要设定活跃访问方,例如设定一个月登录天数大于20天的为活跃访问方,通过活跃访问方的留存量中得到预设时间段内的访问方访问各被访问对象的次数均值。示例性地,可以设定预设时间长度为一个月,对应的预设值为20。对应地,根据各访问方对于各被访问对象的访问留存量,对各访问方进行聚类,包括:当确定各访问方的类型为预设类型时,监控预设类型对应地各被访问对象;当确定预设类型对应地各被访问对象变化时,根据预设类型对应地各被访问对象的访问留存量,对预设类型对应地各访问方进行聚类。本发明实施例中,预设类型用于表征访问方在预定时间长度内对于各被访问对象的访问留存量高于预设值。基于上述可知,访问方在预定时间长度内对于各被访问对象的访问留存量高于预设值可以对应忠诚的访问方,也就是说,本发明实施例监控忠诚的访问方对应的各被访问对象是否发生变化。需要说明的是,本发明实施例可以是通过访问次数来确定各访问方的类型的,一旦访问方的类型发生变化后,则表明访问方访问被访问对象的次数发生改变,进而可以确定推荐给该访问方的信息可能不符合其兴趣导致其改变,因此,对于变化后的预设类型对应地各被访问对象需要重新确定给其推荐的待推荐信息。图5为本发明实施例提供的一种信息推荐方法的实现流程示意图五,如图5所示,在本发明实施例提供的一种信息推荐方法中的信息推荐装置根据各访问方对于各被访问对象的访问留存量,对各访问方进行聚类,即步骤103的过程可以包括步骤103a和步骤103b。如下:步骤103a、根据各被访问对象,设定初始质心。本发明实施例中,信息推荐装置在根据各访问方对于各被访问对象的访问留存量,对各访问方进行聚类的过程中,需要设定初始质心,才能基于该初始质心进行聚类。步骤103b、根据访问留存量和初始质心,对各访问方进行聚类,得到聚类结果。本发明实施例中,信息推荐装置在设定初始质心之后,可以通过k-means聚类算法对各访问方对于各被访问对象的访问留存量和初始质心,对各访问方进行聚类。需要说明的是,k-means聚类算法可以包括以下步骤:1)为每个聚类确定一个初始质心,即从数据集中选择k个数据,作为k个初始质心。2)将样本按照最小距离原则分配到最邻近聚类中。需要说明的是,两个点之间的距离大小采用欧氏距离公式衡量,如对于两个点t0(x1,y2)和t1(x2,y2),t0和t1之间的欧氏距离d如公式(2)为:d=sqrt((x1-x2)2+(y1-y2)2)(2)3)使用每个聚类中的样本均值作为新的聚类中心。4)重复步骤2)和3)直到聚类中心不再变化,得到k个聚类。需要说明的是,k-means聚类算法是无监督学习方式,对于大数据无需进行提前的训练与学习,可以直接进行分类统计。图6为本发明实施例提供的一种信息推荐方法的实现流程示意图六,如图6所示,在本发明实施例提供的一种信息推荐方法中的信息推荐装置根据聚类结果,向各访问方推荐与聚类中心相对应的被访问对象,即步骤104包括步骤104a、104b和步骤104c。如下:步骤104a、根据聚类结果,确定各访问方所属于的聚类中心。本发明实施例中,信息推荐装置在获取聚类中心对应的被访问对象之前,需要根据聚类结果,确定各访问方所属于的聚类中心。示例性地,聚类结果可以是访问方a[10,10,5,10]对应聚类中心a;访问方b[20,5,10,20]对应聚类中心b,其中a[10,10,5,10]用于表征不同访问方访问各被访问对象的留存量。步骤104b、从各访问对象中,获取与聚类中心对应的被访问对象。步骤104c、向各访问方推荐所述各被访问对象。本发明实施例中,信息推荐装置从聚类结果中可以获取聚类中心对应的各访问对象,将该聚类中心对应的各访问对象作为推荐信息推荐给各访问方。需要说明的是,本发明实施例是对忠诚访问方访问各访问对象发生变化后,即忠诚访问方变化成非忠诚访问方时,通过聚类算法进一步对忠诚访问进行分类,这样便可以获取变化后的忠诚访问方感兴趣的各访问对象,进而实现针对变化后的访问方进行推荐。可以理解的是,本发明实施例通过访问留存量区分访问方的不同类型,再基于访问方的类型,进行信息推荐,如此能够针对不同访问对象的类型及时调整推荐的信息,并进行有针对性的推荐信息。通过本发明实施例提供的一种信息推荐方法,一方面,根据访问时间和访问页面来分析不同对象的留存量,能够简化处理过程,减小数据处理量,并明确感兴趣的目标对象上的具体页面;另一方面,对访问对象进行分类,基于访问对象类型进行有针对性的推荐,能够提高信息推荐的准确性。实施例二基于实施例一的同一发明构思,为了更好的说明本发明实施例提供的信息推荐方法,以各被访问对象的标识对应访问页面进行举例,将上述信息推荐的方法应用在信息推荐装置中,图7为本发明实施例提供的一种信息推荐方法的实现流程示意图七,如图7所述,信息推荐装置实现信息推荐方法可以包括以下步骤:步骤201、根据访问方行为数据建立数据库。本发明实施例中,访问方行为包括登录访问行为和注册访问行为,对应地,访问行为数据包括第一次登录数据和注册数据,信息推荐装置根据访问方行为数据建立数据库,包括建立登录表和建立注册表。示例性地,上述数据库可以是非关系型数据库redis。需要说明的是,信息推荐装置建立数据库包括:首先,对不同访问方的注册时间进行存储,存储访问方和访问方注册的具体日期,设置键值key为“访问方-访问方注册的具体日期”,进而得到对应的注册表。其次,对不同访问方的第一次登录时间进行存储,需要存储三列数据,分别是访问方、访问方第一次登录的具体日期以及访问方访问的具体页面,设置key为“访问方—访问方第一次登录的具体日期—访问方访问的具体页面”,得到对应的登录表。示例性地,注册表如表1和登录表如表2。表1register—a—2018-06-10register—b—2018-05-10register—c—2018-04-10register—d—2018-04-10表2login—a—2018-06-24—a页面login—b—2018-05-24—a页面login—c—2018-04-24—a页面步骤202、获取实时访问数据流。本发明实施例中,信息推荐装置在实时数据流中采集到访问方的行为数据,访问方行为数据包括访问时间和访问信息,根据访问方行为数据,确定访问方行为类型;当访问方行为类型为登录访问类型时,对应得到的实时数据流是login—访问方—登录时刻—访问的具体页面;当确定是注册类型时,记录注册时刻,便于后续登录。示例性地,实时数据流可以是login—a—2018-06-26—a页面。步骤203、根据数据库和实时数据流,得到访问方访问页面的留存量。本发明实施例中,如果信息推荐装置中收到实时数据流为:login—a—2018-06-26—a页面,通过该访问方a查找步骤201的登录表,得到访问方a第一次的登录时刻为2018-06-24,计算此次登录时刻2018-06-26和第一次登录时刻2018-06-24的差值为2,根据差值得到的访问方a访问a页面的留存量为:a—2018-06-24—2—a页面—1;若访问方a当天再次访问了a页面,则进行累加,得到访问方a访问a页面的留存量为:a—2018-06-24—2—a页面—2,依次累加可以得到访问方a访问a页面的留存量为a—2018-06-24—2—a页面—n。如果信息推荐装置中收到实时数据流为:login—a—2018-06-30—a页面,对应地访问方a于登录时刻2018-06-30登录了a页面,通过该访问方a找到第一次的登录时刻为2018-06-24,计算此次登录时刻2018-06-30和第一次登录时刻2018-06-24的差值为:6,得到访问方a访问a页面的留存量为:a—2018-06-24—6—a页面—1。如果信息推荐装置中收到数据流为:register—d—2018-04-10,则说明此访问方d刚注册,还未登录,需要记录下一次的登录时间,才可进行值的叠加。如果信息推荐装置中收到实时数据流为:login—a—2018-07-24—b页面,通过查找步骤201的登录表可得该访问方a此前并未访问过b页面,则将该实时数据流记录到登录表中。本发明实施例,信息推荐装置通过上述对实时数据流进行计算,可得访问方在某段时间差内访问页面的次数,如得到访问方访问页面的留存量为:a—2018-06-24—10—a页面—n,则表明访问方a第一次4登录a页面的登录时刻为2018-06-2,10天后的当日访问该a页面的次数为n。步骤204、对预设时间段内的访问方访问页面的留存量进行处理,得到访问方预设段时间内访问页面的留存量。示例性地,预设时间段内的访问方访问页面的留存量为:a—2018-06-24—10—a页面—n、b—2018-05-24—10—a页面—m、c—2018-04-24—10—a页面—p、a—2018-06-24—10—b页面—q、b—2018-05-24—10—b页面—r、c—2018-04-24—10—b页面—s、a—2018-06-24—10—c页面—x、b—2018-05-24—10—c页面—y、c—2018-04-24—10—c页面—z。通过上述访问方访问页面的留存量可知,所述访问方第一次登录页面,10天后访问a页面的总留存量为n+m+p,b页面的总留存量为q+r+s,c页面的总留存量为x+y+z,此被访问对象假设只有a,b,c三个页面,则此被访问对象的总留存量为all:n+m+p+q+r+s+x+y+z。a页面的留存率为(n+m+p)/all,b页面的留存率为(q+r+s)/all,c页面的留存率为(x+y+z)/all。由上述访问方访问页面的留存量亦可得到相对应第一次注册之后的用户留存量以及留存率:访问方在第一次注册了此被访问对象之后,使用去重统计,经过10天之后的留存量为a、b、c三个访问方,则访问方留存量为3,一开始注册的访问方数量为a+b+c+d,总的用户留存率为3/(a+b+c+d)。步骤205、通过对访问方预设段时间内访问页面的留存量进行分析,确定忠诚的访问方本发明实施例中,信息推荐装置对访问方预设段时间内访问页面的留存量进行分析包括:统计访问方在预设时间段内访问天数;对访问方每天访问被访问对象上所有页面的次数进行累加统计,依次可得用访问方在任何时间段内访问被访问对象上所有页面的次数,可以得到一个访问目标对象上所有页面的次数表。示例性地,如果实时访问统计数据流为a—2018-06-24—n—a页面—n、a—2018-06-24—n—b页面—q、a—2018-06-24—n—c页面—x至a—2018-06-24—n—n页面—z,则得到用户设备每天访问目标对象上所有页面的次数为n+q+x+…+z。假设预设时间段为一个月,设置一个月访问天数大于20天的为活跃访问方,同时从得到的活跃访问方对应的次数表中,取出其在一个月内的每日访问此被访问对象的次数均值,对应的,通过访问方访问次数和该次数均值,并可以可将被访问对象上的访问方分为忠诚访问方和非忠诚访问方,具体地,当访问方访问次数大于或等于次数均值时,确定该访问方为忠诚访问方,当访问方访问次数小于次数均值时,确定该访问方为非忠诚访问方。示例性地,设定一个月内的每日访问此被访问对象的次数均值为20,则如果访问方a一个月内的每日访问被访问对象的次数大于等于20,确定对应的访问方a为忠诚访问方,否则确定为非忠诚访问方。针对忠诚访问方,只要实时监督此类忠诚访问方是否变成非忠诚访问方,一旦变成非忠诚访问方,则对该非忠诚访问方进行聚类。步骤206、当监测到忠诚访问方变化成非忠诚访问方时,对非忠诚访问方进行k-means算法,获取待推荐信息。本发明实施例中,信息推荐装置针对非忠诚访问方做k-means聚类算法的,选取非忠诚访问方,分时期用该选取的非忠诚访问方对应的访问页面对非忠诚访问方进行个性化推荐,并对个性化推荐后的数据进行留存计算,以及查看固定时间段内的访问天数是否增多,分别比对使用不同页面做个性化推荐对访问方数量的影响效果,从而获得最能吸引非忠诚访问方的页面,就将此页面作为个性化推荐的首页。示例性地,如表3的数据集,该表3统计了z类页面,每行的数据代表每个特定用户在某个时间差内,访问各页面的留存量。表3a页面b页面c页面……z页面10105……1020510……20…………………………51020……1假设统计了2000人的数据,将上述形式的数据作为数据集。设置k为z,对应地,该数据集一共有z个质心,接着选了取1500个样本作为测试集,对应地,输出的内容一共有1500行。通过对上述数据集进行聚类统计,得到实验过程中输出z个质心坐标数据为:第0类型聚类中心坐标为[a,b,c….];第1类型聚类中心坐标为[d,e,f….];第2类型聚类中心坐标为[i,j,k….];……;第z-1类型聚类中心坐标为[x,y,z….],其中,0-z聚类中心分别代表所分成的z类。得到的聚类输出的实验结果为:访问方a[10,10,5…..10]属于第1类型聚类中心;访问方b[20,5,10…..20]属于第1类型聚类中心;……;访问方z[5,10,20…..1]属于第1类型聚类中心。由上述实验结果可知,此被访问对象最能吸引访问方的页面为每个聚类中心坐标对应的页面,从而对访问方进行定制化的推荐。另外,在实际情况中,某一个访问方通常不仅仅具有一个兴趣,若想得到此访问方关注的页面的前三名,可以在代码运算过程中,每得到一个聚类的中心,计算保存此访问方访问页面的坐标点与聚类中心点间的距离,并在每一次迭代过程中,对此距离进行迭代。在最后的输出结果中,将此坐标点与各中心点的距离进行比较,输出前三名页面。同时,若实现对每个访问方对应的页面进行个性化内容推荐有困难,也可以利用k-means算法将各访问方聚集成有限类,实现各访问方的分类,针对有限类各访问方进行个性化内容的基本匹配与推荐,降低难度的同时,也能匹配用户的喜好内容。步骤207、将待推荐信息推荐给非忠诚访问方。通过本发明实施例,以访问方登录时刻和登录次数计算访问方访问被访问对象的留存量,既能够简化处理过程,同时能够挖掘出不同访问方对应的具体感兴趣的页面;另一方面,本发明实施例先对访问方进行分类,再基于变化后的非忠诚访问方进行有针对性的推荐,能够实时调整推荐信息,提高了信息推荐的准确度。实施例三基于实施例一至实施例二的同一发明构思,本发明实施例提供一种信息推荐装置,图8为本发明实施例提供的一种信息推荐装置组成结构示意图一,如图8所示,在本发明实施例中,信息推荐装置1000包括获取单元1001、确定单元1002、聚类单元1003和推荐单元1004,其中,所述获取单元1001,用于获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;所述确定单元1002,用于根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;所述聚类单元1003,用于根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果;所述推荐单元1004,用于根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。在其他实施例中,所述确定单元1002可以包括:第一确定单元1002a,用于根据所述映射关系,确定所述各访问方访问所述各被访问对象的访问次数;根据所述访问次数以及所述各访问方访问所述各被访问对象的登录时刻,确定所述各访问方对于所述各被访问对象的访问留存量。在其他实施例中,所述装置1000还可以包括:判定单元1005,用于根据所述访问方在预定时间长度内对于所述各被访问对象的访问留存量是否低于预设值,判定所述各访问方的类型。在其他实施例中,所述聚类单元1003可以包括:第一聚类单元1003a,用于根据所述各被访问对象,设定初始质心;根据所述访问留存量和所述初始质心,对所述各访问方进行聚类。在其他实施例中,所述推荐单元1004可以包括:第二确定单元1004a,用于根据聚类结果,确定所述各访问方所属于的聚类中心;第一获取单元1004b、用于从所述各访问对象中,获取与所述聚类中心对应的被访问对象;第一推荐单元1004c,用于向所述各访问方推荐所述各被访问对象。在其他实施例中,所述第一确定单元1002a可以包括:查找单元1002a1,用于根据所述各访问方,从预设数据库中查找所述各访问方访问所述各被访问对象的第一次登录时刻;第三确定单元1002a2,用于根据所述各访问方访问所述各被访问对象的登录时刻和所述第一次登录时刻,获取登录时刻差;所述第三确定单元1002a3,用于根据所述登录时刻差和所述访问次数,确定所述各访问方对于所述各访问对象的访问留存量。通过本发明实施例,以访问方登录时刻和登录次数计算访问方访问被访问对象的留存量,既能够简化处理过程,同时能够挖掘出不同访问方对应的具体感兴趣的页面;另一方面,本发明实施例先对访问方进行分类,再基于变化后的非忠诚访问方进行有针对性的推荐,能够实时调整推荐信息,提高了信息推荐的准确度。实施例四基于实施例一至实施例三的同一发明构思,本发明实施例提供的一种信息推荐装置,图9为本发明实施例提供的一种信息推荐装置组成结构示意图二,如图9所示,上述信息推荐装置至少包括处理器01、存储器02、通信接口03及通信总线04,其中,通信总线04用于实现处理器和存储器之间的连接通信;通信接口03用于信息的接收和发送;处理器01用于执行存储器02中存储的信息推荐程序,以实现上述实施例一至实施例二提供的信息推荐方法中的步骤。通过本发明实施例,以访问方登录时刻和登录次数计算访问方访问被访问对象的留存量,既能够简化处理过程,同时能够挖掘出不同访问方对应的具体感兴趣的页面;另一方面,本发明实施例先对访问方进行分类,再基于变化后的非忠诚访问方进行有针对性的推荐,能够实时调整推荐信息,提高了信息推荐的准确度。基于前述实施例,本发明实施例提供了一种计算机可读存储介质,其上存储有信息推荐程序,上述信息推荐程序被处理器执行时实现上述一个或多个实施例中的信息推荐方法。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1