一种内容推荐方法、装置和计算设备与流程

文档序号:18797315发布日期:2019-09-29 19:53阅读:249来源:国知局
一种内容推荐方法、装置和计算设备与流程

本发明涉及计算机及互联网技术领域,尤其涉及一种内容推荐方法、装置和计算设备。



背景技术:

随着互联网技术的快速发展和电子商务的日渐普及,网络信息资源的数量急剧增长,内容提供商总是希望能够为用户推荐更多感兴趣或者需要的商品资源。传统的内容提供推荐方法是根据用户的浏览兴趣生成推广投放内容,来进行千人千面投放,但这种方法对浏览推广内容后到线索转化的过程缺少反馈,不能有效提高内容打开到线索生成的转化效率。

因此,需要提供一种能够有效促进用户生成线索转化的内容推荐方案。



技术实现要素:

为此,本发明提供一种内容推荐方法、装置和计算设备,以力图解决或至少缓解上面存在的问题。

根据本发明的一个方面,提供一种内容推荐方法,适于在计算设备中执行,该方法包括步骤:基于用户行为日志生成网站用户的用户特征,该用户特征包括属性特征、价值特征和需求特征;分析线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容,其中线索用户指在网站中留下意向线索的用户;对线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段;以及结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容,向网站用户推荐与其匹配程度高的内容

可选地,在根据本发明的内容推荐方法中,属性特征包括城市级别和年龄代际,价值特征包括家庭收入,需求特征包括产品属性偏好和产品价位偏好。

可选地,在根据本发明的内容推荐方法中,价值特征还包括价值观,需求特征还包括产品特点偏好、产品国别偏好、产品系列偏好、栏目偏好、竞品偏好、内容偏好中的一种或多种。

可选地,在根据本发明的内容推荐方法中,生成网站用户的用户特征的步骤包括:综合网站用户对具有不同需求特征的内容的浏览时长和浏览行为,计算网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。

可选地,在根据本发明的内容推荐方法中,在分析线索用户在不同浏览阶段的浏览行为和浏览内容之前,还包括步骤:生成线索用户宽表,该线索用户宽表包括线索用户的标识、联系方式、以及留下意向线索时的时间、产品和厂家;以及根据线索用户的标识查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。

可选地,在根据本发明的内容推荐方法中,浏览阶段包括关注期、粗选期、兴趣期、偏好期和意向期中的一种或多种;浏览行为包括点赞、收藏、主动搜索和对某产品留下联系方式中的一种或多种;以及关键影响内容包括行业入门性内容、产品介绍性内容、竞品比较性内容、价格计算性内容中的一种或多种。

可选地,在根据本发明的内容推荐方法中,还包括步骤:将具有相同或相似用户特征的网站用户聚合为一个族群,并根据该族群中的主要用户特征标记该族群的人群特征;以及根据该族群的人群特征向该族群中的网站用户推荐与该族群匹配程度高的内容。

可选地,在根据本发明的内容推荐方法中,每种特征按照预定规则划分为多个级别,该方法还包括步骤:生成网站用户的三维可视模型,该三维可视模型的三个坐标轴分别为属性特征、价值特征和需求特征,且每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。

可选地,在根据本发明的内容推荐方法中,三维可视模型由多个单元立方体组成,每个单元立方体中包括用户特征定位在该单元立方体中的网站用户的用户标识、用户特征和当前浏览阶段。

可选地,在根据本发明的内容推荐方法中,还包括步骤:统计用户特征定位在每个单元立方体的用户数量;将所有单元立方体按照用户数量进行降序排序,并为每个单元立方体生成一个与排序相对应的索引号;以及将具有最大用户数量的单元立方体的透明度设置为1,并将其他单元立方体的透明度设置为其用户数量与最大用户数量的比值。

可选地,在根据本发明的内容推荐方法中,还包括步骤:计算每个单元立方体所包括的用户数量在所有立方体所包括的用户数量的比例,作为对应单元立方体的占比;以及对所有单元立方体按照预定梯度值进行梯度聚类处理,分别得到核心人群占比在前n%(0≤n≤100)的立方体群体。

可选地,在根据本发明的内容推荐方法中,还包括步骤:结合各单元立方体的占比和相邻单元立方体之间的距离,将多个单元立方体聚合为多个族群;以及为每个族群生成一种显色标记,并标记每个族群的人群特征,该人群特征为族群的主要用户特征。

可选地,在根据本发明的内容推荐方法中,相邻单元立方体之间的距离为相邻单元立方体中主要用户特征的相似度。

可选地,在根据本发明的内容推荐方法中,还包括步骤:综合族群中所有单元立方体的占比来计算族群的占比,并将多个族群按照其族群占比进行降序排序,以分别显示具有不同占比的族群。

根据本发明的另一个方面,提供一种内容推荐装置,适于驻留在计算设备中,该装置包括:特征生成模块,适于基于用户行为日志生成网站用户的用户特征,该用户特征包括属性特征、价值特征和需求特征;内容分析模块,适于收集线索用户在不同浏览阶段的浏览行为和浏览内容,从中分析不同浏览阶段的关键影响内容,其中线索用户指在网站中留下意向线索的用户;阶段预测模块,适于对线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段;以及内容推荐模块,适于结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容,向网站用户推荐与其匹配程度高的内容。

可选地,在根据本发明的装置中,属性特征包括城市级别和年龄代际,价值特征包括家庭收入,需求特征包括产品属性偏好和产品价位偏好。

可选地,在根据本发明的装置中,特征生成模块适于:综合网站用户对具有不同需求特征的内容的浏览时长和浏览行为,计算网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。

可选地,在根据本发明的装置中,内容分析模块还适于:生成线索用户宽表,该线索用户宽表包括线索用户的标识、联系方式、以及留下意向线索时的时间、产品和厂家;以及根据线索用户的标识查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。

根据本发明的又一个方面,提供一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,该一个或多个程序被处理器执行时实现如上所述的内容推荐方法的步骤。

根据本发明的又一个方面,存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,该指令当由计算设备执行时实现如上所述的内容推荐方法的步骤。

根据本发明的技术方案,能够预测出网站用户所处的当前浏览阶段,并结合该网站用户的属性特征、价值特征和需求特征来向该用户推荐与其用户特征和当前浏览阶段最为匹配的内容。该方案能够进行更精准的推广投放,提高用户打开内容到实际线索全过程的转化效率,达到用户、媒体平台和投放客户的三方最佳匹配。

进一步地,本发明还能够将全量用户的用户特征和当前浏览阶段以三维可视化的方式进行直观呈现,帮助厂商直观地发现其目标用户的分布、主要分群和核心人群占比筛选等,并进行针对性的内容推荐。该方案保证了内容的定制型,节约了内容曝光资源。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的计算设备100的结构框图;

图2示出了根据本发明一个实施例的内容推荐方法200的流程图;

图3和图4分别示出了根据本发明一个实施例的uvn-b三维可视模型的示意图;以及

图5示出了根据本发明一个实施例的内容推荐装置500的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1是根据本发明一个实施例的计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。程序数据124包括指令,在根据本发明的计算设备100中,程序数据124包含用于执行内容推荐方法200的指令。

计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个a/v端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个i/o端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和web服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(pda)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行内容推荐方法200。

图2示出了根据本发明一个实施例的内容推荐方法200的流程示意图。方法200在计算设备中执行,如在计算设备100中执行,以便对网站用户进行特征行为分析,从而进行针对性的网站内容推荐。

如图2所示,方法200始于步骤s210。在步骤s210中,基于用户行为日志生成网站用户的用户特征。

其中,用户行为日志例如可以是媒体平台浏览行为日志,该日志中还可包含用户所浏览的每页内容的页面内容标记(也就是企业定义的文章内容的唯一id),根据该页面内容标记可以关联出文章内容的分类标签信息,如该页面内容中所包含的产品系列、内容所在栏目、产品价格、产品所属国别等。

用户特征通常包括属性特征u、价值特征v和需求特征n,每种特征都可以预定规则划分为多个级别。属性特征可以包括城市级别和年龄代际,价值特征例如包括家庭收入和价值观,需求特征例如包括产品属性偏好和产品价位偏好。这些单个特征也同样可以分为多个级别。存在多种划分特征级别的方式,本发明都不受限于此,所有可以进行有效级别划分的方式都在本发明的保护范围之内。

对于属性特征u而言,城市级别可以划分一线城市至六线城市这六个级别,年龄代际可以将用户分为70前、70后、80后、90后和00后等。这样属性特征u的多个级别可以如图3中所示,u4.6级别代表四线城市70前,u3.6级别代表三线城市70前,u2.8级别代表二线城市80后,u1.9级别代表一线城市90后。应当理解的是,图3中将属性特征分为22个级别,其中考虑购买需求的因素忽略了五线和六线城市的70前,实际在数据统计时也可以将两种客户群体加上。

对于价值特征v而言,家庭收入可以划分划分多个级别(如五个级别),如v1级别代表10万以内,v2级别代表10-20万,v3级别代表20-30万,v4级别代表30-40万,v5级别代表50万以上。当然不限于此,也可按照其他规则而得到其他级别划分。对应于家庭收入值,还可以将网站用户划分为蓝领、白领、中产、精英等层级。另外,在进行价值特征分级时还可以加入对价值观的考虑,如用户属于保守型消费还是刺激型消费,用户更追求舒适度、宽敞性、实用性还是更追求外观。将家庭收入和用户的价值观结合起来进行价值特征分级,其具体结合及分级方法本领域技术人员可以根据需要自行设定,本发明对此不作限制。例如,v1代表10万以内保守型消费群,v2代表10万以内刺激型消费群,等等。

根据一个实施例,可以根据以下方法获取网站用户的价值观:通过对调研用户的多个价值观问题的回答语句进行分析得到调研用户的价值观,并将该价值观作为与调研用户具有其他相同或相似用户特征的网站用户的价值观。其中,调研用户是指完成了调研问卷的用户,该问卷中包含多个价值观问题,通过对这些答案进行语句和情感分析,能大致得到用户的消费观价值观。这样,若某个网站用户与某调研用户在其他用户特征方面都比较相同或相似,就可将该调研用户的价值观作为该网站用户的价值观。

对于需求特征n而言,产品价格偏好可以根据产品本身的行业价格高低值来划分第一级别、第二级别、第三级别等等。比如汽车行业可以划分为8万以下车型、8-10万车型、10-15万车型、15-20万车型、20-25万车型、25-30万车型、30-50万车型、50万以上车型等,对应的多种级别可分别标识为n0级别、n8级别、n10级别、n15级别、n20级别、n30级别和n50级别。当然也可以选择其他数值划分标准,本发明对此不作限制。产品属性偏好代表该产品的属性,如汽车产品可分为suv型车和轿车,空调产品可分为壁挂式空调和立柜式空调,等等。因此,可以相应地在价位级别后加上该产品的属性,如n20.s代表20-25万suv,n20.c代表20-25万轿车。

此外,需求特征还可以包括产品级别偏好、产品特点偏好、产品国别偏好、产品系列偏好、栏目偏好、竞品偏好和内容偏好中的一种或多种。其中,产品级别偏好可以划分为低端产品、中端产品、和高端产品等级别,还可以加入中低端产品、中高端产品这两个过渡级别,当然不限于此。产品级别偏好也可以认为是产品型号偏好,如微型产品、小型产品、紧凑型产品、中型产品、中大型产品、大型产品等。产品特点偏好也就是用户最关心的产品的卖点,例如汽车类产品用户的产品特点偏好包括外观、品牌、动力、油耗、排气量、优惠比例、用户口碑等。产品系列偏好是指用户更偏好产品的哪一系列,栏目偏好例如包括咨讯类栏目偏好、测评类栏目偏好、一级栏目、二级栏目等,竞品偏好即用户同时在看的一种或两种竞品产品,内容偏好即用户更偏好文章里包含哪些内容。

根据一个实施例,可以对各项需求特征进行打分,来计算用户对各项需求的偏好度。具体地,可以综合网站用户对具有不同需求特征的内容的浏览时长和浏览行为,来计算网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。其中,浏览行为例如可以包括点赞、收藏、主动搜索和对某产品留下联系方式等。对于需求特征的打分方式,本领域技术人员可以根据需要自行设定,本发明不作限制。例如,浏览时长每超过30s,分值加1;每发生一次浏览行为(如点赞),分值加2。若一篇内容中代表的是中端产品、动力型、咨询类文章,用户浏览时长2分钟,点赞1次、收藏1次,则该内容中这三种偏好的分值均为8。将该用户所浏览的所有内容中具有同类需求特征偏好的分值进行合并,即可计算得到该用户对某需求特征的偏好度。

此外,每个网站用户的用户特征可以用数据元组形式存储,例如用(ua,vb,nc)表示,其中,a、b、c分别代表对应特征的级别数值。(u2.8,v3,n20.c)代表用户为二线城市80后、家庭收入20-30万,偏好20-25万轿车。此外,该元组中还可以包括用户对不同需求特征的偏好度,如产品特点偏好度p1、产品国别偏好度p2、产品系列偏好度p3、栏目偏好度p4、竞品偏好度p5等等,得到(ua,vb,nc,p1,p2,p3……)。而且,每种偏好度中可以把同类的偏好度都统计出来,也可以只统计偏好度最大的那一项,如产品特点偏好度p1可以把动力偏好度、品牌偏好度、油耗偏好度等都写入到用户特征表达中,也可以只写入这些产品特点中偏好度最大的一项。

随后,在步骤s220中,分析线索用户在不同浏览阶段的浏览行为和浏览内容,得到不同浏览阶段的关键影响内容。

这里,线索用户指在网站中留下意向线索的用户,具体是指完成了所有浏览阶段并留下了意向线索的用户,意向线索一般指产生了询价操作、预约实体操作或留下联系方式等,留下意向线索也可以称之为下线索。例如,用户经过多个浏览阶段后最终对某款x型车进行了预约试驾操作,则该用户为线索用户。通过回溯线索用户的过往浏览行为和浏览内容,可以将用户的浏览阶段划分为关注期、粗选期、兴趣期、偏好期和意向期,比如关注期开始关注相关产品,粗选期是对相关产品的粗略选择期,兴趣器对某些相似的竞品产品比较感兴趣,偏好期更偏好某些特定产品,完成意向期一般代表用户比较具有购买意向。另外,不同浏览阶段可以用不同的标识表示,如分别用b1-b5表示。

根据一个实施例,可以将线索用户下线索时的时间、联系方式、产品和厂家、线索分发情况、以及该线索用户的标识记录下来,生成线索用户宽表。其中,根据线索用户的标识可以关联到后台数据库,提炼出线索用户在下线索之前的行为。也就是,可以根据线索用户的标识可查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。根据一个实施例,可以根据线索用户标识在线索表中关联到用户cookie,通过手机号获取线索用户下线索时信息,通过cookie从浏览表中获取用户的各种浏览、评论、点赞等行为信息并处理成相应的特征。

结合线索用户下线索时的时间,对线索用户下线索之前的浏览行为和浏览内容进行回溯,可以划分出不同的浏览阶段,并挖掘出不同浏览阶段的关键影响内容。该关键影响内容例如可以包括行业入门性内容、产品介绍性内容、竞品比较性内容、价格计算性内容等。此外,还可以挖掘不同浏览阶段的内容形式,例如图文类介绍、视频类介绍等。这里,每个浏览阶段内都有用户更感兴趣的内容和形式,例如意向期用户可能更需要产品价格计算,此时其关键影响内容可以是价格计算性内容,如产品报价、贷款计算、利息介绍等内容。

随后,在步骤s230中,对线索用户在不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段。

需要说明的是,存在多种对内容进行机器学习来生成预测模型的方法,本发明都不受限于此,所有可以生成能够根据用户的浏览行为和浏览内容预测用户的浏览阶段的预测模型的方式都在本发明的保护范围之内。根据一个实施例,可以将每个浏览阶段的浏览行为和浏览内容处理为相应的行为特征,例如每个浏览阶段内每个页面内容的浏览次数、点赞次数、收藏次数和浏览时长等,进一步地还可以将这多个行为特征处理为特征向量。这样,就可以收集网站用户近期(如最近两天内)的浏览行为和浏览内容,生成对应的行为特征或特征向量后,就可输入到该预测模型中得到该网站用户的当前浏览阶段。基于此,所存储的网站用户的用户特征元组中还可以加上其当年浏览阶段b(如b1或b2),代表不同的浏览阶段。

接着,在步骤s240中,结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容,向网站用户推荐与其匹配程度高的内容。

例如,若某网站用户的用户特征为二线城市80后、家庭收入20-30万,偏好20-25万轿车、处于关注期则可以多向该用户推荐20-25万的同类型竞品轿车。当然,如果用户的特征和浏览阶段是用特征元组为(u2.8,v3,n20.c,b2)表示,则也可以直接根据该特征元组来解析对应的用户特征等,并进行内容推荐。进一步地,若该用户的用户特征还包括其各项偏好度的值,比如相应的特征元组(ua,vb,nc,p1,p2,p3,……,b)为(u2.8,v3,n20.c,70%,60%,65%,……,b2),其中p1为动力偏好度,p2为德系产品偏好度,p3为五系产品偏好度,则可以多向用户推荐20-25万动力较好偏德系且与该五系产品相同或相似的产品。

从上可以看出,本发明在用户和内容上同时建立uvn-b四个维度的标签,保证内容的定制性,实现用户和内容的匹配。这样所推荐的能够最大可能的引起用户的点击和浏览兴趣,提高内容打开到线索生成的转换率。

根据一个实施例,本发明还可以生成用户分群模型(uvn-b模型),具体可将具有相同或相似用户特征的网站用户聚合为一个族群,并根据该族群的主要用户特征标记该族群的人群特征。例如,将同属于五六线城市80后、价值级别在二三级、偏好10-15万轿车的用户划分为一个族群,该族群的人群特征为低线级城市80后白领、偏好10-15万轿车。用户特征的分群可以根据每个用户的(ua,vb,nc)特征元组来实现,具有相同或相似级别数值的用户可以划分到一个族群。在上述例子中,该族群的用户们的属性特征级别均为u5.8或u6.8,价值特征级别均为v2或v3,需求特征级别为n10.c。此外,本发明还可以根据每种特征的相似度算法来计算同个族群,当每种特征的相似度都满足一定阈值(如85%)时可认为是同个族群。之后,可以根据该族群的人群特征向该族群中的网站用户推荐与该族群匹配程度高的内容。

根据另一种实现方式,本发明还可以将用户特征uvn进行三维可视化展示,得到uvn-b的三维可视模型,如图3和图4所示。具体地,以属性特征、价值特征和需求特征作为uvn坐标系的三个坐标轴参数生成网站用户的三维可视模型,每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。如图3中通过交叉uvn三个维度可以得到uvn自然分布,其中v轴有五个单位刻度,最大刻度为五级。该三维可视模型由多个单元立方体组成,每个单元立方体都有其对应的用户特征。根据某用户的三维用户特征,可将该用户唯一定位在对应的单元立方体中。例如,当某用户是六线城市80后,家庭年收入在10-20万之间,偏好10-15万的紧凑型suv,该用户就落在“六线城市-80后-v2-10-15万紧凑型suv”的自然uvn小块中。每个单元立方体中可存储定位在该单元立方体中的网站用户的用户标识、用户特征和当前浏览阶段。

此外,uvn-b三维可视模型中的单元立方体支持根据数据做热度渲染,以透明度显示,不同的单元立方体还可以设置不同的透明度,以代表该立方体中的用户数量。具体地,可以统计用户特征定位在每个单元立方体的用户数量,将所有单元立方体按照用户数量进行降序排序。之后,将具有最大用户数量的单元立方体的透明度设置为1,并将其他单元立方体的透明度设置为其用户数量与最大用户数量的比值。其中,若计算得到的透明度小于最小值(如0.3),则将透明度设置为该最小值,也就是立方体的透明度最小不会低于0.3,以保证所有立方体都处以可以查看的程度。另外,还可以为每个单元立方体生成一个与排序相对应的索引号,方便使用者能够快速定位到高密度立方体,提高数据分析效率。

进一步地,还可以计算每个单元立方体所包括的用户数量在所有立方体所包括的用户数量的比例,作为对应单元立方体的占比,并对所有单元立方体按照预定梯度值进行梯度聚类处理,以分别得到核心人群占比在前n%(0≤n≤100)的立方体群体。其中,预定梯度值可以是10%,当然不限于此,也可以是其他数值。具体地,按照用户数量降序排序的单元立方体,其对应的也是占比的降序排序,从最大占比开始累计,当达到目标占比总值(如达到60%、70%、80%等)时停止,得到这些计入目标占比总值的单元立方体。

另外,本发明可以在三维可视模型中设置标尺进度条,对应多个占比总值,其可以使用canvas等常用方法绘制,结合算法实现刻度选择及动画效果。使用者选择某个占比总值时,就可显示当前全量用户中占比为该数值的群体,方便使用者进行高密度方块群的分析。例如,图4中的标尺进度条分别可以显示出核心人群占比为0%、10%、……、100%的群体,全量用户为5170699人,包含1787个单元立方体;当选择核心人群占比为70%,显示的是图4中的群体,其共有3628145人,包含120个单元立方体。

而且,本发明还支持用户战略分群,具体可结合各单元立方体的占比和相邻单元立方体之间的距离,通过聚类算法将多个单元立方体聚合为多个族群(如8-9个族群),此时还可以计算出每个族群所包含人数在总人数的占比。其中,相邻单元立方体之间的距离可以认为是相邻单元立方体的用户特征的相似度。存在多种距离计算算法和同类聚类算法,本发明不受限于这些算法的具体形式,所有可以计算相邻立方体的距离,并根据该距离和占比来实现同类族群的聚类的方法都在本发明的保护范围之内。

此外,进一步地,还可以为每个族群生成一种显色标记,如族群1区用红色显示,族群2区用蓝色显示,以显示区分不同的族群。进一步地,还可以标记每个族群的人群特征,该人群特征为族群的主要用户特征,还可以标记各用户特征的比例和处于各浏览阶段的比例,如偏好外观的有多少比例,偏好动力的有多少比例,处于关注期的有多少比例,等等。也就是,本发明将自然分布的uvn小块根据小块的密度及彼此之间的距离通过算法聚合成大的族群,并以该族群的主要特征来命名这个族群,令使用者能快速抓住主要族群的人群特征,制定营销方案。

通常可以用下拉菜单的方式对主要族群进行排序显示,具体可按照族群占比进行降序排序,以分别单独显示不同族群分布。此外,还可以在下拉菜单第一栏中列入全部项,用于查看全部族群。如图3中右上角所示,第一项为全部用户,第二项为族群占比第一位的“低线级城市80后白领,偏好10-15万轿车”的族群。当用户在下拉菜单中选择某个族群后,或者当用户的鼠标焦点位于三维可视模型中某族群的显色区时,就显示出该族群的人群特征描述,该人群特征描述可在图下方区域(如图3中在左下角的“人群包基本属性”区)显示,也可以该族群的显色区旁边显示,本发明对此不作限制。

进一步地,本发明还可以设置轮盘选择器,分别对应top1、top2、……、top10等族群单元的快速定位与展示,其可以使用平面几何算法,结合鼠标焦点事件来实现轮盘的前滚、回滚和定位等功能,方便使用者能够快速对核心族群进行定位和分析。

需要说明的是,本发明在进行内容推荐、用户分群和uvn-b三维可视模型生成时,可针对全量网站用户来实现,不同于依赖市场调研随机抽样做出的用户分群,本发明在制定用户策略时,可实际触达每个用户而达成营销落地。当然,也可以专门筛选符合预定条件的网站用户来进行内容推荐、用户分群和三维可视模型生成,其筛选条件可以是任何条件,可以由使用者自行定义,如“选择90天内看过某车的网站用户”、“选择80天内看过某品牌的网站用户”。根据一定的筛选条件选择符合条件的网站用户。例如,图3中圈选的是“90天看过x车的网站用户”,这些用户占全量五百多万用户的89%。线索用户可参与用户分群和三维模型的生成(如使用者主要关注转换率时),也可以不参与,本发明对此不作限制。

另外,关于三维模型的前端可视化实现过程,可以分别绘制主体容器、绘制坐标轴、绘制单元立方体并生成族群功能。主体容器是一个网格组成的长方体,一个面的网格由多条横线和多条纵线组成。定义1为一个方格的尺寸,可以根据u、v、n三个轴两两结合得出6个平面的横线和总线的数量,之后使用three库中绘制线段的方法来绘制横线和纵线,将横线和纵线交叉出来的网格面进行定位处理,最终得到一个网格立方体。绘制坐标轴中,根据u、v、n坐标轴的数组长度,也就是确定每个轴所划分的级别数,得到坐标轴线段的长度,并将坐标轴的原点定位在立方体的左下角位置。

绘制轴标签时,可先使用canvas绘制文字,并将文字贴图应用在three的纹理上,之后根据标签在数组中的位置确定其在坐标轴上的位置。绘制小立方体时,用单元数据中的u、v、n值去匹配uvn坐标轴中的对应索引值,得到单元立方体在容器中的具体位置,然后绘制单位为1的小立方体,并对该立方体定位在计算好的位置上。在生成族群功能时,对族群数组进行遍历,每个族群分配一个颜色,该族群所包含的所有立方体都为该颜色,且查看单个族群时,将其他族群的数据过滤掉。

这种三维可视模型使用three库,通过算法实现三维坐标轴,根据单个数据的具体属性,将小立方体对应到相应位置,支持3d模型的放大、缩小和旋转。坐标轴支持翻转,当旋转立方体背面时,坐标轴可以进行对应的切换。模型具有可扩展性和复用性,且对计算机的性能要求较低,即使在性能不好的计算机也可以流畅显示。使用精确控制来保证3d模型的整体性能,保证在低配电脑可以稳定渲染。整个模型还可使用多种设计模式,如在观察者模式下进行全局通信交互,在策略模式下进行内容分发动作等。

图5示出了根据本发明一个实施例的内容推荐装置500,该装置500可以包含在如图1所示的计算设备100中。如图5所示,装置500包括特征生成模块510、内容分析模块520、阶段预测模块530和内容推荐模块540。

特征生成模块510基于用户行为日志生成网站用户的用户特征。其中,用户特征包括属性特征、价值特征和需求特征,属性特征包括城市级别和年龄代际,价值特征包括家庭收入,需求特征包括产品属性偏好和产品价位偏好。特征生成模块510可以进行与上面在步骤s210中描述的处理相对应的处理,这里不再展开赘述。

内容分析模块520收集线索用户在不同浏览阶段的浏览行为和浏览内容,从中分析不同浏览阶段的关键影响内容。内容分析模块520可以收集线索用户的标识和联系方式生成线索用户宽表,并根据该线索用户的标识查找线索用户的行为日志,得到其在不同浏览阶段的浏览行为和浏览内容。内容分析模块520可以进行与上面在步骤s220中描述的处理相对应的处理,这里不再展开赘述。

阶段预测模块530对不同浏览阶段的浏览行为和浏览内容进行机器学习,得到行为预测模型,并根据该行为预测模型预测网站用户的当前浏览阶段。阶段预测模块530可以进行与上面在步骤s230中描述的处理相对应的处理,这里不再展开赘述。

内容推荐模块540结合网站用户的用户特征、当前浏览阶段、以及不同浏览阶段的关键影响内容,向网站用户推荐与其匹配程度高的内容。内容推荐模块540可以进行与上面在步骤s240中描述的处理相对应的处理,这里不再展开赘述。

根据本发明的一个实施例,装置500还可以包括用户分群模块(图中未示出),该用户分群模块可以将具有相同或相似用户特征的网站用户聚合为一个族群,并根据该族群的主要用户特征标记该族群的人群特征,以进行该人群特征向该族群中的网站用户推荐与该族群匹配程度高的内容。

根据本发明的另一个实施例,装置500还可以包括三维可视化模块,具体可根据属性特征、价值特征和需求特征三种特征生成网站用户的三维可视模型,支持透明度热度渲染、核心人群展示、不同占比展示、族群聚类颜色展示、多种设计模式展示、标尺控制条和轮盘选择器展示等。该三维可视模块的具体生成过程和细节已在基于图2-图4中的描述中详细公开,这里不再展开赘述。

根据本发明的技术方案,打通线索用户和浏览用户的特征,结合线索用户的线索画像数据和网站用户的流量画像数据,建立uvn-b用户分群模型,并结合数据曝光转化的全过程链数据来优化内容推荐,支持全站所有产品的uvn-b用户微分群及数据三维可视化展现。三维热力图将三维模型进行网页级可视化,支持旋转和放大功能,同时保证视觉效果和网速体验。模型提供核心人群占比筛选和top10人群单元的快速定位与展示,在进行战略分群展示时还包括整体属性描述与人群单元属性描述。这些都可帮助使用者直观高效的发现其目标用户的分布和主要分群,并制定相应的市场和营销策略,提高打开推广内容到实际线索全过程的转化效率,使用户、媒体平台和广告投放方达到三方共赢的状态。

a8、如a1-a7中任一项所述的方法,每种特征按照预定规则划分为多个级别,所述方法还包括步骤:生成所述网站用户的三维可视模型,所述三维可视模型的三个坐标轴分别为所述属性特征、价值特征和需求特征,且每个坐标轴的单位刻度和最大刻度分别为对应特征的单个级别和最大级别。a9、如a8所述的方法,其中,所述三维可视模型由多个单元立方体组成,每个单元立方体中包括用户特征定位在该单元立方体中的网站用户的用户标识、用户特征和当前浏览阶段。a10、如a8或a9所述的方法,还包括步骤:统计用户特征定位在每个单元立方体的用户数量;将所有单元立方体按照用户数量进行降序排序,并为每个单元立方体生成一个与排序相对应的索引号;以及将具有最大用户数量的单元立方体的透明度设置为1,并将其他单元立方体的透明度设置为其用户数量与最大用户数量的比值。

a11、如a8-a10中任一项所述的方法,还包括步骤:计算每个单元立方体所包括的用户数量在所有立方体所包括的用户数量的比例,作为对应单元立方体的占比;以及对所有单元立方体按照预定梯度值进行梯度聚类处理,分别得到核心人群占比在前n%(0≤n≤100)的立方体群体。a12、如a8-a11中任一项所述的方法,还包括步骤:结合各单元立方体的占比和相邻单元立方体之间的距离,将所述多个单元立方体聚合为多个族群;以及为每个族群生成一种显色标记,并标记每个族群的人群特征,所述人群特征为族群的主要用户特征。a13、如a12所述的方法,其中,所述相邻单元立方体之间的距离为相邻单元立方体中主要用户特征的相似度。a14、如a12所述的方法,还包括步骤:综合族群中所有单元立方体的占比来计算族群的占比,并将所述多个族群按照所述族群的占比进行降序排序,以分别显示具有不同占比的族群。

b16、如b15所述的装置,其中,所述属性特征包括城市级别和年龄代际,所述价值特征包括家庭收入,所述需求特征包括产品属性偏好和产品价位偏好。b17、如b15所述的装置,所述特征生成模块适于:综合所述网站用户对具有不同需求特征的内容的浏览时长和浏览行为,计算所述网站用户对不同需求特征的偏好度,并将该偏好度与对应的需求特征关联存储。b18、如b15所述的装置,所述内容分析模块还适于:生成线索用户宽表,所述线索用户宽表包括所述线索用户的标识、联系方式、以及留下意向线索时的时间、产品和厂家;以及根据线索用户的标识查找线索用户的行为日志,得到线索用户在不同浏览阶段的浏览行为和浏览内容。

这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、u盘、软盘、cd-rom或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的内容推荐方法。

以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。

在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1