旅游行业用户画像构造方法、装置和计算机设备与流程

文档序号:17321973发布日期:2019-04-05 21:35阅读:1339来源:国知局
旅游行业用户画像构造方法、装置和计算机设备与流程
本申请涉及数据处理
技术领域
,特别是涉及一种旅游行业用户画像构造方法、装置、计算机设备和存储介质。
背景技术
:随着互联网技术的迅猛发展,适用于用户线上活动的各类平台应运而生。平台为了向用户提供精准推荐服务,通常以构建用户画像的方式,来了解用户的行为习惯、消费习惯等信息,以改进服务质量,提升用户体验。其中,用户画像是通过将收集到的用户信息分类并进行标签化,从而抽象得出的用户模型,例如一个用户的用户画像可以包括爱情、喜剧、中国、时尚等标签。为了丰富用户画像,常常需要获取众多的数据源的数据,例如,一种旅客画像的构造方式是,根据诸如票务系统中的订票记录、周边酒店的订单数据、餐饮订单数据、其它平台的标签数据、用户行为日志数据以及社交网络中的用户日常消息数据的等各个数据源系统中的数据,进行旅客画像。这种方式,虽然丰富了用户画像,但不仅数据收集难度大且针对性差。而用户画像的一个主要作用是进行信息推荐(例如,产品推荐),这种针对性差的用户画像也会影响信息推荐的准确度。技术实现要素:基于此,有必要针对上述技术问题,提供一种能够降低数据收集难度且可以提升用户画像的针对性的旅游行业用户画像构造方法、装置、计算机设备和存储介质。一种旅游行业用户画像构造方法,方法包括:获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息,目标用户为旅游行业用户,已浏览产品为旅游产品;根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;根据第二权重值,构造目标用户的目标用户画像。一种旅游行业用户画像构造装置,该装置包括:获取模块,用于获取目标用户的产品浏览记录信息,所述产品浏览记录信息包括已浏览产品的浏览记录信息,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品;第一处理模块,用于根据所述产品浏览记录信息确定第一权重值,所述第一权重值为所述已浏览产品的权重值;归类模块,用于根据所述已浏览产品的各产品标签对所述已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;第二处理模块,用于根据所述第一权重值确定第二权重值,所述第二权重值为各所述已浏览产品集合对应的产品标签的权重值;构造模块,用于根据所述第二权重值,构造所述目标用户的目标用户画像。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品;根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;根据第二权重值,构造目标用户的目标用户画像。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品:获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息;根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;根据第二权重值,构造目标用户的目标用户画像。上述旅游行业用户画像构造方法、装置、计算机设备和存储介质,是获取目标用户的包括已浏览产品的浏览记录信息的产品浏览记录信息,根据该产品浏览记录信息确定已浏览产品的权重值(第一权重值),根据已浏览产品的产品标签对已浏览产品进行产品归类,得到产品标签对应的已浏览产品集合,已浏览产品的权重值确定已浏览产品集合对应的产品标签的权重值(第二权重值),根据该已浏览产品集合对应的产品标签的权重值值,构造目标用户的目标用户画像。由于是根据目标用户的产品浏览记录信息构造目标用户的目标用户画像,且产品浏览记录信息方便获取,例如,从提供产品的网站(旅游网站)服务器的记录数据中获取即可,且只需要借助旅游网站数据即可,降低了数据获取难度。同时,由于产品浏览记录信息往往更能反映用户兴趣和需求,且由于第二权重值是反应产品标签的权重值,因此,基于产品浏览记录信息构造的目标用户画像往往更能满足用户需求,提升用户画像的针对性,便于提升推荐信息的准确度。附图说明图1为一个实施例中旅游行业用户画像构造方法的应用环境图;图2为一个实施例中旅游行业用户画像构造方法的流程示意图;图3为一个实施例中产品标签的建立步骤的流程示意图;图4为一个实施例中用户属性信息获取步骤的流程示意图;图5为一个实施例中预测用户属性缺失数据步骤的流程示意图;图6为一个实施例中确定第一权重值步骤的流程示意图;图7为一个实施例中预期发生时间或者/和产品预期目的地的获取步骤的流程示意图;图8为一个实施例中的用户画像可视化步骤的流程示意图;图9为一个实施例中旅游行业用户画像构造装置的结构框图;图10为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。需要说明的是,本发明实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。术语“或者/和”,描述关联对象的关联关系,表示可以存在三种关系,例如,a或者/和b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或者”的关系。本申请提供的旅游行业用户画像构造方法,可以应用于如图1所示的应用环境中。如图1所示,该旅游行业用户画像构造方法可以应用于旅游行业用户画像构造系统。该旅游行业用户画像构造系统包括终端102和服务器104。其中,终端102通过网络与服务器104通过网络进行通信。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种旅游行业用户画像构造方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤s202:获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品;这里,目标用户可以是指当前任意一个需要构造用户画像的用户;这里,已浏览产品可以是目标用户在任意一个或者多个产品服务网站上浏览过的产品,可以是任意一个种类的产品,例如,旅游产品。其中,已浏览产品的产品数量可以是一个,也可以是多个,优选是多个。这里,浏览记录信息可以是目标用户的各种浏览行为的记录信息,该浏览行为可以但不限于是点击、浏览时长、搜索、收藏、询问以及购买等行为。步骤s204:根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;其中,在已浏览产品中包括多个产品时,分别根据已浏览产品中的各个产品的浏览记录信息确定各个产品对应的第一权重值。例如,根据第i个产品的浏览记录信息确定第i个产品对应的第一权重值,其中,i=1,2,3,...,m,m为已浏览产品中的产品总数。步骤s206:根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;这里,已浏览产品的中的任意两个不同产品的产品标签的数量以及种类可以相同,也可以不同。同一已浏览产品集合中的全部产品至少具有一个相同的产品标签;具体地,可以是服务器确定已浏览产品中的各产品的产品标签,根据该产品标签将已浏览产品中的具有相同产品标签的各产品进行产品归类处理,得到各产品标签对应的已浏览产品集合。也可以是预处理服务器确定已浏览产品的产品标签,服务器从该预处理服务器获取已浏览产品的产品标签,根据该产品标签将已浏览产品中的具有相同产品标签的各产品进行产品归类处理,得到各产品标签对应的已浏览产品集合。步骤s208:根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;具体地,服务器可以根据第j个产品标签对应的已浏览产品集合中各产品对应的第一权重值,确定第j个产品标签的权重值,即第j个产品标签对应的第二权重值。其中,j=1,2,3,...,n,n为目标用户的已浏览产品的产品标签总个数。本领域技术人员应该可以理解,在统计产品标签总个数时,对于相同的产品标签,只统计一次。步骤s210:根据第二权重值,构造目标用户的目标用户画像;具体地,服务器可以根据第二权重值已浏览产品中的各产品的产品标签进行排序,根据该排序得到的产品标签排序构造目标用户的目标用户画像。其中,可以根据部分第二权重值(若干个较大的第二权重值)构造目标用户的目标用户画像,也可以根据全部的第二权重值构造目标用户的目标用户画像。上述旅游行业用户画像构造方法中,由于是根据目标用户的产品浏览记录信息构造目标用户的目标用户画像,且产品浏览记录信息方便获取,例如,从提供产品的网站服务器的记录数据中获取即可,且只需要借助旅游网站数据即可,降低了数据获取难度。同时,由于产品浏览记录信息往往更能反映用户兴趣和需求,且由于第二权重值是反应产品标签的权重值,因此,基于产品浏览记录信息构造的目标用户画像构建,可以更加满足用户需求,提升用户画像的针对性。为了便于理解本发明的方案,以下以目标用户的已浏览产品为表1中的10个旅游产品(产品1、产品2、产品3、...、产品10)为例。如表1所示,共有产品1、产品2、产品3、...、产品10等10个已浏览产品,每个已浏览产品有若干个产品标签,例如,产品1的产品标签是标签1、标签2和标签3,产品2的产品标签是标签3和标签4等。表1产品1标签1、标签2、标签3产品2标签3、标签4产品3标签1、标签3、标签4产品4标签2、标签3、标签4、标签5产品5标签1、标签5产品6标签3、标签5产品7标签2、标签3、标签4产品8标签1、标签2、标签3、标签4、标签5产品9标签1、标签5产品10标签2、标签4根据上述实施例方案,服务器在获取到该10个已浏览产品的浏览记录信息后,首先根据该10个已浏览产品的浏览记录信息,例如,产品的点击、浏览时长、搜索、收藏、询问以及购买等浏览记录信息,分别确定这10个已浏览产品的权重值(第一权重值)。例如,这10个已浏览产品的第一权重值分别为w1、w2、w3、...、w10。其次,根据这10个已浏览产品的产品标签对10个已浏览产品,按照产品标签进行产品归类处理,例如,表1中这10个已浏览产品共有5个产品标签,则划分成5个已浏览产品集合。依照表1,标签1对应的已浏览产品集合1是{产品1、产品3、产品5、产品8、产品9},标签2对应的已浏览产品集合2是{产品1、产品4、产品7、产品8、产品10},标签3对应的已浏览产品集合3是{产品1、产品2、产品3、产品4、产品6、产品7、产品8},标签4对应的已浏览产品集合4是{产品2、产品3、产品4、产品7、产品8、产品10},标签5对应的已浏览产品集合5是{产品4、产品5、产品6、产品8、产品9}。接着,根据上述10个已浏览产品的第一权重值w1、w2、w3、...、w10分别确定该5个已浏览产品集合对应的产品标签的权重值(第二权重值),例如,该5个已浏览产品集合对应的产品标签的第二权重值分别为k1、k2、k3、k4和k5。具体地,根据w1、w3、w5、w8和w9确定k1(标签1的第二权重值);根据w1、w2、w3、w4、w7、w8和w10确定k2(标签2的第二权重值);根据w1、w2、w3、w4、w6、w7和w8确定k3(标签3的第二权重值);根据w2、w3、w4、w7、w8和w10确定k4(标签4的第二权重值);根据w4、w5、w6、w8和w9确定k5(标签5的第二权重值)。最后,根据上述5个产品标签的第二权重值k1、k2、k3、k4和k5构造目标用户的目标用户画像。为了丰富目标用户画像的信息,在其中一个实施例中,提供一种目标旅游行业用户画像构造方法,该方法还包括:获取目标用户的用户属性信息、特定行为预期发生时间或者/和产品预期目的地;上述的根据第二权重值,构造目标用户的目标用户画像,可以包括:根据第二权重值以及该用户属性信息、特定行为预期发生时间或者/和产品预期目的地构建目标用户的目标用户画像。其中,用户属性信息包括但不限于是用户的年龄、性别等信息。产品预期目的地是指预期购买的产品对应的目的地,例如,旅游产品对应的预期旅游目的地。特定行为可以是预先选定的需要预测的一种或者多种用户行为,一般是指产品购买行为,因此,特定行为预期发生时间可以是产品预期购买时间。本实施例中用户属性信息可以根据目标用户的注册信息获取,或者根据目标用户的一些已有信息通过分类算法获得,特定行为预期发生时间或者/和产品预期目的地也可以根据目标用户的一些已有信息通过分类算法预测获得。其中,已有信息可以是已经获取到的用户属性信息,也可以是已经获取到的用户行为信息,例如,目标用户的产品浏览记录信息。采用本实施例的方案,不但可以丰富目标用户画像的信息,而且用户属性信息、特定行为预期发生时间或者/和产品预期目的地可以根据用户填写的数据以及用户行为数据获得,这些数据都可以在同一数据源系统(例如,同一产品网站)获取得到,可以不借助于其他数据源系统就可以实现用户画像的相关数据的获取,数据获取也较便捷、高效。在其中一个实施例中,本发明的目标旅游行业用户画像构造方法还可以包括产品标签的建立步骤,如图3所示,该产品标签的建立步骤,可以包括如下步骤:步骤s302:获取目标产品的产品自身信息,根据产品自身信息为目标产品添加第一类型标签;其中,产品产品自身信息是指目标产品的产品自身固定的信息,例如,对于旅游产品,可以是沙滩游、购物、出游天数、出游方式等。步骤s304:获取目标产品的用户行为信息,根据用户行为信息为目标产品添加第二类型标签;其中,目标产品可以是任意一个产品,用户行为信息可以是多个用户对该产品的行为信息。第二类型标签可以包括两类,一类是由模型定义的标签,另一类是由规则定义的标签。具体地,上述的根据用户行为信息为目标产品添加第二类型标签,可以包括:根据用户行为信息确定目标产品的用户关系模型和目标产品的当前热度信息;根据用户关系模型为目标产品添加用户关系标签,根据产品当前热度信息为目标产品添加产品热度标签,目标产品的第二类型标签包括用户关系标签和产品热度标签。其中,用户关系模型是指使用该目标产品的成员之间的关系,例如,对于旅游产品,判断用户是家庭、情侣或者好友一起出游,然后为产品添加标签亲子游、长者游、情侣游等用户关系标签。其中,可以根据用户对产品产生的点击、浏览时长、搜索、收藏、询问以及购买等行为,赋予不同的权重,在乘上一个时间衰减因子,累加得到产品当前的热度产品热度标签。步骤s306:获取目标产品的评价信息,根据评价信息为目标产品添加第三类型标签;其中,目标产品的产品标签包括第一类型标签、第二类型标签或者/和第三类型标签。本实施例中,可以使得产品标签更加体系化,同时,仅需要需要根据用户填写的数据以及用户行为数据就可以实现产品标签的建立,如上,这些数据都是可以在自己网站收集到,数据收集便利性强。需要说明的是,步骤s302、步骤s304和步骤s306可以不采用上述先后顺序,也可以同时执行。同时,产品标签的建立步骤也可以只考虑步骤s302、步骤s304和步骤s306中一个或者两个步骤。在其中一个实施例中,上述的获取目标用户的用户属性信息,可以包括:步骤s402:获取目标用户的用户属性已有数据和目标用户的用户行为数据,根据用户属性已有数据确定用户属性缺失数据;这里,用户属性已有数据是指已经获取到的用户属性数据,用户属性缺失数据是指尚未获取到的用户属性数据。这里,用户行为数据指用户对产品的浏览行为(包括点击、浏览时长、搜索、收藏、询问以及购买等行为)的数据。步骤s404:根据用户属性已有数据、该目标用户的用户行为数据以及预设的第一分类模型预测用户属性缺失数据;其中,第一分类模型采用一些分类算法进行用户属性缺失数据的预测,该分类算法可以是xgboost或者随机森林等。具体地,可以将该用户属性已有数据和该目标用户的用户行为数据作为特征量,用该用户属性缺失数据作为目标变量,使用分类算法(例如xgboost、随机森林等)去预测该用户属性缺失数据。采用本实施例中,不但可以基于已有数据构造目标用户画像,还可以对一些缺失数据进行预测,根据预测到的数据以及已有数据构造目标用户画像,可以提升目标用户画像的数据完整度。在其中一个实施例中,上述的根据用户属性已有数据、用户行为数据以及预设的第一分类模型预测用户属性缺失数据,可以包括:步骤s502:获取自身属性缺失数据的类别数目,根据类别数目确定自身属性缺失数据的预测顺序;其中,类别数目少的自身属性缺失数据先预测。步骤s504:根据自身属性已有数据、用户行为数据、预测顺序以及预设的第一分类模型预测自身属性缺失数据。采用本实施例中的方案,可以提升预测出的自身属性缺失数据的准确度。在其中一个实施例中,上述的根据产品浏览记录信息确定第一权重值,包括:步骤s602:根据已浏览产品的产品浏览记录信息,确定目标用户的各浏览行为对应的产品标识信息、行为发生时间和行为类别信息;其中,行为类别信息为表征浏览行为类别的信息。浏览行为类别包括但不限于点击、浏览时长、搜索、收藏、询问以及购买等行为;步骤s604:根据各浏览行为对应的产品标识信息、行为发生时间和行为类别信息,以及预设的时间衰减函数确定已浏览产品对应的第一权重值。时间衰减函数可以是式中,α为0到1之间的常数,tlact为用户最后一次浏览行为的发生时间,tact为目标用户的该次浏览行为的发生时间。具体地,可以首先根据产品标识信息对各浏览行为进行归类处理,得到已浏览产品中的各产品的对应的浏览行为集合;然后,根据上述的时间衰减函数以及各浏览行为对应的行为发生时间确定各浏览行为对应的时间衰减因子,其中,第k次浏览行为对应的时间衰减因子是fk,tkact为目标用户的第k次浏览行为的发生时间,其中,k=1,2,3,...,l,l为浏览行为的总数目;接着,根据各浏览行为对应的行为类别信息,确定浏览行为的行为初始权重值,将各浏览行为的行为初始权重值乘以对应的时间衰减因子,得到各个浏览行为的行为权重值,其中,各浏览行为的行为初始权重值可以根据预设的行为初始权重值与行为类别信息的关联关系确定;最后,分别将同一产品的浏览行为的行为权重值进行求和处理,得到已浏览产品中各个产品的第一权重值。本实施例中,考虑了不同时间节点对用户影响的不同,例如,时间越长影响力越小,可以提升第一权重值的准确度,进而提升所构造的用户画像的准确度。但需要说明的是,第一权重值的确定方式并不限于该实施例中提供的实现方式。例如,还可以,可以根据已浏览产品中各产品的点击次数、浏览时长、搜索次数、收藏与否、询问与否以及购买与否分别生成一个浏览参数向量,例如,该浏览参数向量为一行向量,该行向量的各元素分别为点击次数、浏览时长、搜索次数、收藏与否(收藏为1,未收藏为0)、询问与否(询问为1,未询问为0)以及购买与否(购买为1,未购买为0)。该浏览参数向量乘以预设的浏览参数权重向量,得到已浏览产品的第一权重值。浏览参数权重向量为一列向量,该列向量中的各个元素值的大小可以根据实际需要确定。在其中一个实施例中,上述的根据第一权重值确定第二权重值,可以包括:分别对各已浏览产品集合中的产品的第一权重值进行求和处理,得到第二权重值。例如,对已浏览产品集合中的产品的第一权重值直接相加得到和值,或者加权求和得到和值。在其中一个实施例中,如图7所示,上述的特定行为预期发生时间或者/和产品预期目的地的获取过程,包括:步骤s702:根据产品浏览记录信息抽取目标数据,根据目标数据构建特征变量;其中,目标数据的类型可以根据实际需要确定,例如,购买行为数据,询问行为数据等。步骤s704:确定预测对象,根据预测对象确定目标变量,预测对象包括特定行为预期发生时间或者/和产品预期目的地;步骤s706:根据特征变量、目标变量和预设的第二分类模型确定特定行为预期发生时间或者/和产品预期目的地。其中,第二分类模型采用一些分类算法进行预期发生时间或者/和产品预期目的地的预测,该分类算法可以是xgboost或者随机森林等。采用本实施例的方案,可以方便快捷的确定特定行为预期发生时间或者/和产品预期目的地。在其中一个实施例中,上述的已浏览产品为旅游产品,如图8所示,上述的旅游行业用户画像构造方法还可以包括:步骤s802:从用户属性信息中抽取目标属性数据,将目标属性数据添加到预设的用户画像显示模板中;其中,用户画像显示模板可以包括多个数据显示区,每个数据显示区中有一个或者多个数据填充位。具体地,可以从用户属性信息中抽取目标属性数据,可以根据预设的属性数据和数据填充位的关联关系,将将目标属性数据添加到预设的用户画像显示模板中对应的数据填充位。步骤s804:从产品浏览记录信息抽取已购产品的目的地信息和已购产品的成交价格信息;步骤s806:根据目的地信息和成交价格信息生成目标用户的旅行轨迹图表,将旅行轨迹图表添加到用户画像显示模板中;其中,旅行轨迹图表的横坐标可以是时间,纵坐标是成交价格。步骤s808:根据第二权重值确定各已浏览产品集合对应的产品标签的显示方式,按照显示方式将各已浏览产品集合对应的产品标签添加到用户画像显示模板中;其中,不同第二权重值的产品标签的显示方式可以是不同的,例如,第二权重值越大越突出显示,该突出显示可以是字号、字体、颜色、亮度上的突出显示。步骤s810:根据添加目标属性数据、旅行轨迹图表和产品标签后的用户画像显示模板生成用户画像显示图像。其中,可以将添加目标属性数据、旅行轨迹图表和产品标签后的用户画像显示模板,直接作为用户画像显示图像,也可以是将添加目标属性数据、旅行轨迹图表和产品标签后的用户画像显示模板,进行排版调整,得到用户画像显示图像。采用本实施例方案,可以实现用户画像的可视化显示。需要说明的是,用户画像显示图像中可以包括更多或者更少的数据,也可以包括更多或者更少的数据,例如,还可以包括会员信息(例如,会员积分、会员等级)、渠道偏好(移动终端、团体销售或者直销门店)或者支付偏好(例如,微信线上支付、微信线下支付、积分支付或者信用卡支付)。为了便于理解本发明的方案,以下以构造旅游行业的用户画像为例进行说明。1、建设标签体系,把标签分成几个层级。2、产品的标签集分为2部分,自身标签和用户行为标签。2.1自身标签:指产品自身固定的标签,例如沙滩游、购物、出游天数、出游方式等。2.2根据用户的行为为产品定义一批新的标签,这类标签由模型或者规则去定义。1)由模型定义的标签,例如依据用户关系模型,判断用户是家庭、情侣或者好友一起出游,然后为产品添加标签亲子游、长者游、情侣游等关系标签。2)由规则定义的标签,例如产品当前的热度,根据用户对产品产生的点击、浏览时长、搜索、收藏、询问以及购买等行为,赋予不同的权重ti,在乘上一个时间衰减因子,累加即为产品当前热度。2.3依据对用户的回访和用户的评价,为产品添加标签,例如行程很好、导游细心、美食等。3、用户画像由自身属性(年龄、性别)、行为画像、模型标签组成。3.1自身画像:用户年龄性别等,如果缺失则使用分类算法补充。1)以用户性别数据缺失为例进行说明:使用用户的自身已有的数据以及行为数据作为特征(x),用户性别作为目标变量(y),然后使用分类算法(例如xgboost、随机森林等)去预测用户性别。2)以用户年龄数据缺失为例进行说明:年龄因为是连续变量,将其截断作为分区变量,例如(0,10]、(10,20]等,然后和预测性别一样的做法,使用用户的自身已有的数据以及行为数据作为特征(x),用离散化的年龄数据作为目标变量(y),最后使用分类算法(例如xgboost、随机森林等)去预测。3)如果需要,其余自身变量也是类似操作,不过先预测类别少的变量(例如先预测性别),然后使用预测数据填补后作为特征变量去预测下一个目标变量。3.2根据用户的浏览记录,抽取产品的标签构成用户标签集。具体过程如下:1)时间衰减函数,因为不同时间节点对用户的影响不同,时间越长影响力越小,所以添加了一个时间衰减函数,函数公式为:2)根据用户的行为,即点击、浏览时长、搜索、收藏、询问以及购买等行为,赋予不同的权重wk,即对于某个产品li,li具有标签集(沙滩,出海,亲子,3天,高铁…),在某个操作下,li所有的标签均获得权重wk。然后乘以一个时间衰减因子,最终获得的权重为wk*fk。如果一个产品,一个用户对该产品有多次浏览行为,则对这多次浏览行为的权值进行求和处理,得到该产品的第一权值。3)对于用户,第j个标签的权重值为:pj=∑i∈l'w1i,其中,w1i=∑k∈g'wik*fik;其中,l'为包含第j个标签的产品集合,w1i为第i个产品的第一权值,第g'为第i个产品的对应的浏览行为集合,wik为第i个产品的第k个浏览行为的权重值,fik为第i个产品的第k个浏览行为的时间衰减因子值。3.3模型标签,依据用户历史行为轨迹,使用算法建模进行预测,rfm模型用于用户分组,分类模型预测未来会购买的时间,目的地预测。具体过程如下:1)获取用户历史的购买记录、浏览记录等行为数据,以及年龄性别等自身属性。2)确定目标变量,以每个月月初作为分割点,下个月有购买行为的用户即为1,否则为0。3)抽取数据构建特征变量,例如购买次数、购买价格、浏览次数、产品天数、产品类别等变量,构建周期性特征、例如过去半年购买次数、过去半年浏览产品数。4)使用分类算法预测,例如xgboost、随机森林、逻辑回归、神经网络等。4、画像可视化,根据预先开发的用户画像系统,把用户自身属性以及行为数据通过图表等方式展现出来。应该理解的是,虽然图2-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图9所示,提供了一种旅游行业用户画像构造装置,包括:获取模块902、第一处理模块904、归类模块906、第二处理模块908和构造模块910,其中:获取模块902,用于获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品;第一处理模块904,用于根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;归类模块906,用于根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;第二处理模块908,用于根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;构造模块910,用于根据第二权重值,构造目标用户的目标用户画像。在其中一个实施例中,获取模块902还可以用于获取目标用户的用户属性信息、特定行为预期发生时间或者/和产品预期目的地;构造模块910可以根据第二权重值以及用户属性信息、特定行为预期发生时间或者/和产品预期目的地构建目标用户的目标用户画像。在其中一个实施例中,上述的旅游行业用户画像构造装置,还可以包括产品标签建立模块,该产品标签建立模块用于获取目标产品的产品自身信息,根据产品自身信息为目标产品添加第一类型标签,或者/和,获取目标产品的用户行为信息,根据用户行为信息为目标产品添加第二类型标签,或者/和,获取目标产品的评价信息,根据评价信息为目标产品添加第三类型标签,目标产品的产品标签包括第一类型标签、第二类型标签或者/和第三类型标签。在其中一个实施例中,获取模块902可以获取目标用户的用户属性已有数据和目标用户的用户行为数据,根据用户属性已有数据确定用户属性缺失数据;根据用户属性已有数据、用户行为数据以及预设的数据预测模型预测用户属性缺失数据。在其中一个实施例中,获取模块902可以获取用户属性缺失数据的类别数目,根据类别数目确定用户属性缺失数据的预测顺序;根据用户属性已有数据、预测顺序以及预设的数据预测模型预测自身属性缺失数据。在其中一个实施例中,产品标签建立模块可以根据用户行为信息确定目标产品的用户关系模型和目标产品的当前热度信息;根据用户关系模型为目标产品添加用户关系标签,根据产品当前热度信息为目标产品添加产品热度标签,目标产品的第二类型标签包括用户关系标签和产品热度标签。在其中一个实施例中,第一处理模块904可以根据已浏览产品的产品浏览记录信息,确定目标用户的各浏览行为对应的产品标识信息、行为发生时间和行为类别信息;根据各浏览行为对应的产品标识信息、行为发生时间和行为类别信息,以及预设的时间衰减函数确定已浏览产品对应的第一权重值。在其中一个实施例中,获取模块902可以根据产品浏览记录信息抽取目标数据,根据目标数据构建特征变量;确定预测对象,根据预测对象确定目标变量,预测对象包括特定行为预期发生时间或者/和产品预期目的地;根据特征变量、目标变量和预设的第二分类模型确定特定行为预期发生时间或者/和产品预期目的地。在其中一个实施例中,上述的旅游行业用户画像构造装置,还可以包括画像可视化模块,该画像可视化模块模块用于从用户属性信息中抽取目标属性数据,将目标属性数据添加到预设的用户画像显示模板中,从产品浏览记录信息抽取已购产品的目的地信息和已购产品的成交价格信息,根据目的地信息和成交价格信息生成目标用户的旅行轨迹图表,将旅行轨迹图表添加到用户画像显示模板中,根据第二权重值确定各已浏览产品集合对应的产品标签的显示方式,按照显示方式将各已浏览产品集合对应的产品标签添加到用户画像显示模板中,根据添加目标属性数据、旅行轨迹图表和产品标签后的用户画像显示模板生成用户画像显示图像。关于旅游行业用户画像构造装置的具体限定可以参见上文中对于旅游行业用户画像构造方法的限定,在此不再赘述。上述旅游行业用户画像构造装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户画像数据或者产品浏览记录信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种旅游行业用户画像构造方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品;根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;根据第二权重值,构造目标用户的目标用户画像。在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取目标用户的用户属性信息、特定行为预期发生时间或者/和产品预期目的地;在处理器执行计算机程序实现上述的根据第二权重值,构造目标用户的目标用户画像的步骤时,具体实现以下步骤:根据第二权重值以及用户属性信息、特定行为预期发生时间或者/和产品预期目的地构建目标用户的目标用户画像。在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取目标产品的产品自身信息,根据产品自身信息为目标产品添加第一类型标签;或者/和,获取目标产品的用户行为信息,根据用户行为信息为目标产品添加第二类型标签;或者/和,获取目标产品的评价信息,根据评价信息为目标产品添加第三类型标签,目标产品的产品标签包括第一类型标签、第二类型标签或者/和第三类型标签。在一个实施例中,在处理器执行计算机程序实现上述的获取目标用户的用户属性信息的步骤时,具体实现以下步骤:获取目标用户的用户属性已有数据和目标用户的用户行为数据,根据用户属性已有数据确定用户属性缺失数据;根据用户属性已有数据、用户行为数据以及预设的数据预测模型预测用户属性缺失数据。在一个实施例中,在处理器执行计算机程序实现上述的根据用户属性已有数据以及预设的数据预测模型预测用户属性缺失数据的步骤时,具体实现以下步骤:获取用户属性缺失数据的类别数目,根据类别数目确定用户属性缺失数据的预测顺序;根据用户属性已有数据、预测顺序以及预设的数据预测模型预测自身属性缺失数据。在一个实施例中,在处理器执行计算机程序实现上述的根据用户行为信息为目标产品添加第二类型标签的步骤时,具体实现以下步骤:根据用户行为信息确定目标产品的用户关系模型和目标产品的当前热度信息;根据用户关系模型为目标产品添加用户关系标签,根据产品当前热度信息为目标产品添加产品热度标签,目标产品的第二类型标签包括用户关系标签和产品热度标签。在一个实施例中,在处理器执行计算机程序实现上述的根据产品浏览记录信息确定第一权重值的步骤时,具体实现以下步骤:根据已浏览产品的产品浏览记录信息,确定目标用户的各浏览行为对应的产品标识信息、行为发生时间和行为类别信息;根据各浏览行为对应的产品标识信息、行为发生时间和行为类别信息,以及预设的时间衰减函数确定已浏览产品对应的第一权重值。在一个实施例中,在处理器执行计算机程序实现特定行为预期发生时间或者/和产品预期目的地的获取步骤时,具体实现以下步骤:根据产品浏览记录信息抽取目标数据,根据目标数据构建特征变量;确定预测对象,根据预测对象确定目标变量,预测对象包括特定行为预期发生时间或者/和产品预期目的地;根据特征变量、目标变量和预设的第二分类模型确定特定行为预期发生时间或者/和产品预期目的地。在一个实施例中,处理器执行计算机程序时还实现以下步骤:从用户属性信息中抽取目标属性数据,将目标属性数据添加到预设的用户画像显示模板中;从产品浏览记录信息抽取已购产品的目的地信息和已购产品的成交价格信息;根据目的地信息和成交价格信息生成目标用户的旅行轨迹图表,将旅行轨迹图表添加到用户画像显示模板中;根据第二权重值确定各已浏览产品集合对应的产品标签的显示方式,按照显示方式将各已浏览产品集合对应的产品标签添加到用户画像显示模板中;根据添加目标属性数据、旅行轨迹图表和产品标签后的用户画像显示模板生成用户画像显示图像。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标用户的产品浏览记录信息,产品浏览记录信息包括已浏览产品的浏览记录信息,所述目标用户为旅游行业用户,所述已浏览产品为旅游产品;根据产品浏览记录信息确定第一权重值,第一权重值为已浏览产品的权重值;根据已浏览产品的各产品标签对已浏览产品进行产品归类,得到各产品标签对应的已浏览产品集合;根据第一权重值确定第二权重值,第二权重值为各已浏览产品集合对应的产品标签的权重值;根据第二权重值,构造目标用户的目标用户画像。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取目标用户的用户属性信息、特定行为预期发生时间或者/和产品预期目的地;在计算机程序被处理器执行实现上述的根据第二权重值,构造目标用户的目标用户画像的步骤时,具体实现以下步骤:根据第二权重值以及用户属性信息、特定行为预期发生时间或者/和产品预期目的地构建目标用户的目标用户画像。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取目标产品的产品自身信息,根据产品自身信息为目标产品添加第一类型标签;或者/和,获取目标产品的用户行为信息,根据用户行为信息为目标产品添加第二类型标签;或者/和,获取目标产品的评价信息,根据评价信息为目标产品添加第三类型标签,目标产品的产品标签包括第一类型标签、第二类型标签或者/和第三类型标签。在一个实施例中,在计算机程序被处理器执行实现上述的获取目标用户的用户属性信息的步骤时,具体实现以下步骤:获取目标用户的用户属性已有数据和目标用户的用户行为数据,根据用户属性已有数据确定用户属性缺失数据;根据用户属性已有数据、用户行为数据以及预设的数据预测模型预测用户属性缺失数据。在一个实施例中,在计算机程序被处理器执行实现上述的根据用户属性已有数据以及预设的数据预测模型预测用户属性缺失数据的步骤时,具体实现以下步骤:获取用户属性缺失数据的类别数目,根据类别数目确定用户属性缺失数据的预测顺序;根据用户属性已有数据、预测顺序以及预设的数据预测模型预测自身属性缺失数据。在一个实施例中,在计算机程序被处理器执行实现上述的根据用户行为信息为目标产品添加第二类型标签的步骤时,具体实现以下步骤:根据用户行为信息确定目标产品的用户关系模型和目标产品的当前热度信息;根据用户关系模型为目标产品添加用户关系标签,根据产品当前热度信息为目标产品添加产品热度标签,目标产品的第二类型标签包括用户关系标签和产品热度标签。在一个实施例中,在计算机程序被处理器执行实现上述的根据产品浏览记录信息确定第一权重值的步骤时,具体实现以下步骤:根据已浏览产品的产品浏览记录信息,确定目标用户的各浏览行为对应的产品标识信息、行为发生时间和行为类别信息;根据各浏览行为对应的产品标识信息、行为发生时间和行为类别信息,以及预设的时间衰减函数确定已浏览产品对应的第一权重值。在一个实施例中,在计算机程序被处理器执行实现特定行为预期发生时间或者/和产品预期目的地的获取步骤时,具体实现以下步骤:根据产品浏览记录信息抽取目标数据,根据目标数据构建特征变量;确定预测对象,根据预测对象确定目标变量,预测对象包括特定行为预期发生时间或者/和产品预期目的地;根据特征变量、目标变量和预设的第二分类模型确定特定行为预期发生时间或者/和产品预期目的地。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从用户属性信息中抽取目标属性数据,将目标属性数据添加到预设的用户画像显示模板中;从产品浏览记录信息抽取已购产品的目的地信息和已购产品的成交价格信息;根据目的地信息和成交价格信息生成目标用户的旅行轨迹图表,将旅行轨迹图表添加到用户画像显示模板中;根据第二权重值确定各已浏览产品集合对应的产品标签的显示方式,按照显示方式将各已浏览产品集合对应的产品标签添加到用户画像显示模板中;根据添加目标属性数据、旅行轨迹图表和产品标签后的用户画像显示模板生成用户画像显示图像。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1