根据用户行为和用户画像构建推荐引擎的方法与流程

文档序号：20769722发布日期：2020-05-15 19:30阅读：274来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及数据统计技术领域，尤其涉及一种根据用户行为和用户画像构建推荐引擎的方法。

背景技术：

随着互联网的发展，用户的兴趣越来越广泛，且随着用户所处环境及生活水平的改变，用户的需求也在发生改变。目前，基于lbs(locationbasedservices，基于位置的服务)推荐引擎召回和排序方法在长租公寓领域适用性存在的问题：

1、当前长租公寓采集用户信息一般只根据用户的线上记录，渠道单一，造成用户信息遗漏，样本信息库缺失；

2、召回方式行业内整体上是倒排索引加用户行为召回，未考虑高质量公寓所具有的优质地块价格等大宗标的物属性；

3、粗排层内通用推荐粗排阶段未针对高价值稀疏标的的场景做优化，长租公寓场景需要多层粗排序，既需要针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，又需要对用户次要需求和房屋次要房态、地段特征做匹配策略；

4、排序层业界普遍基于用户线上行为做pair-wise或list-wise的learningtorank模型排序。但是长租公寓除了需要考虑用户线上反馈还需要考虑带看、签约等情况，排序模型会更复杂，需要基于对排序模型做多级样本权重刻画，同时样本的高度稀疏性和交易的大额属性，需要对区域、房态等场景做深度细分，提升推荐质量；

5、干预调整层业界普遍基于竞价排名的方式做精准的广告插入，并未基于长租公寓特有的lbs方式建模，推荐效果不理想。

技术实现要素：

有鉴于此，本申请公开了一种根据用户行为和用户画像构建推荐引擎的方法，包括步骤：

采集用户信息以及房源信息；

所述用户信息包括用户行为信息，统计预设时期内的所述用户行为信息的类型和各类型对应的所述用户行为的操作频率，预设频率阈值，所述用户行为的操作频率大于各类型对应所述频率阈值时，所述用户行为信息包括有效用户行为信息；其中，所述用户行为信息的类型包括用户浏览网页信息和用户租住时长；

所述用户信息还包括用户画像信息，所述用户画像信息包括用户消费信息和用户偏好信息；所述房源信息根据所述有效用户行为信息划分为实时用户行为信息和历史用户行为信息；将所述实时用户行为信息进行审查和校验，根据分布式流处理开源框架实时进入在线数据库；将所述历史用户行为信息生成日志，并将所述日志通过spark框架计算引擎批量入离线数据仓库；所述在线数据库和所述离线数据仓库生成第一召回数据源；

所述房源信息根据所述用户画像信息召回，通过离线数据仓库内置的光盘、以及通过lbs进行筛选得到第二召回数据源；

将所述第一召回数据源和所述第二召回数据源根据lbs服务做价值匹配和地段特征匹配，得到相应的匹配度，依据所述匹配度依次从高到低排序生成第一推荐数据源；

将所述第一推荐数据源通过spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源；

将所述第二推荐数据源训练得到排序模型；

将所述房源信息输入到所述排序模型，得到所述房源信息的评分排序情况；

设置评分阈值，所述房源信息的评分大于所述评分阈值的所述房源为第一推荐房源；

同时依据房主需求生成第二推荐房源；

根据所述第一推荐房源和所述第二推荐房源构建推荐引擎。

优选的，通过线上、线下以及电销的方式采集所述用户信息。

优选的，所述第一推荐房源的数量大于所述第二推荐房源的数量。

优选的，所述第一推荐房源的数量与所述第二推荐房源的数量的比值为5∶1。

优选的，所述特征工程处理包括将所述第一推荐数据源依次通过汇聚、提炼加工、筛选以及补全得到所述第二推荐数据源。

优选的，所述将所述房源信息输入到所述排序模型，得到所述房源信息的评分排序情况包括：将所述房源信息进行权重刻画，根据所述房源信息的稀疏性和交易属性对区域、房态等场景做深度的划分，得到所述房源信息的评分排序情况。

优选的，所述推荐引擎中还包括热点房源。

与现有技术相比，本发明提供的根据用户行为和用户画像构建推荐引擎的方法，达到如下有益效果：

1、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，设置用户行为操作的频率阈值，可以提高用户行为信息的准确性以及高效性。

2、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，通过限定第一推荐房源和第二房源的关系可以有利于提高长租公寓的收益。

3、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，采集信息渠道丰富，包括用户线上app记录、线下带看沟通、电销方式；采集大量用户信息，生成整体的样本模型，涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。

4、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，优化个性化推荐模式，通过对用户的行为和画像综合测算，在样本模型库中提取推荐匹配度较高的公寓。

5、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，优化推荐排序模型，对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

6、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，优化干预调整层，基于长租公寓特有的lbs方式建模，设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本发明根据用户行为和用户画像构建推荐引擎的方法的一种流程图；

图2为本发明根据用户行为和用户画像构建推荐引擎的方法的又一种流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。应注意到，所描述的实施例实际上仅仅是本发明一部分实施例，而不是全部的实施例，且实际上仅是说明性的，决不作为对本发明及其应用或使用的任何限制。本申请的保护范围当视所附权利要求所界定者为准。

实施例1：

图1为本发明根据用户行为和用户画像构建推荐引擎的方法的一种流程图，如图1所示，本实施例提供的一种根据用户行为和用户画像构建推荐引擎的方法，包括步骤：

步骤101，采集用户信息以及房源信息；

用户信息包括用户行为信息，统计预设时期内的用户行为信息的类型和各类型对应的用户行为的操作频率，预设频率阈值，用户行为的操作频率大于各类型对应频率阈值时，用户行为信息包括有效用户行为信息；其中，用户行为信息的类型包括用户浏览网页信息和用户租住时长；

用户信息还包括和用户画像信息，用户画像信息包括用户消费信息和用户偏好信息；可以理解的是，当用户使用app浏览到一个房屋信息时，看误实际并不需要时，这是操作是无效的，当浏览一个房屋信息超过一定频率时，或者浏览同类房屋超过一定频率时，可以明确知道用户希望入住此类房屋，即此时的用户行为信息为有效信息，故设置用户行为操作的频率阈值，可以提高用户行为信息的准确性以及高效性。

在步骤101中，可以通过线上、线下以及电销的方式采集用户信息。可以理解的是，第一种线上采集方式，根据用户在网页、app的浏览搜索记录，获取用户意图信息；第二种是线下采集方式，通过专人带看、签约沟通获取用户的意图信息；第三种是电销的方式，通过和用户的电话沟通，明确用户意图；丰富采集信息渠道，采集大量用户信息，生成整体样本模型，涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。

步骤102，房源信息根据有效用户行为信息划分为实时用户行为信息和历史用户行为信息；将实时用户行为信息进行审查和校验，根据分布式流处理开源框架flink实时进入在线数据库；将历史用户行为信息生成日志，并将日志通过spark框架计算引擎批量入离线数据仓库hive；在线数据库和离线数据仓库hive生成第一召回数据源；

房源信息根据用户画像信息召回，通过hive离线数据仓库内置的光盘udf、以及通过lbs进行筛选得到第二召回数据源。

在步骤102中，可选的，分为通过历史行为和实时行为召回两个部分，实时行为更能捕捉用户的当前意图。其中，flink以数据并行和流水线方式执行任意流数据程序，flink的流水线运行时系统可以执行批处理和流处理程序。spark是ucberkeleyamplab(加州大学伯克利分校的amp实验室)所开源的类hadoopmapreduce的通用并行框架。hive是基于hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在hadoop中的大规模数据的机制。

在步骤102中，可选的，通过工作地、生活地和兴趣点等方式召回数据，重要性最低。但是在没有用户行为收集不足的前提下作为冷启动的方案。其中，udf是统一光盘格式(universaldiscformat)的英文缩写，由国际标准化组织于1996年制定的通用光盘文件系统，它采用标准的包刻录技术(pw，packetwriting)来简化刻录机的使用。

步骤103，将第一召回数据源和第二召回数据源根据lbs服务做价值匹配和地段特征匹配，得到相应的匹配度，依据匹配度依次从高到低排序生成第一推荐数据源，第一推荐数据源包括在线数据源和离线数据源；

在步骤103中，将第一召回数据源和第二召回数据源，根据lbs服务作价值匹配策略，以及地段特征做匹配策略排序生成第一推荐数据源。

进一步为，针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，以及对用户次要需求和房屋次要房态、地段特征做匹配策略，得到一个粗略的排序结果。优化个性化推荐模式，对用户的行为、画像综合测算，在样本模型库中提取推荐匹配度较高的优质公寓。同时还可以优化推荐排序模型，对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

在上述步骤中可以理解的是，将用户信息通过用户需求信息、用户行为信息和用户画像信息房源信息相应生成第一召回数据源、第二召回数据源和第三召回数据源，并进行处理生成第一推荐数据源；可以在海量的用户信息中召回一些有相关度的用户信息并进行粗略的排序，可以对后续进行精细排序减少工作的运算量，有利于提高得出结果的响应时间。

步骤104，将第一推荐数据源通过spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源；

可以理解的是，由于第一推荐数据源包括在线数据源和离线数据源；spark分布式框架包括离线计算模块和在线模计算模块，将第一推荐数据源的在线数据源利用spark分布式框架包括在线计算模块进行处理，将第一推荐数据源的离线数据源利用spark分布式框架包括离线计算模块进行处理，可以有利于缩短得出结果的响应时间。

步骤105，将第二推荐数据源训练得到排序模型；

步骤106，将房源信息输入到排序模型，得到房源信息的评分排序情况；

在步骤106中，进一步为将房源信息进行权重刻画，根据房源信息的稀疏性和交易属性对区域、房态等场景做深度的划分，得到房源信息的排序打分。

步骤107，设置评分阈值，房源信息的评分大于评分阈值的房源为第一推荐房源；

在步骤104-步骤107中，可以理解的是，特征工程处理包括将第一推荐数据源通过汇聚、提炼加工、筛选以及补全得到第二推荐数据源。进一步为采集第一推荐数据源通过spark框架的特征工程测算处理后，训练出相应的排序模型，对样本数据进行权重刻画，根据数据信息的高度稀疏性和交易的大额属性对区域、房态等场景做深度的划分，给出房源信息准确的排序打分，最终推荐给用户高质量的优质长租公寓资源。

步骤108，同时依据房主需求生成第二推荐房源；

步骤109，根据第一推荐房源和第二推荐房源构建推荐引擎。可选的，推荐引擎中还包括热点房源。在步骤108-步骤109中，可以理解的是，基于长租公寓特有的lbs建模后，系统根据公司的出房倾斜政策、运营活动策略、广告推广等定制化的需求将一些特定的房源插入到推荐列表中特定的位置，为用户推荐更多的选择空间；如果推荐结果不足时，系统会自动推荐相关的热点精品房源补全。设置优化干预调整层，基于长租公寓特有的lbs方式建模，设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。

其中，第一推荐房源的数量大于第二推荐房源的数量。优选的第一推荐房源的数量与第二推荐房源的数量的比值为5∶1。可以在保证推荐的满足用户的需求，又可以提高长租公寓的广告效益等。

实施例2：

图2为本发明根据用户行为和用户画像构建推荐引擎的方法的又一种流程图，如图2所示，本实施例提供的又一种根据用户行为和用户画像构建推荐引擎的方法，包括步骤：

步骤201，用户信息采集：

信息采集方式主要分为三种方式：第一种线上采集方式，根据用户在网页、app的浏览搜索记录，获取用户意图信息；第二种是线下采集方式，通过专人带看、签约沟通获取用户的意图信息；第三种是电销的方式，通过和用户的电话沟通，明确用户意图；将所有渠道获取的信息构建样本模型，存放在数据库中，便于调取；丰富采集信息渠道，包括用户线上app记录、线下带看沟通、电销方式；采集大量用户信息，生成整体样本模型，涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。

步骤202，召回：

假设用户搜索“xx首府”附近的长租公寓信息后，首先通过样本数据库获取用户需求：根据用户行为召回：用户的实时行为经过数据清洗，通过flink处理框架实时进入数据库；用户的每次行为会生成历史行为日志汇总，通过spark计算引擎批量入hive离线数据仓库；入库数据同步存入redis实时数据库；

对采集到的数据信息进行汇总，精选，然后对长租公寓场景进行多层粗排序，针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，以及对用户次要需求和房屋次要房态、地段特征做匹配策略，得到一个粗略的排序结果；对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

步骤203，排序：

对于召回的房源数据粗排序信息，综合采集用户的历史行为以及房态地块商圈图像通过spark分布式框架的特征工程测算处理后，分别对在线和离线数据进行相应训练构建排序模型，对样本数据进行权重刻画，根据数据信息的高度稀疏性和交易的大额属性对区域、房态等场景做深度的划分，给出房源信息准确的排序打分，最终推荐给用户高质量的优质长租公寓资源；

步骤204、干预调整：

基于长租公寓特有的lbs建模后，系统根据公司的出房倾斜政策、运营活动策略、广告推广等定制化的需求将一些特定的房源插入到推荐列表中特定的位置，为用户推荐更多的选择空间；如果推荐结果不足时，系统会自动推荐相关的热点精品房源补全。优化干预调整层，基于长租公寓特有的lbs方式建模，设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。

可以理解的是，本发明的召回方式，可以仅根据用户行为信息或者画像信息其中任意一个，当然也可以根据以上两种方式同时召回。本实施例仅示意出根据用户行为召回，本实施例对召回方式不做具体要求，可以根据实际情况设置。

实施例3：

请继续参考图2，图2为本发明根据用户行为和用户画像构建推荐引擎的方法的又一种流程图；本实施例提供的又一种根据用户行为和用户画像构建推荐引擎的方法，包括步骤：

步骤301，用户信息采集：

步骤302，召回：

假设用户搜索“xx首府”附近的长租公寓信息后，首先通过样本数据库获取用户需求：根据用户画像召回：通过hive兴趣商圈挖掘出与公寓附近长租公寓的相关信息，经过内容、lbs筛选，存入redis召回列表索引库；

步骤303，排序：

步骤304、干预调整：

可以理解的是，本发明的召回方式，可以仅根据用户行为信息或者画像信息其中任意一个，当然也可以根据以上两种方式同时召回。本实施例仅示意出根据用户画像召回，本实施例对召回方式不做具体要求，可以根据实际情况设置。

通过以上各实施例可知，本申请存在的有益效果是：

1、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，设置用户行为操作的频率阈值，可以提高用户行为信息的准确性以及高效性。

2、本发明提供的根据用户行为和用户画像构建推荐引擎的方法，通过限定第一推荐房源和第二房源的关系可以有利于提高长租公寓的收益。

上面通过附图和实施例，对本申请的技术方案做虽然已经通过例子对本申请的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上例子仅是为了进行说明，而不是为了限制本发明的范围。尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。本发明的范围由所附权利要求来限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李昭;陈浩;高靖;崔岩;卢述奇;陈呈;张宵
技术所有人：青梧桐有限责任公司
我是此专利的发明人

上一篇：电池隔室的制作方法
上一篇：一种LED铅笔沾头漆及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。