根据用户需求和用户行为构建推荐引擎的方法与流程

文档序号：20769715发布日期：2020-05-15 19:30阅读：327来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及数据统计技术领域，尤其涉及一种根据用户需求和用户行为构建推荐引擎的方法。

背景技术：

随着互联网的发展，用户的兴趣越来越广泛，且随着用户所处环境及生活水平的改变，用户的需求也在发生改变。目前，基于lbs(locationbasedservices，基于位置的服务)推荐引擎召回和排序方法在长租公寓领域适用性存在的问题：

1、当前长租公寓采集用户信息一般只根据用户的线上记录，渠道单一，造成用户信息遗漏，样本信息库缺失；

2、召回方式行业内整体上是倒排索引加用户行为召回，未考虑高质量公寓所具有的优质地块价格等大宗标的物属性；

3、粗排层内通用推荐粗排阶段未针对高价值稀疏标的场景做优化，长租公寓场景需要多层粗排序，既需要针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，又需要对用户次要需求和房屋次要房态、地段特征做匹配策略；

4、排序层业界普遍基于用户线上行为做pair-wise或list-wise的learningtorank模型排序。但是长租公寓除了需要考虑用户线上反馈还需要考虑带看、签约等情况，排序模型会更复杂，需要基于对排序模型做多级样本权重刻画，同时样本的高度稀疏性和交易的大额属性，需要对区域、房态等场景做深度细分，提升推荐质量；

5、干预调整层业界普遍基于竞价排名的方式做精准的广告插入，并未基于长租公寓特有的lbs方式建模，推荐效果不理想。

技术实现要素：

有鉴于此，本发明实施例提供一种根据用户需求和用户行为构建推荐引擎的方法，包括步骤：

采集用户信息以及房源信息；

所述用户信息包括用户需求信息和用户行为信息，所述用户需求信息包括用户对房价、距离工作地或地铁站以及商圈的需求，所述用户行为信息包括用户浏览网页信息和用户租住时长；预设所述用户需求信息的反馈界面，所述反馈界面展示有至少一个作为相应树形结构的节点的关键词；所述树形结构的各级节点均为所述用户需求信息的关键词；当采集到用户针对于所述反馈界面当前所展示的关键词的搜索指令，将所述搜索指令所对应的目标关键词确定为用户需求信息；

所述房源信息根据所述用户需求信息召回，并通过数据收集器过滤、格式化得到所述第一召回数据源；

所述房源信息根据所述用户行为信息划分为实时用户行为信息和历史用户行为信息；将所述实时用户行为信息进行审查和校验，根据分布式流处理开源框架实时进入在线数据库；将所述历史用户行为信息生成日志，并将所述日志通过spark框架计算引擎批量入离线数据仓库；所述在线数据库和所述离线数据仓库生成第二召回数据源；

将所述第一召回数据源和所述第二召回数据源根据lbs服务做价值匹配和地段特征匹配，得到相应的匹配度，依据所述匹配度依次从高到低排序生成第一推荐数据源，所述第一推荐数据源包括在线数据源和离线数据源；

将所述第一推荐数据源通过spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源；

将所述第二推荐数据源训练得到排序模型；

将所述房源信息输入到所述排序模型，得到所述房源信息的评分排序情况；

设置评分阈值，所述房源信息的评分大于所述评分阈值的所述房源为第一推荐房源；

同时依据房主需求生成第二推荐房源；

根据所述第一推荐房源和所述第二推荐房源构建推荐引擎。

优选的，所述第一推荐房源的价格与所述第二房源的价格相匹配。

优选的，通过线上、线下以及电销的方式采集所述用户信息。

优选的，所述第一召回数据源通过搜索的方式召回。

优选的，所述特征工程处理包括将所述第一推荐数据源依次通过汇聚、提炼加工、筛选以及补全得到所述第二推荐数据源。

优选的，所述将所述房源信息输入到所述排序模型，得到所述房源信息的评分排序情况包括：

将所述房源信息进行权重刻画，根据所述房源信息的稀疏性和交易属性对区域、房态等场景做深度的划分，得到所述房源信息的评分排序情况。

优选的，所述推荐引擎中还包括热点房源。

与现有技术相比，本发明提供的根据用户需求和用户行为构建推荐引擎的方法，达到如下有益效果：

1、本发明提供的根据用户需求和用户行为构建推荐引擎的方法，第一推荐数据源通过spark分布式框架进行特征工程处理得到第二推荐数据源，有利于缩短得出结果的响应时间。

2、本发明提供的根据用户需求和用户行为构建推荐引擎的方法，预设用户需求信息的反馈界面降低了在用户需求对应的关键词由于关键词众多导致用户出现错选、漏选的几率。

3、本发明提供的根据用户需求和用户行为构建推荐引擎的方法，采集信息渠道丰富，包括用户线上app记录、线下带看沟通、电销方式；采集大量用户信息，生成整体的样本模型，涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。

4、本发明提供的根据用户需求和用户行为构建推荐引擎的方法，优化个性化推荐模式，通过对用户的需求和行为综合测算，在样本模型库中提取推荐匹配度较高的公寓。

5、本发明提供的根据用户需求和用户行为构建推荐引擎的方法，优化推荐排序模型，对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

6、本发明提供的根据用户需求和用户行为构建推荐引擎的方法，优化干预调整层，基于长租公寓特有的lbs方式建模，设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本发明根据用户需求和用户行为构建推荐引擎的方法的一种流程示意图；

图2是本发明根据用户需求和用户行为构建推荐引擎的方法的又一种流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。应注意到，所描述的实施例实际上仅仅是本发明一部分实施例，而不是全部的实施例，且实际上仅是说明性的，决不作为对本发明及其应用或使用的任何限制。本申请的保护范围当视所附权利要求所界定者为准。

实施例1：

图1是本发明根据用户需求和用户行为构建推荐引擎的方法的一种流程示意图，如图1所示，本实施例提供的一种根据用户需求和用户行为构建推荐引擎的方法，包括步骤：

步骤101，采集用户信息以及房源信息；

用户信息包括用户需求信息和用户行为信息，所述用户需求信息包括用户对房价、距离工作地或地铁站以及商圈的需求，所述用户行为信息包括用户浏览网页信息和用户租住时长；预设用户需求信息的反馈界面，反馈界面展示有至少一个作为相应树形结构的节点的关键词；树形结构的各级节点均为用户需求信息的关键词；当采集到用户针对于反馈界面当前所展示的关键词的搜索指令，将搜索指令所对应的目标关键词确定为用户需求信息；

可以理解的是，反馈界面的关键词相当于第一关键词，与用户搜索相匹配的关键词，属于第二关键词；当未采集到第二关键词时，可以采用第一关键词继续，预设用户需求信息的反馈界面降低了在用户需求对应的关键词由于关键词众多导致用户出现错选、漏选的几率。

在步骤101中，可以通过线上、线下以及电销的方式采集用户信息。可以理解的是，第一种线上采集方式，根据用户在网页、app的浏览搜索记录，获取用户意图信息；第二种是线下采集方式，通过专人带看、签约沟通获取用户的意图信息；第三种是电销的方式，通过和用户的电话沟通，明确用户意图；丰富采集信息渠道，采集大量用户信息，生成整体样本模型，涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。

步骤102，房源信息根据用户需求信息召回，并通过数据收集器logstash过滤、格式化得到第一召回数据源；

房源信息根据用户行为信息划分为实时用户行为信息和历史用户行为信息；将实时用户行为信息进行审查和校验，根据分布式流处理开源框架flink实时进入在线数据库；将历史用户行为信息生成日志，并将日志通过spark框架计算引擎批量入离线数据仓库hive；在线数据库和离线数据仓库hive生成第二召回数据源；

在步骤102中，可选的，通过用户填写或询问收集用户需求反馈，通过搜索的方式召回，技术可以采用elk框架，保证索引建立和query函数执行mysql查询的实时性和推荐引擎的可扩展性。其中，elk框架为elasticsearch,logstash,kibana是一套实时数据收集、存储、索引、检索、统计分析及可视化的解决方案。mysql是一个关系型数据库管理系统。

在步骤102中，可选的，分别通过历史行为和实时行为召回两个部分，实时行为更能捕捉用户的当前意图。其中，flink以数据并行和流水线方式执行任意流数据程序，flink的流水线运行时系统可以执行批处理和流处理程序。spark是ucberkeleyamplab(加州大学伯克利分校的amp实验室)所开源的类hadoopmapreduce的通用并行框架。hive是基于hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在hadoop中的大规模数据的机制。

步骤103，将第一召回数据源和第二召回数据源根据lbs服务做价值匹配和地段特征匹配，得到相应的匹配度，依据所述匹配度依次从高到低排序生成第一推荐数据源，第一推荐数据源包括在线数据源和离线数据源；

在步骤103中，将第一召回数据源和第二召回数据源，根据lbs服务作价值匹配策略，以及地段特征做匹配策略排序生成第一推荐数据源。

进一步为，针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，以及对用户次要需求和房屋次要房态、地段特征做匹配策略，得到一个粗略的排序结果。优化个性化推荐模式，对用户的需求和行为综合测算，在样本模型库中提取推荐匹配度较高的优质公寓。同时还可以优化推荐排序模型，对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

在上述步骤中可以理解的是，将用户信息通过用户需求信息、用户行为信息和用户画像信息房源信息相应生成第一召回数据源、第二召回数据源和第三召回数据源，并进行处理生成第一推荐数据源；可以在海量的用户信息中召回一些有相关度的用户信息并进行粗略的排序，可以对后续进行精细排序减少工作的运算量，有利于提高得出结果的响应时间。

步骤104，将第一推荐数据源通过spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源；

可以理解的是，由于第一推荐数据源包括在线数据源和离线数据源；spark分布式框架包括离线计算模块和在线计算模块，将第一推荐数据源的在线数据源利用spark分布式框架包括在线计算模块进行处理，将第一推荐数据源的离线数据源利用spark分布式框架包括离线计算模块进行处理，可以有利于缩短得出结果的响应时间。

步骤105，将第二推荐数据源训练得到排序模型；

步骤106，将房源信息输入到排序模型，得到房源信息的评分排序情况；

在步骤106中，进一步为将房源信息进行权重刻画，根据房源信息的稀疏性和交易属性对区域、房态等场景做深度的划分，得到房源信息的排序打分。

步骤107，设置评分阈值，房源信息的评分大于评分阈值的房源为第一推荐房源；

在步骤104-步骤107中，可以理解的是，特征工程处理包括将第一推荐数据源通过汇聚、提炼加工、筛选以及补全得到第二推荐数据源。进一步为采集第一推荐数据源通过spark框架的特征工程测算处理后，训练出相应的排序模型，对样本数据进行权重刻画，根据数据信息的高度稀疏性和交易的大额属性对区域、房态等场景做深度的划分，给出房源信息准确的排序打分，最终推荐给用户高质量的优质长租公寓资源。

步骤108，同时依据房主需求生成第二推荐房源；

步骤109，根据第一推荐房源和第二推荐房源构建推荐引擎。可选的，推荐引擎中还包括热点房源。其中，热点房源可以为出租率在90％以上的房源，优选的，热点房源可以为靠近地铁站、商圈或者市中心的出租率在90％以上的房源。

在步骤108-步骤109中，可以理解的是，基于长租公寓特有的lbs建模后，系统根据公司的出房倾斜政策、运营活动策略、广告推广等定制化的需求将一些特定的房源插入到推荐列表中特定的位置，为用户推荐更多的选择空间；如果推荐结果不足时，系统会自动推荐相关的热点精品房源补全。优化干预调整层，基于长租公寓特有的lbs方式建模，设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。

其中，第一推荐房源的价格与第二房源的价格相匹配，可以理解的是，第一推荐房源属于用户需求房源，第二推荐房源属于长租公寓希望出租进而推荐的房源，将第一推荐房源的价格与第二房源的价格相匹配，价格相匹配可以提高用户选择第二推荐房源的概率，有利于长租公寓的收益。

实施例2：

图2是本发明根据用户需求和用户行为构建推荐引擎的方法的又一种流程示意图，如图2所示，本实施例提供的又一种根据用户需求和用户行为构建推荐引擎的方法，包括步骤：

步骤201，用户信息采集：

信息采集方式主要分为三种方式：第一种线上采集方式，根据用户在网页、app的浏览搜索记录，获取用户意图信息；第二种是线下采集方式，通过专人带看、签约沟通获取用户的意图信息；第三种是电销的方式，通过和用户的电话沟通，明确用户意图；将所有渠道获取的信息构建样本模型，存放在数据库中，便于调取；丰富采集信息渠道，包括用户线上app记录、线下带看沟通、电销方式；采集大量用户信息，生成整体样本模型，涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。

步骤202，召回：

假设用户搜索“xx首府”附近的长租公寓信息后，首先通过样本数据库获取用户需求：预设所述用户需求信息的反馈界面，所述反馈界面展示有至少一个作为相应树形结构的节点的关键词；所述树形结构的各级节点均为所述用户需求信息的关键词；当采集到用户针对于所述反馈界面当前所展示的关键词的搜索指令，将所述搜索指令所对应的目标关键词确定为用户需求信息；根据用户的需求召回：系统从mysql房源库中选取“xx首府”附近的长租公寓数据信息，数据传给数据收集器logstash进行过滤和格式化，然后存储在es数据库；

进一步为，对采集到的数据信息进行汇总，精选，然后对长租公寓场景进行多层粗排序，针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，以及对用户次要需求和房屋次要房态、地段特征做匹配策略，得到一个粗略的排序结果；对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

步骤203，排序：

对于召回的房源数据粗排序信息，会综合采集用户的历史行为、需求偏好信息以及房态地块商圈图像通过spark分布式框架的特征工程测算处理后，分别对在线和离线数据进行相应训练构建的排序模型，对样本数据进行权重刻画，根据数据信息的高度稀疏性和交易的大额属性对区域、房态等场景做深度的划分，给出房源信息准确的排序打分，最终推荐给用户高质量的优质长租公寓资源；

步骤204，干预调整：

基于长租公寓特有的lbs建模后，系统根据公司的出房倾斜政策、运营活动策略、广告推广等定制化的需求将一些特定的房源插入到推荐列表中特定的位置，为用户推荐更多的选择空间；如果推荐结果不足时，系统会自动推荐相关的热点精品房源补全。优化干预调整层，基于长租公寓特有的lbs方式建模，设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。

可以理解的是，本发明的召回方式，可以仅根据用户需求信息或者行为信息其中任意一个，当然也可以根据以上两种方式同时召回。本实施例仅示意出根据用户的需求召回，本实施例对召回方式不做具体要求，可以根据实际情况设置。

实施例3：

继续参考图2，本实施例提供的又一种根据用户需求和用户行为构建推荐引擎的方法，包括步骤：

步骤301，用户信息采集：

步骤302，召回：

假设用户搜索“xx首府”附近的长租公寓信息后，首先通过样本数据库获取用户行为信息：根据用户行信息召回：用户的实时行为经过数据清洗，通过flink处理框架实时进入数据库；用户的每次行为会生成历史行为日志汇总，通过spark计算引擎批量入hive离线数据仓库；入库数据同步存入redis实时数据库；

对采集到的数据信息进行汇总，精选，然后对长租公寓场景进行多层粗排序，针对客户强意图和标的物关键属性的匹配做lbs和价值匹配策略，以及对用户次要需求和房屋次要房态、地段特征做匹配策略，得到一个粗略的排序结果；对线上，线下的带看、签约等情况制定新的匹配策略，对排序模型做多级样本权重刻画，降低现有排序模型的复杂度；同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分，提高推荐公寓质量。

步骤303，排序：

对于召回的房源数据粗排序信息，综合采集用户的历史行为、需求偏好信息以及房态地块商圈图像通过spark分布式框架的特征工程测算处理后，分别对在线和离线数据进行相应训练构建排序模型，对样本数据进行权重刻画，根据数据信息的高度稀疏性和交易的大额属性对区域、房态等场景做深度的划分，给出房源信息准确的排序打分，最终推荐给用户高质量的优质长租公寓资源；

步骤304、干预调整：

可以理解的是，本发明的召回方式，可以仅根据用户需求信息或者行为信息其中任意一个，当然也可以根据以上两种方式同时召回。本实施例仅示意出根据用户行为召回，本实施例对召回方式不做具体要求，可以根据实际情况设置。

通过以上各实施例可知，本申请存在的有益效果是：

上面通过附图和实施例，对本申请的技术方案做虽然已经通过例子对本申请的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上例子仅是为了进行说明，而不是为了限制本发明的范围。尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。本发明的范围由所附权利要求来限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李昭;陈浩;高靖;崔岩;卢述奇;陈呈;张宵
技术所有人：青梧桐有限责任公司
我是此专利的发明人

上一篇：一种使用砂光粉的紫外光固化木器涂料的制作方法
上一篇：具有白色有机发光二极管的显示器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。