基于矩阵分解的楼宇推荐方法和系统与流程

文档序号:31084905发布日期:2022-08-09 22:53阅读:64来源:国知局
基于矩阵分解的楼宇推荐方法和系统与流程

1.本发明涉及矩阵分解技术领域,具体地,涉及一种基于矩阵分解的楼宇推荐方法和系统。


背景技术:

2.近年来随着线下广告业务的迅猛发展,广告主对于线下广告的精细化服务提出了更多的需求。尤其在对线下广告进行资源筛选的场景中,一直缺乏一个清晰的参考方案,为广告主提供智能的一站式的推荐服务。
3.专利文献cn113868462a(申请号:cn202111065891.5)公开了一种基于矩阵分解的歌曲推荐系统及方法,涉及数据分析技术领域;将预处理后的歌曲特征数据和用户行为数据利用矩阵分解模型进行数据的矩阵分解,根据分解后的数据矩阵利用伯努利概率分布模型获得用户对歌曲的偏好度指标,根据偏好度指标对用户进行歌曲的推荐。
4.随着线下广告业务数据量质量的不断提升,现有的数据已经可以满足广告主对资源层面的精细化需求,所以如果能够结合线上电商等平台的推荐方案和线下资源的自有特性完成线下资源的智能推荐,这无疑对线下投放广告提供了投放最优解,同时为资源配置和整合带来巨大的好处,所以迫切需要一个基于线下资源的智能推荐方案。


技术实现要素:

5.针对现有技术中的缺陷,本发明的目的是提供一种基于矩阵分解的楼宇推荐方法和系统。
6.根据本发明提供的基于矩阵分解的楼宇推荐方法,包括:
7.步骤s1:获取楼宇画像和品牌方案,包括楼宇受众人群属性、自有标签、广告主的投放偏好、品牌规则和历史投放计划;
8.步骤s2:根据楼宇画像和品牌方案建立品牌-楼宇打分矩阵;
9.步骤s3:通过矩阵分解对品牌-楼宇进行打分预测;
10.步骤s4:将打分矩阵和权重矩阵进行融合,将所有品牌对于楼宇的分数进行加权;
11.步骤s5:将矩阵分解后的楼宇稠密特征向量用于楼宇相似度计算,将矩阵分解后的品牌稠密特征向量用于品牌相似度计算;
12.步骤s6:根据抽取的强规则为品牌召回楼宇,并根据分数从高到低进行排序,然后进行楼宇推荐。
13.优选的,所述品牌-楼宇打分矩阵的表达式为:
[0014][0015]
其中:m为生成的打分矩阵;score=p/t,p为所选点位数量,t为楼宇的点位总数;
[0016]
根据品牌规则建立规则矩阵,表达式为:
[0017][0018]
其中:w代表品牌的规则权重,当需要规避不符合预设条件的楼宇时,将w置为0。优选的,打分预测的表达式为:
[0019]
y(t)=g(t)+s(t)+h(t)+ε
t
[0020]
其中:g(t)为趋势项,s(t)为周期项,h(t)为节假日项,ε
t
为噪音项,将数据带入到模型,生成预测值t时刻预测值y。
[0021]
优选的,步骤s4中的加权表达式为:
[0022]
优选的,相似度计算表达式为:
[0023][0024]
其中:cosθ为相似度,为特征向量n,为特征向量n-1,||bn||和||b
n-||分别代表它们的模。
[0025]
根据本发明提供的基于矩阵分解的楼宇推荐系统,包括:
[0026]
模块m1:获取楼宇画像和品牌方案,包括楼宇受众人群属性、自有标签、广告主的投放偏好、品牌规则和历史投放计划;
[0027]
模块m2:根据楼宇画像和品牌方案建立品牌-楼宇打分矩阵;
[0028]
模块m3:通过矩阵分解对品牌-楼宇进行打分预测;
[0029]
模块m4:将打分矩阵和权重矩阵进行融合,将所有品牌对于楼宇的分数进行加权;
[0030]
模块m5:将矩阵分解后的楼宇稠密特征向量用于楼宇相似度计算,将矩阵分解后的品牌稠密特征向量用于品牌相似度计算;
[0031]
模块m6:根据抽取的强规则为品牌召回楼宇,并根据分数从高到低进行排序,然后进行楼宇推荐。
[0032]
优选的,所述品牌-楼宇打分矩阵的表达式为:
[0033][0034]
其中:m为生成的打分矩阵;score=p/t,p为所选点位数量,t为楼宇的点位总数;
[0035]
根据品牌规则建立规则矩阵,表达式为:
[0036][0037]
其中:w代表品牌的规则权重,当需要规避不符合预设条件的楼宇时,将w置为0。优选的,打分预测的表达式为:
[0038]
y(t)=g(t)+s(t)+h(t)+ε
t
[0039]
其中:g(t)为趋势项,s(t)为周期项,h(t)为节假日项,ε
t
为噪音项,将数据带入到模型,生成预测值t时刻预测值y。
[0040]
优选的,模块m4中的加权表达式为:e=m
°
r。
[0041]
优选的,相似度计算表达式为:
[0042][0043]
其中:cosθ为相似度,为特征向量n,为特征向量n-1,||bn||和||b
n-||分别代表它们的模。
[0044]
与现有技术相比,本发明具有如下的有益效果:
[0045]
1、本发明能够适配线下广告投放的场景,将一直被广泛用于线上电商作业的推荐任务一直到线下广告资源的推荐中去,实现了线上模型和线下业务的完美结合;
[0046]
2、本发明设计的权重模块是对传统推荐算法应用到线下广告投放场景的一个有力补充,广告主的业务需求通常加入强规则,偏好打分等外部特性,权重矩阵的补充使得推荐的结果根据解释性更加贴近业务本身;
[0047]
3、本发明的数据副产品可以用来进行广告主和项目资源本身的聚类分析和相似度计算,更有助于公司的资源整合;
[0048]
4、本发明设计的方法拥有一套完整的闭环链路进行模型的修正,能够不断地自我强化和自我修正,最终不断增进业务发展。
附图说明
[0049]
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0050]
图1为本发明的流程示意图;
[0051]
图2为本发明的核心算法模块图;
[0052]
图3为本发明的模型修正流程图。
具体实施方式
[0053]
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
[0054]
实施例:
[0055]
如图1,本发明提供了一种基于矩阵分解的楼宇推荐方案,方法的实现和部署方式包括以下步骤:
[0056]
步骤s1:生成楼宇画像和品牌方案,包括楼宇受众人群属性,自有标签,广告主的投放偏好,品牌规则和历史投放计划。楼宇画像,包括楼宇自然统计值,dmp标签和受众属性,楼宇画像需要数据在时间上的积累和空间上的融合,这其中包含楼宇打标任务,受众统计任务等,融合后获得项目资源标签向量,向量中的维度代表楼宇对应标签置信度;
[0057]
步骤s2:根据楼宇画像和品牌方案计算品牌-楼宇打分矩阵,根据品牌规则建立规则矩阵,融合楼宇的矩阵和品牌的矩阵需要根据历史的投放方案和客户表达的历史偏好进行链接,并计算分数;
[0058]
步骤s3:通过矩阵分解完成对于品牌-楼宇打分的预测,同时根据规则矩阵完成对于强规则的抽取。通过sparkals完成矩阵分解的计算,通过规则矩阵中的阈值等于1的特征
抽取强规则;
[0059]
步骤s4:将打分矩阵和权重矩阵进行融合,将所有品牌对于楼宇的分数进行加权,矩阵相加带入到核函数,即对应分数和对应权重相乘,最终得到综合得分;
[0060]
步骤s5:矩阵分解后的楼宇稠密特征向量可以继续用于楼宇相似度的计算,品牌稠密特征向量用于品牌相似度的计算。除了推荐分数,可以根据分解后的向量计算品牌相似度和楼宇相似度,用来完善冷启动问题;
[0061]
步骤s6:根据抽取的强规则为品牌召回部分楼宇,并根据分数从高到低进行排序,推荐top 10的楼宇,召回数量和排序规则可以动态调整。
[0062]
所述品牌-楼宇打分矩阵的表达式为:其中:m为生成的打分矩阵;score=p/t,p为所选点位数量,t为楼宇的点位总数;
[0063]
根据品牌规则建立规则矩阵,表达式为:其中:w代表品牌的规则权重,当需要规避不符合预设条件的楼宇时,将w置为0。
[0064]
打分预测的表达式为:y(t)=g(t)+s(t)+h(t)+ε
t
;其中:g(t)为趋势项,s(t)为周期项,h(t)为节假日项,ε
t
为噪音项,将数据带入到模型,生成预测值t时刻预测值y。
[0065]
步骤s4中的加权表达式为:e=m
°
r。
[0066]
相似度计算表达式为:其中:cosθ为相似度,为特征向量n,为特征向量n-1,||bn||和||b
n-||分别代表它们的模。
[0067]
以上步骤不仅仅引入了主流的推荐模型对楼宇资源进行的打分和预测,同时对线下广告投放场景进行了定制。通过数据积累和楼宇画像数据,广告主和项目之前的评分体系已经可以被建立,但是仍旧要存在着稀疏矩阵的特点,即对未曾投放过的项目中不存在品牌对项目的评分,也就无法完成预测。所以通过传统的矩阵分解对评分进行预测,并且由于线下广告和线上广告存在着很多不同,包括对于城市,地点,竞品等诸多限制,此类限制会分别变成权重矩阵和召回规则引擎融入到整个推荐体系中去。该方法能够很好地将线上线下的方式结合到一起,将推荐系统贴近现有业务实际。
[0068]
本发明应用于多种资源的数据推荐,可以进行进一步拓展,进行点位的推荐,也可以到区域,商圈的推荐,对于任何数据都可以应用到这一模式。
[0069]
本发明首先要完成楼宇画像和品牌方案的绘制,然后完成实楼宇矩阵相关矩阵的构建,最后完成召回和排序。以楼宇及品牌的矩阵分解程序为例,如图2所示,完成矩阵算法的设计,包括基础打分矩阵和权重矩阵,这些数据是所有计算的基础。然后设计开发spark矩阵分解程序,设计入参rank=50,参数为特征向量维度,值过小容易拟合程度不够,值过大容易造成泛化能力弱,经过测试50的损失最小;iteration=10,该参数为迭代次数;lambda=0.0001,lambda为正则化系数,系数越大,惩罚力度越大,对于降维和削弱指标的影响越大。超参数设置完毕后对现有矩阵进行分解计算,得到关于楼宇的稠密特征和品牌的稠密特征,将两个特征矩阵进行叉乘,完成矩阵的还原,新生成矩阵中的预测单元中就生成了新的打分项。一般情况下该分数就可以用来品牌对于楼宇的召回和排序了,但是由于
线下广告的特殊性,对于强规则和弱规则都需要加以考量。对于通用的可衡量的规则指标,例如受众要求,租金要求等,会加入到权重矩阵中去,从dmp系统中生成该数据,然后融合进预测矩阵,完成最后的打分。对于专有的强规则,在召回阶段设置规则引擎,针对不同客户进行规则召回,再进行分数排序,完成不同场景下不同客户的推需求。
[0070]
以上仅为推荐系统中一个场景的设计和开发样例,其他场景的推荐实践均是如此。本发明开发成本较低,只需要已有的大数据框架即可完成;本发明可以有效地解决线下投放的业务问题,做到了线上线下相结合;本发明扩展性强,任意spark集群均可完成构建,只需要对现有数据进行定制化清洗即可。综上所述,本发明提供的一种基于矩阵分解的楼宇推荐方案拥有十分广阔的应用前景。需要说明的是,本发明在实施过程中,该方法除了spark通用环境的搭建,仅需定制化数据矩阵转化管道即可,模型可迁移,方法可复用。
[0071]
本发明提供了一种基于矩阵分解的楼宇推荐系统,包括:
[0072]
模块m1:数据清洗模块,通过dmp平台完成对楼宇画像和品牌方案的定制;
[0073]
模块m2:矩阵生成模块,融合各类数据指标转换成各类别矩阵;
[0074]
模块m3:spark算法模块,通过spark构建矩阵分解模块,完成als计算;
[0075]
模块m4:加权融合模块,该模块为了突出用户的当下偏好;
[0076]
模块m5:召回排序模块,将权重矩阵模块和打分矩阵的融合,然后通过强规则完成召回过滤,通过分数进行排序推荐;
[0077]
模块m6:闭环修正模块,通过埋点数据和用户倾向动态不断更新三个矩阵,完成模型的迭代。
[0078]
所述模块m1会对多种类数据进行清洗和融合,收集楼宇画像相关数据,收集品牌投放策略相关数据,最后融合成楼宇维度和品牌维度的画像数据。
[0079]
所述模块m2是对楼宇画像数据和品牌投放数据的融合,生成品牌楼宇的打分矩阵,该矩阵通过单一的分数维度表示品牌对于楼宇的偏好度。
[0080]
所述模块m3通过开发spark任务完成m2输出矩阵的分解,并生成副产品楼宇稠密向量和品牌稠密向量,同时完成分数的预测。
[0081]
所述模块m4是生成和m3预测矩阵维度相同的权重矩阵,该矩阵为品牌的规则偏好加权。
[0082]
所述模块m5,通过权重矩阵和预测矩阵的融合完成最终矩阵的生成,对于限制规则,行业禁忌等通过召回匹配规则的方式完成过滤。
[0083]
所述模块m6通过埋点数据和线下规则补充来影响预测矩阵和权重矩阵,每次结果会重新加入到生成从而不断优化现有推荐模型,如图3。
[0084]
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结
构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
[0085]
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本技术的实施例和实施例中的特征可以任意相互组合。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1