本发明涉及一种展示产品列表的选取方法,具体为一种互联网金融平台首页展示产品列表的选取方法,属于展示产品排序及列表选取。
背景技术:
1、首页不同模块热门产品展示是互联网平台尤其电商平台,为达到良好的营销效果,常用的手段。一般情况下,要选取合适的产品类别,达到一定的运营效果,需要基于海量的用户信息及相关的行为数据进行模型训练。
2、而对新用户进行产品展示的问题,已有的解决方法或多或少都依赖对新用户信息的收集,这些新用户通常是包含了平台已注册用户,所谓的“新”可能指首次登录但无操作行为记录的用户,或者历史有登录但不活跃的用户等。当平台积累的数据量较少且新用户是未在平台注册的完全陌生访问者时,如何确定首页不同模块下的产品展示列表,是一个仍待深入研究的问题。
技术实现思路
1、本发明的目的就在于为了解决上述至少一个技术问题而提供一种互联网金融平台首页展示产品列表的选取方法。
2、本发明通过以下技术方案来实现上述目的:一种互联网金融平台首页展示产品列表的选取方法,包括以下步骤:
3、s1、建立指标集,对产品进行不同维度的排序,并对每个维度进行细分,使最终建立的指标包含:5个一级指标,19个二级指标,32个三级指标;
4、s2、数据清洗及指标加工处理;
5、s3、确定产品得分计算方式,包括指标权重、指标分值;
6、s4、根据产品得分进行排序并结合产品属性的相似度选取最终展示的产品列表。
7、作为本发明再进一步的方案:步骤s1中,产品排序方法使用的数据源主要包含产品所在机构合作深度(如是否签约、业务数据是否共享等)、产品基本信息(如产品的类型、利率、放款时长、贷款额度、贷款期限以及还款方式等)、产品热度信息(如产品的历史点击量、申请量等)、产品效率信息(如产品机构对申请的处理时效等)、产品成效信息(如产品的历史授信规模、授信笔数、贷后表现等)5个维度。
8、作为本发明再进一步的方案:步骤s2具体包括以下步骤:
9、s21、对金融产品信息中涉及产品属性的描述性文本,进行信息提取(如利率、额度、放款时间等);
10、s22、根据s21提取的信息以及收集的产品热度信息、产品效率信息和产品成效信息相关的原始数据,加工衍生相应的三级指标;
11、s23、将s22中取值为连续型的指标进行标准化处理。
12、作为本发明再进一步的方案:s23具体包括以下步骤:
13、s231、正向指标数据标准化。正向指标代表数值大小与指标得分正相关的指标,例如贷款额度、贷款期限、热度等,设为第i个产品第j个三级指标标准化后的值,为第i个产品第j个三级指标的原始数据,q0.05j,q0.95j分别为第j个三级指标的5%和95%分位数,则
14、
15、或
16、
17、当指标在尾部的差异不显著或取值区间跨度较大时,使用(2)式以保证指标数值的稳健性和数值分布的合理性;
18、s232、负向指标数据标准化;负向指标代表数值大小与指标得分负相关的指标,例如产品利率、产品放款天数等,则
19、
20、或
21、
22、当指标在尾部的差异不显著或取值区间跨度较大时,使用(4)式以保证指标数值的稳健性和数值分布的合理性。
23、作为本发明再进一步的方案:步骤s3具体包括以下步骤:
24、s31、为了方便比较,预设最大分值为100分,实际最大分值还可以取1000等固定数值,不影响排序效果,权重的确定方法采用经典的ahp层次分析法,首先对一级指标确定相应的权重,然后依次对各层级的二级指标和三级指标确定相应的权重,实际中当历史数据充足时也可使用因子分析法等方式确定权重;
25、s32、产品的三级指标si()分值计算如下:
26、si()=xi()*100.0(5)
27、其中xi()表示给定产品的第i个一级指标下第j个二级指标下第k个三级指标的标准化指标值;
28、s33产品的二级指标si(分值计算如下:
29、
30、其中ωi()表示给定产品的第i个一级指标下第j个二级指标下第k个三级指标的权重,nj表示第j个二级指标下的三级指标数量;
31、s34产品的一级指标si分值计算如下:
32、
33、其中ωi(表示给定产品的第i个一级指标下第j个二级指标的权重,mi表示第i个一级指标下的二级指标数量;
34、s35产品最终分值s分值计算如下:
35、
36、其中,ωi表示给定产品的第i个一级指标的权重。
37、作为本发明再进一步的方案:步骤s4具体包括以下步骤:
38、s41、对产品按s3中计算的得分降序、产品上架时长降序、产品授信规模降序、产品放款时长升序等(为确保排名唯一性,选取一定数量的指标辅助排序),取出排名第一位的产品p1,生成展示产品列表{p1}及剩余产品子集p01=p0-{p1},其中p0为全部产品集;
39、s42、根据s41取到的产品集{p1},计算p1与p01中产品的【产品属性相似度】,根据设定的相似度阈值或数量(可根据实际选用其一),从p01中排除满足条件的产品,得到产品集p010,从p010中依s41中的排序选取第一位的产品p2,生成产品列表{p1,p2}及剩余产品子集p02=p010-{p1,p2};这里所述的【产品属性相似度】可采用“标称属性相似性度量”(两个属性向量相同元素的数量占比)和“余弦相似性度量”等。这里借助【产品属性相似度】阈值筛选产品的方式,也可用mmr(maximal marginal relevance)算法替代;mmr考虑选取产品的多样性和相关性,可避免出现重复或属性相似度过高的产品;
40、mmr=argmaxi∈9{θ*rewardi-(1-θ)*max(∈s[sim(i,j)]}
41、其中,
42、ii,j分别表示第i和第j个产品;
43、r:未选中的产品集合,s:已选中的产品集合;
44、θ:产品价值和多样性系数,介于0-1之前,rewardi:产品i的排序分数;
45、max(∈s[sim(i,j)]:产品i的多样性分数,sim(i,j)为产品i和j的【产品属性相似度】。
46、s43、根据s42取到的产品集{p1,p2},计算p1、p2与p02中产品的【产品属性相似度】的均值,根据设定的相似度阈值或数量(可根据实际选用其一),从p02中排除满足条件的产品,得到产品集p020,从p020中依s41中的排序选取第一位的产品p3,生成产品列表{p1,p2,p3}及剩余产品子集p03=p020-{p1,p2,p3};
47、s44、重复s43的操作,直到获得满足首页展示要求数量n的产品列表{p1,p2,…,pn}。
48、本发明的有益效果是:针对非注册用户访问平台的冷启动情形,提供了一种不依赖用户信息的新颖展示产品选取方法,可为平台新用户提供优质且丰富多样性的产品展示信息,有效提高平台服务水平,更好的吸引和转化平台新客户,使用了多维度的产品数据信息,体现产品打分公平性的同时,亦能起到对产品所属机构的正向督促引导作用,本发明的实现过程中使用了多层次的指标信息及稳健的归一化方法,权重的选择充分考虑各层级指标的重要性,结果更具科学性和可靠性,本发明提供的方法实现方便,易于迭代,可有效提高互联网金融平台的数字化运营水平。