基于用户画像的产品推荐方法、装置、电子设备及介质与流程

文档序号:26760570发布日期:2021-09-25 05:47阅读:71来源:国知局
基于用户画像的产品推荐方法、装置、电子设备及介质与流程

1.本发明涉及数据分析技术领域,尤其涉及一种基于用户画像的产品推荐方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.任何的项目及产品销售中,由于各类客户的需求不同,依据客户的需求来推荐所匹配的产品是最为高效的销售方式。目前,在金融、保险等领域中,会对用户的相关信息进行分析,推断出用户可能会感兴趣的产品,并将这些可能会感兴趣产品推荐给用户。在对用户进行产品推荐时,被推荐产品的准确性直接影响到最终的推荐效果。
3.现有的产品推荐方法通常是通过人为设置进行产品推荐,例如,在信托行业中,通常是根据经理通过对客户持有资产、投资偏好等信息凭借从业经验更甚至于经理的自身偏好向客户推荐产品。这样的推荐方式对于客户的投资预期产生偏差的概率较大,客户体验并不乐观,产品推荐的准确度较低。


技术实现要素:

4.本发明提供一种基于用户画像的产品推荐方法、装置及计算机可读存储介质,其主要目的在于解决产品推荐的准确度较低的问题。
5.为实现上述目的,本发明提供的一种基于用户画像的产品推荐方法,包括:
6.获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集;
7.对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图;
8.提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据;
9.对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像;
10.获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所述多个数据特征构建用户画像;
11.计算所述用户画像和所述内容画像之间的匹配值;
12.当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行过滤推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
13.可选地,所述提取所述关系有向图中的多个关键实体,包括:
14.利用预设的节点权重计算公式计算所述关系有向图中多个节点的权重;
15.将所述关系有向图中的权重超过预设的权重阈值的多个节点做为所述多个关键实体。
16.可选地,所述利用预设的节点权重计算公式计算所述关系有向图中多个节点的权重,包括:
17.利用如下公式计算所述关系有向图中多个节点的权重:
[0018][0019]
其中,ws(v
i
)表示节点v
i
的权重,d为阻尼系数,in(v
i
)为指向节点v
i
的节点集合,out(v
j
)为节点v
i
所指向的节点集合,w
ji
为节点v
i
和v
j
之间的连接权重,w
jk
为节点v
k
和v
j
之间的连接权重。
[0020]
可选地,所述计算所述初始向量和多个预设标准标签之间的相似系数,包括:
[0021]
计算所述初始向量与所述预设标准标签之间的协方差;
[0022]
根据所述协方差和预设的皮尔逊相关公式计算所述初始向量和所述预设标准标签之间的相似系数。
[0023]
可选地,所述根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像,包括:
[0024]
筛选出所述预设标准标签中相似系数大于或者等于预设的相似阈值的多个预设标准标签;
[0025]
将筛选出来的多个预设标准标签按照对应相似系数的从大到小进行排序;
[0026]
按照从前到后的顺序从排序后的多个预设标准标签中选取预设数量的预设标准标签为所述原始数据集的内容画像。
[0027]
可选地,所述根据所述多个数据特征构建用户画像,包括:
[0028]
计算所述多个数据特征中各个数据特征的分类值;
[0029]
根据所述分类值所在的数值区间确定所述多个数据特征中各数据特征对应的分类;
[0030]
根据所述分类计算用户指标数据,并确定所述用户指标数据为所述目标用户的用户画像。
[0031]
可选地,所述对所述初始数据集进行实体识别处理,得到实体集合,包括:
[0032]
对所述初始数据集进行去符号或分词处理,得到初始分词集;
[0033]
识别并提取出所述初始分词集中的多个实体,得到实体集合。
[0034]
为了解决上述问题,本发明还提供一种基于用户画像的产品推荐装置,所述装置包括:
[0035]
数据筛选模块,用于获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集;
[0036]
实体识别模块,用于对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图;
[0037]
实体提取模块,用于提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据;
[0038]
标签选择模块,用于对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准
标签作为所述原始数据集的内容画像;
[0039]
画像构建模块,用于获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所述多个数据特征构建用户画像;
[0040]
产品推荐模块,用于计算所述用户画像和所述内容画像之间的匹配值,当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行过滤推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
[0041]
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
[0042]
存储器,存储至少一个指令;及
[0043]
处理器,执行所述存储器中存储的指令以实现上述所述的基于用户画像的产品推荐方法。
[0044]
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于用户画像的产品推荐方法。
[0045]
本发明实施例中,通过对经过数据筛选得到的初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建得到关系有向图,利用所述关系有向图清楚且直观的表示出实体之间的关系,明确地将数据组织成图形结构以便更好地进行分析,根据相似系数选取预设数量的预设标准标签为所述原始数据集的内容画像,由于利用初始向量与预设标准标签的相似系数选取内容画像,故得到的内容画像的精度高,因此,可提高生成的内容画像的精确度;通过提取目标用户的数据信息集的多个数据特征并根据多个数据特征生成目标用户的用户画像,可提高生成的用户画像的精确度;通过获取目标用户的数据信息集,基于数据信息集提取目标用户的多个数据特征,基于多个数据特征生成目标用户的用户画像,计算用户画像和内容画像的匹配值,进而将匹配值满足预设条件的内容画像进行推荐处理,将得到的目标产品推送至所述目标用户,实现了利用匹配值筛选出满足预设条件的内容画像对应的目标产品并推送给目标用户,提高了筛选出的目标产品与目标用户的匹配性,从而可以实现个性化的对用户进行产品推荐的目的。因此本发明提出的基于用户画像的产品推荐方法、装置、电子设备及计算机可读存储介质,可以解决产品推荐的准确度较低的问题。
附图说明
[0046]
图1为本发明一实施例提供的基于用户画像的产品推荐方法的流程示意图;
[0047]
图2为本发明一实施例提供的基于用户画像的产品推荐装置的功能模块图;
[0048]
图3为本发明一实施例提供的实现所述基于用户画像的产品推荐方法的电子设备的结构示意图。
[0049]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0050]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0051]
本技术实施例提供一种基于用户画像的产品推荐方法。所述基于用户画像的产品推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的
该方法的电子设备中的至少一种。换言之,所述基于用户画像的产品推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
[0052]
参照图1所示,为本发明一实施例提供的基于用户画像的产品推荐方法的流程示意图。在本实施例中,所述基于用户画像的产品推荐方法包括:
[0053]
s1、获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集。
[0054]
本发明实施例中,所述原始数据集可以为在信托行业中客户的相关信息,例如,客户的关注方向、投资习惯、风险偏好、未来现金流、现有资产、持有资产等。具体地,可以通过具有数据获取功能的爬虫语句从信托行业的系统或者数据库中进行数据的爬取。
[0055]
具体地,所述对所述原始数据集进行数据筛选处理,得到初始数据集,包括:
[0056]
从所述原始数据集中筛选出与预设关键词库中相同的数据,得到初始数据集。
[0057]
详细地,在本发明实施例中,所述预设关键词库中包含多个客户关注信息的关键词,例如,客户关注产品的等级、期限、类型等信息。
[0058]
其中,由于所述原始数据集中包含客户相关的多种信息,而在本发明主要是实现根据客户的需求来推荐所匹配的产品,故需要筛选出所述原始数据集中客户所关注产品的相关信息和对应的数据。
[0059]
s2、对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图。
[0060]
本发明实施例中,对所述初始数据集进行实体识别,以识别出所述初始数据集中具有特定意义的实体,包括人名、地名、机构及专有名词等。例如,本发明实施例中,可以识别出所述初始数据集中的产品实体。
[0061]
具体地,所述对所述初始数据集进行实体识别处理,得到实体集合,包括:
[0062]
对所述初始数据集进行去符号或分词处理,得到初始分词集;
[0063]
识别并提取出所述初始分词集中的多个实体,得到实体集合。
[0064]
详细地,所述去符号是去除所述初始数据集中的非文字部分,所述初始数据集中的初始数据不一定是规范的纯文本,可能含有部分数字符号或者特殊符号,进行去符号处理可以保留所述初始数据集中的文字部分,便于后续进行实体识别。
[0065]
进一步地,本发明实施例可以利用jieba分词器对所述初始数据集进行分词处理,得到初始分词集,并采用基于神经网络的实体识别模型从所述初始分词集中筛选出实体集合。
[0066]
具体地,所述根据所述实体集合构建关系有向图,包括:
[0067]
以所述实体集合中的实体作为节点,实体和实体之间的关系作为节点和节点之间的连线,构建关系有向图。
[0068]
s3、提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据。
[0069]
本发明实施例中,所述提取所述关系有向图中的多个关键实体,包括:
[0070]
利用预设的节点权重计算公式计算所述关系有向图中多个节点的权重;
[0071]
将所述关系有向图中的权重超过预设的权重阈值的多个节点做为所述多个关键实体。
[0072]
其中,所述关系有向图中的一个节点表示所述实体集合中的一个实体。
[0073]
详细地,本发明实施例中,所述利用预设的节点权重计算公式计算所述关系有向图中多个节点的权重,包括:
[0074]
利用如下公式计算所述关系有向图中多个节点的权重:
[0075][0076]
其中,ws(v
i
)表示节点v
i
的权重,d为阻尼系数,in(v
i
)为指向节点v
i
的节点集合,out(v
j
)为节点v
i
所指向的节点集合,w
ji
为节点v
i
和v
j
之间的连接权重,w
jk
为节点v
k
和v
j
之间的连接权重。
[0077]
优选地,所述阻尼系数可以为0.75。
[0078]
详细地,提取出所述关系有向图中的多个关键实体,所述关键实体在所述实体集合中处于关系中心且具有较多关联实体,根据挑选出来的关键实体在所述原始数据集中找到对应的初始数据。
[0079]
s4、对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像。
[0080]
本发明实施例中,可以利用预设的无监督模型对所述初始数据进行向量化处理,其中,所述预设的无监督模型可以是word2vec、doc2vec、fasttext等,本方案中,所述预设的无监督模型为word2vec中的skip

gram模型。
[0081]
具体地,所述计算所述初始向量和多个预设标准标签之间的相似系数,包括:
[0082]
计算所述初始向量与所述预设标准标签之间的协方差;
[0083]
根据所述协方差和预设的皮尔逊相关公式计算所述初始向量和所述预设标准标签之间的相似系数。
[0084]
详细地,利用预设的协方差公式计算所述初始向量与所述预设标准标签之间的协方差,包括:
[0085]
cov(x,y)=e(x

μ)(y

υ)
[0086]
其中,cov(x,y)为所述协方差,x为所述初始向量,y为所述预设标准标签,μ表示所述初始向量的数学期望,υ为所述预设标准标签的数学期望。
[0087]
详细地,所述协方差用于衡量两个变量的总体误差。
[0088]
进一步地,所述根据所述协方差和预设的皮尔逊相关公式计算所述初始向量和所述预设标准标签之间的相似系数,包括:
[0089]
利用如下公式计算所述初始向量和所述预设标准标签之间的相似系数:
[0090][0091]
其中,ρ
x,y
为相似系数,cov(x,y)为所述协方差,σ
x
和σ
y
分别为所述初始向量和预设的标准标签对应的标准差。
[0092]
例如,所述初始数据进行向量化后对应的初始向量为z,存在多个预设标准标签
(预设标准标签a、预设标准标签b和预设标准标签c),分别计算所述初始向量z与预设标准标签a之间的相似系数、所述初始向量z与预设标准标签b之间的相似系数及所述初始向量z与预设标准标签c之间的相似系数。
[0093]
具体地,所述根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像,包括:
[0094]
筛选出所述预设标准标签中相似系数大于或者等于预设的相似阈值的多个预设标准标签;
[0095]
将筛选出来的多个预设标准标签按照对应相似系数的从大到小进行排序;
[0096]
按照从前到后的顺序从排序后的多个预设标准标签中选取预设数量的预设标准标签为所述原始数据集的内容画像。
[0097]
例如,预设相似阈值为40,初始向量为z与预设标准标签a的相似系数为10、初始向量为z与预设标准标签b的相似系数为70,初始向量为z与预设标准标签c的相似系数为50,初始向量为z与预设标准标签d的相似系数为60;则选取预设标准标签b、预设标准标签c和预设标准标签d,且将预设标准标签b、预设标准标签c和预设标准标签d按照相似系数的大小进行排序为:预设标准标签b、预设标准标签d、预设标准标签c;当预设数量为2时,则按照从前到后的顺序从标签序列中选取预设标准标签b和预设标准标签d为原始数据集的内容画像。
[0098]
s5、获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所述多个数据特征构建得到用户画像。
[0099]
本发明实施例中,所述目标用户的信息集可以从存储所述目标用户对应信息的数据库中提取,例如,目标用户关注产品的等级、期限、类型等。
[0100]
具体地,所述提取所述数据信息集中的多个数据特征,包括:
[0101]
将所述数据信息集输入至预构建的特征提取模型中进行特征提取处理,得到多个数据特征。
[0102]
详细地,所述预构建的特征提取模型为至少包含一个网络构建块的深度神经网络,其中,所述网络构建块包括融合模块和并联的多路处理模块,通过多路处理模块分别提取所述数据信息集中的的部分特征数据,多路处理模块提取的部分特征数据分属于不同维度的特征数据,需要通过所述融合模块将所述多路处理模块输出的部分特征数据拼接在一起,得到多个数据特征。
[0103]
进一步地,所述根据所述多个数据特征构建得到用户画像,包括:
[0104]
计算所述多个数据特征中各个数据特征的分类值;
[0105]
根据所述分类值所在的数值区间确定所述多个数据特征中各数据特征对应的分类;
[0106]
根据所述分类计算用户指标数据,并确定所述用户指标数据为所述目标用户的用户画像。
[0107]
其中,所述多个数据特征中各个数据特征包括但不限于用户等级特征、用户期限特征和用户类型特征。
[0108]
详细地,所述计算所述多个数据特征中各个数据特征的分类值,包括:
[0109]
利用下述分类计算公式计算多个数据特征中各个数据特征的分类值:
[0110]
s=1
×
degree+5
×
limit+10
×
type
[0111]
其中,s为所述分类值,degree为目标用户关心产品的等级,limit为目标用户关心产品的期限,type为目标用户关心产品的类型。
[0112]
详细地,根据所述分类值所在的数值区间确定所述多个数据特征中各数据特征对应的分类,例如,当分类值在区间[a,b)时,特征分类为第一类,当分类值在区间[b,c)时,特征分类为第二类,当分类值在区间[c,d)时,特征分类为第三类,当a<s<b时,则多个特征中各个数据特征的分类为第一类。
[0113]
具体地,利用预设的用户指标算法计算所述分类对应的用户指标数据,其中,所述用户指标数据是指可以代表用户某些具体行为的指标数据。
[0114]
进一步地,所述根据所述分类计算用户指标数据,包括:
[0115]
利用如下公式计算用户指标数据:
[0116]
target=θ*s+τ*t
[0117]
其中,target为所述用户指标数据,s为等级偏好特征的分类值,t为期限偏好特征的分类值,θ、τ为预设权重系数。
[0118]
本发明实施例通过目标用户的数据信息集提取目标用户的多个数据特征,并基于多个数据特征生成目标用户的用户画像,能够生成精确度高的用户画像。
[0119]
s6、计算所述用户画像和所述内容画像之间的匹配值。
[0120]
本发明实施例中,利用隐语言模型lfm来进行用户画像和所述内容画像的匹配,将所述用户画像和所述内容画像输入至所述隐语言模型lfm中,得到所述用户画像和所述内容画像之间的匹配值。
[0121]
所述隐语言模型lfm是一种分类推荐领域的机器学习模型,通过隐语言模型lfm可计算出用户画像和内容画像的匹配值。
[0122]
s7、当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
[0123]
本发明实施例中,当所述匹配值大于或者等于预设的匹配阈值时,将所述内容画像对应的初始数据作为输出数据,所述初始数据中包含了客户所关注的产品性质,以所述初始数据作为标准在预设的产品数据库中进行搜索,得到多个产品,并对产品评价予以进一步的整理和过滤,得到目标产品,并将所述目标产品推送给目标用户。
[0124]
详细地,协同过滤推荐算法能够划分成两个方面。其一,则是“协同”。另外一者,则是“过滤”。第一步,这种算法则会将用户的个人偏好作为先决性条件,开始予以协同。之后,再对于待推荐产品评价予以进一步的整理和过滤。
[0125]
本发明实施例中,通过对经过数据筛选得到的初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建得到关系有向图,利用所述关系有向图清楚且直观的表示出实体之间的关系,明确地将数据组织成图形结构以便更好地进行分析,根据相似系数选取预设数量的预设标准标签为所述原始数据集的内容画像,由于利用初始向量与预设标准标签的相似系数选取内容画像,故得到的内容画像的精度高,因此,可提高生成的内容画像的精确度;通过提取目标用户的数据信息集的多个数据特征并根据多个数据特征生成目标用户的用户画像,可提高生成的用户画像的精确度;通过获取目标用户的数据信息
集,基于数据信息集提取目标用户的多个数据特征,基于多个数据特征生成目标用户的用户画像,计算用户画像和内容画像的匹配值,进而将匹配值满足预设条件的内容画像进行推荐处理,将得到的目标产品推送至所述目标用户,实现了利用匹配值筛选出满足预设条件的内容画像对应的目标产品并推送给目标用户,提高了筛选出的目标产品与目标用户的匹配性,从而可以实现个性化的对用户进行产品推荐的目的。因此本发明提出的基于用户画像的产品推荐方法可以解决产品推荐的准确度较低的问题。
[0126]
如图2所示,是本发明一实施例提供的基于用户画像的产品推荐装置的功能模块图。
[0127]
本发明所述基于用户画像的产品推荐装置100可以安装于电子设备中。根据实现的功能,所述基于用户画像的产品推荐装置100可以包括数据筛选模块101、实体识别模块102、实体提取模块103、标签选择模块104、画像构建模块105及产品推荐模块106。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0128]
在本实施例中,关于各模块/单元的功能如下:
[0129]
所述数据筛选模块101,用于获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集;
[0130]
所述实体识别模块102,用于对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图;
[0131]
所述实体提取模块103,用于提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据;
[0132]
所述标签选择模块104,用于对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像;
[0133]
所述画像构建模块105,用于获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所述多个数据特征构建用户画像;
[0134]
所述产品推荐模块106,用于计算所述用户画像和所述内容画像之间的匹配值,当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行过滤推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
[0135]
详细地,所述基于用户画像的产品推荐装置100各模块的具体实施方式如下:
[0136]
步骤一、获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集。
[0137]
本发明实施例中,所述原始数据集可以为在信托行业中客户的相关信息,例如,客户的关注方向、投资习惯、风险偏好、未来现金流、现有资产、持有资产等。具体地,可以通过具有数据获取功能的爬虫语句从信托行业的系统或者数据库中进行数据的爬取。
[0138]
具体地,所述对所述原始数据集进行数据筛选处理,得到初始数据集,包括:
[0139]
从所述原始数据集中筛选出与预设关键词库中相同的数据,得到初始数据集。
[0140]
详细地,在本发明实施例中,所述预设关键词库中包含多个客户关注信息的关键词,例如,客户关注产品的等级、期限、类型等信息。
[0141]
其中,由于所述原始数据集中包含客户相关的多种信息,而在本发明主要是实现
根据客户的需求来推荐所匹配的产品,故需要筛选出所述原始数据集中客户所关注产品的相关信息和对应的数据。
[0142]
步骤二、对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图。
[0143]
本发明实施例中,对所述初始数据集进行实体识别,以识别出所述初始数据集中具有特定意义的实体,包括人名、地名、机构及专有名词等。例如,本发明实施例中,可以识别出所述初始数据集中的产品实体。
[0144]
具体地,所述对所述初始数据集进行实体识别处理,得到实体集合,包括:
[0145]
对所述初始数据集进行去符号或分词处理,得到初始分词集;
[0146]
识别并提取出所述初始分词集中的多个实体,得到实体集合。
[0147]
详细地,所述去符号是去除所述初始数据集中的非文字部分,所述初始数据集中的初始数据不一定是规范的纯文本,可能含有部分数字符号或者特殊符号,进行去符号处理可以保留所述初始数据集中的文字部分,便于后续进行实体识别。
[0148]
进一步地,本发明实施例可以利用jieba分词器对所述初始数据集进行分词处理,得到初始分词集,并采用基于神经网络的实体识别模型从所述初始分词集中筛选出实体集合。
[0149]
具体地,所述根据所述实体集合构建关系有向图,包括:
[0150]
以所述实体集合中的实体作为节点,实体和实体之间的关系作为节点和节点之间的连线,构建关系有向图。
[0151]
步骤三、提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据。
[0152]
本发明实施例中,所述提取所述关系有向图中的多个关键实体,包括:
[0153]
利用预设的节点权重计算公式计算所述关系有向图中多个节点的权重;
[0154]
将所述关系有向图中的权重超过预设的权重阈值的多个节点做为所述多个关键实体。
[0155]
其中,所述关系有向图中的一个节点表示所述实体集合中的一个实体。
[0156]
详细地,本发明实施例中,所述利用预设的节点权重计算公式计算所述关系有向图中多个节点的权重,包括:
[0157]
利用如下公式计算所述关系有向图中多个节点的权重:
[0158][0159]
其中,ws(v
i
)表示节点v
i
的权重,d为阻尼系数,in(v
i
)为指向节点v
i
的节点集合,out(v
j
)为节点v
i
所指向的节点集合,w
ji
为节点v
i
和v
j
之间的连接权重,w
jk
为节点v
k
和v
j
之间的连接权重。
[0160]
优选地,所述阻尼系数可以为0.75。
[0161]
详细地,提取出所述关系有向图中的多个关键实体,所述关键实体在所述实体集合中处于关系中心且具有较多关联实体,根据挑选出来的关键实体在所述原始数据集中找到对应的初始数据。
[0162]
步骤四、对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像。
[0163]
本发明实施例中,可以利用预设的无监督模型对所述初始数据进行向量化处理,其中,所述预设的无监督模型可以是word2vec、doc2vec、fasttext等,本方案中,所述预设的无监督模型为word2vec中的skip

gram模型。
[0164]
具体地,所述计算所述初始向量和多个预设标准标签之间的相似系数,包括:
[0165]
计算所述初始向量与所述预设标准标签之间的协方差;
[0166]
根据所述协方差和预设的皮尔逊相关公式计算所述初始向量和所述预设标准标签之间的相似系数。
[0167]
详细地,利用预设的协方差公式计算所述初始向量与所述预设标准标签之间的协方差,包括:
[0168]
cov(x,y)=e(x

μ)(y

υ)
[0169]
其中,cov(x,y)为所述协方差,x为所述初始向量,y为所述预设标准标签,μ表示所述初始向量的数学期望,υ为所述预设标准标签的数学期望。
[0170]
详细地,所述协方差用于衡量两个变量的总体误差。
[0171]
进一步地,所述根据所述协方差和预设的皮尔逊相关公式计算所述初始向量和所述预设标准标签之间的相似系数,包括:
[0172]
利用如下公式计算所述初始向量和所述预设标准标签之间的相似系数:
[0173][0174]
其中,ρ
x,y
为相似系数,cov(x,y)为所述协方差,σ
x
和σ
y
分别为所述初始向量和预设的标准标签对应的标准差。
[0175]
例如,所述初始数据进行向量化后对应的初始向量为z,存在多个预设标准标签(预设标准标签a、预设标准标签b和预设标准标签c),分别计算所述初始向量z与预设标准标签a之间的相似系数、所述初始向量z与预设标准标签b之间的相似系数及所述初始向量z与预设标准标签c之间的相似系数。
[0176]
具体地,所述根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像,包括:
[0177]
筛选出所述预设标准标签中相似系数大于或者等于预设的相似阈值的多个预设标准标签;
[0178]
将筛选出来的多个预设标准标签按照对应相似系数的从大到小进行排序;
[0179]
按照从前到后的顺序从排序后的多个预设标准标签中选取预设数量的预设标准标签为所述原始数据集的内容画像。
[0180]
例如,预设相似阈值为40,初始向量为z与预设标准标签a的相似系数为10、初始向量为z与预设标准标签b的相似系数为70,初始向量为z与预设标准标签c的相似系数为50,初始向量为z与预设标准标签d的相似系数为60;则选取预设标准标签b、预设标准标签c和预设标准标签d,且将预设标准标签b、预设标准标签c和预设标准标签d按照相似系数的大
小进行排序为:预设标准标签b、预设标准标签d、预设标准标签c;当预设数量为2时,则按照从前到后的顺序从标签序列中选取预设标准标签b和预设标准标签d为原始数据集的内容画像。
[0181]
步骤五、获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所述多个数据特征构建得到用户画像。
[0182]
本发明实施例中,所述目标用户的信息集可以从存储所述目标用户对应信息的数据库中提取,例如,目标用户关注产品的等级、期限、类型等。
[0183]
具体地,所述提取所述数据信息集中的多个数据特征,包括:
[0184]
将所述数据信息集输入至预构建的特征提取模型中进行特征提取处理,得到多个数据特征。
[0185]
详细地,所述预构建的特征提取模型为至少包含一个网络构建块的深度神经网络,其中,所述网络构建块包括融合模块和并联的多路处理模块,通过多路处理模块分别提取所述数据信息集中的的部分特征数据,多路处理模块提取的部分特征数据分属于不同维度的特征数据,需要通过所述融合模块将所述多路处理模块输出的部分特征数据拼接在一起,得到多个数据特征。
[0186]
进一步地,所述根据所述多个数据特征构建得到用户画像,包括:
[0187]
计算所述多个数据特征中各个数据特征的分类值;
[0188]
根据所述分类值所在的数值区间确定所述多个数据特征中各数据特征对应的分类;
[0189]
根据所述分类计算用户指标数据,并确定所述用户指标数据为所述目标用户的用户画像。
[0190]
其中,所述多个数据特征中各个数据特征包括但不限于用户等级特征、用户期限特征和用户类型特征。
[0191]
详细地,所述计算所述多个数据特征中各个数据特征的分类值,包括:
[0192]
利用下述分类计算公式计算多个数据特征中各个数据特征的分类值:
[0193]
s=1
×
degree+5
×
limit+10
×
type
[0194]
其中,s为所述分类值,degree为目标用户关心产品的等级,limit为目标用户关心产品的期限,type为目标用户关心产品的类型。
[0195]
详细地,根据所述分类值所在的数值区间确定所述多个数据特征中各数据特征对应的分类,例如,当分类值在区间[a,b)时,特征分类为第一类,当分类值在区间[b,c)时,特征分类为第二类,当分类值在区间[c,d)时,特征分类为第三类,当a<s<b时,则多个特征中各个数据特征的分类为第一类。
[0196]
具体地,利用预设的用户指标算法计算所述分类对应的用户指标数据,其中,所述用户指标数据是指可以代表用户某些具体行为的指标数据。
[0197]
进一步地,所述根据所述分类计算用户指标数据,包括:
[0198]
利用如下公式计算用户指标数据:
[0199]
target=θ*s+τ*t
[0200]
其中,target为所述用户指标数据,s为等级偏好特征的分类值,t为期限偏好特征的分类值,θ、τ为预设权重系数。
[0201]
本发明实施例通过目标用户的数据信息集提取目标用户的多个数据特征,并基于多个数据特征生成目标用户的用户画像,能够生成精确度高的用户画像。
[0202]
步骤六、计算所述用户画像和所述内容画像之间的匹配值。
[0203]
本发明实施例中,利用隐语言模型lfm来进行用户画像和所述内容画像的匹配,将所述用户画像和所述内容画像输入至所述隐语言模型lfm中,得到所述用户画像和所述内容画像之间的匹配值。
[0204]
所述隐语言模型lfm是一种分类推荐领域的机器学习模型,通过隐语言模型lfm可计算出用户画像和内容画像的匹配值。
[0205]
步骤七、当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
[0206]
本发明实施例中,当所述匹配值大于或者等于预设的匹配阈值时,将所述内容画像对应的初始数据作为输出数据,所述初始数据中包含了客户所关注的产品性质,以所述初始数据作为标准在预设的产品数据库中进行搜索,得到多个产品,并对产品评价予以进一步的整理和过滤,得到目标产品,并将所述目标产品推送给目标用户。
[0207]
详细地,协同过滤推荐算法能够划分成两个方面。其一,则是“协同”。另外一者,则是“过滤”。第一步,这种算法则会将用户的个人偏好作为先决性条件,开始予以协同。之后,再对于待推荐产品评价予以进一步的整理和过滤。
[0208]
本发明实施例中,通过对经过数据筛选得到的初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建得到关系有向图,利用所述关系有向图清楚且直观的表示出实体之间的关系,明确地将数据组织成图形结构以便更好地进行分析,根据相似系数选取预设数量的预设标准标签为所述原始数据集的内容画像,由于利用初始向量与预设标准标签的相似系数选取内容画像,故得到的内容画像的精度高,因此,可提高生成的内容画像的精确度;通过提取目标用户的数据信息集的多个数据特征并根据多个数据特征生成目标用户的用户画像,可提高生成的用户画像的精确度;通过获取目标用户的数据信息集,基于数据信息集提取目标用户的多个数据特征,基于多个数据特征生成目标用户的用户画像,计算用户画像和内容画像的匹配值,进而将匹配值满足预设条件的内容画像进行推荐处理,将得到的目标产品推送至所述目标用户,实现了利用匹配值筛选出满足预设条件的内容画像对应的目标产品并推送给目标用户,提高了筛选出的目标产品与目标用户的匹配性,从而可以实现个性化的对用户进行产品推荐的目的。因此本发明提出的基于用户画像的产品推荐装置可以解决产品推荐的准确度较低的问题。
[0209]
如图3所示,是本发明一实施例提供的实现基于用户画像的产品推荐方法的电子设备的结构示意图。
[0210]
所述电子设备可以包括处理器10、存储器11、通信接口12和总线13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于用户画像的产品推荐程序。
[0211]
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移
动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于用户画像的产品推荐程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0212]
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于用户画像的产品推荐程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0213]
所述通信接口12用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi

fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及old(organic light

emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0214]
所述总线13可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称fisa)总线等。该总线13可以分为地址总线、数据总线、控制总线等。所述总线13被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0215]
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0216]
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi

fi模块等,在此不再赘述。
[0217]
进一步地,所述电子设备还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如wi

fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。
[0218]
可选地,该电子设备还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可
选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light

emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0219]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0220]
所述电子设备中的所述存储器11存储的基于用户画像的产品推荐程序是多个指令的组合,在所述处理器10中运行时,可以实现:
[0221]
获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集;
[0222]
对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图;
[0223]
提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据;
[0224]
对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像;
[0225]
获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所述多个数据特征构建用户画像;
[0226]
计算所述用户画像和所述内容画像之间的匹配值;
[0227]
当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行过滤推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
[0228]
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0229]
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)。
[0230]
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0231]
获取原始数据集,对所述原始数据集进行数据筛选处理,得到初始数据集;
[0232]
对所述初始数据集进行实体识别处理,得到实体集合,并根据所述实体集合构建关系有向图;
[0233]
提取所述关系有向图中的多个关键实体,在所述初始数据集中筛选与所述关键实体对应的初始数据;
[0234]
对所述初始数据进行向量化处理,得到初始向量,计算所述初始向量和多个预设标准标签之间的相似系数,根据所述相似系数选择预设个数的预设标准标签作为所述原始数据集的内容画像;
[0235]
获取目标用户的数据信息集,提取所述数据信息集中的多个数据特征,并根据所
述多个数据特征构建用户画像;
[0236]
计算所述用户画像和所述内容画像之间的匹配值;
[0237]
当所述匹配值大于或者等于预设的匹配阈值时,利用协同过滤推荐算法对所述内容画像对应的初始数据进行过滤推荐处理,得到目标产品,并将所述目标产品推送给目标用户。
[0238]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0239]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0240]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0241]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0242]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0243]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0244]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0245]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1