本发明涉及文章推荐,特别涉及一种基于新能源云和用户行为的文章推荐方法和装置。
背景技术:
1、随着网络技术的发展,目前出现了多种可以浏览信息的网络平台。用户通过终端设备访问网络平台后,就可以浏览网络平台上发布的文章。
2、这些网络平台一般都具有文章推荐的功能,在用户登录网络平台后,平台可以为该用户推荐若干文章。目前多数网络平台在推荐文章时一般都会默认推荐最新发布的文章。
3、然而不同用户显然会偏好浏览不同类型的文章,因此这种推荐方式并不能准确推荐用户感兴趣的文章,导致用户在平台上浏览文章时的用户体验较差。
技术实现思路
1、针对上述现有技术的缺点,本发明提供一种基于新能源云和用户行为的文章推荐方法和装置,以便为新能源云的用户推荐感兴趣的文章,改善用户体验。
2、本技术第一方面提供一种基于新能源云和用户行为的文章推荐方法,包括:
3、根据预先构建的新能源行业关键词库分析待推荐文章,得到所述待推荐文章的文章标签;其中,所述新能源行业关键词库包括多个关键词;所述待推荐文章标签由所述待推荐文章包含的所述关键词组成;
4、基于内容推荐算法计算所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述用户和所述待推荐文章的内容相似度;
5、基于协同过滤算法对所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述待推荐文章的协同相似度;其中,所述用户的历史浏览文章根据所述用户的行为信息确定;
6、基于词频-逆文档频率算法分析所述用户的历史浏览文章和所述待推荐文章,得到所述待推荐文章的词频相似度;
7、基于利用所述历史浏览文章训练的逻辑回归模型分析所述待推荐文章的文章标签,得到所述待推荐文章的回归相似度;
8、根据所述待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度计算得到所述待推荐文章的推荐评分;
9、将推荐评分大于预设推荐阈值的待推荐文章推荐给用户。
10、可选的,所述基于内容推荐算法计算所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述用户和所述待推荐文章的内容相似度,包括:
11、基于所述历史浏览文章构建用户标签向量;
12、基于所述文章标签构建所述待推荐文章的文章标签向量;
13、计算所述用户标签向量和所述文章标签向量的余弦相似度,将计算结果确定为所述待推荐文章的内容相似度。
14、可选的,所述基于协同过滤算法对所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述待推荐文章的协同相似度,包括:
15、根据所述历史浏览文章的文章标签计算所述历史浏览文章的标准差;
16、根据所述待推荐文章的文章标签计算所述待推荐文章的标准差;
17、利用皮尔逊相关系数计算公式计算所述待推荐文章的标准差和所述历史浏览文章的标准差,得到所述待推荐文章的协同相似度。
18、可选的,所述基于词频-逆文档频率算法分析所述用户的历史浏览文章和所述待推荐文章,得到所述待推荐文章的词频相似度,包括:
19、基于词频-逆文档频率算法计算得到所述历史浏览文章中各个关键词的权重,以及所述待推荐文章中各个关键词的权重;
20、将所述历史浏览文章中按权重从高至低选取的n个关键词和所述待推荐文章中按权重从高至低选取的n个关键词组成关键词集合;
21、统计所述关键词集合中每一关键词在所述历史浏览文章中的词频,得到表征所述历史浏览文章的第一关键词向量;
22、统计所述关键词集合中每一关键词在所述待推荐文章中的词频,得到表征所述待推荐文章的第二关键词向量;
23、计算所述第一关键词向量和所述第二关键词向量的余弦相似度,将计算结果确定为所述待推荐文章的词频相似度。
24、可选的,所述根据所述待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度计算得到所述待推荐文章的推荐评分,包括:
25、计算所述待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度的平均值,并将计算结果确定为所述待推荐文章的推荐评分。
26、本技术第二方面提供一种基于新能源云和用户行为的文章推荐装置,包括:
27、标签单元,用于根据预先构建的新能源行业关键词库分析待推荐文章,得到所述待推荐文章的文章标签;其中,所述新能源行业关键词库包括多个关键词;所述待推荐文章标签由所述待推荐文章包含的所述关键词组成;
28、内容单元,用于基于内容推荐算法计算所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述用户和所述待推荐文章的内容相似度;
29、协同单元,用于基于协同过滤算法对所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述待推荐文章的协同相似度;其中,所述用户的历史浏览文章根据所述用户的行为信息确定;
30、词频单元,用于基于词频-逆文档频率算法分析所述用户的历史浏览文章和所述待推荐文章,得到所述待推荐文章的词频相似度;
31、回归单元,用于基于利用所述历史浏览文章训练的逻辑回归模型分析所述待推荐文章的文章标签,得到所述待推荐文章的回归相似度;
32、计算单元,用于根据所述待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度计算得到所述待推荐文章的推荐评分;
33、推荐单元,用于将推荐评分大于预设推荐阈值的待推荐文章推荐给用户。
34、可选的,所述内容单元基于内容推荐算法计算所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述用户和所述待推荐文章的内容相似度时,具体用于:
35、基于所述历史浏览文章构建用户标签向量;
36、基于所述文章标签构建所述待推荐文章的文章标签向量;
37、计算所述用户标签向量和所述文章标签向量的余弦相似度,将计算结果确定为所述待推荐文章的内容相似度。
38、可选的,所述协同单元基于协同过滤算法对所述用户的历史浏览文章的文章标签和所述待推荐文章的文章标签,得到所述待推荐文章的协同相似度时,具体用于:
39、根据所述历史浏览文章的文章标签计算所述历史浏览文章的标准差;
40、根据所述待推荐文章的文章标签计算所述待推荐文章的标准差;
41、利用皮尔逊相关系数计算公式计算所述待推荐文章的标准差和所述历史浏览文章的标准差,得到所述待推荐文章的协同相似度。
42、可选的,所述词频单元基于词频-逆文档频率算法分析所述用户的历史浏览文章和所述待推荐文章,得到所述待推荐文章的词频相似度时,具体用于:
43、基于词频-逆文档频率算法计算得到所述历史浏览文章中各个关键词的权重,以及所述待推荐文章中各个关键词的权重;
44、将所述历史浏览文章中按权重从高至低选取的n个关键词和所述待推荐文章中按权重从高至低选取的n个关键词组成关键词集合;
45、统计所述关键词集合中每一关键词在所述历史浏览文章中的词频,得到表征所述历史浏览文章的第一关键词向量;
46、统计所述关键词集合中每一关键词在所述待推荐文章中的词频,得到表征所述待推荐文章的第二关键词向量;
47、计算所述第一关键词向量和所述第二关键词向量的余弦相似度,将计算结果确定为所述待推荐文章的词频相似度。
48、可选的,所述计算单元根据所述待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度计算得到所述待推荐文章的推荐评分时,具体用于:
49、计算所述待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度的平均值,并将计算结果确定为所述待推荐文章的推荐评分。
50、本技术提供一种基于新能源云和用户行为的文章推荐方法和装置,方法包括,根据预先构建的新能源行业关键词库分析待推荐文章,得到待推荐文章的文章标签;通过分析该用户的历史浏览文章和待推荐文章的文章标签,以及分析该用户历史浏览文章和待推荐文章,分别计算得到待推荐文章的内容相似度、协同相似度、词频相似度和回归相似度,并结合这些相似度计算得到待推荐文章的推荐评分;将推荐评分大于预设推荐阈值的待推荐文章推荐给用户。本方案根据用户的历史浏览文章为用户推荐新的文章,从而确保给用户推荐感兴趣的文章,改善了用户的使用体验。