一种基于用户群体行为数据挖掘智能推荐的方法

文档序号:6633068阅读:221来源:国知局
一种基于用户群体行为数据挖掘智能推荐的方法
【专利摘要】本发明公开了一种根据用户群体行为计算资讯相似度并对用户进行数据挖掘智能推荐的解决方法,通过收集用户行为数据并进行权重处理,把用户进行区间划分,通过大量的矩阵计算获取任意资讯之间的相似度,结合历史最近的点击资讯列表,从相关资讯库中选取和其历史偏好相似度高、时效性好的资讯实时推荐,同时对离线、缓存资讯进行分析,如此即可快速推荐相似的和相关度极高的资讯给用户。
【专利说明】一种基于用户群体行为数据挖掘智能推荐的方法

【技术领域】
[0001] 本发明涉及智能手机资讯软件的资讯相关度推荐,特别地涉及一种互联网应用软 件的用户兴趣推荐的技术方法。
[0002]

【背景技术】
[0003] 随着互联网技术的发展,每天在我们都生活在大量的信息中,新闻、广告、科技、销 售等等。大多都不是用户想看的,也无法接受那么多的信息量,更加无法有效的找到自身感 兴趣的内容。
[0004] 互联网时代资讯更新极快,海量的资讯展示到不同的用户面前,采用传统的曝光 形式很难引起用户的兴趣,一般的将资讯进行分门别类的方法难以确定用户感兴趣的类 别。
[0005] 我们需要把资讯过滤,排序,最终展示给用户的是优质的内容,否则用户就会很难 在海量的资讯里,找到自己感兴趣的、热点的内容。目前应用市场有很多适用于智能手机的 资讯软件,但能根据用户的行为结合群体行为,针对不同的用户提供不同侧重点的资讯的 应用还未有先例。
[0006] 基于用户群体数据挖掘的资讯智能推荐技术方法,解决了目前市场上无法进行海 量资讯过滤和推荐的问题,效果明显,大大吸引了用户的阅读兴趣,给用户更好的体验。


【发明内容】

[0007] 本发明的主要目的是提供一种用户群体行为计算资讯相似度并对用户进行数据 挖掘智能推荐的方法,以解决现有智能设备无法进行海量资讯过滤和推荐的问题,从而实 现个性化精准推荐问题。
[0008] 为解决上述问题,提供如下解决方案: 1、收集用户的点击行为、赞、收藏、分享、打开原文、浏览时长等海量用户行为数据,通 过对这些不同行为数据进行权重处理,整合成用户对资讯的评分值。特别的针对用户的活 跃度不同,喜好点击的偏重不同,使得用户对资讯的单次行为产生的评分值权重是不一致 的,整体原则采用随之用户活跃度增加单次行为分值递减。同时由于资讯的热度会大量影 响资讯的被评分次数,采用和用户行为相一致的反递减原则进行综合评分计算。
[0009] 2、在评分计算时将所有点击用户分成20个区间,赋值 (1,2, 3, ...,19, 20)使得绝大部分的用户在7-15分区间,对资讯根据其被点 击数据获得资讯热度值,采用TF-IDF的思想,对这两个分数进行综合计算:

【权利要求】
1. 一种基于用户群体行为数据挖掘的资讯智能推荐技术方法,其特征在于: 根据用户行为数据计算用户对资讯的感兴趣程度评分值,收集群体用户行为评分数据 建立资讯-用户评分值矩阵,资讯相似度计算步骤,计算所有有关联的资讯向量间的相关 性值P (X,y),计算获取所有资讯的相关资讯库,计算获得任一条资讯最相似的N条资讯,收 集所有资讯的最相似资讯存放到在线Server,根据用户当前不同的浏览行为,推荐最相似 或最可能感兴趣的资讯信息给用户。
2. 根据权利要求1所述,其特征还在于,还包括: 用户无直接评分数据,通过采集用户对资讯的点击、赞、收藏、分享、打开原文、浏览时 长等行为数据来推测用户的感兴趣分值。
3. 根据权利要求1所述,其特征还在于,还包括: 通过获得用户的整体点击数,结合资讯的总体热度来平滑不同用户习惯下的评分数 据,特别的采用了自创公5
t的计算方式,同时使用了结合资讯内容量的 浏览时长数据平滑方法自创公另
根据权利要求1所述其特征还在于,还包括:
度值时采用群体用户对资讯的评分向量间的相关性值来表示, ,计算两个向量的协方差除以两个变量的标准差。
4. 根据权利要求1所述其特征还在于,还包括: 根据当前用户的浏览行为智能的推荐资讯给用户,在用户刷新拉取时根据用户历史 最近的点击记录来获取推荐资讯,在用户点击操作值获取和当前选择资讯最相似的资讯推 荐。
【文档编号】G06F17/30GK104281718SQ201410611460
【公开日】2015年1月14日 申请日期:2014年11月4日 优先权日:2014年11月4日
【发明者】不公告发明人 申请人:深圳市英威诺科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1