消息推荐方法及装置的制造方法

文档序号:9375590阅读:175来源:国知局
消息推荐方法及装置的制造方法
【技术领域】
[0001] 本发明实施例涉及互联网技术,尤其涉及一种消息推荐方法及装置。
【背景技术】
[0002] 互联网中的社交媒体,例如微博、Twitter等受到广大用户的欢迎。用户可方便的 获取该用户所关注的人发送的各类消息,极大的方便了用户获取信息的需求。
[0003] 现有技术中,社交媒体推送消息的方式主要是基于用户的圈子(例如用户所关注 的人)来发送消息。一般来说,没有被该用户关注的圈子中的消息无法被用户获取。
[0004] 用户从其关注的圈子中获取的消息中,有大量的消息是用户不感兴趣的,这样就 浪费了用户的时间和精力。而没有被该用户关注的圈子中的消息中,有大量的消息是用户 感兴趣的,但用户无法获得这些消息,因此,现有技术中社交媒体向用户推送消息的方式缺 乏灵活性。

【发明内容】

[0005] 本发明实施例提供一种消息推荐方法及装置,以使用户可以方便灵活地获取到感 兴趣的消息。
[0006] 第一方面,本发明实施例提供一种消息推荐方法,包括:
[0007] 分别解析第一用户在网络上发布的第一消息以及第二用户在网络上发布的第二 消息,获取所述第一消息的兴趣描述信息以及所述第二消息的话题描述信息;其中,所述第 二用户为除所述第一用户之外的其它用户;
[0008] 将所述话题描述信息与所述兴趣描述信息进行比较,并计算所述话题描述信息与 所述兴趣描述信息的相似度;
[0009] 若所述相似度大于或等于预定值时,向所述第一用户推送所述第二用户发布的所 述第二消息。
[0010] 结合第一方面,在第一方面的第一种可能的实现方式中,所述兴趣描述信息包括 所述第一用户发布的所述第一消息在K个话题上的概率分布信息;所述话题描述信息包括 所述第二用户发布的所述第二消息在K个话题上的概率分布信息,所述K为大于0的整数;
[0011] 相应地,所述对所述话题描述信息与所述兴趣描述信息进行比较,并计算所述话 题描述信息与所述兴趣描述信息的相似度,包括:
[0012] 比较所述第二消息在K个话题上的概率分布信息与所述第一消息在K个话题上的 概率分布信息,并计算所述第二消息在K个话题上的概率分布信息与所述第一消息在K个 话题上的概率分布信息的相似度。
[0013] 结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式 中,所述分别解析第一用户在网络上发布的第一消息以及第二用户在网络上发布的第二消 息,获取所述第一消息的兴趣描述信息以及所述第二消息的话题描述信息,具体包括:
[0014] 分别解析第一用户在网络上发布的第一消息以及第二用户在网络上发布的第二 消息,获取所述第一消息以及所述第二消息中每一个词在K个话题上的分配信息;分别根 据所述分配信息确定所述第一消息的兴趣描述信息以及所述第二消息的话题描述信息。
[0015] 结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式 中,所述分别解析第一用户在网络上发布的第一消息以及第二用户在网络上发布的第二消 息,获取所述第一消息以及所述第二消息中每一个词在K个话题上的分配信息;分别根据 所述分配信息确定所述第一消息的兴趣描述信息以及所述第二消息的话题描述信息,包 括:
[0016] 将消息中的每一个词随机分配给所述K个话题中的任意一个,获取经过随机分配 后所述消息中每一个词在所述K个话题上的分配信息;其中,所述消息包括所述第一消息 或所述第二消息;
[0017] 使用吉布斯采样的方法,从所述消息中的第一个词开始,根据所述词属于其他话 题概率的大小,确定是否需要将所述词重新分配到其他话题,当确定结果为是,则将所述词 进一步分配到所述需要分配的话题上,直至遍历所述消息中所有词,更新经过所述遍历之 后所述消息中需要重新分配的词在所述K个话题上的分配信息;
[0018] 重复所述遍历,直至重复的次数达到第一预定值,或者需要被重新分配话题的词 占据发送所述消息的用户发布的所有消息中的所有词的比例少于第二预定值时停止所述 遍历,并获取经过最后一次遍历之后所述消息中每一个词在K个话题上的当前分配信息;
[0019] 若所述消息为所述第一消息时,根据所述第一消息中每一个词在所述K个话题上 的当前分配信息确定所述第一消息的兴趣描述信息;
[0020] 若所述消息为所述第二消息时,根据所述第二消息中每一个词在所述K个话题上 的当前分配信息确定所述第二消息的话题描述信息。
[0021 ] 结合第一方面的第一种至第三种任一种可能的实现方式,在第一方面的第四种可 能的实现方式中,所述比较所述第二消息在K个话题上的概率分布信息与所述第一消息在 K个话题上的概率分布信息,并计算所述第二消息在K个话题上的概率分布信息与所述第 一消息在K个话题上的概率分布信息的相似度,具体包括:
[0022] 使用余弦相似度算法:
[0023]
其中,s(u,d)表示所述第一消息的兴趣描述信息与所述 第二消息的话题描述信息的相似度;u表示所述第一消息的兴趣描述信息;d表示所述第二 消息的话题描述信息;Pl表示向量U的第i个分量;qi表示向量d的第i个分量。
[0024] 结合第一方面的第一种至第三种任一种可能的实现方式,在第一方面的第五种可 能的实现方式中,所述比较所述第二消息在K个话题上的概率分布信息与所述第一消息在 K个话题上的概率分布信息,并计算所述第二消息在K个话题上的概率分布信息与所述第 一消息在K个话题上的概率分布信息的相似度,具体包括:
[0025] 使用KL散度算法:
[0026]
,其中,KL (u,d)表示所述第一消息的兴趣描述信息与所述第 二消息的话题描述信息的相似度;U表示所述第一消息的兴趣描述信息;d表示所述第二消 息的话题描述信息;Pi表示向量u的第i个分量表示向量d的第i个分量。
[0027] 第二方面,本发明实施例提供一种消息推荐装置,包括:
[0028] 获取模块,用于分别解析第一用户在网络上发布的第一消息以及第二用户在网络 上发布的第二消息,获取所述第一消息的兴趣描述信息以及所述第二消息的话题描述信 息;其中,所述第二用户为除所述第一用户之外的其它用户;
[0029] 比较模块,用于将所述话题描述信息与所述兴趣描述信息进行比较,并计算所述 话题描述信息与所述兴趣描述信息的相似度;
[0030] 推送模块,用于若所述相似度大于或等于预定值时,向所述第一用户推送所述第 二用户发布的消息。
[0031] 结合第二方面,在第二方面的第一种可能的实现方式中,所述兴趣描述信息包括 所述第一用户发布的所述第一消息在K个话题上的概率分布信息;所述话题描述信息包括 所述第二用户发布的所述第二消息在K个话题上的概率分布信息,所述K为大于0的整数;
[0032] 相应地,所述比较模块具体用于:比较所述第二消息在K个话题上的概率分布信 息与所述第一消息在K个话题上的概率分布信息,并计算所述第二消息在K个话题上的概 率分布信息与所述第一消息在K个话题上的概率分布信息的相似度。
[0033] 结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式 中,所述获取模块具体用于:
[0034] 分别解析第一用户在网络上发布的第一消息以及第二用户在网络上发布的第二 消息,获取所述第一消息以及所述第二消息中每一个词在K个话题上的分配信息;分别根 据所述分配信息确定所述第一消息的兴趣描述信息以及所述第二消息的话题描述信息。
[0035] 结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式 中,所述获取模块,包括:
[0036] 分配单元,用于将消息中的每一个词随机分配给所述K个话题中的任意一个,获 取经过随机分配后所述消息中每一个词在所述K个话题上的分配信息;其中,所述消息包 括所述第一消息或所述第二消息;
[0037] 第一确定单元,用于使用吉布斯采样的方法,从所述消息中的第一个词开始,根据 所述词属于其他话题概率的大小,确定是否需要将所述词重新分配到其他话题,当确定结 果为是,则将所述词进一步分配到所述需要分配的话题上,直至遍历所述消息中所有词,更 新经过所述遍历之后所述消息中需要重新分配的词在所述K个话题上的分配信息;
[0038] 所述第一确定单元,还用于:重复所述遍历,直至重复的次数达到第一预定值,或 者
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1