一种社交消息的监测方法及装置的制造方法_5

文档序号:9375616阅读:来源:国知局
析,得到所述社交消息的主题概率向量。
[0182] 例如:预设的领域包括:政治、社会热点、灾难、金融。若接收到的社交消息的所属 领域为娱乐,则过滤掉该社交消息。
[0183] 在上述社交网服务器中,接收社交消息,根据社交消息与每个代表消息的相似性, 将社交消息存入与该社交消息相似性最高的代表消息所在的消息类中,当任一消息类中的 社交消息所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交消息主题 一致时,向社交网客户端输出该消息类,由于社交网服务器能够主动向社交网客户端输出 消息类,实现了对社交消息的实时监测,使得社交网客户端能主动发现聚类的社交事件。
[0184] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1. 一种社交消息的监测方法,其特征在于,包括: 接收社交消息,并对所述社交消息进行主题建模分析,得到所述社交消息的主题概率 向量; 将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到主题 相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,其中,所 述代表消息为一个消息类中具有代表性的社交消息; 将所述社交消息存入与所述社交消息相似性最高的代表消息所在的消息类中; 当所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交消息主题一 致时,向社交网客户端输出所述消息类。2. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 若所述社交消息与所述每个代表消息的相似性均不超过预设的第一相似性阈值,则新 建一个消息类,将所述社交消息存入所述新建的消息类。3. 根据权利要求1或2所述的方法,其特征在于,所述方法还包括: 从每一个消息类中选取代表消息; 其中,所述从每一个消息类中选取代表消息包括: 在每一个消息类中选择预设的时间内的社交消息作为代表消息,其中,不同的消息类 中预设的时间可以不相同;或 在所述每一个消息类中选择预设的地点内的社交消息作为代表消息,其中,不同的消 息类中预设的地点可以不相同;或 在所述每一个消息类中选择预设的时间内和预设的地点内的社交消息作为代表消息, 其中,不同的消息类中预设的时间和预设的地点可以不相同;或 将所述每一个消息类中的所有的社交消息的主题概率向量进行加权平均,得到所述每 一个消息类的代表消息的主题概率向量,在每一个消息类中选取与所述消息类的代表消息 的主题概率向量匹配的社交消息作为代表消息;其中,若有新的社交消息加入所述消息类, 重新进行加权平均计算所述消息类的代表消息的主题概率向量。4. 根据权利要求1-3任一项所述的方法,其特征在于,所述接收社交消息,并对所述社 交消息进行主题建模分析,得到所述社交消息的主题概率向量,包括: 接收所述社交消息,获取所述社交消息的内容参数、所述社交消息的时间参数、所述社 交消息的空间参数; 利用隐含狄利克雷分布LDA算法对所述社交消息的内容参数、所述社交消息的时间参 数、所述社交消息的空间参数进行主题建模分析,得到所述社交消息的主题概率向量。5. 根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括: 对比所述社交消息的用户与所述每个代表消息的用户得到所述社交消息与所述每个 代表消息的用户相似性; 所述将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到 主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,具 体包括: 计算所述社交消息的主题概率向量与所述每个代表消息的主题概率向量的相对熵,得 到所述社交消息与所述每个代表消息的主题消息相似性; 对所述主题消息相似性和用户相似性进行加权求和,得到所述社交消息与所述每个代 表消息的相似性。6. 根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括: 对任意一个消息类中的社交消息进行查找、插入、删除操作。7. 根据权利要求1-6任一项所述的方法,其特征在于,所述对所述社交消息进行主题 建模分析,得到所述社交消息的主题概率向量之前,还包括: 获取所述社交消息所属的领域,若所述社交消息所属的领域不属于预设的领域,则剔 除所述社交消息,得到过滤后的社交消息; 所述对所述社交消息进行主题建模分析,得到所述社交消息的主题概率向量,包括: 对过滤后的所述社交消息进行主题建模分析,得到所述社交消息的主题概率向量。8. -种社交网服务器,用于监测社交消息,其特征在于,包括: 主题建模模块,用于接收社交消息,并对所述社交消息进行主题建模分析,得到所述 社交消息的主题概率向量; 相似性获取模块,用于将所述主题建模模块接收的社交消息的主题概率向量与每个代 表消息的主题概率向量进行比较得到主题相似性,并依据所述主题相似性获取所述社交消 息与所述每个代表消息的相似性,其中,所述代表消息为一个消息类中具有代表性的社交 消息; 聚类模块,用于将所述社交消息存入相似性获取模块测量得到的与所述社交消息相似 性最高的代表消息所在的消息类中; 聚类分析模块,用于当所述消息类中的社交消息的数量达到第一阈值或所述消息类中 的社交消息主题一致时,向社交网客户端输出所述消息类。9. 根据权利要求8所述的社交网服务器,其特征在于,所述聚类模块还用于: 若所述社交消息与所述每个代表消息的相似性均不超过预设的第一相似性阈值,则新 建一个消息类,将所述社交消息存入所述新建的消息类。10. 根据权利要求8或9所述的社交网服务器,其特征在于,所述社交网服务器还包 括: 聚类操作模块,用于从每一个消息类中选取代表消息; 其中,聚类操作模块具体用于: 在每一个消息类中选择预设的时间内的社交消息作为代表消息,其中,不同的消息类 中预设的时间可以不相同;或 在所述每一个消息类中选择预设的地点内的社交消息作为代表消息,其中,不同的消 息类中预设的地点可以不相同;或 在所述每一个消息类中选择预设的时间内和预设的地点内的社交消息作为代表消息, 其中,不同的消息类中预设的时间和预设的地点可以不相同;或 将所述每一个消息类中的所有的社交消息的主题概率向量进行加权平均,得到所述每 一个消息类的代表消息的主题概率向量,在每一个消息类中选取与所述消息类的代表消息 的主题概率向量匹配的社交消息作为代表消息;其中,若有新的社交消息加入所述消息类, 重新进行加权平均计算所述消息类的代表消息的主题概率向量。11. 根据权利要求8-10任一项所述的社交网服务器,其特征在于,所述主题建模模块 包括: 参数收集单元,用于接收所述社交消息,获取所述社交消息的内容参数、所述社交消息 的时间参数、所述社交消息的空间参数; 向量获取单元,用于利用隐含狄利克雷分布LDA算法对所述参数收集模块获取的社交 消息的内容参数、所述社交消息的时间参数、所述社交消息的空间参数进行主题建模分析, 得到所述社交消息的主题概率向量。12. 根据权利要求8-11任一项所述的社交网服务器,其特征在于,所述社交网服务器 还包括: 用户相似性测量模块,用于对比所述社交消息的用户与所述每个代表消息的用户得到 所述社交消息与所述每个代表消息的用户相似性; 所述相似性获取模块包括: 主题相似性测量单元,用于计算所述社交消息的主题概率向量与所述每个代表消息的 主题概率向量的相对熵,得到所述社交消息与所述每个代表消息的主题消息相似性; 相似性获取单元,用于对所述主题相似性获取模块得到的主题消息相似性和所述用户 相似性模块得到的用户相似性进行加权求和,得到所述社交消息与所述每个代表消息的相 似性。13. 根据权利要求8-12任一项所述的社交网服务器,其特征在于,所述聚类操作模块 还用于: 对任意一个消息类中的社交消息进行查找、插入、删除操作。14. 根据权利要求8-13所述的社交网服务器,其特征在于,所述社交网服务器还包括: 过滤模块,用于获取所述社交消息所属的领域,若所述社交消息所属的领域不属于预 设的领域,则剔除所述社交消息,得到过滤后的社交消息; 所述主题建模模块,具体用于: 对过滤后的所述社交消息进行主题建模分析,得到所述社交消息的主题概率向量。
【专利摘要】本发明的实施例提供一种社交消息的监测方法及装置,涉及通信领域,能够解决社交网客户端不能主动发现社交事件的问题。具体的实现方法为:社交网服务器接收社交消息,得到所述社交消息的主题概率向量;将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性;将所述社交消息存入与所述社交消息相似性最高的代表消息所在的消息类中;当所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交消息主题一致时,向社交网客户端输出所述消息类。本发明用于实现对社交消息的监测。
【IPC分类】G06Q10/10, G06Q50/00, G06F17/30
【公开号】CN105095228
【申请号】CN201410175434
【发明人】陈雷, 周项敏, 何秀强
【申请人】华为技术有限公司
【公开日】2015年11月25日
【申请日】2014年4月28日
【公告号】WO2015165230A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1