一种社交消息的监测方法及装置的制造方法

文档序号:9375616阅读:210来源:国知局
一种社交消息的监测方法及装置的制造方法
【技术领域】
[0001] 本发明涉及通信领域,尤其涉及一种社交消息的监测方法及装置。
【背景技术】
[0002] 近年来,社交媒体,如微博、微信、论坛、播客等,已经成为人们发布消息的重要途 径。社交媒体的信息中往往包含着在事件发生过程中的各种重要资料和线索,通过消息及 时发现和监控重大事件的发生及变化过程,能够提高对危机事件管理和决策的灵活性和实 时性。
[0003] 以新西兰昆士兰水灾为例,整个水灾过程从不同角度在Twitter( -种社交媒体 的名称)上进行了实时呈现,例如发生了什么、在哪里发生、有谁参与、以及对周边环境的 影响等。如下的事件都出现在Twitter上,"一艘游艇在布里斯班河正在沉没"、"港口重新 开放"、"鲨鱼被冲到街道上"、"一些重要政府机构办公地区临时管制"等。及时发现上述事 件对救灾及危机管理都有重大的意义。
[0004] 现有的对社交消息进行发现的过程是:用户通过社交网客户端主动对社交消息进 行查询、收集相关的社交事件。即对社交消息的获取需要通过人工输入的方式在社交网客 户端中输入社交消息的基本信息,然后由浏览器或社交网客户端依据社交消息的基本信息 搜索获取一个类别的社交消息。
[0005] 在实现上述社交消息发现的过程中,由于对社交消息的获取是通过人工触发,这 样社交网客户端并不能实现对社交消息的实时监测,因此社交网客户端不能主动发现互联 网社交事件的更新。

【发明内容】

[0006] 本发明的实施例提供一种社交消息的监测方法及装置,以实现对社交消息的实时 监控,从而使社交网客户端能主动发现聚类的社交事件。
[0007] 本发明的实施例采用如下技术方案:
[0008] 第一方面,提供一种社交消息的监测方法,包括:
[0009] 接收社交消息,并对所述社交消息进行主题建模分析,得到所述社交消息的主题 概率向量;
[0010] 将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到 主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,其 中,所述代表消息为一个消息类中具有代表性的社交消息;
[0011] 将所述社交消息存入与所述社交消息相似性最高的代表消息所在的消息类中;
[0012] 当所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交消息主 题一致时,向社交网客户端输出所述消息类。
[0013] 结合第一方面,在第一种可能的实现方式中,所述方法还包括:
[0014] 若所述社交消息与所述每个代表消息的相似性均不超过预设的第一相似性阈值, 则新建一个消息类,将所述社交消息存入所述新建的消息类。
[0015] 结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式 中,所述方法还包括:
[0016] 从每一个消息类中选取代表消息;
[0017] 其中,所述从每一个消息类中选取代表消息包括:
[0018] 在每一个消息类中选择预设的时间内的社交消息作为代表消息,其中,不同的消 息类中预设的时间可以不相同;或
[0019] 在所述每一个消息类中选择预设的地点内的社交消息作为代表消息,其中,不同 的消息类中预设的地点可以不相同;或
[0020] 在所述每一个消息类中选择预设的时间内和预设的地点内的社交消息作为代表 消息,其中,不同的消息类中预设的时间和预设的地点可以不相同;或
[0021] 将所述每一个消息类中的所有的社交消息的主题概率向量进行加权平均,得到所 述每一个消息类的代表消息的主题概率向量,在每一个消息类中选取与所述消息类的代表 消息的主题概率向量匹配的社交消息作为代表消息;其中,若有新的社交消息加入所述消 息类,重新进行加权平均计算所述消息类的代表消息的主题概率向量。
[0022] 结合第一方面或第一方面的第一种或第二种可能的实现方式,在第三种可能的实 现方式中,所述接收社交消息,并对所述社交消息进行主题建模分析,得到所述社交消息的 主题概率向量,包括:
[0023] 接收所述社交消息,获取所述社交消息的内容参数、所述社交消息的时间参数、所 述社交消息的空间参数;
[0024] 利用隐含狄利克雷分布LDA算法对所述社交消息的内容参数、所述社交消息的时 间参数、所述社交消息的空间参数进行主题建模分析,得到所述社交消息的主题概率向量。
[0025] 结合第一方面或第一方面的第一种到第三种任一种可能的实现方式,在第四种可 能的实现方式中,所述方法还包括:
[0026] 对比所述社交消息的用户与所述每个代表消息的用户得到所述社交消息与所述 每个代表消息的用户相似性;
[0027] 将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较得到 主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,具 体包括:
[0028] 计算所述社交消息的主题概率向量与所述每个代表消息的主题概率向量的相对 熵,得到所述社交消息与所述每个代表消息的主题消息相似性;
[0029] 对所述主题消息相似性和用户相似性进行加权求和,得到所述社交消息与所述每 个代表消息的相似性。
[0030] 结合第一方面或第一方面的第一种到第四种任一种可能的实现方式,在第五种可 能的实现方式中,所述方法还包括:
[0031] 对任意一个消息类中的社交消息进行查找、插入、删除操作。
[0032] 结合第一方面或第一方面的第一种到第五种任一种可能的实现方式,在第六种可 能的实现方式中,所述对所述社交消息进行主题建模分析,得到所述社交消息的主题概率 向量之前,还包括:
[0033] 获取所述社交消息所属的领域,若所述社交消息所属的领域不属于预设的领域, 则剔除所述社交消息,得到过滤后的社交消息;
[0034] 所述对所述社交消息进行主题建模分析,得到所述社交消息的主题概率向量,包 括:
[0035] 对过滤后的所述社交消息进行主题建模分析,得到所述社交消息的主题概率向 量。
[0036] 第二方面,提供一种社交网服务器,用于监测社交消息,其特征在于,包括:
[0037] 主题建模模块,用于接收社交消息,并对所述社交消息进行主题建模分析,得到 所述社交消息的主题概率向量;
[0038] 相似性获取模块,用于将所述主题建模模块接收的社交消息的主题概率向量与每 个代表消息的主题概率向量进行比较得到所述社交消息与所述每个代表消息的主题相似 性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似性,其中,所述代 表消息为一个消息类中具有代表性的社交消息;
[0039] 聚类模块,用于将所述社交消息存入相似性获取模块测量得到的与所述社交消息 相似性最高的代表消息所在的消息类中;
[0040] 聚类分析模块,用于当所述消息类中的社交消息的数量达到第一阈值或所述消息 类中的社交消息主题一致时,向社交网客户端输出所述消息类。
[0041] 结合第二方面,在第一种可能的实现方式中,所述聚类模块还用于:
[0042] 若所述社交消息与所述每个代表消息的相似性均不超过预设的第一相似性阈值, 则新建一个消息类,将所述社交消息存入所述新建的消息类。
[0043] 结合第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式 中,所述社交网服务器还包括:
[0044] 聚类操作模块,用于从每一个消息类中选取代表消息;
[0045] 其中,聚类操作模块具体用于:
[0046] 在每一个消息类中选择预设的时间内的社交消息作为代表消息,其中,不同的消 息类中预设的时间可以不相同;或
[0047] 在所述每一个消息类中选择预设的地点内的社交消息作为代表消息,其中,不同 的消息类中预设的地点可以不相同;或
[0048] 在所述每一个消息类中选择预设的时间内和预设的地点内的社交消息作为代表 消息,其中,不同的消息类中预设的时间和预设的地点可以不相同;或
[0049] 将所述每一个消息类中的所有的社交消息的主题概率向量进行加权平均,得到所 述每一个消息类的代表消息的主题概率向量,在每一个消息类中选取与所述消息类的代表 消息的主题概率向量匹配的代表消息,若有新的社交消息加入所述消息类,重新进行加权 平均计算所述消息类的代表消息的主题概率向量。
[0050] 结合第二方面或第二方面的第一种或第二种可能的实现方式,在第三种可能的实 现方式中,所述主题建模模块包括:
[0051] 参数收集单元,用于接收所述社交消息,获取所述社交消息的内容参数、所述社交 消息的时间参数、所述社交消息的空间参数;
[0052] 向量获取单元,用于利用隐含狄利克雷分布LDA算法对所述参数收集模块获取的 社交消息的内容参数、所述社交消息的时间参数、所述社交消息的空间参数进行主题建模 分析,得到所述社交消息的主题概率向量。
[0053] 结合第二方面或第二方面的第一种到第三种任一种可能的实现方式,在第四种可 能的实现方式中,所述社
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1