一种社交消息的监测方法及装置的制造方法_2

文档序号:9375616阅读:来源:国知局
交网服务器还包括:
[0054] 用户相似性测量模块,用于对比所述社交消息的用户与所述每个代表消息的用户 得到所述社交消息与所述每个代表消息的用户相似性;
[0055] 所述相似性获取模块包括:
[0056] 主题相似性测量单元,用于计算所述社交消息的主题概率向量与所述每个代表消 息的主题概率向量的相对熵,得到所述社交消息与所述每个代表消息的主题消息相似性;
[0057] 相似性获取单元,用于对所述主题相似性获取模块得到的主题消息相似性和所述 用户相似性模块得到的用户相似性进行加权求和,得到所述社交消息与所述每个代表消息 的相似性。
[0058] 结合第二方面或第二方面的第一种到第四种任一种可能的实现方式,在第五种可 能的实现方式中,所述聚类操作模块还用于:
[0059] 对任意一个消息类中的社交消息进行查找、插入、删除操作。
[0060] 结合第二方面或第二方面的第一种到第五种任一种可能的实现方式,在第六种可 能的实现方式中,所述社交网服务器还包括:
[0061] 过滤模块,用于获取所述社交消息所属的领域,若所述社交消息所属的领域不属 于预设的领域,则剔除所述社交消息,得到过滤后的社交消息;
[0062] 所述主题建模模块,具体用于:
[0063] 对过滤后的所述社交消息进行主题建模分析,得到所述社交消息的主题概率向 量。
[0064] 在上述方案中,社交网服务器接收社交消息,根据社交消息与每个代表消息的相 似性,将社交消息存入与该社交消息相似性最高的代表消息所在的消息类中,当所述消息 类中的社交消息的数量达到第一阈值或所述消息类中的社交消息主题一致时,向社交网客 户端输出该消息类,由于社交网服务器能够主动向社交网客户端输出消息类,实现了对社 交消息的实时监测,使得社交网客户端能主动发现聚类的社交事件。
【附图说明】
[0065] 图1为本发明的实施例提供的应用场景示意图;
[0066] 图2为本发明的实施例提供的一种社交消息的检测方法的流程示意图;
[0067] 图3为本发明的又一实施例提供的一种社交消息的检测方法的流程示意图;
[0068] 图4为本发明的实施例提供的一种社交消息的存储结构示意图;
[0069] 图5为本发明的实施例提供的一种社交消息的查找、插入和删除结构的示意图;
[0070] 图6为本发明的实施例提供的一种社交网服务器的结构示意图;
[0071] 图7为本发明的另一实施例提供的一种社交网服务器的结构示意图;
[0072] 图8为本发明的又一实施例提供的一种社交网服务器的结构示意图;
[0073] 图9为本发明的再一实施例提供的一种社交网服务器的结构示意图。
【具体实施方式】
[0074] 下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚 地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本 发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实 施例,都属于本发明保护的范围。
[0075] 本发明的实施例应用于社交网络系统,其中,参照图1所示,用户通过社交网客户 端向社交网服务器上传社交消息(例如微博消息),若用户需要对上传的社交消息进行浏 览或评论,则用户通过社交网客户端向社交网服务器发送浏览或评论上传的社交消息的请 求,社交网服务器会处理客户端提供浏览或评论的业务,下传相应的社交消息或评论,并存 储相应的评论,实现了用户与用户之间的互动。在本发明的实施例中,用户通过社交网客户 端向社交网服务器上传社交消息,社交网服务器,对上传的社交消息进行主题建模分析,根 据社交消息与每个代表消息的相似性,将社交消息存入与该社交消息相似性最高的代表消 息所在的消息类中,若所述社交消息与所有代表消息的相似性均不超过预定阈值,则为所 述社交消息新建一个消息类,当任一消息类中的社交消息所述消息类中的社交消息的数量 达到第一阈值或所述消息类中的社交消息主题一致时,向社交网客户端输出该消息类。这 样,实现了对社交消息的实时监测。能够使该社交消息及时受到用户的关注。
[0076] 具体的,参照图2所示,包括以下步骤:
[0077] 101、接收社交消息,并对社交消息进行主题建模分析,得到社交消息的主题概率 向量。
[0078] 对于社交网服务器接收到的每一条社交消息,首先都进行主题建模分析,得到该 社交消息的主题概率向量,并且该社交消息的主题概率向量与该社交消息始终保持对应存 在的关系。其中,主题概率向量是该社交消息属于各个主题的概率所组成的向量,例如服务 器中包括军事、财经、灾难、娱乐四个主题,接收到一条社交消息,对其进行主题建模分析, 得到的主题概率向量包括四个概率(假设该主题概率向量为:{〇. 2、0. 1、0. 8、0. 3}),这四 个概率分别对应属于军事主题的概率、属于财经主题的概率、属于灾难主题的概率、属于娱 乐主题的概率。
[0079] 102、将所述社交消息的主题概率向量与每个代表消息的主题概率向量进行比较 得到主题相似性,并依据所述主题相似性获取所述社交消息与所述每个代表消息的相似 性,其中,所述代表消息为一个消息类中具有代表性的社交消息。
[0080] 得到主题相似性之后,还可以结合其他的相似性参数得到更精确的社交消息与每 个代表消息的相似性。
[0081] 103、将所述社交消息存入与所述社交消息相似性最高的代表消息所在的消息类 中。
[0082] 可选的,若所述社交消息与所述每个代表消息的相似性均不超过预设的第一相似 性阈值,则新建一个消息类,将所述社交消息存入所述新建的消息类。
[0083] 从得到的社交消息与每个代表消息的相似性中,选取相似性最高的。并将社交消 息存入该数值最高的相似性对应的代表消息所在的消息类中。若最高的所述社交消息与代 表消息的相似性不超过预设的第一相似性阈值,说明所述社交消息不属于任一个现有的消 息类。则新建一个消息类,将所述社交消息存入所述新建的消息类。
[0084] 104、当所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交消 息主题一致时,向社交网客户端输出所述消息类。
[0085] 当任一个消息类中的社交消息的数量达到第一阈值时,说明该消息类中的社交消 息的数量足够多,满足输出的第一条件。
[0086] 或者,当所述消息类中所述所有社交消息间的相似性中,超过预设的第二相似性 阈值的社交消息间的相似性的数量,达到第二阈值时,则满足主题一致性,输出该消息类。 其中,第二阈值也可以为一个比例,即超过预设的第二相似性阈值的社交消息间的相似性 的数量达到总数量的一定比例时,满足主题一致性。
[0087] 可选的,在对所述社交消息进行主题建模分析之前,还可以获取社交消息所属的 领域,若社交消息所属的领域不属于预设的领域,则剔除所述社交消息,得到过滤后的社交 消息。社交网服务器可以对过滤后的所述社交消息进行主题建模分析,得到所述社交消息 的主题概率向量。
[0088] 例如:预设的领域包括:政治、社会热点、灾难、金融。若接收到的社交消息的所属 领域为娱乐,则过滤掉该社交消息。
[0089] 可选的,还可以对任意一个消息类中的社交消息进行查找、插入、删除操作。
[0090] 其中,运营商可以通过社交网服务器对社交网服务器中存储的社交消息进行查 找、插入、删除操作。这样,提供了一种人工输入和输出社交消息或删除社交消息的方法,使 社交消息的监测更加灵活。
[0091] 在上述实施例中,社交网服务器接收社交消息,根据社交消息与每个代表消息的 相似性,将社交消息存入与该社交消息相似性最高的代表消息所在的消息类中,当任一消 息类中的社交消息所述消息类中的社交消息的数量达到第一阈值或所述消息类中的社交 消息主题一致时,向社交网客户端输出该消息类,由于社交网服务器能够主动向社交网客 户端输出消息类,实现了对社交消息的实时监测,使得社交网客户端能主动发现聚类的社 交事件。
[0092] 本发明的实施例提供一种社交消息的监测方法,参照图3所示,包括以下步骤:
[0093] 201、接收社交消息,获取社交消息的内容参数、社交消息的时间参数、社交消息的 空间参数。
[0094] 202、利用隐含狄利克雷分布LDA算法对社交消息的内容参数、社交消息的时间参 数、社交消息的空间参数进行主题建模分析,得到所述社交消息的主题概率向量。
[0095] 隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA)算法可以对社交消 息进行建模,其中,需要先指定主题的数量,再按照LDA算法计算出社交消息的主题概率向 量,该主题概率向量包括社交消息属于每一个主题的概率。由于只使用社交消息的内容参 数建模精确度低,所以再引入社交消息的时间参数和社交消息的空间参数提高精确度。其 中,引入的社交消息的时间参数和社交消息的空间参数(空间参数分为:经度参数和纬度 参数)可以设定为基于主题的贝塔分布,从而计算社交消息的主题概率向量。
[0096] 203、从所有的消息类中选取代表消息
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1