一种热点事件分类方法及装置的制造方法_4

文档序号:9579364阅读:来源:国知局
br>[0131] 图2为本发明实施例所提供的一种中心点对应的热点事件调整过程的流程示意 图,包括如下步骤:
[0132] S201 :采集每个热点事件,并获取该热点事件对应的设定时间长度内的转发数量 或评论数量。
[0133] S202 :根据每个热点事件对应的设定时间长度内的转发数量或评论数量,对热点 事件进行聚类,将每个热点事件划分到不同的聚类中。
[0134] S203 :在每个聚类中,针对该聚类中包含的每个热点事件,确定该聚类的中心点对 应的热点事件。
[0135] S204 :对每个聚类的中心点对应的热点事件在设定时间长度内的转发数量或评论 数量进行调整。
[0136] 针对每个聚类的中心点对应的热点事件,根据如下公式对该中心点对应的热点事 件在设定时间长度内的转发数量或评论数量进行调整:
[0137]
[0138] 其中,AB(t)为设定时间长度内调整后的时间点t的转发量,U(n)为该热点事件 在设定时间长度内的当前时间点η时,在网络中未传播到的用户的个数,ε为采集到的热 点事件中包含的噪声所对应的广告事件和个人事件的数量,S(t)根据以下公式确定:
[0139]
[0140] 其中,nb为该热点事件在设定时间长度内传播到预设的意见领袖的时间点;
[0141]G(t)根据以下公式确定:
[0142] G(t) = a e
[0143] 其中,a为该热点事件在设定时间长度内的转发量或者评论数量出现第二峰值时 的幅值,w为该热点事件在设定时间长度内从转发量或者评论数量出现第一峰值到第二峰 值的时间长度,tp为该热点事件在设定时间长度内的转发量或者评论数量出现第二峰值的 时间点;
[0144] f(T)根据以下公式确定:
[0145] f(τ)= β*τ L5
[0146] 其中β为热点事件传播过程中的传播系数,τ为传播过程中的每个时间点。
[0147] 现有技术忽略了热点事件在传播过程中转发数量或评论数量随时间动态变化的 规律,只能处理静态数据,所以本发明实施例针对每个聚类的中心点对应的热点事件在设 定时间长度内的转发数量或评论数量进行调整,抽象出热点事件的数学特性,定量地描述 热点事件在传播过程中转发数量或评论数量随时间动态变化的规律。
[0148] 本发明实施例中,提出了一种热点事件分类方法,该方法通过接收待分类的热点 事件,确定该待分类的热点事件与每个聚类的中心点对应的热点事件的距离,将所述待分 类的热点事件划分到距离的最小值对应的聚类中,并对每个聚类的中心点对应的热点事件 在设定时间长度内的转发数量或评论数量进行调整,实现了热点事件的分类及定量地描述 热点事件在传播过程中转发数量或评论数量随时间动态变化的规律。
[0149]图3为本发明实施例提供的一种热点事件分类装置的结构示意图,与图1Α所示的 流程相对应,所述装置包括接收模块301、确定模块302、聚类模块303、采集模块304、调整 模块305和过滤模块306。
[0150] 接收模块301,用于接收待分类的热点事件;
[0151] 确定模块302,用于确定该待分类的热点事件与每个聚类的中心点对应的热点事 件的距离;
[0152] 聚类模块303,用于将所述待分类的热点事件划分到该距离的最小值对应的聚类 中;
[0153] 所述装置还包括:
[0154] 采集模块304,用于采集每个热点事件,并获取该热点事件对应的设定时间长度内 的转发数量或评论数量;
[0155] 所述聚类模块303,还用于根据每个热点事件对应的设定时间长度内的转发数量 或评论数量,对热点事件进行聚类,将每个热点事件划分到不同的聚类中;在每个聚类中, 针对该聚类中包含的每个热点事件,确定该聚类的中心点对应的热点事件。
[0156] 所述装置还包括:
[0157] 调整模块305,用于针对每个聚类的中心点对应的热点事件,根据如下公式对该中 心点对应的热点事件在设定时间长度内的转发数量或评论数量进行调整:
[0158:
[0159] 其中,AB(t)为设定时间长度内调整后的时间点t的转发量,U(n)为该热点事件 在设定时间长度内的当前时间点η时,在网络中未传播到的用户的个数,ε为采集到的热 点事件中包含的噪声所对应的广告事件和个人事件的数量,S(t)根据以下公式确定:
[0160]
[0161] 其中,nb为该热点事件在设定时间长度内传播到预设的意见领袖的时间点;
[0162]G(t)根据以下公式确定:
[0163] G(t)^a e
[0164] 其中,a为该热点事件在设定时间长度内的转发量或者评论数量出现第二峰值时 的幅值,w为该热点事件在设定时间长度内从转发量或者评论数量出现第一峰值到第二峰 值的时间长度,tp为该热点事件在设定时间长度内的转发量或者评论数量出现第二峰值的 时间点;
[0165]f(〇根据以下公式确定:
[0166]f(τ ) =β*τ L5
[0167] 其中β为热点事件传播过程中的传播系数,τ为传播过程中的每个时间点。
[0168] 所述装置还包括:
[0169] 过滤模块306,用于针对每个热点事件,判断该热点事件的平均时间转发量友和意 见领袖占有率D是否大于相应的平均时间转发量阈值tjP意见领袖占有率阈值tD;如果 否,则删除该热点事件,如果是,则将所述热点事件发送到所述聚类模块,其中根据如下公 式确定平均时间转发量R和意见领袖占有率D:
[0170]
[0171]
[0172] S为平均时间转发量,D为意见领袖占有率,Rt为该热点事件的总转发量,T为设 定的时间长度,Vb为该热点事件传播过程中转发该热点事件的意见领袖的个数,Vt为该热 点事件传播过程中转发该热点事件的用户的个数。
[0173] 所述聚类模块303,具体用于根据属于类别(;的所有热点事件Xi,与中心点对应的 热点事件yk的距离d(Xl,yk)的和为最小,确定该聚类的中心点对应的热点事件<,其中
4为属于类别Ck的所有热点事件,μ 中心点对应的热点事 件,为确定的该聚类的中心点对应的热点事件。
[0174] 所述确定模块302,具体用于根据以下公式确定该待分类的热点事件与每个聚类 的中心点对应的热点事件的距离:
[0175]
[0176] 其中,x(t)为该待分类的热点事件X在该设定时间长度内每个时间点t的转发数 量或评论数量,C(t)为聚类中心对应的热点事件C在该设定时间长度内每个时间点t的转 发数量或评论数量,T为设定的时间长度。
[0177] 本发明实施例中,提出了一种热点事件分类方法及装置,该方法中采集每个热点 事件,并获取该热点事件对应的设定时间长度内的转发数量或评论数量;根据每个热点事 件对应的设定时间长度内的转发数量或评论数量,对热点事件进行聚类,将每个热点事件 划分到不同的聚类中;在每个聚类中,针对该聚类中包含的每个热点事件,确定该聚类的中 心点对应的热点事件,根据每个中心点对应的热点事件对待分类的热点事件进行分类。由 于本发明实施例中通过接收待分类的热点事件,确定该待分类的热点事件与每个聚类的中 心点对应的热点事件的距离,将所述待分类的热点事件划分到距离的最小值对应的聚类 中,实现了热点事件的分类。
[0178] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实 体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存 在任何这种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体意在涵 盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要 素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备 所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除 在包括所述要素的过程、方法、物品或者设备中还存在另外的
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1