一种舆情事件中社交媒体用户角色分类方法

文档序号:25734029发布日期:2021-07-06 18:42阅读:来源:国知局

技术特征:

1.一种舆情事件中社交媒体用户角色分类方法,其特征是按如下步骤进行:

步骤1、获取社交媒体中的用户信息:

步骤1.1、构建用户集合u∈{1,2,...,u…,|u|},其中,u表示用户的序号,|u|表示社交媒体中用户的数量;

步骤1.2、获取社交媒体中|u|个用户的行为数据,其中,所述用户集合u中第u个用户的行为数据包括:第u个用户关注的用户数量关注第u个用户的用户数量以及第u个用户发布的文本数量mu;

步骤1.3、获取社交媒体中|u|个用户发布的文本信息,并去除所有停用词后,构成文本集合;其中,第u个用户去除停用词后所对应的文本信息,记为wu,n表示第u个用户的文本信息中第n个词,nu表示文本信息中的词总数;

步骤2、基于社交媒体中用户的行为数据和文本信息,构建非参贝叶斯模型-混合狄利克雷过程混合模型h-dpmm:

步骤2.1、对于社交媒体中的第u个用户,按照式(1)生成第u个用户对应的角色ru:

ru~multinomial(π),π~dirichlet(α)(1)

式(1)中,~表示服从,multinomial(·)表示多项式分布,dirichlet(·)表示狄利克雷分布,π表示多项式分布的超参数,α表示狄利克雷分布的超参数;

步骤2.2、对于社交媒体中的第u个用户,按照式(2)生成第u个用户的主题分布θu:

θu~multinomial(ρk),ρk~dirichlet(α1)(2)

式(2)中,ρk表示第k个角色对应的主题分布,且k∈{1...k}表示角色索引,α1表示狄利克雷分布的超参数;

步骤2.3、对于社交媒体中的第u个用户,按照式(3)生成第u个用户的行为特征vu:

vu~guassian(ηk),ηk~inv-wishart(α2)(3)

式(3)中,guassian(·)表示高斯分布,inv-wishart(·)表示逆威沙特分布,ηk表示第k个角色对应的行为分布,α2表示逆威沙特分布的超参数;

步骤3、基于通过社交媒体中观察到的用户集合u,设计吉布斯采样,对用户的角色分布进行参数推断:

步骤3.1、初始化u=1;

步骤3.2、假设当前采样角色的用户为用户集合u中的第u个用户,并根据式(4)依次采样第u个用户的角色ru:

式(4)中,r表示在当前采样过程之前已经出现的某个角色,表示当前采样过程之前未出现的一个新角色,cr表示第r个角色中的用户数量,表示除第u个用户的角色ru外的角色;δ(ru,r)为指示函数,如果ru是一个已经出现的角色r,则令δ(ru,r)=1,否则令δ(ru,r)=0;如果ru是一个新的角色则令否则令fexisting(u|ηk,ρk,ru=k)表示第u个用户分配到已经出现的第k个角色的条件概率,fnew(u|α,αt,αb)表示第u个用户分配到未出现的新角色的条件概率;

步骤3.3、将u+1赋值给u,并返回步骤3.2执行,直到u=|u|为止;从而为每个用户分配角色并得到角色分类结果;

步骤3.4、重复步骤3.1-步骤3.3的采样过程,从而更新每个用户所分配的角色,并更新第k个角色对应的行为分布ηk和第k个角色对应的主题分布ρk,当所有用户的角色不再变化,且角色分类结果不变时,输出最终的所有角色的行为分布和主题分布;其中,最终的第k个角色对应的行为分布记为最终的第k个角色对应的主题分布记为

步骤4、根据最终的所有角色的行为分布和主题分布,对社交媒体中用户进行角色分类。


技术总结
本发明公开了一种舆情事件中社交媒体用户角色分类方法,其步骤包括:1.获取社交媒体中的用户信息,并提取用户特征,2.设计非参贝叶斯模型混合狄利克雷过程混合模型(h‑DPMM)建模用户角色,3.设计吉布斯采样推断参数,分析舆情事件中社交媒体的用户角色,本发明能够利用在线社交媒体平台中用户生成的内容将用户为不同的角色,从而实现对群体中角色类型全面快速且精准地分类。

技术研发人员:孙春华;周凡;李怡;孙见山;周永行;井二康;梁瑞成;陶守正;魏雪梅
受保护的技术使用者:合肥工业大学
技术研发日:2021.04.14
技术公布日:2021.07.06
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1