1.一种舆情事件中社交媒体用户角色分类方法,其特征是按如下步骤进行:
步骤1、获取社交媒体中的用户信息:
步骤1.1、构建用户集合u∈{1,2,...,u…,|u|},其中,u表示用户的序号,|u|表示社交媒体中用户的数量;
步骤1.2、获取社交媒体中|u|个用户的行为数据,其中,所述用户集合u中第u个用户的行为数据包括:第u个用户关注的用户数量
步骤1.3、获取社交媒体中|u|个用户发布的文本信息,并去除所有停用词后,构成文本集合;其中,第u个用户去除停用词后所对应的文本信息,记为
步骤2、基于社交媒体中用户的行为数据和文本信息,构建非参贝叶斯模型-混合狄利克雷过程混合模型h-dpmm:
步骤2.1、对于社交媒体中的第u个用户,按照式(1)生成第u个用户对应的角色ru:
ru~multinomial(π),π~dirichlet(α)(1)
式(1)中,~表示服从,multinomial(·)表示多项式分布,dirichlet(·)表示狄利克雷分布,π表示多项式分布的超参数,α表示狄利克雷分布的超参数;
步骤2.2、对于社交媒体中的第u个用户,按照式(2)生成第u个用户的主题分布θu:
θu~multinomial(ρk),ρk~dirichlet(α1)(2)
式(2)中,ρk表示第k个角色对应的主题分布,且k∈{1...k}表示角色索引,α1表示狄利克雷分布的超参数;
步骤2.3、对于社交媒体中的第u个用户,按照式(3)生成第u个用户的行为特征vu:
vu~guassian(ηk),ηk~inv-wishart(α2)(3)
式(3)中,guassian(·)表示高斯分布,inv-wishart(·)表示逆威沙特分布,ηk表示第k个角色对应的行为分布,α2表示逆威沙特分布的超参数;
步骤3、基于通过社交媒体中观察到的用户集合u,设计吉布斯采样,对用户的角色分布进行参数推断:
步骤3.1、初始化u=1;
步骤3.2、假设当前采样角色的用户为用户集合u中的第u个用户,并根据式(4)依次采样第u个用户的角色ru:
式(4)中,r表示在当前采样过程之前已经出现的某个角色,
步骤3.3、将u+1赋值给u,并返回步骤3.2执行,直到u=|u|为止;从而为每个用户分配角色并得到角色分类结果;
步骤3.4、重复步骤3.1-步骤3.3的采样过程,从而更新每个用户所分配的角色,并更新第k个角色对应的行为分布ηk和第k个角色对应的主题分布ρk,当所有用户的角色不再变化,且角色分类结果不变时,输出最终的所有角色的行为分布和主题分布;其中,最终的第k个角色对应的行为分布记为
步骤4、根据最终的所有角色的行为分布和主题分布,对社交媒体中用户进行角色分类。