一种基于微博信息源的新闻认证方法及系统的制作方法

文档序号:8258679阅读:161来源:国知局
一种基于微博信息源的新闻认证方法及系统的制作方法
【技术领域】
[0001] 本发明涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法 及系统。
【背景技术】
[0002] 随着微博在人们生活中的普遍应用,使用微博平台获取和发布信息成为人们生活 中很重要的部分,微博上信息的真实性问题,也越来越得到人们的重视,微博平台中虚假信 息和不实信息的传播,不仅会给网络环境带来负面影响,也会给个人生活和社会稳定带来 严重危害,现有技术中对新闻事件的认证还是借助人力的干预判断和调查取证,其缺点是 耗费人力多,花费时间长。
[0003] 发明专利"一种基于用户行为的用户可信度认证系统及方法",该发明公开了一种 基于用户行为的用户可信度认证系统及方法,该系统包括用户身份及行为模式确认模块、 用户行为采集模块、用户行为挖掘模块、用户行为序列匹配及可信度认证模块和本地安全 策略模块,通过用户行为挖掘模块对用户的行为日志进行行为挖掘,建立用户个性化行为 特征序列,通过用户行为序列匹配及可信度认证模块对用户个性化行为特征序列与待匹配 序列进行序列相似度计算,获得用户可信度级别,并启用相应的安全策略。该发明,利用序 列模式挖掘方式,采集用户的实时行为建立待匹配序列,进行行为序列的相似度匹配,以此 对用户的实时行为进行可信认证,提高认证的准确率,保障企业和个人财产安全。但是该发 明仅仅利用用户的行为信息,而本发明综合使用了用户的社交关系信息、社交行为信息和 社交评价信息;该发明从用户行为日志挖掘行为特征序列,而本发明以事件关键词为检索 关键词搜集数据;该发明基于单用户应用平台,不涉及多用户交互,而本发明基于的是社交 网络。
[0004] 发明专利"一种基于微博平台的用户可信度评估方法",该发明基于全球著名的微 博平台,如Twitter,新浪微博,腾讯微博等,针对信息可信度进行研宄,提出采用用户可信 度评估模型来评估用户的可信度,为全球的微博用户识别微博平台上海量信息的真伪提供 了关键性的理论依据以供同行参考,并提出了重要的应用价值供广大微博用户运用。该方 法可广泛应用于微博平台上的信息可信度评估方面,主要包括微博平台上的用户可信度, 主题专家的探测,广告投放效果的实际价值等等,在一定程度上为微博用户在信息化时代 准确的识别微博上海量信息的真伪奠定了重要的基础。但该发明仅仅利用用户社交关系信 息,而本发明综合使用了用户的社交关系信息、社交行为信息和社交评价信息;该发明主要 提出一种简单可泛用的用户可信度的评价模型,而本发明则是针对新闻事件认证这一具体 任务,用户可信度评估是实现该任务的一个手段。
[0005] 发明专利"一种获取社交网络用户可信度方法及系统",该发明获取社交网络用户 可信度的方法及系统,其中,所述方法包括:收集社交网络用户在现实世界中与其他用户之 间产生的第一社交行为;累积所述第一社交行为的相关数据;根据累积后的第一社交行为 的相关数据,获取所述社交网络用户的可信度信息。通过该发明,能够获取到更具有参考价 值的可信度信息,供用户引用或者查询。但该发明需要收集现实世界中的社交行为,数据获 取难度大,而本发明的分析数据则完全来源于微博平台,数据获取难度小;该发明针对社交 网络的用户可信度,而本发明则是针对新闻事件认证这一具体任务,用户可信度评估只是 实现该任务的一个手段。

【发明内容】

[0006] 针对现有技术的不足,本发明提出一种基于信息源的新闻认证方法及系统。
[0007] 本发明提出一种基于微博信息源的新闻认证方法,包括:
[0008] 步骤1,提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应 用户的用户信息;
[0009] 步骤2,根据所述用户信息,获取所述用户的互粉比例、认证粉丝比例、粉丝数与关 注数比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关注数比例,通过经验值 归一化后加权融合,获取所述用户的社交关系可信度值;
[0010] 步骤3,根据所述用户信息,获取所述用户的用户活跃度与历史微博平均影响力, 将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度 值;
[0011] 步骤4,查找所述用户的所有微博,获取所述微博的评价舆情指数,同时查找所述 微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论 舆情指数作为社交评价可信度值;
[0012] 步骤5,将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信度 值进行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信度 预警等级,以完成认证所述新闻。
[0013] 所述的基于微博信息源的新闻认证方法,将所述用户的粉丝数与关注数分别取 log平滑后的比值,作为所述粉丝数与关注数比例。
[0014] 所述的基于微博信息源的新闻认证方法,所述用户活跃度通过以下公式获取:
[0015] Ac(i) = Count_N(i)/N
[0016] 其中N为天数,i为所述用户,Count_N(i)为所述用户在N天内发表微博的总数, Ac (i)为所述用户活跃度。
[0017] 所述的基于微博信息源的新闻认证方法,所述历史微博平均影响力通过以下公式 获取:
[0018]
【主权项】
1. 一种基于微博信息源的新闻认证方法,其特征在于,包括: 步骤1,提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户 的用户信息; 步骤2,根据所述用户信息,获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数 比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关注数比例,通过经验值归一 化后加权融合,获取所述用户的社交关系可信度值; 步骤3,根据所述用户信息,获取所述用户的用户活跃度与历史微博平均影响力,将所 述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值; 步骤4,查找所述用户的所有微博,获取所述微博的评价舆情指数,同时查找所述微博 的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情 指数作为社交评价可信度值; 步骤5,将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信度值进 行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信度预警 等级,以完成认证所述新闻。
2. 如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,将所述用户的 粉丝数与关注数分别取log平滑后的比值,作为所述粉丝数与关注数比例。
3. 如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,所述用户活跃 度通过以下公式获取: Ac(i) =Count_N(i)/N 其中N为天数,i为所述用户,Count_N(i)为所述用户在N天内发表微博的总数,Ac(i) 为所述用户活跃度。
4. 如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,所述历史微博 平均影响力通过以下公式获取:
其中k为所述用户发布的微博k,Re(t)为所述微博k第t个转发引起的二次转发数,T为所述微博K的转发总数,Fluence(k)为历史微博影响力;
其中m为所述用户的历史微博数,i为所述用户,avg_Fluence(i)为所述历史微博平均 影响力。
5. 如权利要求1所述的基于微博信息源的新闻认证方法,其特征在于,所述步骤5还包 括: 生成预测模型,通过所述预测模型对新闻进行认证。
6. -种基于微博信息源的新闻认证系统,其特征在于,包括: 获取待认证信息源模块,用于提取新闻的信息源,作为待认证信息源,获取与所述待认 证信息源相对应用户的用户信息; 获取社交关系可信度值模块,用于根据所述用户信息,获取所述用户的互粉比例、认证 粉丝比例、粉丝数与关注数比例,并将所述互粉比例、所述认证粉丝比例、所述粉丝数与关 注数比例,通过经验值归一化后加权融合,获取所述用户的社交关系可信度值; 社交行为可信度值模块,用于根据所述用户信息,获取所述用户的用户活跃度与历史 微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社 交行为可信度值; 社交评价可信度值模块,用于查找所述用户的所有微博,获取所述微博的评价舆情指 数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情 指数与所述评论舆情指数作为社交评价可信度值; 认证模块,用于将所述社交关系可信度值、所述社交行为可信度值、所述社交评价可信 度值进行线性加权求和作为综合可信度值,根据所述综合可信度值,获取所述新闻的可信 度预警等级,以完成认证所述新闻。
7. 如权利要求6所述的基于微博信息源的新闻认证系统,其特征在于,将所述用户的 粉丝数与关注数分别取log平滑后的比值,作为所述粉丝数与关注数比例。
8. 如权利要求6所述的基于微博信息源的新闻认证系统,其特征在于,所述用户活跃 度通过以下公式获取: Ac(i) =Count_N(i)/N 其中N为天数,i为所述用户,Count_N(i)为所述用户在N天内发表微博的总数,Ac(i) 为所述用户活跃度。
9. 如权利要求6所述的基于微博信息源的新闻认证系统,其特征在于,所述历史微博 平均影响力通过以下公式获取:
其中k为所述用户发布的微博k,Re(t)为所述微博k第t个转发引起的二次转发数,T为所述微博K的转发总数,Fluence(k)为历史微博影响力;
其中m为所述用户的历史微博数,i为所述用户,avg_Fluence(i)为所述历史微博平均 影响力。
10. 如权利要求6所述的基于微博信息源的新闻认证系统,其特征在于,所述认证模块 还包括: 生成预测模型,通过所述预测模型对新闻进行认证。
【专利摘要】本发明涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法及系统,该方法包括:提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并根据以上三个比例,获取所述用户的社交关系可信度值;获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;获取微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;将以上三个可信度值进行线性加权求和作为综合可信度值。
【IPC分类】G06F17-30
【公开号】CN104572807
【申请号】CN201410594515
【发明人】曹娟, 张俊强, 谢菲, 张勇东, 苏宇, 李锦涛, 吕锐, 陈明祥
【申请人】中国科学院计算技术研究所, 新华通讯社
【公开日】2015年4月29日
【申请日】2014年10月29日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1