基于用户生成内容的新闻认证预警方法及系统的制作方法

文档序号:8319220阅读:364来源:国知局
基于用户生成内容的新闻认证预警方法及系统的制作方法
【技术领域】
[0001]本发明涉及新闻认证领域,尤其涉及基于用户生成内容的新闻认证预警方法及系统。
【背景技术】
[0002]随着互联网技术的深入人心和WEB2.0技术的蓬勃发展,普通用户成为互联网上的内容的主要生产者。UGC(User Generated Content)是用户生成内容的简称,UGC新闻是在社会媒体(例如微博、博客、社交网络等)中用户们自发上传或分享的新闻事件信息。UGC内容由于其具有反应及时、传播快等特点,也成为传统媒体的一个主要信息来源。但是,由于UGC内容的门槛低,任何用户都可以向互联网上传内容,缺乏对UGC内容的有效监管,UGC中存在着大量的虚假新闻,这也给传统的通讯社在发布UGC信息带来困扰。
[0003]从国内外研宄进展来看,一方面,目前相关的研宄主要针对UGC内容(非新闻内容)可信性,或者传统新闻稿件(非UGC)可信性,建立全面而科学的信息可信度评价指标体系,而针对UGC新闻的研宄还处于空白阶段;另一方面,这些研宄都是从传播学,心理学,社会学的角度出发,通过问卷调查的方式进行理论分析。而在应用领域针对UGC新闻认证的研宄才刚刚起步,暂时还没有成熟的解决方案。因此,在政府和社会越来越依赖互联网新闻资源,而网络新闻可信度现状又不理想的背景下,本项目从UGC新闻线索认证的实际需求出发,进行互联网UGC新闻内容认证的关键技术研宄,将具有重要的研宄价值。

【发明内容】

[0004]为了解决上述问题的不足,本发明提供了基于用户生成内容的新闻认证预警方法及系统。本发明的目的是在输入新闻线索和新闻时间点后实现自动挖掘、判定相关新闻线索的可信度,并且通过可视化的结果展示给用户丰富、直观的认证结果、数据和证据。
[0005]为达到上述目的,本发明从互联网UGC新闻线索中提取关键的认证要素,并从用户群体,传播模式和信息内容(多媒体内容、文本内容)等方面对其进行可信度认证的关键技术。最终形成UGC新闻真实性的预警分级,为该新闻是否为真实信息提供决策支持。
[0006]本发明提供的一种基于用户生成内容的新闻认证预警系统,包括:
[0007]新闻线索语义扩展模块,用于获取新闻线索,并对该新闻线索进行语义扩展,获取参考数据;
[0008]参数数据定向采集模块,用于对该参考数据进行定向采集,获取信息内容、传输模式、用户群体、用户群体的行为信息和属性信息;
[0009]语义知识提取模块,从该信息内容中提取语义知识;
[0010]语义知识对比认证模块,对该语义知识进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索;
[0011]用户群体认证模块,分析用户群体的行为信息和属性信息,提取该行为信息和属性信息的可信度认证要素,获取该用户群体的可信度认证结果R(U);
[0012]信息内容认证模块,用于将信息内容进行逻辑对比认证,将该信息内容反应的情绪、新闻观点进行分类,获取该信息内容认证结果R(M);
[0013]传播模式认证模块,用于挖掘该新闻观点的传播模式,检测具有异常的传播模式,获取该传播模式异常度认证结果R(G);
[0014]预警分级模块,用于根据这些认证结果及其相应的权重,对该新闻线索的可信度进行预警分级。
[0015]所述基于用户生成内容的新闻认证预警系统,还包括:认证结果展示模块,用于将该用户群体的可信度认证结果R(U)、该信息内容认证结果R(M)、该传播模式异常度认证结果R(G)进行整理和结构化展示。
[0016]所述基于用户生成内容的新闻认证预警系统,还包括:
[0017]该参考数据包括新闻线索标签、源头微博、以及对应的微博信息链接、作者账号;
[0018]该信息内容包括,文本内容和多媒体内容;
[0019]该语义知识包含该多媒体和文本语义知识,该多媒体语义知识是指从该多媒体内容中提取高稳定性和区分性的视觉指纹;
[0020]该预警分级计算公式为:R = (W1R(U)+W2R(G)+W3R(Μ)},其中W1, w2,界3为权重。
[0021]所述基于用户生成内容的新闻认证预警系统,用户群体认证模块还包括:
[0022]识别模块,首先在微博平台中识别与该新闻线索相关的用户群体;
[0023]特性分析模块,对该用户群体中的核心人物进行深度分析,总结该核心人物的行为信息和属性信息;
[0024]特性提取模块,从该行为信息和属性信息中提取用户粉丝数、用户关注数、用户收藏数,用户互粉数,用户地理位置,用户描述,用户关注、用户粉丝、用户标签、用户互粉认证比例以及用户微博数,构造用户群体认证分析模型。
[0025]所述基于用户生成内容的新闻认证预警系统,该传播模式认证模块还包括:
[0026]分析模块,用于分析该新闻观点的源头微博,以及该新闻观点传播过程中的用户群体;
[0027]过滤模块,用于获取该用户群体的评论舆情与传播模式,检测异常或匹配冲突的新闻观点,并进一步过滤该用户群体。
[0028]本发明还提供一种基于用户生成内容的新闻认证预警方法,其特征在于,包括:
[0029]SI,获取新闻线索,并对该新闻线索进行语义扩展,获取参考数据;
[0030]S2,对该参考数据进行定向采集,获取信息内容、传播模式、用户群体、用户群体的行为信息和属性信息;
[0031]S3,从该信息内容中提取语义知识;
[0032]S4,对该语义知识进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索;
[0033]S5,分析用户群体的行为信息和属性信息,提取该行为信息和属性信息可信度认证要素,获取该用户群体的可信度认证结果R(U);
[0034]S6,对信息内容进行逻辑挖掘,将该信息内容反映出的情绪、新闻观点进行分类,获取该信息内容认证结果R(M);
[0035]S7,对该新闻观点的传播模式进行挖掘,检测具有异常的传播模式,获取该传播模式异常度认证结果R(G);
[0036]S8,根据这些评价结果及其相应的权重,对该新闻线索进行预警分级。
[0037]所述基于用户生成内容的新闻认证预警方法,还包括:
[0038]将该用户群体的可信度认证结果R(U)、该信息内容认证结果R(M)、该传播模式异常度认证结果R(G)进行整理和结构化展示。
[0039]所述基于用户生成内容的新闻认证预警方法,还包括:
[0040]该参考数据包括新闻线索标签、源头微博、以及对应的微博信息链接、作者账号;
[0041]该信息内容包括,文本内容和多媒体内容;
[0042]该语义知识包含该多媒体和文本语义知识,该多媒体语义知识是指从该多媒体内容中提取高稳定性和区分性的视觉指纹;
[0043]该预警分级计算公式为:R = (W1R(U)+W2R(G)+W3R(Μ)},其中W1, w2,界3为权重。
[0044]所述用户生成内容新闻认证方法,该步骤S5还包括:
[0045]S51,首先在微博平台中识别与该新闻线索相关的用户群体;
[0046]S52,对该用户群体的核心人物进行深度分析,总结该核心人物的行为信息和属性信息;
[0047]S53,从该行为信息和属性信息中提取用户粉丝数、用户关注数、用户收藏数,用户互粉数,用户地理位置,用户描述,用户关注、用户粉丝、用户标签、用户互粉认证比例以及用户微博数,构造用户群体认证分析模型。
[0048]所述用户生成内容新闻认证方法,该步骤S7还包括:
[0049]S71,分析该新闻观点的传播源,以及该新闻观点传播过程中的用户群体;
[0050]S72,通过获取该用户群体的评论舆情与传播模式,检测具有异常的信息内容和新闻观点,并进一步过滤用户群体。
[0051]由以上方案可知,本发明的优点在于:
[0052]一是本发明可以通过对UGC语义知识进行深度挖掘与分析,并对其可信度进行预警分级;
[0053]二是利用本发明的方
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1