一种议题管理式网络舆情评价管理系统与方法_2

文档序号:8339672阅读:来源:国知局
题(更新 议题设定信息1010),则回到操作议题建立与设定模块100相关流程,若选择不建立/设定 议题,则议题信息会整合到议题相关舆情数据交换模块104,提供所有已建立/设定的既有 议题设定信息1009。
[0022] 如图2所示,在多个虚拟服务器(Virtual Machine,简称VM)中独立布署各模块 后,议题管理网站服务器群组200建立/设定议题,暨建立/设定各议题对应关键词组的组 态,并包括Web层服务与议题管理API,议题管理网站服务器群组200将设定的关键词组发 送到舆情搜集与结构化数据流服务器202,舆情搜集与结构化数据流服务器202以此关键 词组为基准,由因特网213将取得的未经过整理的网站舆情资料(RAW DATA)发送到舆情搜 集与结构化数据流服务器202中暂存。
[0023] 舆情搜集与结构化数据流服务器202包括多组信息接取与转换模块,每日定时将 由因特网213取得的暂存RAW DATA予以结构化转换,转换为具有标题、作者、内文、发文时 间、取得时间、转换数据时间、网址、网页卷标、数据来源、数据来源网站分类、点阅数、响应 数等的固定格式结构化信息,并将固定格式结构化信息区分为社交网站(FACEB00K、Plurk、 Twitter等)、新闻媒体、兴趣社群(PTT、Mobile01、Baby Home、知名部落格等网站)、智能型 手机应用软件市集(Google Play、Apple iTunes、Windows Market等)等四大分类;舆情 搜集与结构化数据流服务器202使用档案传输协议/安全性档案传输协议(FTP/SFTP)通 过FTP服务器210取得舆情文字CSV (Comma S印arate Values,逗号分隔值)或TXT (Text File,文本文件)档案,根据分隔符解析文本文件后予以结构化转换;舆情搜集与结构化数 据流服务器202使用Java程序通过安全认证后,取得电子邮件服务器211来源的Windows Office文件档(.docx或.xlsx),以Office Open XML标准为依据结构化抽出文件中的舆 情信息,再予以结构化转换;其它非OFFICE文件、固定分隔符文字文件、无法通过爬网技术 取得的数据,舆情搜集与结构化数据流服务器202制定固定格式与API,以国际标准格式 JSON、XML、DSML、YAML等规范为标准进行数据交换取得舆情数据,再予以结构化转换;另 外,针对目前热门的社交网站,如:Facebook、Twitter、Plurk、Google+等,以各社交网站提 供的SNS (Social Networking Service,社会性网络服务)API取得社交网站上所张贴的文 章、分享数、留言数、按赞数、社群标签,也可以取得213中网址信息(如:新闻网页)所嵌 入的外部社交网站如Facebook的分享数、留言数、按赞数、社群标签,再一并予以结构化转 换;针对台湾热门的BBS站台,以telnet (远程登录)标准登录BBS网站中多个指定论坛, 模拟使用者浏览文章方式根据日期逐一选阅,并同时抄录信息到舆情搜集与结构化数据流 服务器202,再予以结构化转换;所有异质数据通过舆情搜集与结构化数据流服务器202, 将对应议题与固定格式进行整合后转换为结构化信息。
[0024] 舆情搜集与结构化数据流服务器202将转换完成的大量结构化信息,储存到数据 库服务器群组201中,并在索引服务器204建立结构化数据查询索引文件时,舆情搜集与结 构化数据流服务器202在每次转换信息并储存完成后,通过数据库服务器群组201呼叫情 绪字典评价分析服务器203进行评价分析,情绪字典评价分析服务器203内存储有一套口 碑量值字典,口碑量值字典的内容为每一个口碑字词所对应的正面口碑分数与负面口碑分 数,另外情绪字典评价分析服务器203中包括文字口碑指针分析与社群Fuzzy社群指标分 析的口碑双指针正负评价分析方法模块,以及议题评价分析方法模块;情绪字典评价分析 服务器203从数据库服务器群组201中取得每一笔结构化舆情信息后,先将文章内容抽词 成i等分,并将各字词与口碑量值字典进行比较,正向的文字词义分析口碑指针采用如下 方程式
[0025]
【主权项】
1. 一种议题管理式网络舆情评价管理系统,其特征在于,该系统包括: 议题建立与管理模块,用于建立多个议题与多个关键词,所述多个议题与所述多个关 键词一一对应,并生成设定组态,且管理所述多个议题; 舆情搜集模块,用于从多个异质数据来源中搜集数据并转换为结构化数据格式; 舆情口碑评分模块,用于计算舆情正负评价; 议题趋势分析模块,用于计算议题正负评价; 议题相关舆情数据交换模块,用于连接上述多个模块,以使上述多个模块存取所述舆 情正负评价以及所述议题正负评价。
2. 如权利要求1所述的系统,其特征在于,所述议题建立与管理模块管理所述多个议 题包括修改、删除、关键词调整、议题处理方式记录、议题回报、电子邮件议题、议题追踪、查 询相关议题舆情、重大议题警告通报或议题相关舆情爆量警告。
3. 如权利要求1所述的系统,其特征在于,所述舆情搜集模块具体用于: 将从所述多个异质数据来源中搜集的数据通过OFFICE Open XML、格式化文字文件、国 际数据交换标准、爬网技术、社交网站存取接口、Telnet纪录等技术转换为所述结构化数据 格式,并储存转换为所述结构化数据格式的数据。
4. 如权利要求1所述的系统,其特征在于,所述舆情口碑评分模块具体用于: 使用口碑双指标正负评价分析方法计算所述舆情正负评价。
5. 如权利要求1所述的系统,其特征在于,所述议题趋势分析模块具体用于: 使用议题评价分析方法计算所述议题正负评价。
6. -种议题管理式网络舆情评价管理系统方法,其特征在于,该方法包括: 使用口碑双指标正负评价分析方法分析文章并获得第一口碑指标和第二口碑指标; 根据所述第一口碑指标和所述第二口碑指针生成舆情评价分数; 使用议题评价分析方法调整所述舆情评价分数,并获得以议题为主的议题口碑分数。
7. 如权利要求6所述的方法,其特征在于,所述议题评价分析方法根据时间调整所述 舆情评价分数。
8. 如权利要求7所述的方法,其特征在于,所述议题评价分析方法根据对数法方程式、 倍数余额递减法或线回归法调整所述舆情评价分数。
9. 如权利要求6所述的方法,其特征在于,所述口碑双指标正负评价分析方法根据文 字词义分析法和社群分析法获得所述第一口碑指标和所述第二口碑指标。
10. 如权利要求6所述的方法,其特征在于,所述第一口碑指标为文字词义分析口碑指 针,所述第二口碑指标为社群Fuzzy分析口碑指标。
【专利摘要】本发明提供一种议题管理式网络舆情评价管理系统与方法。此系统包括:议题建立与设定模块,用于建立议题与议题关联字组;舆情搜集模块,用于议题关连字组通过爬网、程序与社群网站公开的API撷取并解析数据,结构化信息为标题、作者、来源、网址、内文等,并区分为社交网站、新闻媒体、兴趣社群、智能型手机应用软件市集等四大类;舆情口碑评分模块,用于将每则舆情根据字词口碑分析与社群互动模糊分析计算出每则舆情的评价分数;议题趋势分析模块,用于将每日、每周、每月的舆情,以舆情口碑评价分数为基础通过揭露方法计算议题趋势分数;议题相关舆情数据交换模块,用于将议题相关舆情通过网络交换标准,呈现在各系统的管理接口或讯息通报上。
【IPC分类】G06F17-30
【公开号】CN104657425
【申请号】CN201510032358
【发明人】黄华泰, 杨孟鑫, 黄博威
【申请人】中华电信股份有限公司
【公开日】2015年5月27日
【申请日】2015年1月22日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1