一种微博舆情与城市路况相映射的交通平行方法_3

文档序号:9750845阅读:来源:国知局
步骤103,判定分类:对于JMB,对其JMB_original中的Content使用自然语言处 理工具结合自定义交通字典进行分词,形成有效词组WordList =(万万;没想到;山东路; 全线;堵车;这么;厉害;真是;醉了;山东路;北向南;各个;路口;很堵;山东路;二思;青 岛交通广播FM897 ;青岛交警),词组在交通事故、交通拥堵、交通反馈三个分类下的词组得 分分别采用以下方式计算,CategoryScore为整个词组的得分,WordScore为单个词的得 分:
[0080]
[0081] 其中η为WordList中的词数。由于CategoryScore在三个分类下的得分分别为 [8, 27, 2],因此设定 JMB_processed 中的 Category = "交通拥堵"。
[0082] 步骤104,地理信息抽取:对于JMB,由于其Plocation为空,即发布者没有标定当 时的位置,则使用对内容分词后的词组WordList中包含的青岛道路数据集JRD中的路段 名称,设定JMB_processed中的Road_name = "山东路",Road_type = 1,由于没有包含具 体位置,Location_name与Location_type均为空。由于其为拥堵类信息,反馈主题Target 也为空;
[0083] 步骤105,指数计算:对于JMB,用EmotionWords表示其包含的情感词集,扫描 WordList,EmotionWords中的情感词得分Score_words = -5。其表情符号情感得分为 Score_emoticon = -3,则
[0084] Index_emotion = Score_words+Score_emoticon
[0085] 设定 JMB_processed 中的 Index_emotion = -8,即 JMB 的情感为负面情感。
[0086] 由于JMB的发布人"许a_ruby"在历史发布者数据集中,且已经根据其发布的交 通主题的微博信息等计算出了其可信度得分,这里直接读取其发布者可信度得分Sc 〇re_ publisher = 4. 4分(取值范围0-5)。发布人的初始可信度得分可根据以下方法计算:
[0087]
[0088] 其中,a _i表示第i个因素的权值因子,X_i为第i个影响因素,k为影响因素的个 数。这里考虑的因素包括:发布人的所在地是否与设定城市一致、发布人的账号类型、发布 人的粉丝数、发布人平均每月历史交通微博条数、被系统用户标记为发布不实消失的次数。 然后再根据每一张图片得1分,最多3分,则其图片张数得分Sc 〇re_Cntpic = 1 ;根据使用 手机客户端发布得1分,否则〇分,则发布源得分Sc〇re_ptemi = 1 ;根据标识了发布位置 得2分,否则0分,则发布位置得分SC〇re_pl〇cati 〇n = 0。那么JMB得可信度得分为:
[0089] Index_rellability = Score_publisher+Score_cntpic+Score_ptemi+Score_ plocation
[0090] 设定 JMB_processed 中的 Index_reliability = 6· 4〇
[0091] 根据JMB_original中的发布人信息Publisher相关信息以及转发数、评论数、点 赞数、图片数,同时根据近十天采集的历史微博信息,使用相似度算法计算同主题得分,采 用加权的方式综合计算其重要度得分,设定JMB_processed中的Index_importance。
[0092] Index_importance = Score_forward+Score_comment+Score_like+Score_same
[0093] 步骤106,路段更新:由于JMB属于交通拥堵类信息,则加入到自定义时间窗口内 的拥堵类Setjam下"山东路"数据集中。数据集中,其中事故类数据集记为Set_a CCident, 拥堵类数据集记为Set_jam,反馈类数据集记为Set_feedback。对于Set_accident与Set_ feedback,实时信息动态更新;对于Set_jam,更新所属路段的拥堵指数;
[0094] 步骤107,地图可视化:微博舆情地图可视化显示采用使用百度地图API,对更新 后的Set_jam,根据城市道路数据集JRD中山东路的起始点经炜度坐标值,其更新后的拥堵 指数(时间窗口内的微博舆情条数)根据自定义得阈值区间对所属路段进行红黄绿颜色 渲染,以表示不同的交通畅通度/拥堵程度。同时在弹出的具体信息中,再以不同的图标分 别标记JMB的相关指数(情感度、可信度与重要度),实现交通舆情到城市路况的平行映射。
[0095] 图3显示的是青岛市区主要道路2015年10月7日18点时微博舆情与城市路况 相映射的交通平行方法构建的百度地图,自定义时间窗口为60小时,拥堵状况采用了颜色 植染,本图未做展示,图中的微博舆情JMB_processed信息展示为随机选取,交通事故、交 通反馈情况直接在地图中显示。从图3中可以看出,本发明的方法可以实现微博舆情与城 市路况的映射,通过本发明可以实现对微博中的交通信息进行快速分类与定位,实现基于 互联网信息交通事故、拥堵、反馈类信息进行预警可视化展示,为城市交通管理、规划、应急 预案、问题解决等提供辅助决策。
[0096] 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详 细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡 在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保
【主权项】
1. 一种微博舆情与城市路况相映射的交通平行方法,其特征在于,该方法包括以下步 骤: 步骤一、根据设定城市中各路段名称、路段级别、交叉路集、两侧建筑物集、路段起点经 炜度坐标、路段终点经炜度坐标建立城立路段数据集JRD ; 步骤二、实时采集设定的城市交通信息主题相关的微博,根据主题相关和时间窗口范 围判断其有效性,对于一条有效的微博记作JMB ; 步骤三、对于每一条JMB,建立其原始数据集,抽取其原始属性,记作JMB_original ; 步骤四、对原始数据集进行处理抽取,建立与原始数据集形成映射的属性集,记作: JMB-processed ; 步骤五、自定义时间窗口,建立自定义时间窗口内的交通主题数据集JCD ;其中事故类 数据集记为Set_accident,拥堵类数据集记为Set_jam,反馈类数据集记为Set_feedback ; 对于每条微博信息JMB,根据其所属路段与交通主题类别加入对应的自定义时间窗口内的 数据集中;对于Set_accident与Set_feedback,实时信息动态更新;对于Set_jam,更新所 属路段的拥堵指数; 步骤六、对JMB_processed中的部分属性信息,以及更新后的三类交通主题数据集 Set_accident,Set_jam以及Set_feedback,根据城市道路数据集JRD中相关路段的起始点 经炜度坐标值和地点信息分别以不同的方式在地图中进行实时可视化显示。2. 根据权利要求1所述的一种微博舆情与城市路况相映射的交通平行方法,其特征在 于,步骤三中,JMB采用向量形式表达,具体如下: JMB_original = (Publisher, PTime, Content, Ptemi,Cnt_forward,Cnt_ comment, Cnt_like, Cnt_pic, Plocation, Emoticon),其中 Publisher为该条微博的发布者,同时会采集相关属性,包括账号类型Publisher_ type、博主名称 Publisher_name、博主所在地 Publisher_city、博主粉丝数 Publisher_ fanscnt ; T_publish为本条微博发布时间; Content为本条微博文本内容; Ptemi为本条微博发布客户端; Cnt_forward为本条微博转发数,且Cnt_forw
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1