一种微博舆情与城市路况相映射的交通平行方法

文档序号:9750845阅读:400来源:国知局
一种微博舆情与城市路况相映射的交通平行方法
【技术领域】
[0001] 本发明涉及本发明属于互联网数据处理技术领域,具体地,涉及一种微博舆情与 城市路况相映射的交通平行方法。
【背景技术】
[0002] 目前主要的交通数据采集技术包括固定式传感器采集、浮动车采集以及移动感知 采集。固定式传感器技术利用安装在道路上或铺设再道路中的传感器节点组成传感器网络 对交通数据进行定点采集,但一般存在对安装场所和环境的依赖,面临初期投资巨大、生命 周期短、维护成本高等问题。浮动车技术主要利用再路网中行驶的浮动车(出租车、自行车 等)采集自身行驶时的GPS估计数据并上传到服务器。但也存在投入大,缺乏其他种类车 辆的数据以及出租车等的行驶数据并不一定能反映真是路况等问题。随着移动互联网和移 动智能手持设备的普及,基于众包的移动感知技术被随之提出。目前,国内外对基础移动感 知技术对路况数据提取的研究,主要集中再基于手机网络定位技术以及基于终端传感器定 位技术的实时交通信息提取研究。两种技术也分别存在网络定位精度低、采集频率不固定 以及人为触发和监控导致用户感知负担增加等问题。
[0003] 随着互联网的不断发展,使得以在线社区、博客、微博、社交网站、视频共享网站等 为代表的社会媒体迅速普及,网民的互动参与,使网络空间变得与物理"真实世界"逐渐趋 于一致。由于社会媒体发布信息的易用性和时效性极高,使得人们发布共享各类信息变得 无比便捷。如在2012年伦敦奥运会时,伦敦交通局就发布了一款叫做Tube Star的应用, 它通过监测乘客在Twitter所发布的消息,及时获取到了大量用户乘坐公共交通旅行时的 感受和情况,例如哪里交通拥挤,哪里发生交通事故等。当前网络已经成为大众反应问题, 反应诉求的一个重要窗口,通过浏览互联网不难发现,其中充斥着大量对交通管理工作中 出现的问题的投诉和建议。其中微博平台由于其参与人数多、更新速度快、用户分布广等特 点,存在大量用户实时发布的交通信息,包括对交通事故的现场描述、交通拥堵的评价、交 通设施的问题反馈等各类信息。如何及时获取这些信息,正确处理后进行交通主题分类,并 从中分析抽取相关地理位置信息并计算相关指数,通过有效的可视化方法进行展示,实现 从微博舆情到交通问题映射,进而辅助相关交通管理部门在传统数据采集方法之外对相关 路况等数据的补充验证等,也是当前交通数据采集急需解决的一个问题。

【发明内容】

[0004] 为了解决上述问题,本发明提供一种微博舆情与城市路况相映射的交通平行方 法,其具体的技术方案如下:
[0005] -种微博舆情与城市路况相映射的交通平行方法,该方法包括以下步骤:
[0006] 步骤一、根据设定城市中各路段名称、路段级别、交叉路集、两侧建筑物集、路段起 点经炜度坐标、路段终点经炜度坐标建立城立路段数据集JRD ;
[0007] 步骤二、实时采集设定的城市交通信息主题相关的微博,根据主题相关和时间窗 口范围判断其有效性,对于一条有效的微博记作JMB ;
[0008] 步骤三、对于每一条JMB,建立其原始数据集,抽取其原始属性,记作JMB_ original ;
[0009] 步骤四、对原始数据集进行处理抽取,建立与原始数据集形成映射的属性集,记 作:JMB_processed ;
[0010] 步骤五、自定义时间窗口,建立自定义时间窗口内的交通主题数据集J⑶;其中 事故类数据集记为Set_accident,拥堵类数据集记为Set_jam,反馈类数据集记为Set_ feedback ;对于每条微博信息JMB,根据其所属路段与交通主题类别加入对应的自定义时 间窗口内的数据集中;对于Set_accident与Set_feedback,实时信息动态更新;对于Set_ jam,更新所属路段的拥堵指数;
[0011] 步骤六、对JMB_processed中的部分属性信息,以及更新后的三类交通主题数据 集Set_accident,Set_jam以及Set_feedback,根据城市道路数据集JRD中相关路段的起 始点经炜度坐标值和地点信息分别以不同的方式在地图中进行实时可视化显示。
[0012] 进一步,步骤三中,JMB采用向量形式表达,具体如下:
[0013] JMB_original = (Publisher, PTime, Content, Ptemi, Cnt_forward, Cnt_ comment, Cnt_like, Cnt_pic, Plocation, Emoticon),其中
[0014] Publisher为该条微博的发布者,同时会采集相关属性,包括账号类型 Publisher_type、博主名称 Publisher_name、博主所在地 Publisher_city、博主粉丝数 Publisher_fanscnt ;
[0015] T_publish为本条微博发布时间;
[0016] Content为本条微博文本内容;
[0017] Ptemi为本条微博发布客户端;
[0018] Cnt_forward 为本条微博转发数,且 Cnt_forward 多 0 ;
[0019] Cnt_comment 为本条微博评论数,且 Cnt_comment 多 0 ;
[0020] Cnt_like为本条微博点赞数,且Cnt_like彡0 ;
[0021] Cnt_pic为本条微博包含的图片数,且Cnt_pic彡0 ;
[0022] Plocation为本条微博包含的发布地点;
[0023] Emoticon为本条微博包含的表情符号;
[0024] 进一步,步骤四中,JMB_processed的具体表达形式如下:
[0025] JMB_processed = (Category, Road_name, Road_type, Location_name, Location_ type, Index_emotion, Target, Index_reliability, Index_inf luence),其中
[0026] Category为本条微博JMB的所属交通主题类别,其取值为交通分类数据集中包含 的类别,取值范围为[交通事故、交通拥堵与交通反馈];
[0027] Road_name为本条微博包含的城市路段名称,取值范围为对应城市交通道路数据 集中的道路;
[0028] Road_type为本条微博包含的城市路段名称,取值范围为对应城市交通道路数据 集中的道路级别;
[0029] Location_name为本条微博包含的具体地理位置名称;
[0030] Location_type为本条微博包含的具体地理位置类别,取值范围为1代表道路交 叉口,2代表道路旁的建筑物;
[0031] Target为交通反馈类微博反馈的交通主题,取值范围为[信号灯、交通标线、交通 标志、交通护栏、监控设备];
[0032] Index_emotion为本条微博的情感度得分,取值范围为整数集Z ;
[0033] Index_reliability 为本条微博的可信度得分,且 Index_reliability 多 0 ;
[0034] Index_importance 为本条微博的重要度得分,且 Index_importance 多 0〇
[0035] 进一步,步骤四中,JMB_processed的属性信息按如下方式取得:
[0036] S1,判定分类:对于实时采集的一条有效微博JMB,根据对其文本内容进行自然语 言分词后的词组以及构建的城市交通主题分类数据集JCD判定其所属的交通主题类别,设 定 JMB_processed 中的 Category。
[0037] S2,地理信息抽取:对于每条微博信息JMB,根据其基础属性集合JMB_original中 的相关字段以及构建的城市道路数据集JRD,抽取其地理位置信息,包括所属路段、交叉口 等,设定 JMB_processed 中的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1