基于3d模型的微博数据处理可视化系统的制作方法

文档序号:6499008阅读:110来源:国知局
基于3d模型的微博数据处理可视化系统的制作方法
【专利摘要】本发明提供了一款用3D视图对微博上的海量数据进行可视化展示的应用系统。该应用将微博上的各类消息进行分类,采用了版块显示方法,提高了信息浏览效率;数据信息以人为中心显示,方便寻找活跃用户;对事件的转发情况进行分析,并将其用三维视图展示出来,可以看到事件的传播情况和数据。应用初始化用户时进行用户分析,取得可用于进行用户确定的特征数据;对不同类别的用户提供不同类别的服务。该应用能够保证获取微博数据的完整性和实时性,并能进行自适应的调整,以适应网络数据的变化。
【专利说明】基于3D模型的微博数据处理可视化系统
【技术领域】
[0001]本发明涉及数据可视化处理,尤其涉及微博客环境中的数据基于3D的可视化显
/Jn ο
【背景技术】
[0002]微博即微型博客(MicroBlog),是一种基于用户关系的信息分享、传播以及获取平台,用户可以通过万维网(Web)、无线应用通信协议(WAP, WirelessApplication Protocol)以及各种客户端组件个人社区,以140字左右的文字更新信息,并实现即时分享。微博的用户可以将自己看到的、听到的、想到的事情写成短文,通过电脑或者移动终端随时随地分享给好友。好友可以第一时间看到该用户发表的信息,并随时与该用户展开讨论。
[0003]微博的实时性很强,微博可实时被刷新,用户可阅览到其关注或收听的用户的最新微博。微博的互动性也很强,用户可对其它用户的微博进行即时的评论、转发、引用等。因而,用户的微博的刷新速度比较快,用户接收的新微博的数量也较多。
[0004]传统的微博显示方法,一般将所有微博按照微博发布时间排序进行展示。展示的微博中很可能有发布内容重复的微博,因为用户发布的微博有可能是用户转发或引用他人的微博,因此不可避免的造成有可能显示发布内容重复的微博的问题。并且由于消息按发布时间来显示,没有条理性,不利于分类阅读。
[0005]微博客作为一种新型的社交网络,有其自身的独特特点,这些特点帮助微博客快速发展的同时也为数据处理增加了困难:微博单条信息不足140字,但频繁更新;消息数量巨大,但包含许多广告及重复信息;用户类型数量巨大,但大部分消息由少部分活跃用户产生;用户之间为单向联系,关系极具跳跃性,不能用一般社交网络的关系模型准确描述。
[0006]面对微博客的这些特点,现有的在整个因特网和传统社交网络的数据可视化显示方式在应用到微博时存在以下限制:
第一,传统可视化工具在用户体验和操作流畅性方面还表现得不够好,界面的工具太多,使得用户需要一段的时间来学习使用,其学习成本相对较高
第二,传统的微博可视化工具没有使用时间轴,无法看到消息传播的变化及每位用户的信息。
[0007]另外,在一些可视化工具中用户信息重叠问题很严重,极大地妨碍了信息的浏览,同时,视图的放大交互效果反应时间在5iTlOS之间,这对于浏览信息来说反应速度是不可接受的,这些问题极大地影响了用户浏览信息的效率与用户体验。

【发明内容】

[0008]因此,本发明的目的在于克服上述现有技术的缺陷,提供一种基于3D的微博数据可视化应用系统,对大规模微博客用户的数据进行高效、实时、完整的处理显示。
[0009]本发明提供了一种用3D视图对微博上的海量数据进行可视化展示的应用系统,该系统包括:
A读取初始的用户数据;
B从用户数据中提取用户特征;
C对用户微博上的数据信息进行分类去重处理;
D对不同的消息显示转发关系及消息分析结果。
[0010]上述微博3D可视化系统中,还包括步骤E定期地从经步骤A刷新用户数据提取消息,并进行消息分析。
[0011]上述微博3D可视化系统中,用户特征可以包括:账户注册时间和最近登录微博客时间;关注数量与被关注数量;发送、转发和评论的消息的数量;发送的消息被评论和转发的数量。
[0012]上述微博3D可视化系统中,步骤C可以包括以下步骤:
将其关注数量大于被关注数量、并且关注数量与被关注数量的差值的绝对值超过初始分类闽值的用户的类型确定为企业用户;
将其关注数量小于被关注数量、并且关注数量与被关注数量的差值的绝对值超过初始分类闽值的用户的类型确定为个人用户。
[0013]上述微博3D可视化系统中,步骤C还包括:将重复信息过滤,并保留原作者;在将消息分类的基础上筛出广告。
[0014]上述微博3D可视化系统中,步骤D还包括微博站内热词监控及分析,对微博上的热点内容进行实时监控,提供一个可以参考的数值,用来对热点词汇和热点事件进行量化和比较。
[0015]上述微博3D可视化系统中,对于企业用户特别提供 舆情监控:微博帐号及站内负面监控;
竞争分析:能够识别出特定的账号,如用户竞争对手,并能够跟踪其在特定事件中的动
态;
效果分析:评测微博对品牌提升和销售增长的影响。系统能够动态地显示出一条微博的传播过程,并且直观地显示一个事件的影响力大小。
[0016]上述微博3D可视化系统中,步骤C对于不同消息的分类采取3D模版方式可视化处理,其特征在于,所述的各种处理包括:
首先将位于数据库表或其他存储媒介中的海量原始数据按照类别进行重建成不同版块,其中每条原始数据记录相当于版块的一个点;然后在此基础上把每个关注用户螺旋状显示分布在中央,与其发布的消息进行连线。
[0017]上述微博3D可视化系统中,关注用户显示的大小与发布消息的数量成正比。
[0018]上述微博3D可视化系统中,对所采集的消息进行分类,以不同的颜色代表不同的消息类别。
[0019]上述微博3D可视化系统中,步骤D采用3D球状模型及时间轴显示消息转发情况。中心的球代表某个事件的起源微博,该球面上的所有点代表直接转发这条微博的用户。连线表示转发关系,一条连线表示一次二次或多次转发,其中靠近球面的是被转发者,远离球面的是转发者,后者是通过前者来转发起源微博而不是直接转发起源微博的。从球面向外,转发链的长度增加,转发深度依次加深。[0020]上述微博3D可视化系统中,某个点上的连线越多,表示该用户的微博被转发的次数越多,说明该用户在该事件的传播中起到的推动作用越大。
[0021]上述微博3D可视化系统中,其中时间轴是用来在一定程度上操控模型,对应的时间是从该事件开始到当前时间所经历的时间。最上方的是该事件开始的时间,最下方表示当前事件。
【专利附图】

【附图说明】
[0022]以下参照附图对本发明实施例作进一步说明。
[0023]图1为根据本发明实施例的微博数据分类3D模版示意图。
[0024]图2为根据本发明实施例的对于特定事件转发情况的3D球状示意图。
[0025]图3为根据本发明实施例的系统类图;
【具体实施方式】
[0026]为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0027]为了更好地理解本发明,首先对微博进行简单介绍。微博,即微博客,是一种基于用户关系的信息分享、传播以及获取平台。微博的消息非常短,不超过140字。微博发展了一种称为“追随”的社交关系,微博用户可以任意关注感兴趣的用户而不需要获得对方的许可。微博用户发布的所有消息都会广播给他所有的“粉丝”。最早也是最著名的微博系统是美国的Twitter,根据公开的数据目前Twitter有超过2亿的活跃用户;在国内,新浪微博和腾讯微博是最热门的微博系统。微博的盛行,给互联网带来更丰富的信息资源,微博不仅是社交网络,更成为一种传播媒体。对微博提供检索,已经在商业、政治等领域具有重要意义。
[0028]微博客所提供的基本功能包括:用户功能、消息功能、群组功能和批量采集功能。用户功能包含关注、被关注。消息功能有发送、评论、转发。群组功能包括建立群组,加入多个用户进行同时关注。
[0029]图1为根据本发明的一个实施例的微博数据进行分类所得到的模块化3D示意图。更具体地,该系统主要包括下列步骤。
[0030]步骤A,读取初始的用户数据。
[0031]该系统用新浪微博的账号登录并经过新浪的授权,读取用户数据并对这些数据进行处理及3D可视化显示操作。其中,初始的用户数据可以包括用户的基本信息,用户的朋友关系,用户发送、转发、评论的消息数量,用户在给定的一段时间内发送的消息被转发和评论的次数等信息。可以将读取到的数据存储在日志服务器。
[0032]步骤B,提取用户特征。
[0033]从所读取的用户数据中提取用户特征。例如,分析用户的个人信息,提取其中诸如所在地、兴趣等能反映其关注领域的特征;分析用户的朋友(关注)关系,提取其朋友(关注)的职业等分布特征,判断用户的关注领域;分析用户消息,提取发送、转发和评论的数目、内容特征,发送、转发和评论的对象特征等。在一个实施例中,可以将对应于每个用户的特征保存到特征数据库。用户特征例如可以包括注册时间、最近一次访问时间、发送消息数目、收到的转发和回复数目、关注数量、被关注数量等属性。
[0034]步骤C,对用户微博上的数据信息进行分类去重处理。
[0035]根据所提取出的数据消息依照类别进行分类,将位于数据库表或其他存储媒介中的海量原始数据按照用户需要的进行重构分类,其中每条原始数据记录相当于3D模型版块上的一个点。
[0036]从服务器端接收微博,所述微博中包括发布者名称、发布时间和微博正文;判断所述微博中是否有微博正文内容或微博正文引用的内容相同的条目,若是,显示所述内容相同的条目中的一条,将其它条目隐藏。
[0037]如图1所示,模型可视化展示的内容分为消息与好友。模型中心的螺旋形上的每个点代表一个好友,这些代表好友的点上的连线是与其发的微博相连的;模型外围的每种颜色的矩形代表一类消息,矩形上的每个点代表一条消息,其中实心点代表原创微博,空心点则代表转发的微博,点与点之间的连线表示转发关系。
[0038]代表好友的点的大小代表该好友的活跃程度,这与和它相连的线的多少又是对应的,连线的增多,表示更新微博越多,其代表该好友的点越大。当点击经过某个好友时,可以看到该好友的相关信息,同时与该好友相连的线和微博都会高亮,其信息和其所发的全部消息会显示出来。
[0039]模型外围的每种颜色的矩形代表一类消息,其中红色对应生活类微博,绿色对应广告,黄色对应商政类微博,橙色对应科技类微博,紫色对应情感类微博,蓝色对应除以上五种微博外的其它微博。
[0040]模型外围矩形上的每个点与其发布者相连,实心圆点连着微博原创者,空心圆点连着转发者。模型外围的某个颜色的矩形越多,表示这一类消息越多,点击消息进行查看,消息框中有小箭头表示这类消息不止一条,可以切换浏览,双击视角切换到模型中间时,点击任何一个点来浏览该条消息包括原创微博和转发微博。
[0041]步骤D,对不同的消息显示转发关系及消息分析结果。
[0042]事件分析页面的模型如图2所示,其规则如下。
[0043]中心的球代表某个事件的起源微博,该球面上的所有点代表直接转发这条微博的用户。
[0044]连线表示转发关系,一条连线表示一次二次或多次转发,其中靠近球面的是被转发者,远离球面的是转发者,其含义是:后者是通过前者来转发起源微博而不是直接转发起源微博的。
[0045]从球面向外,转发链的长度增加,转发深度依次加深。某个点上的连线越多,表示该用户的微博被转发的次数越多,说明该用户在该事件的传播中起到的推动作用越大。如有几个地方有很多点都连在一个点上,形成了一簇一簇的点,这表示某个人被转发的次数很多。
[0046]如图2所示,在事件模型的右侧有时间轴,时间轴上的某个时间点在页面中心的模型中对应着该事件从开始到该时间的转发情况。时间点默认处于“start”状态,模型上对应的点较少。当拖动时间轴上的红点时,可以看到模型相应的变化。
[0047]模型上的点的数目对应着这条微博从发出到现在的总转发数。连续拖动时间轴,可以看到动态的变化情况。
[0048]拖动时间轴,查看任意一个时间点的转发情况,不需按照时间顺序。除了大致看到数据的大致分布情况,还能够浏览具体的信息。当看到某个较大的事件推动者时,可以点击这个点来查看具体的信息,并可以看到转发情况。由于模型中容纳了五万多个点,想要点击某个具体的用户时,需要将模型放大到一定的程度。
[0049]拖动时间轴时可以看到事件在各个时间段内的热度变化,即转发人数多少。同时可以看到评论当中有效评论在其中所占的比例。可以根据内容将评论分类,看到各类评论的比较和在其中的相对多少。
[0050]若设备支持触摸操作,还可以事件分析模型直接使用触摸的方式进行操作。其中一个手指触摸并滑动可对模型进行旋转,两个手指放在模型上并向相反方向滑动可缩放模型,三个或三个以上的手指可移动模型。
[0051]微博3D可视化系统中消息页面是对好友在某段时间内发的消息的一种统计显示,以浏览消息为主。事件分析页面为对某条微博的转发情况进行分析,用于展示某条微博的转发数据,分析该时间的传播而得出一些结论。
[0052]微博3D可视化系统对微博上的信息按内容进行分类,如广告、话题等,将不同类别的信息进行颜色形态区分显示,便于识别。
[0053]微博3D可视化系统中用转发链表示微博中的转发关系的,链上的人的顺序与实际的转发顺序是一致的。
[0054]微博3D可视化系统中直接转发又称一级转发表示该条微博是转发的且直接转发博主的,中间没有经过其他人。二级转发表示这条微博从原创到获取这条消息之间经过了两次转发,从转发链上来看就是这条链上有三个用户。而多级转发依次类推。
[0055]微博3D可视化系统中采用消息热度描述某段时间内参与该事件的人数多少的,人数越多热度越高,它对应着事件分析模型中点的多少。
[0056]微博3D可视化系统中采用时间轴并将其分为几段:半天、一天、一个星期、两个星期、两个星期以后。表示该微博从发出到当前的时间,由于事件的转发情况在时间上的分布是很不均匀的,时间轴上的时间划分也是如此。拖动时间轴,其模型上的点对应着该微博从发出到当前选择的时间的转发总数。其动态变化就是不同时间段内的热度变化,即转发数增量。
[0057]以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的可视化分析系统来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
【权利要求】
1.一种用3D视图对微博上的海量数据进行可视化展示的应用系统,该系统包括: A.读取初始的用户数据; B.从用户数据中提取用户特征; C.对用户微博上的数据信息进行分类去重处理; D.对不同的消息显示转发关系及消息分析结果。
2.根据权利要求1所述的微博3D可视化系统,还包括步E定期地通过步骤A刷新用户数据提取消息,并进行消息分析。
3.根据权利要求1与2所述的微博3D可视化系统,其中提到的用户特征包括:账户注册时间和最近登录微博客时间;关注数量与被关注数量;发送、转发和评论的消息的数量;发送的消息被评论和转发的数量。
4.根据权利要求1所述的微博3D可视化系统,其中步骤C包括以下步骤:将微博关注数量大于被关注数量、并且关注数量与被关注数量的差值的绝对值超过初始分类闽值的用户的类型确定为企业用户; 将微博关注数量小于被关注数量、并且关注数量与被关注数量的差值的绝对值超过初始分类闽值的用户的类型确定为个人用户。
5.根据权利要求1所述的微博3D可视化系统,其中步骤C还包括:将重复信息过滤,并保留原作者;在将消息分类的基础上筛出广告。
6.根据权利要求1所述的微博3D可视化系统,步骤D.还包括:微博站内热词监控及分析,对微博上的热点内容进行实时监控,提供一个可以参考的数值,用来对热点词汇和热点事件进行量化和比较。
7.根据权利要求1与4所述的微博3D可视化系统,对于企业用户特别提供 舆情监控:微博账号及站内负面监控; 竞争分析:根据所得数据识别出特定的账号,跟踪竞争对手在特定事件中的动态; 效果分析:系统能够动态地显示出微博的传播过程,直观地显示事件的影响力。
8.根据权利要求1所述的微博3D可视化系统,其中步骤C.对于不同消息的分类采取3D模版方式可视化处理,其中各种所涉及到的处理的特征包括: 将位于数据库表或其他存储媒介中的海量原始数据按照类别进行重建成不同颜色版块,其中每条原始数据记录相当于版块的一个点;在此基础上把每个关注用户与其发布消息的数量对应大小螺旋状显示分布在中央,与其发布的消息进行连线。
9.根据权利要求1所述的微博3D可视化系统,其中步骤D采用3D球状模型及时间轴显示消息转发情况;中心的球代表某个事件的起源微博,该球面上的点代表直接转发微博的用户;连线表示转发关系,从球面向外,转发链的长度增加,转发深度依次加深。
10.根据权利要求9所述的微博3D可视化系统,球面点上的连线数表示该用户的微博的被转发数,说明该用户在该事件的传播中起到的作用,时间轴是用来在一定程度上操控模型。
【文档编号】G06F17/30GK103440237SQ201310012475
【公开日】2013年12月11日 申请日期:2013年3月15日 优先权日:2013年3月15日
【发明者】樊小英, 郝向荣, 陈竹心, 肖鹏飞, 孙晓康, 段光英, 蔡恒进 申请人:武汉元宝创意科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1