一种消息传播路径提取方法及其系统的制作方法

文档序号:6552209阅读:148来源:国知局
一种消息传播路径提取方法及其系统的制作方法
【专利摘要】本发明提供一种消息传播路径提取方法及其系统,方法包括获取传播数据,统计除原始传播节点外的传播数据的层级;对传播数据中的传播节点进行分析,分析包括:分析得到单个传播节点的所属层级和与单个传播节点连接的上一层级的传播节点;标记单个传播节点在所属层级的传播次数加1,标记与单个传播节点连接的上一层级的传播节点的传播次数加1,标记已分析的传播节点;统计各层级及各层级中各传播节点的传播次数;统计除原始传播节点外的所有传播节点的个数,得到原始传播节点的总传播次数;构建消息路径树形结构,提取所需传播节点。提供一种能通过对消息传播节点及路径进行分析后整合得到路径结构图,获取关键传播节点及传播效果的方法及其系统。
【专利说明】一种消息传播路径提取方法及其系统

【技术领域】
[0001] 本发明涉及信息网络领域,具体说的是一种消息传播路径提取方法及其系统。

【背景技术】
[0002] 如今的互联网社交已经成为人们生活中必不可缺少的一部分,人们每一天都要好 几次登陆社交网站浏览大量的信息,不断的浏览、转发、评论,这种社交网站的消息传播方 式既可以有利的传播有价值的信息,同时也会捎带传播不利的垃圾信息,于是管理层有必 要能通过传播的路径分析传播的消息的价值,及时的制止垃圾信息的传播,并且能掌握发 布垃圾信息的源头,了解消息传播中有价值的数据。目前准对社交网站的消息传播,都只能 展示消息传播的次数,而不能针对传播的路径进行分析,识别出关键传播用户以及传播的 效果,没办法获取消息传播的有价值的分析数据。


【发明内容】

[0003] 本发明所要解决的技术问题是:克服现有技术无法对消息传播的节点及路径进行 分析,辨别并获取关键传播节点和传播效果的不足,提供一种能通过对消息传播节点及路 径进行分析后整合得到路径结构图,获取关键传播节点及传播效果的方法及其系统。
[0004] 为了解决上述技术问题,本发明采用的技术方案为:
[0005] -种消息传播路径提取方法,包括:
[0006] S100 :获取传播数据,统计除原始传播节点外的传播数据的层级;
[0007] S200 :对传播数据中的传播节点进行分析,分析包括:
[0008] S201 :分析得到单个传播节点的所属层级和与所述单个传播节点连接的上一层级 的传播节点;
[0009] S202 :标记单个传播节点在所属层级的传播次数加1,标记与所述单个传播节点 连接的上一层级的传播节点的传播次数加1,标记已分析的传播节点;
[0010] S300 :统计各层级及各层级中各传播节点的传播次数;
[0011] S400:统计除原始传播节点外的所有传播节点的个数,得到原始传播节点的总传 播次数;
[0012] S500 :构建消息路径树形结构,提取所需传播节点。
[0013] 本发明提供的另一个技术方案为:
[0014] 一种消息传播路径提取系统,包括依次连接的获取模块、分析模块、整合模块和统 计模块,所述分析模块包括依次连接的第一分析单元和标记单元;
[0015] 所述获取模块,用于获取传播数据;
[0016] 所述分析模块,用于对传播数据中的传播节点进行分析;
[0017] 所述第一分析单元,用于分析得到单个传播节点的所属层级和与所述单个传播节 点连接的上一层级的传播节点;
[0018] 所述标记单元,用于标记单个传播节点在所属层级的传播次数加1,标记与所述单 个传播节点连接的上一层级的传播节点的传播次数加1,标记已分析的传播节点;
[0019] 所述整合模块,构建消息路径树形结构,提取所需传播节点;
[0020] 所述统计模块,用于统计除原始传播节点外的传播数据的层级,统计各层级及各 层级中各传播节点的传播次数和统计除原始传播节点外的所有传播节点的个数,得到原始 传播节点的总传播次数。
[0021] 本发明的有益效果在于:通过对传播数据中的每个传播节点依次进行分析,标记 所分析的传播节点所在层级的传播次数及与其连接的上一层级的传播节点各加1,循环标 记每一个传播节点后进行统计得到标记有各个节点及层级传播次数的消息路径树形结构 图,通过树形结构图便可一目了然的知晓关键的传播节点及传播路径,进而轻易便可获取 消息传播的中有价值的传播节点,了解其带来的传播效果,使得对消息传播数据的分析更 加的方便快捷。

【专利附图】

【附图说明】
[0022] 图1为本发明实施例一种消息传播路径提取方法的流程示意图;
[0023] 图2为本发明实施例一种消息传播路径提取系统的结构示意图;
[0024] 图3为本发明实施例一种消息传播路径提取方法的流程框图;
[0025] 图4为本发明实施例一种消息传播路径提取系统的结构图;
[0026] 图5为本发明实施例一种消息传播路径提取方法得到的消息路径树形结构图。
[0027] 标号说明:
[0028] 10-获取模块; 20-分析模块; 21-第一分析单元;
[0029] 22-标记单元; 30-整合模块; 40-统计模块;
[0030] 50-判断模块; 11-分批获取单元; 12-读取单元。

【具体实施方式】
[0031] 为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式 并配合附图详予说明。
[0032] 本发明最关键的构思在于:通过依次分析获取到的传播数据中每一个传播节点, 标记并统计每个层级及每个传播节点的传播次数,整合后构建出消息路径树形结构图,能 够一目了然的识别关键传播节点及传播效果,轻易获取所需传播节点。
[0033] 请参阅图1所示,本发明提供一种消息传播路径提取方法,包括:
[0034] S100 :获取传播数据,统计除原始传播节点外的传播数据的层级;
[0035] S200 :对传播数据中的传播节点进行分析,分析包括:
[0036] S201 :分析得到单个传播节点的所属层级和与所述单个传播节点连接的上一层级 的传播节点;
[0037] S202 :标记单个传播节点在所属层级的传播次数加1,标记与所述单个传播节点 连接的上一层级的传播节点的传播次数加1,标记已分析的传播节点;
[0038] S300 :统计各层级及各层级中各传播节点的传播次数;
[0039] S400:统计除原始传播节点外的所有传播节点的个数,得到原始传播节点的总传 播次数;
[0040] S500 :构建消息路径树形结构,提取所需传播节点。
[0041] 从上述描述可知,本发明的有益效果在于:通过对传播数据中的每个传播节点依 次进行分析,标记所分析的传播节点所在层级的传播次数及与其连接的上一层级的传播节 点各加1,循环标记每一个传播节点后进行统计得到标记有各个节点及层级传播次数的消 息路径树形结构图,通过树形结构图便可一目了然的知晓关键的传播节点及传播路径,进 而获取消息传播的中有价值的传播节点,了解其带来的传播效果。
[0042] 需要说明的是,在获取传播数据并统计传播数据的层级,分析传播数据中的单个 传播节点的过程中,分析单个传播节点可以是直接将所有的未经过特殊排列处理的传播数 据按照按原始顺序一一进行分析,也可以是直接从中抽取传播节点进行分析,分析单个传 播节点的顺序并不局限于以上几种,优选的,还可以按照传播数据的传播时间逆顺序进行 分析,或者从传播数据层级的最底层开始进行分析,由于已经分析过的传播节点将会得到 标记,因此不会存在重复分析的现象,且保证每一个传播节点都得到分析。
[0043] 在对直接传播原始传播节点的下一层级的传播节点进行标记的时候,由于该传播 节点所在的层级已是最高层级,便分析不到原始传播节点,于是只对该传播节点所在的层 级的传播次数进行累加。
[0044] 请参阅图3所述,为本发明实施例一种消息传播路径提取方法的流程框图。
[0045] 进一步的,所述步骤S200之后包括:
[0046] S301 :判断是否还存在未分析的传播节点;
[0047] 若是,则返回步骤S200 ;
[0048] 若否,则执行步骤S300。
[0049] 通过判断是否还存在未分析的传播节点,保证获取到的传播数据中的每一个传播 节点都得到分析,保证分析得到的消息路径树形结构图更加的准确。
[0050] 进一步的,步骤S100还包括:
[0051] S101 :分批获取各个接口的传播数据;
[0052] S102:整合全部的传播数据后循环读取每一条传播数据,标记已经读取的传播数 据。
[0053] 本实施方式中包括分批获取各个接口的传播数据,并对传播数据进行整合,由于 社交网站消息数据传播的范围路径很广,很难从一个接口便获取到足以得到相对准确分析 结果的传播数据,于是通过分批获取的方式从社交网站的服务器中获取消息的传播数据并 进行整合,能够保证最终分析得到的结果更加的准确。
[0054] 本发明提供另一个技术方法:
[0055] 请参阅图2,为本发明实施例一种消息传播路径提取系统的结构框图。
[0056] -种消息路径提取系统,包括依次连接的获取模块10、分析模块20、整合模块30 和统计模块40,所述分析模块20包括依次连接的第一分析单元21和标记单元22 ;
[0057] 所述获取模块10,用于获取传播数据;
[0058] 所述分析模块20,用于对传播数据中的传播节点进行分析;
[0059] 所述第一分析单元21,用于分析得到单个传播节点的所属层级和与所述单个传播 节点连接的上一层级的传播节点;
[0060] 所述标记单元22,用于标记单个传播节点在所属层级的传播次数加1,标记与所 述单个传播节点连接的上一层级的传播节点的传播次数加1,标记已分析的传播节点;
[0061] 所述整合模块30,构建消息路径树形结构,提取所需传播节点;
[0062] 所述统计模块40,用于统计除原始传播节点外的传播数据的层级,统计各层级及 各层级中各传播节点的传播次数和统计除原始传播节点外的所有传播节点的个数,得到原 始传播节点的总传播次数。
[0063] 从上述描述可知,本发明的有益效果在于:通过分析模块20对传播数据进行分 析,分离出每个传播节点的所属层级及与其连接的上一层级的传播节点,并进行标记累加, 最终通过统计模块40对所有层级及所有传播节点的传播数据进行统计,通过整合模块30 构建消息路径树形结构,便能从消息路径树形结构图中清楚的辨识并提取出关键的传播节 点、传播路径及其带来的传播效果,知晓消息传播过程中有价值的传播节点,对数据的分 析,后续运行操作提供有价值的依据。
[0064] 请参阅图4,为本发明实施例一种消息传播路径提取系统的结构图。
[0065] 进一步的,所述消息路径提取系统还包括判断模块50,所述判断模块50分别连接 所述分析模块20和整合模块30 ;
[0066] 所述判断模块50,用于判断是否还存在未分析的传播节点;若是,则调动所述数 据分析模块20 ;若否,则调动所述整合模块30。
[0067] 通过判断模块50对获取到的传播数据进行判断,若发现还有未进行分析的传播 节点则继续对未分析的传播节点进行分析,若所有传播数据中的传播节点都已进行分析, 则直接转入后续的整合模块30,通过判断便能保证获取到的所有传播数据都得到分析,保 证最终整合构建的消息路径树形结构图能够体现所有传播数据的分析结果。
[0068] 进一步的,所述获取模块10包括分批获取单元11和读取单元12,所述分批获取单 元11连接所述读取单元12,所述读取单元12连接所述分析单元;
[0069] 所述分批获取单元11,用于分批获取各个接口的传播数据;
[0070] 所述读取单元12,整合全部的传播数据后循环读取每一条传播数据,标记已经读 取的传播数据。
[0071 ] 本实施方式中包括分批获取各个接口的传播数据的分批获取单元11,及对传播数 据进行整合的读取单元12,由于社交网站消息数据传播的范围路径很广,很难从一个接口 便获取到足以得到相对准确分析结果的传播数据,于是通过分批获取的方式从社交网站的 服务器中获取消息的传播数据并进行整合,能够保证最终分析得到的结果更加的准确。 [0072] 下面就上述方案提供一个示例,请参阅图5,为本发明实施例一种消息传播路径提 取方法得到的消息路径树形结构图。
[0073] 一种消息传播路径提取方法:
[0074] 原始微博:
[0075] @001 :我发的原始微博
[0076] 原始微博被转发过程:
[0077] 1、@031:转发微博//@021:转发微博//@011:转发微博
[0078] 2、@032:转发微博//@021:转发微博//@011:转发微博
[0079] 3、@033:转发微博//@021:转发微博//@011:转发微博
[0080] 4、@021:转发微博//@011:转发微博
[0081] 5、@022:转发微博//@011:转发微博
[0082] 6、@023:转发微博//@012:转发微博
[0083] 7、@011:转发微博
[0084] 8、@012:转发微博
[0085] 9、@013:转发微博
[0086] 获取上述原始微博的消息转发传播数据,统计传播数据的层级,除去原始微博用 户的层级得到共三个层级,按照被转发的路径进行排序,@〇11、@〇12和@013处于第一层级, @023、@022和@021处于第二层级,@031、@032和@033处于第三层级。从传播数据的最低 层级开始对传播数据中的传播节点,即转发用户开始分析,分离得到转发用户所在层级和 转发用户转发的上一层级中的被转发用户,具体的分析过程:
[0087] 第一条转发微博:
[0088] 转发用户为@031
[0089] (1)第三层转发加1,总数为1
[0090] ⑵第二层的@021的转发次数加1,总数为1
[0091] 第二条转发微博:
[0092] 转发用户为@032
[0093] (1)第三层转发加1,总数为2
[0094] (2)第二层的@021的转发次数加1,总数为2
[0095] 第三条转发微博:
[0096] 转发用户为@033
[0097] (1)第三层转发加1,总数为3
[0098] (2)第二层的@021的转发次数加1,总数为3
[0099] 第四条转发微博:
[0100] 转发用户为@021
[0101] (1)第二层转发加1,总数为1
[0102] (2)第一层的@011的转发次数加1,总数为1
[0103] 第五条转发微博:
[0104] 转发用户为@022
[0105] (1)第二层转发加1,总数为2
[0106] (2)第一层的@011的转发次数加1,总数为2
[0107] 第六条转发微博:
[0108] 转发用户为@023
[0109] (1)第二层转发加1,总数为3
[0110] (2)第一层的@012的转发次数加1,总数为1
[0111] 第七条转发微博:
[0112] 转发用户为@011
[0113] (1)第一层转发加1,总数为1
[0114] 第八条转发微博:
[0115] 转发用户为@012
[0116] (1)第一层转发加1,总数为2
[0117] 第九条转发微博:
[0118] 转发用户为@013
[0119] (1)第一层转发加1,总数为3
[0120] 统计三个层级及三个层级中各个传播节点(即转发用户)的传播次数,统计除原 始微博用户外的所有转发用户的总转发次数,得到原始微博用户的总传播次数为9。
[0121] 构建消息路径树形结构如图5,通过如图中数据便可轻易的提取所需的关键微博 用户,了解其消息传播的路径。
[0122] 综上所述,本发明提供的一种消息路径提取方法及其系统,通过分析传播数据中 每个传播节点,并对每个传播节点的传播路径进行标记,从而统计得到传播数据中每个传 播节点的传播次数及其传播路径,最终构建出消息路径树形结构图。传播数据的分析不仅 分批获取并整合各个接口的传播数据,还能判断是否所有的传播节点都得到分析,保证了 所有传播数据中的传播都能得到分析统计,提高最终分析结果的准确性,用户能够通过消 息路径树形结构图中轻易的识别关键的传播节点及传播效果,提取有价值的传播节点,为 后续运行操作提供有价值的依据。
[0123] 以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发 明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技 术领域,均同理包括在本发明的专利保护范围内。
【权利要求】
1. 一种消息传播路径提取方法,其特征在于,包括: 5100 :获取传播数据,统计除原始传播节点外的传播数据的层级; 5200 :对传播数据中的传播节点进行分析,分析包括: 5201 :分析得到单个传播节点的所属层级和与所述单个传播节点连接的上一层级的传 播节点; 5202 :标记单个传播节点在所属层级的传播次数加1,标记与所述单个传播节点连接 的上一层级的传播节点的传播次数加1,标记已分析的传播节点; S300 :统计各层级及各层级中各传播节点的传播次数; S400:统计除原始传播节点外的所有传播节点的个数,得到原始传播节点的总传播次 数; S500 :构建消息路径树形结构,提取所需传播节点。
2. 根据权利要求1所述的一种消息传播路径提取方法,其特征在于,所述步骤S200之 后包括: S210 :判断是否还存在未分析的传播节点; 若是,则返回步骤S200 ; 若否,则执行步骤S300。
3. 根据权利要求1所述的一种消息传播路径提取方法,其特征在于,步骤S100还包 括: 5101 :分批获取各个接口的传播数据; 5102 :整合全部的传播数据后循环读取每一条传播数据,标记已经读取的传播数据。
4. 一种消息传播路径提取系统,其特征在于,包括依次连接的获取模块、分析模块、整 合模块和统计模块,所述分析模块包括依次连接的第一分析单元和标记单元; 所述获取模块,用于获取传播数据; 所述分析模块,用于对传播数据中的传播节点进行分析; 所述第一分析单元,用于分析得到单个传播节点的所属层级和与所述单个传播节点连 接的上一层级的传播节点; 所述标记单元,用于标记单个传播节点在所属层级的传播次数加1,标记与所述单个传 播节点连接的上一层级的传播节点的传播次数加1,标记已分析的传播节点; 所述整合模块,构建消息路径树形结构,提取所需传播节点; 所述统计模块,用于统计除原始传播节点外的传播数据的层级,统计各层级及各层级 中各传播节点的传播次数和统计除原始传播节点外的所有传播节点的总传播次数,得到原 始传播节点的总传播次数。
5. 根据权利要求4所述的一种消息传播路径提取系统,其特征在于,还包括判断模块, 所述判断模块分别连接所述分析模块和整合模块; 所述判断模块,用于判断是否还存在未分析的传播节点;若是,则调动所述数据分析模 块;若否,则调动所述整合模块。
6. 根据权利要求4所述的一种消息传播路径提取系统,其特征在于,所述获取模块包 括分批获取单元和读取单元,所述分批获取单元连接所述读取单元,所述读取单元连接所 述分析单元; 所述分批获取单元,用于分批获取各个接口的传播数据; 所述读取单元,整合全部的传播数据后循环读取每一条传播数据,标记已经读取的传 播数据。
【文档编号】G06F17/30GK104092598SQ201410315583
【公开日】2014年10月8日 申请日期:2014年7月3日 优先权日:2014年7月3日
【发明者】钟添森, 张立, 赖润星 申请人:厦门欣欣信息有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1