网络实体热度分析方法及系统的制作方法

文档序号:10624912阅读:637来源:国知局
网络实体热度分析方法及系统的制作方法
【专利摘要】本发明公开了一种网络实体热度分析方法及系统,该方法包括:获取网络实体热度相关信息,所述热度相关信息是指能够体现所述网络实体被用户关注程度的信息;根据所述网络实体热度相关信息构建不同类型网络实体实例间的链接关系图,所述链接关系图中每个节点代表一个网络实体实例;根据所述链接关系图中节点的热度空间值计算节点间的跳转概率,所述热度空间值指将所有网络实体实例的热度值划分到同一空间后,每个网络实体实例的热度值;根据所述跳转概率,计算每个节点的热度值。利用本发明,可以有效提高热度分析结果的可靠性、区分性和准确性。
【专利说明】
网络实体热度分析方法及系统
技术领域
[0001] 本发明设及互联网信息挖掘领域,具体设及一种网络实体热度分析方法及系统。
【背景技术】
[0002] 随着互联网技术的迅速发展,从海量互联网数据中分析获取有价值的信息变成研 究人员研究的热点和难点,网络实体的热度信息作为反映用户关注程度的一个重要指标, 受到越来越多研究人员的关注。现有的网络实体的热度分析方法一般是基于标签的分析方 法,即对网络实体标注不同的标签,通过分析网络实体标签的共现信息来分析计算网络实 体的热度信息。显然,运种方法存在因标签标注不准确而导致热度分析不可靠、不准确的 缺点,例如当一个冷口的网络实体被标注了很多热口标签时,分析出的热度信息肯定是不 可靠的。此外,现有技术中的网络实体一般包括的类型较少,W音乐实体为例,只包括歌曲 及歌手两种类型,因而在构建网络实体实例间的链接关系图时,较容易出现Dead End节点 (该节点与其它节点之间没有链接,Dead End节点一般表示一些较偏的网络实体实例),如 果Dead End节点在关系链接图中出现的较多,容易导致每个节点最终的热度信息区分性 差。此外,现有技术在处理Dead End节点的跳转概率时,使用的是传统的平均概率方法,该 方法容易导致较冷口的网络实体的热度信息比其它热口网络实体的热度信息高。因而,使 用现有热度分析方法得到的热度信息常常出现不可靠、区分性差、不准确等问题,当将该热 度分析结果用到自然语言理解或捜索上时,用户常常得不到想要的答案。

【发明内容】

[0003] 本发明实施例提供一种网络实体热度分析方法及系统,W提高热度分析结果的可 靠性、区分性和准确性。
[0004] 为此,本发明实施例提供如下技术方案: 阳〇化]一种网络实体热度分析方法,包括:
[0006] 获取网络实体热度相关信息,所述热度相关信息是指能够体现所述网络实体被用 户关注程度的信息;
[0007] 根据所述网络实体热度相关信息构建不同类型网络实体实例间的链接关系图,所 述链接关系图中每个节点代表一个网络实体实例;
[000引根据所述链接关系图中节点的热度空间值计算节点间的跳转概率,所述热度空间 值指将所有网络实体实例的热度值划分到同一空间后,每个网络实体实例的热度值;
[0009] 根据所述跳转概率,计算每个节点的热度值。
[0010] 优选地,所述根据所述网络实体热度相关信息构建不同类型网络实体实例间的链 接关系图包括: W11] 确定不同类型网络实体之间重要性关系的假设条件;
[0012] 将不同类型网络实体实例作为关系链接图中的节点,根据所述假设条件及所述网 络实体热度相关信息确定节点之间边的链接情况;
[0013] 生成不同类型网络实体实例间的链接关系图。
[0014] 优选地,所述根据所述链接关系图中节点的热度空间值计算节点间的跳转概率包 括:
[0015] 获取不同类型网络实体实例的初始热度值;
[0016] 对所述初始热度值进行归整,得到归整后的热度值;
[0017] 利用所述归整后的热度值,计算所述链接关系图中每个节点的热度空间值;
[0018] 利用所述节点的热度空间值,计算节点间的跳转概率。
[0019] 优选地,所述初始热度值为所述网络实体实例在网络上的点击量或捜索量。
[0020] 优选地,所述跳转概率包括:有链接的跳转概率、无链接的跳转概率。
[0021] 优选地,所述计算每个节点的热度值包括:
[0022] 将所述节点的跳转概率作为链接关系图中边的权重,W图中任意节点为起点,进 行随机游走,通过迭代方式计算每个节点的热度值。
[0023] 一种网络实体热度分析系统,包括:
[0024] 信息获取模块,用于获取网络实体热度相关信息,所述热度相关信息是指能够体 现所述网络实体被用户关注程度的信息;
[0025] 链接关系图构建模块,用于根据所述网络实体热度相关信息构建不同类型网络实 体实例间的链接关系图,所述链接关系图中每个节点代表一个网络实体实例;
[00%] 跳转概率计算模块,用于根据所述链接关系图中节点的热度空间值计算节点间的 跳转概率,所述热度空间值指将所有网络实体实例的热度值划分到同一空间后,每个网络 实体实例的热度值;
[0027] 热度值计算模块,用于根据所述跳转概率,计算每个节点的热度值。
[0028] 优选地,所述链接关系图构建模块包括:
[0029] 设置单元,用于预先确定不同类型网络实体之间重要性关系的假设条件;
[0030] 确定单元,用于将不同类型网络实体实例作为关系链接图中的节点,根据所述假 设条件及所述网络实体热度相关信息确定节点之间边的链接情况;
[0031] 生成单元,用于生成不同类型网络实体实例间的链接关系图。
[0032] 优选地,所述跳转概率计算模块包括:
[0033] 初始热度值获取单元,用于获取不同类型网络实体实例的初始热度值;
[0034] 归整单元,用于对所述初始热度值进行归整,得到归整后的热度值;
[0035] 热度空间值计算单元,用于利用所述归整后的热度值,计算所述链接关系图中每 个节点的热度空间值;
[0036] 跳转概率计算单元,用于利用所述节点的热度空间值,计算节点间的跳转概率。
[0037] 优选地,所述热度值计算模块,具体用于将所述节点的跳转概率作为链接关系图 中边的权重,W图中任意节点为起点,进行随机游走,通过迭代方式计算每个节点的热度 值。
[0038] 本发明实施例提供的网络实体热度分析方法及系统,通过获取网络实体的热度相 关信息,根据网络实体间重要性关系的假设条件,构建网络实体的链接关系图;然后依据该 链接关系图,计算每个节点的热度空间值及跳转概率。为了防止多次迭代后,其它节点的热 度值被Dead End节点拉低的情况,对于无链接节点的跳转概率,直接使用被跳转节点的热 度空间值作为无链接节点跳转到被跳转节点的跳转概率,即任意节点被随机跳转到的概率 只与该节点的热度空间值有关,从而可W避免一个较冷口的网络实体比热口网络实体的热 度值高的情况;最后根据链接关系图及节点的跳转概率计算节点的热度值,从而得到网络 实体的热度信息,有效地提高了热度分析结果的可靠性、区分性和准确性。
【附图说明】
[0039] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一 些实施例,对于本领域普通技术人员来讲,还可W根据运些附图获得其他的附图。
[0040] 图1是本发明实施例网络实体热度分析方法的流程图;
[0041] 图2是本发明实施例中针对音乐实体实例构建的部分链接关系图;
[0042] 图3是本发明实施例中构建音乐实体实例间链接关系图的流程;
[0043] 图4是本发明实施例网络实体热度分析系统的结构示意图;
[0044] 图5是本发明实施例中跳转概率计算模块的一种结构示意图。
【具体实施方式】
[0045] 为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施 方式对本发明实施例作进一步的详细说明。
[0046] 如图1所示,是本发明实施例网络实体热度分析方法的流程图,包括W下步骤:
[0047] 步骤101,获取网络实体热度相关信息,所述热度相关信息是指能够体现所述网络 实体被用户关注程度的信息。 W48] 比如,可W利用网络爬虫等技术从网站上获取大量网络实体的热度相关信息。所 述热度相关信息主要指能够体现网络实体被用户关注程度的信息,W音乐实体为例,热度 相关信息主要指歌曲所属专辑的信息、歌曲所在歌单的信息、演唱该歌曲的歌手信息、歌曲 在音乐网站上的点击量信息及歌曲的排行榜信息等。
[0049] 步骤102,根据所述网络实体热度相关信息构建不同类型网络实体实例间的链接 关系图,所述链接关系图中每个节点代表一个网络实体实例。
[0050] 具体地,预先确定不同类型网络实体之间重要性关系的假设条件,然后将不同类 型网络实体实例作为关系链接图中的节点,根据所述假设条件及所述网络实体热度相关信 息确定节点之间边的链接情况,从而生成不同类型网络实体实例间的链接关系图。
[0051] 需要说明的是,所述链接关系图中节点之间边的链接是双向的,有重要性关系的 不同类型网络实体实例间使用边链接,确定了各节点之间的边链接,即可确定整个链接关 系图的拓扑结构。如图2所示为针对音乐实体实例构建的部分链接关系图。
[0052] 不同类型网络实体实例间的链接关系图的具体构建过程将在后面详细说明。
[0053] 步骤103,根据所述链接关系图中节点的热度空间值计算节点间的跳转概率,所述 热度空间值指将所有网络实体实例的热度值划分到同一空间后,每个网络实体实例的热度 值。
[0054] 具体地,可W首先获取不同类型网络实体实例的初始热度值,具体可W是该网络 实体实例在网络上的点击量或捜索量,并对所述初始热度值进行归整,得到归整后的热度 值;然后利用归整后的热度值,计算所述链接关系图中每个节点的热度空间值,再利用所述 节点的热度空间值,计算节点间的跳转概率。 阳化5] 由于从网络上获取的不同类型网络实体实例的初始热度值相差较大,因此,需要 对所述初始热度值进行规整,具体规整方法如W下公式(1)所示:
[0056]
[0057] 其中,化tNormal。为第i类网络实体的第j个实例规整后的热度值,化tU为从 网络上获取的第i类网络实体的第j个实例的热度值,所述热度值一般指该类网络实体实 例在网络上的点击量或捜索量,Ma址oti为从网络上获取的第i类网络实体实例所有热度值 的最大值。
[0058] 当然,还可W采用其它规整方法,比如,使用每类网络实体实例的热度值除W该类 网络实体实例所有热度值之和,,对此本发明实施例不做限定。
[0059] W图2所示的音乐实体为例,歌曲、歌手、专辑、歌单四种类型的音乐实体实例初 始热度值的规整过程如下:
[0060] 歌曲热度值规整:规整方法如式(2)所示:
[0061]
阳06引其中,SongHotNormalj为第j首歌曲规整后的热度值,SongHot j为从网络上获取 的第j首歌曲的热度值(点击量或捜索量),MaxSongHot为从网络上获取的所有歌曲热度 值的最大值。
[0063] 歌手热度值规整:规整方法如式(3)所示:
[0064]
W65] 其中,Singe吐[0tNo;rmal.j为第j个歌手规整后的热度值,Singe吐lot .j为从网络上 获取的第j个歌手的热度值(点击量或捜索量),MaxSingerilot为从网络上获取的所有歌 手热度值的最大值。
[0066] 专辑热度值规整:规整方法如式(4)所示:
[0067]
[0068] 其中,A化umHotNormalj为第j个专辑规整后的热度值,A化umHot J为从网络上获 取的第j个专辑的热度值(点击量或捜索量),MaxA化umHot为从网络上获取的所有专辑热 度值的最大值。
[0069] 歌单热度值规整:规整方法如式(5)所示:
[0070]
[0071] 其中,SongLis地otNo;rmal.j为第j个歌单规整后的热度值,SongLis地ot .j为从网 络上获取的第j个歌单的热度值(点击量或捜索量),MaxSon江is地ot为从网络上获取的 所有歌单热度值的最大值。
[0072] 利用上面得到的不同类型网络实体的每个实例规整后的热度值,计算得到不同类 型网络实体中每个实例的热度空间值,即关系链接图中每个节点的热度空间值,所述热度 空间值指将所有网络实体实例的热度值划分到同一空间后,每个网络实体实例的热度值, 具体计算方式如式(6)所示:
[0073]
[0074] 其中,化tSpace,为第i类网络实体第j个实例所对应的关系链接图中的第k个节 点的热度空间值,N为网络实体的类型数,Ml为第i类网络实体的实例数。
[0075] 所述跳转概率有两种,分别为有链接的跳转概率和无链接的跳转概率。其中,有链 接的跳转概率是指非Dead End节点之间跳转的概率,无链接的跳转概率是指Dead End节 点与其它节点之间的跳转概率。
[0076] 下面分别对运两种跳转概率的计算进行详细说明。 阳077] 1)有链接的跳转概率
[0078] 根据节点的出链个数,计算跳转到每个出链连接节点的概率,如式(7)所示:
[0079]
[0080] 其中,NJump(i,j)表示节点i跳转到节点j的概率,R。为节点i跳转到的第1个 节点的编号,Rm为节点i跳转到的第η个节点的编号。
[00川从上式(7)可W看出节点i跳转到节点j的概率是根据节点j的热度空间值大小 来确定的,即节点的热度空间值越大,被跳转到的概率越大。
[00間如图2中'Singer:王菲'节点(编号为1)共跳转到立节点,假设'Song:红豆'节 点(编号为2)的热度空间值为0. 4, 'A化um :王菲200Γ节点(编号为3)的热度空间值为 0.2, 'Song:因为爱情'节点(编号为4)的热度空间值为0.6,则可W计算出'Singer:王 菲'跳转到所述Ξ个节点的概率分别为:
[0086] 由上可W看出,节点'Song:因为爱情'的热度空间值最大,为0.6,计算得到的跳 转概率NJump(l,4)最大。
[0087] 2)无链接的跳转概率
[0088] Dead End节点在链接关系图中与其它节点之间不存在链接关系(如图2中的节 点'Singer:红豆'),为了防止多次迭代后,其它节点的热度值被Dead End节点拉低,在本 发明实施例中,可W直接使用被跳转节点的热度空间值作为无链接节点跳转到被跳转节点 的跳转概率,具体计算方法如式(8)所示
[0089] DJump (j) = HotSpacej (8)
[0090] DJump (j)表示第j个节点被随机跳转到的概率。
[0091] 步骤104,根据所述跳转概率,计算每个节点的热度值。 阳09引具体地,可W将所述节点跳转概率NJump及DJump作为链接关系图中边的权重,W 图中任意节点为起点,进行随机游走,计算每个节点的热度值,经过若干次迭代后,得到每 个节点的最终热度值。
[0093] 具体热度值的计算方法如式(9)所示:
[0094]
阳09引其中PR似为第k个节点的热度值,d为阻尼系数,一般取0. 85,DJump似表示当 前第k个节点被随机跳转到的概率,In化)为节点k的入度集合,即链入到节点k的边数, PR(j)为第j个节点的热度值,NJump化k)表示节点j跳转到节点k的概率。
[0096] 下面W音乐实体为例,说明不同类型音乐实体间重要性关系的假设条件,其它领 域网络实体的重要性关系的假设与之类似,如电影实体,电视剧实体。
[0097] 音乐实体的类型可W分为歌曲、歌手、专辑、歌单四种类型,将运四种类型音乐实 体的实例作为链接关系图中的节点,根据运四种类型音乐实体间重要性关系的假设条件确 定不同节点间边的链接。所述重要性关系一般根据经验确定,一般情况下热度越高的音乐 实体,重要性越高。
[0098] 例如,针对音乐实体实例构建链接关系图的过程如图3所示:
[0099] 步骤301,根据音乐实体的歌手信息,确定歌手、歌曲间链接关系。 阳100] 所述歌手信息主要指所述歌手在音乐网站上的点击量或捜索量,构建链接关系的 假设条件如下: 阳101] (1)所述歌手在音乐网站上的点击量或捜索量越高,其演唱的歌曲热度越高; 阳102] (2)所述歌曲在音乐网站上的点击量或捜索量越高,演唱所述歌曲的歌手热度越 局。 阳103] 根据如上假设条件构建歌曲与歌手之间的重要性链接关系,即歌手与其所演唱的 歌曲间存在链接关系,使用一条双向边进行链接。 阳104] 步骤302,根据音乐实体的专辑信息,确定专辑、歌手、歌曲间重要性链接关系。 阳105] 所述专辑信息主要指所述专辑在音乐网站上的点击量或捜索量,构建链接关系的 假设条件如下: 阳106] (1)所述专辑在音乐网站上的点击量或捜索量越高,所述专辑的演唱歌手及专辑 内的歌曲热度越高;
[0107] (2)所述专辑内的歌曲在音乐网站上的点击量或捜索量越高,所述专辑及演唱该 歌曲的歌手热度越高;
[0108] (3)所述歌手在音乐网站上的点击量或捜索量越高,所述歌手演唱的歌曲或专辑 热度越高。
[0109] 根据如上假设条件,歌曲、歌手、专辑Ξ者之间是存在重要性传递关系的,当利用 专辑信息构建链接关系图时,将专辑与歌手、专辑与歌曲使用双向边进行链接即可。
[0110] 步骤303,根据音乐实体的排行榜信息,确定不同歌手演唱的歌曲间链接关系。 阳111] 所述排行榜信息是指不同排行榜主题下所述歌曲受欢迎的程度,构建链接关系的 假设条件为:当前排行榜主题下排名越靠前的歌曲热度越高。
[0112] 根据如上假设条件,排行榜下的歌曲使用双向边进行链接,实现节点重要性的传 递。
[0113] 步骤304,根据音乐实体的歌单信息,确定歌单、歌手、歌曲间链接关系。
[0114] 所述歌单指同一主题的歌曲集合,所述歌单信息指该歌单在音乐网站上的点击量 或捜索量,构建链接关系的假设条件如下:
[0115] (1)所述歌单在音乐网站上的点击量或捜索量越高,所述歌单下的每首歌曲热度 越局;
[0116] (2)所述歌单中的歌曲在音乐网站上的点击量或捜索量越高,所述歌曲所在的歌 单热度越高。
[0117] 根据如上假设条件,构建歌单、歌曲间的重要性传递关系,即歌单下的歌曲与歌单 可W使用一条双向边进行链接。
[0118] 依据如上四步构建不同类型音乐实体间重要性链接关系的假设条件来构建音乐 实体的链接关系图时,会出现重复构建链接的情况,此时可W在链接关系图中不考虑边出 现的频率,节点之间只使用一条边连接。
[0119] 步骤305,根据所述音乐实体的不同实例之间的链接关系,生成音乐实体实例间的 链接关系图。
[0120] 根据上述步骤301至步骤304确定的各音乐实体的不同实例之间的链接关系,即 可生成该音乐实体实例间的链接关系图。 阳121] 本发明实施例提供的网络实体热度分析方法,通过获取网络实体的热度相关信 息,根据网络实体间重要性关系的假设条件,构建网络实体的链接关系图;然后依据该链接 关系图,计算每个节点的热度空间值及跳转概率。为了防止多次迭代后,其它节点的热度值 被Dead End节点拉低的情况,对于无链接节点的跳转概率,直接使用被跳转节点的热度空 间值作为无链接节点跳转到该被跳转节点的跳转概率,即任意节点被随机跳转到的概率只 与该节点的热度空间值有关,从而可W避免一个较冷口的网络实体比热口网络实体的热度 值高的情况;最后根据链接关系图及节点的跳转概率计算节点的热度值,从而得到网络实 体的热度值。
[0122] 相应地,本发明实施例还提供一种网络实体热度分析系统,如图4所示,是该系统 的一种结构示意图。 阳123] 在该实施例中,所述系统包括:
[0124] 信息获取模块401,用于获取网络实体热度相关信息,所述热度相关信息是指能够 体现所述网络实体被用户关注程度的信息;
[01巧]链接关系图构建模块402,用于根据所述网络实体热度相关信息构建不同类型网 络实体实例间的链接关系图,所述链接关系图中每个节点代表一个网络实体实例;
[01%] 跳转概率计算模块403,用于根据所述链接关系图中节点的热度空间值计算节点 间的跳转概率,所述热度空间值指将所有网络实体实例的热度值划分到同一空间后,每个 网络实体实例的热度值. 阳127]热度值计算模块404,用于根据所述跳转概率,计算每个节点的热度值。
[0128] 上述链接关系图构建模块402具体可W将不同类型网络实体实例作为关系链接 图中的节点,建立不同类型网络实体实例间的链接关系图。链接关系图构建模块402的一 种具体结构包括W下各单元:
[0129] 设置单元,用于确定不同类型网络实体之间重要性关系的假设条件;
[0130] 确定单元,用于将不同类型网络实体实例作为关系链接图中的节点,根据所述假 设条件及所述网络实体热度相关信息确定节点之间边的链接情况; 阳131 ] 生成单元,用于生成不同类型网络实体实例间的链接关系图。
[0132] 如图5所示,是本发明实施例中跳转概率计算模块的一种结构示意图。 阳133] 该跳转概率计算模块包括:
[0134] 初始热度值获取单元501,用于获取不同类型网络实体实例的初始热度值;
[0135] 归整单元502,用于对所述初始热度值进行归整,得到归整后的热度值; 阳136] 热度空间值计算单元503,用于利用所述归整后的热度值,计算所述链接关系图中 每个节点的热度空间值;
[0137] 跳转概率计算单元504,用于利用所述节点的热度空间值,计算节点间的跳转概 率。
[0138] 上述各单元的具体计算方法可参照前面本发明方法实施例中的描述,在此不再寶 述。
[0139] 相应地,上述热度值计算模块404具体可W将所述节点的跳转概率作为链接关系 图中边的权重,W图中任意节点为起点,进行随机游走,通过迭代方式计算每个节点的热度 值。
[0140] 本发明实施例提供的网络实体热度分析系统,通过获取网络实体的热度相关信 息,根据网络实体间重要性关系的假设条件,构建网络实体的链接关系图;然后依据该链接 关系图,计算每个节点的热度空间值及跳转概率。为了防止多次迭代后,其它节点的热度值 被Dead End节点拉低的情况,对于无链接节点的跳转概率,直接使用被跳转节点的热度空 间值作为无链接节点跳转到该被跳转节点的跳转概率,即任意节点被随机跳转到的概率只 与该节点的热度空间值有关,从而可W避免一个较冷口的网络实体比热口网络实体的热度 值高的情况;最后根据链接关系图及节点的跳转概率计算节点的热度值,从而得到网络实 体的热度值。 阳141] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实 施例而言,由于其基本相似于方法实施例,所W描述得比较简单,相关之处参见方法实施例 的部分说明即可。W上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明 的单元可W是或者也可W不是物理上分开的,作为单元显示的部件可W是或者也可W不是 物理单元,即可W位于一个地方,或者也可W分布到多个网络单元上。可W根据实际的需要 选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出 创造性劳动的情况下,即可W理解并实施。 阳142] W上对本发明实施例进行了详细介绍,本文中应用了【具体实施方式】对本发明进行 了阐述,W上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本领域的 一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所 述,本说明书内容不应理解为对本发明的限制。
【主权项】
1. 一种网络实体热度分析方法,其特征在于,包括: 获取网络实体热度相关信息,所述热度相关信息是指能够体现所述网络实体被用户关 注程度的信息; 根据所述网络实体热度相关信息构建不同类型网络实体实例间的链接关系图,所述链 接关系图中每个节点代表一个网络实体实例; 根据所述链接关系图中节点的热度空间值计算节点间的跳转概率,所述热度空间值指 将所有网络实体实例的热度值划分到同一空间后,每个网络实体实例的热度值; 根据所述跳转概率,计算每个节点的热度值。2. 根据权利要求1所述的方法,其特征在于,所述根据所述网络实体热度相关信息构 建不同类型网络实体实例间的链接关系图包括: 确定不同类型网络实体之间重要性关系的假设条件; 将不同类型网络实体实例作为关系链接图中的节点,根据所述假设条件及所述网络实 体热度相关信息确定节点之间边的链接情况; 生成不同类型网络实体实例间的链接关系图。3. 根据权利要求1所述的方法,其特征在于,所述根据所述链接关系图中节点的热度 空间值计算节点间的跳转概率包括: 获取不同类型网络实体实例的初始热度值; 对所述初始热度值进行归整,得到归整后的热度值; 利用所述归整后的热度值,计算所述链接关系图中每个节点的热度空间值; 利用所述节点的热度空间值,计算节点间的跳转概率。4. 根据权利要求3所述的方法,其特征在于,所述初始热度值为所述网络实体实例在 网络上的点击量或搜索量。5. 根据权利要求3所述的方法,其特征在于,所述跳转概率包括: 有链接的跳转概率、无链接的跳转概率。6. 根据权利要求1至5任一项所述的方法,其特征在于,所述计算每个节点的热度值包 括: 将所述节点的跳转概率作为链接关系图中边的权重,以图中任意节点为起点,进行随 机游走,通过迭代方式计算每个节点的热度值。7. -种网络实体热度分析系统,其特征在于,包括: 信息获取模块,用于获取网络实体热度相关信息,所述热度相关信息是指能够体现所 述网络实体被用户关注程度的信息; 链接关系图构建模块,用于根据所述网络实体热度相关信息构建不同类型网络实体实 例间的链接关系图,所述链接关系图中每个节点代表一个网络实体实例; 跳转概率计算模块,用于根据所述链接关系图中节点的热度空间值计算节点间的跳转 概率,所述热度空间值指将所有网络实体实例的热度值划分到同一空间后,每个网络实体 实例的热度值; 热度值计算模块,用于根据所述跳转概率,计算每个节点的热度值。8. 根据权利要求7所述的系统,其特征在于,所述链接关系图构建模块包括: 设置单元,用于预先确定不同类型网络实体之间重要性关系的假设条件; 确定单元,用于将不同类型网络实体实例作为关系链接图中的节点,根据所述假设条 件及所述网络实体热度相关信息确定节点之间边的链接情况; 生成单元,用于生成不同类型网络实体实例间的链接关系图。9. 根据权利要求7所述的系统,其特征在于,所述跳转概率计算模块包括: 初始热度值获取单元,用于获取不同类型网络实体实例的初始热度值; 归整单兀,用于对所述初始热度值进行归整,得到归整后的热度值; 热度空间值计算单元,用于利用所述归整后的热度值,计算所述链接关系图中每个节 点的热度空间值; 跳转概率计算单元,用于利用所述节点的热度空间值,计算节点间的跳转概率。10. 根据权利要求7至9任一项所述的系统,其特征在于, 所述热度值计算模块,具体用于将所述节点的跳转概率作为链接关系图中边的权重, 以图中任意节点为起点,进行随机游走,通过迭代方式计算每个节点的热度值。
【文档编号】G06F17/30GK105989143SQ201510091477
【公开日】2016年10月5日
【申请日】2015年2月28日
【发明人】吴及, 丁赛, 吕萍, 胡国平, 王影, 胡郁, 刘庆峰
【申请人】科大讯飞股份有限公司, 清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1