音乐信息网络中社交关系影响下的歌曲流行度分析方法

文档序号:10594140阅读:470来源:国知局
音乐信息网络中社交关系影响下的歌曲流行度分析方法
【专利摘要】本发明涉及一种音乐信息网络中社交关系影响下的歌曲流行度分析方法,先从音乐信息网络中获取信息子网和信息子网的网络模式,并获取与信息子网相关的社交关系,然后在信息子网中计算不同类型关系边的平均边介数,再根据平均边介数计算得到不同类型关系边的传播因子,接着根据社交关系在信息子网中设计边权重,根据边权重在同一类型节点间选择节点进行随机游走,最后结合传播因子和边权重在信息子网中随机游走,得到网络中节点影响力排名,从而得到歌曲流行度。本发明提出的该方法考虑到了用户群体对歌曲的影响,从而使得最后的流行度分析更为合理。
【专利说明】
音乐信息网络中社交关系影响下的歌曲流行度分析方法
技术领域
[0001] 本发明设及信息检索领域,特别是一种音乐信息网络中社交关系影响下的歌曲流 行度分析方法。
【背景技术】
[0002] 音乐信息网络实际上是由一个信息子网和社交子网构成,而信息子网通常包含歌 曲W及与歌曲相关的类型节点,如歌手、作词者、流派等等,网络中存在的关系有歌曲-歌手 之间的被演唱与演唱关系、歌曲-作词者之间的被作词与作词关系、歌曲-流派之间的被包 含与包含关系等等,社交子网中包含用户之间的好友关系、歌曲-用户之间的被播放与播放 关系、用户-分组之间的被包含与包含关系。
[0003] 目前,对于异构信息网络中歌曲流行度分析方法,基本上都是利用与歌曲相关的 信息子网中不同类型的对象和关系等全面的结构信息和丰富的语义信息来分析得到流行 度。然而运种信息子网中更多注重于与歌曲相关的的歌手、作词者等运些静态信息,因而在 运种网络中用传统方法分析得到的歌曲流行度只是表明在运一信息子网中的普适性,并不 能真正地体现出歌曲在用户群体中的受欢迎程度;而在引入与歌曲相关的社交关系后,考 虑到信息子网与社交子网的网络差异性问题,如前者往往关注于网络中静态信息,后者更 多关注于网络拓扑结构,因而不能直接在音乐信息网络运一整个网络中使用传统方法分析 歌曲流行度。

【发明内容】

[0004] 本发明的目的在于提供一种音乐信息网络中社交关系影响下的歌曲流行度分析 方法,W克服现有的音乐信息网络中歌曲流行度分析方法中存在的问题。
[0005] 为实现上述目的,本发明的技术方案是:一种音乐信息网络中社交关系影响下的 歌曲流行度分析方法,步骤包括如下:
[0006] 步骤SI:获取音乐信息网络,从所述音乐信息网络中提取没有社交关系影响下的 信息子网W及信息子网的网络模式,并从所述音乐信息网络中提取出与所述信息子网相关 的社交关系;
[0007] 步骤S2:根据所述信息子网的网络模式,计算所述信息子网中不同类型关系边的 平均边介数,并根据平均边介数计算随机游走过程中不同类型关系边的传播因子;
[000引步骤S3:根据所述社交关系,计算在社交关系影响下的信息子网中各种类型边权 重;
[0009] 步骤S4:结合所述传播因子与各种类型边权重在所述信息子网中进行随机游走, 计算社交关系影响下各种类型的节点影响力排序,从而得到歌曲流行度。
[0010] 在本发明一实施例中,在所述步骤Sl中,在音乐信息网络中,去除用户之间的社交 关系W及用户与歌曲之间的播放关系与被播放关系后,得到仅与歌曲相关的且没有社交 关系影响下的信息子网Go,该信息子网Go的网络模式有四种类型节点,分别为:歌曲、歌手、 流派W及作词者。
[0011] 在本发明一实施例中,所述信息子网络中四种类型节点存在如下类型关系:歌手- 歌曲之间的演唱与被演唱关系、作词者-歌曲之间的作词与被作词关系、流派-歌曲之间的 包含与被包含关系;并从音乐信息网络中提取用户-歌曲之间的播放关系,作为所述信息子 网相关的社义关系SGo。
[0012] 在本发明一实施例中,在所述步骤S2中,基于信息子网的网络模式,计算如下六种 类型边的传播因子,即,演唱关系、被演唱关系、作词关系、被作词关系、包含关系W及被包 含关系,按照如下步骤计算:
[OOU] 步骤S21:获取所述信息子网Go;
[0014]步骤S22:计算所述信息子网Go中所述被演唱关系边、所述被作词关系W边及所述 被包含关系边的边介数,并计算该S种类型边的平均边介数的比值ems : ema : emt;
[001引步骤S23 :根据Ams : Ama : Amt = Gms : Gma : Gmt和Ams+Ama+Amt = 1计算该;种类型边的传播 因子Ams, Ama, Amt,且所述演唱关系边、所述作词关系边W及所述包含关系边的传播因子均为 1,良P入Sm= 1 ,入am= 1 ,入tm= 1。
[0016] 在本发明一实施例中,在所述步骤S3中,各所述种类型边权重计算过程如下:
[0017] 步骤S31:歌曲-流派之间的被包含关系边的权重按照如下方式计算:
[001 引
[0019] 其中,NmT表示歌曲m所属于的流派个数,NmU表示播放歌曲m的用户人数,P(t)表示 流派t包含的歌曲列表;
[0020] 步骤S32:流派-歌曲之间的包含关系边的权重按照如下方式计算:
[0021]

[0022] 其中,N?t表示流派t包含的歌曲数;
[0023] 步骤S33:歌曲-歌手之间的被演唱关系边的权重按照如下方式计算:
[0024]
[002引其中,N"s表示歌曲m的歌手个数,N"u表示播放歌曲m的用户人数,P(S)表示歌手S演 唱的歌曲列表;
[0026] 步骤S34:歌手-歌曲之间的演唱关系边的权重按照如下方式计算:
[0027]
[002引其中,表示歌手S演唱的歌曲数;
[0029]步骤S35:歌曲-作词者之间的被作词关系边的权重按照如下方式计算:
[0030]
[0031 ] 其中,N/表示歌曲m的作词者个数,N"u表示播放歌曲m的用户人数,P (a)表示作词 者a作词的歌曲列表;
[0032] 步骤S36:作词者-歌曲之间的作词关系边的权重按照如下方式计算:
[0033]
[0034] 其中,NgM表示作词者a作词的歌曲数。
[0035] 在本发明一实施例中,所述步骤S4还包括如下步骤:
[0036] 步骤S41:将所述信息子网中歌曲-歌曲之间边权重Wmm,、歌手-歌手之间边权重 Wss、作词者-作词者之间边权重Waa、流派-流派之间边权重Wtt、歌手-作词者之间边权重Wsa、 作词者-歌手之间边权重Was、歌手-流派之间边权重Wst、流派-歌手之间边权重Wts、作词者- 流派之间边权重Wat、流派-作词者之间边权重Wta均设置为0,即W",Wss,Waa,Wtt,Wsa,Was,Wst, Wts,Wat,Wta都设置为对应大小的零矩阵;将歌曲-歌曲之间传播因子A?、歌手-歌手之间传播 因子、S、作词者-作词者之间传播因子Aaa、流派-流派之间传播因子Att、歌手-作词者之间传 播因子作词者-歌手之间传播因子Aas、歌手-流派之间传播因子、t、流派-歌手之间传播 因子Ats、作词者-流派之间传播因子Aat、流派-作词者之间传播因子Ata均设置为0,即Amm = 火SS 二火aa 二火tt 二火Sa 二火as 二火St 二火ts 二火at 二火ta 二 0 ;
[0037] 步骤S42:在所述信息子网中,节点之间进行随机游走的转移概率矩阵TPM按如下 方式计算:
[00;3 引
[0039] 步骤S43:设定两个长度为N的向量¥6(3_(:与¥6(3_1?; Vec_R中的值为所述信息子网中 每个节点的影响力值,Vec_C初始知并通过如下方式计算Vec_R: N
[0040]
[0041] 其中,e为全图随机跳转概率,N取值为所述信息子网中节点总个数;
[0042] 步骤S44:通过W下两个公式计算Vec_CW及Vec_R:
[0043]
[0044]
[0045] 且当I |Vec_R-Vec_C|| >巧寸,贝纖续W上两个公式的计算,否则得至lJVec_R,C为预 设误差阔值;
[0046] 步骤S45:分别对¥6(3_1?中类型节点歌曲、歌手、作词者W及流派值进行排序,得到 歌曲、歌手、作词者W及流派的排序结果序列,进而得到歌曲流行度。
[0047] 相较于现有技术,本发明具有W下有益效果:本发明提出了一种音乐信息网络中 社交关系影响下的歌曲流行度分析方法,该方法不仅有效地利用与歌曲相关的信息子网中 不同类型的对象和关系等全面的结构信息和丰富的语义信息,同时又考虑到用户群体对歌 曲的影响,并且能够避免音乐信息网络中信息子网和社交子网网络差异性问题。运种在信 息子网中借助社交子网的社交关系来分析歌曲流行度的方法更合理。
【附图说明】
[0048] 图1为本发明中一种音乐信息网络中社交关系影响下的歌曲流行度分析方法。
[0049] 图2为本发明一实施例中音乐信息网络。
[0050] 图3为本发明一实施例中音乐信息网络中的信息子网的网络模式。
[0051] 图4为本发明-实施例中音乐信息网络中社交关系影响下的信息子网实例。
【具体实施方式】
[0052] 下面结合附图,对本发明的技术方案进行具体说明。
[0053] 下面通过具体实施例对本发明做进一步的说明,但是需要注意的是,公布实施例 的目的在于帮助进一步理解本发明,但是本领域的技术人员可W理解:在不脱离本发明及 所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实 施例所公开的内容,本发明要求保护的范围W权利要求书界定的范围为准。
[0054] 如图1所示,为本发明所提出的音乐信息网络中社交关系影响下的歌曲流行度分 析方法的的流程图,该方法包括如下步骤:
[0055] 步骤SI:获取音乐信息网络,从音乐信息网络中提取没有社交关系影响下的信息 子网W及信息子网的网络模式,并从音乐信息网络中提取出与信息子网相关的社交关系。
[0056] 进一步的,在本实施例中,在音乐信息网络中,去除用户之间的社交关系W及用户 与歌曲之间的播放关系与被播放关系等社交信息后,得到只与歌曲相关的没有社交关系影 响下的信息子网Go,在运个信息子网Go的网络模式中,有四种类型节点,分别为歌曲、歌手、 流派、作词者,网络中存在的关系有:歌手-歌曲之间的演唱与被演唱关系、作词者-歌曲之 间的作词与被作词关系、流派-歌曲之间的包含与被包含关系;再从音乐信息网络中提取用 户-歌曲之间的播放关系,也就是与信息子网相关的社交关系SGo。
[0057] 进一步的,在本实施例中,从豆瓣音乐网站中获取音乐网络数据信息,提取网络实 体,包括歌曲(M),歌手(S),作词者(A),流派(T),用户化),分组(G),运些数据中存在关系 有:歌曲-歌手之间的被演唱与演唱关系、歌曲-作词者之间的被作词与作词关系、歌曲-流 派之间的被包含与包含关系、用户-歌曲之间的播放与被播放关系、分组-用户之间的包含 与被包含关系,从而生成音乐信息网络,音乐信息网络例子如图2所示。
[0058] 进一步的,在本实施例中,音乐信息网络中信息子网的网络模式中有节点歌曲 (M),歌手(S),作词者(A),流派(T),边代表节点之间的关系,分别为歌曲-歌手之间的被演 唱与演唱关系、歌曲-作词者之间的被作词与作词关系、歌曲-流派之间的被包含与包含关 系,信息子网的网络模式如图3所示。而与信息子网相关的社交关系是指用户-歌曲之间的 播放与被播放关系。
[0059] 步骤S2:根据信息子网的网络模式,计算信息子网中不同类型关系边的平均边介 数,并根据平均边介数计算随机游走过程中不同类型关系边的传播因子。
[0060] 进一步的,基于信息子网的网络模式,计算如下六种类型边的传播因子,即,演唱 关系、被演唱关系、作词关系、被作词关系、包含关系、被包含关系,计算方法如下:
[0061] 步骤S21.获取信息子网Go;
[0062] 步骤S22.计算出信息子网Go中被演唱关系、被作词关系、被包含关系边的边介数, 并统计出运^种类型边的平均边介数的比值ems : ema : emt;
[0063] 步骤S23 .根据Ams : Ama : Amt = ems : ema : emt和Ams+^ma+Amt= 1 计算出运S种类型边的传 播因子Ams, Ama, Amt,而演唱关系边、作词关系边和包含关系边的传播因子都为1,即Asm=I, 入 am= 1 ,入tm= 1。
[0064] 如图 4所示,在本实施例中,ems:ema:emt = 9.5332:7.5288:8.7495,入 ms = 0.3693 ,Ama = 0.2917,入 mt = 0.3390。
[0065] 步骤S3:基于信息子网的网络模式,并根据社交关系,设计出在社交关系影响下的 信息子网Go中各种类型边权重,具体计算公式如下:
[0066] 步骤S31:歌曲-流派之间的被包含关系边的权重计算公式
NmT表示歌曲m所属于的流派个数,NmU表示播放歌曲m的用户人数,P(t)表示流派t包含的歌 曲列表;
[0067] 步骤S32:流派-歌曲之间的包含关系边的权重计算公式:
,N/表示流派t 包含的歌曲数;
[006引步骤S33:歌曲-歌手之间的被演唱关系边的权重计算公式
Nm嗦示歌曲m的歌手个数,Nm嗦示播放歌曲m的用户人数,P(S)表示歌手S演唱的歌曲列表;
[0069] 步骤S34:歌手-歌曲之间的演唱关系边的权重计算公式:^8,,1=^,扼》表示歌手8 演唱的歌曲数;
[0070] 步骤S 3 5 :歌曲-作词者之间的被作词关系边的权重计算公式:
,NmA表示歌曲m的作词者个数,NmU表示播放歌曲m的用户人数,P(a)表示 作词者a作词的歌曲列表;
[0071] 步骤S36:作词者-歌曲之间的作词关系边的权重计算公式:
NgM表示作词 者a作词的歌曲数;
[0072] 步骤S4:结合传播因子与边权重来在信息子网中进行随机游走,得到歌曲、歌手、 作词者、类型运四种类型节点的影响力排序,具体计算方法如下:
[0073] 步骤S41 .将网络中歌曲-歌曲之间边权重Wmm、歌手-歌手之间边权重Wss、作词者- 作词者之间边权重Waa、流派-流派之间边权重Wtt、歌手-作词者之间边权重Wsa、作词者-歌手 之间边权重Was、歌手-流派之间边权重Wst、流派-歌手之间边权重Wts、作词者-流派之间边权 重Wat、流派-作词者之间边权重Wta均设置为0,在本实施例中,W是6 X 6的零矩阵、Wss是4 X 4 的零矩阵、Waa是2 X 2的零矩阵、Wtt是3 X 3的零矩阵、Wsa是4 X 2的零矩阵、Was是2 X 4的零矩 阵、Wst是4 X 3的零矩阵、Wts是3 X 4的零矩阵、Wat是2 X 3的零矩阵、Wta是3 X 2的零矩阵;将歌 曲-歌曲之间传播因子A?、歌手-歌手之间传播因子、S、作词者-作词者之间传播因子Aaa、流 派-流派之间传播因子Att、歌手-作词者之间传播因子作词者-歌手之间传播因子Aas、歌 手-流派之间传播因子、t、流派-歌手之间传播因子Ats、作词者-流派之间传播因子Aat、流 派-作词者之间传播因子^均设置为0,即人mm == Aaa = Att = Asa = Aas = Ast = Ats = Aat =入ta =0;
[0074] 步骤S42.在信息子网中,节点进行随机游走需要考虑两点,即,下一步随机游走应 选择何种类型节点W及应选择该类型节点集中具体哪一个节点,实际上前者就是各种类型 边的传播因子,后者是各种类型边权重,因此,从节点i到节点j的转移概率,就是将运两者 进行乘积,即转移概率矩阵TPM计算公式如下:
[0075]
[0076] 步骤S43.设定两个长度为N的向量Vec_C,Vec_R,Vec_R中的值为信息子网中每个 节点的影响力值,Vec_C初始划去]WxW述过嫁C-K =怜而+巧去]公式计算Vec_R; 在本实施例中,N= 15;
[0077] 步骤S44.通过W下两个公式计算¥6。_(:和¥6(3_尺 [007引 Vec_C = Vec_R
[0079] 吟C _ W = Kw _ C * + £. * [丄1。V - - N '
[0080] 当I |Vec_R-Vec_C|| 寸继续W上两个公式的计算,否则得到Vec_R,C为事先设 定误差阔值;
[0081] 步骤S45.分别对Vec_R中歌曲、歌手、作词者和流派值进行排序,得到歌曲、歌手、 作词者和流派运四种类型节点的排序结果序列,得到歌曲流行度,如表1所示。
[0082]
[0083] 表1
[0084] W上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作 用未超出本发明技术方案的范围时,均属于本发明的保护范围。
【主权项】
1. 一种音乐信息网络中社交关系影响下的歌曲流行度分析方法,其特征在于:步骤包 括如下: 步骤S1:获取音乐信息网络,从所述音乐信息网络中提取没有社交关系影响下的信息 子网以及信息子网的网络模式,并从所述音乐信息网络中提取出与所述信息子网相关的社 交关系; 步骤S2:根据所述信息子网的网络模式,计算所述信息子网中不同类型关系边的平均 边介数,并根据平均边介数计算随机游走过程中不同类型关系边的传播因子; 步骤S3:根据所述社交关系,计算在社交关系影响下的信息子网中各种类型边权重; 步骤S4:结合所述传播因子与各种类型边权重在所述信息子网中进行随机游走,计算 社交关系影响下各种类型的节点影响力排序,从而得到歌曲流行度。2. 根据权利要求1所述的音乐信息网络中社交关系影响下的歌曲流行度分析方法,其 特征在于,在所述步骤S1中,在音乐信息网络中,去除用户之间的社交关系以及用户与歌曲 之间的播放关系与被播放关系后,得到仅与歌曲相关的且没有社交关系影响下的信息子网 Go,该信息子网Go的网络模式有四种类型节点,分别为:歌曲、歌手、流派以及作词者。3. 根据权利要求2所述的音乐信息网络中社交关系影响下的歌曲流行度分析方法,其 特征在于,所述信息子网络中四种类型节点存在如下类型关系:歌手-歌曲之间的演唱与被 演唱关系、作词者-歌曲之间的作词与被作词关系、流派-歌曲之间的包含与被包含关系;并 从音乐信息网络中提取用户-歌曲之间的播放关系,作为所述信息子网相关的社交关系 SGo〇4. 根据权利要求3所述的音乐信息网络中社交关系影响下的歌曲流行度分析方法,其 特征在于,在所述步骤S2中,基于信息子网的网络模式,计算如下六种类型边的传播因子, 即,演唱关系、被演唱关系、作词关系、被作词关系、包含关系以及被包含关系,按照如下步 骤计算: 步骤S21:获取所述信息子网Go; 步骤S22:计算所述信息子网Go中所述被演唱关系边、所述被作词关系以边及所述被包 含关系边的边介数,并计算该三种类型边的平均边介数的比值ems: em: emt; 步骤S23:根据Ams: Ama: Amt = ems: ema: emt和Xms+Ama+Amt = 1计算该三种类型边的传播因子 Ams,Ama,Amt,且所述演唱关系边、所述作词关系边以及所述包含关系边的传播因子均为1,即 ^sm - 1 , - 1 , ^tm - 1 〇5. 根据权利要求4所述的音乐信息网络中社交关系影响下的歌曲流行度分析方法,其 特征在于,在所述步骤S3中,各所述种类型边权重计算过程如下: 步骤S31:歌曲-流派之间的被包含关系边的权重按照如下方式计算:其中,NmT表示歌曲m所属于的流派个数,Nmu表示播放歌曲m的用户人数,P(t)表示流派t 包含的歌曲列表; 步骤S32:流派-歌曲之间的包含关系边的权重按照如下方式计算:其中,N/表示流派t包含的歌曲数; 步骤S33:歌曲-歌手之间的被演唱关系边的权重按照如下方式计算:其中,Nms表示歌曲m的歌手个数,Nmu表示播放歌曲m的用户人数,P(s)表示歌手s演唱的 歌曲列表; 步骤S34:歌手-歌曲之间的演唱关系边的权重按照如下方式计算:其中,队《表示歌手s演唱的歌曲数; 步骤S35:歌曲-作词者之间的被作词关系边的权重按照如下方式计算:其中,N/表示歌曲m的作词者个数,Nmu表示播放歌曲m的用户人数,P(a)表示作词者a作 词的歌曲列表; 步骤S36:作词者-歌曲之间的作词关系边的权重按照如下方式计算:其中,NaM表示作词者a作词的歌曲数。6.根据权利要求5所述的音乐信息网络中社交关系影响下的歌曲流行度分析方法,其 特征在于,所述步骤S4还包括如下步骤: 步骤S41:将所述信息子网中歌曲-歌曲之间边权重W?,、歌手-歌手之间边权重Wss、作词 者-作词者之间边权重Waa、流派-流派之间边权重Wtt、歌手-作词者之间边权重Wsa、作词者-歌手之间边权重W as、歌手-流派之间边权重Wst、流派-歌手之间边权重Wts、作词者-流派之间 边权重W at、流派-作词者之间边权重^3均设置为0;将歌曲-歌曲之间传播因子λ_、歌手-歌 手之间传播因子A ss、作词者-作词者之间传播因子、流派-流派之间传播因子Att、歌手-作 词者之间传播因子A sa、作词者-歌手之间传播因子Aas、歌手-流派之间传播因子Ast、流派-歌 手之间传播因子A ts、作词者-流派之间传播因子Aat、流派-作词者之间传播因子Ata均设置为 0,艮口 入脑-- Aaa - Att - ^sa - ^as - Ast - A-ts - ^at - ^ta - 0 ; 步骤S42:在所述信息子网中,节点之间进行随机游走的转移概率矩阵TPM按如下方式 计算:步骤S43:设定两个长度为N的向量Vec_(^^Vec_R; Vec_R*的值为所述信息子网中每个 节点的影响力值,Vec_C初始为[ιΚ、,并通过如下方式计算Vec_R:其中,ε为全图随机跳转概率,N取值为所述信息子网中节点总个数; 步骤S44:通过以下两个公式计算Vec_C以及Vec_R: Vec_C = Vec_R,且当I |VeC_R-VeC_C| I彡ξ时,则继续以上两个公式的计算,否则得到Vec_R,|为预设误 差阈值; 步骤S45:分别对Vec_I^类型节点歌曲、歌手、作词者以及流派值进行排序,得到歌曲、 歌手、作词者以及流派的排序结果序列,进而得到歌曲流行度。
【文档编号】G06F17/30GK105956040SQ201610264331
【公开日】2016年9月21日
【申请日】2016年4月26日
【发明人】余春艳, 郑晓燕, 苏金池, 王秀, 郭文忠
【申请人】福州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1