歌曲情绪压力分析方法及系统的制作方法

文档序号：2832111阅读：485来源：国知局

专利名称：：歌曲情绪压力分析方法及系统的制作方法
技术领域：
：本发明涉及歌曲分析技术，特别是涉及一种以歌词为依据的歌曲情绪压力分析方法及系统。
背景技术：
：当前社会对歌曲的需求与日倶增，听歌已经从个人电脑转向互联网在线视听。3G通信网络的逐渐普及，必然推动歌曲操作从互联网向手机扩展。为应对上述需求，各种智能歌曲搜索和推荐系统逐渐涌现。歌曲分类是智能歌曲搜索和推荐的关键技术，目标是赋予歌曲特定的类别标签，以方便用户搜索或者系统推荐。歌曲类别中有客观类别和内涵类别，例如地域类别是根据歌曲创作地点所设定的客观类别，而情绪类别是根据歌曲情绪压力所设定的内涵类别。实现自动的歌曲情绪分析难度较大。近年来，歌曲情绪分类首先在音频信号处理研究中出现，人们试图借助统计手段从音频信号中提取可能会反映情绪的音频特征，再借助机器学习算法实现情绪分类。这类研究已有近20年的历史，但至今无法获得准确反映情绪的音频特征，所取得的成效非常有限，无法达到实用水平。由于音频信号在歌曲情绪分析上局限性明显，最近出现了借助歌词进行歌曲情绪分析的研究兴趣。
发明内容本发明的目的是提供一种根据歌词对歌曲的情绪压力状态进行分析的方法和系统。为达到上述目的，提供一种依照本发明实施方式的歌曲情绪压力分析方法，所述方法包括以下步骤Sl，对歌词进行切分；S2，通过分析歌词的重复、排比和歌词片段序列，判定歌词的结构；53,根据歌词的字数和演唱时间，确定歌曲的平均唱速；54,从歌词中抽取情绪单元，并判定情绪单元的情绪压力极性；S5，根据所述歌词的结构、歌曲的平均唱速以及情绪单元的情绪压力极性计算歌词情绪压力指数。优选地，在步骤si中，对歌词进行切分包括先将歌词切分为语句，再将语句切分为词汇。优选地，在步骤si中，将语句切分为词汇时釆用双向最大匹配策略判断词汇边界。优选地，在步骤S2中，通过分析歌词文件时间信息和字符匹配来分析歌词的重复。优选地，在步骤S2中，通过分析歌词片段字符匹配来分析歌词的排比。优选地，在步骤S2中，通过分析歌词文件时间序列来分析歌词片段序列。优选地，所述步骤S4中，通过利用情绪词词典从歌词片段中查找情绪词，之后在上下文中查找修饰词和否定词，获得情绪单元。优选地，所述步骤S4中情绪单元的情绪压力极性判定步骤包括S4-1，从情绪词词典中提取情绪词的情绪压力极性；S4-2，判断情绪单元中是否存在否定词，如果是，则极性置反并转到步骤S4-3，如果否，则直接转到步骤S4-3;S4-3，判断是否存在修饰词，如果是，根据修饰词的程度对所述情绪压力极性进行增强或者消弱，如果否，则结東。优选地，所述情绪压力极性包括积极和消极。优选地，所述步骤S5中利用下式计算歌曲的情绪压力指数魂卜丄J],.0—尸。/w(m,》)+s姆")+s—(",)其中，S为情绪压力指数，其取值范围为[O，16]，其中最小值0表明歌曲的压力状态为最轻松，最大值16表明歌曲的压力状态为最沉重；/,是某歌词，N是歌曲情绪单元的总数，尸o/"K",.)是情绪单元",的极性，取值为{1,-1}，对应{积极，消极};F""c(w,.)是情绪单元",.的强度系数，取值为{1，-1},对应{增强，削弱};^n^(",.)是情绪单元w,的结构系数；5^e^(w)是情绪单元",的唱速系数，该系数实际上是情绪单元^所处位置唱速s,的函数g)，g(a)按照下式<formula>formulaseeoriginaldocumentpage7</formula>s,为唱速，单位是字/秒，其取值范围为b-，7](i是歌曲全局最低唱速，/是歌曲全局最高唱速)，g")的取值范围为[-l，l]。为达到上述目的，还提供一种依照本发明实施方式的歌曲情绪压力分析系统，所述系统包括预处理模块，用于切分歌词；结构分析模块，与预处理模块连接，用于根据歌词的重复和排比特性以及歌词片段序列分析歌词的结构；唱速分析模块，与预处理模块连接，用于根据歌词字数判定歌曲的演唱速度；情绪单元提取模块，与预处理模块连接，用于提取歌词中的情绪单元，并根据歌词上下文判定情绪单元的压力极性；情绪压力计算模块，与结构分析模块、唱速分析模块和情绪单元提取模块连接，用于根据歌词结构、演唱唱速、情绪单元压力极性以及情绪单元的分布情况计算歌曲情绪压力指数。基于本发明所提供的歌曲情绪压力分析方法和系统，可以更有效地进行歌曲内涵分析，尤其是判定歌曲的情绪压力。如将其应用于用户搜索歌曲或者系统推荐歌曲的情况，则能够使用户在歌曲搜索的过程中，根据歌曲的关键词(例如歌手名)和歌曲内涵(例如情绪压力)类别，可以准确定位所需要的歌曲，包括用户并不知道名称的新歌，从而提高歌曲搜索命中率，缩短用户的歌曲搜索时间，不断提升用户体验。图l是依照本发明实施方式的歌曲情绪压力分析方法的流程示意图2是依照本发明实施方式的歌曲情绪压力分析系统的结构示意图。具体实施例方式下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。图1示出了本发明一实施例所提供的歌曲情绪压力分析方法的流程示意图。在步骤S1中，对歌词进行切分，例如将歌词切分为词汇，优选地，可以先将歌词切分为语句，进而将语句切分为词汇。歌曲的歌词可以是包含时间信息和歌词信息的LYRIC文件格式(气LRC)。语句的切分策略较为简单，将LRC文件的歌词行直接视为语句。在词汇切分时，釆取双向最大匹配策略判定词汇边界，所用词典为标准现代汉语词典。双向最大匹配是一种通用机械分词方法，它同时从正向(由左到右)和逆向(由右到左)将待分析的汉字串与通用汉语词典中的词条进行匹配；若在词典中找到某个字符串，则匹配成功(识别出一个词)；若双向存在不一致，则结合统计信息来判断。例如，"我们要加强民主意识"被切分为"我们/要/加强/民主/意识"，而不是"我们/要/加强/民/主意/识"。这是因为双向最大匹配策略能有效处理词汇切分歧义。在步骤S2中，通过分析歌词的重复、排比和歌词片段序列，判定歌词的结构。歌词片段序列是表达了一定情感的词汇组合，是歌词结构关系的体现，是歌词各个片段按照时间出现的先后次序。歌词片段一般是一个语句，有时会是更小的语言颗粒，例如句子的一部分乃至单个词汇。在本实施例中通过分析歌词文件时间信息和字符匹配来分析歌词的重复。LRC格式歌词文件显式表示了重复歌词片段，例如歌词"到底怎样才算好不算坏"表示歌词片段"到底怎样才算好不算坏"在全篇歌词中重复了2次，即可以借助LRC格式歌词直接从歌词中提取重复片段。该实施例还通过分析歌词片段字符匹配来分析歌词的排比。例如如下两句歌词构成排比难道真是从来就不应该，以及难道真是根本就不可爱。其中"难道真是从来就不应该"和"难道真是根本就不可爱"构成"难道真是xx就不xx"排比结构。本发明通过字符串匹配能发现这种排比结构。有时会存在长度不一的"准"排比句，例如如下两句歌词构成"准"排比到底怎样才算好不算坏，以及到底怎样才能适应这个时代。其中"到底怎样才算好不算坏"和"到底怎样才能适应这个时代"构成"准"排比句。这种"准"排比现象也在本发明中使用到，其可信度略低于排比。发现歌词重复和排比结构是为了分析歌词结构特征。本分析方法以歌词全篇为背景，根据重复和排比出现的先后次序确定歌曲结构。本实施例主要考虑了如下歌词结构(1)A—B—A-B(2)A1-A2-B-Al(或A2)-B(3)Al-A2-B-Al(或A2)(4)Al—B—A2—B—C—B(5)A—B—A—B—D(6)A—B-B-D(7)A-B-C一B—D(8)B—A—B—D其中A代表主题歌词片段，Ai是编号的主题片段，B代表副歌片段，C代表过渡句(插句)，D代表结束句(流行句)。主题片段(A)—般是歌曲的前奏部分，以内容表述为目的，主要用来铺垫，为引出高潮部分，通常感情较平淡，甚至与高潮部分所表达的感情不一致。副歌部分通常是歌曲的高潮，在节奏、强度和曲调上都同主题片段形成强烈对比。副歌片段(B)—般是感情的升华，是全歌词的画龙点睛之处。其中抒情的成分居多，概括性很强。同时副歌部分重复度比较高，意在强化情绪。因此，副歌片段基本能反映歌曲情绪。过渡片段(C)通常指两段紧相邻的副歌之间的过渡歌词，其目的在过渡，因而情绪表达平淡。结束句(流行句)(D)歌曲结東部分容易被记住的一两句歌词，其情绪表达也比较充分，接近副歌。这样，本发明在获得歌词结构后，将情绪丰富的副歌片段进行权重增强处理，而将情绪较平淡甚至与副歌片段不一致的主题片段和过渡片段进行权重降低或忽略处理。表1是本发明中设定的不同结构中情绪单元所处的不同位置时的权重。表1歌词片段类型歌词结构权重AA—B-A—B0.4BA—B-A-B1.2AlA1—A2—B-A1(A2)—B0.4A2A1-A2-B-A1(A2)—B0.5BA1-A2—B-A1(A2)—B1.2AlA1-A2—B—A1(A2)0.4A2A1—A2—B—A1(A2)0.5BA1-A2-B—A1(A2)1.2AlAl-B—A2—B-C—B0.5A1-B-A2-B-C—B0.5<table>tableseeoriginaldocumentpage11</column></row><table>在步骤S3中，根据歌词的字数和演唱时间，确定歌曲的平均唱速。具体地说，本实施例以LRC文件中每行内容作为一个歌词片段，以歌词方括号内的时间为起始时间，以其下一句歌词的起始时间为本行歌词的结東时间，就可以计算出本歌词片段所占用的演唱时间。先统计歌词的字数，再除以歌词演唱时间，就可以得到歌曲的唱速。例如一行歌词的字数为10个字，演唱起始时间为,结束时间为,则片段占用时间为4秒，因此本片段的唱速为0.4字/秒。上述演唱时间计算方法可能会在歌词自然段的最后一句歌词上发生误差，但大部分LRC文件能够将音乐部分的歌词设置为空。这样，误差可被控制在很小的范围。情绪词词典是针对歌词情绪分析的词典，也可以与现有的情感词典融合并调整扩展来形成。例如，本实施例中的情绪词词典融合了知网情感词典(知网情感词典是互联网上提供的免费版本)。情感词典分情感关键词词典、修饰词词典和否定词词典三部分。情绪关键词词典文件格式如下[极性]极性分积极(1)和消极(-1)两类。该文件示例片段如下表里如一1表里一致1表率1一团乱麻-1一团漆黑-1一团糟-1修饰词词典文件格式如下:[修饰词][程度]程度分加强(1)和削弱(-1)两类。该文件示例片段如下:稍微-1稍为-1稍许-1充分1出奇1大为1否定词词典文件格式简单，每行只存放否定词。在步骤S4中，从歌词中抽取情绪单元，并判定情绪单元的情绪压力极性。考虑到情绪单元的上下文范围基本不超出语句，本发明以歌词片段为目标寻找情绪单元。情绪单元是一个包含了情绪词、否定词(可选)和修饰词(可选)的意义单位。本发明首先借助情绪词词典从歌词片段查找情绪词，接着在上下文(共8个词)范围内查找修饰词和否定词。这样就能在上下文窗口内获得一个情绪单元，通常表现为一个短语，例如从歌词"太多疑问太多无奈太多徘徊，，中，可获得如下三个情绪单元"太多疑问""太多无奈""太多徘徊"其中，"太多"是修饰词，"疑问"、"无奈"和"徘徊"是情绪词。情绪单元的极性判定比较简单。首先从情绪词词典中提取情绪词的情绪极性，例如"疑问"的情绪极性为消极；然后看情绪单元是否存在否定词，若存在则极性置反；最后看是否存在修饰词，若存在则极性增强或削弱。由于三个词汇均属消极词汇，切均不存在否定词限定，并有程度增强的修饰词"太多"，故三个情绪单元均为增强的消极极性。在步骤S5中，根据所述歌词的结构、歌曲的平均唱速以及情绪单元的情绪压力极性计算歌词情绪压力指数。令(uj(i的取值为lN)代表歌词中的情绪单元，歌曲的情绪压力指数定义为其中s为情绪压力指数，其取值范围为[O,16]，其中最小值0表明歌曲的压力状态为最轻松，最大值16表明歌曲的压力状态为最沉重；/,是某歌词，N是歌曲情绪单元的总数，尸o/"K^)是情绪单元仏的极性，取值为{1，-1}，对应{积极，消极};尸"^")是情绪单元",.的强度系数，取值为{1,-1}，对应{增强，削弱};^n^(",.)是情绪单元",的结构系数；6^eW(w)是情绪单元",的唱速系数，该系数实际上是情绪单元所处位置唱速a的函数g",),g(&)按照下式s—^s,为唱速，单位是字/秒，其取值范围为iy,z]u是歌曲全局最低唱速，/是歌曲全局最高唱速),g")的取值范围为[-i,i]。一般情况下歌曲遵循前文中给出的s种歌词结构，不同结构中情绪单元所处的位置不同，对歌曲情绪压力影响不同，比如表示为表i中所列的权重。图2示出了本发明一实施例的一种歌曲情绪压力分析系统，其包括预处理模块，用于切分歌词；结构分析模块，与预处理模块连接，用于根据歌词的重复和排比特性以及歌词片段序列分析歌词的结构；唱速分析模块，与预处理模块连接，用于根据歌词字数判定歌曲的演唱速度；情绪单元提取模块，与预处理模块连接，用于提取歌词中的情绪单元，并根据歌词上下文判定情绪单元的压力极性；情绪压力计算模块，与结构分析模块、唱速分析模块和情绪单元提取模块连接，用于根据歌词结构、演唱速度、情绪单元压力极性以及情绪单元所述的位置计算歌曲情绪压力指数。根据本实施例所述的方法和系统可更有效地进行歌曲内涵分析，尤其是判定歌曲的情绪压力，进而开发歌曲分类、检索和推荐系统，可被互联网服务提供商、手机增值服务提供商采纳以便为其用户提供准确、灵活、个性化歌曲试听和推荐服务。其潜在的价值优点可以至少归纳为两个方面第一，由于歌曲数目众多，且种类繁杂，歌曲试听服务往往因服务提供不当而变得烦闷而令人沮丧。通过关键词(例如歌曲名、歌手名或歌词中的词汇)进行歌曲检索，一方面需要查询者实现知道使用哪些关键词，另一方面，返回结果准确率低，最终造成歌曲试听体验差。基于本发明所述算法，并结合其他歌曲分析技术，可开发基于关键词与内涵相结合的歌曲搜索系统。用户不一定实现知道关键词，只需指定所了解的关键词(例如歌手名)和歌曲内涵(例如情绪压力)类别，就可以准确定位所需要的歌曲，包括用户并不知道名称的新歌，从而提高歌曲命中率，缩小用户的歌曲搜索时间，不断提升用户体验。第二，近年来个性化歌曲推荐服务愈来愈受到关注。基于本发明所述算法，并结合其他歌曲分析技术，可开发个性化、智能歌曲推荐系统，根据用户歌曲收藏和试听曰志获取用户"我的最爱"歌曲列表,构建个性化用户歌曲欣赏品味模型，并以该模型为依据从歌曲库匹配符合用户品味的歌曲，尤其是用户不知道姓名的新歌手近期创作的新歌，从而不断给他/她带来惊喜，不断提升用户体验。以上所述仅是本发明的优选实施方式，应当指出，对于本
技术领域：
的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变型，这些改进和变型也应视为本发明的保护范围。权利要求1、一种歌曲情绪压力分析方法，其特征在于，所述方法包括以下步骤S1，对歌词进行切分；S2，通过分析歌词的重复、排比和歌词片段序列，判定歌词的结构；S3，根据歌词的字数和演唱时间，确定歌曲的平均唱速；S4，从歌词中抽取情绪单元，并判定情绪单元的情绪压力极性；S5，根据所述歌词的结构、歌曲的平均唱速以及情绪单元的情绪压力极性计算歌词情绪压力指数。2、如权利要求1所述的歌曲情绪压力分析方法，其特征在于，在步骤S1中，所述对歌词进行切分包括将歌词切分为语句，并将语句切分为词汇。3、如权利要求2所述的歌曲情绪压力分析方法，其特征在于，将语句切分为词汇时釆用双向最大匹配策略判断词汇边界。4、如权利要求1所述的歌曲情绪压力分析方法，其特征在于，在步骤S2中，通过分析歌词文件时间信息和字符匹配来分析歌词的重复。5、如权利要求1-4中任一项所述的歌曲情绪压力分析方法，其特征在于，在步骤S2中通过分析歌词片段字符匹配来分析歌词的排比。6、如权利要求5所述的歌曲情绪压力分析方法，其特征在于，在步骤S2中，通过分析歌词文件时间序列来分析歌词片段序列。7、如权利要求1所述的歌曲情绪压力分析方法，其特征在于，所述步骤S4中，通过利用情绪词词典从歌词片段中查找情绪词，之后在上下文中查找修饰词和否定词，获得情绪单元。8、如权利要求7所述的歌曲情绪压力分析方法，其特征在于，所述步骤S4中，情绪单元的情绪压力极性判定步骤包括S4-1,从情绪词词典中提取情绪词的情绪压力极性；S4-2，判断情绪单元中是否存在否定词，如果是，则极性置反并转到步骤S4-3，如果否，则直接转到步骤S4-3;S4-3,判断是否存在修饰词，如果是，根据修饰词的程度对所述情绪压力极性进行增强或者消弱，如果否，则结東。9、如权利要求8所述的歌曲情绪压力分析方法，其特征在于，所述情绪压力极性包括积极和消极。10、如权利要求l所述的歌曲情绪压力分析方法，其特征在于，所述步骤S5中利用下式计算歌曲的情绪压力指数<formula>formulaseeoriginaldocumentpage3</formula>其中，^为情绪压力指数，其取值范围为[O，16],其中最小值0表明歌曲的压力状态为最轻松，最大值16表明歌曲的压力状态为最沉重；/,是某歌词，N是歌曲情绪单元的总数，尸o/w(",)是情绪单元w的极性，取值为{1,-1},对应{积极，消极};F""c(",.)是情绪单元",.的强度系数，取值为{1,-1}，对应{增强，削弱};5^"(",.)是情绪单元w的结构系数；S;^W(w)是情绪单元w的唱速系数，该系数是情绪单元W所处位置唱速A的函数g(A)，按照下式计算s—xA为唱速，单位是字/秒，其取值范围为K],其中f是歌曲全局最低唱速，^是歌曲全局最高唱速，的取值范围为[-l，l]。11、一种歌曲情绪压力分析系统，其特征在于，所述系统包括预处理模块，用于切分歌词；结构分析模块，与预处理模块连接，用于根据歌词的重复和排比特性以及歌词片段序列分析歌词的结构；唱速分析模块，与预处理模块连接，用于根据歌词字数判定歌曲的演唱速度；情绪单元提取模块，与预处理模块连接，用于提取歌词中的情绪单元，并根据歌词上下文判定情绪单元的压力极性；情绪压力计算模块，与结构分析模块、唱速分析模块和情绪单元提取模块连接，用于根据歌词结构、演唱速度、情绪单元压力极性以及分布情况计算歌曲情绪压力指数。全文摘要本发明公开了一种歌曲情绪压力分析方法，其包括步骤S1，对歌词进行切分；S2，通过分析歌词的重复、排比和歌词片段序列，判定歌词的结构；S3，根据歌词的字数和演唱时间，确定歌曲的平均唱速；S4，从歌词中抽取情绪单元，并判定情绪单元的情绪压力极性；S5，根据所述歌词的结构、歌曲的平均唱速以及情绪单元的情绪压力极性计算歌词情绪压力指数。基于上述方法，用户可以准确定位所需要的歌曲，从而提高歌曲搜索命中率，缩短歌曲搜索时间。文档编号G10L15/22GK101587708SQ20091008782公开日2009年11月25日申请日期2009年6月26日优先权日2009年6月26日发明者夏云庆申请人:清华大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏云庆
技术所有人：清华大学
我是此专利的发明人

上一篇：一种dra帧内误码检测及检测-隐蔽方法
上一篇：一种音频比对系统及其音频能量比对方法