用于提供音乐片段概观的方法和装置的制作方法

文档序号:2831055阅读:258来源:国知局
专利名称:用于提供音乐片段概观的方法和装置的制作方法
技术领域
本发明的一个实施例涉及用于提供音乐片段(pieces of music) 概观的方法和装置.本发明的另一实施例涉及用于提供音乐片段概观 的系统.背景技术例如由于诸如音頻压缩的新技术允许汇编包含几千或几百万个歌 曲的大的音乐集合,所以在大的音乐数据库中找到音乐片段已经变成 一项有挑战性的任务.此外,存在大的音乐数据库并且可以例如通过因特网来访问.浏 览这种大的集合对于用户来说通常是耗时且痛苦的.发明内容因此,本发明的目的是提供用于提供音乐片段概观的方法和装置. 该目的分别通过根据权利要求1、 16、 18、 19、和20所述的方法 和装置来解决.从对附困以及随后的描述的考虑,本发明的另外的目的和可能的 优点将变得显而易见.


图1示出用于提供音乐片段概观的方法的一个实施例; 图2示出用于提供音乐片段概观的方法的另一实施例; 图3示出本发明的一个实施例,其中来自一个目录的歌曲被布置 成混合曲;困4示出本发明的另一实施例,其中执行音乐片段的乐节 (section)的聚类(clustering),并且其中根据所述聚类来布置所述乐节;困5示出本发明的另一实施例,其中执行音乐片段的聚类,并且 其中位于每个群集(cluster)的质心附近的音乐片段被识别; 困6示出用于提供音乐片段概观的装置的一个实施例; 图7示出用于提供音乐片段概观的装置的另一实施例,其中该装 置包括用于进行数据交换的发送/接收单元;
图8示出用于提供音乐片段概观的、作为手持装置实现的装置的 另一实施例;图9示出用于提供音乐片段概观的、具有受限制的图形用户接口 的装置的另一实施例;困IO示出用于提供音乐片段概观的系统的一个实施例,其中该系 统包括通过发送/接收单元进行通信的客户机和服务器;以及困11示出用于提供音乐片段概观的系统的又一实施例,其中该系 统包括通过因特网进行通信的客户机和服务器.具体实施方式
在下文中描迷了本发明的实施例.重要的是注意,在下文中所描 述的所有实施例可以以任何方式来组合,也即,并不存在所描述的某 些实施例不能与其它实施例相组合的限制.在本发明的一个实施例中, 一种用于提供音乐片段概观的方法包 括提供至少两个音乐片段、确定所述音乐片段的至少两个乐节,其中 所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个 从所述音乐片段中的另 一个确定,并且将所述片段布置在一个序列中. 可以通过包含该序列的混合曲来提供概观.所述音乐片段可以从包含音乐数据的任何集合(例如目录、文件 夹、或包含音乐数据的任何其它容器)中确定.所述音乐片段还可以 从诸如数据库的集合中例如通过以下方式来检索,即利用播放列表, 确定音乐片段的有序列表、音乐风格(mood)选择器,提供对相同风 格的内容项布置、或艺术家选择器的访问,允许选择由所选择的艺术家所创作或表演的音乐片段,等等.此外,所述音乐片段可以从远程 数据库例如通过因特网或者通过用户环境中的本地网接收.除了音乐数据之外,所述集合可以包含例如用于用户娱乐的其它的内容项,诸如视频数据或计算机游戏.在后一种情况下,来自音频数据磁道的音乐可以从所述内容项中得到,当从所述音乐片段中确定所述乐节时, 一个乐节可以从一个音乐片段中确定,另一乐节可以从另一个音乐片段中确定.因此,来自所述音乐片段中的至少两个音乐片段的乐节可以被确定.换句话说,所述概观可以包含源自所述音乐片段中的至少两个的乐节.因此,可以把它视为反映所述集合或其一部分的内容的摘要. 另外,可以确定所述音乐片段中的每一个的至少一个乐节.替代 地,为了生成短的摘要,可以从所述音乐片段中的每一个中确定至多一个乐节.这允许收听者获得例如对所述集合的最相关项的快速概观. 可以根据作为生成所述概观的基础的目的来确定乐节.典型的乐节可能对概括音乐片段集合特别感兴趣.因此,相应的音乐片段的有 代表性的部分可以被得到,例如合唱、副歌、和/或歌声.乐节还可以 被确定以便代表性地概括音乐片段,例如如果所述音乐片段包含可被认为是平静的章节以及可被认为是充满活力的其它章节,那么来自两 个章节的乐节可以被确定/选择.还可以根据生成概观的目的来将乐节布置在一个序列中.例如, 所述乐节可以被布置在反映所述音乐片段的有序列表、例如播放列表 的顺序的所述序列中.这导致集合中所包含的音乐片段的内容以及顺 序的概观.替代地,乐节可以被布置在一个随机的序列中.这导致随 机化,保证例如在随后浏览或访问同一目录或文件夹时不重复地产生 相同的序列.此外,用于布置所述乐节的其它选项可能是感兴趣的. 为了迅速引起用户的注意,在该序列的开头布置源自该集合中的人所 共知的音乐片段的乐节可能是合适的.如果例如所述音乐集合包含流 行歌曲,那么所述人所共知的音乐片段可以是被置于实际命中列表的 顶部的歌曲,其中所述列表可以例如从因特网自动地下栽.在另一例子中,如果所迷音乐集合反映电影的声带(soundtrack),那么所述 人所共知的音乐片段可以包含介绍性的主题.在又一例子中,如果所 述集合包含另一年代、例如七十年代的歌曲,那么可被认为是常青树 的歌曲就可以被置于该概观的开头.用于布置的另一标准可以是乐节 的类型.例如,具有歌声的乐节可以被布置在该序列的开头,并且后 面可以是包含副歌的那些乐节.另外,在布置乐节时可以考虑节拍, 例如可以布置乐节,使得连续的乐节的节奏或步调相互匹配,或者产 生一种在节奏上引人注意的效果,在布置所述乐节时另一重要的问趙可能是音乐片段和/或乐节的 多样性.为了获得该集合的快速的概观,可以选择来自最多样的音乐 片段的乐节.此外,可以在不考虑音乐片段的多样性的情况下选择乐 节,但是把源自最多样的音乐片段的乐节放置在该概观的开头.在概 观中反映音乐片段和/或乐节的多样性的又一方式是确定所选择的乐 节的多样性并把最多样的乐节置于开头.确定音乐片段和/或乐节的多 样性以及在布置中考虑该多样性的各种不同方式将在下文中进行讨论,为了在布置在所述序列中的乐节之间实现平滑的过渡,可以应用 渐变过程.这可以是在该序列的开头的渐强、在该序列的结尾的渐弱 和/或关于该序列中的两个连续乐节的信号的交叉渐变.这种渐变还可 以包括例如通过韵律的在所述连续乐节的基调之间的调制.所述调制 还可以通过组合所述连续乐节的旋律的至少部分或者组合节奏的至少 部分来执行.在后一种情况下,节奏的组合可能导致乐节之间的速率、 例如各乐节的速度或步调的同化,其中所述速度或步调例如可以以每 分钟的节拍来测量.根据本发明的所述实施例所生成的概观允许用户方便地浏览大的 音乐集合,因为它可以提供作为基础的音乐数据的简短的、非视觉的 印象.可以通过组合来自不同源的曲调或章节的混合曲来提供该概观.为了便于浏览,可以为包含音乐数据的大重容器、例如目录、文 件夹、播放列表、音乐风格选择器、或艺术家选择器生成概观.这允 许例如在用户期望向朋友介绍最新分类的播放列表或者研究最近知晓 的艺术家的音乐以获得有关作品的第一概观时给出或获得这样的容器 的快速概观.混合曲可以被预先计算,以便在浏览期间提高性能. 一旦被预先 计算,该混合曲就可以与所述容器一起被存储,并且当用户选摔或进 入所述容器时可以从数据存储器中检索该混合曲并向他/她播放该混 合曲.替代地,可以在向用户播放混合曲之前、例如当该用户选择容器 或进入目录时生成该混合曲.这种生成混合曲的方式可以被认为是"即时(on the fly)"或"按需(on demand)"合成.这允许结果的随 机化,并保证在用户随后访问相同的容器或目录时不重复相同的序列.在图1中示出了提供音乐片段的步骤SIOO,其中至少两个音乐片 段可以从包含音乐数据的集合中被确定,或者可以替代地从远程数据 存储器例如通过因特网接收.另外,示出了确定乐节的步骤S102,其 中至少两个乐节可以用以下方式被确定,即所述乐节之一源自所述音 乐片段之一,并且所述乐节中的另一个源自所述音乐片段中的另一个,
在这之后是布置乐节的步槺SI04,其中所述乐节被布置在一个序列中. 该序列可以被播放给用户,由此提供该集合的概观.因此,按照困1的实施例,可以生成概观,其包括源自至少两个 音乐片段的至少两个乐节.该概观可以为不同的目的、例如为了概括 目录的内容、为了给出用户可能计划收听的或者令人愉快地吸引用户 注意他可能有兴趣购买的包含音乐数据的捆绑套装(bundle)的播放 列表、音乐风格选择器、或艺术家选择器的内容的快速印象而生成.图2示出本发明的另一实施例,其中通过提供步稞S200来提供音 乐片段.如上所述,该提供可以包括从音乐数据集合中确定所述音乐 片段,或者从可能远程的数据存储器接收音乐数据.然后,在之后的音乐片段聚类步骤S202中,所述音乐片段可以根 据音乐片段量度被聚类.所述音乐片段量度可以描述相应音乐片段的 至少一个特性.所述音乐片段量度可以用数字来表示或者通过类别来 指示,并且可以被限制于一维,或者可以替代地包含多维表示.由所 述音乐片段量度反映的所述属性可以涉及所述音乐片段的特征或特 色,或者可以涉及属性、例如音乐风格、时期、作曲者、或演奏艺术 家.它可以是当收听所述音乐片段时由用户感觉到的可听特性.替代 地或附加地,所述音乐片段量度可以从所述音乐片段的信号频谦例如 通过计算Mel频芈倒谗系数(MFCC)来确定.在所述音乐片段聚类步骤S202中,所述音乐片段量度可以被用于 确定所述音乐片段之间的距离.为此,可以使用已知的距离量度之一, 例如欧几里德距离或Mahalanobis距离.根据所述距离量度,所述音 乐片段可以在音乐片段群集中被聚类.为此可以使用分级或分区的聚 类算法。之后的乐节确定步稞S204然后可以涉及所述音乐片段的聚类.例 如,可以从每个音乐片段群集中确定至少一个乐节,从而保证基本上 每个音乐片段群集都在所述混合曲中被表示.另外,可以选择来自在 音乐片段群集的质心附近的音乐片段的乐节,因而实现对可以被认为 代表所述音乐片段群集的乐节的选择.这种选择被认为有代表性的乐 节的方式将在下文中详细描述.在另一实施例中,例如通过对属于相应音乐片段群集的音乐片段 的数目进行计数,或者通过对相应音乐片段群集中所包含的每个音乐 片段的相应播放时间进行求和,可以确定所述音乐片段群集中的每一个的大小.在所述乐节确定步骤S204中,所述乐节在这种情况下可以 根据所述大小来确定.例如,可以确定乐节,使得在所述序列中,被 分配给源自相应音乐片段群集的音乐片段的乐节的时间量与它的大小 相对应.例如可以确定由相应音乐片段群集的音乐片段所贡献的总播 放时间的百分比.然后,在乐节确定步猓S204中,可以利用与所迷百 分比相对应的播放时间量来选择所述相应音乐片段群集的音乐片段的 乐节,其中该时间涉及所述概观的预期的或预定的播放时间.例如, 如果一个音乐片段群集包含贡献总播放时间的约30X的音乐片段,并且 应生成总长度为IOO秒的混合曲,那么源自该音乐片段群集的乐节可 以被选择为具有大约30秒的播放时间量.这可以导致集合中所包含的 音乐风格的平衡表示例如如果一个播放列表包含总播放时间为35分 钟的快乐的歌曲、以及总播放时间为15分钟的悲伤的歌曲,那么可以 从具有35秒的总播放时间量的快乐的歌曲和具有15秒的总播放时间 量的悲伤的歌曲中确定乐节.因此,该混合曲可以反映悲伤和快乐的 歌曲的这种平衡,并且用户可以获得这种平衡的快速印象.在乐节确定步骤S204之后,在图2中示出了乐节聚类步骤S206. 作为乐节聚类的基础,确定乐节量度.所述乐节量度可以描述相应乐 节的至少一个特性.所述乐节量度的表示可以是数字的或者通过类别 来指示,并且可以是一维的或者多维的.所述乐节量度可以涉及所述 乐节的特征、特色、或者属性,例如音乐风格、时期、作曲者、或演 奏艺术家.所述乐节量度还可以反映当收听所述乐节时收听者所感觉 到的其它可听特性.另外,所述乐节量度可以从相应乐节的信号频谦 中例如通过计算Mel频率倒谦系数(MFCC)来确定.尤其,所述乐节量 度还可以取决于所述乐节所源自的相应音乐片段的所述音乐片段量 度.例如,通过多维表示的一个或多个分量,所述音乐片段量度可以 被合并在所述乐节量度中.在下文中,所述乐节量度可以被称为笫一 量度,而所述音乐片段量度可以被称为第二量度.所述乐节量度可以被用于计算乐节之间的距离,例如通过计算欧 几里德距离或Mahalanobis距离.乐节之间的所述距离然后可以被用 作在乐节聚类步骤S206中使所述乐节聚类的基础,例如利用分级的或 分区的聚类算法。
在这种情况下,可以根据所述乐节的聚类来执行乐节的布置,如在图2中的乐节布置步驟S208中所示.布置所述乐节的方式可以取决 于生成混合曲的目的.例如如果生成该混合曲以便提供关于目录或文件夹的内容的快速 概观,那么可能适当的是按照多样性来进行布置,把最多样的乐节放 置在所述混合曲的开头.这可以通过选择具有最高距离差的乐节并把 它们布置在所述序列的开头来实现.在该序列之后,可以布置具有递 减的距离的乐节.替代地或者附加地,当布置乐节时,还可以考虑乐 节属于哪个乐节群集.为了保证收听者获得关于所有所包含的乐节群 集的快速概观,来自每个群集的一个乐节可以被置于该混合曲的开头.所述按照多样性的布置可能适于或可能不适于生成所迷混合曲, 这取决于生成该混合曲的目的. 一方面,它保证收听者可以获得该混 合曲可表示的集合的内容的快速概观,另一方面,如果该混合曲在非 常多样的乐节之间跳跃,那么它对于收听者来说可能是令人讨厌的. 因此,为了生成令人愉快地收听但同时反映音乐集合的多样性的混合 曲,可能适当的是在乐节布置步騍S208中把所述序列划分为属于相同 群集的一个或多个乐节的子序列.换句话说,该序列可以通过将源自 相同乐节群集和/或音乐片段群集的乐节的子序列进行连接而构成.这 导致把少量相似的乐节分组在一个子序列中,该子序列可以使收听者 愉快地收听,而目录的多样性通过该序列总体上来表示.可以使用用于在乐节布置步樣S208中布置乐节的其它标准.例如, 具有歌声的乐节可以优先于那些包含副歌的乐节,并且可以被分组到 该混合曲的开头的一个子序列.然后,在该笫一子序列之后,笫二子 序列包含可能随后的包括副歌的乐节.替代地,具有来自单个音乐片 段的歌声和副歌的乐节可以被分组在一个子序列中,使得子序列构成 相应音乐片段的简短摘要.根据用作所迷乐节聚类的基础的所述乐节量度,通过将乐节布置 在子序列中并把子序列连接为单个序列的这种方式,可以获得各不相 同的结果,例如,乐节可以根据它们的音乐类型来分组.然后所述布 置可以反映文件夹或目录的音乐类型的分布.如果例如一个文件夹拥 有很多浪漫的歌曲和仅仅少数进取型的歌曲,那么该混合曲可以以多 个浪漫的乐节开始,之后是一个或两个进取型的乐节,之后是一些更
多的浪漫的乐节,等等.在另一实施例中,可以根据从中提取所述乐节的音乐片段所属的 相应群集来布置所述乐节.这可以允许选择源自可以被认为代表整个 音乐片段群集的音乐片段的乐节,并把它们置于开头.如前所述的按 照多样性的布置允许把来自最多样的音乐片段和/或来自不同音乐片 段群集的乐节布置在开头,从而保证收听者获得基本上所有现有的音 乐片段群集的快速概观.另外,当所述乐节的子序列在所述序列中被 构建并被连接时,可以考虑所述音乐片段聚类.因此,可以实现乐节 的布置,包含来自同一音乐片段群集的乐节子序列.困3示出本发明的一个实施例,其中目录300拥有歌曲A和歌曲B. 作为一个例子,在对这种情况没有任何限制的情况下,从歌曲A中选 择了笫一乐节306.另外,从歌曲B中选择笫二乐节308和第三乐节 310.这些乐节通过布置模块312来布置,其中该布置模块可以根据前 面所讨论的标准来执行布置.于是所得到的混合曲314包括所布置的 乐节的序列.在该例子中,该序列包含第一个被放置的处理后的乐节 308'、第二个被放罝的处理后的乐节306'、以及第三个被放置的处理 后的乐节310'.如在该例子中通过长度所示,第一个被放置的处理后 的乐节308'可以是例如通过应用渐变过程而从笫二乐节308得到的, 笫二个被放置的处理后的乐节306'可以是从笫一乐节306得到的,而 第三个被放置的处理后的乐节310'可以是从第三乐节310得到的.乐 节308也可以等于或基本上等于乐节308',乐节306也可以等于或基 本上等于乐节306',等等.图4示出根据本发明的另一实施例的乐节聚类.在该实施例中, 作为一个例子并且在对这种情况没有限制的情况下,乐节根据它们每 分钟的平均节拍被聚类.所述每分钟的平均节拍被用作乐节量度(第 一量度),其通过轴400上的一維参数来表示.在轴400上,相应乐 节用叉号402-1、 ... 、 402-12来指示.把乐节聚类为乐节群集SC1、 SC2、 和SC3用方括号404-1、…、404-6来指示.根据所述聚类来布置乐节 的可能结果在图4的下面部分中示出,该部分描绘了混合曲406形式的概观,其中处理后的乐节402-1' ..... 402-12'被分组在子序列410-1.....410-5中,这些子序列包含来自乐节群集SC1、 SC2、 SC3中的同一相应乐节群集的乐节.在该例子中,子序列"0-1包含处理
后的乐节402-1' 、 402-3'、和402-6',其可以是从属于乐节群集 SC1的乐节402-1、 402-3和402-6得到的.相应地,子序列410-2包 含从属于乐节群集SC3的乐节得到的处理后的乐节,等等.在图5中,示出了本发明的另一实施例的音乐片段505-1.....505-n的聚类.根据音乐片段量度来执行所述音乐片段聚类,在该例子 中,该音乐片段量度包含两个参数,这两个参数被绘制于由第一轴502和第二轴504所定义的二维坐标系统中.音乐片段505-1..... 505-n通过小,吝、来绘制(也请参见在困5右手側的困例).如可以看到的, 音乐片段505-l、…、505-n被分配给音乐片段群集MPCl、 MPC2、 MPC3, 每个音乐片段群集MPC1、 MPC2、 MPC3都具有相应的质心508-1、 508-2、 508-3,其被绘制为小叉号,质心508-1、 508-2、 508-3可以被认为是 相应音乐片段群集的中心,并且可以被确定为这样一个点,即该群集 中的所有点到该点的偏移之和为零.对于每个音乐片段群集MPC1、 MPC2、 MPC3,位于相应质心508-1、 508-2、 508-3附近的音乐片段通 过小的环绕的圃来突出显示(也请再次参见图5的图例).例如,在 音乐片段群集MPC1中,音乐片段505-3、 505-4、 505-5、 505-6可以 被认为是位于质心508-1附近,并且因此可以被认为是音乐片段群集 MPC1的根据形成音乐片段聚类的基础的参数的代表性组成部分.音乐 片段群集的代表性组成部分还可以被认为是代表性音乐片段.确定音乐片段群集MPC1、 MPC2、 MPC3的代表性音乐片段可以包括确定所述音乐片段群集的与相应质心的距离小于预定阈值的所有组成 部分.作为一个例子,音乐片段群集MPC1的阈值510通过图5中的虚 线来描绘.该阈值510可以被用作用于确定代表性音乐片段505-3、…、 505-6的基础.替代地或者附加地,确定相应音乐片段群集的代表性组 成部分可以包括确定属于与相应质心的距离最小的预定百分比的音乐 片段的百分位数的所有组成部分.此外,为了确定音乐片段群集MPC1、 MPC2、 MPC3的质心508-1、 508-2、 508-3,当考虑属于该群集的音乐片段时,可以例如通过它们 的相应播放时间来对音乐片段量度的参数进行加权.例如,当确定音 乐片段群集MPC1的质心508-1时,可以考虑音乐片段505-1、…、505-8 的相应播放时间.在这种情况下,这种加权还可以对音乐片段群集 MPC1、 MPC2、 MPC3的代表性组成部分的确定具有影响. 音乐片段群集MPC1、 MPC2、 MPC3的代表性音乐片段的确定可以影 响乐节确定步騍S204.例如,可以仅仅从代表性音乐片段中、例如从 音乐片段群集MPC1的代表性音乐片段505-3、 505-4、 505-5、 505-6 中以及从音乐片段群集MPC2和MPC3的代表性片段中选择乐节.此夕卜, 可以允许从代表性音乐片段中选择长的乐节,和/或限制来自未被识别 为有代表性的音乐片段的乐节的长度.另外,代表性音乐片段的识别可能影响图2中的乐节布置步驟 S208.在此,源自代表性音乐片段的乐节可以被置于该序列的开头.困6示出用于提供音乐片段概观的装置600的一个实施例,装置 600包含数据存储器602、数据处理器604、音頻输出单元606、以及 扬声器608.在该实施例中,音乐数据可以被存储在数据存储器602中.当应 用用于生成音乐片段概观的方法时,例如按照图2在提供步骤S200中, 在装置600中可以使用所迷音乐数据.另外,数据存储器602可以包 含与所述音乐数据有关的元数据.当应用所述用于生成音乐片段概观 的方法时,例如在困2中所描绘的音乐片段聚类步骤S202中或者在乐 节聚类步驟S206中,也可以使用所述元数据.在这些步槺中,元数据 可以被用作用于计算所述音乐片段量度(第二量度)和/或所述乐节量 度(第一量度)的基础.这些量度可以例如完全地通过元数据来定义, 或者替代地,仅仅第一和/或笫二量度的多维表示的一部分分量可以从 所述元数据得到.在又一替代方案中,元数据可以被用作计算所述笫 一和/或笫二量度的基础.该数据处理器604可以被配置用于例如通过从数据存储器602中 检索音乐数据来提供音乐片段.另外,数据处理器604可以负责从所 述音乐片段中确定乐节,并负责将所述乐节布置在一个序列中.数据 处理器604还可以执行另外的支持步稞,例如确定音乐片段量度并根 据该量度来使音乐片段中的至少一些聚类.数据处理器604也可以执 行乐节量度以及根据该乐节量度的乐节聚类.可以通过从数据存储器 602检索元数据来执行或者至少部分地支持所述音乐片段量度的确定 以及所述乐节量度的确定.另外,数据处理器604可以对通过布置而 获得的乐节序列应用渐变过程,以便平滑乐节之间的过渡.所得到的概观或混合曲然后可以被存储在数据存储器602中,或 者可以被传输到音頻输出单元606.音频输出单元606通过扬声器608 输出该混合曲.装置600可以是手持音乐存储装置、移动电话或者个人数字助理 (PDA)类型的装置.它还可以是汽车音频设备或者例如用在居室或公 共场所中的音频系统.困7示出用于提供音乐片段概观的装置700的另一个实施例,该 装置包含数据存储器702、数据处理器704、发送/接收单元706、音频 输出单元708、以及扬声器710.数据存储器702、数据处理器704、 音频输出单元708、以及扬声器710可以被配置为与图6的数据存储器 602、数据处理器604、音频输出单元606、以及扬声器608相似或相 同.因此,数据存储器702可以保存并提供音乐数据和有关的元数据. 数据处理器704可以负责为生成混合曲而执行的所有步稞.音频输出 单元708然后可以通过扬声器710向用户榆出该混合曲.附加的发送/接收单元706允许该装置700与其它的装置通信.它 还可以被用于从外部数据源、例如远程数据库检索数据.例如如果该 用户拥有私人的集中的数据存储器,那么这种数据库可以位于用户的 环境中,或者可以通过因特网来访问.所检索的数据可以包括音乐数 据和元数据,另外,该发送/接收单元使用户能够向另一装置发送所生成的概 观,例如用于向另一人呈现该混合曲作为新布置的播放列表或者新获 取的光盘的摘要.如果该装置700仅仅具有有限的数据存储器702,并 且如果期望通过网络来交换数据,那么该发送/接收单元706的提供可 以是可选的.图8示出用于提供音乐片段概观的一种可能的用户界面.示出了 手持装置800,给用户提供图形用户界面802.图形用户界面802可以 提供显示屏和触摸垫功能.另外,用户命令可以通过鍵盘804来输入, 该鍵盘包含用于在音乐片段列表中开始和停止音乐数据的回放的键 805-1、用于暂停的键805-2、用于快进的鍵805-3以及用于快退的鍵 805-4.另外,示出鍵805-5和805-6,用于确定输出音量.当在包含 音乐片段列表的文件夹结构中导航时,键805-7允许返回前一项,鍵 805-8允许选择下一项,鍵805-9允许向上移动一级,并且805-10允 许向下移动一级. 在图形用户界面802中,示出了几个目录806-1、 806-2、播放列 表806-3、 806-4和风格选择器806-5、 806-6.在进入目录806-1之 前,用户可以选择"播放摘要"按钮807.在选择时,目录806-1的音 乐数据的混合曲可以例如通过头戴耳机或扬声器(二者在困8中未示 出)被播放给该用户.该用户然后可以决定是否进入该目录.如果他/ 她不喜欢该摘要,那么他/她可以转到下一或前一容器、例如目录、播 放列表、或文件夹,或者如果目录以分级的方式被构造,那么他/她可 以向上一级.在困8中所示的例子中,还为播放列表806-3、 806-4以及风格选 择器806-5、 806-6提供了用于播放摘要的选项.在后一情况下,将呈 现由相同风格的歌曲构成的混合曲.因此,手持装置800使用户能够方便地浏览音乐集合,给他提供 目录、播放列表、文件夹、和/或风格选择器的内容的快速印象.这可 以允许用户决定该内容是否符合他的口味/当前的心情和/或选择是否 可能是正确的选择.在另一实施例中,文件夹/目录可以是在线音乐商店的目录.如果 该用户喜欢该混合曲,那么他/她可能想购买该文件夹/目录的所有或 至少部分的歌曲.为了与其它装置、例如外部数据存储器或另外的音频装置通信, 附加地提供了网络访问812.图9示出用于提供音乐片段概观的装置900的另一实施例.装置 900仅允许受限制的用户交互用户界面包含小的、单行的显示屏902 以及有限数目的具有预定功能的鍵903.音频输出通过扬声器904来支 持.装置900可以是汽车音频设备的部分.浏览大的音乐集合或者选择文件夹或播放列表来进行收听在这种 环境中对于用户来说可能是单调乏味和痛苦的任务.如果高分辨率的 固形界面不可用,那么有限的视觉显示建立对通过音频信号来交换信 息的需要.作为音频数据的摘要而生成的、并提供文件夹或播放列表 的内容的非视觉概观的混合曲可能是支持用户使用该装置的一个重要 信息.具有受限制的用户界面的音频系统可以在汽车中找到,在汽车中 驾驶员的视觉注意力转向周围的交通,并且驾驶员的额外的分心是不
可接受的.具有受限制的用户交互的音频装置的另一例子是在居室环境中所使用的高保真(hi-fi)系统.在此,通常仅仅小的显示屏、有 限数目的键、以及具有有限数目的按钮的附加遥控器是可用的.图10示出包含客户机100和服务器1002的本发明的另一实施例. 客户机100包含数据处理器1010、数据存储器1012、以及发送接收单 元1014.服务器1002包含发送/接收单元1022、数据处理器1024、以 及数据库1026.数据处理器IOIO可以负责生成混合曲.用作混合曲生成的基础的 音乐数据可以从位于客户机1000处的数据存储器1012检索.替代地 或者附加地,音乐数据可以从服务器1002检索.为此,客户机1000 可以使用它的发送/接收单元1014来发送对音乐数据的请求.该请求 被该服务器1002的发送/接收单元1022接受.然后该请求被数据处理 器1024处理,该处理器从数据库中检索所请求的数据,并通过相应的 发送/接收单元1022和1014将该数据发送回该客户机1000.客户机 1000的数据处理器1010然后可以生成包含所检索的音乐数据的混合 曲.如果需要附加的信息来生成该混合曲,那么可以从本地数据存储 器1012或从位于服务器1002上的数据库1026检索该信息.这种附加的信息可以包括与要生成的混合曲的音乐片段有关的元数据.所述元 数据可以自动地被预先计算/确定或被手动标注,并且可以被集中地例 如存储在可以通过因特网访问的大的音乐数据库中.该元数据然后例 如可以被用作在乐节聚类步稞S206中确定所述第一量度和/或在音乐 片段聚类步稞S202中确定所述第二量度的基础.因此,在图10中所示的客户机-服务器体系结构使客户机能够访 问大的音乐数据库,以便检索可以被用于例如通过生成混合曲来提供 音乐片段概观的音乐数据和/或元数据.在检索到所需数据之后,该客 户机1000的数据处理器1010可以例如按照如困1或图2中所述的步 骤生成混合曲.此外,该客户机1000可以仅仅向服务器1002发送生成混合曲的 请求.该请求可以包含关于如何生成该混合曲的另外的信息、例如应 被并入到该混合曲中的音乐片段的标題列表.该请求可以通过该客户 机的发送/接收单元1014来发送,并且可以通过该服务器的发送/接收 单元1022来接收.生成该混合曲的计算负荷在这种情况下将由服务器1002来承担.在这种情况下,用于生成该混合曲的步驟可以由服务器 1002的处理器1024例如按照在困1或图2中所描绘的步骤来执行.在 生成之后,该混合曲可以由服务器1002的发送/接收单元1022发送给 客户机1000的发送/接收单元1014.然后它可以被播放给客户机1000 的用户,并且,如果需要,那么可以被存储在本地数据存储器1012中.图11示出具有客户机-服务器体系结构的本发明的另一实施例. 在此,该客户机通过个人计算机1101来实现,该个人计算机包括显示 器1102.通过因特网1103,客户机1101被连接到服务器1104,该服 务器包含数据处理器1106、数据存储器1108、以及传输单元1110.在图11中所描绘的例子中,该服务器1104提供对在线音乐商店 的访问.该客户机1101的显示器1102显示该在线音乐商店的困形用 户界面.在此,可以提供歌曲集合。用户可以在把集合添加到他的购 物车之前请求播放套餐(package)的摘要.这样做时,他/她可以获得该套餐的内容的快速印象,并且可以决定是否购买该套餐.在该例 子中,每个套餐的摘要可以包含按照困1或2中所描绘的步驟而生成的该套餐的概观.上述的实施例还可以用在用于生成混合曲的方法中.例如,用户 可能完全不想收听某一目录/播放列表的歌曲.在这种情况下,上述的 原理可以被用于生成用户能够喜爱的混合曲,其中该混合曲仅仅包含 该目录/播放列表的歌曲的部分.换句话说,该混合曲包含重新布置的 乐节,例如在困3中所示的乐节308' 、 306' 、 310'或者在图4的下 部所示的乐节408-1、 408-2、....
权利要求
1. 用于提供音乐片段概观的方法,包括提供至少两个音乐片段;确定所述音乐片段的至少两个乐节,其中所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个中确定;以及将所述乐节布置在一个序列中.
2. 根据权利要求l所述的方法,其中为所述乐节确定第一量度, 所述第一量度描述相应乐节的至少一个笫一特性,并且根据所述笫一 量度来布置所述乐节.
3. 根据权利要求2所述的方法,其中根据所述第一量度来确定所 述乐节中的至少两个之间的距离,并且所述乐节中的所述至少两个中 的第一乐节和所述乐节中的所述至少两个中的第二乐节被布置在所述序列的开头,所述第一乐节和所述笫二乐节在所有的所述乐节中的所 述至少两个中具有最高的距离差.
4. 根据权利要求3所述的方法,其中执行第一聚类,根据所述第 一量度把所述乐节划分为乐节群集,并且其中根据所述第一聚类将所 述乐节布置在所述序列中.
5. 根据权利要求4所述的方法,其中所述序列包括至少一个子序 列,所述子序列包括属于所述乐节群集中的相同乐节群集的所述乐节 中的至少两个.
6. 根据前述权利要求中任一所述的方法,其中为所述音乐片段中 的至少一个确定第二量度,所述第二量度描述相应音乐片段的至少一 个笫二特性,并且执行笫二聚类,根据所述笫二量度把所述音乐片段 划分为音乐片段群集,并且其中根据所迷笫二聚类来确定所述乐节.
7. 根据权利要求6所述的方法,其中从所述音乐片段中的代表性 音乐片段中确定所述乐节中的至少一个代表性乐节,所述代表性音乐 片段位于相应音乐片段群集的质心的附近.
8. 根据权利要求7所述的方法,其中所述至少一个代表性乐节被 布置在所述序列的开头.
9. 根据权利要求6至8中任一所述的方法,其中确定所述音乐片 段群集中的每一个的大小,并且其中根据所述大小来确定所述乐节, 使得在所述序列中,为源自相应音乐片段群集中的音乐片段的乐节所 分配的时间量与它的大小相对应.
10. 根据权利要求2至9中任一所述的方法,其中所述第一特性 和/或所述第二特性是可听特性.
11. 根据权利要求2至10中任一所述的方法,其中根据元数据来 确定所述第一量度和/或所述第二量度,所述元数据被预先计算和/或 被手动标注.
12. 根据前述权利要求中任一所述的方法,其中所述乐节至少包 含相应音乐片段的代表性部分、合唱、副歌、和/或歌声.
13. 根据前述权利要求中任一所述的方法,其中对所述乐节中的 至少一个应用渐变过程.
14. 根据前述权利要求中任一所述的方法,其中在向用户播放混 合曲之前,生成或预先计算并从数据存储器中检索所述混合曲.
15. 音乐回放装置,包括数据存储器,被配置用于存储至少两个音乐片段; 数据处理器,被配置用于确定所述音乐片段的至少两个乐节,所 述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从 所述音乐片段中的另一个中确定,以及用于将所述乐节布置在一个序 列中.
16. 根据权利要求15所述的装置,还包括发送/接收单元,该发 送/接收单元被配置用于接收所述至少两个音乐片段和/或元数据,该 元数据描述所述音乐片段中的至少一个的至少一个特性.
17. 系统,包括服务器,包括数据库,该数据库包含音乐片段和/或描述所述音乐 片段的至少一个特性的元数据;以及 客户机,包括发送/接收机构,被配置用于接收所述服务器的所述音乐片段 中的至少两个和/或所述元数据;数据处理器,被配置用于确定所述音乐片段的至少两个乐节, 所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另 一个 从所述音乐片段中的另一个中确定;以及用于将所迷乐节布置在一个 序列中。
18. 系统,包括 服务器,包括数据库,该数据库包含至少两个音乐片段和/或描迷所述音乐 片段的至少一个特性的元数据;数据处理器,被配置用于确定所述音乐片段的至少两个乐节, 所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个 从所述音乐片段中的另一个中确定,以及用于将所述乐节布置在一个 序列中;发送/接收机构,被配置用于发送所述序列;以及 客户机,包括发送/接收机构,被配置用于接收所述服务器的所述序列.
19. 一种计算机可读介质,包括使计算机执行用于生成混合曲的方法的计算机程序指令,包括 提供至少两个音乐片段;确定所述音乐片段的至少两个乐节,其中所述乐节中的笫一乐节 从所述音乐片段之一 中确定,并且所述乐节中的第二乐节从所述音乐 片段中的另一个中确定;以及将所述乐节布置在一个序列中.
全文摘要
本发明涉及用于提供音乐片段概观的方法和装置。用于提供音乐片段概观的方法包括提供至少两个音乐片段;确定所述音乐片段的至少两个乐节,其中所述乐节之一从所述音乐片段之一中确定,并且所述乐节中的另一个从所述音乐片段中的另一个确定;以及将所述乐节布置在一个序列中。
文档编号G10H1/00GK101399037SQ20081016816
公开日2009年4月1日 申请日期2008年9月28日 优先权日2007年9月28日
发明者J·埃金克, T·坎普, W·哈格 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1