实现分类播放的媒体播放器及分类播放方法

文档序号:6779739阅读:180来源:国知局
专利名称:实现分类播放的媒体播放器及分类播放方法
技术领域
本发明涉及媒体播放技术,特别涉及一种实现分类播放的媒体播放器、 以及 一 种媒体文件的分类播放方法。
背景技术
随着多媒体技术的不断发展,媒体播放器得到了广泛的应用。图1为现有媒体播放器的结构示意图。如图l所示,现有媒体播放器包括主控单元 101、媒体文件库102、音频解码单元103和音频输出单元104。主控单元101根据外部输入的用户指令,将媒体文件库102中与该用户 指令对应的至少 一个媒体文件输出给音频解码单元103。其中,媒体文件库102中存储着多个媒体文件。音频解码单元103对接收到的媒体文件进行音频解码,并将音频解码后 音频数据输出给音频输出单元104。音频输出单元104播放输出接收到的媒体文件。可见,上述媒体播放器通过查找、音频解码和输出,实现了媒体文件的 播放。然而,由于用户对媒体播放的需求越来越多样化,例如,用户在不同 的环境或不同的时间可能希望播放不同的媒体文件,因此,上述媒体播放器 只能简单地进行查找、音频解码和输出以实现对媒体文件的播放,已经无法 有效满足用户的需求,从而使得现有媒体播放的实用性不高。发明内容有鉴于此,本发明了提供一种实现分类播放的媒体播放器、以及一种媒 体文件的分类播放方法,能够提高媒体播放的实用性。本发明提供的一种实现分类播放的媒体播放器,包括主控单元、媒体 文件库、音频解码单元、音频输出单元,该媒体播放器进一步包括音乐情 感分类单元,其中,所述音频解码单元,对接收到的媒体文件进行音频解码,并将音频解码后音频数据输出;所述音乐情感分类单元,对解码后的音频数据进行情感分析,根据分析结果并按预设的情感类别进行分类,将分类结果提供给主控单元;所述主控单元,根据用户输入的类别选择指令,调取媒体文件库中与该指令所表示类別相同的各媒体文件用以播放。所述音乐情感分类单元包括音乐元素分析子单元、心理模型匹配子单元,其中,所述音乐元素分析单元,接收来自所述音频解码单元的音频数据,从当 前接收到的音频数据中提取各种音乐基本元素,将提取出的音乐基本元素作 为分析结果,与当前接收到的音频数据对应的媒体文件标识一起输出给所述 心理模型匹配子单元;所述心理模型匹配单元,存储多个预设的心理模型;将当前接收到的分 析结果与心理模型进行匹配,得到与媒体文件标识表示的媒体文件匹配的心 理模型,将匹配的心理模型作为该媒体文件所属的情感类别,与对应的媒体 文件标识 一 起输出给所述主控单元。所述音乐情感分类单元中包括简单特征提取子单元和具有智能学习功 能的分类器,其中,所述简单特征提取子单元,接收音频解码后的音频数据,从接收到的音 频数据中提取简单特征后,输出给所述分类器;所述分类器根据预先计算得到的参数,对接收到的简单特征进行分析, 得到该简单特征对应的媒体文件所匹配的心理模型,并将每个媒体文件匹配 的心理模型与对应媒体文件标识 一起输出给所述主控单元。所述音乐情感分类单元包括列表存储子单元,用于存储每个媒体文件 所匹配的情感类别。 所述与媒体文件匹配的心理模型为与所述媒体文件的相关度大于预设 阈值的心理模型。所述列表存储单元进一步存储所述心理模型与所述媒体文件的相关度; 所述媒体播放器进一步包括显示单元,用于将当前播放的媒体文件与其匹配的心理模型的相关度显示输出。所述音乐基本元素包括音乐的速度、力度、节奏、旋律、音色。 所述媒体播放器为便携式播放器,所述音乐情感分类单元进一步按照预设的环境类别与情感类别的对应关系对媒体文件进行分类;其中,所述环境类别与情感类别的对应关系是按照环境对人类心理影响和音乐对心理影响之间的相关性建立的。该媒体播放器中进一步包括环境感测单元,用于感测该媒体播放器所处外部环境的环境参数;所述列表存储单元中进一步存储了环境参数与环境类别的对应关系;所述主控单元进一步根据所述环境参数与环境类别的对应关系,查找与 所述环境感测单元感测到的环境参数所匹配的环境类别。所述环境感测单元包括下述之一或任意组合加速度传感器、温度传感器、光传感器、声音传感器、计时器,其中,所述加速度传感器,感测所述媒体播放器在外力作用下移动时所具有的加速度,并将感测到的加速度取值输出给所述主控单元;所述温度传感器,感测所述媒体播放器所处外部环境的温度,并将感测到的温度取值输出给所述主控单元;所述光传感器,感测所述媒体播放器所述外部环境的光线强度,并将感 测到的光线强度取值输出给所述主控单元;所述声音传感器,感测所述媒体播放器所述外部环境的声音的类别和强 度,并将感测到的信息输出给所述主控单元;所述计时器,将当前时间输出给所述主控单元。所述音乐情感分类单元进一步按照预设的行为状态类别与情感类别的 对应关系对媒体文件进行分类;其中,所述行为状态类别与情感类别的对应关系是按照人类在不同行为 状态下对心理的需求和音乐对心理影响之间的相关性建立的。本发明提供的一种媒体文件的分类播放方法,包括 对接收到的媒体文件进行音频解码得到音频数据; 对解码后的音频数据进行情感分析,根据分析结果并按预设的情感类别 进行分类;根据用户输入的类别选择指令,调取媒体文件库中与该指令所表示类别 相同的媒体文件用以播放。所述对解码后的音频数据进行情感分析,根据分析结果并按预设的情感 类别进行分类包括从音频数据中提取各种音乐基本元素,将提取出的音乐基本元素作为分 析结果;将所述分析结果与预设心理模型进行匹配,得到与媒体文件标识表示的 媒体文件匹配的心理模型,将匹配的心理模型作为该媒体文件所属的情感类 别,与对应的媒体文件标识一起输出。所述对解码后的音频数据进行情感分析,根据分析结果并按预设的情感类别进行分类包括从音频数据中提取简单特征;根据预先计算得到的参数,对接收到的简单特征进行分析,得到该简单 特征对应的媒体文件所匹配的心理模型,并将匹配的心理模型作为该媒体文 件所属的情感类别,与对应媒体文件标识 一起输出。所述将匹配的心理模型作为该媒体文件所属的情感类别,与对应媒体文 件标识 一起输出之后,该方法进一 步包括存储媒体文件所匹配的情感类别。该方法进一步包括设置所述心理模型与所述媒体文件的相关度;在播放媒体文件时,将当前播的媒体文件与其匹配的心理模型的相关度 所述音乐基本元素包括音乐的速度、力度、节奏、旋律、音色。 所述对解码后的音频数据进行情感分析,根据分析结果并按预设的情感类别进行分类进一步包括按照预设的环境类别与情感类别的对应关系对媒体文件进行分类;其中,所述环境类别与情感类别的对应关系是按照环境对人类心理影响和音乐对心理影响之间的相关性建立的。所述按照预设的环境类别与情感类别的对应关系对媒体文件进行分类之前,该方法进一步包括感测外部环境的环境参数;根据所述环境参数与环境类别的对应关系,查找与感测到的环境参数所 匹配的环境类别。所述对解码后的音频数据进行情感分析,根据分析结果并按预设的情感 类别进行分类进一步包括按照预设的行为状态类别与情感类别的对应关系对媒体文件进行分类;其中,所述行为状态类别与情感类别的对应关系是按照人类在不同行为 状态下对心理的需求和音乐对心理影响之间的相关性建立的。有上述技术方案可见,本发明根据用户输入的指令,将该指令对应类别 的各媒体文件进行音频解码并播放。例如,用户可根据其当前的心情、其当 前所处环境、其当前行为状态,输入相应的指令,表示其希望听到不同舒緩 度、激情度等类别的音乐,媒体播放器即可根据该指令播放符合用户需求的 媒体文件,满足了用户对媒体播放的多样化需求,从而能够提高媒体播放的实用性。


图1为现有媒体播放器的结构示意图。图2为本发明中实现分类播放的媒体播放器的结构示意图。
图3为本发明中媒体文件的分类播放过程的流程示意图。 图4为本发明中媒体文件分类过程的流程示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举 实施例,对本发明进一步详细说明。本发明中,根据用户输入的指令,将该指令对应类别的各媒体文件进行 音频解码并播放。例如,用户可根据其当前的心情或其当前所处环境输入相 应的指令,表示其希望听到不同舒緩度、激情度等类别的音乐,媒体播放器 即可根据该指令播放符合用户需求的媒体文件。其中,媒体文件的分类可以按照如下方式来实现先对音频解码后的音 频数据进行音乐基本元素分析,得到包括媒体文件的音乐播放速度、力度、 节奏、旋律、音色等音乐基本元素的分析结果;然后将分析结果与预设的心 理模型进行匹配,例如与表示不同舒緩度、激情度等心理模型进行匹配,得 到与媒体文件匹配的心理模型,作为表示情感类别的匹配结果,匹配相同心 理模型的各媒体文件,即属于相同的类别。图2为本发明中实现分类播放的媒体播放器的结构示意图。如图2所示, 该媒体播放器包括主控单元101、媒体文件库102、音频解码单元103、 音频输出单元104、音乐情感分类单元205、显示单元206。音频解码单元103,对接收到的媒体文件进行音频解码,并将音频解码 后的音频数据输出给音乐情感分类单元205或音频输出单元104。音乐情感分类单元205,对解码后的媒体文件进行情感分析,根椐分析 结果并按预设的情感类别进行分类,将分类结果提供给主控单元101。主控单元IOI,根据用户输入表示不同情感类别的类别选择指令,调取 媒体文件库102中与该指令所表示类别相同的各媒体文件用以播放。例如,主控单元可将与该指令所表示类别相同的各媒体文件的音频数据 通过显示鱼元206显示到用户界面(供用户选择是否播放、选择播放其中的
哪一个或哪几个媒体文件)、或经音频解码单元103解码后由音频输出单元 104播放。可见,上述媒体播放器实现了媒体文件的分类播放。在分类播放之前,主控单元101、音频解码单元103和音乐情感分类单 元205还需要进行协同处理,以对媒体文件库102中存储的媒体文件进行分类。主控单元101,将媒体文件库102中的媒体文件依次输出给音频解码单 元103。音频解码单元103,对接收到的媒体文件进行音频解码,并将音频解码 后的音频数据输出给音乐情感分类单元205。音乐情感分类单元205,从来自音频解码单元103的音频数据中提取媒 体文件的播放速度、力度、节奏、旋律、音色等各种音乐基本元素;将从各 音频数据中提取出的音乐基本元素分别与预设的各心理模型进行匹配,将解 码后的音频数据匹配不同心理模型的媒体文件分为不同情感类别,并存储情 感类别与媒体文件的对应关系,以实现如图2所示的媒体播放器能够按类别 播放对应的媒体文件。这样,上述如图2所示的媒体播放器则能够实现基于不同心理模型的媒 体文件分类播放。用户即可根据其当前的心情或其当前所处环境,选择播放 不同舒緩度、激情度等类别的媒体文件。具体来说,音乐情感分类单元205可以从媒体文件中提取各种音乐基本 元素,并根据提取出的音乐基本元素与预设心理模型的匹配结果对媒体文件 进行分类;音乐情感分类单元205还可以通过智能学习方式对媒体文件进行 分类。如杲采用前一种方式,则音乐情感分类单元205中可以包括音乐元素 分析子单元2051、心理模型匹配子单元2052、列表存储子单元2053。音乐元素分析子单元2051,从当前接收到的音频数据中提取各种音乐 基本元素,例如音乐播放速度、力度、节奏、旋律、音色等,并将提取出的 音乐基本元素作为分析结果,与该音频数据对应的媒体文件标识一起输出给心理模型匹配子单元2052。其中,播放速度、力度、节奏、旋律、音色等音乐基本元素,均可以按 照其元素特性并利用现有方式来提取。心理模型匹配子单元2052,存储多个预设的心理模型,例如表示不同 舒緩度、不同激情度等心理模型;将当前接收到的分析结果与心理模型进行 匹配,得到与媒体文件标识表示的媒体文件匹配的心理模型,将匹配的心理 模型作为该媒体文件所属情感类别,与对应的媒体文件标识一起输出给列表 存储子单元2503。其中,不同心理模型是由不同取值的各种音乐基太元素构成的,因此, 将提取出的音乐基本元素与心理模型中的音乐基本元素进行比较,即可获得 匹配的心理模型。匹配的方式可以为如果从某一媒体文件的音频数据中提 取的音乐基本元素与某一 心理模型中的各音乐基本元素的相关度大于预设 域值时,即该媒体文件与该心理模型的相关度大于预设域值时,则确定该媒 体文件与该心理模型匹配。例如,当从媒体文件1中提取的音乐基本元素, 与心理模型1中的对应音乐基本元素的相关度为90%,大于预设阔值60%, 则确定媒体文件1与心理模型1匹配。该相关度可看作媒体文件与其所属类 别的相关度。列表存储子单元2053,存储着分类列表,列表中包括每个媒体文件所匹配的情感类别。如果心理模型匹配子单元2052还将每个媒体文件与其所属情感类别的 相关度也输出给列表存储子单元2053,则列表存储单元2053存储的分类列实际应用中,心理模型匹配子单元206可以直接将每个媒体文件所属情 感类别及其对应的媒体文件标识输出给主控单元101,使得主控单元101获 知每个媒体文件所属类别;这种情况下,可以由主控单元101再将每个媒体 并存储到分类列表中,以便后续接收到用户输入的指令能够根据该分类列表 中存储的对应关系获知对应情感类别的各媒体文件。当然,在确定分类类型后,也可以不以列表存储子单元2053的形式存在,可以直接在媒体库的相应媒体文件的属性上加上情感类型即可。心理模型匹配子单元2052还可以直接将每个媒体文件所属情感类别及 其对应的媒体文件标识输出给存储列表子单元2053,并存储到分类列表中, 而不需主控单元101的中继转发。这样,主控单元101根据外部输入的用户指令和列表存储单元207中的 分类列表,将媒体文件库102中与该用户指令对应的至少一个类别的各媒体 文件输出给音频解码单元103。例如,心理模型1、心理模型2、心理模型3,分别表示悲伤度、激情 度、舒緩度这3个情感类别,则用户输入表示激情度和舒緩度的指令之后, 主控单元101即在列表存储单元207中查找与心理模型2和心理模型3所对 应的各媒体文件标识,然后调用媒体文件库102中与查找的各媒体文件标识 对应的媒体文件,输出给音频解码单元103。音频解码单元103对接收到的媒体文件进行音频解码,并将音频解码后 的音频数据输出给音频输出单元104。音频输出单元104播放输出接收到的音频数据,即实现了满足激情度等 级2和舒緩度等级1的各媒体文件的播放。用户输入的指令可能表示多种情感类别,用户输入的指令也可能表示随 机播放或表示各情感类别。这种情况下,为了使得用户能够获知当前播放的 媒体文件是属于哪一个情感类别,如图2所示的媒体播放器中的显示单元 206,还可以将当前播放的媒体文件所属情感类别的信息显示输出。其中,该信息可以是情感类别所对应的心理模型名称,也可以是心理模 型所表示的情感类别名称,例如,"舒緩度等级l"、"激情度等级2"等。同时,由于列表存储单元2053中还可以存储媒体文件与其所属类别的 相关度,因此,显示单元还可以将当前播放的媒体文件与其所属类型的相关 度显糸输出。这样,假设当前播放的媒体文件对应"舒緩度",同时输出该媒体文件与"舒緩度"所对应的心理模型的相关度80%;假设上一次播放的媒体文件也对应"舒緩度",上一次播放时输出该媒体文件与"舒緩度"所对应的心理模型的相关度70%,则用户即可获知,虽然两次播放的媒体文件均对应"舒緩度",但相比之下,当前播放的媒体文件更加舒緩。可见,本发明中的媒体播放器可根据用户输入的指令,播放符合用户在 当前环境或时间所希望播放的 一个或多个类别的媒体文件,满足了用户对媒 体播放的多样化需求,还能够进一步显示输出当前播放的媒体文件的相关信 息,从而进一步提高了媒体播放的实用性。上述实施例中音乐基本元素的定义十分直观,与心理模型之间有着直接 的对应关系,但是其中多数元素的计算过程较为复杂,计算结果也不能充分 表征该元素的意义,因此,我们可以简化音乐元素的提取,代之以一些计算 简单的特征,并采用智能学习的方法实现媒体文件的分类。该实施方案的特 点在于特征计算简单、分类器设计理论成熟、基于学习的分类方法更为可靠。在音乐情感分类单元205中,用一个简单特征提取子单元和分类器替换 音乐元素分析子单元2051和心理模型匹配子单元2052。其中的简单特征可 以包括短时能量、短时平均幅度、短时谱特征等;分类器可以为现有的人工 神经网络(Artificial Neural Network, ANN )分类器、隐马尔科夫模型(Hidden Markov Model, HMM )分类器等任意 一种具有学习能力的现有分类器。在利用分类器进行媒体文件的分类之前,预先挑选若干媒体文件,并结 合经验值对这些媒体文件的心理模型分别进行评定,确定每个媒体文件所匹 配的心理模型。然后将确定的匹配不同心理模型的媒体文件的音频数据作为 分类器的训练样本;提取训练样本的简单特征作为分类器的输入,将媒体文 件对应的心理模型作为分类器的期望输出,根据预设学习法则计算出分类器 的参数,以使得分类器输出的心理模型尽量接近期望输出,从而实现分类器 的训练过程,也就是智能学习过程。经过训练过程的分类器即可实现媒体文件的分类。简单特征提取子单元 的输入端与音频解码单元103相连,接收音频解码后的音频数据,从接收到 的音频数据中提取简单特征后,输出给分类器;分类器根据预先计算得到的 参数,对接收到的简单特征进行分析,最后输出该简单特征对应的媒体文件 所匹配的心理模型。除此之外,分类器还可以输出简单特征对应的媒体文件 与其匹配的心理模型的相关度,即该媒体文件以多大的概率匹配于该心理模 型。这样,音乐情感分类单元205即可将分类器得到的每个媒体文件匹配的 心理模型以及对应的媒体文件标识一起输出给主控单元101;还可以根据每 个媒体文件匹配的心理模型确定并存储每个文件所属情感类别,并将每个媒 体文件所属情感类别及其对应的媒体文件标识输出给主控单元101。上述如图2所示的媒体播放器,可以为体积小巧,便于携带的便携式播 放器,这样,用户随身携带该媒体播放器处于不同的环境下,则可以输入其 所处环境的类别,媒体播放器的列表存储单元207中还存储了环境类别与情 感类别的对应关系,主控单元101即可根据该对应关系,在列表存储单元 207中查找与任意一种环境类别所对应情感类别对应的各媒体文件标识,并 调取媒体文件库102中与查找到的媒体文件标识所对应的各媒体文件,经由 音频解码单元103和音频输出单元104来播放。具体来说,音乐情感分类单元205可以进一步按照预设的环境类别与情感 类别的对应关系对媒体文件进行分类,即音乐情感分类单元205中可存储该对 应关系。主控单元101即可根据用户输入的表示不同环境类别的类别选择指令, 以及环境类别与情感类别的对应关系,调用媒体文件库102中,与该指令所表 示环境类别相同的各情感类别的媒体文件通过显示单元206显示到用户界面、 或经音频解码单元103解码后由音频输出单元104播放。简单的说,就是使得 用户能够在不同环境听不同的音乐。其中,环境类别与情感类别的对应关系是根据环境对人类心理影响和音 乐对心理影响之间的相关性建立的。而环境对人类心理影响、音乐对心理影 响可以是预先统计分析的经验值。 可见,本发明中的媒体播放器还可以使得用户能够根据其自身所处环境 来选择媒体文件,进一步提高了媒体播放器的实用性。进一步地,本发明中的媒体播放器还可以自动识别其自身所处环境状 态,从而自动选择符合该环境状态的心理模型所对应的媒体文件进行播放。这种情况下,该媒体播放器中进一步包括环境感测单元(图中未示出), 用于感测该媒体播放器所处外部环境的环境参数。具体来说,环境感测单元中可以包括下述之一或任意组合加速度传感器、温度传感器、光传感器、计时器。加速度传感器,感测媒体播放器在外力作用下移动时所具有的加速度,并将感测到的加速度取值输出给所述主控单元101,例如,如果媒体播放器为便 携式,则用户会带动该媒体播放器行走、奔跑,对该媒体播放器产生加速度。温度传感器,感测媒体播放器所处外部环境的温度,并将感测到的温度取 值输出给所述主控单元101,主控单元101可根据当前光照强度选择对应的媒 体文件播放,例如在温度较高时可以播放激情度较高的媒体文件,在温度较低 时则播放舒緩度较高的媒体文件。光传感器,感测媒体播放器所述外部环境的光线强度,并将感测到的光线 强度取值输出给主控单元101,主控单元101可根据当前光照强度选择对应的 媒体文件播放,例如在光照强度较高时可以播放激情度较高的媒体文件,在光 照强度较低时则播放舒緩度较高的媒体文件。声音传感器,可以是麦克风,感测媒体播放器所述外部环境的声音的类别 和强度,并将感测到的信息输出给主控单元101。计时器,将当前时间输出给所述主控单元101,主控单元101可根据当前 时间判断出当前是白天或是夜晚,从而选择对应的媒体文件播放,例如在白天 可以播放激情度较高的媒体文件,在夜晚则播放舒緩度较高的媒体文件。同时,列表存储单元207中则进一步存储了环境参数与环境类别的对应 关系;主控单元101则根据环境参数与环境类别的对应关系,查找与环境感 测单元感测到的环境参数所匹配的环境类别。
例如,假设加速度传感器测量到的加速度值大于预设的阈值,则主控单 元根据环境参数与环境类别的对应关系,判断出媒体播放器当前所处环境为 运动环境,再根据环境类别与心理模型的对应关系,在列表存储单元207中 查找表示激情度等级1 n的心理模型所对应的媒体文件标识,从而将媒体文 件库102中与上述媒体文件标识对应的媒体文件输出给音频解码单元103, 以实现激情度等级l~n的媒体文件的播放。同理,主控单元101根据接收到的各种环境参数的取值、以及列表存储 单元207中环境参数与环境类别的对应关系,自动判断出媒体播放器当前所 处的环境类别,进而查找与对应心理模型对应的媒体文件并播放。可见,本发明中的媒体播放器还能够自动根据其自身所处环境来选择媒 体文件,更进一步地提高了媒体播放器的实用性。本发明提供的媒体播放器,还能够根据用户所处的行为状态,例如用户 在休息、在工作、在健身、在学习、睡觉前、在行走、在散步时等行为状态 下,对心理的需求,选择对应情感类别的媒体文件进行播放。这种情况下,音乐情感分类单元205进一步按照预设的行为状态类别与 情感类别的对应关系对媒体文件进行分类,即音乐情感分类单元205中可存 储该对应关系。主控单元101即可根据用户输入的表示不同行为状态类别的 类别选择指令,例如表示用户在休息、在工作、在健身、在学习、睡觉前、 在行走、在散步时等人类行为状态,以及行为状态类别与情感类别的对应关 系,调用媒体文件库102中,与该指令所表示行为状态类别相同的各情感类 别的媒体文件通过显示单元206显示到用户界面、或经音频解码单元103解 码后由音频输出单元104播放。简单的说,就是使得用户在做不同的事情时 能够听到不同的音乐。其中,行为状态类别与情感类别的对应关系是按照人类在不同行为状态 下对心理的需求和音乐对心理影响之间的相关性建立的。人类在不同行为状 态下对心理的需求、音乐对心理影响可以是预先统计分析的经验值。以上是对本发明中媒体播放器的详细说明,下面,对本发明媒体播放中
的分类方法进行详细说明。图3为本发明中媒体文件的分类播放过程的流程示意图。如图3所示, 该方法包括以下步骤步骤301,根据用户输入的指令和预先获取的情感类别与媒体文件的对应关系,将与该指令所表示类别的各媒体文件进行音频解码。本步骤之前,先对媒体文件进行音频解码得到音频数据,然后对解码后的音频数据进行情感分析,根据分析结果并按预设的情塵类别进行分类,分类过程与如前所述的媒体播放器内部处理过程相同,在此不再赘述。 用户可输入表示不同情感类别的类别选择指令,这样,本步骤中,即可根据用户输入的该指令,查找与其表示的情感类别的各媒体文件,并进行音频解码。本步骤之前,用户还可以输入表示不同环境类别或不同行为状态类别的 类别选择指令,这样,在本步骤中,即可根据预先获取的环境类别与情感类 別的对应关系、和/或行为状态类别与情感类别的对应关系,查找对符合环 境类别或行为状态类别的各媒体文件进行音频解码,用以实现用户能够在不 同环境听不同的音乐、或用户在做不同的事情时能够听到不同的音乐。步骤302,利用解码后的音频数据播放媒体文件。在执行本步骤的同时,还可以将当前播放的媒体文件所属情感类别显示 输出。至此,本流程结束。其中,在上述流程中的步骤301之前,可以通过如下过程来实现媒体文 件的分类。图4为本发明中媒体文件分类过程的流程示意图。如图4所示, 步骤401,将媒体文件库中的媒体文件进行音频解码。 步骤402,从音频解码后的音频数据中提取各种音乐基本元素,例如该 媒体文件的音乐播放速度、力度、节奏、旋律、音色等。本步骤中,以节奏为例,提取音乐基本元素的过程可以为402a,以帧为单位接收音频解码后的音频数据,对当前接收到的一帧音 频数据(包括1024个采样点的时域信号)使用FFT变换将信号从时域编换 到频域,得到频域复信号a。+jbn, n为大于等于O且小于等于51的正整数。402b,计算频域复信号的幅度A[n^ Va 2 +b 2 。402c,按照预先划分的多个子带,分别计算每个子带的幅度,作为瞬时^匕一1" fl匕里。例如,可以按照50~200、 200 400、 400 800、 800 1600、600 3200、 3200Hz以上,共划分6个子带。实际应用中,瞬时能量可按照如下公式来计算丄I^W,其中,£/[,']表示第i个子带的瞬时能量、^表示第i个子带的宽度、S,表示第i个子带的起始谱线,i为大于l的正整数。每次执行402c之后,均存储当前帧的各子带瞬时能量,并按照先进先 出的原则,删除最先存储的 一个帧的各子带瞬时能量。402d,读取已存储的m个帧的各子带的瞬时能量fi0[/],分别计算m个 帧在每个子带的瞬时能量£/[/]的平均值^[/]和方差。其中,m为1秒内緩存在历史能量緩冲子单元2054的帧数量,m的取 值通常为43。实际应用中,第i个子带的瞬时能量平均值W[/]和第i个子带的瞬时能 量方差A,K|/j可以分别按照如下公式来计算£4,1 =丄££0,[,.], j为大于等于l且小于等于m的正整数、£0,[/1为读取" H的第j个帧的第i个子带的瞬时能量; 五「[,]=丄^(£0,[/] —m[/])2。402e,根据计算得到的W[,1和^7[,],判断当前帧每个子带的瞬时能量 /可/]是否为峰值能量,如果是,则将判断为峰值能量的£/[/]确定为提取的音
乐基本元素并输出,即实现了音乐基本元素中节奏的提取。其中,当大于C x E4卩]、且大于V时,判断£/[/]为峰值能量,C和V是两个由实验确定的常数,通常情况下,C=250, V=150。至于播放速度、力度、旋律、音色等音乐基本元素提取,则可通过现有方式来实现。步骤403,将从当前音频数据中提取出的音乐基本元素与预设的心理模 型进行匹配,将与当前媒体文件匹配的心理模型作为该音频数据对应的媒体 文件所属的媒体文件类型。本步骤中,预设的心理模型可以为表示不同舒緩度、不同激情度等心理模型。其中,不同心理模型是由不同取值的各种音乐基本元素构成的,因此, 将提取出的音乐基本元素与心理模型中的音乐基本元素进行比较,即可获得 匹配的心理才莫型。步骤404,存储每个媒体文件与其所属情感类别的对应关系。至此,本流程结束。可见,基于如图4所示的流程,在媒体播放时,通过如图3所示的流程 能够播放符合用户在当前环境或时间所希望播放的一个或多个类别的媒体 文件,满足了用户对媒体播放的多样化需求,从而能够提高媒体播放的实用性。除此之外,本发明中还可以进一步预先设置环境类别与情感类别的对应 关系、和/或行为状态类别与情感类别的对应关系。这样,在执行如图3所示流程的步骤301之前,如果用户输入的指令表 示环境类别,则步骤301中的具体处理过程可以包括根据用户输入的表示环境类别和/或行为状态类别的指令、环境类别与 情感类别的对应关系、和/或行为状态类别与情感类别的对应关系,确定对 应的情感类别;的对应关系,将与所确定的情感类别对应的各 媒体文件进行音频解码。涉及上述环境类别和/或行为状态类别的分类过程,与如前所述的媒体 播放器内部处理过程相同,在此不再赘述。这样,即可使得用户根据其当前所处环境、和/或其行为状态,选择播 放用户所需的媒体文件。以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范 围。凡在本发明的精神和原则之内,所作的任何修改、等同替换以及改进等, 均应包含在本发明的保护范围之内。
权利要求
1、一种实现分类播放的媒体播放器,包括主控单元、媒体文件库、音频解码单元、音频输出单元,其特征在于,该媒体播放器进一步包括音乐情感分类单元,其中,所述音频解码单元,对接收到的媒体文件进行音频解码,并将音频解码后音频数据输出;所述音乐情感分类单元,对解码后的音频数据进行情感分析,根据分析结果并按预设的情感类别进行分类,将分类结果提供给主控单元;所述主控单元,根据用户输入的类别选择指令,调取媒体文件库中与该指令所表示类别相同的媒体文件用以播放。
2、 如权利要求1所述的媒体播放器,其特征在于,所述音乐情感分类单元 包括音乐元素分析子单元、心理模型匹配子单元,其中,所述音乐元素分析单元,接收来自所述音频解码单元的音频数据,从当前 接收到的音频数据中提取各种音乐基本元素,将提取出的音乐基本元素作为分 析结果,与当前接收到的音频数据对应的媒体文件标识一起输出给所述心理模 型匹配子单元;所述心理模型匹配单元,存储多个预设的心理模型;将当前接收到的分析 结果与心理模型进行匹配,得到与媒体文件标识表示的媒体文件匹配的心理模 型,将匹配的心理模型作为该媒体文件所属的情感类别,与对应的媒体文件标 识一起输出给所述主控单元。
3、 如权利要求1所述的媒体播放器,其特征在于,所述音乐情感分类单元 中包括简单特征提取子单元和具有智能学习功能的分类器,其中,所述简单特征提取子单元,接收音频解码后的音频数据,从接收到的音频 数据中提取简单特征后,输出给所述分类器;所述分类器根据预先计算得到的参数,对接收到的简单特征进行分析,得 到该简单特征对应的媒体文件所匹配的心理模型,并将匹配的心理模型作为该 媒体文件所属的情感类别,与对应媒体文件标识一起输出。
4、如权利要求2或3所述的媒体播放器,其特征在于,所述音乐情感分类单元包括列表存储子单元,用于存储每个媒体文件所匹配的情感类别。
5.如权利要求2或3所述的媒体播放器,其特征在于,所述与媒体文件匹 配的心理模型为与所述媒体文件的相关度大于预设阈值的心理模型。
6、 如权利要求2或3所述的媒体播放器,其特征在于,所述列表存储单元 进一 步存储所述心理模型与所述媒体文件的相关度;所述媒体播放器进一步包括显示单元,用于将当前播放的媒体文件与其匹 配的心理模型的相关度显示输出。
7、 如权利要求2所述的媒体播放器,其特征在于,所述音乐基本元素包括 音乐的速度、力度、节奏、旋律、音色。
8、 如权利要求2或3所述的媒体播放器,其特征在于,所述媒体播放器为 便携式播放器,所述音乐情感分类单元进一步按照预设的环境类别与情感类别 的对应关系对媒体文件进行分类;其中,所述环境类别与情感类别的对应关系是按照环境对人类心理影响和 音乐对心理影响之间的相关性建立的。
9、 如权利要求8所述的媒体播放器,其特征在于,该媒体播放器中进一步 包括环境感测单元,用于感测该媒体播放器所处外部环境的环境参数;所述列表存储单元中进一步存储了环境参数与环境类别的对应关系; 所述主控单元进一步根据所述环境参数与环境类别的对应关系,查找与所 述环境感测单元感测到的环境参数所匹配的环境类别。
10、 如权利要求9所述的媒体播放器,其特征在于,所述环境感测单元包 括下述之一或任意组合加速度传感器、温度传感器、光传感器、声音传感器、 计时器,其中,所述加速度传感器,感测所述媒体播放器在外力作用下移动时所具有的加 速度,并将感测到的加速度取值输出给所述主控单元;所述温度传感器,感测所述媒体播放器所处外部环境的温度,并将感测到 的温度取值输出给所述主控单元;所述光传感器,感测所述媒体播放器所述外部环境的光线强度,并将感测 到的光线强度取值输出给所述主控单元;所述声音传感器,感测所述媒体播放器所述外部环境的声音的类别和强度,并将感测到的信息输出给所述主控单元;所述计时器,将当前时间输出给所述主控单元。
11、 如权利要求2或3所述的媒体播放器,其特征在于,所述音乐情感分类单元进一步按照预设的行为状态类别与情感类别的对应关系对媒体文件进行分类;其中,所述行为状态类别与情感类别的对应关系是按照人类在不同行为状 态下对'g理的需求和音乐对'"、理影响之间的相关性建立的。
12、 一种媒体文件的分类播放方法,其特征在于,包括 对媒体文件进行音频解码得到音频数据;对解码后的音频数据进行情感分析,根据分析结果并按预设的情感类别进 行分类;根据用户输入的类别选择指令,调取媒体文件库中与该指令所表示类别相 同的媒体文件用以播放。
13、 如权利要求12所述的分类播放方法,其特征在于,所述对解码后的音 频数据进行情感分析,根据分析结果并按预设的情感类别进行分类包括从音频数据中提取各种音乐基本元素,将提取出的音乐基本元素作为分析 结果;将所述分析结果与预设心理模型进行匹配,得到与媒体文件标识表示的媒 体文件匹配的心理模型,将匹配的心理模型作为该媒体文件所属的情感类别, 与对应的媒体文件标识一起输出。
14、 如权利要求12所述的分类播放方法,其特征在于,所述对解码后的音 频数据进行情感分析,根据分析结果并按预设的情感类别进行分类包括从音频数据中提取简单特征; 根据预先计算得到的参数,对接收到的简单特征进行分析,得到该简单特 征对应的媒体文件所匹配的心理模型,并将匹配的心理模型作为该媒体文件所 属的情感类别,与对应媒体文件标识一起输出。
15、 如权利要求13或14所述的分类播放方法,其特征在于,所述将匹配 的心理模型作为该媒体文件所属的情感类别,与对应媒体文件标识一起输出之后,该方法进一步包括存储媒体文件所匹配的情感类别。
16、 如权利要求13或14所述的分类播放方法,其特征在于,该方法进一 步包括设置所述心理模型与所述媒体文件的相关度;在播放媒体文件时,将当前播的媒体文件与其匹配的心理模型的相关度显 示输出。
17、 如权利要求13所述的媒体播放器,其特征在于,所述音乐基本元素包 括音乐的速度、力度、节奏、旋律、音色。
18、 如权利要求13或14所述的分类播放方法,其特征在于,所述对解码 后的音频数据进行情感分析,根据分析结果并按预设的情感类别进行分类进一 步包括按照预设的环境类别与情感类别的对应关系对媒体文件进行分类; 其中,所述环境类别与情感类别的对应关系是按照环境对人类心理影响和 音乐对心理影响之间的相关性建立的。
19、 如权利要求18所述的分类播放方法,其特征在于,所述按照预设的环 境类别与情感类别的对应关系对媒体文件进行分类之前,该方法进一步包括感测外部环境的环境参数;根据所述环境参数与环境类别的对应关系,查找与感测到的环境参数所匹 配的环境类别。
20、 如权利要求13或14所述的分类播放方法,其特征在于,所述对解码 后的音频数据进行情感分析,根据分析结果并按预设的情感类别进行分类进一 步包括按照预设的行为状态类别与情感类别的对应关系对媒体文件进行分类; 其中,所述行为状态类别与情感类别的对应关系是按照人类在不同行为状 态下对心理的需求和音乐对心理影响之间的相关性建立的。
全文摘要
本发明提供了一种实现分类播放的媒体播放器和一种媒体文件的分类播放方法。本发明根据用户输入的指令,将该指令对应类别的各媒体文件进行音频解码并播放。例如,用户可根据其当前的心情、其当前所处环境、其当前行为状态,输入相应的指令,表示其希望听到不同舒缓度、激情度等类别的音乐,媒体播放器即可根据该指令播放符合用户需求的媒体文件,满足了用户对媒体播放的多样化需求,从而能够提高媒体播放的实用性。
文档编号G11B20/10GK101149950SQ20071017743
公开日2008年3月26日 申请日期2007年11月15日 优先权日2007年11月15日
发明者党宁娜, 律 谢 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1