接收、分析并编辑音频来创建音乐作品的系统和方法

文档序号:2824838阅读:422来源:国知局
专利名称:接收、分析并编辑音频来创建音乐作品的系统和方法
技术领域
本发明一般涉及音乐创作,并且更具体地涉及用于生成具有多个基本协调音轨的音乐汇编的系统和方法。
背景技术
音乐是一种公认的人类自我表达的众所周知的形式。然而,个人对此艺术进取心的直接认识可以以不同方式获得。通常,通过聆听他人的创作而不是他或她自己创作音乐, 人们可以更加容易地享受音乐。对于许多人,听到并辨认有感染力的音乐作品的能力是天生的,而人工创作适当音符集的能力却远不可及。个人创作新音乐的能力可能受时间、金钱和/或需要学习乐器到足以随意准确地再现调子的技能的限制。对于大多数人,他们自身的想象力可能是新音乐的源泉,但他们哼出或呤唱此同一调子的能力限制了他们哼的调子可以从形式上被保持并被再创作以供他人享受。记录一段时间音乐家的表现也是一个艰辛的过程。相同材料的多个制作被记录, 并辛苦地仔细检查直到单次制作可以与所有去掉的不完美录音组合。一个好的制作通常要求有天份的艺术家在另一艺术家的指导下相应地调节他或她的表现。在业余录音的情况下,最佳制作通常是意外运气带来的,因而不可以重复。更加普遍的是,业余表演者制作的制作中具有好、坏部分。如果不必一丝不苟地分析每个制作的每个部分就能构成一首歌,则录音过程可能更加容易,更有趣。因此,针对这些考虑和其它考虑做出了本发明。而且,个人希望创作的音乐可能是复杂的。例如,想像的调子可以具有一种以上的乐器,它可以与其它乐器以可能的布置同时演奏。此复杂性进一步增加了个人产生期望的声音组合所需的时间、技能和/或金钱。大多数乐器的物理配置还要求个人集中全部的精神注意力以手动生成音符,进一步要求另外的人员来演奏期望调子的附加部分。此外,则可能需要额外检查和管理来确保各个涉及乐器和期望调子的元素的适当交互。甚至对于已经喜爱创作其自己的音乐的人们,那些聆听者可能缺乏能够完成适当作品和音乐创作的这种技能。结果,创作的音乐可能包含不在同一音乐键或和弦内的音符。 在大多数音乐风格中,出现跑调或偏离和弦音符通常被称作“不协调”音符,使得音乐是令人不快刺耳的。相应地,因为缺乏经验和训练,音乐聆听者通常创作听起来不令人喜欢、不专业的音乐。对于一些人,艺术灵感不受通常与新音乐的生成和录音关联的相同时间和位置限制。例如,当新调子的想法突然出现时,个人可能不在手头有可演奏的乐器的作品工作室。 在灵感消失的瞬间,个人可能想不起原始调子的完整内容,导致艺术尝试的失败。而且,个人可能对于再创作只是他或她初始音乐发现的较差、不完美版本所投入的时间和精力感到泄气。专业的音乐作曲和编辑软件工具在当下是普遍可用的。但是,这些工具对新手用户入门造成令人胆怯的阻碍。此类复杂的用户界面可能很快耗尽敢于尝试艺术奇想的任何初学者的热情。限制于预置音频服务器套件还阻碍了想在移动中制作调子的移动创作风格。需要的是一种音乐创作系统和方法,它能容易地作为与用户最基本的能力的接口,又能够创作与用户的想像力和经验一样复杂的音乐。还存在便于脱离不协调音符的音乐创作的关联需要。此外,本领域中存在对于音乐创作系统的需求,该音乐创作系统能够基于自动选择标准将多个制作(take)的多个部分集合从而生成音乐汇编音轨。还希望此系统进一步以不受在灵感出现时用户所处位置限制的方式实现,从而能够捕捉新音乐作品的第一次表达。本领域还存在对以下所述系统和方法的关联需要,该系统和方法可以通过自动评估以前记录的音轨的质量并选择通过电子创作系统记录的以前记录的音轨中的最佳音轨, 来由多个制作创建汇编音轨。


参照下面的附图,描述非限制性和非穷举的实施例。在附图中,相同的附图标记在所有各幅图中指相同部件,除非另外规定。为了更好地理解本公开,将参照结合附图解读的下文的详细描述进行,附图中 图1A、1B和IC图解说明可以实施本发明的方面的系统的几个实施例;
图2是图1的系统的音频转换器140的可能组件的一个实施例的框图; 图3图解说明用于音乐汇编的演进的一个示例性实施例; 图4是图2系统的音轨分割器204的可能组件的一个实施例的框图; 图5是图解说明音频输入的频率分布的示例性频谱图,该音频输入具有基本频率和多个谐波;
图6是示例性音高与时间的曲线图,该曲线解说明人声音的音高在第一和第二音高之间变化,随后稳定在第二音高附近;
图7是按音高事件随时间变化绘制的形态的一个示例性实施例,每个音高事件具有离散持续时间;
图8是图解说明在本发明的一个实施例中的数据文件的内容的框图; 图9是图解说明用于在连续循环录音会话中生成音乐音轨的方法的一个实施例的流程图10、10A和IOB —起形成用于在连续循环录音会话中生成音乐音轨的一个可能的用户界面的示意;
图11是用于校准录音会话的一个可能的用户界面的示意;
图12A、12B和12C—起图解说明与在三个单独的时间段的连续循环录音会话中生成音乐音轨关联的第二可能的用户界面;
图13A、i;3B和13C —起图解说明用户界面的一种可能使用,以修改使用图12的用户界面输入到系统中的音乐音轨;
图14A、14B和14C 一起图解说明用于在三个单独的时间段创建节奏音轨的一个可能的用户界面;
图15是图1系统的MTAC模块144的可能组件的一个实施例的框图; 图16是图解说明用于确定由音频输入的一个或多个音符反映的音乐键的一个可能过程的流程图17、17A和17B—起形成一个流程图,该解说明基于和弦序列约束对音乐音轨的一部分打分的一个可能过程;
图18图解说明用于确定形态中心的过程的一个实施例;
图19图解说明谐波振荡器随时间变化的阶跃响应,其具有衰减响应、过衰减响应和欠衰减响应;
图20图解说明一个逻辑流程图,该图示出了用于对音乐输入的一部分打分的一个实施例;
图21图解说明从多个录音的音轨中组成“最佳”音轨的过程的一个实施例的逻辑流程
图22图解说明示例性音频波形和显示实际音高与理想音高的差异的分数的图形表示的一个实施例;
图23图解说明由之前记录的音轨的分割部分构成的新音轨的一个实施例; 图M图解说明一个数据流程图,该图示出了将伴奏音乐输入与前奏音乐输入协调的过程的一个实施例;
图25图解说明由图M的转换音符模块执行的过程的数据流程图; 图沈图解说明超级键盘的一个示例性实施例; 图27A-B图解说明和弦轮的两个示例性实施例; 图观图解说明可以实施本发明的网络配置的一个示例性实施例; 图四图解说明支持本文中讨论的过程的装置的框图; 图30图解说明音乐网络装置的一个实施例; 图31图解说明游戏环境中的第一界面的一个可能的实施例; 图32图解说明用于在图31的游戏环境中创建一个或多个前奏声音或乐器音轨的界面的一个可能的实施例;
图33图解说明用于在图31的游戏环境中创建一个或多个节拍音轨的界面的一个可能的实施例;
图34A-C图解说明用于在图31的游戏环境中创建一个或多个伴奏音轨的界面的可能的实施例;
图35图解说明图形界面的一个可能的实施例,其描绘作为前奏音乐的伴奏演奏的和弦演进;
图36图解说明用于在图31的游戏环境中音乐汇编的不同部分之间选择的一个可能的实施例;和
图37A和37B图解说明与音乐资源关联的文件结构的可能的实施例,其中音乐资源可以与图31-36的游戏环境结合使用。
具体实施例方式现在将参照附图在下文中更加全面地描述本发明,附图形成其一部分,并通过示意示出了可以实施本发明的特定的示例性实施例。不过,本发明可以许多不同形式体现,不应解读为局限到本文列出的实施例;相反,提供这些实施例使本公开彻底全面,对本领域技术人员而言这些实施例将全面覆盖本发明的范围。除此之外,本发明还可体现为方法或装置。相应地,本发明可以采用完全的硬件实施例、完全的软件实施例或结合软件和硬件方面的实施例的形式。因此,以下详细描述不是在限制意义上进行的。定义
在说明书和权利要求中,下面的术语采用与本文中相关的显式含义,除非上下文明确规定为相反。如本文中使用的短语“在一个实施例中”不一定指同一个实施例,尽管也可以是同一个实施例。而且,如本文中使用的短语“在另一实施例中”不一定指不同的实施例, 尽管也可以是不同的实施例。因此,如下文描述的,在不偏离本发明的范围或精神下,本发明的各个实施例可以被容易地组合。此外,如本文中使用的,术语“或”是包含性的“或”运算符,等同于术语“和/或”, 除非上下文明确规定为相反。术语“基于”是非排他性的,允许基于没有描述的其它因素,除非上下文明确规定为相反。此外,在说明书中,“一个”和“所述”包括复数引用。“在…中” 的含义包括“在…中”,并包括复数引用。“在…中”的含义包括“在…中”和“在…上”。如本文中使用的术语“音乐输入”指包含通过各种媒介中的任何一种媒介传送的音乐和/或控制信息的任何信号输入,包括但不限于空气、麦克风、线路输入机构等等。音乐输入不限于可由人耳听到的信号输入频率,可包括在人耳可听到的范围之外的其它频率,或采用不易于被人耳听到的形式。而且,术语“音乐”的使用不旨在传达对于节拍、节奏等等的内在需求。因此,例如,音乐输入可包括各种输入,诸如轻拍,包括轻拍一次,点击,人类输入(诸如语音(例如哆、来、咪))、打击输入(例如咔,嚓,哒等等)以及通过乐器或其它振幅和/或频率生成机构经由传送器的间接输入,包括但不限于麦克风输入,线路输入,MIDI 输入,具有可用来传达音乐输入的信号信息的文件,或能够使所传送信号转化成音乐的其它输入。如本文中使用的,术语“音乐键”是一组协调的音乐音符。键通常是大调或小调。 音乐家经常谈到音乐作品是例如C大调基调,这意味着一首音乐是以C音符为和音中心,利用第一音符或主音是C的大音阶。大音阶是由完全音程和长半音组成的8个音符(例如C D EFGA B或哆、来、咪、发、索、拉、西)演进。对于钢琴,例如,中C (有时称作“C4”)的频率为626 Hz,而 D4 是四3. 665 Hz ;E4 是 329. 628 Hz ;F4 是;349. 228 Hz ;G4 是 391. 995 Hz ;A4是440. 000 Hz ;以及B4是493. 883 Hz0而其它乐器的相同音符会以相同频率演奏, 也理解为一些乐器自然以一个键或另一键演奏。如本文中使用的,术语“不协调音符”是不在正确音乐键或和弦上的音符,而正确音乐键和正确和弦是当前被另一音乐家或音乐资源演奏的音乐键或和弦。如本文中使用的,术语“布鲁斯音符”是不在正确音乐键或和弦上的音符,但可以不经过转换来演奏。如本文中使用的,术语“伴奏音乐输入的音符”是由伴奏音乐家演奏的与以相应的前奏曲调演奏的音符相关的音符。本发明的总体描述
下面简要描述各个实施例,以便提供对本发明的一些方面的基本理解。该简要描述不旨在作为宽范围概述。不旨在指出关键或重要元素,或描绘或以其它方式缩小范围。其目的只是以简单形式提出一些概念,作为后文提出的更加详细描述的序言。简单讲,各个实施例针对通过循环一组以前记录的音频音轨,并接收针对每个增加的音频音轨的可听输入,来生成多音轨录音。在一个实施例中,多音轨录音中的每个音频音轨可以由来自终端用户的可听声音输入生成。每个新的可听输入可以在当前录音重复重放或者循环一次或多次之后提供。由循环周期隔开的该录音序列可以允许用户彻底、连续且在无立即要求另外输入的时间相关压力下倾听当前录音,其中在循环周期中不接收新的音轨输入。与输入附加音轨的循环独立,循环重放还可以允许执行其它动作,诸如修改之前的音轨或改变录音系统的参数。而且,多音轨录音中的至少一个音频音轨可包括基于可听输入中提供的一个或多个不同的声音生成的一个或多个乐器声音。可以在所接收的可听输入上执行各种形式的处理以创建音频音轨,包括排列和调节可听输入的时间,频率识别和调节,将可听输入转换成与乐器相关的音色,增加与乐器相关的已知听觉提示等等。而且,这些过程中的每个过程可以被实时执行,允许几乎即时重放生成的音频音轨,并使另一可听输入随后被立即接收以进行处理,并作为音频音轨覆盖到多音轨录音中的一个或多个之前记录的音轨上。在一个实施例中,多音轨录音的循环或重复部分可包括一小节音乐。此小节的长度可以由节奏和与该音轨相关的拍子记号确定。在另一实施例中,小节数或重放多音轨录音的循环点可以是动态的。即,多音轨录音中第一音频音轨的重复可以在与多音轨录音中的第二音频音轨的重复不同的时间出现。此动态循环点的调节例如可以基于对于后续音轨的可听输入的长度自动确定。各个实施例还针对自动产生单个“最佳”制作,它是从制作集中得到的。在一个实施例中,一次演奏的多个制作在一个或多个会话过程中被记录到多音轨记录器上。每个制作被自动划分成若干片断。多个制作中每个录音的每个分割部分的质量基于可选标准被打分,音轨是从每个制作的最佳质量片断中自动构建的。在一个实施例中,最佳片断是由具有多个片断得分中最高分数的片断定义的。各个实施例还进一步针对防止音乐家演奏不协调的音符。在一个实施例中,伴奏乐器的音符也是从前奏乐器接收的。来自伴奏乐器的音符然后基于键、和弦和/或前奏的时间被修改。在一个实施例中,可以提供虚拟乐器,其中乐器的输入键动态映射到安全音符。因此,如果虚拟乐器的演奏者正在为曲调伴奏,则虚拟乐器可以识别安全音符,其包括用于正被伴奏的曲调的当前和弦的音符,或者用于在曲调的音乐键中的音符。装置架构
图IA示出了可以设置在各类装置50上的系统100的一个实施例,出于示意目的,装置 50可以是任何多用途计算机,手持计算装置(图1B)和/或专用游戏系统(图1C)。装置50 可以包括许多比图四中所示的那些组件更多或更少的许多组件。然而,本领域普通技术人员应该理解的是,如果不一定是实现本发明的各方面所必要的,某些组件不一定是操作系统100必需的,而诸如处理器、麦克风、视频显示器和音频扬声器的其它组件是重要的。
如图四中所示,装置50包括与大容量存储器四04通过总线四06通信的处理器 2902,处理器可以是CPU。本领域普通技术人员在看到本说明书、附图和权利要求后会理解至IJ,处理器四02还可包括一个或多个通用处理器,数字信号处理器,单独或彼此组合的其它专用处理器和/或ASIC。装置50还包括电源四08、一个或多个网络接口 2910、音频接口 2912、显示驱动器四14、用户输入处理器四16、照明器四18、输入/输出接口 2920、可选的触摸接口四22以及可选的全球定位系统(GPS)接收器四对。装置50还可包括能够使视频被获得和/或与特定的多音轨录音关联的照相机(未显示)。来自照相机或其它来源的视频还可以进一步提供到在线社交网络和/或在线音乐社区。装置50还可以可选地与基站 (未显示)通信,或直接与另一计算装置直接通信。像基站之类的其它计算装置可包括另外的音频相关组件,如专业音频处理器、发生器、放大器、扬声器、XLR连接器和/或电源。继续图四,电源四08可包括可充电或不可充电电池,或可由外部电源提供,诸如也可以补充和/或对电池充电的AC适配器或电源连接基座。网络接口四10包括用于将装置50耦连到一个或多个网络的电路,其被构建成与一个或多个通信协议和技术一起使用, 包括但不限于全球移动通信系统(GSM)、码分多址(CDMA)、时分多址(TDMA)、用户数据报协议(UDP)、传输控制协议/互联网协议(TCP/IP)、SMS、通用分组无线服务(GPRS)、WAP、超宽带(UWB)、IEEE 802. 16微波存取全球互通(WiMax)、SIP/RTP或各种其它无线通信协议中的任何一种。相应地,网络接口四10可包括收发器、收发装置或网络接口卡(NIC)。音频接口四12 (图29)被设置成产生并接收像人的发音的声音之类的音频信号。 例如,如图IA和IB中最清楚示出的,音频接口四12可耦连到扬声器51和/或麦克风52, 以能够将音乐输出、输入到系统100中。显示驱动器四14 (图四)被设置成产生视频信号, 以驱动各类显示器。例如,显示驱动器四14可驱动视频监视显示器75,如图IA所示,它可以是液晶、气体等离子或基于发光二极管(LED)的显示器,或者可以是与计算装置一起使用的任何其它类型的显示器。如图IB所示,显示驱动器四14可以可替代地驱动手持、触敏屏 80,它还可以被设置成接收来自像指示笔之类的物体或来自人手通过用户输入处理器四16 (参见图31)的手指的输入。小键盘55可包括被设置成接收来自用户的输入的任何输入装置(例如,键盘,游戏控制器,跟踪球和/或鼠标)。例如,小键盘55可包括一个或多个按钮、 数字拨号盘和/或键。小键盘阳还可包括与选择和发送图像关联的命令按钮。装置50还包括输入/输出界面四20,用于与像耳机、扬声器51或其它输入或输出装置之类的外部装置通信。输入/输出接口四20可利用一个或多个通信技术,诸如USB、 红外、蓝牙等等。可选的触摸接口四22被设置成向装置50的用户提供触觉反馈。例如,在一个实施例中,如图IB所示的实施例中,其中装置50是移动或手持装置,可选的触摸界面四22可被利用以特殊方式使装置振动,例如,当计算装置的另一用户正在打电话时。可选的GPS收发器四对可确定装置100在地球表面上的物理坐标,其通常输出如纬度和经度值的位置。GPS收发器四对还可利用其它地理定位机制,包括但不限于三角测量、辅助GPS (AGPS)、E-OTD、CI、SAI、ETA、BSS等,以进一步确定装置50在地球表面上的物理位置。然而,在一个实施例中,移动装置可通过其它组件提供其它信息,这些信息可以被用来确定装置的物理位置,例如包括MAC地址、IP地址等等。如图四所示,大容量存储器四04包括RAM 2924、ROM 2926和其它存储装置。大容量存储器四04图解说明计算机可读存储介质的一个例子,以存储像计算机可读指令、数据结构、程序模块或其它数据之类的信息。大容量存储器四04存储用来控制装置50的底层操作的基本输入/输出系统(“BIOS”)四观。大容量存储器还存储用于控制装置50的操作的操作系统四30。应认识到,此组件可包括通用操作系统,诸如MAC OS、WINDOWS、UNIX或 LINUX的一个版本,或专用操作系统,例如)(box 360系统软件,Wii IOS,Windows MobileTM 或Symbian 操作系统。操作系统可包括Java虚拟机模块或与其接口,使得能够通过Java 应用程序控制硬件组件和/或操作系统的操作。一个或多个数据存储模块132可存储在装置50的存储器四04中。本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解,存储在数据存储模块132中的一部分信息还可存储在磁盘驱动器或与装置50关联的其它存储介质上。数据存储模块132可存储多个音轨录音、MIDI文件、WAV文件、音频数据的样本和各种其它数据和/或数据格式或采用上文讨论的任何一种格式的输入曲调数据。数据存储模块132还可存储描述系统 100的各种能力的信息,这些信息经请求或响应于特定事件等等,可以例如在通信过程中作为报头的一部分发送到其它装置。而且,数据存储模块132还可被用来存储社交联网信息, 包括地址簿、朋友列表、化名、用户资料信息等等。装置50可存储并选择性地执行许多不同应用,包括根据系统100使用的应用。例如,根据系统100使用的应用可包括音频转换器模块140、录音会话实时循环(RSLL)模块 142、多个制作自动组合器(MTAC)模块144、协调器模块146、音轨共享器模块148、声音搜索器模块150、流派匹配器模块152以及和弦匹配器模块154。这些应用的功能将在下文更详细地描述。装置50上的应用还可包括消息器134和浏览器136。消息器132可被配置成使用各种消息通信中的任何一种来发起并管理消息会话,包括但不限于电子邮件、短消息业务(SMS)、即时消息(IM)、多媒体消息业务(匪S)、互联网中继聊天(IRC)、mIRC、RSS源和/ 或其它。例如,在一个实施例中,消息器243可被配置为IM消息应用,诸如AOL即时消息, Yahoo ! Mesenger,. NET Mesenger Server,ICQ 等等。在另一实施例中,消息器 132 可以是被配置成整合并使用各种消息协议的客户端应用。在一个实施例中,消息器132可以与浏览器134交互,以用于管理消息。浏览器134可包括被配置成接收并显示图形、文本、多媒体等的虚拟的任何应用,虚拟使用任何基于网络的语言。在一个实施例中,浏览器应用能够使用手持装置标记语言(HDML)、无线标记语言(WML)、WMLScript、JavaScript、标准通用标记语言(SMGL)、超文本标记语言(HTML)、可扩展标记语言(XML)等,以显示并发送消息。不过,可以使用其它各种基于网络的语言中的任何一种语言。装置50还可以包括其它应用138,诸如计算机可执行指令,其在被客户端装置100 执行时,发送、接收和/或另外处理消息(例如,SMS,MMS, IM、电子邮件和/或其它消息)、音频、视频,并能够与另一客户端装置的另一用户远程通信。应用程序的其它例子包括日历、 搜索程序、电子邮件客户端、IM应用、SMS应用、VoIP应用、联系人管理器、任务管理器、自动译码器、数据库程序、字处理程序、安全性应用、表单程序、游戏、搜索程序等等。以上描述的每个应用可以嵌入或可替代地下载并在装置50上执行。当然,尽管以上讨论的各种应用显示为是在装置50上实现的,但在可替代实施例中,这些应用中的每个应用的一个或多个部分可以在一个或多个远程装置或服务器上实现,其中每个部分的输入和输出在装置50和一个或多个远程装置或服务器上通过一个或多个网络传递。可替代地,一个或多个应用可被打包以在外围装置上执行或从外围装置上下载。咅频转换器
音频转换器140被配置成接收音频数据,并将音频数据转换成更有意义的形式以在系统100中使用。音频转换器140的一个实施例图解说明于图2中。在此实施例中,音频转换器140可包括各种子系统,包括音轨记录器202、音轨分割器204、量化器206、频率检测器 208、频率移位器210、乐器转换器212、增益控制214、谐波发生器216、特殊效果编辑器218 和人工调节控制220。与音频转换器140的各个子系统的连接以及各子系统之间的互联并没有示出,以避免混淆本发明,不过,这些子系统可电学和/或逻辑连接,本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解。音轨记录器202使用户能够记录来自语音或乐器的至少一个音频音轨。在一个实施例中,用户可以记录没有任何伴奏的音轨。不过,音轨记录器202还可被配置成自动或经用户请求播放音频,包括节拍音轨(click track),音乐伴奏,用户可以对照以判断他/她的音高和时间的开始音调,或甚至之前录音的音频。“节拍音轨”指周期性的“节拍”噪声(诸如由机械式节拍器发出的周期性节拍噪声),旨在帮助用户保持一致节奏。音轨记录器202 还可以使用户设置录音的时间长度-以时限(即几分钟和几秒)或几个音乐小节。当与MTAC 模块144结合使用时,如下文讨论的,音轨记录器202还可被配置成用图形指示与所记录的音轨的各个部分相关的分数,以便例如像在用户走调等时之类的情况下指出。通常,一个音乐汇编由多个抒情部分组成。例如,图3图解说明流行歌曲的一个典型演进,它以介绍部分开始,随后是交替的独唱和合唱部分,以及最后独唱之前的过门部分。当然,尽管没有示出,还可以使用诸如副歌、总结等的其它结构。因此,在一个实施例中, 音轨记录器202还可被配置成使用户能够选择所记录的音频音轨要用于的歌曲部分。这些部分然后可以任何顺序排列(自动(基于流派匹配器模块152所做出的确定)或由终端用户选择)以创建完整的音乐汇编。音轨分割器204将所记录的音频音轨分成单独的分割部分,之后分割部分可被找到并可能分别作为可找到的单独的声音片断或文件存储。优选选择分割部分以使尾尾相连接合的片断产生很少或不产生人为音频产品。例如,我们假设可听输入包括短语“噗啪噗”。在一个实施例中,此可听输入的划分可识别并将此可听输入的每个音节区分为单独的声音,诸如“噗”、“啪”和“噗”。不过,应该理解的是,此短语可以其它方式进行描述,单个分割部分可包括一个以上的音节或字。各自包括一个以上的音节的四个分割部分(编号为 “1”、“2”、“3”和“4”)图示于图1A、1B和IC的显示器75上。如所示的,分割部分“ 1 ”具有多个音符,它们可反映已经由音轨记录器202利用来自麦克风52的输入记录的相同的多个音节,麦克风52的输入来自人或乐器来源。为了实现可听音轨到单独的分割部分的划分,音轨分割器204可利用在处理器 2902上运行的一个或多个进程。在如图4所示的一个示例性实施例中,音轨分割器204可包括静音检测器402、停止检测器404和/或手动分割器406,每一个都可以用来将音频音轨划分成按时间排列的N个分割部分。音轨分割器204可使用静音检测器302以在特定的时间段中检测到静音时,划分音轨。“静音”可以由音量阈值定义,使得当音频音量下降到低于定义的阈值达到一限定的时间段时,音轨中的位置被认为是静音。音量阈值和时间段都是可以配置的。另一方面,停止检测器404可以被配置成使用语音分析,如共振峰分析,以识别音轨中的元音和辅音。例如,诸如T,D, P, B, G, K的辅音和鼻音是由其发声中气流的停顿界定的。特定元音或辅音的位置然后可以用来检测并优先识别划分点。与静音检测器402 类似,停止检测器404识别划分点所使用的元音和辅音的类型可以是可配置的。还可以提供手动分割器406以使用户能够手动界定每个分割部分。例如,用户可以只是规定每个分割部分的时间长度,使音频音轨被划分成每个有相同长度的很多分割部分。还可以允许用户识别音频音轨中待创建分割部分的特定位置。可以使用指示装置,诸如鼠标或游戏控制器与图1A,1B和IC中所示类型的图形用户界面结合来以图形方式进行识别。还可以通过音轨记录器202在音频音轨的可听重放过程中,通过按下用户输入装置如键盘55,鼠标M 或游戏控制器56上的按钮或键来进行识别。当然,尽管已经分别描述了静音检测器402、停止检测器304和手动分割器406的功能,但应考虑到音轨分割器204可使用静音检测器、停止检测器和/或手动分割器的任何组合来将音频音轨分割或划分成若干片断。本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解,可以使用将音频音轨分割或划分成若干片断的其它技术。量化器206被配置成将所接收的音频音轨的分割部分量化,它可利用在处理器 2902上运行的一个或多个进程。量化进程这个术语在本文中使用时,指以前创建的每一个分割部分(以及因此包含在该分割部分内的音符)的时间移位,可能需要它们以便将分割部分中的声音与特定的节拍对齐。优选地,量化器206被配置成将每个分割部分的开始按时间顺序与以前确定的节拍对齐。例如,可以提供拍子,其中每个小节可包括4个节拍,单独声音的对齐可关于时间的四分之一节拍递增出现,因此在每4个节拍小节中提供可以将分割部分对齐的16个时间点。当然,可以针对每个小节(诸如华尔滋或波尔卡舞效果3个节拍,摇摆效果的2个节拍等)和节拍使用任意数目的递增,并且在进程中的任何时间,可以通过用户手动或基于特定标准进行调节,如用户选择特定的风格或音乐流派(例如,布鲁斯、 爵士、波尔卡舞、流行音乐、摇滚、摇摆或华尔滋)。在一个实施例中,每个分割部分可通过量化器206自动与可用的时间增量对齐, 在录音时最接近该时间增量接收分割部分。即,如果声音在节拍中的两个时间增量之间开始,则声音的重放时间会按时间顺序向前或向后移动到其初始开始时间更接近的这些增量中的一个。可替代地,每个声音可按时间被自动移位到立即位于一开始记录声音的相对时间之前的每个时间增量。在又一个实施例中,每个声音可按时间被自动移位到立即跟在一开始记录声音的相对时间之后的每个时间增量。如果有时间移位,对于每个单独的声音,还可以交替地或另外根据为多音轨录音选择的流派影响时间移位,这将在下文关于流派匹配器152进一步讨论。在另一个实施例中,每个声音还可以自动地与以前记录的多音轨录音中的音轨时间对齐,实现卡拉OK类型的效果。而且,单独的声音的长度可以比一个或多个时间增量大,量化器206的时间移位可以被控制以防止单独的声音发生时间移位,使得它们在同一音频音轨内重叠。频率检测器208被配置成检测并识别每个分割部分内可以包含的一个或多个声音的音高,它可以利用处理器四02上运行的一个或多个进程。在一个实施例中,音高可以通过将每个单独的声音转换成频谱来确定。优选地,这是通过使用快速傅立叶变换(FFT)算法完成的,诸如通过ihtope的FFT实现。不过,应该理解的是,可以使用任何FFT实现。 还要考虑到也可以使用离散傅立叶变换(DFT)算法来获得频谱。为了图示,图5描绘了可以由在所接收的音频音轨的一部分上执行的FFT进程的输出产生的频谱的一个示例。可以看出,除了在2F,3F,4F…nF处激励的谐波之外,频谱400 包括与音高对应的处于单个基本频率(F)502的一个主要尖峰。另外的谐波出现在频谱中, 原因是当象声卡或小提琴琴弦之类的振荡器在单个音高处被激励时,它通常以多个频率振动。在一些事例中,音高的识别可能由于另外的噪声是复杂的。例如,如图5中所示, 频谱可包括由于来自现实世界的振荡器诸如声音或乐器的音频输入而出现的,并且在频谱中以低幅度尖峰展开出现的噪声。在一个实施例中,可通过过滤低于特定噪声阈值之下的 FFT输出来提取此噪声。在一些实施例中,音高的识别还可能由于振动的存在而复杂化。振动是一种有准备的频率调制,它可以应用到表演上,通常在5. 5 Hz和7. 5 Hz之间。就象噪声一样,通过在频域中应用带通滤波器,振动可以从FFT输出中滤除,但在许多情况下可能不希望滤掉振动。除了上文讨论的频域方法之外,应当考虑,还可以使用一个或多个时域方法来确定一个分割部分中一个或多个声音的音高。例如,在一个实施例中,可以通过测量信号的0 交叉点之间的距离来确定音高。还可以使用象AMDF (平均幅值差函数)、ASMDF (平均均方差函数)和其它类似自相关算法之类的算法。为了使音高的判断最有效,还可以将音高内容分成(恒定频率的)音符和(频率均勻增大或减小的)滑音。但是,与具有自然产生均勻的离散音高的音品或键的乐器不同,人类的声音趋向于以连续方式变成音符和波,使得转换成离散音高变得困难。结果,频率检测器208还可以优选利用音高脉冲检测来识别一个分割部分中的单独的声音之间的音高的移动或变化。音高脉冲检测是一种界定音高事件的方法,它侧重于在歌手的声音和他对他声音的感知之间形成的控制循环的发射特性。通常,当歌手出声时,该歌手在片刻之后听到该声音。如果歌手听到音高是不正确的,他立即将其声音变成目的音高。此负反馈循环可以作为由周期性脉冲驱动的衰减谐波动作来建模。因此,人类声音可以认为是单个振荡器声卡。 改变并稳定歌手的声音602的音高的一个示例图示可以参见图6。声卡中的张力控制音高, 音高的此变化可以通过对阶跃函数的响应来建模,诸如图6中的阶跃函数604。因此,新音高事件的开始可以通过如下方式确定找到音高中衰减谐波振荡的开始;并观察收敛到稳定值的音高的连续转折点。在已经确定音频音轨的一个分割部分中的音高事件之后,它们可以被转换和/或存储为一种形态,它是音高事件对于时间的曲线图。形态(没有分割)的一个示例描绘于图 7中。形态因此可以包括识别每个声音的开始、持续时间和音高的信息,或者这些值的任何组合或子集。在一个实施例中,形态可以是MIDI数据形式的,尽管形态可以指音高随时间的任何表示,并且不限于半音或任何特定拍子。例如,可以使用的形态的其它类似例子在 Larry Polansky所著"Morphological Metrics,,, Journal of New Music Research,第 25卷,第观9-368页,ISSN: 09拟9_8215中有描述,其通过引用被并入本文。频率移位器210可被配置成将可听输入的频率移位,它可利用在处理器四02上运行的一个或多个进程。例如,可听输入的一个分割部分中的一个或多个声音的频率可被自动提高或降低,以便与可听输入或以前记录的单独的声音的基本频率一致。在一个实施例中,确定是否提高或降低可听输入的频率取决于最接近的基本频率。换言之,假设作品是C 大调,如果由音轨记录器202捕捉的可听频率是270. 000Hz,则频率移位器210会将音符下移至626Hz (中C),而如果由音频记录器202捕捉的可听频率是观0. 000Hz,则频率移位器210会将音符上移到四3. 665Hz (或在中C上的D)。甚至当频率移位器首先将可听输入调节到最接近的基本频率时,移位器210还可被进一步编程,以基于音乐键,流派和/或和弦,对接近的呼叫作出不同决定(即可听频率大致在两个音符之间的正中间)。在一个实施例中,频率移位器210可基于由流派匹配器260和/或和弦匹配器270提供的控制,基于音乐键,流派和/或和弦,调节可听输入到使音乐听起来更加悦耳的其它基本频率,这将在下文进一步讨论。可替代地或者另外,频率移位器210响应于来自乐器转换器212的输入, 还可分别将一个或多个分割部分的一个或多个部分移位,以与预定的频率集合或象一般与选择的乐器关联的半音对应,乐器如钢琴、吉它或其它弦类乐器、木管乐器或黄铜管乐。乐器转换器212可被配置成执行将可听输入的一个或多个部分转换成具有与乐器关联的音色的一个或多个声音。例如,可听输入中的一个或多个声音可被转换成一个或多个不同类型的打击乐器的一个或多个乐器声音,打击乐器包括小军鼓、牛铃、底鼓、三角铁等等。在一个实施例中,可听输入到一个或多个对应的打击乐器声音的转换可包括将可听输入中的一个或多个声音的时间和幅值修改为包括打击乐器的一个或多个声音的对应音轨,打击乐器声音包括与一个或多个可听输入声音相同或相似的时间和幅值。对于能够演奏不同音符的乐器,诸如长号或其它类型的黄铜管乐、琴弦、木管乐器等等,乐器转换可进一步将可听输入声音的一个或多个频率与具有由乐器演奏的相同或相似频率的一个或多个声音相关联。而且,每个转换可由实际演奏相应物理乐器的物理能力来得到和/或限定。例如,为女低音萨克斯管音轨生成的乐器声音的频率可由传统的女低音萨克斯管的实际频率范围限定。在一个实施例中,生成的音频音轨可包括转换后可听输入的MIDI格式的表示。乐器转换器212所使用的对于各种乐器的数据会优选地被存储在存储器四04中,并且可从光或磁介质、可移动存储器中或通过网络下载。增益控制214可被配置成基于其它以前记录的音轨的音量自动地调节可听输入的相对音量,并且可利用在处理器四02上运行的一个或多个进程。谐波发生器216 可被配置成将谐波并入到音频音轨中,它可利用在处理器四02上运行的一个或多个进程。例如,可听输入信号的不同的附加频率可被确定,并加入到所生成的音频音轨。确定附加频率还可基于来自流派匹配器沈0的流派,或通过使用由用户输入的其它预定的参数设置。例如,如果选择的流派是华尔滋,附加频率可以从与八度音中的前奏音乐协调的刚好低于前奏的大三和音中选择,在%时间,具有“oom-pa-pa”节拍,如下根音
? t,根音〗1。特殊效果编辑器218可被配置成将各种效果加入到音频音轨,诸如回声,
回响等,优选利用在处理器四02上运行的一个或多个进程。音频转换器140还可包括手工调节控制220,以能够使用户手动改变上文讨论的由模块自动配置的设置中的任何设置。例如,手动调节控制220可以使用户改变音频输入或其各部分的频率;使用户改变每个单独的声音的开始和持续时间;增加或降低针对音频音轨的增益;除其它选项之外,选择不同的乐器应用到乐器转换器212。本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解,此手动调节控制220可被设计成与一个或多个图形用户界面一起使用。在下文将联系后面的图13A、i;3B和13C,讨论一个具体的图形用户界面。图8图解说明音频音轨的一个分割部分的文件结构的一个实施例,音频音轨已经由音频转换器140处理过,或者另外下载,提取或从另一来源获得。如所示的,在此实施例中,文件包括与文件相关的元数据,所获得的形态数据(例如以MIDI格式)和原始音频(例如以.wav格式)。元数据可包括指示与音频音轨分割部分的创建者或提供者相关的资料的信息。它还可包括关于数据的音频拍号的附加信息,包括键、节奏和与音频关联的分割部分。 元数据还可包括关于以下各项的信息,即可应用到分割部分中的每个音符的可能可用的音高移位,可应用到每个音符的时间移位的量等等。例如,要理解的是,对于实时记录音频,如果音高移动超过单个半音,则存在失真的可能性。相应地,在一个实施例中。可对实时音频设置约束来阻止移位超过一个半音。当然,还可以使用不同的设置和不同的约束。在另一个实施例中,也可以由音频音轨分割部分的创建者,或者对该音频音轨分割部分具有实际权利的个人,如管理员、合作方等等改变或建立潜在音高移位,时间移位等的范围。录咅会话实时循环
录音会话实时循环(RSLL)模块142实现数字音频工作站,它与音频转换器140结合, 能够记录可听输入,生成单独的音频音轨,并创建多音轨录音。因此,RSLL模块142可以使任何记录的或者说出来的、吟颂的或其它方式的音频音轨与之前记录的音轨结合来创建多音轨录音。如下文进一步讨论的,RSLL模块142还优选被配置成循环以前记录的多音轨录音的至少一个小节以用于反复重放。此反复重放可在新的可听文件正在被记录或RSLL模块142另外接收指令以记录当前正在执行的会话的同时被执行。结果,RSLL模块142允许用户继续编辑并组合音乐音轨,同时播放、聆听以前记录的音轨。从下文的讨论中会理解至IJ,以前记录的音轨的连续循环还最小化了用户对由于施加到当前正在被用户记录的音频音轨的进程可能引起的任何延迟的感知,因为这些进程是优选被完成的。图9图解说明一个逻辑流程图,它一般地显示了总体过程的一个实施例,以与音频转换器140结合通过使用RSLL模块142来创建多音轨录音。总之,图9的操作通常表示一个录音会话。此会话可以是每次用户采用系统100,例如RSLL模块142时最近创建和完成的。可替代地,以前的会话可以被继续,其某些元件,诸如以前记录的多音轨录音或其它用户规定的录音参数还可以被加载和应用。在任一配置中,过程900在开始块之后从判断块910开始,在此用户判断当前记录的多音轨录音是否是要重放的。重放当前的多音轨录音的进程同时能够进行其它动作,这在本文中总体被称作“实时循环”。当前正在被重放的多音轨录音的一部分的内容和持续时间无明显重复,被称作“实时循环”。在重放过程中,多音轨录音可以伴随有节拍音轨(click track),它通常包括单独的不是与多音轨录音一起存储的音频音轨,其提供一连串相等间隔的参考声音或节拍,这些声音或节拍可听地指示系统当前被配置成记录的音轨的拍子速度禾口调子(measure)。在开始执行过程900时,音频音轨可能还没有生成。在这种状态下,可以模拟块 910中的空白多音轨录音的重放,节拍音轨可仅向用户提供重放的声音。然而,在一个实施例中,用户可以选择使节拍音轨消音,这将参照块964在下文中进一步讨论。在录音过程中视觉提示可与音频重放结合提供给用户。甚至当音频音轨没有被记录时,节拍音轨被消音, 模拟的重放和当前的重放位置的指示可只限于那些可视提示,其可包括例如进度条、指针或其它一些图形表示(参见例如图12A,12B和12C)的变化显示。在判断块910中重放的实时循环的多音轨录音可包括以前记录的一个或多个音频音轨。多音轨录音可包括总体长度以及作为实时循环重放的长度。实时循环的长度可被选择为小于多音轨录音的总体长度,允许用户单独对多音轨录音的不同小节分层。实时循环的长度,相对于多音轨录音的总体长度,可由用户手动选择,或者可替代地,基于所接收的可听输入自动确定。在至少一个实施例中,多音轨录音和实时循环的总体长度可以相同。 例如,实时循环和多音轨录音的长度可以是音乐的单个小节。当在判断块910选择用于重放的多音轨录音时,附加的视觉提示,诸如一个或多个音轨的可视表示,可与实时循环的音频重放同步地提供,该实时循环包括为用户重放的多音轨录音的至少一部分。当播放多音轨录音时,过程900继续判断块920,在此由终端用户做出是否要生成用于多音轨录音的音频音轨的判断。录音可以基于可听输入的接收而发起,诸如由终端用户生成的声音可听输入。在一个实施例中,可听输入的检测幅度可以触发系统100中接收的可听输入信号的采样和存储。在一个替代实施例中,此音轨的生成可以由系统100接收的手动输入来发起。而且,生成新的音频音轨可能需要检测到的可听输入, 诸如来自麦克风,和手动指示。如果要生成新的音频音轨,则进程继续块922。如果不发起音频音轨的生成,则过程900继续判断块940。在块922,由音频转换器140的音轨记录器202接收可听输入,可听输入被存储在一个或多个数据存储模块132中的存储器四04中,如本文中使用的,“可听”指装置50的输入性质,其中当正在提供输入时,它可以同时,自然和直接被至少一个用户听到,而不用放大或其它电子处理。在一个实施例中,所记录的可听输入的长度可以基于当第一次接收可听输入时,实时循环中剩余时间量来确定。即,可听输入的记录可以在实时循环结束后的一时间长度之后结束,无论可检测量的可听输入是否仍在被接收。例如,如果循环的长度是每小节4个节拍的一个小节长,并且可听输入的接收首先被检测或在第二节拍开始时被触发,则可以记录可听输入的3个节拍,对应于小节的第二、第三和第四节拍,因此第二、第三和第四节拍会在块910中连续处理的的多音轨录音重放中循环。在此配置中,在单个小节结束之后接收的可听输入可以被记录并被作为用于多音轨录音的另一单独音轨的基础处理。单独的音轨的此附加处理可通过至少块910、920和922被表示为单独重复。在至少一个可替代实施例中,循环重放的长度可以基于在块922接收的可听输入的长度而被动态调节。即,可听输入可能自动地产生当前块910中正在播放的多音轨录音的音轨长度的延长。例如,如果在当前的实时循环的长度已经重放之后接收附加可听输入, 则此更长的可听输入可被进一步记录并保持以导出,作为新的音频音轨。在此配置中,多音轨录音的以前的音轨可在随后的实时循环中重复,以便匹配所接收的可听输入的长度。在一个实施例中,可以重复执行较短的以前的多音轨录音整数次。此整数次重复保持以前记录的较短的多音轨录音的多个小节之间的关系,若有的话。以此方式,多音轨录音和实时循环的循环点可以被动态地改变。类似地,在块922接收的音轨的长度可以比当前正在播放的实时循环(即在4小节长度的实时循环的重放过程中只接收可听输入的一个小节)的长度短。在此配置中,可听输入的结束可在接收和记录至少一个阀值音量后的预定时间(例如,选择的秒数)之后没有接收到附加可听输入时检测到。在一个实施例中,此静音的检测可以基于在超过当前的实时循环的阀值音量上没有输入。可替代地或者另外,可听输入的结束可以通过接收手动信号来发出信号。此较短的可听输入的相关长度可以根据具有与多音轨录音相同数量节拍的小节的数目来确定。在一个实施例中,此小节的数目是作为当前实时循环的长度的因素选择的。在每种情况下,可听输入一旦在块拟4被转换成音轨,就可以手动或自动选择以重复许多次,足以匹配当前正在重放的多音轨录音的长度。在块924,所接收的可听输入可以通过音频转换器140被转换成音频音轨。如上文讨论过的,音频转换过程可包括各种操作,包括分割、量化、频率检测和移位、乐器转换、 增益控制、和音生成、加入特殊效果和手动调节。这些音频转换操作中每个操作的顺序可以被改变,并且在至少一个实施例中可以由终端用户配置。还有,这些操作中每个操作可以被选择性地施加,使得可听输入能够以与所需的一样多的或者最少的附加处理被转换成音频音轨。例如,可以不选择乐器转换,因此允许来自可听输入的一个或多个原始声音基本与其原始音色一起被包括在所生成的音频音轨中。在块924,可以应用回声消除过程,以从正在有效记录的音频音轨中过滤掉在实时循环过程中播放的其它音轨的音频。在一个实施例中,这可以通过以下来实现识别在实时循环中正在播放的音频信号,确定输出音频信号和输入音频信号之间的任何延迟;过滤和延迟输出音频信号以与输入音频信号类似;并从输入音频信号中减去输出音频信号。可以使用的一个优选回声消除过程是由ihtope实现的过程,不过也可以使用其它实现方式。块拟4的过程后续可以被应用或去掉,在本文中将参照块942进一步讨论。在块拟4将可听输入转换成生成的音频音轨之后,过程900继续块 926。在块926,由块924生成的音频音轨可实时加入到多音轨录音中。这可以是已经发起的多音轨,或者可替代地是具有被包括作为其第一音轨的音频音轨的新多音轨。在块拟6之后,过程900可再次开始判断块910,其中多音轨可随着所包括的最近生成的音频音轨重放。当922、拟4和拟6操作在图9中被示出为连续被执行时,对于每个接收的可听输入,这些步骤还可以并行执行,以便进一步能够进行实时录音和可听输入信号的重放。在每个可听输入中,例如,可对于从可听输入中识别的每个单独的声音,执行此并行处理,尽管可替代实施例可包括可听输入信号的其它不同大小的部分。在判断块940,对多音轨录音中的一个或多个音频音轨是否要被修改做出判断。例如,可以接收指示终端用户希望修改以前记录的一个或多个音频音轨的输入。在一个实施例中,此指示可以通过手动输入来接收。如上文指出的,此修改还可以在当前记录的多音轨录音的重放的过程中执行,允许为终端用户立即评估多音轨录音的当前状态。在一个实施例中,此指示可包括期望应用调节的多音轨录音的一个或多个音轨。这些音轨还可包括手动加入到多音轨录音的一个或多个新音轨。如果接收到音轨修改的指示,过程900继续块 942 ;否则,过程900继续判断块960。在块942,接收一个或多个以前转换的音轨的参数,经调节的参数可以通过终端用户输入。用于修改的参数可包括使用音频转换器140的过程可以进行的任何调节,除了其它例子,它可以包括使音轨消音或单独演奏,去掉整个音轨,调节音轨中乐器的打击速度, 调节音轨的音量水平,调节实时循环中所有音轨的重放节奏,根据选择的音轨的时间增量增加或去掉单独的声音,调节实时循环的长度和/或多音轨录音的整体长度。调节实时循环的长度可以包括改变循环关于整个多音轨录音的开始点和结束点,和/或还可以包括采用以前与这些小节关联的音轨的至少一个子集向当前实时循环中正在重复的音轨中增加更多小节,增加和/或附加多音轨录音的以前记录的小节,或从多音轨录音中删除小节。新音轨的加入可能要求此新音轨的各个方面由终端用户手动输入。同样在块942,可构造为通过使用声音搜索器模块150执行对附加音轨的搜索,以便于终端用户重新使用以前记录的音频音轨。在块944,调节的参数被应用到在判断模块940指示的一个或多个音轨。此应用可包括将调节参数转换成与调节的一个或多个音轨兼容的格式。例如,一个或多个数值参数可被调节成与可应用于MIDI或其它协议格式的一个或多个值对应。在块944,过程900可再次开始于判断块910,其中与实时循环对应的多音轨录音的至少一部分可随着所包括的一个或多个修改的音频音轨重放。在判断块960,对录音设置是否要被修改做出判断。例如,可接收指示用户是否希望修改录音设置的一个或多个方面的输入。此指示还可通过手动输入接收。此指示还可以是将要被调节的录音设置的一个或多个参数设置。如果终端用户希望修改录音设置,过程 900继续块962 ;否则过程900继续判断块980。在块962,录音系统可被校准。特别是,录音电路包括至少一个音频输入源,音频输出源和音频音轨处理组件,其可被校准以与装置50结合确定系统100的延迟时间,延迟时间是通过音频输出源的声音的重放和通过音频输入源的可听输入的接收之间的时间,优选以毫秒测量的。例如,如果录音电路包括耳机和麦克风,则延迟时间可通过RSLL 142确定, 以改善可听输入的接收和转换,特别是确定被重放的多音轨录音的节拍和所接收的可听输入之间的相对时间。如果需要,在块962校准之后,过程900继续块964。在块964,可以改变其它录音系统参数设置。例如,节拍音轨的重放可被接通或关断。同样,可以修改对于新音轨或新的多音轨录音的默认设置,诸如对于可听输入可以提供块拟4默认节奏和默认转换设置。当前的多音轨录音的拍子记号还可以在块964被改变。 与数字音频工作站相关的其它设置还可以被提供,使得它们可以被终端用户修改,本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解这些。在块964之后,过程900 可返回判断块910,其中对录音系统的调节可以应用于随后录音和对于多音轨录音的音频音轨的修改。在块980,对是否要结束录音会话做出判断。例如,指示会话结束的输入可从手动输入接收。可替代地,装置50可指示会话的结束,例如如果数据存储装置132满了。如果接收到结束会话的指示,则多音轨录音可被存储和/或传送以用于附加操作。例如,多音轨录音可存储在数据存储装置132中以用于以后在新会话中检索、浏览和修改,或者继续一开始已创建多音轨录音的会话。多音轨录音还可以通过网络从装置50传送到另一装置50, 以存储在与用户帐户关联的至少一个远程数据存储装置中。传送的多音轨录音还可以通过网络服务器与在线音乐社区共享或在网络服务器驻留的游戏中共享。如果录音会话没有结束,则过程900再次返回判断块910。此事件顺序可表示用户收听实时循环同时如果需要决定要生成哪些附加音轨或如果需要要执行哪些其它修改的周期。本领域普通技术人员在阅读本说明书、附图和权利要求后会理解,图9中所示的流程图的每个块(和其它)和流程图示意中的块的组合,可由计算机程序指令执行。这些程序指令可被提供给处理器以产生一种装置,使得在处理器上执行的指令创建用于执行一个或几个流程块中规定的动作的装置。计算机程序指令可由处理器执行,以使处理器执行一连串操作步骤,从而产生计算机执行的过程,使得在处理器上执行的指令,提供用来实现一个或几个流程块中规定的动作的步骤。计算机程序指令还可引起流程图的块中所示的操作步骤中的至少一些步骤并行执行。而且,一些步骤还可以在一台以上的处理器上执行,诸如这可能在多处理器计算机系统中出现。此外,在不偏离本发明的范围或精神下,流程示意中的一个或多个块或块的组合还可以与其它块或块的组合并行执行,或者甚至以与所图示的不同的顺序执行。相应地,流程示意图的块支持用于执行特定动作的装置的组合,用于执行特定动作的步骤的组合和用于执行特定动作的程序指令装置。还要理解的是,流程示意图中的每个块和流程示意图中块的组合可以由专用的基于硬件的系统来执行,系统执行特定动作或步骤,或专用硬件和计算机指令的组合。现在参照各个屏幕显示来描述本发明的某些方面的操作,屏幕显示可以与执行音频转换器140和RSSL模块142的用户界面关联。所图解说明的实施例是非限制性的非穷举的示例用户界面,其可以与系统100的操作关联来使用。各个屏幕显示可包括比所显示的那些组件更多或更少的许多组件。而且,组件的设置不限于在这些显示中所示的,其它设置也在设想之内,包括不同的界面上各个组件的布置。不过,所示的组件足以公开了用于实施本发明的示例性实施例。图10、10A和IOB —起图解说明执行RSLL 142和音频转换器140的方面的一个用户界面,以记录并修改多音轨录音的音轨。界面1000的整体显示可以被认为是“控件空间”。界面上显示的每个控件可以基于来自用户的手动输入来操作,诸如通过使用鼠标M、 触摸屏80,压力垫或被设置成响应并传送物理控件的装置。如图所示,界面1000显示录音会话的各个方面和被生成作为此会话的一部分的多音轨录音。文件菜单1010包括用于创建新的多音轨录音或加载以前记录的多音轨录音的选项,本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解这些。节奏控件1012以每分钟的节拍数显示多音轨录音的节奏。节奏控件1012可以被用户直接手动修改。条控件1014显示用于多音轨录音的条数。条控件1014可被配置成在实时循环的过程中显示当前条数,总条数,或可替代地被用来选择多音轨录音的特定条数, 以进一步在界面1000中显示。节拍控件1016显示用于多音轨录音的节拍数。节拍控件1016可被配置成显示每个条的节拍总数,或者可替代地,在多音轨录音的重放过程中的当前节拍数。时间控件1018 显示用于多音轨录音的时间。此时间控件1018可被配置成显示多音轨录音的总时间,用于当前选择的实时循环的时间长度,实时循环过程中的绝对或相对时间,或者被用来跳转到多音轨录音的特定绝对时间。界面1000的控件的操作,诸如控件1012、1014、1016、1018和 1021-1026可在图9的块中被改变。控件1020对应于音轨和录音设置调节,这将进一步参照图9的块942和962讨论。增加音轨控件1021使用户能够手动将音轨增加到多音轨录音。一旦选择控件 1021,新的音轨就被加入到多音轨录音,界面被更新为包括用于所增加的音轨的附加控件 1040-1054,它的操作在下文讨论。渲染WAV控件1022生成并存储来自多音轨录音的至少一部分的WAV文件。在此WAV文件中渲染的多音轨录音的各部分以及其它存储参数可以进一步根据选择渲染WAV控件1022由用户输入。而且,除了 WAV之外,其它音频文件格式还可通过诸如控件1022的控件可用。节拍音轨控件1023切换节拍音轨的重放。备用控件IOM切换RSLL 142的录音组件的接入和关断及装置记录可听输入的能力。备用控件IOM使终端用户在录音会话过程中能够与其它用户讲话,实现声音输入,并创建其它可听声音,而不必将那些声音转换成进一步被RSLL 142处理的可听输入。电路参数控件1025使用户能够校准录音电路参数,这将参照图11进一步讨论。滑块10 使多音轨录音重放的音量能够被控制。重放控件1030能够使多音轨录音重放。此重放是与通过控件1012-1018进一步显示和控制的录音参数配合进行的。例如,重放控件 1030可从通过控件1014-1018指示的位置并以控件1012显示的节奏发起多音轨录音的重放。如上文提到的,此控件1030还能够记录另外的可听输入,以生成用于多音轨录音的另一音频音轨。位置控件1032还可用来控制多音轨录音的当前重放位置。例如,控件1032 可引起在多音轨录音的绝对开始或可替代地在当前实时循环的开始发起重放。用户界面1000上的网格1050代表多音轨录音的一个或多个音轨内单独声音的重放和时间,其中每一行代表一个单独的音轨,每一列代表时间增量。每个行例如可以包括用于单个条中每个时间增量的框。可替代地,每一行可包括代表用于实时循环的整个持续时间的时间增量的足够多的框。网格1050中具有第一阴影或颜色的框,诸如框1052,可代表实时循环中重放声音的相对时间,而其它框,诸如框1054,每一个分别指示在音轨中不重放单独声音的时间增量。通过手动控件1021加入的音轨一开始包括框,诸如框10M。选择框,诸如框1052或框1054,可在与所选择的框关联的时间增量向音轨增加或去掉声音。通过手动输入到网格1050中的框而加入的声音可包括用于为音轨选择的乐器的默认声音, 或可替代地,由音轨的可听输入量化的至少一个声音的拷贝。采用网格1050的此手动操作使可听输入能够针对音轨生成一个或多个声音,在该音轨中的手动选择位置增加一个或多个这些声音的拷贝。进度条1056可视地指示多音轨录音的当前重放位置的时间增量。网格1050中的每个音轨与一组音轨控件1040、1042、1044、1046和1048关联。去掉音轨控件1040能够从多音轨录音中去掉音轨,并可被配置成选择性地从多音轨录音的一个或多个条中去掉音轨。乐器选择控件1042能够选择乐器,在生成的音频音轨中可听输入的声音转换到该乐器。如图IOA所示,多个乐器,包括打击乐器或其它类型的非打击乐器可从下拉菜单中手动选择。可替代地,可为每个给定的音频音轨,自动选择或预先定义默认乐器或默认乐器的行进。当不选择乐器时,所生成的音频音轨中的每个声音可基本与原始可听输入的声音对应,包括具有原始可听输入的音色。在一个实施例中,乐器可基于训练RSLL 142选择,以基于例如每个特殊声音的频带的分类将可听输入中的特殊声音转换成关联乐器声音。静音/独奏控件1044使关联音轨消音,或使除了与控件1044关联的音轨之外的所有其它音轨消音。速度控件1046能够调节初始音轨或为转换的音频音轨生成的乐器声音的打击长度,其可影响峰值,持续时间,发行和为关联音频音轨生成的每个乐器声音的整体幅度形状。此速度可以是手动输入的,或者基于生成一个或多个乐器声音的可听输入声音的性质提取。音量控件1048能够个别控制多音轨录音中的每个音轨的重放音量。图11图解说明用于校准录音电路的界面1100的一个实施例。界面1100可代表屏幕显示弹出框等的一个例子,其在控件1025 (参见图10A)被选择时出现。在一个实施例中,界面1100包括麦克风增益控件1110,其能够调节所接收的可听输入的幅值。上控件 1120和下控件1130和半减期控件1140提供附加控制和用于识别所接收的信号的验证,作为由系统100进一步处理的可听输入。校准电路发起预定节拍音轨,并可以引导用户在可听输入信号中复制节拍音轨。在一个可替代实施例中,用于校准的节拍音轨可被音频输入装置,诸如麦克风直接接收,作为可听输入,而不需要用户可听地复制节拍音轨。基于节拍音轨中的声音的生成和可听输入中的声音的接收之间的相对时间差,可以确定系统延迟时间1160。此延迟时间值可进一步被RSLL 142使用,以提高可听输入的量化以及多音轨录音和接收的可听输入的重放之间检测的相对时间,用于后续得到附加音频音轨以被增加到多音轨录音。因此,如图所示,界面1000和1100给用户呈现控件空间,该控件空间受欢迎、不让人惧怕、强大一致,但直观便于学习,它对于不是专业音乐家或其他不熟悉数字音频作曲工具的外行用户是特别重要的。图12A、12B和12C—起图解说明另一示例性可视显示,其可以与多音轨录音中音频音轨的录音和修改关联使用。在此例子中,音频频率(实际和形态的(通过频率移位器210 移位的后频率))、分割、量化和节奏信息是以图形方式提供的,以便给用户提供更加直观的体验。例如,首先来看图12A,提供用于实时循环的图形控件空间1200。该控件空间包括多个分割指示符1204,其标识音轨(在图12A-C的情况中,显示了小节1-4)中的每个分割部分 (或音乐小节)。在图12A-C中所示的图形用户界面的一个实施例中,垂直线1206图解说明每个小节中的拍子,每个小节中垂直线的数目优选对应于拍子记号的最大数。例如,如果音乐作品被选为使用3/4拍子记号组成,每个小节会包括3个垂直线,以指示该小节或分割部分中有3个拍子。在图12A-C中所示的图形用户界面的同一实施例中,水平线1208还可标识与所选择的可听输入可被转换成的乐器关联的基本频率。如图12A-C所示的实施例中进一步图示的,乐器图标1210还可被提供以指示所选择乐器,诸如图12A-C中选择的吉它。在图12A-C所示的实施例中,实线1212代表由终端用户用声音或使用乐器记录的一个音轨的音频波形;而多个水平条1214代表已经由音频转换器140的量化器206和频率移位器210从音频波形产生的音符的形态。如所描绘的,所产生的每个音符的形态已经在时间上移位,以与每个分割部分的节拍对齐,并在频率上移位以与所选乐器的基本频率中的一个对应。如所描绘的,通过比较图12A,12B和图12C,重放条1216也可被提供以识别属于图9的过程的当前被音轨记录器202播放的实时循环的特定部分。重放条1216因此在实时循环被播放时从左移动到右。一旦到达第四小节的末尾,重放条返回小节1的开始,再次顺序重复循环。终端用户可在实时循环内的任何点通过在循环中的适当点记录附加音频来提供附加音频输入。尽管在图12A-C中未显示,但每个附加录音可用来提供新的音轨(或音符集)以用于实时循环中的描述。通过增加附加的乐器图标1210,单独的音轨也可与不同乐器关联。图13A、13B和13C—起图解说明用于通过图12A-C的界面手动改变以前生成的音符的过程的一个例子。如图13A所示,终端用户可使用指针1304选择一个特定音符1302。 如图1 所示,终端用户可随后垂直地将该音符拖动到另一水平线1208,以改变所拖动音符的音高。在此例子中,音符1302显示为被移到到较高基本频率。考虑到,音符还可被移动到乐器的基本频率之间的频率。如图13C所示,音符的时间还可通过选择音符的形态描述的末尾来改变,然后水平拖动。在图13C中,音符1304的持续时间已经被加长。同样如图13C所示,加长音符1304的结果是通过量化器206自动缩短音符1306,以保持节拍,避免正由单一乐器播放的音符重叠。本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解,可以使用相同或相似方法来缩短所选音符的持续时间,使另一相邻音符自动加长,并且音符的持续时间还可以与关于修改描绘的末尾所示的相同方式从形态描绘的开始改变。同样,本领域普通技术人员会理解,可以使用相同的方法来从音轨中删除音符或拷贝音符,以插入音轨的其它部分。图14A、14B和14C图解说明与系统100 —起使用的另一示例性可视显示。在此例子中,可视显示使用户能够记录并修改与打击乐器关联的多音轨录音。首先来看图14A,控件空间1400包括网格1402,它代表一个或多个节拍音轨中单独的声音的重放和时间。如在图12A-C的图示中,分割部分1-4每一个都具有4个拍子,描绘于图14A-C的例子中。例如,在图14A中,第一行网格1402代表与第一基础底鼓关联的声音的重放和时间,第二行网格1402代表与小军鼓关联的声音的重放和时间,第三和第四行网格1402代表与钹关联的声音的重放和时间,第五行网格1402代表与落地鼓(floor torn)关联的声音的重放和时间。本领域普通技术人员在阅读本说明书、附图和权利要求之后会理解,这些具体的打击乐器和它们在网格1402上的次序只表示图解说明概念,不应视作是将此概念限制到此具体的例子。网格中的每个框代表与相关打击乐器关联的声音的时间增量,其中不加阴影的框表示在时间增量没有声音被播放,阴影框表示(与相关打击乐器的音色关联的)声音在时间增量被播放。因此,图14A图解说明没有声音要被播放的一个例子,图14B图解说明在由阴影框指示的时间要播放底鼓的声音的一个例子,图14C图解说明在由阴影框指示的时间要播放底鼓和符号的声音的一个例子。对于每个打击乐器音轨,与具体打击乐器关联的声音可以各种方式被加入到乐器的音轨。例如,如图14A、14B或14C所示,重放条1404可被提供以可视地指示实时循环过程中多音轨录音的当前重放位置的时间增量。因此,在图14B中, 重放条指示第三小节的第一节拍当前正在被播放。用户然后可以通过在重放条1404处在与具体节拍关联的框上时记录声音,来将与具体的打击乐器关联的声音加入具体节拍。在一个实施例中,要与声音关联的乐器音轨可通过用户选择或点击适当乐器手动识别。在此情况下,用户发出的声音的具体性质和音高可能不是重要的,尽管考虑到由用户发出的声音的音量可以影响为打击音轨生成的关联声音的增益。可替代地,由用户发出的声音可以表示待关联声音的打击乐器。例如,用户可以发出声音“隆隆声” “、咂咂声”或“咔咔声”以分别指示底鼓、符号或嗵鼓(tomdrum)节拍。在又一实施例中,用户可以简单地点击或选择网格1402中的框来向音轨增加或去掉声音。多个制作自动作曲模块
MTAC模块144 (图1A)被配置成与音频转换器140以及可选地与RSLL 142结合操作, 以能够自动产生从制作的集合中得到的单个“最佳”制作。MTAC模块144的一个实施例图示于图15中。在此实施例中,MTAC模块144包括对来自所记录的音频的每个制作的分割部分打分的分割打分器1702和基于通过分割打分器1702识别的分数组合单个“最佳”制作的组合器1704。分割打分器1702可被配置成基于任何一个或多个标准对分割部分打分,它可利用在处理器四02上运行的一个或多个过程。例如,一个分割部分可基于该分割部分的键相对于为整个组合选择的键而被打分。通常,表演者可能不知道唱走调音符。因此,一个分割部分中的音符还可以基于音符的键和用于该分割部分的适当键之间的差而被打分。不过,在许多情况下,新手终端用户可能不知道他想要唱哪个音乐键。结果是,分割打分器1702还可被配置成自动地识别键,这可被称作“自动键检测”。借助“自动键检测”,分割打分器1702可确定最接近终端用户记录的音频性能的键的那个键。系统50可高亮与自动检测的键不合调的任何音符,并可以进一步自动将那些音符调节到为自动确定的调号(key signature)的基本频率。用于确定音乐键的一个示例性过程描绘于图16中。如第一块所示,此过程将整个音轨相对于 12个音乐键(C, C#/Db, D#/Eb, Ε, F, F#/Gb, G, G#/Ab, A, A#/Bb, B冲的每一个打分,权重是键中的每个基本频率。例如,对于一些任意大调的键的权重阵列可能类似[1,-1,1,-1,1,1,-1,1,-1,1,-1,1],它以哆(Do)开始以睞(Re)等继续的音阶升降来向12个音符中的每一个分配权重。向每个音符(或与语音的间隔)分配权重适用于任何类型的键。偏离键的音符被分配负权重。尽管此权重的幅值通常较不重要,它们可被调节到个别用户品味或基于来自流派匹配器模块152的输入。例如,键中的一些音调更加确定是该键,所以它们的权重的幅值可能更高。而且,不在键中的一些音调比其它音调更普遍;它们可保持为负值,但具有更小的幅值。因此,用户或系统100 (基于输入,例如来自流派匹配器模块152)可以开发对于大调的更加细化的keyWeight阵列,它可以是[1,_1,
5,-.5,.8,.9,-1,1,-.8,.9,-.2,.5]。12个大调中的每一个可以与权重阵列关联。本领域普通技术人员在看到本说明书、附图和权利要求后会理解到,通过参照显示键中的音符的相对位置的任何文献,选择计算键中的音符的每个阵列的权重,可以适应小(或其它任何)调。如图16的第三块所示,相对于整个段落(或分割部分)的持续时间的每个音符的持续时间乘以当前针对循环分析的键中的音符的音高类型的“权重”,以确定该段落中每个音符的分数。在每个段落开始时,分数是零,然后每个音符与当前键相对比的分数被相继加入,直到段落中没有其它音符,过程循环返回,以开始分析关于下一键的段落。过程的主循环的结果是对于每个键的单个键分数,它反映段落中每个音符的所有分数的集合。在图16 过程的最后一个块,具有最高分数的键被选择为BestKey (即最适合该段落)。本领域普通技术人员会理解,不同的键可能得分相同,或具有相当相似的分数以至于基本上是平分。在一个实施例中,在图17中由值“索引(index)”代表的音符的音高类型可以使用公式确定index := (note, pitch - key + 12) % 12,这里note, pitch代表与一种乐器的特定音高关联的数字值,其中数字值优选以增加的音高次序分配。以钢琴为例,钢琴有88 个键,每个键可与在1和包含88在内之间的数值关联。例如,键1可以是AO Double Pedal Α,键88可以是C8八度音阶,键40可以是中C。在另一实施例中,终端用户知道他们希望在哪个音乐键,用户可找到该键,在这种情况下,图16的过程仅会为终端用户选择的一个键而不是指示的12个键开始。以此方式, 分割部分中的每个部分可相对于用户以上面讨论的方式选择的单个预定键而被判断。在另一实施例中,分割部分还可以相对于和弦约束而被判断。和弦顺序是在用户希望记录一个伴奏时可以使用的音乐约束。伴奏通常可认为是和弦音轨中音符的集合,还可包括和弦本身。当然,允许演奏和弦外的音符,但是通常必须判断这些音符的音乐价值。根据和弦顺序约束对分割部分的谐调的质量打分的一个示例性过程图示于图17, 17A和17B中。在图17的过程中,根据所选择和弦与音频音轨的给定分割部分(或拍子)协调的程度每一次对一个选择的和弦打分。每个音符的和弦分数是加分和乘数的和。在过程 1700的第二框中,对于段落中的每个音符,变量被重新设置为0。然后,音符的音高的关系与当前选择的和弦进行比较。如果音符在所选择的和弦中,则乘数被设置为过程1700的第一框中的chordNoteMultiplier设置的值。如果音符是和弦根音(例如,C是C大调和弦的和弦根音)的三全音(即跨越3个全音调的音乐间隔),则乘数被设置为tritoneMultiplier 的值(如在图17A中所示是负值,因此表示音符与所选和弦不够协调)。如果音符是超过根音的一个或八个半音(或在小调和弦的情况下超过根音4个半音),则乘数被设置为 nonKeyMultiplier的值(如图17A中所示又是负值,因此表示该音符与选择的和弦不够协调)。不落入前述类别中的音符被分配0乘数,因此对和弦分数没有影响。如图17B所示,乘数被当前音符所在的段落的部分持续时间定标。如果音符处于段落的开始,或者如果音符是为分析选择的当前和弦的根音,则得分被加入到和弦分数。关于段落的和弦分数是对于每个音符的计算的累加。一旦分析了第一选择和弦,则系统50可再次使用过程1700来(一次一个地)分析其它选择的和弦。每次通过过程1700的和弦分数可以在彼此之间比较,最高分数会确定被选择为作为与段落最佳配合来伴奏该段落的和弦。本领域普通技术人员在看到本说明书、附图和权利要求后会理解到,可能找到两个或多个和弦与选择的段落具有相同分数,在这种情况下,系统50会基于各种选择基础,包括但不限于音乐音轨的流派来在这些和弦之间做出决定。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,上文陈述的打分过程在某种程度上是最好根据西方音乐中的流行音乐流派设计选择要考虑的事情。相应地要考虑对于乘数的选择标准可针对不同音乐流派改变和/或在图 17中分配给各乘数选择标准的乘数值可被改变以反映不同的音乐品味,而不偏离本发明的精神。在另一实施例中,分割打分器1702还可相对于特定允许的音高值的集合判断分割部分,诸如半音在西方音乐中是普遍的。不过,类似地考虑其它音乐传统(诸如中东文化的那些音乐传统)的四分之一音高。在另一实施例中,还可以基于分割部分中的各个音高之间的过渡来对该分割部分打分。例如,如上文讨论的,可使用音高脉冲检测来识别音高变化。在一个实施例中,相同的音高脉冲检测还可以用来识别一个分割部分中的音高过渡的质量。在一种方法中,系统可以利用通常理解的概念抑制谐波振荡器通常满足以下等式
其中,ω 0是振荡器的非衰减角频率,ζ是取决于系统的常数,被称作衰减率(对于弹性常数k和衰减系数C的弹簧上的质量,ζκΛπ ο^)。要理解,衰减率ζ的
值临界地确定衰减系统的行为(例如,过衰减,临界衰减(ζ =1)或欠衰减)。在临界衰减系统中,在无振荡时系统会尽快返回平衡。专业歌手通常能够以临界衰减的响应改变他/她的音高。通过使用音高脉冲分析,可以确定音高变化的真实开始事件和音高变化的质量。具体地,音高变化事件是推论阶梯函数,而音高变化的质量是由ζ的值确定的。例如,图19 描述3个值ζ的衰减谐波振荡器的阶梯响应。通常,ζ的值>1表示差的声音控制,其中歌手“追寻”目标音高。因此,ζ的值越大,归因于该分割部分的音高-过渡-分数越差。对音高过渡的质量打分的另一示例性方法示于图20中。在此实施例中,分割部分的打分可包括接收音频输入(过程2002),将音频输入转换成音高事件的形态,显示音高变化之间的真实振荡(过程2004),使用音高事件的形态构建每个音高事件之间具有临界衰减音高变化的波形(过程2006),计算所构建的波形中音高和原始音频波形之间的差(过程 2008),并基于此差异计算分数(过程2010)。在一个实施例中,该分数可以基于“过滤音高” 和“重构音高”之间的有符号均方根来进行。简单讲,此计算可指示终端用户他们偏离“理想”音高多远,这又依次可变成音高-过渡-分数。还可以利用上文描述的打分方法来相对于显式参考或隐式参考对分割部分打分。 显式参考可以是现有或预记录的曲调音轨,音乐键,和弦顺序或音符范围。当表演者正在与另一音轨一致地录音时,通常使用显式情况。显式情况还可以被类推为判断卡拉O K,原因是音乐参考存在且正在使用以前已知的曲调作为参考来分析音轨。另一方面,隐式参考可以是由多个以前记录的制作中计算的“目标”曲调(即系统对表演者旨在产生的音调的最佳猜想),这些制作已经由音轨记录器202存储在数据存储装置132中。在用户正在记录歌曲的前奏曲时,通常使用隐式情况,此时歌曲中没有参考可用,诸如分割打分器1702不知道的原始作品或歌曲。在参考是隐式的情况下,可根据制作计算参考。这通常是通过确定每个以前记录的音轨的N个分割部分中每个部分的形态的重心来实现的。在一个实施例中,一组形态的重心只是通过求取平均音高和形态中每个事件的持续时间构成的新形态。对于η=1到N,重复此操作。所产生的重心然后被当作是隐式参考音轨的形态。以此方式确定的单个音符的重心的一个示例描述于图18中,虚线描述所产生的重心。应考虑还可以使用其它方法来计算重心。例如,不是使用平均值,而是使用对于每个制作形态组的形式平均值。在任何一种方法中,在计算平均值或均方值之前可以去掉任何边远值。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,基于在本说明书中陈述的原则,在不必进行过度实验的情况下可以开发用于确定制作的重心的附加选择。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,可以将用于对分割部分打分的任意数量的前述独立方法组合来提供对更宽的考虑组合的分析。可以给予每个分数相同或不同权重。如果给予分数不同权重,它可以基于由流派匹配器模块152 确定的具体的作品流派。例如,在一些音乐流派中,可以对表演的一方面设置比另一方面更高的值。选择应用哪一种打分方法还可以自动或由用户手动确定。如图23所示,音乐表演的分割部分可以从多个记录音轨中的任何一个中选择。组合器1704被配置成将来自多个记录音轨的分割部分组合,以便创建理想音轨。该选择可以通过图形用户界面手动完成,其中用户可查看为每个版本的分割部分识别的分数,试听每个版本的分割部分,并选择一个版本作为“最佳”音轨。可替代地或另外,通过基于上文介绍的打分概念选择具有最高分数的每个音轨分割部分版本来自动执行分割部分的组合。图21图解说明使用MTAC模块144与音频转换器140的结合从制作的集合中提供单个“最佳”制作的过程的一个示例性实施例。在步骤2102,用户设置一种配置。例如,用户可以选择关于显式还是隐式参考来对分割部分打分。用户还可以选择一个或多个标准 (即键,曲调,和弦,目标等)以用来对分割部分打分和/或提供排序以识别相关权重或每个标准的重要性。然后,在步骤2104中记录制作,在步骤2106中被分割,在步骤2108中使用上文描述的过程转换成一种形态。如果RSSL模块142正在被使用,则如上文所述,在制作结束时,音轨可自动循环回到开始位置,允许用户记录另一制作。同样,在记录过程中,用户可以选择听节拍音轨,以前记录的音轨,任何一个音轨的MIDI版本,或如上文讨论的关于显式或隐式参考计算的“目标”音轨的MIDI版本(参见图18、19、20和21)。这允许用户聆听他可以产生下一个(有希望改进的)制作的参考。在一个实施例中,终端用户可以选择所记录的(若干)制作可以与之比对而被打分的参考和/或一个或多个方法,步骤2110。例如,用户的配置可以指示该分割部分应相对于键、曲调、和弦由一个或多个音轨的重心构建的目标形态或上文讨论的其它任何方法来打分。引导选择可以由用户手动进行或者由系统自动设置。制作的分割部分在步骤2112中被打分,在步骤2114中,对于音轨中每个分割部分的打分的指示可指示给用户。这可通过给终端用户提供他们的音高或时间偏离的指示使终端用户受益,使得终端用户可在以后的制作中改进。用于图解说明分割部分的分数的图形显示的一个示例图示于图22中。具体地,图22的垂直条描述由音频来源记录的音频波形, 黑色实线主要是水平线描述音频来源试图模仿的理想波形,箭头表示音频来源(例如歌手) 的音高与理想波形变化(称作显式参考)的程度。在步骤2116,终端用户手动确定是否记录另一制作。如果用户希望进行另一制作, 则过程返回步骤2104。一旦终端用户已经记录对于一个音轨的所有多个制作,过程前进到步骤2118。在步骤2118,可以给用户提供是否由所有的制作手动或自动地编辑“最佳”整个音轨的选项。如果用户选择创建手动作品,则用户可以在步骤2120简单地试听第一制作的第一分割部分,然后是第二制作的第一分割部分,直到已经试听完每个候选的第一分割部分。 为便于试听和在分割部分的各个制作之间的选择而使用的一个界面显示于图23中,其中终端用户通过使用指针装置(诸如鼠标)点击用于每个分割部分中获得的每个音轨以提示重放该音轨,再随后用户选择这些候选分割部分中的一个作为该分割部分的最佳表现,例如双击所期望的音轨和/或点击拖动所希望的音轨到底部最终的编辑音轨2310。对第二、 第三和以后的分割部分用户重复此过程,直到达到音轨的末尾。然后在步骤21M中通过将所选择的分割部分接合在一起成为单个新音轨,系统构建“最佳”音轨。在步骤2126,用户然后还可以决定是否记录另一制作,以便提高他的表现。如果用户选择自动编辑“最佳”音轨,则在步骤2122基于每个制作中的每个分割部分的分数,新音轨被接合在一起(优选使用每个分割部分的最高得分的制作)。由实际记录的音轨的分割部分接合在一起的虚拟“最佳”音轨的一个例子也图示于图23中。在此例子中,最终的编辑音轨2310包括来自制作1的第一分割部分2302,来自音轨5的第二分割部分2304,来自制作3的第三分割部分2306和来自音轨2的第四分割部分2308,没有使用来自音轨4的分割部分。协调器
协调器模块146执行用于协调来自具有音乐键的伴奏源的音符和/或和前奏源的和弦的过程,前奏源可以是声音输入、乐器(实时或虚拟)或可由用户选择的预先记录的曲调。结合图M和25来描述此伴奏源的协调过程的一个示例性实施例。这些图中的每个图显示为数据流程图(DFD)。这些图通过信息系统提供数据“流”的图形表示,其中数据项通过内部过程从外部数据源或内部数据存储流向内部数据存储或外部数据汇聚。这些图不旨在提供关于过程的时间或次序或者关于过程是顺序还是并行操作的信息。同样,将输入控制流转换成输出控制流的控制信号和过程通常由虚线表示。图M描述协调器模块146通常可包括变换音符模块M02、前奏音乐源2404、伴奏源M06、和弦/键选择器M08和控制器M10。如图所示,变换音符模块可接收来自前奏音乐源M04的前奏音乐输入;以及来自伴奏源M06的伴奏音乐输入。前奏和伴奏音乐可各自由实时音频或以前存储的音频组成。在一个实施例中,协调器模块146还可被配置成基于前奏音乐输入的曲调生成伴奏音乐输入。变换音符模块M02还可接收来自和弦/键选择器M08的音乐键和/或选择的和弦。来自控制器Mio的控制信号指示变换音符模块对02音乐输出是否应该基于前奏音乐输入,伴奏音乐输入和/或来自和弦/键选择器M08的音乐键或和弦,及应该如何处理该变换。例如,如上文所述,音乐键和和弦可以是从前奏曲或伴奏源中得到的,或者甚至是由和弦/键选择器M08指示的从手动选择的键或和弦中得到的。基于控制信号,变换音符模块M02可以可替代地将前奏音乐输入变换成与和弦或音乐键一致的音符,生成协调输出音符。在一个实施例中,输入音符使用预先确立的和音度量被映射到协调音符。在下面将更详细讨论的一个实施例中,控制信号还可被配置成指示一个或多个“布鲁斯音符”是否可以被允许存在于伴奏音乐输入中,而不必由变换音符模块对02变换。图25图解说明一个数据流程图,它大致显示在选择音符以与前奏音乐源2404“协调”时,可以由图M的变换音符模块M02执行的过程的更多细节。如图所示,前奏音乐输入在过程2502被接收,其中前奏曲的音符被确定。在一个实施例中,前奏曲的音高可使用所描述的技术中的一个技术确定,诸如将前奏音乐输入转换成识别其开始、持续时间和音高的形态,或者任何子集或其组合。当然,本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,可以使用由前奏曲确定音符的其它方法。例如,如果前奏音乐输入已经是MIDI格式,则确定音符可仅仅包括从MIDI流中提取音符。当确定前奏曲的音符时,它们被存储在前奏音乐缓冲器2510中。在过程2504从伴奏源M06接收建议的伴奏音乐输入(如图M中所示)。过程2504确定伴奏的音符,并可从MIDI流(在可用时)中提取MIDI 音符,将音乐输入转换成识别其开始、持续时间和音高的形态或其子集或组合,或使用本领域普通技术人员在看到本说明书、附图和权利要求后还会理解的另一方法。在过程2506,可以从在前奏音乐缓冲器2516中找到的音符中确定前奏曲的和弦。 前奏曲的和弦可通过以上文关于图17陈述的相同方式或者通过使用本领域普通技术人员理解的另一方法(诸如使用下文描述的由和弦匹配器1 执行的隐藏马尔可夫模型和弦演进分析)分析音符来确定。音符的时间以及音符本身可以被分析(除了其它可能考虑,诸如流派),以确定前奏曲的当前和弦。一旦已经确定和弦,其音符被传送到变换音符2510,以等待由来自控制和音2514的控制信号的可能选择。在图25的过程2508,可以确定前奏曲的音乐键。在一个实施例中,上文参照图16 描述的过程可以被用来确定前奏曲的键。在其它实施例中,包括使用隐藏马尔可夫模型或类似模型的统计技术可用来由存储在前奏音乐缓冲器中的音符来确定音乐键。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,确定音乐键的其它方法可类似地被考虑,包括但不限于过程1600和使用统计技术的组合。过程2508的输出是变换音符 2510的许多输入中的一个。过程2510(图25)“变换”作为伴奏使用的音符。输入到过程2510中的伴奏音乐音符的变换是通过控制和音2514的输出确定的(在下文稍微详细讨论)。基于控制和音2514 的输出,变换音符过程2510可在以下之间选择(a)来自过程2504的音符输入(其显示于图M中,已经接收来自伴奏源M06的伴奏音乐输入);(b)来自和弦的一个或多个音符(显示于图M中,已经从和弦/键选择器M08接收);(c)来自所选择的音乐键的音符(键的标识已经从和弦/键选择器M08接收(如图M所示));(d)由过程2506的来自和弦输入的一个或多个音符(显示为已经基于从前奏音乐缓冲器2516中的音符确定的音符和音乐键); 或(e)通过过程2508从前奏音乐缓冲器2516中的音符确定的音乐键。在过程2512,通过修改伴奏音乐输入的音符,并修改伴奏音乐输入的音符的时间, 可渲染变换音符。在一个实施例中,渲染音符是可听地播放的。另外或可替代地,变换音符还可以可视地被渲染。控制和音2514代表过程基于来自一个或多个来源的一个或多个输入所做出的决定的集合,一个或多个来源控制通过变换音符过程2510进行的音符的选择。控制和音2514 接收来自控制器MlO的许多个输入控制信号(参见图M),它可直接来自用户输入(可能来自图形用户输入或预设配置),来自协调器模块146,流派匹配器模块152或另一外部过程。 在控制和音2514可以考虑的可能用户输入中,还有要求输出音符为以下的用户输入(a) 约束为通过和弦/键选择器M08选择的和弦(参见图M); (b)约束为通过和弦/键选择器 2408选择的键(参见图24); (c)与通过M08选择的和弦或键一致(参见图24); (d)约束为由过程2506确定的和弦;(e)约束为由过程2508确定的键;(f)与由前奏音符确定的和弦或键一致;(g)约束在特定的音符范围内(例如,低于中C,在中C的两个八度音阶内等);和 /或(h)约束在特定的音符选择内(S卩小调,增音等)。输入到控制和音2514的另一输入是和音度量,其基本上是来自变换音符过程 2510的反馈路径。首先,“和音”通常被定义为产生与一些基调声音协调一致的声音。和音还可被认为是不协调的反义词(其包括即使不协调也随意使用的任何声音)。所以,如果终端用户已经使控制信号通过控制器MlO被馈送到控制和音2514中,控制器MlO将来自变换音符过程2510的输出音符约束到通过和弦/键选择器M08手动选择的和弦或键,然后一个或多个输出音符可能与前奏音乐缓冲器2516是不协调的。输出音符不协调的指示最终会被馈送到控制和音2514。而控制和音2514被设计成强制变换音符2510生成的输出音符音轨返回到与前奏音乐的和音中,由于反馈和编程系统的固有延迟时间,期望允许许多个不协调音符通过进入音乐输出。实际上,允许在系统产生的音乐中有至少一些不协调音符和甚至不协调缝隙应该对系统50有利,产生音乐作品的较小机械声音,这是发明人期望的。在一个实施例中,也可被输入到控制和音2514中的另一控制信号指示一个或多个“布鲁斯音符”是否可被允许存在于音乐输出中。如上文指出的,用于此说明书目的术语 “布鲁斯音符”被给予比其通常用在布鲁斯音符音乐中更宽的含义,作为不是正确的音乐键或和弦的音符,但允许不经变换而被播放。除了利用系统延迟来提供一些最小限度插入“布鲁斯音符”之外,一个或多个布鲁斯累加器(优选是软件编码的而非硬连线)可用来为布鲁斯音符提供一些附加余地。所以,例如一个累加器可用来将布鲁斯音符的数目限定在单个分割部分内,另一累加器可用来将布鲁斯音符的数目限制在相邻分割部分,又一累加器可用来限制每一预定时间间隔的布鲁斯音符数目或总音符数目。换言之,通过和音度量的控制和音可以计算以下中的任何一个或多个逝去时间、音乐输出中布鲁斯音符的数目,音乐输出中总音符的数目,每个分割部分中布鲁斯音符的数目等。预先确定的,自动确定的和实时确定的/调节的最高限度可被实时编程或作为预设/预定值。这些值还可以受当前作品的流派影响。在一个实施例中,系统100还可包括用于提供伴奏音乐源的超级键盘。超级键盘可以是物理硬件装置,或者通过计算装置生成并显示的图形表示。在任一实施例中,超级键盘可以被认为是用于图M的和弦/键选择器M08的手动输入。超级键盘优选包括键盘上的至少一排输入键,它们动态地关于现有曲调映射到音乐键和/或和弦(即和弦的一部分) 中的音符。超级键盘还可包括与现有曲调不协调的一排输入键。不过,按压超级键盘的不协调的输入键则可被动态地映射到现有曲调的音乐键中的音符,或现有曲调的和弦音符的首符。根据本发明的超级键盘的一个实施例示于图沈中。图沈中所示的实施例是关于用于标准钢琴的音符显示的,不过可理解超级键盘可用于任何乐器。在图26所示的实施例中,超级键盘的上面一排输入键2602映射到标准钢琴音符;中间一排沈04映射到对于现有曲调的音乐键中的音符;下面一排沈06映射到在当前和弦中的音符。更具体地,上面一排显示如常规钢琴中每八度音阶的12个音符,中间一排显示每八度音阶的8个音符,下面一排显示每八度音阶的3个音符。在一个实施例中,中间一排中每个输入键的颜色可取决于曲调的当前音乐键。因此,当曲调的音乐键变化时,被选择显示在中间一排的输入键也变化。在一个实施例中,如果不协调音乐音符由用户从上面一排输入,则超级键盘还可被配置成自动地播放协调音符。以此方式,表演者可以比他选择的行更低的逐渐约束的方式伴奏前奏音乐。图27A图解说明根据本发明的和弦选择器的一个实施例。在此实施例中,和弦选择器可包括和弦轮2700的图形用户界面。和弦轮2700描述关于现有曲调处于音乐键的和弦。在一个实施例中,和弦轮2700显示从当前选择的音乐键得到的和弦。在一个实施例中, 当前选择的音乐键是由曲调确定的,正如上文讨论的。另外或者可替代地,和弦轮的最远的同心圆提供选择音乐键的机构。在一个实施例中,用户可以通过和弦/键选择器对08,通过选择来自和弦轮2700的和弦来输入和弦。在一个实施例中,和弦轮2700描述关于当前选择的音乐键的7个和弦_3个主调和弦,3个小调和弦和1个减小的和弦。在此实施例中,减小的和弦位于和弦轮的中心;3个小调和弦围绕着减小的和弦;3个主调和弦围绕着3个小调和弦。在一个实施例中,表演者能够使用最远的同心圆选择音乐键,其中由和弦轮描述的7个和弦中的每个和弦是通过所选择的音乐键确定的。图27B图解说明根据本发明的和弦选择器在系统50的操作过程中的具体时刻的另一可能的实施例。在此实施例中,和弦选择器可包括和弦花2750。类似和弦轮2700,和弦花2750描述在音乐上落入当前音频音轨的当前音乐键内的和弦的至少一个子集。和弦花2750还指示当前正在播放的和弦。在图27B图解说明的例子中,键是C大调(从大调的标识和在中心的花瓣中包括的小调和弦可以确定),且当前播放的和弦由在中心描述的和弦指示,其在图示的重放时间是C大调。和弦花2750被设置成提供对在紧跟当前播放的和弦之后描述的任何和弦的可能性的视觉提示。如图27B描述的,最可能的和弦演进会来自当前正在播放的C大调到G大调,下一最可能的演进可能是F大调,其后可能跟A大调。在此意义上,任何和弦会跟随在另一和弦之后的可能性在数学意义上不是严格的可能性,而是在具体的音乐流派中特定和弦演进频率的通常概念。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,当前奏音轨产生不同和弦的计算时,则和弦花2750会改变。例如,假设前奏音乐音轨的下一分割部分实际上被确定为与B平大调对应,则花的中心会显示具有降半音符号的大写B。反过来,在C大调的键中找到的其它和弦会绕B降半音 “旋转”到指示任何具体和弦是演进中的下一和弦的相对可能性的布置。咅轨共享器樽块
返回图IA中的系统100的图,音轨共享器模块148能够为系统100传送并接收音轨或多音轨录音。在一个实施例中,此类音轨可被传送或从远程装置或服务器接收。音轨共享器模块148还可执行关于音轨的共享的管理操作,诸如能够进行帐户登录,以及支付和付帐信息的交换。声咅捭索器樽块
声音搜索器模块150同样也在图IA中显示,可执行与寻找以前记录的音轨或多音轨录音相关的操作。例如,基于可听输入,声音搜索器模块150可搜索相似音轨和/或以前记录的多音轨录音。此搜索可以在具体装置50或在其它联网装置或服务器上进行。此搜索的结果然后可以通过装置呈现,音轨或多音轨录音可随后被访问,购买或另外获得以用在装置50上或另外用在系统100中。流派匹配器模块
流派匹配器模块152同样显示于图IA中,被配置成识别和弦顺序和对音乐流派通用的节拍资料。即,用户可以输入或选择将流派与流派匹配器模块152关联的具体流派或示例性乐队。然后可将所指示的流派的一个或多个特色应用于每个生成的音频音轨来执行每个记录的音轨的处理。例如,如果用户指示“爵士”作为期望流派,则所记录的可听输入的量化可被应用,使得节拍的时间可倾向于被切分。同样,从可听输入生成的合成和弦可包括传统上与爵士音乐关联的一个或多个和弦。而且,“布鲁斯音符”的数目可比例如古典作品中允许的数目要高。和弦匹配器模块
和弦匹配器IM提供音高和和弦相关服务。例如,和弦匹配器IM可执行单音轨的智能音高校正。此音轨可由可听输入得到,音高校正可包括修改输入的频率以将可听输入的音高与具体预定的频率对齐。和弦匹配器1 还可构建和细化以前记录的多音轨录音中包括的现有曲调的伴奏。在一个实施例中,和弦匹配器IM还可被配置成基于以前播放的和弦动态地识别对于音频音轨的适当未来和弦的可能性。具体地,和弦匹配器IM可以在一个实施例中包括音乐的数据库。使用隐藏马尔可夫模型与此数据库的结合,未来和弦演进的可能性然后可基于在音频音轨中出现的以前的和弦来确定。网络环境
如上文讨论的,装置50可以是能够执行以上所述过程的任何装置,不要求与其它任何装置联网。不过,图观示出了其中可以实施本发明的网络环境的一个可能实施例的组件。 并非所有组件都要求实施本发明,配置中的变形和组件类型可在不偏离本发明的精神或范围下进行。如图所示,图28的系统沘00包括局域网(“LAN”)/广域网(“WAN”)-(网络》806, 无线网络观10、客户端装置观01-2805,音乐网络装置(MND) 2808和外围输入/输出(I/O) 装置观11-2813。客户端装置观01-2805中的任何一个或多个可包括如上所述的装置100。 当然,尽管图示了客户端装置的几个例子,但应理解在图观公开的网络背景下,客户端装置280H805可虚拟地包括能够处理音频信号并通过网络发送音频相关数据的任何计算装置,诸如网络观06、无线网络观10等等。客户端装置28034805还可包括被配置成便携的装置。因此,客户端装置观03-2805可虚拟地包括能够连接到另一计算装置并接收信息的便携计算装置。此装置包括便携装置,诸如手机、智能电话、显示传真机、射频(RF)装置、 红外(IR)装置、个人数字助理(PDA)、手持计算机、膝上型计算机、可佩戴计算机、平板计算机、结合一个或多个前述装置的集成装置等。因此,客户端装置观03-2805通常根据能力和特征在很宽范围内。例如,手机可具有数字小键盘以及其上只能显示文本的几行单色LCD 显示。在另一例子中,能够上网的移动装置可具有多触敏屏,指示笔和可显示文本和图形的几行彩色IXD显示屏。客户端装置280H805还可虚拟地包括能够通过网络通信以发送和接收信息的任何计算装置,包括音轨信息和社交网络信息,执行生成的可听音轨搜索查询等等。这些装置的集合可包括通常使用有线或无线通信介质连接的装置,诸如个人计算机、多处理器系统、基于微处理器或可编程消费电子、网络PC等等。在一个实施例中,客户端装置 2803-2805中至少一些可通过有线和/或无线网络操作。能上网的客户端装置还可包括被配置成接收并发送网页、基于网络的消息等等的浏览器应用。浏览器应用可被配置成接收并显示图形、文本、多媒体等等,虚拟地利用任何基于网络的语言,包括无线应用协议消息(WAP)等等。在一个实施例中,浏览器应用能够使用手持装置标记语言(HDML),无线标记语言(WML)、WMI^cript、JavaScript、标准通用25标记语言(SMGL)、超文本标记语言(HTML),可扩展标记语言(XML)等等,以显示并发送各种内容。在一个实施例中,客户端装置的用户可利用浏览器应用来与消息客户端交互,诸如文本消息客户端、电子邮件客户端等等,以发送和/或接收消息。客户端装置280H805还可包括被配置成接收来自另一计算装置的内容的至少一个其它客户端应用。客户端应用可包括提供并接收文本内容、图形内容、音频内容等的能力。客户端应用可进一步提供识别其自身的信息,包括类型、能力、名称等。在一个实施例中,客户端装置3001-3005可唯一地通过各种机构来识别它们自身,包括电话号码、移动识别号码(MIN)、电子序列号(ESN)或其它移动装置标识符。信息还可指示移动装置能够利用的内容格式。此信息可在网络包等中提供,发送到MND 108或其它计算装置。客户端装置280H805可进一步被配置成包括能够使终端用户登录到可由另一计算装置诸如MND观08等管理的用户帐户的客户端应用。此用户帐户例如可被配置成使终端用户能够参与一个或多个社交网络活动,诸如提交音轨或多音轨录音,搜索与可听输入相似的音轨或录音,下载音轨或录音,并参与以共享、查看和讨论产生的音轨和多音轨录音为中心的一个具体的在线音乐社区。不过,参与各种联网活动还可以不必登录到用户帐户来进行。在一个实施例中,包括曲调的音乐输入可由客户端装置280H805通过来自MND 3008或者从能够传送此音乐输入的其它任何基于处理器的装置的网络观06或观10接收。 包含曲调的音乐输入可以是预录音的或通过MND 2808或其它此类基于处理器的装置实时捕捉。另外或可替代地,曲调可以是实时由客户端装置观01-2805捕捉的。例如,曲调生成装置可生成曲调,与客户端装置观01-2805中的一个通信的麦克风可捕捉生成的曲调。如果音乐输入是实时捕捉的,则系统通常在计算曲调的音乐键和和弦之前寻找音乐的至少一个小节。这类似于在乐队中演奏的音乐家,其中伴奏音乐家通常可聆听曲调的至少一个小节,以在贡献任何附加音乐之前确定正在播放的音乐键和和弦。在一个实施例中,音乐家可与客户端装置280H805交互,以便伴奏一个曲调,将客户端装置视作虚拟乐器。另外或可替代地,伴奏曲调的音乐家可演唱和/或演奏乐器,诸如用户演奏的乐器,以对曲调伴奏。无线网络观10被配置成将客户端装置280H805和其组件与网络观06耦连。无线网络观10可包括各种无线子网络中的任何一种,其可进一步覆盖单独或专用网络等,以为客户端装置观03-2805提供以设施为导向的连接。此子网络可包括网格网络,无线LAN (WLAN)网络,蜂窝网络等等。无线网络观10可进一步包括由无线电链路等连接的终端、网关、路由器等的自主系统。这些连接器可被配置成自由、随机移动,并任意组织自己,使得无线网络观10的拓扑可快速变化。无线网络观10可进一步利用多个接入技术,包括第二代(2G)、第三代(3G)、第四代(4G)无线接入蜂窝系统,WLAN、无线路由器(WR)网格等等。诸如2G、3G、4G的接入技术和未来的接入网络可以广域覆盖移动装置,诸如具有各种移动程度的客户端装置观03-2805。 例如,无线网络观10可以通过无线网络接入进行无线连接,无线网络接入诸如全球移动通信(GSM)、通用分组无线服务(GPRS)、增强数据GSM环境(EDGE)、宽带码分多址(WCDMA)等等。本质上,无线网络观10可虚拟地包括任何无线通信机构,通过它信息可在客户端装置 2803-2805和另一计算装置、网络等之间传播。网络观06被配置成将网络装置与其它计算装置,包括MND 2808、客户端装置 2801-2802耦连,并通过无线网络观10耦连到客户端装置观03_2805。网络观06能够利用任何形式的计算机可读介质来将信息从一个电子装置传送到另一装置。同样,除了包括局域网(LAN)、广域网(WAN)、诸如通过通用总线(USB)端口、其它形式的计算机可读介质的直接连接,或其任何组合之外,网络106可包括互联网。在包括基于不同架构和协议的那些互联的LAN的互联集上,路由器作为LAN之间的链路,能够使消息从一个发送到另一个。此外,LAN内的通信链路通常包括双绞线对或同轴电缆,而网络之间的通信链路可利用模拟电话线,完全或部分专用的数字线,包括T1、T2、T3和Τ4,集成服务数字网络(ISDN)、数字订阅线(DSL)、包括卫星链路或本领域已知的其它通信链路的无线链路。而且,远程计算机和其它相关电子装置可通过调制解调器和临时电话链路远程连接到LAN或WAN。本质上,网络 2806包括任何通信方法,通过它信息可以在计算装置之间传播。在一个实施例中,客户端装置280H805可使用例如点对点配置来直接通信。此外,通信介质通常体现计算机可读指令、数据结构、程序模块或其它传送机构, 并包括任何信息传送介质。作为例子,通信介质包括有线介质,诸如双绞线,同轴电缆,光纤,波导和其它有线介质和无线介质,诸如声的、RF、红外和其它无线介质。各种外设,包括I/O装置观11_2813可附连到客户端装置观01_2805。多触点压力垫观13可接收来自用户的物理输入并作为USB外设分配,尽管不限于USB,也可以使用其它接口协议,包括但不限于ZIGBEE、蓝牙等等。通过外部和压力垫观13的接口协议传送的数据可包括例如MIDI格式的数据,不过其它格式的数据也可通过此连接传送。类似的压力垫观09可以可替代地全部与客户端装置,诸如移动装置观05集成。耳机观12可附连到客户端装置的音频端或其它有线或无线I/O接口,为用户聆听所记录音轨以及系统的可听输入的循环重放提供示例性布置。麦克风观11可通过音频端或其它连接附连到客户端装置 2801-2805.可替代地或者另外,耳机观12和麦克风观11,一个或多个其它扬声器和/或麦克风可集成到一个或多个客户端装置280H805或其它外围装置观11_2813。同样,外部装置可连接到压力垫观13和/或客户端装置101-105,以提供声音样本、波形、信号或其它可由外部控制重新产生的音乐输入的外部来源。此外部装置可以是MIDI装置,客户端装置 2803和/或压力垫观13可向MIDI装置路由MIDI事件或其它数据以便由外部装置观14触发音频的重放。不过,除了 MIDI之外的格式还可被此类外部装置使用。图30根据一个实施例示出了网络装置3000的一个实施例。网络装置3000可包括比所示的更多或更少的组件。不过,所示的组件足以公开用于实施本发明的示例性实施例。 网络装置3000可代表例如图28的MND 2808。简单讲,网络装置3000可包括能够连接到网络观06的任何计算装置,以使用户能够在不同帐户之间发送并接收音轨和音轨信息。在一个实施例中,此音轨分配或共享也是在不同的客户端装置之间执行的,其可由不同用户、系统管理员、商业实体等管理。另外或可替代地,网络装置3000可以共享调子,包括借助装置 280H805产生的曲调和和音。在一个实施例中,此曲调或调子分配或共享也是在不同的客户端装置之间执行的,其可由不同用户、系统管理员、商业实体等管理。在一个实施例中,网络装置3000还操作以自动地从音乐键和/或和弦中为曲调提供类似“最佳”音乐键和/或和弦。可以作为网络装置3000操作的装置包括各种网络装置,包括但不限于个人计算机、桌上型计算机、微处理器系统、基于微处理器的或可编程消费电子、网络PC、服务器、网络设备等等。如图30所示,网络装置3000包括处理单元3012、视频显示适配器3014和大容量存储器,它们都通过总线3022彼此通信。大容量存储器通常包括RAM 3016,ROM 3032 和一个或多个永久性大容量存储装置,诸如硬盘驱动器30 、磁带驱动器、光学驱动器和/ 或软盘驱动器。大容量存储器存储用于控制网络装置3000的操作的操作系统3020。可以使用任何通用操作系统。基本输入/输出系统(“BIOS”)3018也被提供以控制网络装置 3000的底层操作。如图30所示,网络装置3000还与互联网或其它一些通信网络通过网络接口单元3010通信,其被构建以与各种通信协议一起使用,包括TCP/IP协议。网络接口单元3010有时已知为收发器、收发装置或网络接口卡(NIC)。如上文所述的大容量存储器图解说明计算机可读介质的另一类型,即计算机可读存储介质。计算机可读存储介质可包括以任何方法或技术实现的用于存储信息的易失性、 非易失性、可移动和不可移动介质,存储的信息例如计算机可读指令、数据结构、程序模块或其它数据。计算机可读存储介质的例子包括RAM、ROM、EEPR0M、闪存或其它存储器技术、 CD-ROM、数字通用盘(DVD)或其它光学存储器、磁带盒、磁带、磁盘存储器或其它磁存储装置,或可用来存储期望信息并可由计算装置访问的其它任何介质。如图所示,数据存储装置3052可包括数据库、文本、表单、文件夹、文件等,它们可被配置成保持并存储用户帐户标识,电子邮件地址、IM地址和/或其它网络地址,分组标识符信息,与每个用户帐户关联的音轨或多音轨录音,用于共享音轨和/或录音的规则,付帐信息等等。在一个实施例中,数据存储装置3052中的至少一些还可能被存储在网络装置 3000的另一组件上,包括但不限于⑶-R0M/DVD-R0M 3026,硬盘驱动器30 等等。大容量存储器还存储程序代码和数据。一个或多个应用3050被加载到大容量存储器中,并在操作系统3020上运行。应用程序的例子可包括自动译码器、调度程序、日历、 数据库程序、字处理程序、HTTP程序、可定制用户界面程序、IPSec应用、加密程序、安全性程序、SMS消息服务器、IM消息服务器、电子邮件服务器、帐户管理器等等。网络服务器3057 和音乐服务3056还可作为应用3050内的应用程序被包括在内。网络服务器3057代表被配置成通过网络向另一计算装置提供包括消息的内容的各种服务中的任何一种。因此,网络服务器3057包括例如网络服务器、文件传送协议(FTP) 服务器、数据库服务器、内容服务器等等。网络服务器3057可使用各种格式中的任何一种通过网络提供包括消息的内容,格式包括但不限于WAP、HDML、WML, SMGL, HTML、XML、cHTML、 xHTML等等。在一个实施例中,网络服务器3057可被配置成使用户能够访问并管理用户帐户和共享的音轨和多音轨录音。音乐服务3056可提供与能够进行在线音乐社区相关的各种功能,并且可以进一步包括音乐匹配器30M、权限管理器3058和曲调数据。音乐匹配器30M可将类似音轨和多音轨录音,包括数据存储装置3052中存储的音轨匹配。在一个实施例中,此匹配可以由声音搜索器或客户端装置上的MTAC请求,其可以提供例如待匹配的可听输入、音轨或多音轨录音。权限管理器3508使与帐户关联的用户上传音轨和多音轨录音。此音轨和多音轨录音可存储在一个或多个数据存储装置3052中。权限管理器3058可以进一步使用户能够提供对于所提供的音轨和多音轨录音的分配的控制,诸如基于在线音乐社区、支付或音轨或多音轨录音的潜在使用的关系或成员的限制。使用权限管理器3058,用户还可以将所有访问权限限制到存储的音轨或多音轨录音,从而存储未完成的录音或其它进行中的作品, 而在用户认为它准备好之前不进行社区浏览。音乐服务3056还可驻存或另外使单或多玩家游戏能够被在线音乐社区的各个成员玩耍。例如,由音乐服务3056驻存的多用户角色扮演游戏可在音乐录音行业中被设置。 用户可以为通常从事某行业的人选择角色。游戏用户然后可以使用它们的客户端装置50例如RSLL 142和MTAC 144通过创建音乐来发展它们的人物。消息服务器3056可包括虚拟的被配置、设置为将来自消息用户代理和/或其它消息服务器的消息转送或传送消息的任何一个或多个计算组件。因此,消息服务器3056可包括消息传送管理器,以使用各种消息协议包括但不限于SMS消息器、IM、MMS, IRC、RSS源、 mIRC,各种文本消息协议中的任何一种或各种其它消息类型中的任何一种来传送消息。在一个实施例中,消息服务器3056可以使用户发起和/或以其它方式进行聊天会话,VOIP会话,文本消息会话等等。应注意的是,尽管网络装置3000被图示为单个网络装置,但是本发明并非受此限制。例如,在另一实施例中,网络装置300的音乐服务等可存在于一个网络装置中,而相关数据存储装置可存在于另一网络装置中。在又一实施例中,各种音乐和/或消息传送组件可存在于一个或多个客户端装置中,操作于点对点配置中等。游戏环境
为了进一步便于音乐的创建和组合,图31-37图解说明提供游戏界面作为上文描述的音乐汇编工具的用户界面的实施例。以此方式,认为用户界面会较不令人恐惧,更加用户友好,以便最小化终端对用户的创作音乐过程的任何干扰。从前面的讨论中显示,游戏界面提供与上文描述的一个或多个功能方面关联的可视提示和标记,以便精简、简化和鼓励音乐汇编过程。这使终端用户(关于此实施例也称作“玩家”)利用专业的高质量工具来创建专业高质量的音乐,而不要求这些用户必须具有音乐理论或音乐创建工作操作的任何经验。首先来看图31,提供第一显示界面3100的一个示例性实施例。在此界面中,可给玩家提供从位于混合板之后的音乐产生器的视角的工作室视图。在图31的实施例中,然后在背景中可以看见有3个不同的工作室前奏声音/乐器室3102、打击乐器室3104和伴奏室3106。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到工作室的数目可以更多或更少,每个工作室中提供的功能可以被不同地再次划分和/或可以在工作室中提供附加选项。图31中描述的3个室中的每个室可包括一个或多个音乐家“头像”,其提供图解说明室的性质和/或目的以及提供对于流派、风格和/或由“头像”表演的音乐色彩性能和正在使用的乐器的种类的可视提示。例如,在图31图示的实施例中,前奏声音/乐器室3102包括女性流行歌手,伴奏室3104包括摇滚鼓手,伴奏室3106包括乡村小提琴家、 摇滚贝司手和说唱音乐电子键盘手。将在下文更加详细地讨论,与游戏环境界面的其它方面结合,音乐家头像的选择提供可视、易于理解的界面,通过该界面,上文描述的各个工具可由大多数新手终端用户容易地实现。为了开始创作音乐,玩家可选择这些室中的一个室。在一个实施例中,用户可以简单地直接使用鼠标或其它输入装置选择室。可替代地,可提供与各个工作室对应的一个或多个按钮。例如,在图31的实施例中,前奏室按钮3110的选择会将玩家送到前奏声音/乐器室3102,选择打击室按钮3108会将玩家送到打击室3104,选择伴奏室按钮3112会将玩家送到伴奏室3106。也可以提供其它可选按钮,如图31所示。例如,录音按钮3116和停止按钮3118可被提供以开始、停止由终端用户在工作室3100通过录音会话实时循环模块142进行的任何音乐的录音(图1A)。设置按钮3120可被提供以允许玩家改变各个设置,诸如期望流派、音色和节奏,音量等等。搜索按钮3122可被提供以使用户能够启动声音搜索器模块150。用于保存(3124)和删除(3126)玩家的音乐作品的按钮也可被提供。图32呈现前奏声音/乐器室3102的一个示例性实施例。在此实施例中,用于此工作室的已经被配置成使终端用户能够为音乐汇编创建并记录一个或多个前奏声音和/ 或乐器音轨。前奏声音/乐器室3102可包括与结合图12-13在上文描述的控件空间类似的控件空间3202。因此,如上文所述,控件空间3202可包括多个分割指示符3204以识别音轨中的每个分割部分(例如音乐小节);垂直线3206图解说明每个小节中的拍子,水平线 3208识别与所选乐器(诸如由乐器选择器3214指示的吉它(图32中所示))关联的各个基本频率,和重放条以识别当前正在被播放的实时循环的特定部分。在图32图示的例子中,界面图解说明假设以前在会话中已经被玩家记录的一个音轨的音频波形3210,不过用户还可以具体与声音搜索模块150(由搜索按钮3122调用(参见图31))结合拖动预存的音频音轨。在图32图示的例子中,所记录的音频波形3210也已经被转换成与吉它的基本频率对应的音符3212的形态,如由乐器选择器3214所指示的。应该理解的是,使用可以拖动到控件空间3202上的各种乐器选择器图标,玩家可以选择一个或多个其它乐器,这会使原始音频波形转换成与新的或另外选择的(若干)乐器的基本频率对应的音符的不同形态。玩家还可以改变小节数,或者每个小节的节拍数,然后也可以使音频波形(通过量化器206 (参见图2))被量化,并在时间上与新改变的时间对齐。还应该理解的是,尽管玩家可选择将音频波形转换成与乐器关联的音符的形态,但玩家不必进行此操作,因此能够使来自可听输入的一个或多个原始声音与其原始音色一起被基本包括在所生成的音频音轨中。如图32所示,还可以在背景中提供歌手3220的头像。在一个实施例中,此头像可提供之前在流派匹配器模块152中定义的特定的音乐流派的易于理解的可视指示。例如, 在图32中,歌手被图示为是流行歌手。在此情况下,所记录的音轨3210的处理可通过应用与流行音乐关联的一个或多个特点来执行。在其它例子中,歌手可以被图示为是男性成年人,年青男性或小女孩,理发店四重奏,作为歌剧或百老汇歌剧女主角,西方乡村明星,说唱音乐家,英国入侵摇滚乐,民歌手等,产生通常被人们理解为与每种类型的歌手关联的合成音高、节奏、模式、音乐结构、音色、表达质量、和音等。在一个实施例中,为了提供附加娱乐价值,歌手头像3220可被编程为跳舞和其它动作,就像头像被包含在录音会话中甚至可能与音乐音轨同步。前奏声音/乐器室界面3102可进一步包括音轨选择器3216。音轨选择器3216 使用户能够记录或创建多个前奏制作,并选择那些制作中的一个或多个以包括在音乐汇编中。例如,在图32中,示出了标记为“1”、“2”、“3”的3个音轨窗口,每个窗口显示对应音轨的音频波形的小型表示,以便为与每个音轨关联的音频提供可视提示。在每个音轨窗口中的音轨可代表单独记录的音频制作。不过,还应该理解的是,可以创建音频音轨的拷贝,在这种情况下,每个音轨窗口可代表单个音频波形的不同实例。例如,音轨窗口 “ 1 ”可代表音频波形的未变化声音版本,音轨窗口“2”可代表转换成与吉它关联的音符形态的音频波形, 音轨窗口“3”可代表转换成与钢琴关联的音符形态的同一音频波形。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,对可在音轨选择器3216上保持的音轨的数目不需要有特别限制。提供音轨选择窗口 3218以便例如通过选择并拖曳3个音轨窗口中的一个或多个到选择窗口 3218使玩家能够选择一个或多个音轨以包括在音乐汇编中。在一个实施例中, 选择窗口 3218还可被用来结合MTAC模块133以便从多个制作“ 1”、“2”和“3”生成单个最佳制作。前奏声音/乐器室界面3102还可包括多个按钮,实现与前奏声音或乐器音轨的创建有关的一个或多个功能。例如,最小化按钮3222可被提供以允许用户最小化网格3202 ; 声音按钮32M可被提供以使用户能够消音或不消音与一个或多个音频音轨关联的声音, 独唱按钮32 可被提供以消音已经由系统100基于音频波形3210或其形态生成的任何伴奏音频,以便允许玩家将精力集中在与前奏音频关联的问题上,新的音轨按钮32 可被提供以使用户能够开始记录新的前奏音轨;形态按钮3230激活频率检测器208和移位器 210在控件空间3202中音频波形上的操作。还可提供一组按钮以使用户能够设置参考音调从而帮助提供声音音轨。因此,切换音高按钮3232可实现和禁止参考音调,音调上调按钮 3234可增大参考音调的频率,音调下调按钮3236可降低参考音调的音高。图33图解说明打击乐器室3104的一个示例性实施例。用于此室的界面被配置成使玩家能够为音乐汇编创建和记录一个或多个节拍音轨。打击乐器室界面3104包括与上文结合图14描述的控件空间类似的控件空间。因此,控件空间可包括网格3302,其代表一个或多个节拍音轨中单独的声音的重放和时间,以识别当前正在被播放的实时循环的特定部分和被划分成多个节拍的多个分割部分(1-4),网格中的每个框3306代表与相关打击乐器关联的声音的时间增量(其中,不加阴影的框指示在该时间增量没有声音被播放,阴影框指示与相关打击乐器的音色关联的声音在该时间增量被播放)。打击乐器片断选择器3308还可被提供,以便使玩家能够创建并选择多个打击乐器片断。在图33所示的例子中,只有单个打击乐器片断“A”的分割部分被显示。不过,通过选择打击乐器片断选择器3308,附加片断可被创建并标识为片断“B”、“C”等等。玩家然后可在每个不同的片断内的每个分割部分中创建不同的打击乐器顺序。创建的片断然后可以任何次序排列,以创建用在音乐汇编中的更多变化的打击乐器音轨。例如,玩家可能希望创建以下列次序重复播放的不同的打击乐器音轨“A”、“A”、“B”、“C”、“B”,尽管可以创建任何数目的片断并且可以使用任何次序。为了便于查看和创建多个打击乐器片断,片断重放指示器3310可被提供,以可视地指示当前正在被播放和/或编辑的打击乐器片断以及正在被播放和/或编辑的片断的部分。如图33中进一步图示的,还可以在背景中提供鼓手的头像3320。与结合前奏声音 /乐器室3102描述的表演者头像类似,鼓手头像3320可提供易于理解的与以前在流派匹配器模块152中定义的流派对应的音乐的特定流派和播放风格的可视指示。例如,在图33 中,鼓手被图示为是摇滚鼓手。在此情况下,可通过应用与摇滚音乐关联的以前定义的打击乐器的一个或多个特点来对每个打击乐器执行所创建的打击乐器音轨的处理。在一个实施例中,为提供附加娱乐价值,鼓手头像3320可被编程为跳舞和其它动作,就像头像被包括在录音会话中甚至可能与音频音轨同步。打击乐器室界面3104还可包括多个按钮以能够实现与一个或多个打击乐器音轨的创建关联的一个或多个功能。例如,最小化按钮3312可被提供以使用户最小化网格 3302,声音按钮3314可被提供以使用户消音或不消音与一个或多个音频音轨关联的声音, 独唱按钮3316可被提供以使用户在消音和不消音之间切换,以停止其它音频音轨的重放,使得玩家可以不分心地集中在打击乐器音轨上,附加的打击乐器按钮3318增加与可由玩家选择的打击乐器相对应的附加子音轨,摇摆按钮3320允许用户摆动(即切分)音符。图34A-C呈现伴奏室界面3106的一个示例性实施例。用于此工作室的界面被配置成给玩家提供音乐托盘,由此用户可以为音乐汇编选择并创建一个或多个伴奏音轨。例如,如图34A所示,可给玩家提供乐器类型选择条3402,以使玩家选择为前奏声音和/或音乐音轨伴奏的乐器的类型。在所示的实施例中,图示了用于选择的3个类型一贝斯3404、 键盘3406和吉它3408。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,可以提供包括各种种类乐器的任意数目的乐器类型,包括黄铜管乐、木管乐器和弦乐器。出于说明目的,我们假设玩家已经在图34A中选择贝斯类型3404。在该情况下,然后给玩家提供从一个或多个音乐家头像中选择播放伴奏乐器的选项。例如,如图34B所示, 可给玩家提供在乡村音乐家;3410、摇滚音乐家3412和说唱音乐家3414之间选择的选项,玩家然后可以通过直接点击希望的头像来进行选择。当然,尽管显示了 3个头像,但允许玩家在更多或更少的选项之间选择。箭头3416还可被提供以使玩家能在头像选项之间滚动,特别是在提供更多头像选项时。在图34中选择音乐家头像之后,然后可以给玩家提供选择特定乐器的选项。例如,我们现在假设玩家已经选择乡村音乐家。如图34C所示,然后可以给玩家提供在电子贝斯吉它3418、标准贝斯3420或声音贝斯吉它3422中选择的选项,然后玩家可以通过直接点击希望乐器来进行选择。还可提供箭头34M以使玩家能够在乐器选项之间滚动,本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到这不限于只有3种的贝斯乐器。当然,尽管在上面的顺序中,乐器类型是在选择音乐家头像之前选择的,考虑可给玩家提供在选择乐器类型之前选择音乐家头像的选项。类似地,还考虑可给玩家提供在选择音乐家头像之前选择特定乐器的选项。在玩家已经选择音乐家头像和乐器之后,系统100通过基于当前正在前奏声音/ 乐器室3102 (即使其它室是静音的)中播放的一个或多个前奏音轨生成一组伴奏音符,来创建适当的伴奏音轨,利用流派匹配器模块152和协调器模块146将这些音符转换成适当流派、音色和音乐风格以用于选择的音乐家和乐器,从而与一个或多个前奏音轨协调。因此, 根据由玩家选择的乐器和音乐家头像,用于特定乐器的伴奏音轨可能具有不同声音、时间、 和音、布鲁斯音符内容等。伴奏室界面3106还被配置成使玩家能够分别试听多个音乐家头像和/或多个乐器中的每一个,以帮助选择优选的伴奏音轨。因此,一旦乐器和头像已经由用户选择,相应的伴奏音轨已经如上文所述被创建,则伴奏音轨在实时循环重放过程中与以前创建的其它音轨(前奏,打击乐器或伴奏)一起被自动播放,使得玩家可以实际上实时地评估新的伴奏是否是良好适合的。然后玩家可以选择保持伴奏音轨,不相同乐器选择不同的音乐家,为相同音乐家头像选择不同的乐器,挑选全新的头像和乐器,或者完全地删除伴奏音轨。玩家还可以通过重复的以上描述的步骤创建多个伴奏音轨。图35图解说明描述和弦演进播放作为前奏音乐的伴奏的图形界面的一个可能的实施例。在一个实施例中,此图形用户界面可通过按图34A、34B和34C所示的花形按钮来启动。具体地,此界面显示了由于允许任何布鲁斯音符(由于上文与图25关联讨论的流派和其它问题)通常被迫进入到伴奏室3106中的多个伴奏头像的和弦演进,头像可能已经构建于其关联配置文件中。每个头像还可以具有由于头像的流派或基于头像的其它属性与头像关联的特定琶音技术(即顺序播放的断弦)。如图35的例子描述的,和弦演进是“G”大调, “A”大调,“A”小调,根据伴奏室3106中的每个伴奏头像分别关联的技术,为分割部分的全部播放每个和弦。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,在单一分割部分中和弦演进可以改变和弦多次,或可以在多个分割部分中可以保持相同的和弦。图36图解说明一个示例性界面,通过它玩家可以识别玩家想要创建或编辑的音乐汇编的部分。例如,在图36所示的示例性界面中,提供标签结构3600,玩家可以在音乐作品的介绍部分、歌词部分和和唱部分之间选择。当然,应该理解的是,音乐作品的其它部分也可以是可用的,诸如过门、独白(outro)等等。可以预先通过玩家手动选择,或者基于所选择的音乐流派自动设置确定可用于在具体音乐作品中进行编辑的部分。各个部分最终排列以形成音乐作品的次序可由玩家手动选择,或基于所选择的音乐流派自动设置类似地被预先确定。所以,例如如果新手用户选择创建流行歌曲,则标签结构3600可被预填充流行作品的预期的元素,这通常包括介绍、一个或多个歌词,合唱,过门和结束。然后可以提示终端用户创建与此全部作品的第一方面关联的音乐。在完成整体作品的第一方面之后,可以引导终端用户创建另一方面。每个方面单独和/或一起可被打分,以警告终端用户相邻元素的键是否不同。本领域普通技术人员在看到本说明书、附图和权利要求后还会理解到,使用标准图形用户界面操作技术,作品的各部分可被删除,移动到作品的其它部分,拷贝并在之后被修改等等。如图36所示,用于单独汇编的每个部分的标签还可包括可选择图标,以使玩家能够识别并编辑与该部分关联的音频音轨,其中第一排可图解说明前奏音轨,第二排可图解说明伴奏音轨,第三排可图解说明打击乐器音轨。在所示的例子中,介绍会话被显示为包括键盘和吉它前奏音轨(分别是3602和3604);吉它,键盘和贝斯伴奏音轨(分别是3606,3608 和3610);和打击乐器音轨3612。还可提供和弦选择器图标3614,使得当被选择时给玩家提供(诸如图27或图35的)界面,允许玩家改变与伴奏音轨关联的和弦。图37A和37B图解说明可为上文描述的图形界面中使用并存储在数据存储装置 132中的特定可视提示提供的文件结构。首先来看图37A,在本文中也称作音乐资源,可为每个音乐家头像提供玩家可在图形界面中可选择的音乐资源。例如,在图37A中,图示的顶部音乐资源用于说唱音乐家。在此实施例中,音乐资源可包括可视属性3704,其识别待与音乐资源关联的头像的图形样子。音乐资源还可包括与音乐资源关联的一个或多个功能属性,在玩家选择音乐资源时,被应用于音频音轨或汇编。功能属性可被存储在音乐资源中和 /或提供对另一文件、对象或过程的指针或调用,诸如流派匹配器152。功能属性可被配置成影响上文描述的各个设置或选择中的任何一个,包括但不限于音轨的节奏或拍子速度, 对待使用的和弦或键的约束,对可用乐器的约束,音符之间过渡的性质,音乐汇编的结构或演进等。在一个实施例中,这些功能资源可基于通常与音乐家的可视表示关联的音乐的流派。在可视属性提供特定音乐家的表示的实例中,功能属性还可基于该具体音乐家的音乐风格。图37B图解说明可与每个可选择乐器关联的音乐资源3706的另一集合,这可以是乐器的一般类型(即吉它)或特定乐队和/或乐器模型(即芬达(Fender) Stratocaster, Rhodes Electric钢琴,^irlitzer风琴)。类似于与音乐家头像对应的音乐资源3700,对于乐器的每个音乐资源3706可包括可视属性3708,它识别待与音乐资源关联的乐器的图形样子和该乐器的一个或多个功能属性3710。和上文一样,功能属性3710可被配置成影响上文描述的各种设置或选择中的任何一个。对于乐器,这些可包括可用基本频率,音符之间的过渡的性质等等。使用图31-37中图示的图形工具和基于游戏的动态过程,新手用户能够容易地创建专业声音音乐作品,用户会愿意与其它用户分享该音乐作品以自我享受甚至娱乐,就象玩家可聆听商业产生的音乐一样。在本说明书中,在音乐创作系统的背景中提供的图形范例对各种创作项目和由专业人员通常进行的努力同样表现良好,不然,产生即使一个平常作品所需的技能水平太高使平常人不可能达到。不过,通过简化程序任务,即使新手用户也可以直观容易地创作专业水平的项目。前面的描述和附图只在解释和图示本发明,本发明并不限于此。尽管关于一些实现方式或实施例描述了说明书,但许多细节是出于图示目的陈述的。因此,前述只是图解说明本发明的原理。例如,在不偏离其精神或本质特征下,本发明可以具有其它特定形式。所描述的设置是示例性的,不是限制性的。对于本领域技术人员,本发明可以用另外的实现方式或实施例,在本申请中描述的这些细节在不偏离本发明的基本原理下可被相当大程度地改变。因此,应认识到本领域技术人员能够设计各种配置方式,尽管它们没有在本文中明显描述或显示,但体现本发明的原理,因此落入其范围和精神。
权利要求
1.一种用于创建音乐作品的设备,包括音频界面,其可操作地接收来自音频输入装置的音频,并输出音频到音频输出装置;音频转换器模块,其可操作地连接到所述音频界面,以将通过所述音频界面接收的音频转换成音频音轨;和录音会话模块,其被配置成重复地重放包括第一音频音轨的至少一部分的实时循环, 并在重复重放过程中向所述实时循环增加第二音频音轨的至少一部分。
2.根据权利要求1所述的设备,其中所述第一音频音轨是以前存在的音轨。
3.根据权利要求2所述的设备,其中所述以前存在的音轨是节拍音轨。
4.根据权利要求2所述的设备,其中所述实时循环被存储在数据存储介质中,并且所述以前存在的音轨是之前记录的实时循环。
5.根据权利要求1所述的设备,其中所述录音会话模块被配置成在重放过程中向所述实时循环增加第三音频音轨的至少一部分。
6.根据权利要求5所述的设备,其中所述第三音频音轨是基于所述第一或第二音轨的一个或多个音乐标准自动生成的。
7.根据权利要求6所述的设备,所述第一和第二音轨中的一个是打击乐器音轨。
8.根据权利要求1所述的设备,进一步包括数据存储介质,所述数据存储介质存储所述实时循环、所述第一音频音轨和所述第二音频音轨中的至少一个。
9.根据权利要求1所述的设备,进一步包括耦连到所述录音会话模块的用户界面,所述用户界面提供说明正在被播放的实时循环部分的可视表示。
10.根据权利要求1所述的设备,其中所述音频转换器模块包括将所述第一和第二音频音轨中的至少一个分成一个或多个分割部分的音轨分割器,并且其中所述实时循环包括所述一个或多个分割部分的至少一个子集。
11.根据权利要求10所述的设备,其中所述音频转换器进一步包括量化器,其被配置成将所述一个或多个分割部分中的第一和第二音频音轨的至少一个中的音频与预定节拍对准。
12.根据权利要求11所述的设备,其中所述音频转换器进一步包括频率检测器,其被配置成识别所述一个或多个分割部分中每一个中的一个或多个声音的音高。
13.根据权利要求12所述的设备,其中一个或多个分割部分中的每一个被存储为一种形态,该形态具有标识该分割部分中一个或多个声音的开始、音高和持续时间的信息。
14.根据权利要求13所述的设备,其中所述音频转换器模块进一步包括基于一个或多个标准变换所述音频音轨的频率的频率变换器。
15.根据权利要求14所述的设备,其中所述音频转换器模块进一步包括乐器转换器, 其被配置成将所述音频音轨转换成具有与乐器关联的音色的一个或多个声音。
16.一种用于创建音乐作品的方法,包括识别第一音频音轨;重复重放包括所述第一音频音轨的至少一部分的实时循环;和在所述重复重放过程中向所述实时循环增加第二音频音轨的至少一部分。
17.根据权利要求16所述的方法,其中识别第一音频音轨包括获得以前存在的音轨。
18.根据权利要求16所述的方法,其中识别第一音频音轨包括生成节拍音轨。
19.根据权利要求16所述的方法,其中所述第二音频音轨是基于所述第一音频音轨的一个或多个标准自动生成的。
20.根据权利要求16所述的方法,其中所述第一和第二音轨中的一个是打击乐器音轨。
21.根据权利要求16所述的方法,进一步包括存储所述实时循环、所述第一音频音轨和所述第二音频音轨中的至少一个。
22.根据权利要求16所述的方法,其中识别第一音频音轨包括通过音频界面接收可听输入,并将音频输入转换成音频音轨。
23.根据权利要求22所述的方法,其中转换音频输入包括将所述音频音轨分成一个或多个分割部分。
24.根据权利要求23所述的方法,其中转换音频输入进一步包括用预定节拍量化所述一个或多个分割部分。
25.根据权利要求M所述的方法,其中转换音频输入进一步包括识别所述一个或多个分割部分中每个部分内的一个或多个声音的音高。
26.根据权利要求25所述的方法,其中转换音频输入进一步包括基于一个或多个标准变换所述第一音频音轨的频率。
27.根据权利要求沈所述的方法,其中转换音频输入进一步包括将所述第一音频音轨转换成具有与乐器关联的音色的一个或多个声音。
28.根据权利要求27所述的方法,进一步包括将所述一个或多个分割部分的每一个部分存储为一种形态,该形态具有标识该分割部分中一个或多个声音的开始、音高和持续时间的信息。
29.一种用于创建音乐作品的设备,包括音频界面,其可操作地接收来自音频输入装置的音频,并输出音频到音频输出装置;音频转换器模块,其可操作地连接到所述音频界面,以将通过所述音频界面接收的音频转换成具有一个或多个分割部分的音频音轨;和多音轨组合器模块,其被配置成接收第一音频音轨和第二音频音轨;基于一个或多个标准,自动地对所述第一和第二音频音轨的每个分割部分打分;和基于对于每个分割部分的分数,由所述第一和第二音频音轨的分割部分构成第三音频音轨。
30.根据权利要求四所述的设备,其中所述多音轨组合器模块被配置成基于分割部分中音符的音乐键与预定音乐键的比较,对所述第一和第二音频音轨的每个分割部分打分。
31.根据权利要求30所述的设备,其中所述预定音乐键是由用户选择的。
32.根据权利要求30所述的设备,其中所述多音轨组合器模块被配置成基于所述第一和第二音频音轨的至少一个中的音符自动识别所述预定音乐键。
33.根据权利要求四所述的设备,其中所述多音轨组合器模块被配置成基于该分割部分中的音符与预定和弦约束的比较对每个分割部分打分。
34.根据权利要求四所述的设备,其中所述多音轨组合器模块被配置成基于该分割部分中的音符之间的音高转换质量对每个分割部分打分。
35.根据权利要求四所述的设备,其中所述多音轨组合器模块被配置成基于分数通过在所述第一和第二音频音轨中选择每个分割部分的一个版本来自动地构成所述第三音频首轨。
36.根据权利要求四所述的设备,其中所述多音轨组合器模块被配置成通过以下方式构成所述第三音频音轨显示每个分割部分的分数指示,接收对于每个分割部分的优选版本的用户选择的指示,并基于所接收的用户选择的指示构成所述第三音频音轨。
37.一种用于创建音频音轨的方法,包括接收多个音频音轨;将所述多个音频音轨中的每一个划分成η个分割部分;基于一个或多个标准对所述分割部分中的每一个打分;和基于每个分割部分的分数,由所述第一和第二音频音轨的分割部分构成第三音频音轨。
38.根据权利要求37所述的方法,其中对每个分割部分打分包括将该分割部分中的音符的音乐键与预定音乐键比较。
39.根据权利要求38所述的方法,其中所述预定音乐键是由用户选择的。
40.根据权利要求38所述的方法,其中对每个分割部分打分包括基于所述第一和第二音频音轨的至少一个中的音符自动识别所述预定音乐键。
41.根据权利要求37所述的方法,其中对每个分割部分打分包括将该分割部分中的音符与预定和弦约束比较。
42.根据权利要求37所述的方法,其中对每个分割部分打分包括确定该分割部分中的音符之间的音高转换质量。
43.根据权利要求37所述的方法,其中构成所述第三音频音轨包括通过在所述第一和第二音频音轨中选择每个分割部分的一个版本来自动构成所述第三音频音轨。
44.根据权利要求37所述的方法,其中构成所述第三音频音轨包括显示对于每个分割部分的分数的指示,接收用户选择的每个分割部分的优选版本的指示,并基于所接收的用户选择的指示构成所述第三音频音轨。
45.一种用于增强音频的设备,包括第一界面,其从第一来源接收第一音频片断;和协调模块,其耦连到所述第一界面,所述协调模块被配置成识别所述第一音频片段的至少一个音乐性质;基于所述至少一个音乐性质计算与所述第一音频片断协调的音符的子集;以及从所述音符的子集中选择以生成基本与所述第一音频片断同步播放的音频音轨。
46.根据权利要求45所述的设备,其中所述至少一个音乐性质是与所述第一音频片断关联的和弦。
47.根据权利要求45所述的设备,其中所述至少一个音乐性质是与所述第一音频片断关联的音乐键。
48.根据权利要求45所述的设备,进一步包括接收来自第二来源的第二音频片断的第二界面,其中所述协调模块被配置成通过转换所述第二音频片断的一个或多个音符来生成所述音频音轨。
49.根据权利要求48所述的设备,其中所述协调模块被配置成通过改变所述一个或多个音符的频率来转换所述第二音频片断的一个或多个音符。
50.根据权利要求48所述的设备,其中所述协调模块被配置成将所述第二音频片断中的一个或多个音符转换成从所述音符的子集中选择的一个或多个音符。
51.根据权利要求45所述的设备,其中所述协调模块被配置成通过改变所述一个或多个音符的时间来转换所述第二音频片断中的一个或多个音符。
52.根据权利要求45所述的设备,进一步包括耦连到音乐性质选择器的第三界面,其中所述至少一个音乐性质是基于用户通过所述音乐性质选择器选择的输入来识别的。
53.根据权利要求45所述的设备,进一步包括耦连到所述协调模块的键盘,该键盘被设置成包括与一种乐器的标准音符集对应的第一组输入键,与在预定曲调的音乐键中的音符对应的第二组键,和与在所述预定曲调的和弦内的音符对应的第三组键。
54.一种用于增强音频的方法,包括从第一界面接收第一音频片断;识别所述第一音频片断的至少一个音乐性质;基于所述至少一个音乐性质,计算与所述第一音频片断协调的音符的子集;以及从所述音符的子集中选择,以生成基本与所述第一音频片断同步播放的音频音轨。
55.根据权利要求M所述的方法,其中识别至少一个音乐性质包括识别与所述第一音频片断关联的和弦或键中的至少一个。
56.根据权利要求M所述的方法,进一步包括从第二来源接收第二音频片断;并通过转换所述第二音频片断的一个或多个音符来生成音频音轨。
57.根据权利要求56所述的方法,其中生成音频音轨包括基于从所述音符的子集中选择的音符,改变所述第二音频片断中的一个或多个音符的频率。
58.根据权利要求56所述的方法,其中生成音频音轨包括将所述第二音频片断中的一个或多个音符转换成从所述音符的子集中选择的一个或多个音符。
59.根据权利要求56所述的方法,其中生成音频音轨包括改变所述第二音频片断中的一个或多个音符的时间以基本与所述第一音频片断中的一个或多个音符同步。
60.根据权利要求56所述的方法,进一步包括从通过第三界面可操作地连接的音乐性质选择器中接收所述至少一个音乐性质的指示。
61.一种用于辅助终端用户开发音乐作品的系统,所述系统包括数据存储介质;存储在所述数据存储介质中的多个音乐资源,所述多个音乐资源中的每个音乐资源与功能属性和可视属性关联,所述可视属性向终端用户提供关于所述音乐资源的功能属性的可视建议;耦连到音频界面、显示驱动器和用户输入处理器的用户界面;所述用户界面能够渲染图形显示器,所述图形显示能够使终端用户在一个或多个可视属性之间进行选择;可操作地耦连到所述用户界面和所述数据存储介质的音频转换器模块,所述音频转换器模块能够捕捉由终端用户通过所述音频界面记录的音频,处理所述音频;并产生由多个音频音轨以多个音轨彼此之间基本在音乐上协调的方式混合在一起组成的多音轨音乐汇其中,响应于终端用户通过所述用户界面选择一个或多个可视属性,所述音频转换器进一步被配置成识别与所述一个或多个选择的可视属性关联的音乐资源,并基于与所识别的音乐资源关联的功能属性改变音频音轨的至少一部分;其中所述音频音轨是多个音频音轨中的一个。
62.根据权利要求61所述的系统,其中所述可视属性对应于具有与音乐流派中的音乐家关联的至少一个特征的头像,并且所述功能属性对应于与所述音乐流派关联的一个或多个音乐属性。
63.根据权利要求61所述的系统,其中所述可视属性对应于具有和个别音乐家关联的至少一个特征的头像,并且所述功能属性对应于和所述个别音乐家关联的一个或多个音乐属性。
64.根据权利要求62所述的系统,其中所述可视属性对应于乐器的可视表示,并且所述功能属性对应于和乐器类别关联的一个或多个音乐属性。
65.根据权利要求62所述的系统,其中所述可视属性对应于乐器的可视表示,并且所述功能属性对应于和具体乐器关联的一个或多个音乐属性。
66.根据权利要求61所述的系统,其中所述多个音乐资源包括多个第一类型的音乐资源,和多个第二类型的音乐资源;并且其中响应于终端用户选择与第一类型的第一音乐资源关联的第一可视属性,和与第二类型的第二音乐资源关联的第二可视属性,所述音频转换器被配置成基于与所述第一音乐资源关联的第一功能属性和与所述第二音乐资源关联的第二功能属性,改变所述音频音轨的至少一个单一部分。
67.根据权利要求66所述的系统,其中所述第一类型的音乐资源与音乐流派相关,并且所述第二类型的音乐资源与乐器相关。
68.根据权利要求61所述的系统,其中所述音频音轨是从由终端用户记录的音频生成的。
69.根据权利要求61所述的系统,其中所述音频音轨是以前记录的音频音轨。
70.根据权利要求61所述的系统,其中所述音频音轨是基于一个不同的之前记录的音频音轨生成的音频音轨。
71.根据权利要求70所述的系统,其中所述音频音轨中的音符是与所述不同的之前记录的音频音轨中的音符同步生成的。
72.一种用于辅助终端用户开发音乐作品的方法,所述方法包括存储多个音乐资源,所述多个音乐资源中的每个音乐资源与功能属性和可视属性关联,所述可视属性向终端用户提供关于所述音乐资源的功能属性的可视建议;提供能够渲染图形显示的用户界面,所述图形显示使终端用户能够在一个或多个可视属性之间进行选择;接收终端用户已经选择一个或多个可视属性的指示; 识别与所述一个或多个选择的可视属性关联的音乐资源; 基于与所述识别的音乐资源关联的功能属性,改变音频音轨的至少一个部分; 使用所述音频音轨的所述至少一个部分,产生多音轨音乐汇编;其中所述音乐汇编中的多音频音轨中的每一个以所述多音轨彼此之间基本在音乐上协调的方式混合在一起。
73.根据权利要求72所述的方法,其中所述可视属性对应于具有与音乐流派中的音乐家关联的至少一个特征的头像,并且所述功能属性对应于与所述音乐流派关联的一个或多个音乐属性。
74.根据权利要求72所述的方法,其中所述可视属性对应于具有与个别音乐家关联的至少一个特征的头像,并且所述功能属性对应于与所述个别音乐家关联的一个或多个音乐属性。
75.根据权利要求73所述的方法,其中所述可视属性对应于乐器的可视表示,并且所述功能属性对应于与乐器类别关联的一个或多个音乐属性。
76.根据权利要求73所述的方法,其中所述可视属性对应于乐器的可视表示,并且所述功能属性对应于与具体乐器关联的一个或多个音乐属性。
77.根据权利要求72所述的方法,进一步包括捕捉由终端用户记录的音频,并将所捕捉的音频转换成音频音轨。
78.根据权利要求72所述的方法,进一步包括基于与之前记录的音频音轨关联的一个或多个标准生成音频音轨的音符。
全文摘要
公开了一种用于创建音乐作品的设备。该设备包括音频界面,其可操作地接收来自输入装置的音频并将音频输出到音频输出装置,以及音频转换器模块可操作地连接到音频界面以将通过音频界面接收的音频转换成音频音轨。可提供录音会话模块,以重复地重放包括第一音频音轨的至少一部分的实时循环,并在重复重放过程中将第二音频音轨的至少一部分增加到实时循环。多音轨组合器模块还可被配置成接收第一音频音轨和第二音频音轨,自动地对第一和第二音频音轨的每个分割部分打分,并基于每个分割部分的分数构造第三音频音轨。
文档编号G10H7/00GK102576524SQ201080034174
公开日2012年7月11日 申请日期2010年6月1日 优先权日2009年6月1日
发明者D.曼, F.G.卡波迪奇, M.塞尔莱蒂克, M.温特, R.拉苏尔, T.R.萨沃 申请人:音乐策划公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1