用户接口系统和方法

文档序号：6747342阅读：183来源：国知局

专利名称：用户接口系统和方法
技术领域：
本发明属音/像编辑技术领域。具体地说，本发明与编辑跨网数字化音/像数据的方法和设备有关。
近来，音/像编辑大都是按

图1所例示的系统进行的。一个编辑工作站今天含有一些存有音/像数据的本机盘片。编辑可以通过显示屏幕执行，但只限于对本机存储的音/像数据。这种系统对于编辑存储在多个工作站的大量音/像数据来说其功能就有些不能胜任了。
具体地说，这种系统可以不能令人满意是因为当前的编辑工作站不能跨越工作站界限上网执行编辑。每个工作站的音/像必需分别编辑好，然后再可以将编辑结果输入一个混合控制台，建立一个最终音/像输出。如果最终音/像输出有什么问题，就必需反复编辑驻留在各个分离工作站的各种音/像数据磁道的冗长过程，直至最终输出令人满意为止。
本发明揭示了一种提供音/像(A/V)数据的可配置用户接口的系统和方法。在一个实施例中，有一个数据描述器与含有A/V数据的A/V文件系统连接。对面临GUI的用户的类型加以标识。显示产生器访问A/V文件系统，产生取决于用户类型的A/V数据显示。菜单构造器产生需在GUI中显示的用户可选择的选项/特征，所显示的选项/特征取决于用户类型。操作驱动器接收用户的输入，根据用户类型确定需执行的操作。
本发明将结合附图举例说明，但本发明并不局限于所说明的这些具体实施例。附图中的相同标号标记的是相同的组成部分，在这些附图中图1例示了现有技术的音响编辑方法；图2例示了本发明实施例的概况；
图3详细例示了按本发明实施例配置的各软件模块；图4例示了按本发明实施例定义一个磁道的数据结构；图5A-E例示了对一个音响数据磁道执行的各种编辑操作；图6例示了可用来执行编辑的图形用户界面的例子；图7例示了按照本发明原理产生用户可配置界面的系统的实施例；图8例示了另一种用户的图形用户界面的例子；以及图9例示了特定用户的图形用户界面的另一个例子。
本发明是一种产生用户可配置界面的方法和设备。在以下的详细说明中，为了充分说明本发明，给出了许多具体细节。对于原就在本技术领域工作的人员来说，实现本发明显然并不一定要采用这些具体细节。在其他一些情况下，没有详细示出一些众所周知的结构、接口和过程，以使本发明更为清晰。
图2示出了本发明实施例的概况。虽然以下一些章节中说明的是音响编辑过程，但同样的技术也可成功地用于图像编辑过程。如图所示，按照本发明构成的系统至少包括一个编辑站，它与多个远地站1-N连接。远地站1-N含有音/像数据，以数字形式存储在一个或多个存储磁盘上。按照本发明的这个实施例，音响工程人员可以就在本地，即编辑站200，编辑驻留在任何远地站1-N中的数字化数据。音响工程人员也可以跨越远地站1-N编辑数字化数据，例如将音响数据从一个站的磁道拷贝到另一个站的磁道上和将一段音响数据剪粘到另一个站的磁道上。
编辑站200可以是一个个人计算机(PC)或任何其他类型的系统，能够显示图形应用、接收通过图形应用的输入和将输入送至远地站。远地站1-N也可以是PC机，或者是诸如Song公司的录/放系统那样的专利音/像存储/编辑站。远地站1-N可以包括一些能容纳多个诸如Iomega Jaz盘那样的可插盘的槽，这些磁盘增大了远地站的可用存储量，使所存储的数据能从一个远地很方便地移到另一个远地。
图3例示了按本发明实施例配置的软件模块。编辑站200包括编辑应用302、动态键接库(DLL)304和远地过程调用(RPC)机制306。编辑应用302使音响工程人员可通过图形用户界面(GUI)执行各种编辑功能。RPC机制306提供编辑站与远地站1-N之间的通信链路(见图2)。按照本发明的一个实施例，RPC机制306是以Microsoft WindowsNT为基站的RPC机制。其他RPC机制或可用于远地通信的其他网络机制也可使用。
图3还例示了按照本发明实施例配置在一个典型远地站的软件模块的例子。这个典型的远地站包括RPC机制308(与编辑站300的RPC机制306相应)、DLL310和与数字信号处理(DSP)系统314交互作用的驱动机制312。音响工程人员从编辑站200通过GUI与远地站1-N交互作用，通过GUI指定的各功能可在编辑站200与远地站1-N之间通过RPC机制306和308进行交流，而DLL310和DSP系统314执行实现指定功能所必需的所有处理。
图4示出了按照本发明实施例构成的典型远地站的音响磁道的数据结构。一个音响磁道是音响的一种静态表示，它规定了音响数据在磁盘上的位置、正确重放音响数据必需的组织数据和各种与音响数据配合的其他参数。按照本发明的一个实施例，各种与音响数据配合的参数分别列在各自的表中。
因此，图4中所示的各个表相当于单个音响磁道。这个磁道由一种以逻辑方法将所有这些表链接在一起的数据结构表示。通过利用单个数据结构将所有各表链接在一起，本发明的一个实施例使所有与特定的音响磁道配合的数据可由一个公用编辑界面集中编辑。因此，例如如果音响工程人员决定编辑一个音响磁道的一部分，那么所有与这部分音响磁道配合的表可以同时编辑，不像现有系统那样，磁道各方面必需分别编辑。
执行对跨越图4所示磁道数据结构的编辑的机制涉及一些成分。按照一个实施例，这些成分以C++类实现。主要成分是Track(磁道)，EventList(事件表)和Event(事件)。这些成分均示于图4，下面将对此详细说明。虽然以下说明假设是以C++实现的，但相同或类似的功能也可以在其他编程环境中实现。
“磁道”是一个由音响应用用来表示音响和其他基于时间的数据的静态数据流的公用对象。一个磁道实现为一个命名对象(即具有一个字符串名)，它含有一批事件表(下面将予说明)。一个磁道暴露一个适用于每个事件表的编辑界面。按照一个实施例，一个磁道至少含有一个事件表，即SoundList(音响表)(见图4)。
“事件表”是含有两种基本类型事件的双重链接数据结构。默认事件称为“默”事件，而其他事件称为“非默”事件。每种默/非默事件组合分别有一个独立的事件表。例如，如图4中所示，沿音响时间分布的涂色圆圈表示发出音响，而未涂色圆圈表示不发声。其他表的情况也不难预料。例如，如图4中所示，增益表示出了音响磁道各特定部分需加多大增益。例如涂色圆圈指示需加某个标量值的增益，而未涂圆圈则指示需加单位增益。图4还示出了两个“其他表”，正如熟悉本技术领域的人员现在所清楚的那样，这些其他表包括各种参数，其中有与图像或其他编辑操作有关的参数。每种事件至少存有以样点计量的长度和定义事件情况所需的其他数据。按照一个实施例，实际上事件表的所有编辑情况都以C++类实现的。
每种事件都维持两个虚拟功能SlideStart(…)和SlideEnd(…)。在建立新的非默事件时，每个事件必需再实现这些功能。这是因为一个编辑操作的开始/结束时间并不与一个事件的开始匹配，所以必需建立一个“接缝”。这是通过拷贝适当事件、“滑动”源事件的终端、然后再“滑动”拷贝事件的始端来实现的。这种滑动机制将在下面详细说明(见图5C)。
事件表是基于时间的数据结构，含有一系列链接的事件，每个事件至少维持以样点计量的长度。所有事件的长度之和加上起始偏移(下面将详细说明)就等于事件表的长度。如果不特别说明有起始偏移，第一个事件就默认为在绝对时间为零的样点处起动。在有起始偏移时，第一个事件在起始偏移值处起动。起动一个事件的绝对时间(以样点计量)为在这个事件前的所有事件的长度之和再加上起始偏移。
对于本说明而言，磁道和事件表可互换使用。磁道代表了多个事件表。所谓工作事件表是一个含有一系列正在为特定类型的音响情况建模而构建的事件。工作事件表最初以一个大的默事件建立。一旦建立了工作事件表，就可以对它进行各种编辑操作。各个单事件可以通过调用Add(…)功能加到这个表中。此外，按照本发明的一个实施例，可以进行六种基本的编辑操作<pre listing-type="program-listing"><![CDATA[　　Clear()　　Cut()Copy()　　Paste()　　Insert()　　Insert()(space)]]></pre>磁道、事件表和编辑建模的任何其他对象在定义一个编辑界面时都使用上列各项。下面将说明这些编辑操作在对事件表执行时的情况，这些情况示于图5A-E。按照本发明的另一个实施例，还可以执行其他编辑操作。
Clear(清除)操作是用默事件代替一个事件段而不影响在结束时间后的各事件的时间。Clear实际上是一种改写操作。Clear编辑操作示于图5A。Paste(粘贴)操作是将一个源表粘贴在一个目的表上。粘贴的起动和结束时间由源表确定。Paste操作是一种改写操作，因此结束时间后的各事件的时间保持不变，如图5B所示。
Insert(插入)操作是将一个源表插入一个目的表的操作。插入点由源表的起动时间决定。在插入点和插入点后的所有事件的时间都后移源表长度，如图5C。Insert space(插入空白)是在目的表内插入一个具有特定长度的空白事件表而不是一个源表。Cut(剪除)操作是从一个事件表中剪去一个事件段，在结束时间后的所有事件都在时间上前移被剪去的这段的长度，如图5D所示。最后，Copy(拷贝)操作是拷贝一段事件表，而源表不受影响，如图5E所示。
图6例示了在编辑站200可由编辑应用302产生的GUI屏幕。这个GUI屏幕使音响工程人员可以规定编辑功能需对音响数据执行的范围。例如，图6所示屏幕示出了七个分离磁道(FXL,FXC,FXR,FXS,Foleyl,FoleyC和FoleyR)。这七个磁道可以就驻留在一个站中，也可以驻留在网络的几个分离的站中。提供音响工作人员可以从单个远地站通过网络访问多个站同时进行编辑的这种能力显示了比现有的音/像编辑方法有明显的进步。按照本发明的一个实施例，音响工程人员能执行多种跨越像他所希望那样多的远地站的编辑操作，从而使音响工程人员具有很大的灵活性，可以很方便地编辑大量的音响数据。因此，例如，音响工程人员可以对屏幕的加亮部分执行上述任何编辑操作。加亮部分相应于多个音响数据磁道上的部分音响数据，每个磁道包括多个表。
音响的可视直观表示使音响工程人员在指定编辑功能上具有很大的灵活性。例如，音响工程人员可以加亮屏幕的预定部分，指定需对整个加亮区域执行的编辑功能。如图6所示，这个加亮区域可以包括屏幕的有底纹和无纹纹两部分。有底纹部分指示每个磁道的有效音响部分(非默事件)，而空白部分指示默事件。在音响工程人员指定了一个编辑功能时，这个函数就加到这些磁道上，从而使用户可以同时编辑多个磁道。更有意义的是这些磁道可以驻留在网络的一些分离的机器中，这与编辑站只能编辑驻留在本站的数据的现有技术相反。
这种从单个编辑站通过网络执行对数字化音/像数据进行编辑的能力除了直接使处理过程更为有效外还有一些显著的现实优点。例如，在当前的胶片编辑设施中，各个编辑工作室可以各有多个编辑音/像数据不同部分的编辑站，而所有这些编辑站的输出全都输入一个混合控制台。在要将一台机器重新分配给另一个工作室时，必需将整个编辑站搬到这个新的地点。相反，按照本发明的一个实施例，并不需要这样搬动这些远地站。远地站可以处在任何地点，而只要为每个工作室分配预定的一组远地站就可以了。这样，分配给一个工作室的远地站的数目可以每天甚至每小时加以改变而没有什么明显的问题。
在另一个实施例中，这种数据结构能用来支持各种为不同类型的用户定制的GUI。例如，在电影制片业中，不同单位从事音响产生、音乐合成、音乐编辑和音响编辑工作。不同单位进行的工作全部或部分需要利用这种数据结构，图4示出了其中的一个例子。然而，不同的单位习惯于不同的用户界面。例如，音响产生或音乐合成人员利用短线、节拍来标识需加以操作的特定部分，然而音响编辑(包括混合)人员却利用SMPTE代码。类似，如果在这个系统中处理的是非图像应用的音响，则可以用MIDI代码来标识音响的不同部分。在这个实施例中，如图7所示，系统还包括一个数据描述器710。参见图7，含有A/V数据的GUI705是通过数据描述器710访问A/V数据库715建立的。数据描述器710可以用在现有处理器或其他处理器上运行的软件实现，也可以用一个专用的硬件或软件系统实现。所产生的GUI取决于用户的类型。因此，例如，用户最初可以在数据描述器的提示下标出所要求的GUI类型，如音响编辑、音响产生等。或者，系统可以根据注册或某种其他用户标识实现默认的GUI类型。
数据描述器访问A/V数据库715，显示产生器以为用户类型配置的表示方式显示所关心的数据，如图6和8所图示。如前面所指出的那样，图6是为音响编辑人员配置的GUI表示，而图8是为转录人员配置的GUI表示。应指出的是，来自不同磁道的数据在图形上以不同形式表示。例如，参见图6，除了提供所示每个磁道中当前所接入和表示的特定音响的标识以外，还为音响编辑人员提供了音响数据的图形表示(如区域655)。转录显示也提供所接入的音响数据的标识805，但由于在转录站并不执行编辑操作，因此不提供音响数据的图形表示。同样，转录经常要用到偏移，使不同的磁道相对偏移(如同于混响)，然而在编辑过程中基本上不使用偏移。因此，在图8的GUI中提供了偏移段(如810)，而在图6的GUI中不提供偏移段。
这些表示可以预先产生，存入例如参考数据文件735或其他存储器或存储媒体。这种表示可以作为描述数据或可执行代码(如Java原语之类)存储。应该指出的是可以有某些共同性的表示。例如，表示入点、出点等的时间代码(如686-690和830-836)可以是相同的，这取决于用户的类型。
此外，菜单构造器725(图7)产生特定类型GUI的用户可选择的特征/选项/操作。由于采用数据表示，菜单可以预先产生，存入例如参考数据文件735或其他存储器或存储媒体。这种表示可以作为描述数据或可执行代码(如Java原语之类)存储。不同的用户可选择的特征/选项/操作的例子可参见图6和8。在转录GUI中，有几个选项，如“S”保安812、“R”录音814、“I”输入816、“S”单独818和“M”静音820。这些都以按钮方式实现，使得在用户例如将光标压在按钮区后按动鼠标器/跟踪球时就允许执行相应功能。例如，安全按钮812实现整个磁道的写保护机制。录音按钮814立即起动将输入录在所选磁道上。输入按钮816使用户能听到输入的(而不是输出的)是什么。静音按钮820使所选磁道静音，而单独按钮818使除了所选磁道外的所有磁道静音。
在图6所示的编辑GUI中，提供了类似的功能，但执行起来有些不同，以适合不同用户的操作情况。如图所示，为单独678、静音680、输入682和录音684各功能都提供了按钮。然而，与转录应用不同，编辑应用实现基于磁带的多磁道录音模型。因此，如果用户选择了录音功能，这个按钮就会闪烁，指示正在等待录音起动，然后改变为单色，指示由于受到用户选择屏幕上的主录音按钮(如按钮691)的控制而录音起动。一旦选择了主录音按钮，就能选择辅助的磁道录音按钮，立即允许录音。此外，如果再次选择主录音按钮，停止主录音功能，磁道录音按钮就又会闪烁，指示正在等待录音起动。
还提供了一些与磁带控制功能完全相同的功能，如快进、倒带、放音、停止等(690和840)和按照时间代码卷带(692和842)。此外，所提供的某些功能只能在一些特定类型的GUI中找到。例如，可编程磁道选择按钮844、“全部”磁道选择按钮845和“无”磁道选择按钮846在用户同时操作许多不同磁道的转录应用中都是很有用的。此外，一些功能在图形上可以按菜单构造器所规定的那样有不同的表示。例如，增益值在编辑GUI中表示为滑动块图标，而在转录GUI中则表示为数字值。选择适当GUI中的增益柱或图标将拉出增益窗，如图9中所示，使用户可以利用图形中的滑动块调整增益。应当指出的是图9整个示出了可由用户配置的转录GUI的另一个实施例。
一旦显示了数据和用户可选功能，用户就能将输入送给系统，以执行一定任务。用户输入最好由操作驱动器(图7中的730)加以处理。操作驱动器解释输入，产生系统可理解的指令。这样做的优点是用户能使用特定的术语或通常所用“lingo”，而系统将理解需要做些什么和怎样执行任务。因此，有些功能只是对于特定类型的用户，而有些功能却是共同的，虽然叫法不同。例如，在音响产生中有一种操作称为“调动(swap)”，在音乐编辑中同样的操作称为“引用(verse)”，而在音响编辑中同样的操作称为“录取(take)”。所有这三种叫法都是指从一个确定的点开始打上时间标记、录取同一音响的多个版本的操作。因此，虽然不同类型的用户的叫法不同，但同样是录取数据的操作。操作驱动器能以各种方式实现。在一个实施例中，构造了一个对照表，存储在例如存储装置735内，其中含有可能出现的用户功能和相应的内部功能。这样，操作驱动器就能为特定功能对对照表进行搜索，确定需执行的内部功能。
如所能看到的那样，本说明可以超出所例举的音响情况扩展到图像领域，为其他类型的音/像用户服务。因此，可以预料同样的系统能支持各种各样的用户，而不需要为特定类型的用户提供专用的用户硬件。
因此，本发明揭示了一种产生用户可配置的图形用户界面的方法和设备。这里所说明的这些具体结构和方法只是用来例示本发明的原理。在这技术领域工作的人员可以根据本发明的精神无论在形式上或是在细节上作出种种修改。虽然本发明是以特定的优选实施例示出的，但并不局限于此。本发明的专利保护范围仅由所附权利要求限定。
权利要求
1．一种系统，包括一个图形用户界面(GUI)；一个含有音/像(A/V)数据的A/V文件系统；以及一个接在GUI和A/V文件系统之间的数据描述器，所述数据描述器包括一个显示产生器，配置成提供形式取决于具体用户类型的A/V数据，送至GUI显示，一个菜单构造器，配置成产生取决于具体用户类型的用户可选择的选项/特征，送至GUI显示，以及一个操作驱动器，配置成接收用户的输入，根据具体用户类型确定需执行的操作。
全文摘要
本发明揭示了一种提供音/像(A/V)数据的可配置用户接口的系统和方法。在一个实施例中,有一个数据描述器与含有A/V数据的A/V文件系统连接。对面临GUI的用户的类型加以标识。显示产生器访问A/V文件系统,产生取决于用户类型的A/V数据显示。菜单构造器产生需在GUI中显示的用户所选择的选项/特征,所显示的选项/特征取决于用户类型。操作驱动器接收用户的输入,根据用户类型确定需执行的操作。
文档编号G11B27/34GK1218259SQ98119548
公开日1999年6月2日申请日期1998年9月24日优先权日1997年9月24日
发明者J·梅尔斯, R·J·奥利弗, J·M·克拉, R·M·杜瓦尔申请人:索尼电影娱乐公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.梅尔斯;R.J.奥利弗;J.M.克拉;R.M.杜瓦尔
技术所有人：索尼电影娱乐公司
我是此专利的发明人

上一篇：跨网数字化音/像数据的编辑的制作方法
上一篇：半导体集成电路器件的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。