多媒体对象的音频控制的制作方法

文档序号：11406747阅读：208来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

分案说明

本申请属于申请日为2012年04月13日的中国发明专利申请201280026544.4的分案申请。

本公开涉及电子设备，以及更具体地，涉及电子设备的音频控制。

背景技术：

用户可以与在计算设备(例如，移动电话、平板计算机、智能手机等)上执行的应用进行交互。例如，用户可以安装、查看或删除计算设备上的应用。

在一些情况下，用户可以通过图形用户界面与计算设备进行交互。在一些示例中，计算设备可以包括一个或多个声音设备。在计算设备上执行的应用可以访问声音设备。

技术实现要素：

在一个示例中，一种方法包括接收包括能够生成音频数据的一个或多个多媒体对象的组的电子文档。该方法进一步包括注册该一个或多个多媒体对象的组中的多媒体对象，其中注册多媒体对象包括存储识别该多媒体对象的多媒体对象标识符。该方法还包括接收由已注册的多媒体对象生成的音频数据。该方法进一步包括通过计算设备基于一个或多个配置参数来确定该音频数据的音量级别，其中该一个或多个配置参数定义与多媒体对象标识符相关联的一个或多个音量级别。该方法进一步包括以所确定的音量级别向输出设备输出音频数据。

在一个示例中，一种计算机可读存储介质编码有指令，所述指令当被执行时，促使计算设备的一个或多个处理器执行包括接收包括能够生成音频数据的一个或多个多媒体对象的组的电子文档的操作。所述指令进一步促使一个或多个处理器执行包括注册该一个或多个多媒体对象的组中的多媒体对象的操作，其中注册多媒体对象包括存储识别该多媒体对象的多媒体对象标识符。所述指令进一步促使一个或多个处理器执行包括下述的操作：接收由已注册的多媒体对象生成的音频数据；通过计算设备基于一个或多个配置参数来确定该音频数据的音量级别，其中该一个或多个配置参数定义与多媒体对象标识符相关联的一个或多个音量级别。所述指令进一步促使一个或多个处理器执行包括以所确定的音量级别向输出设备输出音频数据的操作。

在一个示例中，一种计算设备，包括：一个或多个处理器。该计算设备进一步包括音频控制模块，其可由该一个或多个处理器执行来接收包括能够生成音频数据的一个或多个多媒体对象的组的电子文档。该音频控制模块可进一步执行来注册该一个或多个多媒体对象的组中的多媒体对象，其中注册多媒体对象包括存储识别该多媒体对象的多媒体对象标识符。该音频控制模块可进一步执行来接收由已注册的多媒体对象生成的音频数据。该计算设备还包括用于基于一个或多个配置参数来确定该音频数据的音量级别的装置，其中该一个或多个配置参数定义与多媒体对象标识符相关联的一个或多个音量级别。该计算设备进一步包括以所确定的音量级别输出音频数据的输出设备。

在一个示例中，一种方法包括接收包括能够生成音频数据的两个或更多个多媒体对象的组的电子文档。该方法还包括向应用注册该组中的第一多媒体对象和第二多媒体对象，其中注册第一多媒体对象包括存储识别第一多媒体对象的第一多媒体对象标识符，以及其中注册第二多媒体对象包括存储识别第二多媒体对象的第二多媒体对象标识符。该方法进一步包括接收由第一多媒体对象生成的第一音频数据和由第二多媒体对象生成的第二音频数据。该方法还包括在执行该应用期间，从用户接收指示第一多媒体对象的第一音量级别的第一配置参数。该方法进一步包括在执行该应用期间，从用户接收指示第二多媒体对象的第二音量级别的第二配置参数。该方法还包括以第一音量级别向输出设备输出第一音频数据。该方法进一步包括以第二音量级别向输出设备输出第二音频数据。

在附图和下面的描述中阐述了本公开的一个或多个示例的细节。根据描述和附图以及权利要求，本公开的其他特征、目的和优势将是显而易见的。

附图说明

图1是图示依据本公开的一个或多个方面的、可以被配置成执行一个或多个应用的计算设备的示例的框图。

图2是图示依据本公开的一个或多个方面的、图1中所示的计算设备2的一个示例的进一步细节的框图。

图3是图示依据本公开的一个或多个方面的、可以由计算设备执行来执行一个或多个多媒体对象的音频控制的示例方法的流程图。

图4是图示依据本公开的一个或多个方面的、可以被配置成执行一个或多个应用的计算设备的示例的框图。

图5是图示依据本公开的一个或多个方面的、可以被配置成执行一个或多个应用的计算设备的示例的框图。

具体实施方式

总的来说，本公开的方面针对用于对多媒体对象进行控制的技术。应用和网络技术的进步已使开发者能够创建包括丰富和动态内容的文档。例如，应用可以在单个文档中显示多个多媒体对象。每一个多媒体对象可以提供音频和/或视觉内容源。在一个示例中，文档可以包括每一个提供视频和音频内容的许多多媒体对象。应用可以最初执行包括在文档中的多媒体对象。该应用可以进一步通过各种应用编程接口(api)向多媒体对象提供对例如音频设备的i/o设备的访问。在一些示例中，多个多媒体对象可能同时要求对音频设备的访问以供音频和/或视频播放。在这样的示例中，每一个多媒体对象可以为对音频设备的访问而进行竞争。

目前，应用没有向用户提供对单独多媒体对象的粒状音频控制。因此，多媒体对象可以同时向音频设备发送音频数据，这可能导致是所有音频数据的组合的音频信号。这种对控制的缺乏可以导致不期望的用户体验。例如，收听第一对象的音频的用户可能被第二对象的音频打断。组合的音频信号可能是难以理解的，并且第二对象可能使用户从第一对象的音频分心。用户因此可能期望用来粒状地控制共享单个音频设备的单独多媒体对象的一个或多个技术。

本公开的技术提供了对可能同时要求对同一音频设备的访问的多媒体对象的粒状音量控制。在一个示例中，在web浏览器中包括音频控制模块。当web浏览器最初渲染多媒体对象时，向音频控制模块注册该多媒体对象。因此，音频模块维护在web浏览器中的多媒体对象的列表。音频控制模块进一步提供多媒体对象可访问的声音控制api。当多媒体对象生成待由音频设备输出的音频数据时，该多媒体对象可以调用包括在声音控制api中的函数来向音频设备发送音频数据。该音频数据可以由音频控制模块通过该函数调用接收。一旦音频控制模块接收了该音频数据，音频控制模块就可以例如改变该音频数据的音量。然后，可以通过可以由操作系统向web浏览器提供的另一个api将经转变的音频数据发送给音频设备。

图1是图示依据本公开的一个或多个方面的、可以被配置成执行例如应用8的一个或多个应用的计算设备2的示例的框图。如图1中所示，计算设备2可以包括显示器4、音频设备6和应用8。在一些示例中，应用8可以包括音频控制模块10。

在一些示例中，计算设备2包括下述或是下述的一部分：便携式计算设备(例如，移动电话/上网本/膝上型机/平板设备)或台式计算机。计算设备2还可以使用网络接口(参见例如图2)来连接到有线或无线网络。在图2的示例中进一步描述了计算设备2的一个非限制性示例。

在一些示例中，计算设备2可以包括显示器4。在一个示例中，显示器4可以是如图2中所示的输出设备50。在一些示例中，显示器4可以由计算设备2编程为显示图形内容。图形内容一般包括显示器4所显示的任何视觉描绘。图形内容的示例可以包括图像、文本、视频、视觉对象和/或视觉程序组件，诸如滚动条、文本框、按钮等。在一个示例中，应用8可以促使显示器4显示图形用户界面(gui)16。

如图1中所示，应用8可以在计算设备2上执行。应用8可以包括计算设备2可执行的程序指令和/或数据。应用8的示例可以包括web浏览器、电子邮件应用、文本消息递送应用或接收用户输入和/或显示图形内容的任何其他应用。

在一些示例中，应用8促使gui16在显示器4中显示。gui16可以包括以人类可读方式呈现计算设备2的信息的交互式和/或非交互式图形内容。在一些示例中，gui16可以使用户能够通过显示器4与应用8交互。例如，用户可以通过诸如鼠标、键盘或触摸屏的输入设备提供用户输入。响应于接收该用户输入，计算设备2可以执行一个或多个操作。以这种方式，gui16可以使用户能够创建、修改和/或删除计算设备2的数据。

在一些示例中，如图1中所示的应用8可以是web浏览器软件应用(在下文中“web浏览器”)。web浏览器的一个示例可以是googlechrome^tmweb浏览器。在一些示例中，web浏览器可以检索并呈现在诸如因特网的网络上的信息资源。web浏览器还可以向网络上的其他设备发送信息。在一些示例中，信息资源可以是文档，诸如超文本标记语言(html)文档。html文档可以包括web浏览器可解释的结构化数据。在一些示例中，结构化数据可以包括文本、图片和多媒体对象。web浏览器可以例如以人类可解释的形式显示html文档的结构化数据。

如图1中所示，应用8可以是显示html文档18的web浏览器。html文档18可以例如包括文本20、多媒体对象22和多媒体对象24。多媒体对象可以是嵌入在文档18中的任何视觉、音频和/或其他感知数据源。在一些示例中，多媒体对象可以包括视频对象和/或声音对象。多媒体对象的示例可以包括小应用程序、电影、mpeg-4视频、mp3音频和wav音频。在一些示例中，多媒体对象可以包括动画和音频内容。在一些示例中，例如文档18的文档的创建者可以将一个或多个多媒体对象嵌入在文档18中。计算设备2的用户可以使用应用8来查看文档18，并且与多媒体对象22和24进行交互。

在一些示例中，在单个文档18中可以包括多个多媒体对象。例如，如图1中所示，在文档18中嵌入了两个多媒体媒体对象22和24。在图1的示例中，多媒体对象22可以是题为如文本20所指示的“androidcloudtodevicemessagingframework(到设备消息发送框架的安卓云)”的视频。文档18可以进一步包括多媒体对象24。多媒体对象24可以如图1中所示，包括视听广告。例如，多媒体对象24可以包括做广告的产品或服务的视觉动画，并且可以在一些示例中，进一步包括与该动画相关联的音频。

在一些示例中，应用8可以包括用来解释文档18的结构化数据的渲染引擎。在一些示例中，应用8的渲染引擎可以以人类可解释的形式呈现结构化数据。如在此所述，在一些示例中，“渲染”可以包括以人类可解释的形式呈现任何结构化数据。html文档的结构化数据可以包括封装待由渲染引擎渲染的内容的标签。标签可以是不同类型的，因此，使渲染引擎能够以不同方式渲染不同标签所包含的内容。因此，在一个示例中，文本20可以由使渲染引擎能够显示“androidcloudtodevicemessagingframework”作为文本的“文本”标签封装。

在其他示例中，在文档18中可以包括用来指定多媒体对象22和24的多媒体标签。在这样的示例中，应用8的渲染引擎可以对多媒体标签进行处理来以人类可解释的形式向用户呈现多媒体对象22、24。在一些示例中，渲染引擎可以包括渲染部分而非所有类型的与各种不同标签相关联的内容的功能。例如，渲染引擎可以本原地渲染文本，但是可以不本原地渲染多媒体对象。在这样的示例中，用于多媒体对象的标签可以指定单独多媒体应用来渲染该多媒体对象的内容。例如，在一个示例中，应用8可以不本原地渲染多媒体对象22。替代地，包括在文档18中并且与多媒体对象22相关联的标签可以指示单独视频应用来渲染多媒体对象22的内容。应用8可以在对与多媒体对象22相关联的标签进行处理时执行该单独视频应用，其进而可以渲染多媒体对象22的内容。以这种方式，应用8可以扩展成渲染各种不同类型的内容。

如图1中所示并且在此所述，文档可以包括多个多媒体对象。在一些示例中，应用8可以同时渲染文档18的部分或全部结构化数据。例如，应用8可以渲染用于多媒体对象22、24的标签，因此，应用8可以同时向用户呈现多媒体对象22、24的内容。在这样的示例中，每一个多媒体对象可以包括可以通过一个或多个输出设备向用户提供的内容。例如，多媒体对象22、24每一个都可以包括音频内容。多媒体对象22、24中的每一个因此可以向例如声卡和/或扬声器的音频设备6提供音频数据，以向用户呈现音频内容。在一些示例中，音频设备6可以从应用8接收音频数据。该音频数据可以包括音频内容的表示。音频设备6可以基于该音频数据来提供包括该音频内容的人类可解释表示的音频信号。

在一些示例中，多媒体对象22、24可以为对音频设备6的访问而进行竞争。例如，应用8可以渲染包括多媒体对象22和多媒体视觉广告对象24的文档18。每一个多媒体对象可以包括音频内容，因此可以向音频设备6提供相应音频数据。音频设备6可以同时接收多媒体对象22、24两者的音频数据。在一些示例中，音频设备6可以输出包括每一个多媒体对象22、24的组合或交织的音频内容的音频信号。

各种缺点在本示例中显而易见。例如，当多个多媒体对象的音频数据被组合或交织时，作为结果的音频信号就人类而言可能是混乱或不可解释的。在其他示例中，用户的对第一多媒体对象所生成的音频内容的专注可能被第二多媒体媒体对象的音频内容扰乱。在这样的示例中，用户因此可能不期望听见第二多媒体对象的音频内容。在一些示例中，多媒体对象可以不向用户提供直接控制与该多媒体对象相关联的音频内容的能力。在其他示例中，用户可能需要分别识别每一个多媒体对象，以禁用或降低每一个多媒体对象的音量。因此，用户可能应用大量努力来限制竞争访问音频设备的大量多媒体对象的不期望效果。

在下文所述的本公开的方面可以克服可能为音频输出设备而进行竞争的多个媒体对象所展现的各种缺点。如图1中所示，例如web浏览器的应用8可以最初访问包括一个或多个多媒体对象22、24的文档18。在一些示例中，应用8可以如在本文先前所述的，渲染文档18的结构化数据。例如，应用8可以渲染文档18并且识别与文本20、多媒体对象22(在下文中，视频对象22)和多媒体对象24(在下文中，广告对象24)相关联的一个或多个标签。

在当前示例中，音频控制模块10可以在应用8进行渲染时自动注册文档18的一个或多个多媒体对象。为了自动注册多媒体对象，音频控制模块10可以识别与多媒体对象相关联的标签。在一些示例中，与多媒体对象相关联的一个或多个标签可以指示该多媒体对象包括特定类型的内容。在一些示例中，音频控制模块10可以基于多媒体对象的内容类型来注册多媒体对象。例如，各种内容类型可以包括音频内容，因此，音频控制模块10可以被配置成注册与这样的内容类型相关联的多媒体对象。

在一些示例中，音频控制模块10可以生成识别多媒体对象的多媒体对象标识符。音频控制模块10可以使用多媒体对象标识符来注册多媒体对象。在一些示例中，多媒体对象标识符可以包括数字和/或字母的唯一字母数字串，例如哈希码。在一些示例中，音频控制模块10可以将多媒体对象标识符存储在计算设备2或耦接到计算设备2的某一其他计算设备的映射表、哈希表、数据库或其他数据存储结构中以供稍后检索。在一个示例中，音频控制模块10可以将多媒体对象标识符存储在对象标识符储存库12中。

在图1的示例中，音频控制模块10可以在应用8渲染文档18时，注册视频对象22和广告对象24。音频控制模块10可以生成对应于视频对象22的多媒体对象标识符“a1”。在当前示例中，音频控制模块10可以生成对应于广告对象22的多媒体对象标识符“a2”。每一个标识符可以由应用8存储以供稍后检索。

如在本文前面所述，在一些示例中，应用8可以执行例如单独多媒体应用来渲染多媒体对象的内容。在一些示例中，应用8可以执行该多媒体应用作为应用8的子进程。当应用8执行该多媒体应用作为子进程时，音频控制模块10可以向该多媒体应用提供对应用编程接口(api)的访问。该多媒体应用可以通过api访问计算设备2的资源，例如存储、输出设备、输入设备等。例如，多媒体应用可以通过应用8所提供的api向音频扬声器6发送音频数据。以这种方式，应用8可以控制对计算设备2的资源的访问，并且对从多媒体应用接收的数据进行修改。

在一些示例中，音频控制模块10可以包括用来对与已注册的多媒体对象相关联的音量级别进行修改的逻辑。例如，音频控制模块10可以从渲染已注册的多媒体对象的内容的多媒体应用接收音频数据。音频控制模块10可以通过应用8所提供的api从该多媒体应用接收音频数据。响应于接收音频数据，音频控制模块10可以执行用来增大或减小与音频数据相关联的音量级别的一个或多个操作。例如，音频控制模块10可以响应于例如用户输入或存储在计算设备2上的数据，生成指定音量级别的数据。指定音量级别的数据可以与从多媒体应用接收的音频数据相关联。音频控制模块10可以将音量级别数据发送给音频设备6。音频控制模块10还可以将从多媒体应用接收的相应音频数据发送给音频设备6。以这种方式，音频设备6可以基于音频数据和所指定的音量级别来生成音频信号。因此，在包括许多已注册的多媒体对象的示例中，音频控制模块10可以基于任何数量的配置参数来提供与每一个多媒体对象相关联的每一个音量级别的细粒度音频控制。

在一些示例中，音频控制模块10可以基于一个或多个配置参数来确定多媒体对象所生成的音频数据的音量级别。在一个示例中，配置参数可以定义与识别多媒体对象的多媒体对象标识符相关联的一个或多个音量级别。在一些示例中，计算设备2可以包括用来存储配置参数的参数储存库14。因此，在一些示例中，当音频控制模块10注册多媒体对象时，音频控制模块10可以自动执行一个或多个配置参数。以这种方式，在一些示例中，音频控制模块10可以基于一个或多个配置参数来自动配置音量级别，从而减少了手动用户配置的程度。

在一些示例中，应用8可以包括参数储存库14。参数储存库14可以存储与多媒体对象相关联的一个或多个配置参数。在一些示例中，参数储存库12可以包括能够存储数据的数据库、查找表或其他适当的数据结构。在一个示例中，用户可以定义被存储在参数储存库14中的一个或多个参数。在例如图5中进一步描述并说明了各种配置参数。

在一些示例中，音频控制模块10可以基于一个或多个配置参数来确定音频数据的音量级别，其中该一个或多个配置参数定义与多媒体对象标识符相关联的一个或多个音量级别。例如，音频控制模块10可以从参数储存库14选择配置参数或在运行时间接收与用户的音量级别选择相对应的配置参数。配置参数可以指定与多媒体对象相关联的音量级别。音频模块10可以生成与音量级别相对应的音量级别设置数据，其可以被发送给音频设备6的音频驱动器或在计算设备2上执行的操作系统。在任一情况下，音量级别设置数据可以促使音频设备6以相应音量级别输出音频数据。

在图1的一个示例用例中，文档18可以包括视频对象22和广告对象24。应用8可以是web浏览器。在当前示例中，音频控制模块10可以自动注册视频对象22并且存储相应多媒体对象标识符“a1”。音频控制模块10可以自动注册广告对象24并且存储多媒体对象标识符“a2”。响应于注册视频对象22和广告对象24，音频控制模块10可以自动选择并执行存储在参数储存库14中的一个或多个配置参数。在其他示例中，用户可以在运行时间指定配置参数。例如，用户提供给音频控制模块10的配置参数可以指定音频控制模块10可以用来改变音频数据的音量级别的音量级别。

在当前示例中，应用8可以执行可以分别渲染视频对象22和广告对象24的内容的第一和第二多媒体应用作为子进程。视频对象22和广告对象24每一个都可以包括可以作为音频数据被发送给音频设备6的音频内容。在当前示例中，第一应用可以通过音频控制模块10的api将视频对象22的音频数据发送给音频设备6。同时，第二应用可以通过音频控制模块10的api将广告对象24的音频数据发送给音频设备6。在当前示例中，配置参数可以例如指定待禁用广告对象24的声音。因此，音频控制模块10可以将与广告对象24相关联的音量级别设置成静音，例如没有音量。因此，用户可以不被来自广告对象24的音频打断，因为音频控制模块10已自动执行了相应的配置参数。

在一些示例中，应用8可以进一步包括指示与每一个已注册的多媒体对象相关联的音量级别的控制面板26。例如，音量选择器28a可以与例如视频对象22的第一多媒体对象相关联，如标记28b和36所指示。音量选择器30a可以与例如广告对象24的第二多媒体对象相关联，如标记30b和38所指示。视频对象22和广告对象24每一个都可以向音频控制模块10进行注册，例如识别每一个对象的多媒体对象标识符可以由音频控制模块10存储。音量选择器可以指示相应多媒体对象在可选音量级别范围内的音量级别。

在一个示例中，音频控制面板26可以使用户能够通过改变音量选择器，经由音频控制模块10来修改与多媒体对象相关联的音量级别。例如，用户可以使用音量选择器，通过将音量选择器从一个音量级别位置滑动到不同的音量级别位置来改变音量级别。音频控制模块10响应于确定用户已调整了音量选择器，可以接收指示新的音量级别的配置参数。音频控制模块10可以响应于接收配置参数，以该配置参数所指示的新的音量级别输出音频数据。以这种方式，用户维持对文档18中的每一个多媒体对象的音量级别的细粒度控制。在一些示例中，可以将与多媒体对象相关联的音量级别存储在对象识别储存库12中。

如图1中所示，除音量选择器外，控制面板还可以显示与多媒体对象相关联的其他控件。例如，图1进一步包括独占选择器32、34。在一个示例中，独占选择器32可以与视频对象22相关联，以及独占选择24可以与广告对象24相关联。在一个示例中，独占选择器当被选择时，可以指示只有来自相应选择的多媒体对象的音频数据才可以被发送给计算设备2的音频设备6。在这样的示例中，音频控制模块10可以识别与所选择的独占选择器相对应的多媒体对象，并且仅向音频设备6提供来自所选择的多媒体对象的音频数据。

如图1中所示，应用8可以在控制面板26中显示包括多媒体对象标识符的表示，例如标记。例如，标记28b可以包括与视频对象22相关联的多媒体对象标识符。在一些示例中，应用8还可以在或靠近在gui16中显示的多媒体对象的位置显示多媒体对象标识符的表示。例如，标记36可以指示视频对象22与控制面板26的音量选择器28a相关联。以这种方式，用户可以快速识别与多媒体对象相对应的音量选择器。

本公开的各方面可以在某些情况下，提供一个或多个益处和优势。例如，本公开的技术可以向用户提供与大量多媒体对象相关联的音量级别的细粒度控制。精确的声音控制可以提供计算设备的改进的用户定制。在一些示例中，细粒度音频控制可以潜在地减少可能为声音设备而进行竞争的多个多媒体对象所引起的音频数据的扰乱和/或不期望的混乱。

本公开的另一个潜在优势可以包括自动注册多媒体对象，并且基于配置参数来确定一个或多个已注册的多媒体对象的音量级别。自动执行配置参数可以简化用户配置需求并且帮助用户在不用额外用户干预的情况下应用偏好。以这种方式，可以定义、存储并且在未来使用中应用精确的音量级别设置。此外，如在例如图5中所述的，在配置参数中定义的探试法(heuristic)可以自适应地将音量级别设置应用到大量未定义的情况，而不用额外的用户配置。

前述益处和优势是示例性的，并且其他这样的益处和优势可以在前述非限制性示例中显而易见。虽然本公开的某些方面可以提供部分或全部前述示例性益处和优势，然而，本公开的任何方面不应当被解释为必须需要任何或全部前述示例性益处和优势。

图2是图示依据本公开的一个或多个方面的、图1中所示的计算设备2的一个示例的进一步细节的框图。图2仅图示了计算设备2的一个特定示例，并且在其他情况下，可以使用计算设备2的许多其他示例实施例。

如图2的特定示例中所示，计算设备2包括一个或多个处理器40、存储器42、网络接口44、一个或多个存储设备46、输入设备48、输出设备50以及电池52。计算设备2还包括操作系统54。在一个示例中，计算设备2进一步包括应用8和一个或多个其他应用56。应用8和一个或多个其他应用56还可由计算设备2执行。组件40、42、44、46、48、50、52、54、56和8中的每一个都可以(物理上、通信地和/或操作地)互连以供组件间通信。

在一个示例中，处理器40被配置成实现用于在计算设备2内执行的功能和/或处理指令。例如，处理器40可以能够处理存储在存储器42中的指令或存储在存储设备46上的指令。

在一个示例中，存储器42被配置成在操作期间存储在计算设备2内的信息。在一些示例中，存储器42被描述为计算机可读存储介质。在一些示例中，存储器42是暂时性存储器，意为存储器42的主要目的不是长期存储。在一些示例中，存储器42被描述为易失性存储器，意为存储器42在关闭计算机时不维持已存储的内容。易失性存储器的示例包括随机存取存储器(ram)、动态随机存取存储器(dram)、静态随机存取存储器(sram)以及本领域已知的其他形式的易失性存储器。在一些示例中，存储器42用来存储程序指令以供处理器40执行。在一个示例中，存储器42由运行于计算设备2上的软件或应用(例如，应用8和/或一个或多个其他应用56)使用来在程序执行期间暂时性地存储信息。

在一些示例中，存储设备46也包括一个或多个计算机可读存储介质。存储设备46可以被配置成存储比存储器42更大量的信息。存储设备46可以进一步被配置用于对信息的长期存储。在一些示例中，存储设备46包括非易失性存储元件。这样的非易失性存储元件的示例包括磁硬盘、光盘、软盘、闪存或电可编程存储器(eprom)或电可擦除可编程(eeprom)存储器的形式。

在一些示例中，计算设备2还包括网络接口44。在一个示例中，计算设备2利用网络接口44来通过诸如一个或多个无线网络的一个或多个网络与外部设备通信。网络接口44可以是网络接口卡，诸如以太网卡、光收发机、射频收发机、或能够发送并接收信息的任何其他类型的设备。这样的网络接口的其他示例可以包括在移动计算设备中的3g和无线电以及usb。在一些示例中，计算设备2利用网络接口44来与诸如服务器、移动电话或其他联网的计算设备的外部设备(未示出)无线地通信。

在一个示例中，计算设备2还包括一个或多个输入设备48。在一些示例中，输入设备48被配置成通过触觉、音频或视频反馈从用户接收输入。输入设备48的示例包括存在敏感屏幕、鼠标、键盘、语音响应系统、摄影机、麦克风或用于检测来自用户的命令的任何其他类型的设备。在一些示例中，存在敏感屏幕包括触敏屏幕。

在计算设备2中，还可以包括一个或多个输出设备50。在一些示例中，输出设备50被配置成使用触觉、音频或视频刺激来向用户提供输出。输出设备50的示例包括图1的显示器4和音频设备6。在一个示例中，输出设备50包括存在敏感屏幕、声卡、音频扬声器、视频图形适配器卡或用于将信号转换成对人类或机器来说可理解的适当形式的任何其他类型的设备。输出设备50的另外示例包括阴极射线管(crt)监视器、液晶显示器(lcd)或能够向用户生成可理解输出的任何其他类型的设备。

在一些示例中，计算设备2包括一个或多个电池52，其可以是可再充电的并且向计算设备2提供电力。在一些示例中，电池52由镍镉、锂离子或其他适当材料制成。

计算设备2可以包括操作系统54。在一些示例中，操作系统54控制计算设备2的组件的操作。例如，在一个示例中，操作系统54便于应用8与处理器40、存储器42、网络接口44、存储设备46、输入设备48、输出设备50和电池52的交互。

如图2中所示，应用8可以包括图1中所述的音频控制模块10。音频控制模块10可以包括计算设备2可执行的程序指令和/或数据。例如，音频控制模块10可以包括促使在计算设备2上执行的应用8执行在图1-5中所述的操作和动作中的一个或多个的指令。在一些示例中，音频控制模块10可以是在计算设备2上执行的操作系统的一部分。在一些示例中，音频控制模块10可以与从计算设备2的一个或多个输入设备48接收输入的操作系统54通信。

计算设备2可以包括对象识别储存库12和/或参数储存库14。在一些示例中，储存库12、14可以是缓存、查找表或其他适当的数据结构。在其他示例中，储存库12、14可以包括关系数据库管理系统(rdbms)软件。在一个示例中，储存库12、14可以是关系数据库并且使用本领域众所周知的结构化查询语言(sql)接口来访问。数据库14可以替选地被存储在单独联网的计算设备上，并且可以通过计算设备2的网络接口或系统总线是可访问的。在其他示例中，数据库14可以是对象数据库管理系统(odbms)、在线分析处理(olap)数据库或其他适当的数据管理系统。

在计算设备2内实现或由计算设备2执行的任何应用，例如应用8或其他应用56，可以在计算设备2的组件内实现或包含在所述组件内、可由所述组件操作、由所述组件执行、和/或操作地/通信地耦接到所述组件，所述组件例如处理器40、存储器42、网络接口44、存储设备46、输入设备48、输出设备50和/或电池52。

图3是图示可以由计算设备执行来执行一个或多个多媒体对象的细粒度音频控制的示例方法的流程图。例如，图3中所图示的方法可以由图1和/或2中所示的计算设备2来执行。

图3的方法包括，接收包括能够生成音频数据的一个或多个多媒体对象的组的电子文档(60)；注册该一个或多个多媒体对象的组中的多媒体对象，其中注册多媒体对象包括存储识别该多媒体对象的多媒体对象标识符(62)；接收由已注册的多媒体对象生成的音频数据(64)；通过计算设备基于一个或多个配置参数来确定该音频数据的音量级别，其中该一个或多个配置参数定义与多媒体对象标识符相关联的一个或多个音量级别(66)；以及以所确定的音量级别向输出设备输出音频数据(68)。

在一个示例中，该方法包括，注册该一个或多个多媒体对象的组中的第二多媒体对象，其中注册第二多媒体对象包括存储识别第二多媒体对象的第二多媒体对象标识符；接收由第二已注册的多媒体对象生成的第二音频数据；通过计算设备基于一个或多个配置参数来确定第二音频数据的音量级别，其中该一个或多个配置参数进一步定义与第二多媒体对象标识符相关联的一个或多个音量级别；以及以所确定的第二音量级别向输出设备输出第二音频数据。

在一个示例中，该方法包括，通过计算设备基于占优探试法来确定第二已注册的多媒体对象包括占优多媒体对象，其中占优探试法指示第二已注册的多媒体对象是多媒体对象的组的待受用户关注的最可能的多媒体对象；并且响应于确定第二已注册的多媒体对象包括占优多媒体对象，通过计算设备执行一个或多个配置参数中的至少一个配置参数来改变一个或多个多媒体对象中的至少一个的音量级别。在一个示例中，该方法包括，一个或多个配置参数中的至少一个配置参数定义指示没有音量的静音音量级别，以及该方法进一步包括，通过计算设备将静音音量级别与一个或多个多媒体对象的组中的除占优多媒体对象外的每一个多媒体对象相关联。

在一个示例中，占优探试法基于第二多媒体对象在电子文档中的空间位置。在一个示例中，占优探试法基于第二多媒体对象的内容类型。在一个示例中，占优探试法基于将多媒体对象的第一空间大小与第二多媒体对象的第二空间大小进行比较。

在一个示例中，该方法包括通过计算设备确定已注册的多媒体对象在计算设备的图形用户界面的不活动区域中显示，其中该不活动区域对用户不可见；通过计算设备确定第二已注册的多媒体对象在计算设备的图形用户界面的活动区域中显示，其中该活动区域对用户可见；以及通过计算设备基于第二已注册的多媒体对象在活动区域中显示来确定第二已注册的多媒体对象包括占优多媒体。

在一个示例中，该方法包括通过计算设备确定计算设备的声音设备正在接收音频数据；以及通过计算设备将静音音量级别分配给一个或多个多媒体对象中的每一个已注册的多媒体对象，其中静音级别音量指示没有音量。在一个示例中，声音设备包括计算设备的声卡或音频扬声器。

在一个示例中，该方法包括注册一个或多个多媒体对象的组中的多媒体对象进一步包括：通过计算设备对电子文档进行扫描来识别与该多媒体对象相关联的一个或多个多媒体标签；以及对识别该一个或多个多媒体标签作出响应，通过计算设备基于该一个或多个多媒体标签来注册该多媒体对象。在一个示例中，该一个或多个多媒体标签指示该多媒体对象的内容类型。在一个示例中，该方法包括通过计算设备确定在计算设备上执行的应用正在访问计算设备的声音设备；通过计算设备生成对该声音设备的独占访问的请求；以及通过计算设备将该请求发送给该声音设备。

在一个示例中，该方法包括通过计算设备显示包括指示多媒体对象的音量级别的音量选择器的音频控制面板，其中该音量选择器指示可选音量级别的范围；通过计算设备接收选择该音量选择器的与该多媒体对象相关联的第二音量级别的用户输入；以及以第二音量级别向输出设备输出音频数据。

在一个示例中，该方法包括通过计算设备生成基于多媒体对象的属性和第二音量级别的偏好探试法；通过计算设备注册该一个或多个多媒体对象的组中的第二多媒体对象，其中第二多媒体对象包括该多媒体对象的属性；以及响应于确定第二已注册的多媒体对象包括该多媒体对象的属性，通过计算设备基于偏好探试法来将第二音量级别分配给第二多媒体对象。在一个示例中，属性进一步包括多媒体对象的多媒体类型或域名。

在一个示例中，该方法包括通过计算设备在音频控制面板中显示多媒体对象标识符的第一表示；以及通过计算设备在多媒体对象处显示多媒体对象标识符的第二表示，其中该多媒体对象在电子文档中显示。在一个示例中，该多媒体对象包括包含音频内容的动画。

图4是图示依据本公开的一个或多个方面的、可以被配置成执行例如应用8的一个或多个应用的计算设备2的示例的框图。除非在下文另有描述，如图4中所示，包括在图4中的计算设备2和各种组件可以包括与在图1和2中所述的相似的性质和特性。如图4中所示，计算设备2可以包括显示器4、音频设备6、应用8、对象应用80、对象应用82、应用84、对象标识符储存库12以及参数储存库14。

如前面图1中所述，在一些示例中，应用8可以包括渲染部分而非所有类型的被包括在文档中的内容的功能。在应用8不包括渲染特定类型的内容的功能，例如应用8不本原地支持该内容类型的示例中，应用8可以执行单独的应用来渲染这样的内容。如图4中所示，应用8可以执行对象应用80、82，其可以包括渲染应用8不支持的多媒体对象的内容的功能。在一个示例中，对象应用80、82可以是应用8的子进程。在一些示例中，对象应用80、82可以使用应用8所提供的一个或多个应用编程接口(api)84来向音频设备6发送多媒体对象的音频数据。

如图4中所示，应用8可以进一步发送并接收包括在对象标识符储存库12中的信息。在一些示例中，对象标识符储存库12可以包括一个或多个多媒体对象标识符和一个或多个对应的音量级别。以这种方式，应用8可以存储、检索并监视每一个多媒体对象的音量级别。例如，如图4中所示，对象标识符储存库12可以包括多媒体对象标识符86a(“a1”)和对应的音量级别86b(“8”)。多媒体对象标识符86a可以识别包括在文档中的多媒体对象。在一些示例中，多媒体对象标识符86a可以与音量级别86b相关联。因此，在一个示例中，音频设备6可以以音量级别8输出与标识符86a相关联的多媒体对象所生成的音频数据。类似地，音频设备6可以以音量级别0，例如没有音量(静音的)，输出与标识符88a相关联的多媒体对象所生成的音频数据。

如图4中所示，应用8可以进一步发送并接收包括在参数储存库14中的信息。在一些示例中，参数储存库14可以包括可以由应用8的音频控制模块10应用的一个或多个配置参数。在一个示例中，参数90b可以与参数标识符1001相关联。配置参数90b可以定义与特定多媒体对象相关联的用户偏好(“param.:pref”)。配置参数92b可以定义占优探试法(“param.:dominant”)，如在图4中进一步描述的。如图4中所示，音频控制模块10可以访问参数储存库14来自动应用与各种已注册的多媒体对象相关联的配置参数。

在一些示例中，计算设备2上的多个应用每一个都可以为对音频设备6的访问而进行竞争。例如，如图4中所示，应用8和应用84每一个都可以向音频设备6发送音频数据。在一些示例中，音频控制模块10可以确定应用84正在访问计算设备2的音频设备6。例如，音频控制模块10可以查询在计算设备2上执行的操作系统和/或音频设备6来确定是否一个或多个应用可能正在访问音频设备6。在其他示例中，在计算设备2上执行的操作系统可以向模块10通知一个或多个应用可能正在访问音频设备6。响应于确定应用84可能正在访问音频设备6，音频控制模块10可以生成对独占访问音频设备6的请求，其可以被发送给音频设备6、音频设备6的设备驱动器和/或操作系统94。在从应用8接收了该请求时，音频设备6可以仅为来自应用8的音频数据输出声音。以这种方式，音频控制模块10可以获得对音频设备6的独占访问。在一些示例中，当在一个或多个配置参数中指定的一个或多个条件发生时，例如当用户选择如图1中所示的独占选择器时，音频控制模块10可以请求独占访问。

在一些示例中，用户可能希望听见来自应用84的音频数据，但是可能不希望听见来自向音频控件10注册的多媒体对象的音频数据。因此，在一个示例中，音频控制模块10可以确定音频设备6目前是否在接收来自应用84的音频数据。例如，音频控制模块10可以向在计算设备2上执行的操作系统和/或音频设备6发送查询。对音频控制模块10所接收的数据作出响应并且基于该查询，音频控制模块10可以确定指示没有音量的静音音量级别。音频控制模块10可以将静音音量级别分配给每一个已注册的多媒体对象，从而最小化或消除可能由应用84提供给音频设备6的音频数据所生成的扰乱。

图5是图示依据本公开的一个或多个方面的、可以被配置成执行例如应用8的一个或多个应用的计算设备2的示例的框图。除非在下文另有描述，如图5中所示，包括在图5中的计算设备2和各种组件可以包括与在图1和2中所述的相似的性质和特性。如图5中所示，计算设备2可以包括显示器4、音频设备6、应用8、对象标识符储存库12以及参数储存库14。

如图5中所示，显示器4可以显示应用8所生成的图形用户界面110。在图5的示例中，应用8可以是如在本文所述的web浏览器。gui110可以包括可以使用户能够输入一个或多个统一资源定位符(url)的地址栏114，其可以用来检索资源，例如html文档。如图5中所示，gui110可以显示一个或多个标签式窗口。每一个标签式窗口可以由例如标签118的标签识别。在一些示例中，标签式窗口可以显示html文档的内容。以这种方式，用户可以使用同一应用来在不同标签式窗口中打开两个或更多个文档。如图5中所示，gui110包括标签式窗口116、118和120。在一些示例中，活动的标签式窗口可以目前由用户可查看。不活动的标签式窗口可以是当前不可由用户查看的标签式窗口。因此，如图5中所示，标签式窗口118可以是活动的标签式窗口，因为标签式窗口118的内容对用户可见。

如图5中所示，标签式窗口118可以包括多媒体对象122和124。每一个多媒体对象可以生成可以由应用8发送给音频设备6的音频数据。在一些示例中，音频控制模块10可以确定多媒体对象122或多媒体124中的一个包括占优多媒体对象。占优多媒体对象可以包括用户最可能将其注意力集中于的一个或多个多媒体对象。因此，在一些示例中，一个或多个占优多媒体对象可以是用户的关注的最可能的多媒体对象。在一些示例中，音频控制模块10可以使用一个或多个占优探试法来识别一个或多个多媒体对象的组中的哪个多媒体对象可能是占优多媒体对象。占优探试法可以包括可以指示用户更可能或不那么可能关注于多媒体对象的一个或多个事实。在一些示例中，一个或多个占优探试法可以作为配置参数被存储在参数储存库14中，并且由音频控制模块10应用到一个或多个已注册的多媒体对象。

在一个示例中，如图5中所示，根据本公开的技术，多媒体对象122(在下文中，视频对象122)和多媒体对象124(在下文中，广告对象124)每一个都可以向音频控制模块10进行注册。在当前示例中，音频控制模块10可以查询参数储存库14来识别包括占优探试法的配置参数。执行该配置参数，音频控制模块10可以确定视频对象122或广告对象124中的一个是占优多媒体对象。当确定了占优多媒体对象时，音频控制模块10可以执行一个或多个配置参数来例如改变一个或多个多媒体媒体对象的音量级别。例如，配置参数可以指定不是占优多媒体对象的任何多媒体对象将与指示没有音量的静音音量级别相关联。因此，音频控制模块10在检测到占优多媒体对象时，可以使所有其他多媒体对象静音，从而使用户能够专注于占优多媒体对象的音频内容。

在一些示例中，占优探试法可以基于多媒体对象在文档中的空间位置。例如，html文档可以在二维空间中显示一个或多个多媒体对象。在一些示例中，html文档的作者可以将该作者意在具有吸引用户的关注的最高可能性的多媒体对象放置在该html文档的中心。该作者可以在该二维空间的其他不同位置包括另外的多媒体对象。在一个示例中，占优探试法可以包括二维空间的用户最可能专注于的最高可能性空间位置。在这样的示例中，音频控制模块10可以确定每一个多媒体对象的空间位置，并且进一步确定距最高可能性空间位置最短距离的多媒体媒体对象是占优多媒体对象。

在一些示例中，占优探试法可以基于多媒体对象的内容类型。例如，用户可以指定将多媒体对象的可能内容类型列表按优先顺序排列的一个或多个配置参数。在一个示例中，当文档中包括一个或多个多媒体对象时，音频控制模块10可以确定具有最高优先级内容类型的多媒体对象可以是占优多媒体对象。在又其他示例中，占优探试法可以基于两个或更多个多媒体对象的相对空间大小。例如，多媒体对象可以由计算设备2的显示器4显示。每一个多媒体对象可以包括可以由多媒体对象宽度和高度指定的空间区域。在一个示例中，占优探试法可以指示具有最大空间区域的多媒体对象是占优多媒体对象。例如，如图5中所示，音频控制模块10可以确定视频对象22是占优多媒体对象，因为其具有比广告对象124大的空间区域。

在其他示例中，占优探试法可以基于多媒体对象是在图形用户界面的活动还是不活动区域中。例如，用户可能不期望听见来自包括在图形用户界面的不活动区域中的多媒体对象的音频数据。如图5中所示，标签式窗口118可以包括gui110的活动区域，因为标签式窗口118的内容，例如视频对象122和广告对象124，可以可见。gui110的不活动区域可以包括标签式窗口116和120，其可以包括目前对用户不可见的多媒体对象。在示例中，占优探试法可以确定多媒体对象是占优多媒体对象，因为该多媒体对象被包括在gui110的活动区域中。因此，在图5的示例中，音频控制模块10可以基于指示活动区域的多媒体对象是占优多媒体对象的占优探试法来确定视频对象122和广告对象124是占优多媒体对象。

在一些示例中，本公开的方面可以使应用8能够跟踪、存储并自适应地应用用户偏好。例如，用户在使用应用的一定时间段和/或实例数内，可以基于用户的对应于一个或多个多媒体对象的偏好来指定一个或多个配置参数。因此，在一个示例中，用户可以指示与特定内容类型相关联的多媒体对象的音频数据可以优选地与特定音量级别相关联。在其他示例中，用户可以指示源自特定网络域的多媒体对象的音频数据与特定音量级别相关联。更一般地，用户可以基于多媒体对象的任何属性来生成在配置参数中定义的一个或多个偏好。

音频控制模块10如图5中所示，可以使用户能够基于用户偏好来生成一个或多个配置参数。在一些示例中，音频控制模块10可以在用户指示每一个偏好时将每一个配置参数自动存储在参数储存库14中。在一些示例中，配置参数可以基于一个或多个多媒体对象的状态和用户定义的相应音量级别。在其他示例中，音频控制模块10可以向用户提示存储、修改或删除用户偏好。在一个示例中，配置参数可以基于多媒体对象的属性和相应音量级别。

在一些示例中，音频控制模块10可以使用一个或多个配置参数来生成偏好探试法。在一个示例中，偏好探试法可以基于在一个或多个配置参数中定义的一个或多个属性和/或一个或多个音量级别。因此，在一个示例中，音频控制模块10可以如在本文前面所所定义的，注册一个或多个多媒体对象。音频控制模块10随后可以基于存储在参数储存库14中的配置参数来生成和/或检索一个或多个偏好探试法。因此，音频控制模块10可以例如基于多媒体对象的与偏好探试法相关联的属性来将音量级别分配给该多媒体对象。以这种方式，音频控制模块10可以自适应地跟踪、存储并执行偏好探试法，来自动地基于用户偏好来配置与多媒体对象相关联的音量级别。因此，可以不需要用户手动地配置包括与一个或多个偏好探试法相关联的一个或多个属性的多媒体对象的音量级别。在这样的示例中，音频控制模块10可以使用一个或多个偏好探试法来自动地配置多媒体对象的音量级别。

在本公开中所述的技术可以至少部分以硬件、软件、固件或其任何组合来实现。例如，所述技术的各方面可以在一个或多个处理器内来实现，包括一个或多个微处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或任何其他等价集成或分立逻辑电路，以及这样的组件的任何组合。用语“处理器”或“处理电路”一般可以指单独或结合其他逻辑电路的任何前述逻辑电路、或任何其他等价电路。包括硬件的控制单元也可以执行本公开的技术中的一个或多个。

这样的硬件、软件和固件可以在同一设备或分离设备内实现来支持在本公开中所述的各种技术。另外，任何所述单元、模块或组件可以在一起或分别实现为分立但是可互操作的逻辑器件。将不同特征描述为模块或单元意在强调不同的功能方面，并且并不一定暗示这样的模块或单元必须由单独的硬件、固件或软件组件来实现。相反，与一个或多个模块或单元相关联的功能可以由单独的硬件、固件或软件组件来执行、或被集成在共同或单独的硬件、固件或软件组件内。

在本公开中所述的技术还可以被包含或编码在包括编码有指令的计算机可读存储介质的制品中。嵌入或编码在包括已编码的计算机可读存储介质的制品中的指令，可以促使一个或多个可编程处理器或其他处理器诸如当包括或编码在计算机可读存储介质中的指令由该一个或多个处理器执行时，实现在本文所述的技术中的一个或多个。计算机可读存储介质可以包括随机存取存储器(ram)、只读存储器(rom)、可编程只读存储器(prom)、可擦可编程只读存储器(eprom)、电可擦可编程只读存储器(eeprom)、闪存、硬盘、光盘rom(cd-rom)、软盘、盒式带、磁介质、光介质或其他计算机可读介质。在一些示例中，制品可以包括一个或多个计算机可读存储介质。

在一些示例中，计算机可读存储介质可以包括非暂时性介质。用语“非暂时性”可以指示存储介质没有体现在载波或传播信号中。在某些示例中，非暂时性存储介质可以存储能够随着时间的推移改变的数据(例如，在ram或缓存中)。

已描述了本公开的各方面。这些和其他实施例在所附权利要求的范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：约翰尼·陈
技术所有人：谷歌公司
我是此专利的发明人

上一篇：一种分体式变压器的制造方法与工艺
上一篇：一种用于移相整流变压器的全密封式围板结构的制造方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。