用于使用周围音频在设备之间建立协同通信的方法和系统的制作方法

文档序号：7738804阅读：250来源：国知局

专利名称：用于使用周围音频在设备之间建立协同通信的方法和系统的制作方法
技术领域：
本发明的实施例涉及用于交换信息的协同系统和方法。
背景技术：
有效的观念沟通通常由一起密切工作的协同方表征。然而，常规会议场合中的参与者经常因必须采取不自然的步骤以实现简单形式的协同而被妨碍。例如，听演示的听众成员可能必须拷下文件名称或URL以便获得说话者的幻灯片，或者等待幻灯片在演示之后用电子邮件发送，这意味着听众成员必须把他们的电子邮件地址提供给说话者或者另一组织。电话会议呼叫是一种其中参与者可以交换观念和信息的受限制的方式。远程参与者可能必须要求且拷下联网IP地址以便获得文档或者把他们的电子邮件地址提供给其他参与者。此外，通过手机倾听电话会议的、希望转变到更高质量固定电话的远程参与者必须第二次拨打一长组会议代码并且倾听分散注意力的提示。仅仅举几例而言，常规的用于使设备彼此识别的方法和系统包括发送密码、IP地址直接输入，利用电缆、通用即插即用物理地连接设备，以及使用包含配置信息的USB存储设备。所有这些常规的方法和系统要求使参与者从演示中分散注意力的用户干预，要求准备时间并且增加参与者的挫折感。换言之，常规的用于使设备在协同设置中通信的方法和系统并没有反映参与语言通信的人们共享的自然的信任关系。希望的是拥有使得协同参与者使用的设备能够以有限的参与者努力建立通信的方法和系统。

图1示出了依照本发明实施例的用于通过网络提供信息的协同交换的第一交会 (rendezvous)禾口协同系统。图2示出了依照本发明实施例的用于参与交会和协同的客户端接口硬件的示意性表示。图3示出了依照本发明实施例实现的第一交会用户体验。图4示出了依照本发明实施例实现的第二交会用户体验。图5A-5B示出了依照本发明实施例实现的第三交会用户体验。图6示出了依照本发明实施例的在建立交会和协同时由客户端接口和服务器执行的操作的第一控制流程图。图7示出了依照本发明实施例配置的第二交会和协同系统。图8示出了依照本发明实施例的在建立交会和协同时由客户端接口和服务器执行的操作的第二控制流程图。图9示出了依照本发明实施例配置的第三交会和协同系统。图10示出了依照本申请实施例的在建立交会和协同时由服务器执行的操作的控制流程图。
具体实施例方式本发明的实施例涉及这样的系统和方法，其允许共同的周围音频(ambient audio)环境中的两个或更多设备通过网络自动地变得互连，从而可以在有限的设备用户干预的情况下在设备之间交换信息。系统和方法实施例也包括允许共同的周围音频环境中的两个或更多设备通过网络变得自动地互连，从而可以在有限的设备用户干预的情况下在设备之间建立音频和视觉信息。详细的描述组织如下。在第一子节中提供交会和协同系统的一般描述。在第二子节中提供客户端接口硬件的描述。在第三子节中提供依照本发明实施例实现的交会用户体验的描述。在第四子节中提供交会过程的描述。最后，在第五子节中提供其他实施例的描述。I.交会和协同系统
图1示出了依照本发明实施例的用于通过网络提供信息的协同交换的交会和协同系统100。系统100包括一个或多个客户端接口 102以及交会和协同服务器104，所有这些都通过网络106通信。服务器104是这样的相关设备，其确定哪些客户端接口 102处于共同的音频环境中并且只与处于该共同的音频环境中的那些客户端接口 102互连，从而可以交换文档和其他信息和/或也可以建立语音和视频通信。网络106可以是因特网、局域网、内联网、广域网、无线网络或者允许客户端接口通信和交换信息的任何其他系统。在特定实施例中，客户端接口 102可以是允许用户输入和接收信息并且能够在显示屏幕上呈现用户界面的任何设备，包括但不限于台式计算机、膝上型计算机、便携式计算机、电话、移动电话、显示系统、电视、计算机监视器、导航系统、便携式媒体播放器、个人数字助理(“PDA”)、游戏控制台、手持式电子设备、嵌入式电子设备或者器具。每个客户端接口 102包括诸如麦克风之类的周围音频检测器，用于监视、记录和收集周围音频，例如语
曰°在特定实施例中，客户端接口 102可以由安装在房间(例如会议室)中的分离的部件组成。换言之，客户端接口的诸如显示器和麦克风之类的部件不必限于特定的设备。例如，客户端接口 102可以由会议室中的一个或多个麦克风和/或共享工作空间组成。所述一个或多个麦克风操作来连续地监视房间中产生的周围音频。当麦克风和关联的处理设备检测到房间中的噪声时，麦克风发起与交会服务器104的通信以便确定与周围音频匹配的电话会议是否在进行当中。如果是，并且如果电话会议具有关联的协同工作空间，那么交会服务器104将也存在于会议室中的显示系统配置成显示与进行中的电话会议关联的共享工作空间。例如，共享工作空间可以是共享的虚拟白板或者共享的演示。在特定实施例中，客户端接口 102并不包括显示屏幕。例如，客户端接口 102可以仅仅由音频输入端、音频输出端和数字小键盘组成；或者客户端接口 102可以仅仅由音频输入端、音频输出端以及“打开”和“关闭”客户端接口且激活与服务器104的通信的单个按钮组成。在又一些实施例中，客户端接口 102可以由音频输入端和音频输出端组成，并且在客户端接口 102检测到诸如人类话音之类的噪声时自动地激活与服务器104的通信。每个客户端接口 102收集一个或多个称为“片段”的周围音频段并且将每个片段转换成多个帧。帧可以是固定或可变长度的数据分组，其由对比滤波器(contrast filter) 处理并且阈值化以产生k比特描述符。对比滤波器减去相邻矩形波谱图区域。例如，每个
5片段可以是k的记录的音频，其被转换成415个隔开近似12ms的帧，并且每帧可以被转换成32比特描述符。与所述一个或多个收集的片段关联的32比特描述符的集合称为“音频摘要(audio summary)”。用于产生音频摘要的技术是公知的。例如，Ke，Y., Hoi em, D., Sukthankar, R. , “Computer Vision for Music Identification,，，In Proc. Computer Vision and Pattern Recognition, (2005)描述了用于在音乐识别中产生音频摘要的方法。Ke等人提出的音乐识别方法可以适于为诸如通信方发出的语音之类的其他周围音频源产生音频摘要。也参见 Fink，Μ. , Covell, Μ. , Shumeet, B. , "Mass Personalization: Social and Interactive Applications using Sound-track Identification,，，Multimed Tools Appl (2008) 36:115-132。音频摘要和用于标识特定客户端接口 102的关联的用户标识符(“用户id”)经由网络106发送到服务器104。在特定实施例中，如Ke等人中所描述的，可以将描述符压缩成周围音频的统计摘要。通过发送统计摘要，维持了用户的声学隐私，因为统计摘要是不可逆的。换言之，原始音频不可能从描述符中恢复。因此，音频环境中收集的用户或其他个人的任何交谈都不可能从描述符中复现。在特定实施例中，为了额外的隐私和安全性，可以使用一种或多种诸如非对称或对称密钥加密和椭圆加密之类的已知加密技术对描述符进行加密。对于客户端接口 102提供的每个音频摘要，服务器104将该音频摘要与从其他客户端接口 102发送给服务器104的整个音频摘要集合进行比较。换言之，可以将包括由一个客户端接口 102提供的音频摘要的描述符与由每个其他客户端接口 102提供的音频摘要中的描述符进行比较。服务器104比较这些音频摘要并且确定哪些音频摘要与共同的音频环境足够相似。在特定实施例中，可以对音频摘要加时间戳以便确保由服务器104比较的音频摘要在基本上相同的时间收集。可以允许特定的时间错位量以考虑到处理延迟或时钟不准确。在特定实施例中，服务器104经由网络106向共同的音频环境中的每个客户端接口 102发送处于共同的音频环境中的其他客户端接口的列表和关联的用户id。共同的音频环境中的客户端接口 102可以经由网络106依照协同应用来共享文档和/或建立音频和视频通信。II.客户端接口硬件
图2示出了依照本发明实施例配置的客户端接口硬件系统200的示意性表示。系统 200包括一个或多个处理器202，例如中央处理单元；可选地一个或多个显示设备204，例如监视器；麦克风接口 206 ；—个或多个网络接口 208，例如USB端口、以太网或FireWire (火线)端口；以及一个或多个计算机可读介质210。这些部件中的每一个操作时耦合到一个或多个总线212。例如，总线212可以是EISA、PCI、USB、FireWire、NuBus或者PDS。在其他实施例中，系统200可能不包括显示设备或输入设备，例如键盘或小键盘；并且系统200可以被配置成在没有用户输入的情况下产生背景中的音频摘要。计算机可读介质210可以是参与向处理器202提供指令以供执行的任何介质。例如，计算机可读介质210可以是非易失性介质，例如光盘或磁盘；易失性介质，例如内存；以及传输介质，例如同轴电缆、铜线和光纤。传输介质也可以采取声、光或射频波的形式。计算机可读介质210也包括操作系统214，例如Mac OS、Windows、Unix和Linux ；网络通信模块216 ；交会应用218;以及协同应用220。操作系统214可以是多用户、多处理、多任务、多线程、实时的等等。操作系统214也可以执行基本的任务，例如识别来自诸如键盘或小键盘之类的输入设备的输入；将输出发送给显示器204 ；跟踪介质210上的文件和目录；控制诸如盘驱动器、打印机、图像捕获设备之类的外设；以及管理所述一个或多个总线 212上的业务。网络应用216包括用于建立和维持网络连接的不同部件，例如用于实现包括 TCP/IP、HTTP、以太网、USB和FireWire的通信协议的软件。如以下在子节III-V中所描述的，交会和协同应用218和220提供用于允许在相同周围环境中的客户端接口之间进行交会和协同的不同软件部件。如下文所描述的，服务器104容纳特定的交会和协同功能，这些功能使得服务器104能够在交会和协同应用被激活时与客户端接口 102交互。在特定实施例中，应用218和220执行的一些或全部过程可以集成到操作系统214中。在特定实施例中，这些过程可以至少部分地在数字电子电路中或者在计算机硬件、固件、软件中或者在其任意组合中实现。计算机可读介质210也可以存储其他的软件应用，包括文字处理器、浏览器、电子邮件、即时消息传送、媒体播放器和电话软件。III.交会用户体验
在该子节中，描述了依照本发明实施例实现的三个示例性交会体验。应当指出的是，本发明的实施例并不意在限于这三个体验。本发明的系统和方法实施例可以用来创建任意数量的不同种类的交会体验。图3示出了依照本发明实施例实现的第一交会用户体验。在图3中，五个客户端接口 301-305设置在共同的场所中。该场所可以是房间，例如会议室、礼堂、大会堂，或者任何其他适当的封闭或未封闭环境。如图3中所示，客户端接口 301和303为膝上型计算机，客户端接口 302为PDA或者包括像计算机那样的功能的智能电话，客户端接口 304为移动电话，并且客户端接口 305为台式计算机。客户端接口 301和305分别包括外部麦克风306 和308，并且客户端接口 302-304包括内部麦克风。如上面在子节I中所描述的，客户端接口 301-305都假设经由共同的网络106 (未示出)连接到服务器104。图3也包括周围音频源310，其可以是说话的人产生的语音，或者例如围绕会议桌或者白板自由谈话的客户端接口 301-305的各用户基本上同时地或者在不同的时间发出的两个或更多语音的组合。为了开始依照本发明实施例的交会过程，每个操作客户端接口 301-305之一的用户激活存储在每个客户端接口 301-305上的交会应用。例如，用户可以通过按压位于键盘上的特定按钮或者通过鼠标点击监视器312上显示的图标而激活客户端接口 301上存储的交会应用。因此，用户可以在不中断交谈或演示的情况下激活交会应用。每个客户端接口的交会应用经由网络106建立与服务器104的联系，并且开始收集房间中产生的周围音频以便产生发送给服务器104的音频摘要。服务器104使用音频摘要以确定哪些客户端接口 301-305正在收集基本上相同的周围音频并且因而是共同的音频环境的部分。数秒钟之后，在特定实施例中，服务器104可以向每个客户端接口 301-305呈现界面，询问关联的用户他们是否想要处于共同的音频环境中的客户端接口的列表，或者在其他实施例中，服务器104 可以激活弹出窗口或其他显示，其列出如上面在子节I中所描述的识别为处于共同的音频环境中的客户端接口 301-305和关联的用户id。所述显示也可以包括每个用户可以点击以接受客户端接口 301-305列表的“好的”按钮。当接受该列表时，利用包括识别的计算机和关联的用户id的参与者列表来激活协同应用。协同应用促进了文档的共享。例如，假定客户端接口 303的用户具有成为讨论的主题的文档，并且客户端305的用户想要拥有该文档的拷贝。位于客户端接口 303上的协同应用使得用户能够将文档的拷贝和客户端接口 305 的用户id上传到服务器104。服务器104可以激活客户端接口 305上的弹出窗口，指示文档的拷贝现在可用于从服务器104下载。图4示出了依照本发明实施例实现的第二交会用户体验。在图4中，位于第一场所的第一用户拥有第一移动电话401和第一膝上型计算机402，并且位于第二场所的第二用户拥有第二移动电话403和第二膝上型计算机404。第一场所和第二场所可以是相同建筑物内的不同的房间、位于相同城市、州、国家或者甚至不同国家的两个不同建筑物内的房间，并且这些建筑物可以分开数十、数百和数千英里。第一用户和第二用户起初分别通过手机401和403进行交谈。为了开始依照本发明实施例的交会过程，第一用户和第二用户激活各自的存储在膝上型计算机402和404上的交会应用。每个交会应用建立到服务器104 的单独的连接，并且开始收集各自场所处的音频样本。在特定实施例中，第一用户和第二用户这二者可以分别激活移动电话401和403上的扬声器。如图4中所示，说话的第一用户提供由移动电话401的麦克风和连接到膝上型计算机402的麦克风407收集的周围音频源 406。说话的第二用户提供由移动电话403的麦克风和连接到膝上型计算机404的麦克风 409收集的周围音频源408。当第一用户激活移动电话401上的扬声器时，输入到移动电话 403的第二用户的语音变成第一场所处的第二周围音频源410，并且当第二用户激活移动电话403上的扬声器时，输入到移动电话401的第一用户的语音变成第二场所处的第二周围音频源412。因此，第一用户和第二用户发出的语音同时由两个场所的麦克风407和409 收集，并且用来产生单独地发送到服务器104的可比较的音频摘要。服务器104处理这些音频摘要，确定膝上型计算机402和404处于共同的音频环境中，并且继续以发送列表和用户id给膝上型计算机402和404，从而第一和第二用户可以激活如上面参照图3所描述的协同应用。在其他实施例中，在建立交会过程时可以激活仅仅一个移动电话的扬声器。例如，假定第一用户激活第一移动电话401上的扬声器，并且第二用户不激活第二移动电话403 上的扬声器。因此，第二场所处的周围音频408仅仅包括第二用户的语音，该语音由麦克风 409收集并且用来产生发送到服务器104的音频摘要。同时，在第一场所处，麦克风407收集的周围音频406和410为第一用户的语音和从第一移动电话401的扬声器广播的第二用户的语音的组合。该组合的周围音频406和410用来产生也发送到服务器104的音频摘要。第二用户的语音对于服务器104接收的两个音频摘要是共同的，并且可以用来确定膝上型计算机402和404处于共同的音频环境中。服务器104继续以发送列表和用户id，从而第一和第二用户可以激活如上面参照图3所描述的协同应用。应当指出的是，图4中描述的音频体验并不限于使用移动电话来建立交会。在其他实施例中，可以使用具有扬声器的固定电话，或者可以使用能够广播声音的任何其他适当的通信设备。此外，可以使用如上面在子节I中所描述的任何适当的用户接口代替膝上型计算机402和404。在其他用户体验实施例中，假定在打移动电话或固定电话的人已经参与电话会议并且想要转变为膝上型计算机网际协议语音(“VoIP”)呼叫。图5A-5B示出了依照本发明实施例实现的第三交会用户体验。交会和协同服务器104与会议桥502通信，该会议桥是链接电话线并且用来连接参与电话会议的多方的设备。如图5A-5B中所示，会议桥502可以服务器104分开，并且在其他实施例中，会议桥502可以与服务器104集成在一起。图5A-5B 示出仅仅一个用户经由移动电话504拨入505会议桥502，但是其他用户(未示出)可以拨入会议桥502。用户可以使用特定会议号码拨入会议桥。除了为拨入会议桥502的电话提供电信之外，会议桥502被配置成作为客户端接口而操作，其收集同时发生的不同交谈的音频样本并且将与每个交谈关联的音频摘要发送到服务器104。在图5A所表示的第一实施例中，移动电话504的用户可以通过激活膝上型计算机 506上的交会应用而切换到膝上型计算机506上的VoIP呼叫，这建立与服务器104的网络连接508。服务器104如上面所描述的那样响应从膝上型计算机506发送的音频摘要，并且相对于与经由会议桥502发生的每个交谈关联的音频摘要检查膝上型计算机506提供的音频摘要。当服务器104识别适当的交谈时，服务器104指示膝上型计算机506发起到会议桥502的适当VoIP呼叫510，使得膝上型计算机506加入电话会议。在图5B所表示的第二实施例中，用户可以发起从膝上型计算机506到会议桥502 的VoIP呼叫512。会议桥502将膝上型计算机506收集的周围音频的音频摘要发送到服务器104。当服务器104发现经由会议桥502发生的现有电话会议的音频摘要基本上与膝上型计算机506提供的音频摘要匹配时，服务器104指示会议桥502将膝上型计算机506 VoIP呼叫加入到现有的电话会议。在其他实施例中，不是从移动电话504切换到膝上型计算机506，而是服务器104 可以被配置成使得用户可以经由固定电话(未示出)加入电话会议。用户使用固定电话拨入会议桥502。用户可以继续说话以产生由移动电话504和固定电话收集的周围音频。服务器104将移动电话504和固定电话这二者经由会议桥502提供的音频摘要进行比较，并且确定固定电话和移动电话504是共同的音频环境的部分。服务器104将固定电话加入到会议电话并且可以终止移动电话504的呼叫。IV.交会和协同过程
图6示出了依照本申请实施例的在建立某个客户端接口与其他客户端接口之间的交会和协同体验时由该客户端接口以及交会和协同服务器执行的操作的控制流程图。步骤 601-604和步骤611-614由每个客户端接口单独地执行，并且步骤605-610由交会和协同服务器执行。客户端接口都预先加载了服务器的名称。在步骤602中，用户如上面在子节II和III中所描述的那样激活客户端接口上存储的交会应用。在步骤602中，交会应用激活周围音频检测器(例如麦克风)并且开始如上面在子节I和III中所描述的那样收集周围音频样本或片段。在步骤603中，交会应用将每个片段转换成个帧，并且每帧由对比滤波器处理并且阈值化以便产生A比特描述符。k 比特描述符形成音频摘要。在步骤604中，交会应用经由网络将来自客户端接口的音频摘要发送到服务器。在步骤605中，服务器经由网络接收来自客户端接口 102的音频摘要。在步骤606 中，服务器将该音频摘要与从其他客户端接口接收的其他音频摘要中的每一个进行比较。在步骤607中，当服务器确定该音频摘要基本上与从其他客户端接口接收的音频摘要匹配时，服务器继续到步骤608，否则，服务器继续到步骤610。在步骤608中，服务器如上面在子节III中所描述的那样将该客户端接口添加到所有参与共同的音频环境的其他客户端
9接口的列表。该列表也包括每个客户端接口的用户id。在步骤609中，服务器将参与客户端接口和用户id的列表返回该客户端接口。在步骤610中，服务器向该客户端接口返回对交会的访问被拒绝的通知，指示该客户端接口不是该共同的音频环境的一部分。回到客户端执行的操作，在步骤611中，当该客户端接口接收到来自服务器的参与客户端接口的列表时，继续到步骤612，否则，交会应用可以返回步骤601并且步骤 601-604可以重复。在步骤612中，该客户端接口可以联系服务器或者列表中提供的另一个参与客户端接口。在步骤613中，该客户端接收与另一个参与客户端加入交换文档的提示。在步骤614中，该客户端启动协同应用，从而使得该客户端接口能够经由网络与列表中提供的选定的客户端接口交换文档。在特定实施例中，交会应用可以被配置成周期性地检查某个客户端接口是否是共同的音频环境的一部分，从而使得用户能够在不同的时间离开该音频环境。特别地，交会应用可以被配置成周期性地重复步骤602-604，并且服务器上存储的交会功能也可以周期性地重复步骤605-610。当用户完成参与该协同时，用户简单地从音频环境移除关联的客户端接口，例如膝上型计算机或PDA。服务器接收来自移除的客户端接口的音频摘要以及来自该共同的音频环境中剩余的客户端接口的音频摘要并且确定该移除的客户端接口的音频摘要不再与从共同的音频环境中剩余的那些客户端接口接收的音频摘要匹配。因此，服务器从列表中移除该客户端，并且切断该客户端接口与仍然在共同的音频环境中的其他客户端接口的连接。在其他实施例中，客户端接口也可以加入如上面在子节I-III中所描述的建立的已经存在的音频环境。用户激活交会应用，该交会应用如上面在步骤601-604中所描述的那样产生音频摘要并且将该音频摘要发送到服务器。由于服务器周期性地重复步骤 605-610，因而服务器接收来自最近进入的客户端接口的音频摘要并且确定该音频摘要基本上与从已经在共同的音频环境中的那些客户端接口接收的音频摘要匹配。然后，服务器将最近进入的客户端接口加入到已经存在的音频环境。V.其他实施例
在其他实施例中，可以采用两个单独的服务器，第一服务器被配置成处理客户端接口之间的交会，并且第二服务器被配置成处理其中交换文档和其他信息的协同。图7示出了依照本发明实施例的用于通过网络提供协同信息交换的交会和协同系统700。除了服务器 104被交会服务器702和协同服务器704代替之外，系统700与图1中所示的系统100相同。如上面在子节I中所描述的那样，交会服务器702是相关设备。交会服务器702接收来自客户端接口 102的音频摘要并且将共享安全令牌返回给如上面在子节I-III中所描述的仅仅那些由服务器702确定为处于共同的音频环境中的客户端接口。安全令牌也发送到协同服务器704。安全令牌可以是数据分组，其包括由交会服务器702创建的二进制密码部分以便像密码那样操作。当客户端接口 102接收到安全令牌时，关联的用户激活将安全令牌发送到协同服务器704的协同应用，该协同服务器将从客户端接口 102接收的安全令牌与从服务器104接收的安全令牌进行比较。与交会服务器702提供的安全令牌匹配的安全令牌被假定处于共同的音频环境，并且被允许通过经由协同服务器704交换文档而协同。图8示出了依照本申请实施例的在建立客户端接口 102与其他客户端接口 102之间的交会和协同时由该客户端接口 102和交会服务器702执行的操作的控制流程图。步骤601-604和步骤803-805由每个客户端接口 102单独地执行，并且步骤605_607、801和802 由交会服务器702执行。客户端接口 102执行步骤601-604并且交会服务器702执行步骤601-607、801和 802。在步骤607中，当音频摘要基本上与其他客户端接口提供的音频摘要匹配时，交会服务器702继续到步骤801，否则，交会服务器702继续到步骤802。在步骤801中，交会服务器702将共享安全令牌发送给客户端接口 102，如上面参照图7所描述的。在步骤802中，交会服务器702向客户端接口 102返回对交会的访问被拒绝的通知，指示客户端接口 102 不是共同的音频环境的一部分。返回客户端接口执行的操作，在步骤803中，当客户端接口 102接收到来自交会服务器702的安全令牌时，继续到步骤804，否则交会应用可以返回步骤601并且步骤 601-604可以重复。在步骤804中，客户端启动协同应用，从而使得客户端能够经由网络106 和协同服务器704交换文档。在步骤805中，客户端将安全令牌发送到协同服务器704。在其他实施例中，系统可以被配置成在客户端接口处于不同的音频环境但是碰巧基于相同的广播事件而形成音频摘要时，防止客户端加入非预期的协同会话。图9示出了依照本发明实施例的用于通过网络提供协同信息交换的交会和协同系统900。除了交会和协同服务器902连接到广播信号数据库904之外，系统900与图1中示出的系统100相同。数据库904存储从电视以及服务器902和客户端接口 102所在的区域内的无线电广播获得的周围音频的音频摘要。该区域可以是市、郡、州或者多州区域。数据库904中存储的音频摘要在交会过程开始时更新，并且这些音频摘要在客户端接口参与协同会议时更新。服务器104将客户端接口 102提供的音频摘要与数据库902中存储的音频摘要进行比较以便消除客户端接口在事实上它们不是共同的音频环境中的协同者时被错误地识别为这样的协同者。考虑例如位于分开的房间中但是交会应用被激活的两个PDA。假定这些PDA收集到来自碰巧调谐到相同频道的两个电视机的周围音频。服务器104将这些PDA提供的音频摘要与数据库902中存储的音频摘要进行比较并且确定这些PDA基本上与从相同广播获得的音频摘要匹配。服务器104拒绝将这些PDA加入协同会话。图10示出了依照本申请实施例的在建立某个客户端接口与其他客户端接口之间的交会和协同会话时由交会服务器执行的操作的控制流程图。步骤1001-1008可以代替上面参照图6所描述的控制流程图中的步骤605-610。在步骤1001中，服务器经由网络接收来自客户端接口的音频摘要。在步骤1002中，服务器将该客户端接口提供的音频摘要与广播信号数据库中存储的音频摘要进行比较，如上面参照图9所描述的。在步骤1003中，当该客户端接口提供的音频摘要与数据库中存储的音频摘要匹配时，继续到步骤1004，否则继续到步骤1005。在步骤1004中，服务器向该客户端接口返回对交会的访问被拒绝的通知。在步骤1005中，服务器将该客户端接口提供的音频摘要与从其他客户端接口接收的其他音频摘要的集合进行比较。在步骤1006中，当服务器确定该音频摘要基本上与从其他客户端接口接收的音频摘要匹配时，服务器继续到步骤1007，否则，服务器继续到步骤1004。在步骤1007中，服务器将该客户端接口添加到包括共同的音频环境的其他客户端接口的列表，如上面在子节III和IV中所描述的。该列表也包括每个客户端接口的用户id。在步骤1008中，服务器向该客户端接口返回参与客户端接口和用户id的列表。前面的描述出于解释的目的使用了特定的术语以便提供对于本发明的透彻理解。然而，本领域技术人员应当清楚的是，并不需要这些特定细节以便实施本发明。前面的对于本发明特定实施例的描述出于说明和描述的目的而被提供。它们并不预期是穷举的或者将本发明限于所公开的精确形式。显然，鉴于上面的教导，许多修改和变型都是可能的。所述实施例被示出和描述以便最佳地解释本发明的原理及其实际应用，从而允许本领域技术人员最佳地利用本发明以及具有适于设想的特定用途的各种修改的不同实施例。本发明的范围意在由下面的权利要求及其等效物限定。
权利要求
1.一种用于建立第一客户端接口与第二客户端接口之间的互连的方法，该方法包括在第一客户端接口处形成第一音频摘要(603)并且在第二客户端接口处形成第二音频摘要；将第一音频摘要(603)和第二音频摘要提交给能够将第一音频摘要与第二音频摘要进行比较的相关设备；以及在第一客户端接口和第二客户端接口处从相关设备接收(611)成功或失败的指示，以便基于第一音频摘要是否基本上与第二音频摘要匹配而建立第一客户端接口与第二客户端接口之间的互连。
2.权利要求1的方法，进一步包括当第一音频摘要基本上与第二音频摘要匹配时将第一客户端接口与第二客户端接口互连(614)。
3.权利要求1的方法，其中形成第一音频摘要和第二音频摘要进一步包括第一客户端接口和第二客户端接口中的每一个使用关联的周围音频检测器收集从一个或多个说话的人输出的周围音频的音频样本(602)。
4.权利要求1的方法，其中接收成功的指示进一步包括当第一音频摘要基本上与第二音频摘要匹配时，第一客户端接口接收与第二客户端接口关联的用户标识符并且第二客户端接口接收与第一客户端接口关联的用户标识符。
5.权利要求1的方法，其中接收成功的指示进一步包括第一客户端接口接收第一安全令牌，第二客户端接口接收第二安全令牌，并且协同服务器接收第三安全令牌，第一、第二和第三安全令牌由所述相关设备产生，其中协同服务器比较这些安全令牌并且当第一、第二和第三安全令牌匹配时建立第一客户端接口与第二客户端接口之间的互连。
6.一种用于建立第一客户端接口与第二客户端接口之间的互连的方法，该方法包括从第一客户端接口接收第一音频摘要(605)并且从第二客户端接口接收第二音频摘要；基于第一音频摘要是否基本上与第二音频摘要匹配而将成功或失败的指示(609，610) 发送给第一客户端接口和第二客户端接口；以及当第一音频摘要基本上与第二音频摘要匹配时，将第一客户端接口和第二客户端接口互连，使得第一客户端接口和第二客户端接口能够交换信息。
7.权利要求6的方法，其中第一音频摘要和第二音频摘要中的每一个进一步包括从一个或多个说话的人输出的周围音频的音频样本的集合。
8.权利要求6的方法，其中发送成功的指示进一步包括当第一音频摘要基本上与第二音频摘要匹配时，将与第二客户端接口关联的用户标识符发送给第一客户端接口并且将与第一客户端接口关联的用户标识符发送给第二客户端接口。
9.权利要求6的方法，其中发送成功的指示进一步包括当第一音频摘要基本上与第二音频摘要匹配时，发送第一安全令牌给第一客户端接口，发送第二安全令牌给第二客户端接口，并且发送第三安全令牌给协同服务器。
10.权利要求13的方法，进一步包括第一客户端接口和第二客户端接口将第一和第二安全令牌提交给协同服务器，该协同服务器将第一和第二安全令牌与第三安全令牌进行比较并且在第一、第二和第三安全令牌匹配时建立第一客户端接口与第二客户端接口之间的互连。
11.一种系统，包括第一客户端接口(102)，其被配置成收集周围音频并且形成第一音频摘要；第二客户端接口(102)，其被配置成收集周围音频并且形成第二音频摘要；以及相关设备(104，702)，其被配置成接收第一音频摘要和第二音频摘要，并且在第一音频摘要基本上与第二音频摘要匹配时将第一客户端接口和第二客户端接口互连，使得第一客户端接口和第二客户端接口能够交换信息。
12.权利要求11的系统，其中第一客户端接口和第二客户端接口中的每一个进一步包括台式计算机、膝上型计算机、便携式计算机、电话、移动电话、显示系统、电视、计算机监视器、导航系统、便携式媒体播放器、个人数字助理、游戏控制台、手持式电子设备、嵌入式电子设备或器具、会议桥之一。
13.权利要求11的系统，其中第一客户端接口和第二客户端接口中的每一个进一步包括周围音频检测器。
14.权利要求11的系统，其中相关设备被配置成当第一音频摘要基本上与第二音频摘要匹配时，将与第二客户端接口关联的用户标识符发送给第一客户端接口并且将与第二客户端接口关联的用户标识符发送给第一客户端接口。
15.权利要求11的系统，其中相关设备被配置成发送第一安全令牌给第一客户端接口，发送第二安全令牌给第二客户端接口，并且发送第三安全令牌给协同服务器，该协同服务器被配置成分别从第一和第二客户端接口接收第一和第二安全令牌，并且在第一、第二和第三安全令牌匹配时建立第一客户端接口与第二客户端接口之间的互连。
全文摘要
本发明的不同实施例涉及这样的系统和方法，其用于使得相同周围音频环境中的两个或更多设备能够变得自动地互连，从而能够在这些设备之间交换信息。所述两个或更多设备检测基本上相同的声音，例如人在会议中谈话，自动地确定该事实并且经由网络使设备进入信息和文档共享关系。
文档编号H04L12/28GK102379103SQ200980158447
公开日2012年3月14日申请日期2009年1月30日优先权日2009年1月30日
发明者特罗特 M. 申请人:惠普开发有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M. 特罗特
技术所有人：M.特罗特
我是此专利的发明人

上一篇：用于从不可读标签恢复数据的系统的制作方法
上一篇：多载波信号的频谱整形的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。