用于在视频环境中提供增强的图形的系统和方法

文档序号:7886066阅读:211来源:国知局
专利名称:用于在视频环境中提供增强的图形的系统和方法
技术领域
本公开总地涉及通信领域,并且更具体地涉及在视频环境中提供增强的图形。
背景技术
视频服务在当今社会中已经变得日益重要。在某些体系结构中,服务提供者可能希望为他们的最终用户提供成熟的视频会议服务。视频会议体系结构可以通过网络提供“亲临现场”的会议体验。视频会议体系结构可以利用高级的视频、音频和协作技术实现人之间的实时、面对面的交互。优化视频通信的能力给系统设计者、设备制造者和服务提供者等提出了巨大挑战。


为了提供对本公开及其特征和优点的更完全的理解,结合附图对以下描述进行参考,在附图中相似的标号表示相似的部分,其中:图1是根据本公开的一个实施例的用于在网络环境中提供视频会话的系统的简化框图;图2是图示了与系统相关联的某些组件的一种示例性实现方式的简化框图;图3是图示了与系统相关联的网络流量管理的一种示例性实现方式的简化框图;图4是图示了与系统相关联的网络流量管理的另一示例性实现方式的简化框图;图5-13是图示了与要被用于进行视频会话的用户界面相关联的某些特征的简化屏幕截图14是图示了控制台元件的一种可能的实现方式的简化框图;图15-17是描述与本公开相关联的某些视频图形的简化图形图示;并且图18是图示了与本公开相关联的一个示例操作的简化流程图。
具体实施例方式摄览在一个示例中提供了一种方法,该方法包括:接收来自耦接到显示器的视频源的视频输入,所述显示器被配置用于在其上呈现用户界面;通过评估关于与所述视频输入相关联的像素的α值来生成与所述用户界面相关联的灰度级要素;生成不透明掩模;以及为源图像中的某些像素设置与所述源图像的α值相等的红、绿、蓝(RGB)值。在更具体的实现方式中,所述灰度级要素是通过评估与所述用户界面相关联的每个像素的α值而被生成的。在另一些实施例中,如果特定像素的特定α值为0,则相关联的灰度级图像的一部分包含黑色像素。如果特定像素的特定α值为255,则相关联的灰度级图像的一部分包含白色像素。在其它实现方式中,该方法可以包括将所选择的像素设置为红、绿、蓝、a (RGBA)值中的某种颜色以向处理器元件指示所述不透明掩模的存在。此外,该方法可以包括针对RGBA颜色来评估与所述用户界面相关联的图形以确定是否将所述图形呈现在所述显示器上。更具体而言,某些图像被用作所述不透明掩模的一部分以将源视频与所述用户界面混合。被确定为黑色的像素在所述显示器上显示直通视频,并且被确定为白色的像素在所述显示器上显示实心用户界面像素颜色。示例实施例转到图1,图1是用于在网络环境中提供视频会话的系统10的简化框图。在该具体示例中,系统10可以包括显示器12、相机元件14、用户界面(Π)18、控制台元件20、手持机28和网络30。联合相机兀件14提供一系列扬声器16以发送和接收音频数据。在一种具体的示例性实现方式中,提供无线麦克风24以接收周围环境中的音频数据(例如来自一个或多个观众成员)。注意,这个无线麦克风24纯粹是可选的,因为扬声器16能够在任意个视频会议应用期间充分地捕获周围环境中的音频数据(下面会进行详细描述)。一般来说,系统10可以被配置为在视频会议的上下文中捕获视频图像数据和/或音频数据。系统10可以包括能够实现传输控制协议/互联网协议(TCP/IP)通信的配置,用于网络中分组的发送和/或接收。在适当的情况下并且基于具体的通信需要,系统10也可以配合用户数据报协议/IP (UDP/IP)或任何其它适当的协议进行工作。在某些实现方式中,手持机28可以被用作对系统10的远程控制。例如,手持机28可以提供无线远程控制,该无线远程控制允许其经由无线网络链路(例如红外、蓝牙、任意类型的基于ΙΕΕΕ802.11的协议等)与显示器12、相机元件14和/或控制台元件20进行通信。手持机28还可以被提供作为具有各种拨号盘的无线移动电话(例如免提通话设备):其中一些作为示例在图ι中被示出。在其它实现方式中,手持机28操作为学习机构和/或通用远程控制器,允许其容易地控制显示器12、相机元件14、控制台元件20和/或任何音频视频(AV)接收器设备(例如管理诸如0N/0FF、音量、输入选择等功能以改进整体的视频体验)。在特定的一组示例中, 手持机28上的特定按钮可以启动UI18,UI18用于浏览在UI软件的子菜单中提供的任意数目的选项。此外,可以使用专用按钮来作出/应答呼叫、结束呼叫、打开/关闭相机元件14、打开/关闭麦克风、打开/关闭控制台元件20等。此外,一组重放控件可以被设置在手持机28上以控制在显示器12上呈现的视频数据。注意,手持机28可以被配置为启动、控制和/或管理Π18。在一个特定实例中,Π18包括沿其周长(B卩,上、下、左、右)具有四个分离的功能的四叶草设计。Π18的中心可以用于发起呼叫或者配置呼叫选项。下部的工具图标可被用于调节设置,包括控制简档信息、私密设置、控制台设置等。右手侧的图标(当被选择时)可以用于查看发送给特定用户的视频消息。上部的图标可以用于管理联系人(例如添加、查看和连接到其他个人)。场记板(被设置为左部图标)可以用于记录和发送视频消息给其他个人。非常需要注意的是这些菜单选项可以被进行相当大的改变,而不脱离本公开的范围。此外,这些图标可以按任意适当的方式来定制、改变或管理。此外,UI18的图标不是穷尽的,因为在Π18的上下问中可以提供任何其它合适的特征。沿类似的线条,在这些图标中的每个图标之下设置的子菜单导航选项可以包括可应用于视频会议、联网、用户数据管理、简档等的任意合适的参数。在示例性实现方式的操作中,系统10可以用于进行视频呼叫(例如,支持呼入和呼出方向的呼叫流)。对于呼入呼叫的情景,一旦接收到呼入呼叫请求,控制台元件20就被配置为联系配对的(一个或多个)手持机28 (例如在适当的情况下,将其从睡眠状态唤醒)。手持机28可以被配置来播放铃声、开启LED指示器以及/或者显示UI18(例如包括呼入呼叫者的联系信息)。如果被配置为如此,UI18还可以被显示在控制台元件20上的任意直通视频源上方。如果被呼叫方选择用呼叫控制按钮中的一个应答呼叫,则控制台元件20将其媒体能力提供给呼叫方的端点。在某些示例性实现方式中,默认地,可以在通话开始时提供音频媒体。在语音通话期间的任意时间,双方可以商定进入完全视频会话(例如被称为“做大(go big)”协议)。作为捷径,“做大”的意向可以在通话开始时被预先表决。在视频媒体流动之后的任意时间,通话还可以被降级回只有音频的通话。在某些实例中,可以有作为即时完全视频会话来自动应答呼入呼叫的选项。在自治呼出呼叫的情况下,用户可以从他们的联系人列表中选择被呼叫方,通过快速拨号设置来选择被呼叫方,或者作为替代,用户可以输入任意类型的标识符(例如电话号码、名字、或者直接是视频会议系统(例如由加利福尼亚州圣何塞市的思科公司制造的Telepresence)号码)。如果被呼叫方应答,则呼叫情景与呼入呼叫相类似地进行。在保持和恢复情景的情况下,可以提供呼入Π18信号以将呼叫置于保持状态,并且随后呼叫可以在稍后的时间被恢复。注意在其它实例中,系统10可以用于执行规定时间的呼叫、呼叫转移功能、多点呼叫和/或各种其它会议能力。在消费者用户尝试与商业实体的通信的情况下,某些参数可以基于互操作性问题而被改变。例如,安全商业端点可以被支持,其中信令和媒体将是安全的(音频和视频二者)。可以在Π18中显示适当的消息以告知用户关于任何安全性迫使的掉话的原因。通过以下方式,信令可以被认为是安全的,所述方式即使得商业交换和消费者网络在物理上位于相同位置,或者在两个实体直接使用安全隧道(例如站点到站点的虚拟私有网络(VPN)隧道)。 在转到与系统10相关联的其他流程之前,引入图2以说明针对系统10的一些可能的布置和配置。在图2的特定示例性实现方式中,相机元件14包括处理器40a和存储器元件42a。相机元件14耦接到控制台元件20,控制台元件20类似地包括处理器40b和存储器元件42b。电源线36设在插头与控制台元件20之间。可以使用任何合适的连接(有线或无线的)以连接图2的任意组件。在某些示例中,所使用的线缆可以包括以太网线缆、高清晰度多媒体接口(HDMI)线缆、通用串行总线(USB)线缆或者被配置用于在两个设备之间承载数据或能量的任何其它合适的链路。就物理基础设施而言,相机元件14可以被配置为固定于显示器12 (例如平板HD电视机)的任一边缘(例如上边缘)。相机元件14可以被包括作为可包括扬声器16 (例如阵列麦克风)的集成组件(即,单个组件、专用元件、机顶盒、控制台元件20等)的一部分。因而,所有这些元件(相机元件14、扬声器16、控制台元件20)可以被组合并且/或者被适当地合并成位于(或者固定于,或者位于附近)显示器12上的集成组件。或者,这些元件分别是它们自己独立的设备,这些设备可以被耦接(或者简单地彼此交互)或者以任何适当的方式被恰当地放置。图2中还设有路由器34和机顶盒32:这两者都可以耦接到控制台元件20。在特定示例中,路由器34可以是被配置用于提供与网络30的连接的家庭无线路由器。或者,路由器34可以利用简单的以太网线缆来提供用于与系统10相关联的数据传输的网络连接。手持机28可以被通过座充电器26 (如图2中所示)来充电。[手持机28在入坞时可以是起作用的。]或者,手持机28可以通过电池、太阳能充电、线缆或者通过任何电源或者这些机制的任意合适的组合而被供电。在一个特定示例中,系统10的呼叫信令可以通过会话发起协议(SIP)来提供。此夕卜,用于视频会议平台的媒体可以通过安全实时传输协议(SRTP)或者任何其它适当的实时协议来提供。SRTP解决了 RTP的安全问题,并且还可以被配置为对RTP协议增加保密性、消息认证和重放保护。SRTP对于保护IP语音(VoIP)流量而言是优选的,这是因为其可以结合头部压缩而被使用,并且此外,其通常对IP服务质量(QoS)没有影响。对于网络地址翻译(NAT) /防火墙(FW)穿越,任何合适的机制都可以被系统10使用。在一个特定示例中,这些功能可以由具有用于NAT的会话穿越应用程序(STUN)和交互式连接建立(ICE)的拆分隧穿VPN提供。信令可以经由VPN传播到呼叫代理。此外,媒体可以直接从一个端点发送到另一端点(即从一个视频会议平台到另一视频会议平台)。注意,这里所使用的术语“媒体”包括音频数据(可以包括语音数据)和视频数据(可以包括任何类型的图像数据)。视频数据可以包括任何合适的图像(例如由相机元件14、由对应方的相机元件、由摄像头、由智能电话、由iPad等捕获的图像)。这里所使用的术语“智能电话”包括能够配合视频服务而工作的任何类型的移动设备。这自然包括诸如Google Droid、iPhone、iPad等产品。此外,术语“信令数据”包括可以朝着网络发送的任何适当的控制信息。这可以包括被用于最初建立视频会话的流量以及可能适合于特定视频会议的任意类型的协商(例如针对比特率、针对带宽等)。这还可以包括不作为媒体数据的一部分而提供的诸如管理流量、帐户流量(用于用户帐户管理、联系人列表[包括好友列表,下面将详细描述]等)和/或其它类型的流量之类的项目。 为了应对对称NAT,在特定实施例中,使用穿越的中继NAT(TURN)可以被系统10使用。在特定示例中,用于视频会议平台的用户名可以由E.164号码提供。或者,用户命名可以是简单的用户ID (例如由服务提供商指定的、由用户选择的等)、用户的全名(或者组名)、头像或者可以用于将一个用户与另一用户区别开的任何其它符号、数字或者字母组合。注意,单个名字也可以与组(例如家庭、商业单位等)相关联。系统10的通信的安全性可以用很多种方式解决。在一种实现方式中,视频服务(即,云服务)可以由任何适当的安全协议(例如安全性软件、自适应安全性设施(ASA)等)来保护。此外,入侵保护系统、防火墙、防拒绝服务机制可以被提供用于该体系结构(都在网络内外以及/或者在住宅环境本地内)。转而考虑与系统10的基础设施相关联的细节,在一个特定示例中,相机元件14是被配置为捕获、记录、保持、缓存、接收和/或发送图像数据的视频相机。这可以包括通过网络30将分组发送到适当的下一个目的地。所捕获/记录的图像数据可以被存储在相机元件14本身中,或者在某个适当的存储区域(例如数据库、服务器、控制台元件20等)中提供。在一个特定实例中,相机元件14可以是其自己独立的网络设备并且具有独立的IP地址。相机元件14可以包括无线相机、高清晰度相机或者被配置为捕获图像数据的任何其它适当的相机设备。相机元件14可以与用于发起用于视频会话的通信的设备交互(或者包括这些设备),所述设备例如是交换机、控制台元件20、专用端点、麦克风、拨号盘、网桥、电话、计算机或者能够发起系统10内的视频、语音、音频、媒体或数据交换的任何其它设备、组件、元件或对象。相机元件14还可以被配置为包括接收模块、发送模块、处理器、存储器、网络接口、呼叫发起和接收设备(例如拨号盘)、一个或多个显示器等。这些项目中的任一个或多个可以被合成、组合、完全去除或者进行相当大的改变,并且这些修改可以基于特定的通信需求而被进行。相机元件14可以包括高性能镜头和光学变焦器,其中相机元件14能够执行平移和倾斜操作。视频和音频流可以从相机元件14发送给控制台元件20,在控制台元件20处这些视频和音频流被混合成HDMI流中。在某些实现方式中,相机元件14可以提供作为光传感器,以使得该体系结构可以检测相机的快门是打开的还是关闭的(或者快门是否是部分打开的)。可以使用应用程序接口(API)来控制相机元件14的操作。显示器12提供屏幕,可以在该屏幕上为最终用户呈现视频数据。注意,在本说明书中所使用的术语“显示器”意指能够向最终用户传送图像数据(包括视频信息)、文本、声音、音频视频数据等的任何元件。这将必然包括任何面板、等离子元件、电视机(可以是高清晰度的电视机)、监视器、计算机接口、屏幕、Telepresence设备(包括Telepresence板、面板、屏幕、表面等)或者能够传送/呈现/投影这些信息的任何其它合适的元件。网络30表示用于接收和发送通过系统10传播的信息分组的互连通信路径的一系列点或节点。网络30提供在图1和2的组件中的任一组件与远程站点之间的通信接口,并且可以是任何局域网(LAN)、无线局域网(WLAN)、城域网(MAN)、广域网(WAN)、VPN、内联网、外联网或者在网络环境中辅助实现通信的任何其它适当的体系结构或系统。

控制台元件20被配置为接收来自相机元件14的信息(例如,经由可以附接到集成设备(例如机顶盒、专用箱等)的某个连接,所述集成设备位于显示器12顶部(或者附近)并且包括相机元件14 (或者作为相机元件14的一部分))。控制台元件20还可以被配置为控制压缩活动或者与从相机元件14接收的数据相关联的附加处理。或者,实际的集成设备可以在图像数据被发送给其下一个所意图的目的地之前执行该附加处理。控制台元件20还可以被配置为存储、聚合、处理、输出或者以其他方式保持图像数据并且以任何适当的格式登记,其中这些活动可能涉及处理器40b和存储器元件42b。控制台元件20是辅助实现端点与给定网络之间的数据流动的视频元件。在本说明书中所使用的术语“视频元件”意图包括服务器、专用箱、网络装备、机顶盒或者可操作来与相机元件14交换视频信息的其它适当的设备、组件、元件或对象。控制台元件20可以通过无线连接或者经由允许信号在这些元件之间传播的一个或多个线缆或线路与相机元件14相接口。这些设备还可以接收来自中间设备、远程控制器、手持机28等的信号,并且这些信号通常可以利用红外、蓝牙、WiF1、电磁波,或者用于将数据(例如可能通过网络)从一个元件传送给另一元件的任何其它适当的传输协议。实质上,任何控制路径都可以被利用来在控制台元件20与相机元件14之间传递信息。这两个设备之间的传输在某些实施例中可以是双向的,以使得设备可以彼此交互。这将允许设备确认来自彼此的传输并且在适当的情况下提供反馈。这些设备中的任意设备可以基于特定的配置需要而与彼此合成,或者独立工作。在一个特定实例中,相机元件14利用USB线缆被智能供电。在更具体的示例中,视频数据通过HDMI链路而被传输,并且控制数据通过USB链路而被传送。在某些示例中,控制台元件20可以在其内部设置有独立的光传感器以测量给定房间的采光。随后,该体系结构可以基于在房间中检测到的光来调节相机曝光、快门、透镜调节等。相机元件14也试图提供这个功能;但是具有独立的光传感器提供了基于在房间中感测到的光来调节这些参数的更具确定性的方式。一种算法(例如在相机元件14和/或控制台元件20内)可以被执行以基于光检测进行相机调节。在空闲(IDLE)模式下,相机元件14的镜头可以自动关闭。相机元件14的镜头可以为呼入呼叫而打开,并且可以在呼叫完成时关闭(或者这些操作可以由手持机28控制)。该体系结构也可以应对针对相机元件14的具有挑战性的采光环境。例如,在一个人背后有明亮的日光的情况下,系统10可以优化对此人面部的曝光。关于音频数据(包括语音数据),在一个特定示例中,扬声器16被提供为麦克风阵列,该阵列可以被适当地校准。注意,在某些消费者应用中,该消费者的家庭系统是个变体,这与具有固定(可预测)的办公室结构的大多数企业系统形成对比。在特定示例中,相机元件14可以包括有8个麦克风的阵列,但是作为替代,任意数目的麦克风可以被提供以适当地捕获音频数据。这些麦克风可以按线性或对数间隔而被放置以实现所希望的音频捕获功能。在某些实现方式中,微机电系统(MEMS)技术可被用于每个麦克风。MEMS麦克风代表电容式麦克风设计的变形,具有内置的模数转换器(ADC)电路。系统10的音频机制可以被配置为对系统添加延迟以保证声学装置能够正确地起作用。实质上,该视频会议体系结构本身由于消费者的独特领域而不知道合适的延迟。例如,可能存在被用于声学目的的家庭影院系统。因而,系统10可以确定对于该特定环境而言将是唯一的适当延迟。在一个特定实例中,该延迟可以被测量,其中来自现有扬声器的回声效果被适当地抵消。嵌入式水印签章也可以被提供在每个扬声器中,其中该签章可以被检测以确定适当的延迟。注意,还存在某种由显示器12自身添加的附加延迟,因为时钟机制通常不是确定性的。 该体系结构可以动态地更新该延迟以应对这个问题。这些功能中的很多功能可以由控制台元件20和/或相机元件14完成:这两者都可以被智能地配置用于执行这些功能调节。该体系结构还可以发出信号(例如白噪声)作为用于测量延迟的测试。在某些实例中,这个功能是自动完成的,而不需要提示用户。该体系结构还可以利用无线麦克风24,在某些实现方式中,该无线麦克风24可以使用专用链路。无线麦克风24可以被配对(类似于蓝牙配对)以使得隐私问题可以被适当地解决。无线麦克风24可以被带到任何地方(例如在房间里、在屋子里等)并且仍然提供适当的音频功能,其中多路复用将发生在控制台元件20处以用于这个特定应用。类似地,对于给定的扬声器也可以存在同样的情况(或者扬声器/麦克风可以一起被提供作为便携式移动单元)。该扬声器可以类似地被用在房间里、屋子里等的任何地方。应当注意这不仅是方便的问题,而且在适当地捕获/传送具有适当的强度和质量的音频信号方面也是性能问题。就呼叫应答和视频消息而言,手持机28允许个人具有接受语音呼叫而非应答视频会议呼叫的选项。这是因为手持机28可能具有纯粹作为移动电话来工作的智能。因此,手持机28可以容易地用各种类型的智能电话代替/取代,所述智能电话上可以设有用于控制视频会议活动的应用。手持机28还支持(通过手持机本身)被通知呼入视频会议呼叫的能力,具有将所述呼叫呈现在显示器12上的选项。可以使用简单的视觉警报(例如LED、振动等)来指示视频消息正在等待被收听/观看。
视频消息可以包括将指示出实际消息图像的视频帧的快照。在用户的视频收件箱中,当前的视频邮件可以包括被存储用于将来重放的实际消息的图像。例如,消息来自用户的母亲,则视频邮件将包括在该视频邮件期间母亲讲话的一系列快照。在一个特定示例中,实际的视频邮件以一定时间间隔(例如每隔10秒)而被采样以生成这些图像,这些图像用作视频邮件消息的预览。或者,快照在数目上可以被限制。在其它实例中,快照被任意选择或者在视频消息的开始、中间和结尾处被选择。在其它实现方式中,快照被作为整个视频消息的百分比(例如在20 %标记处、在40 %标记处和在100 %标记处)而拍摄。在其它示例中,收件箱中的视频邮件通过仅仅显示与编写视频消息的特定用户ID相关联的图像而被预览。在涉及正在观看显示器12上的正常电视节目的用户的示例的操作中,呼入呼叫可以被视频会议平台接收。即使电视机是关闭的,通知也可以到达(例如通过系统10的扬声器)。如果有人选择应答该呼叫,则视频会议平台接管电视机。在涉及数字视频记录器(DVR)的一个示例中,节目可能被暂停。在其它示例中,用户可以将呼叫保持最小化,使得(例如)用户可以在观看足球比赛的同时与朋友讲话。控制台元件20可以被配置为记录消息,然后将该消息发送到任何适当的下一个目的地。例如,用户可以针对特定消息发送链接给某个人。用户还可以使用Flip Share或YouTube技术上传/发送消息到任何合适的目的地。在通常意义上,消息可以位于网络云中以使得即使住宅处的电源断掉或者用户不在住宅处,消息仍然可以被访问(例如通过无线链路)。用户还可以从视频通话切换到手持机28,并且从手持机28切换回视频通话。例如,用户可以在智能电话上发起呼叫,随后将呼叫转移到视频会议显示器12。用户也可以反过来做,即用户开始于视频会议平台再切换到智能电话。注意,无线麦克风24可以工作在特定的优选范围内(例如12到15英尺),其中如果个人移动到远离所述范围的地方,则用户可以选择转移到手持机28(按更传统的电话方式)。考虑以下情况:由于家庭成员而使得房间变得嘈杂,并且视频会议呼叫上的用户选择简单地切换到智能电话、到给定的座机等。运动检测也可以被使用以发起或应答视频呼叫。例如,在起居室里难以找到远程控制器的情况下,可 以使用简单的摆手姿势来应答呼入的视频呼叫。此外,系统(例如相机元件14与控制台元件20合作)通常可以检测特定的身体部分以执行该协议。例如,该体系结构可以在狗跑过显示器12与用于应答呼入呼叫的摆手之间进行区分。沿类似的线路,用户可以使用不同的姿势来执行不同的通话功能(例如握住他的手以将通话置于等待状态、拍手以结束通话、指点以将某个人加入联系人列表等)。注意,W1-Fi是被系统10完全支持的。在大多数视频会议场景中,可能会有大量数据(这些数据中的许多是对时间要求严格的)传进(或传出)该体系结构。通过W1-Fi连接传播的视频分组(即低等待时间数据)可以被系统10正确地接纳。在一个特定示例中,不移动(静态)的背景图像可以被从视频图像中分出,所述视频图像正在被显示器12呈现。然后,该体系结构(例如通过控制台元件20)可以大幅度地降低那些图像上的比特率。然后,可以对正在移动(即以某种方式变化)的其它图像进行分配。在某些示例性实现方式中,面部检测算法也可以被使用,其中视频基于那些算法的结果而被优化。某些电话特征允许手持机28提供快速拨号以及用于将联系人存入联系人列表中的机制。可以通过手持机28上的单个按钮按压对在快速拨号列表或联系人列表上的用户进行呼叫。此外,可以利用手持机28的Π或屏幕上的Π18发起呼叫。此外,呼叫可以从web门户被发起,这种情况下呼叫者可以通过按压手持机28上的语音专用或视频呼叫按钮来在端点处确认呼叫发起。此外,呼叫可以经由呼叫工具从其它web页面被发起(例如通过点击某个人的Facebook对象来呼叫此人)。此外,呼叫者可以在在线通讯录(例如存储在数据库中的所有Tel印resence用户的通讯录)中查找接收方,对该接收方做出呼叫,并且将接收方的联系信息存入联系人列表中。就接收视频会议呼叫而言,呼入呼叫可以利用手持机28上的单个按钮按压而被接受。呼叫接收方有机会接收或拒绝呼叫。被拒绝的呼叫可以被路由到视频邮件(如果被接收方的安全设置所允许的话)。关于通话质量,如果在通话期间可用带宽减小,则视频分辨率适当地被降低。如果在通话期间可用带宽增大,则视频分辨率可以被提高。可以在显示器12上提供屏上图标来告知用户其视频会议体验的质量。该信息的目的可以是为了告知用户可能由于网络条件造成的劣质体验,并且用户可以通过升级其宽带服务来改善其体验。当利用摄像头通信时,显示器12上的图片可以被框在黑框内:不管摄像头视频的实际质量如何。关于视频邮件,当呼叫不能被实时应答时,该呼叫不被丢失,而是被自动转发到视频邮件。视频邮件可以从视频会议系统、web门户、智能电话、膝上型计算机或者用户所使用的任何其它适当的端点设备而被访问。注意,用户被提供了为何时呼叫方将被转移到用户的视频邮件收件箱设置指定时间间隔的能力。术语“指定时间间隔”包括响铃的次数、一定的时间段(例如在几秒内)或者零间隔,在零间隔的情况下,呼叫方的视频呼叫请求将被立即路由到用户的视频邮件。在某些实施例中,“指定时间间隔”具有由管理员配置的缺省值。在系统10的特定实现方式中,视频邮件可以被存储在网络中(例如云中)。或者,视频邮件可以被本地存储在消费者的住宅处(例如存储在膝上型计算机、个人计算机、外部硬盘驱动器、服务器处或者任何其它适当的数据存储设备中)。视频邮件可以用以下最小的重放控件集合来播放:播放、暂·停、停止、快进或跳进、快退或跳退、返回到开始。在特定实现方式中,视频邮件只被所希望的接收方查看。对新视频邮件的通知可以通过短消息服务(SMS)文本消息(例如发送到移动设备)或者通过电子邮件而被发送给其它设备。也可以在手持机28上显示即时的通知。对于视频记录而言,视频可以被记录和存储在网络上以供将来查看和分发(例如作为视频服务的一部分,这将在下面参考图3进行详细描述)。呼叫可以类似地被实时记录并存储在网络中以供将来查看和分发。当与视频会议用户共享所记录的视频时,该体系结果可以指定具体哪些视频会议用户有对视频数据的访问权。当共享列表包含一个或多个电子邮件地址时,在特定实现方式中,访问控制不被启用(例如任何具有URL的个人都可以访问视频)。就媒体共享而言,系统10可以提供用于利用可移除闪存介质、闪存和硬盘驱动器高清晰度数字摄像机、数码相机和其它便携式存储设备来共享数字照片和视频的简单机制。这可以通过支持这些设备与USB端口的外部USB连接来实现,所述USB端口可以设在控制台元件20、显示器12、相机元件14、专用设备处或者任何其它适当的位置处。媒体共享应用(例如位于控制台元件20中)支持存储在USB设备上的压缩AV文件媒体的重放。此外,这种媒体共享可以通过这些设备与HDMI端口的外部HDMI连接而被支持。系统10还可以提供用于共享在计算机上、网络附接存储(NAS)设备上、本地网络上等的数字照片和视频的机制。该机制可以是与通用即插即用(UPnP)/数字生活网络联盟(DLNA)渲染器兼容的。媒体共享应用还可以提供用于共享在照片或视频共享站点(例如Flickr、YouTube等)上的数字照片和视频的机制,如这里所讨论的。系统10还可以提供用于利用与通话视频以画中画(PIP)的形式显示的HDTV机顶盒HDMI AV馈给来观看广播HDTV节目(例如观看Superbowl)的机制。继续该示例,SuperBowl广播馈给可以来自本地机顶盒32并且不被共享。在该示例中,只有通话视频和语音将被共享。通话的音频部分可以被重定向到手持机28 (例如默认为扬声器电话)。来自本地TV的音频可以被传送到HDMI和光学链路(例如TOSlink输出)。在一示例场景中,最初,比赛视频可能填充主屏幕并且通话视频可能在较小的PIP中。比赛的音频可以通过机顶盒传送到电视机或者传送到AV接收器的环绕声音系统。视频通话的音频将由手持机28支持。在不同场景中,在观看比赛的同时,在一个呼叫者优选将主屏幕从比赛切换到视频通话(例如在中场休息期间)的情况下,则以下的活动将发生。[注意,这与其它PIP体验是一致的。]通话视频可以填充主屏幕,而比赛填充较小的PIP窗口。视频通话的音频可以移到TV或者移到AV接收器环绕声音系统,并且比赛音频可以切换到手持机28。注意,这些活动都不需要用户“在镜头之外”来控制体验:就是说,用户不必为了控制/协调所有这些活动而离开他的椅子。在一个特定示例中,控制台元件20和相机元件14可以支持用于针对本地未压缩输入和输出的HD视频的任何合适的帧速率(例如50-60帧/秒(fps)的速率)。此外,视频(例如HDMI1.3视频)可以被提供作为用于本地未压缩输入和输出的数字信号输入/输出。存在有用于来自HDMI的本地未压缩输入和输出的高带宽数字内容保护(HDCP)数据的直通路径。关于音频支持,HDMI音频可以被提供作为数字信号输入/输出。也可能有立体声模拟线路电平输出来支持环境中的旧式设备。这是对数字音频输出的补充,所述数字音频输出可以采用诸如TOS链路输出 之类的光学链路输出的形式。对于音频视频切换活动,音频和视频可以从输入、视频会议视频或者其它生成源而被补入本地全屏输出。该体系结构可以提供用于自动开启并选择HDTV的正确源(以及任意外部音频系统,当在应答呼叫的同时音频视频配置允许该外部音频系统时)的协议。该特征(和手持机28的其它特征)可以通过红外、蓝牙、任何形式的IEEE802.11协议、HDMI消费电子控制(CEC)等来实现。关于相机元件14,该体系结构可以提供全运动视频(例如以30fps)。在范围以外的参与者可以通过自动对焦被聚焦。相机元件14可以向控制台元件20、机顶盒卫星和/或与其能力有关的任何其它适当的设备提供标识信息。相机元件14可以被提供任何适当的像素分辨率(例如1280X720像素(720p)的分辨率、1920X 1080 (1080p)的分辨率等)。如果焦点深度大于或等于两米,则手动对焦可能被建议用于设置活动,并且自动对焦特征/选项可能是用户所想要的。在操作中,用户可以在设置期间将相机元件14手动对焦到其沙发(或者任何其它目标区域)上。如果成功,则该问题将不需要被重新考虑。如果焦点深度小于或等于一米(通常都是这样),则自动对焦可以被实现。还可以利用相机元件14为系统10提供数字人物动作发现器。平移和倾斜特征都是在设置时和视频通话期间手动可用的。类似地,变焦也是在设置时和视频通话期间手动可用的。手持机28可以配备有任何合适的麦克风。在一个特定实现方式中,该麦克风是被优化用于捕获语音范围内的高质量音频的单通道发话筒麦克风。该麦克风可以被放置为具有标准的耳朵-嘴巴的距离以优化音频捕获。手持机28可以具有用于带有麦克风的耳机的
3.5mm的插口。注意,系统10可以支持家庭网络管理协议(HNAP)并且与Network Magic、Linksys Easy-Link Advisor或者任何其它合适的家庭网络管理工具兼容。在一个示例中,手持机28具有用于控制标准家庭影院组件的红外发射器。在该示例中,用于手持机28的最少控件可以是TV和AV接收器的电源开关、输入选择、音量高/低和音频输出静音。控制台元件20 (以及相机元件14)可以具有红外接收器以辅助实现视频会议系统与其它远程控制器的配对,这可以允许其它远程设备控制视频会议系统。适当的配对可以通过将红外代码输入到手持机28中或者通过从在视频会议系统的红外接收器处的目标系统指向远程设备来进行(例如类似于通用远程设备学习和配对的方式)。对于呼叫管理,系统10可以允许用户发起、接受和断开去往和来自只有语音的电话的呼叫(例如利用在只有语音的模式下的手持机28)。还可以提供呼叫转接以使得视频呼叫在位于视频会话的每个端点处的控制台元件20之间被转接。此外,可以提供公告以使得默认的公告视频可以被播放给留下视频邮件的呼叫者。自我查看在任意时间都是可用的,并且自我查看可以根据用户需要通过用户按压手持机28上的按钮而被触发。自我查看可以用显示相机的反转图像的镜像模式来支持,就好像用户在镜子里查看一样。这可以发生在任何时候,包括在空闲时、在视频会议通话期间、在只有语音的呼叫期间等。图3是图示了与系统10相关联的一种可能操作的简化框图。在该特定实现方式中,控制台元件20配备有VPN客户端模块44和媒体模块46。控制台元件20耦接到家庭路由器48,该路由器可以提供经由网络52与另一视频会议端点50的连接。家庭路由器48还可以提供与包括多个视频服务56的网络的连接。在该示例中,视频服务56包括消费者数据库58、视频邮件服务器60、呼叫控制服务器62、web服务64和会话边界控制器66。任意数目的流量管理特征可以被系统10支持。在一简单示例中,系统10可以允许在两个家庭视频会议系统之间进行点到点的连接。连接也可以在家庭视频会议系统和企业视频会议系统之间建立·。与呼叫相关联的分组可以通过家庭路由器而被路由,所述家庭路由器可以将分组引导至网络中的交换器或网关。消费者端点不需要支持第二数据通道;任何共享的内容都可以被合并到主数据流中。多点连接可以在三个或更多个家庭和企业视频会议系统的组合之间被建立。在操作中,VPN被利用以向网络传送管理和信令流量。此外,媒体数据(例如语音和视频)可以在该链路以外被交换(例如其可以被设置为在高带宽点到点链路上流动)。这种链接方式可以被配置为保护管理和信令流量(该流量可以包括下载流量),同时通过点到点的路径进行高速数据通信。在图3的特定示例中,安全信令和管理数据被描述为在家庭路由器48与视频服务56之间传播。多个VPN端口也在图3中被示出。这些端口可以与任何适当的安全协议相关联(例如与IPsec、安全套接层(SSL)等相关联)。此外,媒体数据可以在网络52与家庭路由器48之间传播,在这种情况下RTP端口被提供用于这种涉及对应方端点50的特定交换。从语义上说,可以使用多个路径来传送与系统10相关联的流量。与其它捆绑其流量(即提供到防火墙内的单个穿孔)的其它应用相对比,系统10的某些实现方式可以利用在防火墙中的两个不同路径:用于传送两种不同类型的数据的两个路径。视频服务56内的对象是路由或者交换(或者彼此合作以路由或交换)网络环境中的流量和/或分组的网络元件。本说明书中所使用的术语“网络元件”意图包括服务器、交换机、路由器、网关、网桥、负载平衡器、防火墙、内联服务节点、代理服务器、处理器、模块或者可操作来在网络环境中交换信息的任何其它合适的设备、组件、元件或对象。该网络元件可以包括辅助实现其操作的任何合适的硬件、软件、组件、模块、接口或对象。这可以包括允许数据或信息的有效交换(接收和/或传输)的适当的算法和通信协议。注意,视频邮件服务器60可以在视频服务56的任意元件之间共享(或协调)某些处理操作。利用类似的推理,它们各自的存储器元件可以以任意种可能的方式存储、保持和/或更新数据。在一个示例性实现方式中,视频邮件服务器60可以包括软件以实现涉及用户的视频处理应用,如这里所描述的。在其它实施例中,这些特征可以在任意上述元件的外部被提供,或者被包括在一些其它网络元件中以实现这种所希望的功能。或者,若干个元件可以包括可以协调以实现所述操作的软件(或者往复式软件),如这里所概述的。在其它实施例中,图中的任意设备可以包括辅助实现这些交换操作的任何合适的算法、硬件、软件、组件、模块、接口或对象。在某些实例中,视频邮件60可以被提供在不同的位置中,或者一些其它功能可以直接在视频会议平台内(例如在控制台元件20、相机元件14、显示器12等内)被提供。这种情况可能出现在以下的场景中,其中控制台元件20已被提供有提高的智能以执行类似的任务或者为了个人用户的利益而管理某些数据存储库。图4是图示了与呼叫信令和呼叫媒体相关联的其他细节的简化框图。在该特定实例中,呼叫媒体链路用虚线表示,而呼叫信令链路用实线表示。更具体而言,呼叫信令从一组端点74a-b通过宽带网络传播,在这种情况下这些链路具有在视频服务56处的合适的连接。在图4的示例中,这些链路被标记为70a-b。视频服务56包括之前针对图3表明的很多服务。端点74a_b之间的呼叫媒体在宽带网络上传播,其中这些链路被标识为72a_b。端点74a-b只是利用系统10的设备的视频会议实体。图5-13是图示了与要配合进行视频会话而使用的用户界面相关联的某些特征的简化屏幕截图。图5 图示了可以在给定的视频显示器上呈现的用户界面75。在该特定实例中,电话图标被选择以使得视频呼叫可以被发起或接收。图6图示了用户界面75怎样发信号通知有针对给定用户的视频邮件。此外,应当注意在该示例中信封图标已被突出以指示有视频消息在等待被用户访问。图7-8图不了用户界面75的某些子菜单76和78。子菜单76与设备设置和偏好相关联,而子菜单78与记录视频和回顾当前视频相关联。注意,这些子菜单可以通过简单地操纵(例如在向上、向下、向左和向右方向上)用于家庭用户界面75的远程控制器(即手持机)而被访问。图9图不了用于应答呼入视频呼叫的图形80。当呼叫进入系统中时,用户可以利用用户界面75 (如之前所讨论的)选择忽略该呼叫,或者使用手持机来应答该呼叫。图10图示了与用户怎样访问其联系人以发起视频呼叫相关联的图形82。图11图示了允许用户可以用来向其视频系统添加新联系人的图形84。图12图示了与对视频消息进行转发、删除、播放、编辑等相关联的图形86。图13图示了与正在被用户播放的视频消息相关联的图88。在图形88内提供时间过期参数。注意,视频消息可以通过对图形88的操纵而被倒带、快进、暂停等。图14是图示了控制台元件100的一种可能实现方式的简化框图。控制台元件100类似于(图1的)控制台元件20 ;但是,在该实例中,控制台元件100具有与在视频会话期间在给定显示器上呈现弯曲边缘相关联的某些附加的增强。控制台元件100可以包括处理器102、存储器元件104、不透明掩模模块106和色度键模块108。控制台元件100内的元件可以互相合作以实现增强的视频操作(例如与不透明掩模、色度键处理等相关联的操作),如下面要进行讨论的。转而考虑与色度键抗锯齿活动相关联的具体细节,大多数消费产品覆盖整个屏幕,该屏幕提供任何合适的图形都可以被提供在其上的画布。鉴于高清晰度电视的块像素特性,在直通视频上面创建光滑曲线是很困难的。通常,当全屏幕产品想要显示菜单时,粗糙的盒式形状被显示。此外,结果通常呈现锯齿状,而不是表现出光滑曲线。与这些产品相对比,用户界面图形(用四叶草形状显示)是无损伤的直通用户界面,该界面以光滑的圆形边缘被呈现给用户。为了实现这种光滑的圆形边缘呈现,本公开的体系结构可以采用两种技术:色度键控和抗锯齿。该上下文中的色度键控指的是使用特定的红、蓝和绿(RGB)颜色并指定其表示到下层视频的直通颜色。这自然与蓝屏和绿屏视觉效果通常操作的方式相吻
图15是图示了按钮拉伸的示例的简化框图。图15包括一系列图像90a_c,这些图像一起来演示系统可以怎样对用户界面的按钮的宽度进行大小调整。这样做是因为希望动态拉伸圆形按钮以配合可变长度的文本(例如当将文本翻译成外语时),同时保持原始按钮图形的相同曲线半径。图16是图示了抗锯齿图像91a_b的简化框图。在这种情况下,图像91a示出了在没有抗锯齿情况下红色信号上的黄色圆圈。图91b示出了在应用了抗锯齿的情况下红色信号上的黄色圆圈。更一般来说,这些图像演示了抗锯齿是怎样操作的,据此具有黑色轮廓的黄色圆圈表现为锯齿状(在图像91a上),然后作为将红色直通视频与透明黑色像素混合的结果而变成了更光滑的曲线(在图91b中示出)。图17是图示了说明多个色度键颜色的使用的一组图像92a_c的简化框图。在这种情况下,在直通视频像素(红色)上面,色度键颜色为绿色和蓝色,据此绿色像素是100%透明的(以在图像92b中露出全部红色),而蓝色像素只是50%透明的(以在图像92c中露出变暗的红色)。这产生了看上去更光滑的曲线,该曲线比简单地使用一种色度键颜色(绿色)来显示视频(导致有锯齿的曲线)的现有结构要好。就操作而言,处理器(例如处理器102、现场可编程门阵列(FPGA)等)评估在显示器的用户界面中的每个像素。当处理器检测到用于像素的色度颜色时,处理器用背景视频来替换该像素,而不是用用户界面颜色替换。用户界面仍然被保持为看上去呈锯齿状(即使正在尝试描绘曲线)。该体系结构通过指定另一色度键颜色来解决这个问题:一种表示被变暗了一定百分比(例如50%)的背景视频的颜色。随后,系统可以改变针对弯曲的用户界面的工艺图,并且除了原始直通颜色以外,系统还可以使第二色度键颜色落在锯齿状曲线的台阶之间。这允许变暗了 50%的视频更柔和地混入用户界面中:导致更光滑曲线的错觉。更多色度键颜色被指定,系统就可以对曲线进行更好的抗锯齿处理以使曲线看上去更光滑。注意,在指定色度键方面应当有些限制,因为耗尽该参数可能会超过允许在用户界面中使用的颜色数目。这是因为每种颜色可以代表Π像素颜色或者背景视频(即,被变暗到指定量的颜色)。
图18是图示了与多色度键抗锯齿相关联的示例流程的简化流程图200。该方法可以开始于步骤210,在该步骤中处理器开始接收视频数据。输入的视频数据可以来自于相机元件或者任何其它合适的视频源(例如电缆箱、DVR、游戏机、蓝光/DVD播放器等)。处理器被配置为循环通过显示的所有像素(即,从左到右,从上到下),如步骤220中所示。对于每个像素,进行判断以识别该特定像素颜色(由RGB值反映)是否匹配用于色度键操作的特别指定的值。这由步骤230反映。例如,如果像素与所述指定的颜色(例如255)相匹配,则源视频的该像素可以100%清楚地被显示。如果不匹配,意味着该颜色在RGB尺度的251-254处,则直通视频将被显示为有一定百分比(例如20%)的变暗。这由步骤240示出。识别出的任何其它值(即0-250)将导致没有直通视频被显示,并且相反,像素将从源图形中被呈现。这由步骤250示出。因而,进行最初的判断以识别像素的匹配。在匹配被发现的情况下,做出关于针对该特定像素使直通视频信号变暗多少的决定。在某些示例性实现方式中,颜色本身(即RGB值)将决定变暗参数。这允许该体系结构选择性地使视频的像素变暗以平滑视频会话的给定显示上的圆形边缘。转而考虑与不透明呈现掩模相关联的操作,本公开的某些方面可以提供用于在视频处理中平滑边缘的更多的增强。对于高清晰度电视机,图像通常由具有由一定量的红蓝绿颜色(RGB)指定的颜色清晰度的方形像素构成。为了实现在用户界面中的平滑圆形按钮效果,该体系结构可以利用被称为α的附加参数:导致针对特定像素有RGBA颜色值。每个参数可以具有256个可能值,从O至Ij 255。RGB值(0,0,O)是纯黑色,而值(255,255,255)是纯白色。值(255,0,O)是纯红色,而值(0,0,255)是纯蓝色。α值为O是完全透明,值255表示是不透明。为了在视频会话期间在给定显示器上呈现光滑弯曲的用户界面,该体系结构最初利用经过抗锯齿处理的图像创建圆形图形。以不同的术语来描述,曲线可以利用部分透明的像素而被平滑。透明度可以由针对该像素的α值指定。这些部分透明的像素可以与在用户界面后面的直通电视源的像素颜色混合。当是时候在屏幕上绘制/呈现用户界面时,呈现代码创建用户界面的灰度级版本。该用户界面的灰度级版本是通过检查用户界面中的每个像素的α值而被创建的。如果像素的α值为0,则灰度级图像包含黑色像素。在像素的α值为255的情况下,灰度级图像包含白色像素。这是通过创建新的图像(被称为不透明掩模)并将其RGB值针对源图像中的每个像素设置为等于源图像的α值而实现的。换言之,该体系结构可以开始于源用户界面图像的左上角,并且从左到右、从上到右移至像素。针对所述初始像素的RGBA颜色被确定(例如128,32,192,255),并且该系统可以将RGB值(针对新图像中的相同像素)设置为源图像的α值,在该情况下为(255,255,255),为全白色。在新的灰度级图像被创建之后,处理器可以将像素X,Y (0,0)设置为RGBA颜色值(0,0,0,0)。这向处理器表明不透明掩模已被创建。处理器不断地评估用户界面图形以找到在位置(0,O)处的颜色(0,O, O, O)。当处理器看到这个值时,处理器知道该图像是不透明掩模,并且不应该将该图像呈现给屏幕。相反,处理器(例如FPGA)将该图像用作不透明掩模以将源视频与用 户界面混合。为黑色(0,0,O)的每个像素将完全显示直通视频。为白色(255,255,255)的任意像素都将不显示视频:只有实心的UI像素颜色。此外,具有在这些边界之间的值的每个像素使处理器将源视频的像素颜色与用户界面的像素颜色进行混合。在视频帧被混合在一起之后,该视频帧被发送到电视机以供显示。观众将不会看到灰度级呈现掩模:只有源视频与用户界面混合后所得到的图片在上面。注意,在某些示例性实现方式中,这里所概述的视频处理功能可以通过编码在一个或多个有形介质中的逻辑(例如,在专用集成电路[ASIC]中提供的嵌入式逻辑、数字信号处理器[DSP]指令、要由处理器或者任何其它类似的机器执行的软件[可能包括目标代码和源代码]等)来实现。在这些实例中的一些实例中,存储器元件[如图14中所示]可以存储用于这里所描述的视频增强操作(例如,涉及不透明掩模、色度键等)的数据。这包括能够存储被执行来实现本说明书中所描述的活动的软件、逻辑、代码或处理器指令的存储器元件。处理器可以执行与数据相关联的任何类型的指令以实现本说明书中所详细描述的操作。在一个示例中,处理器[如图14中 所示]可以将要素或物品(例如数据)从一种状态或事物转换为另一种状态或事物。在另一示例中,这里所概述的视频增强活动可以用固定逻辑或可编程逻辑(例如由处理器执行的软件/计算机指令)来实现,并且这里所标识的元件可以是某种类型的可编程处理器、可编程数字逻辑(例如FPGA、可擦除可编程只读存储器(EPR0M)、电可擦除可编程ROM (EEPROM))或者包括数字逻辑、软件、代码、电指令或者它们的任何适当的组合的ASIC。注意,图14的设备可以共享(或协调)某些处理操作。利用类似的推理,它们各自的存储器元件可以以任意种可能的方式存储、保持和/或更新数据。在通常意义上,之前的图中所示的布置可以在其表示上更具有逻辑性,而物理体系结构可以包括这些元件的各种置换/组合/混合。在一个示例性实现方式中,控制台元件20、100包括软件(例如作为图14的模块的一部分)以实现视频增强操作,如本文档中所概述的。在其它实施例中,这些特征可以在任意上述元件的外部被提供(例如被包括在相机元件14中),或者被包括在某个其它设备中以实现这些功能。或者,若干个元件可以包括可以协调以实现所述操作的软件(或者往复式软件),如这里所概述的。在其它实施例中,图中的任意设备可以包括辅助实现这些视频增强操作的任何合适的算法、硬件、软件、组件、模块、接口或对象。所有这些前述设备还可以将信息保存在任何合适的存储器元件(例如随机访问存储器(RAM)、ROM、EPROM、EEPROM、ASIC等)、软件、硬件中或者适当地基于特定需要保存在任何其它合适的组件、设备、元件或对象中。这里所讨论的存储器项目中的任意项目(例如数据库、表格、键值、队列等)应当被理解为被包括在宽泛术语“存储器元件”内。类似地,本说明书中所描述的任意可能的处理元件、模块和机器都应当被理解为被包括在宽泛术语“处理器”内。控制台元件20、100和/或相机元件14还可以包括用于接收、发送和/或以其它方式在网络环境中传送数据或信息的适当的接口。注意,就这里所提供的示例而言,交互可以针对两个、三个或四个元件而被描述。但是这样做只是为了清晰和示例的目的。在某些情况下,仅仅参考有限数目的元件描述给定流程组的一个或多个功能可能更容易。应当理解系统10 (及其教导)可以很方便地调整规模并且可以容纳大量组件以及更复杂/高级的布置和配置。因此,所提供的示例不应当限制系统10的范围或者限制系统10可能被应用于各种其它体系结构的宽泛教导。还很重要的是要注意在之前的流程图中的步骤只示出了可以被系统10或者在系统10内执行的可能的信令情景和模式中的一些。这些步骤中的一些步骤可以适当地被删除或去除,或者这些步骤可以在不脱离本公开的范围的情况下被进行相当大的修改或改变。此外,大量的这些操作已被描述为与一个或多个附加操作同时或者并行被执行的。但是,这些操作的定时可以被进行相当大的改变。之前的操作流程已为了示例和讨论的目的而被提供。系统10提供相当大的灵活性,因为在不脱离本公开的教导的情况下,任何适当的布置、年表、配置和定时机制都可以被提供。虽然已详细参考具体布置和配置对本发明进行了描述,但是在不脱离本公开的范围的情况下,这些示例性的配置和布置可以被进行相当大的改变。例如,例如,虽然本公开是参考包括特定服务器组件的特定通信交换而被描述的,但是系统10可以应用于其它协议和布置(例如涉及任何类型的视频会议情景的那些协议和布置)。此外,虽然相机元件14已被描述为按照特定方式安装,但是相机元件14可以按任何合适的方式被安装以适当地捕获视频图像。其它配置可以包括适当的墙部安装、通道安装、家具安装、柜橱安装、直立(立式)组装等或者其中相机将被适当地放置以执行其功能的布置。此外,这里所描述的用户简单地是在显示器12的附近或者观看区域内的个人。观众成员可以是参与到涉及在远程站点处的其它个人的视频会议中的人。观众成员可以与公司情景、消费者情景、住宅情景等相关联或者与系统10可应用于的任何其它适当的环境相关联。此外,虽然之前的讨论聚焦于与特定类型的端点相关联的视频会议上,但是使用视频应用的手持设备可以方便地采用本公开的教导。例如,iPhone、iPad、Google Droid、个人计算应用(即桌式视频解决方案)等可以方便地利用在上面详细描述了增强的视频处理操作。对视频数据进行编码或呈现的任何通信系统或设备都将适合于这里所讨论的视频特征。本领域技术人员可以明白各种其它改变、替换、变化、更改和修改,并且希望本公开包括落入所附权利要求的范围内的所有这些改变、替换、变化、更改和修改。

此外,系统10可以涉及不同类型的对应方,个人所使用的技术可以存在不对称性。例如,一个用户可能正在使用笔记本计算机,而另一用户在使用系统10的体系结构。类似地,智能电话可以被用作一个个人端点,而另一用户继续使用系统10的体系结构。而且,摄像头可以结合系统10被方便地使用。按照类似的思路,多方呼叫可以利用本公开的教导被方便地实现。此外,虽然已参考辅助实现通信过程的特定元件和操作对系统10进行了说明,但是这些元件和操作可以用实现系统10所希望的功能的任何适当的体系结构或过程来代替。
权利要求
1.一种方法,包括 接收来自耦接到显示器的视频源的视频输入,所述显示器被配置用于在其上呈现用户界面; 通过评估关于与所述视频输入相关联的像素的α值,生成与所述用户界面相关联的灰度级要素; 生成不透明掩模;以及 为源图像中的特定像素设置与所述源图像的α值相等的红、绿、蓝(RGB)值。
2.根据权利要求I所述的方法,其中所述灰度级要素是通过评估与所述用户界面相关联的每个像素的α值而生成的。
3.根据权利要求I所述的方法,其中如果特定像素的特定α值为O,则相关联的灰度级图像的一部分包含黑色像素。
4.根据权利要求I所述的方法,其中如果特定像素的特定α值为255,则相关联的灰度级图像的一部分包含白色像素。
5.根据权利要求I所述的方法,还包括 将选择的像素设置为红、绿、蓝、a (RGBA)值中的特定颜色以向处理器元件指示所述不透明掩模的存在。
6.根据权利要求I所述的方法,还包括 针对RGBA颜色来评估与所述用户界面相关联的图形以确定是否在所述显示器上呈现所述图形。
7.根据权利要求I所述的方法,其中特定图像被用作所述不透明掩模的一部分以将源视频与所述用户界面混合,并且其中被确定为黑色的像素在所述显示器上显示直通视频,并且被确定为白色的像素在所述显示器上显示实心用户界面像素颜色。
8.一种编码在一个或多个有形介质中的逻辑,该逻辑包括用于执行的代码并且当所述代码被处理器执行时可操作来执行包括以下各项的操作 接收来自耦接到显示器的视频源的视频输入,所述显示器被配置用于在其上呈现用户界面; 通过评估关于与所述视频输入相关联的像素的α值,生成与所述用户界面相关联的灰度级要素; 生成不透明掩模;以及 为源图像中的特定像素设置与所述源图像的α值相等的红、绿、蓝(RGB)值。
9.根据权利要求8所述的逻辑,其中所述灰度级要素是通过评估与所述用户界面相关联的每个像素的α值而生成的。
10.根据权利要求8所述的逻辑,其中如果特定像素的特定α值为0,则相关联的灰度级图像的一部分包含黑色像素。
11.根据权利要求8所述的逻辑,其中如果特定像素的特定α值为255,则相关联的灰度级图像的一部分包含白色像素。
12.根据权利要求8所述的逻辑,所述操作还包括 将一选定像素设置为红、绿、蓝、a (RGBA)值中的特定颜色以向处理器元件指示所述不透明掩模的存在。
13.根据权利要求8所述的逻辑,所述操作还包括 针对RGBA颜色评估与所述用户界面相关联的图形,以确定是否在所述显示器上呈现所述图形。
14.根据权利要求8所述的逻辑,其中特定图像被用作所述不透明掩模的一部分以将源视频与所述用户界面混合,并且其中被确定为黑色的像素在所述显示器上显示直通视频,并且被确定为白色的像素在所述显示器上显示实心用户界面像素颜色。
15.一种装置,包括 被配置来存储数据的存储器元件;以及 可操作来执行与所述数据相关联的指令的处理器,其中所述处理器和所述存储器元件进行合作以使得所述装置被配置为 接收来自耦接到显示器的视频源的视频输入,所述显示器被配置用于在其上呈现用户界面; 通过评估关于与所述视频输入相关联的像素的α值,生成与所述用户界面相关联的灰度级要素; 生成不透明掩模;以及 为源图像中的特定像素设置与所述源图像的α值相等的红、绿、蓝(RGB)值。
16.根据权利要求15所述的装置,其中所述灰度级要素是通过评估与所述用户界面相关联的每个像素的α值而生成的。
17.根据权利要求15所述的装置,其中如果特定像素的特定α值为O,则相关联的灰度级图像的一部分包含黑色像素。
18.根据权利要求15所述的装置,其中如果特定像素的特定α值为255,则相关联的灰度级图像的一部分包含白色像素。
19.根据权利要求15所述的装置,所述装置还被配置为 将一选定像素设置为红、绿、蓝、a (RGBA)值中的特定颜色以向处理器元件指示所述不透明掩模的存在。
20.根据权利要求15所述的装置,还包括 手持机,该手持机被配置为在视频会话期间控制所述用户界面。
全文摘要
在一个示例中提供了一种方法,该方法包括接收来自被耦接到显示器的视频源的视频输入,所述显示器被配置用于在其上呈现用户界面;通过评估关于与视频输入相关联的像素的α值来生成与用户界面相关联的灰度级要素;生成不透明掩模;以及为源图像中的特定像素设置与源图像的α值相等的红、绿、蓝(RGB)值。
文档编号H04N5/445GK103238178SQ201180054805
公开日2013年8月7日 申请日期2011年11月14日 优先权日2010年11月15日
发明者约翰·M·小卡纳拉基斯, 扎查理·R·比恩, 大卫·J·麦凯, 埃迪·柯林斯, 马克·大卫·德耶尔 申请人:思科技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1