用于数字图像和视频操纵和传送的系统和方法

文档序号:6763861阅读:136来源:国知局
用于数字图像和视频操纵和传送的系统和方法
【专利摘要】一种用于通过下面的步骤自动操纵并分享多媒体内容项的系统、方法和计算机程序产品:获取多媒体内容项;经图形用户界面定义相关的项信息;以及把多媒体内容项和相关的项信息传送到选择的目的地,由此保留相关的项信息。相关的项信息包括元数据和收集定义,包括传送约束和目的地要求。实施例可被实现在可能联网的计算机和照相机上,并把内容传送到电子邮箱账户、档案、社交网络和内容发布站点。图形用户界面包括用于容易、快速使用的功能特定区域。目的地由名字和标志识别,并且可包括互换服务器,互换服务器动态地更新最终目的地要求并作为响应适配另外的传送。传送可以是立即的或按需发生或在装置网络连接时发生,并且可包括用于实现图形用户界面的计算机可执行程序指令。
【专利说明】用于数字图像和视频操纵和传送的系统和方法
[0001]相关申请的交叉引用
[0002]本专利申请要求标题为“数字图像和视频操纵和传送”的于2011年5月25日提交的美国专利申请N0.13/115,826和于2010年8月13日提交的临时专利申请N0.61/373,566的优先权,根据35U.S.C.119要求该专利申请和临时专利申请的利益并且该专利申请和临时专利申请进一步通过引用包含于此。
【技术领域】
[0003]本专利文件一般地涉及管理多媒体内容,更具体地讲,涉及经各种计算机站点和社交网络操纵并分享照片、视频和其它多媒体内容。
【背景技术】
[0004]数字照相机正变得更便宜、更强大并且被更为广泛地使用。高分辨率图像和高清晰度视频能够被立即捕捉并存储在高容量存储装置上,且其成本小于好的SLR胶卷照相机曾经的成本。当前可用的数字照相机还通常具有彩色显示器以在现场显示捕捉的图像和视频。
[0005]社交网络正变得日益流行。站点和/或服务(像是Y0UTUbeTM、FaCeb00kTM、PiCaSaTM和其它站点和/或服务)使用户能够经互联网分发文本、图像和视频。不幸的是,管理图像、视频和其它多媒体内容项会很复杂。随后把这些项传送到在线站点能够引起另外的用户厌烦和乏味,因为每个站点可具有它自己的应用程序接口(API)和对上传的约束,并且这些可随时间而改变。
[0006]想要管理并分享内容的人能够分为不同的可能的细分市场。例如,“习惯性分享者”想要简单和速度以与朋友“分享一个时刻”或者炫耀他们做的一些事情。他们的照片是短暂的,并且希望使用不“碍事”的软件经社交网络进行迅速轻松的分享。相比之下,“家史学者”想要足够的内容管理工具复杂性以用于严肃的项目。这一组通常对捕捉重要事件的珍贵记忆、随后组织、基本上永远保留它们并且回忆它们或以私密方式发送它们感兴趣。
[0007]这两种用户组都想要注解内容项并把它们集结成呈现或收集,但可能更喜欢不修改原始多媒体内容项。相反地,他们将会提供链接到原始项并为了相关的呈现而与这些项一起传送的另外的材料。同需要随后的计算机交互相比,这两种用户组也可更喜欢直接利用数字照相机执行这些任务(如果该选项可用的话)。结果,需要一种经各种计算机站点和社交网络容易地自动操纵并分享照片、视频和其它内容的照相机内工具。

【发明内容】

[0008]本文公开并要求保护一种用于自动操纵并分享多媒体内容项的系统、方法和计算机程序产品。示例性实施例获取多媒体内容项,随后呈现图形用户界面,通过该图形用户界面,用户可定义与多媒体内容项相关的信息。多媒体内容项和相关的项信息随后被传送到选择的目的地,由此保留相关的项信息。如本领域中可知,多媒体内容项可包括文本文件、照片、视频、音频文件、HTML文件、混合媒体呈现、PDF文档、可执行程序文件、数据库文件或其它内容项及其组合。如本领域中可知,可从照相机、电话、扫描仪、存储装置、电子邮件、网络、计算机或其它内容源输入或获取多媒体内容项。
[0009]实施例或人类用户可通过添加字幕、日期和注释或者通过修剪多媒体内容项、减小多媒体内容项的文件大小、减小视频或呈现类型项的持续时间来编辑原始多媒体内容项。实施例或人类用户还可添加元数据或者指定形成多媒体内容项的收集。添加元数据包括:保留原始多媒体内容项,但提供在呈现期间管理它的修改的另外的信息;如前所述,这种修改可包括添加字幕、日期和注释以及把名字添加到具有自动识别的脸部的图像。收集的形成可包括:选择特定多媒体内容项,确定连接顺序,设置传送约束和定义目的地约束。
[0010]实施例可通过图标、缩略图或收集记号在图形用户界面中表示多媒体内容项和相关的项信息。图形用户界面可被实现在触摸屏装置、照相机或计算机上,触摸屏装置、照相机或计算机中的每一个可连接到网络。图形用户界面可包括功能特定区域,诸如主台、过滤区域、收集集结区域、用户引导区域、持久上下文敏感动作按钮和具有目的地容器的分享坞。
[0011]多媒体内容项或收集和相关的项信息的传送包括:把多媒体内容项或收集记号移动到图形用户界面上的目的地容器中。目的地容器可通过包括具有名字或标志的标签而由用户容易地识别。根据用户指定的传送约束,传送可以是立即的或被延迟预定时间或直至实现连接。指定的目的地可包括:公共站点或私人站点、电子邮箱账户、社交联网站点、内容发布站点、互换服务器和档案。
[0012]在一个实施例中,目的地是互换服务器,互换服务器自动地管理向具有其自己的目的地约束的另外的目的地的另外的传送。以这种方式,给定的多媒体内容管理工具能够把传送细节的管理留给互换服务器,互换服务器可根据变化的目的地约束动态地更新它的操作。在另一实施例中,用于实现图形用户界面的计算机可执行程序指令可被从第一计算装置传送到第二计算装置。以这种方式,多媒体内容和多媒体内容管理工具可因此都是便携式的。
[0013]如以下更全面所述,公开的实施例的设备和处理允许多媒体内容项的自动管理和分享。考虑到详细描述和作为例子表示各种实施例的下面的附图,本文公开的设备和方法的另外的方面、目的、所希望的特征和优点将会被更好地理解并且对于本领域技术人员而言变得清楚。然而,应该明确地理解,附图仅用于说明的目的,而非旨在用作要求保护的发明的限制的定义。
【专利附图】

【附图说明】
[0014]图1A和IB描述实施例的基于数字照相机的实现方式;
[0015]图2描述根据实施例的图形用户界面;
[0016]图3描述根据实施例把几个多媒体内容项集结成收集;
[0017]图4描述根据实施例的包括脸部识别的图形用户界面;
[0018]图5描述根据实施例的包括视频管理的图形用户界面;
[0019]图6描述实施例的流程图。
[0020]【具体实施方式】显示[0021]现在参照图1A和1B,显示本发明的实施例的基于数字照相机的实现方式。该实现方式也可在另一触摸屏装置(诸如,智能电话)上,或者可在计算机(未示出)上。实施例的硬件部分也可联网。
[0022]如图1A中所示,数字照相机10包括显示器102,显示器102显示捕捉的图像以及叠加的图标和用户提供的标签104。该标签是在显示期间与图像结合的软件标记,但捕捉的图像文件自身可被编辑以包括该标签或者自身不可被编辑以包括该标签。软件标记因此是可与内容项链接并作为元数据一起传送的与内容项相关的信息的例子。照相机还具有用于分孚106和丢弃108图像或视频的图标。
[0023]如图1B中所示,在选择分享图标时,呈现用于分享的图形用户界面110。复选框112可被单个地选择以使内容分享到特定目的地114,包括社交联网站点/服务(例如,YouTube?、Facebook?、PicasaTM)或已在以前定义的电子邮件账户(例如,爷爷、家人、朋友、John)。这些目的地可由具有名字、缩略图和标志的标签识别,如图中所示。
[0024]另外,解释性电影(未示出)能够在照相机通电时被播放以帮助用户理解照相机的特征。通电应该优选地发生在小于一秒内以实现快速图像获取。在由照相机的制造商制造的不同产品之间使用共同的外观和感觉也将会帮助减少用户困惑。例如,照相机可以是Sony? Bloggie Touch? 产品。
[0025]现在参照图2,显示计算机上的根据实施例的图形用户界面200。这个实施例比图1A和IB中显示的实施例复杂,并且它能够同时处理多个多媒体内容项。这些内容项可包括例如:文本文件、照片、视频、音频文件、HTML文件、混合媒体呈现、PDF文档、可执行程序文件或数据库文件。例如,可从照相机、电话、扫描仪、存储装置、电子邮件、网络或计算机输入或获取内容项。
[0026]该图形用户界面具有将会在随后讨论的几个特征。与常规图形用户界面不同,既不存在与常规定点装置一起使用的传统菜单条也不存在文件夹,因为这个界面可与触摸屏装置一起使用。撤销按钮202允许撤销动作,这对于web浏览器的用户而言是很熟悉的。还可实现重做按钮(未示出)。搜索条204接受来自用户的搜索项以例如通过搜索元数据来帮助识别相关的多媒体内容项。观看条206中的观看选择按钮使用户能够一次一个、一次两个、作为列表或作为缩略图的网格观看多媒体内容项。滑动条208使用户在呈现的项中进行导航。
[0027]该图形用户界面还包括功能特定区域,功能特定区域包括主台210、过滤区域212、收集集结区域214、用户引导区域216、持久上下文敏感动作按钮218和具有目的地容器的分享坞220。主台是显示并布置代表多媒体内容项的图标或缩略图以便观看和操纵的主要中央显示区域。例如,通过直接获取或从存储器或连接的或联网的装置导入来使多媒体内容项进入主台中。
[0028]提供帮助图标222以触发在用户引导区域(也称为“语音”区域)中的用户指令的呈现。语音区域提供关于如何操作、什么选项当前可用(例如,显示或编辑元数据)的重要信息和有帮助的提示,并提供模式对话框或向导以引导用户。主台能够根据“语音”区域动作而被调整尺寸,即语音区域能够根据需要临时占据更大的显示空间。过滤区域包括几个能够应用于主台中的内容项的过滤标签,因此用户能够识别满足所希望的过滤准则的那些项,诸如例如“最后观看”或“最后导入”或“观看垃圾箱”。还可基于这些内容项的元数据内容选择内容项。
[0029]提供持久上下文敏感动作按钮以向用户指示什么基本动作可用。这些动作存在于例如界面的底部并且是上下文敏感的,即它们基于用户动作而改变以表示当前可操作的命令。在这个示例性实施例中,具有目的地容器的分享坞被显示在界面的顶部。目的地容器是代表可存储多媒体内容项的文件夹的可容易访问的图标。容器上可具有包括名字或标志的标签以便于用户识别对应的目的地。
[0030]例如通过拖放而放置在容器中的项或项的收集被排队以便分享到选择的目的地,因此用户能够看见过去或未决的传送。目的地可包括例如公共或私人站点、电子邮箱账户、社交联网站点、内容发布站点、互换服务器和档案。到目的地的传送可立即发生,在与计算机或其它装置连接时发生,在用户指定的延迟之后发生,响应于用户命令而发生,或者响应于满足其它预定传送条件而发生。用户能够通过选择“稍后分享”按钮(未示出)来简单地把待传送的项存储在输出缓冲器中。
[0031]现在参照图3,显示根据实施例把几个多媒体内容项300集结成收集(或“分组”302)。用户能够选择在主台中描述的一个或多个项,并把它或它们移动到收集集结(或“粘贴”)区域以便与其它项集结成收集(也称为相簿或卷)。通过在常规界面中的选择期间按下控制按钮或者触摸屏界面中的等同的功能命令,可选择多个项。这些项能够随后被拖放至合适位置作为收集的添加项。一旦收集完成,它能够被拖放到目的地容器中以排队传送。
[0032]现在参照图4,显示根据实施例的包括脸部识别的图形用户界面400。多媒体内容项可经受脸部识别处理,以便在图像或视频中检测到的人能够自动地在与该项关联的元数据中被标出。实施例可确定一些项具有以前未识别的人402,并且可选择性地向用户提示这个人的名字404。包含未识别的人的项406可在界面中被突出显示。
[0033]在这个实施例中还显示,图形用户界面还提供这样的特征:根据该特征,能够更清楚地定义多媒体内容项之间的关系。如果用户在主台中在另一个项410之后选择一个项408,则界面能够突出显示每个选择的项并通过线来连接它们,形成用作收集记号(collection token) 412的持久线框或星座。记号是项之间的关系的视觉描述,即它们被分组并处于与它们被分配到收集的次序对应的呈现序列中。这个概念类似于在绳上串珠子。记号能够随后在单个项被操纵时被操纵,即在准备好传送时被注解并拖拽到目的地容器。用户能够因此同时以相同方式把收集分享到任何组。这在很大程度上简化了操纵收集并把收集分享到各种目的地的处理。
[0034]每个目的地可具有它自己的分享方案,这些分享方案可能令人困惑并需要大量的用户参与。为了解决这个问题,实施例可包括互换服务器,互换服务器自动地管理向具有其自己的目的地约束的另外的目的地的另外的传送。以这种方式,给定的多媒体内容管理工具能够把传送细节的管理留给互换服务器,互换服务器可根据变化的目的地约束动态地更
新它的操作。互换服务器可包括Sony? Personal Space?产品。
[0035]通过使用共同接口与互换服务器通信,实施例能够从那里脱离约束管理和发布处理。社交联网站点和web发布服务例行地改变它们的约束,但希望避免对具有特定界面的一个人的数字照相机的手工更新,因此照相机不会变得过时。互换服务器还能够按照国家或者按照服务的受欢迎程度改变或打开/关闭服务。[0036]在另一实施例中,用于实现图形用户界面的计算机可执行程序指令可被从第一计算装置传送到第二计算装置。多媒体内容和多媒体内容管理工具可因此都被一起传送。
[0037]现在参照图5,显示根据实施例的包括视频管理的图形用户界面500。用户已选择例如YouTube?作为所希望的(并因此突出显示)的六个视频的收集的目的地502。YouTube?具有限制上传的持续时间的目的地约束。实施例因此注意到:内容项太长,违反该约束。实施例可减小内容项的持续时间或文件大小以及添加用户指定的日期或其它注释或者修剪或进一步压缩内容项以满足目的地约束。
[0038]现在参照图6,显示实施例处理600的流程图。简要地讲,用户在步骤602中指示实施例获取或导入多媒体内容项。实施例可随后在步骤604中显示内容项。用户可随后在步骤606中根据需要对它们进行过滤。用户可在步骤608中编辑或注解内容项。实施例可在步骤610中为用户集结内容项的收集,然后在步骤612中把收集分配给目的地以便传送。实施例可随后在步骤614中根据指定传送收集。
[0039]如本文所使用,术语“一”或一个应该表示一个或超过一个。术语“多个”应该表示两个或超过两个。术语“另一”被定义为第二个或更多个。术语“包含”和/或“具有”是开放式的(例如,包括)。在整个本文件中对“一个实施例”、“某些实施例”、“实施例”或类似术语的提及表示结合实施例描述的特定特征、结构或特性被包括在至少一个实施例中。因此,在整个本说明书的各种地方的这种词语的出现不必全部表示相同的实施例。另外,所述特定特征、结构或特性可非限制性地在一个或多个实施例上以任何合适的方式组合。如本文所使用,术语“或者”应该被解释为是包括性的或者表示任何一种或任何组合。因此,“A、B或者C”表示“下面的任何一种:A ;B ;C ;A和B ;A和C ;B和C ;A,B和C”。仅当元件、功能、步骤或动作的组合以某种方式固有地相互排斥时,将会发生这种定义的例外。
[0040]根据计算机编程领域技术人员的实践,以下参照由计算机系统或类似的电子系统执行的操作描述实施例。这种操作有时被称为计算机执行。将会理解,象征性地表示的操作包括由处理器(诸如,中央处理单元)执行的表示数据比特的电信号的操纵和在存储器位置(诸如,在系统存储器中)的数据比特的保持以及信号的其它处理。保持数据比特的存储器位置是具有与数据比特对应的特定电、磁、光或有机性质的物理位置。
[0041]当以软件实现时,各个实施例的元件本质上是用于执行必要的任务的代码段。非暂态代码段可被存储在处理器可读介质或计算机可读介质中,处理器可读介质或计算机可读介质可包括可存储或传送信息的任何介质。这种介质的例子包括电子电路、半导体存储装置、只读存储器(ROM)、闪存或其它非易失性存储器、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路等。用户输入可包括键盘、鼠标、触摸屏、语音命令输入等的任何组合。用户输入可类似地用于把在用户的计算装置上执行的浏览器应用引导至可从其访问计算资源的一个或多个网络资源(诸如,网页)。
[0042]尽管已结合特定例子和各种实施例描述了本发明,但本领域技术人员应该容易理解,在不脱离如以下所要求保护的本发明的精神和范围的情况下,可实现本文描述的自动多媒体内容项管理和分享工具的许多修改和变化。因此,应该清楚地理解,这种应用仅作为例子而被提出,而非用作对以下要求保护的本发明的范围的限制。描述旨在覆盖落在本发明所属领域内的已知和惯常实践内的通常遵循本发明的原理并包括相对于本发明的这种差异的本发明的任何变型、使用或变化。
【权利要求】
1.一种计算机实现的自动操纵并分享多媒体内容项的方法,包括: 获取多媒体内容项; 由图形用户界面的用户定义相关的项信息;以及 把多媒体内容项和相关的项信息传送到选择的目的地,由此保留相关的项信息。
2.如权利要求1所述的方法,其中所述多媒体内容项包括以下至少一种:文本文件、照片、视频、音频文件、HTML文件、混合媒体呈现、PDF文档、可执行程序文件以及数据库文件。
3.如权利要求1所述的方法,其中从照相机、电话、扫描仪、存储装置、电子邮件、网络和计算机中的至少一种获取多媒体内容项。
4.如权利要求1所述的方法,还包括:通过添加字幕、添加日期、添加注释、修剪多媒体内容项、减小多媒体内容项的文件大小和减小多媒体内容项的持续时间中的至少一种来编辑多媒体内容项。
5.如权利要求1所述的方法,其中所述定义包括以下至少一种:添加元数据和指定多媒体内容项的收集的形成。
6.如权利要求5所述的方法,其中添加元数据包括以下至少一种:添加字幕、添加日期、添加注释、把名字添加到自动识别的脸。
7.如权利要求5所述的方法,其中指定所述形成包括以下至少一种:选择特定多媒体内容项,确定连接顺序,设置传送约束和定义目的地约束。
8.如权利要求1所述的方法,其中所述图形用户界面把多媒体内容项描绘为图标和缩略图中的至少一种。
9.如权利要求1所述的方法,其中由收集记号在图形用户界面中表示多媒体内容项和相关的项信息。
10.如权利要求1所述的方法,其中所述图形用户界面被实现在以下至少一种上:触摸屏装置、未联网的照相机、联网的照相机、未联网的计算机和联网的计算机。
11.如权利要求1所述的方法,其中所述图形用户界面包括功能特定区域,该功能特定区域包括以下至少一种:主台、过滤区域、收集集结区域、用户引导区域、持久上下文敏感动作按钮和具有目的地容器的分享坞。
12.如权利要求11所述的方法,其中所述目的地容器通过名字和标志中的至少一种识别。
13.如权利要求1所述的方法,其中所述传送包括:把多媒体内容项和收集记号中的至少一种移动到目的地容器中,并选择性地满足用户定义的传送约束,所述用户定义的传送约束定义基于时间的触发和基于连接的触发中的至少一种。
14.如权利要求1所述的方法,其中所述目的地包括以下至少一种:公共站点、私人站点、电子邮箱账户、社交联网站点、内容发布站点、互换服务器和档案。
15.如权利要求1所述的方法,其中所述目的地是互换服务器,互换服务器自动地管理向另外的目的地的另外的传送,该另外的传送具有其自己的目的地约束。
16.如权利要求1所述的方法,还包括:把用于实现图形用户界面的计算机可执行程序指令从第一计算装置传送到第二计算装置。
17.一种用于自动操纵并分享多媒体内容项的系统,包括:计算装置,获取输入多媒体内容项;图形用户界面,用于由用户定义相关的项信息;以及
网络连接,用于把多媒体内容项和相关的项信息传送到选择的目的地,由此保留相关的项信息。
18.如权利要求17所述的系统,其中所述多媒体内容项包括以下至少一种:文本文件、照片、视频、音频文件、HTML文件、混合媒体呈现、PDF文档、可执行程序文件以及数据库文件。
19.如权利要求17所述的系统,其中从照相机、电话、扫描仪、存储装置、电子邮件、网络和计算机中的至少一种获取多媒体内容项。
20.如权利要求17所述的系统,其中通过添加字幕、添加日期、添加注释、修剪多媒体内容项、减小多媒体内容项的文件大小和减小多媒体内容项的持续时间中的至少一种来编辑多媒体内容项。
21.如权利要求17所述的系统,其中所述定义包括以下至少一种:添加元数据和指定多媒体内容项的收集的形成。
22.如权利要求21所述的系统,其中添加元数据包括以下至少一种:添加字幕、添加日期、添加注释、把名字添加到自动识别的脸。
23.如权利要求21所述的系统,其中指定所述形成包括以下至少一种:选择特定多媒体内容项,确定连接顺序,设置传送约束和定义目的地约束。
24.如权利要求17所述的系统,其中所述图形用户界面把多媒体内容项描绘为图标和缩略图中的至少一种。
25.如权利要求17所述的系统,其中由收集记号在图形用户界面中表示多媒体内容项和相关的项信息。
26.如权利要求17所述的系统,其中所述图形用户界面被实现在以下至少一种上:触摸屏装置、未联网的照相机、联网的照相机、未联网的计算机和联网的计算机。
27.如权利要求17所述的系统,其中所述图形用户界面包括功能特定区域,该功能特定区域包括以下至少一种:主台、过滤区域、收集集结区域、用户引导区域、持久上下文敏感动作按钮和具有目的地容器的分享坞。
28.如权利要求27所述的系统,其中所述目的地容器通过名字和标志中的至少一种识别。
29.如权利要求17所述的系统,其中所述传送包括:把多媒体内容项和收集记号中的至少一种移动到目的地容器中,并选择性地满足用户定义的传送约束,所述用户定义的传送约束定义基于时间的触发和基于连接的触发中的至少一种。
30.如权利要求17所述的系统,其中所述目的地包括以下至少一种:公共站点、私人站点、电子邮箱账户、社交联网站点、内容发布站点、互换服务器和档案。
31.如权利要求17所述的系统,其中所述目的地是互换服务器,互换服务器自动地管理向另外的目的地的另外的传送,所述另外的传送具有其自己的目的地约束。
32.如权利要求17所述的系统,还包括:把用于实现图形用户界面的计算机可执行程序指令从第一计算装置传送到第二计算装置。
33.一种包括计算机可读介质的计算机程序产品,该计算机可读介质在其上有形地具体化为非暂态计算机可执行程序指令以使计算装置自动操纵并分享多媒体内容项,该指令包括: 获取多媒体内容项; 由图形用户界面的用户定义相关的项信息;以及 把多媒体内容项和相关的项信息传送到选择的目的地,由此保留相关的项信息。
34.一种用于自动操纵并分享多媒体内容项的系统,包括: 用于获取多媒体内容项的装置; 用于由图形用户界面的用户定义相关的项信息的装置;以及 用于把多媒体内容项和相关的项信息传送到选择的目的地,由此保留相关的项信息的 装直。
【文档编号】G11B27/00GK103518236SQ201180038734
【公开日】2014年1月15日 申请日期:2011年8月4日 优先权日:2010年8月13日
【发明者】A·S·布莱纳尔, V·纳卡亚玛, A·安德森, C·瑞斯 申请人:索尼公司, 索尼网络娱乐国际有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1