用于给内容作注解的设备和方法

文档序号:6454764阅读:129来源:国知局
专利名称:用于给内容作注解的设备和方法
技术领域
本发明涉及一种用于给内容作注解的设备。 本发明还涉及一种用于给内容作注解的方法。 本发明还涉及一种程序单元。 本发明还涉及一种计算机可读介质。
背景技术
当前存在着不断将电子设备小型化的趋势,由此导致开发出能够具有 更强处理能力的设备,以使这些设备更为智能。此外,更进一步的技术集 成的趋势将会允许设备将越多越多的技术(例如无线联网)和传感器能力 集成在负担得起的产品中。这两种趋势的组合会使设备成为智能设备,并 且允许设备感知上下文以及以智能方式来与网络(自组织、固定或其他方 式)中的其他此类设备进行交互。这类设备既可以是便携设备,也可以是 固定设备。便携和固定设备制造方往往会在形状和功能方面将其设备产品 与市场上的其他此类产品区分开来。这样做会给在家中和在活动中的用户 带来更多这样的设备。
此类强大设备的一个用途是存储和/或再现个人内容。在使用此类设 备的过程中,诸如自行创建的照片和视频之类的个人内容元数据对于用户 例如能够容易地组织、浏览和找回其内容是重要的。对用户来说,以手动 方式给这种内容作注解是一个很艰苦的任务。由于在商业上以及由个人产 生的内容量不断增长,因此,情况尤其如此。这样一来,要想恰当地给所 有新创建的内容作注解几乎是不可能的。由此有必要具有那些能使用户免 于这类费力劳动并使其能够开始欣赏内容的解决方案。
虽然目前开发了很多使用内容分析或其他手段的解决方案来帮助用 户自动给内容作注解。但是没有一种解决方案是令人满意的。在考虑个人
内容的时候,下列类型的元数据一般被认为是重要的 为什么创建内容?"事件"是什么,例如暑假 谁在所创建的图片或视频中出现?例如我的妻子 何时创建的内容?例如夏天七月
5在哪里创建的内容?例如在意大利
此外,诸如"快乐"、"海滩"和"树木"之类的与内容中存在的概念 和对象相关联的元数据的类型对用户来说同样是重要的。
关于如何辨别谁在图片和视频中出现的可用文献是很多的;相关实例
可以参见Marc Davis、 Michael Smith、 JohnCarmy、 Nathan Good、 Simon King和Rajkumar Janakiraman于2005年发表于Proceedings of 13th Annual ACM International Conference on Multimedia (MM 2005) in Singapore, ACM Press,第483-486页的论文"Towards Context- Aware Face Recognitions该i仑文尤其针对的是在^f吏用移动电话创建的个人图 片中实施的上下文感知脸部识别。另一个实例是在AraV. Nefian、Monson 11. Hayes III于1999发表的论文"Face recognition using an Embedded 腹M"中^是供的,该实例是一种面部识别方法。
要想确定在创建时间内容项目是在哪里创建的,众所周知的是可以使 用全球定位系统(GPS)。此外还开发了这样的系统,其中所述系统尝试分 析所创建的内容,以便推断出所述内容何处捕捉该地点。例如,在Risto Sarvas 、 Erick Herrarte 、 Anita Wilhelm 和 Marc Davis 发表于 "Proceedings of the Second International Conference on Mobile Systems, Applications, and Services (MobiSys2004) in Boston, Massachusetts, ACM Press,第36—48页,2004年,,的论文"Metadata Creation System for Mobile Images"中,所创建的图像可以上传到服 务器,以便与其他图像相比较。从这种分析中可以得出,例如,图像是在 美国的加州大学伯克利分校校园的"钟楼"塔上获取的。
此外,还有很多用于检测概念和对象的成果,相关实例可以参见下列 文南犬Erik Murphy-Chutorianl、 Sarah Aboutalib、 Jochen Triesch于 发表于"Cognitive Science Online第3. 2巻第1—14页,2005年"的论 文"Analys is of a Biological ly-Inspired Sys tem f or Real-t ime Object Recognition"以及I. Cohen、 N. Sebe、 A. Garg、 M.S. Lew、 T. S. Huang 于发表于 "IEEE International Conference on Multimedia and Expo (ICME'02)第II巻第121-124页,Lausanne, Switzerland, 2002年8 月,,的i仓文"Facial Expression Recognition from Video Sequences"。
但是我们发现,即使在内容分析过程中执行所有这些工作,内容分析 也不可能提供100%精确的注解结果。虽然也有些成果引入了用户反馈和 学习算法,但是仍旧存在着需要用户提供很多反馈的问题。本发明人发现了这个问题,由此设计了本发明。 发明概述
本发明旨在提高内容注解质量。
相应地,在本发明的第一个方面中提供了一种用于给内容作注解的设
备,该设备包括用于分析内容并且根据内容分析来产生第 一输出的装置, 用于产生注解请求的装置,用于通信的装置,所述用于通信的装置适于将 注解请求分发到至少一个其他设备和接收来自所述至少一个其他设备的 注解结果,以及通过将第一输出和所述注解结果相结合来提供改进的输出
的装置。
该设备可以在本地使用内容分析器来分析内容,但是毫无疑问,该结 果不会好于可以使用的最佳算法。尽管如此,通过请求至少一个另外的设 备也执行内容分析,可以确定第二独立注解结果。通过将在所述设备上本 地执行的内容分析的结果与至少 一个另外的设备执行并返回的独立的内 容分析结果相结合,可以将个别和独立的结果组合在一起,以便提供组合 和改进的输出。
根据本发明的第二个方面,提供了一种用于给内容作注解的方法,该 方法包括以下方法步骤分析内容并且根据所述内容分析来产生第 一输 出,产生注解请求,将注解请求传递到至少一个其他设备,以及从所述至 少一个其他设备接收注解结果,以及将第一输出与所述注解结果相结合,
以便提供改进的输出。
根据本发明的第三个方面,提供了一种用于给内容作注解的系统,该 系统包括用于给内容作注解的多个设备,所述多个设备中的每一个设备都 包括用于分析内容并且根据内容分析来产生第一输出的装置,用于产生 注解请求的装置,用于通信的装置,所述用于通信的装置适于将注解请求 分发到至少一个其他设备,并且接收来自所述至少一个其他设备的注解结 果,以及通过将第一输出和所述注解结果相结合来提供改进的输出的装 置。
根据本发明的第四个方面,提供了 一种可以直接加载到可编程设备的 存储器中的程序单元,其包括当在该设备上运行所述程序单元时执行下列 方法步骤的软件代码部分分析所要注解的内容,并且根据所述内容分析 来产生第一输出,产生注解请求,将注解请求传递到至少一个其他设备, 从所述至少一个其他设备接收注解结果,以及将第 一输出与所述注解结果相结合,以便提供改进的输出。
根据本发明的第五个方面,提供了 一种可以直接加载到可编程设备的 存储器中的计算机可读介质,其包括用于在该设备上运行所述代码部分时
执行下列方法步骤的软件代码部分分析所要注解的内容并且根据所述内
容分析来产生第一输出,产生注解请求,将注解请求传递到至少一个其他 设备,从所述至少一个其他设备接收注解结果,以及将第一输出与所述注 解结果相结合,以便提供改进的输出。
在一个实施例中可以提供用户接口 ,该用户接口可以适于向用户呈现 注解请求,并且从用户那里接收关于注解请求的反馈,用于组合的装置进 一步组合来自用户的反馈来提供改进的输出。对于所述改进输出提供的注 解质量的改进被判定为仍旧不能满足需要的情况,这样做提供了 一种后退
(fall back)方案。
在另一个实施例中,用于通信的装置可以适于接收来自另外的设备的 外部注解请求,并且将来自用户的反馈传送到所述另外的设备。即使网络 中的另外的设备可能不具有用于请求来自用户自身的反馈的适当用户接 口能力,这也给出了 一个设备来为这些另外的设备提供请求和供应用户反 馈的服务。
在另一个实施例中,可以提供注解中心管理器,该注解中心管理器可 以包括包含用户的多个未解决注解请求的队列,以及用于从未解决注解请 求队列中选择某个选定的未解决注解请求的装置,其中该注解中心管理器 以可通信的方式耦合到用户接口 ,以便向用户接口传递所选择的未解决的 注解请求,以及接收来自用户接口的反馈。这样做允许收集注解请求并且 在恰当的时刻将其呈现给用户。
在另一个实施例中,注解中心管理器还可以包括用于确定废弃的未 解决注解请求的装置,所述废弃的未解决注解请求是被来自用户的反馈废 弃的未解决注解请求,以及用于从队列中删除废弃的未解决注解请求的装 置,并且其中用于通信的装置还适于将所述反馈传递到废弃的未解决注解 请求的发起方。这样做允许考虑来自用户的反馈对排队的注解请求进行分 析,根据来自用户的反馈而可能被废弃的注解请求可以从所述队列中删除 并且传递回到废弃注解请求的发起方。此外,这样做还排除了对废弃注解 请求进行应答的需要,由此减少了所需要的用户交互数量。
在一个实施例中,用于通信的装置还可以适于接收将另外的设备识别 为注解中心管理器的消息,将外部注解请求传送到所识别的注解中心管理器,以及从所识别的注解中心管理器接收来自用户的外部反馈,并且用于 组合的装置还可以组合来自用户的外部反馈,以便提供改进的输出。这样 做允许另外的设备代表所述设备来呈现和接收用户反馈,当所述另外的设 备具有更强的用户接口能力时,这样做是有用的。
在另一个实施例中,可以提供用于检测用户处于设备附近的装置,以 及用于根据所述用户位于设备附近的检测来将所述设备标识成设备网络 中的注解中心管理器的装置,并且用于通信的装置还可以适于接收来自设 备网络的外部注解请求。这样做允许将注解请求引导到用户的本地设备。 此外,这样做还允许快速和有效地收集来自用户的反馈。
在另一个实施例中,可以提供用于存储改进输出的装置。通过存储改 进的输出,允许与所述内容相关的元数据永久具有改进的质量。
在另 一个实施例中,用于组合的装置还可以包括置信等级确定单元, 该置信等级确定单元可以适于确定第一输出的第一置信等级,以及确定注 解结果的第二置信等级,该第一置信等级指示的是第一输出正确的置信 度,第二置信等级指示的是注解结果正确的置信度,并且其中用于组合的 装置可以适于根据第一置信等级和第二置信等级来进一步组合第一输出 和注解结果,以便提供改进的输出。即使在内容分析算法自身无法提供置 信等级的情况下,这样做也允许为每一 个内容分析结果确定一个置信等 级。
在另 一个实施例中,根据本发明的设备可以实现为包括下列各项的群
组中的至少一个机顶盒设备、数字录像设备、启用网络功能的设备、条 件访问系统、便携式音频播放器、便携式视频播放器、移动电话、DVD播 放器、CD播放器、基于硬盘的媒体播放器、因特网无线电设备、计算机、 电视、公共娱乐设备、记忆棒以及MP3播放器。但是,这些应用仅仅是例
示性的。
在另一个实施例中,注解请求可以呈现给用户,并且可以从用户那里 接收对注解请求的反馈,以及组合的方法步骤还可以组合来自用户的反 馈,以便提供改进的输出。对于所述改进输出所提供的注解质量的改进被 判定成仍旧不能满足需要的情况,这样做提供了 一种后退方案。
在一个实施例中,可以从另外的设备接收外部注解请求,并且来自用 户的反馈可以传送到所述另外的设备。即使网络中的另外的设备不具有用 于请求来自用户自身的反馈的适当用户接口能力,也可以为这些另外的设 备提供一种请求和供应用户反馈的服务。
9根据本发明所需要的数据处理可以由计算机程序、也就是由软件来实 现,或者可以通过使用一个或多个专用电子优化电路、也就是以硬件来实 现,还可以采用混合形式、也就是借助软件组件和硬件组件来实现。该数
从以下描述的实施例例示中可以清楚了解上文定义的方面以及本发 明的其他方面,并且这些方面是参考这些实施例例示来进行说明的。
附图简述
在下文中将会参考实施例例示来对本发明进行更详细的描述,但是本 发明并不局限于这些实施例例示。


图1示出了一种根据本发明实施例的设备的系统图示;
图2更详细地示出了一种根据本发明实施例的设备;
图3示出了本发明的一个实施例,其中确定内容分析结果的置信等
级;
图4示出了本发明的一个实施例,其中根据内容分析结果的置信等级 来从用户那里请求反馈;
图5示出了本发明的一个实施例,其中根据内容分析结果的置信等级 来从另外的设备请求注解;
图6示出了本发明的一个实施例,其中对注解请求排队以及根据来自 用户的反馈而可以从所述队列中删除废弃的注解请求;
图7示出了本发明的一个实施例,其中通过检测用户与设备的邻近度 而使所述设备可以向另外的设备告知它可以接收需要用户反馈的注解请
求;
图8示出了一个在本发明实施例中使用的流程图; 图9示出了在本发明实施例中使用的第二流程图;以及 图IO示出了在本发明实施例中使用的第三流程图。 这些附图是以示意性方式描绘的,它们并不具有真实比例,并且在不 同的图中,相同的参考数字指示的是相应的单元。对本领域技术人员来说, 很明显,在不脱离本发明真实构思的情况下,本发明的可替换但是等价的 实施例是可能的,并且本发明的范围只受权利要求的限制。
发明详述
图1示出了本发明的一个实施例。在这里提供了一种可以驻留在网络180中的设备IOO。该网络180可以是本地网络或因特网。另外的设备165 同样也可以驻留在该网络中。设备100可以是自治设备、使设备100能够 在没有其他设备的显式控制的情况下工作,以及能够对正在访问和使用设 备100的功能和数据的对象进行控制。对需要在不同环境中工作的便携设 备来说,这是特别重要的,所述环境中的某些可能位于用户自身(家庭/ 私有)网络之外。设备100可以包括在现今设备中通常应用的用于执行机 器可读代码的处理器120。此外,设备100还可以包括用于互连设备100 内部的系统组件的总线140。例如,处理器120可以使用存储器IIO来运 行代码和/或存储数据。该设备还可以包括用于通信的装置,例如网络接 口 130,其允许设备100与所述另另外的设备165或其他设备进行通信。
网络接口 13 0可以是诸如有线以太网接口之类的网络接口 ,或者实际 上它也可以是无线的。举个例子,网络接口 130可以是WiFi、蓝牙、移 动电话或其他适当的网络接口。在这里可以提供显示器160,以便向用户 192再现内容。用户192可以卩吏用遥控器191以及用户4妻口 190来与i殳备 IOO进行交互。当然,该用户接口 190同样可以使用显示器160。除了遥 控器之外,其他形式的用户交互同样可以是适用的,例如键盘、触摸屏、 鼠标或其他定点设备(point device )。在这里还可以提供存储装置170, 以便存储内容、元数据以及任何处理步骤的中间和/或最终结果。该存储 装置可以是易失或非易失的,并且举例来说,它可以是SRAM、DRAM或FLASH 存储器、硬盘驱动器或光学驱动器。应该指出的是,内容可以从存储装置 170中存取,但是该内容同样可以经由网络接口 130来存取。在这种情况 下,存储装置17G完全是可选的。
在这里可以提供内容分析器150,以便分析可由所述设备在本地或是 经由网络180访问的内容。内容的分析可以提供更多元数据或是具有改进 的质量的元数据。这一点在考虑个人内容的时候尤为关联,其中在考虑个 人内容的时候,下列类型的元数据一般被认为是重要的
为什么创建内容?"事件"是什么,例如暑假
谁在所创建的图片或视频中出现?例如我的妻子
何时创建的内容?例如夏天七月
在哪里创建的内容?例如在意大利
用户192还会评价与内容内部包含的高级概念和对象相关的元数据, 举例来说,发现有关"快乐"、"海滩"和"树木"的概念对用户来说是重 要的。正如已经指出的那样,当涉及到辨别谁在图片和视频中出现时,可
ii用的文献是很多的。举个例子,在2005年发表于Proceedings of 13th Annual ACM International Conference on Multimedia (MM 2005) in Singapore, ACM Press, 483-486的论文"Towards Context-Aware Face Recognition"特别针对的是在使用移动电话创建的个人图片中实施的感 知上下文的脸部识别。另一个实例是在AraV. Nef ian和Monson H. Hayes III于1999年发表的论文"Face recognition using an Embedded誦" 中乂>开的,该实例是一种面部识别方法。
其他重要的元数据方面涉及确定内容项在创建时间是在哪里创建的, 众所周知的是可以使用全球定位系统(GPS)。此外,还开发了这样的系统, 该系统尝试分析所创建的内容,以便推断出该内容何处获取该地点。例如, 在2004年发表于Proceedings of the Second International Conference on Mobile Systems, Applications, and Services (MobiSys2004) in Boston, Massachusetts, ACM Press, 36-48的i仓文"Metadata Creation System for Mobile Images"中,所创建的图像可以上传到服务器,以便 与其他图像相比较。从这种分析中可以得出,例如,图像是在美国的加州 大学伯克利分校校园的"钟楼"塔上拍摄的。
此外,还有很多用于检测概念和对象的成果,相关实例可以参见下列 文南大Erik Murphy-Chutorianl、 Sarah Aboutalib, Jochen Triesch于 2005年发表于Cognitive Science Online第3.2巻第1-14页的论文 "Analysis of a Biologically-Inspired System for Real-time Object Recognition" 以及I. Cohen、 N. Sebe、 A. Garg、 M.S. Lew、 T. S. Huang 发表于 "IEEE International Conference on Multimedia and Expo (ICME12)第II巻第121-124页,Lausanne, Switzerland, 2002年8 月,,的论文"Facial Expression Recognition from Video Sequences,,。 所有这些内容分析形式都是有用的,但在单独使用这些内容分析时, 其可靠性并不满足需要。由此还尝试了引入用户反馈。这种反馈可以用于 在内容分析方法结果的置信度为低的情况下产生注解,并且可以用于改善 内容分析算法(在线学习)。相关实例可以参见"Semantic Learning and
http: //www. research, ibm. com/slam/。 这些已^口的解决方案大多凄1关注 的是如何使用反馈来实施内容分析算法的在线学习。
一种可供用户让他们的内容被注解的完全不同的方法是通过"协作标 记",其相关实例可以参见Scott A. Golder和Bernardo A. Hube簡n将
SLAM project,IBM Research200780016844. 发表于Journal of Information Science (2006), Information Dynamics Lab, HP Labs.的i仓文 "The Structure of Collaborative Tagging Systems"。在该解决方案中,用户可以为上传到网站的任何内容添加注解。
在下文中,注解不但意味着创建元数据,而且还意味着创建用户添加 的信息。可选地,可以保存注解来协助未来的浏览或搜索操作。
此外仍旧存在这样一种情况,那就是用户反馈只对向用户提出的显式 问题而言是可靠的,并且从用户响应中获取的任何推论都不是完全可靠 的。此外,由于处理平台即设备以及设备的不同能力的多种多样,因此, 任何单个内容分析算法的结果可被信任的程度将会受到限制。
在图2中更详细地显示了一个实施例,该实施例改进了来自内容分析 的输出的质量。使要作注解的内容210可供设备100使用。该内容210可 以是照片、音频、视频或某种其他数据形式。内容分析器150使用已知的 算法来对内容210进行分析,该算法例如是面部检测算法。该内容分析器 150利用内容分析步骤的结果产生第一输出205。所述第一输出205可以 只包括注解或注解以及注解中的置信度量度。实际注解以及关于置信度的 任何量度都是特定于每一个内容分析算法的,由此特别是置信量度的某种 标准化形式会是有用的。举个例子,第一输出205可以包括面部数量、面 部代表的人物等等。很多其他的内容分析算法同样是可行的,这些算法关 注的是颜色等视频特征或是音量、拍子等音频特征。
第一输出205被传递到注解管理器220。该注解管理器220可以包括 注解请求生成器230以及组合器240。注解请求生成器230接收第一输出 205,并且根据第一输出205来产生注解请求215。可选地,注解请求生 成器230可以只在注解请求215中提供一个连至内容210的链接,由此另 外的设备165可以从头分析内容210。注解请求215在内部被传递到网络 接口 130,从中其在网络180的内部被分发到其他设备,例如另外的设备 165。
在本实例中,另外的设备165根据注解请求215来分析内容210。该 注解请求215可以是要求从头分析内容210的一般请求,或者它可以是要 求分析内容210的某个方面的特定请求。例如,特定请求可以是要求只对 在照片中检测到的面部进行分析的请求。在执行了分析之后,另外的设备 165将会使用注解结果225来答复注解请求215。独立的注解结果可以由 不同的内容分析算法来执行,或者可以根据不同的背景知识来分析。该注 解结果225可以只包括注解元数据,或者可选地,它还可以在注解元数据
13中包含置信度量度。
设备100经由网络接口 130接收来自另外的设备165的注解结果225。 组合器240接收注解结果225,并且将其与第一输出205相结合。该组合 器240对两个独立结果进行分析,并且判定其中一个或两个结果中的质量 或置信度,以便提供改进的输出235。所述改进的输出235可以是第一输 出205与注解结果225的任何已知组合或函数。
在图3所示的另一个实施例中,注解管理器220可以包括置信等级确 定单元310。该置信等级确定单元310被显示成拦截来自内容分析器150 的第一输出205。为了清楚起见,应该指出的是,内容分析器150可以是 硬件组件或是在处理器120上运行的软件组件。如果内容分析器150没有 在第一输出205中提供任何置信度量度,那么置信等级确定单元310可以 使用历史信息来估计置信等级。根据第一输出205中的置信等级,置信等 级确定单元310可以决定触发注解请求生成器230,以便产生注解请求 215,或者将第一输出205经由切换装置320直接传递给改进输出235。 如果使用注解请求215来选择路径,那么可以正常处理注解请求215,并 且可以在被设置在较低位置的时候将其经由组合器240以及切换装置320 传递给改进输出235。
在图4中还显示了另一个实施例。在图4中,注解管理器220可以包 括能够从网络180上的设备接收注解请求的注解请求接收机410。该注解 请求接收机410能够使用内容分析器150来发起关于内容210的内容分 析。如图4所示,所述内容210可以位于远端。所述内容210也可以存储 在另外的设备165上。注解管理器220还可以包括注解问题生成器420。 该注解问题生成器420可以以可通信的方式耦合到置信等级确定单元 310,并且由置信等级确定单元310执行的分析的结果来触发,以便为用 户192产生问题。显示器160和用户接口 190可以用于这个目的。用户 192可以提供反馈415。根据反馈415,注解问题生成器420产生具有高 置信等级的注解结果225。该注解结果225可以传递回到注解请求225的 发起方。该通信可以由网络接口 130来执行,尽管在图4中并未对此进行 显示。
在图5中显示了这样一个实施例,其中注解问题可以经由网络接口 130传递到包含注解中心管理器520的远端设备510。该注解中心管理器 520以与图4所描述方式相似的方式来向用户显示注解问题。该反々贵415 从远端设备510的注解中心管理器520经由网络180传递到设备100的注解问题生成器420。然后,注解问题生成器420产生注解结果225。同样, 注解结果225可以经由网络接口 130传递到其他设备。
在图6中显示了这样一个实施例,其中设备100可以充当网络180中 的注解中心管理器520。该注解中心管理器520可以包括注解请求接收机 410以及注解请求队列620。这样做允许收集注解请求,直至用户192预 备给出反馈。该注解请求队列620可以触发用户接口 190,以便直接请求 来自用户192的反馈。可替换地,注解请求队列620可以触发内容分析器 150,以便分析内容210。根据来自用户192的反馈415,废弃请求确定单 元630可以在考虑到了用户192提供的反馈415的情况下确定注解请求队 列62Q中的哪些请求现在是废弃的。举个例子,如果在分析了反馈415之 后现在可以以高置信度来辨别"John"的面部。其他任何涉及"John"的 面部的注解请求都不必转发给用户192。由此,需要的用户192的工作量 将会减少。
在图7中显示了作为注解中心管理器520工作的设备100的另一个实 施例。注解中心管理器520还可以包括用户邻近度4企测单元710。用户邻 近度检测单元710可以使用任何已知的手段来检测用户192处于设备100 附近。例如,用户邻近度检测单元710可以使用相机、热检测器等等。用 户邻近度4企测单元710还可以通过记录用户交互以及从这种交互发生时 起经过的时间来推断用户192的邻近度。举个例子,如果用户192正在^喿 作或者近期操作过设备IOO,那么设备100可以推断用户192很有可能位 于设备100的附近。然后,用户邻近度一企测单元71Q可以借助指示705来 向网络180中的其他设备通知其应该成为当前的中心注解中心管理器,并 且需要用户反馈的所有注解请求或问题都应该被引导到设备100。
在图8中显示了一个流程图,该流程图示出了一种用于在设备100的 处理器120上实现本发明实施例的方法。在步骤800,内容210被接收, 或者至少是使得可以访问。在步骤810,在本地使用内容分析算法来分析 内容210,并且产生第一输出205。在步骤820,注解请求215被产生, 并且在步骤830,该注解请求215被传递到另外的设备195。在步骤840, 注解结果225被从另外的设备195接收。在步骤850,第一输出225和注 解结果225被组合,以便提供改进的输出235。
在图9中显示了第二流程图,该流程图指示的是另一种用于在设备 100的处理器120上实现本发明实施例的方法。在步骤820之后,有两条 并行路径是可能的。第一路径包括如图8的文本中描述的方法步骤,即步骤830和840。第二路径在步骤910中向用户192呈现作为问题的注解请 求215。向用户192的呈现可以位于本地i殳备,例如i殳备100,或位于另 外的设备165之上。关于用户192的精确位置并不重要。但是,重要的是, 用户192在步骤920中提供反馈415。在步骤930,第一输出205、注解 结果225以及反馈415全都组合在一起,以便提供很高质量的注解作为改 进的输出235。
在图10中显示了第三流程图,该流程图指示的是另一种用于在设备 100的处理器120上实现本发明实施例的方法。在图10的实施例中,在 步骤1010,可以从远端设备接收外部注解请求。步骤910和步骤920与 图9中描述的那些步骤相同,但是它们作用于外部注解请求。同样,向用 户192的呈现可以位于设备IOO之类的本地设备,或是另外的设备165。 在步骤1020,反馈415可以被传递回到外部注解请求的发起方。这样做 允许将注解请求传送到接近用户192的位置。
总而言之,本发明公开了用于给内容作注解的方法和设备。该设备可 以包括用于分析内容并且根据内容分析来产生第一输出的装置,用于产 生注解请求的装置,用于通信的装置,所述用于通信的装置适于将注解请 求分发到至少一个其他设备和接收来自所述至少一个其他设备的注解结 果,以及通过将第一输出和注解结果相结合来提供改进的输出的装置。通 过组合来自不同设备的内容分析算法的多个独立结果,所述组合可能根据 背景不同的知识,为注解提供了更高质量的结果。
应该指出的是,上述实施例例证而不是限制了本发明,并且本领域技 术人员能够在不脱离所附权利要求限定的本发明范围的情况下设计出众 多可替换实施例。此外,所描述的任何实施例都包括隐含隐性特征,例如 电池或蓄电池之类的内部电流源。在权利要求中,放置在括号中的任何参 考符号都不应该被解释成是限制本发明。单词"包含"和"包括"等等并 不排除在任何权利要求或整个说明书中列举的元件或步骤之外还存在其 他的元件或步骤。关于元件的单数引用并不排除这样的元件的复数引用, 反之亦然。在枚举了若干装置的设备权利要求中,这其中的若干装置可以 由同一个硬件项来实现。仅仅某些措施是在互不相同的从属权利要求中列 举这个事实并不表明不能很有利地使用这些措施的组合。
1权利要求
1. 一种用于给内容作注解的设备(100),该设备包括用于分析内容并且根据内容分析来产生第一输出(205)的装置(150),用于产生注解请求(215)的装置(230),用于通信的装置(130),所述用于通信的装置适于将注解请求分发到至少一个其他设备(165)以及接收来自所述至少一个其他设备的注解结果(225);以及通过将第一输出和注解结果相结合来提供改进的输出(235)的装置(240)。
2. 权利要求1的设备,还包括适于向用户呈现注解请求并且从用 户接收对注解请求的反馈的用户接口 ,以及其中用于组合的装置还组合来自用户的反馈,以便提供改进的输出。
3. 权利要求2的设备,其中用于通信的装置还适于接收来自另外的 设备的外部注解请求,以及将来自用户的反馈传递到所述另外的设备。
4. 权利要求2或3的设备,还包括注解中心管理器,该注解中心管 理器包括包含用户的多个未解决注解请求的队列;以及 用于从未解决注解请求的队列中选择选定的未解决注解请求的装置 其中注解中心管理器以可通信的方式耦合到用户接口 ,以便将所述选 定的未解决注解请求传递给用户接口 ,并且接收来自用户接口的反馈。
5. 权利要求4的设备,其中注解中心管理器还包括 用于确定废弃的未解决注解请求的装置,所述废弃的未解决注解请求是被来自用户的反馈废弃的未解决注解请求;以及用于从所述队列中删除所述废弃的未解决注解请求的装置, 其中所述用于通信的装置还适于将所述反馈传递到所述废弃的未解决注解请求的发起方。
6. 权利要求l的设备,其中用于通信的装置还适于 接收用于将另外的设备识别为注解中心管理器的消息; 将外部注解请求传递到所识别的注解中心管理器;以及 从所识别的注解中心管理器接收来自用户的外部反馈,并且其中用于组合的装置还通过组合来自用户的外部反馈来提供改进的输出。
7. 权利要求3的设备,还包括用于检测用户处于设备附近的装置,用于根据所述用户位于设备附近的检测来将所述设备识别成是设备 网络中的注解中心管理器的装置,以及其中用于通信的装置还适于接收来自设备网络的外部注解请求。
8. 权利要求l的设备,还包括用于存储改进的输出的装置。
9. 权利要求1的设备,其中用于组合的装置还包括置信等级确定单 元,该置信等级确定单元适于确定第一输出的第一置信等级,该第一置信等级指示的是第一输出正 确的置信度;确定注解结果的第二置信等级,该第二置信等级指示的是注解结果正 确的置信度;并且其中用于组合的装置还适于根据第一置信等级和第二置信等级来组 合第一输出和注解结果,以便提供改进的输出。
10. 权利要求l的设备,该设备是作为包括下列各项的群组中的至少 一个实现的机顶盒设备;数字录像设备;启用网络的设备;条件访问系统;便携式音频播放器;便携式视频播放器;移动电i舌;DVD播放器;CD播放器;基于硬盘的媒体播放器; 因特网无线电设备;计算机; 电视;公共娱乐设备; 记忆棒;以及 MP3播放器。
11. 一种用于给内容作注解的方法,该方法包括以下方法步骤分析内容并且根据所述内容分析来产生第 一输出; 产生注解请求;将注解请求传递到至少一个其他设备,并且从所述至少一个其他设备 接收注解结果;以及将第 一输出与所述注解结果相结合,以便提供改进的输出。
12. 权利要求ll的方法,还包括以下方法步骤向用户呈现注解请求,并且从用户那里接收对所述注解请求的反馈;以及在组合的方法步骤中还组合来自用户的反馈,以便提供改进的输出。
13. 权利要求12的方法,还包括以下方法步骤 接收来自另外的设备的外部注解请求;以及 将来自用户的反馈传送到所述另外的设备。
14. 一种用于给内容作注解的系统,该系统包括用于给内容作注解的 多个设备,其中所述多个设备中的每一个设备都包括用于分析内容并且根据内容分析来产生第一输出的装置; 用于产生注解请求的装置,用于通信的装置,所述用于通信的装置适于将注解请求分发到至少一个其他设备,并且接收来自所述至少一个其他设备的注解结果;以及通过将第 一输出和注解结果相结合来提供改进的输出的装置。
15. —种可以直接加载到可编程设备的存储器中的程序单元,包括当 在设备上运行所述程序单元时执行下列方法步骤的软件代码部分分析要作注解的内容,并且根据所述内容分析来产生第 一输出; 产生注解请求;将注解请求传递到至少一个其他设备,并且从所述至少一个其他设备 接收注解结果,以及将第一输出与所述注解结果相结合,以便提供改进的输出。
16. —种可以直接加载到可编程设备的存储器中的计算机可读介质,分析要作注解的:容并且根据所述内容分析来^生第 一输出; 产生注解请求;将注解请求传递到至少一个其他设备,并且从所述至少一个其他设备 接收注解结果;以及将第 一输出与所述注解结果相结合,以便提供改进的输出。
全文摘要
本发明提供了一种用于给内容作注解的设备和方法。该设备可以包括用于分析内容(150)并且根据内容分析来产生第一输出(205)的装置,用于产生注解请求的装置(230),用于通信的装置(130),所述用于通信的装置适于将注解请求分发到至少一个其他设备和接收来自所述至少一个其他设备的注解结果以及通过将第一输出和注解结果相结合(240)来提供改进的输出的装置。通过组合来自不同设备的内容分析算法的多个独立结果,所述组合可能根据背景不同的知识,来为注解提供更高质量的结果。
文档编号G06F17/30GK101443763SQ200780016844
公开日2009年5月27日 申请日期2007年5月7日 优先权日2006年5月9日
发明者F·斯尼德 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1