用于评估稳健性的系统和方法

文档序号:6595626阅读:257来源:国知局
专利名称:用于评估稳健性的系统和方法
用于评估稳健性的系统和方法相关专利申请的交叉引用本专利申请要求2008年10月3日提交的美国临时专利申请No. 61/102618的优先权。相关专利申请本专利申请还涉及2008年10月3日提交的美国临时专利申请No. 61/1(^625和 2008年10月3日提交的美国临时专利申请No. 61/1(^670。
背景技术
人类视觉系统是容量有限的系统,因为其在任何特定时间只能处理较少数量的对象。尽管事实上在任何特定时间有许多对象可以观察到,但情况确实如此。人类视觉系统在任何特定时间将只注意或处理来自人类可见对象的阵列中的一个(或极少数)对象。当人观察图像或场景时,其视觉系统将让注意(和心智处理)从一对象转移到另一对象。在人类视觉注意领域已有大量的研究。该项研究已产生许多针对理解人类视觉注意行为的研究成果,以及许多视觉注意的计算模型。这些计算模型(有时称为视觉注意模型、眼球凝视预测模型、注意模型或显著性模型)在给定视觉刺激物(例如,图片或场景) 下预测人将让其视觉注意或凝视分配在何处。这些模型提供对场景内将吸引视觉注意的对象或区域的预测。然而,典型的真实世界场景常常是高度动态的。当(例如)人的有利位置改变、场景内的对象改变位置或定向、或者照明改变(投射不同阴影)时,投射到人的图像将随之改变。此外,观察者自身会将不确定性引入预测(观察者会心不在焉或者说是倾向于特定的注意模式)。从场景投射图像的任何变动或观察者的变动、或者甚至场景本身的微小改变都会显著地改变这些模型作出的预测。在将视觉注意模型用于应用装置时会由此而产生问题。

发明内容
用于评估(以及在一些实施例中量化)场景内对象对场景和观察者变动的稳健性或场景本身对场景和观察者变动的稳健性的系统和方法。特别是,用于将变动引进到场景和/或视觉注意的计算模型、然后评估这些变化对视觉注意将预测分配在何处的影响的方法。在一个实施例中描述了一种具有视觉注意模块和稳健性评估模块的计算机系统, 视觉注意模块可用来(a)接收场景输入、(b)将视觉注意模型应用到场景输入以及(c)预测场景输入内易于吸引视觉注意的区域;稳健性评估模块可用来与视觉注意模块进行交互以确定经识别的区域中的至少一个具有稳健性或场景具有稳健性的程度。在另一个实施例中,描述了一种计算机实现的方法,其中包括接收场景输入;将视觉注意模型应用到场景输入以预测场景输入内易于吸引视觉注意的区域;改变场景以产生经修改场景;将视觉注意模型应用到经修改场景输入以预测场景输入内易于吸引视觉注意的区域;以及,基于由将视觉注意模型应用到场景输入和被修改的场景而识别的区域,确定经识别的区域中的一个或场景输入具有稳健性的程度。在另一个实施例中,描述了一种计算机实现的方法,其中包括接收场景输入;将视觉注意模型应用到场景输入以预测场景输入内易于吸引视觉注意的区域;改变视觉注意模型以产生经修改的视觉注意模型;将经修改的视觉注意模型应用到场景输入以预测场景输入内有助于吸引视觉注意的区域;以及,基于由将视觉注意模型和经修改的视觉注意模型应用到场景输入所辨认的区域,确定经识别的区域中的一个或场景输入具有稳健性的程度。


图1是示出代表性视觉注意模块的高级功能的流程图。图2是代表性场景的草图。图3A是视觉注意模块输出的艺术效果图。图;3B是视觉注意模块输出的艺术效果图。图4是示出两个实例对象的特性的曲线图。图5示出广告牌对象可以如何以不同背景场景为背景来设定。图6是用于评估场景或场景内对象的稳健性的系统中功能模块的示意图。图7是示出实例场景修改的具体说明。图8示出视觉注意稳健性评估系统的一个替代实施例,其中视觉注意稳健性评估系统另外包括网络服务器模块。图9是说明视觉注意稳健性评估系统评估场景内对象或场景本身的稳健性可采用的流程的一个实施例的高级流程图。图10是示出场景优化的高级流程的流程图。图11是说明与注意扫视所关注对象的连续位置有关的两种不同回报结构的曲线图。图12是场景优化系统中的功能模块的示意图。图13A和图1 各自为一个场景的艺术效果图。图14A和图14B各自为一个场景的艺术效果图。图15是示出多视角场景分析的高级流程图。图16是会议室的示意图。图17A和图17B示出会议室的不同视角。图18是说明对会议室中各种对象进行的三个不同实例分析的图。图19是多视角场景分析系统的示意图。
具体实施例方式视觉注意模型视觉注意模型确定场景内区域在其将吸引视觉注意或吸引眼球运动的可能性方面相异的程度。场景是经受视觉注意模型评估的任何输入形式(例如,图形图像),并可以是(例如)数码照片、虚拟3D场景、网页、文件或视频。对象的视觉注意模型倾向是指视觉注意的模型如何表征场景内对象的相对显著性。例如,一些视觉注意模型将在所预测对象周围叠加迹线。其他视觉注意模型将生成可以在图像上叠加或与图像分开看的热图。还有一些模型可以生成并分配一个值到特定对象和/或区域,该值相对地代表对象的显著性。在迹线的语境中,对象的倾向可以认为是由模型“选定”(加迹线时)或“未选定”。在热图的语境中,对象的倾向是算法已选定对象(或未选定对象)的程度。而在显著性数字的语境中,对象的倾向可以是显著性数字本身。有许多视觉注意模型可预测人类视觉注意会被分配到场景内的何处。通常,这些视觉注意模型采用环境的单幅图像作为输入,并生成对注意将分配在该场景内何处的预测。实验方法使人类受试者接触到场景,并跟踪其眼球移动。然而,该实验方法是资源密集型的,所以已经开发出多个数学模型以通过至少部分地分析场景来预测注意。那就是说实验方法还可以用作本文所述系统和方法的一部分,并如本文所用,实验方法被认为是视觉注意建模的一种类型。图1表示这些模型之一的基本方法论,其由Itti,L. & Koch,C (2000)在“基于显著性的视觉注意明显和隐蔽转移的搜索机制”(A saliency-based search mechanism for overt and covert shifts of visual attention)(〈〈视觉石if究〉〉(Vision Research),第 40卷,1489-1506页)中提出。在高标准下,图1示出如何通过评估“由下而上”特征(例如,颜色、运动、亮度、边缘等)来进行视觉注意的预测,所述特征用作传达人类视觉的一些方面的视觉表现的构成要素。首先,将数码照片形式的场景提供给Itti & Koch模型的计算机实现版本(步骤10)。接着,特征提取过程分析数码照片的颜色、强度、取向或其他场景线索,例如运动、接点、明暗界线、立体视差和从明暗恢复形状(步骤11)。特征提取过程产生多幅特征映射(步骤12),所述特征映射相结合以产生显著性映射(步骤13)。就 Itti & Koch模型而言,将显著性数据作为原始数码照片的效果图提供给使用者,其中“最亮的”对象为模型已预测下一个将分配视觉注意的对象。这种所预测的对象在“赢者通吃 (wirmer-take-all)”算法(步骤15)中被辨认为视觉显著的(步骤14),并且此过程随后重复,直到多个对象被模型辨认。图2是场景201的艺术效果图,其可以提供给诸如Itti & Koch之类的视觉注意模型。该场景是简化场景,仅为了说明而包含于此;在实施过程中,场景常常是真实数码照片或视频,并且要复杂得多。图2包括许多场景内的对象,例如五角星202、花朵203、脸204、 五角星205、箭头206和杯子207。图3A是表示Itti & Koch模型的输出如何被表示的艺术效果图。突出的(且在该代表性图示中,圈绕的)对象是模型预测将为视觉显著的那些。例如,图中的五角星202 在突出边界208内;花朵203在边界209内;脸204在边界210内;五角星205在边界211 内;箭头206在边界212内;并且杯子207在边界213内。因而此实例中的模型已确定六个相对于其他对象更为视觉显著的对象。这个特定的模型还预测注意将在确定为在某一视觉显著性阈值之上的对象中如何移动。例如,视觉注意路径301、302、303、304和305显示所预测的视觉注意路径。图;3B是示出Itti & Koch模型的输出有时被表示的另一方式的第二艺术效果图。除了图3A所示的内容以外,图;3B包括所预测视觉注意的顺序。例如,五角星202标为 “1”(注意序号214),花朵203标为“2”(注意序号215)等等。当然,图3A和图;3B仅为视觉注意预测可被传达到使用者的一种方式;不同模型以不同的方法表示这种信息(或这种信息的某一子集)。例如,虽然可以通过确定具有最高视觉显著性水平的对象,然后排除该对象并寻找下一最高视觉显著性水平的对象等等,来得出这种注意序列,但并非每个模型都确定所预测的注意序列。Itti & Koch’ s模型代表了一种“由下而上”视觉注意模型,因为该模型基于场景的细节分析进行其预测。其他由下而上视觉显著性模型描述于以下这些参考文献feo, Mahadevan 禾口 Vesconcelos(2008)。除了由下而上模型以外,有另一类模型被称为视觉注意的“由上而下”模型。相比于“由下而上”模型,这些模型以场景和明确任务(例如,避开障碍和收集对象)或将影响注意在特定搜索任务期间将分配在何处的对于世界的现有知识(例如,椅子往往会在地面而不是在天花板)开始。这种知识(既基于任务又基于场景的)与“由下而上”特征结合使用来将注意指向所观察场景内的对象。在Rothkopf,C.A.,Ballard, D. H. & Hayhoe, Μ. Μ. (2007)的“任务和环境确定你看向何处”(Task and context Determine Where You Look) (Journal of Vision 7(14) :16,1-20);以及还在 iTorralba, Α.的“目标显著性的环境调制,,(Contextual Modulation of Target Saliency) (Adv. in Neural Information Processing Systems 14 (NIPS), (2001)MIT Press, 2001)中描述了一些示例性的“由上而下”模型。例如,视觉注意的Torralba’ s模型具有关于包括特定类型的对象的特征的现有知识以及关于场景内这些对象的绝对及相对位置的信息。这种现有知识对场景内特定目标的搜索提供“由上而下”的影响。本领域已发展为包括既有“由下而上”又有“由上而下”设计特征的混合视觉注意模型,并已适应模型将接触到的场景类型的差异(例如,视频对静止图像,室外图像对网页
寸寸J。稳健性稳健性是指从视觉注意模型输出的预测对以下任一者或其组合的灵敏度(a)场景视觉特性内的变化和/或变动,其包括(例如)场景内对象的布置,对象的照明、对象的颜色等(称为“外部变动”);或,(b)观察者或观察模型的变化和/或变动(称为“内部变动”)。如本文所用的术语“对象”是指场景内的物件、范围或区域,视情况而定,或通过视觉注意模型分析的场景内的区域。术语“对象”视情况而定可与“范围”或“区域”互换使用。两种类型的变化(a)和(b)被总体称为内部或外部或IE变化,引入然后评估这类变化的各种方法在下面进一步讨论。稳健性评估是一种用于测量IE变化对注意将分配在场景内何处的影响的方法。 然后,场景内对象的稳健性是特定对象的视觉注意模型预测的倾向变化或未变化的程度 (不管IE变化)。一组对象的稳健性为超过一个对象(一个对象的集合)的视觉注意模型的倾向随着IE变化变化或未变化的程度。场景的稳健性是对场景中对象的视觉注意模型的倾向将变化或未变化的程度的测量(不管IE变化)。例如,如果视觉注意模型预测将对场景内相同的四个对象进行注意或注视,并且虽然有IE变化,但这四个对象往往会仍然被视觉注意模型预测,则该场景往往会比所述四个对象随着IE变化而变化的场景更具稳健性。视觉沣意稳健件评估系统图6是显示视觉注意稳健性评估系统403中示例性功能模块的示意图,该系统是用于评估场景的稳健性、场景内对象的稳健性或多个场景内对象的稳健性的系统。当然,也可以手动实践这些方法。在图6所示的实施例中,视觉注意稳健性评估系统在计算机系统 408内。计算机系统408可以是任何通用或专用的计算机或装置。其可以是单独的膝上型计算机或多个联网的计算机。另外,计算机系统408可以是手持式计算机、数字照相机或平板电脑或甚至移动电话。在一个实施例中,计算机系统408具有包括操作系统的各种功能模块(图6中未示出)。这样的操作系统便于视觉注意稳健性评估系统进入计算机系统资源。计算机系统408具有处理器和存储器以及各种传统的输入/输出接口。视觉注意模块403是任何视觉注意模型或模型组合的任何实施例。如前所述,有不同类型的视觉注意模型,但在一定程度上,其全都预测视觉注意往往将会分配到的场景内对象或范围。在图6中视觉注意模块403示出为视觉注意稳健性评估系统402的一部分, 但在另一个实施例中,视觉注意模块403作为单独的计算机处理或甚至作为在任何类型的计算机网络(例如万维网)上提供在远程计算机的服务而工作。VAM修改模块404是视觉注意模块修改模块。VAM修改模块404修改视觉注意模块的参数或架构的一些方面。这种修改可以根据视觉注意模块403的执行以许多方法来实现。例如,视觉注意模块403本身可以支持对视觉注意模块如何工作的一些方面进行修改的函数调用。在一个实施例中,视觉注意模块403可以支持对给予场景某些方面(例如亮度)的权重进行修改的函数调用。在另一个实施例中,如果视觉注意模块经由命令行调用, 则可以使用各种开关来改变视觉注意模块内的变量。或者,如果视觉注意模块403嵌入脚本或程序代码中,则IE修改模块可以修改脚本或程序代码本身。在另一个实施例中,整个视觉注意模型被另一视觉注意模型替换。下面进一步讨论VAM修改模块404修改视觉注意模块403的基础视觉注意模型(或这样的模型于场景的应用)的特定方法,但一个实例可能将修改与用来生成显著性映射的多个特征映射相关的权重。这可以通过将基于可接受值的分布修改这些值的函数调用来实现。场景修改模块405修改将提供给视觉注意模块403用于分析的场景。场景变化是与模拟环境动态特性的外部环境相关的变化。这样的外部变动可以包括(例如)场景内的移动对象(例如,行人的位置)、由于照明方向变化引起的阴影变化、或者大气条件变化(例如,空气中的粉尘)。这种变动可用许多方法产生。一种方法是将摄影机放在场景内,并在不同时刻捕获图像。这样可捕获真实场景的自然变动。另一方法是捕获场景的单幅图像,并规定对该场景内单个元素和对象进行的可能变化。这样的技术的具体说明如图7所示。场景801表示的是原始场景。场景802示出用场景变动元素替换的场景801的对象,所述场景变动元素例如阴影和其他对象(例如,汽车或鸟类等任何可以放在场景内的对象)。场景 803、804、805和806示出原始场景801与场景变动元素的不同组合。本领域技术人员会知道有无数种不同的方法来修改场景,例如使用市售的图像编辑软件,例如Adobe Systems (San Jose, California)以商品名“Wiotoshop”市售的软件。本文仅作为非限制性实例示出了几种。场景修改模块405将外部变动添加到场景,这又会产生场景或场景实例的多个版本。在一个实施例中,场景实例的集合留存场景内的变动。为了测量对象的稳健性或场景的稳健性,各场景实例被提交到视觉注意模块403以产生关于视觉注意将分配在各个场景实例内何处(也就是说,分配到哪个对象)的预测。从属于各次预测的信息保存在数据库 407中,然后稳健性评估模块409遍及这些不同的实例(并如前文进一步详述)对数据进行评估,以生成基于将被分配模型预测的注意的对象的统计。图形用户接口模块406有助于与使用者401的交互。图形用户接口模块406可以 (例如)访问(计算机系统408的)操作系统资源来构建图形用户接口以请求用户401的输入。在一个实施例中,这种输入包括场景的位置以及视觉注意稳健性评估系统的其他操作参数。在一个实施例中,这种输入将规定评估中用户401感兴趣的场景内的区域和/或位置。除了规定这类位置以外,用户401可以规定何种类型的变动将被视觉注意模块403 考虑。这可以包括普通或特定内部变动、或普通或特定外部变动。例如,一种特定类型的外部变动可能是由于照明方向的变化而改变图像。随着光线变化,产生的阴影将变化。这是一种特定类型的外部变动,因为其不会考虑如动态对象、大气析光差等的其他因素。普通内部变动的一个实例可以是其中各特征映射的权重被允许独立变化的状况。特定内部变动的一个实例是在一组特征映射的权重(例如,亮度)变化但其他未变化时的情况。图形用户接口模块406也有助于(可能从用户)获得有关应该从哪个地方获取场景的图像的输入可能的地方包括(例如)数据库或平面文件。稳健性评估模块409控制其他模块的交互,以评估场景内对象的稳健性或场景本身的稳健性。例如,稳健性评估模块409必要时调用视觉注意模块403以及VAM修改模块 404和场景修改模块405。稳健性评估模块409调用各种模块的方式可以通过来自用户401 经由(例如)图形用户接口模块406提供给稳健性评估模块409的输入来修改。稳健性评估模块409必要时还评估由其他模块提供的数据并生成报告。数据库407处理视觉注意稳健性评估系统402的数据存储需求。除了别的以外, 数据库407可以保留场景的图像。数据库407可以是任何计算机存储器。其可以是随机存取存储器或平面文件、或在一个或多个数据库服务器上执行的一个或多个数据库管理系统(DBMS)。数据库管理系统可以是关系(RDBMS)、分层(HDBMS)、多维(MDBMS)、面向对象 (0DBMS或OODBMQ或对象关系(0RDBMQ数据库管理系统。例如,数据库407可以是单一关系数据库,例如Microsoft Corporation的SQL服务器。用户401是视觉注意稳健性评估系统的任何用户。在一些实施例中,视觉注意稳健性评估系统402非常容易使用,使得不熟悉视觉显著性理论的人员可以使用该系统来评估对象、区域或场景的稳健性。用户401可以是评估标牌和非标牌对象在它们的环境内的定位的商业实体雇用的顾问或为其工作的雇员。用户401还可以是对评估其中页面的视觉特性可以改变的网页上的数字对象(例如广告)的设计和布局感兴趣的内容设计者。图8是视觉注意稳健性评估系统的一个替代实施例,其中视觉注意稳健性评估系统另外包括网络服务器模块501。为方便起见,网络服务器模块501示出为视觉注意稳健性评估系统402的一部分。然而,网络服务器模块可以具体化为计算机系统408上运行的在单独存储空间中的软件模块。或者网络服务器模块501可以在经由网络连接到视觉注意稳健性评估系统402的独立计算机系统上。Web服务器模块501提供用户401可以经其通过客户端计算机503并通过网络502与视觉注意稳健性评估系统402沟通的界面。在一种配置中,web模块501执行网页服务器软件,例如Microsoft Corporation (Redmond, Washington)的互联网信息月艮务器(Internet Information Server) 0网络服务器模块501通过使用(例如)动态服务器页面(Active Server Pages)、超文本标记语言(HTML)或动态HTML编写的网页、Active X模块、Lotus脚本、Java脚本、Java小程序、分布式组件对象模块(DCOM)等等来提供与远程用户401交互的机制。尽管举例说明为在由计算机系统408提供的操作环境内执行的“服务器端”软件模块,但包括视觉注意稳健性评估系统402的功能模块可以容易地实现为在由用户401使用的诸如客户端计算机503之类的计算设备上执行的“客户端”软件模块。视觉注意稳健性评估系统402可以(例如)实现为由网页浏览器执行的Active X模块,所述网页浏览器在客户端计算机503上执行。网络502可以是任何类型的网络(公共网络或专用网络)。在一个实施例中,网络 502是互联网。图7和图8中的用户401可以是互联网的任何用户。在一个实施例中,用户401 可以经许可预先安排访问视觉注意稳健性评估系统的功能。图9是说明视觉注意稳健性评估系统402评估场景内对象或场景本身的稳健性可采用的流程的一个实施例的高级流程图。首先,调用视觉注意模块,并向其提供场景输入 (步骤601)。然后来自视觉注意模块接收场景内所预测的对象(步骤60幻。然后,模型预测具有较高相对显著性的位置/对象/区域的一些指示被存储到数据库(步骤60 。确切地说,存储在数据库中的内容很大程度上取决于从步骤602中视觉注意模块接收的输出类型。在一个实施例中,数据库存储关于到达阈值显著性值的对象的信息。在另一个实施例中,数据库存储值的矩阵(图像中辨认的每个对象一个值),并存储(例如)对象到达阈值显著性值的次数。然后,进行检查以查看处理是否完成(步骤60 。在一个实施例中,这种检查可以确定当前迭代是否已超出由用户401最初设置的迭代次数。在另一个实施例中, 迭代次数可以由算法确定。在又一个实施例中,迭代次数可以由场景的特性或者由关于稳健性测量的统计数据确定。例如,如果尝试确定在特定场所两副广告中哪副更好,则可以运行该算法,直到两幅广告的稳健性值之间有统计学上可靠的效果。如果稳健性评估未完成(步骤605 “否”),则将IE变化引入视觉注意模块的视觉注意模型或场景输入。IE变化可以分为两类结构化的和随机的。随机变动是不相关的变动。例如,场景中的随机变动可以包括各个像素颜色和/或亮度的随机变化。在这种情况下,像素变化是不相关的。相比之下,结构化变动在正被修改的元素之间具有相关性。例如,通过模拟场景内对象的运动或添加或移除场景内对象而修改的场景将构成结构化场景变动。在这种情况下,像素修改的变化是相关的。随机内部变化可以包括被视觉注意模块利用的注意模型中的随机变化。在另一方面,结构化变动可以是注意映射的一部分中相比于另一部分中的注意的程序性偏倚产生变动的方法类型汇总于表1。引入IE变化的子处理在下面进一步详细说明。
权利要求
1.一种计算机系统,包括视觉注意模块,其可用来(a)接收场景输入;(b)将视觉注意模型应用到所述场景输入;以及(c)预测所述场景输入内易于吸引视觉注意的区域;以及稳健性评估模块,其可用来与所述视觉注意模块进行交互以确定经识别的区域中的至少一个的稳健性程度或所述场景的稳健性程度。
2.根据权利要求1所述的系统,其中稳健性是对从视觉注意模型输出的预测对以下任一者或某个组合的灵敏度的度量(a)所述场景的所述视觉特性内的变动;或(b)通过所述视觉注意模块施加的所述视觉注意模型内的变动。
3.根据权利要求2所述的系统,其中所述稳健性评估模块还可用来将变动引入所述场景的视觉特性。
4.根据权利要求3所述的系统,其中所述稳健性评估模块通过修改所述场景输入将变动引入所述场景的视觉特性。
5.根据权利要求4所述的系统,其中修改所述场景输入包括系统地或随机地选择所述图像内的像素来修改,并系统地或随机地扰乱那些所选像素的特性。
6.根据权利要求2所述的系统,其中所述稳健性评估模块还可用来将通过所述视觉注意模块施加的变动弓I入所述视觉注意模型。
7.根据权利要求6所述的系统,其中通过修改所述视觉注意模型的操作参数将所述变动引入所述视觉注意模型。
8.根据权利要求7所述的系统,其中修改所述操作参数是系统地或随机地进行的。
9.根据权利要求7所述的系统,其中被修改的所述操作参数是控制所述视觉注意模型对以下任一者的灵敏度的那些颜色、对比度、运动、形状、空间频率、取向。
10.根据权利要求2所述的系统,其中所述稳健性评估模块还可用来同时(a)将变动引入所述场景的视觉特性;并(b)将通过所述视觉注意模块施加的变动弓I入所述视觉注意模型。
11.根据权利要求10所述的系统,其中将变动引入所述场景的所述视觉特性包括将视觉干扰物引入所述场景。
12.根据权利要求10所述的系统,还包括数据库模块,其可用来记录所述经识别的区域如何根据引入场景的视觉特性的变动、 或引入所述视觉注意模型内的通过所述视觉注意模块施加的变动而变化,所述数据库模块还可用来记录变动的类型。
13.根据权利要求12所述的系统,其中所述稳健性评估模块重复地(a)将变动引入所述场景的所述视觉特性,从而生成修改场景,以及;(b)调用所述视觉注意模块并提供所述修改场景作为输入。
14.根据权利要求12所述的系统,其中所述稳健性评估模块重复地(a)将通过所述视觉注意模块施加的变动引入所述视觉注意模型,以及;(b)调用所述视觉注意模块以使用所述修改的视觉注意模型。
15.根据权利要求1所述的系统,还包括用户接口模块,其可用来显示指示所述经识别的区域中的至少一个具有稳健性的程度的信息。
16.根据权利要求15所述的系统,其中所述信息包括所述场景的图形表达,所述场景的所述图形表达覆盖有与所述场景的单独区域相关的热图,所述热图的梯度与所述场景的单独区域的所述稳健性相关联。
17.根据权利要求15所述的系统,其中所述信息包括数字。
18.根据权利要求1所述的系统,其中所述稳健性评估模块另外具有可观察特定区域的持续时间,并另外使用该信息来确定所述区域是否具有稳健性。
19.根据权利要求1所述的系统,其中所述视觉注意模型是经验模型。
20.根据权利要求2所述的系统,其中所述稳健性评估模块还可用来将所述稳健性的程度量化为数字,并将该数字提供到计算机程序。
21.一种计算机实现的方法,包括接收场景输入;将视觉注意模型应用到所述场景输入以预测所述场景输入内易于吸引视觉注意的区域;改变所述场景以产生修改的场景;将所述视觉注意模型应用到所述修改场景输入以预测所述场景输入内易于吸引视觉注意的区域;以及,基于由将所述视觉注意模型应用到所述场景输入和所述修改的场景而识别的所述区域,确定经识别的区域中的一个或所述场景输入具有稳健性的程度。
22.根据权利要求21所述的计算机实现的方法,其中稳健性是对视觉注意模型的预测对所述场景的所述视觉特性内变动的灵敏度的度量。
23.根据权利要求22所述的计算机实现的方法,其中改变所述场景包括系统地或随机地选择所述图像内的像素来修改,并系统地或随机地扰乱那些所选像素的特性。
24.根据权利要求22所述的计算机实现的方法,其中改变所述场景包括将视觉干扰物引入所述场景。
25.根据权利要求22所述的计算机实现的方法,其中改变所述场景包括修改在所述场景内的包括对象的区域。
26.根据权利要求22所述的计算机实现的方法,其中改变所述场景包括修改在所述场景内的包括对象的区域的尺寸、颜色或形状。
27.根据权利要求22所述的计算机实现的方法,其中改变所述场景包括调节所述场景的亮度或对比度。
28.根据权利要求22所述的计算机实现的方法,还包括经由用户接口向用户呈现指示所述经识别的区域中的一个或所述场景输入具有稳健性的程度的信息。
29.根据权利要求观所述的计算机实现的方法,其中所述信息是数字。
30.根据权利要求21所述的计算机实现的方法,还包括向计算机程序提供指示所述经识别的区域中的一个或所述场景输入具有稳健性的程度的数字。
31.一种计算机实现的方法,包括 接收场景输入;将视觉注意模型应用到所述场景输入以预测所述场景输入内易于吸引视觉注意的区域;改变所述视觉注意模型以产生修改的视觉注意模型;将所述修改的视觉注意模型应用到所述场景输入以预测所述场景输入内易于吸引视觉注意的区域;以及,基于由将所述视觉注意模型和所述修改的视觉注意模型应用到所述场景输入而识别的区域,确定所述经识别的区域中的一个或所述场景输入具有稳健性的程度。
32.根据权利要求31所述的计算机实现的方法,其中稳健性是对来自视觉注意模型的预测对所述视觉注意模型内的变动的灵敏度的度量。
33.根据权利要求32所述的计算机实现的方法,其中改变所述视觉注意模型包括修改所述视觉注意模型的操作参数。
34.根据权利要求33所述的计算机实现的方法,其中所述操作参数被随机地或系统地修改。
35.根据权利要求34所述的计算机实现的方法,其中所述操作参数是控制所述视觉注意模型对以下任一者或其组合的灵敏度的那些颜色、对比度、运动、形状、空间频率和取向。
36.根据权利要求31所述的计算机实现的方法,还包括 提供指示所确定的稳健性程度的输出。
37.根据权利要求36所述的计算机实现的方法,其中所述输出是数字。
38.根据权利要求37所述的计算机实现的方法,其中所述输出提供给计算机程序。
全文摘要
本发明公开了用于评价场景内对象或场景本身的稳健性的系统和方法。
文档编号G06K9/46GK102227753SQ200980147669
公开日2011年10月26日 申请日期2009年10月1日 优先权日2008年10月3日
发明者布拉因·J·斯坦凯维奇, 布赖恩·E·布鲁克斯, 布赖恩·L·林兹, 戴维·K·麦斯米尔, 格兰·E·卡斯纳尔, 纳森·J·安德森, 蒂莫西·J·加德纳, 迈克尔·凯利·卡那万 申请人:3M创新有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1