图像聚类方法

文档序号:6370194阅读:198来源:国知局
专利名称:图像聚类方法
技术领域
本发明涉及图像聚类,更具体地说,涉及基于事件的图像聚类。
背景技术
传统地,很多照片聚类算法依赖于时间信息来将照片组织为群组。例如,通常按拍摄照片的日期或通过标识照片的时间排序列表中的重要时间差来对照片进行分组。虽然时间是用于确定事件边界的关键指示符,但当单独使用时,所推导的值可能受限制。例如,在一个小时过去后,拍摄者可能处于60km外的新位置,或他们可能在同一位置。他们移动了多远是额外信息,其可以区分是否已经产生新事件。通常使用由与图像捕获设备(例如照相机)集成的实时时钟生成的时间戳来把时间信息与捕获的图像相关联。通常使用卫星定位/导航设备(比如全球定位系统(Global Positioning System, GPS)设备)来确定位置数据(有时被称为地理学数据、地理数据或地理标签)。此外,这样的设备可以与照相机集成。这样的信息当与捕获的图像相关联时是元数据,并且通常被组织成图像的JPEG (. jpg)文件的EXIF分量。用于基于时间和位置信息而将照片布置为群组的技术已经存在了很多年,然而,提供地理标签以及时间戳的照相机近来才进入主流使用。在没有将GPS信息嵌入照片的EXIF数据的照相机的情况下,用户将需要手动地将GPS信息注解到他们的照片,或随身携带GPS记录器,GPS记录器随后将通过交叉参考照片上的时间戳与GPS日志上的时间戳来提供用于照片的GPS信息。这两种方法都是不方便而且耗时的。可能争议的是,手动地对照片做地理标签或交叉参考GPS日志的开销远超过对于照片聚类使用位置信息所获得的潜在好处。结果,对照片做地理标签的开销意味着基于时间和位置的聚类算法没有被广泛采用。然而,随着在照片上提供地理标签的照相机变得更流行,使用时间和GPS信息对照片 进行分组的照片聚类算法将变得更广泛使用。结果,在EXIF数据中提供地理标签的照相机的预期增多的情况下,可以在将照片的集合分组为事件时利用这样的信息。当前的事件标识方法在照片的时间排序列表中查看相邻照片之间的时间差和距离差,并且尝试标识时间和距离离群值(outlier)。该方法可能在以下情况下并非总是有用当拍摄者对于同一事件拍摄两个照片集合——在一个位置拍摄一个并且然后当日稍后在相同位置拍摄更多照片时。在来自第一集合的最后照片与来自第二集合的第一照片之间的边界处,将认为是时间离群值,这是因为时间的较大改变;但不认为是距离离群值,这是因为其在相同区域中。其它技术寻求标识何时产生时间差或距离差离群值。这些方法的缺点在于,通过仅考虑时间或距离,新事件可能被不正确地检测。例如,对于旅行事件(比如在公共汽车上或小汽车中旅行的同时拍摄照片),大距离差将被检测为离群值,导致旅行事件被错误地分成多个事件。此外,如果存在一个位置中拍摄的照片的短突发,但突发之间的时间被认为是离群值一则一个事件可能被错误地分成多个事件。此外,前述两种技术都不能容易地生成预定数量的聚类。可以通过改变针对什么内容构成离群值的阈值来调整聚类的数量。然而,这样的方法是不方便的并且所创建的聚类的数量无法容易地设置。

发明内容
现在公开一种用于基于元数据(诸如与每张照片关联的时间和位置信息等)而将照片的集合分组为事件的方法。时间和位置信息是新事件开始的关键指示符。在很多情况下,用户已经拍摄的两个照片之间的时间的明显改变和/或距离的明显改变指示新事件的开始。所述方法把旅行事件分组在一起以及把当拍摄者正在区域中游走时拍摄照片的事件分组在一起。通常将媒体对象(比如照片)分组为事件,以帮助用户容易地组织、浏览以及搜索它们。这些需求随着数字摄影的增长以及人们拍摄的大量照片而出现。在当前相册生成应用中,将照片分组为事件并且以有用的地理信息对事件进行标记,以协助用户根据其照片集合回想并且识别事件。这些特征帮助用户从其照片集合找寻并且选取事件,以创建相册。本公开内容涉及当前相册生成软件的分组方面。 根据本公开内容的一方面,提供了一种确定多个图像内的一个或更多个事件子集的方法。每个图像与指定由图像捕获设备捕获图像的时间和位置的时间数据和位置数据相关联。所述方法基于与多个图像的捕获时间排序列表中的每个相邻图像对的图像相关联的时间数据来确定用于每个相邻图像对的时间变量。然后基于与图像的排序列表中的每个相邻图像对的图像相关联的位置数据来确定用于每个相邻图像对的距离变量。所述方法确定图像捕获设备在多个图像中的每个图像的捕获时间和捕获位置处的速度数据。然后基于代价函数来将图像的排序列表划分为一个或更多个事件子集,所述代价函数是根据时间变量和距离变量的标准化而被确定的,其中,与所述速度数据相关地对时间变量和距离变量进行加权。还公开了其它方面。


现将参照以下附图描述本发明的至少一个实施例,其中图I是将排序照片列表分组为事件的一般问题的图;图2示出考虑排序照片列表中的相邻照片之间的时间差以执行图像聚类的现有技术示例;图3示出考虑排序照片列表中的相邻照片之间的时间差和距离差以执行图像聚类的现有技术示例;图4是示出(基于标准化的时间变量和距离变量的加权和以及权重基于速度信息)推导排序列表中的相邻照片之间的“代价”的方法的高级别示图;图5是示出在排序列表中的所有相邻照片对之间计算的“代价”的示例的图,其中代价函数中的峰值对应于新事件的开始;图6是示出使用时间、位置和速度信息检测新事件的开始的处理的示意性流程图;图7是示出均值方差标准化的处理的示意性流程图8是示出计算速度变量的处理的示意性流程图;图9是示出计算代价函数的处理的示意性流程图;图10A、图IOB和图IOC是在两个飞机旅程上拍摄的图像的位置集合的示图。图IOB示出当不根据速度调整权重时将图像分组为事件。图IOC示出当根据速度调整权重时将图像分组为事件。图11是当使用根据本公开内容的图像聚类应用时用户遇到的第一屏幕的屏幕截图,其显示分组为事件的用户照片集合;图12是第二屏幕的屏幕截图,其中用户可以指定将使用多少扩展以及在什么扩展中将使用哪些事件;图13是用户选择在扩展中使用什么图像的第三屏幕的屏幕截图; 图14也是第三屏幕的屏幕截图,示出如何修改图像的布局;以及图15A和图15B形成在上面可以实践所描述的布置的通用计算机系统的示意性框图。
具体实施例方式发明人注意到,时间和距离是非常不同的量,故此,这二者在处于可以合并在一起的状态下之前都需要经历变换。如果简单地加在一起,则在很多情况下最终将仅考虑一个量,因为该量将比另一量大若干数量级。至于可以如何以有用的方式组合这些不同的量,现有技术并未对发明人提供指示或指导。随着数字摄影的增长,人们拍摄的图像的数量已经显著增长。然而,随着所拍摄的照片的数量增长,照片集合变得更难以管理、排序以及找寻图像。公开了一种将照片的集合分组为可识别事件以提供组织并且协助用户识别其照片集合的不同部分的方法。该方法优选地用在相册生成应用中,其中,用户的集合被组织为事件,并且用户选择在其相册中使用什么事件。以下描述公开了一种将照片集合划分为与旅行事件对应的一个或更多个群组的系统。甚至在拍摄者正快速移动的情况下,比如在小汽车或公共汽车里的同时拍摄照片,或在区域(比如娱乐公园或博物馆)中游走的同时拍摄照片的情况下,该系统也将照片集合分组为适当的旅行事件。在检测旅行事件的情况下,一些现有技术使用需要训练数据的机器学习。需要训练数据的风险在于,系统可能变得过度适配(over-fit)于训练数据而不足够通用以对任意数据集合产生良好结果。当前系统不需要训练数据。此外,虽然期望地通过具有形成时间记录和GPS日志的实时时钟和GPS定位设备的照相机设备捕获图像,但通常在后处理环境中、在执行相册应用(所捕获的图像和相关联的元数据被下载至该相册应用)的计算机或相似系统上执行要被描述的处理。图15A和图15B描述在上面可以实践所描述的各种布置的通用计算机系统1500。如图15A可见,计算机系统1500包括计算机模块1501 ;输入设备,例如键盘
1502、鼠标指点设备1503、扫描仪1526、照相机1527以及麦克风1580 ;以及输出设备,包括打印机1515、显示设备1514和扬声器1517。计算机模块1501可以使用外部调制器-解调器(调制解调器)收发器设备1516,用于经由连接1521与通信网络1520通信。通信网络1520可以是广域网(wide-area network, WAN,比如互联网)、蜂窝电信网络、或专用WAN。在连接1521是电话线的情况下,调制解调器1516可以是传统的“拨号”调制解调器。或者,在连接1521是高容量(例如缆线)连接的情况下,调制解调器1516可以是宽带调制解调器。无线调制解调器也可以用于到通信网络1520的无线连接。计算机模块1501典型地包括至少 一个处理器单元1505、以及存储器单元1506。例如,存储器单元1506可以具有半导体随机存取存储器(RAM)和半导体只读存储器(ROM)。计算机模块1501还包括多个输入/输出(I/O)接口,其包括音频视频接口 1507,其耦合到视频显示器1514、扬声器1517和麦克风1580 ;1/0接口 1513,其耦合到键盘1502、鼠标
1503、扫描仪1526、照相机1527、以及可选地耦合到操纵杆或其它人类接口设备(未示出);以及接口 1508,用于外部调制解调器1516和打印机1515。在一些实现中,调制解调器1516可以包括在计算机模块1501内,例如在接口 1508内。计算机模块1501还具有本地网络接口 1511,其允许计算机系统1500经由连接1523耦合到局域通信网络1522 (被称为局域网(LAN))。如图15A所示,本地通信网络1522也可以经由连接1524耦合到广网络1520,连接1524典型地包括所谓的“防火墙”设备或相似功能的设备。本地网络接口 1511可以包括以太网 电路卡、蓝牙 无线布置或IEEE802. 11无线布置;然而,大量其它类型的接口可以被实践用于接口 1511。I/O接口 1508和1513可以提供串行和并行连接中的任一个或两个,前者通常根据通用串行总线(USB)标准而实现,并且具有对应的USB连接器(未示出)。存储设备1509被提供并且通常包括硬盘驱动器(HDD) 1510。也可以使用其它存储设备,诸如软盘驱动器和磁带驱动器等(未示出)。光盘驱动器1512被典型地提供作为非易失性数据源。便携式存储器设备(诸如光盘(例如⑶-ROM、DVD、蓝光盘 )、USB-RAM、便携式外部硬盘驱动器以及软盘等)例如可以用作系统1500的适当数据源。计算机模块1501的组件1505至1513典型地经由互联总线1504并且以产生本领域技术人员已知的计算机系统1500的常规操作模式的方式进行通信。例如,处理器1505使用连接1518耦合到系统总线1504。类似地,存储器1506和光盘驱动器1512通过连接1519耦合到系统总线1504。在上面可以实施所描述的布置的计算机的示例包括IBM-PC和兼容机、Sun Sparcstation、Apple Mac 或类似的计算机系统。在待描述的布置中,图像和元数据可以从照相机1527或经由网络1520和/或1522下载,并且存储在计算机1501中,比如在HDD 1410中。可以使用计算机系统1500实现图像聚类的方法,其中,待描述的图4至图9以及图11至图14的处理可以实施为在计算机系统1500内可执行的一个或更多个软件应用程序1533。特别地,图像聚类的方法的步骤是由在计算机系统1500内执行的软件1533中的指令1531 (见图15B)执行的。软件指令1531可以形成为一个或更多个代码模块,每个代码模块都用于执行一个或更多个特定任务。软件也可以划分为两个分离的部分,其中,第一部分和对应代码模块执行图像聚类方法,第二部分和对应代码模块管理第一部分与用户之间的用户界面。例如,软件可以存储在计算机可读介质中,包括下面描述的存储设备。软件从计算机可读介质加载到计算机系统1500中,然后由计算机系统1500执行。上面记录有此类软件或计算机程序的计算机可读介质是计算机程序产品。计算机程序产品在计算机系统1500中的使用优选地产生有利的用于图像聚类的装置。
软件1533通常存储在HDD 1510或存储器1506中。软件从计算机可读介质加载到计算机系统1500中,并且由计算机系统1500执行。因此,例如,软件1533可以存储在由光盘驱动器1512读取的光学可读盘存储介质(例如⑶-ROM) 1525上。在一些情况中,应用程序1533可以被提供给在一个或更多个⑶-ROM 1525上编码的用户并且经由对应的驱动器1512读取,或者,可以由用户从网络1520或1522读取。此夕卜,软件还可以从其它计算机可读介质加载到计算机系统1500中。计算机可读存储介质是指将记录的指令和/或数据提供给计算机系统1500以用于执行和/或处理的任何非易失性有形存储介质。这样的存储介质的示例包括软盘、磁带、CD-ROM、DVD、蓝光盘、硬盘驱动器、ROM或集成电路、USB存储器、磁光盘、或计算机可读卡(比如PCMCIA卡)等,无论这些设备在计算机模块1501的内部还是外部。易失性或非有形计算机可读传输介质也可以参与软件、应用程序、指令和/或数据对计算机模块1501的提供,这些介质的示例包括无线电或红外传输信道以及对另一计算机或联网设备的网络连接、以及包括电子邮件传输和在网站上记录的信息的互联网或内部网等。可以执行上面描述的应用程序1533的第二部分以及对应代码模块,以实现待在 显示器1514上呈现或另外表示的一个或更多个图形用户界面(⑶I)。通过典型地操控键盘1502和鼠标1503,计算机系统1500和应用的用户可以以功能自适应方式操控界面,以将控制命令和/或输入提供给与GUI关联的应用。也可以实现功能自适应用户界面的其它形式,例如利用经由扬声器1517输出的语音提示以及经由麦克风1580输入的用户语音命令的音频接口。图15B是处理器1505和“存储器” 1534的详细示意性框图。存储器1534表示可以由图15A中的计算机模块1501存取的所有存储器模块(包括HDD 1509和半导体存储器1506)的逻辑集合。当初始地对计算机模块1501进行供电时,供电自测(POST)程序1550执行。POST程序1550通常存储在图15A的半导体存储器1506的ROM 1549中。硬件设备(比如存储软件的ROM 1549)有时被称为固件。POST程序1550检查计算机模块1501内的硬件,以确保正确运作并且典型地检查处理器1505、存储器1534 (1509、1506)、以及也典型地存储在ROM 1549中的基本输入输出系统软件(BIOS)模块1551以用于正确操作。一旦POST程序1550已经成功地运行,BI0S1551就激活图15A的硬盘驱动器1510。硬盘驱动器1510的激活使得经由处理器1505执行在硬盘驱动器1510上驻留的引导加载程序1552。这将操作系统1553加载到RAM存储器1506,在RAM存储器1506上操作系统1553开始操作。操作系统1553是可由处理器1505执行的系统级别应用,以完成包括处理器管理、存储器管理、设备管理、存储管理、软件应用界面以及通用用户接口的各种高级别功能。操作系统1553管理存储器1534 (1509、1506)以确保在计算机模块1501上运行的每个处理或应用具有在其中不与分配给另一处理的存储器冲突的情况下执行的足够存储器。此外,必须正确地使用图15A的系统1500中可用的不同类型的存储器,以使得每个处理可以有效率地运行。因此,集合的存储器1534并非意在示出如何分配存储器的特定分段(除非另外声明),而是提供可由计算机系统1500访问的存储器以及如何使用它的概图。如图15B所示,处理器1505包括多个功能模块,包括控制单元1539、算术逻辑单元(ALU>1540以及本地或内部存储器1548 (有时称为缓存存储器)。缓存存储器1548通常包括寄存器段中的多个存储寄存器1544-1546。一个或更多个内部总线1541将这些功能模块功能地互联。处理器1505典型地还具有用于使用连接1518经由系统总线1504与外部设备进行通信的一个或更多个接口 1542。存储器1534使用连接1519耦合到总线1504。应用程序1533包括可以包括条件分支和循环指令的指令序列1531。程序1533还可以包括在执行程序1533中使用的数据1532。指令1531和数据1532分别存储在存储器位置1528、1529、1530和1535、1536、1537中。取决于指令1531和存储器位置1528-1530的相对大小,可以在单个存储器位置中存储特定指令,如存储器位置1530示出的指令所描述的那样。或者,可以将指令分段为多个部分,每个部分存储在分离的存储器位置中,如存储器位置1528和1529示出的指令段所描述的那样。通常,处理器1505被给予其中执行的指令集合。处理器1505等待后续输入,处理器1505通过执行另一指令集合来对该后续输入做出反应。可以从包括以下数据的多个源中的一个或更多个提供每个输入由输入设备1502、1503中的一个或更多个生成的数据,跨网络1520、1522中的一个从外部源接收的数据,从存储设备1506、1509中的一个提取的 数据或从插入到对应的读取器1512中的存储介质1525提取的数据,全都在图15A中有描述。指令集合的执行可以在一些情况下产生数据输出。执行还可以涉及将数据或变量存储到存储器1534。所公开的图像聚类布置使用在存储器1534中在对应的存储器位置1555、1556、1557中存储的输入变量1554。图像聚类布置产生在存储器1534中在对应的存储器位置1562、1563、1564中存储的输出变量1561。可以在存储器位置1559、1560、1566和1567中存储中间变量1558。参照图15B的处理器1505,寄存器1544、1545、1546、算术逻辑单元(ALU) 1540和控制单元1539 —起工作,以执行针对构成程序1433的指令集合中的每个指令执行“取得、解码和执行”所需的微操作的序列。每个取得、解码和执行周期包括(a)取得操作,其从存储器位置1528、1529、1530取得或读取指令1531 ;(b)解码操作,其中,控制单元1539确定已经取得哪个指令;以及(c)执行操作,其中,控制单元1539和/或ALU 1540执行指令。此后,可以执行针对下一指令的又一个取得、解码和执行周期。相似地,可以执行存储周期,控制单元1539通过该存储周期将值存储或写入到存储器位置1532。图4至图9以及图11至图13的处理中的每个步骤或子处理与程序1533的一个或更多个分段相关联,并且由一起工作的处理器1505中的寄存器段1544、1545、1547、ALU1540以及控制单元1539执行,以针对程序1533的被标明的分段的指令集中的每个指令执行取得、解码和执行周期。图I示出可以形成集合的全部或部分的照片P1至P8的排序列表103。照片中的每一个具有指明图像捕获时间和捕获位置的对应时间数据(tn)和位置数据(地理标签,xn)。期望解决的一般问题是,基于从相关联的时间和地理标签元数据推断的事件而将列表103中的照片聚类在一起、分组、或形成其子集。如该示例所示,照片的群组105、111和115中的每个均与可标识事件相关联并且因此与事件边界相关联。例如图2所示的一些现有技术方法仅考虑时间排序列表的相邻照片之间的时间差205。基于时间一例如通过标识照片之间的明显时间差而将照片划分为聚类。例如图3所示的其它现有技术方法考虑相邻照片之间的时间差305和距离差311。通过标识相邻照片之间的明显时间和/或距离差来找到事件边界。距离差是两个经度/纬度点之间的某种适当的距离度量。距离差可以是例如地理距离(地球的圆周周围的两个经度/纬度点之间的距离)、LI范数或Manhattan距离(I X1-X21 +1 Y1I21 )、或L2范数(sqrt ((X1-X2)2+ (Y1-Y2)2)))。根据本公开内容所采用的方法是将时间差和距离差组合为被称为“代价”的一个标量。如图4所示,在排序列表中的相邻照片之间考虑时间差403、距离差406和速度数据409。时间和距离是用于新事件开始处的关键指示符一时间的改变和/或距离的改变越大,新事件越可能在该边界开始。对时间差和距离差进行标准化410,从而它们处于状态412,因此它们可以合并414在一起。代价418是取得的标准化时间和标准化距离的加权和,其中,权重416取决于420速度数据。该代价函数用于确定事件边界产生之处。如图5所示,代价函数具有峰值505,其对应于照片的时间排序集合中的新事件的开始。本方法是要对照片进行排序,计算相邻照片之间的代价,并且标识峰值产生之处。可以使用标准峰值检测方法或通过标识预定数量的照片聚类来执行峰值检测。在事件边界 处,如果代价函数高于特定阈值,则创建新事件。如果其低于阈值,则将照片分配给现有聚类并且不创建新事件。一起考虑时间和距离的优点是可以根据新事件发生的可能性对照片之间的边界进行分级。这是有益的,由于其允许改变所生成的聚类的数量。图6是根据本公开内容的聚类图像的方法600的示意性流程图。方法600期望地实现为软件,比如应用程序1533,其可以是大型相册应用的组件。其中实现方法600的应用程序1533可以对例如在HDD1510中存储的照片集合和相关联的元数据进行操作。方法600在步骤601开始,在步骤601,处理器1505从HDD 1510提取加时间戳并且加地理标签的照片列表103。照片被按时间排序——使得对于具有时间戳&的每个照片Pp以下关系对于照片的排序成立Ρι,Ρ2,...,Ρηti < t2 < ... < tn ·目标在于,将照片划分为事件Ei—在图I的示例中,创建三个事件E1= (P1, P2, P31105,E2= {P4, Pj 111 以及 E3= {P6, P7, P81115.聚类保留时间排序一聚类中的所有照片按时间排序,并且聚类中的照片将不具有包括较大时间戳的前一聚类中的照片。处理开始于进入步骤601,其中,提供或提取照片用于聚类处理(聚类)。步骤605进行检查照片被以捕获照片的方式进行排序(时间排序)。通常与JPEG图像相关联的EXIF数据包括捕获的实际时间,并且多数照片管理系统以捕获的顺序保存照片。其它很多捕获设备将文件名称给予每张照片,其中,文件名称被字母数字混合地排序。一般地,自动给予的字母数字混合名称按时间顺序进行排序。在这种情况下,在步骤601接收的照片将已经是时间排序的,因此步骤605无需操作以对照片进行排序。然而,照片有时是随机地提供的,或以某种其他方式被排序的。例如,用户可能已经编辑照片图像的文件名称,由此消除任何自动给予的字母数字混合排序,或照片可能是根据某种其他参数(比如拍摄者已经从基准点移动的距离或任何其他合适的度量)排序的。在这些情况下,步骤605操作,以根据照片的特性把接收到的照片排序成根据每个照片的捕获的时间顺序布置的列表。
在接下来的步骤611中,相邻照片之间的时间变量由处理器1505计算出,并且存储在存储器1506中。这典型地是排序列表中的相邻照片的时间戳之间的简单差。然而,时间变量可以还包括某种可选处理,以增加实现特定结果的可能性。例如,可以将15分钟以下的时间差调整为零,从而它们更有可能被分组在一起。还可以将24小时或更大的时间差固定在24小时,以减少数据的动态范围。具体地说,在优选实施方式中
权利要求
1.一种确定多个图像内的一个或更多个事件子集的方法,每个图像与指定由图像捕获设备捕获所述图像的时间和位置的时间数据和位置数据相关联,所述方法包括 基于与所述多个图像的捕获时间排序列表中的每个相邻图像对的图像相关联的所述时间数据来确定用于所述相邻图像对的时间变量; 基于与图像的排序列表中的每个相邻图像对的图像相关联的所述位置数据来确定用于所述相邻图像对的距离变量; 生成所述图像捕获设备在所述多个图像中的每个图像的捕获时间和捕获位置处的速度数据;以及 基于代价函数来将图像的排序列表划分为一个或更多个事件子集,所述代价函数是根据所述时间变量和距离变量的标准化而被确定的,其中,与所述速度数据相关地对所述时间变量和所述距离变量进行加权。
2.如权利要求I所述的方法,其中,确定速度数据的步骤包括以下步骤中的至少一个 (i)根据与所述图像相关联的元数据计算所述速度数据;以及 (ii)从速度记录设备接收所述速度数据。
3.如权利要求I所述的方法,其中,当所述图像捕获设备的速度超过预定阈值时,所述时间变量被加权得比所述距离变量更多,当所述图像捕获设备的速度低于所述预定阈值时,所述距离变量被加权得比所述时间变量更多。
4.如权利要求I所述的方法,其中,所述加权包括所述时间或距离之间的选择。
5.如权利要求4所述的方法,其中,当所述速度数据低于速度阈值时,所述加权是90%距离和10%时间,当所述速度数据高于所述速度阈值时,所述加权是100%时间。
6.如权利要求I所述的方法,其中,根据所述时间变量和所述距离变量确定所述速度数据。
7.如权利要求I所述的方法,还包括步骤根据所述图像的特性对所述多个图像进行排序,以产生图像的捕获时间排序列表。
8.如权利要求7所述的方法,其中,所述图像的特性是捕获时间、文件名称和距基准点的距离中的至少一个。
9.如权利要求I所述的方法,其中,根据所述照相机的位置的GPS日志或速度信息的周期性采样中的至少一个推导所述速度数据。
10.如权利要求I所述的方法,其中,所述代价函数是所述时间变量和所述距离变量的加权平均。
11.如权利要求10所述的方法,其中,根据所述速度数据推导用于所述时间变量和所述距离变量的加权平均的权重。
12.如权利要求I所述的方法,其中,所述图像是基于代价阈值而被划分为子集的,以使得在与图像关联的所述代价函数大于所述阈值的情况下,创建新划分的子集,在所述代价函数小于所述代价阈值的情况下,将所述图像分配给现有子集。
13.如权利要求I所述的方法,其中,根据图像的排序集合中的相邻图像推导所述时间变量和所述距离变量。
14.如权利要求13所述的方法,其中,所述时间变量包括所述相邻图像之间的时间差,所述距离变量包括所述相邻图像之间的距离度量。
15.如权利要求I所述的方法,其中,根据所述拍摄者/图像捕获设备在两个图像之间的速度以及当拍摄图像时所述捕获设备的速度中的至少ー个推导所述速度数据。
16.如权利要求I所述的方法,其中,所述标准化包括均值方差标准化、特征弯曲/直方图均衡化或最大后验概率自适应中的ー个。
17.—种上面记录有计算机程序的计算机可读非易失性存储介质,所述计算机程序能够由计算机化装置执行以执行如前述权利要求中的任一项所述的方法。
18.一种计算机化的装置,适用于执行如权利要求I至16中的任一项所述的方法。
全文摘要
图像聚类方法。公开了确定多个图像内的一个或多个事件子集的方法。每个图像与指定由图像捕获设备捕获图像的时间和位置的时间数据和位置数据相关联。该方法基于与多个图像的捕获时间排序列表中的每个相邻图像对的图像相关联的时间数据来确定用于每个相邻图像对的时间变量。然后基于与图像的排序列表中的每个相邻图像对的图像相关联的位置数据来确定用于每个相邻图像对的距离变量。该方法确定图像捕获设备在多个图像中的每个图像的捕获时间和位置处的速度数据。然后基于代价函数来将图像的排序列表划分为一个或多个事件子集,代价函数是根据时间变量和距离变量的标准化来确定的,其中,与速度数据相关地对时间变量和距离变量进行加权。
文档编号G06K9/62GK102799890SQ20121016364
公开日2012年11月28日 申请日期2012年5月24日 优先权日2011年5月24日
发明者D·J·蒙德, R·桑斯特, B·J·德雷克 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1