用于确定图像相似性的方法和系统的制作方法_6

文档序号:8303486阅读:来源:国知局
、的距离小于阔值距离。如果否,则新图像被视为不同于与现有集群 中屯、相关联的图像。然后,可W创建新图像的新集群中屯、并且新图像与新集群中屯、相关联。
[0177] 然而,如果从大哈希值至至少一个现有集群中屯、的距离小于阔值距离,则识别距 新图像的大哈希值具有最小距离的现有集群中屯、。还可选择距大哈希值为小于阔值距离的 距离的另一现有集群中屯、。在任何情况下,新图像可W与所识别的现有集群中屯、相关联。新 图像被视为与所识别的现有集群中屯、相关联的图像相似。
[017引 管理动作
[0179] 图像与集群中屯、的关联性便于社交网络系统130对相似图像采取的管理动作。图 2中的管理动作模块270可被编程为对相似图像执行去除和阻止功能。例如,在具体情况 下,当图像被视为不需要或者被另行视为不适当时,可W执行去除或者阻止功能,并且从社 交网络系统130中去除或者阻止所有相似的图像。通过遵循或者"爬行"集群中屯、及其对 应相似图像之间的相关联路径可W执行该些功能。
[0180] 在图10A至图10B中,集群中屯、1010与图像plO 1014、pll 1016相互(即,双边) 相关联。集群中线股1012与图像pl2 1018相互(即,双边)相关联。图10A示出了根据本 发明的实施方式的通过管理动作模块270所执行的删除功能。例如,如果图像plO 1014被 视为不适当,则通过遵循其从图像plO 1014至集群中屯、1010的相关联路径可W识别与图 像plO 1014相关联的集群中屯、1010。然后,通过遵循其从集群中屯、1010至图像pll 1016 的相关联路径可W识别与集群中屯、1010相关联的图像Pll 1016。类似于图像pll 1016, 按照相似方式,可W识别与图像plO 1014相似并且与集群中屯、1010相关联的所有图像。 因此,一旦识别集群中屯、1010,则管理动作可遵循从集群中屯、1010至所有相关联图像(例 如,图像plO 1014、pll 1016)的所有相关联的路径,W从社交网络系统130中删除图像。
[0181] 图10B示出了根据本发明的实施方式的通过管理动作模块270执行的阻止功能。 例如,如果图像Pl2 1018被视为不适当,则通过遵循其从图像pl2 1018至集群中屯、1012 的相关联的路径可W识别与图像Pl2 1018相关联的集群中屯、1012。与图像pl2 1018相似 的所有图像与集群中屯、1012相关联。因此,一旦识别集群中屯、1012,则通过管理动作可W 控制集群中屯、1012, W使得不能将W其他方式与集群中屯、1012相关联的任何未来相似图 像被发布到社交网络系统130中。
[0182] 在本发明的实施方式中,管理动作模块270可W执行其他功能。例如,如果社交网 络系统130许可发布相似的图像,则可W发送消息给已发布或者将发布相似图像的用户或 者对已发布或者将发布相似图像的用户采取动作。通过遵循其从感兴趣的图像至相关联的 集群中屯、的相关联路径可W识别对应于感兴趣图像的集群中屯、。因此,通过遵循其集群中 屯、的相关联路径可W识别与感兴趣图像相似的所有图像。因此,通过遵循其从各个相似图 像至相关联用户的相关联路径可W识别社交网络系统130中与相似图像相关联的用户。一 旦识别用户,则将消息发送给用户或者对用户采取动作。
[0183] 图11示出了根据本发明的实施方式的用于限制图像的使用的过程1100。最初, 在框1112中,确定第一图像的大哈希值。在框1114中,基于大哈希值确定第一图像的小哈 希值。在框1116中,确定与第一图像相关联的第一值(例如,小哈希值)和与该至少一个 图像相关联的第一集群中屯、之间的距离。在框1118中,当确定距离大于阔值距离时,第一 图像和该至少一个图像被视为不相似。在框1120中,当确定距离大于阔值距离时,创建第 二集群中屯、。在框1122中,当确定距离大于阔值距离时,第一图像与第二集群中屯、相关联。 在框1124中,当确定距离小于阔值距离时,第一图像与该至少一个图像被视为相似。在框 1126中,当确定距离小于阔值距离时,第一图像与第一集群中屯、相关联。在框1128中,基于 第一集群中屯、的识别限制第一图像和该至少一个图像的使用。
[0184] 在本发明的实施方式中,通过图像相似性分析模块132可W全部或者部分地执行 过程1100。在本发明的实施方式中,通过社交网络系统130至少可W部分地执行过程1100。
[0185] 结论
[0186] 通过各种机器和计算机系统架构W及各种网络和计算环境可W实现上述过程和 特征。图12示出了可用于实现上述所识别的计算设备中的一种或者多种的计算机系统120 的实施例。计算机系统1200包括用于致使计算机系统1200执行此处所讨论的过程和特征 的一系列指令。计算机系统1200可连接(例如,网络)至其他机器。在网络部署中,计算 机系统1200可在客户端-服务器网络环境中的服务器机器或者客户端机器的承受能力内 运行或者作为对等(或者分布式)网络环境中的对等机器运行。在本发明的实施方式中, 计算机系统1200可W是社交网络系统130、用户设备110、W及外部系统120、或者其部件。 在本发明的实施方式中,计算机系统1200可W是构成社交网络系统130的全部或者部分的 多个之中的一个服务器。
[0187] 计算机系统1200包括设及此处所描述的过程和特征的处理器1202、高速缓冲存 储器1204、W及一个或者多个可执行模块和存储在计算机可读介质上的驱动器。此外,计算 机系统1200包括高性能输入/输出(I/O)总线1206和标准I/O总线1208。主桥1210将 处理器1202禪接至高性能I/O总线1206,其中,I/O总线桥1212使两个总线1206和1208 彼此禪接。系统存储器1214与一个或者多个网络/通信接口 1216禪接至总线1206。计算 机系统1200可进一步包括视频存储器和禪接至视频存储器(未示出)的显示设备。大容 量存储器1218和I/O端口 1220禪接至总线1208。计算机系统1200可选地包括键盘和定 点设备、显示设备、或者禪接至总线1208的其他输入/输出设备(未示出)。总之,该些元 件旨在表示计算机硬件系统的广义分类,其中包括但不限于基于由加利福巧亚圣克拉拉因 特尔公司制造的x86-兼容处理器和基于由加利福巧亚森巧韦尔超微半导体(AMD)公司制 造的兼容处理器的计算机系统W及任何其他合适的处理器。
[0188] 操作系统管理并且控制计算机系统1200的操作,其中包括将数据输入到软件应 用程序(未示出)并且从软件应用程序输出数据。操作系统提供在系统上执行的软件应用 程序与系统的硬件部件之间的接口。可W使用任何合适的操作系统,诸如,LINW(操作系统、 从加利福巧亚库比蒂诺(化pedino)苹果电脑公司可商购的Apple Macintosh操作系统、 UNIX操作系统、Microsof愧)Windows⑩操作系统、BSD操作系统等。其他实施方式是可 能的。
[0189] 下面将更为详细地描述计算机系统1200的元件。具体地,网络接口 1216提供计 算机系统1200与大量网络中的任一个之间的同学,诸如,W太网(例如,16邸802.3)网络、 底板等。大容量存储器1218提供用于数据和编程指令的永久存储器W执行通过上述识别 的相应计算系统所实现的上述所述过程和特征,其中,系统存储器1214(例如,DRAM)提在 被处理器1202执行时提供用于数据和编程指令的临时存储器。I/O端口 1220可提供 额外外围设备之间的通信的禪接至计算机系统1200的一个或者多个串联和/或并联通信 端口。
[0190] 计算机系统1200可包括各个系统架构并且可重新布置计算机系统1200的各个部 件。例如,高速缓冲存储器1204可W与处理器1202位于巧片上。可替代地,可W将高速缓 冲存储器1204和处理器1202 -起打包成"处理器模块",且处理器1202被称之为"处理器 核屯、"。而且,本发明的特定实施方式既不需要也不包括所有的上述部件。例如,禪接至标 准I/O总线1208的外围设备可禪接至高性能I/O总线1206。此外,在一些实施方式中,仅 存在单一的总线,且计算机系统1200的部件被禪接至单一总线。而且,计算机系统1200可 包括诸如额外处理器、存储设备、存储器等额外的部件。
[0191] 总之,此处所描述的过程和特征可被实施为操作系统或者具体应用程序的一部 分、部件、程序、对象、模块、或者被称之为"程序"的一系列指令。例如,可W使用一个或者 多个程序执行此处所描述的具体过程。通常,程序包括计算机系统1200中的各个存储器和 存储设备中的一个或者多个指令,该一个或者多个指令在由一个或者多个处理器读取或者 执行时,致使计算机系统1200执行操作W执行此处所描述的过程和特征。在软件、固件、硬 件(例如,专用集成电路)、或者其任一组合中可W实现此处所描述的过程和特征。
[0192] 在一种实施方式中,此处所描述的过程和特征被计算机系统1200实施为独自或 者统一在分布式计算环境中运行的一系列可执行模块。通过硬件、存储在计算机可读介质 上的可执行模块(或者机器可读介质)、或者两者的组合可W实现上述模块。例如,模块可 包括由硬件系统中的处理器(诸如,处理器1202)执行的多个或者一系列指令。最初,该系 列指令可被存储在存储设备上,诸如,大容量存储器1218。然而,该系列指令可被存储在任 何合适的计算机可读存储介质上。而且,该系列指令不需要存储在网络的服务器本机上并 且可经由网络/通信接口 1216从远程存储设备接收。指令从诸如大容量存储器1218等存 储设备被复制到存储器1214中并且然后被处理器1202访问和执行。
[0193] 计算机可读介质的实施例包括但不限于可记录类型的介质,诸如,易失性和非易 失性存储设备、固态静止存储器、闪存和其他可换式磁盘、硬磁盘驱动、磁性介质、光盘(例 如,紧凑磁盘-只读存储器)(CD ROMS)、数字通用盘值VD))、其他相似的非易失性(或者易 失性)有形(或者无形)存储介质、或者适用于存储、编码、或者携带由计算机系统1200执 行的一系列指令W执行此处所描述的过程和特征中的任一种或者多种的任何类型的介质。
[0194] 出于说明性之目的,规定了多种具体细节W提供对本说明书的完全理解。然而, 对本领域技术人员显而易见的是,在没有该些具体细节的情况下可W实现本公开的实施方 式。在一些情况下,W框图形式示出了模块、结构、过程、特征、化及设备,W避免使本说明书 变得模糊。在其他情况下,示出了表示数据和逻辑流的功能框图和流程图。可W各种形式 组合、分离、移除、记录、并且W不同于明确描述和此处描述的方式替换框图和流程图中的 部件(例如模块、块、接口、设备、特征等)。
[0195] 在本说明书中,参考"一种实施方式"、"实施方式"、"其他实施方式"等指结合本 公开的至少一种实施方式中包括的实施方式所描述的具体特征、设计、结构、各种特性。例 如,在本说明书中的各个地方中出现的短语"在一种实施方式中"或者"在实施方式中"并 不一定必须全部指同一种实施方式,也不是排除其他实施方式相互独立或者可替代的实施 方式。而且,无论是否明确参考"实施方式"等,都描述了 W各种形式组合并且包括在一些 实施方式中、但在其他实施方式中也W不同形式省去的各种特征。同样,描述了在一些实施 方式中可优选或者需要而在其他实施方式中不是如此的各种特征。
[0196] 原理上,出于可读性和指示性之目的,选择了此处所使用的语言,并且其不被选择 为描绘或者限制本发明主题。因此,旨在不由细节描述限制本发明的范围,而是由基于此的 申请中发布的任何权利要求限制本发明的范围。因此,本发明的实施方式的公开内容旨在 为示出性,而不是限制下列权利要求中固定的本发明的范围。
【主权项】
1. 一种计算机实现方法,用于确定图像相似性,具体地,用于确定社交网络系统中的图 像之间的相似性,包括: 通过包括至少一个处理器的计算机系统确定与第一图像相关联的第一值和与至少一 个图像相关联的第一集群中心之间的距离;并且 当所确定的距离大于阈值距离时,通过所述计算机系统确定所述第一图像与所述至少 一个图像不相似。
2. 根据权利要求1所述的方法,进一步包括在所确定的距离大于所述阈值距离时创建 第二集群中心,优选地,进一步包括在所确定的距离大于所述阈值距离时使所述第一图像 与所述第二集群中心相关联。
3. 根据权利要求1或权利要求2所述的方法,进一步包括在所确定的距离小于所述阈 值距离时确定所述第一图像与所述至少一个图像相似,优选地,进一步包括在所确定的距 离小于所述阈值距离时使所述第一图像与所述第一集群中心相关联。
4. 根据权利要求1至3中任一项所述的方法,进一步包括: 识别与所述第一值相关联的贮存区; 识别与所述贮存区相关联的至少一个集群中心,所述至少一个集群中心包括所述第一 集群中心;并且 针对所述至少一个集群中心评估所述第一值。
5. 根据权利要求1至4中任一项所述的方法,进一步包括: 识别多个贮存区; 识别与所述多个贮存区相关联的至少一个集群中心,所述至少一个集群中心包括所述 第一集群中心;并且 针对所述至少一个集群中心评估所述第一值。
6. 根据权利要求5所述的方法,其中,所述多个贮存区包括接近所述第一值的小哈希 值的预定数目的贮存区,其中具体地,相邻贮存区的所述预定数目为2 d,其中,d是所述第一 值的坐标系的维度的数量。
7. 根据权利要求1至6中任一项所述的方法,进一步包括: 量化与所述第一图像相关联的所述第一值的小哈希值; 基于所量化的小哈希值识别至少一个贮存区;并且 基于所述至少一个贮存区搜索与所述第一图像相似的图像。
8. 根据权利要求1至7中任一项所述的方法,其中,与所述第一图像相关联的所述第一 值是大哈希值和小哈希值中的至少一个。
9. 根据权利要求8所述的方法,进一步包括基于应用于所述第一图像的所述大哈希值 的小哈希函数确定所述第一图像的所述小哈希值,其中优选地,所述小哈希函数将所述大 哈希值的维度的数量减少至预定的维数。
10. 根据权利要求9所述的方法,其中,所述小哈希函数是局部敏感哈希函数。
11. 根据权利要求1至10中任一项所述的方法,进一步包括基于应用于所述第一图像 的内容感知哈希函数确定所述第一图像的所述大哈希值和/或其中所述阈值距离是可编 程的。
12. 根据权利要求1至11中任一项所述的方法,进一步包括: 使贮存区与多个集群中心相关联;并且 使所述多个集群中心中的每个集群中心与被视为相似的至少一个图像相关联。
13. 根据权利要求1至12中任一项所述的方法,进一步包括: 当所确定的距离小于所述阈值距离时,使所述第一图像与所述第一集群中心相关联; 并且 具体地,在所述社交网络系统内,基于所述第一集群中心的识别限制使用所述第一图 像和所述至少一个图像,例如,限制、防止、或者移除所述社交网络系统中的所述图像的记 录。
14. 一种用于确定图像相似性的系统,具体地,用于确定社交网络系统中的图像之间的 相似性,包括: 至少一个计算机系统,具有至少一个处理器;和 存储器,存储被配置为指示所述至少一个处理器执行根据权利要求1至13中任一项所 述的方法的指令。
15. -种计算机存储介质,存储在被执行时使计算机系统或者计算机系统的至少一个 处理器执行根据权利要求1至13中任一项所述的计算机实现方法的计算机可执行指令。
【专利摘要】确定图像相似性的技术。在一种实施方式中,确定与图像相关联的小哈希值落在贮存区内。如果现有的集群中心与贮存区相关联,则确定小哈希值与集群中心之间的距离。如果小哈希值至集群中心的距离大于阈值距离,则视为图像不同于与集群中心相关联的其他图像。然后,创建新的集群中心并且使新的集群中心与贮存区相关联,并且使该图像与新的集群中心相关联。当具有落在贮存区内的小哈希值的图像被视为不相似时,则一个以上的集群中心可与贮存区相关联。在另一实施方式中,一旦识别贮存区,则可确定大哈希值而非小哈希值与集群中心之间的距离,以评估图像相似性。
【IPC分类】G06T1-00, G06T7-00
【公开号】CN104620284
【申请号】CN201380046933
【发明人】艾萨克·晁
【申请人】脸谱公司
【公开日】2015年5月13日
【申请日】2013年7月5日
【公告号】CA2876585A1, EP2685404A2, US8849047, US20140016872, US20140369609, WO2014011495A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1