搜索方法、搜索程序以及搜索装置的制造方法

文档序号:8412514阅读:308来源:国知局
搜索方法、搜索程序以及搜索装置的制造方法
【技术领域】
[0001] 本文所公开的实施例涉及搜索方法等。
【背景技术】
[0002] 例如,为了认证各种系统的用户,而获取用户的生物统计信息,然后,确定与所获 取的生物统计信息匹配的生物统计信息是否已被数据库所预先记录并且能在该数据库中 找到。这里,由于在认证时要获取的生物统计信息很少完全匹配在登记时获取的生物统计 信息,所以能够有效地执行相似性搜索。
[0003] 为了表达用于执行相似性搜索的相似性等级,可使用将生物统计信息的特征值 转换成散列向量(hash vetor)的技术。该技术将具有相近汉明距离(close hamming distance)的散列向量的每条生物统计信息识别为相似生物统计信息。
[0004] 传统技术已采用超平面将特征值转换成散列向量。然而,还可使用采用超球体将 特征值转换成散列向量的技术,并且期望使用超球体的技术实现精度改善。
[0005] 引用文献列表
[0006] 专利文献
[0007] 专利文献1 :日本已公开专利公布第2011-100395号
[0008] 专利文献2 :日本已公开专利公布第2012-160047号
[0009] 专利文献3 :日本已公开专利公布第2011-39755号
[0010] 非专利文献
[0011] 非专利文献 I : Jae-Pil Heo, Youngwoon Lee, Junfeng He, Shih-Fu Chang, and Sung-Eui Yoon, "Spherical hashing",in CVPR,pp. 2957-2964,2012。
[0012] 非专利文献 2 :Kengo Terasawa and Yuzuru Tanaka, "Spherical Ish for approximate nearest neighbor search on unit hyper-sphere^,in Frank K. H. A. Dehne, Jorg-Rudiger Sack, and Norbert Zeh, editors, WADS, Vol. 4619 of Lecture Notes in Computer Science,pp.27-38. Springer, 2007。
[0013] 然而,前述传统技术引起了利用超球体计算散列向量将导致计算量增加的问题。
[0014] 此外,当利用超球体将特征向量转换成散列向量时,虫孔(wormhole)可以引起甚 至明显不同的特征向量,从而在转换成散列向量后具有缩短的汉明距离。由于这个原因,那 些不同的特征向量会被错误地确定为相似特征向量。
[0015] 因此,本发明的一个实施例的一个方面的目的是提供一种以简单方式利用超球体 实现要执行的相似性搜索的搜索方法、搜索程序以及搜索装置。

【发明内容】

[0016] 根据实施例的一个方面,一种搜索方法包括:获取在数据库中存储的第一维特征 向量;以及搜索以下参数:当特征向量基于包括交点和距离的所述参数映射在球体的表面 上时,通过所述参数,要映射在所述球体的表面上的特征向量的位置集中在所述球体的半 球上,在该交点处特征空间与经过该球体的直线相交,,该球体存在于维度比该特征空间大 一维或更多维的空间中,该距离是从球体的预定点至该特征空间的距离。
【附图说明】
[0017] 图1是例示根据第一实施例的搜索装置的配置的功能块图。
[0018] 图2A是例示特征值存储单元的示例数据结构的视图。
[0019] 图2B是例示位串存储单元的示例数据结构的视图。
[0020] 图3是例示特征空间V与超球体S之间的关系的第一视图。
[0021] 图4是例示特征空间V与超球体S之间的关系的第二视图。
[0022] 图5是例示通过根据第一实施例的搜索装置所执行的过程的流程图。
[0023] 图6是例示根据第一实施例的参数识别处理的过程的流程图。
[0024] 图7是例示在无限远点周围的捷径(shortcut)的说明视图。
[0025] 图8是例示通过逆立体投影将特征向量映射在超球体的东半球上的参数的示例 的视图。
[0026] 图9是例示通过逆立体投影将特征向量映射在超球体的西半球上的参数的示例 的视图。
[0027] 图10是例示根据第二实施例的搜索装置的配置的功能块图。
[0028] 图11是例示近似直线的示例的视图。
[0029] 图12是例示根据第二实施例的参数识别处理的过程的流程图。
[0030] 图13是例示根据第三实施例的搜索装置的配置的功能块图。
[0031] 图14是例示通过爬山搜索而执行的参数识别处理的过程的流程图。
[0032] 图15是例示通过马尔可夫链蒙特卡罗方法执行的参数识别处理的过程的流程 图。
[0033] 图16是例示通过群智能执行的参数识别处理的过程的流程图。
[0034] 图17是例示目标函数的过程的示例的流程图。
[0035] 图18是例示用于执行搜索程序的计算机的示例的视图。
【具体实施方式】
[0036] 将参考附图来解释本发明的优选实施例。注意,本发明不限于这些实施例。
[0037] [a]第一实施例
[0038] 将描述根据第一实施例的搜索装置的配置的示例。图1是例示根据第一实施例的 搜索装置的配置的功能块图。如图1中所例示的,搜索装置100包括特征值存储单元101、查 询存储单元102、位串存储单元103、逆立体投影单元104a和104b以及位串产生单元105a 和105b。搜索装置100还包括超平面放置单元106、转换规则产生单元107、参数设置单元 108、汉明距离计算单元109以及相似向量识别单元110。
[0039] 特征值存储单元101存储多个特征向量。图2A是例示特征值存储单元的示例数 据结构的视图。如图2A中所例示的,特征值存储单元101将识别信息和特征向量以彼此相 关联的方式进行存储。识别信息唯一地识别特征向量。特征向量例如是从用户的生物统计 信息中获得的m维特征值数据。为了从生物统计信息确定特征值,可以采用任意传统技术。
[0040]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1