搜索方法、搜索程序以及搜索装置的制造方法_2

文档序号:8412514阅读:来源:国知局
查询存储单元102存储用于查询的特征向量。搜索装置100从特征值存储单元 101搜索与查询特征向量相似的特征向量。
[0041] 位串存储单元103存储从后面要描述的位串产生单元105获取的位串。图2B是 示出位串存储单元的示例数据结构的视图。如图2B中所例示的,位串存储单元103将识别 信息和位串以彼此相关联的方式进行存储。识别信息唯一地识别特征向量以根据其产生位 串。基于特征向量来产生位串。
[0042] 逆立体投影单元104a和104b通过逆立体投影来映射m维特征空间V,从而将空 间V'(其比m维高p维)中嵌入的(m+p-1)维超球体S与特征空间V相关联。注意,p是 1或更大的整数。在下面的描述中,逆立体投影单元l〇4a和104b将视情况统称为逆立体投 影单元104。逆立体投影单元104是示例投影单元。
[0043] 图3和图4是例不特征空间V和超球体S之间的关系的视图。如图3中所例不的, 通过逆立体投影的映射允许特征空间V中的点与超球体S上的点彼此相关联。在图3中例 示的示例中,特征空间V中的点x v和超球体S上的点xs彼此相关联。特征空间V与在超 球体S的北极Sn与南极S s之间连接的直线的交点定义为Xtl。例如,北极Sn的坐标是(X()1, ^,???,^ ;?,1)并且南极35的坐标是(1。1,1。2,"*,1。"1, -1)。从特征空间乂至超球体3的北 极Sn的高度定义为d。超球体S的表面与经过北极S n和点xv的直线的交点对应于xs。此 外,例如,如图4中所例示的,超球体S的截区S a对应于特征空间V的区域VA。
[0044] 这里,逆立体投影是立体投影的逆操作。当超球体S和特征空间V设置成如图3 中例示并且从北极S n绘直线以与超球体S相交时,立体投影定义为从超球体S与直线的交 点Xs映射至直线与特征空间V的交点X v。图3中例示的示例表示P的值是1的情况。
[0045] 假设,特征空间V的特征向量(坐标)是(Xl,X2,…,x m),使逆立体投影"Γ1 :V - W" 为表达式(1)。在表达式(1)中,r2通过表达式(2)来定义。
[0046]
【主权项】
1. 一种通过计算机执行的搜索方法,所述搜索方法包括: 获取在数据库中存储的第一维特征向量;以及 搜索以下参数:当所述特征向量基于包括交点和距离的所述参数而映射在球体的表 面上时,通过所述参数,要映射在所述球体的表面上的特征向量的位置集中在所述球体的 半球上,在所述交点处特征空间与经过所述球体的直线相交,所述球体存在于维度比所述 特征空间大一维或更多维的空间中,所述距离是从所述球体的预定点至所述特征空间的距 离。
2. 根据权利要求1所述的搜索方法,还包括: 通过借助于所述搜索找到的参数,将多个特征向量映射在所述球体的表面上; 根据所映射的特征向量的位置与划分所述球体的多个超平面之间的关系来产生所述 特征向量的位串;以及 基于所产生的位串来确定相似特征向量。
3. 根据权利要求1或2所述的搜索方法,其中,所述搜索搜索以下参数:该参数允许映 射在所述球体的表面上的特征向量的位置集中在所述球体的南半球、东半球或西半球上。
4. 根据权利要求1或2所述的搜索方法,其中,所述搜索基于所述特征向量的平均值和 所述特征向量的方差_协方差矩阵的特征值的最大值来搜索所述参数。
5. 根据权利要求1或2所述的搜索方法,其中,所述搜索基于所述特征向量的主分量分 析结果来识别累积贡献率曲线并且基于所述累积贡献率曲线来搜索所述参数。
6. 根据权利要求1或2所述的搜索方法,其中,所述搜索基于爬山方法、马尔可夫链蒙 特卡罗方法或群智能来搜索参数。
7. -种搜索装置,包括搜索单元,所述搜索单元获取在数据库中存储的第一维特征向 量并且搜索以下参数:当所述特征向量基于包括交点和距离的所述参数而映射在球体的表 面上时,通过所述参数,要映射在所述球体的表面上的特征向量的位置集中在所述球体的 半球上,在所述交点处特征空间与经过所述球体的直线相交,所述球体存在于维度比所述 特征空间大一维或更多维的空间中,所述距离是从所述球体的预定点至所述特征空间的距 离。
8. 根据权利要求7所述的搜索装置,还包括: 投影单元,所述投影单元通过所述搜索单元搜索的参数将多个特征向量映射在球体的 表面; 产生单元,所述产生单元根据通过所述投影单元映射在所述球体的表面上的特征向量 的位置与划分所述球体的多个超平面之间的关系来产生所述特征向量的位串;以及 识别单元,所述识别单元基于所述产生单元所产生的位串来识别相似特征向量。
9. 根据权利要求7或8所述的搜索装置,其中,所述搜索单元搜索参数,所述参数允 许映射在所述球体的表面上的特征向量的位置集中在所述球体的南半球、东半球或西半球 上。
10. 根据权利要求7或8所述的搜索装置,其中,所述搜索单元基于所述特征向量的平 均值和所述特征向量的方差_协方差矩阵的特征值的最大值来搜索所述参数。
11. 根据权利要求7或8所述的搜索装置,其中,所述搜索单元基于所述特征向量的主 分量分析结果来识别累积贡献率曲线并且基于所述累积贡献率曲线来搜索所述参数。
12. 根据权利要求7或8所述的搜索装置,其中,所述搜索单元基于所述特征向量的主 分量分析结果来识别累积贡献率曲线并且基于所述累积贡献率曲线的梯度来搜索参数。
13. 根据权利要求7或8所述的搜索装置,其中,所述搜索单元基于爬山方法、马尔可夫 链蒙特卡罗方法或群智能来搜索参数。
【专利摘要】本公开涉及一种搜索方法、搜索程序以及搜索装置。根据实施例的搜索装置基于包括节点和距离的参数将特征向量映射在超球体上,其中,在交点处m维特征空间与经过该超球体的直线相交,该超球体存在于维度比m更大的空间中,该距离是从超球体的北极至特征空间的距离。在这种情况下,搜索装置搜索允许映射在超球体上的特征向量的位置集中在超球体的预定半球上的参数。
【IPC分类】G06F17-30
【公开号】CN104731847
【申请号】CN201410697191
【发明人】野间唯, 此岛真喜子
【申请人】富士通株式会社
【公开日】2015年6月24日
【申请日】2014年11月26日
【公告号】EP2890042A1, US20150178590
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1