1.一种基于迭代批量删点框架的SimRank前k个最相似点对计算方法,其特征在于:构建迭代批量删点框架,每次迭代中首先判断出非候选点,在精确计算前删除非候选点来得到前k个最相似点对。
2.如权利要求1所述的基于迭代批量删点框架的SimRank前k个最相似点对计算方法,其特征在于,所述构建迭代批量删点框架包括以下步骤:
(1)初始化各变量,并将步长控制变量i设为0;
(2)开始迭代,首先判断i是否达到规定步数;若没有,则i增加1,计算每个点与其它点的i步内SimRank值;
(3)当所有点的i步内SimRank值完成计算后,保存前k个i步内SimRank值及其对应点对,选取第k个i步内SimRank值作为阈值;
(4)计算每个点的上界,并与阈值比较:若小于或等于阈值,则作为非候选点删除,反之,进入下一轮迭代;
(5)重复(2)至(4)步,直到i达到要求步数;
(6)返回前k个点对。
3.如权利要求2所述的基于迭代批量删点框架的SimRank前k个最相似点对计算方法,其特征在于,所述上界计算公式为:
其中UB(v)代表了点v的上界,*代表除点v以外的点,max{Sl(v,*)}代表了到当前迭代为止,包含有点v的点对的最大相似度的值,l为当前迭代次数,ξ和c分别最大步长和衰减因子。