基于双向图分割与互惠式推理的大规模实体对齐方法

文档序号:28915825发布日期:2022-02-16 10:32阅读:131来源:国知局
基于双向图分割与互惠式推理的大规模实体对齐方法

1.本发明涉及知识图谱技术领域,特别是大规模知识图谱融合技术领域,尤其涉及基于双向图分割与互惠式推理的大规模实体对齐方法。


背景技术:

2.知识图谱作为一种有效的组织和存储数据的方式,近年来得到了持续的关注。知识图谱在组织知识以及下游任务中(如推荐系统,信息检索,问答系统等)扮演着愈发重要的角色。一个知识图谱很难达到完整,因为总有新出现的数据和知识。为了增加知识图谱的规模和覆盖率,一个可行的办法是从其他的知识图谱中引入数据。而实体对齐在这个过程中扮演重要的角色。实体对齐旨在找到不同知识图谱中指向同一真实世界事物。虽然已经有一系列的方法被提出,它们大部分都是在小规模数据集上进行评测,无法处理大规模数据。
3.实体对齐旨在找到不同知识图谱中指向同一真实世界物体的实体。总的来说,当前实体对齐的方法主要可以分为两个阶段,一个是表示学习,一个是对齐推理。大部分的工作主要针对前者,利用不同的知识图谱表示模型,如transe 和图卷积神经网络(gcn),学习实体的表示。接着利用标注好的实体对,链接两个知识图谱的向量表示,将它们投射到一个联合向量空间中。而对齐推理阶段则旨在利用学到的联合实体向量预测实体对齐的结果。给定源知识图谱中的一个实体,当前的方法采取直接实体对齐,将目标知识图谱中的实体进行排序,并认为离其最近的目标实体是对应的实体。
4.虽然当前的方法在提升实体对齐效果方面已经取得了一定的进展,但这些模型往往需要大量的参数以及过度的计算资源。因此,对齐效果的提升往往意味着模型可扩展性的下降,即这些方法并不适合于大规模知识图谱。比如,文献中提到,在dwy100k数据集上(约20万个实体),大部分的方法需要超过20000 秒的运行时间,并且有些方法甚至还无法生成实验结果。因此,对大规模实体对齐的研究十分重要。大规模实体对齐也顺应了当前数据管理领域对自动决策系统的可应答的设计,发展,利用以及分析研究。
5.受传统图分割算法的启发,一种可行的方法是将大规模的知识图谱对分割成小规模的子图对,进而在子图对上进行实体对齐。然而,将知识图谱对进行分割的过程并不简单,需要满足两个目标:(1)原本的知识图谱结构需要尽可能的保留;(2)分割得到的源知识图谱和目标知识图谱需要能够匹配上。换句话说,对等的源和目标实体应该被分割到同一个子图对中。虽然第一个目标能通过传统的图分割方法,如metis,来实现,第二个目标只存在于实体对齐任务中。
6.为达到第二个目标,可利用种子实体对帮助指引分割过程。种子实体对是预先标注好的实体对,其中的对应的实体是对等的。理想状态下,如果能够在分割过程中保留这些种子实体对,并将它们分布到更小的子图对中,剩下的未对齐实体也能因为与种子实体对的连接关系被分到同一子图对中,因为对等的实体往往具有非常相似的结构信息。根据此想法,一个同期的方法提出了一个初始的工作metis-cps(简称cps)。它首先将源知识图谱
分割成多个子图。接着,根据种子实体的分布,它重新给目标知识图谱的边赋予合适的权重,接着再对其进行分割。然而,这类方法(单向分割方法)往往很难满足第一个目标,因为对第二个知识图谱的分割受限于保留种子实体对这一约束,进而在某种程度上会破坏知识图谱的结构。


技术实现要素:

7.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明公开了基于双向图分割与互惠式推理的大规模实体对齐方法,所述方法提出基于种子实体对的双向图分割算法(简称sbp),通过进行双向的图分割并整合源到目标以及目标到源的分割结果来生成最终的子图对,而后提出互惠式对齐推理策略,将实体对齐任务建模成互惠推荐过程,作用于两个层次:(1)实体偏好建模,将另一侧的对齐影响整合到一侧的实体的偏好中,以生成更准确的实体偏好得分;(2)双向偏好聚合,将双向的偏好进行整合,生成互惠偏好矩阵,以更好的建模实体的互惠偏好,这样两级的互惠建模与传统的直接对齐推理相比,能够取得更好的效果。
8.本发明公开了基于双向图分割与互惠式推理的大规模实体对齐方法,包括以下步骤:
9.步骤1,获取源知识图谱和目标知识图谱数据;
10.步骤2,对源知识图谱和目标知识图谱进行图分割,获得一组源子图和目标子图的子图对;
11.步骤3,利用实体结构的表示学习模型获得所有子图对中的联合实体表示;
12.步骤4,在对每一个子图对中的子图进行互惠式对齐推理,获得子图对的对齐结果;
13.步骤5,聚合所有子图对的对齐结果,获得源知识图谱和目标知识图谱的对齐结果;
14.具体地,步骤4中采用互惠式对齐推理,包括以下步骤:
15.步骤401,偏好建模,给定一个实体对(u,v),将u对v的偏好分数定义为:
16.p
u,v
=sim(u,v)-max{sim(v,u

),u

∈εs}+1,
17.其中0≤p
u,v
≤1,sim(,)表示实体对的相似度得分,εs表示源知识图谱中的实体集合,u

为εs中的一个元素;由此,获得源到目标的偏好得分矩阵p
s,t
和目标到源偏好得分矩阵p
t,s

18.步骤402,偏好聚合,聚合两个偏好得分矩阵来捕获实体的相互偏好并生成最终的互惠偏好矩阵:
[0019][0020]
其中φ是一个聚合函数,所述的互惠偏好矩阵中的每个元素代表一对实体u和v之间的相互偏好程度,而值越大,偏好程度越高。
[0021]
步骤403,根据互惠偏好矩阵,对于每一个源实体,将它最互惠偏好且互惠偏好超过预设阈值的目标实体预测为其对应的目标实体,获得对齐结果。
[0022]
优选地,步骤2中所述的图分割采取基于种子实体对的双向图分割策略,包括以下步骤:
[0023]
步骤201,进行源到目标的图分割,得到一组源知识图谱子图和一组目标知识图谱子图;
[0024]
步骤202,进行目标到源的图分割,得到第二组源知识图谱子图和第二组目标知识图谱子图;
[0025]
步骤203,找到两组源知识图谱中对应的子图,将它们聚合,得到一组聚合后的源知识图谱子图;找到两组目标知识图谱中对应的子图,将它们聚合,得到一组聚合后的目标知识图谱子图;
[0026]
步骤204,对于聚合后的每一个源知识图谱子图,在聚合后的目标知识图谱子图中找到包含最多种子实体对的对应的目标子图,生成一个子图对。
[0027]
优选地,步骤2中所述的基于种子实体对的双向图分割策略采用迭代式分割方法,包括以下步骤:
[0028]
步骤205,通过步骤204将知识图谱划分为k个子图对后,在每个子图对中进行实体对齐;
[0029]
步骤206,将子图对生成的对齐结果进行聚合,得到暂时的实体对齐结果;
[0030]
步骤207,将置信度较高的暂时的实体对齐结果,看作是伪标注数据,利用双向最邻近搜索选择这些实体对,并将它们加入到种子实体对中以用于后续轮次分割。
[0031]
优选地,步骤5中所述的聚合的过程中,对于被多个子图对匹配上不同的目标实体的源实体,得到票数最多的目标实体为该源实体最后的对齐结果,如果多个目标实体有同样的票数,将该源实体对齐到具有最低相互互惠偏好值的目标实体。
[0032]
具体地,步骤2中所述的图分割采用单向分割方法cps(collaborativepartitionstrategy,联合分割策略)。
[0033]
具体地,步骤402中的φ聚合函数采用算术平均值进行聚合。
[0034]
具体地,步骤3中所述的表示学习模型采用rrea(relationalreflectionentityalignment,基于关系映射的实体对齐)模型或者gcn(graphconvolutionalnetwork,图卷积网络)模型。
[0035]
与现有方法相比,本发明方法的优点在于:
[0036]
(1)本发明方法提出了一种基于种子实体对的双向图分割策略的算法,通过进行双向的图分割并整合源到目标以及目标到源的分割结果来生成最终的子图对;该方法主要动机如下:对于首先分割的知识图谱,得到的子图有更完整的结构,而对于后分割的知识图谱,得到的子图主要是为了保留种子实体对。因此,通过进行双向的分割和聚合,最终的子图对能够拥有更完整的结构以及更多的种子实体对,进而能够生成更准确的实体对齐结果;
[0037]
(2)提出了互惠式对齐推理策略,这是因为常用的直接对齐推理只考虑源实体与目标实体的相似度,忽略了其它影响因素;以及无法整合双向的实体相似度并刻画双向偏好,在做对齐决策的过程中,直接对齐推理方法往往会生成一堆不准确的对齐结果;两级的互惠建模与传统的直接对齐推理相比,能够取得更好的对齐效果;
[0038]
本发明方法是一个新的具有高可拓展性的实体对齐的框架,能够高效处理大规模实体对齐,且能够用在当前的实体对齐模型上,比如最常用的gcn表示学习模型和当前效果最好的rrea表示学习模型,以提升它们处理大规模数据的效果。
附图说明
[0039]
图1示出了本发明实施例的流程示意图;
[0040]
图2示出了本发明实施例的单向图分割和双向图分割流程示意图;
[0041]
图3示出了本发明实施例的互惠式推理的计算示例。
具体实施方式
[0042]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0043]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0044]
一个知识图谱通常表示为其中ε是实体集合,是关系集合,而一个三元组(s,r,o)表示一个头实体s∈ε与一个尾实体o∈ε通过关系相连接。实体对齐的输入包括两个待对齐的知识图谱(源知识图谱和目标知识图谱),一组标注好的实体对其中代表相等,εs,ε
t
代表源知识图谱和目标知识图谱里的实体集合。目标是要从剩下的实体中找到对等的实体。
[0045]
如图1所示,本发明实施例的基于双向图分割与互惠式推理的大规模实体对齐方法,包括以下步骤:
[0046]
步骤1,获取源知识图谱和目标知识图谱数据;
[0047]
步骤2,对源知识图谱和目标知识图谱进行图分割,获得一组源子图和目标子图的子图对;
[0048]
步骤3,利用实体结构的表示学习模型获得所有子图对中的联合实体表示;
[0049]
步骤4,在对每一个子图对中的子图进行互惠式对齐推理,获得子图对的对齐结果;
[0050]
步骤5,聚合所有子图对的对齐结果,获得源知识图谱和目标知识图谱的对齐结果。
[0051]
在大规模图数据上进行横向扩展计算的一种常见方法是对图数据进行分块,并在分布式机器集群上进行并行化计算。在这项工作中,一般采用这类方法,将知识图谱对划分为更小的子图对,对齐每个子图对中的实体,并将每个分区中的对齐结果聚合以生成最终的实体对齐结果。
[0052]
常用的图分块工具metis可以作为基本的分块方法。metis算法思想主要基于多级图划分,它通过折叠节点和边来减小图的大小,划分得到较小的图,然后对其进行粗化以构造原始图的分块。其目标是构建一个平均的节点分块,将节点均分到多个分块,从而使跨越分块的边的数量最小。然而,与传统任务中只有一个大图不同,在实体对齐任务中,有两个单独的大图,以及连接这两个图的少量种子实体对。虽然可以通过种子实体对相互连接,将两个图合并成一个图,直接用metis进行分块。然而这很可能生成仅包含源(或目标)实体的子图。而这违背了实体对齐的目标,因为其旨在找到知识图谱之间的等价实体。因此,为了满足实体对齐的要求,在本实施例中提出了面向种子实体对的图分区策略。
[0053]
本实施例中首先介绍基于种子实体对的单向图分割策略作为基本模型,接着仔细介绍本实施例提出的双向分割框架以及它的迭代式变种。
[0054]
基于种子实体对的单向图分割
[0055]
单向的图分割策略仅仅只考虑到源到目标的这一单向的知识图谱分割,将源知识图谱和目标知识图谱分割成k个子图对,其中每个子图对中包含一个源知识图谱的子图,一个目标知识图谱的子图,以及一组两子图间的种子实体对集合。具体来说,本实施例采用一种当前已有的效果最好的单向分割方法,cps,作为基本模型。
[0056]
cps首先利用metis直接将源知识图谱分割成k个源子图。其中每个子图包含一些来自于种子实体对的种子源实体。cps仍然使用metis分割目标知识图谱,除了它给对应种子源实体在同一个子图的种子目标实体间的连边赋予更高的权重,进而促使metis将这些种子目标实体放在同一子图中,同时尽量保留图的原本结构;它给对应种子源实体不在同一个子图的种子目标实体间的连边赋予权重0,以避免将这些种子目标实体放在同一个子图中,因为它们所对应种子源实体本身不在同一个子图中。
[0057]
这样将目标知识图谱进行分割同样也得到k个目标子图。接着,给定每一个源子图,将与其种子源实体对应的种子目标实体数量最多的目标子图作为匹配的目标子图,并认为它们是一个子图对,而它们之间的种子实体对则是两子图的链接。
[0058]
如图2所示,有两个知识图谱需要对齐(kgs和kg
t
),其中两个知识图谱之间的长线表示种子实体对的链接关系,而其中的种子实体以灰色表示。下标相同的实体是等价的。
[0059]
cps执行一次性的源到目标分区。它首先对kgs进行分区,得到框左侧所示的两个源子图,包括{u1,u2,u3,u4}和{u5,u6,u7,u8,u9}。接下来,当对kgt进行分割时,考虑到种子源实体u1和u4在同一个子图中,而u4和u7不在同一个子图中,因此将v1和v4之间的边的权重增加,并且将v4和v7之间的边的权重设置为0。进而kg
t
被划分为框右侧所示的两个子图,包括{v1,v2,v3,v4,v5}和{v6,v7,v8,v9}。最后,使用种子实体对作为锚点,生成两个子图对,即图中cps下的c1和c2。
[0060]
基于种子实体对的双向图分割
[0061]
不难发现,单向分割策略,如cps,对源知识图谱的分割可以很好的保留源知识图谱的图结构,而对于目标知识图谱的分割则受到保留种子实体对这一约束,可能在一定程度上破坏目标知识图谱结构。为此,本实施例提出了基于种子实体对的双向图分割策略,简称sbp。具体来说,其首先进行源到目标的图分割,这一过程可以采用任何的单向分割策略,进而得到一组源知识图谱子图以及一组目标知识图谱子图。接着进行目标到源的分割,得到另一系列的源知识图谱子图和目标知识图谱子图。接下来,找到这两组源知识图谱子图中相对应的子图,并将它们聚合,得到一组聚合后的源子图。同样的,得到一组聚合后的目标子图。最后,对于聚合后的每一个源子图,在目标子图中找到包含最多种子实体对的对应的目标子图,进而生成一个子图对。
[0062]
继续上述例子。除了源到目标的分割,sbp同时进行目标到源的分割,生成了两个目标子图{v1,v2,v3,v4,v7}和{v5,v6,v8,v9},以及两个源子图{u1,u2,u3,u4, u5,u7}和{u6,u8,u9}。接下来,它识别并组合由源到目标和目标到源过程中生成的相应源(目标)子图。例如,根据重叠源种子实体的数量,识别出源到目标分割中生成的{u1,u2,u3,u4}源子图和目标到源分割中生成的{u1,u2,u3,u4,u5,u7} 源子图是相对应的,进而聚合这两个源子图生成{u1,
u2,u3,u4,u5,u7}。其他的源子图和目标子图也通过类似方式进行聚合。最后以种子实体对为链接,生成两个子图对,如上图最右边的方框sbp所示。
[0063]
注意到,在cps的分割结果中,对等的实体可能被放置于不同的子图对中,如u5和v5。而sbp可以有效缓解这个问题,因为它进行双向分割并聚合分割结果。因此,尽管sbp的划分结果是冗余的(即一个实体可能存在于多个子图对中),它可以有效规避将对等实体放置在不同子图对中。
[0064]
双向分割的好处。值得注意的是,在分割过程中,先分割的知识图谱主要为保留其原本的知识图谱结构,而后分割的知识图谱则同时为保留其原本知识图谱结构以及图谱间的种子实体对。因此,通过聚合两种方式生成得到的子图既具有更完整的结构,也拥有更多的指向另一侧的种子实体对,进而能生成更多更准确的对齐结果。
[0065]
此外,和单向分割不同,双向分割得到的子图中可能有重复的实体。这是因为分割过程无法避免的会将对等的实体分割到不同的子图中,进而限制了对齐结果的上限(考虑到对齐是在子图对中进行),而双向分割策略能够将一个实体放入多个子图对中,进而提升该上限。
[0066]
子图级别的对齐结果整合。前面提到,单向分割得到的结果并不冗余,因此最终的实体对齐结果可以通过直接聚合子图上的对齐结果得到。然而,本实施例提出的双向分割策略所生成的子图中可能有重复的实体,需要设计一个额外的结果整合模块以消解可能出现的冲突。相应的,本实施例采用了一个简单的投票策略来解决这个问题。具体来说,对于被多个子图对匹配上不同的目标实体的源实体,本实施例认为得到票数最多的目标实体为该源实体最后的对齐结果。如果多个目标实体有同样的票数,将该源实体对齐到具有最低相互偏好值的目标实体。
[0067]
迭代式双向图分割
[0068]
不难发现,无论单向分割或者双向分割,一次性的分割策略往往会产生不准确的分割结果,即对等的实体可能被放在不同的子图对中,而原本的知识图谱结构也可能被一定程度的破坏。因此,扩展sbp,本实施例提出一个迭代式的框架,i-sbp,通过利用前些轮次得到的对齐结果对知识图谱重新划分,并持续一定轮次。具体来说,在每一轮,利用sbp将知识图谱划分为k个子图对,并且在每个子图对中进行实体对齐。接着,将子图对生成的对齐结果进行聚合,得到最终的实体对齐结果。考虑到最终的实体对齐结果中存在置信度比较高的结果,能够被看作是伪标注数据,利用双向最邻近搜索选择这些实体对,并将它们加入到种子实体对中以用于后续轮次分割。
[0069]
互惠式对齐推理
[0070]
将大规模的知识图谱对划分为较小的子图对后,对每个子图对中的子图进行对齐并聚合各子图对的对齐结果。首先简要介绍表示学习过程。接着,考虑到对双向对齐间的交互进行建模有利于对齐推理过程,提出了一种互惠推理策略,用以偏好建模和聚合双向的实体偏好。
[0071]
实体结构表示学习阶段旨在对实体的结构信息进行建模,并将不同知识图谱的实体投射到一个统一的嵌入空间中,进而通过对实体结构嵌入的比较,可直接推断出实体之间的等价性。大多数实体对齐方法专注于优化表示学习模型进而提升实体对齐结果。然而,这一部分不是本实施的重点,因为本实施例方法旨在提升对齐推理过程以及提升实体对齐
模型处理大规模数据集的能力。事实上,本实施例设计的方法与表示学习模型的选择无关。可以采用当前最好的实体对齐表示学习模型,rrea,还可以采用了实体对齐文献中最常用的模型gcn 作为基本模型。
[0072]
偏好建模
[0073]
在通过实体结构表示模型学到联合实体表示后,可通过计算实体偏好进行推理得到对齐结果。对于每一个源实体,可将它最偏好的目标实体预测为其所对应的目标实体。
[0074]
直接对齐推理。之前的工作在实体偏好建模的过程中仅仅只考虑到实体表示间的相似度,这类方法称之为直接对齐推理方法。给定一个实体对(u,v),定义它们之间的相似度得分为sim(u,v),其中粗体是实体的向量表示。那么相应的相似度矩阵表示为s。对于直接对齐推理,u对于v的偏好得分定义为:
[0075]
p
u,v
=sim(u,v).
[0076]
通过这个定义,可以得到p
u,v
=p
v,u
,因为这些相似度指标往往是对称的,并不区分输入的元素顺序。
[0077]
互惠式对齐推理。本实施例认为,除了相似度之外,一个实体对于另一个实体的偏好需要考虑到其对于匹配概率的评估。从理论上讲,源(目标)实体会更偏好与其具有高相似度同时与其他源(目标)实体具有低相似度的目标(源) 实体。因此,将u对v的偏好分数定义为:
[0078]
p
u,v
=sim(u,v)-max{sim(v,u

),u

∈εs}+1,
[0079]
其中0≤p
u,v
≤1,一个更大的p
u,v
表示更高的偏好度。
[0080]
所定义的偏好度包括三个元素。第一个是u和v的相似度得分,而第二个元素是v与所有的源实体间最高的相似度得分。显然,u会更偏好v,如果它们的相似度得分与v最高的相似度得分相等或者十分接近。因此,用第一个元素减去第二个元素,如果之间的差值与0接近,证明u更满意于(偏好)v。为了使得偏好得分为正值,我们加上了第三个元素1。
[0081]
通过这个定义,另一个方向上对于对齐的影响能够被自然的融入到一侧的实体的偏好建模中。此外,p
u,v
和p
v,u
并不相等,因为偏好得分是从实体层面来刻画对齐信息,而不是从实体对层面,将得到的源到目标和目标到源偏好得分分别表示为矩阵形式p
s,t
和p
t,s
[0082]
偏好聚合
[0083]
注意到,偏好得分只从一个方向考虑实体偏好,而一个理想的状态是同时考虑两个方向的实体偏好并生成对齐结果。为此,实施例提出聚合两个方向的偏好。首先,将偏好矩阵p转化为排序矩阵r。具体来说,将偏好矩阵中的每一行的元素从高到低进行排序。排序矩阵中的每一个元素代表了对应的偏好得分的排序,其中更低的排序值代表更高的偏好值。因此,排序矩阵同样也包含着偏好信息,如图3所示。
[0084]
将分数转换为排序的主要目的是放大分数之间的差异。由于聚合源到目标和目标到源矩阵以捕获相互偏好时,而在与另一侧的信息聚合后,一侧的得分之间的细微差异很容易丢失。而通过将得分转换为排序,可以很好地保留这种差异并将其融入最终的相互偏好中。
[0085]
接着,聚合两个排序矩阵来捕获实体的相互偏好并生成最终的互惠偏好矩阵:
[0086][0087]
其中φ是一个聚合函数,可以从任何均值算子或其他可行方法中选择。在本实施
例中采用算术平均值,因为它持有相对中立的态度,能准确地表达了两个实体对彼此的偏好,而不会偏向于更高或更低的排序值。互惠矩阵中的每个元素代表一对实体(u和v)之间的相互偏好程度,而值越低,偏好程度越高。
[0088]
如图3所示,有四个源实体u1,u2,u3,u4和四个目标实体v1,v2,v3,v4。在s,p
s,t
,r
s,t
和中,行对应于源实体,列对应于目标实体,而在p
t,s
和r
t,s
中,行对应于目标实体,列对应于源实体。具有相同下标的实体是等价的。
[0089]
(a):矩阵s中的相似度分数是使用基于实体嵌入的余弦相似度计算得到的。在这个例子中,如果我们仅仅将这些相似性分数视为实体偏好并将每个源实体与其最偏好的目标实体对齐,则结果,(u1,v2),(u2,v2),(u3,v2),(u4,v2),只包含一个正确的匹配。
[0090]
(b):我们使用上述等式计算偏好分数并获得偏好矩阵p
s,t
和p
t,s
。根据偏好分数,如果我们将每个源实体与其最偏好的目标实体对齐,结果(u1,v1),(u2,v2),(u3,v3) 是正确的,而对于u4,v3和v4都有可能成为被匹配上。此外,如果我们将每个目标实体与其最偏好的源实体对齐,也很难推导出v2的对齐结果。
[0091]
(c):我们将偏好矩阵p
s,t
和p
t,s
分别转换为排序矩阵r
s,t
和r
t,s

[0092]
(d):我们使用算术平均值聚合两个排序矩阵。基于互惠偏好矩阵如果我们将每个源(目标)实体与其最偏好的源(目标)实体对齐,则结果都是正确的。
[0093]
与直接对齐策略相比,由于偏好和排序矩阵的计算,互惠式对齐推理需要消耗更多的内存空间和时间。因此,在本实施例中,提出了变体方法来减少互惠建模带来的内存和时间消耗。
[0094]
非排序的聚合
[0095]
不难发现,互惠建模的额外时间复杂度主要由排序过程带来。因此,提出一种无排序的聚合策略来近似互惠对齐推理,省略排序过程,直接生成互惠偏好矩阵。
[0096]
步骤如下:偏好聚合,聚合两个偏好得分矩阵来捕获实体的相互偏好并生成最终的互惠偏好矩阵:
[0097][0098]
其中φ是一个聚合函数,所述的互惠偏好矩阵中的每个元素代表一对实体u和v之间的相互偏好程度,值越大,偏好程度越高。
[0099]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1