链接强度计算方法和链接强度计算设备的制造方法_3

文档序号:9261491阅读:来源:国知局
共同链接程度值的方式。
[0073] 作为一种改进的实施方式,还可W考虑如下情况:如果该选定链接的一个端节点 与在第N-2级完备子图中的同类节点在第N-1级完备子图中共同链接到的节点不包括该选 定链接的另一个端节点,则减少该选定链接的该个端节点与第N-2级完备子图中的该同类 节点之间的共同链接程度值。
[0074] 举例来说,在上述节点A2与A1的共同链接程度值的计算示例中,节点A2与A1在 第2级完备子图中共同链接到的节点分别是P2、P3、P4。节点A2与A1在第2级完备子图 中共同链接到的节点包括该一组完备子图所针对的链接<A2,P2〉的另一端点P2,所W节点 A2与A1的共同链接程度值不做调整。
[0075] 但假设节点A2与A1共同链接到的节点不包括节点P2,则减少节点A2与A1的共 同链接程度值。
[0076] 该样的计算方式基于如下考虑;当前针对的是链接<A2,P2〉,如果一个节点与节 点A2共同链接到的节点不包括P2,则该样的节点对于链接<A2,P2>的链接强度值的估计的 贡献应该较小,因为该样的节点与链接<A2,P2〉的关联度要低一些。
[0077] 在步骤S4中,基于上面计算的相似度和共同链接程度值、W及该选定链接两端的 两节点与第N-2级完备子图中的异类节点之间链接的强度初始值,利用针对该二部图的链 接强度模型,计算所述选定链接的强度值。
[0078] 在步骤S2中计算了链接<A2,P2〉的节点A2、P2分别与第N-2级子图中的同类节 点的相似度,在步骤S3中计算了链接<A2,P2〉的节点A2、P2分别与第N-2级子图中的同类 节点的共同链接程度值。该两种信息从相关节点的角度提供了链接<A2,P2〉的强度值的参 考。
[0079] 链接<A2,P2>等也具有强度初始值。强度初始值可W是其它方法给出的值、由本 领域技术人员指定的值、预估计的值、或随机的值。该强度初始值具有一定的置信度,但仍 不够准确或合适,所W需要利用本发明的方法和设备进行修正。
[0080] 链接强度模型是预先针对该二部图训练好的,其输入是选定链接相关的上述方法 计算的相似度和共同链接程度值、W及该选定链接两端的两节点与第N-2级完备子图中的 异类节点之间链接的强度初始值,其输出是所述选定链接的强度值。
[0081] 仍W链接<A2,P2〉为例,链接强度模型可由下面的公式2表示。 ./'(< ,化 1)2 >)=乞/.;,(<A2,P/ >) *义"?(1,/,1)2) *K(I,/,[)2) *WI+
[00的] 。i (公式2) y,/;,(<A/,P2>)*Sim{\j,M)*V{kj,M)*W2+h j
[0083] 其中,f(<A2,P2>)为链接<A2,P2〉的链接强度值,Pi表示在第N-2级完备子图中 的m个与P2同类型的节点,Sim(Pi,P2)表示节点Pi与P2的相似度,V(Pi,P2)表示节点 Pi与P2的共同链接程度值,fb(<A2,Pi〉)为链接<A2,Pi〉的链接强度初始值,W1、W2、b为 模型参数,Aj表示在第N-2级完备子图中的n个与A2同类型的节点,Sim(Aj,A2)表示节 点Aj与A2的相似度,V(Aj,A2)表示节点Aj与A2的共同链接程度值,fb(<Aj,P2〉)为链接 <Aj,P2>的链接强度初始值。在下述的链接强度模型的训练过程中,f?A2,P2〉)的值为链 接<A2,P2〉的链接强度初始值。
[0084] 应理解,上述公式2仅为链接强度模型的一个示例,本发明不限于此。
[0085] 链接强度模型具有参数,参数在训练过程中获得。具有特定参数的链接强度模型 可用于训练时针对的二部图中的链接的强度值的计算。可W认为,对于给定的二部图,即对 于给定的二部图中的节点类型,链接强度模型的参数应是固定和通用的。
[0086] 举例来说,如果链接强度模型所针对的二部图中的两类节点是作者和文章,那么 认为该个链接强度模型的参数适用于所有作者和文章。如果链接强度模型所针对的二部图 中的两类节点是计算机领域的作者和文章,那么认为该个链接强度模型的参数适用于所有 计算机领域的作者和文章。
[0087] 比如,训练时针对的二部图中的节点包括;作者1、作者2、作者3、文章1、文章2、 文章3,已经存在的链接是作者1-文章1、作者2-文章3、作者1、3-文章2。
[0088] 那么,可W利用训练好的链接强度模型计算链接作者1-文章1的强度值,所计算 的强度值可W用于修正该链接原有的强度初始值。
[0089] 例如,可用所计算的强度值代替原有的强度初始值。
[0090] 此外,如果所计算的强度值低于预定阔值,则说明对应链接的置信度较低,可将相 应的链接标记为错误链接。
[0091] 也可W基于所计算的强度值对所有链接排序。
[0092] 还可W对于二部图中没有的链接,如作者1-文章3计算链接强度值,挖掘隐含关 系。如果所计算的作者1-文章3的链接强度值高于另一预定阔值,说明对应链接的置信度 较高,则可W向二部图中新增作者1-文章3的链接。
[0093] 如果训练时仅针对二部图中的一部分链接进行训练,则可W利用训练好的链接强 度模型计算二部图中的其它链接的强度值。
[0094] 还可W向二部图添加同类型的新节点,如作者4、文章4,并计算链接作者4-文章 4的强度值、或者W作者4、文章4之一作为端点并W二部图中的其它节点作为另一端点的 链接的强度值。
[0095] 下面介绍链接强度模型的训练方法。
[0096]图4示出了根据本发明的实施例的链接强度模型的训练方法的流程图。如图4所 示,根据本发明的实施例的链接强度模型的训练方法,包括如下步骤:针对所述二部图中的 每一个链接,基于所述二部图,构建针对该链接的所述N级完备子图(步骤S41),分别计算 该链接两端的两节点与第N-2级完备子图中的同类节点之间的相似度(步骤S42),分别计 算该链接两端的两节点与第N-2级完备子图中的所述同类节点之间的共同链接程度值(步 骤S43) ;W及基于与每一个链接对应的所述相似度和共同链接程度值、W及每一个链接的 强度初始值,训练得到所述链接强度模型的相关参数(步骤S44)。
[0097] 在训练过程中,针对二部图中的每一个链接,进行步骤S41、S42、S43的处理。步 骤S41-S43的处理与上面的步骤S1-S3的处理类似,主要区别是在训练过程中所针对的是 二部图中的每一个链接,在应用过程中所针对的仅为要计算其强度值的选定链接。
[0098] 另外,作为改进,也可W在训练时仅针对二部图中的一部分链接,在应用时针对二 部图中的其余链接。
[0099] 在步骤S44中,利用步骤S41-S43中所收集的信息对链接强度模型进行训练W得 到链接强度模型的参数。
[0100] 由于此处的训练步骤与上面详细介绍的应用步骤存在对应性,所W在此不再费 述。
[0101] 下面,将参照图5描述根据本发明实施例的链接强度计算设备。
[0102]图5示出了根据本发明实施例的链接强度计算设备的结构方框图。如图5所示,根 据本发明的链接强度计算设备500包括;子图构建装置51,被配置为;针对给定的二部图中 的选定链接,基于所述二部图,构建针对该选定链接的N级完备子图,其中所述N级完备子 图中的第0级完备子图包括该选定链接W及该选定链接两端的两节点,所述N级完备子图 中的第n+1级完备子图包括所述二部图中的、W第n级完备子图中的所有链接两端的节点 作为端点的链接及其两端的节点,其中N为预定正整数,且N〉2,n为正整数,且N-2 >n> 0, 相似度计算装置52,被配置为;针对给定的二部图中的选定链接,分别计算该选定链接两 端的两节点与第N-2级完备子图中的同类节点之间的相似度,程度值计算装置53,被配置 为:针对给定的二部图中的选定链接,分别计算该选定链接两端的两节点与第N-2级完备 子图中的所述同类节点之间的共同链接程度值;W及强度计算装置54,被配置为;基于所 述相似度和共同链接程度值、W及该选定链接两端的两节点与第N-2级完备子图中的异类 节点之间链接的强度初始值,利用针对该二部图的链接强度模型,计算所述选定链接的强 度值。
[0103] 在一个实施例中,链接强度计算设备500还包括:修正装置,被配置为;用所计算 的选定链接的强度值代替选定链接的强度初始值。
[0104] 在一个实施例中,链接强度计算设备500还包括:排序装置,被配置为;根据所计 算的选定链接的强度值,对选定链接进行排序。
[0105] 在一个实施例中,链接强度计算设备500还包括:纠错装置,被配置为;将所计算 的强度值低于预定阔值的选定链接标记为错误链接。
[0106] 在一个实施例中,所述选定链接两端的两节点在所述二部图中并不初始相连;所 述链接强度计算设备500还包括挖掘装置,被配置为;将所计算的强度值高于预定阔值的 选定链接增加到所述二部
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1