基于贝叶斯个性化排序的知识图链接预测方法与流程

文档序号：11830915阅读：658来源：国知局

本发明涉及知识图的链接推荐，利用贝叶斯个性化排序模型来优化推荐链接的顺序，属于计算机技术、信息网络、数据挖掘交叉技术应用领域。

背景技术：

知识图是一个可以存放任何数据的实体信息库，其特征是在于经常与其它实体的有关联。资源描述框架(RDF)是一个捕获实体间频繁的交互的框架。一个RDF数据集相当于一个异构图，其中每个顶点和边可以属于不同的实体类，类信息捕获于各种实体类型和关系类型之间的分类层次结构。从知识图的自然语言文本中建立可以推荐的知识图需要大量的工作，因为在提取实体、关系映射和链接预测这三个重要过程中，提取数据和语义角色标注是非常嘈杂的。因此必须设计方法来减少噪音，这一方法要有以下考虑：(1)可信的数据来源；(2)一个由一个自然语言处理引擎得到的概率值，表达了对分析的正确的概率；(3)要存在先验的主体和对象。因此本发明采用贝叶斯个性化排名算法的嵌入模型。

知识图中的链接预测是一个机器学习方法，利用主体和客体的先验知识来评估三要素之间的信任值。

技术实现要素：

技术问题：本发明的目的是提供一种基于贝叶斯个性化排序的知识图链接预测方法，解决知识图链接预测中主体与客体间关系集合的交集对预测结果的影响，利用贝叶斯个性化排序来优化主体与客体间关系的预测模型。

技术方案：本发明所述的基于贝叶斯个性化排序的知识图链接方法提出一个基于特征的链接预测模型来预测知识图知识图中的链接，并利用贝叶斯个性化排序来优化该模型。

本发明所述的基于贝叶斯个性化排序的知识图链接方法包括以下步骤：

步骤1)建立知识图，具体步骤如下：

步骤11)定义知识图的三要素图G＝(S,P,O),G(s,p,o)＝1表示主体S与客体O存在关系P，G(s,p,o)＝0表示主体S与客体O不存在关系P，其中s∈S,p∈P,o∈O。所述三要素包含主体、客体和主客体间的关系，所述s是主体，所述o是客体，所述p是主体与客体间的关系，所述S是主体集合，所述O是客体集合，所述P是主体与客体间关系的集合。

步骤12)定义二分图G_p(S_p,O_p)，对于主体与客体间关系p，G_p(S_p,O_p)＝0表示主体s_p与客体o_p间不存在关系p，G_p(s_p,o_p)＝1表示主体s_p与客体o_p间存在关系p，所述s_p∈S_p,o_p∈O_p，所述二分图是图的顶点集可分割为两个互不相交的子集，并且图中每条边依附的两个顶点都分属于这两个互不相交的子集，两个子集内的顶点不相邻。

步骤2)建立链接预测模型，具体步骤如下：

步骤21)链接预测被抽象为，对每个关系p和在G_p中的实体(s,o)，目标是建立一个预测模型M_p(s,o)，x_s,o＝M_p(s,o)，所述p∈P,s∈S,o∈O，所述x_s,o是预测模型的结果。

步骤22)采用logistic函数来作为评分标准，所述是主体s与客体o建立关系p的概率，所述是s与o建立关系p。

步骤3)定义基于特征的预测模型其中s_p与o_p分别是定义的二分图G_p(S_p,O_p)中的主体与客体，s∈S,p∈P,o∈O，所述S是主体集合，所述O是客体集合，所述P是主体与客体间关系的集合，所述T是转置操作。所述x_s,o是预测模型的结果，值越大，s_p和o_p在低维向量空间中，越为相似，建立链接关系的概率越大；所述所述U和V均为低维向量，所述IR是实数域，所述K是潜在特征的个数。所述向量空间是这样一种集合,其中任意两元素相加可构成此集合内的另一元素,任意元素与任意数相乘后得到此集合内的另一元素，所述的低维是独立参数数目较少。

步骤4)利用贝叶斯个性化排序算法进行优化，步骤如下：

步骤41)建立排序标准所述D_p是训练样本集，所述表示s与o间存在链接，所述表示s与o间不存在链接，所述σ(.)是logistic函数，所述log istic函数为所述a为函数变量，所述用于数据的标准化，为了避免过度拟合，所述λ为一个控制拟合速率的常数，所述Θ_p＝{U^p,V^p,b^p}，所述U^p∈IR^|S|×K,V^p∈IR^|O|×K,b^p∈IR^|O|×1，所述|S|表示主体集合S内元素个数，所述|O|表示主体集合O内元素个数。

步骤42)初始化U^p为大小为m×K值全为0的矩阵，初始化V^p为大小为n×K值全为0的矩阵，b^p为大小为n×1值全为0的向量。所述n为客体集合O内的元素个数，所述m为主题集合S内的元素个数，所述K潜在特征的个数。

步骤43)对于每个结合步骤3)更新的值,最后返回U^p，V^p，b^p的值，所述更新的公式为：

所述

所述α是一个用来控制学习速率的常数常数，所述λ是一个控制拟合速率的常数。

步骤5)根据步骤2)和步骤3)计算出建立链接关系的概率所述是主体s与客体o建立关系p的概率；。

步骤6)定义预测阀值ε，当时，则预测主体s与客体o间存在关系p，当时，则预测主体s与客体o间不存在关系p。

有益效果：本发明提出一种基于贝叶斯个性化排序的知识图链接预测方法，具体有益效果如下：

1)我们实现了一个用于评估在链接预测中的知识图三要点的概率。具体而言，我们借鉴了成功的方法，在推荐系统领域，采用知识图的算法，并对一个突出的基准数据集进行了彻底的评估。

2)我们提出了一个基于特征嵌入的链接推荐模型预测任务，并利用贝叶斯个性化排名算法为基础的优化技术来为每个谓词建立学习模型。

3)我们应用一个线性回归模型来对于每个谓词和原有的知识图的导出子图的拓扑结构定量分析预测精度之间的关系。我们的研究表明，如聚类系数和平均程度等指标，可以使用的作为影响预测精度的指标。

附图说明

图1是基于贝叶斯个性化算法的知识图链接推荐方法流程。

具体实施方式

下面对本发明使用贝叶斯个性化排序算法的链接预测具体实施例作更详细的描述。

根据附图1，将知识图链接问题定义为二分图，采用以下的具体实施步骤：

(1)输入知识图的主体、客体和主客体间的关系。

(2)构建二分图G_p(S_p,O_p)中，以主体s_p与客体o_p集作为二分图的顶点集，主体与客体间关系p作为二分图的边集。G_p(S_p,O_p)＝0表示顶点s_p与顶点o_p间不存在边p，G_p(s_p,o_p)＝1表示顶点s_p与顶点o_p间存在边p，所述 s_p∈S_p,o_p∈O_p。

在完成知识图链接问题定义为二分图后，要建立链接预测模型，具体步骤如下：

(1)建立基于特征的预测模型

(2)采用logistic函数来作为评分标准。

在具体实施中，值越大，s_p和o_p在低维向量空间中，越为相似，建立链接关系的概率越大。所述所述U和V均为低维向量，所述IR是实数域，所述K是潜在特征的个数，所述向量空间是这样一种集合,其中任意两元素相加可构成此集合内的另一元素,任意元素与任意数相乘后得到此集合内的另一元素，所述的低维是独立参数数目较少。所述是主体s与客体o建立关系p的概率，所述是s与o建立关系p。

链接预测模型建立完成后，要利用贝叶斯个性化排序算法进行优化，具体实施步骤如下：

(1)初始化U^p为大小为m×K值全为0的矩阵，初始化V^p为大小为n×K值全为0的矩阵，b^p为大小为n×1值全为0的向量。所述n为客体集合O内的元素个数，所述m为主题集合S内的元素个数，所述K潜在特征的个数。

(2)对于每个更新的值,最后返回U^p，V^p，b^p的值，所述更新的公式为：

所述

所述α是一个用来控制学习速率的常数常数，所述λ是一个控制拟合速率的常数。所述是排序标准。

所述D_p是训练样本集，所述表示s与o间存在链接，所述表示s与o间不存在链接，所述σ(.)是logistic函数，所述logistic函数为所述a为函数变量，所述用于数据的标准化，为了避免过度拟合，所述λ为一个控制拟合速率的常数，所述Θ_p＝{U^p,V^p,b^p}，所述U^p∈IR^|S|×K,V^p∈IR^|O|×K,b^p∈IR^|O|×1，所述|S|表示主体集合S内元素个数，所述|O|表示主体集合O内元素个数。

在具体实施中，根据链接关系的概率设定预测阀值ε，当时，则预测主体s与客体o间存在关系p，当时，则预测主体s与客体o间不存在关系p，所述是主体s与客体o建立关系p的概率。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈清子;陈志;岳文静;刘亚威;王梦伊;
技术所有人：南京邮电大学;
我是此专利的发明人

上一篇：一种固液分离垃圾桶的制作方法与工艺
上一篇：一种体积可扩展的垃圾桶的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。