一种实体相似度确定方法、装置、设备和存储介质与流程

文档序号:24803458发布日期:2021-04-23 16:22阅读:167来源:国知局
一种实体相似度确定方法、装置、设备和存储介质与流程

1.本发明涉及互联网技术领域,尤其涉及一种实体相似度确定方法、装置、设备和存储介质。


背景技术:

2.实体相似度计算在很多领域中都有应用,例如:在推荐系统中,基于实体相似度为用户推荐用户偏好的商品、影视剧等。又如:在搜索系统中,识别用户输入的实体,并基于实体相似度搜索用户所需的实体。
3.目前,多采用编辑距离(levenshtein distance)算法,度量学习(distance metric learning)算法等,确定两个实体之间的相似度。
4.但是,从实际使用上来说,现有的实体相似度算法的准确度较低。编辑距离算法局限于计算文本或字符串字面上的相似度,无法基于语义的相似给出结果,所以无法区分字面意思相近,但是语义完全不同的两个实体。例如:“歌手王菲最新专”和“歌手王蓉最新专辑”,王蓉和王菲都是歌手,且姓名只有一字之差,即字面意思相近,但是,两个歌手的音乐以及音乐受众区别较大,即语义完全不同。度量学习算法由于是无监督学习的,缺乏实际是否相似的反馈,导致即使两件实体在属性上有诸多相似,但在用户看来仍有巨大差别。例如:“雪碧”和“雷碧”,虽然包装相似、口味也相似,但是,两种商品有巨大差别。


技术实现要素:

5.本发明实施例的主要目的在于提供一种实体相似度确定方法、装置、设备和存储介质,以解决现有的实体相似度算法的准确度较低的问题。
6.针对上述技术问题,本发明实施例是通过以下技术方案来解决的:
7.本发明实施例提供了一种实体相似度确定方法,包括:从预设的样本实体集中,获取多个实体的实体属性向量;利用预设的相关性算法,确定多对存在相关性的实体属性向量,并将每对实体属性向量作为一个实体对;在获得的多个实体对中,筛选出符合预设条件的实体对;其中,所述预设条件是指实体对中的两个实体属性向量存在关联关系;利用筛选出的实体对训练预设的语义网络模型,以便在所述语义网络模型收敛之后,利用所述语义网络模型确定目标实体与候选实体的相似度。
8.其中,在获取多个实体的实体属性向量之后,还包括:在多个所述实体中选择一个基准实体;利用预设的相关性算法,确定多对存在相关性的实体属性向量,包括:利用预设的相关性算法,在获取的多个实体的实体属性向量中,确定与所述基准实体的实体属性向量存在相关性的实体属性向量。
9.其中,利用预设的相关性算法,确定多对存在相关性的实体属性向量,包括:计算两个实体属性向量的內积,得到所述两个实体属性向量的內积向量;针对得到的所述內积向量执行归一化处理;针对归一化处理后的所述內积向量执行池化处理,得到所述两个实体属性向量的池化结果;在所述两个实体属性向量的池化结果为第一数值时,确定所述两
个实体属性向量存在相关性。
10.其中,所述关联关系,包括:在所述实体对中,两个实体属性向量的目标属性值相同,并且,所述两个实体属性向量之间的置信度大于预设的置信度阈值,并且,所述两个实体属性向量之间的支持度大于预设的支持度阈值;其中,所述置信度用于表示所述两个实体前后出现的概率;所述支持度用于表示所述两个实体同时出现的概率。
11.其中,所述置信度表示所述实体对中的基准实体出现后,另一个实体也出现的概率;其中,所述基准实体是在所述获取多个实体的实体属性向量之后,在多个所述实体中选择的;每个所述实体对中都包括所述基准实体的实体属性向量。
12.其中,在从预设的样本实体集中,获取多个实体的实体属性向量之前,还包括:为所述样本实体集中的每个所述实体的实体属性向量设置标签;所述标签为所述样本实体集中与所述实体相似的另一实体的信息;利用筛选出的实体对训练预设的语义网络模型,包括:将筛选出的实体对顺序输入所述语义网络模型,获得所述语义网络模型输出的每个所述实体对的相似度;根据所述实体对中每个实体的标签,确定所述实体对的真实相似度;根据所述语义网络模型输出的每个所述实体对的相似度以及每个所述实体对的真实相似度,确定所述语义网络模型是否收敛;在所述语义网络模型尚未收敛的情况下,调整所述语义网络模型中的参数,并将相似度大于预设相似度阈值的实体对再次输入所述语义网络模型,以便再次确定所述语义网络模型是否收敛;在所述语义网络模型已经收敛的情况下,停止对所述语义网络模型进行训练。
13.其中,利用所述语义网络模型确定目标实体与候选实体的相似度,包括:接收来自于客户端的实体展示请求;从实体数据库中,查询所述实体展示请求对应的目标实体,并且查询所述目标实体的实体属性向量;将所述目标实体的实体属性向量输入所述语义网络模型,通过所述语义网络模型从所述实体数据库中查询候选实体的实体属性向量,并根据所述目标实体的实体属性向量和每个所述候选实体的实体属性向量,确定所述目标实体分别与每个所述候选实体的相似度;在利用所述语义网络模型确定目标实体与候选实体的相似度之后,还包括:根据所述目标实体分别与每个所述候选实体的相似度,获取预设数量的所述候选实体作为反馈实体;其中,被获取的所述候选实体与所述目标实体的相似度大于未被获取的所述候选实体与所述目标实体的相似度;将所述目标实体对应的目标展示信息以及每个所述反馈实体分别对应的反馈展示信息发送给所述客户端,以便所述客户端在展示所述目标实体对应的目标展示信息时,展示每个所述反馈实体对应的反馈展示信息。
14.其中,利用所述语义网络模型确定目标实体与候选实体的相似度,包括:接收来自于客户端的目标实体的信息;根据所述目标实体的信息,从实体数据库中,查询所述目标实体的实体属性向量;将所述目标实体的实体属性向量输入所述语义网络模型,通过所述语义网络模型从所述实体数据库中查询候选实体的实体属性向量,并根据所述目标实体的实体属性向量和每个所述候选实体的实体属性向量,确定所述目标实体分别与每个所述候选实体的相似度;在利用所述语义网络模型确定目标实体与候选实体的相似度之后,还包括:根据所述目标实体分别与每个所述候选实体的相似度,获取预设数量的所述候选实体作为反馈实体;其中,被获取的所述候选实体与所述目标实体的相似度大于未被获取的所述候选实体与所述目标实体的相似度;将每个所述反馈实体分别对应的反馈展示信息发送给所述客户端,以便所述客户端展示每个所述反馈实体对应的反馈展示信息。
15.本发明实施例还提供了一种实体相似度确定装置,包括:获取模块,用于从预设的样本实体集中,获取多个实体的实体属性向量;确定模块,用于利用预设的相关性算法,确定多对存在相关性的实体属性向量,并将每对实体属性向量作为一个实体对;筛选模块,用于在获得的多个实体对中,筛选出符合预设条件的实体对;其中,所述预设条件是指实体对中的两个实体属性向量存在关联关系;训练模块,用于利用筛选出的实体对训练预设的语义网络模型,以便在所述语义网络模型收敛之后,利用所述语义网络模型确定目标实体与候选实体的相似度。
16.本发明实施例还提供了一种实体相似度确定设备,所述实体相似度确定设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一项所述的实体相似度确定方法。
17.本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有实体相似度确定程序,所述实体相似度确定程序被处理器执行时实现上述任一项所述的实体相似度确定方法。
18.本发明实施例有益效果如下:
19.在本发明实施例中,确定存在相关性的实体对,在存在相关性的实体对中,筛选出存在关联关系的实体对,利用筛选出的实体对训练语义网络模型,使语义网络模型在关注实体之间的相关性和关联关系的前提下,确定实体之间的相似度,从使得语义网络模型输出的相似度可以体现实体之间的相关性和关联关系。通过本发明实施例的相似度确定方法,即便是两个实体之间仅相差一个字,也会因为两个实体之间不存在相关性或者关联关系,导致两个实体之间的相似度较低。
附图说明
20.此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
21.图1是根据本发明一实施例的实体相似度确定方法的流程图;
22.图2是根据本发明一实施例的实体相似度确定方法的流程图;
23.图3是根据本发明一实施例的实体相似度确定方法的示意图;
24.图4是根据本发明一实施例的实体相似度确定装置的结构图;
25.图5是根据本发明一实施例的实体相似度确定设备的结构图。
具体实施方式
26.为使本发明的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本发明作进一步地详细说明。
27.根据本发明的实施例,提供了一种实体相似度确定方法。如图1所示,是根据本发明一实施例的实体相似度确定方法的流程图。
28.步骤s110,从预设的样本实体集中,获取多个实体的实体属性向量。
29.样本实体集,用于存储多个实体以及每个实体的实体属性向量。
30.实体是知识图谱中的元素。在本实施例中,实体表示对应现实物品的数据对象。如:实体为电商平台的一个商品,实体为视频平台的一部影片。
31.实体属性向量,是根据实体的属性值构成的向量。进一步地,预先构建向量模型,向量模型中的每个元素位置表示一个属性,将实体的属性值放置到对应的元素位置,形成该实体的实体属性向量。在元素位置没有属性值的情况,可以在该元素位置放置空值,如0。
32.实体的属性,是指实体的特性,历史信息的抽象。例如:在实体为商品时,实体的属性包括但不限于:商品的id(identity),型号,尺寸,价格,购买过的用户id。在实体为影片时,实体的属性包括但不限于:影片的id,名称,时长,点击量,完播率,观看过的用户id。
33.步骤s120,利用预设的相关性算法,确定多对存在相关性的实体属性向量,并将每对实体属性向量作为一个实体对。
34.相关性算法,用于确定两个实体的实体属性向量之间是否相关,即是否存在联系。相关性算法可以根据需求而定。
35.实体对可以表示为知识图谱中的三元组。
36.在本实施例中,可以计算两个实体属性向量的內积,得到所述两个实体属性向量的內积向量;针对得到的所述內积向量执行归一化处理;针对归一化处理后的所述內积向量执行池化处理,得到所述两个实体属性向量的池化结果;在所述两个实体属性向量的池化结果为第一数值时,确定所述两个实体属性向量存在相关性。
37.內积处理,用于将两个实体属性向量融合在一起。
38.归一化处理,用于将內积向量中的每个元素归一化到0至1之间。
39.池化处理,用于对归一化处理后的內积向量进行降维处理。在本实施例中,池化处理将內积向量降维成一维数据(0或者1)。由于池化处理的特性是数据降维之后,数据的主要特征不发生变化,所以,两个实体属性向量是否存在相关性的特征不会发生改变。进一步地,可以使用softmax层执行池化处理。
40.在本实施例中,池化处理得到的池化结果为第一数值时,确定两个实体属性向量存在相关性;池化处理得到的池化结果为第二数值时,确定两个实体属性向量不存在相关性。第一数值为1。第二数值为0。
41.后续将提供另一中相关性算法的实现过程,在此不做赘述。
42.步骤s130,在获得的多个实体对中,筛选出符合预设条件的实体对;其中,所述预设条件是指实体对中的两个实体属性向量存在关联关系。
43.所述关联关系,包括:在所述实体对中,两个实体属性向量的目标属性值相同,并且,所述两个实体属性向量之间的置信度大于预设的置信度阈值,并且,所述两个实体属性向量之间的支持度大于预设的支持度阈值。
44.所述目标属性值是在每个实体的实体属性向量中查询得到的。
45.所述目标属性值是指目标属性的值。目标属性可以根据需求而定。例如:目标属性为用户id。
46.所述置信度用于表示所述两个实体前后出现的概率。可以利用预设的置信度算法确定两个实体前后出现的概率。置信度算法包括但不限于:关联规则中的置信度算法。
47.所述支持度用于表示所述两个实体同时出现的概率。可以利用预设的支持度算法确定两个实体同时出现的概率。支持度算法包括但不限于:关联规则中的支持度算法,协同过滤算法。
48.置信度阈值和支持度阈值都为经验值或者实验值。
49.步骤s140,利用筛选出的实体对训练预设的语义网络模型,以便在所述语义网络模型收敛之后,利用所述语义网络模型确定目标实体与候选实体的相似度。
50.语义网络模型,用于确定两个实体之间的相似度。两个实体之间的相似度即是两个实体的实体属性向量的相似度。
51.目标实体,是指请求展示的实体或者请求查询的实体。
52.候选实体,是指需要与目标实体进行相似度计算的实体。候选实体可以是实体数据库中的实体,也可以是实体数据库中与目标实体类型相同的实体。
53.在一个实施方式中,利用所述语义网络模型确定目标实体与候选实体的相似度,包括:接收来自于客户端的实体展示请求;从实体数据库中,查询所述实体展示请求对应的目标实体,并且查询所述目标实体的实体属性向量;将所述目标实体的实体属性向量输入所述语义网络模型,通过所述语义网络模型从所述实体数据库中查询候选实体的实体属性向量,并根据所述目标实体的实体属性向量和每个所述候选实体的实体属性向量,确定所述目标实体分别与每个所述候选实体的相似度;在利用所述语义网络模型确定目标实体与候选实体的相似度之后,还包括:根据所述目标实体分别与每个所述候选实体的相似度,获取预设数量的所述候选实体作为反馈实体;其中,被获取的所述候选实体与所述目标实体的相似度大于未被获取的所述候选实体与所述目标实体的相似度;将所述目标实体对应的目标展示信息以及每个所述反馈实体分别对应的反馈展示信息发送给所述客户端,以便所述客户端在展示所述目标实体对应的目标展示信息时,展示每个所述反馈实体对应的反馈展示信息。
54.实体展示请求,用于请求展示目标实体对应的目标展示信息。在实体展示请求中,可以写到目标实体的id。
55.目标展示信息,包括但不限于:目标实体的名称,展示图,链接地址。
56.反馈实体,是指实体属性向量与目标实体的实体属性向量相似的实体。
57.反馈展示信息,包括但不限于:反馈实体的名称,展示图,链接地址。
58.预设数量,可以是根据需求设置的值。
59.可以按照相似度从大到小的顺序,对候选实体进行排序,从相似度最大的候选实体开始,获取预设数量的候选实体作为反馈实体。
60.在另一实施方式中,利用所述语义网络模型确定目标实体与候选实体的相似度,包括:接收来自于客户端的目标实体的信息;根据所述目标实体的信息,从实体数据库中,查询所述目标实体的实体属性向量;将所述目标实体的实体属性向量输入所述语义网络模型,通过所述语义网络模型从所述实体数据库中查询候选实体的实体属性向量,并根据所述目标实体的实体属性向量和每个所述候选实体的实体属性向量,确定所述目标实体分别与每个所述候选实体的相似度;在利用所述语义网络模型确定目标实体与候选实体的相似度之后,还包括:根据所述目标实体分别与每个所述候选实体的相似度,获取预设数量的所述候选实体作为反馈实体;其中,被获取的所述候选实体与所述目标实体的相似度大于未被获取的所述候选实体与所述目标实体的相似度;将每个所述反馈实体分别对应的反馈展示信息发送给所述客户端,以便所述客户端展示每个所述反馈实体对应的反馈展示信息。
61.目标实体的信息可以是目标实体的id。
62.在本发明实施例中,确定存在相关性的实体对,在存在相关性的实体对中,筛选出
存在关联关系的实体对,利用筛选出的实体对训练语义网络模型,使语义网络模型在关注实体之间的相关性和关联关系的前提下,确定实体之间的相似度,从使得语义网络模型输出的相似度可以体现实体之间的相关性和关联关系。通过本发明实施例的相似度确定方法,即便是两个实体之间仅相差一个字,也会因为两个实体之间不存在相关性或者关联关系,导致两个实体之间的相似度较低。
63.下面提供一个较为具体的实体相似度确定方法。图2是根据本发明一实施例的实体相似度确定方法的流程图。图3是根据本发明一实施例的实体相似度确定方法的示意图。
64.步骤s210,为样本实体集中的每个实体的实体属性向量设置标签。
65.所述标签为样本实体集中与实体相似的另一实体的信息。
66.可以在样本实体集中,存储预先为每个实体设置的标签。(另一)实体的信息可以是实体的id。
67.步骤s220,从样本实体集中,获取多个实体的实体属性向量。
68.从样本实体集中,获取预设时间段内被操作过的多个实体的实体属性向量。被操做过的实体例如是被用户购买过的商品,被用户观看过的影片。
69.步骤s230,在获取多个实体的实体属性向量之后,在多个所述实体中选择一个基准实体。
70.例如:获取四个实体的实体属性向量,实体1的实体属性向量为[value1,0],实体2的实体属性向量为[0,value2],实体3的实体属性向量为[value1,0],实体4的实体属性向量为[0,value2]。可以将实体1选定为基准实体。
[0071]
步骤s240,利用预设的相关性算法,在获取的多个实体的实体属性向量中,确定与所述基准实体的实体属性向量存在相关性的实体属性向量,将基准实体的实体属性向量和所述存在相关性的实体属性向量作为一个实体对。
[0072]
计算两个实体属性向量的內积,得到所述两个实体属性向量的內积向量;针对得到的所述內积向量执行归一化处理;针对归一化处理后的所述內积向量执行池化处理,得到所述两个实体属性向量的池化结果;在所述两个实体属性向量的池化结果为第一数值时,确定所述两个实体属性向量存在相关性。在所述两个实体属性向量的池化结果为第二数值时,确定所述两个实体属性向量不存在相关性。第一数值为1。第二数值为0
[0073]
例如:实体1为基准实体,实体1的实体属性向量[value1,0]和实体2的实体属性向量[0,value2]的內积向量为[0,0],经过归一化和池化处理后,池化结果为0,即实体1和实体2的实体属性向量不存在相关性。实体1的实体属性向量[value1,0]和实体3的实体属性向量为[value1,0]的內积向量为[value12,0],经过归一化和池化处理后,池化结果为1,即实体1和实体3的实体属性向量存在相关性。实体1的实体属性向量[value1,0]和实体4的实体属性向量为[0,value2]的內积向量为[0,0],经过归一化和池化处理后,池化结果为0,即实体1和实体2的实体属性向量不存在相关性。经过计算,在实体1、实体2、实体3和实体4中,实体1和实体3为实体对。
[0074]
步骤s250,在获得的多个实体对中,筛选出符合预设条件的实体对。
[0075]
在所述实体对中,两个实体属性向量的目标属性值相同,并且,所述两个实体属性向量之间的置信度大于预设的置信度阈值,并且,所述两个实体属性向量之间的支持度大于预设的支持度阈值时,确定该实体对符合所述预设条件。
[0076]
目标属性值是目标属性的值。例如:目标属性为用户id。
[0077]
所述置信度表示所述实体对中的基准实体出现后,另一个实体也出现的概率;其中,所述基准实体是在所述获取多个实体的实体属性向量之后,在多个所述实体中选择的;每个所述实体对中都包括所述基准实体的实体属性向量。
[0078]
步骤s260,将多个实体对顺序输入所述语义网络模型,获得所述语义网络模型输出的每个所述实体对的相似度。
[0079]
首次输入时,可以将筛选出的每个实体对顺序输入所述语义网络模型,后续迭代过程,可以将相似度大于预设相似度阈值的实体对输入所述语义网络模型。
[0080]
步骤s270,根据所述实体对中每个实体的标签,确定实体对的真实相似度;根据所述语义网络模型输出的每个所述实体对的相似度以及每个所述实体对的真实相似度,确定所述语义网络模型是否收敛;如果是,则执行步骤s280;如果否,则执行步骤s290。
[0081]
根据实体对中每个实体的标签,可以确定每个实体相似的实体,如果实体对中的两个实体互为相似的实体,则表示实体对的真实相似度为100%;如果实体对中的两个实体不是互为相似的实体,则表示实体对的真实相似度为0%。
[0082]
利用预设的损失函数,根据所述语义网络模型输出的每个所述实体对的相似度以及每个所述实体对的真实相似度,确定所述语义网络模型的损失值;在该损失值小于预设的损失阈值时,确定语义网络模型收敛;在该损失值大于或等于预设的损失阈值时,确定语义网络模型未收敛。
[0083]
当然,在确定语义网络模型的损失值小于损失阈值时,还可以利用验证实体集,对语义网络模型进行验证,以便确定语义网络模型的准确度。
[0084]
步骤s280,在所述语义网络模型已经收敛的情况下,停止对所述语义网络模型进行训练,利用所述语义网络模型确定目标实体与候选实体的相似度。
[0085]
步骤s290,在所述语义网络模型尚未收敛的情况下,调整所述语义网络模型中的参数,并将相似度大于预设相似度阈值的实体对再次输入所述语义网络模型,跳转到步骤s270,以便再次确定所述语义网络模型是否收敛。
[0086]
在本实施例中,可以在获取出的多个实体的实体属性向量之后,在利用所述语义网络模型确定目标实体与候选实体的相似度之前,顺序将每个实体作为基准实体,循环执行本实施例的步骤s230至s290,以便增加语义网络模型的稳定性。
[0087]
在本实施例中,由于在真实场景(搜索场景,推荐场景)中,都是基于一个实体来进行相似度检索,所以通过在多个实体中指定基础实体,那么最终获取的实体对都包括基础实体的实体属性向量,在训练语义网络模型时,可以模拟真实场景中的相似度计算过程,使得语义网络模型更加适应真实场景,确定的相似度准确度更高。
[0088]
本发明实施例还提供了一种实体相似度确定装置。如图4所示,是根据本发明一实施例的实体相似度确定装置的结构图。
[0089]
该实体相似度确定装置,包括:获取模块410,确定模块420,筛选模块430和训练模块440。
[0090]
获取模块410,用于从预设的样本实体集中,获取多个实体的实体属性向量。
[0091]
确定模块420,用于利用预设的相关性算法,确定多对存在相关性的实体属性向量,并将每对实体属性向量作为一个实体对。
[0092]
筛选模块430,用于在获得的多个实体对中,筛选出符合预设条件的实体对;其中,所述预设条件是指实体对中的两个实体属性向量存在关联关系。
[0093]
训练模块440,用于利用筛选出的实体对训练预设的语义网络模型,以便在所述语义网络模型收敛之后,利用所述语义网络模型确定目标实体与候选实体的相似度。
[0094]
本发明实施例所述的装置的功能已经在上述方法实施例中进行了描述,故本发明实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
[0095]
本实施例提供一种实体相似度确定设备。如图5所示,为根据本发明一实施例的实体相似度确定设备的结构图。
[0096]
在本实施例中,所述实体相似度确定设备,包括但不限于:处理器510、存储器520。
[0097]
所述处理器510用于执行存储器520中存储的实体相似度确定程序,以实现上述的实体相似度确定方法。
[0098]
具体而言,所述处理器510用于执行存储器520中存储的实体相似度确定程序,以实现以下步骤:从预设的样本实体集中,获取多个实体的实体属性向量;利用预设的相关性算法,确定多对存在相关性的实体属性向量,并将每对实体属性向量作为一个实体对;在获得的多个实体对中,筛选出符合预设条件的实体对;其中,所述预设条件是指实体对中的两个实体属性向量存在关联关系;利用筛选出的实体对训练预设的语义网络模型,以便在所述语义网络模型收敛之后,利用所述语义网络模型确定目标实体与候选实体的相似度。
[0099]
其中,在获取多个实体的实体属性向量之后,还包括:在多个所述实体中选择一个基准实体;利用预设的相关性算法,确定多对存在相关性的实体属性向量,包括:利用预设的相关性算法,在获取的多个实体的实体属性向量中,确定与所述基准实体的实体属性向量存在相关性的实体属性向量。
[0100]
其中,利用预设的相关性算法,确定多对存在相关性的实体属性向量,包括:计算两个实体属性向量的內积,得到所述两个实体属性向量的內积向量;针对得到的所述內积向量执行归一化处理;针对归一化处理后的所述內积向量执行池化处理,得到所述两个实体属性向量的池化结果;在所述两个实体属性向量的池化结果为第一数值时,确定所述两个实体属性向量存在相关性。
[0101]
其中,所述关联关系,包括:在所述实体对中,两个实体属性向量的目标属性值相同,并且,所述两个实体属性向量之间的置信度大于预设的置信度阈值,并且,所述两个实体属性向量之间的支持度大于预设的支持度阈值;其中,所述置信度用于表示所述两个实体前后出现的概率;所述支持度用于表示所述两个实体同时出现的概率。
[0102]
其中,所述置信度表示所述实体对中的基准实体出现后,另一个实体也出现的概率;其中,所述基准实体是在所述获取多个实体的实体属性向量之后,在多个所述实体中选择的;每个所述实体对中都包括所述基准实体的实体属性向量。
[0103]
其中,在从预设的样本实体集中,获取多个实体的实体属性向量之前,还包括:为所述样本实体集中的每个所述实体的实体属性向量设置标签;所述标签为所述样本实体集中与所述实体相似的另一实体的信息;利用筛选出的实体对训练预设的语义网络模型,包括:将筛选出的实体对顺序输入所述语义网络模型,获得所述语义网络模型输出的每个所述实体对的相似度;根据所述实体对中每个实体的标签,确定所述实体对的真实相似度;根据所述语义网络模型输出的每个所述实体对的相似度以及每个所述实体对的真实相似度,
确定所述语义网络模型是否收敛;在所述语义网络模型尚未收敛的情况下,调整所述语义网络模型中的参数,并将相似度大于预设相似度阈值的实体对再次输入所述语义网络模型,以便再次确定所述语义网络模型是否收敛;在所述语义网络模型已经收敛的情况下,停止对所述语义网络模型进行训练。
[0104]
其中,利用所述语义网络模型确定目标实体与候选实体的相似度,包括:接收来自于客户端的实体展示请求;从实体数据库中,查询所述实体展示请求对应的目标实体,并且查询所述目标实体的实体属性向量;将所述目标实体的实体属性向量输入所述语义网络模型,通过所述语义网络模型从所述实体数据库中查询候选实体的实体属性向量,并根据所述目标实体的实体属性向量和每个所述候选实体的实体属性向量,确定所述目标实体分别与每个所述候选实体的相似度;在利用所述语义网络模型确定目标实体与候选实体的相似度之后,还包括:根据所述目标实体分别与每个所述候选实体的相似度,获取预设数量的所述候选实体作为反馈实体;其中,被获取的所述候选实体与所述目标实体的相似度大于未被获取的所述候选实体与所述目标实体的相似度;将所述目标实体对应的目标展示信息以及每个所述反馈实体分别对应的反馈展示信息发送给所述客户端,以便所述客户端在展示所述目标实体对应的目标展示信息时,展示每个所述反馈实体对应的反馈展示信息。
[0105]
其中,利用所述语义网络模型确定目标实体与候选实体的相似度,包括:接收来自于客户端的目标实体的信息;根据所述目标实体的信息,从实体数据库中,查询所述目标实体的实体属性向量;将所述目标实体的实体属性向量输入所述语义网络模型,通过所述语义网络模型从所述实体数据库中查询候选实体的实体属性向量,并根据所述目标实体的实体属性向量和每个所述候选实体的实体属性向量,确定所述目标实体分别与每个所述候选实体的相似度;在利用所述语义网络模型确定目标实体与候选实体的相似度之后,还包括:根据所述目标实体分别与每个所述候选实体的相似度,获取预设数量的所述候选实体作为反馈实体;其中,被获取的所述候选实体与所述目标实体的相似度大于未被获取的所述候选实体与所述目标实体的相似度;将每个所述反馈实体分别对应的反馈展示信息发送给所述客户端,以便所述客户端展示每个所述反馈实体对应的反馈展示信息。
[0106]
本发明实施例还提供了一种计算机可读存储介质。这里的计算机可读存储介质存储有一个或者多个程序。其中,计算机可读存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
[0107]
当计算机可读存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述的实体相似度确定方法。
[0108]
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1