基于知识图谱的对象识别方法、装置、可读介质和设备与流程

文档序号:26854017发布日期:2021-10-09 02:54阅读:130来源:国知局
基于知识图谱的对象识别方法、装置、可读介质和设备与流程

1.本公开涉及电子信息处理技术领域,具体地,涉及一种基于知识图谱的对象识别方法、装置、可读介质和设备。


背景技术:

2.随着电子信息技术的不断发展,应用市场上出现了各种各样的游戏类应用程序。在游戏运营过程中,会通过投放多媒体内容的方式,来增加游戏的曝光度,从而提高游戏的活跃量。为了提高投放的准确度,通常会在多种投放平台中选择适用于该游戏的目标投放平台,并在目标投放平台上定向投放。现有技术中,存在基于知识图谱来识别目标对象,进行精准投放的方法,然而这种方式需要对象与游戏之间存在交互行为,对于新上架的游戏来说,对象与游戏之间往往不存在交互行为,或者存在很少的交互行为,知识图谱会出现冷启动的问题,导致无法识别目标对象。


技术实现要素:

3.提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
4.第一方面,本公开提供一种基于知识图谱的对象识别方法,所述方法包括:
5.根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;
6.根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;
7.若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。
8.第二方面,本公开提供一种基于知识图谱的对象识别装置,所述装置包括:
9.向量确定模块,用于根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;
10.相关度确定模块,用于根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏的种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;
11.识别模块,用于若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。
12.第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处
理装置执行时实现本公开第一方面所述方法的步骤。
13.第四方面,本公开提供一种电子设备,包括:
14.存储装置,其上存储有计算机程序;
15.处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面所述方法的步骤。
16.通过上述技术方案,本公开首先根据预先建立的游戏知识图谱,确定待识别对象向量和目标游戏向量。之后根据待识别对象向量、目标游戏向量和预先训练的识别模型,确定待识别对象与目标游戏的相关度,其中识别模型为根据用于表征目标游戏的种子对象的种子对象向量和目标游戏向量训练得到的。最后,在待识别对象与目标游戏的相关度满足预设条件的情况下,确定待识别对象为目标游戏的目标对象。本公开通过游戏知识图谱得到用于表征待识别对象和目标游戏的向量,再利用识别模型对向量进行识别,从而确定待识别对象是否为目标对象。不需要待识别对象与目标游戏之间存在交互行为,就能够有效识别目标对象,解决了对象识别的冷启动问题,提高了对象识别的效率和准确度。
17.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
18.结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
19.图1是根据一示例性实施例示出的一种基于知识图谱的对象识别方法的流程图;
20.图2是根据一示例性实施例示出的一种游戏知识图谱的示意图;
21.图3是根据一示例性实施例示出的一种训练识别模型的流程图;
22.图4是根据一示例性实施例示出的另一种训练识别模型的流程图;
23.图5是根据一示例性实施例示出的一种识别模型的示意图;
24.图6是根据一示例性实施例示出的一种建立游戏知识图谱的流程图;
25.图7是根据一示例性实施例示出的另一种建立游戏知识图谱的流程图;
26.图8是根据一示例性实施例示出的另一种基于知识图谱的对象识别方法的流程图;
27.图9是根据一示例性实施例示出的一种对象游戏图谱的示意图;
28.图10是根据一示例性实施例示出的一种基于知识图谱的对象识别装置的框图;
29.图11是根据一示例性实施例示出的另一种基于知识图谱的对象识别装置的框图;
30.图12是根据一示例性实施例示出的另一种基于知识图谱的对象识别装置的框图;
31.图13是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
32.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
33.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
34.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
35.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
36.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
37.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
38.图1是根据一示例性实施例示出的一种基于知识图谱的对象识别方法的流程图,如图1所示,该方法包括以下步骤:
39.步骤101,根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量。
40.其中,游戏知识图谱中包括多个节点和至少一个边,多个节点包括:对象节点、游戏节点和内容节点,每个边用于表征该边两端的两个节点之间具有关联。
41.举例来说,要从大量的对象中识别出目标游戏的目标对象,可以先建立游戏知识图谱。可以理解为,一个游戏生态中包括多个对象、游戏、内容,游戏知识图谱能够表征游戏生态,反映的是多个对象、游戏、内容之间的关联。游戏知识图谱中可以包括多个节点,节点分为三类:用于表示对象的对象节点、用于表示游戏的游戏节点,和用于表示内容的内容节点。其中,对象可以理解为用于投放多媒体内容的投放平台,用户可以通过投放平台下载游戏、进入游戏等。投放平台例如可以是一个应用程序,也可以是同一个服务器对应的一组应用程序,还可以是应用程序中的一个页面等。对象还可以理解为投放区域,投放区域内的用户可以下载游戏、进入游戏等。投放区域例如可以是一个局域网覆盖的区域,也可以是一个基站覆盖的区域,还可以一个运营商提供服务的区域等。对象也可以理解为一个终端设备,用户可以通过终端设备下载游戏、进入游戏等。对象还可以理解为用户,本公开对于对象的具体含义不作具体限定。内容可以理解为通过对象展示的任意内容,例如可以是文本(例如:新闻、小说、博客等)、音频(例如:音乐、广播、有声书等)、视频(例如:电影、电视剧、短视频等)中任一种。游戏知识图谱中还包括至少一个边,若任意两个节点之间具有关联,那么该两个节点之间存在一个边,即每个边能够表征该边两端的两个节点之间具有关联,进一步的,每个边的宽度或者数值还可以表征该边两端的两个节点之间具有的关联的属性。例如,表示a内容的内容节点,与表示a游戏的游戏节点之间存在一个边,该边用于表征a内容中提到了a游戏。进一步的,若a内容为一篇博客,其中70%文字都是在描述a游戏,那么该边的数值可以是0.7。在一种实现方式中,每个节点还可以包括有该节点的属性(例如对象节点包括对应的对象的画像),在另一种实现方式中,也可以将每个节点的属性,作为一个属性节点,并与对应的节点之间建立边。以图2所示的游戏知识图谱为例,其中包括了:表示对
象甲的节点甲、表示对象乙的节点乙,表示游戏a的节点a、表示游戏b的节点b,表示内容a的节点a、表示内容b的节点b,还包括表示对象甲的画像的节点甲1,表示游戏a的标签的节点a1,表示内容a的标签的节点a1。其中,节点甲1与节点甲之间是单向箭头,表示节点甲1是节点甲的属性节点,节点乙与节点甲之间是双向箭头,表示节点甲与节点乙之间具有关联(例如:在对象为应用程序的场景中,可以是对象甲和对象乙使用同一个服务器)。节点a与节点a1之间是单向箭头,表示节点a1是节点a的属性节点,节点b与节点a之间是双向箭头,表示节点a与节点b之间具有相似关联(例如:游戏a和游戏b属于相同的游戏开发商)。节点a与节点a1之间是单向箭头,表示节点a1是节点a的属性节点,节点b与节点a之间是双向箭头,表示节点a与节点b之间具有相似关联(例如:内容a和内容b描述了相同的游戏)。需要说明的是,在对象为用户的场景中,上述建立游戏知识图谱所需要的信息,均是得到用户授权的情况下获得的,或者在用户阅读相关说明后主动提交的,或者是用户在使用终端设备时终端设备必然会发送至服务器的。
42.要对待识别对象进行识别,可以通过游戏知识图谱确定用于表征待识别对象的待识别对象向量,和用于表征目标游戏的目标游戏向量。其中,待识别对象可以为游戏知识图谱中任一对象节点表示的对象。在一种实现方式中,可以利用图神经网络(英文:graph neural networks,缩写:gnn)、图卷积神经网络(英文:graph convolutional network,缩写:gcn)或者graphsage(英文:graph sample and aggregate)等,确定游戏知识图谱中每个节点对应的向量,从而得到表示待识别对象的对象节点对应的待识别对象向量,和表示目标游戏的游戏节点对应的目标游戏向量。在另一种实现方式中,还可以根据游戏知识图谱,建立能够反映各个游戏节点之间,在对象、内容、游戏等多个维度的关联的多个子图谱,并利用预设的图表示算法和多个子图谱,确定每个游戏节点对应的向量。再根据游戏知识图谱,建立能够反映各个对象节点与游戏节点之间,在游戏、内容等多个维度的关联的多个子图谱,最后结合每个游戏节点对应的向量和多个子图谱,确定每个对象节点对应的向量,从而得到表示待识别对象的对象节点对应的待识别对象向量,和表示目标游戏的游戏节点对应的目标游戏向量。
43.步骤102,根据待识别对象向量、目标游戏向量和预先训练的识别模型,确定待识别对象与目标游戏的相关度,识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和目标游戏向量训练得到的,种子对象向量根据游戏知识图谱确定。
44.步骤103,若待识别对象与目标游戏的相关度满足预设条件,确定待识别对象为目标游戏的目标对象。
45.示例的,可以根据游戏知识图谱,确定用于表征目标游戏的种子对象的种子对象向量,然后利用种子对象向量和目标游戏向量预先训练识别模型,识别模型可以理解为,能够识别出任一个对象与目标游戏的相关度的模型。识别模型可以是lookalike方式中的分类模型,例如可以是:随机森林(英文:random forest,缩写:rf),adaboost模型,xgboost模型等,识别模型也可以是卷积神经网络(英文:convolutional neural networks,缩写:cnn),本公开对此不作具体限定。其中,种子对象为多个,可以理解为投放过目标游戏的多媒体内容的投放平台、提供目标游戏进入接口的投放平台、安装有目标游戏的终端设备,或者下载并使用过目标游戏的用户等。例如,在目标游戏上架之前,可以利用内测等方式,先让部分用户对目标游戏进行试玩,这部分用户即为种子对象。再比如,在目标游戏上架之
前,可以在部分投放平台投放目标游戏的多媒体内容,可以将这些投放平台作为种子对象。可以将种子对象向量作为正样本,将非种子对象的对象向量作为负样本,对识别模型进行训练。在训练得到识别模型之后,可以将待识别对象向量和目标游戏向量输入识别模型,以根据识别模型的输出确定待识别对象与目标游戏的相关度。可以理解为,识别模型能够输出待识别对象与目标游戏的相关度评分,以作为待识别对象与目标游戏的相关度。
46.最后,若待识别对象与目标游戏的相关度满足预设条件,可以确定待识别对象为目标游戏的目标对象。预设条件可以是大于或等于预设的阈值,那么若待识别对象与目标游戏的相关度大于或等于预设的阈值,可以确定待识别对象为目标对象。预设条件也可以是最大的指定数量(例如1000个)个相关度,可以先分别确定多个待识别对象与目标游戏的相关度,然后将相关度最大的指定数量个待识别对象作为目标对象。在确定目标对象之后,可以针对目标对象定向投放目标游戏的多媒体内容。
47.由于游戏知识图谱表征的是整个游戏生态,能够反映对象、游戏、内容之间的关联,因此不需要待识别对象与目标游戏之间存在交互行为,同时利用能够表征待识别对象和目标游戏的向量,从而有效识别目标对象,解决了对象识别的冷启动问题,提高了对象识别的效率。同时,由于游戏知识图谱能够反映对象、游戏、内容之间的关联,因此待识别对象向量和目标游戏向量也是从对象、游戏、内容三个维度来表征待识别对象和目标游戏,对于识别模型来说,获得了更多维度的信息来进行识别,能够更准确地识别出待识别对象与目标游戏的相关度,从而提高对象识别的准确度。
48.综上所述,本公开首先根据预先建立的游戏知识图谱,确定待识别对象向量和目标游戏向量。之后根据待识别对象向量、目标游戏向量和预先训练的识别模型,确定待识别对象与目标游戏的相关度,其中识别模型为根据用于表征目标游戏的种子对象的种子对象向量和目标游戏向量训练得到的。最后,在待识别对象与目标游戏的相关度满足预设条件的情况下,确定待识别对象为目标游戏的目标对象。本公开通过游戏知识图谱得到用于表征待识别对象和目标游戏的向量,再利用识别模型对向量进行识别,从而确定待识别对象是否为目标对象。不需要待识别对象与目标游戏之间存在交互行为,就能够有效识别目标对象,解决了对象识别的冷启动问题,提高了对象识别的效率和准确度。
49.在一种实现方式中,步骤102的实现方式可以为:
50.将待识别对象向量、目标游戏向量和待识别对象的对象特征,输入识别模型,以得到识别模型输出的待识别对象与目标游戏的相关度,对象特征根据待识别对象的对象信息确定。
51.举例来说,要对待识别对象进行识别,还可以根据待识别对象的对象信息,确定对象特征。其中,在对象为用户的场景中,对象信息是得到用户授权的情况下获得的,或者在用户阅读相关说明后主动提交的,或者是用户在使用终端设备时终端设备必然会发送至服务器的。进一步的,针对对象信息中有关个人属性的数据,都是经过脱敏处理的,例如可以将某一类数据进行部分隐藏,或者将某一类数据,进行分段划分等。对象特征可以理解为能够反映待识别对象活跃性的统计指标或者变化趋势,可以包括一种或多种特征。对象特征可以包括对象在不同阶段的多种特征。例如,在对象为用户的场景中,可以将根据对象信息统计得到的待识别对象浏览与目标游戏相关的内容的时长作为对象特征,还可以将根据对象信息统计得到的待识别对象浏览与目标游戏相关的内容的频率作为对象特征,也可以将
待识别对象浏览与目标游戏相关的内容的方式(例如:开屏方式、信息流)、渠道(例如:不同app)作为对象特征。在对象为投放平台的场景中,可以将根据对象信息统计得到的待识别对象展示与目标游戏相关的内容的时长作为对象特征,还可以将根据对象信息统计得到的待识别对象展示与目标游戏相关的内容的频率作为对象特征。本公开对具体对象特征包括的种类、获取对象特征的方式不作具体限定。在得到对象特征之后,可以将对象特征与待识别对象向量、目标游戏向量进行拼接,一同输入到识别模型,以得到识别模型输出的待识别对象与目标游戏的相关度。对于识别模型来说,除了获得待识别对象向量和目标游戏向量之外,还结合了对象特征,能够更准确地识别出待识别对象与目标游戏的相关度,进一步提高对象识别的准确度。
52.图3是根据一示例性实施例示出的一种训练识别模型的流程图,如图3所示,对象节点中包括多个样本对象对应的对象节点,样本对象包括正样本对象和负样本对象,正样本对象包括种子对象。所述方法还包括:
53.步骤104,针对目标游戏训练上述识别模型。
54.具体的,步骤104的实现方式可以为:
55.步骤1041,获取样本输入集,样本输入集包括:每个样本对象对应的样本输入,样本输入包括:根据游戏知识图谱确定的,用于表征该样本对象的对象向量和目标游戏向量。
56.步骤1042,获取样本输出集,样本输出集中包括与每个样本输入对应的样本输出,每个样本输出包括对应的样本对象的真实识别结果。
57.步骤1043,将样本输入集作为识别模型的输入,将样本输出集作为识别模型的输出,以训练识别模型。
58.举例来说,在对上述实施例中的识别模型进行训练时,需要先获取样本输入集和样本输出集。其中,样本输入集中包括了多个样本对象中每个样本对象对应的样本输入,该样本对象对应的样本输入为该样本对象的对象向量和目标游戏向量。需要说明的是,多个样本对象中包括多个正样本对象和多个负样本对象,正样本对象可以包括种子对象,进一步的,还可以控制正样本对象的数量与负样本对象的数量的比值(例如可以是1:1)。样本输出集中包括了与每个样本输入对应的样本输出,每个样本输出包括对应的样本对象的真实识别结果。其中,正样本对象的真实识别结果为正确(可以表示为1),即正样本对象为目标游戏的目标对象,负样本对象的真实识别结果为错误(可以表示为0),即负样本对象不为目标游戏的目标对象。之后,可以将样本输入集作为识别模型的输入,将样本输出集作为识别模型的输出来训练,使得在输入样本输入集时,识别模型的输出,能够和样本输出集匹配。例如,可以根据识别模型的输出,与样本输出集的差(或者均方差)作为识别模型的损失函数,以降低损失函数为目标,利用反向传播算法来修正识别模型中的神经元的参数,神经元的参数例如可以是神经元的权重(英文:weight)和偏置量(英文:bias)。重复上述步骤,直至损失函数满足预设条件,例如损失函数小于预设的损失阈值。
59.在一种应用场景中,正样本对象还可以包括扩展对象,扩展对象是通过以下方式确定的:
60.步骤1)根据用于表征其他游戏的其他游戏向量与目标游戏向量,确定其他游戏与目标游戏的相关度,其他游戏为除目标游戏之外的游戏,其他游戏向量根据所述游戏知识图谱确定。
61.步骤2)将与目标游戏的相关度大于或等于预设的相关度阈值的其他游戏,作为目标游戏对应的相关游戏。
62.步骤3)将相关游戏的活跃对象作为扩展对象。
63.举例来说,通常情况下,需要通过内测等方式来获取种子对象,当种子对象的数量过少,或者无法获取种子对象时,可能出现识别模型的冷启动问题。因此,可以先借助游戏知识图谱中确定的每个游戏向量,分别计算其他游戏与目标游戏的相关度,然后将与目标游戏的相关度大于或等于预设的相关度阈值的其他游戏,作为目标游戏对应的相关游戏,相关游戏可以是一个或多个。其中,其他游戏与目标游戏的相关度,例如可以是其他游戏对应的游戏向量,与目标游戏的游戏向量之间的余弦相似度,也可以是其他游戏对应的游戏向量,与目标游戏的游戏向量之间的jaccard相似度,本公开对此不作具体限定。最后,可以将相关游戏的活跃对象作为扩展对象,以将扩展对象作为用以训练识别模型的正样本对象,这样,能够解决由于种子对象数量过少,导致识别模型的冷启动问题。具体的,相关游戏的活跃对象,可以直接根据相关游戏已获取的历史数据确定,也可以将满足指定条件(例如:连续上线n天,或者使用时间超过m个小时)的对象确定为活跃对象,还可以在游戏知识图谱中筛选出活跃对象,其中,活跃对象对应的对象节点与相关游戏对应的游戏节点之间具有边,且边的数值满足指定条件。
64.图4是根据一示例性实施例示出的另一种训练识别模型的流程图,如图4所示,步骤1043的实现方式可以包括:
65.步骤a,按照预设的聚类算法对样本输入集进行聚类,以得到多组样本输入子集,每组样本输入子集对应一组样本输出子集。
66.步骤b,针对每组样本输入子集,将该组样本输入子集输入识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型。
67.其中,识别模型的输出,根据每组样本输入子集对应的识别子模型的输出确定。
68.示例的,在样本对象涵盖了多种对象群体的情况下,可以先按照预设的聚类算法对样本输入集进行聚类,以得到多组样本输入子集,每组样本输入子集中包括了样本输入集中的部分样本输入,可以理解为这部分样本输入属于同一个对象群体。相应的,每组样本输入子集对应一组样本输出子集,该样本输出子集中包括这部分样本输入对应的样本输出。其中,聚类算法例如可以是dbscan(英文:density

based spatial clustering of applications with noise,中文:具有噪声的基于密度的聚类方法),本公开对此不作具体限定。
69.进一步的,识别模型中可以包括与每组样本输入子集对应的识别子模型,即识别子模型与样本输入子集一一对应,识别模型的结构可以如图5所示。针对每组样本输入子集,可以将该组样本输入子集输入对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为对应的识别子模型的输出,以训练对应的识别子模型,使得在输入该组样本输入子集时,对应的识别子模型的输出,能够和该组样本输入子集对应的样本输出子集匹配。例如,可以根据对应的识别子模型的输出,与对应的样本输出子集的差(或者均方差)作为对应的识别子模型的损失函数,以降低损失函数为目标,利用反向传播算法来修正对应的识别子模型中的神经元的参数。重复上述步骤,直至损失函数满足预设条件,例如损失函
数小于预设的损失阈值。
70.最后,可以根据每组样本输入子集对应的识别子模型的输出,来确定识别模型的输出,即可以将识别模型理解为一个包括了多个识别子模型的投票系统。例如,可以将每组样本输入子集对应的识别子模型的输出的平均值,作为识别模型的输出,也可以将每组样本输入子集对应的识别子模型的输出的最大值,作为识别模型的输出,还可以将每组样本输入子集对应的识别子模型的输出进行加权求和,作为识别模型的输出。本公开对此不作具体限定。由于样本对象涵盖了多种对象群体,相应训练出的识别模型具有较强的泛化能力,能够准确识别出多种对象群体中的对象与目标游戏的相关度。
71.在一种应用场景中,每组样本输入子集对应的识别子模型,为树集成模型,包括多个树模型。步骤b的实现方式可以包括:
72.首先,针对每个树模型,对该组样本输入子集进行随机采样,以得到采样输入子集,采样输入子集包括的样本输入的数量,小于该组样本输入子集包括的样本输入的数量。
73.之后,对采样输入子集中包括的每个样本输入进行随机采样,以得到该样本输入对应的采样样本输入,采样样本输入属于该样本输入。
74.最后,将采样输入子集中包括的每个样本输入对应的采样样本输入作为该树模型的输入,将采样输入子集中包括的每个样本输入对应的样本输出作为该树模型的输出,以训练该树模型。
75.其中,树集成模型的输出,根据每个树模型的输出确定。
76.举例来说,上述每个识别子模型,都可以是树集成模型(或者称为集成树模型),例如:可以是随机森林、adaboost模型,xgboost模型等,其中包括了多个树模型,树模型例如可以是分类树。针对每个识别子模型进行训练的过程,可以是联合训练该识别子模型中包括的多个树模型的过程。
77.针对每个树模型,可以先对该组样本输入子集进行随机采样,以得到采样输入子集,采样输入子集包括的样本输入的数量,小于该组样本输入子集包括的样本输入的数量,即采样输入子集中包括了该组样本输入子集中的部分样本输入。例如,该组样本输入子集中包括了100个样本输入,进行随机采样,得到的采样输入子集中可以包括75个样本输入。之后,再对采样输入子集中包括的每个样本输入进行随机采样,以得到该样本输入对应的采样样本输入,采样样本输入属于该样本输入,即采样样本输入的维度,小于该样本输入的维度。例如,采样输入子集中包括了75个样本输入,每个样本输入为256维的向量。对每个样本输入进行随机采样,得到的75个样本输入对应的75个采样样本输入,每个采样样本输入可以为200维的向量。再将采样输入子集中包括的每个样本输入对应的采样样本输入作为该树模型的输入,将采样输入子集中包括的每个样本输入对应的样本输出作为该树模型的输出,以训练该树模型,使得在输入采样样本输入时,对应的树模型的输出,能够和对应的样本输出匹配。例如,可以根据对应的树模型的输出,与对应的样本输出的差(或者均方差)作为对应的树模型的损失函数,以降低损失函数为目标,利用反向传播算法来修正对应的树模型中的神经元的参数。重复上述步骤,直至损失函数满足预设条件,例如损失函数小于预设的损失阈值。
78.最后,可以根据每个树模型的输出,来确定树集成模型的输出,即可以将树集成模型理解为一个包括了多个树模型的投票系统。例如,可以将每个树模型的输出的平均值,作
为树集成模型的输出,也可以将每个树模型的输出的最大值,作为树集成模型的输出,还可以将每个树模型的输出进行加权求和,作为树集成模型的输出。本公开对此不作具体限定。由于对每组样本输入子集进行了随机采样,并对其中每个样本输入进行了随机采样,因此,能够在样本数量、样本表征两个维度提高树集成模型的泛化能力,从而使识别模型能够准确识别出对象与目标游戏的相关度。
79.图6是根据一示例性实施例示出的一种建立游戏知识图谱的流程图,如图6所示,游戏知识图谱是通过以下步骤建立的:
80.步骤c,获取多个对象的对象信息、多个游戏的游戏信息和多个内容的内容信息。其中,内容为文本、音频、视频中任一种,多个对象中包括待识别对象和种子对象,多个游戏包括目标游戏。
81.示例的,在对待识别对象进行识别之前,可以先建立游戏知识图谱。具体的,可以先获取多个对象的对象信息、多个游戏的游戏信息和多个内容的内容信息。其中,对象的数量、游戏的数量和内容的数量互不相关。可以理解为,游戏生态中包括了多个对象、游戏和内容,其中,多个对象中包括了上述待识别对象和种子对象,还可以包括其他的对象。多个游戏包括了上述目标游戏,还可以包括其他的游戏(例如前文提及的相关游戏)。
82.具体的,对象信息例如可以包括对应的对象的对象画像、对象标识、对象群体类型等。需要说明的是,在对象为用户的场景中,对象信息均是在得到相应的用户授权的情况下获得的,或者相应的用户在阅读相关说明后主动提交的,或者是用户在使用终端设备时终端设备必然会发送至服务器的。进一步的,针对对象信息中有关个人属性的数据,都是经过脱敏处理的,例如可以将某一类数据进行部分隐藏,或者将某一类数据,进行分段划分等。游戏信息可以包括对应的游戏的游戏标签(例如:扑克、换装、对战、篮球、回合制、角色扮演、及时战略等)、游戏类别(例如:棋牌类、养成类、对战类、体育类等)、游戏开发商等。内容信息可以包括对应的内容的内容标签、内容类别、内容提供者等,其中,内容标签和内容类别,与游戏标签和游戏类别可以是共享的,即可以根据内容中所涉及的游戏来确定相应的内容标签和内容类别。例如,内容a中涉及了游戏a,那么内容a的内容标签和内容类别,可以与游戏a游戏标签和游戏类别相同。
83.需要说明的是,在得到对象信息、游戏信息和内容信息之后,可以先对这些信息进行数据清洗,再进行归一化处理。具体的,数据清洗的过程可以是删除数据缺失较多的信息,还可以对数据缺失较少的信息利用插值法来补全。本公开对此不作具体限定。
84.步骤d,建立每个对象对应的对象节点、每个游戏对应的游戏节点、每个内容对应的内容节点。
85.步骤e,根据预设的关联规则,在多个节点之间建立边。
86.示例的,可以在游戏知识图谱中分别为每个对象、每个游戏、每个内容建立相应的节点,即游戏知识图谱中至少包括三类节点:用于表示对象的对象节点、用于表示游戏的游戏节点和用于表示内容的内容节点。进一步的,游戏知识图谱中,还可以包括用于表示对象信息的对象属性节点、用于表示游戏信息的游戏属性节点、用于表示内容信息的内容属性节点。之后,可以根据预设的关联规则,在具有关联的两个节点之间建立边,从而得到游戏知识图谱。
87.图7是根据一示例性实施例示出的另一种建立游戏知识图谱的流程图,如图7所
示,步骤e的实现方式可以包括:
88.步骤e1,根据每个对象的对象信息,确定与该对象满足关联规则的游戏关联对象,游戏关联对象包括:对象、游戏、内容中的至少一种,并在该对象对应的对象节点,与游戏关联对象对应的节点之间建立边。
89.步骤e2,根据每个内容的内容信息,确定与该内容满足关联规则的内容关联对象,内容关联对象包括:游戏,和/或内容,并在该内容对应的内容节点,与内容关联对象对应的节点之间建立边。
90.步骤e3,根据每个游戏的游戏信息,确定与该游戏满足关联规则的关联游戏,并在该游戏对应的游戏节点,与关联游戏对应的游戏节点之间建立边。
91.在游戏知识图谱中建立边的具体方式,可以先确定关联规则。关联规则中可以包括多种维度的关联:对象与对象之间的第一关联:例如对象与对象之间具有的关联、对象与对象的对象信息的相似度超过第一阈值(例如75%)等。对象与游戏之间的第二关联:例如对象下载、使用、消费过游戏。对象与内容之间的第三关联:例如对象浏览、评论、点赞、分享过内容。内容与内容的第四关联:例如内容与内容的内容信息的相似度超过第二阈值(例如60%)、内容与内容的内容信息中包括了相同的内容标签(或者内容类别、内容提供者)。内容与游戏之间的第五关联:例如内容的内容信息与游戏的游戏信息的相似度超过第三阈值(例如50%)。游戏与游戏的第六关联:例如游戏与游戏的游戏信息的相似度超过第四阈值(例如80%)、游戏与游戏的游戏信息中包括了相同的游戏标签(或者游戏类别、游戏开发商)。
92.之后,可以根据关联规则,确定与每个对象满足关联规则(例如:第一关联、第二关联、第三关联)的对象、游戏、内容(即游戏关联对象),并建立相应的边。确定与每个内容满足关联规则(例如:第四关联、第五关联)的游戏、内容(即内容关联对象),并建立相应的边。确定与每个游戏满足关联规则(即第六关联)的关联游戏,并建立相应的边。这样,游戏知识图谱中的边,能够从多个维度描述对象、游戏、内容之间的关联。
93.需要说明的是,上述实施例中的执行顺序仅用于举例说明,步骤e1、步骤e2、步骤e3之间的执行顺序可以根据具体需求来设置,本公开对此不作具体限定。
94.图8是根据一示例性实施例示出的另一种基于知识图谱的对象识别方法的流程图,如图8所示,步骤101的实现方式可以包括:
95.步骤1011,根据游戏知识图谱,确定用于表征每个游戏的游戏向量。
96.举例来说,可以先根据游戏知识图谱,来确定用于表征每个游戏的游戏向量。具体的,可以通过以下步骤来实现:
97.步骤4)根据游戏知识图谱中对象节点与游戏节点之间的边,确定对象游戏图谱,根据游戏知识图谱中对象节点与内容节点之间的边,确定对象内容图谱,根据游戏知识图谱中游戏节点与游戏节点之间的边,确定游戏图谱。
98.步骤5)根据预设的图表示算法、对象游戏图谱、对象内容图谱和游戏图谱,确定每个游戏向量。
99.其中,对象游戏图谱用于表征任意两个游戏节点在对象维度的关联,对象内容图谱用于表征任意两个游戏节点在内容维度的关联,游戏图谱用于表征任意两个游戏节点在游戏维度的关联。
100.示例的,可以先从游戏知识图谱中提取出用于表征任意两个游戏节点在对象维度的关联的对象游戏图谱、用于表征任意两个游戏节点在内容维度的关联的对象内容图谱、用于表征任意两个游戏节点在游戏维度的关联的游戏图谱。可以理解为,对象游戏图谱、对象内容图谱和游戏图谱中,均包括了多个游戏中每个游戏对应的游戏节点,若任意两个游戏在对象维度上存在关联,那么可以在对象游戏图谱中,该两个游戏对应的两个游戏节点之间建立一个边。同样的,若该两个游戏在内容(或者游戏)维度上存在关联,那么可以在对象内容图谱(或者游戏图谱)中,该两个游戏对应的两个游戏节点之间建立一个边。
101.具体的,游戏a和游戏b在对象维度上存在关联,可以理解为与游戏a和游戏b之间存在关联的对象的重合度大于预设的第五阈值(例如:30%),即游戏知识图谱中同时与游戏a对应的游戏节点之间存在边、且与游戏b对应的游戏节点之间存在边的对象节点的数量超过了对象的数量的30%。那么可以在对象游戏图谱中,游戏a对应的游戏节点与游戏b对应的游戏节点之间建立一个边,进一步的,还可以将对象的重合度作为该边的宽度,或者该边的数值。
102.游戏a和游戏b在内容维度上存在关联,可以理解为与内容a和内容b之间存在关联的对象的重合度大于预设的第六阈值(例如:20%),其中内容a中涉及了游戏a,内容b中涉及了游戏b,即游戏知识图谱中同时与内容a对应的内容节点之间存在边、且与内容b对应的内容节点之间存在边的对象节点的数量超过了对象的数量的20%。那么可以在对象内容图谱中,内容a对应的内容节点与内容b对应的内容节点之间建立一个边,进一步的,还可以将对象的重合度作为该边的宽度,或者该边的数值。
103.游戏a和游戏b在游戏维度上存在关联,可以理解为游戏a与游戏b游戏信息的相似度超过第七阈值(例如:50%),即游戏知识图谱中游戏a对应的游戏节点与游戏b对应的游戏节点之间的边,表示游戏a与游戏b游戏信息的相似度超过50%。那么可以在游戏图谱中,游戏a对应的游戏节点与游戏b对应的游戏节点之间建立一个边,进一步的,还可以将对象的相似度作为该边的宽度,或者该边的数值。
104.在得到对象游戏图谱、对象内容图谱和游戏图谱之后,可以根据预设的图表示算法,来确定每个游戏向量。其中,图表示算法能够将图谱按照邻接表或者邻接链表的方式进行表示,从而得到用于表征图谱中每个节点的向量。具体的,可以将对象游戏图谱输入图表示算法,以得到每个游戏对应的第一游戏向量,将对象内容图谱输入图表示算法,以得到每个游戏对应的第二游戏向量,将游戏图谱输入图表示算法,以得到每个游戏对应的第三游戏向量。最后,可以将每个游戏对应的第一游戏向量、第二游戏向量和第三游戏向量求平均,作为该游戏对应的游戏向量。也可以将每个游戏对应的第一游戏向量、第二游戏向量和第三游戏向量进行拼接,作为该游戏对应的游戏向量。还可以将每个游戏对应的第一游戏向量、第二游戏向量和第三游戏向量中的最大值,作为该游戏对应的游戏向量。本公开对具体确定游戏向量的方式不作具体限定。这样,每个游戏对应的游戏向量,能够从多个维度来表征游戏,相比于仅用游戏信息来描述游戏的方式,包含了更多的信息量。
105.步骤1012,根据游戏知识图谱和每个游戏向量,确定用于表征每个对象的对象向量。
106.示例的,在得到每个游戏向量之后,可以进一步结合游戏知识图谱,来确定用于表征每个对象的对象向量。具体的,可以通过以下步骤来实现:
107.在一种应用场景中,步骤1012可以通过以下步骤来实现:
108.步骤6)根据游戏知识图谱中对象节点与游戏节点之间的边,确定对象游戏图谱,根据游戏知识图谱中对象节点与内容节点之间的边,确定对象内容图谱。
109.步骤7)根据每个游戏向量、对象游戏图谱和对象内容图谱,确定每个对象向量。
110.其中,对象游戏图谱用于表征每个对象节点与每个游戏节点在游戏维度的关联,对象内容图谱用于表征每个对象节点与每个游戏节点在内容维度的关联。
111.示例的,可以先从游戏知识图谱中提取出用于表征每个对象节点与每个游戏节点在游戏维度的关联的对象游戏图谱,和用于表征每个对象节点与每个游戏节点在内容维度的关联的对象内容图谱。可以理解为,对象游戏图谱和对象内容图谱中,均包括了每个对象对应的对象节点,和每个游戏对应的游戏节点,若某个对象与某个游戏在游戏维度上存在关联,那么可以在对象游戏图谱中,该对象对应的对象节点,与该游戏对应的游戏节点之间建立一个边。同样的,若该游戏与该游戏在内容维度上存在关联,那么可以在对象内容图谱中,该对象对应的对象节点,与该游戏对应的游戏节点之间建立一个边。需要说明的是,步骤1011中的对象游戏图谱,与步骤1012中的对象游戏图谱表示不同的图谱,同样的,步骤1011中的对象内容图谱,与步骤1012中的对象内容图谱表示不同的图谱。
112.具体的,对象甲和游戏a在游戏维度上存在关联,可以理解为对象甲下载、使用、或者消费过游戏a,即游戏知识图谱中对象甲对应的对象节点与游戏a对应的游戏节点之间存在边。那么可以在对象游戏图谱中,对象甲对应的对象节点与游戏a对应的游戏节点之间建立一个边,进一步的,还可以将对象甲下载、使用、或者消费游戏a的任一种度量(例如:使用时长、使用频率等)作为该边的宽度,或者该边的数值。
113.对象甲和游戏a在内容维度上存在关联,可以理解为对象甲浏览、评论、点赞、或者分享过内容a,其中内容a中涉及了游戏a,即游戏知识图谱中对象甲对应的对象节点与内容a对应的内容节点之间存在边。那么可以在对象内容图谱中,对象甲对应的对象节点与游戏a对应的游戏节点之间建立一个边,进一步的,还可以将对象甲浏览、评论、点赞、或者分享内容a的任一种度量(例如:转发次数、点赞数量等)作为该边的宽度,或者该边的数值。
114.在得到对象游戏图谱和对象内容图谱之后,可以根据对象游戏图谱、对象内容图谱,和之前确定的每个游戏向量,来确定每个对象向量。具体的,可以根据对象游戏图谱确定每个对象对应的第一对象向量,同时根据对象内容图谱确定每个对象对应的第二对象向量。以图9所示的对象游戏图谱来举例,若对象游戏图谱中对象甲对应的节点甲,与游戏a对应的节点a、游戏b对应的节点b之间存在边,对象乙对应的节点乙,仅与节点b之间存在边,那么可以将游戏a对应的游戏向量,和游戏b对应的游戏向量求和,以作为对象甲对应的第一对象向量,将游戏b对应的游戏向量作为对象乙对应的第一对象向量。进一步的,若节点甲与节点a之间存在的边的数值为0.8,节点甲与节点b之间存在的边的数值为0.2,那么还可以将游戏a对应的游戏向量,和游戏b对应的游戏向量按照0.8、0.2的权重进行加权求和,以作为对象甲对应的第一对象向量。
115.根据对象内容图谱和每个游戏向量确定第二对象向量的方式,与根据对象游戏图谱和每个游戏向量确定第一对象向量的方式相同,此处不再赘述。最后,可以将每个对象对应的第一对象向量和第二对象向量求平均,作为该对象对应的对象向量。也可以将每个对象对应的第一对象向量和第二对象向量进行拼接,作为该对象对应的对象向量。还可以将
每个对象对应的第一对象向量和第二对象向量的最大值,作为该对象对应的对象向量。本公开对具体确定对象向量的方式不作具体限定。这样,每个对象对应的对象向量,能够利用游戏向量从多个维度来表征对象,反映了每个对象与每个游戏在不同维度上的关联,相比于仅用对象信息来描述对象的方式,包含了更多的信息量。
116.步骤1013,将用于表征待识别对象的对象向量作为待识别对象向量,并将用于表征目标游戏的游戏向量作为目标游戏向量。
117.示例的,根据步骤1011至步骤1012得到每个游戏向量和每个对象向量之后,可以将用于表征待识别对象的对象向量作为待识别对象向量,并将用于表征目标游戏的游戏向量作为目标游戏向量。进一步的,还可以将用于表征种子对象的对象向量,作为种子对象向量。
118.综上所述,本公开首先根据预先建立的游戏知识图谱,确定待识别对象向量和目标游戏向量。之后根据待识别对象向量、目标游戏向量和预先训练的识别模型,确定待识别对象与目标游戏的相关度,其中识别模型为根据用于表征目标游戏的种子对象的种子对象向量和目标游戏向量训练得到的。最后,在待识别对象与目标游戏的相关度满足预设条件的情况下,确定待识别对象为目标游戏的目标对象。本公开通过游戏知识图谱得到用于表征待识别对象和目标游戏的向量,再利用识别模型对向量进行识别,从而确定待识别对象是否为目标对象。不需要待识别对象与目标游戏之间存在交互行为,就能够有效识别目标对象,解决了对象识别的冷启动问题,提高了对象识别的效率和准确度。
119.图10是根据一示例性实施例示出的一种基于知识图谱的对象识别装置的框图,如图10所示,该装置200包括:
120.向量确定模块201,用于根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量。
121.相关度确定模块202,用于根据待识别对象向量、目标游戏向量和预先训练的识别模型,确定待识别对象与目标游戏的相关度,识别模型为根据用于表征目标游戏的种子对象的种子对象向量和目标游戏向量训练得到的,种子对象向量根据游戏知识图谱确定。
122.识别模块203,用于若待识别对象与目标游戏的相关度满足预设条件,确定待识别对象为目标游戏的目标对象。
123.在一种应用场景中,相关度确定模块202可以用于:
124.将待识别对象向量、目标游戏向量和待识别对象的对象特征,输入识别模型,以得到识别模型输出的待识别对象与目标游戏的相关度,对象特征根据待识别对象的对象信息确定。
125.在另一种应用场景中,游戏知识图谱包括多个节点和至少一个边,多个节点包括:对象节点、游戏节点和内容节点。每个边用于表征该边两端的两个节点之间具有关联。
126.图11是根据一示例性实施例示出的另一种基于知识图谱的对象识别装置的框图,如图11所示,对象节点中包括多个样本对象对应的对象节点,样本对象包括正样本对象和负样本对象,正样本对象包括种子对象。该装置200还可以包括:
127.训练模块204,用于针对目标游戏训练上述识别模型。
128.训练模块204可以用于执行以下步骤:
129.步骤a,获取样本输入集,样本输入集包括:每个样本对象对应的样本输入,样本输
入包括:根据游戏知识图谱确定的,用于表征该样本对象的对象向量和目标游戏向量。
130.步骤b,获取样本输出集,样本输出集中包括与每个样本输入对应的样本输出,每个样本输出包括对应的样本对象的真实识别结果。
131.步骤c将样本输入集作为识别模型的输入,将样本输出集作为识别模型的输出,以训练识别模型。
132.在另一种应用场景中,正样本对象还可以包括扩展对象,扩展对象是通过以下方式确定的。
133.步骤1)根据用于表征其他游戏的其他游戏向量与目标游戏向量,确定其他游戏与目标游戏的相关度,其他游戏为除目标游戏之外的游戏,其他游戏向量根据所述游戏知识图谱确定。
134.步骤2)将与目标游戏的相关度大于或等于预设的相关度阈值的其他游戏,作为目标游戏对应的相关游戏。
135.步骤3)将相关游戏的活跃对象作为扩展对象。
136.在又一种应用场景中,步骤c可以包括:
137.步骤c1,按照预设的聚类算法对样本输入集进行聚类,以得到多组样本输入子集,每组样本输入子集对应一组样本输出子集。
138.步骤c2,针对每组样本输入子集,将该组样本输入子集输入识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型。
139.其中,识别模型的输出,根据每组样本输入子集对应的识别子模型的输出确定。
140.在又一种应用场景中,每组样本输入子集对应的识别子模型,为树集成模型,包括多个树模型。步骤c2的实现方式可以包括:
141.首先,针对每个树模型,对该组样本输入子集进行随机采样,以得到采样输入子集,采样输入子集包括的样本输入的数量,小于该组样本输入子集包括的样本输入的数量。
142.之后,对采样输入子集中包括的每个样本输入进行随机采样,以得到该样本输入对应的采样样本输入,采样样本输入属于该样本输入。
143.最后,将采样输入子集中包括的每个样本输入对应的采样样本输入作为该树模型的输入,将采样输入子集中包括的每个样本输入对应的样本输出作为该树模型的输出,以训练该树模型。
144.其中,树集成模型的输出,根据每个树模型的输出确定。
145.在一种实现方式中,游戏知识图谱是通过以下步骤建立的:
146.步骤d,获取多个对象的对象信息、多个游戏的游戏信息和多个内容的内容信息。其中,内容为文本、音频、视频中任一种,多个对象中包括待识别对象和种子对象,多个游戏包括目标游戏。
147.步骤e,建立每个对象对应的对象节点、每个游戏对应的游戏节点、每个内容对应的内容节点。
148.步骤f,根据预设的关联规则,在多个节点之间建立边。
149.在另一种实现方式中,步骤f的实现方式可以包括:
150.步骤f1,根据每个对象的对象信息,确定与该对象满足关联规则的游戏关联对象,
游戏关联对象包括:对象、游戏、内容中的至少一种,并在该对象对应的对象节点,与游戏关联对象对应的节点之间建立边。
151.步骤f2,根据每个内容的内容信息,确定与该内容满足关联规则的内容关联对象,内容关联对象包括:游戏,和/或内容,并在该内容对应的内容节点,与内容关联对象对应的节点之间建立边。
152.步骤f3,根据每个游戏的游戏信息,确定与该游戏满足关联规则的关联游戏,并在该游戏对应的游戏节点,与关联游戏对应的游戏节点之间建立边。
153.图12是根据一示例性实施例示出的另一种基于知识图谱的对象识别装置的框图,如图12所示,向量确定模块201可以包括:
154.第一确定子模块2011,用于根据游戏知识图谱,确定用于表征每个游戏的游戏向量。
155.第二确定子模块2012,用于根据游戏知识图谱和每个游戏向量,确定用于表征每个对象的对象向量。
156.第三确定子模块2013,用于将用于表征待识别对象的对象向量作为待识别对象向量,并将用于表征目标游戏的游戏向量作为目标游戏向量。
157.在一种应用场景中,第一确定子模块2011可以用于执行以下步骤:
158.步骤4)根据游戏知识图谱中对象节点与游戏节点之间的边,确定对象游戏图谱,根据游戏知识图谱中对象节点与内容节点之间的边,确定对象内容图谱,根据游戏知识图谱中游戏节点与游戏节点之间的边,确定游戏图谱。
159.步骤5)根据预设的图表示算法、对象游戏图谱、对象内容图谱和游戏图谱,确定每个游戏向量。
160.其中,对象游戏图谱用于表征任意两个游戏节点在对象维度的关联,对象内容图谱用于表征任意两个游戏节点在内容维度的关联,游戏图谱用于表征任意两个游戏节点在游戏维度的关联。
161.在一种应用场景中,第二确定子模块2012可以用于执行以下步骤:
162.步骤6)根据游戏知识图谱中对象节点与游戏节点之间的边,确定对象游戏图谱,根据游戏知识图谱中对象节点与内容节点之间的边,确定对象内容图谱。
163.步骤7)根据每个游戏向量、对象游戏图谱和对象内容图谱,确定每个对象向量。
164.其中,对象游戏图谱用于表征每个对象节点与每个游戏节点在游戏维度的关联,对象内容图谱用于表征每个对象节点与每个游戏节点在内容维度的关联。
165.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
166.综上所述,本公开首先根据预先建立的游戏知识图谱,确定待识别对象向量和目标游戏向量。之后根据待识别对象向量、目标游戏向量和预先训练的识别模型,确定待识别对象与目标游戏的相关度,其中识别模型为根据用于表征目标游戏的种子对象的种子对象向量和目标游戏向量训练得到的。最后,在待识别对象与目标游戏的相关度满足预设条件的情况下,确定待识别对象为目标游戏的目标对象。本公开通过游戏知识图谱得到用于表征待识别对象和目标游戏的向量,再利用识别模型对向量进行识别,从而确定待识别对象是否为目标对象。不需要待识别对象与目标游戏之间存在交互行为,就能够有效识别目标
对象,解决了对象识别的冷启动问题,提高了对象识别的效率和准确度。
167.下面参考图13,其示出了适于用来实现本公开实施例的电子设备(例如可以上述实施例中的执行主体,可以是终端设备或服务器)300的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图13示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
168.如图13所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储装置308加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
169.通常,以下装置可以连接至i/o接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图13示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
170.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从rom 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
171.需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
172.在一些实施方式中,终端设备、服务器可以利用诸如http(hypertext transfer protocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
173.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
174.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。
175.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语言。程序代码可以完全地在对象计算机上执行、部分地在对象计算机上执行、作为一个独立的软件包执行、部分在对象计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)——连接到对象计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
176.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
177.描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,向量确定模块还可以被描述为“确定待识别对象向量和目标游戏向量的模块”。
178.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
179.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供
指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
180.根据本公开的一个或多个实施例,示例1提供了一种基于知识图谱的对象识别方法,包括:根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。
181.根据本公开的一个或多个实施例,示例2提供了示例1的方法,所述根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,包括:将所述待识别对象向量、所述目标游戏向量和所述待识别对象的对象特征,输入所述识别模型,以得到所述识别模型输出的所述待识别对象与所述目标游戏的相关度,所述对象特征根据所述待识别对象的对象信息确定。
182.根据本公开的一个或多个实施例,示例3提供了示例1或示例2的方法,所述游戏知识图谱包括多个节点和至少一个边,所述多个节点包括:对象节点、游戏节点和内容节点;每个边用于表征该边两端的两个节点之间具有关联。
183.根据本公开的一个或多个实施例,示例4提供了示例3的方法,所述对象节点包括多个样本对象对应的对象节点,所述样本对象包括正样本对象和负样本对象,所述正样本对象包括所述种子对象;所述方法还包括:针对所述目标游戏训练所述识别模型;所述针对所述目标游戏训练所述识别模型,包括:获取样本输入集,所述样本输入集包括:每个所述样本对象对应的样本输入,所述样本输入包括:根据所述游戏知识图谱确定的,用于表征该样本对象的对象向量和所述目标游戏向量;获取样本输出集,所述样本输出集中包括与每个所述样本输入对应的样本输出,每个所述样本输出包括对应的所述样本对象的真实识别结果;将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型。
184.根据本公开的一个或多个实施例,示例5提供了示例4的方法,所述正样本对象还包括扩展对象,所述扩展对象是通过以下方式确定的:根据用于表征其他游戏的其他游戏向量与所述目标游戏向量,确定所述其他游戏与所述目标游戏的相关度,所述其他游戏为除所述目标游戏之外的游戏,所述其他游戏向量根据所述游戏知识图谱确定;将与所述目标游戏的相关度大于或等于预设的相关度阈值的所述其他游戏,作为所述目标游戏对应的相关游戏;将所述相关游戏的活跃对象作为所述扩展对象。
185.根据本公开的一个或多个实施例,示例6提供了示例4的方法,所述将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述
识别模型,包括:按照预设的聚类算法对所述样本输入集进行聚类,以得到多组样本输入子集,每组所述样本输入子集对应一组样本输出子集;针对每组所述样本输入子集,将该组样本输入子集输入所述识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型;所述识别模型的输出,根据每组所述样本输入子集对应的识别子模型的输出确定。
186.根据本公开的一个或多个实施例,示例7提供了示例6的方法,每组所述样本输入子集对应的识别子模型,为树集成模型,包括多个树模型;所述将该组样本输入子集输入所述识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型,包括:针对每个所述树模型,对该组样本输入子集进行随机采样,以得到采样输入子集,所述采样输入子集包括的所述样本输入的数量,小于该组样本输入子集包括的所述样本输入的数量;对所述采样输入子集中包括的每个所述样本输入进行随机采样,以得到该样本输入对应的采样样本输入,所述采样样本输入属于该样本输入;将所述采样输入子集中包括的每个所述样本输入对应的采样样本输入作为该树模型的输入,将所述采样输入子集中包括的每个所述样本输入对应的所述样本输出作为该树模型的输出,以训练该树模型;所述树集成模型的输出,根据每个所述树模型的输出确定。
187.根据本公开的一个或多个实施例,示例8提供了示例3的方法,所述游戏知识图谱是通过以下步骤建立的:获取多个对象的对象信息、多个游戏的游戏信息和多个内容的内容信息;建立每个所述对象对应的对象节点、每个所述游戏对应的游戏节点、每个所述内容对应的内容节点;根据预设的关联规则,在所述多个节点之间建立边。
188.根据本公开的一个或多个实施例,示例9提供了示例8的方法,所述根据预设的关联规则,在所述多个节点之间建立边,包括:根据每个所述对象的对象信息,确定与该对象满足所述关联规则的游戏关联对象,所述游戏关联对象包括:对象、游戏、内容中的至少一种,并在该对象对应的对象节点,与所述游戏关联对象对应的节点之间建立边;根据每个所述内容的内容信息,确定与该内容满足所述关联规则的内容关联对象,所述内容关联对象包括:游戏,和/或内容,并在该内容对应的内容节点,与所述内容关联对象对应的节点之间建立边;根据每个所述游戏的游戏信息,确定与该游戏满足所述关联规则的关联游戏,并在该游戏对应的游戏节点,与所述关联游戏对应的游戏节点之间建立边。
189.根据本公开的一个或多个实施例,示例10提供了示例9的方法,所述根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量,包括:根据所述游戏知识图谱,确定用于表征每个所述游戏的游戏向量;根据所述游戏知识图谱和每个所述游戏向量,确定用于表征每个所述对象的对象向量;将用于表征所述待识别对象的对象向量作为所述待识别对象向量,并将用于表征目标游戏的游戏向量作为所述目标游戏向量。
190.根据本公开的一个或多个实施例,示例11提供了示例10的方法,所述根据所述游戏知识图谱,确定用于表征每个所述游戏的游戏向量,包括:根据所述游戏知识图谱中对象节点与游戏节点之间的边,确定对象游戏图谱,根据所述游戏知识图谱中对象节点与内容节点之间的边,确定对象内容图谱,根据所述游戏知识图谱中游戏节点与游戏节点之间的
边,确定游戏图谱;根据预设的图表示算法、所述对象游戏图谱、所述对象内容图谱和所述游戏图谱,确定每个所述游戏向量;其中,所述对象游戏图谱用于表征任意两个所述游戏节点在对象维度的关联,所述对象内容图谱用于表征任意两个所述游戏节点在内容维度的关联,所述游戏图谱用于表征任意两个所述游戏节点在游戏维度的关联。
191.根据本公开的一个或多个实施例,示例12提供了示例10的方法,所述根据所述游戏知识图谱和每个所述游戏向量,确定用于表征每个所述对象的对象向量,包括:根据所述游戏知识图谱中对象节点与游戏节点之间的边,确定对象游戏图谱,根据所述游戏知识图谱中对象节点与内容节点之间的边,确定对象内容图谱;根据每个所述游戏向量、所述对象游戏图谱和所述对象内容图谱,确定每个所述对象向量;其中,所述对象游戏图谱用于表征每个所述对象节点与每个所述游戏节点在游戏维度的关联,所述对象内容图谱用于表征每个所述对象节点与每个所述游戏节点在内容维度的关联。
192.根据本公开的一个或多个实施例,示例13提供了一种基于知识图谱的对象识别装置,包括:向量确定模块,用于根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;相关度确定模块,用于根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏的种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;识别模块,用于若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。
193.根据本公开的一个或多个实施例,示例14提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现示例1至示例12中所述方法的步骤。
194.根据本公开的一个或多个实施例,示例15提供了一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现示例1至示例12中所述方法的步骤。
195.以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
196.此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
197.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此
处将不做详细阐述说明。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1