模型训练和媒介信息处理方法、装置、设备及存储介质与流程

文档序号:30664176发布日期:2022-07-06 02:24阅读:116来源:国知局
模型训练和媒介信息处理方法、装置、设备及存储介质与流程

1.本公开涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术,具有涉及一种模型训练和媒介信息处理方法、装置、设备及存储介质。


背景技术:

2.随着互联网技术的不断发展,媒介信息的数量和种类越来越多。如何向用户提供高质量的媒介信息物料至关重要。


技术实现要素:

3.本公开提供了一种模型训练和媒介信息处理方法、装置、设备及存储介质。
4.根据本公开的一方面,提供了一种模型训练方法,该方法包括:
5.根据样本媒介信息物料,构建三元组;其中,所述三元组包括正样本物料、负样本物料和预测样本物料;
6.采用所述三元组,对神经网络模型进行训练,得到目标质量分类模型;所述神经网络模型包括三个结构相同的子质量分类模型。
7.根据本公开的另一方面,提供了一种媒介信息处理方法,该方法包括:
8.获取目标媒介信息物料;
9.采用目标质量分类模型对所述目标媒介信息物料进行分类;其中,所述目标质量分类模型通过本公开任一所述的模型训练方法训练得到;
10.根据分类结果,对所述目标媒介信息物料进行处理。
11.根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
12.至少一个处理器;以及
13.与所述至少一个处理器通信连接的存储器;其中,
14.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的模型训练方法或媒介信息处理方法。
15.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一实施例所述的模型训练方法或媒介信息处理方法。
16.根据本公开的技术,能够提高目标质量分类模型的识别精度,进而实现了高效且精准向用户提供高质量的媒介信息物料。
17.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
18.附图用于更好地理解本方案,不构成对本公开的限定。其中:
19.图1a是根据本公开实施例提供的一种模型训练方法的流程图;
20.图1b是根据本公开实施例提供的一种神经网络模型的结构示意图;
21.图1c是根据本公开实施例提供的一种子质量分类模型的结构示意图;
22.图2是根据本公开实施例提供的另一种模型训练方法的流程图;
23.图3是根据本公开实施例提供的一种媒介信息处理方法的流程图;
24.图4是根据本公开实施例提供的另一种媒介信息处理方法的流程图;
25.图5是根据本公开实施例提供的一种模型训练装置的结构示意图;
26.图6是根据本公开实施例提供的一种媒介信息处理装置的结构示意图;
27.图7是用来实现本公开实施例的数据处理方法或媒介信息处理的电子设备的框图。
具体实施方式
28.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
29.图1a是根据本公开实施例提供的一种模型训练方法的流程图。该方法适用于如何精准确定媒介信息质量的情况。该方法可以由模型训练装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成配置有模型训练功能的电子设备中。如图1a所示,本实施例的模型训练方法可以包括:
30.s101,根据样本媒介信息物料,构建三元组。
31.其中,媒介信息可以包括广告、新闻和书籍等,在本实施例中媒介信息优选为敏感类型的广告,比如植发广告、口腔美容广告等;媒介信息物料为媒介信息展现的内容,可以是文字、图片或flash类型的物料等。所谓样本媒介信息物料可以为从互联网中获取的媒介信息物料,例如可以是经过图像处理后满足神经网络输入要求的图像。
32.所谓三元组可以包括正样本物料、负样本物料和预测样本物料。其中,正样本物料为高质物料,负样本物料为低质物料,预测样本物料为预测时所需的样本物料,可以为预测正样本物料或预测负样本物料。需要说明的是,正样本物料、负样本物料和预测样本物料的数量相同。
33.具体的,可以从样本媒介信息物料中选择设定数量的媒介信息物料作为正样本物料,选择设定数量的媒介信息物料作为负样本物料,再选则设定数量的媒介信息物料作为预测样本物料。
34.s102,采用三元组,对神经网络模型进行训练,得到目标质量分类模型。
35.本实施例中,神经网络模型包括三个结构相同的子质量分类模型,例如图1b所示,神经网络模型包括子质量分类模型a、子质量分类模型b和子质量分类模型c,且子质量分类模型a、子质量分类模型b和子质量分类模型c的网络结构完全相同。
36.子质量分类模型用于识别媒介信息物料的类别,可以包括一个卷积神经网络和一个全连接网络;其中,卷积神经网络用于特征提取,可以包括至少一个卷积层、至少一个激活层和至少两个池化层;全连接网络用于分类。
37.需要说明的是,卷积层的卷积核可以根据训练数据(即样本媒介信息物料)进行配置,例如,当训练集数据小的时候,使用多个卷积核,可以得到多个降维新矩阵,等效于增加训练集,对模型进行数据增量训练;当训练集数据大的时候,可选择少量卷积核。
38.此外,还需要说明的是,子质量分类模型是预先采用样本媒介信息物料训练好的。可选的,子质量分类模型中的卷积神经网络可以包括一个卷积层、一个激活层和两个池化层,具体训练过程如下:将样本媒介信息物料输入至质量分类模型中的卷积神经网络的卷积层c1,经过卷积层处理,输出特征图谱;将卷积层c1层输出的特征图谱输入至一个激活层s2,该激活层s2对卷积层c1输出的特征图谱中的像素进行求和、加权重、加偏置,通过sigmod函数得到该特征图谱在激活层s2的输出,即一个特征映射图谱;将激活层s2输出的特征映射图谱输入至池化层c3,该池化层c3对激活层s2输出的特征映射图谱进行滤波(比如平均池化或最大池化操作),得到池化层c3的输出,即一个特征图谱;将池化层c3输出的特征图谱中的像素进行求和、加权重、加偏置,通过sigmod函数得到该特征图谱在激活层s4的输出,即一个特征映射图谱;将激活层s4输出的特征映射图谱输入至全连接网络,得到预测结果;根据预测结果和样本监督数据,确定子质量分类模型的训练损失值;进而根据训练损失值,对子质量分类模型进行训练,直到迭代次数达到设定次数,或者训练损失值达到设定数值,则停止训练,将停止训练时的模型作为训练好的子质量分类模型。其中,设定次数和设定数值可以由本领域技术人员根据实际情况设定;训练损失值可以基于focal loss+lovasz的损失函数确定;训练过程可以采用adam优化算法,以及采用在epoch逐渐增加时学习率减小的learning rate策略。
39.所谓目标质量分类模型用于对目标媒介信息物料进行质量分类(即高质物料或低质物料)。
40.具体的,可以采用三元组,对神经网络模型进行度量训练,例如,结合图1b,可以将三元组中的正样本物料输入至子质量分类模型a,将三元组中的负样本物料输入至子质量分类模型b,将三元组中的预测样本物料输入至子质量分类模型c,进行训练,直到训练次数达到预设次数,或者目标损失值达到预设值,停止对神经网络模型训练,将停止训练时的神经网络模型作为目标质量分类模型。其中,预设次数和预设值可以由本领域技术人员根据实际情况设定;目标损失值可以基于三元组损失函数(tripletloss)确定,训练过程可以采用adam优化算法,以及采用在epoch逐渐增加时学习率减小的learning rate策略。
41.需要说明的是,采用度量学习机制对神经网络模型进行训练得到的目标质量分类模型,可以在面对新的未见过的媒介信息物料时,也能够准确的对该媒介信息物料进行分类。
42.本公开实施例提供的技术方案,通过根据样本媒介信息物料,构建三元组;其中,三元组包括正样本物料、负样本物料和预测样本物料,之后采用三元组,对神经网络模型进行训练,得到目标质量分类模型;神经网络模型包括三个结构相同的子质量分类模型。上述技术方案,引入三元组,对三个结构相同的子质量分类模型进行度量训练,所得到的目标质量分类模型能够对媒介信息物料的质量进行精准识别,进而实现了高效且精准地向用户提供高质量的媒介信息物料。
43.在上述实施例的基础上,为提高目标质量分类模型的准确性,作为本公开的一种可选方式,子质量分类模型包括至少两个不同的卷积神经网络、一个注意力机制模块和一
个全连接网络;至少两个不同的卷积神经网络并行连接于注意力机制模块的一端,注意力机制模块的另一端连接于全连接网络。
44.其中,卷积神经网络包括至少一个卷积层、至少一个激活层和至少两个池化层。不同的卷积神经网络中卷积层的卷积核不同。注意力机制模型用于对卷积神经网络的输出特征的权值进行调整。
45.优选的,如图1c所示,子质量分类模型可以包括三个卷积神经网络和nn网络(由一个注意力机制模块和一个全连接层组成),每个卷积神经网络可以包括一个卷积层c1,一个激活层s2,一个池化层c3和一个激活层s4。具体的,子质量分类模型的训练过程如下:将每个样本媒介信息物料分别输入至子质量分类模型的三个并行的卷积神经网络的卷积层c1,经过卷积层c1处理后,得到三个特征图谱;对于每一特征图谱,对该特征图谱中每组的四个像素进行加权值,加偏置,通过一个sigmoid函数得到该特征图片在激活层s2层的输出。对激活层s2层输出的每一映射特征图谱再经过滤波(比如平均池化或最大池化)得到池化层c3层的输出。对于c3层的每一输出,可以对该输出中每组的四个像素进行求和、加权值、加偏置,并通过sigmoid函数,产出该输出在s4层的输出。通过注意力机制模块确定激活层s4输出的三个特征的权值;基于权值,将激活层s4输出的三个特征拼接成一个向量;该向量通过全连接网络输出该图像属于某一类别的预测概率(即预测结果)。进而基于样本媒介信息物料的预测结果和样本监督数据,确定训练损失值,并根据损失值对子质量分类模型进行训练,直到训练次数达到设定次数,或者训练损失值达到设定值,停止模型训练,得到训练好的子质量分类模型。
46.可以理解的是,引入多个卷积神经网络和注意力机制,可以使得子质量分类模型的分类效果更加准确。
47.进一步的,全连接网络基于预先训练的残差网络进行迁移学习得到。例如,可以基于预先训练的resnet18网络的参数和输出特征对全连接网络进行训练。
48.可以理解的是,通过预先训练的残差网络迁移学习得到全连接网络,可以提高子质量分类模型的泛化能力。
49.在上述实施例的基础上,作为本公开的一种可选方式,根据样本媒介信息物料,构建三元组还可以是,从样本媒介信息物料中提取第一物料集和第二物料集;从第一物料集中抽取正样本物料和负样本物料;从第二物料集中抽取预测样本物料;根据正样本物料、负样本物料和预测样本物料,构建三元组。
50.具体的,可以从样本媒介信息物料的每类媒介信息物料中抽取一定数量的媒介信息物料,作为第一物料集,从样本媒介信息物料的每类媒介信息物料中抽取一定数量的媒介信息物料,作为第二物料集;之后从第一物料集的每类媒介信息物料的正样本物料中抽取设定数量的媒介信息物料,作为正样本物料,从第一物料集的每类媒介信息物料的负样本物料中抽取设定数量的媒介信息物料,作为负样本物料;从第二物料集中每类媒介信息物料的正样本物料或负样本物料中随机抽取设定数量的媒介信息物料,作为预测样本物料;进而将正样本物料、负样本物料和预测样本物料,作为三元组。其中,设定数量可以由本领域技术人员根据实际情况设定。
51.可以理解的是,从样本媒介信息物料中抽取媒介信息物料来构建三元组,可以确定合适数量的三元组训练样本,避免由于三元组中训练样本过多或过少导致目标质量分类
模型不准确的问题。
52.图2是根据本公开实施例提供的另一种模型训练方法的流程图。在上述实施例的基础上,进一步优化,提供一种可选实施方案。如图2,本实施例提供的模型训练方法可以包括:
53.s201,对原始媒介信息物料中的原始负物料进行数据扩充,得到扩充负物料。
54.其中,原始媒介信息物料为从互联网中获取的媒介信息物料。
55.具体的,对原始媒介信息物料中的原始负物料进行数据扩充,即进行数据增强处理,得到扩充负物料。
56.一种可选方式,可以对原始媒介信息物料中的原始负物料进行颜色变化增强,例如进行噪声、模糊或者颜色变换等操作,得到扩充负物料。
57.另一种可选方式,还可以对原始媒介信息物料中的原始负物料进行几何变化增强,例如进行旋转、剪裁处理,得到扩充负物料。
58.又一种可选方式,还可以对原始媒介信息物料中的原始负物料进行风格迁移,或者通过gan网络进行处理,得到扩充负物料。
59.可以理解的是,通过对原始负物料进行扩充,避免了正负物料不平衡,导致目标质量分类模型不准确的问题。
60.s202,根据扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,确定样本媒介信息物料。
61.具体的,可以将所有的扩充负物料、原始负物料和原始正物料,作为样本媒介信息物料。
62.s203,根据样本媒介信息物料,构建三元组。
63.其中,三元组包括正样本物料、负样本物料和预测样本物料。
64.s204,采用三元组,对神经网络模型进行训练,得到目标质量分类模型。
65.本公开实施例提供的技术方案,通过对原始媒介信息物料中的原始负物料进行数据扩充,得到扩充负物料,之后根据扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,确定样本媒介信息物料。进而根据样本媒介信息物料,构建三元组,并采用三元组,对神经网络模型进行训练,得到目标质量分类模型。上述技术方案,通过对原始负物料进行扩充,避免了真实媒介信息中由于媒介信息物料不平衡导致模型训练不准确的问题,从而提升了目标质量分类模型的准确度。
66.在上述实施例的基础上,作为本公开的一种可选方式,根据扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,确定样本媒介信息物料还可以是,根据扩充负物料与原始负物料之间的相似度,对扩充负物料进行筛选;将筛选后的扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,作为样本媒介信息物料。
67.具体的,可以结合原始负物料的数量、原始正物料的数量、以及原始负物料和扩充负物料之间的相似度,从扩充负物料中选择一部分负物料。例如,可以根据原始正物料的数量和原始负物料的数量,确定需要选择的扩充负物料的扩充数量,进而根据原始负物料和扩充负物料之间的相似度对扩充负物料进行从小到大排序,将排序在前的扩充数量个扩充负物料保留,且删除剩余扩充负物料;将筛选后的扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,作为样本媒介信息物料。
68.可以理解的是,引入相似度,对扩充负物料进行筛选,可以剔除掉一些无用的扩充负物料,保证了样本媒介信息物料更加丰富准确。
69.图3是根据本公开实施例提供的一种媒介信息处理方法的流程图。该方法适用于如何精准确定媒介信息质量的情况。该方法可以由媒介信息处理来执行,该装置可以采用软件和/或硬件的方式实现,并可集成配置有媒介信息处理功能的电子设备中。如图3所示,本实施例提供的媒介信息处理方法可以包括:
70.s301,获取目标媒介信息物料。
71.本实施例中,目标媒介信息物料为需要进行质量评估的媒介信息物料。
72.具体的,可以从业务端获取目标媒介信息物料。
73.s302,采用目标质量分类模型对目标媒介信息物料进行分类。
74.本实施例中,目标质量分类模型通过上述实施例提供的任一的模型训练方法训练得到。
75.具体的,将目标媒介信息物料输入至目标质量分类模型中,经过模型分类处理,得到目标媒介信息物料的分类结果。
76.s303,根据分类结果,对目标媒介信息物料进行处理。
77.本实施例中,分类结果为目标媒介信息物料为高质物料或者低质物料的概率。
78.一种可选方式,若根据分类结果确定目标媒介信息物料属于高质物料,则对目标媒介信息物料进行首屏展示。具体的,若分类结果中概率大于设定概率值,则确定目标媒介信息物料属于高质物料,进而在用户的检索端对目标媒介信息物料进行首屏展示。进一步的,还可以从高质物料的目标媒介信息物料中抽取一部分进行人工审核,若人工审核通过,则对人工审核通过的目标媒介信息物料进行首屏展示。
79.又一种可选方式,若根据分类结果确定目标媒介信息物料属于低质物料,则对目标媒介信息物料进行滤除。具体的,若分类结果中概率小于设定概率值,则确定目标媒介信息物料属于低质物料,进而将目标媒介信息物料进行滤除。
80.本公开实施例提供的技术方案,通过获取目标媒介信息物料,之后采用目标质量分类模型对目标媒介信息物料进行分类,进而根据分类结果,对目标媒介信息物料进行处理。上述技术方案,通过目标质量分类模型,可以对媒介信息物料的质量进行精准识别,进而为向用户提供高质量的媒介信息物料提供了保障。
81.图4是根据本公开实施例提供的另一种媒介信息处理方法的流程图。在上述实施例的基础上,对“获取目标媒介信息物料”进一步优化,提供一种可选实施方案。如图4所示,本实施例提供的媒介信息处理方法可以包括:
82.s401,对待处理媒介信息物料进行合规审核。
83.本实施例中,待处理媒介信息为从业务端获取的原始的媒介信息。
84.具体的,可以对待处理媒介信息物料进行去重和过滤处理,例如,删除掉重复的待处理媒介信息物料,并根据业务逻辑(待处理媒介信息物料所属行业等)对待处理媒介信息物料进行过滤。
85.进一步的,还可以对去重和过滤后的待处理媒介信息物料进行格式或者黄反检测,得到合规的待处理媒介信息物料。
86.s402,从合规审核通过的待处理媒介信息物料中获取目标媒介信息物料。
87.一种可选方式,可以从合规审核通过的待处理媒介信息物料中随机选择一个待处理媒介信息物料,作为目标媒介信息物料。
88.又一种可选方式,还可以根据待处理媒介信息物料的所属行业的优先级,从合规审核通过的待处理媒介信息物料中获取目标媒介信息物料。具体的,可以将合规审核通过的待处理媒介信息物料中所属行业优先级高的待处理媒介信息物料,作为目标媒介信息物料。
89.另一种可选方式,还可以根据待处理媒介信息物料的获取时间的先后顺序,从合规审核通过的待处理媒介信息物料中获取目标媒介信息物料。具体的,可以将合规审核通过的待处理媒介信息物料中获取时间靠前的待处理媒介信息物料,作为目标媒介信息物料。
90.s403,采用目标质量分类模型对目标媒介信息物料进行分类。
91.s404,根据分类结果,对目标媒介信息物料进行处理。
92.本公开实施例提供的技术方案,通过对待处理媒介信息物料进行合规审核,从合规审核通过的待处理媒介信息物料中获取目标媒介信息物料,之后采用目标质量分类模型对目标媒介信息物料进行分类,进而根据分类结果,对目标媒介信息物料进行处理。上述技术方案,对待处理媒介信息物料进行合规处理,能够使得向用户所提供的媒介信息物料的质量更高。
93.图5是根据本公开实施例提供的一种模型训练装置的结构示意图。本实施例的技术方案适用于如何精准确定媒介信息质量的情况。该装置可以采用软件和/或硬件的方式实现,并可集成配置有模型训练功能的电子设备中。如图5所示,本实施例的模型训练装置500可以包括:
94.三元组构建模块501,用于根据样本媒介信息物料,构建三元组;其中,三元组包括正样本物料、负样本物料和预测样本物料;
95.训练模块502,用于采用三元组,对神经网络模型进行训练,得到目标质量分类模型;神经网络模型包括三个结构相同的子质量分类模型。
96.本公开实施例提供的技术方案,通过根据样本媒介信息物料,构建三元组;其中,三元组包括正样本物料、负样本物料和预测样本物料,之后采用三元组,对神经网络模型进行训练,得到目标质量分类模型;神经网络模型包括三个结构相同的子质量分类模型。上述技术方案,引入三元组,对三个结构相同的子质量分类模型进行度量训练,所得到的目标质量分类模型能够对媒介信息物料的质量进行精准识别,进而实现了高效且精准地向用户提供高质量的媒介信息物料。
97.进一步地,子质量分类模型包括至少两个不同的卷积神经网络、一个注意力机制模块和一个全连接网络;至少两个不同的卷积神经网络并行连接于注意力机制模块的一端,注意力机制模块的另一端连接于全连接网络。
98.进一步地,全连接网络基于预先训练的残差网络进行迁移学习得到。
99.进一步地,三元组构建模块501具体用于:
100.从样本媒介信息物料中提取第一物料集和第二物料集;
101.从第一物料集中抽取正样本物料和负样本物料;
102.从第二物料集中抽取预测样本物料;
103.根据正样本物料、负样本物料和预测样本物料,构建三元组。
104.进一步地,该装置还包括:
105.扩充负物料确定模块,用于对原始媒介信息物料中的原始负物料进行数据扩充,得到扩充负物料;
106.样本物料确定模块,用于根据扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,确定样本媒介信息物料。
107.进一步地,样本物料确定模块具体用于:
108.根据扩充负物料与原始负物料之间的相似度,对扩充负物料进行筛选;
109.将筛选后的扩充负物料、原始负物料和原始媒介信息物料中的原始正物料,作为样本媒介信息物料。
110.进一步地,扩充负物料确定模块具体用于:
111.对原始媒介信息物料中的原始负物料进行旋转、剪裁和风格迁移中的至少一项处理,得到扩充负物料。
112.图6是根据本公开实施例提供的一种媒介信息处理装置的结构示意图。本公开的技术方案适用于如何精准确定媒介信息质量的情况。该装置可以采用软件和/或硬件的方式实现,并可集成配置有媒介信息处理功能的电子设备中。如图6所示,本实施例提供的媒介信息处理装置600可以包括:
113.目标物料获取模块601,用于获取目标媒介信息物料;
114.分类模块602,用于采用目标质量分类模型对目标媒介信息物料进行分类;其中,目标质量分类模型通过上述实施例提供的模型训练方法训练得到;
115.物料处理模块603,用于根据分类结果,对目标媒介信息物料进行处理。
116.本公开实施例提供的技术方案,通过获取目标媒介信息物料,之后采用目标质量分类模型对目标媒介信息物料进行分类,进而根据分类结果,对目标媒介信息物料进行处理。上述技术方案,通过目标质量分类模型,可以提高目标媒介信息物料的分类准确度,进而可以精准的对目标媒介信息物料进行处理。
117.进一步地,目标物料获取模块601具体用于:
118.对待处理媒介信息物料进行合规审核;
119.从合规审核通过的待处理媒介信息物料中获取目标媒介信息物料。
120.进一步地,物料处理模块603具体用于:
121.若根据分类结果确定目标媒介信息物料属于高质物料,则对目标媒介信息物料进行首屏展示。
122.本公开的技术方案中,所涉及的媒介信息物料数据等的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
123.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
124.图7是用来实现本公开实施例的数据处理方法和媒介信息处理的电子设备的框图。图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形
式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
125.如图7所示,电子设备700包括计算单元701,其可以根据存储在只读存储器(rom)702中的计算机程序或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序,来执行各种适当的动作和处理。在ram 703中,还可存储电子设备700操作所需的各种程序和数据。计算单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
126.电子设备700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
127.计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如模型训练或媒介信息处理方法。例如,在一些实施例中,模型训练或媒介信息处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom 702和/或通信单元709而被载入和/或安装到电子设备700上。当计算机程序加载到ram703并由计算单元701执行时,可以执行上文描述的模型训练或媒介信息处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行模型训练或媒介信息处理方法。
128.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
129.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
130.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电
子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
131.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
132.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
133.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
134.人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
135.云计算(cloud computing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。
136.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
137.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1