用于音频事件分类的半监督学习高置信度样本挖掘方法_3

文档序号：9350401阅读：来源：国知局

。Xi表示Dl中的第i个样本，下标i 表示第i个。11〇])表示样本X1在数据集Dl中的第0近邻样本，即样本Xi本身，为了在后续表达式中便于统一表达C1中的样本，这里为其添加了下标（0)。XlU)，x1〇()分别表示样本X1 在数据集Dl中的第1近邻样本和第K近邻样本。用M=H表示C1中样本x1〇i) 的隶属于正类的估计置信度，简称为正类估计置信度，工⑴e[OsI];用伏=…,K)表示(；中样本Xl〇i)的隶属于正类的先验置信度，简称为正类先验置信度，Q() 由于已知Dl中已标注正类样本确切地属于正类，所以将Dl中已标注的正类样本的先验置信度设为1;对于Dl中的未标注音频事件样本，由于没有关于其类标签的先验信息，因此折衷地将 Dl中的未标注音频事件样本的先验置信度设为0.5。\(15)表示样本^在数据集Dl中的第 k近邻样本。
[0078] 为了估计未标注音频事件样本的正类置信度，用线性回归模型为每个单元格(^中样本的正类估计置信度建模，并最小化建模误差；同时，由于已知已标注正类样本确切地属于正类，其属于正类的置信度为1，因此在建模的过程中，已标注正类样本的正类估计置信度不能偏离1值太大。因此，上述建模过程可以表达为：
[0080] 其中，表示第i个单元格(；的映射向量，上标T表示转置，aiGRn，Rn表示n 维实数向量。I表示第i个单元格C1的偏置值。是指示函数，其定义为：
[0081]
[0082] 杨毅曾经提出了一种简记为LRGA的多媒体检索排序算法，其中的最小化问题和公式⑴中的最小化问题非常相似。受LRGA的启发，这里将公式⑴中的最小化问题改为：
[0084] 其中，IIa」I表示向量ai的模，A表示正则化系数，其值可以通过验证集得到。 U是一个值非常大的正常数，这里将其值设为10000。
[0085]令Xi=[X iW, Xi⑴，…，xi0()]表示由单元格Ci中的样本组成的样本矩阵。令
K近邻算法中的K值，上标T表示转置，R(K+1)(K+1)表示（K+1)X(K+1)维的实数矩阵。令 KXi表示由单元格Ci中的样本组成的样本矩阵，上标T 表示转置，X表示正则化系数。In表示nXn维的单位矩阵。令g+GRidi1表示由数据集Dl中样本的正类估计置信度组成的列向量，g+中各元素在[0，1]区间取值。令r+eRidi1 表示由数据集Dl中样本的正类先验置信度组成的列向量，r+中各元素在[0, 1]区间取值。 r+中已标注的正类样本的正类先验置信度设置为1，其它未标注音频事件样本的正类先验
问题，根据以上定义可得数据集Dl中样本的正类估计置信度为：
[0088] g+= (V++ff+) :ff+r+ (5)
[0089]向量g+中前IUI个值是未标注音频事件样本的正类估计置信度，将前IUI个值取出，用向量&表示，则於丨即为未标注音频事件样本的正类估计置信度。
[0090](三）D2={U，L}，用D2内的样本估计未标注音频事件样本的负类置信度Si
[0091] 用已标注音频事件样本集L中标注为负类的样本组成样本集L，用U和L组成包含未标注音频事件样本和已标注的负类样本的数据集D2，D2= {U，L} = {yi，y2，… ，yiui，yiui+i，…，y_}，yiGRn(i= 1，2,…，|D2|)表示D2中的第i个样本，下标i表示第i 个。Rn表示n维实数向量。|u|表示未标注音频事件样本集U中样本的数量，|D2I表示数据集D2中样本的数量。和用Dl内的样本估计未标注音频事件样本的正类置信度类似，这里用D2内的样本估计未标注音频事件样本隶属于负类的置信度，简称为负类置信度。这里不再给出具体的推导过程，而是直接给出推导结果。
[0092]对于D2中的每个样本yi(i= 1，2,…，|D2|)，通过K近邻的方法为其创建一个单元格。令Yi=Iiyiw^yi⑴，"^yi00]表示由样本又;所对应的单元格内样本组成的样本矩阵，其中Y1表示D2中的第i个样本，下标i表示第i个。ylW表示样本y在数据集D2中的第〇近邻样本，即样本Y1本身。分别表示样本71在数据集D2中的第1近邻
数向量，其只有第P(y1〇i))个元素值为1，其它元素值都为0。Rid21表示|D2|维的实数向量。P (yi)表示样本yi〇〇在数据集D2中的位置，y iw表示数据集D2中第i个样本y i的第k近邻样本。令geRid21表示由数据集D2中样本的负类估计置信度组成的列向量，g中的各元素在[0, 1]区间取值。令reR|D21表示由数据集D2中样本的负类先验置信度组成的列向量， r中的各元素在[0, 1]区间取值。r中已标注负类样本的负类先验置信度设置为1，其它未
和用Dl内的样本估计未标注音频事件样本的正类置信度同样的推理过程可得：
[0093]g=(V+ff)1Wr (6)
[0094]向量g中前IUI个值是未标注音频事件样本的负类估计置信度，将前IUI个值取出，用向量於=表示，则即为未标注音频事件样本的负类估计置信度。
[0095](四）挖掘正类样本集P
[0096]根据原则2和原则3,我们希望挖掘的正类样本应尽可能地和已标注的正类样本相似，同时应尽可能地和已标注的负类样本不同。
和负类估计置信度的差值。|U|表示未标注音频事件样本集中样本的数量。
[0099] 如果某一未标注音频事件样本的gl值为正值，这说明其隶属于正类的置信度大于其隶属于负类的置信度，因此我们会更加倾向于将其分类为正类，并且，其gl值越大，我们将其分类为正类的信心越强。因此，具有较大的正的gl值的那些未标注音频事件样本可以被挖掘为正类样本。为此，我们设定一个百分比值￡%，在半监督学习的每轮迭代中，用支持向量机分类器对未标注音频事件样本分类，计算出未标注音频事件样本的gl值，然后选出那些落在支持向量机分类器分类边界内且其gl值为正值的未标注音频事件样本，将这些未标注音频事件样本按照其gl值降序排序，最后取这些未标注音频事件样本的前 e%作为挖掘的正类样本，用公式可以表达为：
[0100]
[0101] P表示挖掘的正类样本集。f( ?)表示支持向量机分类器的决策函数，/(4 )表示样本< 的决策值。根据支持向量机原理，f(x) = ±1表示的是支持向量机分类器的分类边界，而If(X)I< 1则表示分类边界内部区域，其中X表示任一样本。所以|/(xf)|<l表示样本xf落在分类边界内。T0PE%/gl{ ? }表示将集合{ ? }内的样本根据其gl值降序排序后，取其前e%的样本组成新的样本集合。
[0102] (五）挖掘负类样本集N
[0103] 根据原则2和原则3,我们希望挖掘的负类样本应尽可能地和已标注的负类样本相似，同时应尽可能地和已标注的正类样本不同。
和正类估计置信度的差值。|U|表示未标注音频事件样本集中样本的数量。
[0106] 如果某一未标注音频事件样本的g2值为正值，这说明其隶属于负类的置信度大于其隶属于正类的置信度，因此我们会更加倾向于将其分类为负类，并且，其g2值越大，我们将其分类为负类的信心越强。因此，具有较大的正的g2值的那些未标注音频事件样本可以被挖掘为负类样本。为此，我们设定一个百分比值￡%，在半监督学习的每轮迭代中，用支持向量机分类器对未标注音频事件样本分类，计算出未标注音频事件样本的g2值，然后选出那些落在支持向量机分类器分类边界内且其g2值为正值的未标注音频事件样本，将这些未标注音频事件样本按照其g2值降序排序，最后取这些未标注音频事件样本的前 e%作为挖掘的负类样本，用公式可以表达为：
[0107]
[0108]N表示挖掘的负类样本集。TOPe%/g2{ ? }表示将集合{ ? }内的样本根据其g2值降序排序后，取其前e%的样本组成新的样本集合。
[0109](六）将正类样本集P中的样本自动标注为正类，然后加入到已标注音频事件样本集L中，并将其从未标注音频事件样本集U中移除；将负类样本集N中的样本自动标注为负类，然后加入到已标注音频事件样本集L中，并将其从未标注音频事件样本集U中移除。
[0110] 为了验证本发明提出的半监督学习高置信度样本挖掘方法的有效性，这里采样 IEEEAASP音

完整全部详细技术资料下载

当前第3页1 2 3 4 5