用于音频事件分类的半监督学习高置信度样本挖掘方法_5

文档序号：9350401阅读：来源：国知局

，K表示K近邻算法中的K值，上标T表示转置， R(K+1)X(K+1)表示（K+l) X (Κ+1)维的实数矩阵；步骤（2-7):令爲丑，X1表示由单元格C1中的样本组成的样本矩阵，上标T表示转置，λ表示正则化系数，In表示nXn维的单位矩阵；步骤（2-8):令，_ .厂 Pva(I).乂..... - } 、.. ~ .q表示Idi 维的实数向量，其只有第P(X100)个元素值为1，其它元素值都为〇，Ρ(Χι0?))表示样本\〇〇在数据集Dl中的位置，Xl(k)表示数据集Dl中第i个样本X i的第k近邻样本；步骤（2-11):求 g+= (V++W+) Vr+; 步骤（2-12):向量g+中前|U|个值是未标注音频事件样本的正类估计置信度，将前|U| 个值取出，用向量&+表示，则容?即为未标注音频事件样本的正类估计置信度。4. 如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（3)的步骤为：用已标注音频事件样本集L中标注为负类的样本组成样本集L，用U和L组成包含未标注音频事件样本和已标注的负类样本的数据集D2, g表示数据集D2中样本的负类估计置信度组成的列向量，r表示数据集D2中样本的负类先验置信度组成的列向量，设置r中各个样本的负类先验置信度，用D2内的样本估计未标注音频事件样本的负类置信度。5. 如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（3)的具体步骤为：步骤（3-1):用已标注音频事件样本集L中标注为负类的样本组成样本集L，用U 和L组成包含未标注音频事件样本和已标注的负类样本的数据集D2，D2= {U，L }= {yi，y2,…，yiui，yiui+i，…，yiD2|}，y# Rn(i = 1，2,…，|D2|)表示D2 中的第 i 个样本，下标 i 表示第i个，Rn表示η维实数向量，|u|表示未标注音频事件样本集U中样本的数量，|D2 I 表示数据集D2中样本的数量；步骤（3-2):令g e Rid21表示由数据集D2中样本的负类估计置信度组成的列向量， g是一个待求的量，其各元素的值未知，g中各元素在[〇，1]区间取值，令r e Rid21表示由数据集D2中样本的负类先验置信度组成的列向量，r中各元素在[0, 1]区间取值，R |D21表示ID2 I维的实数向量；步骤（3-3):对于D2中的每个样本yi(i = 1，2,…，|D2|)，通过K近邻的方法为其创建一个单元格，单元格内样本记为{yi(Q), Yi⑴，…，yi(K)}，Yi表示D2中的第i个样本，下标i 表示第1个，71(。)表示样本71在数据集〇2中的第0近邻样本，即样本71本身，7 1(1)，71〇0分别表示样本71在数据集D2中的第1近邻样本和第K近邻样本；步骤（3-4):令Yi= [y iW, y;⑴，…，yi〇()]表示由D2中第i个样本对应的单元格中的样本组成的样本矩阵，令= ·，￡)表示样本71〇0的负类估计置信度，令 0 = 0丄···,/〇表示样本y1〇i)的负类先验置信度，y 1〇〇表示样本y 1在数据集D2中的第k 近邻样本；步骤（3-5):令W1表示对角矩阵，其对角向量为上标T表示转置，ω是一个正常数；步骤（3-6)I表示（K+l) X (Κ+1)维的单位矩阵， 1K+1表示元素全为1的（K+1)维列向量，K表示K近邻算法中的K值，上标T表示转置， R(K+1)X(K+1)表示（K+l) X (Κ+1)维的实数矩阵；步骤（3-7):令V1 = H-HY /(Y1HY1VA In) 1Y1H, Y1表示由D2中第i个样本对应的单元格中的样本组成的样本矩阵，上标T表示转置，λ表示正则化系数，In表示nXn维的单位矩阵；步骤（3-8):令「)表示 D2|维的实数向量，其只有第p(y1〇i))个元素值为1，其它元素值都为0, p(y1〇i))表示样本 71〇〇在数据集D2中的位置，y 1〇?)表示数据集D2中第i个样本y i的第k近邻样本；步骤（3-12):向量g中前|U|个值是未标注音频事件样本的负类估计置信度，将前|U| 个值取出，用向量&表示，则黑e即为未标注音频事件样本的负类估计置信度。6.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（4)的具体步骤包括：步骤（4-1):对未标注音频事件样本，计算正类估计置信度和负类估计置信度的差值 gl ；步骤（4-2):在半监督学习的每轮迭代中，用支持向量机分类器对未标注音频事件样本分类，然后选出那些落在支持向量机分类器分类边界内且其gl值为正值的未标注音频事件样本；步骤（4-3):将步骤（4-2)中挑选出来的未标注音频事件样本按照其gl值降序排序；步骤（4-4):设定一个百分比值ε %，取步骤（4-3)中排序的未标注音频事件样本的前 ε %作为挖掘的正类样本。7. 如权利要求6所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（4-1)的具体步骤为：其中，Λ/ U =1，2,…，表示未标注音频事件样本集u中的第j个样本，下标j表示第 j个，表示未标注音频事件样本4的gl值，即正类估计置信度和负类估计置信度的差值，|U|表示未标注音频事件样本集中样本的数量。8. 如权利要求6所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（4-4)的具体方法用公式表达为：P表示挖掘的正类样本集，f (·)表示支持向量机分类器的决策函数，/(<)表示样本 <的决策值，根据支持向量机原理，f(x) = ±1表示的是支持向量机分类器的分类边界，而I f GO I < 1则表示分类边界内部区域，其中X表示任一样本，所以|/(<)| < 1表示样本< 落在分类边界内，TOP E % /gl { ·}表示将集合{ ·}内的样本根据其gl值降序排序后，取其前 ε %的样本组成新的样本集合。9. 如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（5)的具体步骤为：步骤（5-1):对未标注音频事件样本，计算负类估计置信度和正类估计置信度的差值 g2 ; 步骤（5-2):在半监督学习的每轮迭代中，用支持向量机分类器对未标注音频事件样本分类，然后选出那些落在支持向量机分类器分类边界内且其g2值为正值的未标注音频事件样本；步骤（5-3):将步骤（5-2)中挑选出来的未标注音频事件样本按照其g2值降序排序；步骤（5-4):设定一个百分比值ε %，取步骤（5-3)中排序的未标注音频事件样本的前 ε %作为挖掘的负类样本。10. 如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法，其特征是：所述步骤（5-1)的具体方法为：其中，λ? (J· = 表示未标注音频事件样本集U中的第j个样本，下标j表示第 j?个，^ia. 表示未标注音频事件样本<的g2值，即负类估计置信度和正类估计置信度的差值，|u|表示未标注音频事件样本集中样本的数量；所述步骤（5-4)的具体方法用公式表达为：N表示挖掘的负类样本集，T0PE%/g2{ · }表示将集合{ · }内的样本根据其g2值降序排序后，取其前ε %的样本组成新的样本集合。
【专利摘要】本发明公开了一种用于音频事件分类的半监督学习高置信度样本挖掘方法，本发明创新性地通过三个原则来确定未标注音频事件样本的置信度，进而挖掘具有高置信度的未标注音频事件样本。三个原则为未标注音频事件样本的正确标注提供了三重保障，因而能成功地为半监督学习挖掘到高置信度的未标注音频事件样本。此外，本发明的三个原则充分考虑了数据分布，挖掘的高置信度样本具有一定的多样性，因而能更好地提高音频事件分类器的分类性能。本发明挖掘的高置信度样本经自动标注加入到已标注音频事件样本集，因而在提高分类器的分类性能的同时不增加额外的手工标注工作量，因此该项发明在实际应用中具有很强的应用价值。
【IPC分类】G06K9/62
【公开号】CN105069474
【申请号】CN201510475266
【发明人】冷严, 李登旺, 方敬, 程传福, 万洪林, 王晶晶
【申请人】山东师范大学
【公开日】2015年11月18日
【申请日】2015年8月5日

完整全部详细技术资料下载

当前第5页1 2 3 4 5