用于音频事件分类的半监督学习高置信度样本挖掘方法_2

文档序号：9350401阅读：来源：国知局

度。
[0031] 所述步骤（3)的具体步骤为：
[0032]步骤（3-1):用已标注音频事件样本集L中标注为负类的样本组成样本集L，用 U和L组成包含未标注音频事件样本和已标注的负类样本的数据集D2，D2= {U，L}= {yi，y2,…，yiui，yiui+i，…，yiD2|}，y#Rn(i= 1，2,…，|D2|)表示D2 中的第i个样本，下标i 表示第i个，Rn表示n维实数向量，IUI表示未标注样本集U中样本的数量，ID2I表示数据集D2中样本的数量；
[0033] 步骤（3-2):令gGR|D21表示由数据集D2中样本的负类估计置信度组成的列向量，g是一个待求的量，其各元素的值未知，g中各元素在[0，1]区间取值，令rERid21表示由数据集D2中样本的负类先验置信度组成的列向量，r中各元素在[0, 1]区间取值，Rid21 表示|D2|维的实数向量；
[0034] 步骤（3-3):对于D2中的每个样本yi(i= 1，2,…，|D2|)，通过K近邻的方法为其创建一个单元格，单元格内样本记为{yi(Q)，yi⑴，…，yi(K)}，表示D2中的第i个样本，下标i表示第i个，Y1 (Q)表示样本y1在数据集D2中的第0近邻样本，即样本yi本身，yi⑴，yi(K) 分别表示样本71在数据集D2中的第1近邻样本和第K近邻样本；
[0035]步骤（3-4):令Yi=[yiW，yi⑴，"^yi00]表示由D2中第i个样本对应的单元格中的样本组成的样本矩阵，令= …，/〇表示样本71〇5)的负类估计置信度，令 /;|"（/1=()丄一，/〇表示样本71〇 5)的负类先验置信度，71〇5)表示样本71在数据集〇2中的第1^ 近邻样本；
[0036] 步骤（3-5):令K表示对角矩阵，其对角向量为，斑,上标 T表示转置，《是一个正常数；
阵，1K+1表示元素全为1的（K+1)维列向量，K表示K近邻算法中的K值，上标T表示转置，R_x_表示（K+l)X(K+1)维的实数矩阵；
[0038]步骤（3-7):令K 卞"，Y1表示由D2中第i个样本对应的单元格中的样本组成的样本矩阵，上标T表示转置，A表示正则化系数，In表示nXn维的单位矩阵；
示|D2|维的实数向量，其只有第p(y1〇i))个元素值为1，其它元素值都为0，p(y1〇i))表示样本71〇〇在数据集〇2中的位置，71〇5)表示数据集02中第1个样本71的第1^近邻样本；
[0042]步骤（3-11):求g=(V+W)1Wr;
[0043] 步骤（3-12):向量g中前|U|个值是未标注音频事件样本的负类估计置信度，将前|U|个值取出，用向量表示，则g:a即为未标注音频事件样本的负类估计置信度。
[0044] 所述步骤（3-2)中，r中已标注负类样本的负类先验置信度设置为1，其它未标注音频事件样本的负类先验置信度设置为〇. 5。
[0045] 所述步骤（4)的具体步骤包括：
[0046] 步骤（4-1):对未标注音频事件样本，计算正类估计置信度和负类估计置信度的差值gl;
[0047] 步骤（4-2):在半监督学习的每轮迭代中，用支持向量机分类器对未标注音频事件样本分类，然后选出那些落在支持向量机分类器分类边界内且其gl值为正值的未标注音频事件样本；
[0048] 步骤（4-3):将步骤（4-2)中挑选出来的未标注音频事件样本按照其gl值降序排序；
[0049] 步骤（4-4):设定一个百分比值e%，取步骤（4-3)中排序的未标注音频事件样本的前e%作为挖掘的正类样本。
[0050] 所述步骤（4-1)的具体步骤为：
负类估计置信度的差值，|U|表示未标注音频事件样本集中样本的数量。
[0053] 所述步骤（4-4)的具体方法用公式表达为：
[0054]
[0055]P表示挖掘的正类样本集，f(?)表示支持向量机分类器的决策函数，/(<)表示样本#的决策值，根据支持向量机原理，f(X) = ±1表示的是支持向量机分类器的分类边界，而If(X)I< 1则表示分类边界内部区域，其中X表示任一样本，所以|/Uf)|<l表示样本<落在分类边界内，T0PE%/gl{ ? }表示将集合{ ? }内的样本根据其gl值降序排序后，取其前e%的样本组成新的样本集合。
[0056] 所述步骤（5)的具体步骤为：
[0057] 步骤（5-1):对未标注音频事件样本，计算负类估计置信度和正类估计置信度的差值g2 ;
[0058] 步骤（5-2):在半监督学习的每轮迭代中，用支持向量机分类器对未标注音频事件样本分类，然后选出那些落在支持向量机分类器分类边界内且其g2值为正值的未标注音频事件样本；
[0059] 步骤（5-3):将步骤（5-2)中挑选出来的未标注音频事件样本按照其g2值降序排序；
[0060] 步骤（5-4):设定一个百分比值e %，取步骤（5-3)中排序的未标注音频事件样本的前e%作为挖掘的负类样本。
[0061] 所述步骤（5-1)的具体方法为：
和正类估计置信度的差值，|u|表示未标注音频事件样本集中样本的数量。
[0064] 所述步骤（5-4)的具体方法用公式表达为：
[0065]
[0066]N表示挖掘的负类样本集，TOPe%/g2{ ? }表示将集合{ ? }内的样本根据其g2值降序排序后，取其前e%的样本组成新的样本集合。
[0067]本发明的有益效果为：
[0068] 1.本发明创新性地通过三个原则来挖掘支持向量机分类边界内的未标注音频事件样本，三个原则为未标注音频事件样本的正确标注提供了三重保障，因而能成功地为半监督学习挖掘到高置信度的未标注音频事件样本。
[0069] 2.本发明的三个原则充分考虑了数据分布，挖掘的高置信度样本具有一定的多样性，因而能更好地提高音频事件分类器的分类性能。
[0070] 3.在主动学习结束之后，基于本发明提出的高置信度样本挖掘方法的半监督学习技术能继续成功地挖掘未标注音频事件样本，因而能在不增加手工标注工作量的前提下进一步提高音频事件分类器的分类性能，因此该项发明在实际应用中具有很强的应用价值。
【附图说明】
[0071] 图1为本发明的流程图。
【具体实施方式】：
[0072] 下面结合附图与实施例对本发明作进一步说明。
[0073] 如图1所示，对于那些挖掘支持向量机分类边界内的未标注音频事件样本的主动学习技术，本发明在主动学习标注了确定数量的未标注音频事件样本之后，基于以下三个原则来为半监督学习从分类边界内挖掘高置信度样本：1)平滑假设；2)挖掘的正类样本、负类样本应分别和已标注的正类样本、已标注的负类样本尽可能相似；3)挖掘的正类样本、负类样本应分别和已标注的负类样本、已标注的正类样本尽可能不同。本发明提出的用于音频事件分类的半监督学习高置信度样本挖掘方法的整个实施流程如图1所示：
[0074]( -）输入已标注音频事件样本集L、未标注音频事件样本集U、支持向量机分类器
[0075] 半监督学习每轮迭代后都会输出得到一个已标注的音频事件样本集L、未标注的音频事件样本集U、支持向量机分类器，而其又将作为下一轮迭代的输入。
[0076](二）Dl= {U，L+}，用Dl内的样本估计未标注音频事件样本的正类置信度
[0077] 用已标注音频事件样本集L中标注为正类的样本组成样本集L+，用U和L+组成包含未标注音频事件样本和已标注的正类样本的数据集Dl，Dl= {U，L+} = (X1,X2，… ，Xlul,x|u|+1，…，x|D1|}，x;GRn(i= 1，2,…，|D11)表示Dl中的第i个样本，下标i表示第i 个。Rn表示n维实数向量。|u|表示未标注音频事件样本集u中样本的数量，|diI表示数据集Dl中样本的数量。根据第一原则，即平滑假设，空间上相近的样本应该具有相似的类标签。为了满足第一原则，对于Dl中的每个样本Xl(i= 1，2,…，|D1|)，通过K近邻的方法为其创建一个单元格，记为Ci,Ci={xiW,xiU),…，xi〇()}

完整全部详细技术资料下载

当前第2页1 2 3 4 5