口考作弊检测方法和装置的制造方法

文档序号：10571083阅读：375来源：国知局

口考作弊检测方法和装置的制造方法
【专利摘要】本发明提出一种口考作弊检测方法和装置，该口考作弊检测方法包括：获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息；根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括：从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征；根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果。该方法能够扩展口考作弊检测的适用范围。
【专利说明】
口考作弊检测方法和装置
技术领域
[0001]本发明涉及语音处理技术领域，尤其涉及一种口考作弊检测方法和装置。
【背景技术】
[0002]随着人们对语言学习热情的高涨，各类语言的口语考试在各种学业考试和职业考试中也成为非常普遍的科目，比如全国的普通话水平测试、中高考英语口语考试以及各种小规模考试或测试中。为了保证口语考试评分的客观性、公正性，口语考试中的作弊检测也成为至关重要的问题。口语考试中的作弊主要有两种类型:一、替考作弊，考生为其他人替考;二、抄袭作弊，考生抄袭他人，主要有考生跟读作弊和录取其他考生语音的抄袭作弊。
[0003]相关技术中，口考作弊检测通常基于声纹进行。但是，基于声纹检测的方式存在一定的局限性，例如，不能检测考生跟读作弊。

【发明内容】

[0004]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此，本发明的一个目的在于提出一种口考作弊检测方法，该方法可以扩展口考作弊检测的适用范围，不仅适用于基于声纹进行作弊检测的场景，如替考、录取其他考生语音等，还可以适用于其他场景，如跟读作弊检测。
[0006]本发明的另一个目的在于提出一种口考作弊检测装置。
[0007]为达到上述目的，本发明第一方面实施例提出的口考作弊检测方法，包括:获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息;根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征;根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果。
[0008]本发明第一方面实施例提出的口考作弊检测方法，通过获取出考生的声纹特征之外的其他特征，可以在口考作弊检测时，应用更多的特征进行口考作弊检测，以扩展口考作弊检测的适用范围。
[0009]为达到上述目的，本发明第二方面实施例提出的口考作弊检测装置，包括:获取模块，用于获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息;提取模块，用于根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征;确定模块，用于根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果。
[0010]本发明第二方面实施例提出的口考作弊检测装置，通过获取出考生的声纹特征之外的其他特征，可以在口考作弊检测时，应用更多的特征进行口考作弊检测，以扩展口考作弊检测的适用范围。
[0011]本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中:
[0013]图1是本发明一个实施例提出的口考作弊检测方法的流程示意图；
[0014]图2是本发明另一个实施例提出的口考作弊检测方法的流程示意图；
[0015]图3是本发明实施例中构建作弊检测模型的流程示意图；
[0016]图4是本发明实施例中采用的作弊检测模型的拓扑结构示意图；
[0017]图5是本发明一个实施例提出的口考作弊检测装置的结构示意图；
[0018]图6是本发明另一个实施例提出的口考作弊检测装置的结构示意图。
【具体实施方式】
[0019]下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0020]图1是本发明一个实施例提出的口考作弊检测方法的流程示意图。
[0021]参见图1，本实施例的流程包括:
[0022]Sll:获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息。
[0023]其中，当前考生是指当前进行口考的考生，该考生可以是报名的考生本人，或者，也可以是报名的考生的替考者。
[0024]可以在当前考生口考过程中，对当前考生的语音数据进行录制，从而可以获取到当前考生的口考语音数据。
[0025]辅助信息可以包括:当前考生的其他信息，如身份信息、座位信息、答题内容、发音信息等，还可以包括其他考生的信息，如当前考生的邻座考生的信息，如邻座考生的答题内容、发音信息等，还可以包括当前考生所在考场的整体情况，如整体答题内容，发音信息等。
[0026]其中，当前考生的身份信息是指当前考生声称的考生，也就是报名的考生的身份信息，因此可以从报名信息中获取到上述的身份信息。
[0027]由于考生在考试时，为预先为考生分配座位，因此从分配信息中可以获取到座位
?目息O
[0028]而其他的信息，如答题内容、发音信息等可以根据考生的实际考试情况确定。
[0029]SI2:根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征。
[0030]本实施例中，作弊检测特征不限于声纹特征，还包括其他特征。
[0031 ]其他特征例如包括如下项中的一项或多项:
[0032]当前考生与相应座位声纹相似度特征、邻座声纹相似度特征、邻座答题内容相似度特征、邻座答题发音对比特征、整个考场考生整体答题内容一致性特征、整个考场考生发音时差一致性特征。
[0033]本发明实施例中，以作弊检测特征包括上述的7种特征为例。
[0034]具体的作弊检测特征的提取方法可以参见后续实施例的描述。
[0035]S13:根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果。
[0036]其中，作弊检测模型的输入是作弊检测特征，输出可以是作弊得分或者作弊检测结果，以作弊检测结果包括:作弊或不作弊为例，则输出层有两个节点，分别代表作弊或不作弊，如输出为【0，I】表示不作弊，【I，0】表示作弊。因此，根据作弊检测特征和作弊检测模型，可以得到作弊得分或者直接得到作弊检测结果。
[0037]当得到的是作弊得分时，在得到作弊得分后，可以与预先设置的阈值进行比较，得到作弊检测结果。
[0038]进一步的，阈值可以是一个，以通过该一个阈值检测考生是作弊或者未作弊。例如，当作弊得分大于或等于该阈值时，确定作弊检测结果是作弊，否则，当作弊得分小于该阈值时，确定作弊检测结果是未作弊。或者，
[0039]阈值也可以是多个，以通过该多个阈值检测考生的作弊等级，如作弊、疑似作弊、
未作弊等。
[0040]上述的阈值可以根据经验和大量实验结果确定。
[0041]本实施例中，通过获取出考生的声纹特征之外的其他特征，可以在口考作弊检测时，应用更多的特征进行口考作弊检测，以扩展口考作弊检测的适用范围。
[0042]如上所示，在口考作弊检测时，需要提取出作弊检测特征。具体的，作弊检测特征的提取流程可以如下所示。
[0043](I)—些实施例中，上述的声纹特征是指从当前考生的口考语音数据中进行声纹特征提取后得到的声纹特征。
[0044]其中，声纹特征不限于1- V e c t ο r特征，还可以包括:梅尔频率倒谱系数(M e IFrequency Cepstrum Coeff icient，MFCC)特征或线性预测编码(Linear predict1ncoding，LPC)特征等。
[0045](2)—些实施例中，当前考生与相应座位声纹相似度特征是指当前考生对应的声纹特征，与当前考生声称的考生对应的声纹特征之间的相似度特征。
[0046]具体的，当前考生与相应座位声纹相似度特征的提取流程包括:
[0047]从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征；
[0048]获取第二声纹特征，所述第二声纹特征是从所述当前考生的相应座位的报名考生的语音数据中提取的；
[0049]计算第一声纹特征与第二声纹特征的相似度特征，将所述相似度特征确定为当前考生与相应座位声纹相似度特征。
[0050]其中，为了与后续声纹特征区别，可以将从当前考生的口考语音数据中提取的声纹特征称为第一声纹特征。
[0051]第二声纹特征是当前考生声称的考生的语音数据对应的声纹特征。
[0052]例如，考生报名时可以采集注册语音数据，或者在考前采集试音语音数据，从而可以从注册语音数据或试音语音数据中提取声纹特征，作为第二声纹特征。
[0053]计算相似度时，具体计算方式可以包括:计算第一声纹特征与第二声纹特征之间的余弦距离、欧式距离等。
[0054](3)—些实施例中，邻座声纹相似度特征是指当前考生对应的声纹特征，与当前考生的邻座考生对应的声纹特征之间的相似度特征。
[0055]邻座的个数可以设置，例如，选择当前考生周围的4或8个考生作为邻座考生。本实施例以邻座包括N=4个为例。
[0056]具体的，邻座声纹相似度特征的提取流程包括:
[0057]从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征；
[0058]从所述当前考生的邻座考生的口考语音数据中提取声纹特征，得到第三声纹特征；
[0059]计算第一声纹特征与第三声纹特征的相似度特征，将所述相似度特征确定为邻座声纹相似度特征。
[0060]进一步的，当邻座为多个时，第三声纹特征也为多个，可以分别计算第一声纹特征与每个第三声纹特征之间的相似度特征，从而可以得到与邻座个数相同的邻座声纹相似度特征。
[0061 ]例如，邻座为4个，则得到的邻座声纹相似度特征为4个。
[0062](4)—些实施例中，邻座答题内容相似度特征是指当前考生的答题内容，与当前考生的邻座考生的答题内容之间的相似度特征。
[0063]具体的，邻座答题内容相似度特征的提取流程包括:
[0064]对所述当前考生的答题内容进行向量化，得到第一答题内容向量；
[0065]对所述当前考生的邻座考生的答题内容进行向量化，得到第二答题内容向量；
[0066]计算第一答题内容向量与第二答题内容向量的相似度特征，将所述相似度特征确定为邻座答题内容相似度特征。
[0067]其中，内容向量化的方法可以采用通常方法。
[0068]类似邻座声纹相似度特征，当邻座为N个时，邻座答题内容相似度特征也为N个。
[0069](5)—些实施例中，邻座答题发音对比特征是指当前考生的答题发音与邻座考生的答题发音之间的对比特征。
[0070]进一步的，答题发音之间的对比特征可以分为多个维度，例如包括:
[0071]相同答案的错读发音一致度、语速相似度、停顿相似度、朗读时差一致度这4个维度。
[0072]因此，当邻座的个数是N、答题发音的对比特征是M个维度，则邻座答题发音对比特征是N X M维的特征向量。
[0073]具体的，上述4个对比特征的提取流程可以分别是:
[0074]错读发音一致度:当前考生发音错误与邻座考生发音错误相同的个数/当前考生发音错误总数;发音错误的发现采用现有的口语评测技术，在此不再详细阐述。
[0075]语速相似度:当前考生语速/邻座考生语速；
[0076]停顿相似度:当前考生与邻座考生停顿相似处的个数/当前考生答题中停顿总数；
[0077]朗读时差一致度:当前考生与邻座考生各朗读子单元时差一致数/朗读子单元的总数。举例:以句子为朗读子单元，如果一个答题内容一共有3个句子，统计当前考生朗读每个句子的开头和/或结尾与邻座考生朗读的时差一致的个数，时差一致的判断一般是通过时差阈值进行判断，如阈值取为2秒。
[0078](6)—些实施例中，整个考场考生整体答题内容一致性特征的提取流程可以包括:
[0079]将考场所有考生的答题内容向量两两进行相似度计算；
[0080]计算所有相似度的均值和标准方差，作为整个考场考生整体答题内容一致性特征。
[0081 ] (7)—些实施例中，整个考场考生发音时差一致性特征的提取流程包括:
[0082]分别计算各朗读子单元的发音一致度；
[0083]对所有朗读子单元的发音一致度进行加权平均，得到整个考场考生发音时差一致性特征。
[0084]其中，所述各朗读子单元的发音一致度:朗读该子单元时发音时差一致考生个数/考生总数。
[0085]可以理解的是，上述实施例中未特别说明的部分，如声纹特征的提取、相似度的计算等，可以参见其他实施例中已具体说明的内容。
[0086]通过上述流程可以提取出作弊检测特征，以用于口考作弊检测。
[0087]图2是本发明另一个实施例提出的口考作弊检测方法的流程示意图。
[0088]参见图2，本实施例的流程包括:
[0089]S21:构建作弊检测模型。
[0090]可以理解的是，可以在口考作弊检测之前，离线预先构建作弊检测模型。
[0091]—些实施例中，参见图3，构建作弊检测模型的流程可以包括:
[0092]S31:收集历史口考考生数据，并提取所述历史口考考生数据对应的作弊检测特征，以及，获取所述历史口考考生数据对应的作弊情况的人工标注结果，得到训练数据。
[0093]其中，可以对应收集的每个历史考生，获取一组口考考生数据，该组口考考生数据包括:该考生的口考语音数据以及其他的辅助信息，具体的辅助信息可以参见上述实施例。
[0094]在获取到每组口考考生数据后，可以如上述所示的提取流程，提取到上述的7种作弊检测特征。
[0095]通过上述流程，对应一个历史考生，可以获取一组口考考生数据，并从中提取到一组作弊检测特征。
[0096]另外，对应每个历史考生，可以对该考生的作弊情况进行人工标注，标注出作弊结果，如作弊或未作弊，或者，作弊等级等。
[0097]因此，可以将每个历史考生的{作弊检测特征，作弊结果H乍为一个训练样本，大量的历史考生对应的训练样本组成一组训练数据用于后续的模型训练。
[0098]S32:确定模型拓扑结构。
[0099]模型的拓扑结构可以根据需要设置。
[0100]本实施例中，以循环神经网络(Recurrent Neural Networks，RNN)为例。
[0101]RNN网络属于一种神经网络，神经网络可以包括:输入层、隐层和输出层，其中，输入层和输出层分别是一层，隐层的个数可以根据需要设置。
[0102]如图4所示，给出了考场内一个考生的神经网络结构图，完成结构图由一个考场所有考生结构图组成。具体说明如下:
[0103]输入层:输入的是一个考场所有考生所有试题的作弊检测特征。由于口语考试中每个考场的考生数不一样，考题数也不一样，为了保证模型的鲁棒性，可以根据经验值对模型结构设定固定数量的考生数(如50)和考题数节点(30)，当某一场考生数或考题数小于固定值时，训练和测试的过程中对应空缺的节点设定常量值即可(例如设置为O)。
[0104]例如一个考场有P(P小于等于50)个考生，考题有J(J小于等于30)道，以上述7个作弊检测特征为例，则模型的输入为P X J X (5+6N)。
[0105]其中，5+6N表示有:I个声纹特征、I个当前考生与相应座位声纹相似度特征、N个邻座声纹相似度特征、N个邻座答题内容相似度特征、4N个邻座答题发音对比特征(以发音对比特征包括4个维度为例)、2个整个考场考生整体答题内容一致性特征、I个整个考场考生发音时差一致性特征。
[0106]隐层:隐层数一般由经验和/或大量实验确定，一般取2-8层，本案中取3层。本案中隐层采用的是局部RNN的网络结构，以考生为单位，输入层连接过来的隐层节点间从左到右进行有向连接。通常情况下，同一个考生如果前面的作弊了，后面的题型作弊的概率会大大增大，故模型的第一个隐层的结构采用考生内部节点有向连接的方式，确保前面题型的节点可以作用到后面的题型，这样可以大大的提高分类的准确性。
[0107]输出层:模型的输出为考场中每个考生每道试题出现作弊的概率得分，或者，输出也可以直接是作弊或未作弊这些作弊检测结果。
[0108]S33:根据模型拓扑结构和所述训练数据进行训练，生成作弊检测模型。
[0109]模型的训练采用现有的神经网络模型训练方法，如误差反向传播(ErrorBackPropagat 1n,BP)算法，具体在此不再阐述。
[0110]在构建出作弊检测模型后，该模型可以在线用于口考作弊检测。即，本实施例还可以包括:
[0111]S22:获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息。
[0112]S23:根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征。
[0113]S24:根据所述作弊检测特征和所述作弊检测模型，得到作弊检测结果。
[0114]可以理解的是，本实施例中无特别说明的地方，具体内容可以参见上一实施例的相关内容，在此不再详细说明。
[0115]本实施例中，通过获取出考生的声纹特征之外的其他特征，可以在口考作弊检测时，应用更多的特征进行口考作弊检测，以扩展口考作弊检测的范围。进一步的，通过预先构建作弊检测模型，可以在作弊检测时直接采用该模型，以快速完成作弊检测。
[0116]图5是本发明一个实施例提出的口考作弊检测装置的结构示意图。
[0117]参见图5，本实施例的装置50包括:获取模块51、提取模块52和确定模块53。
[0118]获取模块51，用于获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息；
[0119]提取模块52，用于根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征；
[0120]确定模块53，用于根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果。
[0121 ] —些实施例中，所述其他特征包括如下项中的一项或多项:
[0122]当前考生与相应座位声纹相似度特征、邻座声纹相似度特征、邻座答题内容相似度特征、邻座答题发音对比特征、整个考场考生整体答题内容一致性特征、整个考场考生发音时差一致性特征。
[0123]—些实施例中，所述声纹特征包括:
[0124]1-vector特征或MFCC特征或LPC特征。
[0125]—些实施例中，所述提取模块具体用于执行如下项中的一项或多项:
[0126]从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征;获取第二声纹特征，所述第二声纹特征是从所述当前考生的相应座位的报名考生的语音数据中提取的；计算第一声纹特征与第二声纹特征的相似度特征，将所述相似度特征确定为所述当前考生与相应座位声纹相似度特征；
[0127]从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征;从所述当前考生的邻座考生的口考语音数据中提取声纹特征，得到第三声纹特征;计算第一声纹特征与第三声纹特征的相似度特征，将所述相似度特征确定为所述邻座声纹相似度特征；
[0128]对所述当前考生的答题内容进行向量化，得到第一答题内容向量;对所述当前考生的邻座考生的答题内容进行向量化，得到第二答题内容向量;计算第一答题内容向量与第二答题内容向量的相似度特征，将所述相似度特征确定为所述邻座答题内容相似度特征；
[0129]获取当前考生与邻座考生的如下发音特征中的一项或多项，作为所述邻座答题发音对比特征:相同答案的错读发音一致度、语速相似度、停顿相似度、朗读时差一致度；
[0130]将考场所有考生的答题内容向量两两进行相似度计算;计算所有相似度的均值和标准方差，作为整个考场考生整体答题内容一致性特征；
[0131]分别计算各朗读子单元的发音一致度;对所有朗读子单元的发音一致度进行加权平均，得到整个考场考生发音时差一致性特征。
[0132]—些实施例中，参见图6，该装置还包括:用于构建作弊检测模型的构建模块54，所述构建模块54具体用于:
[0133]收集历史口考考生数据，并提取所述历史口考考生数据对应的作弊检测特征，以及，获取所述历史口考考生数据对应的作弊情况的人工标注结果，得到训练数据；
[0134]确定模型拓扑结构；
[0135]根据模型拓扑结构和所述训练数据进行训练，生成作弊检测模型。
[0136]—些实施例中，所述获取模块51获取的所述辅助信息包括如下项中的一项或多项:
[0137]所述当前考生的除所述口考语音数据之外的其他信息；
[0138]除所述当前考生之外的其他考生的信息；
[0139]所述当前考生所在考场的整体情况。
[0140]可以理解的是，本实施例的装置与方法实施例对应，具体内容可以参见方法实施例中的描述，在此不再详细说明。
[0141]本实施例中，通过获取出考生的声纹特征之外的其他特征，可以在口考作弊检测时，应用更多的特征进行口考作弊检测，以扩展口考作弊检测的范围。进一步的，通过预先构建作弊检测模型，可以在作弊检测时直接采用该模型，以快速完成作弊检测。
[0142]需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。
[0143]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0144]应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0145]此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0146]上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0147]在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0148]尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
【主权项】
1.一种口考作弊检测方法，其特征在于，包括: 获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息；根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征；根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果。2.根据权利要求1所述的方法，其特征在于，所述其他特征包括如下项中的一项或多项: 当前考生与相应座位声纹相似度特征、邻座声纹相似度特征、邻座答题内容相似度特征、邻座答题发音对比特征、整个考场考生整体答题内容一致性特征、整个考场考生发音时差一致性特征。3.根据权利要求1所述的方法，其特征在于，所述声纹特征包括: 1-vector特征或MFCC特征或LPC特征。4.根据权利要求2所述的方法，其特征在于，所述提取作弊检测特征包括如下项中的一项或多项: 从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征;获取第二声纹特征，所述第二声纹特征是从所述当前考生的相应座位的报名考生的语音数据中提取的；计算第一声纹特征与第二声纹特征的相似度特征，将所述相似度特征确定为所述当前考生与相应座位声纹相似度特征；从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征;从所述当前考生的邻座考生的口考语音数据中提取声纹特征，得到第三声纹特征;计算第一声纹特征与第三声纹特征的相似度特征，将所述相似度特征确定为所述邻座声纹相似度特征；对所述当前考生的答题内容进行向量化，得到第一答题内容向量;对所述当前考生的邻座考生的答题内容进行向量化，得到第二答题内容向量;计算第一答题内容向量与第二答题内容向量的相似度特征，将所述相似度特征确定为所述邻座答题内容相似度特征；获取当前考生与邻座考生的如下发音特征中的一项或多项，作为所述邻座答题发音对比特征:相同答案的错读发音一致度、语速相似度、停顿相似度、朗读时差一致度；将考场所有考生的答题内容向量两两进行相似度计算;计算所有相似度的均值和标准方差，作为整个考场考生整体答题内容一致性特征；分别计算各朗读子单元的发音一致度；对所有朗读子单元的发音一致度进行加权平均，得到整个考场考生发音时差一致性特征。5.根据权利要求1-4任一项所述的方法，其特征在于，还包括:构建作弊检测模型，所述构建作弊检测模型包括: 收集历史口考考生数据，并提取所述历史口考考生数据对应的作弊检测特征，以及，获取所述历史口考考生数据对应的作弊情况的人工标注结果，得到训练数据；确定模型拓扑结构；根据模型拓扑结构和所述训练数据进行训练，生成作弊检测模型。6.根据权利要求1-4任一项所述的方法，其特征在于，所述辅助信息包括如下项中的一项或多项: 所述当前考生的除所述口考语音数据之外的其他信息；除所述当前考生之外的其他考生的信息；所述当前考生所在考场的整体情况。7.—种口考作弊检测装置，其特征在于，包括: 获取模块，用于获取当前考生的口考语音数据，以及除所述口考语音数据之外的辅助信息；提取模块，用于根据所述口考语音数据和所述辅助信息，提取作弊检测特征，所述作弊检测特征包括:从所述口考语音数据中提取的声纹特征，以及除所述声纹特征之外的其他特征；确定模块，用于根据所述作弊检测特征和预先构建的作弊检测模型，得到作弊检测结果O8.根据权利要求7所述的装置，其特征在于，所述其他特征包括如下项中的一项或多项: 当前考生与相应座位声纹相似度特征、邻座声纹相似度特征、邻座答题内容相似度特征、邻座答题发音对比特征、整个考场考生整体答题内容一致性特征、整个考场考生发音时差一致性特征。9.根据权利要求7所述的装置，其特征在于，所述声纹特征包括: 1-vector特征或MFCC特征或LPC特征。10.根据权利要求8所述的装置，其特征在于，所述提取模块具体用于执行如下项中的一项或多项: 从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征;获取第二声纹特征，所述第二声纹特征是从所述当前考生的相应座位的报名考生的语音数据中提取的；计算第一声纹特征与第二声纹特征的相似度特征，将所述相似度特征确定为所述当前考生与相应座位声纹相似度特征；从所述当前考生的口考语音数据中提取声纹特征，得到第一声纹特征;从所述当前考生的邻座考生的口考语音数据中提取声纹特征，得到第三声纹特征;计算第一声纹特征与第三声纹特征的相似度特征，将所述相似度特征确定为所述邻座声纹相似度特征；对所述当前考生的答题内容进行向量化，得到第一答题内容向量;对所述当前考生的邻座考生的答题内容进行向量化，得到第二答题内容向量;计算第一答题内容向量与第二答题内容向量的相似度特征，将所述相似度特征确定为所述邻座答题内容相似度特征；获取当前考生与邻座考生的如下发音特征中的一项或多项，作为所述邻座答题发音对比特征:相同答案的错读发音一致度、语速相似度、停顿相似度、朗读时差一致度；将考场所有考生的答题内容向量两两进行相似度计算;计算所有相似度的均值和标准方差，作为整个考场考生整体答题内容一致性特征；分别计算各朗读子单元的发音一致度；对所有朗读子单元的发音一致度进行加权平均，得到整个考场考生发音时差一致性特征。11.根据权利要求7-10任一项所述的装置，其特征在于，还包括用于构建作弊检测模型的构建模块，所述构建模块具体用于: 收集历史口考考生数据，并提取所述历史口考考生数据对应的作弊检测特征，以及，获取所述历史口考考生数据对应的作弊情况的人工标注结果，得到训练数据；确定模型拓扑结构；根据模型拓扑结构和所述训练数据进行训练，生成作弊检测模型。12.根据权利要求7-10任一项所述的方法，其特征在于，所述获取模块获取的所述辅助信息包括如下项中的一项或多项: 所述当前考生的除所述口考语音数据之外的其他信息；除所述当前考生之外的其他考生的信息；所述当前考生所在考场的整体情况。
【文档编号】G10L15/08GK105931632SQ201610424906
【公开日】2016年9月7日
【申请日】2016年6月13日
【发明人】何春江, 胡阳, 潘颂声
【申请人】科大讯飞股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何春江;胡阳;潘颂声;
技术所有人：科大讯飞股份有限公司;
我是此专利的发明人