一种匹配检测方法及装置制造方法

文档序号:6621483阅读:190来源:国知局
一种匹配检测方法及装置制造方法
【专利摘要】本发明实施例公开了一种匹配检测方法及装置,其中的方法可包括:构建音频文件的音频特征序列和字幕文件的字幕特征序列;根据所述音频特征序列和所述字幕特征序列,确定相关因子;采用所述相关因子进行相关运算,获得相关函数序列;根据所述相关函数序列,对所述音频文件和所述字幕文件进行匹配检测。本发明能够对音频文件和字幕文件进行匹配检测,满足对音频文件的应用需求,提升音频文件的应用智能性。
【专利说明】-种匹配检测方法及装置

【技术领域】
[0001] 本发明涉及互联网【技术领域】,具体涉及音频处理【技术领域】,尤其涉及一种匹配检 测方法及装置。

【背景技术】
[0002] 随着互联网技术的发展,互联网音频库中收录了大量的诸如歌曲、歌曲片段等音 频文件,关于互联网音频的应用也日渐增多,例如:K歌系统、听歌系统等等。在应用音频文 件的过程中,用户通常希望播放音频文件的同时获得对应的字幕信息,例如:用户在演唱或 收听某歌曲时,希望查看对应的歌词;等等,然而,音频文件与字幕文件常常会出现不匹配 的情况,无法满足用户对音频文件的使用需求,从而降低了音频文件的应用智能性。


【发明内容】

[0003] 本发明实施例所要解决的技术问题在于,提供一种匹配检测方法及装置,能够对 音频文件和字幕文件进行匹配检测,满足对音频文件的应用需求,提升音频文件的应用智 能性。
[0004] 本发明实施例第一方面提供一种匹配检测方法,可包括:
[0005] 构建音频文件的音频特征序列和字幕文件的字幕特征序列;
[0006] 根据所述音频特征序列和所述字幕特征序列,确定相关因子;
[0007] 采用所述相关因子进行相关运算,获得相关函数序列;
[0008] 根据所述相关函数序列,对所述音频文件和所述字幕文件进行匹配检测。
[0009] 本发明实施例第二方面提供一种匹配检测装置,可包括:
[0010] 构建模块,用于构建音频文件的音频特征序列和字幕文件的字幕特征序列;
[0011] 因子确定模块,用于根据所述音频特征序列和所述字幕特征序列,确定相关因 子;
[0012] 相关运算模块,用于采用所述相关因子进行相关运算,获得相关函数序列;
[0013] 匹配检测模块,用于根据所述相关函数序列,对所述音频文件和所述字幕文件进 行匹配检测。
[0014] 实施本发明实施例,具有如下有益效果:
[0015] 本发明实施例中,可根据音频文件的音频特征序列和字幕文件的字幕特征序列, 构建相关函数序列;通过分析所述相关函数序列,了解所述音频文件与所述字幕文件之间 的相关性,从而实现了对音频文件和字幕文件之间的匹配检测,既满足了用户对于音频文 件的应用过程中的实际需求,又提升了音频文件的应用智能性。

【专利附图】

【附图说明】
[0016] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。
[0017] 图1为本发明实施例提供的一种匹配检测方法的流程图;
[0018] 图2为本发明实施例提供的另一种匹配检测方法的流程图;
[0019] 图3为图2所示的步骤S201的一个实施例的流程图;
[0020] 图4a为本发明实施例提供的一种构建音频文件的音频特征序列的方法的流程 图;
[0021] 图4b为本发明实施例提供的一种构建字幕文件的字幕特征序列的方法的流程 图;
[0022] 图5a为本发明实施例提供的一种确定相关因子的方法的流程图;
[0023] 图5b为本发明实施例提供的另一种确定相关因子的方法的流程图;
[0024] 图6a为本发明实施例提供的一种根据相关函数序列进行匹配检测的方法的流程 图;
[0025] 图6b为本发明实施例提供的另一种根据相关函数序列进行匹配检测的方法的流 程图;
[0026] 图7为本发明实施例提供的一种匹配检测装置的结构示意图;
[0027] 图8为本发明实施例提供的另一种匹配检测装置的结构示意图;
[0028] 图9为本发明实施例提供的一种预处理模块的结构示意图;
[0029] 图10a为本发明实施例提供的一种构建模块的结构示意图;
[0030] 图10b为本发明实施例提供的另一种构建模块的结构示意图;
[0031] 图11a为本发明实施例提供的一种因子确定模块的结构示意图;
[0032] 图lib为本发明实施例提供的另一种因子确定模块的结构示意图;
[0033] 图12a为本发明实施例提供的一种匹配检测模块的结构示意图;
[0034] 图12b为本发明实施例提供的另一种匹配检测模块的结构示意图。

【具体实施方式】
[0035] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0036] 本发明实施例中,音频文件可以包括但不限于:歌曲、歌曲片段等文件。字幕文件 可以包括但不限于:歌词、歌词片段等文件。一个音频文件可由至少一个音频单句顺序排列 而成,该至少一个音频单句的集合描述了音频文件中演唱内容部分;音频单句之间还可包 括无演唱内容部分。以歌曲A为例,歌曲A的描述可表示如下:
[0037] [661,770], [661,20] &1 [661,60] a2 [721,170] a3 [891,200] a4 [1091,70] a5 [1161, 180]a6[1341,20]a7[1361,50]a8
[0038] [1541,180], [1541,20]b![1561,50]b2[1611,20]bs[1631,30]b 4[1661,0]b5[1661, 10]b6[1671,20]b 7[1701,30]b8
[0039] [1871,730], [1871,60]Cl[1931,100]c2[2031,110]c3[2141,200]c 4[2341,70] c5 [2411,60]c6[2471,50]c7[2421,80]c8
[0040] ......
[0041] 上述歌曲 A 的描述中,诸如"a^a^asaj^ag"、"b^bgb^bjjbX"、"(^(32(33(3 4(35(36(37(38" 可分别用于表示一个音频单句,各音频单句之前的"[]"用于描述对应的音频单句的时间 属性,其单位时间通常为ms,例如:上述[661,770]用于描述音频单句"aia^aAajjaA"的 时间属性,其中的"661"表示音频单句1%----%?"的开始时间,"770"表示音频单 句,'的持续时间,假设歌曲A共5分钟,音频单句,'贝1J从第 661ms开始演唱,持续770ms结束演唱。各音频单句中,每个音频字之前的"[]"用于描述对 应的音频字的时间属性,其单位时间通常为ms,例如:上述[661,20]用于描述音频字"a/' 的时间属性,其中的"661"表示音频字"a/'的开始时间,"20"表示音频字"a/'的持续时间。 按照开始时间的先后顺序,可确定音频文件包含的各音频单句的顺序,例如:根据上述歌曲 A的描述,音频单句"aia2a3a4a5a 6a7a8"为第一个音频单句,其在歌曲A中的顺序为1 ;音频单 句"卟21^4咕6¥8"为第二个音频单句,其在歌曲A中的顺序为2 ;以此类推。可以理解的 是,每个音频单句开始之前或结束之后还可包含无演唱内容,例如:上述歌曲A的0-661ms 时间段则为无演唱内容部分,该部分可包含前奏信息。
[0042] 一个字幕文件可由至少一个显示字符单句顺序排列而成,该至少一个显示字符单 句的集合描述了字幕文件中的显示内容部分;显示字符单句之间还可包括空白字符,空白 字符描述了字幕文件中无显示内容部分。
[0043] 下面将结合图1-图6,对本发明实施例提供的匹配检测方法进行详细介绍。
[0044] 请参见图1,为本发明实施例提供的一种匹配检测方法的流程图;该方法可包括 以下步骤S101-步骤S104。
[0045] S101,构建音频文件的音频特征序列和字幕文件的字幕特征序列。
[0046] 所述音频特征序列可由至少一个音频元素通过其取值及索引构建形成,其中,音 频元素的索引指该音频元素在所述音频特征序列中的顺序,可用于表征所述音频文件的时 间特征;音频元素的值可用于体现所述音频文件的演唱特征;例如:某音频元素的值为第 一预设值(例如:第一预设值为1),可表示音频文件中该音频元素的索引所表征的时间片 为演唱内容部分;或者,某音频元素的值为第二预设值(例如:第二预设值为〇),可表示音 频文件中该音频元素的索引所表征的时间片为无演唱内容部分。
[0047] 所述字幕特征序列可由至少一个字幕元素通过其取值及索引构建形成,其中,字 幕元素的索引指该字幕元素在所述字幕特征序列中的顺序,可用于表征所述字幕文件的时 间特征;字幕元素的值可用于体现所述字幕文件的字符特征;例如:某字幕元素的值为第 一预设值(例如:第一预设值为1),可表示字幕文件中该字幕元素的索引所表征的时间片 为显示内容部分;或者,某字幕元素的值为第二预设值(例如:第二预设值为0),可表示字 幕文件中该字幕元素的索引所表征的时间片为无显示内容部分。
[0048] S102,根据所述音频特征序列和所述字幕特征序列,确定相关因子。
[0049] S103,采用所述相关因子进行相关运算,获得相关函数序列。
[0050] 其中,所述相关因子可用于表征所述音频特征序列的音频元素和所述字幕特征序 列的字幕元素之间的关系。采用所述相关因子进行相关运算,获得相关函数序列,所述相关 函数序列可以表征所述音频文件和所述字幕文件的相关性。
[0051] S104,根据所述相关函数序列,对所述音频文件和所述字幕文件进行匹配检测。
[0052] 由于所述相关函数序列可用于表征所述音频文件和所述字幕文件的相关性,本步 骤中,通过分析所述相关函数序列,可检测所述音频文件和所述字幕文件的匹配情况。具体 地,若所述音频文件和所述字幕文件的相关性越高,所述音频文件和所述字幕文件越匹配; 反之,若所述音频文件和所述字幕文件的相关性越低,所述音频文件和所述字幕文件越不 匹配。
[0053] 本发明实施例中,可根据音频文件的音频特征序列和字幕文件的字幕特征序列, 构建相关函数序列;通过分析所述相关函数序列,了解所述音频文件与所述字幕文件之间 的相关性,从而实现了对音频文件和字幕文件之间的匹配检测,既满足了用户对于音频文 件的应用过程中的实际需求,又提升了音频文件的应用智能性。
[0054] 请参见图2,为本发明实施例提供的另一种匹配检测方法的流程图;该方法可包 括以下步骤S201-步骤S205。
[0055] S201,对所述音频文件和所述字幕文件进行预处理。
[0056] 本步骤中,对所述音频文件和所述字幕文件进行预处理的目的在于:使所述音频 文件的播放时长与所述字幕文件的显示时长相统一,以使后续的匹配检测结果更为准确。
[0057] S202,构建音频文件的音频特征序列和字幕文件的字幕特征序列。
[0058] S203,根据所述音频特征序列和所述字幕特征序列,确定相关因子。
[0059] S204,采用所述相关因子进行相关运算,获得相关函数序列。
[0060] S205,根据所述相关函数序列,对所述音频文件和所述字幕文件进行匹配检测。
[0061] 本实施例的步骤S202-步骤S205可参见图1所示实施例的步骤S101-步骤S104, 在此不赘述。
[0062] 本发明实施例中,可根据音频文件的音频特征序列和字幕文件的字幕特征序列, 构建相关函数序列;通过分析所述相关函数序列,了解所述音频文件与所述字幕文件之间 的相关性,从而实现了对音频文件和字幕文件之间的匹配检测,既满足了用户对于音频文 件的应用过程中的实际需求,又提升了音频文件的应用智能性。
[0063] 请参见图3,为图2所示的步骤S201的一个实施例的流程图;该步骤S201可包括 以下步骤slOOl-步骤sl004。
[0064] S1001,获取所述音频文件的源播放时长和所述字幕文件的源显示时长。
[0065] 所述音频文件的源播放时长为:所述音频文件中演唱内容部分的时长和无演唱内 容部分的时长总和,例如:假设歌曲A共5分钟,其中演唱内容部分的时长为4分钟,无演唱 内容部分的时长为1分钟,则本步骤所获取的所述音频文件的源播放时长为5分钟。
[0066] 所述字幕文件的源显示时长为:所述字幕文件中显示内容部分的时长和无显示内 容部分的时长总和,例如:假设歌曲A的歌词文件共需要显示4. 5分钟,其中显示内容部分 的时长为4分钟,无显示内容部分的时长为0. 5分钟,则本步骤所获取的所述字幕文件的源 显示时长为4. 5分钟。
[0067] sl002,选取所述源播放时长和所述源显示时长二者中的最大者,将所选取的最大 者作为基准时长。
[0068] 按照步骤slOOl中所示例子,所述源播放时长为5分钟,所述源显示时长为4. 5分 钟,本步骤则选取5分钟作为基准时长,该基准时长可表示为Tmax。
[0069] S1003,采用所述基准时长对所述音频文件的源播放时长进行归整处理,获得所述 音频文件的目标播放时长。
[0070] S1004,采用所述基准时长对所述音频文件的源显示时长进行归整处理,获得所述 字幕文件的目标显示时长。
[0071] 步骤sl003-sl004中,归整处理的目的是使所述音频文件的播放时长与所述字幕 文件的显示时长相统一,以使后续的匹配检测结果更为准确。具体地,由于基准时长T max等 于所述音频文件的源播放时长,因此,步骤S1003中可直接将该基准时长Tmax作为所述音 频文件的目标播放时长。由于基准时长T max大于所述字幕文件的源显示时长,因此,步骤 S1004中的归整处理过程可包括:在所述字幕文件的结束时间点之后插入空白字符,使所 述字幕文件的源显示时长增加至Tmax,归整处理之后,所述字幕文件的目标显示时长也为该 基准时长T max。
[0072] 本发明实施例中,可根据音频文件的音频特征序列和字幕文件的字幕特征序列, 构建相关函数序列;通过分析所述相关函数序列,了解所述音频文件与所述字幕文件之间 的相关性,从而实现了对音频文件和字幕文件之间的匹配检测,既满足了用户对于音频文 件的应用过程中的实际需求,又提升了音频文件的应用智能性。
[0073] 请参见图4a,为本发明实施例提供的一种构建音频文件的音频特征序列的方法的 流程图;本实施例可以为图1所示的步骤S101的具体细化流程,也可以为图2所示的步骤 S202的具体细化流程。该方法可包括以下步骤s2001-步骤s2006。
[0074] S2001,按照预设时间刻度对所述音频文件的目标播放时长进行等分处理,获得至 少一个播放时间片。
[0075] 所述预设时间刻度可根据实际需要进行设定,例如:可考虑节拍因素,一个节拍通 常为200ms,可将时间刻度设定为节拍的倍数,诸如:100ms、200ms、400ms等等。所述预设时 间刻度可采用T表示,本步骤中,可采用公式(1)进行等分处理,该公式(1)可表示如下:
[0076] N = Tmax/T (1)
[0077] 上述公式(1)中,N为正整数。通过上述公式(1),所述音频文件的目标播放时长 Tmax被划分为N个播放时间片;例如:假设N为10, Tmax等于5分钟(0-4分59秒),则第一 个播放时间片为0-29秒,第二个播放时间片为30秒-59秒,以此类推,第N个播放时间片 为4分30秒 -4分59秒。
[0078] S2002,根据所述至少一个播放时间片的数量,确定构建所述音频特征序列的音频 元素的数量。
[0079] 所述播放时间片的数量等于所述音频元素的数量。本步骤中,可确定构建所述音 频特征序列的音频元素的数量为N,即确定所述音频特征序列由N个音频元素构成。
[0080] S2003,根据所述至少一个播放时间片中各播放时间片的顺序,确定构建所述音频 特征序列的各音频元素的索引。
[0081] 所述播放时间片的顺序与所述音频元素的索引一一对应;具体地,第一个播放时 间片的顺序为1,该第一个播放时间片对应的音频元素的索引为1 ;第二个播放时间片的顺 序为2,该第二个播放时间片对应的音频元素的索引为2 ;以此类推,第N个播放时间片的顺 序为,该第N个播放时间片对应的音频元素的索引为N。
[0082] s2004,计算所述各播放时间片内的能量。
[0083] 设定一个播放时间片内包括L(L为小于等于N的正整数)个音频帧,一个播放时 间片内的音频可以为该L个音频帧顺序排列构成,则一个播放时间片内的音频序列可表示 为其中x(j),j为整数,且〇彡j彡L-1。本实施例中,N个播放时间片中每个播放时间片内 的音频序列可表示为 Xl (j),i为整数,且〇彡i彡N-l,i表示播放时间片的顺序或音频元 素的索引。具体地,第一个播放时间片的音频序列可表示为&(·]_),第二个播放时间片的音 频序列可表示为 Xl(j),以此类推,第N个播放时间片的音频序列可表示为XN_i(j)。
[0084] 本步骤中,可采用公式(2)计算各播放时间片内的能量,该公式(2)可表示如下:
[0085]

【权利要求】
1. 一种匹配检测方法,其特征在于,包括: 构建音频文件的音频特征序列和字幕文件的字幕特征序列; 根据所述音频特征序列和所述字幕特征序列,确定相关因子; 采用所述相关因子进行相关运算,获得相关函数序列; 根据所述相关函数序列,对所述音频文件和所述字幕文件进行匹配检测。
2. 如权利要求1所述的方法,其特征在于,所述构建音频文件的音频特征序列和字幕 文件的字幕特征序列之前,还包括: 对所述音频文件和所述字幕文件进行预处理。
3. 如权利要求2所述的方法,其特征在于,所述对所述音频文件和所述字幕文件进行 预处理,包括: 获取所述音频文件的源播放时长和所述字幕文件的源显示时长; 选取所述源播放时长和所述源显示时长二者中的最大者,将所选取的最大者作为基准 时长; 采用所述基准时长对所述音频文件的源播放时长进行归整处理,获得所述音频文件的 目标播放时长; 采用所述基准时长对所述音频文件的源显示时长进行归整处理,获得所述字幕文件的 目标显示时长。
4. 如权利要求3所述的方法,其特征在于,所述构建音频文件的音频特征序列,包括: 按照预设时间刻度对所述音频文件的目标播放时长进行等分处理,获得至少一个播放 时间片; 根据所述至少一个播放时间片的数量,确定构建所述音频特征序列的音频元素的数 量; 根据所述至少一个播放时间片中各播放时间片的顺序,确定构建所述音频特征序列的 各音频元素的索引; 计算所述各播放时间片内的能量; 根据所述各播放时间片内的能量,设置构建所述音频特征序列的各音频元素的值; 按照构建所述音频特征序列的各音频元素的值及索引,构建所述音频文件的音频特征 序列。
5. 如权利要求4所述的方法,其特征在于,所述构建字幕文件的字幕特征序列,包括: 按照预设时间刻度对所述字幕文件的目标显示时长进行等分处理,获得至少一个显示 时间片; 根据所述至少一个显示时间片的数量,确定构建所述字幕特征序列的字幕元素的数 量; 根据所述至少一个显示时间片中各显示时间片的顺序,确定构建所述字幕特征序列的 各字幕元素的索引; 根据所述各显示时间片与所述字幕文件中包含的字符的对应关系,设置构建所述字幕 特征序列的各字幕元素的值; 按照构建所述字幕特征序列的各字幕元素的值及索引,构建所述字幕文件的字幕特征 序列。
6. 如权利要求1-5任一项所述的方法,其特征在于,所述根据所述音频特征序列和所 述字幕特征序列,确定相关因子,包括: 对所述音频特征序列进行循环移动,获得所述音频文件的音频转换序列; 统计所述音频转换序列与所述字幕特征序列中等值元素的数量,获得第一相关因子; 统计所述音频转换序列与所述字幕特征序列中非等值元素的数量,获得第二相关因 子。
7. 如权利要求1-5任一项所述的方法,其特征在于,所述根据所述音频特征序列和所 述字幕特征序列,确定相关因子,包括: 对所述字幕特征序列进行循环移动,获得所述字幕文件的字幕转换序列; 统计所述音频特征序列与所述字幕转换序列中等值元素的数量,获得第三相关因子; 统计所述音频特征序列与所述字幕转换序列中非等值元素的数量,获得第四相关因 子。
8. 如权利要求1-5任一项所述的方法,其特征在于,所述根据所述相关函数序列,对所 述音频文件和所述字幕文件进行匹配检测,包括: 计算所述相关函数序列的最大值; 判断所述最大值是否大于或等于预设阈值; 若所述最大值大于或等于所述预设阈值,确定所述音频文件与所述字幕文件相匹配; 若所述最大值小于所述预设阈值,确定所述音频文件与所述字幕文件不匹配。
9. 如权利要求1-5任一项所述的方法,其特征在于,所述根据所述相关函数序列,对所 述音频文件和所述字幕文件进行匹配检测,包括: 根据所述相关函数序列,计算所述音频文件的播放时间与所述字幕文件的显示时间之 间的时间差; 判断所述时间差是否位于预设时间范围内; 若所述时间差位于所述预设时间范围内,确定所述音频文件与所述字幕文件相匹配; 若所述时间差位于所述预设时间范围外,确定所述音频文件与所述字幕文件不匹配。
10. 如权利要求9所述的方法,其特征在于,所述确定所述音频文件与所述字幕文件相 匹配之后,还包括: 根据所述时间差,对所述音频文件的播放时间和所述字幕文件的显示时间进行校准处 理。
11. 一种匹配检测装置,其特征在于,包括: 构建模块,用于构建音频文件的音频特征序列和字幕文件的字幕特征序列; 因子确定模块,用于根据所述音频特征序列和所述字幕特征序列,确定相关因子; 相关运算模块,用于采用所述相关因子进行相关运算,获得相关函数序列; 匹配检测模块,用于根据所述相关函数序列,对所述音频文件和所述字幕文件进行匹 配检测。
12. 如权利要求11所述的装置,其特征在于,还包括: 预处理模块,用于对所述音频文件和所述字幕文件进行预处理。
13. 如权利要求12所述的装置,其特征在于,所述预处理模块包括: 时长获取单元,用于获取所述音频文件的源播放时长和所述字幕文件的源显示时长; 基准选取单元,用于选取所述源播放时长和所述源显示时长二者中的最大者,将所选 取的最大者作为基准时长; 第一归整单元,用于采用所述基准时长对所述音频文件的源播放时长进行归整处理, 获得所述音频文件的目标播放时长; 第二归整单元,用于采用所述基准时长对所述音频文件的源显示时长进行归整处理, 获得所述字幕文件的目标显示时长。
14. 如权利要求13所述的装置,其特征在于,所述构建模块包括: 播放时长处理单元,用于按照预设时间刻度对所述音频文件的目标播放时长进行等分 处理,获得至少一个播放时间片; 第一数量确定单元,用于根据所述至少一个播放时间片的数量,确定构建所述音频特 征序列的音频元素的数量; 第一索引确定单元,用于根据所述至少一个播放时间片中各播放时间片的顺序,确定 构建所述音频特征序列的各音频元素的索引; 能量计算单元,用于计算所述各播放时间片内的能量; 音频元素赋值单元,用于根据所述各播放时间片内的能量,设置构建所述音频特征序 列的各音频元素的值; 第一构建单元,用于按照构建所述音频特征序列的各音频元素的值及索引,构建所述 音频文件的音频特征序列。
15. 如权利要求14所述的装置,其特征在于,所述构建模块包括: 显示时长处理单元,用于按照预设时间刻度对所述字幕文件的目标显示时长进行等分 处理,获得至少一个显示时间片; 第二数量确定单元,用于根据所述至少一个显示时间片的数量,确定构建所述字幕特 征序列的字幕元素的数量; 第二索引确定单元,用于根据所述至少一个显示时间片中各显示时间片的顺序,确定 构建所述字幕特征序列的各字幕元素的索引; 字幕元素赋值单元,用于根据所述各显示时间片与所述字幕文件中包含的字符的对应 关系,设置构建所述字幕特征序列的各字幕元素的值; 第二构建单元,用于按照构建所述字幕特征序列的各字幕元素的值及索引,构建所述 字幕文件的字幕特征序列。
16. 如权利要求11-15任一项所述的装置,其特征在于,所述因子确定模块包括: 音频移动单元,用于对所述音频特征序列进行循环移动,获得所述音频文件的音频转 换序列; 第一统计单元,用于统计所述音频转换序列与所述字幕特征序列中等值元素的数量, 获得第一相关因子; 第二统计单元,用于统计所述音频转换序列与所述字幕特征序列中非等值元素的数 量,获得第二相关因子。
17. 如权利要求11-15任一项所述的装置,其特征在于,所述因子确定模块包括: 字幕移动单元,用于对所述字幕特征序列进行循环移动,获得所述字幕文件的字幕转 换序列; 第三统计单元,用于统计所述音频特征序列与所述字幕转换序列中等值元素的数量, 获得第三相关因子; 第四统计单元,用于统计所述音频特征序列与所述字幕转换序列中非等值元素的数 量,获得第四相关因子。
18. 如权利要求11-15任一项所述的装置,其特征在于,所述匹配检测模块包括: 最大值计算单元,用于计算所述相关函数序列的最大值; 第一判断单元,用于判断所述最大值是否大于或等于预设阈值; 第一结果确定单元,用于若所述最大值大于或等于所述预设阈值,确定所述音频文件 与所述字幕文件相匹配;或者,用于若所述最大值小于所述预设阈值,确定所述音频文件与 所述字幕文件不匹配。
19. 如权利要求11-15任一项所述的装置,其特征在于,所述匹配检测模块包括: 时间差计算单元,用于根据所述相关函数序列,计算所述音频文件的播放时间与所述 字幕文件的显示时间之间的时间差; 第二判断单元,用于判断所述时间差是否位于预设时间范围内; 第二确定单元,用于若所述时间差位于所述预设时间范围内,确定所述音频文件与所 述字幕文件相匹配;或者,用于若所述时间差位于所述预设时间范围外,确定所述音频文件 与所述字幕文件不匹配。
20. 如权利要求19所述的装置,其特征在于,所述匹配检测模块还包括: 校准处理单元,用于根据所述时间差,对所述音频文件的播放时间和所述字幕文件的 显示时间进行校准处理。
【文档编号】G06F17/30GK104142989SQ201410362558
【公开日】2014年11月12日 申请日期:2014年7月28日 优先权日:2014年7月28日
【发明者】赵伟峰 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1