音视频文件检测管理方法及装置的制造方法_2

文档序号：8434245阅读：来源：国知局

对比；
[0115]若所述音视频元数据与黑名单规则匹配，则筛选其为不可信任数据；
[0116]若所述音视频元数据与白名单规则匹配，则筛选其为可信任数据；
[0117]若所述音视频元数据与黑白名单规则均不匹配，则筛选其为需进一步深度分析的未识别数据。
[0118]可选地，设置所述黑白名单规则的参数包括下列至少之一:
[0119]所述音视频元数据的IP地址；
[0120]所述音视频元数据的email来源；
[0121 ] 所述音视频元数据的MD5标识；
[0122]所述音视频元数据的后缀名；
[0123]所述音视频元数据的下载地址；
[0124]所述音视频元数据的文件摘要。
[0125]可选地，所述分流器包括:
[0126]视频提取单元，用于对于视频文件，提取其中的至少一帧画面和/或至少一个语音片段作为特征数据；和/或
[0127]音频提取单元，用于对于音频文件，提取其中的至少一个语音片段作为特征数据。
[0128]可选地，所述视频提取单元还用于:根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面作为特征数据。
[0129]可选地，所述视频提取单元还用于采用下列至少之一的提取方式:
[0130]在所述时间轴上随机选择任意时间点，提取对应帧的画面；
[0131]集中在所述时间轴的某个时间段内进行提取若干帧的画面；
[0132]每隔固定时间在对应时间点提取对应帧的画面以生成规则样本选集；
[0133]间隔不固定时间在对应时间点提取对应帧的画面以生成不规则样本选集。
[0134]可选地，所述数据判别器还用于:
[0135]对作为特征数据的帧画面进行信息识别，得到所述帧画面的表达信息，其中，所述表达信息包括所述帧画面上的文字信息和/或所述帧画面的图形信息；
[0136]对所述表达信息进行识别操作，以判断出该帧画面上是否以文字和/或图形的方式包含特定类型的信息。
[0137]可选地，所述表达信息包括徽标LOGO。
[0138]可选地，所述音频提取单元还用于:根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段作为特征数据。
[0139]可选地，所述音频提取单元还用于:
[0140]在所述时间轴上随机选择任意时间段，提取对应的语音片段；
[0141]集中在所述时间轴的某个时间段内进行提取若干语音片段；
[0142]每隔固定时间段提取固定时长的语音片段以生成规则样本选集；
[0143]间隔不固定时间段提取固定时长或可变时长的语音片段以生成不规则样本选集;
[0144]若视频文件提取了至少一帧画面作为特征数据时，提取与所述至少一帧画面对应的语音片段。
[0145]可选地，所述数据判别器还用于:
[0146]对作为特征数据的语音片段进行解析，得到语音片段的语音信息；
[0147]对所述语音信息进行识别操作，以判断识别出该语音片段中是否包含特定类型的信息。
[0148]可选地，所述数据判别器还用于:
[0149]对所述语音片段进行语音与文本间的转换，得到语音信息；或者
[0150]对所述语音片段进行语音提取识别，得到其中的语音信息。
[0151]可选地，所述数据判别器还用于:
[0152]对每个特征数据的识别结果赋予对应权值并设定在判别结果中的比值；
[0153]对当前被分析音视频文件的各识别结果进行加权处理，得到最终权值；
[0154]比较所述权值与权值阈值，得到所述判别结果。
[0155]可选地，所述数据判别器还用于:
[0156]对当前被分析音视频文件的各特征数据的识别结果分别进行计数；
[0157]比较识别结果为包含特定类型的信息的特征数量和识别结果为不包含特征类型的信息的特征数量，以得到所述判别结果。
[0158]可选地，音视频文件检测管理装置还包括:
[0159]规则更新器，用于根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则。
[0160]可选地，所述规则更新器还用于:
[0161]对检测结果为包含特定类型的信息的音视频文件进行解析，得到与所述特定类型相关的关键参数；
[0162]将所述关键参数更新至所述预设规则中。
[0163]可选地，音视频文件检测管理装置还包括:
[0164]文件拦截器，用于若检测出被分析音视频文件为所述特定类型的音视频，则将其拦截；
[0165]文件放行器，用于若检测出被分析音视频文件并非为所述特定类型的音视频，则将其放行。
[0166]可选地，音视频文件检测管理装置还包括:
[0167]身份确认器，用于跟踪上传识别为所述特定类型的音视频的用户在网站上的账户信息；根据所述账户信息查找所述用户的真实身份信息。
[0168]可选地，音视频文件检测管理装置还包括:
[0169]账户信息处理器，用于对所述身份确认器识别出的账户信息发送提醒消息；和/或，锁定或冻结该网站上的该账户信息。
[0170]可选地，音视频文件检测管理装置还包括:
[0171]文件转发器，用于若根据所述判别结果仍无法检测所述被分析音视频文件是否为特定类型的音视频文件，则将被分析音视频文件转入人工审核机制处理。
[0172]在本发明实施例中采用如下手段对音视频文件进行检测管理:在获取到音视频文件对应的音视频元数据之后，首先，对音视频元数据进行初步筛选，以对音视频文件进行分类；随后，依据分类结果中音视频文件中的至少一部分(例如分类为无法识别的部分音视频文件)进行深度分析，得到针对被分析音视频文件的差别结果，进而可以根据差别结果检测被分析音视频文件是否为特定类型的音视频文件，以完成音视频文件的检测管理。在初步筛选的过程中，部分音视频文件就已经能够判断其类型，并进而确定其安全性。而在初步筛选中无法识别的部分音视频文件，因其未知性导致不可知的威胁性，因此，本发明实施例结合了初步筛选步骤和进一步的深度分析步骤，最终，根据综合的识别结果得到的判断结果检测出被分析音视频文件是否为特定类型的音视频文件。由此可见，本发明实施例能够对网站存储的音视频文件进行筛选辨别检测，以提高音视频文件的可检测性，进而提高音视频文件的安全性、可靠性，避免因音视频文件的难以检测为用户以及整个互联网时代带来一定的安全隐患。进一步，本发明实施例利用对数据的提取分析等自动管理手段替代了现有技术的人工审核机制，能够更好更快地发现、控制以及管理某些特定类型的音视频，及时有效地发现相关的音视频，及时处理，加速大数据的处理过程，节省审核时间，降低互联网安全可能面临的危机。并且，自动管理手段的标准相对于人工审核标准较为统一完善，可更新性强，进一步降低了对互联网安全的影响。
[0173]上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的【具体实施方式】。
[0174]根据下文结合附图对本发明具体实施例的详细描述，本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
【附图说明】
[0175]通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中:
[0176]图1示出了现有技术的人工审核视频的流程示意图；
[0177]图2示出了根据本发明一个实施例的音视频文件检测管理方法的处理流程图；
[0178]图3示出了根据本发明一个实施例的根据提取的至少一个特征数据综合判断未识别数据是否为特定类型的数据的第一种流程图；
[0179]图4示出了根据本发明一个实施例的根据提取的至少一个特征数据综合判断未识别数据是否为特定类型的数据的第二种流程图；
[0180]图5示出了根据本发明一个实施例的音视频元数据的总处理流程的简单示意图；
[0181]图6示出了根据本发明一个实施例的三步处理方式的详细处理流程；
[0182]图7示出了根据本发明一个实施例的音视频文件检测管理装置的一种结构示意图；
[0183]图8示出了根据本发明一个实施例的音视频文件检测管理装置的另一种结构示意图；以及
[0184]图9示出了根据本发明一个实施例的多网络数据上传接口接收网站上传数据的示意图。
【具体实施方式】
[0185]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
[0186]为解决上述技术问题，本发明实施例提供了一种音视频文件检测管理方法。图2示出了根据本发明一个实施例的音视频文件检测管理方法的处理流程图。参见图2，该方法至少包括以下步骤：
[0187]步骤S202、从存储有音视频文件的网站获取音视频文件对应的音视频元数据。
[0188]步骤S204、根据预设规则对步骤S202获取的音视频元数据进行初步筛选，以对音视频元数据对应的音视频文件进行分类。
[0189]步骤S206、依据分类结果对音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果。步骤S208、根据步骤S206得到的、针对被分析音视频文件的判别结果检测被分析音视频文件是否为特定类型的音视频文件。
[0190]在本发明实施例中采用如下手段对音视频文件进行检测管理：在获取到音视频文件对应的音视频元数据之后，首先，对音视频元数据进行初步筛选，以对音视频文件进行分类；随后，依据分类结果中音视频文件中的至少一部分（例如分类为无法识别的部分音视频文件）进行深度分析，得到针对被分析音视频文件的判别结果，进而可以根据判别结果检测被分析音视频文件是否为特定类型的音视频文件，以完成音视频文件的检测管理。在初步筛选的过程中，部分音视频文件就已经能够判断其类型，并进而确定其安全性。而在初步筛选中无法识别的部分音视频文件，因其未知性导致不可知的威胁性，因此，本发明实施例结合了初步筛选步骤和进一步的深度分析步骤，最终，根据综合的识别结果得到的判断结果检测出被分析音视频文件是否为特定类型的音视频文件。由此可见，本发明实施例能够对网站存储的音视频文件进行筛选辨别检测，以提高音视频文件的可检测性，进而提高音视频文件的安全性、可靠性，避免因音视频文件的难以检测为用户以及整个互联网时代带来一定的安全隐患。进一步，本发明实施例利用对数据的提取分析等自动管理手段替代了现有技术的人工审核机制，能够更好更快地发现、控制以及管理某些特定类型的音视频，及时有效地发现相关的音视频，及时处理，加速大数据的处理过程，节省审核时间，降低互联网安全可能面临的危机。并且，自动管理手段的标准相对于人工审核标准较为统一完善，可更新性强，进一步降低了对互联网安全的影响。
[0191]本发明实施例可以应用任何互联网存储资源的检测，特别是对于包含木马/病毒/不当的宣传资料等的音视频文件，对于可能存在的恐怖宣传起到了极大的防御效果。并且，本发明实施例能够根据互联网的可追溯性追踪到宣传者，对互联网本身的安全以及网络下的安全均能够起到很大的保障。
[0192]为实施本发明实施例所提供的音视频文件检测管理方法，可以设置一个独立的控制主体，也可以在服务器等类似管理设备中设置能够提供这一管理方法功能的控制部件或设备，后文提及的相关处理平台即是控制主体的具相化，具体应用由实际情况限定，在此不做赘述。
[0193]在本发明的一个优选实施例中，步骤S206所提及的深度分析过程具体可以包括如下步骤：
[0194]步骤1、根据分类结果获取被分析音视频文件；
[0195]步骤2、提取被分析音视频文件的至少一个特征数据；
[0196]步骤3、对提取的特征数据进行信息识别操作，以判断提取的特征数据中是否包含特定类型的信息；
[0197]步骤4、依据信息识别操作的结果，得到判别结果。
[0198]在本发明一个优选地实施例中，步骤S202所提及的从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据的步骤，至少可以包括如下两种方式。
[0199]方式一、被动上传方式，即，通过各网站数据上传接口向各网站发送元数据获取请求，当各网站接收到元数据获取请求之后，对元数据获取请求进行答应，进而可以通过网站数据上传接口将音视频元数据上传，从而使得本方式可以通过各网站数据上传接口接收到各网站上传的音视频元数据。即，由下发的元数据获取请求触发各网站上传数据。这一方式时间及应用等方面均较为灵活，适用于各类网站，例如，可以是控制主体发现网站已存储的音视频资源达到指定容量时发出元数据获取请求，也可以是控制主体发现其中某个或某几个网站已存储的音视频文件达到指定容量时针对这个或这几个网站发出元数据获取请求。
[0200]方式二、主动上传方式，通过与各网站对应的网站数据上传接口接收各网站主动上传的音视频元数据。在这一种上传方式中，各网站检测自身的音视频资源，确定是否需要上传。具体地，例如，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据，此处需要说明地是，其中的任意个网站检测到自身的音视频资源达到一定百分比即可上传。再例如，在一定的时间段内，各网站所更新的音视频资源的

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6