音视频文件检测管理方法及装置的制造方法_5

文档序号:8434245阅读:来源:国知局
准相对于人工审核标准较为统一完善,可更新性强,进一步降低了对互联网安全的影响。
[0317]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0318]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0319]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0320]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0321 ] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的音视频文件检测管理装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0322]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”或“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0323]至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
[0324]本发明公开了 Al、一种音视频文件检测管理方法,包括:
[0325]从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据;
[0326]根据预设规则对所述音视频元数据进行初步筛选,以对所述音视频文件进行分类;
[0327]依据分类结果对所述音视频文件中的至少一部分进行深度分析,得到针对被分析音视频文件的判别结果;
[0328]根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件。
[0329]A2、根据权利要求Al所述的方法,其中,所述依据分类结果对所述音视频文件中的至少一部分进行深度分析,得到针对被分析音视频文件的判别结果的步骤进一步包括:
[0330]根据所述分类结果获取所述被分析音视频文件;
[0331]提取所述被分析音视频文件的至少一个特征数据;
[0332]对提取的特征数据进行信息识别操作,以判断所述提取的特征数据中是否包含特定类型的信息;
[0333]依据所述信息识别操作的结果,得到所述判别结果。
[0334]A3、根据权利要求Al所述的方法,其中,所述从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据的步骤进一步包括:
[0335]通过网站数据上传接口向各网站发送元数据获取请求,并通过各网站数据上传接口接收各网站应答所述元数据获取请求所上传的音视频元数据;
[0336]或者
[0337]通过与各网站对应的网站数据上传接口接收各网站主动上传的音视频元数据。
[0338]A4、根据权利要求A3所述的方法,其中,在一定的时间段内,各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据;
[0339]或者,
[0340]在一定的时间段内,各网站所更新的音视频资源的总量达到一定的数值时主动上传音视频元数据;
[0341]或者
[0342]每隔固定或不定时间段,各网站主动上传音视频元数据。
[0343]A5、根据权利要求A3或A4所述的方法,其中,所述网站数据上传接口的数量为一个或多个,
[0344]当所述网站数据上传接口为一个时,通过该网站数据上传接口接收各网站上传的音视频元数据;
[0345]当所述各网站数据上传接口为多个时,根据包括网站数据上传接口与各网站绑定关系的预配置信息,通过各网站数据上传接口分别接收与各网站数据上传接口绑定的各网站上传的音视频元数据。
[0346]A6、根据权利要求Al至A5任一项所述的方法,其中,所述根据预设规则对所述音视频元数据进行初步筛选的步骤进一步包括:
[0347]根据预设的黑白名单规则对所述音视频元数据进行初步筛选对比;
[0348]若所述音视频元数据与黑名单规则匹配,则筛选其为不可信任数据;
[0349]若所述音视频元数据与白名单规则匹配,则筛选其为可信任数据;
[0350]若所述音视频元数据与黑白名单规则均不匹配,则筛选其为需进一步深度分析的未识别数据。
[0351]A7、根据权利要求A6所述的方法,其中,设置所述黑白名单规则的参数包括下列至少之一:
[0352]所述音视频元数据的IP地址;
[0353]所述音视频元数据的email来源;
[0354]所述音视频元数据的MD5标识;
[0355]所述音视频元数据的后缀名;
[0356]所述音视频元数据的下载地址;
[0357]所述音视频元数据的文件摘要。
[0358]AS、根据权利要求A2至A7任一项所述的方法,其中,所述提取所述被分析音视频文件的至少一个特征数据的步骤进一步包括:
[0359]对于视频文件,提取其中的至少一帧画面和/或至少一个语音片段作为特征数据;和/或
[0360]对于音频文件,提取其中的至少一个语音片段作为特征数据。
[0361]A9、根据权利要求A8所述的方法,其中,所述对于视频文件,提取其中的至少一帧画面作为特征数据的步骤进一步包括:
[0362]根据视频文件的时间轴走向,在至少一个时间点提取对应帧的画面作为特征数据。
[0363]A10、根据权利要求A9所述的方法,其中,所述根据视频文件的时间轴走向,在至少一个时间点提取对应帧的画面的步骤进一步包括下列至少之一:
[0364]在所述时间轴上随机选择任意时间点,提取对应帧的画面;
[0365]集中在所述时间轴的某个时间段内进行提取若干帧的画面;
[0366]每隔固定时间在对应时间点提取对应帧的画面以生成规则样本选集;
[0367]间隔不固定时间在对应时间点提取对应帧的画面以生成不规则样本选集。
[0368]All、根据权利要求AS至AlO任一项所述的方法,其中,所述对提取的特征数据进行信息识别操作,以判断所述提取的特征数据中是否包含特定类型的信息的步骤进一步包括:
[0369]对作为特征数据的帧画面进行信息识别,得到所述帧画面的表达信息,其中,所述表达信息包括所述帧画面上的文字信息和/或所述帧画面的图形信息;
[0370]对所述表达信息进行识别操作,以判断该帧画面上是否以文字和/或图形的方式包含特定类型的信息。
[0371]A12、根据权利要求All所述的方法,其中,所述表达信息包括徽标LOGO。
[0372]A13、根据权利要求AS所述的方法,其中,所述对于音频文件和/或视频文件,提取其中的至少一个语音片段作为特征数据的步骤进一步包括:
[0373]根据音频文件和/或视频文件的时间轴走向,提取至少一个时间段的语音片段作为特征数据。
[0374]A14、根据权利要求A13所述的方法,其中,所述根据音频文件和/或视频文件的时间轴走向,提取至少一个时间段的语音片段的步骤进一步包括:
[0375]在所述时间轴上随机选择任意时间段,提取对应的语音片段;
[0376]集中在所述时间轴的某个时间段内进行提取若干语音片段;
[0377]每隔固定时间段提取固定时长的语音片段以生成规则样本选集,;
[0378]间隔不固定时间段提取固定时长或可变时长的语音片段以生成不规则样本选集;
[0379]若视频文件提取了至少一帧画面作为特征数据时,提取与所述至少一帧画面对应的语音片段。
[0380]A15、根据权利要求A13或A14所述的方法,其中,所述对提取的特征数据进行信息识别操作,以判断所述提取的特征数据中是否包含特定类型的信息的步骤进一步包括:
[0381]对作为特征数据的语音片段进行解析,得到语音片段的语音信息;
[0382]对所述语音信息进行识别操作,以判断该语音片段中是否包含特定类型的信息。
[0383]A16、根据权利要求A15所述的方法,其中,所述对作为特征数据的语音片段进行解析,得到语音片段的语音信息的步骤进一步包括:
[0384]对所述语音片段进行语音与文本间的转换,得到语音信息;或者
[0385]对所述语音片段进行语音提取识别,得到其中的语音信息。
[0386]A17、根据权利要求A2至A16任一项所述的方法,其中,所述依据所述信息识别操作的结果,得到所述判别结果的步骤进一步包括:
[0387]对每个特征数据的识别结果赋予对应权值并设定在判别结果中的比值;
[0388]对当前被分析音视频文件的各特征数据的识别结果进行加权处理,得到最终权值;
[0389]比较所述权值与权值阈值,得到所述判别结果。
[0390]A18、根据权利要求A2至A16任一项所述的方法,其中,所述依据所述信息识别操作的结果,得到所述判别结果的步骤进一步包括:
[0391]对当前被分析音视频文件的各特征数据的识别结果分别进行计数;
[0392]比较识别结果为包含特定类型的信息的特征数量和识别结果为不包含特征类型的信息的特征数量,以得到所述判别结果。
[0393]A19、根据权利要求Al至A18任一项所述的方法,其中,所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后,还包括:
[0394]根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则。
[0395]A20、根据权利要求A19所述的方法,其中,所述根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则的步骤进一步包括:
[0396]对检测结果为包含特定类型的信息的音视频文件进行解析,得到与所述特定类型相关的关键参数;
[0397]将所述关键参数更新至所述预设规则中。
[0398]A21、根据权利要求Al至A20任一项所述的方法,其中,所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后,还包括:
[0399]若检测出所述被分析音视频文件为所述特定类型的音视频文件,则将其拦截;
[0400]若检测出所述被分析音视频文件并非为所述特定类型的音视频文件,则将其放行。
[0401]A22、根据权利要求Al至A21任一项所述的方法,其中,所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后,还包括:
[0402]跟踪上传识别为所述特定类型的音视频文件的用户在网站上的账户信息;
[0403]根据所述账户信息查找所述用户的真实身份信息。
[0404]A23、根据权利要求A22所述的方法,其中,所述跟踪上传识别为所述特定类型的音视频的用户在网站上的账户信息之后,还包括:
[0405]对该账户信息发送提醒消息;和/或
[0406]锁定或冻结该网站上的该账户。
[0407]A24、根据权利要求Al至A23任一项所述的方法,还包括:
[0408]若根据所述判别结果仍无法检测所述被分析音视频文件是否为特定类型的音视频文件,则将被分析音视频文件转入人工审核机制处理。
[0409]本发明还公开了 B25、一种音视频文件检测管理装置,包括:
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1