一种防止违规文件多次上传的方法及装置的制作方法

文档序号:7855271阅读:335来源:国知局
专利名称:一种防止违规文件多次上传的方法及装置的制作方法
技术领域
本发明涉及数据传输技术领域,特别涉及一种防止违规文件多次上传的方法及装置。
背景技术
随着网络技术的迅速发展,网络对人们的工作、学习和生活产生了深刻的影响,并且成为文化发展的巨大推动力量。在现代社会,报纸是纸质媒体,广播、电视是声像媒体,网络被称为报纸、广播、电视之外的第四种媒介。网络上的学习资源分布广泛、内容丰富、数量庞大 、种类繁多,例如,教学课件、网络课堂、学习科研动态、电子图书、数字化学术期刊、考试题库、经验交流、网络学术会议、数字图书馆文献、远程教育资源库、视听点播资料等等,利用网络进行学习已成为当今学习化社会的一个重要特征。网络作为一种新的文化传播的媒介,在传播积极类信息的同时,通过网络传播危害网民身心健康(例如,暴力文化、色情文化等)、财产安全(例如,股票内幕诈骗、彩票预测诈骗、赌博诈骗等)与社会安定团结(例如,毒品买卖、枪械等管制品买卖等)的消极类信息也越来越多。为了营造一个健康的网络环境,网络管理员需要对这些包含消极类信息的文件进行删除,其中,包含消极类信息的文件可以为图片或视频等多种格式。现有技术下,网络管理员要删除包含消极类信息的违规文件时,只能对包含消极类信息的违规文件进行逐个删除,并且,被删除的违规文件可以被同一用户或不同用户再次上传,那么,网络管理员只能对再次上传的违规文件进行再次删除,这将大大耗费人力资源与时间资源。

发明内容
本发明实施例提供一种防止违规文件多次上传的方法及装置,用以减少删除同一违规文件时耗费的人力资源与时间资源。本发明实施例提供的具体技术方案如下一种防止文件多次上传的方法,包括确定待上传文件的第一信息摘要值;将所述第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配;确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,且确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传。一种防止文件多次上传的装置,包括计算单元,用于确定待上传文件的第一信息摘要值;匹配单元,用于将所述第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配;
处理单元,用于确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,且确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传。本发明实施例中,用户在将违规文件上传时,服务器先确定待上传文件的第一信息摘要值,然后,服务器将第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配,最后,服务器确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,及确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传,这样,用户将不能在同一区域多次上传违规文件,避免了该区域的网络管理员对多次上传的违规文件进行多次删除,减少了人力资源与时间资源的耗费。


图I为本发明实施例中服务器的结构示意图;图2为为本发明实施例中禁止同一违规文件在同一区域多次上传的详细流程图。
具体实施方式

为了禁止同一违规文件在同一区域多次上传,避免该区域的网络管理员对多次上传的同一违规文件进行多次删除,减少人力资源与时间资源的耗费,本发明实施例中,用户在上传违规文件时,服务器先确定待上传文件的第一信息摘要值,然后,服务器将第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配,最后,服务器确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,及确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传,这样,用户将不能在同一区域将同一违规文件多次上传,避免了该区域的网络管理员对多次上传的同一违规文件进行多次删除,减少了删除同一违规文件的人力资源与时间资源的耗费。下面结合附图对本发明优选的实施方式进行详细说明。参阅图I所示,本发明实施例中,服务器包括计算单元10、匹配单元11和处理单元12,其中,计算单元10,用于确定待上传文件的第一信息摘要值;匹配单元11,用于将所述第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配;处理单元12,用于确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,且确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传。基于上述技术方案,参阅图2所示,本发明实施例中,网络服务器禁止同一违规文件在同一区域多次上传的详细流程如下步骤200 :确定待上传的文件的第一信息摘要值。待上传文件的格式可以有多种,例如,图片格式、文本格式、视频格式、音频格式等等。并且,待上传文件可以为学术科研动态资料、电子图书、数字化学术期刊等包含积极信息的文件,也可以为反动杂志、恐怖期刊、色情图书等包含消极信息的文件。例如,待上传文件可以为数字化学术期刊,并且该数字化期刊既可以为图片格式,也可以为视频格式,还可以为音频格式。又例如,待上传文件可以为恐怖期刊,并且该恐怖期刊可以为图片格式,也可以为视频格式,还可以为音频格式。待上传文件的第一信息摘要值可以由MD5(Message_Digest Algorithm 5,摘要算法5)计算得到,也可以由SHAl (Secure Hash Algorithm,安全哈希算法)计算得到,但不限于以上两种计算方法。MD5为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护,让大容量信息在用数字签名软件签署私人密钥前被“压缩”成一种保密的格式,即把一个任意长度的字节串变换成一定长的十六进制数字串。SHAl主要适用于数字签名标准里面定义的数字签名算法。对于长度小于264位的文件,SHAl会产生一个160位的信息摘要值。当接收到文件的时候,这个信息摘要值可以用来验证文件的完整性。在传输的过程中,文件的数据很可能会发生变化,那么变化的文件产生的信息摘要值就不相同。SHAl有以下特性不可以从信息摘要值中恢复原文件;两个不同的文件产生的信息摘要值一定不相同。
步骤210 :判断目标区域内是否存在与第一信息摘要值匹配成功的第二信息摘要值,若是,则执行步骤220 ;否则,将待上传文件上传至目标区域。本发明实施例中,目标区域内每一个文件的第二信息摘要值可以由MD5或SHAl计算得到,但不限于这两种计算方法。并且,目标区域内文件的第二信息摘要值的算法与待上传文件的第一信息摘要值的采用相同的计算方法时,才将第一信息摘要值与目标区域内文件的第二信息摘要值进行匹配。例如,若待上传文件的第一信息摘要值是根据MD5算法得出,目标区域内文件的第二信息摘要值也根据MD5算法得出,然后再将第一信息摘要值与目标区域内文件的第二信息摘要值进行匹配;若待上传文件的第一信息摘要值是根据MD5算法得出,目标区域内文件的第二信息摘要值根据SHAl算法得出,不执行将第一信息摘要值与目标区域内文件的第二信息摘要值匹配的操作。又例如,待上传文件的第一信息摘要值是根据SHAl算法得出,那么目标区域内文件的第二信息摘要值也必须根据SHAl算法得出,然后再将第一信息摘要值与目标区域内文件的第二信息摘要值进行匹配;若待上传文件的第一信息摘要值是根据SHAl算法得出,目标区域内文件的第二信息摘要值根据MD5算法得出,不执行将第一信息摘要值与目标区域内文件的第二信息摘要值匹配的操作。在本发明的实施例中,每一个文件都有唯一的信息摘要值,只有两个完全相同的文件的信息摘要值才可能相同。也就是说,内容相同、格式不同的文件的信息摘要值一定不相同,内容不相同、格式相同的文件的信息摘要值也一定不相同,内容相同、格式也相同的文件的信息摘要值可能相同,也可能不同。但是,如果两个文件的信息摘要值相同的话,则这两个文件的内容与格式都一定完全相同。例如,以下文字“中国互联网络信息中心在2007年I月23日下午发布第十九次中国互联网发展状况统计调查报告,截止到2006年12月31日,中国的网民总人数为13700万人,与去年同期相比,中国网民总人数一年增加了 2600万人,增长率为23.4%。这说明互联网已经获得了迅猛的发展,成为现在媒介的重要一员”有A与B两种格式的文件,A为图片格式的文件,B为音频格式的文件。A文件与B文件的内容相同,格式不相同,即A为图片格式、B为音频格式,因此,A文件与B文件的信息摘要值一定不相同。
又例如,C文件为图片格式的文件,D文件也为图片格式的文件,其中,C文件的图片中记载的内容为计算机对人类的生产活动和社会活动产生了极其重要的影响,并以强大的生命力飞速发展”,D文件的图片中记载的内容为“主板是电脑中各个部件工作的一个平台,它把电脑的各个部件紧密连接在一起,各个部件通过主板进行数据传输”,C文件与D文件的格式相同,即C文件与D文件都为图片格式,但是所记载的内容不相同,因此,C文件与D文件的信息摘要值一定不相同。又例如,E文件为图片格式的文件,F文件也为图片格式的文件,其中,C文件中记载的内容为“计算机对人类的生产活动和社会活动产生了极其重要的影响,并以强大的生命力飞速发展”,D文件中记载的内容为“计算机对人类的生产活动和社会活动产生了极其重要的影响,并以强大的生命力飞速发展”。E文件与F文件的格式相同,即E文件与F文件都为图片格式,内容也相同,但是,E文件与F文件的信息摘要值也不一定相同,即可能相同,也可能不同。又例如,G文件为图片格式的文件,G文件中记载的内容为“今日的网络,不仅结合了科技,更连接了人类、组织和社会,这表明网络不仅是技术的存在,更是文化的存在”, 如果H文件与G文件的信息摘要值相同,则H文件一定为图片格式的文件,且H文件中记载的内容也一定为“今日的网络,不仅结合了科技,更连接了人类、组织和社会,这表明网络不仅是技术的存在,更是文化的存在”。在本发明的实施例中,将待上传文件的第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配,若目标区域内存在与第一信息摘要值匹配成功的第二信息摘要值,则执行步骤220 ;若目标区域内不存在与第一信息摘要值匹配成功的第二信息摘要值,则允许待上传文件上传至目标区域。另一方面,为了较准确地识别出违规文件,较佳的,根据第一算法得到待上传文件的第一信息摘要值与目标区域内每一个文件的第二信息摘要值,并将采用第一算法得到的第一信息摘要值分别与采用第一算法得到的每一个第二信息摘要值进行匹配,确定采用第一算法得到的第一信息摘要值与目标区域内全部或部分第二信息摘要值未匹配成功时,根据第二算法计算待上传文件的第一信息摘要值和目标区域内第一次未匹配成功的每一个文件的第二信息摘要值,并将根据第二算法得到的待上传文件的第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配。当然,如果存在更多的加密算法,还可以继续叠加执行,以精确地识别出不允许上传的文件。例如,J文件为待上传的文件,K、L、M文件为目标区域内的文件。根据MD5算法分别计算J文件的第一信息摘要值与K、L、M文件的第二信息摘要值,并将采用MD5算法得到的J文件的第一信息摘要值分别与采用MD5算法得到的K、L、M文件的第二信息摘要值进行匹配,其中,采用MD5算法得到的J文件的第一信息摘要值与采用MD5算法得到的K、L、M文件的第二信息摘要值全部未匹配成功,则根据SHAl算法计算J文件的第一信息摘要值和目标区域内第一次未匹配成功的K、L、M文件的第二信息摘要值,并将根据SHAl算法得到的J文件的第一信息摘要值与目标区域内K、L、M文件的第二信息摘要值分别进行匹配。例如,N文件为待上传的文件,0、P、Q文件为目标区域内的文件。根据MD5算法分别计算N文件的第一信息摘要值与O、P、Q文件的第二信息摘要值,并将采用MD5算法得到的N文件的第一信息摘要值分别与采用MD5算法得到的O、P、Q文件的第二信息摘要值进行匹配,其中,采用MD5算法得到的N文件的第一信息摘要值与采用MD5算法得到的O文件的第二信息摘要值匹配成功,与采用MD5算法得到的P、Q文件的第二信息摘要值未匹配成功,则根据SHAl算法计算N文件的第一信息摘要值和目标区域内第一次未匹配成功的P、Q文件的第二信息摘要值,并将根据SHAl算法得到的N文件的第一信息摘要值与目标区域内P、Q文件的第二信息摘要值分别进行匹配。步骤220 :判断与第一信息摘要值匹配成功的第二信息摘要值的文件是否具有预设标记,若是,则执行步骤230 ;否则,将待上传文件上传至目标区域。本发明实施例中,具有预设标记的文件是指包含不良信息的各种格式的文件,其中,不良信息至少可以分为三大类别违反法律的不良信息、违反道德的不良信息与破坏信息安全的不良信息。违反法律的不良信息例如,赌博、犯罪等技能教唆信息;毒品、违禁药品、刀具枪械、监听器、假证件、发票等管制品买卖信息;虚假股票、信用卡、彩票等诈骗信息,以及网络销赃等。 违反道德的不良信息例如,代写论文、代发论文等学术造假、学术腐败信息等。破坏信息安全的不良信息例如,对访问者电脑数据构成安全威胁的含有病毒、木马等闻风险类 目息等。网络管理员确定目标区域内的文件中有包含不良信息的文件时,将包含不良信息的文件进行预设标记。本发明实施例中,在确定目标区域内存在与待上传文件的第一信息摘要值匹配成功的第二信息摘要值的情况下,进一步查看与待上传文件的第一信息摘要值匹配成功的第二信息摘要值的文件是否具有预设标记,若与待上传文件的第一信息摘要值匹配成功的第二信息摘要值的文件具有预设标记,则执行步骤230,若与待上传文件的第一信息摘要值匹配成功的第二信息摘要值的文件无预设标记,则允许待上传的文件上传至目标区域。为了避免由于误操作而导致待上传文件进行上传,较佳的,目标区域的服务器在确定不存在与待上传文件的第一信息摘要值匹配成功的第二信息摘要值,或,服务器在确定存在与待上传文件的第一信息摘要值匹配成功的第二信息摘要值及确定与待上传文件的第一信息摘要值匹配成功的第二信息摘要值的文件不具有预设标记后,客户端会以操作界面的形式提示用户是否确定将待上传文件进行上传,其中,操作界面的选项为“是”与“否”。在用户进一步点击“是”的情况下,将待上传文件进行上传;在用户进一步点击“否”的情况下,禁止待上传文件进行上传。例如,用户A在某论坛中发布一则出售自行车的信息,在上传关于该自行车的图片I时,由于误操作,将图片2进行上传,其中,图片2为一张关于房屋信息的图片。该论坛的服务器在确定不存在与图片2的第一信息摘要值匹配成功的第二信息摘要值后,客户端以操作界面的形式提示用户是否确定将待上传文件进行上传,其中,操作界面的选项为“是”与“否”。在用户A进一步点击“是”的情况下,将图片2进行上传;在用户A进一步点击“否”的情况下,禁止图片2进行上传。步骤230 :禁止待上传文件进行上传。综上所述,本发明实施例中,用户在将违规文件上传时,服务器先确定待上传文件的第一信息摘要值,然后,服务器将第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配,最后,服务器确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,及确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传,这样,用户将不能在同一区域多次上传违规文件,避免了该区域的网络管理员对多次上传的违规文件进行多次删除,减少了人力资源与时间资源的耗费。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种防止违规文件多次上传的方法,其特征在于,包括 确定待上传文件的第一信息摘要值; 将所述第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配;确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,且确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传。
2.如权利要求I所述的方法,其特征在于,所述确定待上传文件的第一信息摘要值,包括 根据摘要算法5MD5计算待上传文件的第一信息摘要值; 或者, 根据安全哈希算法SHAl计算待上传文件的第一信息摘要值。
3.如权利要求2所述的方法,其特征在于,所述确定待上传文件的第一信息摘要值,包括 基于待上传文件包含的全部信息计算第一信息摘要值; 或者, 基于待上传文件包含的部分信息计算第一信息摘要值。
4.如权利要求1、2或3所述的方法,其特征在于,将所述第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配,包括 根据第一算法得到待上传文件的第一信息摘要值与目标区域内每一个文件的第二信息摘要值,并将所述第一信息摘要值分别与每一个第二信息摘要值进行匹配; 确定采用第一算法获得的第一信息摘要值与目标区域内全部或部分文件的第二信息摘要值未匹配成功时,根据第二算法计算待上传文件的第一信息摘要值和目标区域内第一次未匹配成功的每一个文件的第二信息摘要值; 将根据第二算法获得的第一信息摘要值和每一个第二信息摘要值分别进行匹配。
5.如权利要求I所述的方法,其特征在于,还包括 在确定不存在与所述第一信息摘要值匹配成功的第二信息摘要值,或,确定存在与所述第一信息摘要值匹配成功的第二信息摘要值及所述第二信息摘要值的文件不具有预设标记之后,在将待上传文件上传至目标区域之前,向用户呈现确认上传提示界面,并在用户进行确认操作后,执行上传操作。
6.一种防止违规文件多次上传的装置,其特征在于,包括 计算单元,用于确定待上传文件的第一信息摘要值; 匹配单元,用于将所述第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配; 处理单元,用于确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,且确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传。
7.如权利要求6所述的装置,其特征在于,计算单元具体用于 根据摘要算法5MD5计算待上传文件的第一信息摘要值; 或者, 根据安全哈希算法SHAl计算待上传文件的第一信息摘要值。
8.如权利要求7所述的装置,其特征在于,计算单元具体用于基于待上传文件包含的全部信息计算第一信息摘要值; 或者, 基于待上传文件包含的部分信息计算第一信息摘要值。
9.如权利要求6、7或8所述的装置,其特征在于,匹配单元具体用于 根据第一算法得到待上传文件的第一信息摘要值与目标区域内每一个文件的第二信息摘要值,并将所述第一信息摘要值分别与每一个第二信息摘要值进行匹配; 确定采用第一算法获得的第一信息摘要值与目标区域内全部或部分文件的第二信息摘要值未匹配成功时,根据第二算法计算待上传文件的第一信息摘要值和目标区域内第一次未匹配成功的每一个文件的第二信息摘要值; 将根据第二算法获得的第一信息摘要值和每一个第二信息摘要值分别进行匹配。
10.如权利要求6所述的装置,其特征在于,处理单元进一步用于 在确定不存在与所述第一信息摘要值匹配成功的第二信息摘要值,或,确定存在与所述第一信息摘要值匹配成功的第二信息摘要值及所述第二信息摘要值的文件不具有预设标记之后,在将待上传文件进行上传之前,向用户呈现确认上传提示界面,并在用户进行确认操作后,执行上传操作。
全文摘要
本发明涉及数据传输技术,公开了一种防止违规文件多次上传的方法及装置,用以减少删除同一违规文件时耗费的人力资源与时间资源。该方法为用户在上传违规文件时,服务器先确定待上传文件的第一信息摘要值,然后,服务器将第一信息摘要值与目标区域内每一个文件的第二信息摘要值分别进行匹配,最后,服务器确定存在与所述第一信息摘要值匹配成功的第二信息摘要值,及确定所述第二信息摘要值的文件具有预设标记时,禁止待上传文件进行上传,这样,用户将不能在同一区域将同一违规文件多次上传,避免了该区域的网络管理员对多次上传的同一违规文件进行多次删除,减少了删除同一违规文件的人力资源与时间资源的耗费。
文档编号H04L29/08GK102821136SQ201210230049
公开日2012年12月12日 申请日期2012年7月4日 优先权日2012年7月4日
发明者樊家麟, 张弘强, 刘琳璐 申请人:北京小米科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1