一种文件识别方法及装置的制造方法

文档序号:9923822阅读:285来源:国知局
一种文件识别方法及装置的制造方法
【技术领域】
[0001]本发明涉及数据传输技术领域,特别涉及一种文件识别方法及装置。
【背景技术】
[0002]目前,即时通信(IM,InstanceMessaging)客户端软件都具备有文件传输功能。随着网络的快速普及,不法分子利用文件传输的功能进行远程攻击,其过程为:
[0003]假如用户A有一个骗取用户密码的链接IinkA(例如,该链接可能与某网银bankA的网站相似,称为恶意链接),把该链接IinkA生成一个二维码图片,用户A通过頂软件将该二维码图片文件发给用户B,诱导用户B使用手机扫描这个二维码图片,并输入用户B的用户名和密码;而用户A在自己IinkA网站的后端就可以获取到用户B在网银bankA的用户名和密码,之后,用户A使用用户B的网银用户名和密码登陆并将用户B的余额转入自己的账号里。
[0004]由此可知,现有的頂客户端软件对于文件传输完全透明,没有针对传输的图片文件进行额外的处理,因此,任何包含恶意链接的二维码图片都能到达接收方,导致接收到这类二维码图片的用户都存在被攻击的风险,比如用户信息被盗取或财务损失等。
[0005]因此,本发明的发明人发现,由于现有技术中不能识别二维码图片中是否含有恶意链接,从而导致IM软件用户数据信息安全性降低的问题。

【发明内容】

[0006]本发明实施例中提供了一种文件识别方法及装置,以解决现有技术中由于不能识别二维码图片中是否含有恶意链接,而导致用户数据信息安全性降低的技术问题。
[0007]为了解决上述技术问题,本发明实施例公开了如下技术方案:
[0008]第一方面提供了一种文件识别方法,包括:
[0009]接收文件;
[0010]如果所述文件为图片文件,则获取所述图片文件中的二维码信息;
[0011]判断所述二维码信息中是否包括恶意链接;
[0012]如果包括恶意链接,则提示用户删除所述文件。
[0013]可选的,所述获取所述图片文件中的二维码信息,包括:
[0014]对所述图片文件进行二值化处理,得到黑白二色的图片文件;
[0015]判断所述黑白二色的图片文件中是否包括二维码信息;
[0016]如果包括二维码信息,则提取所述二维码信息中的数据信息;
[0017]将所述数据信息转换为文本信息。
[0018]可选的,所述判断所述二维码信息中是否包括恶意链接,包括:
[0019]判断所述文本信息中是否包括链接;
[0020]如果包括链接,继续判断所述链接是否为恶意链接。
[0021]可选的,所述判断所述二维码信息中是否包括链接,包括:判断所述文本信息中是否包括统一资源定位符URL来确定所述文件信息中是否包括链接;
[0022]所述判断所述链接是否为恶意链接,包括:判断所述文本信息中的所述URL是否在URL黑白名单来判断所述链接是否为恶意链接;或者按照URL评分机制判断所述文本信息中的所述URL是否为恶意链接。
[0023]可选的,还包括:
[0024]在接收文件时,判断所述文件是否为图片文件,如果为图片文件,执行所述获取所述图片文件中的二维码信息的步骤。
[0025]第二方面提供了一种文件识别装置,包括:
[0026]接收单元,用于接收文件;
[0027]获取单元,用于在所述接收单元接收到的所述文件为图片文件时,获取所述图片文件中的二维码信息;
[0028]第一判断单元,用于判断所述二维码信息中是否包括恶意链接;
[0029]提示单元,用于在所述第一判断单元判断所述二维码信息中包括恶意链接时,提示用户删除所述文件。
[0030]可选的,所述获取单元包括:
[0031]二值化处理单元,用于对所述图片文件进行二值化处理,得到黑白二色的图片文件;
[0032]第二判断单元,用于判断所述黑白二色的图片文件中是否包括二维码信息;
[0033]提取单元,用于在所述第二单元判断所述黑白二色的图片文件中包括二维码信息时,提取所述二维码信息中的数据信息;
[0034]转换单元,用于将所述数据信息转换为文本信息。
[0035]可选的,所述第一判断单元包括:
[0036]链接判断单元,用于判断所述转换单元转换得到的所述文本信息中是否包括链接;
[0037]恶意链接判断单元,用于在所述链接判断单元判断所述文本信息中包括链接时,继续判断所述链接是否为恶意链接。
[0038]可选的,所述链接判断单元,具体用于判断所述文本信息中是否包括统一资源定位符URL来确定所述文件信息中是否包括链接;
[0039]所述恶意链接判断单元,具体用于按照URL黑白名单或URL评分机制判断所述文本信息中的所述URL是否为恶意链接。
[0040]可选的,还包括:
[0041]第三判断单元,用于在所述接收单元接收到文件时,判断所述文件是否为图片文件;
[0042]所述获取单元,还用于在所述第三判断单元判断所述文件为图片文件时,获取所述图片文件中的二维码信息。
[0043]由上述技术方案可知,本发明实施例中,通过对接收到的图片文件进行安全检查,扫描图片文件中二维码,并且对二维码信息中的恶意的链接进行拦截;防止接收的用户看到或打开文件,降低了用户数据的泄露或财物损失,从而提高了用户数据的安全性。
【附图说明】
[0044]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1为本发明实施例提供的一种文件识别方法的流程图;
[0046]图2为本发明实施例提供的一种黑白二色的图片文件中包括的特征信息示意图;
[0047]图3为本发明实施例提供的一种文件识别方法的另一流程图;
[0048]图4为本发明实施例提供的一种文件识别装置的结构示意图;
[0049]图5为本发明实施例提供的一种文件识别装置的另一结构示意图;
[0050]图6为本发明实施例提供的一种文件识别装置的另一结构示意图;
[0051]图7为本发明实施例提供的一种文件识别装置的另一结构示意图;
[0052]图8为本发明实施例提供的一种终端的结构示意图。
【具体实施方式】
[0053]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054]在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0055]应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一信息也可以被称为第二信息,不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0056]请参阅图1,图1为本发明实施例提供的一种文件识别方法的流程图;所述方法包括:
[0057]步骤101:接收文件;
[0058]该步骤中,用户终端接收到的文件可能是图片文件,也可能是文本文件等。其中,本实施例中的用户终端,也可以是集成有IM软件客户端软件的用户终端,也可以是其他终端,本实施例不作限制。
[0059]步骤102:如果所述文件为图片文件,则获取所述图片文件中的二维码信息;
[0060]其中,获取所述图片文件中的二维码信息的过程,包括:
[0061]用户终端对所述图片文件进行二值化处理,得到黑白二色的图片文件;
[0062]以Q
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1