一种文件识别方法及装置的制造方法_2

文档序号:9923822阅读:来源:国知局
R 二维码为例来说明:
[0063]I)用户终端会将图片文件进行二值化处理,即将原始图片文件转换成只包含黑白二色的图片文件;其中,
[0064]其中,黑白二色的图片文件中包括:位置探测图形、位置探测图形分隔符、定位图形、校正图形、格式信息、版本信息,数字和纠错码字,以及空白区等特征信息。这些特征具体如图2所示,图2为本发明实施例提供的一种黑白二色的图片文件中包括的特征信息示意图。
[0065]2)判断所述黑白二色的图片文件中是否包括二维码信息;
[0066]该步骤中,可以根据黑白二色的图片文件中的位置探测图形、位置探测图形分隔符和定位图形中来判断是否存在二维码,具体的判断过程对于本领域技术人员来说,已是熟知技术,在此不再赘述。
[0067]3)如果该图片文件中包括二维码信息,则获取所述二维码信息中的数据信息;
[0068]其中,获取所述二维码信息中的数据信息的过程包括:
[0069]通过扫描该二维码信息中的数据段,获得该二维码中的数据信息,然后,将该数据信息转换为文本信息,其具体的转换过程对于本领域技术人员来说,已是熟知技术,在此不再赘述。
[0070]步骤103:判断所述二维码信息中是否包括恶意链接;
[0071]该步骤中,先判断所述二维码信息中的所述文本信息中是否包括链接;如果包括链接,再继续判断所述链接是否为恶意链接,其具体过程包括:
[0072]其中,判断所述二维码信息中的所述文本信息中是否包括链接,具体为:按照所述文本信息中是否包括统一资源定位符URL来判断所述文件信息中是否包括链接;具体包括:
[0073]—种方式为:判断文本信息中是否有以http,https, ftp开头的文本,如果有,贝Ij确定该文本信息中包括URL ;否则,确定该文本信息中没有包括URL。
[0074]另一方式为:判断文本信息中是否有符合URL标准定义开头的文本,比如,文本信息中包含XXX.XX的形式的文本等,如果有,则确定该文本信息中包括URL ;否则,确定该文本信息中没有包括URL。
[0075]其中,判断所述链接是否为恶意链接,具体为:
[0076]—种方式为:判断所述文本信息中的所述URL是否在URL黑白名单来判断所述链接是否为恶意链接;
[0077]这种方式中,如果从文本信息中提取到URL,则判断提取的URL是否在URL黑白名单中,如果在URL白报名单中,则确定所述URL是否为安全(即正常)链接,如果在URL黑名单中,则确定所述URL是否为恶意链接。
[0078]如果从文本信息中没有提取到URL,则确定所述链接为安全链接。
[0079]另一方式为:按照URL评分机制判断所述文本信息中的所述URL是否为恶意链接。
[0080]其中,URL评分机制为:对于非URL黑白名单的URL采用字符评分机制,当达到一定分值的URL则进行黑白灰归类。以仿冒淘宝网为例,例如某个URL为:
[0081]http: //actaobao-1na.com,通过评分系统认定为跟 http://taoba0.com 有一定相似度,会将此URL列为可疑URL,从而将包括URL的链接确定为恶意链接。
[0082]步骤104:如果包括恶意链接,则提示用户删除所述文件。
[0083]在上述步骤确定出该文件包括的URL为恶意链接时,向接收到该文件的用户提醒打开该文件存在风险,建议删除该文件;当然,如果确定该文件中包括的URL为安全链接,就不用提示接收到该文件的用户任何操作。也就是说,确定文件中的URL是否为恶意链接对用户来说是感知不到的。
[0084]本发明实施例中,通过对接收到的图片文件进行安全检查,扫描图片文件中二维码,并且对二维码信息中的恶意的链接进行拦截;防止接收的用户看到或打开文件,降低了用户数据的泄露或财物损失,从而提高了用户数据的安全性。
[0085]还请参阅图3,图3为本发明实施例提供的一种文件识别方法的另一流程图,该实施例与上述实施例的不同之处在于,在接收到文件时,判断所述文件是否为图片文件,如果为图片文件,执行所述获取所述图片文件中的二维码信息的步骤,具体包括:
[0086]步骤301:接收文件;
[0087]步骤302:判断所述文件是否为图片文件,如果是,执行步骤303 ;否则执行步骤307 ;
[0088]其中,可以通过文件的扩展名,或者图片文件头的特殊格式进行判断,其具体的判断过程,对于本领域技术人员来说,已是熟知技术,在此不再赘述。
[0089]步骤303:获取所述图片文件中的二维码信息;
[0090]该步骤中,获取的过程包括:对所述图片文件进行二值化处理,得到黑白二色的图片文件;判断所述黑白二色的图片文件中是否包括二维码信息;如果是,则获取所述二维码信息中的数据信息;将所述数据信息转换为文本信息。其具体的获取过程详见上述实施例中的描述,在此不再赘述。
[0091]步骤304:判断所述二维码信息中是否包括链接;如果是,执行步骤305 ;否则执行步骤307 ;
[0092]该步骤中,扫描二维码信息,得到二维码信息中的数据信息,提取该数据信息,并将该数据信息转换成文本信息,然后判断该文本信息中是否包括统一资源定位符URL,如果包括,确定该来确定该二维码信息中是否包括链接;否则,确定该二维码信息中没有链接;如果没有包括链接,则结束本次流程。
[0093]步骤305:判断所述链接是否为恶意链接,如果是,执行步骤306 ;否则,执行步骤307 ;
[0094]该步骤中,一种判断方式为:判断所述文本信息中的所述URL是否在URL黑白名单中,如果在白名单中,则确定所述链接为安全链接;如果在黑名单中,则确定所述链接为恶意链接;
[0095]另一判断方式为按照URL评分机制判断所述文本信息中的所述URL是否为恶意链接。其具体的判断过程详见上述实施例中的描述,在此不再赘述。
[0096]步骤306:提示用户删除所述文件。
[0097]在该步骤中,在确定该链接为恶意链接时,可以提示用户删除该文件,并对该恶意链接进行拦截,从而防止用户被骗。
[0098]步骤307:结束本次流程。
[0099]也就是说,如果图片文件中的链接不是恶意链接,说明该图片文件为正常的图片文件,用户可以看到或打开文件。
[0100]本发明实施例中,通过对接收到的图片文件进行安全检查,扫描图片文件中二维码,并且对二维码信息中的恶意的链接进行扫描和拦截,防止不法分子通过IM软件传播带有恶意链接二维码的图片文件,骗取受害人点击,达到获取用户敏感信息以及钱财的行为。从而提高了用户数据的安全性。
[0101]基于上述方法的实现过程,本发明实施例还提供一种文件识别装置,其结构示意图如图4所示,所述装置包括:接收单元41,获取单元42,第一判断单元43和提示单元44,其中,
[0102]所述接收单元41,用于接收文件;
[0103]所述获取单元42,用于在所述接收单元41接收到的所述文件为图片文件时,获取所述图片文件中的二维码信息;
[0104]所述第一判断单元43,用于判断所述获取单元42获取的所述二维码信息中是否包括恶意链接;
[0105]所述提示单元44,用于在所述第一判断单元43判断所述二维码信息中包括恶意链接时,提示用户删除所述文件。
[0106]可选的,在另一实施例中,该实施例在上述实施例的基础上,所述获取单元42包括:二值化处理单元51,第二判断单元52,提取单元53和转换单元54,其结构示意图如图5所示,其中,
[0107]所述二值化处理单元51,用于对所述图片文件进行二值化处理,得到黑白二色的图片文件;
[0108]所述第二判断单元52,用于判断所述黑白二色的图片文件中是否包括二维码信息;
[0109]所述提取单元53,用于在所述第二单元判断所述黑白二色的图片文件中包括二维码信息时,提取所述二维码信息中的数据信息;
[0110]所述转换单元54,用于将所述数据信息转换为文本信息。
[0111]可选的,在另一实施例中,该实施例在上述实施例的基础上,所述第一判断单元43包括:链接判断单元61和恶意链接判断单元62,其结构示意图如图6所示,其中,
[0112]其中,所述链接判断单元61,用于判断所述转换单元转换得到的所述文本信息中是否包括链接;
[0113]所述恶意链接判断单元62,用于在所述链接判断单元61判断所述文本信息中包括链接时,继续判断所述链接是否为恶意链接。
[0114]其中,所述链接判断单元61,具体用于按照所述文本信息中是否包括统一资源定位符URL来判断所述文件信息中是否包括链接;
[0115]所述恶意链接判断单
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1