一种获取文件类型的处理方法及装置与流程

文档序号:11133990阅读:207来源:国知局
一种获取文件类型的处理方法及装置与制造工艺

本发明实施例涉及文件处理技术领域,尤其涉及一种获取文件类型的处理方法及装置。



背景技术:

随着科学技术的不断发展,用户对网络的依赖程度越来越高,并经常通过网络下载文件。为了保证存储在本地的文件类型的正确性,进而可以调用相应的软件打开文件,需要对文件类型进行准确识别。

在实现本发明实施例的过程中,发明人发现现有的服务器中的文件资源在上传时,文件名后缀是手动输入的,或者文件资源上传时使用了默认的文件名后缀,因而服务器中记载的文件名后缀并不准确。现有的文件类型识别方法中,在文件下载时,服务器为下载文件添加文件名,然而服务器返回的文件名常常会出现错误,本地通过服务器返回的文件名中的文件名后缀确定的文件类型也会错误。



技术实现要素:

本发明实施例提供一种获取文件类型的处理方法及装置,用以解决现有技术中无法准确获取文件类型的缺陷。

本发明实施例提供一种获取文件类型的处理方法,包括:

发送待下载文件的下载请求后,接收返回的所述待下载文件的URL地址;

根据所述URL地址解析获得所述待下载文件的文件名后缀信息;

根据所述文件名后缀信息确定所述待下载文件的文件类型。

可选地,所述根据所述文件名后缀信息确定所述待下载文件的文件类型包括:

在预存的文件类型统计表中,若查找到与所述文件名后缀信息对应的目标文件类型,则将所述待下载文件的文件类型确定为所述目标文件类型。

可选地,所述方法还包括:

在预存的文件类型统计表中,若未查找到与所述文件名后缀信息对应的目标文件类型,则向浏览器内核发送文件类型获取请求;

接收所述浏览器内核返回的所述待下载文件的文件类型。

可选地,所述方法还包括:

若所述浏览器内核返回的所述待下载文件的文件类型为空,则以所述服务器发送的所述待下载文件的文件名后缀信息确定所述待下载文件的文件类型。

可选地,所述方法还包括:

若所述服务器返回的所述待下载文件的文件类型为空,则获取所述待下载文件的文件头信息,根据所述文件头信息确定所待下载文件的文件类型。

本发明实施例提供一种获取文件类型的处理装置,包括:

URL地址获取单元,用于发送待下载文件的下载请求后,接收返回的所述待下载文件的URL地址;

文件名后缀获取单元,用于根据所述URL地址解析获得所述待下载文件的文件名后缀信息;

第一文件类型确定单元,用于根据所述文件名后缀信息确定所述待下载文件的文件类型。

可选地,所述文件类型确定单元,进一步用于当在预存的文件类型统计表中查找到与所述文件名后缀信息对应的目标文件类型时,则将所述待下载文件的文件类型确定为所述目标文件类型。

可选地,该获取文件类型的处理装置还包括:

第二文件类型确定单元,用于当在预存的文件类型统计表中未查找到与所述文件名后缀信息对应的目标文件类型时,则向浏览器内核发送文件类型获取请求;接收所述浏览器内核返回的所述待下载文件的文件类型。

可选地,该获取文件类型的处理装置还包括:

第三文件类型确定单元,用于当所述浏览器内核返回的所述待下载文件的文件类型为空时,则以所述服务器发送的所述待下载文件的文件名后缀信息确定所述待下载文件的文件类型。

可选地,该获取文件类型的处理装置还包括:

第四文件类型确定单元,用于当所述服务器返回的所述待下载文件的文件类型为空时,则获取所述待下载文件的文件头信息,根据所述文件头信息确定所待下载文件的文件类型。

本发明实施例提供的获取文件类型的处理方法及装置,在下载待下载文件时,接收服务器返回的待下载文件的URL地址;根据所述URL地址解析获得待下载文件的文件名后缀信息;根据所述文件名后缀信息确定待下载文件的文件类型,避免了现有技术中单纯依靠服务器返回的文件名确定文件类型造成的错误,提高了文件类型获取的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例的获取文件类型处理方法的流程图;

图2为本发明另一个实施例的获取文件类型处理方法的流程图;

图3为本发明实施例的获取文件类型处理装置的结构示意图;

图4为本发明实施例的获取文件类型处理装置的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例的获取文件类型处理方法的流程图。如图1所示,本发明实施例的获取文件类型处理方法包括:

S11:发送待下载文件的下载请求后,接收返回的所述待下载文件的URL地址;

其中,本地向服务器发送待下载文件的下载请求后,会接收服务器返回的待下载文件的URL(Uniform Resource Locator,统一资源定位符)。一个完整的URL包括以下几部分:(1)协议部分:如Http、Ftp等;(2)域名部分;(3)端口部分,跟在域名后面的是端口,域名和端口之间使用“:”作为分隔符;(4)虚拟目录部分:从域名后的第一个“/”开始到最后一个“/”为止,是虚拟目录部分;(5)文件名部分;(6)锚部分,从“#”开始到最后,都是锚部分;(7)参数部分,从“?”开始到“#”之间的部分为参数部分。

举例来说,本地接收到的待下载文件的URL为“http://wenku.baidu.com:8080/view/index.asp?boardID=5&ID=24618&page=1#n ame”,该URL分为7个部分:其中,“http”为协议部分;“wenku.baidu.com”为域名部分;“8080”为端口部分;“view”为虚拟目录部分;“index.asp”为文件名部分;“name”为锚部分;“boardID=5&ID=24618&page=1”为参数部分。

S12:根据所述URL地址解析获得所述待下载文件的文件名后缀信息;

S13:根据所述文件名后缀信息确定所述待下载文件的文件类型。

在实际应用中,从域名后的最后一个“/”开始到“?”为止,是文件名部分,如果没有“?”,则是从域名后的最后一个“/”开始到“#”为止,是文件名部分,如果没有“?”和“#”,那么从域名后的最后一个“/”开始到结束,都是文件名部分。

可以理解的是,下载文件的文件类型可以根据文件名后缀进行识别,如word文件的文件名后缀为“.doc”。

本发明实施例提供的获取文件类型的处理方法,在下载待下载文件时,接收服务器返回的待下载文件的URL地址;根据所述URL地址解析获得待下载文件的文件名后缀信息;根据所述文件名后缀信息确定待下载文件的文件类型,避免了现有技术中单纯依靠服务器返回的文件名确定文件类型造成的错误,提高了文件类型获取的准确性。

图2为本发明另一个实施例的获取文件类型处理方法的流程图。如图2所示,本发明实施例的获取文件类型处理方法包括:

S21:发送待下载文件的下载请求后,接收返回的所述待下载文件的URL地址。

S22:在预存的文件类型统计表中,若查找到与所述文件名后缀信息对应的目标文件类型,则将所述待下载文件的文件类型确定为所述目标文件类型;

在实际应用中,可以将文件名后缀与文件类型进行对应建立文件类型统计表,文件类型统计表保存在本地,通过在文件类型统计表中查找与所述文件名后缀信息对应的目标文件类型,确定待下载文件的文件类型。

S23:在预存的文件类型统计表中,若未查找到与所述文件名后缀信息对应的目标文件类型,则向浏览器内核发送文件类型获取请求;

接收所述浏览器内核返回的所述待下载文件的文件类型;

需要说明的是,通过下载文件的URL地址无法确定文件类型时,需要向浏览器内核发送文件类型获取请求。浏览器与网页服务器建立网络连接,当连接成功时,浏览器内核可以向其发送Http协议的文件类型获取请求,服务器在接受到请求后,向浏览器返回Http协议格式的数据,浏览器内核解析该数据获取待下载文件的文件类型。

S24:若所述浏览器内核返回的所述待下载文件的文件类型为空,则以所述服务器发送的所述待下载文件的文件名后缀信息确定所述待下载文件的文件类型;

在实际应用中,通过浏览器内核无法获取待下载文件的文件类型时,则根据服务器返回的文件名后缀信息在预存的文件类型统计表中,查找与所述文件名后缀信息对应的目标文件类型,若查找到,则将所述待下载文件的文件类型确定为所述目标文件类型。

S25:若所述服务器返回的所述待下载文件的文件类型为空,则获取所述待下载文件的文件头信息,根据所述文件头信息确定所待下载文件的文件类型;

需要说明的是,待下载文件的文件头信息在文件下载完毕后才能获取到,本发明实施例的获取文件类型处理方法,在通过URL地址、浏览器内核、服务器返回的信息都无法获取正确的文件类型时,采用文件头信息确定文件类型,避免了现有技术中单纯依靠服务器返回的文件名确定文件类型造成的错误,提高了文件类型获取的准确性。

图3为本发明实施例的获取文件类型处理装置的结构示意图。如图3所示,本发明实施例的获取文件类型处理装置包括:URL地址获取单元31、文件名后缀获取单元32和第一文件类型确定单元33;具体地:

URL地址获取单元31,用于发送待下载文件的下载请求后,接收返回的所述待下载文件的URL地址;

文件名后缀获取单元32,用于根据所述URL地址解析获得所述待下载文件的文件名后缀信息;

第一文件类型确定单元33,用于根据所述文件名后缀信息确定所述待下载文件的文件类型。

本发明实施例的获取文件类型的处理装置,URL地址获取单元31向服务器发送待下载文件的下载请求后,接收所述服务器返回的所述待下载文件的URL地址;文件名后缀获取单元32根据所述URL地址解析获得所述待下载文件的文件名后缀信息;第一文件类型确定单元33根据所述文件名后缀信息确定所述待下载文件的文件类型。

本发明实施例的获取文件类型的处理装置,在下载待下载文件时,接收服务器返回的待下载文件的URL地址;根据所述URL地址解析获得待下载文件的文件名后缀信息;根据所述文件名后缀信息确定待下载文件的文件类型,避免了现有技术中单纯依靠服务器返回的文件名确定文件类型造成的错误,提高了文件类型获取的准确性。

在一种可选的实施方式中,文件类型确定单元33,进一步用于当在预存的文件类型统计表中查找到与所述文件名后缀信息对应的目标文件类型时,则将所述待下载文件的文件类型确定为所述目标文件类型。

该发明实施例的获取文件类型的处理装置还包括:

第二文件类型确定单元,用于当在预存的文件类型统计表中未查找到与所述文件名后缀信息对应的目标文件类型时,则向浏览器内核发送文件类型获取请求;接收所述浏览器内核返回的所述待下载文件的文件类型。

进一步地,该发明实施例的获取文件类型的处理装置还包括:

第三文件类型确定单元,用于当所述浏览器内核返回的所述待下载文件的文件类型为空时,则以所述服务器发送的所述待下载文件的文件名后缀信息确定所述待下载文件的文件类型。

该发明实施例的获取文件类型的处理装置还包括:

第四文件类型确定单元,用于当所述服务器返回的所述待下载文件的文件类型为空时,则获取所述待下载文件的文件头信息,根据所述文件头信息确定所待下载文件的文件类型。

本发明实施例所述的获取文件类型的处理装置可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。

图4为本发明实施例的获取文件类型的处理装置的实体结构示意图。如图4所示,该获取文件类型的处理装置包括:

处理器(processor)41、存储器(memory)42和总线43,其中,处理器41和存储器42通过总线43完成相互间的通信。处理器41可以调用存储器42中的逻辑指令,以执行如下方法:

发送待下载文件的下载请求后,接收返回的所述待下载文件的URL地址;

根据所述URL地址解析获得所述待下载文件的文件名后缀信息;

根据所述文件名后缀信息确定所述待下载文件的文件类型。

在一种可选的实施方式中,所述根据所述文件名后缀信息确定所述待下载文件的文件类型包括:

在预存的文件类型统计表中,若查找到与所述文件名后缀信息对应的目标文件类型,则将所述待下载文件的文件类型确定为所述目标文件类型。

进一步地,所述方法还包括:

在预存的文件类型统计表中,若未查找到与所述文件名后缀信息对应的目标文件类型,则向浏览器内核发送文件类型获取请求;

接收所述浏览器内核返回的所述待下载文件的文件类型。

该方法还包括:若所述浏览器内核返回的所述待下载文件的文件类型为空,则以所述服务器发送的所述待下载文件的文件名后缀信息确定所述待下载文件的文件类型。

该方法还包括:若所述服务器返回的所述待下载文件的文件类型为空,则获取所述待下载文件的文件头信息,根据所述文件头信息确定所待下载文件的文件类型。

此外,上述的存储器42中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例提供的获取文件类型的处理方法及装置,在下载待下载文件时,接收服务器返回的待下载文件的URL地址;根据所述URL地址解析获得待下载文件的文件名后缀信息;根据所述文件名后缀信息确定待下载文件的文件类型,避免了现有技术中单纯依靠服务器返回的文件名确定文件类型造成的错误,提高了文件类型获取的准确性。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1