一种文档格式文件的转换方法_2

文档序号:9471346阅读:来源:国知局
述文件的格式是否为文档格式;
[0032]步骤S300:对所述文档格式文件进行初始化处理;
[0033]步骤S400:将所述文档格式文件发送给文档转换节点;
[0034]步骤S500:对所述文档格式文件进行格式转换处理。
[0035]根据本发明较佳实施例,所述文档格式判断方法为根据文件后缀名进行判断。所述文档格式文件的后缀名包括PPt文件、word文件、excel文件、pdf文件以及系统所支持的文档文件所对应的文件后缀名。当文件的后缀名属于上述支持的文档文件后缀名其中之一时,判断其为文档格式文件。例如,当文件后缀名为.doc或者.docx时,判断其为word文件。
[0036]进一步的,当所述文件为多媒体格式时,将其发送给多媒体转换节点进行格式转换。根据文件的后缀名,当出现图片格式或者音视频格式的后缀名时,判断其属于多媒体格式文件,例如当所述文件的后缀名为JPG、GIF或BMP时,判断其为图片格式文件,当所述文件的后缀名为MP3、MP4或ASF时,判断其为音视频格式文件。此外,当所述文件的后缀名不属于系统支持的文档格式或多媒体格式时,判断其为非法文件并通知服务器。
[0037]根据本发明较佳实施例,所述文档格式文件的初始化处理为判断所述文件是否为加密文件或非法文件,并计算所述文档格式文件的页数。当所述文档格式文件的页数为O时,将其标注为空文件并通知服务器。所述判断文件是否为非法文件为判断文件格式是否和其后缀名对应的文件格式一致,当出现不一致的情况时判断其为非法文件并通知服务器。当判断所述文件为加密文件时,同样通知服务器无法处理。
[0038]根据本发明较佳实施例,所述文档转换节点包括无PPT文件转换子任务的第一文档转换节点和有PPT文件转换子任务的第二文档转换节点。由于PPT文件格式转换任务对服务器的处理负担较大,转换速度较慢,按照P2P节点服务器是否已经有PPT文件转换子任务来将其区分为第一文档转换节点和第二文档转换节点,以便优先给较为空闲剩余处理能力较高的第一文档转换节点分配转换子任务,而已经具有PPT转换子任务的第二文档转换节点尽量不分或者少分新的转换子任务,以便减少新的转换子任务的处理等待时间,从而提高转换效率。
[0039]所述文档文件格式转换子任务根据文件总页数、第一文档转换节点和第二文档转换节点的数量关系,并按照以下原则进行分配:
[0040]当所述文档格式文件的总页数小于所述第一文档转换节点总数时,将所述文档格式文件的每一页按照节点次序依次分配给所述每个第一文档转换节点。在这种情况下,由于第一文档转换节点较多,可以不将转换子任务分配给第二文档转换节点,而排序在后的第一文档转换节点也可能分配不到转换子任务,通过较为空闲剩余处理能力较高的第一文档转换节点来处理每一页的文档格式转换子任务,可以提高转换效率,加快转换速度,减少用户等待时间,提升用户体验。
[0041]当所述文档格式文件的总页数大于所述第一文档转换节点总数,同时满足(Ll*2+L2) ^ P的条件时,将所述每个第一文档转换节点按照节点次序依次分配两页文档格式文件,所述每个第二文档转换节点按照节点次序依次分配一页文档格式文件,并且优先分配所述每个第一文档转换节点的转换子任务,其中LI表示第一文档转换节点总数,L2表示第二文档转换节点总数,P表示文档格式文件的总页数。在这种情况下,优先给每个第一文档转换节点分配两页文件转换子任务,剩余页数分配给第二文档转换节点,每个第二文档转换节点只分配一页转换子任务。任务分配是按照节点次序进行的,因此排序较后的第二文档转换节点可能不会分配转换子任务,同时当第一文档转换节点数量较多时,可能第二转换节点都不用分配转换子任务,甚至排序较后的第一文档转换节点也不用分配转换子任务,当出现总页数为奇数页时,后续一个第一文档转换节点只分配一页转换子任务,举例来说,当需要进行文档格式转换的文件总页数为49页,第一文档转换节点的数量为30个,第二文档转换节点的数据为10个,转换子任务按照如下原则进行分配:排序为前24个的第一文档转换节点按照节点次序依次分配2页转换子任务,第25个第一文档转换节点分配I页转换子任务,其余第一文档转换节点和第二文档转换节点不分配转换子任务。
[0042]当所述文档格式文件的总页数大于所述第一文档转换节点总数,同时所述第二文档转换节点数量为O时,所述文档格式文件的总页数平均分配给所述每个第一文档转换节点总数。在这种情况下,全部节点都为第一文档转换节点,将文档格式文件的总页数除以节点总数,若出现无法整除的情况时,采用小数点后舍弃的方式处理,例如当文档文件总页数为100页,第一文档转换节点总数为30个,第二文档转换节点数量为0,计算100/30 =
3.33,将3.33自动计算为3,即每个节点首先分配3页转换子任务,因此首先将每个第一文档转换节点分配3页转换子任务,剩余的10页转换子任务按照节点次序依次分配给前10个第一文档转换节点。
[0043]当所述文档格式文件的总页数大于所述第一文档转换节点总数,同时满足(Ll*2+L2) < P的条件,并且第二文档转换节点数量不为O时,所述第一文档转换节点中每个节点分配2n页文件,所述第二文档转换节点中每个节点分配η页文件,剩余的页数按照节点次序依次分配给第一文档转换节点,若还有多余的页数则按照节点次序依次分配给第二文档转换节点,其中LI表示第一文档转换节点总数,L2表示第二文档转换节点总数,P表示文档格式文件的总页数。在这种情况下,将需要进行格式转换的文档文件总页数除以(Ll*2+L2),将计算结果舍弃小数点后进行分配,举例来说,当需要进行文档格式转换的文件总页数为110页,第一文档转换节点数量为20个,第二文档转换节点为10个,计算110/50 = 2.2,取η = 2,即每个第一文档转换节点首先分配4页转换子任务,每个第二文档转换节点首先分配2页转换子任务,剩余10页转换子任务按照节点次序依次分配给前十个第一文档转换节点。
[0044]当分配有转换子任务的文档转换节点离开时,取出其被分配的全部转换子任务,然后遍历所有文档转换节点,将每个转换子任务按照顺序依次分配给当前没有转换子任务的节点服务器进行处理,如果当前所有文档转换节点都有转换子任务在处理中,则将第一个转换子任务分配给排序最前的文档转换节点,之后再次遍历所有文档转换节点,按照上述规则继续分配第二个转换子任务,直至所有取出的转换子任务全部分配完毕。
[0045]所述文档转换节点为P2P网络中的节点服务器。同时,所述文档转换节点服务器也可以采用自己部署的多台服务器或者虚拟机进行处理,所述多台服务器或者虚拟机组成服务器集群对文件格式转换子任务进行分发处理,服务提供商采用自己部署的服务器或者虚拟机能够增强转换服务的稳定性。
[0046]根据本发明较佳实施例,所述对文档格式文件进行格式转换处理为将所述文档格式文件转换为SWF格式文件或者html5格式文件。
[0047]SffF是一种基于矢量的Flash动画文件,一般用FLASH软件创作并生成SWF文件格式,也可以通过相应软件将doc、ppt、P
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1