投标文件PDF格式化自动整合的方法与流程

文档序号:31526002发布日期:2022-09-14 14:19阅读:99来源:国知局
投标文件PDF格式化自动整合的方法与流程
投标文件pdf格式化自动整合的方法
技术领域
1.本发明涉及对文件进行pdf格式化整合的方法,尤其是一种投标文件pdf格式化自动整合的方法,属于电子招投标技术领域。


背景技术:

2.传统的招投标是指采购人或者招标机构事先提出货物、工程或服务采购的条件和要求,并邀请众多投标单位参加投标,然后按照规章程序从中选择交易对象的一种市场交易行为。招标与投标是相互对应的范畴,也是相互对应的存在,而电子招投标是基于互联网技术对招投标数据进行采集处理,并按照招投标规定和流程完成在线招标投标活动。随着计算机网络技术的不断发展,电子招投标服务的应用也越来越广,通过在计算机和网络上完成招标投标的整个过程,亦即在线完成招标、投标、开标、评标、定标等全部活动。在投标过程中,由于pdf不仅能够保存文档格式、保留文档字体、方便编辑以及不受其它线条的干扰,还具有存储量小,传输方便,不会因为版本不同而破坏文件内容等优点,所以通常会将收集到的投标文件进行格式转化为pdf的处理。
3.然而,现有的操作方式是在投标文件制作过程中,通过人为执行将不同类型的多个文件复制到word中组合成一份文档,再通过第三方软件进行格式转换为pdf。由于投标文件中包含的内容较多且所需的编制要求高,当前这种操作方式不仅繁琐、可编辑性差,还容易出现整合后文件的内容遗漏等问题,给企业的投标工作带来不利影响。所以,有必要对上述的操作方式进行改进。


技术实现要素:

4.本发明的目的就是为了解决上述问题,提供一种投标文件pdf格式化自动整合的方法,用以改善原有投标文件格式转换繁琐、编辑性差的缺陷,避免整合后文件的内容遗漏,保证企业投标工作的顺利进行。
5.本发明的技术解决方案是:投标文件pdf格式化自动整合的方法,其特点是,包括以下步骤:(1)预先完成投标文件的节点信息编辑,由计算机系统获取所有需合并的投标文件列表,通过智能化识别技术判断文件的拓展名识别文件区分不同的文件类型,分别用不同的方式转换成pdf判断各个投标文件的格式,对非pdf格式的投标文件先进行转换,即生成对应的pdf投标文件;若出现部分不支持的格式则系统提示转换异常或文档错误,提示信息会直接反馈至投标人进行重新制作与上传。
6.(2)根据(1)中的投标文件节点名称,按需生成目录页面的pdf初始文件,所述pdf初始文件生成文章目录、页眉及页脚并与其行文之间保持上下位关系。
7.(3)将(2)中所有投标文件的路径、节点名称信息拼接生成为xml文件,并输出到对应的投标工程文件路径后,判断其是否显示页码、水印及超链接。
8.(4)通过设置生成文件的默认字体等基础信息,设置其是否显示页码、水印或者超
链接,若文件设置中需要显示水印,则根据投标工程文件的水印图片路径进行绘制复现,从而转换生成pdf中间文件作为目标文件。
9.(5)遍历需合并的所有文件,通过投标工程文件路径读取文件,将遍历每一页内容复制到pdf中间文件中。
10.(6)通过获取pdf中间文件中每一页的rotation顺序,得到每一页纸张长与宽的两个边长长度,用以完成目标pdf文件每一页的页宽和页高的重置,避免按首页宽高合并所造成的信息丢失,完成投标文件的pdf格式化自动整合调整,得到pdf预览终文件,能够通过用户界面进行显示处理。
11.进一步地,上述的投标文件pdf格式化自动整合的方法,其中:投标文件包括投标的内容文件与政府采购响应性文件,对应所需系统识别投标的内容文件的类型为html、doc、docx、jpg、pgn、xml、zip、13jt及jxjt文件类型;所需系统识别政府采购响应性文件的类型为html、doc、docx、xls及xlsx文件类型。
12.具体地,投标的内容文件由封面、商务标封面、开标一览表与投标函及投标函附录、法定代表人身份证明、授权委托书、投标保证金、已标价工程量清单、项目管理机构、资格审查资料、施工组织设计技术标及其它材料组成,其中封面、商务标封面、开标一览表与投标函及投标函附录、法定代表人身份证明及授权委托书采用html、doc及docx可识别文件类型;投标保证金、项目管理机构采用html、doc、docx、jpg及pgn可识别文件类型;资格审查资料、施工组织设计技术标及其它材料采用doc、docx可识别文件类型;已标价工程量清单采用xml、zip、13jt及jxjt可识别文件类型。
13.具体地,政府采购响应性文件由资格性审查响应对照表、实质性要求与条件响应对照表、资格与资信证明文件要求、报价表、产品配置与分项报价表、技术参数响应与偏离表、商务条款响应与偏离表、技术标方案、培训计划及服务承诺组成,其中资格性审查响应对照表、实质性要求与条件响应对照表、资格与资信证明文件要求采用html、doc、docx可识别文件类型;产品配置与分项报价表、技术参数响应与偏离表、商务条款响应与偏离表、技术标方案、培训计划及服务承诺采用doc、docx可识别文件类型;报价表采用doc、xls、xlsx可识别文件类型。
14.进一步地,上述的投标文件pdf格式化自动整合的方法,其中:所述预先完成投标文件的节点信息分散在每个文档节点中,用以避免由于文件中的错误内容导致所有pdf重新转换,例如:出现错字、错误排版等。
15.更进一步地,上述的投标文件pdf格式化自动整合的方法,其中:所述xml文件生成所需的拼接字符串选择使用stringbuffer或stringbuilder,拼接好后的实体信息写入文件即可。
16.再进一步地,上述的投标文件pdf格式化自动整合的方法,其中:当读取的文件含有图片时,需根据识别的图片尺寸判断是否对其进行分页处理。
17.如此,采用本发明技术方案,将根据任务量接收上传的多个投标文件存储至服务文件夹,针对服务文件夹内不同类型的投标文件进行整合,通过应用智能化识别技术,在投标文件制作过程中的不同节点上,将各类投标文件转换为能够被计算机程序所识别的统一节点信息,系统对上传信息进行有效识别,判断出识别结果后将不同格式的信息转化为系统所支持展示的相同格式。
18.与现有技术相比,采用本发明技术方案之后,通过智能化识别技术将用户上传的各类文件转换为可被计算机程序所识别的统一节点信息,从而在投标文件制作过程中直接将对应文件的格式进行转化,实现了对投标文件的防泄密保护作用;而且,用户无需因为格式调整的问题选择第三方平台或其它软件进行二次或者二次以上的格式修整,避免整合文件中信息丢失、内容出现泄露等问题导致废标,有效保护了投标文件的完整性与安全性,避免给企业的投标工作带来不利影响。
附图说明
19.图1为本发明投标文件pdf格式化自动整合的方法的流程示意图。
具体实施方式
20.下面结合具体实施例进一步阐述本发明技术方案,以使其更易于理解和掌握。以下描述用于揭露本发明以使本领域技术人员能够实现本发明。需要说明的是,所描述的实施例是本发明的一部分实施例,而不是全部的实施例,且以下描述中的优选实施例只作为举例,本领域技术人员可以想到其它显而易见的变型。
21.为使本发明的目的、技术方案和技术效果更加清楚,下面将结合附图与实施例对本发明作进一步地详细描述。
22.如图1所示,本发明提供的一种投标文件pdf格式化自动整合的方法,将根据任务量接收上传的多个投标文件存储至服务文件夹,针对服务文件夹内不同类型的投标文件进行整合,通过应用智能化识别技术,例如:ocr识别技术,在投标文件制作过程中的不同节点上,将各类投标文件转换为能够被计算机程序所识别的统一节点信息,系统对上传信息进行有效识别,判断出识别结果后将不同格式的信息转化为系统所支持展示的相同格式。
23.具体实施例1(1)由计算机系统获取所有需合并的投标文件列表,通过智能化识别技术判断文件的拓展名识别文件区分不同的文件类型,分别用不同的方式转换成pdf判断各个投标文件的格式,若均为pdf格式的投标文件,即一并生成目录页面的的pdf投标文件。
24.(2)遍历需合并的所有文件,通过投标工程文件路径读取文件,将遍历每一页内容复制到一份pdf文件中,完成投标文件的pdf格式化自动整合调整,得到pdf预览终文件,能够通过用户界面进行显示处理。
25.具体实施例2(1)预先完成投标文件的节点信息编辑,避免因为其中某一个字的问题导致其它pdf都要重新转换,由计算机系统获取所有需合并的投标文件列表,通过智能化识别技术判断文件的拓展名识别文件区分不同的文件类型,分别用不同的方式转换成pdf判断各个投标文件的格式,对非pdf格式的投标文件先进行转换,即生成对应的pdf投标文件。
26.具体地,其中投标文件包括投标的内容文件与政府采购响应性文件,投标的内容文件中封面、商务标封面、开标一览表与投标函及投标函附录、法定代表人身份证明及授权委托书、投标保证金、项目管理机构、已标价工程量清单、资格审查资料、施工组织设计技术标及其它材料所需系统识别的类型对应为docx、html、doc、doc、html、docx、docx、jpg、zip、doc及docx;政府采购响应性文件中资格性审查响应对照表、实质性要求与条件响应对照
表、资格与资信证明文件、产品配置与分项报价表、技术参数响应与偏离表、商务条款响应与偏离表、技术标方案、培训计划、服务承诺及报价表所需系统识别的类型对应为html、doc、doc、doc、docx、doc、docx、doc、xlsx。
27.更具体地,所述预先完成投标文件的节点信息分散在每个文档节点中,用以避免由于文件中出现的错误内容导致所有pdf重新转换。
28.(2)根据上述的投标文件节点名称,按需生成目录页面的pdf初始文件,所述pdf初始文件生成文章目录、页眉及页脚并与其行文之间的上下位关系。
29.(3)将上述的所有投标文件的路径、节点名称信息拼接生成为xml文件,并输出到对应的投标工程文件路径后,判断其是否显示页码、水印及超链接。
30.具体地,可扩展标记语言xml文件是标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言,使用开放的可扩展标记语言xml标准来描述、发布、发现、协调和配置投标文件,可用于开发分布式服务的拼接操作。
31.(4)通过设置生成文件的默认字体等基础信息,设置其是否显示页码、水印或者超链接,若文件设置中需要显示水印,则根据投标工程文件的水印图片路径进行绘制复现,从而转换生成pdf中间文件作为目标文件。
32.(5)遍历需合并的所有文件,通过投标工程文件路径读取文件,将遍历每一页内容复制到pdf中间文件中,当读取的文件含有图片时,需根据识别的图片尺寸判断是否对其进行分页处理,若图片尺寸小于或等于画布尺寸,无需对图片进行分页处理;若图片尺寸大于画布尺寸,则将图片分割成多个子图片用于生成对应的pdf分页文件,通过对图片的分页处理,使得pdf文件更加符合用户的查看习惯,不仅可以有效防止图片转换失真,还便于pdf文件的排版打印。
33.(6)再获取pdf中间文件中每一页的rotation顺序后,得到每一页纸张长与宽的两个边长长度,根据页内的文字与图片内容,用以完成目标pdf文件二每一页的页宽和页高的重置,实现投标文件的pdf格式化自动整合,得到能够通过用户界面进行显示的pdf预览终文件。
34.具体实施例3(1)预先完成投标文件的节点信息编辑后,由计算机系统获取所有需合并的投标文件列表,分别用不同的方式转换成pdf判断各个投标文件的格式,对非pdf格式的投标文件先进行转换,即生成对应的pdf投标文件;若出现部分不支持的格式则系统提示转换异常或文档错误,提示信息会直接反馈至投标人进行重新制作与上传。
35.具体地,投标文件包括投标的内容文件与政府采购响应性文件,投标的内容文件中封面、商务标封面、开标一览表与投标函及投标函附录、法定代表人身份证明及授权委托书、投标保证金、项目管理机构、已标价工程量清单、资格审查资料、施工组织设计技术标及其它材料所需系统识别的类型对应为html、html、docx、doc、docx、docx、docx、pgn、jxjt、doc及docx;政府采购响应性文件中资格性审查响应对照表、实质性要求与条件响应对照表、资格与资信证明文件、产品配置与分项报价表、技术参数响应与偏离表、商务条款响应与偏离表、技术标方案、培训计划、服务承诺及报价表所需系统识别的类型对应为html、html、html、doc、docx、docx、doc、doc、xls。
36.(2)根据上述的投标文件节点名称,按需生成目录页面的pdf初始文件,将上述的
所有投标文件的路径、节点名称信息拼接生成为xml文件,并输出到对应的投标工程文件路径后,判断其是否显示页码、水印及超链接。
37.具体地,所述pdf初始文件生成文章目录、页眉及页脚并与其行文之间保持上下位关系,实现内容结构的初步固定后,有利于在文件格式调整与转换中保证其内容的完整性与安全性,有效防止内容丢失或排版问题。
38.(3)通过设置生成文件的默认字体等基础信息,设置其是否显示页码、水印或者超链接,若文件设置中需要显示超链接,则根据投标工程文件的超链接路径进行复现,选择对应所需的超链接类型。
39.具体地,所述超链接类型包括外部链接、内部链接、下载链接、锚点链接及网页元素链接,其中外部链接的href属性要以http:// 开头;内部链接中网站内部页面之间的相互链接,直接链接内部页面名称即可,内部链接的href属性不需要以http:// 开头;下载链接的href里面地址显示是一个文件或压缩包(文件.exe或zip等压缩包形式),可以点击下载这个文件;网页元素链接指的是在网页中的各种网页元素,如文本、图像、表格、音频、视频等都可以添加超链接;锚点链接则是通过点击设定的链接即可快速的定位到页面中的某个位置,在链接文本的href属性中,设置属性值为#名字的形式。
40.(4)遍历需合并的所有文件,通过投标工程文件路径读取文件,将遍历每一页内容复制到pdf中间文件中,通过获取pdf中间文件中每一页的rotation顺序,得到每一页纸张长与宽的两个边长长度均相同,则无需重置文件页面,得到pdf预览终文件。
41.本发明技术方案当中,将不同类型文件不经过第三方平台或其它软件整合成一份pdf是技术关键,图1当中重点展示的是投标文件pdf格式化自动整合的方法流程作业模式,将原有的投标文件处理过程作出了进一步简化,大大降低了工作量与繁琐程度,提高了作业效率,方便用户编辑。另外,通过以上关于实施例的描述,所属领域的技术人员可以清楚地了解到,本发明能够借助软件及所需的通用硬件来配合操作,故基于这样的理解,本发明的技术方案本质上可以通过(可存储在计算机可读存储介质的)软件产品的形式体现出来。
42.通过以上描述可以发现,与现有技术相比,采用本发明技术方案之后,通过应用智能化识别技术,系统可以对上传信息进行有效识别,智能重组上传文件的格式类型,并转化成系统所支持、所需要的格式类型,方便用户查看投标文件内容,无需因为格式调整的问题选择第三方平台或其它软件进行二次或者二次以上的格式修整,避免整合文件中信息丢失、内容出现泄露等问题导致废标,有效保护了投标文件的完整性与安全性。
43.以上对本发明的技术方案、工作过程和实施效果进行了详细描述,需要说明的是,所描述的只是本发明的典型实例,除此之外,本发明还可以有其它多种具体实施方式,凡采用等同替换或等效变换形成的技术方案,均落在本发明要求保护的范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1