一种在线图文转换平台的制作方法

文档序号:16811832发布日期:2019-02-10 13:44阅读:138来源:国知局
一种在线图文转换平台的制作方法

本发明涉及图文转换辅助领域,尤其是一种在线图文转换平台。



背景技术:

随着当代企业管理信息化进程的不断深入,越来越多的企业或机构有了将纸质文档电子化的需求。将纸质资料扫描为图片,再对图片进行文字识别,最终转换为易于编辑的文档格式(如word,excel等office文档),可以为后续的数据处理(如翻译、检索、归档等)提供基础。对于部分传统、老牌企业来说,由于它们有着多年的文档累积,需要电子化的文档是海量的。不仅如此,文档电子化需求也在逐步渗透到越来越多的领域,如辅助教学,智能阅卷等等。

对于纸质文档的电子存储形式通常以pdf格式存储,其扫描速度快、体积小,但难以进行文档内容的编辑、查询,所以还需要进一步将pdf文件转换为word、excel等易于编辑的office文档。

将pdf、jpg等格式的文件转换为易于编辑的文档格式(通常为office文档,如word、excel等)的过程如果利用现有的计算机自动化进行文字识别的技术,其效率虽然高,但目前还不成熟,错误率高。目前主要还是依靠人工转换,对于图文转换企业,一般也是交由某个员工负责。据统计,一个工作人员将一个800页的pdf文件人工进行格式转换和排版至少需要花费3到4天时间,再加上任务交接、文档审核、校正的时间,总耗时甚至可能接近一周。而企业级的文档量通常在万页级,这样数量级的文档电子化耗时是按月算的,效率极其低下。同时,目前校验审核一般都是负责转换的人员自己进行审核,一方面容易出现漏检,另一方面也对审核缺乏监督机制,对图文转换过程缺乏系统性的管理。

以上仅为对图文进行转换环节存在的问题。除此之外,客户往往并不仅限于将文档转换为可编辑文字,其需要直接将转换的文档加以使用。而目前市场的产品几乎都仅限于将文档转换成对应可编辑文字,而没有实现文档进一步定制,例如对文件格式进行调整。这就导致客户需要对文字进行再加工才能得到最终所需要的文档,这就造成客户除了付出金钱外,还要付出额外劳动力,严重影响用户体验。



技术实现要素:

本发明的发明目的在于:针对上述存在的全部或部分问题,提供一种在线图文转换平台,以解决现有人工转换图文效率低、流程长的问题。

本发明采用的技术方案如下:

一种在线图文转换平台,其包括:任务派发系统和图文转换系统,图文转换系统包括:格式转换子系统、图文审核子系统和格式调整子系统;其中:

任务派发系统用于接收用户发送的图文转换请求,该图文转换请求中携带有待转换文档和转换条件;还根据待转换文档的文档信息将待转换文档划分为若干个待转换子文档;还根据拆分的待转换子文档分别向格式转换子系统、图文审核子系统和格式调整子系统派发任务;还向用户反馈已转换文档;

格式转换子系统用于对任务派发系统派发的转换任务中携带的每一个待转换子文档进行格式转换,得到对应的已转换子文档,标记格式转换完成的待转换子文档的转换状态为已转换;

图文审核子系统用于监控任务派发系统派发的审核任务中的每一个待转换子文档的转换状态,获取转换状态为已转换的待转换子文档所对应的已转换子文档,对获取的已转换子文档进行审核;还在对一个审核任务中所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记待转换文档的审核状态为已审核;

格式调整子系统用于监控任务派发系统派发的格式调整任务中的每一个待转换文档的审核状态,获取审核状态为已审核的待转换文档所对应的准转换文档,根据格式调整任务中携带的转换条件,对准转换文档进行格式调整,得到已转换文档,并反馈给任务派发系统。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1、通过对文档的智能拆分和任务派发,可使人工转换的耗时成倍地缩减,同时结合转换审核和格式调整环节,可有效保证人工转换的准确性和定制性。

2、基于平台的任务自动派发能力,可保证每一份拆分文档的转换时间趋于相等,进而在整体上保证文档转换的时效性。

3、基于任务到达消息的提醒,可便于相关账户主体对任务的及时处理,以保证整体任务完成的时效性。

4、本设计的平台可快速对文档进行定价,可大幅缩减人工定价的工作量,同时有效减少人工协商价格的流程和纠纷。

附图说明

本发明将通过例子并参照附图的方式说明,其中:

图1是在线图文转换平台构造图。

图2是在线图文转换平台工作流程图。

具体实施方式

本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。

如图1所示,本实施例公开了一种在线图文转换平台,通过该平台,可以快速、准确地将用户的扫描件、照片等格式的文档转换为便于编辑的电子文档。该平台包括:任务派发系统和图文转换系统,该图文转换系统包括:格式转换子系统、图文审核子系统和格式调整子系统;其中:

任务派发系统用于接收用户发送的图文转换请求,该图文转换请求中携带有待转换文档和转换条件;还根据所述待转换文档的文档信息(优选为平台自动根据接收的文档获取),将待转换文档划分为若干个待转换子文档;还根据拆分的待转换子文档分别向格式转换子系统、图文审核子系统和格式调整子系统派发任务;还向用户反馈已转换文档;

所述格式转换子系统用于对任务派发系统派发的转换任务中携带的每一个待转换子文档进行格式转换,得到对应的已转换子文档,标记格式转换完成的待转换子文档的转换状态为已转换;

所述图文审核子系统用于监控任务派发系统派发的审核任务中的每一个待转换子文档的转换状态,获取转换状态为已转换的待转换子文档所对应的已转换子文档,对获取的已转换子文档按预定规则进行审核;还在对一个审核任务中所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记待转换文档的审核状态为已审核;

所述格式调整子系统用于监控任务派发系统派发的格式调整任务中的每一个待转换文档的审核状态,获取审核状态为已审核的待转换文档所对应的准转换文档,根据格式调整任务中携带的转换条件,对准转换文档进行格式调整,得到已转换文档,并反馈给任务派发系统。对于文档格式的调整,可以为对标题等级、页面设置、页眉页脚等的调整。

优选的,任务派发系统在向格式转换子系统派发转换任务前,还将所拆分的待转换子文档进行预处理。此处预处理例如对比度调整、锐化、图像增强等,以提高文档的显示效果,便于格式转换人员的识别和处理。

优选的,图文审核子系统对已转换子文档进行合并后,还对合并后文档的格式进行预调整,例如按预定规则调整文字的字体或图片排版,以得到准转换文档。

对于图文审核子系统对已转换子文档的合并,在一个实施例中,为通过api接口调用相应的文档合并应用完成:在一个待转换文档对应的所有已转换子文档审核通过后,自动调用该api接口。

本实施例公开了任务派发系统的构造:任务派发系统包括账单子系统和任务派发子系统,账单子系统用于根据待转换文档的文档信息和/或转换条件生成账单发送给用户;任务派发子系统用于监控用户对所述账单的反馈信息,在用户确认所述账单后,根据所述待转换文档的文档信息将待转换文档划分为若干个待转换子文档;此处的划分,优选根据待转换文档的工作量进行平均划分,还根据拆分的待转换子文档分别向格式转换子系统、图文审核子系统和格式调整子系统派发任务。对于转换条件,除了包括对最终转换出的电子文档的格式要求外,还包括对图文转换的时限要求,即是否加急。对于文档信息,包括文档的格式(如pdf、图片)、页数、每页文本量、格式复杂度、图片清晰度等。账单子系统根据文档信息判断转换的难度,结合文档页数和要求的时限,计算账单费用。

优选的,任务派发系统还包括登录子系统,用于用户登录到平台,或者将用户信息在平台上进行注册。通常情况下,用户通过账号和密码在登录子系统中注册。用户在注册后,需通过登录子系统登录到用户账户,发起图文转换请求。

本实施例公开了格式转换子系统执行转换任务的方案:

格式转换子系统中包括若干转换账户,任务派发系统向格式转换子系统派发转换任务具体为:任务派发系统将若干待转换子文档派发给所述若干转换账户中的至少一个转换账户;所述至少一个转换账户用于将接收的待转换子文档转换为已转换子文档,并标记格式转换完成的待转换子文档的转换状态为已转换。

对于任务派发系统选择至少一个转换账户的方案为:任务派发系统监控每一转换账户的剩余任务量,顺序选择任务量最少的转换账户。进一步的,每一转换账户均可以设置转换任务接收状态,该转换任务接收状态至少包括可接收任务和不可接收任务两种状态,任务派发系统所选择的转换账户为可接收任务状态下的转换账户。

对于转换账户而言,其可以借助现有图文转换工具(如ocr)进行预转换,该图文转换工具优选集成到格式转换子系统中,或者将图文转换工具的api接口集成到格式转换系统中由图文转换人员调用(如网页插件);再对预转换的文档进行校验修正,得到已转换子文档;当然,也可以通过全人工的方式进行格式转换。

本实施例公开了图文审核子系统执行审核任务的方案:

图文审核子系统中包括若干审核账户,每一个审核账户用于接收任务派发系统所派发的审核任务,每一个审核任务对应于至少一个待转换文档(即一个待转换文档交由一个审核账户进行审核);接收到审核任务的审核账户对审核任务中的若干待转换子文档的转换状态进行监控,在所监控的若干待转换子文档中存在转换状态为已转换的待转换子文档时,获取已转换状态的待转换子文档所对应的已转换子文档,并对获取的已转换子文档按预定规则进行审核(此处的预定规则,优选为将已转换子文档与对应待转换子文档进行对照审核);在任一待转换文档所对应的所有已转换子文档均审核通过时,将所述所有已转换子文档进行合并,得到准转换文档,还标记对应的待转换文档的审核状态为已审核;在任一已转换子文档审核不通过时,向负责转换该已转换子文档的转换账户发送修改信息,该修改信息包括审核不通过原因(如转换错误点)和/或修改建议。此处向转换账户发送修改信息,优选为任务派发系统在监控到已转换子文档审核不通过时,将修改信息发送给对应的转换账户,并修改对应待转换子文档的转换状态,或修改已转换子文档的状态,如修改为未转换、审核不通过或修改状态,以使转换账户进行修正。对应的,对于审核通过的已转换子文档,由图文审核子系统标记为审核通过状态,在一个待转换文档对应的所有已转换子文档均为审核通过状态后,图文审核子系统自动调用api接口完成对已转换子文档的合并。

对于任务派发系统选择审核账户的方案为:任务派发系统监控每一审核账户的剩余任务量,选择任务量最少的审核账户。进一步的,每一审核账户均可以设置审核任务接收状态,该审核任务接收状态至少包括可接收任务和不可接收任务两种状态,任务派发系统所选择的审核账户为可接收任务状态下的审核账户。

需要说明的是,上述标记待转换文档的审核状态为已审核,可以为对待转换文档进行标记,也可以为对所拆分的待转换子文档进行标记,也可以为对转换后的已转换子文档进行标记,即标记所有已转换子文档为已审核。

审核人员(登录审核账户的员工)可以借助平台对待转换子文档进行在线审核,即将拆分的待转换子文档和对应的已转换子文档进行对照审核。

设置将一个待转换文档的所有拆分部分(即待转换子文档)交由同一个审核人员(审核账户)进行审核,可以有效保证上下文审核的关联性,例如段落间的衔接,进而提高文档整体的可视化效果。

本实施例公开了格式调整子系统执行格式调整任务的方案:

格式调整子系统中设置有若干格式调整账户,每一个格式调整账户用于接收任务派发系统所派发的格式调整任务,每一个格式调整任务对应于至少一个待转换文档,即至少对一份准转换文档进行格式调整,格式调整任务中携带有用户发送图文转换请求时所发送的转换条件,格式调整账户用于监控所派发的格式转换任务所对应的待转换文档的审核状态,在任一待转换文档的审核状态为已审核时,获取对应的准转换文档,并根据转换条件对获取的准转换文档进行格式调整,得到已转换文档,并将已转换文档反馈给任务派发系统。

对于任务派发系统选择格式调整账户的方案为:任务派发系统监控每一格式调整账户的剩余任务量,选择任务量最少的格式调整账户。进一步的,每一格式调整账户均可以设置格式调整任务接收状态,该格式调整任务接收状态至少包括可接收任务和不可接收任务两种状态,任务派发系统所选择的格式调整账户为可接收任务状态下的格式调整账户。

在一种实施方式中,任务派发系统包括消息提醒子系统,用于在任务派发系统向格式转换子系统、图文审核子系统或格式调整子系统派发任务时,和/或在各账户可以处理派发的任务时,向对应的转换账户、审核账户或格式调整账户发送提醒消息。例如转换账户在有回退(审核不通过)的已转换子文档时,可处理对该已转换子文档的修正任务;审核账户在转换账户标记待转换子文档为已转换时,可处理对对应已转换子文档的审核任务;格式调整账户在图文转换系统生成准转换文档后,才可处理对该准转换文档的格式调整任务。

对于上述提醒消息,在一个实施例中,消息提醒子系统在发送提醒消息时,检测对应账户的在线状态,在所要发送的提醒消息对应的账户在线时,向该账户的信箱发送提醒消息(例如提醒事件或弹窗);在账户不在线时,向账户所对应的移动终端发送提醒消息(例如短消息提醒)。通常情况下,每一个账户(转换账户、审核账户或格式调整账户)均绑定有联系方式,向账户对应的移动终端发送提醒消息实质为向账户绑定的联系方式发送的提醒消息。

如图2所示,用户需要转换一份文档(待转换文档,对于用户发送的待转换文档,可以是文件,也可以是文件的下载地址),平台自动获取到文档的文档信息,账单子系统根据该文档的文档信息(难度、页数)和转换要求(加急情况)计算转换费用,生成账单并发送给用户账户,用户确定账单后,任务派发子系统即根据文档的文档信息(如难度、页数、格式、格式复杂度、图片清晰度等)将文档拆分为若干待转换子文档,分别向转换账户、审核账户和格式转换账户派发任务(对于转换账户派发转换任务,对于审核账户派发审核任务,对于格式转换账户派发格式转换任务),同时,消息提醒单元向相应的账户发送提醒消息。转换账户在将派发的待转换子文档转换为已转换子文档(通常的,为上传已转换文档)后,图文转换系统会将审核账户下的该待转换子文档的转换状态修改为已转换,则审核账户可查看、下载对应的已转换子文档进行审核。对于审核账户来说,其负责对一份文档的所有拆分部分的已转换子文档进行审核,以保证对文档的整体把控,在所有已转换子文档审核通过后,例如所有已转换子文档被标记为已审核后,图文转换系统自动将所有已转换子文档进行合并,生成准转换文档;而对于审核未通过的已转换子文档,审核账户会指出审核不通过的原因和修改意见,图文转换系统对该已转换子文档进行标记,并将修改意见反馈给负责的转换账户。进一步的,对于生成的准转换文档,图文审核系统还对其进行格式的预处理,例如统一字体,标题等级等。此时,格式调整账户下格式调整任务对应的待转换文档的状态发生改变,变为可进行格式调整(对应于已审核的审核状态),则格式调整账户按用户的转换要求(如要求为论文格式)对准转换文档进行格式调整(例如行间距、字号、字体、插图设计、页眉页脚、目录生成等),在调整结束后,得到已转换文档反馈给任务派发系统,任务派发系统再根据用户预留的接收地址(例如用户账户、用户邮箱地址等)反馈该已转换文档。

基于上述实施例,本实施例公开了另一种在线图文转换平台:平台还包括账户管理系统,该账户管理系统用于添加、删除或修改用户账户、转换账户、审核账户和格式调整账户。

对于用户账户而言,通常情况下为用户自行注册的账户。而对于转换账户而言,因其需要一定的技术能力,则可以为专业人员提交资料由账户管理系统进行审核,审核通过后派发转换账户,也可以由账户管理系统直接派发,例如对转换工作人员进行培训、考核通过后,由账户管理系统进行集体派发。对于审核账户和格式调整账户而言,其可参考上述用户账户或转换账户的派发规则进行管理。

需要说明的是,本文中所谓的已转换、未转换、转换不通过和已审核等状态,仅为对相应文档状态的描述,而非文字上的限定。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1