一种在线图文转换方法与流程

文档序号:16669944发布日期:2019-01-18 23:30阅读:322来源:国知局
一种在线图文转换方法与流程

本发明涉及图文转换辅助领域,尤其是一种在线图文转换方法。



背景技术:

随着当代企业管理信息化进程的不断深入,越来越多的企业或机构有了将纸质文档电子化的需求。将纸质资料扫描为图片,再对图片进行文字识别,最终转换为易于编辑的文档格式(如word,excel等office文档),可以为后续的数据处理(如翻译、检索、归档等)提供基础。对于部分传统、老牌企业来说,由于它们有着多年的文档累积,需要电子化的文档是海量的。不仅如此,文档电子化需求也在逐步渗透到越来越多的领域,如辅助教学,智能阅卷等等。

对于纸质文档的电子存储形式通常以pdf格式存储,其扫描速度快、体积小,但难以进行文档内容的编辑、查询,所以还需要进一步将pdf文件转换为word、excel等易于编辑的office文档。

将pdf、jpg等格式的文件转换为易于编辑的文档格式(通常为office文档,如word、excel等)的过程如果利用现有的计算机自动化进行文字识别的技术,其效率虽然高,但目前还不成熟,错误率高。目前主要还是依靠人工转换,对于图文转换企业,一般也是交由某个员工负责。据统计,一个工作人员将一个800页的pdf文件人工进行格式转换和排版至少需要花费3到4天时间,再加上任务交接、文档审核、校正的时间,总耗时甚至可能接近一周。而企业级的文档量通常在万页级,这样数量级的文档电子化耗时是按月算的,效率极其低下。同时,目前校验审核一般都是负责转换的人员自己进行审核,一方面容易出现漏检,另一方面也对审核缺乏监督机制,对图文转换过程缺乏系统性的管理。

以上仅为对图文进行转换环节存在的问题。除此之外,客户往往并不仅限于将文档转换为可编辑文字,其需要直接将转换的文档加以使用。而目前市场的产品几乎都仅限于将文档转换成对应可编辑文字,而没有实现文档进一步定制,例如对文件格式进行调整。这就导致客户需要对文字进行再加工才能得到最终所需要的文档,这就造成客户除了付出金钱外,还要付出额外劳动力,严重影响用户体验。



技术实现要素:

本发明的发明目的在于:针对上述存在的全部或部分问题,提供一种在线图文转换方法,以解决现有人工转换图文效率低、流程长的问题。

本发明采用的技术方案如下:

一种在线图文转换方法,包括以下步骤:

s1:接收用户发送的图文转换请求,该图文转换请求中携带有待转换格式的待转换文档和转换条件;

s2:根据待转换文档的文档信息,将待转换文档划分为若干待转换子文档;

s3:对于每一个待转换文档,按预定规则挑选出至少一个转换账户、至少一个审核账户和一个格式调整账户,根据划分的若干待转换子文档,分别向挑选出的转换账户、审核账户和格式调整账户派发任务;

s4:每一个转换账户对派发的转换任务中的每一个待转换子文档进行格式转换,得到对应的已转换子文档,并将已转换格式的待转换子文档的转换状态标记为已转换;

s5:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档按预定规则进行审核;

s6:在所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记所述待转换文档的审核状态为已审核;

s7:格式调整账户对派发的格式调整任务中的待转换文档的审核状态进行监控,在审核状态为已审核时,获取对应的准转换文档,根据所述转换条件,对准转换文档进行格式调整,得到已转换文档;

s8:将已转换文档反馈给用户。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1、通过对文档的智能拆分和任务派发,可使人工转换的耗时成倍地缩减,同时结合转换审核和格式调整环节,可有效保证人工转换的准确性和定制性。

2、基于任务的自动派发能力,可保证每一份拆分文档的转换时间趋于相等,进而在整体上保证文档转换的时效性。

3、基于任务到达消息的提醒,可便于相关账户主体对任务的及时处理,以保证整体任务完成的时效性。

4、本设计的方法可快速对文档进行定价,可大幅缩减人工定价的工作量,同时有效减少人工协商价格的流程和纠纷。

附图说明

本发明将通过例子并参照附图的方式说明,其中:

图1是图文转换方法流程图。

图2是图文转换方法执行的一个实施例。

具体实施方式

本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。

如图1所示,本实施例公开了一种在线图文转换方法,该方法可将难以处理的扫描件、图片等转换文便于编辑的电子文档,该方法包括以下步骤:

s1:接收用户发送的图文转换请求,该图文转换请求中携带有待转换格式的待转换文档和转换条件。

在一个实施例中,对于转换条件,除了包括对最终转换出的电子文档的格式要求外,还包括对图文转换的时限要求,如是否加急。

s2:根据待转换文档的文档信息,将待转换文档划分为若干待转换子文档。此处的划分,优选根据待转换文档的工作量进行平均划分。对于文档信息,包括文档的格式(如pdf、图片)、页数、每页文本量、格式复杂度、图片清晰度等。

s3:对于每一个待转换文档,按预定规则挑选出至少一个转换账户、至少一个审核账户和一个格式调整账户,根据划分的若干待转换子文档,分别向挑选出的转换账户、审核账户和格式调整账户派发任务。

优选的,在向转换账户派发任务前,还将所拆分的待转换子文档进行预处理。此处预处理例如对比度调整、锐化、图像增强等,以提高文档的显示效果,便于格式转换人员的识别和处理。

s4:每一个转换账户对派发的转换任务中的每一个待转换子文档进行格式转换,得到对应的已转换子文档,并将已转换格式的待转换子文档的转换状态标记为已转换。显然,对于每一个待转换子文档,均会有一个对应的已转换子文档。对于转换账户而言,其可以借助现有图文转换工具(如ocr)进行预转换,该图文转换工具优选集成到转换账户的操作界面,或者将图文转换工具的api接口集成到转换账户的操作界面中由图文转换人员调用(如网页插件),再对预转换的文档进行校验修正,得到已转换子文档;当然,也可以通过全人工的方式进行格式转换

转换账户可以在线对待转换子文档进行转换,也可以下载待转换子文档进行离线转换,然后将已转换子文档上传。

s5:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,获取对应的已转换子文档按预定规则进行审核。

上述的预定规则为:审核人员(登录审核账户的员工)借助平台对待转换子文档进行在线审核,即将拆分的待转换子文档和对应的已转换子文档进行对照审核。为保证上下文审核的关联性,例如段落间的衔接,进而提高文档整体的可视化效果,优选将一个待转换文档的所有拆分部分(即待转换子文档)派发给一个审核账户进行审核。

s6:在所有待转换子文档所对应的已转换子文档审核通过时,将所有已转换子文档进行合并,得到准转换文档,标记所述待转换文档的审核状态为已审核。上述对已转换文档的合并,为以对应待转换子文档在待转换文档中的位置关系进行合并。对已转换子文档的合并,在一个实施例中,为通过api接口调用相应的文档合并应用完成:在一个待转换文档对应的所有已转换子文档审核通过后,自动调用该api接口。

优选的,在将已转换子文档进行合并后,还对合并后的文档的格式进行预调整。例如按预定规则调整文字的字体或图片排版,以得到准转换文档。

对于已转换子文档的合并,在一个实施例中,为通过api接口调用相应的文档合并应用完成:在一个待转换文档对应的所有已转换子文档审核通过后,自动调用该api接口。

s7:格式调整账户对派发的格式调整任务中的待转换文档的审核状态进行监控,在审核状态为已审核时,获取对应的准转换文档,根据所述转换条件(该转换条件优选被整合于格式调整任务中),对准转换文档进行格式调整,得到已转换文档。对于文档格式的调整,可以为对标题等级、页面设置、页眉页脚等的调整。

s8:将已转换文档反馈给用户。通常的,为反馈给用户在转换平台所注册的账户,当然,也可以为用户预留的收件地址,如邮箱/信箱地址。

本实施例具体公开了对已转换文档进行审核的方法:

步骤s5具体为:

s51:每一个审核账户对派发的审核任务中的每一个待转换子文档的转换状态进行监控,在任一待转换子文档的转换状态为已转换时,执行s52;

s52:获取转换状态为已转换的待转换子文档所对应的已转换子文档,根据预定规则对获取的已转换子文档进行审核;

s53:将审核通过的已转换子文档标记为审核通过状态,将审核不通过的已转换子文档标记为审核不通过状态;若存在审核不通过的已转换文档,则执行s54,否则,执行s6;

s54:向处理审核不通过的已转换子文档的转换账户发送修改信息,以使该转换账户更新改已转换子文档;该修改信息优选包括通知修改的信息,或者还包括修改意见;还对更新后的已转换子文档按预定规则进行审核,执行s53。

优选的,在一个实施例中,对于已转换子文档的合并的步骤s6具体为:

s61:监控所述待转换文档对应的所有已转换子文档的审核结果,若所有已转换子文档的审核结果均为审核通过,则自动执行s62;所谓自动执行,则表示无需人工触发;

s62:按被拆分的待转换子文档在待转换文档中的位置关系,将对应的所有审核通过的已转换子文档合并为准转换文档,标记所述待转换文档的审核状态为已审核。

上述s62的合并操作,在一个实施例中,为自动调用文档合并工具的api接口对所有已转换子文档进行合并。基于对状态监控自动执行合并操作,无需人工处理,可加快对格式调整处理的支撑,进而保证文档转换的效率。

本实施例公开了s3中,对转换账户、审核账户和格式调整账户的挑选方法:

对每一转换账户、审核账户和格式调整账户的剩余任务量进行监控,根据对各种账户的数量需求,顺序选择任务量最少的相应账户。进一步的,每一个账户(转换账户、审核账户和格式调整账户)均可以设置任务接收状态,该任务接收状态至少包括可接收任务和不可接收任务两种状态,上述选择的账户为可接收任务状态下的账户。

本实施例公开了另一种在线图文转换方法:在步骤s2前,还包括:

s11:根据待转换文档的文档信息和/或转换条件生成账单发送给用户,并监控用户对该账单的反馈信息;在所述反馈信息为用户确认账单后,执行s2。

本实施例公开了另一种在线图文转换方法:在步骤s1前,还包括:

s01:验证用户身份,在验证通过后,执行s1。

具体的,包括:s011:判断用户提供的用户账户是否已注册,若是,则执行s013,否则,执行s012;

s012:将用户账户信息进行注册;

s013:对用户提供的用户账户进行验证,在验证通过后,执行s1。

优选的,为便于各被分配任务的账户及时处理任务,在上述步骤中,还包括:

在向转换账户、审核账户和格式调整账户派发任务时,和/或在转换账户、审核账户或格式调整账户可以处理派发的任务时,向对应的账户(转换账户、审核账户或格式调整账户)发送提醒信息。例如转换账户在有回退(审核不通过)的已转换子文档时,可处理对该已转换子文档的修正任务;审核账户在转换账户标记待转换子文档为已转换时,可处理对对应已转换子文档的审核任务;格式调整账户在图文转换系统生成准转换文档后,才可处理对该准转换文档的格式调整任务。

对于上述提醒消息,在一个实施例中,在发送提醒消息时,检测对应账户的在线状态,在所要发送的提醒消息对应的账户在线时,向该账户的信箱发送提醒消息(例如提醒事件或弹窗);在账户不在线时,向账户所对应的移动终端发送提醒消息(例如短消息提醒)。通常情况下,每一个账户(转换账户、审核账户或格式调整账户)均绑定有联系方式,向账户对应的移动终端发送提醒消息实质为向账户绑定的联系方式发送的提醒消息。

如图2所示,当用户计划转换一份文档(待转换文档,对于用户发送的待转换文档,可以是文件,也可以是文件的下载地址)时,首先通过用户名和密码进行登录,在登录后,发出图文转换请求。自动获取到文档的文档信息,根据文档的文档信息(难度、页数)和转换要求(加急情况)计算转换费用,生成账单并发送给用户账户,用户确定账单后,根据文档的文档信息(如难度、页数、格式、格式复杂度、图片清晰度等)将文档拆分为若干待转换子文档,分别对划分的若干待转换子文档进行预处理(调整清晰度),分别向转换账户、审核账户和格式转换账户派发任务(对于转换账户派发转换任务,对于审核账户派发审核任务,对于格式转换账户派发格式转换任务),同时,向相应的账户发送任务到达的提醒消息。转换账户在将派发的待转换子文档转换为已转换子文档(此处可以为在线转换,或者离线转换后上传已转换文档)后,对应审核账户下的任务会被标记为可处理状态,此时会向该审核账户发送对应的可处理任务的提醒消息。审核账户可查看、下载对应的已转换子文档进行审核,通常的,审核账户可获取到任务对应的待转换子文档,以将已转换子文档进行对照审核。对于审核账户来说,其负责对一份文档的所有拆分部分的已转换子文档进行审核,以保证对文档的整体把控。在所有已转换子文档审核通过后,即所有已转换子文档均被标记为审核通过状态后,自动调用文档合并应用的api接口完成对所有已转换子文档的合并,对格式调整账户下对应任务的待转换文档的状态标记为已审核,此处合并显然以对应于待转换子文档被拆分的顺序和位置进行的合并。对于审核未通过的已转换子文档,审核账户会指出审核不通过的原因和修改意见,该类已转换子文档会连同修改意见和不通过原因被退回到对应的转换账户被修正,修正后重新审核,直到审核通过。对于合并后的文档,首先进行格式预处理,例如统一字体,标题等级等,得到准转换文档。此时,格式调整账户下格式调整任务对应的待转换文档的状态发生改变,变为可进行格式调整(对应于已审核的审核状态),则格式调整账户按用户的转换要求(如要求为论文格式)对准转换文档进行格式调整(例如行间距、字号、字体、插图设计、页眉页脚、目录生成、添加/去除水印等),在调整结束后,得到已转换文档,最后,根据用户预留的接收地址(例如用户账户、用户邮箱地址等)反馈该已转换文档。

为了保证高效率、高准确度地完成图文转换任务,对于转换账户、审核账户和格式调整账户需要进行集中管理。上述方法流程中,还包括添加、删除或修改转换账户、审核账户或格式调整账户。

对于用户账户而言,通常情况下为用户自行注册的账户。而对于转换账户而言,因其需要一定的技术能力,则可以为专业人员提交资料由账户管理系统进行审核,审核通过后派发转换账户,也可以由账户管理系统直接派发,例如对转换工作人员进行培训、考核通过后,由账户管理系统进行集体派发。对于审核账户和格式调整账户而言,其可参考上述用户账户或转换账户的派发规则进行管理。

需要说明的是,本文中所谓的已转换、未转换、转换不通过和已审核等状态,仅为对相应文档状态的描述,而非文字上的限定。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1