一种基于多功能机的文档自动处理方法

文档序号：7856943阅读：410来源：国知局

专利名称：一种基于多功能机的文档自动处理方法
技术领域：
本发明属于办公自动化技术领域，特别涉及一种基于多功能机的文档自动处理方法。
背景技术：
用电脑处理电子文档是很普遍的技木，运用软件在电脑上对电子文档还能实现各种要求和形式的自动处理。但是在很多场合，仍然非常需要能够对纸质文稿的文字进行某种要求的自动处理，而现有技术中，还不存在这样的自动处理系统
发明内容

本发明的目的是提供一种基于多功能机的文档自动处理方法，以解决纸质文稿的文字自动处理问题。本发明的技术方案是，一种基于多功能机的文档自动处理方法，所述的多功能机是指具有扫描、复印和打印功能的机器，包括以下步骤使用者在所述多功能机上，将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件；所述多功能机将所述的第一电子文件传送至服务器，并对服务器发出处理服务请求；所述服务器对所述第一电子文件内容进行OCR识别处理，识别出该第一电子文件中的文字内容，并记录文字的位置；所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务；所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机，该多功能机将该第二电子文件打印到纸上并输出。所述方法进ー步包括以下步骤使用者在所述多功能机的操作面板上选择拼音自动标注服务，启动多功能机的扫描功能，将纸质文稿内容扫描到多功能机中；所述多功能机将纸质文稿的扫描内容转化为图像格式，并保存为第一电子文件；所述多功能机将第一电子文件通过互联网或局域网传送到外置服务器，并对服务器发出拼音标注服务请求；所述外置服务器端的拼音标注程序启动利用第三方OCR引擎实现的文字识别程序，将接收到的第一电子文件输入到文字识别程序进行OCR处理；所述文字识别程序识别出图像格式的电子文件中的文字内容并获取各个文字在ニ维平面上的坐标，文字的大小信息，并将其作为ー组，存入预先设计好的数据结构容器中并返回，数据结构容器包含文字-大小-位置-拼音为単位的多组数据；所述的拼音标注程序启动利用第三方技术实现的拼音识别程序，将数据结构容器输入到拼音识别程序进行拼音识别处理；所述的拼音识别程序将数据结构容器中数据组按存入先后顺序取出，根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音，并将拼音存入数据结构容器中并返回；所述拼音标注程序打开第一电子文件，将该第一电子文件的原始内容转换成水印格式；所述拼音标注程序打开第一电子文件，将数据结构容器中的数据组按顺序取出，根据数据组中的文字大小和坐标信息计算出新的坐标，并将拼音插入图像中的相应位置，重复处理直至所有的数据组中的信息全部的得到处理，最后将处理结果保存为图像格式的第二电子文件；所述拼音标注程序将第二电子文件发送回多功能机；
所述多功能机将第二电子文件打印到纸上并输出。本发明利用服务器所提供的检索转换功能(例如发音标注功能)服务，结合具有扫描打印复印等功能的多功能复印机，将多功能机的扫描打印服务器通信功能和服务器端提供的数据处理服务相结合，实现对纸质文稿进行包括发音标注功能的文档内容自动加工，帮助学习中文的用户在中文文稿上自动标注拼音。

图I是本发明系统组成示意2是本发明一实施例中方法步骤流程图
具体实施例方式图I是本发明的系统组成示意图。结合图2所示，根据图2的模块组成，本发明的基于多功能机的文档自动处理实现步骤为1，将纸质的文稿，放到多功能机的扫描板上，在多功能操作面板上选择拼音自动标注服务，启动多功能机的扫描功能，将文稿内容扫描到多功能机中。2，多功能机将扫描内容转化为特定的图像格式(例如，Docuworks或HF)，并保存为电子文件。3，多功能机将图像文件通过互联网或局域网传送到外置服务器，并对服务器发出拼音标注服务请求。4，服务器端拼音标注程序启动利用第三方OCR引擎实现的文字识别程序，将接收到的图像文件输入到文字识别程序进行OCR处理。5，文字识别程序识别出图像文件中的文字内容并获取各个文字在ニ维平面上的坐标，文字的大小信息，并将其作为ー组，存入实现设计好的数据结构容器中并返回。数据结构容器包含文字-大小-位置-拼音为単位的多组数据。6，拼音标注程序启动利用第三方技术实现的拼音识别程序，将数据结构容器输入到拼音识别程序进行拼音识别处理。7，拼音识别程序将数据结构容器中数据组按存入先后顺序(以下简称顺序)取出。根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音，并将拼音存入数据结构容器中并返回。8，拼音标注程序打开图像文件，将图像文件的原始内容转换成水印格式。9，拼音标注程序打开图像文件，将数据结构容器中的数据组按顺序取出，根据数据组中的文字大小和坐标信息计算出新的坐标(例如原来坐标的正上方)，并将拼音插入图像中的相应位置。重复以上处理，直至所有的数据组中的信息全部的得到处理。最后将图像文件重新保存。10，拼音标注程序将图像文件发送回多功能机。 11，多功能机将图像文件打印到纸上并输出。
权利要求
1.一种基于多功能机的文档自动处理方法，所述的多功能机是指具有扫描、复印和打印功能的机器，其特征在于，包括以下步骤使用者在所述多功能机上，将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件；所述多功能机将所述的第一电子文件传送至服务器，并对服务器发出处理服务请求；所述服务器对所述第一电子文件内容进行OCR识别处理，识别出该第一电子文件中的文字内容，并记录文字的位置；所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务；所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机，该多功能机将该第二电子文件打印到纸上并输出。
2.如权利要求I所述的基于多功能机的文档自动处理方法，其特征在于，所述方法进一歩包括以下步骤使用者在所述多功能机的操作面板上选择拼音自动标注服务，启动多功能机的扫描功能，将纸质文稿内容扫描到多功能机中；所述多功能机将纸质文稿的扫描内容转化为图像格式，并保存为第一电子文件；所述多功能机将第一电子文件通过互联网或局域网传送到外置服务器，并对服务器发出拼音标注服务请求；所述外置服务器端的拼音标注程序启动利用第三方OCR引擎实现的文字识别程序，将接收到的第一电子文件输入到文字识别程序进行OCR处理；所述文字识别程序识别出图像格式的电子文件中的文字内容并获取各个文字在ニ维平面上的坐标，文字的大小信息，并将其作为一組，存入预先设计好的数据结构容器中并返回，数据结构容器包含文字-大小位置拼音为単位的多组数据；所述的拼音标注程序启动利用第三方技术实现的拼音识别程序，将数据结构容器输入到拼音识别程序进行拼音识别处理；所述的拼音识别程序将数据结构容器中数据组按存入先后顺序取出，根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音，并将拼音存入数据结构容器中并返回；所述拼音标注程序打开第一电子文件，将该第一电子文件的原始内容转换成水印格式；所述拼音标注程序打开第一电子文件，将数据结构容器中的数据组按顺序取出，根据数据组中的文字大小和坐标信息计算出新的坐标，并将拼音插入图像中的相应位置，重复处理直至所有的数据组中的信息全部的得到处理，最后将处理结果保存为图像格式的第二电子文件；所述拼音标注程序将第二电子文件发送回多功能机；所述多功能机将第二电子文件打印到纸上并输出。
全文摘要
本发明公开了一种基于多功能机的文档自动处理方法，所述的多功能机是指具有扫描、复印和打印功能的机器，包括步骤使用者在所述多功能机上，将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件；所述多功能机将所述的第一电子文件传送至服务器，并对服务器发出处理服务请求；所述服务器对所述第一电子文件内容进行OCR识别处理，识别出该第一电子文件中的文字内容，并记录文字的位置；所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务；所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机，该多功能机将该第二电子文件打印到纸上并输出。
文档编号H04N1/00GK102833449SQ201210264849
公开日2012年12月19日申请日期2012年7月27日优先权日2012年7月27日
发明者安方确, 王凯申请人:富士施乐实业发展(上海)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安方确;王凯
技术所有人：富士施乐实业发展（上海）有限公司
我是此专利的发明人

上一篇：服务器装置及信息处理方法
上一篇：一种实现ipsec vpn加解密处理的方法及装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。