一种纸质稿件转换为网络文本页面的方法及系统与流程

文档序号:12666821阅读:200来源:国知局

本发明涉及计算机通信技术领域,尤其涉及一种纸质稿件转换为网络文本页面的方法及系统。



背景技术:

目前各个无纸化的办公系统,审批系统逐步普及,原来纸质化的word排版的文本。现有技术中大多采用dreamware等类似的网页编辑软件,手动的将原来的word文本转换为单纯的文本网页,修饰性差,并且需要插入超链接时比较麻烦需要人工一一添加,耗时费工效率地。或者通过扫描仪转换成word,再利用word自带的工具转成网络文本,内容复杂,不符合网页文本的要求,生成的只是静态的网页。



技术实现要素:

为克服现有技术中存在的纸质稿件转变为网页页面过程复杂,效率低下的问题,本发明提供了一种纸质稿件转换为网络文本页面的方法及系统。

一种纸质稿件转换为网络文本页面的方法,包括如下步骤:

步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件;

步骤二:通过文字处理器将位图文件转换为文字处理器文本文件;

步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件中的文本元素插入网页页面模板中,生成初步的网页页面;

步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。

进一步的,包括如下步骤:

步骤一:将纸质稿件通过扫描仪转换成tif文件;

步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本网页文本;

步骤三:根据文字文本网页文本的内容选择网页页面模板,将文字文本网页文本中的文本元素插入网页页面模板中,生成初步的网页页面。

进一步的,所述步骤三还包括如下步骤:

预先设置网页页面模板:通过网页编辑器绘制多套模板上传至系统中;

选择网页页面模板:根据文字处理器文本文件中的文本内容选择页面属性接近的网页页面模板:

插入文本内容:根据文字处理器文本文件中的文本内容插入标题和文本修饰控件,所述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用于对网页文本文字进行修饰;

生成初步的网页页面:根据网页页面模板的填充内容,通过文本修饰控件生成初步的网页页面。

进一步的,所述步骤三还包括如下步骤:

优化网页页面元素:根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充;

填充网页页面属性:根据文字处理器文本文件中的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字段。

进一步的,所述命名文本元素的字段为拼音字段或者英文字段。

本发明的另一个目的是提供一种采用所述的纸质稿件转换为网络文本页面的方法的系统,包括:

扫描设备,用于扫描纸质稿件,并生成位图文件;

连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块;

文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器文本文件,并且读取文字处理器文本文件内每一列的内容;

网页编辑模块,用于在网页编辑过程中生成网页页面,并且根据文字处理器读取到的内容选择相应的网页页面模板进行填充属性和创建文本编辑框;

显示模块,用于显示文字处理器界面和网页页面界面;

筛选模块,用于在电子文本文件中查找筛选出需要建立超链接的字段;

查找模块,用于根据字段的属性及像素在初步形成的网络文本中查找到该字段;

网页编辑器,用于在查找到的字段中添加相应的超链接。

进一步的,所述文字处理器包括:

文字处理器文本转换单元,用于将扫描设备扫描到的纸质稿件的位图文件转换为文字处理器可处理的文字处理器文本文件;

读取单元,用于读取文字处理器文本文件内的每一列的内容;

文字处理界面生成模块,用于生成文字处理器文本转换单元和读取单元运行过程中的用户可操作界面。

进一步的,所述网页编辑模块包括:

文本编辑框创建单元,用于根据文字处理器读取到的文字处理器文本文件中的偶数列的内容进行创建文本编辑框;

网页页面模板预生成选择单元,用于在生成网页页面之前生成网页页面模板,并且根据文字处理器读取到的文字处理器文本文件中的内容进行选择合适的网页页面模板;

网页页面界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页页面。

进一步的,所述网页编辑模块还包括:

属性填充单元,用于根据文字处理器文本文件中的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字段;

网页页面优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充。

与现有技术相比,本发明的有益效果是:

通过一扫面设备扫描纸质稿件的内容形成位图文件,并通过文字处理软件将位图文件转换为电子文本文件,再通过网页编辑器将电子文本文件读取到的文字数据进行填充到网页中形成初步的网络文本。通过一连接自动筛选设备在电子文本文件中查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,并通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面,转换效率高,节省人力,耗费时间少。

具体实施方式

以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

实施例1

本具体实施方式披露了一种纸质稿件转换为网络文本页面的方法,包括如下步骤:

步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件。在本发明的一个可行的具体实施方式中,可以通过手持式扫描仪或者立式扫描仪进行扫描纸质稿件,并且通过扫描仪连接计算机处理设备将扫描到的图像以tif位图文件的形式进行保存。扫描过程中避免可见光照射影响扫描的质量。采用手持式扫描仪进行扫描时,应当在光线较暗的空间内将纸质稿件平铺在平面上进行扫描。采用立式扫描仪进行扫描时则需要将纸质稿件置于扫面盖板下方并盖紧盖板,不漏亮光。在本发明的其他具体实施例中,位图文件还可以是其他格式,例如BMP文件。

优选的,图像扫描设备还可以是数码相机或者手机等图像采集类设备,采用数码相机或者手机进行获取图像能够有效的避免图像扫描设备在扫描过程中的曝光问题。

步骤二:通过文字处理器将位图文件转换为文字处理器文本文件。在本发明的一个可行的具体实施例中,可以采用Office Document Imaging软件作为文字处理器,并通过其自带的OCR文本识别功能将tif文件转成文字文本网页文本。OCR文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。在本发明的其他具体实施例中,还可以通过其他带有图像文字功能的文字处理器进行,例如汉王软件,WPS等。

步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件中的文本元素插入网页页面模板中,生成初步的网页页面。

优选的,在选择网页页面模板之前预先设置多个网页页面模板,通过网页编辑器在插入网页页面时,自动生成网页页面模板供选择。可行的,在本发明的一个具体实施方式中,可以通过一网页页面模板服务器进行提供网页页面模板。

优选的,选择网页页面模板时根据文字处理器文本文件中的文本内容选择页面属性接近的网页页面模板。具体的,是根据文字文本网页文本中表格的尺寸和样式选择最接近的网页页面模板。

确定好网页页面模板之后,根据文字处理器文本文件中的文本内容插入标题和文本修饰控件,所述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用于对网页文本文字进行修饰。

优选的,初步生成的网页页面的填充内容是按照奇数列与偶数列区分的方式读取到的文字处理器文本文件中的内容,其中,奇数列的内容作为变量,偶数列的内容作为文本编辑框,并且变量与文本编辑框一一对应。变量是表格需要填写的内容,其通过空间控制在网页上可供用户进行填写。

最终上传到网页上的网页页面通过文本修饰控件生成。

此外,为使得网页页面更具有美观性,可以根据文字处理器文本文件中的文字的字体对网页页面填充内容进行调整。可行的,可以将字体数据信息转换为像素单位填充到网页页面中,再根据像素单位进行调整网页页面字段的大小属性。而网页页面内填充的文字信息则是文字处理器文本文件中的文字转换为命名文本元素的字段,优选的,所述命名文本元素的字段为拼音字段或英文字段,其根据文字处理器文本文件中的文字的拼音或者英文同义得到。

采用上述方法获得的文本能够直接放到网页上作为form的流程文本,使用方便,能够有效的提高纸质稿件上传到网页的效率。

步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。可行的,网络文本页面的标题根据电子文本文件的标题建立,其与电子文本文件的标题之间建立对应的映射关系,当电子文本文件的标题发生改变时候,例如字体和颜色的变化等,则网络文本页面根据像素及属性进行相应的改变,使之成为最终的网络文本。

实施例2

本具体实施方式披露了一种纸质稿件转换为网页页面的系统,包括:

扫描设备,用于扫描纸质稿件,并生成位图文件。优选的,扫描设备可以采用立式扫描仪、手持式扫描仪、数码相机或者手机等图像采集设备。扫描得到的图像存储为tif格式、BMP格式等位图文件格式,采用位图文件进行存储图像,图像失真度小,能够有效的位置纸质稿件的原状。

连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块。优选的,可以通过一数据交换机将扫描设备、文字处理器、网页编辑模块和显示设备相连接,扫描设备将文件传送给文字处理器,文字处理器与网页编辑模块之间相互传送数据,而显示模块则接收文字处理器和网页编辑模块传送的显示信息数据。

文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器文本文件,并且读取文字处理器文本文件内每一列的内容。可行的,文字处理器可以是自带的OCR文本识别功能软件,例如Office Document Imaging软件、汉王和WPS等。

优选的,文字处理器包括文字处理器文本转换单元,用于将扫描设备扫描到的纸质稿件的位图文件转换为文字处理器可处理的文字处理器文本文件。

读取单元,用于读取文字处理器文本文件内的每一列的内容。

文字处理界面生成模块,用于生成文字处理器文本转换单元和读取单元运行过程中的用户可操作界面,具体的是将读取文字处理器文本文件内容、选择内容等通过控件菜单选择的形式呈现给用户供用户选择。

此外,网页编辑模块用于在网页编辑过程中生成网页页面,并且根据文字处理器读取到的内容选择相应的网页页面模板进行填充属性和创建文本编辑框。

优选的,所述网页编辑模块包括,文本编辑框创建单元,其用于根据文字处理器读取到的文字处理器文本文件中的偶数列的内容进行创建文本编辑框。

还包括一网页页面模板预生成选择单元,用于在生成网页页面之前生成网页页面模板,并且根据文字处理器读取到的文字处理器文本文件中的内容进行选择合适的网页页面模板。在选择合适的网页页面模板之后,通过一表格生成控件进行生成表格,用户通过点击控件形成需要的表格。优选的,用户在点击控件之后,还会在操作界面弹出一属性选择对话框,用户可以在对话框内选择表格的属性,包括底纹、颜色、尺寸调节和字体大小等,具体的各个属性的名称根据文字处理器内的文本的字段来确认。

还包括一网页页面界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页页面。用户通过在用户可操作界面内进行选择控制网页编辑模块运行过程。

优选的,网页编辑模块还包括一属性填充单元,用于根据文字处理器文本文件中的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字段。可行的,在本发明的一个具体实施方式中,可以采用字段的拼音或者英文作为命名文本。

优选的,网页编辑模块还包括一网页页面优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充。

显示模块,用于显示文字处理器界面和网页页面界面。可行的,在本发明的一个具体实施方式中,可以采用一液晶显示器进行显示,其同时作为文字处理器和网页编辑模块的显示设备。用户能够在该液晶显示器上看到操作的步骤和过程中的网页页面。并且用户还以通过该液晶显示其看到网页编辑的内容。

筛选模块,用于在电子文本文件中查找筛选出需要建立超链接的字段,其中需要建立超链接的字段可以通过建立一个流行网络超链接数据库,通过查找筛选将数据库中与电子文本文件中重合的部分插入超链接。

查找模块,用于根据字段的属性及像素在初步形成的网络文本中查找到该字段。

网页编辑器,用于在查找到的字段中添加相应的超链接。

上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1