一种文件格式转换方法、装置及试题导入系统与流程

文档序号:12363963阅读:199来源:国知局
一种文件格式转换方法、装置及试题导入系统与流程

本发明涉及文档处理技术领域,尤其涉及一种文件格式转换的方法、装置及试题导入系统。



背景技术:

随着通讯技术的发展以及各种终端的普及,用户能够随时随地通过电子文件进行信息传递,由此也产生了各种类型及格式的文本文件,另一方面基于一些展示或网络传输等的需要,经常要将电子文件在各类文本文件的格式之间进行转换。

以网络在线的教学数据库系统为例,教学服务提供商在向服务器的数据库中导入文本时,通常采用WORD文本或TXT文本向数据库导入。这就需要在采用支持TXT文本的系统时需要将WORD文本转换为TXT文本。对于教学数据库系统,导入的数据中常常包含大量的公式,例如数学公式、化学公式、物理公式等。采用WORD文本导入方式向服务器导入文本时,往往将公式部分进行图片化,使各个公式以图片的形式向使用者(比如调用习题者)展示,但是将公式图片化的操作,使导入服务器的公式不能再次编辑;且仅能在电脑端体现,不能再ipad、手机等移动端显示或即使显示出来也常常与原始的文字说明出现排版错乱的现象;占用服务器或显示终端太多内存空间。采用TXT文本导入占用的资源较少,但是TXT文本通常为纯文本格式,没有任何文本修饰,没有任何粗体,下划线,斜体,图形,符号或特殊字符及特殊打印格式的文本,只保存文本,不保存其格式设置,因此不宜采用TXT文本编辑公式,即使采用WORD文本编辑,在将WORD文本转换为TXT文本时,也不能保存公式的格式。

因此有必要提供一种文件格式转换的方法、装置及试题导入系统,使得word文本转换为TXT文本后,能够正确保存其公式的格式,并能够对公式进行编辑。



技术实现要素:

本发明的主要目的在于提出一种文件格式转换的方法、装置及试题导入系统,旨在解决现有技术WORD文本转换为TXT文本时,不能保存公式的格式以及WORD文本上传到试题数据库之后不能对公式进行编辑的缺陷。

为实现上述目的,本发明提供的一种文件格式转换方法,所述方法包括步骤:

对WORD文本中的公式进行识别;

将识别出的公式转换成LATEX格式公式;

将所述WORD文本转换为TXT文本,所述TXT文本包含所述LATEX格式公式。

提供一种如上所述的文件格式转换方法,所述对WORD文本中的公式进行识别,包括:

通过office软件的宏技术识别所述WORD文本中公式编辑器的编辑对象,所述编辑对象即为所述WORD文本中的公式。

提供一种如上所述的文件格式转换方法,所述将识别出的公式转换成LATEX格式公式,包括:

将所述公式在所述WORD文本中的原位置处替换为LATEX格式公式,其中所述LATEX格式公式包含开始符号及结束符号,所述开始符号及结束符号之间的内容即为所述公式的内容的表达式。

提供一种如上所述的文件格式转换方法,在对WORD文本中的公式进行识别之前,所述方法还包括:

接收试题导入指令,所述试题导入指令包括需导入的试题;

对所述试题进行分析;

若所述试题为WORD文本,执行所述对WORD文本中的公式进行识别的动作。

提供一种如上所述的文件格式转换方法,在将所述WORD文本转换为TXT文本之后,所述方法还包括:

将所述TXT文本导入试题数据库中。

此外,为实现上述目的,本发明还提出一种文件格式转换装置,所述文件格式转换装置包括:

识别单元,用于对WORD文本中的公式进行识别;

公式转换单元,用于将识别出的公式转换成LATEX格式公式;

文本转换单元,用于在公式转换单元将识别出的公式转换成LATEX格式公式之后,将将所述WORD文本转换为TXT文本,所述TXT文本包含所述LATEX脚本。

提供一种如上所述的文件格式转换装置,所识别单元,还用于通过office软件的宏技术识别所述WORD文本中公式编辑器的编辑对象,所述编辑对象即为所述WORD文本中的公式。

提供一种如上所述的文件格式转换装置,所述公式转换单元,还用于将所述公式在所述WORD文本中的原位置处替换为LATEX格式公式,其中所述LATEX格式公式包含开始符号及结束符号,所述开始符号及结束符号之间的内容即为所述公式的内容的表达式。

为实现上述目的,本发明还提出一种试题导入系统,所述试题导入系统包括如上所述的文件格式转换装置、接收装置、分析装置及试题上传装置:

所述接收装置,用于接收试题导入指令,所述试题导入指令包括需导入的试题;

所述分析装置,用于对所述试题的文本格式进行分析,所述试题的文本格式包括WORD文本或者TXT文本;

所述文件格式转换装置,用于在所述试题的文本格式为WORD文本时,将所述WORD文本转换为TXT文本;

所述试题上传装置,用于在所述文件格式转换装置将所述WORD文本转换为TXT文本之后,将所述TXT文本上传到试题数据库,或者用于在所述试题的文本格式为TXT文本时,将所述TXT文本上传到所述试题数据库。

本发明提出的文件格式转换的方法、装置及试题导入系统,在将WORD文本转换成TXT文本时,可以对WORD文本中的公式进行识别并将识别出的公式转换成LATEX格式公式,然后再将WORD文本转换为TXT文本,这样WORD文本在转换成TXT文本后,其中的公式可以以LATEX格式公式的形式保存在TXT文本中,不仅能够正确保存公式内容的表达式,并能够在TXT 文本中对LATEX格式公式进行再次编辑,以满足各类电子显示设备对正确显示公式的需求。同时LATEX格式公式形式的数据量小,这样占用服务器或显示终端的内存空间也将会减小。

附图说明

图1为本发明实施例提供的一种文件格式转换方法的流程图;

图2为本发明实施例提供的另一种文件格式转换方法的流程图;

图3为本发明实施例提供的一种试题导入系统的模块结构示意图;

图4为图3所示试题导入系统中文件格式转换的模块结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。

本发明提出一种文件格式转换方法,请参阅图1,方法流程包括:

S110、对WORD文本中的公式进行识别;

实际应用中,WORD文本中的公式都是由公式编辑器编辑的,且公式常常以图片格式体现在WORD文本中,我们可利用office的宏技术对公式编辑器的编辑对象进行识别,该编辑对象便是WORD文本中的公式。

S120、将识别出的公式转换成LATEX格式公式;

具体的,该步骤包括:

WORD文本中原公式由LATEX格式公式替换,且LATEX格式公式依然位于在WORD文本中原公式中位置。替换LATEX格式公式包含开始符号及结束符号,他们分别用两个“$$”表示开始符号及结束符号。

LATEX格式公式的开始符号及结束符号之间,即为公式内容的表达式。

通过将LATEX格式公式替换原公式在该WORD文本中的位置上,可以保证与转换后LATEX格式公式与WORD文本中的文字保持正确的前后对应位置关系。

LATEX格式公式的开始符号和结束符号当前用两个“$$”表示,当然,也可以根据LATEX代码定义,选取合适的符号作为开始符号及结束符号。具体的,在将公式转换成LATEX格式公式时,也可以利用LATEX编辑器进行转换。

实际应用中,利用WORD的公式编辑器对WORD文本中公式的识别以及将公式转换成LATEX格式公式LATEX格式公式,均可以通过office软件提供的开发者工具进行编程实现。

S130、将该WORD文本转换为TXT文本,该TXT文本包含该LATEX格式公式。

本实施例的文件格式转换的方法,在将WORD文本转换成TXT文本时,可以对WORD文本中的公式进行识别并将识别出的公式转换成LATEX格式公式,然后再将WORD文本转换为TXT文本,这样WORD文本在转换成TXT文本后,其中的公式可以以LATEX格式公式的形式保存在TXT文本中,不仅能够正确保存公式内容的表达式,并能够在TXT文本中对LATEX格式公式进行再次编辑,以满足各类电子显示设备对正确显示公式的需求。同时LATEX格式公式形式的数据量小,这样占用服务器或显示终端的内存空间也将会减小。

在上述实施例的基础上,本发明还提供了另一种文件格式转换的方法,本实施例以教学系统的试题导入为例对上述方法进行说明,请参阅图2,方法流程包括:

S210、接收试题导入指令,该试题导入指令包括需导入的试题;

S220、对该试题进行分析,若该试题为WORD文本,执行步骤S230;若该试题为TXT文本,执行步骤S240;

S230、对WORD文本中的公式进行识别;

具体的,可以通过office软件的宏技术识别该WORD文本中公式编辑器的编辑对象,该编辑对象即为该WORD文本中的公式。

本实施例中,假设导入试题的某段WORD文本为:

“当m=7,n=3时,执如图所示的程序框图”

如果“m=7,n=3”是通过WORD软件的公式编辑器输入的,那么在进行识别时“m=7,n=3”将会被识别为公式。

S231、将识别出的公式转换成LATEX格式公式;

具体的,该步骤包括:

将所述公式在所述WORD文本中的原位置处替换为LATEX格式公式,其中所述LATEX格式公式包含开始符号及结束符号,所述开始符号及结束符号之间的内容即为所述公式的内容的表达式。

本步骤中“当m=7,n=3时,执如图所示的程序框图”,公式“m=7,n=3”将会被转换为LATEX格式公式,转换结果如下:

“当$$m=7,n=3$$时,执行如图所示的程序框图”

此时,LATEX格式公式在WORD文本中的位置与原公式的位置相同。

S232、将该WORD文本转换为TXT文本,该TXT文本包含该LATEX格式公式,执行步骤S240;

S240、将该TXT文本导入试题数据库中。

当试题的TXT文本导入试题数据库之后,计算机可以通过LATEX代码的开始符号及结束符号识别出TXT文本中的LATEX格式公式,并在该试题被调用时根据LATEX格式公式将原公式显示出来。并且,由于LATEX格式公式的可编辑性,在试题的TXT文本导入试题数据库之后,也能够在核查出该试题公式错误时直接对公式进行修改,操作方便。

本实施例的文件格式转换的方法,在将WORD文本上传到试题数据库之前,可以对WORD文本中的公式进行识别并将识别出的公式转换成LATEX格式公式,然后将WORD文本转换为TXT文本,这样WORD文本在转换成TXT文本后,其中的公式可以以LATEX格式公式的形式保存在TXT文本中,再将TXT文本上传到试题数据库中,不仅能够正确保存公式的格式,而且在上传后也能对公式进行编辑,并且由于LATEX文本被大多数终端ipad、手机等支持,因此试题中的公式也能够在ipad、手机等支持LATEX文本的终端正确的显示。

在上述实施例的基础上,本发明进一步提供一种试题导入系统。请参阅图3,该系统包括:文件格式转换装置310、接收装置320、分析装置330及试题上传装置340。

该接收装置320,用于接收试题导入指令,该试题导入指令包括需导入的试题。

该分析装置330,用于对该试题的文本格式进行分析,期中试题的文本格式包括WORD文本或者TXT文本。

该文件格式转换装置310,用于在该试题的文本格式为WORD文本时,将该WORD文本转换为TXT文本。

具体的,文件格式转换装置310,请参阅图4,该文件格式转换装置310包括识别单元311、公式转换单元312及文本转换单元313。其中:

识别单元311,用于对WORD文本中的公式进行识别。具体的,该识别单元可以通过office软件的宏技术识别该WORD文本中公式编辑器的编辑对象,该编辑对象即为该WORD文本中的公式。

公式转换单元312,用于将识别出的公式转换成LATEX格式公式。具体的,该公式转换单元312将所述公式在所述WORD文本中的原位置处替换为LATEX格式公式,其中所述LATEX格式公式包含开始符号及结束符号,所述开始符号及结束符号之间的内容即为所述公式的内容的表达式间。

文本转换单元313,用于在公式转换单元312将识别出的公式转换成LATEX格式公式之后,将该WORD文本转换为TXT文本,该TXT文本包含该LATEX格式公式。

该试题上传装置340,用于在文件格式转换装置将该WORD文本转换为TXT文本之后,将该TXT文本之后上传到试题数据库中,或者用于在该试题的格式为TXT文本时,直接将该TXT文本上传到试题数据库。

本实施例的试题导入系统,可以在接收到需要导入的试题时,对导入的试题进行分析,并在分析出试题为WORD文本时,将WORD文本中的公式转换成LATEX格式公式,再将WORD文本转换成TXT文本,因此WORD文本中的公式可以以LATEX格式公式的形式保存在TXT文本中,在将TXT文本上传到试题数据库之后,不仅能够正确保存公式的格式,而且在上传后也能对LATEX格式公式进行再次编辑,并且由于LATEX文本被大多数终端 ipad、手机等支持,因此试题中的公式也能够在ipad、手机等支持LATEX文本的终端正确的显示。另外,LATEX格式公式形式的数据量小,这样占用服务器或显示终端的内存空间也将会减小。

需要说明的是,实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1