一种题库构建方法

文档序号:6637268阅读:195来源:国知局
一种题库构建方法【专利摘要】本发明公开了一种题库构建方法,该方法包括:收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件将保存到指定目录中;根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;之后将第一目录中的word源文件转换为html文件,将所述html文件保存到web服务器的指定位置,最后根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。通过本发明的方法提高了基础题库构建的效率以及题库的质量。【专利说明】一种题库构建方法【
技术领域
】[0001]本发明涉及数字化处理【
技术领域
】,具体涉及一种基于python语言和java语言的题库构建方法。【
背景技术
】[0002]伴随着计算机技术和网络时代的推进,在线教育产品/系统在人们生活和学习过程中已经得到了越来越多的应用。与此同时,PC端、移动端的一些旨在方便用户针对性练习的辅助类教育系统/产品也越来越丰富。而这些系统,均需要以题库系统作为支撑来展开服务。因此,如何快捷、高效的构建题库系统,成为此类系统中急需解决的问题。[0003]题库系统的建设一般分题目数据采集、题目数据解析、题目数据入库等操作。一般情况,对于IT企业来说,题目数据采集的方式是通过开发基于编辑器的web应用,实现题目数据的在线录入。该方案的缺点是:首先,习题录入时操作流程较为复杂,导致开发成本较高。另外,使用编辑器,只能实现单道题目录入,而且如果题目中包含大量图片,录入操作时效率会非常低,因而导致人力成本较高,而且也不能有效检查错误。【
发明内容】[0004]针对现有技术中存在的缺陷,本发明的目的在于提供一种题库构建方法,提高题库的构建效率和题库的质量。[0005]为实现上述目的,本发明采用的技术方案为:一种题库构建方法,包括以下步骤:[0006](I)收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件保存到指定目录中;[0007](2)根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;[0008](3)将第一目录中的word源文件转换为html文件,并将所述html文件保存到web服务器的指定位置;[0009](4)根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。[0010]进一步,如上所述的一种题库构建方法,步骤(3)中,将word源文件转换为html文件的方式为:[0011]将word源文件转换为表格格式文件,将表格格式文件转换为html文件。[0012]进一步,如上所述的一种题库构建方法,步骤(I)中,所述习题文件包括教师制作的习题。[0013]进一步,如上所述的一种题库构建方法,步骤(I)中,所述设定格式包括习题属性和习题内容;所述习题属性包括习题的来源、年份、关键字、题型和难度;所述习题内容包括习题、答案和解析。[0014]进一步,如上所述的一种题库构建方法,步骤(2)中,当word源文件校验失败时,所述方法还包括:[0015]对于检验失败的word源文件生成错误日记;[0016]编辑人员根据所述错误日志对于第二目录中的word源文件进行修改;[0017]对修改后的word文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。[0018]进一步,如上所述的一种题库构建方法,步骤(4)中,将解析后的数据保存到数据库服务器中是指将解析后的字符数据保存到数据库服务器中;如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。[0019]进一步,如上所述的一种题库构建方法,步骤⑵和步骤(3)中,通过python脚本语言实现对word源文件的校验和文件的转换。[0020]进一步,如上所述的一种题库构建方法,步骤(4)中,通过java脚本语言实现对html文件的解析。[0021]本发明的有益效果在于:本发明提供了一种根据word源文件自动校验、提取习题数据并存储的方案,该方案能够批量校验、转化源word文件为目标格式,并且可将转换后的文件批量解析、存储到数据库中,通过本发明的方法提高了基础题库构建的效率,且习题数据经校验后,质量明显提高。【专利附图】【附图说明】[0022]图1为本发明实施例中一种题库构建方法的流程图;[0023]图2为本发明实施例中一种题库构建方法的详细流程图;[0024]图3为本发明实施例中word源文件的示意图;[0025]图4为本发明实施例中表格格式文件的示意图。【具体实施方式】[0026]下面结合说明书附图与实施例对本发明做进一步的详细说明。[0027]本发明是针对现有传统的基于界面录入的习题收集方式效率差的问题,而提出的一种题库构建方法,该方法能够实现对习题文件的自动验证、数据提取,提高了题库的构建的效率,且能够有效提高题库的质量。[0028]图1和图2示出了本发明实施例中一种题库构建方法的流程图,由图中可以看出,该方法可以包括以下步骤:[0029]步骤Sll:收集习题文件并将习题保存到word源文件中;[0030]本实施例中,首先收集习题文件,将所述习题文件按照设定格式保存到word文件(初始文件,本实施例中称为word源文件)中,并将word源文件将保存到指定目录中。[0031]其中,所述习题文件的来源可以是多种,可以是教师制作的习题、也可以是网络上下载的习题或者课本上的习题等。完成习题的收集后,将习题按照word的设定格式保存到word中,得到word源文件,并将word源文件保存到指定目录中,如可以是保存到计算机D盘名称为“word”的文件夹中,及指定目录的路径为:D:\word。[0032]word的是设定格式可以根据需要进行设定。本实施例中,所述设定格式包括但不限于习题属性和习题内容;所述习题属性可以包括习题的来源、年份、关键字、题型、难度;所述习题内容可以包括习题、答案和解析。当然,习题内容中除了包括字符内容外,还有可能包括图片(如题目中的公式、示例图片或者题目本身所涉及到的一些网络图片等)等。[0033]如图2所示,是针对类型为选择题而设定的一种word格式,格式中包括了习题的来源学校、年份、关键字、题型、难度、题干(具体的习题)、选项、答案及解析。收集到一选择题后,将该选择题按照上述word格式后得到的word源文件如图3所示。[0034]步骤S12:对word源文件进行校验;[0035]完成word源文件的存储后,根据预设条件对所述word源文件进行校验,以提高生成的题库的质量。所述校验指的是对习题的属性和习题内容进行校验。例如,对图2中所示的源文件进行校验,主要是指针对word源文件中习题的题型、难度、题干及选型等信息进行校验。其中,预设条件是根据所需构建的题库的具体内容进行设置的,例如,需要构建的是单选题的题库,题目的来源年份也是设置好的,那么预设条件便可以使判断题目是否为单选,题目的年份是否符合预设年份等。根据预设条件对word源文件进行判断后,如果word源文件中的题目都符合预设条件,则说明检验通过,如果有其中一项或多项不符合,则校验失败。[0036]该步骤中,完成word源文件的校验后,将校验通过的word源文件保存到第一目录,即第一目录为success目录,将校验失败的word源文件保存到第二目录中,即第二目录为failure目录。[0037]此外,本实施例中,如果word源文件没有通过校验,此时根据校验失败的原因(如哪项预设条件检验没通过)对于检验失败的word源文件生成错误日记,以便编辑人员根据所述错误日志对于第二目录中的word源文件进行修改,在完成修改后,对修改后的word文件再次进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。通过该方式能够实现对第一目录中文件的完善。[0038]本实施例中,在实际应用中,对word源文件的校验,是基于python脚本语言实现的,通过python脚本语言开发出word校验程序,通过运行word校验程序实现对word源文件的批量校验。[0039]步骤S13:对校验通过的word源文件进行格式转换并存储;[0040]在完成word源文件的检验后,将校验通过的第一目录中的word源文件转换为表格格式即table格式,并将表格格式的文件转换为html文件,将所述html文件保存到web服务器的指定位置。为了节约存储资源,将html文件保存到web服务器时,一般是将html文件进行压缩后存储,如图3所示。[0041]在转换过程中,只是将word源文件的字符部分转换成table格式,如果word源文件中包括有图片,则图片不进行转换,而是直接将图片进行存储在指定的目录下,并建立转换后的文件与图片的关联即可。[0042]本实施例中,在实际应用中,对word源文件的转换(包括word格式转换为table格式和table格式转换为html格式),采用的也是是基于python脚本语言实现的,通过python脚本语言开发出相应的转换程序,通过运行转换程序实现文件的转换。如图4所示,为将图3中所示的word源文件转换为table格式后的示意图。当然,在进行word源文件的转换时,也可以此阿勇其它脚本语言实现,如c语言、java语言等,本实施例中采用采用python语言是因为其Win32接口对office的支持更强大,而且python语言相对于java语言等,更方便调用命令行。[0043]本实施例中,将word源文件装换为html文件时,是通过将word源文件首先转换为表格格式,再将表格格式转换为html格式,这是因为table格式转换成的html内容更规范,在后续步骤S14可以更方便快捷的对table格式转换后的html文件进行解析。[0044]步骤S14:根据数据库服务器的数据存储格式对转换后的html文件进行解析、存储。[0045]在步骤S13中完成文件的转换存储后,根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。其中,所述数据存储格式指的是用户根据需要设定的数据库中数据的存储形式。通过该步骤,将html文件解析成了数据库服务器中数据库所需要的数据格式,完成了数据库(题库)的构建。[0046]其中,所述的将解析后的数据保存到数据库服务器,指的是将解析后的字符内容(文字、数字等)保存到数据库服务器。在解析后,如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。[0047]本实施例中,对于html文件的读取与解析,采用的是基于java脚本语言实现的,通过java语言开发生成java习题导入解析程序,通过该程序读取指定位置的html文件并解析。当然,也可以采用其它的脚本语言进行html文件的解析。[0048]本发明所述的题库构建方法,采用word模板(模版中包含一些题目数据所需的必须属性)录入习题,由开发人员定制相应的校验、解析程序针对此类word进行批量处理,并存储到数据库。与现有的基于界面录入的习题收集方式相比,在word中录入习题明显比在界面录入操作更方便,针对收集来的习题,程序可以实现批量校验、转换等操作,题目质量明显更好,效率也明显更高。[0049]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。【权利要求】1.一种题库构建方法,包括以下步骤:(1)收集习题文件,将所述习题文件按照设定格式保存到word源文件中,并将word源文件保存到指定目录中;(2)根据预设条件对所述指定目录中的word源文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中;(3)将第一目录中的word源文件转换为html文件,并将所述html文件保存到web服务器的指定位置;(4)根据数据库服务器的数据存储格式,对所述指定位置的html文件进行解析,并将解析后的数据保存到数据库服务器中。2.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(3)中,将word源文件转换为html文件的方式为:将word源文件转换为表格格式文件,将表格格式文件转换为html文件。3.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(I)中,所述习题文件包括教师制作的习题。4.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(I)中,所述设定格式包括习题属性和习题内容;所述习题属性包括习题的来源、年份、关键字、题型和难度;所述习题内容包括习题、答案和解析。5.根据权利要求1至4之一所述的一种题库构建方法,其特征在于,步骤(2)中,当word源文件校验失败时,所述方法还包括:对于检验失败的word源文件生成错误日记;编辑人员根据所述错误日志对于第二目录中的word源文件进行修改;对修改后的word文件进行校验,将校验通过的word源文件保存到第一目录中,将校验失败的word源文件保存到第二目录中。6.根据权利要求5所述的一种题库构建方法,其特征在于,步骤(4)中,将解析后的数据保存到数据库服务器中是指将解析后的字符数据保存到数据库服务器中;如果解析后的数据包括字符数据和图片数据,则将解析后的图片数据保存到ftp服务器中。7.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(2)和步骤(3)中,通过python脚本语言实现对word源文件的校验和文件的转换。8.根据权利要求1所述的一种题库构建方法,其特征在于,步骤(4)中,通过java脚本语言实现对html文件的解析。【文档编号】G06F17/30GK104503992SQ201410728366【公开日】2015年4月8日申请日期:2014年12月4日优先权日:2014年12月4日【发明者】郭浩伟申请人:明博教育科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1