一种教学资料搜索方法、系统、设备及存储介质与流程

文档序号:21031319发布日期:2020-06-09 20:12阅读:183来源:国知局
一种教学资料搜索方法、系统、设备及存储介质与流程

本申请涉及电子教学技术领域,具体而言,涉及一种教学资料搜索方法、系统、设备及存储介质。



背景技术:

目前,随着科技的进步,人工智能在近阶段得到迅速发展,开始应用在各行各业;而教育是民族振兴和社会进步的重要基石。因此,将人工智能与教育相结合,从而帮助老师更好的进行授课,提高教学效率和教学质量,如何充分利用现有的题库和课程内容库来更好的辅助老师的教学是研究的重点。老师在备课搜索题目和课程内容时现有的常见的方法包括:一是通过搜索引擎网站进行搜索,然而各种资料种类繁杂,老师很难轻易找到适合的题目;二是通过专门的题库类网站,但是网站自带的搜索功能使用体验很差,无法实现细微知识点的题目的搜索。



技术实现要素:

本申请实施例的目的在于提供一种教学资料搜索方法、系统、设备及存储介质,该教学资料搜索方法可实现提高搜索体验和搜索效率的技术效果。

第一方面,本申请实施例提供了一种教学资料搜索方法,包括:对教学资料数据库中的教学资料进行归类,并生成索引信息;根据所述索引信息,生成索引数据库,所述索引数据库与所述教学资料数据库对应;根据输入信息,在所述索引数据库中搜索,生成索引集合;根据所述索引集合,获取所述教学资料数据库中对应的教学资料。

在上述实现过程中,该教学资料搜索方法通过对教学资料数据库中的教学资料进行归类,并根据归类后的教学资料生成索引数据库,一方面为用户提供基于细分知识点的教学资搜索,提高搜索的准确性;另一方面,通过在索引数据库中搜索教学资料,避免访问教学资料的原始文档,大大提高了搜索的速度。通过上述方式,实现提高搜索体验和搜索效率的技术效果。

进一步地,所述对教学资料数据库中的教学资料进行归类,包括:获取归类特征信息,所述归类特征信息包括知识点信息、教学点信息、年级信息、教版信息;根据所述归类特征信息,对所述教学资料进行归类。

在上述实现过程中,归类特征信息可以给教学资料数据库中的教学资料进行归类整理。其中,归类特征信息可以自由设置和组合;根据设置好的归特征信息,对教学资料进行归类,例如,对某一具体题目或者学习材料,找到对应的知识点名称,同时依次找到其所属的教学点、章、节、年级、版本等信息,做好归类合并整理,从而为精确搜索服务。

进一步地,所述生成索引信息,包括:获取分词组件和教育词库;根据筛选模型,删除所述教学资料的原始文档中的无效字符;根据所述分词组件和所述教育词库,对所述教学资料的原始文档进行语义处理,并生成索引信息。

在上述实现过程中,通过将教学资料数据库中的教学资料进行处理,并生成与教学资料相对应的索引信息,进而实现简化检索过程和提高检索效率的技术效果。

进一步地,所述根据输入信息,在所述索引数据库中搜索,生成索引集合,包括:对所述输入信息进行语义处理,生成输入语义处理结果;根据所述输入语义处理结果,在所述索引数据库中搜索,生成初始索引集合;计算所述输入信息和所述初始索引集合的相关性,并根据所述相关性对所述初始索引集合内的元素进行排序。

在上述实现过程中,输入信息为用户输入的关键词;根据用户输入的关键词,在索引数据库中搜索所后,生成与关键词对应的初始索引集合。然后,通过计算输入信息和初始索引集合的相关性,完成对初始索引集合内的元素进行排序过程,并生成索引集合。通过上述方式,完成对用户输入的关键词的搜索过程。

第二方面,本申请实施例提供了一种教学资料搜索系统,包括:归类单元,用于对教学资料数据库中的教学资料进行归类,并生成索引信息;第一生成单元,用于根据所述索引信息,生成索引数据库,所述索引数据库与所述教学资料数据库对应;第二生成单元,用于根据输入信息,在所述索引数据库中搜索,生成索引集合;第一获取单元,用于根据所述索引集合,获取所述教学资料数据库中对应的教学资料。

进一步地,所述系统还包括:第二获取单元,用于获取归类特征信息,所述归类特征信息包括知识点信息、教学点信息、年级信息、教版信息;归类单元还用于根据所述归类特征信息,对所述教学资料进行归类。

进一步地,所述系统还包括:第三获取单元,用于获取分词组件和教育词库;删除单元,用于根据筛选模型,删除所述教学资料的原始文档中的无效字符;第三生成单元,根据所述分词组件和所述教育词库,对所述教学资料的原始文档进行语义处理,并生成索引信息。

进一步地,所述系统还包括:语义处理单元,用于对所述输入信息进行语义处理,生成输入语义处理结果;第四生成单元,用于根据所述输入语义处理结果,在所述索引数据库中搜索,生成初始索引集合;排序单元,用于计算所述输入信息和所述初始索引集合的相关性,并根据所述相关性对所述初始索引集合内的元素进行排序。

第三方面,本申请实施例提供的一种设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。

第四方面,本申请实施例提供的一种存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的方法。

第五方面,本申请实施例提供的一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面任一项所述的方法。

本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种教学资料搜索方法的示意性流程图;

图2为本申请实施例提供的一种教学资料搜索方法的示意性流程图;

图3为本申请实施例提供的一种教学资料搜索系统的示意性框图;

图4为本申请实施例提供的一种教学资料搜索系统的示意性框图;

图5为本申请实施例提供的一种设备的结构框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

本申请实施例提供的一种教学资料搜索方法、系统、设备及存储介质,可应用于教学领域中;该教学资料搜索方法通过对教学资料数据库中的教学资料进行归类,并根据归类后的教学资料生成索引数据库,一方面为用户提供基于细分知识点的教学资搜索,提高搜索的准确性;另一方面,通过在索引数据库中搜索教学资料,避免访问教学资料的原始文档,大大提高了搜索的速度。通过上述方式,实现提高搜索体验和搜索效率的技术效果。

请参见图1,图1为本申请实施例提供的一种教学资料搜索方法的示意性流程图,该教学资料搜索方法包括如下步骤:

步骤s100:对教学资料数据库中的教学资料进行归类,并生成索引信息。

示例性地,教学资料数据库中的教学资料包括教师所需的各种教学资料,包括题库和课程内容库;例如,高中阶段的数学、英语、语文、历史、地理、化学、生物、物理、思想政治等科目的题目或课程内容等。

在一些实施方式中,教学资料数据库可以连接mysql数据库,从而对某一具体题目或者学习材料,找到其对应的知识点名称,同时依次找到其所属的教学点、章、节、年级、版本等信息,做好归类合并整理,为精确搜索服务。

示例性地,mysql数据库是一种开放源代码的关系型数据库管理系统(rdbms),使用数据库管理语言:结构化查询语言(sql)进行数据库管理。其中,mysql数据库为开放源代码,因此可以在generalpubliclicense的许可下下载并根据个性化的需要对其进行修改。由于mysql数据库在速度、可靠性和适应性的优异性能,mysql数据库是管理内容较好的选择之一。

步骤s200:根据索引信息,生成索引数据库,索引数据库与教学资料数据库对应。

示例性地,根据索引信息生成索引数据库,从而使索引数据库与教学资料数据库相对应;根据索引信息,可以反向溯源至对应的教学资料。

步骤s300:根据输入信息,在索引数据库中搜索,生成索引集合。

示例性地,输入信息为用户在进行搜索时输入的关键词;根据用户输入的关键词,在索引数据库中进行搜索,生成索引集合。

步骤s400:根据索引集合,获取教学资料数据库中对应的教学资料。

示例性地,由于索引数据库和教学资料数据库中的对应关系,根据索引集合的索引信息,可获取教学资料相对应的教学资料。从而,该教学资料搜索方法通过对教学资料数据库中的教学资料进行归类,并根据归类后的教学资料生成索引数据库,一方面为用户提供基于细分知识点的教学资搜索,提高搜索的准确性;另一方面,通过在索引数据库中搜索教学资料,避免访问教学资料的原始文档,大大提高了搜索的速度。通过上述方式,实现提高搜索体验和搜索效率的技术效果。

在一些实施方式中,步骤s100包括:获取归类特征信息,归类特征信息包括知识点信息、教学点信息、年级信息、教版信息;根据归类特征信息,对教学资料进行归类。

示例性地,归类特征信息可以给教学资料数据库中的教学资料进行归类整理。其中,归类特征信息可以自由设置和组合;根据设置好的归特征信息,对教学资料进行归类,例如,对某一具体题目或者学习材料,找到对应的知识点名称,同时依次找到其所属的教学点、章、节、年级、版本等信息,做好归类合并整理,从而为精确搜索服务。

在一些实施方式中,步骤s100中的生成索引信息,包括:获取分词组件和教育词库;根据筛选模型,删除教学资料的原始文档中的无效字符;根据分词组件和教育词库,对教学资料的原始文档进行语义处理,并生成索引信息。

示例性地,作为示例而非限定,生成索引信息的具体过程可以为:首先导入ikanalyzer分词组件和专业的教育词库以支持中文文本类型的分词;之后按照筛选模型,对教学资料的原始文档进行分词,并去除标点符号和停用词等;然后将得到的词传给solr的语言处理组件进行语义上的处理;最后将处理后的词传给solr的索引组件生成反向索引,包括字符串序列和字符串的文档编号。其中,教学资料的原始文档中包括题目的题干、答案、解析、知识点名称、教学点名称、章节点名称、年级、教版等信息。

示例性地,solr是一个独立的企业级搜索应用服务器,它对外提供类似于web-service的api接口;用户可以通过http请求,向搜索引擎服务器提交一定格式的xml文件,生成索引;也可以通过httpget操作提出查找请求,并得到xml格式的返回结果。例如,文档通过http利用xml加到一个搜索集合中,查询该集合也是通过http收到一个xml/json响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大dataschema来定义字段,类型和设置文本分析,提供基于web的管理界面等。

示例性地,ikanalyzer分词组件是一个开源的,基于java语言开发的轻量级的中文分词工具包。

示例性地,筛选模型提供去除标点符号以及停用词的筛选标准。

在一些实施方式中,步骤s300中的生成索引集合,可以对索引集合内的元素进行相关性排序。

请参见图2,图2为本申请实施例提供的一种教学资料搜索方法的示意性流程图,该教学资料搜索方法包括如下步骤:

步骤s310:对输入信息进行语义处理,生成输入语义处理结果。

步骤s320:根据输入语义处理结果,在索引数据库中搜索,生成初始索引集合。

步骤s330,计算输入信息和初始索引集合的相关性,并根据相关性对初始索引集合内的元素进行排序。

示例性地,输入信息为用户输入的关键词;根据用户输入的关键词,在索引数据库中搜索所后,生成与关键词对应的初始索引集合。需要注意的是,此时初始索引集合内的元素尚未进行相关性排序。

示例性地,生成初始索引集合后,通过计算输入信息和初始索引集合的相关性,完成对初始索引集合内的元素进行排序过程,并生成索引集合。通过上述方式,完成对用户输入的关键词的搜索过程。

在一些实施方式中,作为示例而非限定,生成索引集合的具体过程可按照如下方式进行:首先利用自然语言处理等相关方法对查询内容进行语义上的分析和处理;然后搜索索引数据库,得到符合要求的文档信息,生成初始索引集合;最后计算初始索引集合的文档信息与输入信息的相关性,根据相关性对初始索引集合内的元素进行排序,从而最终生成索引集合。通过上述防暑,保证了在进行搜索的时候,不需要访问所有的原始文档,从而大大提高了搜索的速度。

在一些实施方式中,输入信息可包括多个关键词,进行多个关键词的搜索;在一些场景中,该教学资料搜索方法可分别为每个关键词搜索相应的索引信息,之后取共同的索引信息作为搜索的结果,从而完成多个关键词的检索过程。

在一些实施方式中,输入信息可以是汉字或拼音;再步骤s300之前,该教学资料搜索方法中还包括:对输入信息完成拼写检查。

在一些实施方式中,在步骤s400之后,该教学资料搜索方法还包括:将搜索到的教学资料,分发给课堂的学生,提高教学效率。

在一些实施方式中,步骤s400中通过使用spring的开源应用框架,一方面支持对具体细分的目录进行搜索,另一方面支持直接关键字搜索。

在一些实施场景中,该教学资料搜索方法通过对教学资料数据库中的教学资料进行归类,并根据归类后的教学资料生成索引数据库,一方面为用户提供基于细分知识点的教学资搜索,提高搜索的准确性;另一方面,通过在索引数据库中搜索教学资料,避免访问教学资料的原始文档,大大提高了搜索的速度。通过上述方式,实现提高搜索体验和搜索效率的技术效果。

请参见图3,图3为本申请实施例提供的一种教学资料搜索系统的示意性框图,该教学资料搜索系统包括:

归类单元100,用于对教学资料数据库中的教学资料进行归类,并生成索引信息。

第一生成单元200,用于根据索引信息,生成索引数据库,索引数据库与教学资料数据库对应。

第二生成单元300,用于根据输入信息,在索引数据库中搜索,生成索引集合。

第一获取单元400,用于根据索引集合,获取教学资料数据库中对应的教学资料。

在一些实施方式中,该教学资料搜索系统还包括:第二获取单元,用于获取归类特征信息,归类特征信息包括知识点信息、教学点信息、年级信息、教版信息;归类单元还用于根据归类特征信息,对教学资料进行归类。

在一些实施方式中,该教学资料搜索系统还包括:第三获取单元,用于获取分词组件和教育词库;删除单元,用于根据筛选模型,删除教学资料的原始文档中的无效字符;第三生成单元,根据分词组件和教育词库,对教学资料的原始文档进行语义处理,并生成索引信息。

应理解,图3中各个单元与图1中教学资料搜索方法的步骤相对应,为避免重复,此处不再赘述。

请参见图4,图4为本申请实施例提供的一种教学资料搜索系统的示意性框图,该教学资料搜索系统包括:

语义处理单元310,用于对输入信息进行语义处理,生成输入语义处理结果。

第四生成单元320,用于根据输入语义处理结果,在索引数据库中搜索,生成初始索引集合。

排序单元330,用于计算输入信息和初始索引集合的相关性,并根据相关性对初始索引集合内的元素进行排序。

应理解,图4中各个单元与图2中教学资料搜索方法的步骤相对应,为避免重复,此处不再赘述。

本申请还提供一种设备,请参见图5,图5为本申请实施例提供的一种设备的结构框图。设备可以包括处理器510、通信接口520、存储器530和至少一个通信总线540。其中,通信总线540用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口520用于与其他节点设备进行信令或数据的通信。处理器510可以是一种集成电路芯片,具有信号的处理能力。

上述的处理器510可以是通用处理器,包括中央处理器(cpu,centralprocessingunit)、网络处理器(np,networkprocessor)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器510也可以是任何常规的处理器等。

存储器530可以是,但不限于,随机存取存储器(ram,randomaccessmemory),只读存储器(rom,readonlymemory),可编程只读存储器(prom,programmableread-onlymemory),可擦除只读存储器(eprom,erasableprogrammableread-onlymemory),电可擦除只读存储器(eeprom,electricerasableprogrammableread-onlymemory)等。存储器530中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器510执行时,设备可以执行上述图1至图2方法实施例涉及的各个步骤。

可选地,设备还可以包括存储控制器、输入输出单元。

所述存储器530、存储控制器、处理器510、外设接口、输入输出单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线540实现电性连接。所述处理器510用于执行存储器530中存储的可执行模块,例如设备包括的软件功能模块或计算机程序。

输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设执行时间以实现用户与服务器的交互。所述输入输出单元可以是,但不限于,鼠标和键盘等。

可以理解,图5所示的结构仅为示意,所述设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。

本申请实施例还提供一种存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,所述计算机程序被处理器执行时实现方法实施例所述的方法,为避免重复,此处不再赘述。

本申请还提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1