基于图片识别的教育资源定位系统及方法与流程

文档序号:16881003发布日期:2019-02-15 22:08阅读:235来源:国知局
基于图片识别的教育资源定位系统及方法与流程

本发明涉及信息化教育领域,尤其涉及一种基于图片识别的教育资源定位系统及方法。



背景技术:

传统的教育资源搜索由用户通过平板电脑等教育电子学习设备或在线输入文字作为关键字启动搜索引擎后返回学习资源。传统的教育资源搜索由用户输入关键字进行搜索的方法不需要在本地或服务器上预存针对纸质课本按页扫描的原始图片,仅存储教育资源库模块,由搜索引擎应用程序直接将输入关键字在教育资源库模块中进行信息匹配并返回给用户搜索结果。

然而,传统的教育资源搜索仅能将文字作为输入关键字,无法方便地输入图形、图片、公式、方程式等复杂的信息作为输入关键信息,用户操作繁琐,搜索结果模糊内容繁多不够精准,用户需多次定位才能找到最准确的搜索结果,导致搜索效率及学习效率不高。



技术实现要素:

本发明要解决的技术问题在于,提供一种改进的基于图片识别的教育资源定位系统及方法。

本发明解决其技术问题所采用的技术方案是:提供一种基于图片识别的教育资源定位系统,包括

资源获取装置,所述资源获取装置包括

图片获取装置,用于获取外部图片;

图片识别装置,与所述图片获取装置相连接,用于根据所获取的所述外部图片进行图片识别,并输出识别结果;

匹配装置,与所述图片识别装置相连接,用于根据所述识别结果选择性地进行数据匹配,并输出匹配结果;

输出装置,与所述匹配装置相连接,用于根据所述匹配结果输出对应的教育资源包中相应的资源内容;

所述系统还包括:

图片服务器原始图片库模块,用于存储若干图片服务器原始图片;

教育资源库模块,用于存储若干教育资源包;

原始图片及索引库模块,用于存储若干原始图片及索引包,每一所述原始图片及索引包包含一原始图片文件夹及一《原始图片索引表》,所述原始图片文件夹内包含对应纸质课本按页扫描后生成的原始图片,所述《原始图片索引表》内每条索引对应所述原始图片文件夹里相应的一所述原始图片;每一所述纸质课本对应一所述原始图片及索引包及所述教育资源包;

章节关联模块,用于存储若干个《章节关联表》,所述《章节关联表》内包括所述纸质课本中每个章节和所述原始图片的对应关系;

原始图片及索引压缩包与别名关联模块,用于存储若干《原始图片及索引压缩包与别名关联表》,所述《原始图片及索引压缩包与别名关联表》包括原始图片及索引压缩包标识与别名的对应关系。

优选地,所述图片识别装置还用于将所述外部图片与所述图片服务器原始图片库模块中的所述原始图片相比对,并根据比对结果得到相应的图片服务器原始图片名称,所述图片服务器原始图片名称包括别名和原始图片文件名称;

所述匹配装置还用于根据所述图片服务器原始图片名称中的别名在所述原始图片及索引压缩包与别名关联模块中的所述《原始图片及索引压缩包与别名关联表》中进行查询比对,得到对应的原始图片及索引压缩包标识;根据所述原始图片及索引压缩包标识在所述原始图片及索引库模块中定位到相应的所述《原始图片索引表》;根据所述图片服务器原始图片名称中的原始图片文件名称在所述《原始图片索引表》上定位到相应的索引记录;以及根据所述原始图片及索引压缩包标识在所述章节关联模块上定位到相对应的所述《章节关联表》,根据所述《原始图片索引表》中相应的索引记录中的原始图片页码或原始图片文件序号定位到所述《章节关联表》中相应的索引记录,根据所述《章节关联表》中相应的索引记录定位到相应的教育资源库模块中对应的教育资源包及章节;

所述输出装置还用于根据所述教育资源包及所述章节输出对应的的资源内容。

优选地,所述资源获取装置还包括一客户端接收及显示装置,与所述输出装置相连接,用于接收所述输出装置输出的教育资源包中相应的资源内容并显示给用户。

优选地,所述系统还包括一图片服务器,所述图片服务器原始图片库模块存储于所述图片服务器中。

优选地,所述系统还包括一搜索引擎服务器,所述教育资源库模块、所述原始图片及索引库模块、所述章节关联模块、所述原始图片及索引压缩包与别名关联模块存储于所述搜索引擎服务器中。

优选地,所述系统还包括一总服务器,所述图片服务器原始图片库模块、所述教育资源库模块、所述原始图片及索引库模块、所述章节关联模块、所述原始图片及索引压缩包与别名关联模块存储于所述总服务器中。

还提供一种基于图片识别的教育资源定位方法,根据前述的系统执行如下步骤

获取外部图片;

根据所获取的所述外部图片进行图片识别,并输出识别结果;

根据所述识别结果选择性地进行数据匹配,并输出匹配结果;

根据所述匹配结果输出对应的教育资源包中相应的资源内容;

还包括:

将若干图片服务器原始图片存储于图片服务器原始图片库模块中;

将存储若干教育资源包存储于教育资源库模块中;

将若干原始图片及索引包存储于原始图片及索引库模块中;

将若干个《章节关联表》存储于章节关联模块中;

将若干《原始图片及索引压缩包与别名关联表》存储于原始图片及索引压缩包与别名关联模块中。

优选地,所述根据所获取的所述外部图片进行图片识别,并输出识别结果还包括

将所述外部图片与所述图片服务器原始图片库模块中的所述原始图片相比对,并根据比对结果得到相应的图片服务器原始图片名称,所述图片服务器原始图片名称包括别名和原始图片文件名称。

优选地,所述根据所述识别结果选择性地进行数据匹配,并输出匹配结果还包括

根据所述图片服务器原始图片名称中的别名在所述原始图片及索引压缩包与别名关联模块中的所述《原始图片及索引压缩包与别名关联表》中进行查询比对,得到对应的原始图片及索引压缩包标识;

根据所述原始图片及索引压缩包标识在所述原始图片及索引库模块中定位到相应的所述《原始图片索引表》;

根据所述图片服务器原始图片名称中的原始图片文件名称在所述《原始图片索引表》上定位到相应的索引记录;以及

根据所述原始图片及索引压缩包标识在所述章节关联模块上定位到相对应的所述《章节关联表》,根据所述《原始图片索引表》中相应的索引记录中的原始图片页码或原始图片文件序号定位到所述《章节关联表》中相应的索引记录,根据所述《章节关联表》中相应的索引记录定位到相应的教育资源库模块中对应的教育资源包及章节,根据所述教育资源包及所述章节输出对应的的资源内容。

优选地,所述根据所述匹配结果输出对应的教育资源包中相应的资源内容,还包括:

接收所述教育资源包中相应的资源内容并显示给用户。

实施本发明的有益效果是:本发明的基于图片识别的教育资源定位系统及方法中,将纸质课本等印刷品扫描生成的外部图片作为输入关键字,通过图片识别装置对外部图片进行识别,由匹配装置进行数据匹配,实现了用户只需通过平板电脑等教育电子学习设备对纸质课本等印刷品进行扫描即可即时搜索到相关学习内容直接进入学习界面,省略了用户手工输入关键词的过程,从而规避了图形、图片、公式及方程式等高难度关键信息的输入,简化了用户操作,丰富输入关键信息,节省了操作时间,提高搜索效率及学习效率,帮助用户构建一个良好知识体系。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明一些实施例中基于图片识别的教育资源定位系统的总构成示意图;

图2是图1中资源获取装置800的构成示意图;

图3是图2中教育资源库模块10的构成示意图;

图4是图2中图片服务器原始图片库模块30的构成示意图;

图5是图2中原始图片及索引库模块20的构成示意图;

图6是图2中章节关联模块40的构成示意图;

图7是图2中原始图片及索引压缩包与别名关联模块50的构成示意图;

图8是本发明一些实施例中图片标识与教育资源库相关联的资源系统的生成方法的流程图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。

图1示出了本发明一些实施例中的基于图片识别的教育资源定位系统的总构成,图2是图1中资源获取装置800的构成示意图。教育资源定位系统700包括图片服务器原始图片库模块30、教育资源库模块10、原始图片及索引库模块20、章节关联模块40、原始图片压缩包与别名关联模块50及资源获取装置800,其中,原始图片库模块30设置在一图片服务器500上,教育资源库模块10、原始图片及索引库模块20、章节关联模块40、原始图片压缩包与别名关联模块50设置在一搜索引擎服务器600上。资源获取装置800包括图片获取装置100、图片识别装置200、匹配装置300、输出装置400、客户端接收及显示装置900。

下面,结合图1-7对本发明一些实施例中出现的名词进行解释及定义。

纸质课本:本发明纸质课本指小学课本,中学课本,小学教辅,中学教辅,中小学期末试卷,中高考真题等类型的学习类纸质印刷品,为便于描述,本发明用纸质课本来代指所有类型的学习类纸质印刷品。每本纸质课本对应一个“原始图片及索引压缩包”及“教育资源包”。“原始图片及索引压缩包”下包含一个“原始图片文件夹”及一个《原始图片索引表》,原始图片文件夹下包含该纸质课本按页扫描后生成的jpg或png等格式的系列扫描图片。教育资源包包含该纸质课本的各类学习资源。每本纸质课本及“原始图片及索引压缩包”对应一个唯一的别名。

别名:给每个原始图片及索引压缩包定义一个唯一的别名,该别名也称为原始图片及索引压缩包的前缀。别名的命名方法为:资源类型+科目名称+原始图片及索引压缩包id号,即将每本纸质课本对应的教育资源包的资源类型作为第一部分,将该纸质课本所属科目作为第二部分,将该纸质课本对应的原始图片及索引压缩包id号作为第三部分,再将上述三部分按先后顺序组合即形成所述原始图片及索引压缩包的别名。如别名为“pschineseg110245”中的ps表示资源类型为课本点读资源,chinese为语文科目,g110245是该纸质课本对应的原始图片及索引压缩包id号。应当理解,该别名也是每本纸质课本的别名。

教育资源包:教育资源包包含展示给用户的各类学习资源,如课本正文的解析,例题的讲解,相关知识点的讲解,同步训练、教辅题目或者试卷等,其展示形式有图形、图片、文字、声音、视频、练习、flash、趣味游戏等一种或多种类型。每本纸质课本对应的学习资源的集合形成该纸质课本的教育资源包,即每本纸质课本对应一个教育资源包。

教育资源包标识:每个教育资源包的文件名称作为该教育资源包的“教育资源包标识”,该标识在教育资源库模块10中是唯一的。

原始图片:本发明原始图片指将纸质课本从封面至封底所有内容按页扫描后生成的jpg或png等格式的系列内页和非内页扫描图片,非内页扫描图片指封面、封底、序言、目录、后记等非正本内容对应的扫描图片,内页扫描图片指正本内容对应的若干扫描图片。

原始图片夹:每本纸质课本的所有扫描图片共同存储于同一个图片文件夹下,该图片文件夹的文件名称可命名为“图片”。本专利文档中“原始图片文件夹”简称为“原始图片夹”,原始图片夹内扫描图片随着纸质课本内容的更新而更新。

原始图片文件名称:“原始图片夹”中所有内页扫描图片和非内页扫描图片均有对应的文件名称,称之为“原始图片文件名称”,该名称在相应的“原始图片夹”中是唯一的。其中内页扫描图片文件名称与该内页扫描图片对应的纸质课本内相应的正本内容页面的页码保持一致;非内页扫描图片文件名称与其内容相同,如封面、目录、后记、封底等。需要说明的是,如果原始图片是内页扫描图片,则原始图片文件名称和页码相同,如果是非内页扫描图片,如封面封底目录后记等则和页面的主题相同,不是页码,因此,所述图片服务器原始图片名称包括别名和原始图片文件名称。

以下,结合图1-7和上述解释及定义对具体实施例进行说明。

教育资源库模块10用于存储若干教育资源包。教育资源库模块10存储于搜索引擎服务器600上,结合图1至图3所示,教育资源库模块10由若干纸质课本对应的教育资源包集合而成。每本纸质课本对应一个教育资源包,教育资源包包含展示给用户的各类学习资源,如课本正文的解析,例题的讲解,相关知识点的讲解,同步训练、教辅题目或者试卷等,其展示形式有图形、图片、文字、声音、视频、练习、flash、趣味游戏等一种或多种类型。

每个教育资源包均有独特的文件名称作为其在教育资源库模块10中的标识,因而保证教育资源库模块10内的所有教育资源包不会重名。该文件名称称为该教育资源包的“教育资源包标识”,其命名方法是:将该教育资源包对应的纸质课本的“资源类型、教材版本、所属学段、所属科目、所属年级、学期、教材版次、教材印次,及其他信息”按先后顺序组合而成,如名称为“九科同步-人教版-初中-数学-七年级-下-12版”是九科同步之人教版初中数学七年级下学期第12版的纸质课本对应的文件名称(也即该纸质课本对应的教育资源包的“教育资源包标识”),该标识在教育资源库模块10中是唯一的。

应当理解,教育资源包包含的各类学习资源是由厂家先行在本地设备上制作完成后上传并存储于搜索引擎服务器600的教育资源库模块10内。教育资源包的制作过程此处不作赘述。

再结合图4所示,图片服务器原始图片库模块30用于存储若干图片服务器原始图片。作为选择,系统还包括一图片服务器500,图片服务器原始图片库模块30存储于图片服务器500中。

将本地设备上所有纸质课本对应的“原始图片夹”里的所有原始图片上传并集合在图片服务器500的同一个文件夹下形成图片服务器原始图片库模块30,该库中每张图片称之为“图片服务器原始图片”。

给每张图片服务器原始图片设定一个整数类型的唯一序号作为“图片服务器原始图片标识”,该标识在“图片服务器原始图片库模块30”中是唯一的。

每张图片服务器原始图片的文件名称称之为该图片的“图片服务器原始图片文件名称”,简称为“图片服务器原始图片名称”。每个图片服务器原始图片文件名称在图片服务器原始图片库模块30中是唯一的。图片服务器原始图片文件名称的命名方法为:图片服务器原始图片对应的原始图片所属的原始图片及索引压缩包的别名+图片服务器原始图片对应的原始图片文件名称,即:图片服务器原始图片文件名称的第一部分为该图片服务器原始图片对应的本地原始图片所属的原始图片及索引压缩包的别名;第二部分为该图片服务器原始图片对应的原始图片文件名称。如“pschineseg110245封面”为该图片服务器原始图片文件名称,其中“pschineseg110245”部分为别名,“封面”为该图片服务器原始图片对应的原始图片的文件名称,即该原始图片的文件名称为“封面”,意即该原始图片是对应纸质课本的封面的扫描图片;又如“pschinesegg11024510”中“pschineseg110245”部分为别名,10为原始图片文件名称即对应纸质课本内页第10页。别名的命名方法前已述及,此处不再赘述。

“图片服务器原始图片标识”及“图片服务器原始图片文件名称”均为图片服务器原始图片在图片服务器原始图片库模块30中的识别信息。

应当理解,图片服务器原始图片库模块30中的“图片服务器原始图片”是由厂家先行在本地设备针对纸质课本制作的原始图片夹里的原始图片上传至图片服务器500保存,其中的图片服务器原始图片可增删及更新。

结合图5所示,原始图片及索引库模块20用于存储若干原始图片及索引包,每一原始图片及索引包包含一原始图片文件夹及一《原始图片索引表》,原始图片文件夹内包含对应纸质课本按页扫描后生成的原始图片,《原始图片索引表》内每条索引对应原始图片文件夹里相应的一原始图片;每一纸质课本对应一原始图片及索引包及教育资源包。

由于原始图片及索引包是由厂家先行在本地设备上针对纸质课本制作的原始图片及索引压缩包上传至搜索引擎服务器600后解压而形成,原始图片及索引包与原始图片及索引压缩包的具体内容及文件名称均相同,故本发明重点描述原始图片及索引压缩包相关信息。

“原始图片及索引压缩包”的文件名称称之为“原始图片及索引压缩包标识”,前已述及,每个原始图片及索引压缩包标识是唯一的,其命名方法为:资源类型+教材版本+学段+科目+年级+学期+其他,即将纸质课本所属的资源类型、教材版本、学段、科目、年级、学期及其他信息按先后顺序组合而成,资源类型包括课本点读资源、试题拍摄资源等类型,科目指语文、数学等小学和中学所学科目。如原始图片及索引压缩包标识为“教辅题-同步试卷-人教五四制版-小学-数学-六年级-上-教材全讲全解参考大全-17年秋-拍搜”为纸质课本“人民教育出版社五四制版小学数学六年级上学期的教材全讲全解参考大全2017年秋季的同步教辅试卷”对应的原始图片及索引压缩包的文件名称。

每本纸质课本对应一个《原始图片索引表》即表1,用以记录与其关联的“原始图片夹”里的每张图片的索引。《原始图片索引表》可为excel类型文件。《原始图片索引表》的文件名称与其对应的“原始图片及索引压缩包”及“原始图片及索引包”的文件名称相同,因而当查找到图片服务器原始图片文件名称时,即获取到该图片服务器原始图片文件名称中的别名,从而获取到对应的原始图片及索引压缩包标识,接着通过该原始图片及索引压缩包标识快速找到相应的《原始图片索引表》。《原始图片索引表》命名方法为:资源类型+教材版本+学段+科目+年级+学期+其他。

表1是《原始图片索引表》的公有格式,表1’是标识为“教辅题-同步试卷-人教五四制版-小学-数学-六年级-上-教材全讲全解参考大全-17年秋-拍搜”的原始图片及索引压缩包所对应的《原始图片索引表》。如表1所示,《原始图片索引表》包含“原始图片索引表文件名称、原始图片文件序号、原始图片及索引压缩包标识、原始图片页码、原始图片文件名称、原始图片url、原始图片md5、图片服务器原始图片文件名称、状态、创建人、创建日期、修改人及修改时间”信息。

表1

表1’

表1中,原始图片索引表文件名称为每本纸质课本对应的《原始图片索引表》的标识,该标识字段类型为bigint16。每本纸质课本对应的《原始图片索引表》文件名称在《原始图片及索引压缩包》中是唯一的。前已述及,该标识与其对应的“原始图片及索引压缩包”的文件名称相同,即:资源类型+教材版本+学段+科目+年级+学期+其他。

原始图片文件序号指原始图片夹里每张原始图片的序号,该序号也视作原始图片对应的索引记录在本《原始图片索引表》中的索引序号,该序号字段类型为varchar(100)。每张图片的序号在原始图片夹里是唯一的。

原始图片及索引压缩包标识可以理解为每本纸质课本对应的原始图片及索引压缩包的文件名称,该标识字段类型为varchar(400)。该标识与《原始图片索引表》的标识相同,其命名方法前已述及,此处不再赘述。

原始图片页码字段类型为int(10),包括内页扫描图片页码和非内页扫描图片页码,其中内页扫描图片页码与其对应的纸质课本内相应的正本内容页面的页码一致,从1开始,上不封顶;目录扫描图片页码从负数开始以1为步长依次递增直到最后一页目录页码为0;其它如封面封底和后记等非内页扫描图片的页码统一默认为“-1000”。

原始图片文件名称字段类型为varchar(200),前已述及,其包括内页扫描图片文件名称和非内页扫描图片文件名称,其中内页扫描图片文件名称与其对应的纸质课本内相应的正本内容页面的页码一致;非内页扫描图片文件名称与其主题内容相同,如封面、目录、后记、封底等。

原始图片url指该原始图片在搜索引擎服务器600里的链接地址,其字段类型为varchar(300)。

原始图片md5即message-digestalgorithm5信息-摘要算法5,其字段类型为varchar(100),用于确保原始图片上传到搜索引擎服务器600后信息的完整一致性。

图片服务器原始图片文件名称即图片服务器原始图片库模块30中图片服务器原始图片的文件名称,图片服务器原始图片是由厂家先行在本地设备制作的纸质课本对应的原始图片上传到图片服务器500而形成,该图片服务器原始图片文件名称在图片服务器原始图片库模块30中是唯一的,其字段类型为varchar(100)。该图片服务器原始图片文件名称的命名方法为:图片服务器原始图片对应的本地原始图片所属的原始图片及索引库压缩包的别名+图片服务器原始图片对应的本地原始图片的文件名称,即:图片服务器原始图片文件名称的第一部分为其相应的本地原始图片所属的原始图片及索引库压缩包别名,第二部分为该图片服务器原始图片对应的本地原始图片的文件名称。如“pschineseg110245封面”为该图片服务器原始图片文件名称,其中“pschineseg110245”为第一部分即别名部分,“封面”为第二部分即该图片服务器原始图片对应的本地原始图片的文件名称,即相应的纸质课本的封面;又如“pschinesegg11024510”中“pschineseg110245”部分为别名,10为原始图片文件名称,即相应纸质课本的内页第10页。

前已述及,每个原始图片及索引压缩包均有一个唯一的别名,该别名也可视为图片服务器原始图片文件名称的前缀。别名的命名规则为:资源类型+科目名称+原始图片及索引压缩包id号,即将每本纸质课本对应的教育资源包的资源类型作为第一部分,将该纸质课本所属科目作为第二部分,将该纸质课本对应的原始图片及索引压缩包id号作为第三部分,再将上述三部分按先后顺序组合即形成原始图片及索引压缩包的别名。如别名为“pschineseg110245”中的ps表示资源类型为课本点读资源,chinese为语文科目,g110245是该纸质课本对应的原始图片及索引压缩包id号。应当理解,该别名也是每本纸质课本及其对应的原始图片及索引包的别名。

状态包括有效和无效两种状态,是指《原始图片索引表》中该条索引记录的状态是否有效,1为有效,0为无效。其字段类型为char(2)。

创建人、创建日期、修改人及修改时间是指该索引的相关创建及修改信息,便于查证,统计及更新,此处不作赘述。

值得一提的是,《原始图片索引表》即表1中图片服务器原始图片文件名称是将纸质课本对应的本地原始图片全部上传至图片服务器500生成对应的图片服务器原始图片后,再将该图片服务器原始图片文件名称回写入《原始图片索引表》中。回写的过程为现有技术,此处不再赘述。

应当理解,原始图片及索引库模块20中的原始图片及索引包是由厂家先行在本地设备制作原始图片及索引包,再将其压缩成原始图片及索引压缩包后上传至搜索引擎服务器600,接着再解压复原成原始图片及索引包并在搜索引擎服务器600保存,其中的原始图片及索引包可增删及更新。

结合图6所示,章节关联模块40用于存储若干个《章节关联表》即表2,《章节关联表》内包括纸质课本中每个章节和原始图片的对应关系。章节关联模块40存储在搜索引擎服务器600上,是由若干个《章节关联表》即表2集合而形成。每本纸质课本对应的“原始图片夹”均对应一个《章节关联表》,《章节关联表》通过内页扫描图片的原始图片文件名称即页码将章节与原始图片夹内的内页扫描图片建立关联关系,即《章节关联表》用于描述每个章节包含的所有原始图片。

《章节关联表》可为excel类型文件,由图1可知,《原始图片索引表》与《章节关联表》的存储路径有别,故《章节关联表》与《原始图片索引表》同名,也即与相应的原始图片及索引压缩包同名,由于章节关联模块40中包含若干个《章节关联表》,故通过原始图片及索引压缩包的名称或《原始图片索引表》的名称即可快速定位到相应的《章节关联表》,提高了检索效率。

表2是《章节关联表》的公有格式,表2’是标识为“教辅题-同步试卷-人教五四制版-小学-数学-六年级-上-教材全讲全解参考大全-17年秋-拍搜”的纸质课本所对应的《章节关联表》。如表2所示,《章节关联表》包含:原始图片及索引压缩包标识、章节起始页对应的页码、章节结束页对应的页码、章节起始页对应原始图片的索引序号、章节结束页对应原始图片的索引序号、教育资源包标识、章节名称、章节序号、状态、创建人、创建日期、修改人、修改时间信息。

表2

表2’

表2中:

原始图片及索引压缩包标识为每本纸质课本对应的原始图片及索引压缩包的文件名称,该标识字段类型为varchar(400)。应当理解,表2中原始图片及索引压缩包标识即表1中原始图片及索引压缩包标识,故同一纸质课本内容通过该原始图片及索引压缩包标识可将表1与表2与表3建立关联关系。

章节起始页对应的页码指该章节起始页对应所属纸质课本的页码,该字段类型为bigint(16)。

章节结束页对应的页码指该章节结束页对应所属纸质课本的页码,该字段类型为bigint(16)。

章节起始页对应原始图片的索引序号指该章节起始页所属纸质课本中相应原始图片在相应的《原始图片索引表》中的索引序号,即表1中原始图片文件序号。故同一纸质课本内容通过该章节起始页对应原始图片的索引序号可将表1与表2建立关联关系。

章节结束页对应原始图片的索引序号指该章节结束页所属纸质课本中相应原始图片在相应的《原始图片索引表》中的索引序号,即表1中原始图片文件序号。故同一纸质课本内容通过该章节结束页对应原始图片的索引序号可将表1与表2建立关联关系。

教育资源包标识指纸质课本对应的教育资源包的标识,该标识字段类型为varchar(400)。教育资源包标识的命名方法前已述及,此处不再赘述。

章节名称指该章节对应纸质课本中该章节的名称,该名称字段类型为varchar(200)。

章节序号指该章节对应纸质课本中该章节的序号,该序号类型为int(16)。

状态包括有效和无效两种状态,是指《章节关联表》中该条记录的状态是否有效。其字段类型为char(2),1为有效,0为无效。

创建人、创建日期、修改人及修改时间是指该章节关联内容的相关创建及修改信息,便于查证,统计及更新,此处不作赘述。

应当理解,本表用于建立纸质课本的内页即正本内容页与章节的关联关系从而定位用户扫描图片对应的教育资源包中的章节,而与非内页封面、封底及目录等无关。

应当理解,章节关联模块40是由厂家在本地设备上先行制作的若干《章节关联表》上传至搜索引擎服务器600后集合形成。

结合图7所示,原始图片及索引压缩包与别名关联模块50,用于存储若干《原始图片及索引压缩包与别名关联表》,《原始图片及索引压缩包与别名关联表》包括原始图片及索引压缩包标识与别名的对应关系。原始图片及索引压缩包与别名关联模块50存储于搜索引擎服务器600上。《原始图片及索引压缩包与别名关联表》是将“原始图片及索引压缩包标识”与所属原始图片及索引压缩包别名建立一一对应关系而形成的表。

《原始图片及索引压缩包与别名关联表》可为excel类型表格文件,也可由程序自动生成。由图1可知,《原始图片及索引压缩包与别名关联表》与《原始图片索引表》及《章节关联表》的存储路径有别,故《原始图片及索引压缩包与别名关联表》与《章节关联表》及《原始图片索引表》同名,也即与相应的原始图片及索引压缩包同名,故通过原始图片及索引压缩包的名称或《原始图片索引表》的名称或《章节关联表》的名称即可快速定位到相应的《原始图片及索引压缩包与别名关联表》,提高了检索效率。

表3是《原始图片及索引压缩包与别名关联表》的公有格式,表3’是《原始图片及索引压缩包与别名关联表》的部分实例内容。如表3所示,《原始图片及索引压缩包与别名关联表》包含:图片服务器原始图片名称、图片服务器原始图片标识、原始图片及索引压缩包标识、教育资源类型、别名、状态、创建人、创建日期、修改人、修改时间信息。

表3

表3’

表3中:

图片服务器原始图片名称即图片服务器原始图片文件名称,该名称在图片服务器原始图片库模块30中是唯一的,前已述及,该名称的命名方法是:图片服务器原始图片对应的原始图片所属的原始图片及索引压缩包的别名+图片服务器原始图片对应的原始图片文件名称。应当理解,原始图片在相应的原始图片及索引包里的文件名称分为内页扫描图片文件名称及非内页扫描图片文件名称,内页扫描图片文件名称与其相应的纸质课本正本内容页码一致,非内页扫描图片文件名称与其页面主题内容一致,当原始图片上传至图片服务器原始图片库模块30时将该原始图片所属原始图片及索引压缩包的别名作为前缀添加至该原始图片文件名称前面,形成相应的图片服务器原始图片文件名称。如表3’中“pschineseg110245_1”中的“pschineseg110245”为相应原始图片及索引压缩包的别名,也即相应的原始图片文件名称的前缀,“1”为原始图片文件名称。该字段类型为bigint(16)。表3中图片服务器原始图片名称即表1中图片服务器原始图片文件名称,故同一纸质课本内容通过图片服务器原始图片名称可将表1与表3建立关联关系。

图片服务器原始图片标识是一个整数类型的序号,该序号在“图片服务器原始图片库模块30”中是唯一的。

原始图片及索引压缩包标识为每本纸质课本对应的原始图片及索引压缩包的文件名称,该标识字段类型为varchar(400)。应当理解,表3中原始图片及索引压缩包标识与表2及表1中原始图片及索引压缩包标识相同,故同一纸质课本内容通过该原始图片及索引压缩包标识可将表3与表1及表2建立关联关系。

教育资源类型、包括课本点读资源、试题拍摄资源等类型,可用不同序号来代表不同资源类型,该字段用以统计各种类型的资源的数量。该字段类型为bigint(16)。

别名即每个原始图片及索引压缩包的唯一别名,也可视作纸质课本和原始图片及索引包的别名,该别名作为图片服务器原始图片文件名称的前缀。该别名的命名方法为:资源类型+科目名称+原始图片及索引压缩包id号,即将每本纸质课本对应的教育资源包的资源类型作为第一部分,将该纸质课本所属科目作为第二部分,将该纸质课本对应的原始图片及索引压缩包id号作为第三部分,再将上述三部分按先后顺序组合即形成原始图片及索引压缩包的别名。如别名为“pschineseg110245”中的第一部分“ps”表示资源类型为课本点读资源,第二部分chinese为语文科目,第三部分g110245是该纸质课本对应的原始图片及索引压缩包id号。该字段类型为varchar(100)。应当理解,表3中图片服务器原始图片名称去掉前缀即别名后得到其所对应的原始图片文件名称,该原始图片文件名称即表1中原始图片文件名称,因而通过将表3中图片服务器原始图片名称去掉其别名后得到表1中原始图片文件名称的方式,可将表3与表1建立关联关系。

状态包括有效和无效两种状态,是指《原始图片及索引压缩包与别名关联表》中该条记录的状态是否有效,1为有效,0为无效,其字段类型为char(2)。

创建人、创建日期、修改人及修改时间是指该《原始图片及索引压缩包与别名关联表》中该条记录的相关创建及修改信息,便于查证,统计及更新,此处不作赘述。

应当理解,原始图片及索引压缩包与别名关联模块50可由厂家先行在本地设备上制作《原始图片及索引压缩包与别名关联表》上传至搜索引擎服务器600后集合形成。

结合图8所示,本资源系统的生成方法如下:

(1)步骤s0:开始;

(2)步骤s2101:生成原始图片夹,该步骤在本地设备上将每本纸质课本从封面至封底所有内容按页扫描后生成的jpg或png等格式的系列内页原始扫描图片和非内页原始扫描图片,并将所有原始扫描图片以纸质课本为单位保存在相应的原始图片夹中;

(3)步骤s2102:生成《章节关联表》,该步骤针对每本纸质课本生成相应的《章节关联表》;

(4)步骤s2103:生成《原始图片及索引压缩包与别名关联表》,该步骤针对每本纸质课本生成相应的《原始图片及索引压缩包与别名关联表》;

(5)步骤s2104:生成教育资源包,该步骤在本地设备上生成每本纸质课本对应的教育资源包;

(6)步骤s2201:生成原始图片索引表,该步骤以纸质课本为单位,为每个原始图片夹中的每张图片建立一条索引,所有图片的所有索引集合生成一个《原始图片索引表》;

(7)步骤s2202:图片服务器500接收原始图片生成图片服务器原始图片库模块30;

(8)步骤s2203:生成章节关联模块40,该步骤由搜索引擎服务器600接收若干《章节关联表》生成章节关联模块40;

(9)步骤s2204:生成原始图片及索引压缩包与别名关联模块50,该步骤由搜索引擎服务器600接收《原始图片及索引压缩包与别名关联表》生成原始图片及索引压缩包与别名关联模块50;

(10)步骤s2205:搜索引擎服务器600接收教育资源包生成教育资源库模块10;

(11)步骤s23:生成原始图片及索引包,该步骤将纸质课本对应的原始图片夹及相应的《原始图片索引表》结合生成以纸质课本为单位的原始图片及索引包,每个原始图片及索引包的文件名称与相应的《原始图片索引表》同名;

(12)步骤s24:生成原始图片及索引压缩包,该步骤将步骤s23形成的以纸质课本为单位的原始图片及索引包进行rar或zip模式的压缩后形成相应的原始图片及索引压缩包,该原始图片及索引压缩包与相应的原始图片及索引包及《原始图片索引表》同名;

(13)步骤s25:搜索引擎服务器600接收原始图片及索引压缩包并解压复原成原始图片及索引包;

(14)步骤s26:生成原始图片及索引库模块20:以每本纸质课本为单位重复上述步骤s2101-s25,生成若干原始图片及索引包,由此若干原始图片及索引包集合形成原始图片及索引库模块20;

(15)步骤s27:生成新的原始图片及索引库模块20;将图片服务器原始图片文件名称回写入相应的原始图片及索引包内相应的《原始图片索引表》中,生成新的原始图片及索引库模块20。

值得一提的是,步骤s2101-s27中,同一纸质课本对应的《原始图片索引表》、《章节关联表》、《原始图片及索引压缩包与别名关联表》、原始图片及索引包、原始图片及索引压缩包及教育资源包具有相同的文件名称。

综上可知,本发明两台服务器即图片服务器500及搜索引擎服务器600上分别包含如下模块:图片服务器500:“图片服务器原始图片库模块30”;搜索引擎服务器600:含表1《原始图片索引表》及原始图片夹的“原始图片及索引库模块20”、“教育资源库模块10”、章节关联模块40即表2对应的模块,及原始图片压缩包与别名关联模块50即表3对应的模块。

作为选择,在一些实施例中,系统还包括一总服务器作为图片服务器500及搜索引擎服务器600的集合,图片服务器原始图片库模块30、教育资源库模块10、原始图片及索引库模块20、章节关联模块40、原始图片压缩包与别名关联模块50存储于该总服务器中。

可以理解地,图片获取装置100用于获取外部图片。作为选择,图片获取装置100可为常见的摄像头等,此处不做具体限定,只要可以实现图片获取功能即可。

图片识别装置200与图片获取装置100相连接,用于根据所获取的外部图片进行图片识别,并输出识别结果。具体地,图片识别装置200还用于将外部图片与图片服务器原始图片库模块30中的原始图片相比对,并根据比对结果得到图片服务器原始图片库模块30中的相应图片的图片服务器原始图片名称,图片服务器原始图片名称包括别名和原始图片文件名称,前已述及,“原始图片夹”中所有内页扫描图片和非内页扫描图片均有对应的文件名称,称之为“原始图片文件名称”,该原始图片文件名称在相应的“原始图片夹”中是唯一的。其中内页扫描图片文件名称与该内页扫描图片对应的纸质课本内相应的正本内容页面的页码保持一致;非内页扫描图片文件名称与其内容相同,如封面、目录、后记、封底等。

匹配装置300与图片识别装置200相连接,用于根据识别结果选择性地进行数据匹配,并输出匹配结果。具体地,匹配装置300还用于根据图片服务器原始图片名称中的别名在原始图片及索引压缩包与别名关联模块50中的《原始图片及索引压缩包与别名关联表》中进行查询比对,得到对应的原始图片及索引压缩包标识;由于原始图片及索引压缩包标识与对应的《原始图片索引表》同名,故根据原始图片及索引压缩包标识在原始图片及索引库模块20中定位到相应的《原始图片索引表》;根据所述图片服务器原始图片名称中的原始图片文件名称在《原始图片索引表》上定位到相应的索引记录;以及由于原始图片及索引压缩包标识与对应的《原始图片索引表》及《章节关联表》同名,故根据原始图片及索引压缩包标识在章节关联模块40上定位到相对应的《章节关联表》,且根据原始图片及索引压缩包标识及《原始图片索引表》中的原始图片页码或原始图片文件序号定位到《章节关联表》中的具体索引记录,再根据《章节关联表》中的具体索引记录定位到教育资源库模块10中对应的教育资源包及章节名称和章节序号,接着根据教育资源包及章节名称和章节序号定位到教育资源库模块中相应教育资源包中相应的章节内容及对应页码的资源学习内容,所述对应页码资源学习内容包含课本正文的解析,例题的讲解,相关知识点的讲解,同步训练、教辅题目、试卷、练习、视频链接、flash链接、趣味游戏链接等一种或多种类型。

输出装置400与匹配装置300相连接,用于根据匹配结果输出对应的教育资源包及章节中相应的资源内容。

以下结合图1-8对本发明一些实施例中图片标识与教育资源库相关联的资源获取方法进行说明。本实施例的方法利用前述实施例的系统执行如下步骤。

首先,由图片获取装置100获取外部图片。

此处对本实施例中各个模块进行描述:图片服务器原始图片库模块30,用于存储若干图片服务器原始图片;教育资源库模块10,用于存储若干教育资源包;原始图片及索引库模块20,用于存储若干原始图片及索引包,每一原始图片及索引包包含一原始图片夹及一相应的《原始图片索引表》,原始图片夹内包含对应纸质课本按页扫描后生成的原始图片,《原始图片索引表》内每条索引对应原始图片夹里相应的一原始图片;每一纸质课本对应一原始图片及索引包及教育资源包;章节关联模块40,用于存储若干个《章节关联表》,《章节关联表》内包括纸质课本中每个章节和原始图片的对应关系;原始图片及索引压缩包与别名关联模块50,用于存储若干《原始图片及索引压缩包与别名关联表》,《原始图片及索引压缩包与别名关联表》包括原始图片及索引压缩包标识与别名的对应关系。

在一些优选实施例中,本实施例中还包括步骤:将若干图片服务器原始图片存储于图片服务器原始图片库模块30中;将若干教育资源包存储于教育资源库模块10中;将若干原始图片及索引包存储于原始图片及索引库模块20中;将若干个《章节关联表》存储于章节关联模块40中;将若干《原始图片及索引压缩包与别名关联表》存储于原始图片及索引压缩包与别名关联模块50中。优选地,上述各个步骤均在获取外部图片的步骤之前;作为选择,上述各个步骤可选择性地在获取外部图片的步骤之前、之中或之后。

其次,由图片识别装置200根据所获取的外部图片进行图片识别,并输出识别结果。具体地,将外部图片与图片服务器原始图片库模块30中的原始图片相比对,并根据比对结果得到图片服务器原始图片库模块30中的相应图片的图片服务器原始图片名称,图片服务器原始图片名称包括别名和原始图片文件名称。前已述及,“原始图片夹”中所有内页扫描图片和非内页扫描图片均有对应的文件名称,称之为“原始图片文件名称”,该名称在相应的“原始图片夹”中是唯一的。其中内页扫描图片文件名称与该内页扫描图片对应的纸质课本内相应的正本内容页面的页码保持一致;非内页扫描图片文件名称与其内容相同,如封面、目录、后记、封底等非正文内容。

然后,匹配装置300根据识别结果选择性地进行数据匹配,并输出匹配结果。具体地,根据图片服务器原始图片名称中的别名在原始图片及索引压缩包与别名关联模块50中的《原始图片及索引压缩包与别名关联表》中进行查询比对,得到对应的原始图片及索引压缩包标识;由于原始图片及索引压缩包标识与对应的《原始图片索引表》同名,故根据原始图片及索引压缩包标识在原始图片及索引库模块20中定位到相应的《原始图片索引表》;根据图片服务器原始图片名称包含的原始图片文件名称在《原始图片索引表》上定位到相应的索引记录;以及由于原始图片及索引压缩包标识与对应的《原始图片索引表》及《章节关联表》同名,故根据原始图片及索引压缩包标识在章节关联模块40上定位到相对应的《章节关联表》,且根据原始图片及索引压缩包标识及《原始图片索引表》中的原始图片页码或原始图片文件序号定位到《章节关联表》中的具体索引记录,再根据《章节关联表》中的具体索引记录定位到教育资源库模块10中对应的教育资源包及章节名称和章节序号,接着根据教育资源包及章节名称和章节序号定位到教育资源库模块中相应教育资源包中相应的章节内容及对应页码的资源学习内容,所述对应页码资源学习内容包含课本正文的解析,例题的讲解,相关知识点的讲解,同步训练、教辅题目、试卷、练习、视频链接、flash链接、趣味游戏链接等一种或多种类型。

最后由输出装置400根据匹配结果输出对应的教育资源包及章节中相应的资源内容。

值得一提的是,对于纸质课本的章节内容少于一个页面的情况,增加《章节关联表》进行章节定位,从而提高定位的精准性。当获得《章节关联表》对应的教育资源包标识和具体的章节信息时,结合《原始图片索引表》中的原始图片页码信息,即可定位到相应的教育资源包的章节内容及对应页码的资源学习内容。

值得一提的是,如果《原始图片索引表》中的原始图片页码为负数或0,则直接定位到与该《原始图片索引表》同名的《章节关联表》中的第一条索引记录,根据第一条索引记录定位到相应的教育资源包的首页学习内容。应当理解,此处所述原始图片页码为负数或0表示该原始图片为非内页扫描图片,即封面、目录、后记、封底等非正文内容。

值得一提的是,同一纸质课本对应的《原始图片索引表》、《章节关联表》、《原始图片及索引压缩包与别名关联表》、原始图片及索引包、原始图片及索引压缩包及教育资源包具有相同的文件名称。

本实施例中的方法中,其他部分与前述实施例中的系统相对应,此处不再赘述。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干个改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1