内容判断的方法和装置的制作方法

文档序号:6432332阅读:139来源:国知局
专利名称:内容判断的方法和装置的制作方法
技术领域
本发明涉及计算机数据处理领域,具体而言,涉及内容判断的方法和装置。
背景技术
在生活中,信息的传递媒介是通过字符数据展示给读者,包括文字、图等,主要通过电子形式,或者印刷品形式。例如,在报纸、杂志、期刊等方面,由于撰稿人在发稿时,使用了一些古文字、简写字等,会由于应用这些文字,从而应用影响阅读,在报纸、杂志、期刊等这些材料出版前,也要进行相应的校对,从而面向相应的读者,如为普通大众阅读的,为小学生、中学生、幼儿等出版的相应文字作品,更需要仔细校对。还有网络作品,例如为各个不同年龄阶段使用的付费网站,提供各种网络文字数据,这些网站上的文字数据,由于也是要面对不同的年龄段的读者。因此,其公布的文字作品在通过互联网发表前,也需要进行文字校对。特别是对教材配套的教辅中的试题,这类文字作品有严格的规定,不能出现超纲的字、词;以使教、学、练更好地开展。如小学一年级第二课中的配套试题,不能出现第三课或以后课程中学到的生字。但目前的网络教育和出版领域中,对教辅书中生字的是否超纲的检查还基于人工逐字逐句的方式进行。采用人工校对的方式,很容易出现失误,人工校对时,需要确定每套教材所对应的学年、以及教材允许有多少超纲字、不允许有多少超纲字,在基于这些超纲字,人工在教材中查找,修改相应的教材,以使这些教材适应于相应学年的学生。采用电子设备、如计算机进行校对出版物时,可通过计算机查找相应的超纲字,虽然检索过程可以减轻些工作量,但这种校对方式需要用户通过计算机输入要查询的检索词,由计算机逐个查找,存在用户工作量大,计算机处理周期长、效率低的问题。

发明内容
本发明旨在提供一种内容判断的方法和装置,以解决上述计算机在校对文字数据时,处理周期长、效率低的问题。在本发明的实施例中,提供了一种内容判断的方法,包括确定内容所对应的级别;在生字集中检索所述内容中的字符的级别;将所述字符与所述内容进行比较,并提示比较结果。在本发明的实施例中,还提供了一种内容判断的装置,包括识别单元,用于确定内容所对应的级别;检索单元,用于在生字集中检索所述内容中的字符的级别;比较单元,用于将所述字符与所述内容进行比较,并提示比较结果。本发明因为采用预先定义了被检索内容的级别、以及生字集的级别,通过在生字集中检索到内容的字符的级别与内容级别的比较,可校对当前内容中的字符是否正常,从而实现快速对各类字符进行校对,提高了校对的效率,缩短了校对的时间。


此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中图I示出了实施例一的流程图;图2示出了实施例二的流程图;图3示出了实施例三的流程图;图4示出了实施例四中装置的结构示意图。
具体实施例方式下面将参考附图并结合实施例,来详细说明本发明。本发明可应用计算机设备中,对各种文字材料进行校对,如对试题、期刊、杂志的校对等。参见图1,图I是本发明实施例一的流程图,包括以下步骤Sll :确定内容所对应的级别。上述的内容可以包括各种类型字符数据的文档,如试题、面向特定学龄阶段的报纸、期刊等。这些内容会被从级别序列中,预先赋予一个级别。S12 :在生字集中检索所述内容中的字符的级别。生字集中会预先存储字符数据、以及每个字符对应的级别等数据及对应关系,如汉字、或日文等,生字集可以采用二维数据库的形式存储,例如采用Oracle、MicrosoftSQL Server> MicrosoftAccess、MySQL 等。通过生字集中存储的数据及对应关系,可以检索出该字符对应的级别。S13 :将所述字符与所述内容进行比较,并提示比较结果。优选地,在生字集中检索出字符,进而可检索出相应的级别,与内容的级别进行比较后,输出比较结果。例如,当在生字集中检索出的字符的级别高于内容的级别,则提示该字符超纲。上述的实施例一中的内容判断过程,可以采用多种形式予以实现,下面通过实施例二详细说明一种实现方式。在实施例二中,被判断的内容为试题类的文档,例如,为不同的教材编写的试题,教材可能包括各个出版社出版的教材,每个教材又包括各种科目的课本,如语文、体育等。可事先建立每个教材的科目所对应课本的生字集,并判断试题中的字符是否超出内容的级别,从而判断是否超纲。下面结合图2详细说明。参见图2,包括以下步骤S21 :创建生字集以及内容;按照教材体系创建生字集,如按照人民教育出版社出版的语文、体育等课本创建生字集,按照北京大学出版社出版的语文、体育等课本创建生字集等。创建过程中,可通过关系型数据库创建,生字集包括多个数据项,每个所述数据项包括字符属性、索引属性和级别属性,字符属性包含用于被检索的字符,如汉字字符;索引属性包含所述被检索的字符的索引,如每个汉字的内码;级别属性包含所述被检索的字符在所述教材体系中的级别,并表示某一课,如汉字“乐”的级别为84785,表示第8课。这些属性的数据可分类存储在数据库中,数据关系可如以下的表I所示。
表I
权利要求
1.一种内容判断的方法,其特征在于,包括 确定内容所对应的级别; 在生字集中检索所述内容中的字符的级别; 将所述字符与所述内容进行比较,并提示比较结果。
2.根据权利要求I所述的方法,其特征在于,在所述检索之前,还包括 根据教材体系创建所述生字集,所述生字集包括多个数据项,每个所述数据项包括字符属性、索引属性和级别属性,所述字符属性包含用于被检索的字符,所述索引属性包含所述被检索的字符的索引,所述级别属性包含所述被检索的字符在所述教材体系中的级别。
3.根据权利要求2所述的方法,其特征在于,所述检索的过程包括 解析所述内容中的字符的索引; 按照所述索引在所述生字集中查找所述索引属性; 从具有所述索引属性的数据项的所述级别属性中提取所述字符的级别。
4.根据权利要求I所述的方法,其特征在于,所述索引为汉字的内码。
5.根据权利要求I所述的方法,其特征在于,将所述字符与所述内容进行比较是指将所述字符的级别与所述内容的级别进行比较。
6.根据权利要求I所述的方法,其特征在于,所述提示比较结果包括 如果所述字符的级别大于所述内容的级别,则提示所述字符数据为超纲字符数据。
7.根据权利要求I所述的方法,其特征在于,所述比较之后,还包括 如果所述字符的级别大于所述内容的级别,则修改所述内容。
8.根据权利要求I所述的方法,其特征在于,所述内容为试题类文档内容。
9.一种内容判断的装置,其特征在于, 识别单元,用于确定内容所对应的级别; 检索单元,用于在生字集中检索所述内容中的字符的级别; 比较单元,用于将所述字符与所述内容进行比较,并提示比较结果。
10.根据权利要求9所述的装置,其特征在于,还包括 创建单元,用于根据教材体系创建所述生字集,所述生字集包括多个数据项,每个所述数据项包括字符属性、索引属性和级别属性,所述字符属性包含用于被检索的字符,所述索引属性包含所述被检索的字符的索引,所述级别属性包含所述被检索的字符在所述教材体系中的级别。
11.根据权利要求10所述的装置,其特征在于,所述检索单元包括 第一子单元,用于解析所述内容中的字符的索引; 第二子单元,按照所述索引在所述生字集中查找所述索引属性; 第三子单元,从具有所述索引属性的数据项的所述级别属性中提取所述字符的级别。
12.根据权利要求9所述的装置,其特征在于,所述比较单元包括 判别单元,用于比较所述字符的级别与所述内容的级别; 提示单元,用于如果所述字符的级别大于所述内容的级别,则提示所述字符数据为超纲字符数据。
全文摘要
本发明提供了一种内容判断的方法和装置,本发明方法包括确定内容所对应的级别;在生字集中检索所述内容中的字符的级别;比较所述字符的级别与所述内容的级别,并提示比较结果。本发明的装置包括识别单元,用于确定内容所对应的级别;检索单元,用于在生字集中检索所述内容中的字符的级别;比较单元,用于比较所述字符的级别与所述内容的级别,并提示比较结果。本发明因为采用预先定义了被检索内容的级别、以及生字集的级别,通过在生字集中检索到内容的字符的级别与内容级别的比较,可校对当前内容中的字符是否正常,从而实现快速对各类字符进行校对,提高了校对的效率,缩短了校对的时间。缩短了校对的时间。
文档编号G06F17/27GK102982017SQ20111025909
公开日2013年3月20日 申请日期2011年9月2日 优先权日2011年9月2日
发明者李少明, 文伟龙 申请人:北大方正集团有限公司, 北京北大方正电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1