用电子装置对文章句子快速进行的分类及检索方法

文档序号:2529640阅读:476来源:国知局

专利名称::用电子装置对文章句子快速进行的分类及检索方法
技术领域
:本发明涉及电子书制作及阅读领域,尤其涉及一种用电子装置对文章句子快速进行的分类及检索方法。疼尔狡不电子技术的高速发展在改变着我们的文章阅读方式,电子书已经越来越多地走进我们的工作及生活,电子书与传统的纸张印刷类书籍相比,具有很多优势,如可贮存海量内容的文章,内容可根据需要随意更换,可根据关键词快速自动查询特定内容,电子书的载体(即电子阅读装置)可长期反复使用,阅读成本很低,等等。这种电子书的出现,在改变着我们的学习方式,我们可以通过电脑、手机及其它便携信息设备来阅读电子书。一个人的时间及精力是有限的,许多人的财力更有限,电子书的出现,可以让我们花更少的时间及精力阅读更多的书籍,而且通过网络我们可以找到大量的免费电子书资料。我们读书学习的目的之一是为了在今后的工作生活中应用我们学到的东西,我国五千年的文化为我们提供了大量的经典名句、诗词歌赋,灵活运用这些词句可以展示一个人深厚的文化内涵及语言功底,但传统的这些经典词句往往分散在数量众多的各类书籍的不同文章中,虽然平时阅读时许多人都能遇到过,但真正需要时想立即找到某些特定的语句,却如同大海捞针,很难如愿。因为包含目标词句的文章虽然能以电子化形式存在,但都是非结构化电子文档,而不是数据库文档,即使有先进的搜索引擎,搜索效率也会很低。由于缺乏专门的分类检索技术,一般人也只能凭自己的理解及记忆来对阅读过的文章中的经典词句按自己的方式分类,需要应用时再凭记忆将阅读过的诗句回忆出来。在这种方式下,即使阅读了大量书籍,实际记住的很少,随着时间流逝也会渐渐忘记,而且记忆也不准确,难以高效利用。因此如何针对大量的电子书文章内容提供全新的分类编排及检索技术,是值得解决的一个技术问题。
发明内容本发明的目的是为电子书读者提供一种用电子装置对文章句子快速进行的分类及检索方法。本发明首先提供一种用电子装置对文章句子快速进行的分类方法,该电子装置具有文章句子显示屏,可编辑文章句子的编辑器,保存文章句子的贮存器,以及处理器,该电子装置可对文章句子进行分类贮存,具体骤如下1)显示屏上显示由若干条句子组成的文章内容;2)通过编辑器为其中的任意句子做上特定分类标记,这里的分类标记在用户在阅读电子书时可以选择是否显示,该标记跟在句子后面,用于标记名称的字符可以由系统提供或用户自定义,要保持唯一性,以区别于其它标记;3)t!:存器中建立与上述每个分类标记对应的类别目录,标记名称或以与类别目录相同,如果目录已经存在,则不建立;4)处理器对有分类标记的句子进行检测及识别,自动将每个有分类标记的句子保存到对应的上述类别目录中。上述的句子为整句,整句的判断方法为组成句子的字符串向前后延伸时以特定的断句标点结束,不包括所述的断句标点本身,该断句分类标记包括句号、问号、感叹号或其它可表示句子结束的字符。上述的编辑器为键盘或手写输入装置,当编辑器为手写输入装置时,所述的显示屏可接受手写识别输入。上述的类别目录可以嵌套,此时所有的句子只能贮存到最里层的分类目录中,而且所有的各层的分类目录具有唯一的名称,分类目录嵌套时,父目录下的平级子目录有类似的分类属性。对上述技术方案的进一步改进在于一个句子上可以标注一个以上的不同分类标记。这是考虑到有的句子难以准确分类,可能具有多重分类属性。当一个句子上有一个以上的不同分类标记时,从第二个分类标记开始,贮存器中只贮存该句子的索引;或句子贮存在特定目录,贮存的各类别目录只贮存句子的分类标记索引。通过这种方法处理,增加了灵活性。本发明同时提供一种用电子装置对文章句子进行的检索方法,该电子装置中有用于读取文章中特定句子的指针,电子装置根据权利要求1所述的分类方法生成文章句子的分类目录表,并保存在贮存器中,本检索方法如下a)显示屏上显示用户打开的当前电子书内容,也可以显示贮存器中的分类目录表;b)处理器逐个提取当前显示的每个句子,查找该句子在分类目录中是否存在,如果存在,则将其所在的本级分类目录名称作为分类标记作为附注添加到该句子上;这里的分类标记依附在相应的句子上显示或隐藏,在隐藏时,如果用户将光标移动到该句子上,分类标记就显示出来,光标离开时恢复隐藏状态;C)带分类标记的句子被用户选中,用户可以将光标移动该句子上确认;d)处理器根据上述选中句子的分类标记将句子读取指针定位到该分类标记对应的分类目录;e)处理器将上述分类目录中的句子进行输出,该输出方式可以是通过一个弹出窗口显示,也可以切换到专门的页面上显示。在上述的电子装置显示电子书内容时,也可以直接显示多层分类目录表,用户进入分类目录后可显示其中的句子;在上述的检索输出中,检索到的句子与显示屏上原有的句子同屏显示。这里显示的句子具有相同的分类属性,但各句子之间并无内容上的关联性,可以在显示句子时显示该句的出处。对上述技术方案的进一步改进在于每个检索到的句子每次被输出时,如果被操作者点击一次,其阅读值递加一次,在每个分类目录中,每个句子按阅读值从大到小顺序排列,并在选中时按此顺序输出。这里其实增加了一个点击量概念,其作用在于随着用户积累的经典语句越来越多,属性相同或类似的语句会渐渐多起来,但一般人在应用这些词句时会有自己的偏好,有的使用多一些,有的使用少一些。通过点击量,可以根据用户的偏好程度来排序,提高系统的适用性。电子装置在处理上述的有多重分类标记的句子时,如果输出的某个句子具有多个分类标记时,按每个分类标记的阅读值按顺序显示。这里也就是说按该句的不同属性的点击量排序,就能看出该句子最常用的属性是什么。对上述技术方案的进一步改进在于上述的电子装置具有发声装置,可将屏幕上显示的句子进行语音朗读。这里语音朗读的方式为播放录制的语文件或针对当前句子的即时机器语音合成,两种方式各有优缺点,播放录制语音文件可采用真人录音,用户欣赏效果好,但语音文件制作成本高,需要占用较大机器贮存器空间。语音合成无须贮存空间及制作成本,也可以让用户自由选择朗读语速、调调、音色、男女声等多种语音参数,唯一的缺点机器合成声音比较呆板,但通过釆用具有较高技术水平的语音合成软件以接近真人发音,提高用户欣赏体验效果。本发明可带来如下有益效果通过本发明的用电子装置对文章句子快速进行的分类及检索方法,为优秀经典文章的阅读利用提供了一种全新的学习模式。用户在学习过程中可以将自己感兴趣的内容进行标注,并建立自己的阅读笔记数据库,可以日后方便地利用已阅读文章中的优秀词句提高自己的文化素养和灵活应用水平。而且通过网络及电子媒质,文字作品的出版商直接出版已经进行了经典句子分类的电子读物,为读者提供学习素材库。读者也可以对现成的素材库根据自己的偏好进行修改完善,并通过网络与其他读者共享,从而开启协作学习之门。说明书附图无具体实施例方式为了便于本领域普通技术人员理解和实施本发明,下面结合具体实施方式对本发明作进一步的详细描述。本发明的技术方案可以在电脑上或各类具有电子书功能的手持数字终端上实现。这里以有手写功能的PDA为例子进行说明-下表1为PDA贮存器中的分类目录表,在PDA出厂时提供一个初始表,该分类目录分为两层,分别为大类及子类,每个大类下有若干子类。为了方便贮存及检索,分类目录中的类别名称为代码表示,其中大类用一个大写字母(A-Z)表示,子类用两位数字(01—99)表示。这个分类目录表用户还可以修改其中名称及对应关系,也可以添加新的分类目录名称。<table>tableseeoriginaldocumentpage0</column></row><table>表l.分类目录表.下表2为PDAlt存器中的词句索引表,在PDA出厂时提供一个预置的经典词句索引表,其中收录了一些常见的经典名句,用户可以直接浏览学习其中的词句,这些词句按其内容含义分别保存在不同的目录中,相同目录中的词句都有相同或相近的分类属性,方便用户对比学习记忆,尤其在写作时可以方便地引用,增加文章的文采,可避免因词汇素材缺乏造成文章干枯或用词平淡。用户也可以对这个分类编辑或添加记录,形成自己个性化的素材表。该索引表为一个数据库表,包含4个基本字段,分别是(1)"编号"字段,四位数字构成,这是一个流水号,向该表中添加词句时系统自动按顺序生成;(2)"词句"字段,将用户选中的词句复制到这里;(3)"出处"字段,自动将PDA打开的当前电子书书名复制到这里;(4)"译文"字段,用户从电子书中复制或自行编辑;(5)"标记"字段,用户从表1的分类目录中的选择添加,本字段中可添加多个标记内容,中间用"/"分隔。上述字段中"编号"为数字型字段,其为均为文本型字段。编号词句出处译文标记1001兢兢业业,如霆如雷诗经形容做事谨慎、勤恳06/07画言之者无罪,闻之者足戒诗经进言的人没有罪过,听的人足以引起警戒。01画辅车相依,唇亡齿寒左传车轮外的直木与车相互依靠,唇没有了,牙齿就感到寒冷。"辅"指车轮外的直木。02/041004言之无文,行而不远左传说话没有文采,就传播不远。07/021005前事不忘,后事之师战国策常用来表示记取过往的经验教训,以作为后来行事的借鉴。081006亡羊而补牢,未为迟也战国策走失了羊,赶快修补羊圈,还不算晚。比喻失误要后及时补救。071007勿以恶小而为之,勿以善小而不为三国即使是很小的坏事也不做;但即使是再小的好事也要做03翻士别三日,当刮目相待三国指别人已有进步,不能再用老眼光去看他。051009周公吐哺,天下归心三国形容求才心切来抒发求贤若渴的心情011010小不忍,则乱大谋论语对小事不忍耐,没耐性,就会影响大局,坏了大事.04/071011学而不厌,诲人不倦论语勤奋学习不厌烦,教诲别人不厌倦。03/081012君子喻于义,小人喻于利论语君子明白大义,小人只知道小利。041013有朋自远方来,不亦乐乎论语有朋友从远方来没,不是很快乐的事吗?注自,从051014己所不欲,勿施与人论语译自己不愿要的也不要施加给别人。注欲,想要施,给予021015知者乐水,仁者乐山论语有智慧的人喜欢水,有仁义的人喜欢山。知,同"智"乐,喜欢05/071016是可忍,孰不可忍论语如果这个都可以忍,那还有什么不可容忍的呢?是,这个孰哪个06/041017老者安之,朋友信之,少者怀之论语对老者让他安逸,对朋友予以信任,对年轻人予以关怀。03/051018人而无信,不知其可也论语一个人如果不守信用,不知他怎么可以做人。(做人要守信用。)03/07表2.词句索引表有了上述两个表,就可以实现本发明的对经典词句快速进行的分类及检索方法。在上述的表中,只作为举例简单列举了(1)至(5)的五个字段,在本发明的实际实施中,还可以根据需要增加其它字段,如"注释"、"作者"、"用户书签"等,其中的"用户书签"可由用户写一些阅读词句的心得体会。用户可以直接浏览表2,学习相关词句。为了方便浏览,可以先在表l中选择特定的分类目录,点击某个大类名称,其包含的所在小类名称表显示出来供用户选择,用户点击小类名称后,PDA从表2中过滤出与该小类名称代码对应的记录,如用户点击了"治国",其代码为"01",PDA则从表2的"标记"字段中提取包含"01"的记录,见下表3,就是提取的记录表。<table>tableseeoriginaldocumentpage11</column></row><table>表3.标记内容为"治国"的词句表上述是根据分类目录来检索对应的已收藏经典词句的方法。许多时候,用户在阅读电子书时,希望PDA能将电子书的经典词句突出显示出来,用户在阅读这个词句时,还可以浏览到相关联的其它同类经典词句。如用户在电子书中阅读到《论语》中的如下一段文章人而无信,不知其可也(03/07);小不忍,则乱大谋(04/07);学而不厌,诲人不倦(03/08);己所不欲,勿施与人(02);名不正,则言不顺;人无远虑,必有近忧。上面的短文中,每句的括号内的数字是处理器添加的句子的分类标记,当每个句子在屏幕上输出显示时,处理器在词句分类表(即表2)中査找该句是否存在,如果存在,则提取索引表中该词句的标记,如第一句的标记是"03/07",第二句的标记是"04/07",等等,并将上述标记显示在相应词句结束的括号内。以表示该句子是本PDA中收藏的经典词句,其括号中的数字就是分类标记代码。用户将光标移动到分类代码上或该词句上,PDA的处理器就从贮存器的分类目录表中提取相应的类别名称(即表1)并显示在PDA特定位置,如屏幕底部,当光标移动到上述短文的第一句时屏幕底部显示"真理.修身/经验.处世",表示该句有两个分类属性,分别属于"修身"及"处世",这是子类别,它们又分别属于大类"真理"及"经验"。如果用户在阅读上述短文时,还想看看本PDA的"处世"目录中还有那些经典的词句,就可以点击"处世",处理器就可以将表2中包含"处世(分类标记07)"的词句列出来,供用户阅读。在上述短文中,用户还会发现最后两句没有分类标记,而且用户发现这两句也是比较经典值得学习,可以进行收藏。用户利用本PDA的自建词句功能,将自己喜爱的词句添加到词句索引表中,具体方法为用户先打开添加词句功能,选中要添加的词句,处理器会自动根据句子结束的标点符号判断整句,判断不准确时用户可修改,当选中"名不正,则言不顺"时,PDA自动提取本短文的标题"论语",并提示用户输入该句子的译文,并选择分类标记,用户输入该句译文"名义不正当,那么道理也讲不通。",并选择该句的分类标记为"处世",希望处理器将该句自动添加到词句索引表的最后,用户还可以继续将后一句"人无远虑,必有近忧"进行添加,添加完毕后,原表2中就添加了新的内容,见下表4,添加了最后编号为"1019"及"1020"的两个记录。<table>tableseeoriginaldocumentpage13</column></row><table>表4.添加新词句后的索引表由于PDA携带方便,可实现际随时随地的经典词句学习,但PDA屏幕小,用户不宜看屏幕太久,因此许多用户会希望用PDA能够"听"电子书。目前的PDA类电子产品一般都具备强大的多媒体发音功能,因此可以实现上述目的。PDA的有声电子书一般分类人工语音录制及机器自动合成,如TTS。两种方式各有优缺点,播放录制的语音文件可采用真人录音时,用户欣赏效果好,但语音文件制作成本高,需要占用较大机器贮存器空间。语音合成方式无须贮存空间及制作成本,也可以让用户自由选择朗读语速、调调、音色、男女声等多种语音参数,唯一的缺点是机器合成的声音效果比较呆板,但通过采用具有较高技术水平的语音合成技术工具以接近真人发音。本实施方式中采用机器合成方式,这样用户自己下载或编排的自定义材料也能实现读音朗读。在本PDA的操作面板上,有读音导读键,用户按下该键后,PDA屏幕输出的句子就自动朗读,此时用户可以将PDA屏幕关闭,以节省用电。在听读过程中,用户可以随时调节各种朗读参数,如"音量、声调、音色、语速"等,PDA上还可以设计复读键及跟读键,对没有听清楚的句子还可以重复朗读,用户也可以自己跟读。用户在经常使用PDA查阅经典名句时,自己可能会对某个词句比较偏爱,查阅的次数可能多一些,本PDA对此也进行了记录,每个词句被用户查询或点击后在屏幕上显示时,处理器自动增加一次点击数,这样长期下去,每个词句都有自己的点击数,在同一个分类目录下,点击数多的词句说明被用户阅读得多,在词句目录列表显示时,可以根据点击数的大小排序显示,就方便了用户。上述的点击数也可以针对每个词句的不同分类标记来分别累计,如上述短文中的"小不忍,则乱大谋(04/07)"有两个分类属性分别是"利益"及"处世",在用户使用PDA的过程中,通过分类标记"处世(07)"来查询该句子的频率高于"利益(04),则处理器自动调整分类标记显示顺序,调整后在分类目录表的显示为表5:<table>tableseeoriginaldocumentpage14</column></row><table>表5.调整分类标记顺序后的索引表权利要求1、一种用电子装置对文章句子快速进行的分类方法,该电子装置具有文章句子显示屏,可编辑文章句子的编辑器,保存文章句子的贮存器,以及处理器,该电子装置可对文章句子进行分类贮存,其步骤如下1)显示屏上显示由若干条句子组成的文章内容;2)通过编辑器为其中的任意句子做上特定分类标记;3)贮存器中建立与上述每个分类标记对应的类别目录,如果目录已经存在,则不建立;4)处理器对有分类标记的句子进行检测及识别,自动将每个有分类标记的句子保存到对应的上述类别目录中。2、根据权利要求1所述的分类方法,其特征在于所述的句子为整句,整句的判断方法为组成句子的字符串向前后延伸时以特定的断句标点结束,不包括所述的断句标点本身,该断句分类标记包括句号、问号、感叹号或其它可表示句子结束的字符。3、根据权利要求1所述的分类方法,其特征在于所述的编辑器为键盘或手写输入装置,当编辑器为手写输入装置时,所述的显示屏可接受手写识别输入。4、根据权利要求1所述的分类方法,其特征在于所述的类别目录可以嵌套,此时所有的句子只能贮存到最里层的分类目录中,而且所有的各层的分类目录具有唯一的名称。5、根据权利要求1所述的分类方法,其特征在于,一个句子上可以标注一个以上的不同分类标记。6、根据权利要求5所述的分类方法,其特征在于,一个句子上有一个以上的不同分类标记时,从第二个分类标记开始,贮存器中只贮存该句子的索引;或句子贮存在特定目录,贮存的各类别目录只贮存句子的分类标记索引。7、一种用电子装置对文章句子进行的检索方法,该电子装置中有用于读取文章中特定句子的指针,电子装置根据权利要求1所述的分类方法生成文章句子的分类目录表,并保存在贮存器中,其特征在于,检索方法如下a)显示屏上显示用户打开的当前电子书内容;b)处理器逐个提取当前显示的每个句子,查找该句子在分类目录中是否存在,如果存在,则将其所在的本级分类目录名称作为分类标记作为附注添加到该句子上;c)带分类标记的句子被用户选中;d)处理器根据上述选中句子的分类标记将句子读取指针定位到该分类标记对应的分类目录;e)处理器将上述分类目录中的句子进行输出。8、根据权利要求7所述的检索方法,其特征在于,检索到的句子与显示屏上原有的句子同屏显示。9、根据权利要求7所述的检索方法,其特征在于,每个检索到的句子每次被输出时,如果被操作者点击一次,其阅读值递加一次,在每个分类目录中,每个句子按阅读值从大到小顺序排列,并在选中时按此顺序输出;如果输出的句子具有多个分类标记时,按每个分类标记的阅读值按顺序显示。10、根据权利要求7所述的检索方法,其特征在于所述的电子装置具有发声装置,可将屏幕上显示的句子进行语音朗读。全文摘要本发明涉及一种用电子装置对文章句子快速进行的分类及检索方法,电子装置按特定的分类方法生成文章句子的分类目录表,在检索时用户打开的电子书内容,处理器逐个提取每个句子,并查找到该句子所在的分类目录,将分类目录名称作为分类标记附注添加到该句子上,带分类标记的句子被用户选中后,句子读取指针定位到分类目录,对其中的句子进行输出。通过本发明为人们阅读优秀经典文章提供了一种全新的学习模式。用户在学习过程中可以将自己感兴趣的内容进行标注,并建立自己的阅读笔记数据库。读者也可以对现成的素材库根据自己的偏好进行修改完善,并通过网络与他人共享学习,在共同协作学习中提高阅读及学习效率。文档编号G09B5/00GK101533393SQ20081006552公开日2009年9月16日申请日期2008年3月11日优先权日2008年3月11日发明者李冬青申请人:深圳市乐天科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1