文章章节生成方法、系统和电子书阅读器的制造方法

文档序号:9547160阅读:416来源:国知局
文章章节生成方法、系统和电子书阅读器的制造方法
【技术领域】
[0001]本发明涉及信息技术领域,具体而言,本发明涉及一种文章章节生成方法和系统,以及一种电子书阅读器。
【背景技术】
[0002]互联网技术的不断发展,使得电子书十分流行。电子书的格式包括TXT、D0C、roF、HTM、HTML、EPUB、CHM等等,通常TXT格式的较受欢迎。一些电子书,是通过搜索引擎抓取网页内容进行转码形成书籍内容,生成电子书文件,这类电子书好多无章节结构或章节混乱。在互联网上,无章节结构或章节混乱的这类电子书较多,用户利用电子书阅读器或者在线阅读这类电子书时容易造成阅读困难,用户体验较差。

【发明内容】

[0003]本发明的目的旨在至少能解决上述的技术缺陷之一,特别是阅读困难的技术缺陷。
[0004]本发明提供一种文章章节生成方法,包括如下步骤:
[0005]遍历所述文章的文本数据,提取其中具有章节特征的纲目内容;
[0006]按序组织所述纲目内容以建立所述文章的章节列表,建立章节列表到对应的章节内容之间的索引关系;
[0007]推送或显示所述章节列表。
[0008]本发明中,所述章节特征为:相邻两个标识符之间的字符数满足预设条件。
[0009]本发明中,所述标识符包括段落符和断行符中的一种。
[0010]本发明中,所述预设条件包括:字符数大于0且少于预设数值。
[0011]本发明中,所述具有章节特征的纲目内容为所述相邻两个标识符之间的字符。
[0012]本发明中,所述按序组织所述纲目内容以建立所述文章的章节列表包括步骤:
[0013]提取所述相邻两个标识符之间的字符作为候选章节;
[0014]得到多个候选章节;
[0015]从所述多个候选章节中得到多个章节,并按照预设的排列规则排列所述多个章节以建立章节列表。
[0016]本发明中,从所述多个候选章节中按照预设的筛选规则得到多个章节。
[0017]本发明中,所述预设的筛选规则包括:保留具有数字字符的候选章节。
[0018]本发明中,所述预设的筛选规则包括:保留具有预设字符的候选章节。
[0019]本发明中,所述预设的筛选规则包括:删除候选章节为预设字符串的候选章节。
[0020]本发明中,所述预设的排列规则包括:文本数据顺序。
[0021]本发明中,还包括前置步骤:根据所述文章的用户指定内容而获得所述文章。
[0022]本发明中,所述用户指定内容包括所述文章的关键词,通过搜索引擎搜索所述关键词而获取所述文章。
[0023]本发明中,所述用户指定内容包括所述文章的存储路径,通过读取所述存储路径所指向的文件而获取所述文章。
[0024]本发明中,按照文本数据顺序依次提取文本数据中具有章节特征的纲目内容。
[0025]本发明中,推送或显示所述章节列表之后,还包括步骤:
[0026]提供所述章节列表给用户确认。
[0027]本发明中,推送或显示所述章节列表之后,还包括步骤:
[0028]提供所述章节列表给用户修改和确认。
[0029]本发明中,保存经用户确认的所述章节列表。
[0030]本发明还提供一种文章章节生成系统,包括:
[0031]提取模块,用于遍历所述文章的文本数据,提取其中具有章节特征的纲目内容;
[0032]生成模块,用于按序组织所述纲目内容以建立所述文章的章节列表,建立章节列表到对应的章节内容之间的索引关系;及
[0033]输出模块,用于推送或显示所述章节列表。
[0034]本发明中,所述章节特征为:相邻两个标识符之间的字符数满足预设条件。
[0035]本发明中,所述标识符包括段落符和断行符中的一种。
[0036]本发明中,所述预设条件包括:字符数大于0且少于预设数值。
[0037]本发明中,所述具有章节特征的纲目内容为所述相邻两个标识符之间的字符。
[0038]本发明中,所述生成模块包括:
[0039]提取单元,用于提取所述相邻两个标识符之间的字符作为候选章节,并得到多个候选章节;及
[0040]排列单元,用于从所述多个候选章节中得到多个章节,并按照预设的排列规则排列所述多个章节以建立章节列表。
[0041]本发明中,从所述多个候选章节中按照预设的筛选规则得到多个章节。
[0042]本发明中,所述预设的筛选规则包括:保留具有数字字符的候选章节。
[0043]本发明中,所述预设的筛选规则包括:保留具有预设字符的候选章节。
[0044]本发明中,所述预设的筛选规则包括:删除候选章节为预设字符串的候选章节。
[0045]本发明中,所述预设的排列规则包括:文本数据顺序。
[0046]本发明中,所述系统还包括获取模块,用于根据所述文章的用户指定内容而获得所述文章。
[0047]本发明中,所述用户指定内容包括所述文章的关键词,通过搜索引擎搜索所述关键词而获取所述文章。
[0048]本发明中,所述用户指定内容包括所述文章的存储路径,通过读取所述存储路径所指向的文件而获取所述文章。
[0049]本发明中,按照文本数据顺序依次提取文本数据中具有章节特征的纲目内容。
[0050]本发明中,所述系统还包括确认模块,用于在输出模块推送或显示所述章节列表之后,提供所述章节列表给用户确认。
[0051]本发明中,所述系统还包括确认模块,用于在输出模块推送或显示所述章节列表之后,提供所述章节列表给用户修改和确认。
[0052]本发明中,所述系统还包括存储模块,用于保存经用户确认的所述章节列表。
[0053]本发明还提供一种电子书阅读器,所述电子书阅读器包括上述的文章章节生成系统。
[0054]上述文章章节生成方法和系统,通过遍历文章的文本数据,提取其中具有章节特征的纲目内容;然后按序组织纲目内容以建立文章的章节列表,并建立章节列表到对应的章节内容之间的索引关系;再推送或显示所述章节列表。章节的标题通常具有一定的章节特征,例如通常章节的标题都较短,又或者具备数字字符,又或者具备特定字符“第” “章” “节”等等,通过提取具有章节特征的纲目内容,可以迅速而准确的找到文章的各个章节标题,从而形成章节列表,使读者可以通过章节列表更便利的阅读文章,提高了用户体验。
[0055]本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0056]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0057]图1为一个实施例的文章章节生成方法流程图;
[0058]图2为一个实施例按序组织纲目内容以建立文章的章节列表流程图;
[0059]图3为一个实施例的文章章节生成系统模块示意图;
[0060]图4为一个实施例的生成模块示意图。
【具体实施方式】
[0061]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0062]本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
[0063]本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0064]本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS (Personal Communicat1ns Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS (Global Posit1ning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1