一种用于显示章节内容的方法和装置的制造方法_4

文档序号:8258494阅读:来源:国知局
T1、TXT2、TXT3进行比对与合并,并将合并后的ΤΧΤ4作为待处理的文本信息。
[0165]其中,比对合并装置可采用多种方式通过比对并合并所述多个不同版本的自然语言文本,获得所述待处理的文本信息。
[0166]例如,比对合并装置基于自然语言处理技术比对该多个不同版本的内容相似度,并根据比对结果合并得到待处理的文本信息。如,比对合并装置基于自然语言处理技术比对ΤΧΤ1、ΤΧΤ2、ΤΧΤ3得知-TXTl的全部内容与ΤΧΤ2的前60%的内容相同,ΤΧΤ2的后50%的内容与ΤΧΤ3的前30 %的内容相同;则比对合并装置提取ΤΧΤ2前50 %的内容以及ΤΧΤ3后70%的内容,并将两者合并,获得合并后的ΤΧΤ4作为待处理的文本信息。
[0167]又例如,当比对合并装置能够识别多个不同版本的每个版本的自然语言文本中的章节时,对于每个章节,比对合并装置对该章节所对应的多个版本进行比对,并合并得到该章节对应的待处理的文本信息。如,ΤΧΤ5、ΤΧΤ6、ΤΧΤ7为小说B的三个不同版本的自然语言处理文本,该三个不同版本均能识别出小说B的3个章节:章节一、章节二、章节三;比对合并装置通过对每个章节在ΤΧΤ5、ΤΧΤ6、ΤΧΤ7中所对应的内容进行比对,得知:章节一在ΤΧΤ5中所对应的内容的数据量最大,章节二在ΤΧΤ7中所对应的内容的数据量最大,章节三在ΤΧΤ6中所对应的内容的数据量最大;则比对合并装置将章节一在ΤΧΤ5中所对应的内容、章节二在ΤΧΤ7中所对应的内容、章节三在ΤΧΤ6中所对应的内容进行合并,并将合并得到的ΤΧΤ8作为待处理的文本信息。其中,识别自然语言文本中的章节的实现方式将在后续予以详述。
[0168]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取待处理的文本信息,其中,所述文本信息包括一个阅读主体的自然语言文本的实现方式,均应包含在本发明的范围内。
[0169]识别装置2根据所述文本信息,识别所述自然语言文本中的章节。
[0170]其中,识别所述自然语言文本中的章节的操作基于以下至少一项来被执行:
[0171]I)自然语言文本中包含的、符合预定格式的文本特征信息。
[0172]其中,所述预定格式包括任何预定的、能够指示章节的格式。优选地,所述预定格式包括文字格式、数字格式、文字与数字结合的格式等。例如,预定格式“第X章”用于指示自然语言文本的第“X”个章节,其中,“X”为阿拉伯数字;则自然语言文本中包含的“第I章”为符合该预定格式的文本特征信息。又例如,预定格式为单独一行的阿拉伯数字或汉字数字,则自然语言文本中包含的、单独一行的“ I”或“一”为符合该预定格式的文本特征信息。
[0173]例如,识别装置2直接基于自然语言文本中包含的、符合“第X章”的预定格式的文本特征信息来识别自然语言文本中的章节。
[0174]2)所述文本信息中包含的、章节标记信息。
[0175]其中,所述章节标记信息包括任何用于标记章节的信息;优选地,所述章节标记信息包括但不限于用于标记章节的标签,如Tag等;更优选地,所述章节标记信息不包含在自然语言文本中。
[0176]更优选地,若文本信息来自其他网站,则该文本信息中的章节标记信息通常由提供该文本信息的其他网站生成;或者,所述章节标记信息可由第一获取装置I在执行操作的过程中生成并加入文本信息中。
[0177]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述文本信息,识别所述自然语言文本中的章节的实现方式,均应包含在本发明的范围内。
[0178]生成装置3将每个章节的章节内容生成为独立的可读取分块,并建立所述阅读主体的章节索引信息。其中,各个独立的可读取分块之间没有直接地耦合关系。
[0179]其中,所述章节索引信息指示了该阅读主体的章节与章节所对应的可读取分块之间的对应信息。
[0180]优选地,所述章节索引信息包括章节的标识信息;所述章节索引信息基于章节的标识信息来指示阅读主体的章节与章节所对应的可读取分块之间的对应关系。
[0181]例如,章节索引信息包括每个章节的标识信息;其中,标识信息Chapterl用于标识阅读主体的第一个章节,并同时标识该第一个章节所对应的可读取分块。
[0182]更优选地,所述章节索引信息还包括章节对应的可读取分块的标识信息;所述章节索引信息指示了章节的标识信息以及与章节所对应的可读取分块的标识信息之间的--对应关系。
[0183]例如,章节索引信息包括章节的标识信息以及每个章节所对应的可读取分块的标识信息,且指示了章节的标识信息和可读取分块的标识信息之间的一一对应关系;其中,章节的标识信息Chapterl用于标记阅读主体的第一个章节,与Chapterl具有对应关系的blockl用于标识该第一个章节所对应的可读取分块。
[0184]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将每个章节的章节内容生成为独立的可读取分块,并建立所述阅读主体的章节索引信息的实现方式,均应包含在本发明的范围内。
[0185]作为一种优选方案,本实施例的第一装置还包括用于获取需要替换的章节的标识信息以及该章节的替换内容信息的装置(以下简称“第二子获取装置”,图未示)、用于根据所述标识信息,通过所述章节索引信息确定与该章节对应的可读取分块,并在不影响该章节所属阅读主体的其他章节的可读取分块的情况下,根据所述替换内容信息,更改该对应的可读取分块中的章节内容的装置(以下简称“更改装置”,图未示)。
[0186]第二子获取装置获取需要替换的章节的标识信息以及该章节的替换内容信息。
[0187]其中,所述章节的标识信息包括任何用于标识章节的信息。优选地,所述标识信息包括需要替换的章节的章节标记信息。
[0188]具体地,第二子获取装置获取需要替换的章节的标识信息以及该章节的替换内容信息的实现方式包括但不限于:
[0189]I)第二子获取装置获取用户指定的需要替换的章节的标识信息,并获取来自用户的该章节的替换内容信息。
[0190]其中,第二子获取装置可采用多种方式获取用户指定的需要替换的章节的标识信息,并获取来自用户的该章节的替换内容信息。
[0191]例如,第二子获取装置根据用户输入的章节编号确定需要替换的章节的标识信息,并接收用户直接上传至网络设备的、该章节的替换内容信息。
[0192]又例如,第二子获取装置接收来自用户设备的、用户指定的需要替换的章节的标识信息,以及,用户上传至该用户设备的替换内容信息。
[0193]2)第二子获取装置获取用户指定的需要替换的章节的标识信息以及该章节的替换内容信息的来源信息,并从所述来源获得章节的替换内容信息。
[0194]其中,所述来源信息用于指示替换内容信息的来源。优选地,所述来源信息包括但不限于用于下载该来源信息的地址信息、呈现该替换内容信息的网页的地址信息等。
[0195]其中,第二子获取装置可采用多种方式获取用户指定的需要替换的章节的标识信息以及该章节的替换内容信息的来源信息。
[0196]例如,第二子获取装置根据用户输入的章节编号确定需要替换的章节的标识信息,并获取用户在用户设备中输入的替换内容信息的下载地址,作为来源信息。
[0197]3)第二子获取装置获取发生更新的章节的标识信息以及该章节更新后的替换内容信息。
[0198]其中,第二子获取装置可通过多种方式来获得发生更新的章节的标识信息以及该章节更新后的替换内容信息。
[0199]例如,第二子获取装置定期访问阅读主体的来源网站,通过作者的历史操作记录来确定发生更新的章节的标识信息,并获取该标识信息对应的章节的更新后的章节内容,作为替换内容信息。
[0200]又例如,第二子获取装置接收到来自用户的、用于指示章节发生更新的指示信息,该指示信息包括该发生更新的章节的标识信息;则第二子获取装置可通过访问该章节的来源网站来获得该章节的替换内容信息。
[0201]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取需要替换的章节的标识信息以及该章节的替换内容信息的实现方式,均应包含在本发明的范围内。
[0202]更改装置根据需要替换的章节的标识信息,通过所述章节索引信息确定与该章节对应的可读取分块,并在不影响该章节所属阅读主体的其他章节的可读取分块的情况下,根据所述替换内容信息,更改该对应的可读取分块中的章节内容。
[0203]例如,更改装置根据需要替换的章节的标识信息,通过章节索引信息确定与该章节对应的可读取分块为block2,则更改装置在不影响该章节所属阅读主体的其他章节的可读取分块的情况下,将block2中的章节内容替换为替换内容信息所对应的章节内容。
[0204]现有技术中,网络设备通常直接将一个文学作品的文本信息作为整体进行处理,因此,一旦文本信息内的部分内容发生更新,网络设备需要对整个更新后的文本信息进行重新处理;并且,对于同一阅读主体的不同版本,网络设备通常会将多个不同版本的章节均提供给用户,有用户来自行选择希望阅读的版本。
[0205]此外,现有技术中,当阅读主体中的章节内容发生更新时,通常需要人工进行修改或替换,这使得用户不能及时阅读到更新后的章节内容,从而影响了用户设备的阅读体验。
[0206]根据本实施例的方案,网络设备通过将章节的章节内容生成为独立的可读取分块,以使可读取分块之间不存在耦合关系,从而可对可读取分块进行独立操作,如更新、添加、删除等,且对一个可读取分块的操作不会影响到其他可读取分块的章节内容,从而使得阅读主体的章节内容之间更加灵活;并且,本实施例中能够将一个阅读主体的不同版本的自然语言文本进行合并,使得用户无需再多个版本中来回选择;此外,网络设备可基于可读取分块建立章节索引信息,从而进一步增强可读取分块的独立性,能够更加快速的为用户设备提供章节内容,且便于用户设备对章节内容的操作。
[0207]图5为本发明一个实施例的显示章节内容的系统的示意图。根据本实施例的方法主要由网络设备和用户设备来实现。本实施例中,网络设备包括第一装置,该第一装置包括用于接收来自用户设备的阅读请求的装置(以下简称“第二接收装置202”)、用于根据所述阅读主体的标识信息,确定该阅读主体的章节索引信息的装置(以下简称“第一确定装置203”)、用于根据所述章节索引信息,确定该阅读主体的所有章节对应的可读取分块的装置(以下简称“第二确定装置204”)、用于从所述所有章节对应的可读取分块从读取章节内容的装置(以下简称“第一读取装置205”)、用于向所述用户设备提供所读取的章
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1