在线文档文件的切分方法和在线文档文件的切分系统与流程

文档序号:11234045阅读:2075来源:国知局
在线文档文件的切分方法和在线文档文件的切分系统与流程

本发明涉及文档处理技术领域,具体而言,涉及一种在线文档文件的切分方法和一种在线文档文件的切分系统。



背景技术:

随着互联网技术的发展,越来越多的用户希望文本文档在web端发挥越来越多的作用,例如越来越多学校或培训机构采用在线考试系统,虽然已有很多电子化题库,但其通常仅仅是单纯的纸质文本电子化,且均为单一性科目,比如语文试卷通常都包括:“选择”、“填空”,“阅读理解”“文言文翻译”、“作文”等多种题型,无法给老师提供进一步选择与编辑的空间,因此老师很难配合当前学生的程度出题或者给出综合化试卷,比如一张只有选择题的试卷,或融合了语文、英语、历史、政治等多学科的试卷。

另外,在传媒端搜索某明星新闻时,往往输入明星的名字搜到的新闻无出处,五花八门,真假难辨,在这种情况下,如果可以对其之前关于明星的专访报道从之前的权威媒体的报章杂志中单独切分出来并保存,则可通过搜寻该“明星名字”与“独家专访”等关键字找到相对客观的访谈内容,则之前单独切分出的文档都可以直接显示出来拼成一个完整版面供读者阅读。

因此,如何设计一种新的在线文档文件的切分方案以提升用户在线体验成为亟待解决的技术问题。



技术实现要素:

本发明正是基于上述技术问题至少之一,提出了一种新的在线文档文件的切分方案,通过获取标签信息并将标签信息的位置确定为切分位置, 完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑,或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。

有鉴于此,本发明提出了一种在线文档文件的切分方法,包括:解析待切分的文档文件,以确定待切分的文档文件中的标签信息;将标签信息的位置确定为切分位置;根据拆分位置对待切分的文档文件进行切分。

在该技术方案中,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。

在上述技术方案中,优选地,在解析待切分的文档文件,以确定待切分的文档文件中的标签信息前,还包括:获取待切分的原始文档文件;将原始文档文件中与标签信息匹配的字符替换为预设字符;在替换为预设字符后,对原始文档文件进行类识别,以确定原始文档文件中的元素对象,其中元素对象包括表格对象、公式对象、图片对象和文本对象中的至少一个。

在该技术方案中,如果待切分的文档文件中存在与标签信息相匹配的字符,则该字符也会被识别为标签信息,从而会造成文档切分出错,因此在将原始文档文件中与标签信息匹配的字符替换为与标签信息无关的预设字符,提高了在线文档文件切分的准确性。

在上述技术方案中,优选地,在解析待切分的文档文件,以确定待切分的文档文件中的标签信息前,还包括:根据元素对象的属性参数将经过类识别的原始文档文件转换为图片文件;获取在元素对象中的任两个对象之间插入的标签信息,以生成待切分的文档文件。

在该技术方案中,将待切分的文档文件中的表格对象、公式对象、图片对象和文本对象转换为图片文件,并在任两个图片文件之间插入标签信息,插入的标签描述的是两个图片文件中的前一个的信息,达到了原始文档文件切分的效果。

在上述任一项技术方案中,优选地,包括:在根据拆分位置对待切分 的文档文件进行切分后,将待切分的文档文件转换为活动文档;将活动文档上传至文档服务器。

在该技术方案中,通过活动文档(即activedocument)多任务,将切分后的文档转换为可以在web端显示的活动文档,并上传至服务网,从而实现了用户在web端对切分后的文档的查找和组合。

在上述技术方案中,优选地,还包括:在本地存储器中保存活动文档。

在该技术方案中,通过将活动文档保存在本地存储器,便于用户对活动文档进行查看和管理。

根据本发明第二方面,还提出了一种在线文档文件的切分系统,包括:解析单元,用于解析待切分的文档文件,以确定待切分的文档文件中的标签信息;确定单元,用于将标签信息的位置确定为切分位置;切分单元,用于根据拆分位置对待切分的文档文件进行切分。

在该技术方案中,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。

在上述技术方案中,优选地,包括:获取单元,用于获取待切分的原始文档文件;替换单元,用于将原始文档文件中与标签信息匹配的字符替换为预设字符;类识别单元,用于在替换为预设字符后,对原始文档文件进行类识别,以确定原始文档文件中的元素对象,其中元素对象包括表格对象、公式对象、图片对象和文本对象中的至少一个。

在该技术方案中,如果待切分的文档文件中存在与标签信息相匹配的字符,则该字符也会被识别为标签信息,从而会造成文档切分出错,因此在将原始文档文件中与标签信息匹配的字符替换为与标签信息无关的预设字符,提高了在线文档文件切分的准确性。

在上述技术方案中,优选地,还包括:转换单元,用于根据元素对象的属性参数将经过类识别的原始文档文件转换为图片文件;获取单元还用于:获取在元素对象中的任两个对象之间插入的标签信息,以生成待切分 的文档文件。

在该技术方案中,将待切分的文档文件中的表格对象、公式对象、图片对象和文本对象转换为图片文件,并在任两个图片文件之间插入标签信息,插入的标签描述的是两个图片文件中的前一个的信息,达到了原始文档文件切分的效果。

在上述任一项技术方案中,优选地,转换单元还用于:在根据拆分位置对待切分的文档文件进行切分后,将待切分的文档文件转换为活动文档;在线文档文件的切分系统还包括:切分单元,用于将活动文档上传至文档服务器。

在该技术方案中,通过活动文档(即activedocument),将切分后的文档转换为可以在web端显示的活动文档,并上传至服务网,从而实现了用户在web端对切分后的文档的查找和组合。

在上述技术方案中,优选地,还包括:保存单元,用于在本地存储器中保存活动文档。

在该技术方案中,通过将活动文档保存在本地存储器,便于用户对活动文档进行查看和管理。

附图说明

图1示出了根据本发明的一个实施例的在线文档文件的切分方法的示意流程图;

图2示出了根据本发明的一个实施例的在线文档文件的切分系统的示意框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用第三方不同于在此描述的第三方方式来实施,因此,本 发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的一个实施例的在线文档文件的切分方法的示意流程图。

如图1所示,根据本发明的一个实施例的在线文档文件的切分方法,包括:步骤102,解析待切分的文档文件,以确定待切分的文档文件中的标签信息;步骤104,将标签信息的位置确定为切分位置;步骤106,根据拆分位置对待切分的文档文件进行切分。

在该技术方案中,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。

在上述技术方案中,优选地,在解析待切分的文档文件,以确定待切分的文档文件中的标签信息前,还包括:获取待切分的原始文档文件;将原始文档文件中与标签信息匹配的字符替换为预设字符;在替换为预设字符后,对原始文档文件进行类识别,以确定原始文档文件中的元素对象,其中元素对象包括表格对象、公式对象、图片对象和文本对象中的至少一个。

在该技术方案中,如果待切分的文档文件中存在与标签信息相匹配的字符,则该字符也会被识别为标签信息,从而会造成文档切分出错,因此在将原始文档文件中与标签信息匹配的字符替换为与标签信息无关的预设字符,提高了在线文档文件切分的准确性。

在上述技术方案中,优选地,在解析待切分的文档文件,以确定待切分的文档文件中的标签信息前,还包括:根据元素对象的属性参数将经过类识别的原始文档文件转换为图片文件;获取在元素对象中的任两个对象之间插入的标签信息,以生成待切分的文档文件。

在该技术方案中,将待切分的文档文件中的表格对象、公式对象、图片对象和文本对象转换为图片文件,并在任两个图片文件之间插入标签信息,插入的标签描述的是两个图片文件中的前一个的信息,达到了原始文档文件切分的效果。

在上述任一项技术方案中,优选地,包括:在根据拆分位置对待切分 的文档文件进行切分后,将待切分的文档文件转换为活动文档;将活动文档上传至文档服务器。

在该技术方案中,通过活动文档(即activedocument),将切分后的文档转换为可以在web端显示的活动文档,并上传至服务网,从而实现了用户在web端对切分后的文档的查找和组合。

在上述技术方案中,优选地,还包括:在本地存储器中保存活动文档。

在该技术方案中,通过将活动文档保存在本地存储器,便于用户对活动文档进行查看和管理。

图2示出了根据本发明的一个实施例的在线文档文件的切分系统的示意框图。

如图2所示,根据本发明的一个实施例的在线文档文件的切分系统200,包括:解析单元202,用于解析待切分的文档文件,以确定待切分的文档文件中的标签信息;确定单元204,用于将标签信息的位置确定为切分位置;切分单元206,用于根据拆分位置对待切分的文档文件进行切分。

在该技术方案中,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。

在上述技术方案中,优选地,包括:获取单元208,用于获取待切分的原始文档文件;替换单元210,用于将原始文档文件中与标签信息匹配的字符替换为预设字符;类识别单元212,用于在替换为预设字符后,对原始文档文件进行类识别,以确定原始文档文件中的元素对象,其中元素对象包括表格对象、公式对象、图片对象和文本对象中的至少一个。

在该技术方案中,如果待切分的文档文件中存在与标签信息相匹配的字符,则该字符也会被识别为标签信息,从而会造成文档切分出错,因此在将原始文档文件中与标签信息匹配的字符替换为与标签信息无关的预设字符,提高了在线文档文件切分的准确性。

在上述技术方案中,优选地,还包括:转换单元214,用于根据元素 对象的属性参数将经过类识别的原始文档文件转换为图片文件;获取单元208还用于:获取在元素对象中的任两个对象之间插入的标签信息,以生成待切分的文档文件。

在该技术方案中,将待切分的文档文件中的表格对象、公式对象、图片对象和文本对象转换为图片文件,并在任两个图片文件之间插入标签信息,插入的标签描述的是两个图片文件中的前一个的信息,达到了原始文档文件切分的效果。

在上述任一项技术方案中,优选地,转换单元214还用于:在根据拆分位置对待切分的文档文件进行切分后,将待切分的文档文件转换为活动文档;在线文档文件的切分系统还包括:切分单元206,用于将活动文档上传至文档服务器。

在该技术方案中,通过活动文档(即activedocument),将切分后的文档转换为可以在web端显示的活动文档,并上传至服务网,从而实现了用户在web端对切分后的文档的查找和组合。

在上述技术方案中,优选地,还包括:保存单元216,用于在本地存储器中保存活动文档。

在该技术方案中,通过将活动文档保存在本地存储器,便于用户对活动文档进行查看和管理。

以上结合附图详细说明了本发明的技术方案,考虑到相关技术中提出的如何设计一种新的在线文档文件的切分方案以提升用户在线体验的技术问题,本发明提出了一种新的在线文档文件的切分方案,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1