文本截断、上传方法和装置的制造方法

文档序号:10538885阅读:136来源:国知局
文本截断、上传方法和装置的制造方法
【专利摘要】本发明公开了一种文本截断、上传方法和装置,涉及计算机技术领域,其中所述文本截断方法包括:判断待截断文本占用的字节数是否大于预设截断字节数;当所述待截断文本占用的字节数大于所述预设截断字节数时,将待截断文本转换为汉字编码字符集内的字节数组;在所转换的字节数组中截取所述预设截断字节数+1个字节;将所截取的字节数组再转换回文本形式;将转换回的文本截取掉最后一个文字作为截断文本。由此,可以快速、高效地将一个文本截断为若干占用字符数等于或略小于预设截断字节数的小文本,且不会产生乱码。
【专利说明】
文本截断、上传方法和装置
技术领域
[0001]本发明涉及计算机技术领域,具体涉及一种文本截断、上传方法和装置。
【背景技术】
[0002]在互联网时代,人们习惯将本地上编辑的文本上传到服务器上备份,以避免文本丢失。然而,当本地上的文本字节数太多的时候,当将文本上传到服务器的时候会花费更多的上传时间,但是网络可能会出现不稳定的情况,特别是对于移动终端利用移动网络上传文本的时候,这种网络不稳定的情况会更加严重,如果中间上传中断,还需要重新进行上传,这样会加重服务器的负担。
[0003]目前的一种解决办法是将本地文本截断为若干较小文件后分别上传,例如可以以5000字节分段,将本地文件截断为若干较小文件,但是中文字符占用2个字节,外文字符占用I个字节,如果简单以每5000字节分段,当中文字符占用第5000和第5001字节时,这种情况下截断会产生乱码,从而会使上传文本信息丢失。

【发明内容】

[0004]本发明要解决的技术问题在于在截断文本时采用固定预设截断字节数进行截断时会产生乱码,会使文本信息丢失。
[0005]为此,本发明实施例提供了一种文本截断方法,包括:判断待截断文本占用的字节数是否大于预设截断字节数;当所述待截断文本占用的字节数大于所述预设截断字节数时,将待截断文本转换为汉字编码字符集内的字节数组;在所转换的字节数组中截取所述预设截断字节数+1个字节;将所截取的字节数组再转换回文本形式;将转换回的文本截取掉最后一个文字作为截断文本。
[0006]优选地,所述方法在所述将转换回的文本截取掉最后一个文字作为截断文本之后,还包括:将截断后剩余的文本作为新的待截断文本,并返回至所述判断待截断文本占用的字节数是否大于预设截断字节数的步骤。
[0007]本发明实施例还提供了一种文本上传方法,包括:获取待上传文本;利用上述的文本截断方法,将所述待上传文本截断为若干截断文本;将截断后的所述若干截断文本分别上传至服务器。
[0008]优选地,所述预设截断字节数根据当前网络状况设定。
[0009]优选地,所述将所述待上传文本截断为若干截断文本和所述将截断后的若干截断文本分别上传至服务器的步骤同步执行。
[0010]相应地,本发明实施例还提供了一种文本截断装置,包括:判断单元,用于判断待截断文本占用的字节数是否大于预设截断字节数;第一转换单元,用于当所述判断单元判断待截断文本占用的字节数大于所述预设截断字节数时,将待截断文本转换为汉字编码字符集内的字节数组;第一截取单元,用于在所转换的字节数组中截取所述预设截断字节数+I个字节;第二转换单元,用于将所截取的字节数组再转换回文本形式;第二截取单元,用于将转换回的文本截取掉最后一个文字作为截断文本。
[0011]优选地,所述文本截断装置还包括:保存单元,用于将截断后剩余的文本作为新的待截断文本,并返回至所述判断单元判断待截断文本占用的字节数是否大于预设截断字节数。
[0012]本发明实施例还提供了一种文本上传置,包括:获取单元,用于获取待上传文本;文本截断单元,利用上述文本截断装置,将所述待上传文本截断为若干截断文本;上传单元,用于将截断后的所述若干截断文本分别上传至服务器。
[0013]优选地,所述预设截断字节数根据当前网络状况设定。
[0014]优选地,所述文本截断单元将所述待上传文本截断为若干截断文本和所述上传单元将截断后的若干截断文本分别上传至服务器同步执行,
[0015]本发明实施例所提供的文本截断方法和装置,可以快速、高效地将一个文本截断为若干占用字符数等于或略小于预设截断字节数的小文本,且不会产生乱码。
[0016]本发明实施例所提供的文本上传方法和装置,通过将待上传文本截断为若干小文本分别上传至服务器,避免了网络不稳定时上传大文本易中断的情形,减轻了服务器的负担。
【附图说明】
[0017]通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
[0018]图1示出了根据本发明实施例的文本截断方法的流程图;
[0019]图2示出了根据本发明实施例的文本上传方法的流程图;
[0020]图3示出了根据本发明实施例的文本截断装置的示意图;
[0021 ]图4示出了根据本发明实施例的文本上传装置的示意图。
【具体实施方式】
[0022]下面将结合附图对本发明的实施例进行详细描述。
[0023]本发明实施例提供了一种文本截断方法,如图1所示,该方法包括如下步骤:
[0024]Sll.判断待截断文本占用的字节数是否大于预设截断字节数,当待截断文本占用的字节数小于或等于预设截断字节数时,则无需进行截断,截断结束;当待截断文本占用的字节数大于预设截断字节数时,则进入步骤S12。在这里,该文本包括中文字符和外文字符,其中中文字符占用2个字节,外文字符占用I个字节。
[0025]S12.将待截断文本转换为汉字编码字符集内的字节数组。在这里,汉字编码字符集内的字符例如可以是符合GB2312标准的中文或外文字符。
[0026]S13.在所转换的字节数组中截取预设截断字节数+1个字节。例如,预设截断字节数为5000,则截取5001个字节。
[0027]S14.将所截取的字节数组再转换回文本形式。
[0028]S15.将转换回的文本截取掉最后一个文字作为截断文本。
[0029]S16.将截断后剩余的文本作为新的待截断文本,并返回至步骤S11。
[0030]下面将详细说明本发明实施例的文本截断方法的原理。还是以预设截断字节数为5000为例,当从所转换的汉字编码字符集内的字节数组中截取5001个字节时,并将其再转换回文本形式后,最后一个文字存在如下三种情况:
[0031]I)最后一个文字是占用I个字节的外文字符,这时截取掉最后一个文字后,所得到的截断文本占用5000个字节;
[0032]2)最后一个文字是本应与第5002个字节共同组成一个汉字的字符,这时截取掉最后一个文字后,所得到的截断文本占用5000个字节;
[0033]3)最后一个文字是占用2个字节的中文字符,这时截取掉最后一个文字后,所得到的截断文本占用4999个字节;
[0034]由此,可以保证截断不会产生乱码,且能保证截断文本等于或略小于预设截断字节数。
[0035]在步骤S16中,将剩余文本作为新的待截断文本,并返回至步骤Sll,从而继续判断新的待截断文本占用的字节数是否大于预设截断字节数,当大于时继续按照步骤S12-S16进行截断,直至待截断文本占用的字节数小于或等于预设截断字节数。
[0036]通过上述方法步骤,可以快速、高效地将一个文本截断为若干占用字符数基本上等于预设截断字节数的小文本,且不会产生乱码。
[0037]本发明实施例还提供了一种文本上传方法,如图2所示,该方法包括如下步骤:
[0038]S21.获取待上传文本。在这里,该文本包括中文字符和英文字符,其中中文字符占用2个字节,英文字符占用I个字节。
[0039]S22.将待上传文本截断为若干截断文本。例如,可以采用上文中所述的文本截断方法,将待上传文本截断为若干小文本。在这里,预设截断字节数可以是用户终端出厂预设的,也可以由用户根据当前网络状况设定,例如,当网络状况较好时,可以将预设截断字节数设置得较大,当网络状况较差时,可以将预设截断字节数设置得较小。
[0040]S23.将截断后的若干截断文本分别上传至服务器。优选地,截断文本按序分别上传至服务器。
[0041]通过上述方法步骤,通过将待上传文本截断为若干小文本分别上传至服务器,避免了网络不稳定时上传大文本易中断的情形,减轻了服务器的负担。
[0042]为了进一步提升效率,上述步骤S22和S23可以同步执行,既完成一个截断文本的截断后就开始上传该截断文本,而无需等待截断完成后再进行上传。
[0043]相应地,本发明实施例还提供了一种文本截断装置,如图3所示,该装置包括:
[0044]判断单元31,用于判断待截断文本占用的字节数是否大于预设截断字节数,当待截断文本占用的字节数小于或等于预设截断字节数时,则无需进行截断。在这里,该文本包括中文字符和外文字符,其中中文字符占用2个字节,外文字符占用I个字节。
[0045]第一转换单元32,用于当判断单元31判断待截断文本占用的字节数大于预设截断字节数时,将待截断文本转换为汉字编码字符集内的字节数组。在这里,汉字编码字符集内的字符例如可以是符合GB2312标准的中文或外文字符。
[0046]第一截取单元33,用于在所转换的字节数组中截取预设截断字节数+1个字节。例如,预设截断字节数为5000,则截取5001个字节。
[0047]第二转换单元34,用于将所截取的字节数组再转换回文本形式。
[0048]第二截取单元35,用于将转换回的文本截取掉最后一个文字作为截断文本。
[0049]通过上述各个单元,可以快速、高效地将一个文本截断为若干占用字符数基本上等于预设截断字节数的小文本,且不会产生乱码。
[0050]优选地,上述文本截断装置还可以包括:
[0051]保存单元36,用于将截断后剩余的文本作为新的待截断文本,并返回至判断单元31判断待截断文本占用的字节数是否大于预设截断字节数。
[0052]由此可以继续对待截断文本进行截断,直至待截断文本占用的字节数小于或等于预设截断字节数,从而可以快速、高效地将一个文本截断为若干占用字符数基本上等于预设截断字节数的小文本,且不会产生乱码。
[0053]本发明实施例还提供了一种文本上传装置,如图4所示,该装置包括:
[0054]获取单元41,用于获取待上传文本。在这里,该文本包括中文字符和英文字符,其中中文字符占用2个字节,英文字符占用I个字节。
[0055]文本截断单元42,用于将待上传文本截断为若干截断文本。例如,可以采用上文中所述的文本截断装置,将待上传文本截断为若干小文本。在这里,预设截断字节数可以是用户终端出厂预设的,也可以由用户根据当前网络状况设定,例如,当网络状况较好时,可以将预设截断字节数设置得较大,当网络状况较差时,可以将预设截断字节数设置得较小。
[0056]上传单元43,用于将截断后的若干截断文本分别上传至服务器。优选地,截断文本按序分别上传至服务器。
[0057]通过上述各个单元,通过将待上传文本截断为若干小文本分别上传至服务器,避免了网络不稳定时上传大文本易中断的情形,减轻了服务器的负担。
[0058]为了进一步提升效率,文本截断单元42将待上传文本截断为若干截断文本和上传单元43将截断后的若干截断文本分别上传至服务器同步执行,既完成一个截断文本的截断后就开始上传该截断文本,而无需等待截断完成后再进行上传。
[0059]本领域内的技术人员还应理解,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0060]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的,应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0061]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0062]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0063]虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
【主权项】
1.一种文本截断方法,其特征在于,包括: 判断待截断文本占用的字节数是否大于预设截断字节数; 当所述待截断文本占用的字节数大于所述预设截断字节数时,将待截断文本转换为汉字编码字符集内的字节数组; 在所转换的字节数组中截取所述预设截断字节数+1个字节; 将所截取的字节数组再转换回文本形式; 将转换回的文本截取掉最后一个文字作为截断文本。2.根据权利要求1所述的文本截断方法,其特征在于,在所述将转换回的文本截取掉最后一个文字作为截断文本之后,还包括: 将截断后剩余的文本作为新的待截断文本,并返回至所述判断待截断文本占用的字节数是否大于预设截断字节数的步骤。3.一种文本上传方法,其特征在于,包括: 获取待上传文本; 利用权利要求1或2所述的文本截断方法,将所述待上传文本截断为若干截断文本; 将截断后的所述若干截断文本分别上传至服务器。4.根据权利要求3所述的文本上传方法,其特征在于,所述预设截断字节数根据当前网络状况设定。5.根据权利要求3或4所述的文本上传方法,其特征在于,所述将所述待上传文本截断为若干截断文本和所述将截断后的若干截断文本分别上传至服务器的步骤同步执行。6.一种文本截断装置,其特征在于,包括: 判断单元,用于判断待截断文本占用的字节数是否大于预设截断字节数; 第一转换单元,用于当所述判断单元判断待截断文本占用的字节数大于所述预设截断字节数时,将待截断文本转换为汉字编码字符集内的字节数组; 第一截取单元,用于在所转换的字节数组中截取所述预设截断字节数+1个字节; 第二转换单元,用于将所截取的字节数组再转换回文本形式; 第二截取单元,用于将转换回的文本截取掉最后一个文字作为截断文本。7.根据权利要求6所述的文本截断装置,其特征在于,还包括: 保存单元,用于将截断后剩余的文本作为新的待截断文本,并返回至所述判断单元判断待截断文本占用的字节数是否大于预设截断字节数。8.一种文本上传装置,其特征在于,包括: 获取单元,用于获取待上传文本; 文本截断单元,利用权利要求6或7所述的文本截断装置,将所述待上传文本截断为若干截断文本; 上传单元,用于将截断后的所述若干截断文本分别上传至服务器。9.根据权利要求8所述的文本上传传置,其特征在于,所述预设截断字节数根据当前网络状况设定。10.根据权利要求8或9所述的文本上传装置,其特征在于,所述文本截断单元将所述待上传文本截断为若干截断文本和所述上传单元将截断后的若干截断文本分别上传至服务器同步执行。
【文档编号】H04L29/08GK105897875SQ201610202824
【公开日】2016年8月24日
【申请日】2016年4月1日
【发明人】李树鹏
【申请人】乐视控股(北京)有限公司, 乐视移动智能信息技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1