文字编码和译码方法、装置及电子设备的制造方法_5

文档序号:9766018阅读:来源:国知局
设备,该方法可以包括:
[0159]获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字;
[0160]在所述分词编码库中找到根节点为当前分词首字的树;
[0161]在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字;
[0162]在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点;
[0163]如果找到,则将该下一个字作为当前分词尾字,返回执行所述在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。
[0164]相应地,本发明实施例还提供了一种应用程序,其中,该应用程序用于在运行时执行本发明实施例所述的一种文字译码方法。其中,本发明实施例所述的一种文字译码方法,应用于电子设备,该方法可以包括:
[0165]获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0166]在所述分词译码库中查找所述当前编码对应的分词;
[0167]将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0168]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0169]本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0170]以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
【主权项】
1.一种文字编码方法,其特征在于,应用于电子设备中,所述电子设备中存储有分词编码库,所述分词编码库包含有多个字典树,各字典树中的每个节点中均包含一个文字且各字典树的根节点中包含的文字不同,每个字典树包含以其根节点为分词首字的所有预设分词,且每个预设分词的分词尾字所在的节点对应有预设长度的编码,所述方法包括: 获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字; 在所述分词编码库中找到根节点为当前分词首字的树; 在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字; 在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点; 如果找到,则将该下一个字作为当前分词尾字,返回执行所述在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 如果在所述根节点的子节点中未找到当前分词首字的下一个字所在的节点,将当前分词首字转换为对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词首字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤。3.根据权利要求1所述的方法,其特征在于,所述预设长度为3字节。4.根据权利要求1所述的方法,其特征在于,所述文字为英文、中文、韩文或日文。5.—种文字译码方法,其特征在于,用于对权利要求1至4中任一项权利要求中的所述编码文件进行处理,所述方法应用于电子设备中,所述电子设备中存储有分词译码库,所述分词译码库是根据所述分词编码库设置的,所述分词译码库中对应存储有所述分词编码库中的所有预设分词及预设长度的编码,所述方法包括: 获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码; 在所述分词译码库中查找所述当前编码对应的分词; 将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。6.—种文字编码装置,其特征在于,应用于电子设备中,所述电子设备中存储有分词编码库,所述分词编码库包含有多个字典树,各字典树中的每个节点中均包含一个文字且各字典树的根节点中包含的文字不同,每个字典树包含以其根节点为分词首字的所有预设分词,且每个预设分词的分词尾字所在的节点对应有预设长度的编码,所述装置包括: 第一获得模块,用于获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字; 第一查找模块,用于在所述分词编码库中找到根节点为当前分词首字的树; 确定模块,用于在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字; 第二查找模块,用于在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点; 第一编码模块,用于第二查找模块如果找到,则将该下一个字作为当前分词尾字,触发第二查找模块;第二查找模块如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,触发第一查找模块,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。7.根据权利要求6所述的装置,其特征在于,所述装置还包括: 第二编码模块,用于确定模块如果在所述根节点的子节点中未找到当前分词首字的下一个字所在的节点,将当前分词首字转换为对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词首字的下一个字确定为当前分词首字,触发第一查找模块。8.根据权利要求6所述的装置,其特征在于,所述预设长度为3字节。9.根据权利要求6所述的装置,其特征在于,所述文字为英文、中文、韩文或日文。10.一种文字译码装置,其特征在于,用于对权利要求6至9中任一项权利要求中的所述编码文件进行处理,所述装置应用于电子设备中,所述电子设备中存储有分词译码库,所述分词译码库是根据所述分词编码库设置的,所述分词译码库中对应存储有所述分词编码库中的所有预设分词及预设长度的编码,所述装置包括: 第二获得模块,用于获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码; 第三查找模块,用于在所述分词译码库中查找所述当前编码对应的分词; 译码模块,用于将所述当前编码转换为第三查找模块查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,触发第三查找模块,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
【专利摘要】本发明实施例提供了文字编码和译码方法、装置及电子设备,在分词编码库中找到根节点为当前分词首字的树,在子节点中找到下一个字所在的节点,将该下一个字作为当前分词尾字,在其子节点中查找下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字,返回执行在其子节点中查找下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的分词转换为预设长度的编码,将编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行找到根节点为当前分词首字的树的步骤,本发明在分词编码库中查找待转换文本中的分词,并将查找到的分词转换为预设长度的编码达到减少占用存储空间的目的。
【IPC分类】G06F17/30
【公开号】CN105528420
【申请号】CN201510890341
【发明人】潘洪安
【申请人】北京金山安全软件有限公司
【公开日】2016年4月27日
【申请日】2015年12月7日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1