文字编码和译码方法、装置及电子设备的制造方法_2

文档序号:9766018阅读:来源:国知局
中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0043]在所述分词译码库中查找所述当前编码对应的分词;
[0044]将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0045]为实现上述目的,本发明实施例还提供了一种存储介质,其中,该存储介质用于存储应用程序,所述应用程序用于在运行时执行本发明实施例所述的一种文字编码方法。其中,本发明实施例所述的一种文字编码方法,应用于电子设备,该方法可以包括:
[0046]获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字;
[0047]在所述分词编码库中找到根节点为当前分词首字的树;
[0048]在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字;
[0049]在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点;
[0050]如果找到,则将该下一个字作为当前分词尾字,返回执行所述在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。
[0051]相应地,本发明实施例还提供了一种存储介质,其中,该存储介质用于存储应用程序,所述应用程序用于在运行时执行本发明实施例所述的一种文字译码方法。其中,本发明实施例所述的一种文字译码方法,应用于电子设备,该方法可以包括:
[0052]获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0053]在所述分词译码库中查找所述当前编码对应的分词;
[0054]将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0055]为实现上述目的,本发明实施例还提供了一种应用程序,其中,该应用程序用于在运行时执行本发明实施例所述的一种文字编码方法。其中,本发明实施例所述的一种文字编码方法,应用于电子设备,该方法可以包括:
[0056]获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字;
[0057]在所述分词编码库中找到根节点为当前分词首字的树;
[0058]在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字;
[0059]在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点;
[0060]如果找到,则将该下一个字作为当前分词尾字,返回执行所述在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。
[0061]相应地,本发明实施例还提供了一种应用程序,其中,该应用程序用于在运行时执行本发明实施例所述的一种文字译码方法。其中,本发明实施例所述的一种文字译码方法,应用于电子设备,该方法可以包括:
[0062]获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0063]在所述分词译码库中查找所述当前编码对应的分词;
[0064]将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0065]本发明实施例提供的文字编码和译码方法、装置及电子设备,可以在分词编码库中找到根节点为当前分词首字的树,在所述根节点的子节点中找到下一个字所在的节点,将该下一个字作为当前分词尾字,在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字,返回执行在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的分词转换为预设长度的编码,将编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行找到根节点为当前分词首字的树的步骤。本发明在分词编码库中查找待转换文本中的分词,并将查找到的分词转换为预设长度的编码,与将单个文字转化为预设长度的编码的方法相比,本发明将分词转换为预设长度的编码减少了占用的存储空间。
【附图说明】
[0066]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0067]图1为本发明实施例提供的一种文字编码方法的流程示意图;
[0068]图2为本发明实施例提供的一种分词编码库中的字典树的结构示意图;
[0069]图3为本发明实施例提供的另一种文字编码方法的流程示意图;
[0070]图4为本发明实施例提供的一种文字译码方法的流程示意图;
[0071]图5为本发明实施例提供的一种文字编码装置的结构示意图;
[0072]图6为本发明实施例提供的一种文字译码装置的结构示意图;
[0073]图7为本发明实施例提供的一种电子设备的结构示意图。
【具体实施方式】
[0074]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0075]如图1所示,本发明实施例提供的一种文字编码方法,图1所示方法可以应用于电子设备中,所述电子设备中存储有分词编码库,所述分词编码库包含有多个字典树,各字典树中的每个节点中均包含一个文字且各字典树的根节点中包含的文字不同,每个字典树包含以其根节点为分词首字的所有预设分词,且每个预设分词的分词尾字所在的节点对应有预设长度的编码,该方法可以包括:
[0076]SlOl:获得待转换文本中的当前分词首字。
[0077]其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字。
[0078]所述分词编码库是根据预设分词编制的,所以具有通用性。
[0079]具体的,所述文字可以为英文、中文、韩文或日文。
[0080]例如:所述文字为中文,如图2所示,所述分词编码库包含有多个字典树,各字典树中的每个节点中均包含一个中文且各字典树的根节点中包含的中文不同,每个字典树包含以其根节点为分词首字的所有预设分词,且每个预设分词的分词尾字所在的节点对应有预设长度的编码。
[0081]S102:在所述分词编码库中找到根节点为当前分词首字的树。
[0082]当开始对待转换文本进行转换时,从所述分词编码库包含的多个字典树中找到所述待转换文本的首个文字所在的树。其它情况时,从所述分词编码库包含的多个字典树中找到所述待转换文本的当前分词首字所在的树。
[0083 ] S13:在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字。
[0084]当开始对待转换文本进行转换时,如果在所述首个文字所在的树的子节点中找到待转换文本中第二个字所在的节点,则将该第二个字作为当前分词尾字。其它情况时,如果在所述当前分词首字所在的树的子节点中找到待转换文本中当前分词首字的下一个字所在的节点,则将该下一个字作为当前分词尾字。
[0085]S104:在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点,如果找到,则执行步骤S105;否则,则执行步骤106。
[0086]S105:将该下一个字作为当前分词尾字,返回执行步骤S104。
[0087]如果在确定的当前分词尾字的子节点中找到当前分词尾字的下一个字所在的节点,将该下一个字作为当前分词尾字,且继续查找作为当前分词尾字的下一个字所在的节点,如果找到,则一直
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1