文字编码和译码方法、装置及电子设备的制造方法_4

文档序号:9766018阅读:来源:国知局
尾字,触发第二查找模块504;第二查找模块504如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,触发第一查找模块502,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。
[0125]所述预设长度可以为3字节。
[0126]所述装置还可以包括:
[0127]第二编码模块,用于确定模块503如果在所述根节点的子节点中未找到当前分词首字的下一个字所在的节点,将当前分词首字转换为对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词首字的下一个字确定为当前分词首字,触发第一查找模块502。
[0128]本发明实施例提供的一种文字编码装置,可以在分词编码库中找到根节点为当前分词首字的树,在所述根节点的子节点中找到下一个字所在的节点,将该下一个字作为当前分词尾字,在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字,触发在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的模块;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的分词转换为预设长度的编码,将编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,触发找到根节点为当前分词首字的树的模块。本发明在分词编码库中查找待转换文本中的分词,并将查找到的分词转换为预设长度的编码,与将单个文字转化为预设长度的编码的方法相比,本发明将分词转换为预设长度的编码达到减少占用空间的目的。
[0129]图6为本发明实施例提供的一种文字译码装置的结构示意图,与图4所示的方法相对应,所述装置应用于电子设备中,所述电子设备中存储有分词译码库,所述分词译码库是根据所述分词编码库设置的,所述分词译码库中对应存储有所述分词编码库中的所有预设分词及预设长度的编码,图6所示装置可以包括:
[0130]第二获得模块601,用于获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0131]第三查找模块602,用于在所述分词译码库中查找所述当前编码对应的分词;
[0132]译码模块603,用于将所述当前编码转换为第三查找模块602查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,触发第三查找模块602,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0133]可见,本发明实施例提供的一种文字译码装置,可以获得编码文件中的当前编码,在所述分词译码库中查找所述当前编码对应的分词,将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,触发所述在所述分词译码库中查找所述当前编码对应的分词的模块。本发明在分词译码库中查找编码文件中的编码对应的分词,将编码转换为查找到的分词,并将转换后得到的分词存储到文本中,将预设长度的编码转换为文字达到文字译码的目的。
[0134]相应地,如图7所述,本发明实施例提供了一种电子设备,所述电子设备中存储有分词编码库,所述分词编码库包含有多个字典树,各字典树中的每个节点中均包含一个文字且各字典树的根节点中包含的文字不同,每个字典树包含以其根节点为分词首字的所有预设分词,且每个预设分词的分词尾字所在的节点对应有预设长度的编码,所述电子设备可以包括:
[0135]壳体(图中未示出)、处理器701、存储器702、电路板703和电源电路704,其中,电路板703安置在壳体围成的空间内部,处理器701和存储器702设置在电路板703上;电源电路704,用于为电子设备的各个电路或器件供电;存储器702用于存储可执行程序代码;处理器701通过读取存储器702中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
[0136]获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字;
[0137]在所述分词编码库中找到根节点为当前分词首字的树;
[0138]在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字;
[0139]在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点;
[0140]如果找到,则将该下一个字作为当前分词尾字,返回执行所述在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。
[0141]该电子设备可以为终端设备或与终端设备通信连接的服务器。
[0142]相应地,如图7所述,本发明实施例提供了一种电子设备,所述电子设备中存储有分词译码库,所述分词译码库是根据分词编码库设置的,所述分词编码库包含有多个字典树,各字典树中的每个节点中均包含一个文字且各字典树的根节点中包含的文字不同,每个字典树包含以其根节点为分词首字的所有预设分词,且每个预设分词的分词尾字所在的节点对应有预设长度的编码,所述分词译码库中对应存储有所述分词编码库中的所有预设分词及预设长度的编码,所述电子设备可以包括:
[0143]壳体(图中未示出)、处理器701、存储器702、电路板703和电源电路704,其中,电路板703安置在壳体围成的空间内部,处理器701和存储器702设置在电路板703上;电源电路704,用于为电子设备的各个电路或器件供电;存储器702用于存储可执行程序代码;处理器701通过读取存储器702中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
[0144]获得编码文件中的当前编码,其中,所述编码文件为待转换文本根据所述分词编码库编码得到的文件,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0145]在所述分词译码库中查找所述当前编码对应的分词;
[0146]将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0147]在本发明的另一实施例中提供了一种电子设备,所述电子设备中既存储有分词编码库又存储有分词译码库,且所述分词译码库是根据所述分词编码库设置的,所述电子设备既可以用于文字编码又可以用于文字译码。
[0148]相应地,本发明实施例还提供了一种存储介质,其中,该存储介质用于存储应用程序,所述应用程序用于在运行时执行本发明实施例所述的一种文字编码方法。其中,本发明实施例所述的一种文字编码方法,应用于电子设备,该方法可以包括:
[0149]获得待转换文本中的当前分词首字,其中,在开始对所述待转换文本进行转换时,所述当前分词首字为所述待转换文本中的首个文字;
[0150]在所述分词编码库中找到根节点为当前分词首字的树;
[0151]在所述根节点的子节点中查找当前分词首字的下一个字所在的节点,如果找到,则将该下一个字作为当前分词尾字;
[0152]在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点;
[0153]如果找到,则将该下一个字作为当前分词尾字,返回执行所述在确定的当前分词尾字的子节点中查找当前分词尾字的下一个字所在的节点的步骤;如果未找到,则将以当前分词首字为开始且以当前分词尾字为结束的文本中的分词转换为当前分词尾字对应的预设长度的编码,将转换后得到的编码存储到编码文件中,并将当前分词尾字的下一个字确定为当前分词首字,返回执行所述在所述分词编码库中找到根节点为当前分词首字的树的步骤,其中,各分词转换后得到的编码在所述编码文件中的存储顺序与各分词在所述待转换文本中的排列顺序一致。
[0154]相应地,本发明实施例还提供了一种存储介质,其中,该存储介质用于存储应用程序,所述应用程序用于在运行时执行本发明实施例所述的一种文字译码方法。其中,本发明实施例所述的一种文字译码方法,应用于电子设备,该方法可以包括:
[0155]获得所述编码文件中的当前编码,其中,在开始对所述编码文件中的编码进行转换时,所述当前编码为所述编码文件中的首个预设长度的编码;
[0156]在所述分词译码库中查找所述当前编码对应的分词;
[0157]将所述当前编码转换为查找到的分词,将转换后得到的分词存储到文本中,并将已转换的当前编码的下一个预设长度的编码确定为当前编码,返回执行所述在所述分词译码库中查找所述当前编码对应的分词的步骤,其中,各预设长度的编码转换后得到的分词在所述文本中的排列顺序与各预设长度的编码在所述编码文件中的存储顺序一致。
[0158]相应地,本发明实施例还提供了一种应用程序,其中,该应用程序用于在运行时执行本发明实施例所述的一种文字编码方法。其中,本发明实施例所述的一种文字编码方法,应用于电子
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1