第二语言反查词库的生成系统及其方法

文档序号:6615853阅读:121来源:国知局
专利名称:第二语言反查词库的生成系统及其方法
技术领域
本发明涉及一种词库的生成系统及其方法,特别是指关于一种字词比对 索引表以关联记录字词的第二语言反查词库的生成系统及其方法。
背景技术
翻译字典对于现代人来说,相当的有帮助,通过翻字典可以查询不同语
言之间的字词解释,以第一语言为英语及第二语言为汉语当作例子,例如 以英语查询汉语的英汉字典、以汉语查询英语的汉英字典或是以汉语查询汉 语的汉语字典等。
但是对于以母语非汉语的使用者来说,如何〗吏用汉语字典将会成为 一种 问题,原因在于母语非汉语的使用者无法使用汉语的输入法输入字词,以查 询汉语字典中汉语字词的汉语解释。
因此,目前一些英语界面的汉语字典也4是供了一种「,命入英语以查询汉 语J的功能,对于这种汉语字典而言,会在汉语字典的字词库中加入相对应 的英语字词,以达到r输入英语以查询汉语J的功能,事实上,这种查询方 式是对英语字词以及汉语字词在资料库中进行全文检索方式查询,使母语非 汉语的使用者也可以使用汉语字典的功能。
但是,由于英语界面的汉语字典是采用英语以及汉语在资料库中进行全 文检索方式查询,因此会产生出查询结果不够精确的问题,例如母语非汉 语的使用者输入rgood」,本意是要查询「好」,但是由于采用汉语以及英 语在资料库中进行全文检索方式查询,同时也会返回解释中包含「 not good J 的汉-浯字词,「坏j的解释。
这对于母语非汉语的使用者来说,会造成学习上的影响,也造成使用英 语界面的汉语字典的正确性,影响到英语界面的汉语字典的功效,使英语界面的汉语字典的查询效果大打折扣。
综上所述,可知现有技术中长期以来一直存在英语界面的汉语字典采用 英语以及汉语以全文检索方式导致查询结果不够精确的问题,因此有必要提 出改进的技术手段,来解决这一问题。

发明内容
本发明要解决的技术问题是提供一种第二语言反查词库的生成系统及 其方法,解决现有技术存在第一语言界面的第二语言字典采用第一语言以及 第二语言以全文检索方式导致查询结果不够精确的问题。
为解决上述问题,本发明揭露了一种第二语言反查词库的生成系统及其
方法,其中
本发明所揭露的第二语言反查词库的生成系统,其系统包含第一数位 词库、第二数位词库、索引模块、选定模块、分析模块、判断模块、储存模 块以及词库生成模块。
本发明所揭露的第二语言反查词库的生成方法,通过第一数位词库以及 第二数位词库中的字词及其解释,以生成第二语言反查词库,其方法包含下 列步骤
首先,依据第一数位词库的第一语言字词生成索引表;接着,自第二数 位词库中选定第二语言字词;接着,将与第二语言字词对应的第一语言解释 分析成为至少一第一语言解释字词;接着,判断第一语言解释字词是否存在 于索引表中;接着,当第一语言解释字词存在于索引表中时,将第二语言字 词的索引值储存于索引表中;最后,将索引表的第一语言字词及索引值储存 为第二语言反查词库。
本发明所揭露的系统与方法如上,与现有技术之间的差异在于本发明通 过建立第一数位词库的第一语言字词生成索引表,并且自第二数位词库中选 定第二语言字词,接着分析第一语言解释为第一语言解释字词,— 验证第一语 言解释字词是否存在于索引表,即可以使不完整的词组被剔除,接着,储存 索引表的第一语言字词及索引值为第二语言反查词库,即可以生成第二语言反查词库。
通过上述的技术手段,本发明可以达成通过^f吏用第二语言反查词库以第 一语言查询可以得到精确查询结果的技术效果。


图1为本发明第二语言反查词库的生成系统方块图; 图2为本发明第二语言反查词库的生成方法流程图; 图3A为本发明索引表初始化示意图; 图3B为本发明第二婆:位词库储存资料示意图; 图3C为本发明索引表记录第二标号示意图; 图3D为本发明第二语言反查词库关联示意图; 图4A为应用本发明第二语言反查词库界面示意图; 图4B为应用本发明第二语言反查词库界面示意图。
具体实施例方式
以下将结合附图及实施例来详细说明本发明的实施方式,藉此对本发明 如何应用技术手段来解决技术问题并达成技术效果的实现过程能充分理解 并据以实施。
本发明应用于母语非第二语言的使用者,由于这些使用者难以通过第二 语言查询第二语言字典的第二语言解释,藉此提供一种笫二语言反查词库的 生成系统及其方法,通过本发明第二语言反查词库,让使用者输入第一语言 即可查询第二语言字典。
在本发明的实施方式说明中,第一语言采用英语作为举例,并且第二语 言采用汉语作为举例,但不以此局限本发明的应用。
以下首先说明本发明第二语言反查词库的生成系统,并同时参考图1所 示,图1为本发明第二语言反查词库的生成系统方块图。本发明所揭露的第 二语言反查词库的生成系统,包括有第一数位词库ll、第二数位词库12、索引模块20、选定模块30、分析模块40、判断模块50、储存模块60、词 库生成4莫块70以及第二语言反查词库71。
以下将说明各模块所执行的动作,索引模块20会依据第一数位词库11 的第一语言字词生成索引表。其中,第一数位词库11至少包含第一语言字 词,索引表包含第一语言字词以及索引值;索引模块20会先依据第一数位 词库11的第一语言字词的顺序,将第一数位词库的第一语言字词记录于索 引表中,同时将索引表中对应于第一语言字词的索引值进行初始化动作,初 始化索引值为将索引表中的索引值填入「NULL」数值。
选定模块30,自第二数位词库12中选定第二语言字词,选定第二语言 字词可以依照第二数位词库12的第二语言字词的顺序依序当作选定第一语 言字词并依序做选定,其中,第二数位词库12包含索引值、第二语言字词、 第二语言解释以及第一语言解释。
分析模块40对与第二语言字词对应的第一语言解释进行分析,将该第 一语言解释分析成为至少一第一语言解释字词。具体而言当选定第二语言 字词为「返回J时,与第二语言字词r返回J对应的第一语言解释为「 return; go back」,分析模块40会依照r; J为第一语言解释字词分开的依据,因 此分析模块40分析与第二语言字词r返回j对应的第一语言解释r return; go back J ,分为两个第一语言解释字词为r return」以及r go back J 。
判断模块50接着会判断分析模块40所分析出来的第 一语言解释字词是 否存在于索引表中,即为判断第一语言解释字词是否为不完整的词组,即可 以使不完整的词组被剔除,具体而言假设分析^i块40所分析出来的第一 语言解释字词为「 no dice」,并且索引模块20所生成的索引表为r dice、 dice away、 dice for、…」,因此,判断模块50会判断第一语言解释字词「 no dice J 属于不完整的词组,因此第一语言解释字词「nodice」将被剔除,进而提升 反查准确度。
当判断模块50判断出第一语言解释字词存在于索引表中,储存模块60 将会储存第二语言字词的索引值于索引表对应该第一语言字词的索引值。
最后,词库生成模块70,储存索引表的第一语言字词及索引值为第二 语言反查词库71,即可以生成第二语言反查词库71。接下来,以一个实施例来解说本发明的运作方式及流程,并请参照图2、 图3A至图3D以及图4A至图4B所示,图2为本发明第二语言反查词库的 生成方法流程图;图3A为本发明索引表初始化示意图;图3B为本发明第 二数位词库储存资料示意图;图3C为本发明索引表记录第二标号示意图; 图3D为本发明第二语言反查词库关联示意图;图4A以及图4B为应用本发 明第二语言反查词库界面示意图,本实施例以第一语言为英语及第二语言为
汉语当作说明条件,但不以此局限本发明。
首先,如图3A所示,第一数位词库11中第一语言字词83为「goJ 、 r go back J 、 r return J 、 r return fare J以及「 return game J ,列页序分另'J为 「21」、「22」、「41」、「42J以及「43J。
因此,索引模块20会依据第一数位词库11的第一语言字词83顺序生 成索引表81,即第一索引值82分别为「21 J 、 「22」、「41」、r 42 J以 及r 43 J ,第一语言字词83为r go J 、 r g0 back J 、 r return J 、 r return fare J 以及「 return game J 。
同时将对应于索引表81的第一语言字词83的笫二索引值84进行初始 化动作,初始化第二索引值84为将索引表81中的第二索引值84填入 rNULL」数值,因此,索引模块20会依据第一数位词库11的第一语言字 词83生成索引表81 (步骤100)。
接着,请参考图3B所示,选定模块30根据第二数位词库12所找出选 定第二语言字词85为「返回J ,因此,在第二数位词库12找出对应的第二 语言解释86为「回返;回归」及第二语言解释87为「 return; go back J (步 骤200)。
接着,经由选定模块30所找出选定的第二语言字词85 r返回」,与第 二语言字词85 r返回j对应的第一语言解释87为r return; go back」,分析 模块40会依照「 ; J为第一语言解释字词分开的依据,因此分析模块40分 析与第二语言字词85 「返回」对应的第一语言解释87 r return; go back J , 分为两个第一语言解释字词为r return」以及rgobackJ (步骤300 )。
判断模块50接着会判断分析模块40所分析出来的第一语言解释字词是 否存在于索引表中(步骤400),即判断第一语言解释字词「 return」以及r g0back」是否为不完整的词组,即可以-使不完整的词组;陂剔除。
判断模块50会先进行分析模块40所分析出来的第一语言解释字词为 r return」的判断,并且索引模块20所生成的索引表81中第一语言字词83 为「go、 go back、 return、 return fare以及return game J , 因》匕,经过比7于的 结果第一语言解释字词r return」存在于索引表81,判断模块50会判断第一 语言解释字词r return」存在于索引表81。
当判断模块50判断出第一语言解释字词rretum」存在于索引表81中 时,储存模块60将会储存第二语言字词85「返回」的第二索引值84为「36J 于索引表81对应第一语言字词81 「 return」的第二索引值84中(步骤500 ), 结果如图3C所示。
接着,由于分析模块40所分析出来的第一语言解释字词为两个字词, 因此,判断模块50会再进行分析模块40所分析出来的第 一语言解释字词为 rgo back」的判断,并且索引模块20所生成的索引表81中第一语言字词 83为c go、 go back、 return、 return fare以及return game」,因jt匕,经过比 对的结果第一语言解释字词「gobackJ存在于索引表81,判断模块50会判 断第一语言解释字词「goback』存在于索引表81。
当判断模块50判断出第一语言解释字词「go back」存在于索引表81 中,储存模块60将会储存第二语言字词85 「返回」的第二索引值84为「 36 J 于索引表81对应第一语言字词81 「go back」的第二索引值84中,结果如 图3C所示。
在此假设分析模块40所分析出来的第一语言解释字词为「no dice」, 并且索引模块20所生成的索引表为「dice、 dice away、 dice for、…」,因 此,判断模块50会判断第一语言解释字词「no dice;属于不完整的词组, 因此第一语言解释字词「nodice」将被剔除,进而提升反查准确度。
假设,分析模块40所分析出来的第一语言解释字词为「no dice」,判 断模块50在进行「no dice」的判断,并且索引模块20所生成的索引表81 中第一语言字词83为rdice、 dice away、 dice for、…」,因此,经过比对 的结果第一语言解释字词r return」不存在于索引表81,判断模块50会判断 第一语言解释字词「 return」不存在于索引表81。当判断模块50判断出第一语言解释字词r no dice」不存在于索引表81 中,此时,判断模块50会选取下一个第一语言解释字词再次进行判断(步 骤710)。
依照上述的方法依此类推,并请参照图3C所示,最后得到的索引表81 为第一索引值82分别为r21 J 、 「22」、「41」、「42」以及「43」,第 一i吾言字词83分另'J为「go」、「go back」、r return J 、 r return fare J以 及rreturngameJ ,第二索引值84分别为r NULL」、「36」、「35; 36; 37 J 、 「 NULL」以及r NULL J 。
经过上述的流程,将第二数位词库12中的所有第二语言字词85处理后, 则可以完成索引表81,最后,词库生成模块70储存索引表81的第一语言 字词83及第二索引值84为第二语言反查词库71 (步骤600),即可以生成 第二语言反查词库71,结果如图3D所示。
当完成第二语言反查词库71后,请参照图4A所示,当使用者于输入 区域91中输入「gobackJ时,并且采用本发明的第二语言反查词库71 ,则 会先找到第一语言字词83rgobackJ所对应的第二索引值84『36J ,接着, 会关联到第二索引值84 「36」对应的第二语言字词85 r返回」、第二语言 解释86为「回返;回归」及第二语言解释87为「 return; go back J 。
接着将会显示第二语言字词85 「返回J 、第二语言解释86为f回返; 回归」及第二语言解释87为r return; go back J于显示区域92中,结果如 图4A所示。
另外,当使用者于输入区域91中输入「 return」时,并且采用本发明的 第二语言反查词库71,所查询的流程如上述,在此不再赘述,因此所呈现 的结果即为显示第二语言字词85 r返」、第二语言解释86为「回J及第二 语言解释87为r return; come or go back J ;第二语言字词85 r返回」、第 二语言解释86为「回返;回归J及第二语言解释87为「 return; go back J ; 第二语言字词85 「返还」、第二语言解释86为r归还;退还」及第二语言 解释87为r return; restore』于显示区域92中。
综上所述,可知本发明与现有技术之间的差异在于通过建立第一数位词 库的第一语言字词生成索引表,并且自第二数位词库中选定第二语言字词,接着分析第一语言解释为第一语言解释字词,验证第一语言解释字词是否存 在于索引表,即可以使不完整的词组被剔除,接着,储存索引表的第一语言 字词及索引值为第二语言反查词库,即可以生成第二语言反查词库的技术手 段,通过这一技术手段可以来解决现有技术所存在的问题,进而达成通过使 用第二语言反查词库以第一语言查询可以得到精确查询结果的技术效果。
虽然本发明所揭露的实施方式如上,但所述的内容并非用以直接限定本 发明的专利保护范围。任何本发明所属技术领域中具有通常知识者,在不脱 离本发明所揭露之精神和范围的前提下,可以在实施的形式上及细节上作一 些变更。本发明的专利保护范围,仍须以所附权利要求所界定的范围为准。
权利要求
1、一种第二语言反查词库的生成系统,其系统包含一第一数位词库,该第一数位词库包含一第一语言字词;一第二数位词库,该第二数位词库包含一索引值、至少一第二语言字词以及所述第一语言解释;一索引模块,依据所述第一语言字词生成一索引表;一选定模块,自所述第二数位词库中选定所述第二语言字词;一分析模块,将与所述第二语言字词对应的所述第一语言解释分析成为至少一第一语言解释字词;一判断模块,判断所述第一语言解释字词是否存在于所述索引表中;一储存模块,当所述第一语言解释字词存在于所述索引表中时,将所述第二语言字词的索引值储存于所述索引表中;及一词库生成模块,将所述索引表的所述第一语言字词及所述索引值储存为一第二语言反查词库。
2、 如权利要求1所述的第二语言反查词库的生成系统,其中所述索引 值为依据所述第二数位词库的所述第二语言字词依序编号。
3、 如权利要求1所述的第二语言反查词库的生成系统,其中所述选定 模块选定所述第二语言字词为依据所述第二数位词库中所述第二语言字词 的顺序依序选定。
4、 一种第二语言反查词库的生成方法,通过一第一数位词库以及一第 二数位词库中的字词及其解释,以生成一第二语言反查词库,其方法包含下 列步骤依据所述第 一数位词库的第 一语言字词生成一索引表; 自所述第二凝:位词库中选定一第二语言字词;将与所述第二语言字词对应的所述第一语言解释分析成为至少一第一 语言解释字词;判断所述第一语言解释字词是否存在于所述索引表中;当所述第一语言解释字词存在于所述索引表中时,将所述第二语言字词 的索引值储存于所述索引表中;及将所述索引表的所述第一语言字词及所述索引值储存为一第二语言反 查词库。
5、 如权利要求4所述的第二语言反查词库的生成方法,其中所述索引 值为依据所述第二数位词库的所述第二语言字词依序编号。
6、 如权利要求4所述的第二语言反查词库的生成方法,其中选定所述 第二语言字词的步骤为依据所述第二数位词库中所述第二语言字词的顺序 依序选定。
全文摘要
一种第二语言反查词库的生成系统及其方法,其通过生成第一数位词库的索引表,并确认第二数位词库中第一语言解释是否存在于索引表,并储存索引值至索引表中,记录索引表以生成第二语言反查词库的技术手段,可以解决已知第一语言界面的第二语言字典采用第一语言及第二语言全文检索方式导致查询结果不精确的问题,藉此可以使用第二语言反查词库以第一语言查询第二语言词典的查询结果精确的技术效果。
文档编号G06F17/30GK101470743SQ20071030566
公开日2009年7月1日 申请日期2007年12月27日 优先权日2007年12月27日
发明者邱全成, 邵晓慧 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1