第一语言反查词库的生成系统及其方法

文档序号:6613034阅读:173来源:国知局
专利名称:第一语言反查词库的生成系统及其方法
技术领域
本发明涉及词库的生成系统及其方法,特别涉及一种透过第二语言关键 字为反查基准的第 一语言反查词库的生成系统及其方法。
背景技术
翻译字典对于现代人来说,相当的有帮助,透过翻字典可以查询不同语
言之间的字词解释,以第一语言为汉语及第二语言为英语当作例子,例如 以英语查询汉语的英汉字典、以汉语查询英语的汉英字典或是以汉语查询汉 语的汉语字典等。
但是对于以母语非第 一语言的使用者来说,无法透过第 一语言翻i^字典 以第一语言查询第一语言的解释,其障碍在于无法使用第一语言的输入法来 查询翻译字典。
因此,目前一些第二语言接口的第一语言翻译字典也提供一种"输入第 二语言以查询第一语言,,的功能,事实上,是对第一语言以及第二语言进行 全文检索方式进行查询,使母语非第一语言的使用者也可以使用第一语言翻 译字典的功能。
但是,由于第二语言接口的第 一语言翻译字典是采用第 一语言以及第二 语言全文检索方式进行查询,因此会产生出查询结果不够精确的问题,这里 以第一语言为汉语及第二语言为英语当做例子,例如母语非汉语的使用者 输入"good",本意是要查询"好",但是由于采用汉语以及英语进行全文检索 方式进行查询,同时也会返回解释中包含"not good,,的汉语字词,"坏,,的解 释。
这对于母语非第一语言的使用者来说,会造成学习上的影响,也造成使 用第二语言接口的第一语言翻译字典的正确性,影响到第二语言接口的第一语言翻译字典的功效,使第二语言接口的第一语言翻译字典的查询效果大打折扣。
综上所述,可知现有技术中长期以来一直存在第二语言接口的第一语言 翻译字典采用第一语言以及第二语言全文检索方式导致查询结果不够精确
的问题,因此有必要提出改进的技术手段,来解决此一问题。

发明内容
有鉴于现有技术存在第二语言接口的第一语言翻译字典采用第一语言 以及第二语言全文检索方式导致查询结果不够精确的问题,本发明遂提供一
种第一语言反查词库的生成系统及其方法,其中
本发明所提供的第 一语言反查词库的生成系统,其系统包含原始词库、 选定字词模块、关联字词模块、关键词模块、关键词反查模块以及反查词库 生成模块。
其中,选定字词模块,于原始词库的至少一个第一语言字词中找出选定 第一语言字词;关联字词模块,根据选定第一语言字词在原始词库中找出至 少一个关联第一语言字词;关键词模块,自原始词库搜寻出选定第一语言字 词的第二语言解释及关联第一语言字词的第二语言解释,判断出第二语言关 键词;关键词反查模块,根据第二语言关键词反查第一词库提供的关键词列 表,验证第二语言关键词存在于关键词列表中;反查词库建立模块,具有反 查词库,当第二语言关键词存在于关键词列表中,将原始词库对应第二语言 关键词的选定第一语言字词、关联第一语言字词、选定第一语言字词对应的 第一语言解释及第二语言解释以及关联第一语言字词对应的第一语言解释 及第二语言解释关联记录于第一语言反查词库中。
本发明所提供的第一语言反查词库的生成方法,以原始词库为基础,其 方法包含下列步骤首先,根据原始词库的至少一个第一语言字词中找出选 定第一语言字词;接着,根据选定第一语言字词在原始词库中找出至少一个 关联第一语言字词;接着,自原始词库搜寻出选定第一语言字词的第二语言 解释及关联第一语言字词的第二语言解释,判断出第二语言关键词;接着, 根据第二语言关键词反查第 一词库提供的关键词列表,— 睑证第二语言关键词是否存在于关键词列表中;最后,当第二语言关键词存在于关键词列表中,
将原始词库对应第二语言关键词的选定第 一语言字词、关联第 一语言字词、 选定第一语言字词对应的第一语言解释及第二语言解释以及关联第一语言 字词对应的第一语言解释及第二语言解释关联记录于第一语言反查词库中。
本发明所提供的系统与方法如上,与现有技术之间的差异在于透过原始 词库找出第二语言关键词,并将第二语言关键词反查关键词列表,即可以将 第 一语言反查词库与原始词库相关联,透过第 一语言反查词库以输入第二语 言字词,可找出精确的解释。
透过上述的技术手段,本发明可以达成透过使用第一语言反查词库使用 第二语言查询可以得到精确查询结果的技术效果。


第1图为本发明第一语言反查词库的生成系统框图。
第2图为本发明第一语言反查词库的生成方法流程图。
第3A图为本发明原始词库示意图。
第3B图为本发明关4泉词列表示意图。
第3C图为本发明第一语言反查词库关联示意图。
具体实施例方式
以下将配合附图及实施例来详细说明本发明的实施方式,藉此对本发明 如何应用技术手段来解决技术问题并达成技术效果的实现过程能充分理解 并据以实施。
本发明应用于母语非第一语言的使用者,由于这些使用者无法透过第一 语言查询第一语言翻译字典的第一语言解释,藉此提供一种第一语言反查词 库的生成系统及其方法,透过本发明第一语言反查词库,让使用者输入第二 语言即可查询第一语言翻译字典。
请参考图l所示,图l是本发明第一语言反查词库的生成系统框图。本 发明所提供的第一语言反查词库的生成系统,包括有原始词库20、选定
7字词模块30、关联字词模块40、关键词模块50、关键词反查模块60以及 反查词库生成模块70。
其中,原始词库20可以使用已经存在具有第一语言字词以及第二语言 解释的词库当作原始词库20,但原始词库20更可以透过词库^^块21将不 同的词库进行整合,以整合生成原始词库20,具体而言词库4莫块21可以 将第二词库11以及第三词库12整合为原始词库20。
上述的第二词库11以及第三词库12用以提供第一语言字词、第一语言 解释以及第二语言解释,经过词库才莫块21的整合,使得原始词库20可以包 含第一语言字词、第一语言解释以及第二语言解释。
选定字词模块30,于原始词库20的至少一个第一语言字词中找出选定 第一语言字词,选定第一语言字词可以依照原始词库20的第一语言字词的 顺序依序当作选定第 一语言字词并依序^故选定。
关联字词模块40,根据选定第一语言字词在原始词库20中找出至少一 个关联第一语言字词。
上述的关联第一语言字词,是找出以选定第一语言字词为前缀的第二语 言解释,并选定与选定第 一语言字词的第二语言解释相同的第一语言字词为 关联第一语言字词。
关键词模块50,根据选定第一语言字词模块30找出选定第一语言字词 的第二语言解释,以及关联字词模块40找出关联第一语言字词的第二语言 解释,判断出第二语言关4定词。
在语言的对应上,往往会产生选定第一语言字词及关联第一语言字词会 对应多个第二语言解释,因此,本发明所判断第二语言关键词的方法为统计 选定第 一语言字词及关联第 一语言字词所对应的第二语言解释数量,以决定 第二语言关键词。最后,以第二语言关键词统计过程后的数量,将以数量最 多的第二语言解释判断为第二语言关键词。
当同时有两个以上第二语言解释为数量最多的第二语言解释时,相同数 量的第二语言解释会依据第二语言解释在选定第一语言字词及关联第一语
言字词的顺序给予优先权值,顺序在前的优先权值较高,会计算优先权值并且以计算后优先权值最高的第二语言解释判断为第二语言关键词。
关键词反查模块60,根据关键词模块50所判断出来的第二语言关键词 反查第一词库13提供的关键词列表,验证第二语言关键词存在于关键词列 表中。
第一词库13会提供关键词列表,利用关键词模块50所判断出的第二语 言关键词为索引,进行反查第一词库13提供的关键词列表,将可以使不完 整的词组被剔除,具体而言假设关键词模块50所判断出来的第二语言关 键词为"dice",关键词反查模块60进行反查第一词库13提供的关4定词列 表为"dice" 、 "dice away" 、 "dice for",因此"no dice"属于不完整的 词组将被踢除,进而提升反查准确度。
反查词库生成模块70,具有第一语言反查词库71,当第二语言关键词 存在于关键词列表中,将原始词库20对应第二语言关键词的选定第一语言 字词、关联第一语言字词、选定第一语言字词对应的第一语言解释及第二语 言解释、以及关联第一语言字词对应的第一语言解释及第二语言解释,透过 数据库关联的手段,将原始词库20关联记录于第一语言反查词库71中。
在关联纪录的过程中,会先赋予选定第一语言字词起始编号,再依序将 关联第一语言字词赋予编号,在第一语言反查词库71中所关联记录的即为 第二语言关键词以及被赋予的编号,第一语言反查词库71以第二语言字词 为查询输入条件,根据输入的第二语言字词,可以得到对应的第一语言解释 以及第二语言解释。
接下来,以一个实施例来解说本发明的运作方式及流程,并请参照图2、 图3A、图3B以及图3C所示,图2是本发明第一语言反查词库的生成方法 流程图;图3A是本发明原始词库示意图;图3B是本发明关键词列表示意 图;以及图3C是本发明第一语言反查词库关联示意图。
如图3A所示,以第一语言为汉语及第二语言为英语,并采用原始词库 20透过词库模块21将不同的词库进行整合,以整合生成原始词库20为实 施例,具体而言词库模块21将第二词库11以及第三词库12整合为原始词库20。
在本实施例中,包括以下步骤
步骤100:选定字词模块30根据原始词库20所找出选定第一语言字词 81为"返,,,因此,在原始词库20找出对应的第一语言解释82为"回,, 及第二语言解释83为"return; come or go back"。
接着,关联字词模块40以选定第一语言字词为前缀的字词为基准(例 如返回、返还…等),并且以选定第一语言字词为前缀的字词"返回"、 "返还"的第二语言解释83分别为"return; go back" 、 "return; restore", 与选定第一语言字词"返"的第二语言解释83 "return; come or go back"
进行比对。
当选定第一语言字词为前缀的字词的第二语言解释83具有与选定第一 语言字词的第二语言解释83相同的第二语言解释83,以实施例而言,比对 结果是具有相同的第二语言解释83,即为所要找的关联第一语言字词为"返 回,,、"返还,,。
步骤200:关联字词模块40根据选定第一语言字词为"返,,在原始词 库20中所找出两个关联第一语言字词为"返回,,以及"返还",并找出关 联第一语言字词"返回"对应的第一语言解释82为"回返;回归"及第二 语言解释83为"return; go back",以及关联第一语言字词"返回"对应的 第一语言解释82为"归还;退还"及第二语言解释83为"return; restore"。
关键词模块50根据选定字词模块30所找出的选定第一语言字词为 "返,,,并且找出对应的第二语言解释83为"return; come or go back", 再配合关联字词模块40所找出的两个关联第一语言字词"返回,,以及"返 还,,,并且找出关联第一语言字词"返回,,对应的第二语言解释83为"return; go back",以及关联第一语言字词"返还,,对应的第二语言解释83为"return; restore"。
本发明所判断第二语言关键词的方法为统计选定第 一语言字词及关联 第一语言字词所对应的第二语言解释数量,以决定第二语言关4建词,经过统 计选定第一语言字词及关联第一语言字词所对应第二语言解释83后的结果如下"return"数量为3次,"go back"数量为2次,"come"数量为1 次,"restore"数量为1次。
步骤300:最后,以第二语言关键词统计过程后的数量,以数量最多的 第二语言解释83判断为第二语言关键词84,所以,根据第二语言解释83 出现次数最多的次数为3次的第二语言解释83 "return"为第二语言关键词。
在此假设另外一种情况,说明当同时有两个以上第二语言解释83为数 量最多的第二语言解释83时候,关键词模块50所进行的判断。
关键词模块50根据选定字词模块30所找出的选定第一语言字词为 "返,,,并且找出对应的第二语言解释83为"return; come or go back", 再配合关联字词模块40所找出的两个关联第一语言字词"返回"以及"返 还",并且找出关联第一语言字词"返回"对应的第二语言解释83为"return; go back",以及关联第一语言字词"返还,,对应的第二语言解释83为"return; go back; restore"。
经过统计选定第一语言字词及关联第一语言字词所对应第二语言解释 83后的结果如下"return"数量为3次,"go back"数量为3次,"come" 数量为1次,"restore"数量为1次。
此时,"return"以及"goback"同时为数量最多的第二语言解释83, 因此,会进行优先权值的判断。
选定第 一语言字词"返"对应的第二语言解释83 "return; come or go back" 的优先权值分别为"2; 1";关联第一语言字词"返回"对应的第二语言解 释83 "return; goback"的优先权值分别为"2; 1",以及关联第一语言字 词"返还"对应的第二语言解释83 "return; goback; restore"的优先权值 分别为"3; 2; 1" 。 "return"所得到的最后优先权值为7, "goback"所 得到的最后优先权值为4,则以计算后优先权值最高为"7"的第二语言解 释83 "return"判断为第二语言关键词84。
步骤400:接着,根据关键词模块50所判断出的第二语言关键词84为 "return",进行反查第一词库13提供的关键词列表的动作,并且验证第二 语言关键词84是否存在于关键词列表中。
ii如图3B所示,第一词库13会提供关键词列表85,关键词反查模块60 可以针对关键词列表85,比对关键词模块50所判断出的第二语言关键词S4 "return";在本实施例中,可以得知第二语言关键词84 "return"存在于关 键词列表85中,即第二语言关键词84 "return"存在于第一词库13中,假 若第二语言关键词84 "return"不存在于第一词库13中,则第二语言关键词 84 "return"不会记录于关联记录于第一语言反查词库71中,将直接返回步 骤100。
步骤500:最后,如图3C所示,当第二语言关键词84 "return"存在于 第一词库13中,将原始词库20对应第二语言关键词84 "return"的选定第 一语言字词"返"、关联第一语言字词"返回,,以及"返还"、选定第一语 言字词"返"对应的第一语言解释82 "回"及第二语言解释83 "return; come or go back"、关联第一语言字词"返回,,对应的第一语言解释82 "回返; 回归"及第二语言解释83 "return; go back"以及关联第一语言字词"返还" 对应的第一语言解释82 "回返;回归,,及第二语言解释83 "return; restore", 透过数据库关联的手段,将原始词库20关联记录于第一语言反查词库71中。
在原始词库20关联记录于第一语言反查词库71中,会先赋予选定第一 语言字词"返"起始编号86,本实施例中"返"的编号86为"1",再依 序将关联第一语言字词"返回"以及"返还,,赋予编号86,"返回"的编 号86为"2"、"返还"的编号86为"3",此处编号的赋予方式可依照选 定第一语言字词以及关联第一语言字词在原始词库的字词顺序赋予编号。
在第一语言反查词库71中所关联记录的即为第二语言关键词84 "return"以及选定第一语言字词及关联第一语言字词外皮赋予的编号84 "1; 2; 3",第一语言反查词库71以第二语言字词为查询输入条件,根据输入 的第二语言字词,可以得到对应的第 一语言解释以及第二语言解释。
综上所述,可知本发明与先前4支术之间的差异在于透过原始词库找出第 二语言关键词,并将第二语言关键词反查关键词列表,即可以将第二语言关 键词的第二语言解释关联纪录于第一语言反查词库中,以生成第一语言反查 词库,藉由可以来解决先前技术所存在的问题,进而达成透过使用第一语言 反查词库使用第二语言查询可以得到精确查询结果的技术效果。虽然本发明所提供的实施方式如上,惟所述的内容并非用以直接限定本 发明的专利保护范围。任何本发明所属技术领域中具有通常知识者,在不脱 离本发明所提供的精神和范围的前提下,可以在实施的形式上及细节上作些 许的更改。本发明的专利保护范围,仍须以所附的权利要求所界定者为准。
权利要求
1、一种第一语言反查词库的生成系统,该系统包含一原始词库;一选定字词模块,于该原始词库的至少一第一语言字词中找出一选定第一语言字词;一关联字词模块,根据该选定第一语言字词在该原始词库中找出至少一关联第一语言字词;一关键词模块,自该原始词库搜寻出选定第一语言字词的第二语言解释及该些关联第一语言字词的第二语言解释,判断出一第二语言关键词;一关键词反查模块,根据该第二语言关键词反查一第一词库提供的一关键词列表,验证该第二语言关键词是否存在于该关键词列表中;及一反查词库生成模块,具有一第一语言反查词库,当该第二语言关键词存在于该关键词列表中,将该原始词库对应该第二语言关键词的该选定第一语言字词、该些关联第一语言字词、该选定第一语言字词对应的第一语言解释及第二语言解释以及该些关联第一语言字词对应的第一语言解释及第二语言解释关联记录于该第一语言反查词库中。
2、 如权利要求1所述的第一语言反查词库的生成系统,其特征在于 还包含一词库才莫块用以将一第二词库以及一第三词库整合为该原始词库,该 第二词库以及该第三词库用以提供该第一语言字词、该第一语言解释以及该 第二语言解释。
3、 如权利要求1所述的第一语言反查词库的生成系统,其特征在于 所述关联字词模块是找出以该选定第一语言字词为前缀的第二语言解释,并 选定与选定第一语言字词的第二语言解释相同的第一语言字词为该关联第 一语言字词。
4、 如权利要求1所述的第一语言反查词库的生成系统,其特征在于 所述第二语言关^建词为统计该选定第一语言字词及该些关联第一语言字词 所对应的第二语言解释数量,以数量最多的第二语言解释判断为该第二语言关键词。
5、 如权利要求4所述的第一语言反查词库的生成系统,其特征在于 依据所述选定第 一语言字词及该些关联第 一语言字词所对应的第二语言解 释的顺序给予一优先权值,同时有两个以上第二语言解释为数量最多的第二 语言解释,则计算该优先权值并且以计算后该优先权值最高的第二语言解释判断为所述第二语言关键词。
6、 如权利要求1所述的第一语言反查词库的生成系统,其特征在于 所述第 一语言反查词库至少包含该第二语言关4建词以及一编号。
7、 如权利要求6所述的第一语言反查词库的生成系统,其特征在于 所述编号为以该选定第一语言字词及该些关联第一语言字词依序赋予编号。
8、 一种第一语言反查词库的生成方法,以一原始词库为基础,该方法 包含下列步骤根据该原始词库找出 一选定第 一语言字词;根据该选定第一语言字词在该原始词库中找出至少一关联第一语言字词;自该原始词库搜寻出该选定第一语言字词的第二语言解释及该些关联 第一语言字词的第二语言解释,判断出一第二语言关键词;根据该第二语言关键词反查一第 一词库提供的 一 关键词列表,验证该第 二语言关键词是否存在于该关键词列表中;及当该第二语言关键词存在于该关键词列表中,将该原始词库对应该第二 语言关键词的该选定第一语言字词、该些关if关第一语言字词、该选定第一语 言字词对应的第一语言解释及第二语言解释以及该关联第一语言字词对应 的第一语言解释及第二语言解释关联记录于一第一语言反查词库中。
9、 如权利要求8所述的第一语言反查词库的生成方法,其特征在于, 还包括将一第二词库以及一第三词库整合为该原始词库,该第二词库以及 该第三词库用以提供该第一语言字词、该第一语言解释以及该第二语言解释。
10、 如权利要求8所述的第一语言反查词库的生成方法,其特征在于 找出该些关联第 一语言字词的步骤是找出以该选定第 一语言字词为前缀的 第二语言解释,并选定与选定第一语言字词的第二语言解释相同的第一语言 字词为该关联第 一语言字词。
11、 如权利要求8所述的第一语言反查词库的生成方法,其特征在于 所述第二语言关键词为统计该选定第一语言字词及该些关联第一语言字词所对应的第二语言解释数量,以数量最多的第二语言解释判断为第二语言关键词。
12、 如权利要求11所述的第一语言反查词库的生成方法,其特征在于 依据该选定第一语言字词及该些关联第一语言字词所对应的第二语言解释 的顺序给予 一优先权值,同时有两个以上第二语言解释为数量最多的第二语 言解释,则计算该优先权值并且以计算后优先权值最高的第二语言解释判断 为第二语言关键词。
13、 如权利要求8所述的第一语言反查词库的生成方法,其特征在于 所述反查词库至少包含该第二语言关键词以及一编号。
14、 如权利要求13所述的第一语言反查词库的生成方法,其特征在于所述编号为以该选定第一语言字词及该些关^:第一语言字词依序赋予编号。
全文摘要
一种第一语言反查词库的生成系统及其方法,其透过原始词库找出第二语言关键字,并将第二语言关键字反查关键字列表,即可以将第二语言关键字的第二语言解释关联记录于第一语言反查词库中,可以解决现有技术中所存在第二语言界面的第一语言字典采用第一语言以及第二语言全文检索方式导致查询结果不够精确的问题,藉此可以达成可以精确得到使用第二语言查询第一语言词典的查询结果的技术结果。
文档编号G06F17/30GK101425058SQ20071016590
公开日2009年5月6日 申请日期2007年10月31日 优先权日2007年10月31日
发明者邱全成, 邵晓慧 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1