第二语言反查词库的生成系统及其方法

文档序号：6615853阅读：121来源：国知局

专利名称：第二语言反查词库的生成系统及其方法
技术领域：
本发明涉及一种词库的生成系统及其方法，特别是指关于一种字词比对索引表以关联记录字词的第二语言反查词库的生成系统及其方法。
背景技术：
翻译字典对于现代人来说，相当的有帮助，通过翻字典可以查询不同语
言之间的字词解释，以第一语言为英语及第二语言为汉语当作例子，例如以英语查询汉语的英汉字典、以汉语查询英语的汉英字典或是以汉语查询汉语的汉语字典等。
但是对于以母语非汉语的使用者来说，如何〗吏用汉语字典将会成为一种问题，原因在于母语非汉语的使用者无法使用汉语的输入法输入字词，以查询汉语字典中汉语字词的汉语解释。
因此，目前一些英语界面的汉语字典也4是供了一种「，命入英语以查询汉语J的功能，对于这种汉语字典而言，会在汉语字典的字词库中加入相对应的英语字词，以达到r输入英语以查询汉语J的功能，事实上，这种查询方式是对英语字词以及汉语字词在资料库中进行全文检索方式查询，使母语非汉语的使用者也可以使用汉语字典的功能。
但是，由于英语界面的汉语字典是采用英语以及汉语在资料库中进行全文检索方式查询，因此会产生出查询结果不够精确的问题，例如母语非汉语的使用者输入rgood」，本意是要查询「好」，但是由于采用汉语以及英语在资料库中进行全文检索方式查询，同时也会返回解释中包含「 not good J 的汉-浯字词，「坏j的解释。
这对于母语非汉语的使用者来说，会造成学习上的影响，也造成使用英语界面的汉语字典的正确性，影响到英语界面的汉语字典的功效，使英语界面的汉语字典的查询效果大打折扣。
综上所述，可知现有技术中长期以来一直存在英语界面的汉语字典采用英语以及汉语以全文检索方式导致查询结果不够精确的问题，因此有必要提出改进的技术手段，来解决这一问题。

发明内容
本发明要解决的技术问题是提供一种第二语言反查词库的生成系统及其方法，解决现有技术存在第一语言界面的第二语言字典采用第一语言以及第二语言以全文检索方式导致查询结果不够精确的问题。
为解决上述问题，本发明揭露了一种第二语言反查词库的生成系统及其
方法，其中
本发明所揭露的第二语言反查词库的生成系统，其系统包含第一数位词库、第二数位词库、索引模块、选定模块、分析模块、判断模块、储存模块以及词库生成模块。
本发明所揭露的第二语言反查词库的生成方法，通过第一数位词库以及第二数位词库中的字词及其解释，以生成第二语言反查词库，其方法包含下列步骤
首先，依据第一数位词库的第一语言字词生成索引表；接着，自第二数位词库中选定第二语言字词；接着，将与第二语言字词对应的第一语言解释分析成为至少一第一语言解释字词；接着，判断第一语言解释字词是否存在于索引表中；接着，当第一语言解释字词存在于索引表中时，将第二语言字词的索引值储存于索引表中；最后，将索引表的第一语言字词及索引值储存为第二语言反查词库。
本发明所揭露的系统与方法如上，与现有技术之间的差异在于本发明通过建立第一数位词库的第一语言字词生成索引表，并且自第二数位词库中选定第二语言字词，接着分析第一语言解释为第一语言解释字词，— 验证第一语言解释字词是否存在于索引表，即可以使不完整的词组被剔除，接着，储存索引表的第一语言字词及索引值为第二语言反查词库，即可以生成第二语言反查词库。
通过上述的技术手段，本发明可以达成通过^f吏用第二语言反查词库以第一语言查询可以得到精确查询结果的技术效果。

图1为本发明第二语言反查词库的生成系统方块图；图2为本发明第二语言反查词库的生成方法流程图；图3A为本发明索引表初始化示意图；图3B为本发明第二婆:位词库储存资料示意图；图3C为本发明索引表记录第二标号示意图；图3D为本发明第二语言反查词库关联示意图；图4A为应用本发明第二语言反查词库界面示意图；图4B为应用本发明第二语言反查词库界面示意图。
具体实施例方式
以下将结合附图及实施例来详细说明本发明的实施方式，藉此对本发明如何应用技术手段来解决技术问题并达成技术效果的实现过程能充分理解并据以实施。
本发明应用于母语非第二语言的使用者，由于这些使用者难以通过第二语言查询第二语言字典的第二语言解释，藉此提供一种笫二语言反查词库的生成系统及其方法，通过本发明第二语言反查词库，让使用者输入第一语言即可查询第二语言字典。
在本发明的实施方式说明中，第一语言采用英语作为举例，并且第二语言采用汉语作为举例，但不以此局限本发明的应用。
以下首先说明本发明第二语言反查词库的生成系统，并同时参考图1所示，图1为本发明第二语言反查词库的生成系统方块图。本发明所揭露的第二语言反查词库的生成系统，包括有第一数位词库ll、第二数位词库12、索引模块20、选定模块30、分析模块40、判断模块50、储存模块60、词库生成4莫块70以及第二语言反查词库71。
以下将说明各模块所执行的动作，索引模块20会依据第一数位词库11 的第一语言字词生成索引表。其中，第一数位词库11至少包含第一语言字词，索引表包含第一语言字词以及索引值；索引模块20会先依据第一数位词库11的第一语言字词的顺序，将第一数位词库的第一语言字词记录于索引表中，同时将索引表中对应于第一语言字词的索引值进行初始化动作，初始化索引值为将索引表中的索引值填入「NULL」数值。
选定模块30,自第二数位词库12中选定第二语言字词，选定第二语言字词可以依照第二数位词库12的第二语言字词的顺序依序当作选定第一语言字词并依序做选定，其中，第二数位词库12包含索引值、第二语言字词、第二语言解释以及第一语言解释。
分析模块40对与第二语言字词对应的第一语言解释进行分析，将该第一语言解释分析成为至少一第一语言解释字词。具体而言当选定第二语言字词为「返回J时，与第二语言字词r返回J对应的第一语言解释为「 return; go back」，分析模块40会依照r; J为第一语言解释字词分开的依据，因此分析模块40分析与第二语言字词r返回j对应的第一语言解释r return; go back J ,分为两个第一语言解释字词为r return」以及r go back J 。
判断模块50接着会判断分析模块40所分析出来的第一语言解释字词是否存在于索引表中，即为判断第一语言解释字词是否为不完整的词组，即可以使不完整的词组被剔除，具体而言假设分析^i块40所分析出来的第一语言解释字词为「 no dice」，并且索引模块20所生成的索引表为r dice、 dice away、 dice for、…」，因此，判断模块50会判断第一语言解释字词「 no dice J 属于不完整的词组，因此第一语言解释字词「nodice」将被剔除，进而提升反查准确度。
当判断模块50判断出第一语言解释字词存在于索引表中，储存模块60 将会储存第二语言字词的索引值于索引表对应该第一语言字词的索引值。
最后，词库生成模块70,储存索引表的第一语言字词及索引值为第二语言反查词库71,即可以生成第二语言反查词库71。接下来，以一个实施例来解说本发明的运作方式及流程，并请参照图2、图3A至图3D以及图4A至图4B所示，图2为本发明第二语言反查词库的生成方法流程图；图3A为本发明索引表初始化示意图；图3B为本发明第二数位词库储存资料示意图；图3C为本发明索引表记录第二标号示意图；图3D为本发明第二语言反查词库关联示意图；图4A以及图4B为应用本发明第二语言反查词库界面示意图，本实施例以第一语言为英语及第二语言为
汉语当作说明条件，但不以此局限本发明。
首先，如图3A所示，第一数位词库11中第一语言字词83为「goJ 、 r go back J 、 r return J 、 r return fare J以及「 return game J ,列页序分另'J为「21」、「22」、「41」、「42J以及「43J。
因此，索引模块20会依据第一数位词库11的第一语言字词83顺序生成索引表81，即第一索引值82分别为「21 J 、「22」、「41」、r 42 J以及r 43 J ,第一语言字词83为r go J 、 r g0 back J 、 r return J 、 r return fare J 以及「 return game J 。
同时将对应于索引表81的第一语言字词83的笫二索引值84进行初始化动作，初始化第二索引值84为将索引表81中的第二索引值84填入 rNULL」数值，因此，索引模块20会依据第一数位词库11的第一语言字词83生成索引表81 (步骤100)。
接着，请参考图3B所示，选定模块30根据第二数位词库12所找出选定第二语言字词85为「返回J ，因此，在第二数位词库12找出对应的第二语言解释86为「回返；回归」及第二语言解释87为「 return; go back J (步骤200)。
接着，经由选定模块30所找出选定的第二语言字词85 r返回」，与第二语言字词85 r返回j对应的第一语言解释87为r return; go back」，分析模块40会依照「； J为第一语言解释字词分开的依据，因此分析模块40分析与第二语言字词85 「返回」对应的第一语言解释87 r return; go back J , 分为两个第一语言解释字词为r return」以及rgobackJ (步骤300 )。
判断模块50接着会判断分析模块40所分析出来的第一语言解释字词是否存在于索引表中(步骤400),即判断第一语言解释字词「 return」以及r g0back」是否为不完整的词组，即可以-使不完整的词组;陂剔除。
判断模块50会先进行分析模块40所分析出来的第一语言解释字词为 r return」的判断，并且索引模块20所生成的索引表81中第一语言字词83 为「go、 go back、 return、 return fare以及return game J ，因》匕，经过比7于的结果第一语言解释字词r return」存在于索引表81,判断模块50会判断第一语言解释字词r return」存在于索引表81。
当判断模块50判断出第一语言解释字词rretum」存在于索引表81中时，储存模块60将会储存第二语言字词85「返回」的第二索引值84为「36J 于索引表81对应第一语言字词81 「 return」的第二索引值84中(步骤500 ), 结果如图3C所示。
接着，由于分析模块40所分析出来的第一语言解释字词为两个字词，因此，判断模块50会再进行分析模块40所分析出来的第一语言解释字词为 rgo back」的判断，并且索引模块20所生成的索引表81中第一语言字词 83为c go、 go back、 return、 return fare以及return game」，因jt匕，经过比对的结果第一语言解释字词「gobackJ存在于索引表81,判断模块50会判断第一语言解释字词「goback』存在于索引表81。
当判断模块50判断出第一语言解释字词「go back」存在于索引表81 中，储存模块60将会储存第二语言字词85 「返回」的第二索引值84为「 36 J 于索引表81对应第一语言字词81 「go back」的第二索引值84中，结果如图3C所示。
在此假设分析模块40所分析出来的第一语言解释字词为「no dice」，并且索引模块20所生成的索引表为「dice、 dice away、 dice for、…」，因此，判断模块50会判断第一语言解释字词「no dice;属于不完整的词组，因此第一语言解释字词「nodice」将被剔除，进而提升反查准确度。
假设，分析模块40所分析出来的第一语言解释字词为「no dice」，判断模块50在进行「no dice」的判断，并且索引模块20所生成的索引表81 中第一语言字词83为rdice、 dice away、 dice for、…」，因此，经过比对的结果第一语言解释字词r return」不存在于索引表81,判断模块50会判断第一语言解释字词「 return」不存在于索引表81。当判断模块50判断出第一语言解释字词r no dice」不存在于索引表81 中，此时，判断模块50会选取下一个第一语言解释字词再次进行判断(步骤710)。
依照上述的方法依此类推，并请参照图3C所示，最后得到的索引表81 为第一索引值82分别为r21 J 、「22」、「41」、「42」以及「43」，第一i吾言字词83分另'J为「go」、「go back」、r return J 、 r return fare J以及rreturngameJ ，第二索引值84分别为r NULL」、「36」、「35; 36; 37 J 、「 NULL」以及r NULL J 。
经过上述的流程，将第二数位词库12中的所有第二语言字词85处理后，则可以完成索引表81，最后，词库生成模块70储存索引表81的第一语言字词83及第二索引值84为第二语言反查词库71 (步骤600),即可以生成第二语言反查词库71，结果如图3D所示。
当完成第二语言反查词库71后，请参照图4A所示，当使用者于输入区域91中输入「gobackJ时，并且采用本发明的第二语言反查词库71 ，则会先找到第一语言字词83rgobackJ所对应的第二索引值84『36J ,接着，会关联到第二索引值84 「36」对应的第二语言字词85 r返回」、第二语言解释86为「回返；回归」及第二语言解释87为「 return; go back J 。
接着将会显示第二语言字词85 「返回J 、第二语言解释86为f回返；回归」及第二语言解释87为r return; go back J于显示区域92中，结果如图4A所示。
另外，当使用者于输入区域91中输入「 return」时，并且采用本发明的第二语言反查词库71，所查询的流程如上述，在此不再赘述，因此所呈现的结果即为显示第二语言字词85 r返」、第二语言解释86为「回J及第二语言解释87为r return; come or go back J ;第二语言字词85 r返回」、第二语言解释86为「回返；回归J及第二语言解释87为「 return; go back J ; 第二语言字词85 「返还」、第二语言解释86为r归还；退还」及第二语言解释87为r return; restore』于显示区域92中。
综上所述，可知本发明与现有技术之间的差异在于通过建立第一数位词库的第一语言字词生成索引表，并且自第二数位词库中选定第二语言字词，接着分析第一语言解释为第一语言解释字词，验证第一语言解释字词是否存在于索引表，即可以使不完整的词组被剔除，接着，储存索引表的第一语言字词及索引值为第二语言反查词库，即可以生成第二语言反查词库的技术手段，通过这一技术手段可以来解决现有技术所存在的问题，进而达成通过使用第二语言反查词库以第一语言查询可以得到精确查询结果的技术效果。
虽然本发明所揭露的实施方式如上，但所述的内容并非用以直接限定本发明的专利保护范围。任何本发明所属技术领域中具有通常知识者，在不脱离本发明所揭露之精神和范围的前提下，可以在实施的形式上及细节上作一些变更。本发明的专利保护范围，仍须以所附权利要求所界定的范围为准。
权利要求
1、一种第二语言反查词库的生成系统，其系统包含一第一数位词库，该第一数位词库包含一第一语言字词；一第二数位词库，该第二数位词库包含一索引值、至少一第二语言字词以及所述第一语言解释；一索引模块，依据所述第一语言字词生成一索引表；一选定模块，自所述第二数位词库中选定所述第二语言字词；一分析模块，将与所述第二语言字词对应的所述第一语言解释分析成为至少一第一语言解释字词；一判断模块，判断所述第一语言解释字词是否存在于所述索引表中；一储存模块，当所述第一语言解释字词存在于所述索引表中时，将所述第二语言字词的索引值储存于所述索引表中；及一词库生成模块，将所述索引表的所述第一语言字词及所述索引值储存为一第二语言反查词库。
2、如权利要求1所述的第二语言反查词库的生成系统，其中所述索引值为依据所述第二数位词库的所述第二语言字词依序编号。
3、如权利要求1所述的第二语言反查词库的生成系统，其中所述选定模块选定所述第二语言字词为依据所述第二数位词库中所述第二语言字词的顺序依序选定。
4、一种第二语言反查词库的生成方法，通过一第一数位词库以及一第二数位词库中的字词及其解释，以生成一第二语言反查词库，其方法包含下列步骤依据所述第一数位词库的第一语言字词生成一索引表；自所述第二凝:位词库中选定一第二语言字词；将与所述第二语言字词对应的所述第一语言解释分析成为至少一第一语言解释字词；判断所述第一语言解释字词是否存在于所述索引表中；当所述第一语言解释字词存在于所述索引表中时，将所述第二语言字词的索引值储存于所述索引表中；及将所述索引表的所述第一语言字词及所述索引值储存为一第二语言反查词库。
5、如权利要求4所述的第二语言反查词库的生成方法，其中所述索引值为依据所述第二数位词库的所述第二语言字词依序编号。
6、如权利要求4所述的第二语言反查词库的生成方法，其中选定所述第二语言字词的步骤为依据所述第二数位词库中所述第二语言字词的顺序依序选定。
全文摘要
一种第二语言反查词库的生成系统及其方法，其通过生成第一数位词库的索引表，并确认第二数位词库中第一语言解释是否存在于索引表，并储存索引值至索引表中，记录索引表以生成第二语言反查词库的技术手段，可以解决已知第一语言界面的第二语言字典采用第一语言及第二语言全文检索方式导致查询结果不精确的问题，藉此可以使用第二语言反查词库以第一语言查询第二语言词典的查询结果精确的技术效果。
文档编号G06F17/30GK101470743SQ20071030566
公开日2009年7月1日申请日期2007年12月27日优先权日2007年12月27日
发明者邱全成, 邵晓慧申请人:英业达股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邱全成;邵晓慧
技术所有人：英业达股份有限公司
我是此专利的发明人

上一篇：一种广告显示方法、系统和装置的制作方法
上一篇：多媒体诗词评价系统及其方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。