汉语/拼音/英语字典的制作方法

文档序号:6422815阅读:210来源:国知局
专利名称:汉语/拼音/英语字典的制作方法
技术领域
本发明针对一种用于在简体汉字符、繁体汉字符、拼音、以及英语之间进行翻译的方法。
背景技术
基于汉藏语系的语言,例如汉语,与基于拉丁语的语言,例如英语,有着很大的不同。汉语不包含字母表。而汉语包括60000多个单独的字符。这60000个字符中的每一个字符具有不同的含义。对于大约1200个字符的了解足以阅读汉语报纸。中国的大学生认识大约3000个字符。
在单词的概念方面,汉语也不同于基于拉丁语的语言。在汉语中,字符串不包含空格,而且对于一个单词结束和另一个开始的地方的解释,完全基于上下文。在含义、发音、以及书写它们的方式方面,汉字符非常精确。如果在一个字符串中一个汉字符拥有向该字符添加的字符,则第一个字符的含义得以加强,而通常不改变其含义。
汉字符总是作为一个单音节发音。不存在双音节汉字符。每一个汉字符拥有5个基本音之一。这5个基本音使汉语具有歌唱般的品质,因为某些汉字符发高音调、某些发低音调、某些具有升或降调。音调是汉语的基本成分,没有这些音调汉语将难以理解。例如,根据音调,字符“ma”可以意为“妈妈”或“马”或一个“询问”。在中国,人们讲着许多方言。从一种方言到另一种方言,口语单词几乎无法理解。但只有一种书面汉语。所有方言都能理解书面汉语。其他汉藏语系语言,例如日语、朝鲜语、以及越南语均使用一些与汉语相同的字符。然而,这些语言没有共同的书面或口语含义,类似于英语、西班牙语、以及法语虽然使用一个共同的字母集,但在别的方面又无法相互替换的情况。
1949年中国共产主义革命之后,共产党对汉字符进行了多次改革。首先,废弃了“从上到下”和“从右向左”的传统的书写方法。现在,中华人民共和国(PRC或中国大陆)仿效西方语言,并“从左向右”,然后“从上到下”书写。其次,选择了一个单一的方言,即普通话,现在,普通话作为主要的汉语在所有学校中加以教授。第三,PRC改变了大约四分之一的字符,把它们简体到大约7划。这形成了称为“简体汉语”的汉语形式,但台湾和香港仍在使用这种较复杂的称为“繁体汉语”的汉语形式。PRC还采用了大多数西方国家所使用的阿拉伯计数系统,Internet的出现导致英语出现在许多汉语句子中。
PRC还推出了“拼音”,即帮助小孩子学习语言汉语的这种语言的一个语音版本。拼音使用了英语字母表的26个字母加4个在某些元音上的声调,以表示如何对字符进行发音。向学生教授使用汉字符时,从大约4岁到大约7岁,通常使用拼音。拼音还十分有助于旅游者和商人根据汉语常用语手册讲汉语。另外,计算机用户喜欢拼音,因为它是从键盘输入汉字符的最容易的方法。
在计算机中,由16个比特的字符表示所有的汉藏语系的语言,而英语和其它拉丁语言通常由8个比特的字符加以表示。传统上,为每一种语言创作独立的编码。英语使用了称为ASCII的7个比特的编码。ASCII编码作为所有其它编码的头7个比特,被包括在所有其它编码中。欧洲语言通常为8个比特的编码,并使用第8个比特表示它们特有的字符。简体汉语使用GB2312编码,而繁体汉语使用Big 5编码。使用Big 5编码的计算机不能够读GB2312形式的计算机代码。编码的多样性令人感到混淆,而且在不同的编码之间不存在标准。Unicode协会已开发出了一种合并了世界上所有主要语言的单一编码。在计算机应用中,存在着一种使用Unicode和取代所有其它编码的强劲势头。在计算机内部,Unicode使用16个比特表示每一字符。Unicode拥有65000个不同的字符,并且把每一种主要的语言映像成这一Unicode范围的一个不同的部分。因此,可以把Unicode用作全世界所有语言的一个单一的编码方案。
汉字符是可以按不同字体尺寸加以显示的被编码项。换句话说,计算机按不同的尺寸显示汉字符,类似于计算机使用ASCII按不同的字体尺寸显示英语字符和单词的方法。改变字体尺寸,十分有利于学生学习汉语,因为学生能够更详细地观察汉字符。
可以使用Unicode中的不同的方案,表示单个的字符、字母、或符号。两种最流行的编码方案是UTF-8和UCS-2。UTF-8是如下基于字节的Unicode编码方案把每一字符、字母、或符号表示为一个、两个、或三个字节,每一个字节为8个比特。相比之下,UCS-2为这样的16个比特的Unicode编码方案把每一字符、字母、或符号表示为16个比特或4个16进制数字。一个16进制数字等价于4个比特,可以由两个16进制数字表示一个字节。以下,表1显示了UTF-8和UCS-2之间的差别。
表1用户可以选择使用UCS-2方案或UTF-8方案进行编码,取决于用户的所预期的需求。例如,当从一个位置向另一个位置传输数据时,或当把数据存储在一个数据库中时,由于可变字节流长度(即1~3个字节,如表1中所示)中固有的传输效率和存储效率,UCF-8为较佳的编码方案。然而,当存储器中装有相同的信息,则UCS-2为应采用的编码方案。UCS-2和UTF-8之间的转换函数是可得的,名为“Table-Level Unicode Handling in a Database Engine”的美国专利申请2003/0078921证明了这一点,将这一专利并入此处,以作参考。
在Unicode的开发之前,在相同编码中,简体汉语和繁体汉语之间的计算机化的字符翻译器是不可能的,因为GB2312代码不能理解Big 5代码,反之亦然。如果用户希望一个计算机实现的翻译,则必须使用多个不允许同时显示两种形式数据的编码。
相类似,现有翻译程序尚不能显示具有适当声调的拼音。通常,这些程序将使用gif(可交换的图像文件)和jpeg(联合图像专家组)格式的图片表示字符,标声调的元音表示适当的音调,而且标声调的元音对拼音的适当发音是至关重要的。一种仅使用ASCII字符的技术,基于在拼音单词之后添加一个数码,以表示声调,如表2所示。
表2因此,现有技术将把单词guó显示为guo2,把单词mā显示为mal等。对于初级读者,拼音的这一现有技术混合版本难以理解,因为读者必须在数码和声调的适当的类型与位置之间进行一个认识上的跳跃。因此,存在着对简体汉语、繁体汉语、拼音、以及英语之间的一种自动翻译方法的需求。这一需求扩展为对一种显示具有适当声调标记的拼音的方法的需求。
然而,存在着这样的可能性用户可能希望得到一系列类似用户输入的单词。当用户试图精确表达一个意思时,例如在商务谈判中,一系列单词是有益的。在这种情况下,由用户指出用户输入是整个所希望的单词、所希望的单词的开始,或仅位于所希望的单词中任何一个位置,将是有用的。因此,存在着对简体汉语、繁体汉语、带声调的拼音、以及英语之间允许用户指出所希望的输出类型的一种自动翻译方法的需求。
发明概述本发明是一种用于在简体汉字符、繁体汉字符、拼音单词、以及英语单词之间进行翻译的方法。本发明的软件实施例是可操作在Web页上的计算机程序,或作为独立计算机上的程序。本发明的软件实施例包括字典程序,(DP)。DP接受Big 5、GB2312、ASCII、或任何Unicode编码方案的字符或单词,并将该字符或单词翻译成Unicode。然后,DP判断用户输入是整个所希望的单词、所希望的单词的开始,还是出现在所希望的单词中任何一个位置,并相应地运行整个单词翻译程序(EWTP)、单词的开始翻译程序(BWTP)、或单词中任何一个位置翻译程序(AWTP)。DP还判断用户指出的用于显示汉字符的字体尺寸。然后,DP显示繁体汉语单词、简体汉语单词、带声调的拼音单词、以及英语单词。
EWTP、BWTP、以及AWTP判断用户输入是繁体汉字符、简体汉字符、拼音单词、或英语单词。EWTP、BWTP、以及AWTP根据要求把用户输入翻译成繁体汉字符、简体汉字符、带声调的拼音单词、以及英语单词。EWTP、BWTP、以及AWTP使用简体汉语/繁体汉语转换表,在简体汉字符和繁体汉字符之间进行翻译。EWTP、BWTP、以及AWTP还使用繁体汉语/拼音/英语字典,在繁体汉字符、拼音、以及英语之间进行翻译。如果所输入的字符为繁体汉字符而且不具有简体汉语的等价物,则EWTP、BWTP、以及AWTP显示消息,指出该繁体汉字符不具有简体汉语的等价物。
附图简述权利要求中给出了被视为本发明特征的新的特性。然而,当结合附图阅读时,通过参照以下对说明性实施例的详细描述,将能够对发明本身、使用的较佳模式、进一步的目的、以及优点最好地加以了解,在这些附图中

图1说明了用于实现本发明的一个计算机网络;图2说明了用于实现本发明的存储器;图3A与3B说明了本发明的字典程序(DP)的逻辑;图4说明了本发明的整个单词翻译程序(EWTP)的逻辑;图5说明了本发明的单词的开始翻译程序(BWTP)的逻辑;图6说明了本发明的单词中任何一个位置翻译程序(AWTP)的逻辑;图7说明了显示用户输入的整个翻译的本发明的图形用户界面(GUI);图8说明了显示对在单词的开始处的用户输入的翻译的本发明的图形用户界面(GUI);图9说明了显示包含在单词中任何一个位置的用户输入的翻译的本发明的图形用户界面(GUI);图10说明了显示本发明的汉字符的可变字体尺寸的本发明的图形用户界面(GUI)。
优选实施例详述如此处所使用的,术语“带声调的拼音”意指在相应的罗马字母之上具有适当声调的汉语言的拼音语音版本。
如此处所使用的,术语“ASCII”是一个针对美国标准信息交换码(American Standard Code for Information Interchange)的首字母缩略词,意指针对QWERTY键盘上的罗马字母、阿拉伯数字、控制字符、以及各种符号的编码语言。
如此处所使用的,术语“Big 5”意指针对繁体汉字符集的编码语言。
如此处所使用的,术语“计算机”意指一种拥有处理器、存储器、操作系统的机器,能够与用户或另一个计算机进行交互,将包括但不局限于台式计算机、笔记本计算机、个人数字助手(PDA)、服务器、手持计算机、以及类似的设备。
如此处所使用的,术语“GB2312”意指针对简体汉字符集的编码语言。
如此处所使用的,术语“混合拼音”意指在相应的罗马字母之上不具有适当声调的汉语言的拼音语音版本,但具有在单词中或单词末尾的数码,以代表音调标记。
如此处所使用的,术语“不带声调的拼音”意指在相应的罗马字母之上不具有适当声调的汉语言的拼音语音版本。
如此处所使用的,术语“Unicode”意指由Unicode协会所开发的编码语言,包括包含简体汉字符集和繁体汉字符集的世界上大部分语言。
图1说明了与本发明相关的计算机网络90。计算机网络90包括电耦合于网络96的本地机器95。经由网络96把本地机器95电耦合于远程机器94和远程机器93。还经由网络96把本地机器95电耦合于服务器91和数据库92。网络96可以为简化的网络连接,例如局域网络(LAN),也可以为较大的网络,例如广域网络(WAN)或Internet。另外,图1中所示的计算机网络90,旨在作为可以包含本发明的可能的操作网络的代表,并不意味着体系结构上的限制。
计算机的内部配置,包括处理器、存储器、以及输入/输出设备的连接与方向,是本领域公知的。本发明是一种能够以计算机程序加以体现的方法。参照图2,通过字典程序(DP)200、整个单词翻译程序(EWTP)300、单词的开始翻译程序(BWTP)400、或单词中任何一个位置翻译程序(AWTP)500,在软件上实现本发明的方法。可以把此处所描述的DP 200、EWTP 300、BWTP 400、AWTP 500存储在图1所示的任何计算机的存储器中。另外,也可选择把DP 200、EWTP 300、BWTP 400、AWTP 500存储在外部存储设备中,例如存储在可移动盘或CD-ROM中。存储器100为图1的计算机之一中的说明用的存储器。存储器100还包括Unicode字典程序102、简体汉语/繁体汉语转换表104、以及繁体汉语/拼音/英语字典108。本发明可以通过存储器100与Unicode字典程序102、简体汉语/繁体汉语转换表104、以及繁体汉语/拼音/英语字典108接口。作为本发明的一部分,可以使用DP 200、EWTP 300、BWTP 400、和/或AWTP 500对存储器100进行配置。处理器106可以执行包含在DP 200、EWTP 300、BWTP 400、和/或AWTP 500中的指令。
在可替换实施例中,把DP 200、EWTP 300、BWTP 400、和/或AWTP500存储在其它计算机的存储器中,把DP 200、EWTP 300、BWTP 400、和/或AWTP 500存储在其它计算机的存储器中允许跨越一系列处理器而不是一个单一的处理器分配处理器工作负载。跨越不同存储器的DP 200、EWTP300、BWTP 400、和/或AWTP 500的进一步配置是本领域技术人员公知的。
在这一优选实施例中,本发明为可通过Internet加以访问的Web页。当用户访问Web页时,DP 200开始(202)。然后,用户输入包括汉字符、拼音、或英语单词的用户输入(204)。在步骤204所输入的用户输入可以为繁体汉字符、简体汉字符、带声调的拼音单词、不带声调的拼音单词、混合拼音单词、或英语单词。而且,步骤204中的输入可以为GB2312、Big 5、或任何Unicode格式。DP 200接受GB2312、Big 5、或Unicode编码(即UTF-8),因为DP 200把字符数据翻译成UCS-2数据(206)。DP 200可以利用图2中的Unicode翻译程序102把所输入的字符翻译成UCS-2数据。混合拼音或不带声调的拼音与繁体汉语或简体汉语之间的翻译程序,是本领域技术人员公知的。尽管GB2312与Big 5互不兼容,但GB2312和Big 5均与Unicode兼容。换句话说,按GB2312编码的Web页将不识别Big 5字符,而且按Big 5编码的Web页也将不识别GB2312字符。然而,按Unicode编码的Web页将既识别GB2312字符,也识别Big 5字符,因为Unicode既包含GB2312字符,也包含Big 5字符。
然后,DP 200判断用户是否指出用户输入为整个单词(208)。如果用户没有指出用户输入为整个单词,则DP 200前进到步骤210。如果用户指出用户输入为整个单词,则DP 200运行EWTP 300(214),并前进到步骤220。接下来,DP 200判断用户是否指出用户输入为所希望的单词的开始(210)。如果用户没有指出用户输入为所希望的单词的开始,则DP 200前进到步骤216。如果用户指出用户输入为所希望的单词的开始,则DP 200运行BWTP400(216),并前进到步骤220。然后,DP 200判断用户是否指出用户输入可能出现在所希望单词中的任何一个位置(212)。如果用户没有指出用户输入可能出现在所希望单词中的任何一个位置,则DP 200前进到步骤208。如果用户指出用户输入为可能出现在所希望单词中的任何一个位置,则DP 200运行AWTP 500(218),并前进到步骤220。
作为本发明的一部分,用户可以指出简体汉语和繁体汉语的所希望的显示尺寸。因为按Unicode对汉字符进行编码,所以能够很容易地改变字体尺寸。先前,如果按GB2312对简体汉字符进行编码,则用户能够改变这些字符的字体尺寸,但不能显示繁体汉字符。相类似,如果按Big 5对繁体汉字符进行编码,则用户能够改变这些字符的字体尺寸,但不能显示简体汉字符。
在步骤220,DP 200判断用户是否选择了标准尺寸的汉字符(220)。标准尺寸的汉字符是默认尺寸的字符,通常为12个点的字体尺寸。普通技术人员可以把标准尺寸的字符配置为任何字体尺寸。如果DP 200断定用户没有选择标准尺寸的汉字符,则DP 200前进到步骤224。如果DP 200断定用户选择了标准尺寸的汉字符,则DP 200按标准尺寸显示简体汉字符和繁体汉字符(222)。然后,DP 200前进到步骤236。
在步骤224,DP 200判断用户是否选择了较大尺寸的汉字符(224)。较大尺寸的字符通常为16个点的字体尺寸。普通技术人员可以把较大尺寸的字符配置为任何字体尺寸。如果DP 200断定用户没有选择较大尺寸的汉字符,则DP 200前进到步骤228。如果DP 200断定用户选择了较大尺寸的汉字符,则DP 200按较大尺寸显示简体汉字符和繁体汉字符(226)。然后,DP 200前进到步骤236。
在步骤228,DP 200判断用户是否选择了大尺寸的汉字符(228)。大尺寸字符通常为20个点的字体尺寸。普通技术人员可以把大尺寸的字符配置为任何字体尺寸。如果DP 200断定用户没有选择大尺寸的汉字符,则DP 200前进到步骤232。如果DP 200断定用户选择了大尺寸的汉字符,则DP 200按大尺寸显示简体汉字符和繁体汉字符(230)。然后,DP 200前进到步骤236。
在步骤232,DP 200判断用户是否选择了巨型尺寸的汉字符(232)。巨型尺寸字符通常为24个点的字体尺寸。普通技术人员可以把巨型尺寸的字符配置为任何字体尺寸。如果DP 200断定用户没有选择巨型尺寸的汉字符,则DP 200返回到步骤220。如果DP 200断定用户选择了巨型尺寸的汉字符,则DP 200按巨型尺寸显示简体汉字符和繁体汉字符(234)。然后,DP 200前进到步骤236。
在步骤236,DP 200按标准尺寸显示带声调的拼音单词和英语单词(236)。在可替换实施例中,DP 200使用户能够改变拼音单词和英语单词以及汉字符的字体尺寸。然后,DP 200结束(238)。
图4中说明了本发明的EWTP 300的逻辑的流程图。EWTP 300是一个为找出严格与用户输入相匹配的项而搜索繁体汉语/拼音/英语字典304的程序。EWTP 300还根据需要把用户输入翻译成简体汉字符、繁体汉字符、拼音单词、以及英语单词。当DP 200指示时,EWTP 300开始(302)。然后,EWTP300判断用户输入是否为简体汉字符(308)。如果用户输入不是简体汉字符,则EWTP 300前进到步骤316。如果用户输入是简体汉字符,则EWTP 300使用简体汉语/繁体汉语转换表306确定等价于简体汉字符的繁体汉字符(310)。简体汉语/繁体汉语转换表306是JAVATM杂凑表,按Unicode编码,包含所有简体汉字符以及它们等价的繁体汉字符之间的一个交叉引用。简体汉语/繁体汉语转换表306可以类似图2中的简体汉语/繁体汉语转换表104。杂凑表中的数据为UCS-2 Unicode格式。由于存在大约1250个简体汉字符,所以杂凑表大约包含2500个表项——每一个简体汉字符以及等价的繁体汉字符一个表项。
在步骤312,为找出严格与用户输入相匹配的项,EWTP 300搜索繁体汉语/拼音/英语字典304(312)。然后,EWTP 300使用繁体汉语/拼音/英语字典304,确定繁体汉字符的带声调的拼音和英语翻译(314)。繁体汉语/拼音/英语字典304是一部字典,按Unicode编码,包含所有具有带声调的拼音和英语翻译的繁体汉字符。在对于一个给定的用户输入存在一个以上的含义的情况下,繁体汉语/拼音/英语字典304给出针对这一用户输入的最常使用的单词。可替换地,繁体汉语/拼音/英语字典304可以给出针对这一用户输入的某些或全部含义。繁体汉语/拼音/英语字典304可以类似于图2中的繁体汉语/拼音/英语字典108。然后,EWTP 300结束(336)。
返回到步骤316,接下来EWTP 300判断用户输入是否为繁体汉字符(316)。如果用户输入不是繁体汉字符,则EWTP 300前进到步骤322。如果用户输入是繁体汉字符,则为找出严格与用户输入相匹配的项,EWTP 300搜索繁体汉语/拼音/英语字典304(318)。然后,EWTP 300使用繁体汉语/拼音/英语字典304和简体汉语/繁体汉语转换表306确定繁体汉字符的简体汉字符、带声调的拼音、以及英语单词翻译(320)。然后,EWTP 300结束(336)。如果所输入的字符为繁体汉字符,而且不具有简体汉字符等价物,则EWTP 300显示消息,指出该繁体汉字符不具有简体汉语的等价物。
返回到步骤322,然后EWTP 300判断用户输入是否为拼音单词(322)。如果用户输入不是拼音单词,则EWTP 300前进到步骤328。如果用户输入是拼音单词,则为找出严格与用户输入相匹配的项,EWTP 300搜索繁体汉语/拼音/英语字典304(324)。然后,EWTP 300使用繁体汉语/拼音/英语字典304和简体汉语/繁体汉语转换表306确定拼音单词的简体汉字符、繁体汉字符、以及英语单词翻译(326)。然后,EWTP 300结束(336)。
返回到步骤328,然后EWTP 300判断用户输入是否为英语单词(328)。如果用户输入不是英语单词,则EWTP 300前进到步骤334。如果用户输入是英语单词,则为找出严格与用户输入相匹配的项,EWTP 300搜索繁体汉语/拼音/英语字典304(330)。然后,EWTP 300使用繁体汉语/拼音/英语字典304和简体汉语/繁体汉语转换表306确定英语单词的繁体汉字符、简体汉字符、以及带声调的拼音单词翻译(332)。然后,EWTP 300结束(336)。
在步骤334,EWTP 300显示错误消息所输入的字符不是认识的简体汉字符、繁体汉字符、拼音单词、或英语单词(334),并结束(336)。
图5中说明了本发明的BWTP 400的逻辑的流程图。BWTP 400是一个为找出以用户输入开始的项而搜索繁体汉语/拼音/英语字典404的程序。BWTP 400还根据需要把在繁体汉语/拼音/英语字典404的所发现的项翻译成简体汉字符、繁体汉字符、拼音单词、以及英语单词。当DP 200指示时,BWTP 400开始(402)。然后,BWTP 400判断用户输入是否为简体汉字符(408)。如果用户输入不是简体汉字符,则BWTP 400前进到步骤416。如果用户输入是简体汉字符,则BWTP 400使用简体汉语/繁体汉语转换表406确定等价于简体汉字符的繁体汉字符(410)。简体汉语/繁体汉语转换表406可以类似图2中的简体汉语/繁体汉语转换表104。
在步骤412,为找出以用户输入开始的项,BWTP 400搜索繁体汉语/拼音/英语字典404(412)。然后,BWTP 400使用繁体汉语/拼音/英语字典404,确定繁体汉字符的带声调的拼音和英语翻译(414)。繁体汉语/拼音/英语字典404可以类似于图2中的繁体汉语/拼音/英语字典108。然后,BWTP 400结束(436)。
返回到步骤416,接下来BWTP 400判断用户输入是否为繁体汉字符(416)。如果用户输入不是繁体汉字符,则BWTP 400前进到步骤422。如果用户输入是繁体汉字符,则为找出以用户输入开始的项,BWTP 400搜索繁体汉语/拼音/英语字典404(418)。然后,BWTP 400使用繁体汉语/拼音/英语字典404和简体汉语/繁体汉语转换表406确定繁体汉字符的简体汉字符、带声调的拼音、以及英语单词翻译(420)。然后,BWTP 400结束(436)。如果所输入的字符为繁体汉字符,而且不具有简体汉字符等价物,则BWTP 400显示消息,指出该繁体汉字符不具有简体汉语的等价物。
返回到步骤422,然后BWTP 400判断用户输入是否为拼音单词(422)。如果用户输入不是拼音单词,则BWTP 400前进到步骤428。如果用户输入是拼音单词,则为找出以用户输入开始的项,BWTP 400搜索繁体汉语/拼音/英语字典404(424)。然后,BWTP 400使用繁体汉语/拼音/英语字典404和简体汉语/繁体汉语转换表406确定拼音单词的简体汉字符、繁体汉字符、以及英语单词翻译(426)。然后,BWTP 400结束(436)。
返回到步骤428,然后BWTP 400判断用户输入是否为英语单词(428)。如果用户输入不是英语单词,则BWTP 400前进到步骤434。如果用户输入是英语单词,则为找出以用户输入开始的项,BWTP 400搜索繁体汉语/拼音/英语字典404(340)。然后,BWTP 400使用繁体汉语/拼音/英语字典404和简体汉语/繁体汉语转换表406确定英语单词的繁体汉字符、简体汉字符、以及带声调的拼音单词翻译(442)。然后,BWTP 400结束(436)。
在步骤434,BWTP 400显示错误消息所输入的字符不是认识的简体汉字符、繁体汉字符、拼音单词、或英语单词(434),并结束(436)。
图6中说明了本发明的AWTP 500的逻辑的流程图。AWTP 500是为找出包含用户输入的项而搜索繁体汉语/拼音/英语字典504的程序。AWTP500还根据需要把在繁体汉语/拼音/英语字典504的所发现的项翻译成简体汉字符、繁体汉字符、拼音单词、以及英语单词。当DP 200指示时,AWTP500开始(502)。然后,AWTP 500判断用户输入是否为简体汉字符(508)。如果用户输入不是简体汉字符,则AWTP 500前进到步骤516。如果用户输入是简体汉字符,则AWTP 500使用简体汉语/繁体汉语转换表506确定等价于简体汉字符的繁体汉字符(510)。简体汉语/繁体汉语转换表506可以类似图2中的简体汉语/繁体汉语转换表104。
在步骤512,为找出包含用户输入的项,AWTP 500搜索繁体汉语/拼音/英语字典504(512)。这些项可以在单词中任何一个位置上包含用户输入。然后,AWTP 500使用繁体汉语/拼音/英语字典504,确定繁体汉字符的带声调的拼音和英语翻译(514)。繁体汉语/拼音/英语字典504可以类似于图2中的繁体汉语/拼音/英语字典108。然后,AWTP 500结束(536)。
返回到步骤516,接下来BWTP 500判断用户输入是否为繁体汉字符(516)。如果用户输入不是繁体汉字符,则BWTP 500前进到步骤522。如果用户输入是繁体汉字符,则为找出包含用户输入的项,BWTP 500搜索繁体汉语/拼音/英语字典504(518)。然后,BWTP 500使用繁体汉语/拼音/英语字典504和简体汉语/繁体汉语转换表506确定繁体汉字符的简体汉字符、带声调的拼音、以及英语单词翻译(520)。然后,BWTP 500结束(536)。如果所输入的字符为繁体汉字符,而且不具有简体汉字符等价物,则BWTP500显示消息,指出该繁体汉字符不具有简体汉语的等价物。
返回到步骤522,然后BWTP 500判断用户输入是否为拼音单词(522)。如果用户输入不是拼音单词,则BWTP 500前进到步骤528。如果用户输入是拼音单词,则为找出包含用户输入的项,BWTP 500搜索繁体汉语/拼音/英语字典504(524)。然后,BWTP 500使用繁体汉语/拼音/英语字典504和简体汉语/繁体汉语转换表506确定拼音单词的简体汉字符、繁体汉字符、以及英语单词翻译(526)。然后,BWTP 500结束(536)。
返回到步骤528,然后BWTP 500判断用户输入是否为英语单词(528)。如果用户输入不是英语单词,则BWTP 500前进到步骤534。如果用户输入是英语单词,则为找出包含用户输入的项,BWTP 500搜索繁体汉语/拼音/英语字典504(350)。然后,BWTP 500使用繁体汉语/拼音/英语字典504和简体汉语/繁体汉语转换表506确定英语单词的繁体汉字符、简体汉字符、以及带声调的拼音单词翻译(352)。然后,BWTP 500结束(536)。
在步骤534,BWTP 500显示错误消息所输入的字符不是认识的简体汉字符、繁体汉字符、拼音单词、或英语单词(534),并结束(536)。
转向图7,图7说明了本发明的图形用户界面(GUI)600的一个实施例。GUI 600是本发明的Web页实施例的内容的实例。GUI 600也是本发明的可操作在单一的计算机上的独立计算机程序实施例的显示的实例。GUI 600包含用户输入字段602。用户可以利用计算机的拷贝和粘贴操作把字符输入到用户输入字段602。在拷贝和粘贴操作中,用户加亮所希望的字符,从菜单中选择“拷贝”,把光标放在用户输入字段602中,然后从菜单中选择“粘贴”。然后,所加亮的字符出现在用户输入字段602中。本领域技术人员了解用于在计算机上实现拷贝和粘贴操作的方法。用户也可以通过本领域技术人员公知的任何方法把字符输入到用户输入字段602中。
作为本发明的一部分,当用户利用拷贝和粘贴操作把字符输入到用户输入字段602时,DP200将识别所输入的字符,而不管在所加亮的“拷贝”文本中所使用的是何种编码格式。例如,用户可以观看以繁体汉语书写的另一个Web页,但会遇到用户不认识的字符。然后,用户可以加亮用户不认识的字符,拷贝该字符,并将该字符粘贴到用户输入字段602中,接下来点击提交按钮604,以确定繁体汉字符的等价简体汉字符。本发明接受另一Web页中所使用的Big 5编码,因为Big 5与Unicode兼容。在另一个实例中,用户可以观看以简体汉语书写的另一个Web页,但会遇到用户不认识的字符。然后,用户可以加亮用户不认识的字符,拷贝该字符,并将该字符粘贴到用户输入字段602中,接下来点击提交按钮604,以确定简体汉字符的等价繁体汉字符。本发明接受另一Web页中所使用的GB2312编码,因为GB2312与Unicode兼容。如果按Big 5或GB2312实现本发明,则本发明将局限于简体汉语或繁体汉语,取决于编码语言。用户也可以使用拷贝和粘贴功能输入ASCII或Unicode格式的英语单词、带声调的拼音、混合拼音、或不带声调的拼音。
当用户把一个字符或单词插入用户输入字段602之后,用户可以点击提交按钮604,提交按钮604指示DP 200分析用户输入字段602中的字符。如在图7中所看到的,用户已输入英语单词“international”。而且,用户还选择了整个单词单选按钮614,以指出用户输入为用户希望的整个字。用户还可能选择了单词的开始单选按钮616,以指出用户输入出现在所希望的单词的开始处。另外,用户也可选择单词中任何位置单选按钮618,以指出用户输入出现在单词中的任何一个位置。用户还可能选择了标准尺寸单选按钮620,以指出用户希望按该种字体尺寸显示汉字符。而且,用户还可能选择了较大单选按钮622,大单选按钮624,或巨型单选按钮626。
当用户点击了提交按钮604,DP 200在用户输入字段602之下显示简体汉字符606、繁体汉字符608、带适当声调的拼音单词610、以及英语翻译612。在图7中,按标准字体尺寸显示汉字符,因为用户选择了标准单选按钮620。另外,因为用户选择了整个单词单选按钮614,所以DP 200仅显示单词international的翻译。用户可以输入所希望数量的单词,并随意地继续利用本发明。
转向图8,再次显示GUI 600。在图8中,用户选择了单词的开始单选按钮616,以指出所希望的单词以用户输入“international”开始。如从图8所示,DP 200产生以international开始的翻译。
转向图9,再次显示GUI 600。在图9中,用户选择了单词中任何位置单选按钮618,指出所希望的单词在该单词中的任何位置包含“international”。如从图8中所看到的,DP 200产生包含international的翻译。
转向图10,再次显示GUI 600。在图10中,用户选择了大单选按钮624,指出用户希望按大字体尺寸显示汉字符。对于学习汉语的学生来说,增大的字体尺寸特别有用,以致于他们可以学习到汉字符之间的区别。
对于以上的描述,本领域技术人员很容易意识到本发明各部分的最佳维度关系,即很容易意识到如何在尺寸、材料、形状、形式、操作功能与方式、装配与使用等方面对本发明加以变化,所有与图中所说明的以及本说明书所描述的关系等价的关系,均旨在由本发明所包括。本发明的新的构思,还通过重新排序或删除这一公开中所包含的某些步骤加以体现。除了通过权利要求的适当构造外,不以任何方式限制本发明的构思。
权利要求
1.一种方法,包括搜索字典,以找出包含简体汉语单词的项;使用Unicode确定所述简体汉语单词的等价的繁体汉语单词;以及使用Unicode把所述简体汉语单词翻译成带声调的拼音单词和英语单词。
2.如权利要求1所述的方法,其中,所述项与所述简体汉语单词严格匹配。
3.如权利要求1所述的方法,其中,所述项以所述简体汉语单词开始。
4.如权利要求1所述的方法,其中,所述项在该项中的任何位置包含所述简体汉语单词。
5.如权利要求1所述的方法,还包括接受作为用户输入的所述简体汉语单词,其中,按GB2312或Unicode对所述简体汉语单词进行编码。
6.如权利要求1所述的方法,还包括把所述简体汉语单词从GB2312翻译成Unicode。
7.如权利要求1所述的方法,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
8.一种方法,包括搜索字典,以找出包含繁体汉语单词的项;使用Unicode确定所述繁体汉语单词的等价的简体汉语单词;以及使用Unicode把所述繁体汉语单词翻译成带声调的拼音单词和英语单词。
9.如权利要求8所述的方法,其中,所述项与所述繁体汉语单词严格匹配。
10.如权利要求8所述的方法,其中,所述项以所述繁体汉语单词开始。
11.如权利要求8所述的方法,其中,所述项在该项中的任何位置包含所述繁体汉语单词。
12如权利要求8所述的方法,还包括接受作为用户输入的所述繁体汉语单词,其中,按Big5或Unicode对所述繁体汉语单词进行编码。
13.如权利要求8所述的方法,还包括把所述繁体汉语单词从Big 5翻译成Unicode。
14.如权利要求8所述的方法,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
15.一种方法,包括搜索字典,以找出包含拼音单词的项;以及使用Unicode把所述拼音单词翻译成繁体汉语单词、简体汉语单词、以及英语单词。
16.如权利要求15所述的方法,其中,所述项与所述拼音单词严格匹配。
17.如权利要求15所述的方法,其中,所述项以所述拼音单词开始。
18.如权利要求15所述的方法,其中,所述项在该项中的任何位置包含所述拼音单词。
19.如权利要求15所述的方法,其中,所述拼音单词是不带声调的拼音单词或混合拼音单词。
20.如权利要求15所述的方法,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
21.一种方法,包括搜索字典,以找出包含英语单词的项;以及使用Unicode把所述英语单词翻译成繁体汉语单词、简体汉语单词、以及带声调的拼音单词。
22.如权利要求21所述的方法,其中,所述项与所述英语单词严格匹配。
23.如权利要求21所述的方法,其中,所述项以所述英语单词开始。
24.如权利要求21所述的方法,其中,所述项在该项中的任何位置包含所述英语单词。
25.如权利要求21所述的方法,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
26.一种可在计算机上操作的程序产品,该程序产品包括计算机可用的媒体;其中,所述计算机可用的媒体包括指令,这些指令包括搜索字典,以找出包含简体汉语单词的项的指令;使用Unicode确定所述简体汉语单词的等价的繁体汉语单词的指令;以及使用Unicode把所述简体汉语单词翻译成带声调的拼音单词和英语单词的指令。
27.如权利要求26所述的程序产品,其中,所述项与所述繁体汉语单词严格匹配。
28.如权利要求26所述的程序产品,其中,所述项以所述繁体汉语单词开始。
29.如权利要求26所述的程序产品,其中,所述项在该项中的任何位置包含所述繁体汉语单词。
30.如权利要求26所述的程序产品,还包括接受作为用户输入的所述繁体汉语单词的指令,其中,按Big5或Unicode对所述繁体汉语单词进行编码。
31.如权利要求26所述的程序产品,还包括把所述繁体汉语单词从Big5翻译成Unicode的指令。
32.如权利要求26所述的程序产品,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词的指令;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
33.一种可在计算机上操作的程序产品,该程序产品包括计算机可用的媒体;其中,所述计算机可用的媒体包括指令,这些指令包括搜索字典,以找出包含繁体汉语单词的项的指令;使用Unicode确定所述繁体汉语单词的等价的简体汉语单词的指令;以及使用Unicode把所述繁体汉语单词翻译成带声调的拼音单词和英语单词的指令。
34.如权利要求33所述的程序产品,其中,所述项与所述繁体汉语单词严格匹配。
35.如权利要求33所述的程序产品,其中,所述项以所述繁体汉语单词开始。
36.如权利要求33所述的程序产品,其中,所述项在该项中的任何位置包含所述繁体汉语单词。
37.如权利要求33所述的程序产品,还包括接受作为用户输入的所述繁体汉语单词的指令,其中,按Big5或Unicode对所述繁体汉语单词进行编码。
38.如权利要求33所述的程序产品,还包括把所述繁体汉语单词从Big5翻译成Unicode的指令。
39.如权利要求33所述的程序产品,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词的指令;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
40.一种可在计算机上操作的程序产品,该程序产品包括计算机可用的媒体;其中,所述计算机可用的媒体包括指令,这些指令包括搜索字典,以找出包含拼音单词的项的指令;以及使用Unicode把所述拼音单词翻译成繁体汉语单词、简体汉语单词、以及英语单词的指令。
41.如权利要求40所述的程序产品,其中,所述项与所述拼音单词严格匹配。
42.如权利要求40所述的程序产品,其中,所述项以所述拼音单词开始。
43.如权利要求40所述的程序产品,其中,所述项在该项中的任何位置包含所述拼音单词。
44.如权利要求40所述的程序产品,其中,所述拼音单词为不带声调的拼音单词或混合拼音单词。
45.如权利要求40所述的程序产品,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词的指令;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
46.一种可在计算机上操作的程序产品,该程序产品包括计算机可用的媒体;其中,所述计算机可用的媒体包括指令,这些指令包括搜索字典,以找出包含英语单词的项的指令;以及使用Unicode把所述英语单词翻译成繁体汉语单词、简体汉语单词、以及带声调的拼音单词的指令。
47.如权利要求46所述的程序产品,其中,所述项与所述英语单词严格匹配。
48.如权利要求46所述的程序产品,其中,所述项以所述英语单词开始。
49.如权利要求46所述的程序产品,其中,所述项在该项中的任何位置包含所述英语单词。
50.如权利要求46所述的程序产品,还包括显示所述简体汉语单词、繁体汉语单词、带声调的拼音单词、以及英语单词;以及其中,所述简体汉语单词字体尺寸和繁体汉语单词字体尺寸是用户可配置的。
全文摘要
公开了一种用于在简体汉字符、繁体汉字符、拼音单词、以及英语单词之间进行翻译的方法。本发明包括字典程序(DP)。DP接受Big5、GB2312、ASCII、或任何Unicode编码方案的字符或单词,并该把字符或单词翻译成Unicode。根据需要,DP把用户输入翻译成繁体汉语字符、简体汉语字符、带声调的拼音单词、以及英语单词。用户可以指出用户输入是整个所希望的单词、所希望的单词的开始、还是出现在所希望的单词中的任何位置。用户还可以配置汉字符的显示尺寸。
文档编号G06F17/22GK1581158SQ20041006961
公开日2005年2月16日 申请日期2004年7月15日 优先权日2003年7月31日
发明者陈彦甫, 约翰·W·邓琪莫尔 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1