汉字变换装置的制作方法

文档序号:6407297阅读:234来源:国知局
专利名称:汉字变换装置的制作方法
技术领域
本发明涉及汉字变换装置,尤其涉及将注音字母串变换成汉字串的汉字变换装置。
汉语中使用的汉字超过一万个。如何能从中正确地选出汉字并高速度输入是包括文字处理等在内的汉语计算机处理中最重要的问题。以往的汉字输入方式有话音识别、文字识别、键盘等。其中,利用键盘最为可靠,因此广泛地付诸实用。而利用键盘的输入方式划分成藉助汉字读音和藉助汉字字形这两种。籍助汉字字形的输入方式必须预先记住输入规则,而默记这些规则需要相当长的时间,并且要达到熟练的程度也需要时间。籍助汉字读音的输入方式较为自然而且最易学习,因此在当前,当然也包括将来,这是汉字输入的主流方式。
输入读音的汉字变换装置其例子有中国台湾专利申请75105838号。图6是该输入读音的汉字变换装置结构图。图中,10是输入部,输入任意长度的拼音、标音、罗马字等注音字母串,由键盘构成。18是词典部,将作为变换对象的单词与注音字母对应,由制造者预先存入(永久存储)。当同一发音有多个单词时,按照使用频度、笔划数的顺序排列变换先后,这与日语文字处理器的词典部无异。14是NCHAR寄存器,存储所输入注音字母串的音节数。12、13是PTR和NP寄存器,分别在注音字母串变换成单词时使用。PTR寄存器12存储变换起始位置,即输入注音字母串中开始进行变换的位置。NP寄存器13在输入的注音字母串变换成单词时存储变换对象的单词长度。15是比较部,在某一长度的单词作变换处理之后,将上述NP寄存器13的值减1,从而将汉字数以及字母数均减小1个后的单词作为变换对象。16是变换控制部,将上述PTR寄存器12的设定位置从所输入注音字母串的最初位置开始依次朝后移动,检查有无已变换的音节,如果尚未有音节得到变换,并且词典部18中存在对应的单词,则变换成该对应单词,从而将先输入的音节串优先作为变换对象。17是词典检索部,将上述变换控制部16送来的音节串作为检索关键词,检索词典部18,查找相应的单词。23是输出部,由阴极射线管(CRT)及打印部构成,输出上述变换控制部16检出的单词。
上述结构的汉字变换装置采用最长一致法将输入的注音字母串变换成汉字。
此处所谓的最长一致法在将注音字母串变换成汉字时所采用的原则是,第1,以变换对象单词构成汉字字数多的为优先,第2,以先输入的注音字母串为优先。
该方法主要通过上述PTR寄存器12、NP寄存器13、NCHAR寄存器14、比较部15以及变换处理部16来实现,其作用将在后文的实施例中详细说明。
但是,在上述汉字变换装置中,采用最长一致法之后仅以词典部记录的单词为变换单位。因此,当作为变换对象的注音字母串中某个音节,与其前面的音节和后面的音节都对应有字数相同的单词(后文称为前单词、后单词)时,优先变换出与先输入的音节对应的单词(前单词),然后,自然将前、后单词共用的音节除去之后变换余下的音节。因此,当前面的音节对应多个单词,并且未作出正确选择的情况下,会有下文所示那样的变换差错。
例如,输入“有一千个”,“一”对应的音节与前面的“有”、后面的“千”所对应的音节都有对应的单词。这时,由于前单词和后单词汉字数相同,所以,优先将先输入的“有一”所对应的音节作汉字变换。但是,词典部18中对应于“you3yi4”(对应于“有一”的音节)记录有“有益”,从使用频度出发,“有益”优先于“有一”,因此,优先变换前单词的结果是“有益”,而后面的“qian”(汉字“千”对应的音节)单独成为变换对象。但是,在词典部18中记录有多个对应于该发音的汉字,而且出于使用频度的原因,输出时“牵”先于“千”,从而优先变换成“牵”。结果后单词不作汉字变换,产生完全错误的变换结果“有益牵个”。同样,若要输入“西元一九八八年”,与输入的“九八”相当的注音字母串“jiou3ba1”在词典部18中对应记录有单词“酒(外1)”,(外1)吧因而错误变换成“西元一酒(外1)九年”。此外,在输入“二十时”时,汉字变换装置不会将表示数量的“十”与表示数量单位的“时”作为不同的汉字处理,因而在“十”及“时”相当的注音字母串“Shi2Shi2”处两个音节都变换成“时”,结果错误变换成“二时时”。
而且,这虽不限制汉语文章,但文章中会用到很多数字。因此,在输入汉语文章时,上述那样由数字引起的错误变换发生极多。虽然如此,但不能将数字逐个地记录在词典中。如果这样的话,举一个极端的例子,“西元”和“年号”等也必须逐年全部记录,词典且不用说,汉字变换装置也会变得大型、成本高并且处理速度慢。
本发明有鉴于此,目的在于减少汉语文章作汉字输入时由数字引起的变换差错。
为了实现上述目的,本发明的汉字变换装置包括记录有注音字母串及其对应单词的词典部;根据最长一致法取出作为汉字变换对象的音节的音节取出部;以音节取出部取出的音节作为检索关键词,检索上述词典部,查出由相应汉字构成的单词的词典检索部;当词典检索部查出单词时将取出的音节串变换成汉字的汉字变换部;记录有注音字母串及其对应数量单位字的数量单位字字典;记录有注音字母串及其对应数字的数字字典;数量单位字检出部,对照上述数量单位字字典,检查由上述音节取出部取出成为当前汉字变换对象而在词典中没有相应单词的音节串最后的音节是否为数量单位字的读音;数字检出部,当上述数量单位字检出部查出数量单位字时,接收该通知,并对照上述数字字典,检查该音节串最后音节前的所有音节是否为数字的读音;数量词生成部,当上述数字检出部判定该音节串最后音节前的所有音节都为数字的读音时,接收该通知,将除去最后音节之外的各个数字音节所对应的数字以及最后一音节所对应的数量单位字组合成一体,生成作为汉字变换对象的数量词。
通过上述结构,本发明可实现下列作用。
音节取出部根据最长一致法,从输入的注音字母中取出作为汉字变换对象的音节串。词典检索部以上述音节取出部取出的音节串为检索关键字,对记录有注音字母串及由其对应汉字构成的单词的词典部进行检索,查出由相应汉字构成的单词。数量单位字检出部对照数量单位字字典,检查上述音节取出部取出作为变换对象但在词典中不存在对应单词的音节串最后的音节是否为数量单位字的读音。进而当数量单位字检出部查出数量单位字时,数字输出部检查所取出的音节串除最后音节之外的所有音节是否为数字的读音。如果上述数字检出部判定,由上述音节取出部取出并成为当前变换对象的音节串除最后音节之外都是数字的发音,则数量词生成部将最后音节之外的各音节所对应数字以及最后音节的数量单位字组合在一起,生成作为汉字变换对象的数量词。
图1是本发明的汉字变换装置一个实施例的结构图。
图2是以上述实施例的寄存器初始化部为主的动作流程图。
图3是以上述实施例的变换处理部为主的动作流程图。
图4是上述实施例中数量单位字字典的数据记录情况示意图。
图5是上述实施例中数字字典的数据记录情况示意图。
图6是已有汉字变换装置的结构图。
下面根据实施例说明本发明。
图1是本发明的汉字变换装置一个实施例的结构图。图2、3是该实施例的处理流程图。下面参照


本实施例的结构和作用。
图1中,对与图6所示已有技术装置有相同结构、作用的部分标以相同符号,除了与最长一致法有关的部分之外,原则上省略其详细说明。10是输入部,18是词典部。14是表示所输入注音字母串音节数的NCHAR寄存器。
在汉语中,一个汉字对应一个音节,因此,所输入注音字母串的音节数即为要变换的汉字数。另外,通常多个注音字母表示一个音节,即表示一个汉字,所以本说明书中原则上采用“注音字母串”一词,该词也包括单个注音字母。此外,“音节”一词从前后文可以清楚地理解为有多个音节时,作为“音节串”,但日语中由于没有单、复数的区别,所以这一用词不很严密。汉语的单词有时也由一个汉字构成。因此,有时一个注音字母相当于一个汉语单词。12、13分别是将注音字母串变换成单词时用到的PTR寄存器和NP寄存器。PTR寄存器12存储变换处理起始位置,即输入的注音字母串进行变换处理的开始位置,NP寄存器13存储所输入注音字母串变换成单词时的变换单词长度,即单词构成汉字数,换句话说是音节数。亦即,上述两个寄存器的存储内容分别设定为ptr、np,则从输入的注音字母串第ptr个音节开始的np个连续音节作为汉字变换对象,成为词典检索部17对词典部18作检索时的检索关键词。(下文中,nchar、np、ptr分别表示NCHAR、NP、PTR寄存器所存储的整数值)。11是将NCHAR寄存器14、NP寄存器13、PTR寄存器12的值初始化的寄存器初始化部,图2示出其动作流程。后文将对此作详细说明,其作用大致为,计算所输入注音字母串的音节数,在NCHAR寄存器14中设定该值,同时,若该值大于词典部18中收入的最长单词的汉字数max(本例中设为8),则NP寄存器13中设定上述max值;若该值不大于max,则NP寄存器13中设定所输入注音字母串的音节数,然后将PTR寄存器12的值设为1。15是比较部,不断检查是否(np+ptr)>(nchar+1),若该关系成立,则将NP寄存器13的值减1,同时,使寄存器初始化部11再次将PTR寄存器12的值设定为1。21是数量单位字字典,预先记录(永久存储)数量单位字的读音以及对应的数量单位字。图4大致示出其记录情形。此处所谓的数量单位是图4所示的“个”、“年”、“时”、“只”等,用于表示物体、人和事情等的时间、长度、个数、重量等绝对量和绝对座标位置的单词,也包括“人”、“个”等日语助数词所对应的单词。22是数字字典,存储数字的读音及对应数字,更正确地讲是汉语数字。其记录情形如图5所示。20是数量词检出部,该部对由上述音节取出部取出成为当前变换对象的音节串,判断为词典检索部17对词典部18检索的结果不存在对应单词时,以该音节串最后音节作为检索关键词,检索数量单位字字典21,查核该音节是否为数量单位读音,如果查到对应的数量单位字,则接着对该音节串最后音节前的所有音节,以每一音节为检索关键词,检索数字字典22,查核各音节是否为数字读音。19是数量词生成部,如果上述数量词检出部20判定由上述音节取出部取出成为当前变换对象的音节串除最后音节之外都是数字,则本数量词生成部将最后音节之外的各个音节所对应的数字与最后音节的数量单位字组合,看作为单词,生成作为一个汉字变换对象的数量词。在本例中,由于数字的绝对数量少,上述数量词检出部还兼作数字检出部。16是变换处理部,其动作流程如图3所示,后文将详细说明。变换处理部16从输入的注音字母串第ptr个音节起在连续的np个音节中检查是否有已变换成汉字的音节。如果存在已作变换的音节,则将PTR寄存器12的值增1。如果没有已变换的音节,而且词典部18等中存在应变换的单词和数量词,则将该单词和数量词变换成汉字,同时将ptr加上np。若既无可变换的单词也无可变换的数量词,则仅将ptr加1,不作其它任何变换。17是词典检索部,以上述变换处理部16送来的音节作为检索关键词,从词典部18中取出相应的单词,若词典部18内记录有多个对应单词,则选取记录在前、可能性最高的单词作为候选词,传送给上述变换处理部16。23是输出部,输出上述变换处理部16变换出的结果。
下面根据图2说明寄存器的初始化动作流程。
在S1,将计算音节数的寄存器置零。
在S2,从输入部输入注音字母串。
在S3,检查当前输入的注音字母是否声调键。是,则进至S4。否,则进至S5。
在S4,将计算音节数的寄存器内容增1,返回S2。
在S5,检查当前输入的注音字母是否输入结束键。如果是输入结束键,则进至S6。若否,例如是显示位置的换行操作键等,则返回S2,等待下一注音字母输入。
在S6,判断当前输入的音节数是否大于8。若在7以下,则进至S8,若在8以上,则进至S7。
在S7,将NP寄存器的值设定为8。
在S8,将NP寄存器的值设定为当前输入的音节数。
步骤S7、S8是为优先变换音节数多的单词而进行的。
在S9,将NCHAR寄存器的值设定为当前输入的音节数。
在S10,将PTR寄存器的值设定为1。本步骤是为优先变换先输入的音节而进行的。
下面根据图3,以变换处理部的动作流程为主,说明各部分的作用。
在S11,从注音字母串第ptr个音节开始取出np个连续的音节。
在S12,检查在S11取出的音节中是否有已变换成汉字的音节。如果有,则进至S16,反之则到S13。
在S13,检查词典部是否记录有与S11中取出的音节对应的单词。如果查出对应的单词,则进至S14,反之到S17。
在S14,将输入的注音字母串中从第ptr个音节开始的np个连续音节变换成S13中查出的单词(包括一个汉字)后,进至S15。
在S15,将PTR寄存器的值加np。这是为了将已变换成汉字的np个音节之后输入的音节作为下一汉字变换对象。
在S16,将PTR寄存器的值加1。
在S17,检查NP寄存器的当前值是否大于1。在大于1时进至S18,若为1,则至S16。
在S18,检查S11中取出的音节中最后的音节是否为数量单位字的读音。如果是,进至S19,如果不是,至S16。
在S19,检查在S11取出的音节中前np-1个音节是否都为数字的读音。如果都是数字的读音,则到S20。若否,则至S16。
在S20,将前np-1个音节所对应的数字与最后音节所对应的数量单位字组合,看作为单词,生成作为一个汉字变换对象的数量词。然后,将所输入音节中第ptr个音节开始的np个连续音节变换成相当于该数量词的汉字和汉数字。再进至S15。
在S21,判断(np+ptr)是否大于(nchar+1)。如果是,则进至S22。若否,则至S11。
在S22,将NP寄存器的值减1,将PTR寄存器的值设定为1,然后进至S23。这样,从输入音节串的前端开始,以音节数减少一个的单词作为变换对象,重新开始检索。
在S23,检查NP寄存器的值是否为零。若是零,则所输入音节已全部变换成汉字,在此结束汉字变换处理。若不是零,则至S11。
下面,根据音节字母输入串“Wo3men5er4shi2shi2zai4jian4”,说明上述结构的本实施例汉字变换装置的具体动作。
首先,为了方便理解,将词典部中对应该输入串的单词示出如下“Wo3men5我们”“Shi2Shi2时时”“Shi2zai4实在”“zai4jian4再见”如图2所示,输入上述注音字母串(S2)后,寄存器初始化部依据输入键,就每一音节划分声调符号,再求出音节数(S3-S5)。上述输入串有7个音节,因而作为音节数,NCHAR寄存器置7(S9),同时,由于该值小于词典部中记录的最长单词(如前所述,构词汉字数最多)的字母数8(本例的词典部收纳的单词的汉字数最多为8)(S6),将NP寄存器的初始值设为7(S8),并且将PTR寄存器设为1(S10)。NP寄存器在此的作用是存储作为当前汉字变换对象单词的汉字数。另外,PTR寄存器的值ptr表示作为当前词典检索对象的注音字母串最前端的位置是上述输入注音字母的第ptr个音节。这时,由于最初设定为1,所以从输入的注音字母串最前端的位置开始,检索词典部是否记录有构成音节为7个的单词,即以所输入的全部音节为检索对象。
根据输入的音节数设定PTR寄存器、NP寄存器、NCHAR寄存器的初始值之后,如图3所示,由变换处理部首先根据PTR寄存器和NP寄存器的值,从输入部送来的注音字母串中取出第1至第7个连续的音节串“Wo3men5er4shi2shi2zai4jian4”(S11),进而检查有无已变换的音节(S12)。在此情况下,输入的全部音节当然都未作汉字变换,因此,将这些音节作为检索关键词送至词典检索部,对词典部进行检索(S13)。由于不存在与此对应的单词,并且当前NP寄存器的值大于1(S17),所以检查最后的音节是否为数量单位字的读音(S18)。若判定最后的音节不是数量单位字的读音,则应该将作为变换对象的音节串朝后移动一个音节,并只将PTR寄存器的值增加1,不作变换处理(S16)。这时,比较部判定(np+ptr)的值大于(nchar+1)的值(S21),结果判定后面不能取出输入的音节串来变换音节数为7的单词。因此,将变换对象的音节数定为6后,最初输入音节串中应作检索的NP寄存器值减1,成为6,同时将PTR寄存器的值再次设定为1(S22)。NP寄存器的值当然不是O(S23),所以取出后面6个连续的音节,开始作为汉字变换处理。
根据PTR寄存器的新值和NP寄存器的值依次取出的“Wo3men5er4shi2shi2zai4”、“men5er4shi2shi2zai4jian4”(S11)也是未作变换的音节(S12),但词典部内没有对应的单词(S13),并且最后的音节也不是数量单位字的读音(S18),因而不作变换处理。只是将PTR寄存器的值增1(S16)。结果,在处理“men5er4shi2shi2zai4jian4”时,PTR寄存器的值为3,比较部判定(np+ptr)>(nchar+1)(S21)。因此,判定不能取出长度为6的单词,将NP寄存器的值减1,成为5。又将PTR寄存器的值设定为1(S22)。这样就以音节数为5的单词作为汉字变换的对象,开始进行处理。
NP寄存器的值为5时,根据PTR寄存器和NP寄存器的值从输入的注音字母串中首次取出的音节串“Wo3men5er4shi2shi2”(S11)都未作变换(S12),因此以此为检索关键词,查找词典部。其中未记录与此对应的单词(S13)。但最后的音节“shi2”是记录在数量单位字字典中的数量单位字读音(S18)。因此,接着检查前面的4个音节“Wo3”、“men5”、“er4”、“shi2”是否都是记录在数字字典中的数字读音。这时,在前的“Wo3”、“men5”不是数字的读音,因而不生成数量词和作汉字变换,仅将PTR寄存器的值增1(S16)。这时,比较部判定(np+ptr)小于(nchar+1)(S30),因而PTR寄存器加1,并根据该新的值,取出后输入的音节数为5的注音字母串“men5er4shi2shi2zai4”(S11)。该注音字母串还未作变换(S12),因此以此为检索键,检索词典部。该部不存在对应单词(S13),而最后的音节不是数量单位字的读音(S18),所以不作变换处理。仅仅将PTR寄存器的值增1(S16)。这样就取出“er4shi2shi2zai4jian4”。但是,这一情况下与前面的音节串结果相同,PTR寄存器的值也增加1。这时,比较部判定(np+ptr)>(nchar+1)(S21),从而判定后面不能取出变换音节数为5的单词所用的音节串,所以将NP寄存器的值减1,成为4。又将PTR寄存器的值再次设定为1(S22)。当然,在此情况下,NP寄存器的值不是0(S23),可继续取出后面的连续音节,作变换处理。
NP寄存器的值变成4时,根据PTR寄存器和NP寄存器的值从输入的注音字母串中先取出的连续音节串“Wo3men5er4shi2”以及后取出的音节串“men5er4shi2shi2”(S11)全部音节都未作变换(S12),因而以此为检索关键词,检索词典部(S13),但其中未记录相应的单词,而最后的音节“shi2”是记录在数量单位字字典中的数量单位字读音(S18),“Wo3”、“men5”却不是数字的读音,所以与前面的音节串一样,不作汉字变换处理。因此,重复PTR寄存器的值增1的动作(S16)。然后,同样地按照输入顺序取出“er4shi2shi2zai4”和“shi2shi2zai4jian4”=连续音节串(S11)。这些音节串都未作汉字变换(S12),但词典部内没有对应的单词(S13),并且最后的音节不是数量单位字的读音(S18),因而不作任何变换处理,只是将PTR寄存器的值依次增加1(S16)。在处理“shi2shi2zai4jian4”时,PTR寄存器的值成为5,比较部判定(np+ptr)大于(nchar+1)(S21)。因此,判定后面不能取得用于4音节单词汉字变换的音节串,并将NP寄存器的值减1,成为3。而且PTR寄存器的值再次设定为1(S22)。接着取出3个连续的音节,开始作汉字变换处理。
NP寄存器的值为3,PTR寄存器的值为1时,首先取出连续的音节串“Wo3men5er4”(S11)。该串全未作汉字变换(S12),在词典部内也没有对应的单词(S13),并且最后的音节不是数量单位字的读音(S18),所以不作变换处理。仅仅将PTR寄存器的值增1,变成2(S12)。接着,取出滞后一音节输入的音节串“men5er4shi2”(S11)。该串都未作变换(S12),在词典部内又没有对应的单词(S13),并且最后的音节“shi2”是数量单位字字典中记录的数量单位字读音(S18),但“men5”不是数字的读音。因此,与前面的音节串一样,不作变换处理,仅仅将PTR寄存器的值增大1(S16)。然后取出再滞后一音节输入的音节串“er4shi2shi2”(S11)。该串全部音节都未作汉字变换(S12),词典部内无对应单词(S13),并且最后的音节“shi2”是记录在数量单位字字典中的数量单位字读音(S18)。因此,检查“er”、“shi2”是否为数字字典中记录的数字读音。这时,“er4”、“shi2”都是数字字典中记录的数字读音。因此,将第一个音节“er4”及第二个音节“shi2”所对应的数字“二”、“十”与第三个音节“shi2”对应的数量单位字“时”组合,成一个数量词“二十时”,从而将注音字母串“er4shi2shi2”变换成所生成的数量词“二十时”(S20)。接着,将PTR寄存器的值加上变换成汉字的音节数3,变成6(S15)。比较部判定(np+ptr)大于(nchar+1)(S21),从而判定已经完成音节数为3的单词的汉字变换。因此,将NP寄存器的值减1,以音节数为2的单词作为处理对象。而且PTR寄存器的值再度设定为1(S22)。然后,用最长一致法进行同样的汉字处理。
NP寄存器的值为2,PTR寄存器的值为1时,先取出两个连续音节“Wo3men5”(S11),各个音节尚未作汉字变换(S12),而且词典部内有对应的单词“我们”,所以将其变换成汉字“我们”,并在PTR寄存器的值1上加NP寄存器的值2,成为3(S15)。接着,取出后面输入的连续音节串“er4shi2”、“shi2shi2”、“shi2zai4”(S11)。这些音节串都包含有已变换成汉字的音节(S12),所以不作任何处理。但PTR寄存器的值逐次增1,最后达到6。这时,取出连续音节串“zai4jian4”(S11),其所有音节都未作汉字变换(S12),而且词典部内记录有对应的单词“再见”,所以将“zai4jian4”变换成汉字“再见”,并将PTR寄存器的值6再加上NP寄存器的值2,成为8(S15)。比较部判定(np+ptr)大于(nchar+1)(S21),不能处理音节数为2的单词变换。然后将NP寄存器的值减1,成为1。而PTR寄存器的值再度设定为1(S22)。这时,NP寄存器的值不是0(S23),开始处理音节数为1的单词的汉字变换。
然而,NP寄存器的值成为1时,所取出的音节都已变换成汉字,因而不管PTR寄存器的值为多少,不作任何处理。最后,比较部判定(np+ptr)大于(nchar+1)(S30),将NP寄存器的值减1,成为0。变换处理部从而判定所输入的音节串已完成汉字变换处理,然后向输出部传送变换结果“我们二十时再见”。
以上根据实施例对本发明作了说明,但本发明不限于上述实施例,在不改变其要旨的情况下,当然可以作适当变形后实施。例如①不必如图2所示那样,在输入结束键按下之后才开始将输入的注音字母串变换成汉字,在声调键按下之后,即每输入一个音节,就从上一次输入的注音字母串结束位置起变换当前输入的注音字母串。这种情况下结果不变。
②数量单位字及汉语数字不是单独地存储在数量单位字字典和数字字典中,而是用不同的标志分别表示,然后一起记录在词典部中。数量单位检出部和数字检出部进而根据各个标志进行检出。
③在汉语数字中,比“亿”大的单位“兆”、“京”等和数量单位字“振”、“里”等很少使用。因此,附加一种功能,由文章输入者根据作为输入对象的汉语文章的具体情况,选择是否将这些词作为本发明的作用对象。
④也可以采用其它的装置来使用最长一致法。另外,数字检出部的作用也可以构造成一旦发现有一个字不是数字的发音,就中止后续的检出作业。
如上所述,根据本发明,用最长一致法将输入的音节串变换成汉语文字时,若作为变换对象的音节串最后的音节是数量单位字,并且其余音节均为数字的读音,则将对应的汉语数字及数量单位字组合成一个较大变换单位的数量词后,看作为单词,一起变换成汉字,而且优先于较短的单词作汉字变换。因此,在“有一千个”之类的文章中,由于未能适当地分开处理数量词“一千个”而产生的变换差错可消除,汉字变换的正确率得以提高。
权利要求
1.一种汉字变换装置,包括记录有注音字母串及其对应单词的词典部;根据最长一致法取出作为汉字变换对象的音节的音节取出部;以音节取出部取出的音节作为检索关键词,检索上述词典部,查出由相应汉字构成的单词的词典检索部;当词典检索部查出单词时将取出的音节串变换成汉字的汉字变换部;其特征在于,还包括记录有注音字母串及其对应数量单位字的数量单位字字典;记录有注音字母串及其对应数字的数字字典;数量单位字检出部,对照上述数量单位字字典,检查由上述音节取出部取出进而为当前汉字变换对象而在词典中没有相应单词的音节串最后的音节是否为数量单位字的读音;数字检出部,当上述数量单位字检出部查出数量单位字时,接收该通知,对照上述数字字典,检查该音节串取后音节前的所有音节是否为数字的读音;数量词生成部,当上述数字检出部判定该音节串最后音节前的所用音节都为数字的读音时,接收该通知,将除去最后音节之外的各个数字音节所对应的汉语数字以及最后音节所对应的数量单位字组合成一体,生成作为汉字变换对象的数量词。
全文摘要
本发明的汉字变换装置,由音节取出部按最长一致法从输入注音字母串未作汉字变换的音节中取出变换对象。词典检索部以此为检索关键词,检索词典部有无对应单词。若无,则数量单位字检出部检查音节串最后音节是否为数量单位字的读音。如果是,则数字检出部检查该音节前的所有音节是否为数字的读音。如果是,则数量词生成部将对应的数字及数量单位字组合成一数量词,再由变换处理部作汉字变换。
文档编号G06F3/023GK1096601SQ9311433
公开日1994年12月21日 申请日期1993年11月6日 优先权日1993年6月15日
发明者周峻慧, 谢用勋, 林启轩 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1