汉字变换装置的制作方法

文档序号:6406771阅读:169来源:国知局
专利名称:汉字变换装置的制作方法
技术领域
本发明涉及汉字变换装置,尤其涉及单词的登记。
汉字变换装置的基本辞书一般存储有3万2千个左右日常使用的单词。
所存储的3万2千个单词中,两个字的单词最多,有2万5千个,约占79%,其次是3个字的单词,3千个左右,约占10%,然后是4个字的单词,约有3千个,占9%强,5个字到7个字的单词约占0.5%。
但是,这3万2千左右的单词都是日常用语,辞书中没有登记“张家华”、“李大年”之类名字、下记外1、外2中所示的新词语以及“涨停板”、“融资”之类专业名词和“松下电器产业株式会社”这样的特定词语。
外1飆車外2薯條作为使用者能自由登记上述未登记单词的功能,例如有在已往的汉字变换装置中在台湾的计算机市场占有率最高的倚天中文系统的辞书登记功能。
图9示出已有的汉字变换装置的辞书登记功能单元的框图。
33是辞书单元,存储预先确定的单词和由使用者登记的登记单词。
31是索引码设定单元,接收由使用者输入的字符串或记号,将该字符串或记号设定为索引码,它对应于通过图中未示出的指定单元所指定的欲作登记的单词。
32是单词登记单元,将通过未示出的指定单元所指定的欲作登记的单词和由上述索引码设定单元所设定的索引码对应,登记在辞书单元33中。
34是输入单元,接收由使用者输入的索引码。
35是检索单元,将从输入单元输入的索引码分开输出到顺序检索单元36。
36是顺序检索单元,根据索引码依次检索辞书单元33,将对应的登记单词输出到输出单元。
37是输出单元,输出变换结果。
以下说明上述已有汉字变换装置的单词登记功能单元的动作。
在辞书中登记单词的情况是,首先由使用者利用图中未示出的指定单元进行登记单词的指示。其次索引码设定单元31接收由使用者输入的对应于该指定单词的字符串或记号,将其作为索引码加以设定。单词登记单元32将上述被指定要作登记的单词与索引码对应,如

图10所示的那样,以顺序方式,在辞书33进行单词登记的特定文件中,在左面一栏内存储一定长度的索引码,右面一栏内存储对应于索引码的登记单词。这样完成了单词的登记。
在进行上述已登记单词的变换的情况下,由使用者从输入单元34输入对应于欲作变换的单词的索引码,该索引码被读入后通过检索单元35输出到顺序检索单元36。顺序检索单元36根据索引码,按顺序检索存储在辞书33作单词登记的特定文件中的登记单词,检出对应于索引码的登记单词,将该单词输出到输出单元37。
另外,在从辞书33中删除已登记的单词的情况下,由使用者作出删除指令,输入对应于要删除的单词的索引码,索引码通过检索单元35输出到顺序检索单元36。顺序检索单元36根据索引码,按顺序检索对应于索引码的单词,将该单词从辞书中删去。
此外,登记上述单词的特定文件的存储内容是在使中文系统起动时被读入的。
但是,上述汉字变换装置的单词登记功能有下列问题。
(1)过去,由使用者决定并使用所希望的编码,因此,即使在登记相同单词的情况下,索引码也因人而异,所以无法进行在线登记,缺乏使用上的灵活性。
(2)当使用已作登记的单词时,使用者必须记住已登记单词的索引码,因此,对使用者来说不方便,不能随心使用。
(3)已登记的单词作变换时,是以顺序方式进行检索的,即按顺序检索辞书中登记的单词,检出对应于索引码的单词,因此,登记单词越增加,则检索的响应时间也越复长,操作性能越降低。
(4)至于单词的登记以及已登记单词的删除,因为在登记文件中存储单词以及对登记有单词的文件的检索是以顺序方式进行的,所以,单词的登记及删除很花费时间,登记单词越增加,则效率将变得非常低。
鉴于上述问题,本发明目的在于提供一种汉字变换装置,使用者不必记住已登记的单词的索引码,并且,能够高效率地进行已登记单词的变换、单词的登记、已登记单词从文件中的删除。
为了解决上述问题,本发明的将单词的索引码变换成汉字的汉字变换装置包括登记使用者所要的单词的学习辞书;辞书整理装置,根据使用上述索引码的特定函数所计算出的值,对上述学习辞书进行单词的登记及删除;变换装置,根据使用上述索引码的特定函数所计算出的值,检索上述学习辞书中登记的单词,变换成对应于索引码的汉字。
在本发明的将单词索引码变换成汉字的汉字变换装置中,学习辞书用来登记使用者所要的单词。辞书整理装置根据使用了上述索引码的特定函数所计算出的数值,对学习辞书进行单词的登记和删除。变换装置根据使用了上述索引码的特定函数所计算出的数值,检索上述学习辞书中登记的单词,将索引码变换成汉字。
图1是显示本发明一个实施例的汉字变换装置的方框图。
图2是显示本发明汉字变换装置的处理过程的流程图。
图3是显示本发明汉字变换装置的处理过程的流程图。
图4是显示索引码处理单元的动作的流程图。
图5是显示汉语发声记号的编码顺序。
图6是显示本发明实施例的汉语发声记号的编码的说明图。
图7说明本发明的该实施例的学习辞书的结构及依据索引码检出对应方框的位置。
图8是说明本发明的该实施例的学习辞书的登记状态的说明图。
图9是显示已有汉字变换装置的结构的框图。
图10显示已有实例的辞书结构。
图1是本发明的汉字变换装置一个实施例的方框图。
图1中,11是输入单元,接收由使用者输入的任意长度的发音记号(检索记号)。
12是索引码处理单元,将由使用者输入的发音记号转换成用于基本辞书的检索及原文所述的散列运算中的索引码。
15是基本辞书,存储预先确定的单词。
17是学习辞书,存储由使用者登记的单词。
学习辞书17的细节如图7所示,它由多个具有固定长度的相关存储块信息栏171、可利用空间信息栏172、登记单词索引码栏173以及对应字符串编码栏174构成,其中分别存储下列信息。
即,相关存储块信息栏171中存储了在用于登记单词的可利用空间不足时接着存储单词的存储块的地址。
可利用空间信息栏172中存储有可利用空间信息,显示上述可利用空间尚有多少字节余下。
登记单词索引码栏173、对应字符串编码栏174中分别存储已登记单词的索引码、对应于该索引码的字符串编码。
14是检索单元,根据索引码对基本辞书15进行检索,并依据由后文所述的散列函数在索引码基础上推导出的存储块的地址对学习辞书17进行检索。
13是变换单元,根据使用者对变换范围的指定,给出变换范围的索引码,根据上述检索单元14的检索结果,将变换范围的索引码变换成相应的字符串。
20是存储单元,存储在向汉字变换、登记单词以及从学习辞书中删除已登记单词的时候,用于运算出存储有单词的存储块的地址的数据以及用于检索的数据。
19是变换修正单元,按照变换修正键的指定,修正变换结果。
16是辞书整理单元,根据由后文所述的散列函数在索引码基础上推导出的学习辞书17中的存储块地址,进行单词的登记、从学习辞书中将已登记单词删除和进行辞书的重新组织。
18是输出单元,输出变换结果以及修正结果。
这里,在进行汉字变换装置的动作说明之前,先参照图4~6说明上述索引码处理单元12的动作。
汉语的读法由声母、介母、韵母以及声调的组合表示,有效的读法约有一千三百种。如要将表示这些读法的发音记号编码化,则表示每一读法必需2个字节。
例如,如图6所示,将各个汉语的发音记号的声母及介母一起放在一个字节中,将韵母及声调放在另一字节中,分别配置成ASCⅡ字符表。这样,全部读法可以用由图6(a)与(b)的组合所构成的2个字节的编码表示,该编码就是上述索引码。
在将输入的发音记号变换成上述那样的索引码时,采用图5所示对汉语发音记号分别给出的顺序值,如图4所示那样,进行简单的判断以及计算,从而进行上述转换处理。
首先,将索引码的第一、第二个字节的数值字1、2置为零(S101)。接着,判断已输入的发音记号中是否有声母(S102),如果有声母,则进行字节1+21H的运算,将得到的数值作为字节1(S105)。根据图5(a)所示的声母编码顺序,取出该声母的对应数值(S106),乘以4,与在步骤S35中得到的字节1相加,再将这次得到的数值作为字节1(S107)。接着,根据图5(b)所示的介母编码顺序,取出该介母的对应数值(S104),加上在步骤S37中得到的字节1,得到最终的第一字节的数值(S108)。
另外,在S102中,输入的发音词中没有声母时,首先进行字节1+75H的运算,将该值作为字节1(S103),接着,进行S104、S108的处理,求出最终的第一字节的数值。
一旦得到第一字节的数值,就接着进行求出第2个字节的数值的处理。
首先,判断输入的发音词中有无韵母(S109),如果有韵母,则进行字节2+26H的运算,将所得到的值作为字节2(S112)。如图5所示,根据韵母码的顺序,取出该韵母的对应值(S113),在该韵母的对应值上乘5,与步骤S112中得到的字节2相加,再将这次得到的值作为字节2(S114)。接着,根据图5所示的声调码顺序,取出该声调的对应值(S111),加上在S114中得到的字节2,就得到了最终的第2字节值(S115)。
最后,从图6所示的ASCⅡ字符表中检索出分别对应于第1和第2字节值的编码,将检索到的编码组合起来作为索引码输出(S116)。
另外,在S109中,如果所输入的发声记号中没有韵母,则首先进行字节2+21H的运算,将该值作为字节2(S110),接着,进行S111、S115的处理,输出索引码(S116)。
另外,在上述说明以及图4的流程中,为了区别10进制和16进制的数字,在16进制的数字之后附加了H。
下文参照附图对上述结构的汉字变换装置的动作进行说明。
首先,叙述汉字变换动作。
发声记号由使用者从输入单元11输入后(S1、S2),存储在存储单元20中。接着,判数该发声记号是否完整(S23)。汉语文字的发声记号中,有“韵母、声调”、“介母、韵母、声调”、“声母、韵母、声调”、“声母、介母、韵母、声调”、“声母、声调”等5种。如果输入的发音记号采取了这5种形式中的任何一种,就判定发音记号为完整。另外,一旦声调输入后,就等于一个文字的读音已输入完毕。
如在S23判定为完整,则按照上述顺序,在索引码处理单元12中将存储单元10中存储的发声记号转换为对应的索引码(S24)。变换后的索引码存储在存储单元20中。
接着,如果使用者指定了要作变换的读音范围,则从索引码中取出对应于该变换范围的索引码(S25),将取出的索引码传给检索单元14,进行检索动作。
首先,检索单元14以传来的索引码为检索关键词,分阶段地以对分检索方式检索基本辞书15(S26)。接着,对学习辞书17进行下述检索。
即,首先从存储单元20读出所存储的索引码(S27),利用读出的索引码,示出学习辞书中对应于读音的存储块位置,为此,进行以下的散列函数运算(S28)。
本实施例的散列函数的运算方法基于索引码串的前三个编码的ASCⅡ值。
例如,学习辞书17中对应于索引码串(a1,a2、a3、a4……)的存储块位置H1(X)可从下式得到。
H1(X)=(a1*b3+a2*b2+a3*b1)modN
这儿,b是特定的整数,N是预先设定的基本的存储块数。mod是求出除法余数的算符。
将依据上述散列函数求出的值作为学习辞书17的对应存储块地址,读取该存储块(S29)。将读出的存储块内容存在存储单元20中(S30)。接着,检查在该存储块的索引码栏173和对应字符串栏174中有无数据(S31)。在没有数据情况下,判定为空存储块,根据相关存储块信息栏171中存储的相关存储块地址,读出下一相关存储块(S34)。在不是空存储块时,根据S33,与存储在该存储块中的所有索引码,依次进行比较(S32),如有相一致的索引码(S33),根据S36将对应字符串给与变换单元,显示于输出单元18。找不到相应单词时(S33),根据相关存储块信息栏171的相关存储块的地址读出下一个关连存储块。检查在S34中读出的相关存储块的地址,如果是零,则判定该存储块是最后的存储块,输出不存在相应单词的信息(S36)。
如果不是最后的相关存储块,则或检出相应单词或输出相应单词未发现的信息,重复S29到S35的处理。
另外,在进行变换结果的修正的时候,首先,当使用者输入变换修正的指示(S1~S3)后,变换修正单元19输出其它的变化候选项(S4)。使用者从输出的变换结果中选择变化候选项后,变换修正单元19进行变换结果的修正,并输出。
接着,说明对学习辞书17进行登记、删除等辞书再编辑时的动作。
首先,在登记单词时,由使用者指定登记的单词(S1~S3)后,辞书整理单元16读取该单词的索引码(S7),对上述索引码进行散列函数的运算(58),求出登记该单词的对应存储块的地址。
散列函数的运算方法和上面相同。根据从散列函数的运算结果得出的地址读对应的存储块(S9),检查在存储块中登记该单词的空间,即可利用空间是否足够(S11),在可利用空间足够时,再判断独立空间是否足够(S13)。
例如,如图8(a)那样,独立空间足以存储8个字节时,在第一个空着的空间中存储单词(S15)。
另一方面,利用空间是足够的,但可利用空间是由散置的独立空间组成的,因而就这样是不能登记新单词的情况下,例如,在要登记8个字节的单词时,如图8(b)所示,存储块中还残存10个字节的空间,但是该10个字节的空间不是连读的,而是以分别为6个和4个字节的两个独立空间的形式存在时,按下文那样进行登记。
亦即,辞书整理单元16将已登记的单词移向较低的地址,使独立的空间连接起来,形成10个字节的空间(S14),然后将单词登记在该空间中(S15)。
另外,在得到的上述存储块中没有可利用空间时,如图8(c)所示,辞书整理单元16形成新的存储块,即相关存储块,它具有依据下述H2(X)函数计算出的地址值。
H2(X)=M增量1这儿,M是变量,是现有存储块的总数,作为当前最高的存储块位置。M的初始值是N-1。
该相关存储块的地址值存储在相关存储块信息栏171中。接着,利用步骤S15,在该相关存储块中存储新单词,结束单词的登记。
在删除学习辞书17中已登记的单词时,由使用者指定要删除的单词后,辞书整理单元16就读出所指定范围的索引码(S7)。通过与上面相同的散列函数运算,求出对应于索引码的对应存储块的地址值,读出对应存储块的内容(S10)。检索在读出的对应存储块中是否有要删除的单词(S16)。在找到该单词后(S17),开放该存储空间,从学习辞书中删去已登记的单词(S18)。当没有该单词时(S17),判断有无相关存储块(S19),如果没有,则在输出单元输出未登记该单<claim>1、一种花格网夹持框的改良装置,其特征在于,该改良装置包含一截成预定长度的基础框可卡接一组卡掣框或一组卡掣平板,乃借彼此枢接成几何形的基础框体可固定于建筑物的窗口以及花格网面可嵌接于卡掣框上以及栏杆组件可固定于卡掣平板上,其中基础框的断面略呈
型,其具有向外开口的卡凹槽,卡掣框的断面略呈
型,其具有向外开口的凹槽及外侧边具有不规则曲弧边,底部向外延伸二凸缘边以可卡掣入基础框的卡凹槽中,一卡掣平板其断面略呈
型亦可卡掣入基础框的卡凹槽中。</claim><claim>2、如权利要求1所述的花格网夹持框的改良装置,其特征在于,当卡掣框欲嵌接具有加宽片体的花格网时,其断面呈
型。</claim><p>如上所述,索引码处理单元12参照图5的顺序值,按下文那样将发声记号变换处理成索引码。
外12厂即,外12所示声母为声母顺序中的第10个,因为没有介母,故而为介母顺序的第0个,因此,索引码的第1字节如下21H+10*4+0=49H49H相当于ASCⅡ码的“I”。
外13ㄞ此外,外13所示韵母是韵母顺序中的第4个,外14
外14中所示声调是声调顺序中的第2个,因此,索引码的第2字节如下26H+4*5+2=3cH3cH相当于ASCⅡ码的“<”。
根据上述结果,发声记号(外3)的索引码为“I<”。
经过相同的处理后,上述发声记号(外3)~(外11)变换成索引码“I<aN%=〕NVC〕EOW?53”(S24)。
由使用者指定变换范围后,变换单元13确定变换范围(S25),检索单元14根据该索引码检索基本辞书(S26),接着,根据如上述那样用散列函数算出的存储块位置,进行学习辞书的检索。
这儿,假定基本辞书中登记了“(外5)(外6)派兵”、“(外7)(外8)进攻”、“(外9)(外10)(外11)科威特”等3个单词,而人名单词“(外3)(外4)海珊”在基本辞书和学习辞书中都没有登记。
这种情况下,由检索单元14从基本辞书15中检出上述已登记的3个单词(S26),因为(外3)和(外4)的对应单词未登记,所以,对于在S25给出的读音(外3)、(外4)输出同音异意字的第1候选字“海”、“山”。
这样,变换结果成为“海山派兵进攻科威特”,显示单元18将变换结果输出。
但是,这儿是要变换成“海珊派兵进攻科威特”,因此,为了修正误变换“山”,由使用者输入变换修正的指示后,作为发声记号的同音异意字而输出山、衫、扇、杉、珊、删以及下述外15、外16中所示的汉字。
外15搧外16舢使用者从这些同音异意字中选出需要的字“珊”,变换结果得到修正,从输出单元18输出正确变换结果“海珊派兵进攻科威特”。
这种时候,如果通过辞书整理单元16在学习辞书17中登记下单词“海珊”,就能避免以后的误变换。
首先,在进行登记的情况下,将要登记的单词的发声记号变换成相对应的正确的字符串,开始登记。
要登记的单词的范围由使用者指定后,辞书整理单元16读出所指定范围的索引码(S7),将该索引码存在存储单元20中。接着,进行散列函数的运算,得出存储单元20中所存储的索引码的对应存储块位置(S8)。
具体的计算采用存储单元20中所存储的索引码“I<aN”中的前3个编码(I是73,<是60,a是97),另外,假定N为64,b为17,各存储块的存储空间为1024K字节,则计算如下H1(X)=(73*173+60*172+97*17)mod 64
=37>638mod64=38这儿,假定根据上述散列函数的运算结果而得出的存储块位置38的存储块如图8(c)所示,只有4个字节的可利用空间,不能登记8个字节的单词,那么,辞书整理单元16如下述那样,通过H2(X)函数求出相关存储块的位置。
H2(X)=64算出的地址值存储在相关存储块信息栏171中。接着,将新的单词登记在存储块位置为64的相关存储块中(S15)。
在学习辞书17中登记“(外3)(外4)海珊”之后,如再次输入上述发声记号,则在检索完基本辞书15之后,如上述在利用散列函数的检索方法下检索学习辞书17,输出与(外3)、(外4)对应的“海珊”。
这样,不必对输出结果进行修正,而能正确地变换出“海珊派兵进攻科威特”。
本发明不局限于上述实施例,在不改变要点的范围内可以以变化的形式实施。
例如,输入的记号不限于发声记号,也可以用简易仓颉记号。
另外,输入记号的索引码的转换规则也无限制,也可以将各个汉字读音的声母及声调一起放在一个字节中,介母及韵母放在另一字节中,修正索引码处理单元的转换动作。
在本实施例中,利用索引码的3个编码进行多项式3元散列函数运算,但是,也可以将所有的索引码作为散列函数的运算对象。上述方法都属于本发明。
如上所述,根据本发明,汉字变换装置通过设置变换装置、辞书整理装置来确定登记单词所对应的索引码,因此,使用者不必记忆各个索引码,并且能进行在线登记。
另外,因为是从索引码计算出已登记单词的登记位置,从而进行检索,所以,检索的响应时间缩短,变换效率提高。
根据上述情况,本发明的装置起到了对汉语、日语等的汉字变换,其操作性极好的效果。
权利要求
1.一种汉字变换装置,将单词的索引码变换成汉字,其特征在于,它包括登记使用者所需要的单词的学习辞书,辞书整理装置,根据使用上述索引码的特定函数所算出的数值,对上述学习辞书进行单词登记和删除,变换装置,根据使用上述索引码的特定函数所算出的数值,检索登记在上述学习辞书中的单词,变换成对应于索引码的汉字。
全文摘要
本发明提供一种汉字变换装置,使用者不必记住已登记单词的索引码,而且能高效地进行已登记单词的变换、单词的登记、单词文件中已登记单词的删除。在该装置中,辞书整理单元16在对可登记使用者所需单词的学习辞书17进行单词登记、辞书中已登记单词的删除的时候,运算用到索引码的特定函数,能高速地得出学习辞书17中对应于所需单词的索引码的存储块。检索单元14也利用上述得到相应存储块的方法检索该存储块中的单词,变换出学习辞书14中登记的与读音对应的汉字。
文档编号G06F17/21GK1082738SQ9211418
公开日1994年2月23日 申请日期1992年11月30日 优先权日1992年8月5日
发明者罗进财, 林启轩, 张家华 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1