国际音标方案、华语工具书编排与小键盘单拼输入法的制作方法

文档序号:2617245阅读:603来源:国知局
专利名称:国际音标方案、华语工具书编排与小键盘单拼输入法的制作方法
技术领域
本发明涉及一种国际音标和华语音标的方案,华语工具书的现代化编排法,华文方块字的小键盘单拼输入法及小键盘智能拼音文字。
背景技术
华语拼音文字中引用的非华语语词,其拼写需要还原为原拉丁字母形式,必要时应当以音标标出读音。目前英语等国际流行语言较常用的注音系统有IPA,KK,Webster及Oxford等。现有的注音系统都存在许多不能用通用英文键盘直接输入的字母和符号,给全世界的使用者带来了不便。
因而不论是中国,还是国际社会,都迫切需要能用英语通用键盘直接输入,符合现行国际语言拼写规范的国际音标。由于英语等语言的发音与拼写的对应并不规律,也同时需要一种能将国际流行语言转化为国际音标的音标文字。
在华人中有许多成年人没有条件或机会学习外语和国际音标,但有时必须读出某些外语单词,现行的音标和拼音方案都不能满足这种要求。
原有的华语字典或词典都是以“字头”开始,以方块字的“单字”为核心,繁杂的文字体系、释义方式和编排方式等导致了文字使用效率低下,不能与华语和外语的拼音文字接轨,非华裔人士把华文方块字视若“天书”,与华语工具书的编排不科学,不能与其他国际流行语言工具书接轨有直接关系。语言工具书应当以科学的体系规范人们的语言行为,而现时的华语工具书本末倒置,往往把社会上已经产生的各种不科学、不规范的语言现象全部罗列出来。
随着手机等产品的普及,小键盘输入与人们的生活越来越紧密,但现行小键盘输入法(如使用较多的T9、iTAP、eZi等)的输入速度适应不了快速的现代生活节奏。现行小键盘输入法分作笔画和拼音两大类,笔画输入法难记,拼音输入法通常为全拼加联想模式,都需要按一大串的按键和繁琐的选择过程才能输入一个字,输入速度都比较慢。
手机输入短信所面临的另一个问题是,不管是字音还是字形的中文输入法,学起来都很复杂,目前在中国不懂或不愿学任何中文输入法的手机用户仍然占绝大部分。如何开发这一部分市场,是各家手机厂商争相研究而未解决的课题。

发明内容
本发明提供一种龚氏国际音标,所用音标字母不超出通用英语键盘的26个字母的范围。为了使字母的负荷量较为均衡,26个英文字母在方案中全部用上。所有的音标之间不会产生混淆或误读。龚氏国际音标既可用于英语等单词的读音标注,又可在仍然使用26个字母的前提下,使英语等独立形成音形对应完全规律的音标文字,把全篇文章音标化。
龚氏华语音标是一种普及型的简易音标,音标和重读的方式建立在龚氏华语拼音方案的基础上,无须学过外语或国际音标即可拼读外语单词。
龚氏华语工具书编排法(凡例)以“音头”开始,以实质意义上的“词”为核心,以华语拼音代码标注词类,以前后环衬编排索引,词典的主体部分不排入各类冗余信息,将姓氏和人名专用字、简繁体字对应等排入附录。每一单音词音头下的同一词类只对应不易混淆的相关单音词义项,其他则以适当方式分化,或改以复音词方式使用。按照经过科学编排的华语工具书的规范,能自行避免华语字词句在使用中的形音义等方面的各种混淆与重叠,能与华语拼音文字完全对应;一词一音,词音优化,简繁内码一一对应,让使用者科学、理性地使用华文文字;使华语词典等工具书与其他国际流行语言工具书完全接轨;能在华语与其他国际流行语言的双向机器翻译的过程中,使每一华语语句无需借助上下文分析即可得到准确结果。
龚码小键盘单拼输入法使用专用的标调键,充分利用第一键,实现了字字分流、字词分流、词词分流;许多字可一键输出,使首键输入的效率达到极限;平均每字输入1.72键(大键盘单拼输入法平均每字输入1.5键);单字的排列顺序由原来的按字频排列改为按单音节义项频和单音节义项频方向平均值排列;能自选和修改词库,按个人需要屏蔽各类冗余信息;在降低重码率和平均击键次数的同时,通过建立码位与键位字母之间的自然关联,给人们提供一种既规范又简捷、能即学即用、优于目前各种小键盘拼音和部首输入的小键盘快速普及型输入方法。由于龚码单拼的小键盘与大键盘的布局完全对应,因而手机用户使用外接键盘时无须改变输入法。
小键盘智能龚拼是一种具有法律准确度的拼音文字,与国际语言文字完全接轨,无须记忆,使用专用的标调键,基本无重码,可满足广大不愿学中文输入法的用户利用小键盘发送信息的需要。
附表说明表1为龚氏国际音标与IPA,KK,Webster及Oxford等四种常用国际音标的对照。
表2为龚氏华语拼音方案,其中包括与汉语拼音方案的对照。
具体实施例方式
一、龚氏国际音标(GGI)目前英语等国际流行语言较常用的注音系统有IPA,KK,Webster及Oxford等。为了便于表述,以下统一采用IPA在前,龚氏国际音标在后的对照方式。龚氏国际音标的全称是Gugq Guovjx Inqbiauq,简称GGI。英语中用作Gugq Phonetic Symbols。
1.龚氏国际音标所用字母不超出通用英语键盘的26个字母的范围。为了使字母的负荷量较为均衡,26个英文字母在方案中全部用上。所有的音标之间不会产生混淆或误读。
2.当现有音标的字母标识与通用英语键盘字母相符时,字母标识不变,如b,p,ts,dz等。
3.当现有音标的字母标识与通用英语键盘字母不相符时,龚氏国际音标优先采用在音标发音音位图上较接近(参看

图1),或有拼写方式对应的单字母标识形式,如 →[i], →[u], →[a],[t∫]→[q],[∫]→[x]。在音标中,[_]的使用频率比[e/ε]大得多,龚氏国际音标中[_]→[e]。
4.当现有音标的字母标识与通用英语键盘字母不相符,无英语键盘的单个字母对应时,采用不超过三个字母的组合形式,如[_(r)]→[er], →[or],[α(r)]→[ar], →[ei], →[ai], →[eu], →[au], →[ir], →[ur], →[air], →[aur],[ju]→[juu], →[jur]。带冒号的长元音以双写表示,如[i]→[ii], →[oo], →[ee],[α]→[aa],[u]→[uu]。
5.在英语等语言中,“c”、“k”的音标都是[k],因而在其他音标中“c”闲了下来。龚氏国际音标以“c”与其他字母搭配后作为元音[_]→[ac],[Λ]→[oc],[e/ε]→[ec],[e_(r)]→[ecr]。
6.重音有三种方式处理①全标以通用英语键盘上的重音符(stress symbol)标于重读音节之前,次重音不标,如revolution[reve`luuxen]。这种方式适用于语言工具书标注及儿童读物中的音标文字。
②只标不规则的重音。凡重音在倒数第2个音节时不标,其余情况标出,如today用作[te`dei];these用作[dhiiz]。这种方式适用于将音标作为正式文字使用。
7.在词典等工具书中将音标标在斜线号(virgule)之内,如sandwich/`sacnwij/;在文章中或其他使用中注音时将音标标在方括号(square brackets)之内,如father[`faadher]。
8.用龚氏国际音标能把全篇文章音标化,能按拉丁字母排序。音标化时,音标字母的大小写与原文保持一致。将龚氏国际音标作为文字使用时,若单词有多种读音,只按使用较多的方式转换成音标文字。如以下将Martin Luther King的“I Have aDream”的英语文本的部分段落以龚氏国际音标文字、华语方块字和龚氏华语拼音文字对照列出I say to you today,my friends,so even though we face the difficulties of today andtomorrow,I still have a dream.It is a dream deeply rooted in the American dream.I have adream that one day this nation will rise up and live out the true meaning of its creed″Wehold these truths to be self-evident--that all men are created equal.″Ai sei te juu te`dei,mai frendz,seu iiven dheu wii feis dhe`difikeltiz ov te`dei end temoreu,Ai stil hacv e driim.It iz e driim diipli mutid in dhe E`mecriken driim.Ai hacv e driim dhactwocn dei dhis neixen wil raiz ocp end liv aut dhe truu miining ev its kriid″Wii hold dhiiztruuths te bi self-`ecvident--dhact ool mecn a krieitid iikwel.″朋友们,今天我要对你们说,尽管今天和明天困难重重,但我依然怀有一个梦。这个梦深植于美国梦之中。我梦想有一天,这个国家将会奋起,实现其立国信条的真谛“我们认为这些真理不言而喻——人人生而平等。”Pim,jt u iaux duix nm sruoq,jg^jt h mt i sd^kn^,ds u ir^i lg mugx.Zg mugx srenqzrv yAmerican mugx zz^.U mugxshagw ilt,zg gj jh^fenxchw,srqshanx chv lixguov shinxtiauvd zrenqdix″Um ru^zs^zl^biey--Rr^Sregq E Pd.″二、龚氏华语音标(GHI)华语拼音文字中引用的非华语语词,其拼写需要还原为原拉丁字母形式,必要时以音标标出读音。以国际音标拼注非华语语词比较准确,但华人中有许多成年人没有条件或机会学习外语和国际音标,龚氏华语音标可解决这一难题——会华语拼音就会华语音标。
龚氏华语拼音方案见附表2,已由发明人在另案申请的《华语拼音统一方案》中提出。以下举例用IPA音标。
1.在龚氏华语音标中,每一个字母都读“本音”而不是“表音”(即不按华语字母表中的读音),辅音字母中不包括元音成份,如p读作[ph]而不是[pho],s读作[s]而不是 2.为与其他音标有区别,龚氏华语音标标在角括号<>(angle brackets)中。
3.龚氏华语音标中,<er>在其他元音后时,省略为<r>,如<oer>略为<or>,<auer>略为<aur>;其他情况一般不采用省略形式,如 →<ing>,[e/ε]→<e^>,[wei]→<uei>。
4.国际音标与龚氏华语音标的对应只是近似读音;为了尽量接近国际音标读音,不受原华语音节的限制。二者的对应参看下表
3.一般情况下,重读音节标为华语的第一声(阴平),次重读音节标为华语的第四声(去声),非重读音节标为华语的轻声,如Australia<a′streiqlir′>,Toronto<te′rongqteu′>,revolution<re^xfe′luqshen′>。若重音在最后一个音节时,重读音节标为华语的第四声(去声),非重读音节标为华语的轻声,如hotel<heu′telx>。单音节标为华语的第四声(去声),如Bush<bushx>。
5.龚氏华语音标主要使用对象为无条件或机会学习国际音标的成年人;在对外正式出版品的非华语语词的读音标注中,用龚氏国际音标。
三、华语工具书编排法以下编排法(凡例)适用于各类以方块字或拼音文字等形成的华语工具书。以下的“单音词”指“单音节词”,“复音词”指“多音节词1”。
1.把涉及到中文字头的华语工具书(包括汉语字典、汉语词典、汉英词典等汉外词典、双解或多解词典),及各种华语平面、电子出版品(如软件、光碟、表格等),将传统的“字头”改为“音头”,将实质意义上的以“字”为主体改为以“词”为主体。不再有“字典”之类的大众化工具书。词典中单音词的音头后不对应非单音词的“字”,如“蝴、璃、尬”之类的字不再出现在单音词的音头后。单音词的音头后出现的字,不再出现“非单音词义项”,如简化字的“准”有“允许/标规/正确/一定/成为接近的”等义项,其中“成为接近的”就是非单音词义项,如“准将、准新娘、准平原”等例词。在zrunw的音头后不解释此义项,必要时在zrunw-的前缀后单独释义,即必要时对部分构词力较强的非单音词义项作为前缀或后缀单独释义。单音词和复音词的划分、确定按华语拼音文字分词规则。这种字头改音头的方式也适用于汉语拼音、通用拼音等其他多种拼音。改为音头后,查阅某词时不再需要先查字头,再查这一字头下的某词,而是一步到位。
2.所有的词标注词类。华语词类代码用斜体带英文句点如名词m.,代词da.,动词d.,形容词s.,副词f.,数词su.,量词l.,介词j.,连词ln.,助词z.,方位词fg.,叹词t.,拟声词(象声词)n.,冠词g.(用于外华词典)等。其他代码如近义词jn.,反义词fn.,又iu.,区别于cbv.,又读id.,繁体字ftz.,简化字jhz.,姓氏用字ssz,人名用字rmz.,地名用字dmz.,译名用字imz.。
3.词典正文中不解释姓氏和人地名专用字等,把这几部分收入附录中。分开后使词典的释义更为简洁,也使简繁体字的统一和多音字的消除更为容易,如姓氏用字“任(renv)”收入附录中,词典正文中的“任(renx)”也就自然而然地成了单音单调字。
附录中列出全部姓氏用字,词典正文中对单音词的声调和音的分化不影响姓氏读音。
附录中只列出人地名专用字,词典正文中对单音词的声调和音的分化不涉及人地名专用字读音。附录中不列出入地名的非专用字,其随词典正文中对单音词的声调和音的分化结果而变化。三者有交叉时按姓氏>人名>地名的顺序归入前者列出,如“荣”既可作姓也可作名,只在姓氏用字中列出。人名专用字根据简繁体字使用区的人名用字字频统计结果,山河湖海岛渠泉等专用字归入地名专用字。也能采用将人名用字全部列出的方式。
以下为两种附录示例


4.词典正文中不收录古音、古义、古字形和无效字形,不收录地名的别称和简称,不收录各类冗余信息。
5.将所有的多音字优化变通为“独音独调单音字”(每个单音字的音和声调都是唯一的)。即词典正文中不存在多音字。以“口”字旁下边去掉一横的轻声旁“_”,作为所有轻声字的左偏旁。如常用轻声字(包括儿话音用字“儿”)“的地得了着儿子头吧吗么呵呐呢啦啰”优化变通为”



吧吗

呵呐呢啦啰。
6.每一个轻声音节只保留一个字。如轻声字“吗嘛、道叨”优化后只保留“吗叨,用作“其实吗、唠叨、地叨dìdao、地道dìdào”。每一个带调音节只保留一个量词、叹词和拟声词用字。如zrq音节内的量词用字“支枝只”只保留作为量词使用时字频最高的“支”,用作“一支花、一支鸡”。
7.把查阅最方便的词典的前环衬和后环衬用作与该词典联系最紧密的索引。如以音序排列的词典,将前环衬用作音节索引,将后环衬用作部首索引。
8.除了略词(简略词、缩略词等)的释义外,词典中的单音节词(相当于印欧语系的词根)不采用“本字组词释义”,避免懂的人不用查词典,不懂的人查了也没用(仍然不懂)。如“备”的释义“①具备;②准备;③防备④设备”就属于“本字组词释义”,可改为“①具有;②预为筹划;③预防,防范;④装置”。
9.对于义项接近、容易混淆的多个字只保留综合字频和字频方向平均值较高者,如唯、惟,作、做,摒、摈,桔、橘,咔、喀等。
重新界定易混淆的义项,让文字的使用者无需思考即可快速使用,如“采”的非动词义项归“彩”,“才”的非副词义项归“材”,“辞”的非动词义项归“词”。
10.解决简繁体字“一对多”的问题,使简繁体字一一对应。如简化字用“ 仠 炂糸圡 仒攵炓 ”对应繁体字的“髮幹 製於後門衝 雲”。
11.目前简化字最多一字五音,繁体字最多一字八音,简繁体字中大约有三千个多音字。通过简繁字形互借、借用异体字或相关字形、借用同音字、同义的名词和动词用字声调合一、转易不转难、导入“空字音节”等多种方式把目前的多音字全部调整为一字一音一调。如“分”与“份”的分工,一直处于变动之中,也一直有争议,把fēn音用作“分”,fèn音用作“份”(即用作身份、成份、部份、过份、份外、水份、糖份、份量、组份),无须记忆,是最科学也是最简单的方法。再如“巷”字,在xiàng音节内有“相向象像项橡”多个字,导入hàng的“空字带调音节”。
部分多音字(包括简繁交叉多音字)变通为以下的单音字。以汉语拼音标注调整后的字音(某些声调经过优化),主字其后的括号内为另一对应的变通字音,斜杠后列出的是其他参考字形阿ā(妸ē);啊à;挨āi(捱ái);扒bā(爬pá);罢bà(吧ba);耙bà(筢pǎ);吧bā(吧ba);柏bǎi(伯bó);薄báo;堡bǎo;背bèi(揹bēi);臂bì(bei→膊);便bián(偏pián);扁biǎn(偏pián);别bié(彆biè);并bìng;播bō;伯bó(佰bǎi);剥bǒ;参cān(参shēn);曾céng(竲zéng);差chà(侪chài);长cháng(長zhǎng);场cǎng;朝cháo(昭zhāo);车chē(車jǖ);称chēng(趁chèn);秤chèng(称chēng);臭chòu(嗅xiǔ);畜chú(傗xǜ);处chǔ(処/處chù);传chuán(僎zuǎn);创chuàng(創chuāng);刺cì(疵cī);嗒dā(沓tǎ);答dā(搭dà);打dǎ(达dá);待dái(呆dāi);担dán(擔dàn);疸dǎn(瘩dá);当dāng(珰/當dàng);倒dǎo(捯dào);道dào(叨dao);得dé( dei);的dí( *de)地dì( di)钉dīng;都dōu(堵dū);斗dǒu(炓/鬥dòu);读dú(逗dòu);度dù;恶è;欸ěi;嗯én;儿ér( er);发fā( /髮fà);法fǎ;番fān;蕃fān(繁fán);繁fán;泛fàn;坊fāng;分fēn(份fèn);缝féng(奉fèng);佛fó;否fǒu(伓pǐ);夫fū(呋fu);嘎gā干gān( /仠gàn);杆gān(桿gǎn);钢gáng(杠gàng);格gé(咯gě);给gěi;擀gěn;更gèng(庚gēng);供gōng(唝gòng);勾gōu莞guǎn(婉wǎn);冠guàn;桄guāng;广guǎng;龟guī;嗨hāi;还hái( /還huán);汗hàn;行háng( xíng;恒hèng);夯hāng;巷hàng;好hǎ0(悎hào);号hào(嚎háo);喝hē(褐hè);呵hē(呵a);和hé(胡hú);哄hǒng(轰hōng;讧hòng)划huā( /刯/劃huà);化huà(花huā);晃huàng(恍huǎng)会huì(侩/快kuài);混hùn(浑hún);伽jiā(玍gà);假jiǎ(徦jià);贾jiǎ(gǔ→罟);价jià;将jiāng(將jiàng);降jiàng(佭xiáng);嚼jiáo;角jióo(决[动词义项]jüé);教jiào;结jié;藉jiè;劲jìng;禁jìn(经jīng);经jīng;桔jǘ(洁jié);咀jǚ;卷jüàn(捲jüǎn);觉jüè(觉/覺jiào);倔jüè;菌jün;咔kā(卡kǎ);咖kā(玍gà);卡kǎ(拤qiǎ);壳ké;咳ké(嗨hāi);空kōng(倥kòng);啦la(拉lā);烙lào;乐lè(玥/ yüè);了liǎo( le;瞭liào);擂léi;累lèi(垒lěi);俩liǎ(两liǎng);量liàng( /掚liáng);瞭liào;溜liū;笼lóng(拢1ǒng);露lòu;陆lū(陸liù);吗mǎ(吗ma);脉mài(默mò);没méi(殁mò);闷mèn;蒙méng;缪miào(谋móu);抹mǒ(mā→擦);磨mǒ(摩mó);呐nà(呐na);南nān(拿ná);难nán(难/囦/難nàn);呢ne(尼ní);鸟niǎo(屌diǎo);喏nuò(惹rě);派pài(帕pà);刨páo;辟pì(避bí)片piàn;漂piáo(票piào);屏pìng(摈bín);铺pū(舖pù);奇qí(畸jī);乾qián(干gān);强qiáng(犟jiàng);切qiè( /扐/刈qiē);茄jiā(苆qié);亲qīn(親qìng);覃qín;圈qüān(蔨jüǎn);撤sā(洒sǎ);塞sāi;散sàn(潵sán);扇shàn(搧shān);上shàng( shang);少shǎo(氽shào);蛇shé;舍shè(捨shě);谁shéi;什shén;省shěng(醒xǐng);盛shèng(挰chēng);熟shóu;数shǔ;属shǔ;术shù;率shuài(律lǜ);沓tǎ(达dá);弹tǎn(彈dàn);澹tán(淡dàn);挑tiāo(佻tiǎo);调diào( ü條tiáo);头tóu( tou);吐tǔ(唋tù);拓tuò;为wèi(為wéi);无wú(摩mó);系xì(糸jì);呷xiā(戛gā);吓xiǎ;厦xiǎ;鲜xiān(鲜xiǎn);闲xiàn;现xiàn;相xiāng( / / xiàng);校xiào(较jiào);协xié;兴xīng( /興xìng)削xüē;血xüè;咽yāh(嚥yàn)幺yāo( me);;要yào(偠yāo);叶yè(协xiè);应yīng(応/應yìng);哟yo(唷yō);佣yōng;吁yǜ(嘘xǖ);晕yǖn(韵yǜn);仔zǎi(子zǐ);脏zàng(圡/髒zāng);藏zàng(芐/蔵cáng);粘zhān;涨zhǎng(胀zhàng);折zhé(佘shé);着zháo(招zhāo;啫zhe;撯zhuó);只zhǐ(支zhī)中zhōng(仲zhóng);种zhǒng;重zhòng(偅chóng);著zhù转zhuàn(抟zhuǎn);兹zī;子zǐ(吇zi);卒zú(猝cù);赚zuán;钻zuàn(拈zuān);幢zuǎng;作zuò。
12.对构词率较低的多个字共享“通用部件”,以复音词方式使用,一方面可减少用字,另一方面可培养抽象思维能力。如“滨缤傧殡鬓槟”共享通用部件“宾”,以“海宾、宾纷、宾相、出宾、宾发、宾榔”之类的复音词方式使用。再如“谍碟蝶喋堞牒鲽”共享通用部件“枼”,以“间枼、枼子、胡枼、枼血、墙枼、史枼、枼鱼”之类的复音词方式使用。当字库中暂无通用部件字形,或所需部件字音不相符时,以具中性偏旁的字替代。
对构词率较低的低配字进行优化,如将“舆论、基础、斡旋”用作“吁论、基楚、握旋”。
大幅度减少华文用字,比减少字的笔画更为重要。既然26个拉丁字母能形成多种语言文字,以华文的通用部件替代几个字应该是华语使用者可以接受的。
13.字频、词频、义项频方向值用某一单位时间段的特定或综合字频、词频、义项频,除以该字前一单位时间段的特定或综合字频、词频、义项频,即为该单位时间段的字频、词频、义项频方向值。通过字频、词频、义项频方向值,可准确分析字频、词频、义项频发展的方向和演变速率;也可比较相同时段不同字的字频、词频、义项频方向值,比较字频、词频、义项频的演变方向和演变速率。当字频、词频、义项频方向值大于1时,说明该字词的使用频度在增大;数值越大就说明增大的速率越快。当字频、词频、义项频方向值小于1时,说明该字词的使用频度在减小;数值越小就说明减小的速率越快。
字频、词频、义项频方向平均值把相邻几个单位时间段的字频、词频、义项频方向值平均,即为字频、词频、义项频方向平均值。可校正时间偏差。比较不同的字,所取相邻的单位时间段应相同,从而比较出字频、词频、义项频的发展方向平均值高低。
如以最近五十年每五年为时间段,据繁体字的综合字频计算出的字频方向平均值(后述均按此定义),“證”为1.1069,“証”0.8434;“閒”1.1375,“閑”0.8107。由字频方向平均值可知,在这四十年中,简化字“证”所对应的繁体字在向“證”发展,“闲”在向“閒”发展,后者的发展速度快于前者。这种方法可避免许多语言文字学家凭感觉反复讨论、争论而得不出科学的结论。
按综合词频和上述的词频方向平均值选取单音节词和复音节词。每一同音同调的单音节或复音节在词典正文中只出现唯一的一个音头。
14.每一单音节的音头下处理的优先顺序为唯一的单音节义项>每一词类下唯一的单音节义项>每一词类下不易混淆的单音节义项。未选用的单音节义项按声调或相近音分化,归入其他单音词,或改按复音词使用。
以下实心鱼尾号内的是对应的方块字。
如diuq的音头下只有“d.遗失;失去。”的单音节义项,是一种最理想的状况。“抛弃”义用复音词,如“丢掉”,或用“扔”;“投送”义用“递”,如“递眼色”;“放置”意用“放”。
再如buxf.否定。m.用棉、麻等织成的材料。l.行走时两脚间的距离。“部”分化入空调音节buq,“bux”音的其他义项全部按复音词使用。
每一复音节的音头下处理的优先顺序为唯一的复音节义项>每一词类下唯一的复音节义项。未选用的复音节义项按其中的声调或相近音分化,或改按其他复音词使用。
如cruqbanw出版d.把平面或电子产品编制出来。“初版”用作“第一版”。
词缀用字放入空心鱼尾号〖〗或半空心鱼尾号

内。
15.华语方块字释义时,以“的”作为形容词后缀,以“地”作为部分副词后缀。
如jigqmeiw精美s.精致华美的。
jigqshinq精心f.特别用心地。
16.使用龚氏华语拼音时,音头和音节索引等按A、B、C、Ch、Cr、D、、E、F、G、H、I、J、K、L、M、N、O、P、R、S、Sh、Sr、T、U、Y、Z、Zr顺序编排。汉语拼音、通用拼音和注音符号等仍按原顺序编排。
17.在涉及到儿童或初学者的工具书、一般读物的华语拼音时,彩色电子和平面出版品、网页等中的词性将每个词最末的专用标调字母标为不同的色彩。如正文为黑色时,名词与代词保持黑色不变,动词绿色,形容词红色,副词橙色,介词蓝色,连词紫色,略拼词没有标调字母不变色。如Lauwsrq shinqsragw hugv meivguix(老师喜欢红玫瑰)中,shinqsragw中的“w”绿色,hugv中的“v”红色。黑白出版品中将名词与代词外的每个词最末的专用标调字母通过斜体、加粗、加横线、上下标等方式标出词性。
18.在词典的附录中收录华语拼音文字的略音略调单音词和略音略调复音语词。每一种字母的组合只能有一个略音略调词,不能与其他常拼音节混淆,并且尽量不与国际流行的略语冲突。职衔类双字词的略拼形式后面加“o”字母结尾;军队职衔类双字词的略拼形式用首字母加“do”字母结尾。按照词频顺序,当双字词的略拼形式有第二、第三个相同的出现时,分别在略拼词后加“^”和“`”(重音号,与轻声号不同)。当位于两音节或以上的词尾时,“r”为儿话音的“儿”,如huaqr(花儿);“z”为组词用字“子”,如zruoqz(桌子)。所有略拼词仍按全拼读音





四.龚码小键盘单拼輸入法1.龚码小键盘单拼輸入法与龚码大键盘单拼輸入法的键盘布局完全对应,只是由于小键盘的键位少,把大键盘所设的声、韵母按所属的字母归入小键盘。龚码大、小键盘单拼輸入法的键盘对应方式请参看下面两表。其中“阿拉伯数字”和“其他标点”在键位能增加时可安排专用键,一键按出后选择,以减少按键次数。
2.龚码单拼使用了21个声母,36个韵母;而通用小键盘上有10个数字键,26个字母分布在数字键2~9中,4个声调字母对应的QVWX四个字母不使用,以数字键1、*、0、#依序标示四声。华语中四声出现的频度依序为21.5%、21.6%、18%、34.5,轻声4.3%,故把轻声合入第三声中;或安排在小键盘左上角等位置。小键盘记忆规律是,凡华语拼音的单字母声母和单字母韵母均与键盘字母相符,一共有22个。常用标点符号在相关位置双击,完毕自动切换回;其他标点符号双击Space键,完毕自动切换回;阿拉伯数字双击#键后选取,完毕自动切换回。



3.可供选择的多级词库和各类冗余单字屏蔽功能机内词库按小键盘用语词频排列,用户可根据需要选择和修改。如用户在总词库中选取2000词,即表明用户在输入信息时选择按小键盘用语词频排列的前2000词作基准,用户可将选取的词库转入台式或手提电脑等根据个人需要增删或调整频度,然后转回小键盘所用词库。这个词库处理方法也适用于大键盘输入,用户可通过选取和调节词库使自己的生活变得简捷。接收信息并不受此影响。
尽管相当一部分华文方块字可以单独当作“词”使用,但华文的“字”与华语的“单音节词”并不完全等同,如“尴、蝴、璃”等字就不是“单音节词”;一些频度较高的字也不会或很少作为“单音节词”使用,如“雄、育、杰、舆、础、斡”等。国标码的六千多个字中,如“茇菝瘭礤躔茺搋簖稃戤颃擐蕺跽谫鲒弪捃芤缡苈篥鞔蠛脬螵椠缲檎锓圊筇绱赕铴掭蜩芄禊渫糈罨蓣驵痄膣窀”等之类约有一千多字是平常不会用的。在平时输入单字时,不让低频字和“非单音节词”的“字”显示出来,可大大提高输入速度。将姓氏、人地名专用字、化学专用字等分类,用户根据需要挂接或屏蔽。
“带部输入”为可选项,可有效降低重码;与“带调输入”都只用于“字”而不用于“词”。单字带部带调输入时,单拼字共三码,双拼字四码。单字不带部只带调输入时,单拼字共两码,双拼字三码。
以下为一些常用部件的读音,按首音码对应的小键盘数字归类2)勹bauq,冖bauw,宀bauw,丷baq,八baq,冫binq,疒bigx,艹cauw,寸cunx,中cauw,爫caix,忄shinq,心shinq,凵shygq,_shauw,小shauw,彡shigv,穴shyev,夕shq,攵unv,夂unv3)丶dianw,刂 dauq,_ dauq,癶degq,大dax,缶feuw,方fagq,犭chyanw,欠chanx4)亅geuq,广guagw,巛guaiw,艮genx,弓gugq,一hegv,彐huix,虍huw,禾hv,火huow,灬huow,衤iq,讠ianv,尢iuv,弋ix,厂cragw,_crunq5)钅jinq,戋janq,匚jagx,丬jagx,_jyanw,巾jinq,口keuw,囗kuagq,癶kuiv,亠liux,耂lauw,耒leiw,力lix,王uagv,_iagv6)皿minw,门menv,马maw,廿nianx,牜niuv,廾nugx,女nyw,尢iuv,酉iuw,又iux,_zruv,丬zruagx,豸zrx,幺iauq7)丿piew,彡piew,疋piv,亻renv,彳renv,人renv,日rx,纟sq,糸sq,罒sx,厶sq,讠ianv8)冂tugv,土tuw,丨srux,扌sreuw,饣srv,十srv,豕srw,礻srx,山sranq,尸srq,手sreuw,水sruiw,氵sruiw,卩erw,阝erw9)曰yex,肀yx,鱼yv,足zuv,_zuv,辶zeuw,廴zeuw,孑zw,隹zuiq部件的读音全部按当代华语字音,如“虫”读作crugv不读huiw,“厂”读作cragw不读hanx。同一部件,无论处于字的哪个位置,读音都相同,如“阝”不管在左右都读erw;“攵”不管在上下左右都读unv。独体字的部件码为本身。如以下字带部带调输入时与小键盘的对应胜879#,湖483*,燕76#,英821,晶5871,团8450,同878*,画444#,匠575#,尾780,迁3791,包2321,手8480。
4.以下为输入术语解释单义频单音节义项频的简称。在一定范围的语言材料中单音节义项(能作为单音节词使用的某一义项)的使用频率。某一华文字的某一单义频与该字的单字的字频是两个不同的概念。在按词输入的输入法的单字排列顺序中,按单义频而不是按字频排序将会加快输入速度。
单向值单音节义项频方向平均值的简称。用某一单位时间段的特定或综合单音节义项频除以前一单位时间段的同一单音节义项的频度,即为该单位时间段的单音节义项频方向值。把相邻几个单位时间段的单音节义项频方向值平均,即为单音节义项频方向平均值。单向值可科学地量化分析单音节义项频发展的方向和演变速率。
首键即龚码单拼输入法的第一键。对于单拼词首键为唯一音键,对于双拼词首键为第一音键。如“波”为单拼词,小键盘上对应的数字键是“2”。“庄”为双拼词,首键为“6”。
单拼字首键即可完成词音输入的字,即凡与龚氏华语拼音方案(参看表2)中57个声韵母拼式相符的字(声母按照表音)均为单拼字,如“副f、眼ian、羊iag、月ye、温un、翁ug、勇yg”等字(其他则为双拼字)。若接着输入部码和调码即为带部带调字,如“安anq”,对应小键盘上的9、2、1。
双拼字需两键完成字音输入的字,如“欢、学、里”等。若接着输入部码和调码即为带部带调双拼字,如“城cregv”,对应小键盘上的4、7、8、*。
双字词由两个字组成的词,按不带部也不带调的字音输入,共2~4键。分为两个单拼字,如“一直46、影视88”;两个双拼字,如“大海3242、编号2743”;或一单一双,如“爱国247、岗位477”。
三字词输入每一字的首键,不带部也不带调,共三键。如“中国心”,对应小键盘的6、4、2。
四字或以上词输入前三字和末字的每一字首键,不带部也不带调,共四键。如“不见不散”对应2、5、2、7;“有机化合物”对应6、5、4、8。
5.龚码单拼能将字、词分得很清楚。当输入调键时视为单字的结束键。因所有非单音词的“字”在单音输入时不出现,并且屏蔽了各类冗余信息,所以带部带调输入单字时重码少。自行调整词库和输入时不必拘泥于语法意义上的词或短语,尽量采用三字以上的词或短语,长了重码少,平均击键少,即“能连则连,连多则快”。如果目的是输入词,只要词库中有现成的,就不要以字的方式输入多次后组合,而应直接输入复音词或短语。如“院里开满了花”中的“花”按单音词输入;“院里开满了鲜花”中的“鲜花”则按双音词输入,不要将“鲜”、“花”分两次输入。输入过程中按键没结束时,忽略屏幕显示,如输入四拼词,四键快速“点按”结束再看屏幕。需要时,按“>”键翻页,以“<”键翻回。单字排列的顺序由原来的按字频排列,改为按单音节义项频顺序排列;当单音节义项频相近时,以单音节义项频方向平均值决定顺序。以下分步说明,单字按带调不带部举例。
1)当“点按”(快速按键后立即松开)首音键,视为输入了首键相关单音节义项频的高频字(包括单拼字和双拼字),所有字将会按单音节义项频列出,可显示十个,以对应的数字“长按”(按住键直到有效)选取。如第一键为8(包括t,ig,er,u和sr),包括t、ig、er、u、sr单拼字和以t、sr为声母的双拼高频字,提示行显示为
1是 2上 3他 4时 5生 6说 7同 8天 9而 0体2)当点按次音键,视为输入了两个单拼字组成的双字词,所有词将会按词频列出,每次显示根据屏幕大小调节。如第一键为2,第二键为8,提示行显示为1因 2碍事 3喜事 4阴影 5稀释次键若为调键,视为完成了带调单拼字输入,这些字将会按单音节义项频列出。如首键为8,次键为调键1(阴平声),提示行显示为1失 2施 3屋 4诗 5湿 6英 7乌 8鹰3)当点按第三音键,视为输入了三拼词(一个单拼字和一个双拼字组成的双字词或三字语词)。如三键依序为3、8、2,提示行显示为1电影院 2赌博第三键若为调键,视为完成了带调双拼字输入。如前两键依序为3、8,第三键为0(上声和轻声),提示行的字按单音节义项频的顺序列出1请 2顶 3赌 4堵在龚氏华语拼音中,“fu”应为“f”是单拼音节。
4)当输入第四音码,视为输入了四拼词(两个双拼字组成的双字词、多字语词)。如四键依序为6、4、6、9,提示行显示为1中华民族 2弥漫6.龚码单拼中,为了提高输入速度,每一个输入步骤的缺省设定为只显示“完全符合条件”的词,“不足部分可选择以相关高频词接后”则由用户选择使用。用户可随时自造词、修改词,并可按类别分为各类词库,据需要选择挂接。龚码单拼输入法可自动调频,用户也可根据需要手动调频。输入中若有差错按cancel键取消。输入时单字带调而词不带调。用户可充分利用每个首键相关字母对应的高频字,尽量做到“高频字不翻页”。有把握的高频字一键完成,其他单拼字带调两键输入,双拼字带调三键输入。双字词根据其所含字分为三种情况两个单拼字两键输入,一单一双三键输入,两个双拼字四键输入。三字词三键、四字词四键,只输入首键。五字词以上输入前三字和末字的首键,共四键;输入完毕后,点按SEND键发出信息。
以上小键盘的单字输入的击键次数,高频字1键,单拼字3键,双拼字4键,平均2.67键。双字词中,两个单拼字2键,两个双拼字4键,一单一双3键,平均每字1.5键。三字词以上的每字1键。总平均每字的击键次数为1.72键。
在大键盘龚码单拼输入中,高频字1键,单拼字2键,双拼字3键,单字平均2键。词的输入同小键盘。因而总平均每字的击键次数为1.5键。
这种输入法也可应用于汉语拼音等其他涉及到华语的拼音。
五.小键盘智能龚氏拼音文字(简称“智能龚拼”)在中国广大的手机及其他小键盘用户中,不愿学各种字音或字形的中文输入法的用户占了一大部分,作为一种拼音文字的小键盘智能龚拼可以满足这些用户发送信息的需要。以下是键位图。其中“阿拉伯数字”和“其他标点”在键位能增加时可安排专用键,一键按出后选择,以减少按键次数。
小键盘智能龚拼无须记忆,直接把拼音文字输入即可,基本上无重码。每一个输入空格键(Space)或标点符号时,视为前一单词输入完毕,若无重码,前一单词会连同其后的空格或标点一起自动上屏。有重码时,选择所需后前一单词会连同其后的空格或标点一起自动上屏。如我们输入77x324x(srxdagx)后按空格键,屏幕按词频顺序显示1.srxdagx;2.srxfagx。选择1后srxdagx会连同其后的空格一起上屏。
以下为几则手机短信的方块字、手机上显示的华语拼音文字和手机输入码,粗体的输入结果为阿拉伯数字。
传真已收到。谢谢。我方将尽快安排,并及时和贵方联系。
Cn ij sd.Ss.Uf j jk ap,bigx js h gf ls.
26 45 73.77.83 5 55 27,244x 57 4 43 57.
拥有你,天天都是情人节。拥有我,天天都是劳动节。我们两个在一起,天天都是狂欢节!Yi n,tt ds ^Chigvrenv Jev.Yi u,tt ds ^Lauvdugx Jev.Um 2g z iqchw,ttds ^Kuagvhuanq Jev !94 6,88 37 ^2444v736v 53v.94 8,88 37 ^528v384x 53v.86 24 9 4q24w,8837 ^5824v4826q 53v!有时候,委屈自己一次就会宽容他人一世。
Ish,uc ^zj lc jh kr tr ^lsrx.
474,82 ^95 12 54 57 87 ^177x.
一切的美好源于真挚和坦诚,虽然岁月不会轮回,天真不再重现。一份真诚的祝福,会让你快乐每一天…Ic ^d mh yy zrenqzrx h tanwcregv,sr sy ^bh lunvhuiv,tianqzrenq bzcrugvshanx.lf zc^d zf,hr^n kl mlt…42 ^3 64 99 9736q97x 4 826w2734v,77 79 ^24 586v484v,8426q9736q 292784v7426x,13 92 ^3 93,47 ^6 55 618…以上的拼音文字使用了简码词。每一简码词的拼写形式都是唯一的,特征是没使用声调符,因而不会产生任何混淆。简码词也可用全拼词代替,二者等效,可相互转换。
以上概略地对本发明的龚氏国际音标、龚氏华语音标、华语工具书编排法、小键盘单拼输入法及小键盘智能拼音文字作了描述。本发明相关领域的人员,可以不经创造性劳动就能对本发明作出各种各样的修改和改进。发明人认为,这种修改和改进都属于本发明的权利要求书所定义的范围之内。
本发明可有效应用于华文方块字和华语拼音字的信息数字化输入、传输、识别、计算机处理、机器翻译、排序、检索、速记、文字智能处理、语音识别系统、同声传译系统等所涉及到的音标和平面、电子工具书,可用于涉及到华语的各种计算机软件(如操作系统、浏览器、文字处理、排版、光学OCR识别、翻译、校对等软件),国际互联网,平面(图书报刊等)、多媒体(CD、DVD光碟等)、电子(国际互联网页等)出版品、教材、手机、电子字典及各类信息电器等,可支持所有平台,可用于主机Server端或客户Client端,可用于文件、电子邮件、页面。亦可用于华文方块字、拼音字及其他语言文字的语音拼注、输入及转换翻译。
龚氏国际音标(GGI) 表1
龚氏华语拼音方案(GHPF,简称龚拼) 表2 1.每单元格中第一行为注音符号与汉语拼音;龚氏拼音若与汉语拼音有差异,在第二行的华文方块字例字后标出,方括号内为IPA国际音标。
2.龚氏拼音的韵母中有-ng时省略为-g,如ang→ag,eng→eg,ing→ig,ung→ug,yng→yg。将ieu、uei省略为iu、ui。
3.所有的声母与韵母均可独立形成音节。声母独立形成的音节对应龚氏拼音字母表中的读音(表音)b(波)、p(坡)、m(莫)三个声母视为已包括o音,声母f(复)视为已包括u音,d(德)、t(特)、n(呢)、l(勒)、g(哥)、k(科)、h(喝)七个声母视为已包括e音,j(机)、ch(其)、sh(西)三个声母视为已包括i音。
4.声母读“本音”时,其后加*,如mv*(呒)、mx*(呣)、nw*(嗯)。ê音在输入时用e^替代。iê、yê简化为ie、ye。
5.q、v、w、x四个字母为专用调母,依序标示四声于单音节之后,轻声用(”)标示。以下为龚氏拼音的字母标调与汉语拼音的符号标调的对照阴平 阳平 上声 去声 轻声q v w x (’) (不标)6.非华语的人地山河名和学科专业名词,其拼写在原则上还原为国际通用的原拉丁字母形式,q、v、w、x等字符保持原用法不变。
权利要求
1.一种国际音标方案,其特征在于1)音标所用字母不超出通用英语键盘的26个字母的范围;为了使字母的负荷量均衡,26个英文字母在方案中全部用上;所有的音标之间不会产生混淆或误读;2)当现有音标的字母标识与通用英语键盘字母相符时,字母标识不变,如b,p,ts,dz等;3)当现有音标的字母标识与通用英语键盘字母不相符时,优先采用在音标发音音位图上较接近,或有拼写方式对应的单字母标识形式,如 →[i], →[u], →[a],[t∫]→[q],[∫]→[x];在音标中,[_]的使用频率比[e/ε]大得多,[_]→[e];4)当现有音标的字母标识与通用英语键盘字母不相符,无英语键盘的单个字母对应时,采用不超过三个字母的组合形式[_(r)]→[er], →[or], →[ar], →[ei], →[ai], →[eu], →[au], →[ir], →[ur], →[air], →[aur],[ju]→[juu], →[jur];带冒号的长元音以双写表示,如[i]→[ii], →[oo], →[ee], →[aa],[u]→[uu];5)以“c”与其他字母搭配后作为元音[_]→[ac],[Λ]→[oc],[e/ε]→[ec],[e_(r)]→[ecr];6)以通用英语键盘上的重音符标于重读音节之前,次重音不标;7)在词典等工具书中将音标标在斜线号之内,在文章中或其他使用中将音标标在方括号之内;8)这种国际音标能把英语等文字形成的全篇文章音标化,能按拉丁字母排序;音标化时,音标字母的大小写与原文保持一致,重音在倒数第二个音节时不标重音符。
2.一种华语音标方案,其特征在于1)在这种华语音标中,每一个字母都读“本音”而不是“表音”(即不按华语字母表中的读音),辅音字母中不包括元音成份;2)为与其他音标有区别,华语音标标在角括号<>中;3)<er>在其他元音后时,省略为<r>,如<oer>略为<or>,<auer>略为<aur>;其他情况一般不采用省略形式;4)为了尽量接近国际音标读音,这种华语音标不受原华语音节的限制;与IPA国际音标的对应见下表 5)一般情况下,重读音节标为华语的第一声(阴平),次重读音节标为华语的第四声(去声),非重读音节标为华语的轻声,如Australia<a′streiqlir′>,Toronto<te′rongqteu′>,revolution<re^xfe′luqshen′>;若重音在最后一个音节时,重读音节标为华语的第四声(去声),非重读音节标为华语的轻声,如hotel<heu′telx>;单音节标为华语的第四声(去声),如Bush<bushx>;6)这种华语音标的主要使用对象为无条件或机会学习国际音标的成年人;在对外正式出版品的非华语语词的读音标注中,用国际音标。
3.一种华语工具书编排法,其特征在于1)将传统的“字头”改为“音头”,将传统华语工具书或其他类型出版品中实质意义上的以“字”为主体改为以“词”为主体,不能用作单音节词的字直接出现在双字或以上的词中,构词力较强的非单音节词用字需要单独释义时以词缀的方式立字头;词典中单音词的音头后不对应非单音词的“字”;单音词的音头后出现的字,不出现“非单音词义项”;单音词和复音词的划分、确定按华语拼音文字分词规则;这种字头改音头的方式也适用于汉语拼音、通用拼音等其他多种拼音;查阅词汇时一步到位;这种编排法同时适用于方块字和拼音文字等;2)所有的词标注词类,华语词类代码用斜体带英文句点如名词m.,代词da.,动词d.,形容词s.,副词f.,数词su.,量词l.,介词j.,连词ln.,助词z.,方位词fg.,叹词t.,拟声词(象声词)n.,冠词g.(用于外华词典),近义词jn.,反义词fn.,又iu.,区别于cby.,又读id.,繁体字ftz.,简化字jhz.,姓氏用字ssz.,人名用字rmz.,地名用字dmz.,译名用字imz.;3)词典正文中不解释姓氏和人地名专用字等,把相关部分收入附录中;分开后使词典的释义更为简洁,也使简繁体字的统一和多音字的消除更为容易;附录中列出全部姓氏用字,词典正文中对单音词的声调和音的分化不影响姓氏读音;附录中只列出人地名专用字,词典正文中对单音词的声调和音的分化不涉及人地名专用字读音;附录中不列出人地名的非专用字,其随词典正文中对单音词的声调和音的分化结果而变化;三者有交叉时按姓氏>人名>地名的顺序归入前者列出;也能采用将人名用字全部列出的方式;人名专用字根据简繁体字使用区的人名用字字频统计结果,山河湖海岛渠泉等专用字归入地名专用字;4)词典正文中不收录古音、古义、古字形和无效字形,不收录地名的别称和简称,不收录各类冗余信息;5)词典正文中出现的字均为“独音独调单音字”(每个单音字的音和声调都是唯一的);以“口”字旁下边去掉一横的轻声旁 作为所有轻声字的左偏旁,如常用轻声字(包括儿话音用字“儿”)“的地得了着儿子头吧吗么呵呐呢啦啰”优化变通为“ ”通过简繁字形互借、借用异体字或相关字形、借用同音字、同义的名词和动词用字声调合一、转易不转难、导入“空字音节”等多种方式把目前的简繁体多音字全部调整为一字一音一调;部分多音字(包括简繁交叉多音字)变通为以下的单音字;以汉语拼音标注调整后的字音(某些声调经过优化),主字其后的括号内为另一对应的变通字音,斜杠后列出的是其他参考字形;阿ā(妸ē);啊à;挨āi(捱ái);扒bā(爬pá);罢bà( ba);耙bà(筢pǎ);吧bā( ba);柏bǎi(伯bó);薄báo;堡bǎo;背bèi(揹bēi);臂bì(bei→膊);便bián(偏pián);扁biǎn(偏pián);别bié(彆biè);并bìng;播bō;伯bó(佰bǎi);剥bǒ;参cān(參shēn);曾céng(竲zéng);差chà(侪chài);长cháng(長zhǎng);场cǎng朝cháo(昭zhāo);车chē(車jǖ);称chēng(趁chèn);秤chèng(称chēng);臭chòu(嗅xiǔ)畜chú(傗xǜ)处chǔ(処/處chù);传chuán(僎zuǎn);创chuàng(創chuāng);刺cì(疵cī);嗒dā(沓tǎ);答dā(搭dà);打dǎ(达dá);待dái(呆dāi);担dán(擔dàn);疸dǎn(瘩dá);当dāng(珰/當dàng);倒dǎo(捯dào);道dào( dao);得dé( dei)的dí( de);地dì( di);钉dīng;都dōu(琽dū);斗dǒu(炓/鬥dòu);读dú(逗dòu);度dù;恶è;欸ěi;嗯én;儿ér( er);发fā(叐/髮fà);法fǎ;番fān;蕃fān(繁fán);繁fán;泛fàn;坊fāng;分fēn(份fèn);缝féng(奉fèng);佛fó;否fǒu(伓pǐ);夫fū( fu);嘎gā;干gān( /仠gàn);杆gān(桿gǎn);钢gáng(杠gàng);格gé(咯gě);给gěi;擀gěn;更gèng(庚gēng);供gōng(唝gòng);勾gōu;莞guǎn(婉wǎn);冠guàn;桄guāng;广guǎng;龟guī;嗨hāi;还hái(辷/還huán);汗hàn;行háng(亍xíng;恒hèng);夯hāng;巷hàng;好hǎo(悎hào);号hào(嚎háo);喝hē(褐hè);呵hē( a);和hé(胡hú);哄hǒng(轰hōng;讧hòng);划huā( /刯/劃huà);化huà(花huā);晃huàng(恍huǎng);会huì(侩/快kuài);混hùn(浑hún);伽jiā(玍gà);假jiǎ(徦jià);贾jiǎ(gǔ→罟);价jià;将jiāng(將jiàng);降jiàng(佭xiáng);嚼jiáo;角jiáo(决[动词义项]jüé);教jiào;结jié;藉jiè;劲jìng;禁jìn(经jīng);经jīng;桔jǘ(洁jié);咀jǚ;卷jüàn(捲jüǎn);觉jüè(覚/覺jiào);倔jüè;菌jūn;咔kā(卡kǎ);咖kā(玍gà);卡kǎ(拤qiǎ);壳ké;咳ké(嗨hāi);空kōng(倥kòng);啦la(拉lā);烙lào;乐lè(玥/楽/樂yüè);了liǎo( le;瞭liào);擂léi;累lèi(垒lěi);俩liǎ(两liǎng);量liàng( /掚liáng);瞭liào;溜liū;笼lóng(拢lǒng);露lòu;陆lū(陸liù);吗mǎ( ma);脉mài(默mò);没méi(殁mò);闷mèn;蒙méng;缪miào(谋móu);抹mǒ(mā→擦);磨mǒ(摩mó);呐nà( na);南nān(拿ná);难nán( /囦/難nàn);呢ne(尼ní);鸟niǎo(屌diǎo);喏nuò(惹rě);派pài(帕pà);刨páo;辟pì(避bí);片piàn;漂piáo(票piào);屏pìng(摈bín);铺pū(舖pù);奇qí(畸jī);乾qián(干gān);强qiáng(犟jiàng);切qiè( / /刈qiē);茄jiā(苆qié);亲qīn(親qìng);覃qín;圈qüān(蔨jüǎn);撒sā(洒sǎ);塞sāi;散sàn(潵sán);扇shàn(搧shān);上shàng( shang);少shǎo(尒shào);蛇shé;舍shè(捨shě);谁shéi;什shén;省shěng(醒xǐng);盛shèng(挰chēng);熟shóu;数shǔ;属shǔ;术shù;率shuài(律lǜ);沓tǎ(达dá);弹tǎn(彈dàn);澹tán(淡dàn);挑tiāo(佻tiǎo);调diào( /條tiáo);头tóu tou);吐tǔ(唋tù);拓tuò;为wèi(為wéi);无wú(摩mó);系xì(糸jì);呷xiā(戛gā);吓xiǎ;厦xiǎ;鲜xiān(鮮xiǎn)闲xián;现xiàn;相xiāng( / /佀xiàng);校xiào(较jiào);协xié;兴xīng( /興xìng);削xüē;血xüè;咽yān(嚥yàn);幺yāo( me);;要yào(偠yāo);叶yè(协xiè);应yīng(応/應yìng);哟yo(唷yō);佣yōng;吁yǜ(嘘xǖ);晕yǖn(韵yǜn);仔zǎi(子zǐ);脏zàng(圡/髒zāng);藏zàng(芐/蔵cáng);粘zhān;涨zhǎng(胀zhàng);折zhé(佘shé);着zháo(招zhāo; zhe;撯zhuó);只zhǐ(支zhī);中zhōng(仲zhóng)种zhǒng;重zhòng(偅chóng);著zhù;转zhuàn(抟zhuǎn);兹zī;子zǐ( zi);卒zú(猝cù);赚zuán;钻zuàn(拈zuān);幢zuǎng;作zuò;6)每一个轻声音节只保留一个字,如“吗嘛、道叨”优化后只保留“ ;每一个带调音节只保留一个量词、叹词和拟声词用字,如zrq音节内的量词用字“支枝只”只保留作为量词使用时字频最高的“支”;7)把查阅最方便的词典的前环衬和后环衬用作与该词典联系最紧密的索引;如以音序排列的词典,将前环衬用作音节索引,将后环衬用作部首索引;8)除了略词(简略词、缩略词等)的释义外,词典中对单音节词(相当于印欧语系的词根)不采用“本字组词释义”,避免懂的人不用查词典,不懂的人查了也没用9)对于义项接近、容易混淆的多个字只保留综合字频和字频方向平均值较高者重新界定易混淆的义项,让文字的使用者无需思考即可快速使用;解决简繁体字“一对多”的问题,使简繁体字一一对应;如简化字用“叐仠
炂糸圡
仒攵炓
”对应繁体字的“髮幹麵鬆繫髒製於後鬥衝劃雲”;10)对构词率较低的多个字共享“通用部件”,以复音词方式使用,以减少用字及培养文字使用者的抽象思维能力;当字库中暂无通用部件字形,或所需部件字音不相符时,以具中性偏旁的字替代11)按综合词频和词频方向平均值选取单音节词和复音节词;每一单音节的音头下处理的优先顺序为唯一的单音节义项>每一词类下唯一的单音节义项>每一词类下不易混淆的单音节义项;未选用的单音节义项按声调或相近音分化,归入其他单音词,或改按复音词使用;每一复音节的音头下处理的优先顺序为;唯一的复音节义项>每一词类下唯一的复音节义项;未选用的复音节义项按其中的声调或相近音分化,或改按其他复音词使用;12)华语方块字释义时,以“的”作为形容词的后缀,以“地”作为部分副词的后缀;13)使用华语拼音时,音节索引等按A、B、C、Ch、Cr、D、、E、F、G、H、I、J、K、L、M、N、O、P、R、S、Sh、Sr、T、U、Y、Z、Zr顺序编排;14)在词典的附录中收录华语拼音文字的略音略调单音词和略音略调复音语词,每一种字母的组合只能有一个略音略调词,不能与其他常拼音节混淆,并且尽量不与国际流行的略语冲突;职衔类双字词的略拼形式后面加“o”字母结尾;军队职衔类双字词的略拼形式用首字母加“do”字母结尾;按照词频顺序,当双字词的略拼形式有第二、第三个相同的出现时,分别在略拼词后加“^”和“`”;当位于两音节或以上的词尾时,“r”为儿话音的“儿”,“z”为助词用字“子”;所有略拼词仍按全拼读音
4.一种小键盘单拼輸入法,其特征在于1)小键盘单拼輸入法与大键盘单拼輸入法的键盘布局完全对应,手机外接大键盘时无须更换输入法;使用专用的声调标调键;根据键盘布局,第三声和轻声可合用一键;按照单义频和单向值而不是按照字频排列单字顺序;由于小键盘的键位少,把大键盘所设的声、韵母按所属的字母归入小键盘;小键盘单拼輸入法的键盘布局如后;其中“阿拉伯数字”和“其他标点”在键位能增加时可安排专用键,一键按出后选择,以减少按键次数;2)单拼输入法使用21个声母,36个韵母;通用小键盘上有10个数字键,26个字母分布在数字键2~9中,4个声调字母对应的QVWX四个字母不使用,以数字键1、*、0、#依序标示四声,把轻声合入第三声中或单独安排;凡华语拼音的单字母声母和单字母韵母均与键盘字母相符,一共有22个;常用标点符号在相关位置双击,完毕自动切换回;其他标点符号双击Space键,完毕自动切换回;阿拉伯数字双击#键后选取,完毕自动切换回;3)可供选择的多级词库和各类冗余单字屏蔽功能机内词库按小键盘用语词频排列,用户可根据需要选择和修改;用户在总词库中选取若干词,即表明用户在输入信息时选择按小键盘用语词频排列的前若干词作基准,用户可将选取的词库转入台式或手提电脑等根据个人需要增删或调整频度,然后转回小键盘所用词库;这个词库处理方法也适用于大键盘输入,用户可通过选取和调节词库使自己的生活变得简捷;接收信息并不受此影响;在输入单字时,不让“非单音节词”的“字”显示出来,以提高输入速度;将姓氏、人地名专用字、化学专用字等分类,用户根据需要挂接或屏蔽; 4)凡与华语拼音方案中57个声韵母拼式相符的词(声母按照表音)均为单拼字,其他单拼词则为双拼字;5)单拼输入法能将字和词分得很清楚,并且键键有字;当输入调键时视为字的结束键;因所有非单音词的“字”在单音输入时不出现,并且屏蔽了各类冗余信息,所以带调输入单字时一般不用翻页;自行调整词库和输入时不拘泥于语法意义上的词或短语,尽量采用三字以上的词或短语、句子形式;如果目的是输入复音词或短语,只要词库中有现成的,就不以单字方式输入多次后组合,而直接输入复音词或短语;6)“带部输入”为可选项,可有效降低重码;与“带调输入”都只用于“字”而不用于“词”;部件输入全部按照当代华语部件读音的首音码的对应键;单字带部带调输入时,单拼字共三码,双拼字四码;单字不带部只带调输入时,单拼字共两码,双拼字三码;7)当“点按”(快速按键后立即松开)首音键,视为输入了首键相关高频字(包括单拼字和双拼字),所有字将会按单音节义项频的顺序列出,单义频相近时按单音节义项频方向平均值决定顺序;每次可显示十个字,以对应的数字“长按”(按住键直到有效)选取,未出现的字可按“>”键翻页,以“<”键翻回;当点按次音键,视为输入了双拼双字词(两个单拼字组成的双字词),所有词将会按词频列出,每次显示根据屏幕大小调节;次键若为调键(输入调键前可选输部键),视为完成了带调单拼字输入,这些字将会按单义频和单向值列出;当点按第三音键,视为输入了三拼词(一个单拼字和一个双拼字组成的双字词、三字语词);第三键若为调键(输入调键前可选输部键),视为完成了带调双拼字输入;当输入第四音码,视为输入了四拼词(两个双拼字组成的双字词、多字语词);8)以上的单拼输入法中,为了提高输入速度,每一个输入步骤的缺省设定为只显示“完全符合条件”的词,“不足部分可选择以相关高频词接后”则由用户选择使用;用户可随时自造词、修改词,并可按类别分为各类词库,据需要选择挂接;单拼输入法可自动调频,用户也可根据需要手动调频;输入中若有差错按cancel键取消;输入时单字可带部带调而词不带;用户可充分利用每个首键相关字母对应的高频字,尽量做到“高频字不翻页”;有把握的高频字一键完成,其他单拼字带调两键输入,双拼字带调三键输入;双字词根据其所含字分为三种情况两个单拼字两键输入,一单一双三键输入,两个双拼字四键输入;三字词三键、四字词四键,只输入首键;五字词以上输入前三字和末字的首键,共四键;输入完毕后,点按SEND键发出信息;9)这种输入法也可应用于汉语拼音等其他涉及到华语的拼音。
5.一种小键盘智能拼音文字,其特征在于1)这种拼音文字无须记忆,直接把拼音文字输入即可,基本上无重码;每一个输入空格键(Space)或标点符号时,视为前一单词输入完毕,若无重码,前一单词会连同其后的空格或标点一起自动上屏;有重码时,选择所需后前一单词会连同其后的空格或标点一起自动上屏;小键盘单拼輸入法的键盘布局如后;其中“阿拉伯数字”和“其他标点”在键位能增加时可安排专用键,一键按出后选择,以减少按键次数; 2)这种拼音文字可使用简码词,每一简码词的拼写形式都是唯一的,特征是没使用声调符,因而不会产生任何混淆;简码词也可用全拼词代替,二者等效,可相互转换。
全文摘要
本发明公开了一种国际音标方案,华语工具书编排法和小键盘输入法。国际音标不超出英语通用键盘的26个字母和符号的范围,把26个字母全部用上,既可用于英语等标注,又可独立形成音标文字。华语工具书的编排法全部以拼音起头,以词为导向,以拼音代码标注词类,以前后环衬编排索引,与国际流行语言工具书完全接轨,查阅时一步到位。龚码单拼输入法大小键盘通用,使用专用的标调键,充分利用第一键,实现了字字分流、字词分流、词词分流;许多字可一键输出,平均每字小盘1.72键,大盘1.5键,是一种快速、易学的输入法。小键盘智能龚拼无须记忆,使用专用的标调键,基本无重码,可满足广大不愿学中文输入法的用户利用小键盘发送信息的需要。
文档编号B42D1/00GK1672957SQ20051005239
公开日2005年9月28日 申请日期2005年2月21日 优先权日2004年3月6日
发明者龚学胜 申请人:龚学胜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1