汉字序码输入方案的制作方法

文档序号:6606017阅读:386来源:国知局
专利名称:汉字序码输入方案的制作方法
技术领域
本发明涉及一种汉字的计算机编码输入方法,具体是用汉字的字音和四角号码来编码并输入汉字的方案。
本发明针对现有汉字编码中“音码”重码过多,“音形码”、“形码”和“数字码”均存在编码负担的缺陷,采用《汉语音字方案》(参见本申请人已申请的专利“汉语音字输入方案”,专利申请号为97107826.2)和《四角号码查字法》来进行编码,基本上不存在编码负担,还便于用计算机键盘来输入,是易学易用的高效率编码输入形式。
本发明涉及的“汉语音字方案”,其作用在于获得“汉语音字拼音”(下称“音字拼音”),具体方法是通过确定三十四个字母的名称来按“切音方式”合成音节。三十四个字母的名称为(对应汉语拼音节)Aa-ngà、Bb-bie、Cc-cuang、Dd-diao、Ee-e、Ff-fou、Gg-gang、Hh-han、Ii-zhi、Jj-jiang、Kk-kao、Li-Iue、Mm-mian、Nn-nen、Oo-shuo、Pp-ping、Qq-qia、Rr-ruan、Ss-sun、Tt-tin、Uu-chu、Vv-vai、Ww-wei、Xx-xiu、Yy-yu、Zz-zong、ηη-ngeng、∑ε-e、JIπ-zhua、Ψψ-chuai、ΦΦ-shui、⊥⊥-yin、∧∧-yang、γγ-shang,其中⊥、∧、γ作为专用标调字母,去声不标调,轻声在声母之前加符号“.”,∑作为零声母,儿化音节在第一个字母之后加符号“”。
按“切音方式”合成的音节如Yi⊥-yi、Ys∧-yun、Nyγ-nu、Ls-lun、Ma-ma、∑a⊥-a、∑η⊥-eng、H;π⊥-huar。
本发明涉及的《四角号码查字法》,其作用是区分字形,又不增加编码负担。具体取码方法完全采用四角号码查字取码方法,此处从略。
本发明的技术方案如下一、字码由省略声调后的音字拼音和四角号码组成,如(为清晰起见,字母的书写区分了大小写,但键入不区分大小写)如端-Dr0212、芒-Mg4471、以-Yi2870、住-Лu2021。
二、词码,有两种形式
1.分词用字码但要省略四角号码作为词码,如大-Da、小-Xd、大小-DaXd。区分重码可采用以下两种方式取识别码。
(1)二位识别码单字词取前两位四角号码,多字词取首尾两字的第一位四角号码,如由-Yf50、油-Yf35、邮-Yf57、游-Yf38、又-Yf17、景片-JpPm62、镜片-JpPm82、中国话-ЛzGoHπ53、中国画-ЛzGoHπ51。
(2)四位识别码单字词取四位四角号码,多字词在二位识别码的基础上增加首尾两字的第二位四角号码,如有-Yf4022、右-Yf4060、游船-YfΨr3287、油船-YfΨr3257。
2.分词用第一字的四角号码,其余字的第一、第二位四角号码,如电-5071、电视-507137、电视机-50713747。区分重码可采用以下四种方式取识别码(1)二位识别码单字词独体字取靠近右下角上方、左下角上方一个笔形代码,非独体字取左右结构的右部分、上下结构的下部分(左中右结构、上中下结构优先从部首处拆分,包围结构的被围部分按上下结构的下部分处理)靠拆分线一边的两个角的笔形代码。多字词取尾字的第三、第四位四角号码。例如代-232440、俊-232424、接手-50042050、接受-50042040、金钱草-8010834440、金钱花-8010834421。
(2)四位识别码单字词独体字在二位识别码的基础上增加右上角下方、左上角下方一个笔形代码,非独体字增加与其相对的另一部分的两个角或自身的另两角(包围结构)的四角号码。
多字词在二位识别码的基础上增加“尾字的二位识别码”。例如这-30300040、遮-30300023、家事-3023500076、家史-3023500060。
(3)声母识别码取首字或尾字的声母,如香-2060X、番-2060F、工事-101050G、正事-101050Л、豆苗-101044M、豆薯-101044Φ。
(4)声韵识别码取首字或尾字的声母和韵母,如伸-2520ΦN、使-2520ΦI、人手-800020RN、入手-800020RU、小商-900000ΦG、小市-900000ΦI。
三、音字码1.分词用字码但要标明声调和省略四角号码作为音字码,其中专名(包括专名成分)的尾字用数目字3、2、5、4、1来作为标调部分,依次表示阴平、阳平、上声、去声、轻声,可以用识别码区分重码,也可以用分组标调字母区分重码。例如直言-Лi∧Yh∧、纸烟-ЛiγYh⊥、后勤-HfQt∧、后秦-HfQt2、尝受-ψg∧φf92、长寿-ψg∧φf45(或ψgΨφf)、长寿县-ψg∧φf4Xm4。
2.采用音字拼音,但词的第一个音节用数目字开头标调,专名用3、2、5、4、1,非专名相应用7、8、9、6、0,作为音字码的快速键入形式(消除词与词之间的空格),如后勤-6HfQt∧、后秦-4HfQt∧、长寿-8ψgφf、长寿县-2ψgφf4Xm。
本发明的键位设置采用计算机标准键盘,把计算机主键盘的十个数目字键位向上移动一排并增加键位至占满这一排,最后一个键位为复原键,原1到0十个键位依次为“η、Л、Ψ、Φ、《、》、⊥、∧、γ、∑”键位(按下复原键后,这些键位还原为1到0十个数目字键位)。采用汉语音字键盘来输入汉字序码,一百个两位序数从“00”到“99”分布在主键盘的五十个键位上,不包括数目字键位,同一键位的大小写字键代替的序数之差为五十,作为“键码”,编码的数字代码部分用键码输入,不区分大小写,音字码可以只保留首字(包括单字词)的声调。键码对应的序数,作为字母的数码形式,但标调字母⊥、∧、γ和表示儿化音节的符号“”可以用数目字7、8、9、6来代替。
本发明以音字拼音和四角号码为依据,编码的“键码”与“数码”协调一致,基本上不存在取码负担。字码用四键输入,很少出现重码。词码和音字码重码较多,但消除重码非常简易。音字码是汉语音字的计算机应用形式,其键入速度可以超过现行的汉字编码。因此,本发明对于面向学生的计算机教学,面向国民的计算机应用,面向社会的“推普”和“汉字拼音化”都能发挥积极的作用。
权利要求
1.汉字序码输入方案,其特征在于采用音字拼音(用三十四个字母按“切音方式”合成音节)和四角号码作为字码,字码的字母序数和四角号码直接作为数码(1)字码由省略声调后的音字拼音和四角号码组成;(2)词码有两种形式①分词用省略声调的音字拼音为词码,区分重码可采用以下两种方式取识别码A.二位识别码单字词取前两位四角号码;多字词取首尾两字的第一位四角号码;B.四位识别码单字词取四位四角号码;多字词在二位识别码的基础上增加首尾两字的第二位四角号码;②分词用第一字的四角号码,其余字的第一、第二位四角号码,区分重码可采用以下四种方式A.二位识别码单字词独体字取靠近右下角上方、左下角上方的四角号码,非独体字取左右结构的右部分,上、下结构的下部分靠近拆分线一边的两个角的四角号码;多字词取尾字的第三、第四位四角号码;B.四位识别码单字词独体字在二位识别码的基础上增加右上角下方、左上角下方一个四角号码;非独体字增加与其相对的另一部分的两个角或自身的另两角(包围结构)的四角号码;多字词在二位识别码的基础上增加尾字的二位识别码;C.声母识别码取首字或尾字的声母;D.声韵识别码取首字或尾字的声母和韵母;(3)音字码有两种方式①采用音字拼音,其中专名的尾字用数字3、2、5、4、1来标调,依次表示阴平、阳平、上声、去声、轻声;②采用音字拼音,但词的第一个音节用数字开头标调;专名用3、2、5、4、1,非专名用7、8、9、6、0来消除词与词之间的空格;(4)键位设置将计算机标准键盘的十个数字键位向上移动一排,增加一排键位,最末一个键位为复位键,原1到0十个键位依次改为η、Л、Ψ、Φ、《、》、⊥、∧、γ、ε键位;主键盘的五十个键位上分布00-99共一百个两位序数,同一键位的大小写字键代替的序数之差为五十。
2.根据权利要求1所述的汉字序码计算机输入方案,其特征在于按“切音方式”合成音节,三十四个字母的名称为Aa-ngà、Bb-bie、Cc-cuang、Dd-diao、Ee-e、Ff-fou、Gg-gang、Hh-han、Ii-zhi、Ji-jiang、Kk-kao、Li-lue、Mm-mian、Nn-nen、Oo-shuo、Pp-ping、Qq-qia、Rr-ruan、Ss-sun、Tt-tin、Uu-chu、Vv-vai、Ww-wei、Xx-xiu、Yy-yu、Zz-zong、ηη-ngeng、∑ε-e、ππ-zhua、Ψψ-chuai、ΦΦ-shui、⊥⊥-yin、∧∧-yang、γγ-shang,其中⊥、∧、γ作为专用标调字母,去声不标调,轻声在声母之前加符号“.”,∑作为零声母,儿化音节在第一个字母之后加符号“”。
全文摘要
本发明涉及一种汉字序码输入方法,采用音字拼音(用三十四个字母按“切音方式”合成音节)和四角号码作为字码,字码的字母序数和四角号码直接作为数码。本发明避免了汉字编码中“音码”重码过多,“音形码”、“形码”和“数字码”均存在编码负担的缺陷,基本上不存在编码负担,还便于用计算机键盘来输入,是易学易用的高效率编码输入形式。
文档编号G06F3/023GK1241742SQ99115070
公开日2000年1月19日 申请日期1999年8月9日 优先权日1999年8月9日
发明者余彦中 申请人:余彦中
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1