一号码汉字输入法的制作方法

文档序号:6330408阅读:578来源:国知局
专利名称:一号码汉字输入法的制作方法
技术领域
本发明涉及一种汉字输入方法,属于中文信息输入与处理领域。
计算机汉字输入方法已近千种,大致可分为音码、形码和音形码三类。音码易学,但是由于汉语同音字多故重码多,输入速度慢;形码输入速度快,但字根复杂不易记忆,且其拆分字根不符合汉字书写规则;现有的音形码,如自然码,以双拼为主,后面可以加形码区分同音字,输入单个汉字比纯音码有所改进,但自然码的字根“表音”、“表形”和“硬行规定”混杂在一起,难以记忆,形码的取码顺序不统一,输入时难以快速判断,影响输入速度。
本发明的目的旨在提供一种易记忆、取码简单、输入速度快的计算机汉字声码输入法。
本发明的目的是这样实现的一种由逻辑运算部件、存储部件、视频显示部件和普通英文键盘组成的一号码汉字输入法,其特征是所述的输入法包括(1)取汉字的汉语拼音的第1字母,以第1字母所对应的英文字母为代码;(2)取汉字的偏旁部首,偏旁部首分为成字偏旁部首、非成字偏旁部首和单一笔划;成字偏旁部首是指可直接作为一个汉字独立使用的偏旁部首,其本身就是一个完整的汉字,如“八辰歹豆耳风弓火金口龙木女皮气日石田王页足……”取其汉字拼音的第1字母,以第1字母对应的英文字母作为其代码;非成字偏旁部首是由汉字衍变、引申而来,其形态与原汉字相比改变较大,不可作为汉字使用,如“ ”是“卜”的变形,取原汉字拼音第1字母,以第1字母对应的英文字母作为非成字偏旁部首的代码,其对应关系如下B宀冖(宝)疒(病) (卜) (八) (半) (匕)、C艹廾(草) (厂)镸(长)、D刂 勹(刀) (斗)、E 阝 (耳)亠冫 (二)、F (丰)、G (艮) (个)、H(虎) (火)、J (己)钅(金)K口冂 匚(框)、L (六)、M罒(皿)、N 牜(牛) (廿)P 丬 ( )、Q (曲) (七)、R 亻彳 (人)、S氵彡巛(三)厶(私)扌 (手) (水) 纟(丝)饣(食)礻(示) (尚) (豕)、W攵夊(文) (无)X 彐 彑(雪)忄 (心) (下)(小)、Y 讠(言)衤(衣)肀 (易) (羊) (云)、Z 辶廴(走)犭 (爪)(竹) (正) (足) (止)T (土)非成字偏旁部首是通过括号内的汉字的衍变、引伸得来的;单一笔划是横一 竖丨 亅、撇丿、捺 折 乚乛乙,取其横、竖、撇、捺和折的拼音的第1字母,以其对应的英文字母为其代码,对应关系如下H一 S 丨 亅、P 丿、N Z乚乛乙单一笔划中的一和乙两个虽然是两个汉字,但是在汉字拆分时不能作为成字偏旁部首,只能作为单一笔划;(3)汉字的拆分,将汉字分成独体字和合体字a.独体字是指结构简单、不含偏旁部首、笔划相互交连不可拆分的汉字,其拆分按笔划顺序拆分成单一笔划;b.合体字是指内含相对独立的偏旁部首的汉字,按其结构分成左右结构、上下结构、内外结构和交错结构的汉字;交错结构是指书写顺序与空间结构排列不一至;半包围结构的汉字按其外围结构的第一笔划与剩下部分的位置关系划分为上下或左右结构;其中左右结构、上下结构、内外结构为规范结构,在划分汉字结构时规范结构优先;其拆分是成全偏旁部首的前提下,按照取大弃小、前者优先原则,从一个方向将偏旁部首拆分出来,按拆分后的偏旁部首第1笔划的书写顺序进行排列;合体字从一个方向拆分,拆分出偏旁部首剩下部分无法拆分部分就定义为不规则结构,其代码用汉字的韵母第1字母对应的英文字母代替;合体字从一个方向拆分,拆分不出偏旁部首,需进行二次拆分,二次拆分可从另一方向进行拆分,拆分出的偏旁部首按其第1笔划的书写顺序进行排列;(3)汉字的编码,取汉字拼音的代码为第1码,汉字拆分后的第1、2偏旁部首为第2、3码;对拆分后不止二个偏旁部首的取最后的偏旁部首作为第4码;汉字词组的编码,二字词组取第1和第2汉字的第1、2代码;三字词组取第1汉字的第1、2代码和第2、3汉字的第1代码;四字和四字以上的词组取第1、2、3和最后1个汉字的第1代码。


发明内容
中所述的汉字编码,在不足4码时,用汉字韵母第1字母对应的英文字母为代码,为第4码。
本发明具有下列优点(1)根据汉字结构特点和书写顺序,将汉字拆分成偏旁部首,对汉字中非偏旁部首单独处理,使汉字拆分简单、直观和规范;(2)以汉字本身发音和偏旁部首对应汉字的发音取码,使汉字取码和编码容易理解和记忆;(3)仅以汉字发音声母或韵码的的首字母对应的英文字母为代码,就不需区分平舌、卷舌音,克服因发音不标准造成的障碍;(4)编码简洁,速度快,汉字输入一般只需3码即可完成,也可以输入第4码减少重码率,提高输入速度。
下面结合实施例对本发明进一步描述。
由逻辑运算部件、存储部件、视频显示部件和普通英文键盘组成的一号码汉字输入法,所述的输入法包括(1)取汉字的汉语拼音的第1字母,以其所对应的英文字母为代码;如“填”拼音的第1字母为“T”代码为“T”、“生”拼音的第1字母为“S”为代码,“饵”拼音的第1字母“E”为代码;(2)取汉字的偏旁部首,偏旁部首分为成字偏旁部首、非成字偏旁部首和单一笔划;成字偏旁部首是指可直接作为一个汉字独立使用的偏旁部首,其本身就是一个完整的汉字,如“八长歹豆耳风弓火口龙木女皮气日石田王页足……”取其汉字拼音的第1字母,以其所对应的英文字母作为其代码;如“八”的拼音的第1字母为“B”,取“B”为代码;“长”的拼音的第1字母“C”,则代码为“C”;“耳”的拼音的第1字母为“E”,则代码为“E”;非成字偏旁部首是由汉字衍变、引申而来,其形态与原汉字相比改变较大,不可作为汉字使用;如“ ”是汉字“卜”的变形,“镸”是汉字长的引申,“ ”是汉字“丰”的变形而来的;取原汉字拼音第1字母,以第1字母对应的英文字母作为非成字偏旁部首的代码,其对应关系如下B宀冖(宝)疒(病) (卜) (八) (半) (匕)、C艹廾(草) (厂)镸(长)、D刂 勹(刀) (斗)、E卩阝 (耳)亠冫 (二)、F (丰)、G (艮) (个)、H(虎)灬 (火)、J (己)钅(金)K口冂 匚(框)、L (六)、M罒(皿)、N 牜(牛) (廿)P 丬 ( )、Q (曲) (七)、R 亻彳 (人)、S 氵彡巛(三)厶(私)扌 (手) (水) 纟(丝)饣(食)礻(示) (尚) (豕)、W攵夊(文) (无)X 彐 彑(雪)忄 (心) (下)(小)、Y 讠(言)衤(衣)肀 (易) (羊) (云)、Z 辶廴(走)犭 (爪)(竹) (正) (足) (止)T (土)非成字偏旁部首是通过括号内的汉字的衍变、引伸得来的;单一笔划是横一 竖丨亅、撇丿、捺 折 乚乛乙,取其横、竖、撇、捺和折的声母的首字母,以其首字母对应的英文字母为其代码,对应关系如下H一 S 丨亅、P 丿、N Z乚乛乙单一笔划中的一和乙两个虽然是两个汉字,但是在汉字拆分时不能作为成字偏旁部首,只能作为单一笔划;(3)汉字的拆分,将汉字分成独体字和合体字a.独体字是指结构简单、不含偏旁部首、笔画相互交连不可拆分的汉字,其拆分按笔划顺序拆分成单笔偏旁部首;如“我申身重秉尸等等”;“口”拆分成“竖、折、横”,“重”拆分成“撇、横、竖、折、横、横、横、横、竖”。
b.合体字是指内含相对独立的偏旁部首的汉字,按其结构分成左右结构、上下结构、内外结构和交错结构的汉字;交错结构是指书写顺序与空间结构排列不一至;半包围结构的汉字按其外围结构的第一笔划与剩下部分的位置关系划分为上下或左右结构;其中左右结构、上下结构、内外结构为规范结构,在划分汉字结构时规范结构优先;左右结构的汉字如“任横撇孙顺损……”,上下结构的汉字如“全泉紧堡秃艾 ……”,内外结构的汉字如“国阗冈闪回圈……”,半包围结构的汉字“这追道习处存友……”,“这”的外围结构“辶”第1笔划与“文”是左右关系所以划为左右结构,“习”的外围结构“ ”第1笔划与“冫”是上下关系所以划为上下结构;交错结构的汉字如“可式座爽……”,在划分汉字结构规范优先,即可划入交错结构又可划如规范结构的汉字要划入规范结构,如“示”应划入上下结构“二、小”而不是划入交错结构“亍、 丶”。
其拆分是成全偏旁部首的前提下,按照取大弃小、前者优先原则,从一个方向将偏旁部首拆分出来,按拆分后的偏旁部首第1笔划的书写顺序先后进行排列;也就是拆分时按大的偏旁部首取,对即可归入前面的偏旁部首又可归入后面的偏旁部首的部分,归入前面的偏旁部首。左右结构如“故“拆分成“古”和“攵”,“到”拆分成第1偏旁部首“至”和第2偏旁部首“刂”,“做字的“古”是归入“亻”形成“估”也可归入“攵”成“故”根据“前者优先”原则“做”拆分成第1偏旁部首“估”和第2偏旁部首“攵”;“打”拆分成第1偏旁部首“扌”和第2偏旁部首“丁”,“治”拆分成第1偏旁部首“氵”和第2偏旁部首“台”,“郴”字拆分成第1偏旁部首“林”和第2偏旁部首“阝”;上下结构如“笼”拆分成第1偏旁部首“”和第2偏旁部首“龙”,“荨”拆分成第1偏旁部首“艹”和第2偏旁部首“寻”,“吕”字拆分成第1偏旁部首“口”和第2偏旁部首“口”,“架”字拆分成第偏旁部首“加”和第2偏旁部首“木”,“蓦”字可拆分成“艹”、“日”、“大”和“马”根据“取大弃小”原则,应拆分成第1偏旁部首“莫”和第2偏旁部首“马”;内外结构如“圈”拆分成第1偏旁部首“口”和第2偏旁部首“卷”,“国”拆分成第1偏旁部首“口”和第2偏旁部首“玉”,“周”拆分成第1偏旁部首“冂”和第2偏旁部首“吉”;半包围结构如“这”字按左右结构汉字拆分,拆分成第1偏旁部首“辶”和第2偏旁部首“文”,“魔”字按上下结构汉字拆分,拆分成第1偏旁部首“麻”和第2偏旁部首“鬼”;交错结构如“可”拆分成第1偏旁部首“丁”和第2偏旁部首“口”;“式”拆分成第1偏旁部首“弋”和“工”合体字从一个方向拆分,拆分出偏旁部首后剩下无法拆分的部首,这部分就定义为不规则结构,其代码用汉字的韵母第1字母对应的英文字母代替;如“伞”拆分成第1偏旁部首“ ”和不规则结构“ ”,不规则结构用“伞”的韵母第1字母“A”作为其代码,合体字从一个方向拆分,拆分不出偏旁部首,需进行二次拆分,二次拆分可从另一方向进行拆分,拆分出的偏旁部首按其第1笔画的书写顺序进行排列;如左右结构的“能”从左到右一次拆分成“ ”和“ ”都不是偏旁部首需进行二次拆分,“ ”从上到下拆分成第1偏旁部首“ ”和第2偏旁部首“月”,“ ”拆分成第3偏旁部首“ ”和最后偏旁部首“ ”。
(4)汉字的编码,单个汉字的编码取汉字的声母的代码为第一码,汉字拆分后的第1、2偏旁部首为第2、3码;对拆分后不止二个偏旁部首的取最后的偏旁部首作为第4码;a.独体字的编码“口”字取其声母“K”为第1码,“口”拆分成“竖、折、横”,“竖、折”为第1、2偏旁部首为第2、3码用“S、Z”作代码,“竖”为最后的偏旁部首为第4码用“S”为代码,“口”的编码为“KSZS”;“重”第1码为“C”,拆分成“撇、横、竖、折、横、横、横、横、竖”,第2、3、4码为“PHS”,其编码为“CPHS”b.合体字的编码左右结构的汉字“故”第1码为声码为“G”,拆分成“古”和“攵”,第2、3码为“GW”,其编码为“GGW”;“到”第1码为“D”,拆分成“至”和“刂”,第2、3码为“Z、D”,其编码为“DZD”;“做”字的第1码为“Z”,“做”拆分成“估”和“攵”,第2、3码为“G、W”,其编码为“ZGW”。“能”从左到右一次拆分成“ ”和“ ”都不是偏旁部首需进行二次拆分,“ ”从上到下拆分成第1偏旁部首“ ”和第2偏旁部首“月”,“ ”拆分成第3偏旁部首“ ”和最后偏旁部首“ ”。其编码为“SYBB”上下结构的汉字“笼”第1码为“L”,拆分成“”和“龙”,第2、3码为“Z、L”,其编码为“LZL”;“荨”拆分成“艹”和“寻”,第2、3码为“C、X”,其编码为“QCX”;“蓦”字第1码为“M”,拆分成“莫”和“马”,第2、3码为“MM”,其编码为“MMM”;“伞”第1码为“S“,拆分成“人”和“ ”,“ ”为不规则部分,第2、3码为“R、A”,其编码为“SRA”。
内外结构的汉字“圈”第1码为“Q”,拆分成“口”和“卷”,第2、3码为“KJ”,其编码为“QKJ”;“国”第1码为“G”,拆分成“口”和“玉”,第2、3码为“KY”,其编码为“GKY”;“周”第1码为“Z”,”,拆分成“冂”和“吉”,第2、3码为“KY”,其编码为“ZKY”。
半包围结构的汉字“这”字第1码为“X”,拆分成“辶”和“文”,第2、3码为“ZW”,其编码为“ZZW”;“魔”字第1码为“M“,拆分成“麻”和“鬼”第2、3码为“MG”,其编码为“MMG”。
交错结构的汉字如“可”第1码为“K”,拆分成第1偏旁部首“丁”和第2偏旁部首“口”,第2、3码为“DK”,其编码为“KDK”;“式”的第1码为“S”,拆分成第1偏旁部首“弋”和“工”,第2、3码为“YG”,其编码为“SYG”。
成字偏旁部首在作为独立的汉字使用时,也是按照上述方法进行拆分和编码。
c.汉字词组的编码二字词组如“我们”第1码为“W”、第2码为“P”第3码为“M”、第4码为“R”,编码为“WPMR”。
三字词组如“计算机”,编码为“JYSJ。
四字和四字以上的词组如“实事求是”,编码为“SSQS”,“中国工商银行”,编码为“ZGGH”。
汉字编码,在不足4码时,可用汉字韵母的首字母对应的英文字母为代码,为第4码,可以减少重码率,如“故”第1码为声码为“G”,拆分成“古”和“ ”,第2、3码为“GW”,第4码为“U”,其编码为“GGWU”;“蓦”字第1码为“M”,拆分成“莫”和“马”,第2、3码为“MM”,第4码为“O”,其编码为“MMMO”;“圈”第1码为“Q”,拆分成“口”和“卷”,第2、3码为“KJ”,第4码为“U”,其编码为“QKJU”;“魔”字第1码为“M“,拆分成“麻”和“鬼”,第2、3码为“MG”,第4码为“O”,其编码为“MMGO”。
权利要求
1.一种由逻辑运算部件、存储部件、视频显示部件和普通英文键盘组成的一号码汉字输入法,其特征是所述的输入法包括(1)取汉字的汉语拼音的第1字母,以第1字母所对应的英文字母为代码;(2)取汉字的偏旁部首,偏旁部首分为成字偏旁部首、非成字偏旁部首和单一笔划;成字偏旁部首是指可直接作为一个汉字独立使用的偏旁部首,其本身就是一个完整的汉字,取其汉字拼音的第1字母,以第1字母所对应的英文字母作为其代码;非成字偏旁部首是由汉字衍变、引申而来,其形态与原汉字相比改变较大,不可作为汉字使用,取原汉字拼音第1字母,以第1字母对应的英文字母作为非成字偏旁部首的代码,其对应关系如下B宀冖疒 丷C艹廾 镸、D刂 勹 E 阝 亠冫 F G H灬、 J 钅K口冂 匚、L M罒、N 牜 P 丬 Q R 亻彳 、S 氵彡巛厶扌纟饣礻 W攵夊 X 彐 彑忄Y 讠衤肀 Z 辶廴犭  T 单一笔划是横一 竖丨亅、撇丿、捺 折 乚乛乙,取其横、竖、撇、捺和折的声母的首字母,以其首字母对应的英文字母为其代码,对应关系如下H一 S丨亅、P丿、N Z乚 乙单一笔划中的一和乙两个虽然是两个汉字,但是在汉字拆分时不能作为成字偏旁部首,只能作为单一笔划;(3)汉字的拆分,将汉字分成独体字和合体字a.独体字是指结构简单、不含偏旁部首、笔划相互交连不可拆分的汉字,其拆分按笔划顺序拆分成单一笔划;b.合体字是指内含相对独立的偏旁部首的汉字,按其结构分成左右结构、上下结构、内外结构和交错结构的汉字;交错结构是指书写顺序与空间结构排列不一至;半包围结构的汉字按其外围结构的第一笔划或笔划的起始部分与剩下部分的位置关系划分为上下或左右结构;其中左右结构、上下结构、内外结构为规范结构,在划分汉字结构时规范结构优先;其拆分是成全偏旁部首的前提下,按照取大弃小、前者优先原则,从一个方向将偏旁部首拆分出来,按拆分后的偏旁部首第1笔划的书写顺序进行排列;合体字从一个方向拆分,拆分偏旁部首后剩下无法拆分的部分就定义为不规则结构,其代码用汉字的韵母第1字母对应的英文字母代替;合体字从一个方向拆分,拆分不出偏旁部首,需进行二次拆分,二次拆分可从另一方向进行拆分,拆分出的偏旁部首按其第1笔划的书写顺序进行排列;(3)汉字的编码,取汉字的拼音的代码为第1码,汉字拆分后的第1、2偏旁部首为第2、3码;对拆分后不止二个偏旁部首的取最后的偏旁部首作为第4码;汉字词组的编码,二字词组取第1和第2汉字的第1、2代码;三字词组取第1汉字的第1、2代码和第2、3汉字的第1代码;四字和四字以上的词组取第1、2、3和最后1个汉字的第1代码。
2.如权利要求1所述的一号码汉字输入法,其特征是所述的汉字编码,在不足4码时,用汉字韵母的第1字母对应的英文字母为代码,为第4码。
全文摘要
本发明涉及一种一号码汉字输入法,本发明中汉字的编码为3码或4码,以汉字的拼音第1字母对应的英文字母为代码,取汉字拼音第1字母的代码为第1码,将汉字拆分成偏旁部首,以偏旁部首对应的汉字的拼音的第1字母,以其对应的英文字母为代码,取第1、2偏旁部首的代码为第2、3码;对于汉字拆分出的偏旁部首超过2个偏旁部首的,取最后的偏旁部首的代码为第4码,对于3码输入的汉字,可取汉字拼音的韵母的第1字母的代码为第4码;本发明具有简单易记,汉字拆分简单、易学,编码简单快速,重码率低。
文档编号G06F3/023GK1369767SQ0110711
公开日2002年9月18日 申请日期2001年2月12日 优先权日2001年2月12日
发明者廖业川 申请人:廖业川
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1