九三码汉字输入方法及键盘的制作方法

文档序号:6410743阅读:441来源:国知局
专利名称:九三码汉字输入方法及键盘的制作方法
技术领域
本发明属汉字键盘输入与中文信息处理领域,具体地是一种九三码汉字输入方法及键盘。
目前汉字输入技术发展很快,输入方法众多,但汉字输入仍然是中文信息现代化的瓶颈,主要问题在于目前汉字输入技术仍然处于“容易学的打不快,打得快的不易学”这种状态;如《五笔字型》最常用,它有重码率低、可实现快速盲打等优点,但是其字根数量大、记忆困难,汉字的拆分有一定的难度,不利普及推广;《自然码》符合音托的规律,便于记忆,缺点是采用“最显眼”方法,选部件易产生二义性、且字根量也大,难以记忆。
本发明的目的是推出一种部件数量少、易学易记、重码率低、文字拆分规范性强、键符安排合理的汉字输入方法及键盘,且对汉字字集扩大时有较强的适应性。
本发明通过如下方法实现把汉字的笔画种类、笔画关系种类、汉字部件种类、汉字字型种类都同时划分为三种,分别用1、2、3三个数字表示,把键盘划分为三行三大列,每大列又分为三小列,每个键位用1、2、3三个数字组成的三位数代号表示。
汉字的拆分遵循下列原则a、不交原则指除了笔画部件之间可以相交之外,其它部件之间均不允许相交,但可以相连;b、最小原则指在汉字的拆分过程中,按首部件、尾部件、剩余部件的顺序,优先选用部件种类代号数较小的部件拆分方法进行拆分;c、最大原则指在满足最小原则前提下,按书写顺序尽可能拆出大的基本部件或笔画部件,以及尽可能使最小种类部件优先取大。
汉字的编码采用公式编码即a、基本部件编码=基本部件键位码+〔成字音码〕+首尾字型码至四码
b、单字编码=首码+〔余1码〕+〔余2码〕+<成字补码>+尾码+<三笔音码>+<首尾字型码>
c、词组的编码=首码+〔余1码〕+〔余2码〕+<成字补码>+尾码式中①无括号的码为必选码;②〔 〕内的码为可选的,部件存在时选其对应的码;③< >内的码为补选码,当由必选码及可选码组成的编码信息量不足时,选用补选码。
由于本方案采用1、2、3三个数字定义了汉字的组成,组成关系及键盘的分区,且键盘划分为九列三行的形式,故称九三码,本发明具有以下优点及积极效果1、规范性把部件划分为三种,采用“音托”、“形托”、“坐标依托”的方式进行键符安排,采用最小原则等拆分方法;笔画提取顺序和取码顺序相同;简体和繁体汉字以及任何汉字都可进行编码。2、易学性基本部件数量少,拆分规则简单;编码采用公式;这样,需长期记忆的内容较少,容易记住。3、快速性编码采用公式重码率低(重码率<4.3%,其中一级字库重码率只有63对);系统若再实行智能化,可以实行快速盲打。
下面通过实施例详述本发明的实施方法。


图1为本发明键盘分区及键位代号本发明把汉字笔画分为竖画、横画和折画三种,分别用1、2、3作代号,见表1。
表1 汉字的三种笔画及其代号
本方案将汉字笔画之间的关系分为相连、分散、交叉三种,分别用1、2、3作代号,单独的笔画用23作代号,见表2。
表2 汉字笔画间的关系及其代号
本方案将汉字部件种类分为基本部件、成字部件和笔画部件三种,分别用1、2、3作代号,参见表3。
表3 汉字的三种部件及其代号
三种部件在汉字中所处的位置可以分为首部件、尾部件和剩余部件三种,简称首、尾、余,首部件指按笔画顺序组成一个汉字的第一个部件,尾部件指按笔画顺序组成一个汉字的最后一个部件,剩余部件指除首部件和尾部件之外剩余的部分,按笔画顺序可分为第一剩余部件、第二剩余部件……,简称余1、余2……等。例如“部”字中,“亠”为首部件,“阝”为尾部件,“ ”为余1部件,“口”为余2部件;“题”字中,“曰”为首部件,“贝”为尾部件,“一”为余1部件,“止”为余2部件。
本方案中把汉字字型种类分为上下型、左右型、交围型三种,分别用1、2、3表示,见表4。
表4 汉字的三种字型及代号
参见图1,本方案中把标准键盘的字符区分为三行三大列,每大列又分为三小列,用1、2、3三个数字组成,一个三位数表示一个键位代码,其中百位数是行代号、十位数是大列号、个位数是小列号。
本方案选取了58种基本部件,基本上以“音托”或“形托”方式分布在各键位上,形成基本部件代码,其对应关系见表5。
表5基本部件在键盘上的分布
汉字的成字部件的代码称为成字代码,是根据成字部件在汉字中的位置取相应的三个笔画的代号来表示,当首部件和余部件为成字部件时,按笔画取前三个笔画的代号,尾部件为成字部件时,按笔画取最后三个笔画的代号,如果不够三画,则用笔画关系作补充,三位数对应的键位,即为该成字部件的代码,如“毽”字,首部件“毛”和余部件“聿”为成字部件,它们前三画代号分别为“122”、“322”,则成字代码分别为“G”、“B”;“尴”字中,首部件“九”和尾部件“皿”为成字部件,“九”字的两个笔画代号,加这两个笔画关系的代号组成三位数“133”、“皿”字的尾三画代号为“112”,其成字代码分别为“L”“S”。
当汉字中剩余部件不足两个时,为了保证提取足够的汉字信息,则需用成字补码来表示补充信息,即若成字代码取成字部件的首部件,则成字补码取其尾部件;反之,则取其首部件。在下列两种情况下使用成字补码1、汉字中只有一个剩余成字部件时,仅该剩余成字部件要用成字补码。
2、汉字中没有剩余部件时,对所有的成字部件要用成字补码。
例如“辅”字,成字部件“车”和“甫”的成字代码为“U(231)”和“Q(211)”,由于没有剩余部件,故需用“车”和“甫”的成字补码“Y(223)”、“E(213)”;“键”字只有一个剩余成字部件“聿”,其成字补码为“R(221)”。
表示笔画部件的代码称为笔画代码,按书写顺序取笔画的代号及笔画关系的代号,组成一个三位数,其对应的键位就是笔画代码,如“我”字,可用“123(H)”、“231(U)”和“123(H)”来作为笔画部件的代号。
有些汉字,其构成部件相同,但因部件在字中所处位置不同,组成的字也不同,则需用首尾字型码来区分。即“首部件种类代号+尾部件种类代号+字型代号”组成一个三位数,其对应的键位称为首尾字型码,如“只”和“叭”两字构成的部件相同,但它们的首尾字型码分别为“111(A)”和“112(S)”。
本方案中汉字的拆分遵循下列原则①、不交原则指除了笔画部件之间可以相交外,其它部件之间均不允许相交,但可以相连,这样就解决了一些相交叉的笔画块的拆分,避免因拆分而引起的二义性。例如“贲”安应拆成“十、艹、贝”,而不应拆分成“土、、贝”,“吏”字由“213(E)”和“211(Q)”两个笔画部件交叉组成。
②、最小原则,可以用部件种类数最小公式来表示,即部件种类数=首+尾+余1+余2=最小四位数其中部件种类数由部件种类的代号组成,若没有剩余部件则用“O”表示,例如“思”字,首部件“田”、尾部件“心”都是基本部件,没有剩余部件,则其部件种类数为“1100”,同理可知“我“字的部件种类数为“3330”,在拆分汉字时,优先采用部件种类数最小的方法进行拆分,如“主”字应拆分为“亠、土”,而不拆为“、王”,因前者部件种类数为“1100”,小于后者“3100”,“天”字应拆分为“干、”,而不应拆为“一、大”,因前者部件种类数“2300”小于后者“3100”。
③、最大原则指在满足最小原则前提下,按书写顺序层可能拆出大的基本部件或笔画部件及尽可能使最小种类部件优先取大,例如“我”字应拆分为“123(H)、231(U)、123(H)”,即使前面的笔画尽可能为三画,“题”字拆分成“日、一、止、贝”或“日、下、人、贝”时,其部件种类数都为“1131”,但前者的笔画部件中,只有一个“一”,后者则有三个笔画,根据基本部件优先取大,采用前者拆分方法,又如“败”字,按书写顺序基本部件优先取大应拆分为“贝、攵”,不应拆分为“冂、人、、本方案中汉字的编码采用公式法编码①、基本部件编码=基本部件键位码+〔成字音码〕+首尾字型码,式中,①成字音码为可选项,指基本部件为成字时,取其读音的第一个字母作为成字音码,为非成字时,不取码,②最后一码为首尾字型码,若编码不足四码则用首尾字型码补至四码。例如王(WWUU)、小(XXCC)、亻(·MMM)②、单字编码=首码+〔余1码〕+〔余2码〕+<成字补码>+尾码+<三笔音码>+<首尾字型码>,式中,①首码、尾码为必选码,码的类型可以是基本部件码、成字代码或笔画代码;②〔 〕内的码为可选码,表示部件存在时就选用其对应的码,否则不选;③< >内为补充码,表示需要补充的码,对<成字补码>来说,当汉字中剩余部件不足两个且符合成字补码的使用条件时才使用;对<三音笔码>来说,当汉字最多只有三画时,选该字读音的第一个字母作为三音笔码;若没有读音则不选用;对首尾字型码来说,当汉字的编码不足四位时才使用。例如明(RYS)、确(SNNA)、显(RISF)、著(UJER)③词组的编码是把词组视为一个广义的大“字”,词组中的每一个字视为该大“字”的成字部件或基本部件,其公式为词组的编码=首码+〔余1码〕+〔余2码〕+<成字补码>+尾码,例如日月(RY)、大家(DBV)、计算机(IZUD)、工程师(WHWJ)
权利要求
1.一种九三码汉字输入方法及键盘,其特征在于A把汉字的笔画种类、笔画关系种类、汉字部件种类、字型种类都同时划分为三种,分别用1、2、3三个数字表示,所述的键盘划分为三行三大列,每大列又分为三小列,每个键位用1、2、3三个数字组成的三位数代号表示;B汉字的拆分遵循下列原则a、不交原则指除了笔画部件之间可以相交之外,其它部件之间均不允许相交,但可以相连;b、最小原则指在汉字的拆分过程中,按首部件、尾部件、剩余部件的顺序,优先选用部件种类代号数较小的部件拆分方法进行拆分;c、最大原则指在满足最小原则前提下,按书写顺序尽可能拆出大的基本部件或笔画部件,以及尽可能使最小种类部件优先取大;C汉字的编码采用公式编码即a、基本部件编码=基本部件键位码+〔成字音码〕+首尾字型码至四码b、单字编码=首码+〔余1码〕+〔余2码〕+<成字补码>+尾码<三笔音码>+<首尾字型码>c、词组的编码=首码+〔余1码〕+〔余2码〕+<成字补码>+尾码式中①无括号的码为必选码;②〔 〕内的码为可选的,部件存在时选其对应的码;③< >内的码为补选码,当由必选码及可选码组成的编码信息量不足时,选用补选码。
全文摘要
本发明涉及一种汉字编码输入方法及键盘,该方法继承了部首信息的主导作用,通过把汉字部件划分为三种,采用“音托”、“形托”和“坐标依托”的方式进行键符安排,采用最小原则等折分方法;笔画提取顺序和取码顺序与书写顺序相同;并且以简单易记的公式形式进行编码,本发明基本部件少,记忆量小,而其它部件则不需专门的记忆,加上简单的折分规则,汉字编码容易快捷,在字集扩大时,适应性强,文字拆分规范性强,重码率低,易学易记,适合专业或非专业人员进行汉字键入。
文档编号G06F3/023GK1193765SQ9611964
公开日1998年9月23日 申请日期1996年9月27日 优先权日1996年9月27日
发明者王道勇 申请人:王道勇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1