计算机汉字输入-新华编码方案的制作方法

文档序号:542阅读:615来源:国知局
专利名称:计算机汉字输入-新华编码方案的制作方法
电子计算机是当今新技术革命的先导技术。在我国,要实现电子计算机的普及以及应用,必须解决计算机汉字输入输出的汉字化问题,只有这样,才便于使计算机技术被我国大众熟悉和掌握。
对于汉字编码输入方法,粗略分为二大类,一类称为整字编码法。采用整字键盘,汉字按某种规则排定先后次序作为汉字代码,优点是直观、操作容易学习、无重码问题,但体积大,造价高,输入速率低。另一类是组合编码,其中又可分为许多种,按照字形特征编码的称为形码。按照汉字发音特征编码的称为音码。也有采用形音结合的音形码或形音码等等,种类繁多。
虽然可以用多种方法实现汉字编码,但要得到一种功能上最佳并且适用面很广的汉字编码方法却并非易事,特别是适用一般人员使用中文计算机是一个十分迫切的问题,国内外汉字输入方法达500多种,但是怎样才能满足普通工作人员的要求,既有速度,又要简单、易学易用、很容易掌握呢?根据这个要求,设计了“新华”编码汉字输入方案。
新华编码方案是汉字拼形输入方案,是在综合国内外多种编码方案,结合新华社实际工作情况的基础上制定的。以汉字字根为主要特征信息,采用通用小键盘26键输入。从两类用户使用计算机着想(专职操作员与非专职操作员),侧重机关干部、编辑记者、科技工作者、企业管理人员等非专职操作人员使用中文计算机而进行设计的。规则严谨、简单明确,取码符合汉字的特点和人们书写汉字的习惯,字根安排便于记忆和查找,需要死记的东西很少,容错能力强。“重码”较少并由计算机去处理,错码率低,容易学习和掌握。已经在新华社国内报务处等部门以及部分编辑记者中正式使用。
设计思想一 键盘选择根据现有设备及日常工作情况采用国标准小键盘,具有经济,易推广,适合盲打等好处。
二 字根选择字根数量过多则增加记忆量和操作人员的负担,过少又会使“重码”增加,我们结合字根的使用频度以及安排键位和取码的需要选取基本字根92个,扩展联想字根30个。
三 字根安排1)一个键位对应一组字根,为使一般人员使用、记忆、查找方便,每组字根尽可能地按音组合在一起。如M键上放木、马,N键上放女、牛等等,减少死记硬背。表中的字根不要求死记,初学者只要会查找,稍加练习,很容易记住。
2)类同的(扩展)字根放在同一键上,如
=D等等,只要记忆其中之一即可联想,使该方案字根更容易记忆。并且避免了形体相近引起的误码。
四 规则简单 1)按书写笔顺取字根,好记,即使记不住,人们也会不自觉地遵守它。对于许多容易引起笔顺错的字由计算机去处理,使用者只需遵循一般原则,按自己的习惯做就行了。
2)字形的拆分比较简单,除独体字外均分成二部分,按这二部分分别取码即可,不用去判别究竟是何结构,分开就行。也不考虑辅助编码。同样,对于容易分错的字,加有容错码,使用者只需按照自己的习惯去做。
3)规则严谨、对将近八千汉字一贯到底。
五 由于键位表的特殊排列和人们对汉字特点的习惯意识,可以做到边用、边学、边记,很快就能熟悉掌握,并且长时间不用后再用时容易恢复,基本上保持原有的速度。
六 对“重码”,计算机可以自动查找选择(保留人工选择)。词组处理简便,有一般的词组输入方法,也有联想式词组输入方法,并有自定义词组输入的功能,输入简单,使用方便。
七 常用标点符号输入简便,在汉字状态下不需切换。
八 根据不同人员,在不改变字根的情况下,可减少某条规则,使学习和掌握更加容易。
规则和使用举例规则简化为七个字双排、双分、按笔顺。
一、按笔顺按书写笔顺取表中最大字根。如“审”取“宀、申”,不取“宀、日、丨”,“庆”取“广、大”,不取“广、一、人”,也不取“丶、厂、一、人”,“分”取“八、刀”。即只要键位表中有此字根,如上述字中的广、大、申等则按下该相应键,不再拆分。如没有所取字根才拆成笔划输入。
二、双分相交难以分隔的字如“里、果、重……”等独体字取一二三四末五码,不足五码取完为止。其余均为合体字,按书写习惯分成二部分(左右、上下、包围),每一个部分限取三码,全码限取五码。取三码方法是该部分首、次、末,二码取法为该部分首末。
例1“照”分成“昭、灬”二个部分(上下),第一部分取“日、刀、口”,第二部分只能取二码了(因一个汉字限取五码),故只取首末的二个点,中间二个点省略。
2“戆”分成“赣、心”二个部分(上下)第一部分取“
、一、贝”,即该部分的首次末,其余略。第二部分取“心”就可以了,全码为“
、一、贝、心”四码。
3“避”分成“辟、辶”二个部分(包围),第一部分取“尸、口、十”,其余略,第二部分也只有“辶”一码,全码为“尸、口、十、辶”四码。
4“键”分成“金、建”二个部分(左右)第一部分取“金”第二部分取“乛、一、辶”因为“聿”在表中无此字根,故拆成笔划取该部分第一、第二码“乛、一、”后再取该部分末码“辶”,全码为“金、乛、一、辶”四码。
三、双排每个键上字根分上、下二排,如拆分后某个部分只有一码,并且该字根又在下排位置则该码加后缀“V”。当然本条规则可以取消不用,但重码要相应增加一些。
例1“则”分成“贝、刂”二部分,“贝”在B键下排,“刂”在D键下排,每个部分都只有一码,故都需加“V”。全码为BVDV。
2“侧”分成“亻、则”二部分,第一部分“亻”在R键上排,不用考虑,第二部分的“贝、刂”虽然都是下排字根,但该“贝、刂”均不是单独出现(该部分有二码),故“贝、刂”都不加V,全码为RBD,这条规则就是说,下排的字根只有在一个汉字的首码或末码且作为偏旁单独出时才加“V”。即“上排不用下排用,首尾仅有一码加”。
即使在使用第三条规则时98%以上的字在忘了加V时仍能显示正确汉字,因为加有容错码,等于未使用该规则一样。
本规则对应国标GB2312-80基本集以及新明码本中的全部汉字,无其它特殊要求、特定规则及辅助编码,取码顺序与书写习惯保持一致,这样利用人们现有的知识和习惯比接受一个新的次序要容易得多,人们会不自觉地遵守它。在字形的拆分上也从简考虑,汉字多数是形声结构,但汉字的形和读音规律牲不强,并无必定的内存联系。音有它的特点也有存在的问题,如许多罕见字一般人不认识,现阶段即使常用字也有人常常读不准。形虽无此问题,但拆分中对形的结构、笔顺等方面存在着不同看法。对这些问题,着重从一般人员使用简便出发,在“易”字上下功夫,尽可能简化取码规则,最大限度地减少死记和思维,对字形拆分和笔顺中易错的地方采取容错码来解决,为使用者提供方便。因此新华编码方案简单、易学、实用方便。
权利要求
1.字根安排a.一个键位对应一组字根,字根大部分按声母音所在的键位排列,如M键上放“木、马”,N键上放“女、牛”等。b.类同字根放在同一键上,如“艹廾
廿井”在U键上,“凵冂冂匚
”在D键上,“丶丷
”在Y键上等。c.键位上字根分上下两排,使每个键可容纳较多的字根。
2.容错能力强,针对不同人员对笔顺和字形拆分的不一致,加有大量的容错编码,某些字有10多个不同输入码均可正确输出汉字。
3.对编码中产生的重码,计算机在稿件输入过程中有自行查找、选择的功能(保留了人工选择)。
专利摘要
新华编码方案是计算机汉字输入拼形方案,侧重机关干部、编辑记者等非专职操作人员使用计算机输入汉字而设计的,规则严谨、简单明确,取码符合汉字的特点和人们书写汉字的习惯。键位的字根安排便于联想记忆和查找,容错能力强,错码率低。词组和标点符号使用方便。全部规则为七个字双排、双分、按笔顺。对应国标GB2312—80基本集及新电报码本中的全部汉字。该方案现已经在新华社国内新闻计算机处理系统中正式使用。
文档编号G06F3/023GK87104351SQ87104351
公开日1988年1月13日 申请日期1987年6月24日
发明者蒋顺炳 申请人:新华通讯社技术研究所导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1