计算机汉字信息合成码输入法的制作方法

文档序号:6337260阅读:257来源:国知局
专利名称:计算机汉字信息合成码输入法的制作方法
技术领域
本发明涉及电子计算机汉字信息编码输入方法。
背景技术
信息是在有效传播情况下能够消除不确定性的中介象征。计算机汉字输入法就是要寻求到能够最大限度消除不确定性的一种编码作为中介象征,从而达到充分有效地传播交流的目标。计算机汉字输入“万码奔腾”,为达成这一目标展开了筚路蓝缕的拓荒铺路工作,也产生了形码、声码、形声码等不同类别的正在应用的编码。但是,已有的各种输入方法都没有全面满足记忆量极小、输入速度极快、重码率极低的高难度要求。
另一方面,千百年来,在我国民间广泛流传一种区分和表述姓氏的说法。例如弓长张,立早章;耳东陈,禾口程;广口唐,共田八黄,三横王……。今天的信息时代,正在面临计算机汉字输入的上述瓶颈,万“码”奔腾而鱼龙混杂;这些编码输入方法都未能汲取民间智慧,不利于推广应用。

发明内容
本发明要解决的技术问题是,针对现有技术存在的不足,提出一种计算机汉字信息合成码输入法,它汲取民间智慧,博采众码长处,具有易懂易学、记忆量小、输入速度快、重码率极低的特点。
本发明的技术解决方案是,所述计算机汉字信息合成码输入法的组成为
1、汉字部件码元及其在标准键盘上的键位分布 所述汉字部件码元,还包括国家颁布的GB2312字表中具有组成另一汉字能力的字,其相应的代码键是与该字汉语拼音首字母相同的英文字母键;再则,笔画横“一”、提 读若“一(YI)”,设为I键;竖“丨”读若“RI(人立)”,设为I键;撇“丿”读“PIE”,设为P键;点“丶”读若“WEN(文点)”,设为W键;捺“”读“NA”,设为N键;其他折笔分别对应相关部首的键位。
2、形成码表(汉字编码输入)的规则2.1 码表分出优选码和容许码两大类别;优选码由一、二、三键简码组成,容许码由三键码、四键码组成,容许用户多种合理的思路打字;2.2 优选码的具体组成2.2.1 一键简码由键面26个字母对应的最高频字的汉语拼音头字母组成;2.2.2 二键简码由26×26个字母组合范围内对应的常用字的汉语拼音头字母组成;2.2.3 三键简码由26×26×26个字母组合范围内对应的较常用字的汉语拼音头字母组成;其中——第一码汉字首部件码元的汉语拼音头字母;第二码汉字次部件码元的汉语拼音头字母;第三码汉字的汉语拼音头字母;2.3 容许码的具体组成2.3.1 容许码的三键简码,第一、二码类似优选码三键简码的第一、二码,但是容许第三码编入汉字再次部件码元的汉语拼音头字母,或者汉字的汉语拼音头字母。
2.3.2 容许码的四键码,第一、二码类似优选码三键简码的第一、二码,但是容许第三码编入汉字再次部件码元的汉语拼音头字母;容许第四码编入汉字最末部件码元的汉语拼音头字母,或者汉字的汉语拼音头字母。
3、用户汉字输入取码口诀及其字例说明3.1 分合兼顾音形义,顺次拆取字部画。要求兼顾汉字字音、字形、字义的分析与合成,并且按照笔顺次序,比较合理地拆取被编码汉字包含的部件字、偏旁部首、笔画。
例① 音的合成gxk,部件声母+部件声母+整字声母。
形的合成艮,通常不必分出部件 义的合成艮,取义“止”;止于心者,尽心、坦率、诚恳;合成“恳”的本义。
如果用户读不出首部件的声母,可以启动“?”键立刻得到解答和屏显。
3.2 多避连击可简省,常码不成取变码。同音连击可能造成重码,运用简化和省略的取码方法,尽量避开连击,变通打字。
例② 尽可能避免连击bb,省略“半”字中的“”,字义的合成更加贴切。
例③ 省略“人”、“口”,作用同例②。
3.3 笔画似部读成部,部画象字读成字。拆取的部件尽量看成可以发出声音的字,或者是键面分布的部件。(超越键面或者需要合并处理的部首、笔画归入V键)例④ “王”“象”“王”, 象“刂”。
例⑤ 象“几”。
例⑥ 合并处理,击V键,不超过三码即可出字。
3.4 低频多拆高频就,隔件从俗可合成。使用频率很低的字可以合理拆成四码字,高频字、常用字就势省码,被其他部件隔开的部件,也可以按照民间习俗合起来取码。
例⑦ 街,高频字,多利用原意合成。
例⑧ 黄,高频字,从简编成三码;百姓中有“共田八”之说,从俗取“共”;改错为“由”。
例⑨ 蹩,低频使用字;“敝”件不拆,容易与高频字“遍”字发生重码,低频多拆,先取字声。如果打字时没有拆打,可能在“容许码”里允许用户不拆击码(bzb),由屏幕显示重码字(遍、蹩)后再作选择。
进一步说明——1.本发明的合成码采集汉字信息的主要特征,部件声+整字声合成编码。每字一到四码,每码都可以咨询作答,平均码长不超过三码。在GB2312即国标6763个汉字的范围里,优选码几乎都可以三键以内出字。记忆量小,输入速度快,优选输入无重码。它给汉字盲打、汉语语词和语句的输入等预留了技术接口,也给其他输入方式如语音、书写、扫描预留了技术接口,特别便利多种情况下儿童对汉字的趣味认知和组织国内外的汉字汉语教学,相应的软件试用和教学实验正在展开过程中。
2.合成码采集GB2312范围里的每一个汉字,分别取用它们音、形、义信息的主要特征,考虑汉字使用频率分一、二、三、四键编码。它大规模简化码元和取码规则,在键面上合理分布码元,将取码规则和码元称谓,编成口诀帮助用户记忆,必要时附录代表字举例加以说明。
本发明中,键面码元由56类多笔部首(内含相关笔画用彩色笔勾出),构成26组码元对应键面26个拼音字母(详见上述“键面分布”),每组平均2.15个码元。这些码元在具体的汉字结构中还可以根据编码需要继续拆分组合。
除了“V”键对应的“舟”、“月”部首有特殊用途单独成字外,其它部首、笔画都没有单独成字。凡是单独成字的部画,或者指定读音的部画(在“键面分布”说明中逐一列出),分别按照读音和取码规则归属键位。
合成码码元的键位分布,尽量依据汉字字、部、画的声母头母键位(多音字、部取其中一种)合理分布。为了均衡键位容量,头字母丫声字按韵头字母分派U、I、O三键,其中yuè音节分派V键位;头字母Z、C、S声字E韵头分派E键,De音节字分派E键;头字母S声字A韵头分派A键,Z声字O韵头分派V键;头字母M声字O韵头分派O键位。助记口诀是——Y声分韵UIO,派送yuè音V键位。
ZCS声E韵归,派送De音E键位。
S声A韵归A键,Z声O韵归V键。
M声O韵送O键,减负分工共作为。
图示如下—— Yue音节→V De音节→D 3.配合一键简码字(字母旁边加点的字),可以凭借联想和想象,用下面的口诀助记码元键位——文乌 W类L 言 丫余归韵头。
心底 X母M三 A峰撇P 草类 C青Q 尤 O容廿N 宝冰 B手S 耳 E位虎H 人立 R匡K 示 I兼竹Z 绞丝 J刀D 雨 U旁饭F 国光 G同T 舟 V合成万能。
4.“容许”域限4.1 在GB2312字库即6763个汉字的范围里,容许出现若干优选码以外的大体合理的3码、4码字。
4.2 容许码必须包含被编码的某个汉字音、形、义的主要特征。
4.3 容许码不违背上述技术方案的框架要求。
4.4 容许在任意一个汉字的编码中用“?”键咨询,限问一码。
4.5 容许向合成码码表反馈信息,提供选码,使合成码不断完善并定期改版。
5.本发明的技术原理包括语言文字学原理、认知心理学原理和教育美学原理。
语言文字学原理。语言是人类社会最基本的信息载体,它保存和传递人类文明成果,维系和发展民族的文化特征。文字是记录和传达语言的书面符号,种类不同的文字分别具有表意、表音、兼表意音三大功能。汉字是记录和传达汉语的书面符号,通常用线条组成块状形体兼表意音。计算机汉字编码的实质,就是采用人机对话的中介符号,实现人机之间的信息转换。合成码从汉字形体入手,分析并综合了汉字信息的主要特征进行编码,与计算机通用键面达成了合理的对应关系,发挥了中介符号便利人机对话的重大功能。
认知心理学原理。认知心理学采用信息加工的观点研究心理过程,把人看作是一个主动的信息加工者,通过严格控制的实验室研究和被试的主观报告,研究人对外界信息的内部加工,掌握人们认识客观事物与获得知识的活动规律。合成码方案认同并且完善了这一原理。它主要通过优选码的严格控制和容许码的宽泛涵盖,通过网络及时采集和统计用户的选项码结果,也就是用户对汉字信息主动加工的结果,动态性地随时研讨和优化方案,以便更好地适应用户心理。这样做,就可以在广泛调查、统计、分析的基础上,使合成码不断得到改进和升级,不断接近人们的认知心理和识字、写字、解字、打字的实际趋向,汲取大众信息加工和传播互动所形成的集体智慧,引导信息处理乃至识字教育中汉字认知的比较盲目的个人行为。
教育美学原理。合成码的功用不限于计算机汉字输入,更为广泛深远的影响在于汉字、汉语的教学教育活动,乃至信息社会里的其它教育教学活动。个人的精神发育理应是人类精神发育的简捷的复演,这一富有哲思和美感的“精神复演论”,对于当代社会运用计算机和网络等信息手段组织教育教学活动,无疑具有教育美学等方面的理论启示和实践感召的力量。合成码的编译过程,恰恰是对古往今来汉字造字、用字、品字过程中的文化精神的历练与复演。抓住汉字信息的主要特征分析与合成,在信息加工的科学把握和艺术处理上,也能够为信息的教育功用和美学价值提供范例。
6. 本发明作为计算机汉字信息合成的输入方法,它在汉字输入的难点上取得了标志性的突破。下面,试以目前应用面最广的“五笔字型”码作出对比说明。本发明特点有(1)记忆容量小,学习难度低。对比如下表 (2)平均码长小,输入速度快。
在GB2312字库共6763个汉字的范围里,合成码几乎做到了三码击键即可在屏幕上显示汉字,四码字不到200个。平均码长为2.92,其中优选码无重码,容许码自由度大,输入速度大大超过现行应用码。“五笔字型”不少是四码出字,平均码长为3.27,输入速度整体上要比合成码低。
(3)合成码的优选码无重码,容许码重码率低于3%。“五笔字型”重码率3.79%(GB2312编码内)。
(4)合成码兼顾音形义多方面的合成,贴近汉字文化,相对符合字理字据、认知心理和群众习惯,具有汉字、汉语教育再度开发并且形成产业长链的价值。
由以上可知,本发明为一种计算机汉字信息合成码输入法,它汲取了民间智慧,又博采众码长处,具有易懂易学、记忆量小、输入速度快、重码率极低的特点。
具体实施例方式
按照本发明的技术方案,编成电子计算机汉字编码输入程序,用于计算机中文(汉字)信息处理。
按照本发明的技术方案,编成汉字信息合成手册,用于合成码输入法培训和汉字学习辅助用书。
参照本发明的技术方案,编成汉字文化动漫故事,用于合成汉字和汉语的数字动漫处理,带动相关产业。
权利要求
1.一种计算机汉字信息合成码输入法,其特征组成为(1)汉字部件码元及其在标准键盘上的键位分布 所述汉字部件码元,还包括国家颁布的GB2312字表中具有组成另一汉字能力的字,其相应的代码键是与该字汉语拼音首字母相同的英文字母键;再则,笔画横“一”、提 设为I键;竖“丨”设为I键;撇“丿”设为P键;点“丶”设为W键;捺“”设为N键;其余折笔分别对应相关部首的键位。(2)形成码表的规则码表分出优选码和容许码两大类别;优选码由一、二、三键简码组成,容许码由三键码、四键码组成;所述优选码的具体组成是a.一键简码由键面26个字母对应的最高频字的汉语拼音头字母组成;b.二键简码由26×26个字母组合范围内对应的常用字的汉语拼音头字母组成;c.三键简码由26×26×26个字母组合范围内对应的较常用字的汉语拼音头字母组成;其中——第一码汉字首部件码元的汉语拼音头字母;第二码汉字次部件码元的汉语拼音头字母;第三码汉字的汉语拼音头字母;所述容许码的具体组成是a.容许码的三键简码,第一、二码类似优选码三键简码的第一、二码,容许第三码编入汉字再次部件码元的汉语拼音头字母,或者汉字的汉语拼音头字母;b.容许码的四键码,第一、二码类似优选码三键简码的第一、二码,容许第三码编入汉字再次部件码元的汉语拼音头字母;容许第四码编入汉字最末部件码元的汉语拼音头字母,或者汉字的汉语拼音头字母。
2.根据权利要求1所述的计算机汉字信息合成码输入法,它的取码规则是a.兼顾汉字字音、字形、字义的分析与合成,并且按照笔顺次序,比较合理地拆取被编码汉字包含的部件字、偏旁部首、笔画;b.同音连击可能造成重码,运用简化和省略的取码方法,尽量避开连击,变通打字;c.拆取的部件尽量看成可以发出声音的字,或者是键面分布的部件;d.将使用频率很低的字合理拆成四码字,高频字、常用字就势省码,被其他部件隔开的部件,可按照民间习俗合起来取码。
3.根据权利要求1和2形成起来的具体实施方式
和方法。
全文摘要
一种计算机汉字信息合成码输入法,它主要包括(1)键面码元由56类多笔部首构成26组码元对应键面26个拼音字母,还包括国家颁布的GB2312字表中具有组成另一汉字能力的字,其相应的代码键是与该字汉语拼音首字母相同的英文字母键;(2)形成码表的规则优选码由一、二、三键简码组成,它们分别由键面26个字母对应的最高频字、常用字、较常用字的汉语拼音头字母组成;三键简码的第一、二、三码分别是汉字首部件码元、汉字次部件码元、汉字的汉语拼音头字母。本合成码输入法汲取了民间智慧,又博采众码长处,具有易懂易学、记忆量小、输入速度快、重码率极低的特点。
文档编号G06F3/023GK101030102SQ20061003129
公开日2007年9月5日 申请日期2006年3月3日 优先权日2006年3月3日
发明者程大琥 申请人:程大琥
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1