一种无需选字的汉字固定码输入法的制作方法

文档序号:37050017发布日期:2024-02-20 20:46阅读:13来源:国知局

本发明属中文信息处理领域,涉及一种无需选字的汉字固定码输入法。


背景技术:

1、汉字是世界上独一无二的文字,是一种信息密度最高的文字,一字一珠,一目了然,承载着博大精深的历史文化信息,是中国人宝贵的文化瑰宝。从商朝甲骨文到汉代造纸,从唐朝雕版到宋代活字印刷,汉字在文字技术领域遥遥领先世界,而在发明了机械打字机和电报的近代,汉字因为不是字母文字,应用于机器和电信变得困难重重。在电脑面世之初,储存空间非常有限,难以装下几万个汉字、数十万个词组,汉字快速输入也成为难题。不过计算机技术飞速发展,全世界的各种文字在电脑文本应用上早已不成问题。

2、三十多年来,涌现了近千种汉字编码输入法,推动了我国汉字信息化的发展。目前汉字输入法无论全拼、双拼、简拼、形码、音形码,熟练后打字速度可以很快,然而遇到同音字词或字形重码都需要选字,在电脑键盘上不能象英文一样输入单词加空格方式直接打字。原因是通用键盘由英文字母键组成,汉字不是字母文字。汉语拼音方案没解决这个问题,根本原因是汉字的同音字太多,同音的词组也有很多,同音不同字的人名更常见。

3、目前用来解决同音字问题的形码方案,采用的方法是把汉字拆分成不同字根部件,再映射到键盘键位,遇到字形和词组重码,最后免不了选字。各种拆分规则让人眼花瞭乱,边打字边想拆分,要跳过拆分思维过程,只能苦练和死记。形码的缺点是难记易忘,除了用来打字,其它地方基本用不上。

4、著名科学家钱伟长曾经指出“好的编码方案应该是一种文字或是文字的一部分,或是一种准文字”。

5、如果能有一种汉字编码作为汉字的一部分,或是汉字的准文字,可读可写可记,接近英文的字母文字形式,中文的信息化、数字化、现代化将取得新突破,汉字就会和阿拉伯数字、拉丁字母一样世界通行。以后只能用英文字母的特殊领域,如机械打字机、采用ascii字符的嵌入式硬件和操作系统内核等,也可以用汉字的准文字编码轻松表示中文。据此分析,用这种汉字编码输入也是无需选字的。


技术实现思路

1、本发明的目的在于提出一种无需选字的汉字固定码输入法,实现国标扩展gbk内20902个汉字都有唯一对应的20902个固定码编码,码长在4码内,用电脑通用键盘、电话数字键盘等设备实现无需选字输入汉字,象英文打单词加空格键一样直接输入。

2、采用的技术方案为:

3、1. 将汉字按国标gb2312和gbk分为2类,一码字、二码字、三码字都属于国标gb2312内的一二级字;四码字第4码a -- l 的是国标字, m -- z的是其余gbk字。

4、2. 固定码一码字26个,二码字399个。用1个字母表示简拼,固定码前2个字母表示音节码。

5、“u、i、v”分别是“这、是、出”的固定码。

6、多音字选出一个音做固定码,如“重”是“vs”,“长”是“vh”。

7、音节码类似双拼,但固定码二码字对应的是汉字,双拼对应的是拼音,有所不同。

8、增加备用音节码,用于同音字太多,第4码排满m -- z的情况,例如用备用音节码“yz”表示“yi”音节,音节码“yl”和备用音节码“yn”表示“yan”音节。

9、键盘键位包含的韵母,括号内为备用音节码的韵母:

10、.a    a

11、b

12、c     ao

13、d     ai

14、e     e (i)

15、f     ou

16、g     en ue

17、h     ang

18、i/sh  i

19、j     ian (an)

20、k     un

21、l     an (ian)

22、m     iao

23、n     iu

24、o     o uo

25、p     ei

26、q     iang uang

27、r     uan van

28、s     ong iong (i)

29、t     ie

30、u/zh  u

31、v/ch  v ui

32、w     ia ua (u)

33、x     in

34、y     ing uai

35、z     eng (i)

36、本发明的固定码第2字母没有用b字母,不会出现第2码为b的二字母固定码,避开了一些字母组合,比其它26键双拼方案韵母少一个键位,减少了记忆量。

37、3.三码字前2码为音节码,第3码为部首码。

38、英文字母键对应的部首:

39、a 手扌

40、b 贝丷宀八勹卜白匕疒貝比冫髟癶鼻

41、c 虫寸厂车彳車巛臣辰采川齒长赤齿镸長

42、d 刀刂大丶豆歹斗鬥鼎

43、e 水氵二儿而已

44、f 方纟糹糸阝耳阜邑匚丰缶非父風风飞

45、g 工广弓戈干瓜廾艮革骨鬼谷高甘鬲龟

46、h 火一禾灬虍户黑黄

47、i 木

48、j 金钅釒巾臼卩几斤见角見旡己韭

49、k 竹衣衤凵

50、l 月力丨立里耂耒隶鹿龙龍卤鹵

51、m 马馬目门門米面麦麥冖皿毛矛母毋麻黾黽

52、n 牛牜鸟鳥女乀

53、o 口

54、p 石丿尸殳皮片爿丬

55、q 犬犭酉气欠青齐齊

56、r 日雨肉曰入

57、s 山十厶士罒豕彡示巳飠礻氏矢生饣舌身鼠色食首

58、t 土冂田亠

59、u 艹艸

60、v 人乙亻

61、w 王攵囗兀文瓦韦韋攴

62、x 心小忄夕彐彑西穴辛玄香血

63、y 言讠又鱼魚羊用业页頁牙音羽聿幺廴弋尢龠

64、z 之辶足子走止自支至舟爪爫疋夂隹豸

65、一般的形码将汉字拆分成不同的字根部件,规则复杂,难记易忘。本发明采用的是部首码,不用拆分,按部首的简拼对应键位。

66、为达到部首均匀分布,采用经部首数量统计和部首形似字母方法,将a、e、i、o、u、v键对应 “扌、氵、木、口、艹、亻” 类部首;“纟糹糸阝耳阜邑”部首设在f键,“竹衣衤”部首设在k键,“月”部首设在l键,“石尸殳”部首设在p键,“酉”设在q键。

67、部首码以《新华字典》的部首为基础,有些字难以确定部首的用笔画作部首,有两个部首的根据编码方便选取。如“次”部首码可以为b或q,最后选q,固定码ciq ,部首码b 留给“赐” cib 。

68、4.四码字前3码是音节码和部首码,第4码表示声调。

69、(4.1)第4码用字母e、f、g、i 分别表示1、2 、3 、4 声调;

70、(4.2)声调相同的采用第二组字母h、j、k、l 表示声调;

71、(4.3)声调相同第三个同音字用第三组字母a、b、c、d表示声调;

72、(4.4)同音字太多的,用备用音节码表示音节,第3码用部首码,第4码用e、f、g、i和h、j、k、l 以及a、b、c、d三组字母表示声调;

73、其余gbk字第4码按“m -- z ”顺序排 ,常用繁体字排在前,接着是常用cjk字,然后按笔画顺序排好固定码。

74、gbk的20902个汉字全部排好固定码后,单纯从编码也能看出三码内是国标字、第4码e -- l是带声调国标字,gbk繁体字和非常用字第4码是m -- z。

75、通用电脑键盘直接按固定码对应的英文字母键后按空格键,就能输入对应的汉字。

76、固定码用于电脑数字键盘和电话键盘,字母对应数字:

77、a 21 b 22 c 23         d 31 e 32 f 33

78、g 41 h 42 i 43         j 51 k 52 l 53    m 61 n 62 o 63

79、p 71 q 72 r 73 s 74    t 81 u 82 v 83    w 91 x 92 y 93 z 94

80、输入汉字固定码字母对应的数字键组合再按0键,就输入对应的字。如“电”字固定码djt数字键按“315181”。“点”dj 数字键按“3151”。“垫”djti 数字键按“31518143”。数字键位与电话键盘上字母位置对应,无需特别记忆。

81、中国目前用的盲文不是汉字盲文,只能摸出汉字读音,无法确定汉字,将汉字固定码直接用于盲文,和英文字母单词用法一样,摸到固定码的字母点字,就知道对应汉字。如点字摸到ziz mum 就能知道是“字母”两字。

82、将固定码用于电报码、中文电码来表示汉字,可读可记,比现在单纯用数字号码表示汉字好记。还能直接在英文打字机打固定码的字母来表示汉字。

83、固定码的音节码用大小写形式aa、aa、aa、aa 表示声调一到四声,精准记录普通话语音,如 mao吗 man妈 mam麻 ma马 mai杩 。

84、固定码用于语音指令和人机对话,读出固定码字母作为语音指令,精准区别于人类自然语言的语音指令。在中国电动汽车上用汉语做语音指令,外国人不懂汉字,可以读固定码字母作为语音指令,如“打开天窗”固定码指令为“daa kd tj vqx”,若用拼音或简拼dktc,虽简单,但拼音词条太多时,会产生混乱和难以理解。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1