一种计算机编码方法

文档序号:6397167阅读:351来源:国知局
专利名称:一种计算机编码方法
技术领域
本发明属于一种计算机信息处理。
背景技术
计算机的编码有过一段曲折的发展历史,最后国际标准化组织制订了一套,事实 上美国Unicode集团的编码方案,试图把全世界的所有文字和符号统一起来;但是实际情 况,许多国家仍然采用自己的编码方案。这就是为什么用户如果收到来自法国或者日本的 邮件,文件中会出现乱码的现象,因为这些国家采用的是自己制订的编码方案,而中国采用 的是iS010646/UniCOde。所以出现这种情况是因为国际标准化组织制订的编码不是非常科 学和规范,特别是对待中国和日本韩国的汉字编码,根本缺点是占用了大量的计算机内存 资源。

发明内容
本发明就是针对目前的imicode编码缺陷,进行了改进。方法如下,把符号如+_*等目前标准键盘上具有的设定为2位16进制编码,对于 字母国家如欧洲、阿拉伯、日本片假名、韩国字母等(非汉字文字)一律采用3位16进制编 码,理论上可以达到999个,完全可以满足这些国家的编码需求。对于汉字(中、日、韩等国)采用4位16进制编码,虽然汉字的数量庞大。但是, 也是由汉字+汉字或者汉字+部件构成的,部件(非成字)的数量有500个左右,构成汉 字的基本汉字(国标一级和部分2级)近5000个,这些汉字和汉字以及和部件的组合有 25000, 000个,实际上汉字的总量在20万以内。比如“蔞”,是由“不”和“要”,这2个字都 是基本常用字,比如“不”的编码是M50,“要”的编码是4630,那么蔞的编码就是M504630, 没有必要为“蔞”单独编码
具体实施例方式把全世界的语言符号分成基本符号集如l、2、Abc等,字母符号区(欧洲语言、阿拉 伯等)和汉字符号区(中日韩);基本符号集采用2位16进制编码;字母符号区采用3位16进制编码;汉字符号区采用4位16进制编码。
权利要求
1.本发明的一种计算机编码方法包括对全世界所有的已知的字母符号进行编码,其特 征在于对目前标准键盘上的字母符号采用2位16进制编码,
2.本发明的一种计算机编码方法包括对全世界所有的已知的字母符号进行编码,其特 征在于对除了权利要求1所述的字母符号和非汉语的字母符号采用3位16进制,编码从 100 FFF,其中FOO FFF区间是空集,为新出现的字母符号扩展编码区
3.本发明的一种计算机编码方法包括对全世界所有的字母符号进行编码,其特征在于 对所有的汉字和符号采用4位16进制,编码空间从1000 FFFF ;
4.根据权利要求3所述的方法,其特征在于,对汉字非成字部件的编码空间是1000 1999 ;
5.根据权利要求3所述的方法,其特征在于,对国标一级汉字和部分2级汉字的编码空 间分配为2000 EFFF,F000 FFFF为空,为扩展编码区。
全文摘要
本发明公开了一种计算机编码方法,包括对全世界所有的已知的字母符号进行编码,其特征在于对目前标准键盘上的字母符号采用2位16进制编码;对欧洲语言、阿拉伯和亚洲采用字母的国家一律采用3位16进制编码;对汉字包括(日韩)采用4位16进制编码;该方法简单符合科学,逻辑性强,占用计算机资源少,能够满足全世界所有语言符号的空间需求彻底解决了目前计算机编码混乱无序的局面,比目前的unicode编码有巨大的优势,为树立国际标准提供了理论根据。
文档编号G06F17/28GK102063426SQ200910234738
公开日2011年5月18日 申请日期2009年11月17日 优先权日2009年11月17日
发明者周连惠 申请人:周连惠
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1