汉字编程方法

文档序号:6453354阅读:1128来源:国知局
专利名称:汉字编程方法
技术领域
本发明涉及计算机源程序编写方法,尤其是能用汉字直接编写计算机源程序背景技术现代电脑软件,大多用高级程序语言编写,高级语言接近现实,与人类生活紧密相连,直观易懂,覆盖了艰涩难懂的机器语言,便于人们阅读、思维、检视、创作。人们用高级语言创作出各种各样精彩的软件作品。
当今世界上使用的高级程序语言很多。如QBASIC、VB、JAVA、C、C++等等。但没有一种汉字程序语言,对广大中国人来说,用外文程序语言进行阅读、思维、编写创作软件,是一件很困难的事情。即使经过专业学习,也不容易熟练掌握。因此,使用汉语的人编写程序是一项技术性高、难度大的工作。许多专业程序学员,因外语水平的限制,对单词定义和灵活使用不能掌握,学了多年程序,也只会做些课本习题,无法进行实际程序编写,更不用说广大非专业人员了,语言障碍严重束缚中国软件技术的发展。况且外文语言也有弱点,如字长码多,占用内存容量大,简写又增加学习难度,并非十全十美。汉语是世界上最攸久的语言之一,它表达力强,定义深刻,功能齐全,使用范围广,但到目前也无一种汉字编程方法。

发明内容
本发明的目的是提供一种能用汉字直接编写计算机源程序的汉字编程方法。
本发明解决其技术问题所采用的技术方案是用汉字直接编写计算机源程序,然后用汉字二分推移编码法对源程序自动编码,再转换成拼音源程序,经编辑后变成ASCII代码,经过编译,最后变成计算机能够识别执行的目标程序。所述汉字二分推移编码法是采用笔画、部首、字根的读音代码进行拆字编码。所述编译程序是指面向过程和面向对象的编译程序。所述汉字二分推移编码法采用二分常用汉字表,并采用汉字源程序-字母源程序函数转换程序和采用字母源程序-汉字源程序记忆转换程序,将字母源程序转换成汉字源程序时保持原输入汉词。采用转换码词典对各种不同汉字程序语言进行转换编辑。在转换编辑过程中的自定义词采用自动编码程序,并采用汉语独有的因果运算符号、连字符-、或黑点·组成汉-汉、汉-英复合词,复合词不要拆字。用覆盖法完全保留国际标准键盘,或根据需要设有汉字键盘和拼音转换码键盘。保留国际通用的计算机语言符号,留用部分外文词汇和代码,并留用了科学词汇的字母符号,它包括半径为R,速度为V,面积为S。对繁体汉字进行编辑时采用繁体汉字源程序-简体拼音转换码转换软件。或者对繁体汉字采用二、三分推移编码法。
在使用汉字作为程序语言的开发过程中,遇到很多难题,如汉字字形结构复杂,变化多端。形近字、同义、同音词、多音字,多义词,纵横交错,计算机很难识别,因此,用汉字作程序语言就必须解决好这些问题。电脑识别汉字困难,识别字母编码却很容易,我们先用汉语编好源程序,再转换成字母编码,电脑就能识别了,这时便可实现用汉语直接编写程序。
本发明人于2002年11月发明了此汉字程序语言,即直接用汉语编写源程序,经计算机转换、编译,变换成目标程序,供计算机系统操作运行,从根本上解决了因语言障碍这一瓶颈因素,对我国软件产业的制约,使千千万万知识分子,甚至,中小学生,都能结合自己的专长,创作编写软件。
本发明的汉字程序语言功能完整、强大,能与英文语言比美,据我的研究,汉字程序语言的功能将超越英文语言。因为汉语比外语更加精练鲜明,和所有高级语言一样,汉字语言也能覆盖在目标语言之上,与外文语言没有什么区别,只要能准确全面地涵盖一切目标程序,从而使汉字语言和英文语言没有什么两样,比喻汉语的“打开”“复制”“搜索”“加”(+)“减”(-)“乘”(*)“除”(/)和英文的“打开”“复制”“搜索”“加”(+)“减”(-)“乘”(*)“除”(/)就没有任何差异,功能完全一致,当然,要把汉字语言转换成字母语言,须通过转换码来实现。
本发明的汉字二分推移编码法成功地用最少的代码、最短的码位编列出最多的不重码的单词短语,并且表达力强,鲜明简洁,符合文字规范,将汉字源程序转换成字母编码就象大写转小写、繁体转简体一样容易了。
本发明的优点是1、使用范围广;2、通俗易懂,鲜明简洁;3、汉语短小精炼,词短码少,占用内存小,运行速度快;4、二分编码法结构无穷,可适应任何巨型工程;5、二分编码符合每个汉字二个字节结构,有利各种转换和对接;6、汉语使用灵活,易学难忘。它能直接使用汉字编写计算机源程序,即用汉字可完成程序语言的全部工作。包括定义、表达、运算和传递各种计算机功能和指令,是首创的汉字程序语言,它功能强大,使用方便,易学难忘,大大降低了使用汉字的人编写软件的工作难度,使编写软件工作大众化。


图1是本发明的工作流程示意图。
图2是编译和执行方框示意图。
具体实施例方式
首先采用转换码对汉字进行转换,汉字能不能作程序语言的关键是必须有一种优良的转换码,将汉字转换成字母编码,转换码必须具备以下优点1、能简单、鲜明地表达汉字的词义、读音,便于编者阅读、思考、检视、修改,写作。
2、要求重码少,有利于准确无误地将汉字转换成字母编码。
3、转换码必须词短码少,占用计算机内存小,便于快速运行。
4、该码分拆汉字时需符合计算机每字2个字节结构,便于各种对接和转换。
5、当然在实际应用中,只要与保留词与系统不发生冲突,代码是可以重用的。
汉字二分推移编码法,能满足以上各项条件,可成功地将汉字源程序转换为字母源程序。转换码是通过采用英文字符代替汉字拼音转换码使用的字符与英文语言字符基本一样,26个大写字母、26个小写字母、10个数字和一些符号大写A-Z;小写a-z;数字0-9;符号+-*/()#、=;?。{}[]+-><>=<=‘’“”。
汉字程序语言中拼音字母区分大小写,用以表示不同意义。
所述二分推移编码法是指取汉字的单字、词组、短语中每个字读音第一字母作代码编码,遇到重码从尾字起二分拆开,各取一码编码,若仍重码,向前推移一字分拆,再重码再向前推移,直至不重码。例如“编辑BJ”与“背景BJ”两个词汇重码,可将“背景”的尾字拆成二码,背景就成三码词,使之与“编辑”不重码。


从表1可以得知,本发明的滤色器的透明保护膜(实施例1),包括多元酸和环氧化合物的热固混合物,相对于对比例1至3,具有更好的耐热性和耐光性。另外,实施例1的透明保护膜对Cr膜,相对于对比例1至3,具有很强的附着力。实施例1中的透明保护膜具有高于对比例1至3中75预留空位1千----2万个,如果自定义词与基本词汇发生冲突,自定义词就按二分推移编码法避让。例如达达码软件,ddmrj如与某一基本词发生冲突,计算机自动将这一词汇的尾字“件”二分拆开达+达+码+软+亻+牛ddm r r n分拆后的编码,如仍与另外基本词发生冲突,计算机会自动向前推移一字分拆,冲突消除后,被分拆的汉字和代码,计算机用颜色或符号标识确认。自定义词设置后,即参入汉字一拼音转换。自定义词汇包括的范围很广,这给编写各种各样的软件,设置了足够的词汇空间,避免了将几百万词语一次设置在转换码中,浪费内存空间。
自定义词自动编码程序自定义词是人们编写不同软件时,自行定义设置的。汉字一拼音转换软件只给它们预留了空位,并没有预先设置这些词汇,因为这些词汇实在太多,软件设置太大,太复杂。我们采用自定义汉字输入后,即时自动编码,将转换软件大大简化了。其程序大致如下先将常用基本汉字约6000-12000个同字两式存储在字库中,一式为单字单音码,即取汉字读音第一个字母作代码,置于汉字后。如生s产c指z标b。二式为单字双码将汉字二分拆开各取一码,置于汉字后如生nh产lp指tz标ms设置时输入“生产指标”,软件第一步会调出相应的单字单音码,给“生产指标”添加拼音,生产指标sczb,当这个拼音码与保留词或其它功能发生冲突,软件第二步就会调出字库中相应的单字双码字,将自定义词“生产指标”从尾字始二分拆开,生产指+木+示sczms,编成5位码,如果这个5位码仍与系统发生冲突,软件就会向前推移一字分拆,生产++旨+标sctzb,再重码再推移,一般分拆一次就不会重码了。自定义词编码完成后,即参入转换。软件会将分拆的汉字和代码,用颜色或符号标示出来。
编码示例汉字下划线_表示该字二分拆开。一字词

二字词

三字词

四字词

五字词以上的多字词依此类推。汉语转换字母码示例汉语 转换码打开 DK动画(号码0--9)DHT(n 0--9)循环 SH活动 HD结束 JS
说明汉字全部转换成字母码号码转成保留码n,数字括号连字符不变。算术运算符号保留符及转换码

算术运算符号,长期在中国使用。已经完全汉化编写程序时,可写汉语转换保留符,但最好直接书写符号。转换码作非运算符号名词的数据依据和参考,求余数用QVS。
关系运算符号保留符及转换码

这些关系运算符号,长期在中国使用已经完全汉化,编写程序可写汉语转换,也可以直接书写符号,转换码作非运算符号名词的数据依据和参考逻辑运算符号及转换码

逻辑运算字符,用汉字语言转换成拼音编码,这样程序语言汉化程度较高。汉语因果关系运算符

运算顺序关系汉字程序语言运算顺序,同样遵循现代计算机的运算规则,汉语因果运算与逻辑运算并列。
保留符号国际通用的数学,计算机语言符号、形象简单在中国长期流行。为广大知识分子熟知,在汉字程序语言中将其保留下来,编写软件时直接书写这些符号。汉字源程序转换拼音源程序时,程序中的符号不转换,不变化。

转义字符汉字程序语言的转义字符,功能与外文语言中的大致相同,但在标识上有些差异,汉字语言的转义符号使用了拼音字母作标识例如\t退格符加了退字的读音t\t是一个整体,不能分割\t表示退格。既不表示\也不表示t。

保留词计算机的运算符号和一些重要功能词汇,是专用的,不能另外定义它用,这就是所谓保留词汇。下表列出部分保留词

其它保留词类推,可根据实际情况增加或减少表中词汇。
外文留用词汇有许多外文词汇在中国长期使用,中国人早已熟知认同。如“正弦sin,余弦cos”。如果将这些词汇译成拼音码,倒会使人费解,因此汉字程序语言将其留用。编写程序时,可写汉语转换外文,也可直接写外文留用词。
纵轴y数号n极限lim正弦sin 余割csc横轴x余弦cos 双曲正弦sh 正割sec 余切cot正切tan 双曲余弦ch科学定义词与常用符号留用众多的科学技术概念,一般都有相应的汉语词汇,例如半径、速度、电流、面积。这些词汇用二分推移编码法,很容易编出拼音转换码,计算机也能够识别。
然而,这众多的科学技术概念,在我国的教科书中,公式演绎、程序运算、表达说明时,大多以简单的字母来表示,例如“R”表示“半径”,“V”表示“速度”,“S”表示“面积”,“I”表示“电流”。用字母表达,鲜明简洁,为广大中国知识分子熟知应用,如果我们放弃这些简单的字母符号,用拼音转换码去代替,倒会把简单的事情弄复杂,这当然不可取,必须留用这些字母符号,编写程序时可直接书写字母符号,无须转换。也可书写汉字,设置二次转换,即在一次转换成拼音码后,再把拼音码中所含的科学名词转换成字母符号。例如

说明拼音转换码也不可省,其它一些情况下需要使用。
复合词在许多情况下,一些单词与另一些单词,组合在一起成为复合词。留用的外文词也会和汉字组成复合词。例如反正弦“反”字为汉字,正弦为外文留用词,遇到这些情况,汉字取拼音,留用词不变。词与词之间用字符连接。反正弦转换f-sin其它汉英混合结构也用此方法解决。例如E底对数转换为e-dds汉词与汉词组成的复合词,。词与词之间界线分明,复合词不要拆字直观易懂。汉字复合词示例1□-□□2□□-□□3□-□□□4□□-□□□5□□□-□□6□□□-□□□7□-□□-□□□。依此类推。
语法规则按现代汉语使用规范,排列词语顺序,从左到右,从上至下分行识别,读取。兼备选择,循环、搜索、替换、并列、分叉、往返、跳越等各种功能。汉字程序语言,基本结构单位是词、符号、数字和程序语句。它们之间用空格、顿号、分号。分隔,便于计算机识别执行。例如汉语程序日期1、2、3、4、5、6、……;转换后 rq 1、2、3、4、5、6、……;分号一般用于语句结尾。逗号一般用于表达式连接。
例如全汉语表达式甲等于5,乙等于2,丙等于甲乘乙;使用保留符号甲=5,乙=2,丙=甲*乙;转换码表达式RS=5,II=2,HN=RS*II;其它符号和规则类推,吸取外文程序语言一些规则和长处,做到洋为中用,择优取用。双杠屏蔽符号“\\”起屏蔽隔离作用,在双杠符内的汉字、外文、符号等是用来注释说明程序不参入任何程序运行。汉字源程序转换拼音源程序时,双杠符内的汉字、外文、符号一切都不变化,不转换。
结构化语句汉字程序语言,在语言结构上,同样采用国际上流行的结构化语句。汉达语言采用顺序、选择、循环基本句型。汉达达以类型结构为基本程序结构。两者都融入汉语的语法,特别在词序上与外文有较大差别。汉达是面向过程的语言,汉达达则是面向对象的语言,汉达类似于VB C语言汉达达与C++ java很近似。
编程示例1、全汉字源程序 2.转换拼音码源程序求圆柱体体积 \\qvzttj\\#定义PA 3.1415//取读音前两码//#di PA 3.1415主函数() zhs(){浮点变量半径、高; {fdbl r、h;浮点变量面积;fdbl s;浮点变量体积;fdbl v;半径等于5.0; r=5.0;高等于4.0; h=4.0;
面积等于PA乘半径乘半径;s=PA*r*r;体积等于面积乘高; v=s*h;输出(n十进制f,体积)};//f为子函数//sc(n\s,f v)};//输出时n\s数字替换//。
说明1、编写程序一般不写全汉字程序,而书写带保留符号字母代码的汉字源程序。就象编写数学书,不全写汉字一样。
2、//双斜杠内为注释语句,不参与程序运行。
3、书写保留符号的汉字源程序#定义PA3.1415//半径r高h面积s体积v//主函数(){浮点变量r h;浮点变量s;浮点变量v;r=5.0;h=4.0;s=PA*r*r;v=s*h;输出(”n/s f v”)};例2轮船公司规定身高1米以下的儿童免票,1米——1.5米的儿童购半票,5米以上买全票。编写购票程序设三个变量分别为儿童身高、票价、金额程序如下1.汉字源程序 2.拼音转换码源程序主函数() zhs()
{浮点变量 身高、票价、金额; {fdbl sg、prj、je;输入(“身高、票价”); sr(“sg、prj”);输入(“\s f\sf”,&身高,&票价) sr(\sf\sf”&sg,&prj);输出(\n); sc(\n);如果(身高<=1)金额=0; rg(sg<=1)je=0;此外如果(身高<=1.5)金额=票价/2; cw rg(sg<=1.5)je=prj/2;此外金额=票价; cw je=prj;输出(“金额=n\s金额); Sc(“je=n\s je”);编译与执行从实质上来说,汉字程序语言的编译和英文程序语言的编译没有原理上的区别。汉字程序语言只是多了一个环节,需要将汉字源程序转换为拼音源程序,再对拼音源程序进行编译和执行。两者编译的目标,绝大多数是相同的。例如加+减-乘*除/查找cz这些词汇的目标程序,英文源程序的编译后和拼音源程序的编译后都是相同的,整个汉字程序语言体系和英文程序语言体系中,这样同样和类似的情形达95%以上。
当然,汉字程序语言和英文语言也有差别,其中一个较大的区别是词序排列,从汉语的角度看,英文语言多为倒置句子,词序与汉语正好相反。在设置拼音源程序编译时,应充分考虑了这一点,并很好地解决。汉字程序语言的编译与执行,一般分为五个步骤一是汉字转换拼音。程序设计员用汉语编写好源程序后,经过检视输入计算机内存,转换成拼音源程序,转换是由一个软件完成,转换过程中软件如发现汉字源程序有错误,就会立即指示出来如某个汉词的转换码与保留词发生冲突计算机会自动进行二分推移编码避让开。如果有语法错误,计算机会显示警示,让人修改纠正错误。错误显示在汉字源程序中,直观可读,容易被发现便于纠改,当然这样做转换软件设计会复杂一些。
二是编辑。转换成拼音字母的源程序,编辑时指出错误,修改后生成以汉达,‘HD’或‘H’为后缀名的文件,并编辑成ASCII代码形式存储,这还不能被计算机直接执行。还需要进行编译。
三是编译。编译就是将已经转换编辑好成为ASCII代码的拼音源程序,翻译成二进制目标程序。二进制目标代码,计算机还不能直接执行,还得把各个独立的模块综合连接,并置于操作系统之下,才能运行。
四是连接。各模块的二进制目标代码,经过连接得到有具体地址的可执行文件,文件以zxj为后缀也可保留exe后缀。
五是执行。汉语程序语言,经过转换、编辑、编译、连接后,最终得到了可执行的目标文件,这些文件在操作管理系统的支持和管理下,可以工作执行了。我们可以把转换、编辑、编译、连接、测试做成一个整体软件,用户可在窗口的指示下完成全部工作。这个软件就叫汉达转换编译器。编译和执行方框示意图见附图2。
国际标准键盘汉字程序语言软件使用键盘有三种方法1、完整保留国际标准键盘,用英文键覆盖拼音转换码。

2.为适应部分人的需要,用汉字布键覆盖转换码.。
3、用拼音转换码直接布键。
繁体汉字程序语言用繁体汉字作程序语言,有多种方法,原理与简体字方法相同。用二分三分推移编码法,对繁体字直接编码转换。该方法与简体字二分推移编码法相同,唯一的区别是将笔画繁多单字三分拆开取三码编码例如“”字拆成声+殳+耳=SSE拆字编码时,用许多简体整字作字根,取其读音编码。将繁体汉字源程序,用(繁体-简体拼音码)转换软件,直接将繁体字源程序,转换成字母编码的源程序,这种方法简单可靠。
面向过程的程序语言即使用拼音转换码,以现有高级程序语言如C、VB为基本,取两者之长,融入汉语特征,进行转换和编译,基本是面向过程的汉字程序语言。
面向对象的程序语言,同样使用拼音转换码,以高级程序语言如c++java为基本,取两者之长,加入汉语语法特点,进行转换和编译,是面向对象的汉字程序语言,其发展前景十分看好。1、转换码词典示例

其它字、词汇、语句二分推移编码方法类推。
二分推移编码常用二分汉字表

其它汉字二分编码方法类推,二分汉字主要用于组合词汇和语句,使之不重码。独立使用只取其中部分。
权利要求
1.一种汉字编程方法,其特征是用汉字直接编写计算机源程序,然后用汉字二分推移编码法对源程序自动编码,再转换成拼音源程序,经编辑后变成ASCII代码,经过编译,最后变成计算机能够识别执行的目标程序。
2.、根据权利要求1所述的汉字编程方法,其特征是所述汉字二分推移编码法是采用笔画、部首、字根的读音代码进行拆字编码。
3.根据权利要求1所述的汉字编程方法,其特征是所述编译程序是指面向过程和面向对象的编译程序。
4.根据权利要求1所述的汉字编程方法,其特征是所述汉字二分推移编码法采用二分常用汉字表,并采用汉字源程序-字母源程序函数转换程序和采用字母源程序-汉字源程序记忆转换程序,将字母源程序转换成汉字源程序时保持原输入汉词。
5.根据权利要求1所述的汉字编程方法,其特征是采用转换码词典对各种不同汉字程序语言进行转换编辑。
6.根据权利要求1所述的汉字编程方法,其特征是在转换编辑过程中的自定义词采用自动编码程序,并采用汉语独有的因果运算符号、连字符-、或黑点·组成汉-汉、汉-英复合词,复合词不要拆字。
7.根据权利要求1所述的汉字编程方法,其特征是用覆盖法完全保留国际标准键盘,或根据需要设有汉字键盘和拼音转换码键盘。
8.根据权利要求1所述的汉字编程方法,其特征是保留国际通用的计算机语言符号,并留用了科学词汇的字母符号,留用部分外文词汇和代码,它包括半径为R,速度为V,面积为S。
9.根据权利要求1所述的汉字编程方法,其特征是对繁体汉字进行编辑时采用繁体汉字源程序-简体拼音转换码转换软件。
10.根据权利要求1所述的汉字编程方法,其特征是对繁体汉字采用二、三分推移编码法。
全文摘要
汉字编程方法,它属于一种计算机编程方法。它主要是解决现有的各种计算机源程序不能用汉字编写等技术问题。其技术方案要点是用汉字直接编写计算机源程序,然后用汉字二分推移编码法对源程序自动编码,再转换成拼音源程序,经编辑后变成ASCII代码,经过编译,最后变成计算机能够识别执行的目标程序。从而使人们能直接用汉语编写源程序,即用汉字可完成程序语言的全部工作,包括定义、表达、运算和传递各种计算机功能和指令,它功能强大,使用方便,易学难忘,大大降低了使用汉字的人编写软件的工作难度,使编写软件工作大众化。
文档编号G06F9/455GK1514362SQ0312470
公开日2004年7月21日 申请日期2003年7月27日 优先权日2003年7月27日
发明者耿达明 申请人:耿达明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1