实现中文声数编码方案的技术方法

文档序号:6405553阅读:325来源:国知局
专利名称:实现中文声数编码方案的技术方法
技术领域
本发明涉及一种软件硬化方法,尤其是用以实现中文声数编码方案的技术方法。
专利申请号为85100087的中文声数编码方案自鉴定后,因其方案的简单、易学、无需记忆编码规划而被不同层次、年龄的非专业录入人员所喜爱和接受,同时,为专业录入人员提供快速的中文输入方法,因而很快得以推广应用。但随着用户的增加,新机型的大量出现以及用户要求的不断提高,原先完全由软件组成而实现的《中文声数编码》方法,已逐渐暴露出其缺陷和不足,如内存和硬盘的占用空间大,显示速度慢,硬盘磨损严重等,造成实用化程度不高。
本发明的目的是改进《中文声数编码》方案的实现方法,以提高字词的显示速度,避免硬盘的磨损,减少内存和硬盘的占用空间,扩大原系统的适用范围,提高其实用化程度。
本发明是将中文声数编码方案中文系统研制成一固化板,固化板由一块汉卡(TM声数汉语系统卡)和相应的支撑软件组成,汉卡则由存储器,存储器译码及控制,I/O译码,内存映射段地址等单元电路构成。下面对汉卡的各组成部分加以说明1、储存器部分板上有8个28脚插座,可容纳最大512K字节的储存容量,用8片27512EPROM芯片固化了所有所需数据,包括中文声数编码方案的字表,双音节词表,三音节词表,四音节词表,不识字表等表格。两个40脚插座用于国标字库(16×16国标GB2312-80基本集的全部汉字)或扩充,见图1,当地址总线稳定后,其控制线打开相应数据所在芯片的控制端,由CPU完成其数据的读取。
2、储存器译码及控制见图2,其中LS373中锁存了地址总线的高8位,这样在读取数据时就选中了相应的存储芯片,在以后的数据处理时,其相应的数据偏移地址与锁存地址相加,就可以得到此存储器芯片中的相应数据,其中两个LS283即为地址加法器,加完后的地址由地址线直接到芯片进行译码,或由LS138转换成芯片控制线,控制相应被选中的芯片。
3、I/O译码部分图3电路组成了I/O的译码器,其中LS85的目的是为了使所用I/O地址方便地由人进行必要调整,以避免与系统I/O地址发生冲突,增加汉卡的适用能力。I/O地址的译码输出去控制LS373的数据锁存,在此译码电路的配合下,即可通过数据总线将地址的高8位锁存在LS373中,用于后面的映射读取。
4、内存映射段地址图4,为了避免内存段地址占用的冲突,此电路通过开关可选择不同的内存映射段地址,从而使得电路更加完善。
5、板上还加有缓冲隔离,去耦滤波以及其它一些控制总线和数据总线。这些功能用来提高汉卡的稳定性和抗干扰能力及控制数据在总线上的正确传输。
由上述可知,本汉卡的特点是1、因汉卡的读取方式采用了内存映射方式,使其读取速度达到了最快。
2、字库译码部分无需采用专用译码电路芯片,而速度比之还快得多,且与其它数据读取方式一样,既简化了电路,又降低了成本。
3、字库可根据需要随意选配。
4、容量有较大的可扩充性。
与汉卡相应的支撑软件由三部分组成,其分别为系统软件,索引表格生成软件及辅助软件,分别说明如下1、系统软件
由上图可知,系统软件的开发实际上是对原西文DOS(磁盘操作系统)进行汉化改造,主要有显示、键盘、打印三个中断模块,它们分别完成了西文和汉字的输入,显示及打印输出等过程。由于这些模块的好坏直接关系到系统的效率,速度和容量,要求较高,故此部分用汇编语言编制。
2、索引表格生成软件这些软件的作用是把原始数据进行各种处理,最后转换到可供系统程序检索用的各类表格,此过程工作量大,烦杂且易出错。原始数据修改后此过程还会重复做,所以用人工是无法做到的,但由于对速度及内存占用量要求不高,故大都采用BASIC语言编写。由原始表格处理软件,排序软件,索引表格生成软件及合并软件组成。
3、辅助软件造词软件为用户提供了一个简单方便的造句用词的环境,可方便各类用户的特殊需要。
由汉卡和相应支撑软件构成的新系统,优化改造并扩大了原软件系统,提供了硬件支持,带来了诸多优点和积极效果
1、简繁体字编码统一由于为纯音码输入,故对于简体字或繁体字可做到编码统一,无论简繁体字系统均提高了双拼输入时的显示还原功能(汉语拼音与注音符号)并可一键转换,从而使其组码与提示都具有准确的可读性,用户可以做到“见字知码,见码识字”,组码自然,容易,可使人脑对语言的思维和人手的键入活动,有机地溶为一体,大大减轻了录入人员输入的负担。
2、汉字输入速度快由于输入时严格采用了双拼键位输入法,并且三字词,四字词,多字词及240个高频字均为仅用字的声母输入,大大缩短其码长,加之经过优化排列的大量词汇(12万条),多层次的提示选择输入,大大提高了拼音方法的输入速度,经实测,经过三个月训练的实践毕业生(原未上过机)最快输入速度达到每分钟四百字以上,一般速度为每分钟二百至三百字之间,打破了人们认为音码同音字多而输入速度无法大幅度提高的传统观念。
3、操作简便本系统操作基本与CC-DOS一致,已用过中文系统的人可方便操作,前后页操作字序不变,方便记忆,适于盲打,适于听打,系统中有自动重复最后一个字的功能,方便制表或重复字输入。
4、可扩充性本系统中任一输入方式均可任意摘挂,且容易扩充其它输入方法。
5、可输入不识字音码的弱点之一即为,若此输入的字不认识,则无法输入。本系统为解决此问题把国标二级字(一级字一般均可认识)进行了分解字形的以声母进行输入的编码,从而解决了不识字的输入问题。如若输入“杳”字,则可用“木”字和“日”字的声母进行输入,编码即为“MR”。
汉卡新系统主要技术指标1、汉卡读取速度65536字节/14个机器周期(T)2、汉卡存储容量512K字节用于存储各种数据表格。
256K字节用于存储国标一、二级汉字库及符号。
256K字节留给扩充用。
3、汉卡为62总线,适用于各种原装及兼容PC/XT机,0520系列机;各种原装及兼容AT机,0530系列机;386机,0540系列机。
4、软件可完成显示,提示显示,输入,打印,造词等功能,造词容量为60K字节(若4字词约5000条左右)。


图1为存储器示意图,图2为存储器译码及控制图,图3为I/O译码线路,图4为内存映射段地址;其中,[1]为控制线,[2]为数据线,[3]为地址线,[4]为芯片控制线,[5]为译码输出。
权利要求
1.实现中文声数编码方案的技术方法,其特征是,该方法将中文声数编码方案用汉卡硬化,并有相应的支撑软件,所说的汉卡由存储器,存储器译码及控制,I/O译码,内存映射段地址,缓冲隔离,去耦滤波以及其它一些控制总线和数据总线构成;汉卡中存储中文声数编码输入方案的字表,双音节词表,三音节词表,四音节词表,不识字表等表格。
2.一种如权利要求1所说的技术方法,其特征是,汉卡将16×16国标GB2312-80基本集的全部汉字固化。
3.一种如权利要求1所说的技术方法,其特征是,在读取的汉卡中数据时,采用了内存映射的读取方式;在读取汉卡中数据时地址译码先用I/O写方式锁存其高8位后和低16位地址相加的方法。
4.一种如权利要求1所说的技术方法,其特征是,把国标二级字字形分解成以声母进行输入的编码,从而解决了不识字和输入问题。
全文摘要
实现中文声数编码方案的技术方法,该方法是将中文声数编码用汉卡硬化,并有相应的支撑软件,汉卡由存贮器,存贮器的译码及控制,I/O译码,内存映射段地址等单元电路构成,本发明优化改造并扩充了原软件系统,为原系统提供了硬件支持,大大提高字词的显示速度,避免了硬盘的严重磨损,减少了内存和硬盘的占用空间,扩大了原系统的适用范围,提高了中文声数编码的实用化程度,具有很高的推广价值。
文档编号G06F3/023GK1048112SQ8910531
公开日1990年12月26日 申请日期1989年6月15日 优先权日1989年6月15日
发明者赵建和, 唐懋宽, 张作岩, 赵磊, 赵海涛, 王逢论, 田在良, 张学海, 张翠玉 申请人:烟台市芝罘区电脑开发公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1