汉语文档快速录入处理技术及其键盘的制作方法

文档序号:6588890阅读:191来源:国知局
专利名称:汉语文档快速录入处理技术及其键盘的制作方法
技术领域
本发明涉及计算机汉字输入技术领域,尤其是汉语文档快速录入处理技术及其键盘。
背景技术
目前汉字输入法按其输入设备分为语音输入法、手写输入法、扫描输入法和键盘输入法,主要都是由声母码、韵母码、部首码、笔画码、字词组合码和句子组合码构成。其中具有智能联想功能的已有很多,比如智能ABC汉字输入法,它能够输入词组和记忆新字词,但是它仅仅能够记忆新字词,不能记忆句子、段落;全拼输入法和联想五笔也仅仅能做到单字词的联想,而不能建立词组间的关联关系,所有这些输入法更不能做到记忆词组与词组之间的关联关系,进行文档、信函、资料、信息交换时的快速录入处理,目前各输入法在任何条件下都远远达不到“口述”的速度,且不具有个性化、专业化、行业化的特点。

发明内容
本发明的目的在于提供一种汉语文档快速录入处理技术及其键盘,这种汉语录入处理方法能利用词组与词组关联来进行句子、段落、文章的快速录入,在录入过程中,标点符号的插入以及规定的连接字的插入不中断词组与词组的关联关系,并能自动记忆使用过的词组、词组与词组间的关联关系,从而达到句子、段落等的“连贯”记忆,智能功能使本发明软件具有个性化、专业化、行业化的特点,适用性更加广泛;使用方便,输入速度快,无识别率问题。
本发明的目的是通过实施下述技术方案实现的本发明包括主机硬盘、屏幕显示窗口、键盘,其特征在于在主机硬盘上预设有单字内码数据库;2-4词组内码数据库;三字词组、四字词组的首部件编码数据库;词组与词组关联关系的数据库;单字的笔画部件输入规范的控制程序;规定的单个连接字的数据库;过程部件的内码数据库。
本发明所述的屏幕显示窗口包括显示已输入部件的历史窗口;显示检索到的单字的窗口;显示检索到的过程部件的窗口;显示检索到的词组的窗口;连续输入三个部件时所检索到的三字词组显示窗口;连续输入四个部件时所检索到的四字词组显示窗口,连接字提示窗口,过程部件提示窗口、繁体字和简体字对照窗口。
本发明所述的键盘与主机之间通过串口或USB口进行连接,并有通讯协议,主机硬盘上有所述键盘的驱动程序。
本发明所述键盘的任一键被敲击后,主机通过通讯协议获得相应信息,进行多线程检索,并通过屏幕显示窗口将输入的部件和检索出的单字、词组、过程部件等及其结合的方式显示出来。
本发明所述的单字内码数据库是将每个汉字按照书写顺序,从上到下,从左到右和键盘上给定的部件或过程部件,结合取大原则,一字一码或一字多码而组合构成的。一字多码,对应于同一汉字的不同书写顺序或是笔画的不同理解或是部件选取的多少。
本发明所述的词组与词组关联关系的数据库是将句子或段落按已有的2-4词组、新增的2-4词组、符合规定的连接字进行划分,然后按先后顺序令后面的词组与和它相邻的前一词组关联。建立关联关系时,两个词组之间有规定的连接字或有标点符号、或一段开头的词组与上一段最后一个词组都视为关联。
本发明所述的键盘上直接设置有汉字的五类基本笔画“一”、“丨”、“丿”、“丶”、“乙”,以及常用的偏旁部首“鱼”、“广”、“马”、“纟”、“人”、“车”、“”、“钅”、“木”、“氵”、“艹”、“土”、“宀”、“虫”、“忄”、“山”、“亻”、“扌”、“日”、“月”、“口”、“讠”。
本发明所述的笔划和常用偏旁部首按照下列方式排布“鱼”、“广”、“马”、“纟”、“人”、“车”“”、“钅”、“木”、“氵”、“艹”、“土”、“宀”“虫”、“一”、“丨”、“丿”、“丶”“乙”、“忄”“山”、“亻”、“扌”、“日”、“月”、“口”、“讠”。
本发明所述的键盘或显示窗口上设置有仅输入简化字或简体、繁体能同时输入(仅输入繁体字或简体、繁体能同时输入)的切换功能键。
本发明所述的键盘或显示窗口或PC键盘上设置有启动智能功能的功能键,进入此功能状态,新增的词组和词组与词组的关联关系能被存储于相关的数据库中。
本发明所述的汉语文档快速录入处理技术的键盘上设置有标点符号与笔划和定义的部件结合,按照下列方式排列

本发明所述的汉字输入步骤如下A、在键盘上敲击确认简体字输入或简体、繁体同时输入(繁体字输入或简体、繁体能同时输入)的功能键,进入同时输入或不同时输入的状态;敲击另一功能键进入或退出智能状态;B、按照书写的笔划顺序,从上到下、从左到右,按照取大原则,在键盘上直接敲击相应的键;本发明的理论基础如下事先建立相应的各种数据库,单字内码数据库根据国标GB18030-2000对27000余字,用规定的27个部件以及规定的过程部件,按照书写顺序,从上到下、从左到右利用取大原则确定内码,一个字可以有多个码,例如天“一一丿丶”和“一”都是它的码;考虑到在广大人群中存在的笔画、笔顺不清的情况,我们增加了容错码,例如,光“丨丶丿”及“丶丨丿”都是它的码,一个字可以有多达六、七个码。
简繁版按照简体字的书写顺序确定内码,繁简版按照繁体字的写法确定内码,对应的简体字和繁体字在每个版本中内码相同并放在一起,对于多个繁体字对应同一简体字的特殊情况,为了节约内存占用,作特殊技术处理情况。例如在简繁版中,体(體)的内码为“亻木一”,而在繁简版中,體(体)的内码为“丨骨丨”。因此。简繁版提供给写简体字的人使用,而繁简版提供给写繁体的人使用。
词组内码数据库装有2-4字词组,其中的三字词组和四字词组有关联的首部件编码;词组与词组关联关系数据库记录词组与词组的关联关系。把一个句子或段落或文章,按已有的2-4词组、新增的2-4词组(根据自己的需要确定)、符合规定的连接字进行划分,然后按先后顺序令后面的词组与和它相邻的前一词组关联。建立关联关系时,两个词组之间有一个连接字或有标点符号、或一段开头的词组与上一段最后一个词组都视为关联。将这些词组与词组的关键关系记录下来构成词组与词组关联关系的数据库,利用智能功能,使用时还可随时增加新词组和词组与词组之间的关联关系。同时可以增加新增词组中三字词、四字词的首部件编码。所以,在输入一个词组后,在词组框会显示与该词组关联的词组、规定的连接字也在屏幕显示框显示出来,这时可以用不同的顺序输入关联的词组、连接字、标点符号;又输入一个词组后,同样可以利用关联关系来继续输入词组,这样以“一键输入一个词组”的速度“一气呵成”地快速录入一段或一篇文章,正是本发明的最核心之处。数据库中还没有的关联关系,可以用智能功能增加,下一次就可快速输入。
规定的单个连接字的数据库中有的、是、与、或、等、和,以、如、使等,也可选择更需要的连接字。例如了、地等等,用于将有关联关系的两个词组连起来。例如词组“中国人民”与“不可战胜”之间可以插入连接字“是”来录入句子“中国人民是不可战胜的”。
本发明的优点在于
(1)输入汉字方便简单,由于在键盘上直接设置有常用的笔画、部件和标点符号,输入方式直观、简明。同时采用笔划顺序输入,符合中国人书写汉字的习惯。
(2)输入汉字速度快,由于设置有词组与词组之间的关联关系数据库,利用词组与词组的关联关系,进行录入工作,基本上可以做到“一键一词”,整段、整篇文章的录入可以一气呵成。
(3)具有超强的记忆功能,能记忆新的词组、词组与词组之间的关联关系,使软件能适应不同用户的特殊需要,极大地提高特殊用户的录入速度。
(4)容错性强,对于不同书写顺序习惯书写的汉字都能容错,即一个汉字有多种笔划、部件顺序的输入形式。
(5)采用新的国标GB18030-2000,解决了27000余字的输入,包含港、台地区所用大五码、统一码的所用汉字。单字内码的编制方案可以解决45000或70000多汉字的输入问题。
(6)本发明在汉语录入过程中,标点符号的插入以及规定的连接字的插入不中断词组与词组的关联关系,并能自动记忆使用过的词组、句子、段落等,具有个性化、专业化、行业化特点,适用范围广。
(7)本发明的汉字键盘与PC键盘配合使用,中英文可以混合输入,不需进行切换。例如“与PC键盘配合使用”就可以先输“与”,接着用PC键盘输入“PC”再接着输入“配合使用”。
(8)本发明的汉字规范控制程序,可起到“规范文字、推广普通话”的作用。


图1为本发明键盘结构示意2为本发明键盘部首、标点以及其他按键的布置图
具体实施例方式实施例1单字输入输入“明”字。在键盘上直接敲击“日”和“月”两键,直接输入“明”字。
输入“天”字。在键盘上直接敲击“一”、“一”、“丿”、“丶”,就会在屏幕显示窗口上显示出来“天”字,敲击确认键,输入“社”字。
输入“天”字,也可以敲击“一”,再敲击“输入4”立即输入“天”。
实施例2词组输入输入“社会主义”。在键盘上直接敲击“丶”、“人”、“丶”、“丶”,词组框就会出现该词组,用汉字键盘上的数字或PC键盘上数字小键盘的数字都可输入这个词组;输入“建设时期”。在键盘上直接敲击“乙”、“讠”、“日”、“一”,就可输入“建设时期”;实施例3整句、整段输入输入“社会主义建设时期”。在键盘上直接敲击“丶”、“人”、“丶”、“丶”,输入“社会主义”,然后敲击数字“7”输入“建设时期”;输入“中国人民解放军的唯一宗旨是紧紧地和人民站在一起,全心全意为人民服务……”这段话。在键盘上直接敲击“丨”、“丨”、“人”、“乙”,输入“中国人民”接着用PC键盘上数字小键盘的数字键,一键一个词组,依次输入“解放军”、“唯一宗旨”、“紧紧地”、“和人民”、“站在一起”、“全心全意”、“为人民”、“服务”……在输入“解放军”、“唯一宗旨”这两个词组之间、用确认键输入连接字“的”;在“唯一宗旨”、“紧紧地”这两个词组之间,用“输入2”键输入连接字“是”;在“站在一起”、“全心全意”这两个词组之间输入标点符号“,”……,完成整句、整段的输入。
实施例4智能功能输入诗词《茅屋为秋风所破歌》,可将全诗连同标题按2-4字词组、连接字进行划分,在启动智能功能后依次输入,例如,标题可划分为“茅屋”、“为秋风”、“所破歌”,接着是正文“八月秋高”、“风怒”、“卷我屋上”、“三重茅”……。第一次录入以后,在任何输入过程中,需要引用“安得广厦千万间、大庇天下寒士俱欢颜……”,均可用已有的词组关联关系,一键一词快速输入“安得广厦”、“千万间”、“大庇天下”、“寒士”、“俱欢颜”、……;也可快速输入全诗或某一部分。
权利要求
1.汉语文档快速录入处理技术,包括主机硬盘、屏幕显示窗口、键盘,其特征在于在主机硬盘上预设有单字内码数据库;2-4词组内码数据库;三字词组、四字词组的首部件编码数据库;词组与词组关联关系的数据库;单字的笔画部件输入规范的控制程序;规定的单个连接字的数据库;过程部件的内码数据库;录入处理软件;音库。
2.根据权利要求1所述的汉语文档快速录入处理技术,其特征在于所述的屏幕显示窗口包括显示已输入部件的历史窗口;显示检索到的单字的窗口;显示检索到的过程部件的窗口;显示检索到的词组的窗口;连续输入三个部件时所检索到的三字词组显示窗口;连续输入四个部件时所检索到的四字词组显示窗口,连接字提示窗口,过程部件提示窗口、繁体字和简体字对照窗口。
3.根据权利要求1所述的汉语文档快速录入处理技术的键盘,其特征在于所述的键盘与主机之间通过串口或USB口进行连接,并有通讯协议,主机硬盘上有键盘驱动程序。
4.根据权利要求1或3所述的汉语文档快速录入处理技术的键盘,其特征在于所述键盘的任一键被敲击后,主机通过通讯协议获得相应信息,进行多线程检索,并通过屏幕显示窗口将输入的部件和检索出的单字、词组、过程部件等及其结合的方式显示出来。
5.根据权利要求1所述的汉语文档快速录入处理技术,其特征在于所述的单字内码数据库是将每个字按照书写顺序,从上到下,从左到右和键盘上确定已有的部件或过程部件结合取大原则,一字一码或一字多码而组合构成的。
6.根据权利要求1所述的汉语文档快速录入处理技术,其特征在于所述的词组与词组关联关系的数据库是将句子或段落按已有的2-4词组、新增的2-4词组、符合规定的连接字进行划分,然后按先后顺序令后面的词组与和它相邻的前一词组关联,且建立关联关系时,两个词组之间有连接字或有标点符号均视为两个词组直接关联,以及下一段落开头的词组与上一段落最后一个词组也视为关联。
7.根据权利要求1所述的汉语文档快速录入处理技术的键盘,其特征在于所述的键盘上直接设置有将汉字的笔划归并为五类的“一”、“丨”、“丿”、“丶”、“乙”,以及定义的部件“鱼”、“广”、“马”、“纟”、“人”、“车”、“”、“钅”、“木”、“氵”、“艹”、“土”、“宀”、“虫”、“忄”、“山”、“亻”、“扌”、“日”、“月”、“口”、“讠”。
8.根据权利要求1所述的汉语文档快速录入处理技术的键盘,其特征在于对于简繁版,所述的键盘或显示窗口上设置有仅输入简化字或简体、繁体能同时输入的切换功能键;对于繁简版,所述的键盘或显示窗口上设置有仅输入繁体字或繁体、简体能同时输入的切换功能键;,
9.根据权利要求1或6所述的汉语文档快速录入处理技术的键盘,其特征在于所述的键盘或显示窗口或PC键盘上设置有启动智能功能的功能键,进入此功能状态,新增的词组和词组与词组的关联关系能被存储于相关的数据库中。
10.根据权利要求1所述的汉语文档快速录入处理技术的键盘,其特征在于所述的键盘上设置有标点符号,与笔划和定义的部件结合按照下列方式排列
全文摘要
本发明公开了一种汉语文档快速录入处理技术及其键盘,在主机硬盘上预设有单字内码码本的数据库;2-4字的词组内码码本的数据库;三字词组、四字词组的首部件编码码本的数据库;词组与词组关联关系的数据库等,利用词组与词组关联来进行句子、段落、文章的快速录入,在录入过程中,标点符号的插入以及规定的连接字的插入不中断词组与词组的关联关系,自动记忆词组、词组与词组关联关系的智能功能使软件具有个性化、专业化、行业化,适用性更加广泛;使用方便,输入速度快,识别率高。
文档编号G06F3/023GK1485717SQ0213383
公开日2004年3月31日 申请日期2002年9月29日 优先权日2002年9月29日
发明者康泰, 康 泰 申请人:康泰, 康 泰
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1