汉字输入和辨识的方法、装置与计算机可读媒体的制作方法

文档序号:6611299阅读:265来源:国知局
专利名称:汉字输入和辨识的方法、装置与计算机可读媒体的制作方法
技术领域
本发明涉及输入和辨识装置和方法;更特定的说,本发明涉及汉字的输入和辨识装 置和方法。
背景技术
现在的汉字输入法可被分为两大类,第一类为依照字音输入,第二类则是依照字形 输入。
常使用的字音输入法包括注音输入法、汉语拼音输入法、以及改进的注音输入法 等等。由于字音输入法容易学习,再加上使用者大多已熟悉拼音方法,因此字音输入法 仍为主要的汉字输入法。字音输入法虽然容易,但如果使用者并不知道要输入汉字的发 音,或者使用者所知的汉字发音不正确(例如^与丄,ik与卩等等),即使使用者知道 汉字的写法,字音输入法仍无法让使用者输入正确的汉字。另外,中国文字无所不至, 汉字使用区域中许多地区仍以地方方言为主,而这些使用者并不了解所有汉字的通用发 音,进而造成字音输入法无法被所有的汉字使用者所使用。
字形输入法利用拆解汉字的方法,将拆解的部分输入,再拼凑成完整的汉字。常见 的字形输入法包括仓颉输入法,无虾米输入法等等。字形输入法解决了字音输入法所 产生的问题,使所有的汉字使用者均可利用字形输入法输入汉字。由于字形输入法的特 性,输入装置必须具有较大的键盘,以容纳所拆解的每一部分,例如,仓颉输入法需利 用26个键以代表每一笔划。因此字形输入法的输入装置受其特性所限制,大多利用计算 机键盘或其他具有更多键的输入装置,无法实施例如手机、遥控器等具有较小键盘的装 置。
另外,汉字部首为过去千百年来通用的汉字检索方式,然而并无利用汉字部首的拆 解方法的输入法。这是因为汉字部首并非有逻辑的规则,且部首类型复杂,难以判别。 因此如果需根据汉字部首拆解和输入汉字时,使用者需强记相似的汉字但位置各异的不
同部首,如凤与凰等(凤在鸟部,凰在几部),汉字的部首,造成使用者的不方便。
由于上述的现有汉字输入法的缺点,需发明一种可克服使用者需强记复杂的汉字部 首的困难,不需使用大键盘,且可让遍布于各地区的方言使用者也可使用的汉字输入法。
在信息处理上的另一类汉字应用需求为汉字辨识。汉字辨识主要是将图形档的汉字 转换为电子档,以利于信息处理。目前的汉字辨识方法是利用检索汉字图形中的数个取 样点,将这数个取样点与汉字数据库中的所有汉字做比较。但是,中文字不像英文字母 仅有26个,如果使用此方法,每一次的辨识都须与数据库中上万个汉字比较,不仅费时, 费资源,且辨识率受限,难以提升。
由于上述的现有汉字辨识法的缺点,在信息处理上需要一种可在短时间内正确地辨 认出汉字的汉字辨识法,以克服取样比对需长时间且辨识率低的问题。

发明内容
为解决上述问题,根据本发明的一实施例的汉字输入方法包括接收第一输入码, 所述第一输入码代表第一数字;根据所述第一输入码,从数据库中选取所述第一输入码 所对应的第一数据码群组;接收第二输入码;根据所述第二输入码,从所述第一数据码 群组中选取所述第二输入码所对应的第一数据码;接收第三输入码;根据所述第一数据 码和所述第三输入码从所述数据库中所对应的第二数据码群组中选取所对应的第二数据 码;以及显示所述第二数据码所对应的汉字。
根据本发明的另一实施例的汉字输入系统包括数据库;检索装置,其用以根据第 一输入码选取第一数据码群组,根据第二输入码选取所述第一数据码群组中所对应的第 一数据码,并根据第三输入码和所述第一数据码从所述数据库中所对应的第二数据码群
组中选取所对应的第二数据码;显示装置,其用以显示所述第二数据码所对应的汉字; 其中所述第一输入码代表第一数字。
根据本发明的另一实施例的汉字辨识方法包括接收图形;判断所述图形是否具有 汉字部首;根据所判断出的汉字部首,从数据库中选取所述汉字部首所对应的第一数据 码群组;根据所述图形,从所述第一数据码群组中选取所对应的数据码;以及输出所述 数据码所对应的汉字。
根据本发明的另一实施例的汉字辨识系统包括数据库,其中所述数据库至少包括 代表汉字部首的第一数据码群组;判断装置,其用以接收图形,并判断所述图形是否具 有汉字部首;辨识装置,其根据所判断出的汉字部首,从所述数据库中选取所述汉字部 首所对应的第一数据码群组,并根据所述图形,从所述第一数据码群组中选取所对应的 数据码;输出装置,其用以输出所述数据码所对应的汉字。


图l为一种汉字输入方法的流程图。 图2为一种汉字输入系统。 图3为一种汉字辨识方法的流程图。 图4为流程A的详细流程图。 图5为流程B的详细流程图。 图6为流程C的详细流程图。 图7为一种汉字辨识装置。 图8-12为字的构型的示意图。
具体实施例方式
本发明利用具有规则的创新的汉字部首编排方式,实施汉字的输入和辨识。汉字部 首的编排遵循一种逻辑,因此排除了现有的部首编排方式需使用者强记所带来的困难, 便利使用者可以轻易认定汉字的部首且利用所述部首输入所述汉字。依照此部首编排方 式,汉字辨识也可更迅速并确实地实现。根据汉字的基本结构,可将汉字分类成数种构 型,而此汉字部首编排方式,则是利用汉字的构型为基础而订出汉字的部首。
汉字构型和其部首订定方法可分为以下五种
一、方块周边型部首环绕着方块字型的周边,共有二衣行臼厂厂广广尸
户飞刁勺气L乙走L门几门斗U山匸匚工口等十型廿八个 部首。
^ 二、上下堆叠型(或三明治型)两个以上字形上下堆叠成一汉字,部首定在最上层。
三、 左右并列型两个以上字形左右并排成一汉字,部首依「不在字左、就在字右」 为原则,如果左右都是部首,则以左为部首。多个字形或部首挤在一边的称为「混合部 首」,单一字形的一边称为「纯部首」,应选纯部首的一边为部首。
四、 田字l型或倒品字型两个以上字形上下堆叠且左右并排成一汉字,部首位于字 的上层,并利用「左右并列型」的规则订定部首。
五、 田字2型两个以上字形上下堆叠且左右并排成一汉字,部首在字的左上第一字 形为部首。
关于上述五种构型和新部首编排方式的详细说明,请参考附件一。
依据本发明的实施例,是为将以上的汉字部首编排实施在汉字输入、辨识中的系统 和方法。由于此汉字部首编排是有逻辑的系统,输入法使用者不须强记每一汉字的部首 便可利用此方法简易地输入汉字。
根据本发明的一实施例,图1为一种汉字输入方法的流程图100。步骤110为接收第一 输入码,而第一输入码代表第一数字,此数字代表待输入的汉字的第一部首的笔划数。
步骤120在收到部首笔划数后,从数据库中选取符合笔划数的部首的数据码群组,即第一 数据码群组。步骤130则接收第二输入码,并在步骤140根据第二输入码从已选取的部首 数据码群组中选取所要的部首,即所述第一数据码群组中的第一数据码。接着步骤150 接收第三输入码。第三输入码可以代表第二数字。第二数字可以代表待输入的汉字笔划 的总笔划数,或可代表待输入的汉字笔划的总笔划数减去先前已输入的部首笔划数。在 步骤160,根据第三输入码从数据库中选取对应的汉字,即第二数据码。最后在步骤170 显示选取的汉字。当待输入的汉字所属的部首为罕见部首时,对应此部首的汉字可能只 有一个。在此时,第三输入码可为代表选取的输入码,使得输入更快速、简便。当待输 入汉字所属的部首为常见部首时,根据本发明的另一实施例,在步骤160中选取对应的汉 字可进一步包括接收第四输入码,根据第四输入码从数据库中选取对应的汉字。
根据本发明的另一实施例,在步骤150中,第三输入码可以代表待输入汉字的第二部 首的笔划数,且包含输入第五输入码以选取所述第二部首,所述第二部首为待输入的汉 字除去所述第一部首后的部首;在步骤160中进一步包含输入第三数字代表待输入的汉字 笔划的总笔划数或所述总笔划数减去第一和第二部首的笔划数,并根据第三数字选取对 应的汉字。根据此实施例,使用者可利用输入多个部首更进一步地縮短汉字输入的时间。
由于输入码可仅为数字键或选取键,因此所使用的输入装置可为具有数字键的装置。 例如, 一般电话、移动电话、遥控器、音响或家电产品等的键盘。由于输入装置可以是 仅具有数字键盘的装置,因此输入装置的尺寸可縮减,使得本发明的汉字输入法可实施 在较小尺寸的装置中。也使得汉字输入更能与电子产品融合,更广泛地被使用。
根据本发明的另一实施例,图2显示一种汉字输入系统200。所述汉字输入系统200 包含数据库210;检索装置220以及显示装置230。根据本发明的一实施例,使用者利用 输入装置输入部首笔划数,输入装置将输入的部首笔划数传送给汉字输入系统200的检索 装置220。检索装置220在接收部首笔划数后,在数据库210中选取笔划数相等于所接收的 部首笔划数的部首群组。而数据库210中存储有所有汉字和所有汉字部首。例如,使用者 输入3,检索装置则从数据库210中选出所有笔划为3的部首。检索装置220在选出同笔划 的部首后,可将所选取的一个或个以上个部首显示在显示装置230上。此时使用者可根据 所显示的部首,利用输入选取键选取部首。此选取键可以是单一键值,例如确定键,也 可为多个键值的组合,例如左右键加确定键或数字键。检索装置220根据所述键值在先前 所选取的部首中,选取第一部首。使用者在完成部首选取后,输入汉字的减去部首的笔 划数或输入汉字的总笔划数。检索装置220在接收此笔划数后,根据所述笔划数,从数据
库210中选取属于所述部首且笔划数符合的汉字。如果部首和笔划符合的汉字只有一个 时,检索装置220可直接从数据库210中选取所述汉字。如果部首和笔划符合的汉字多于 一个时,使用者则需输入另一键值以选择所述汉字。此键值同先前的键值一样,可为单 一键值或多个键值的组合。使用者还可在选取第一部首后,输入第二部首的笔划数并选 取第二部首,此第二部首为待输入的汉字除去第一部首后的部分字形的部首。使用者在 完成多个部首选取后,输入汉字减去多个部首的笔划数总和或输入汉字的总笔划数。检 索装置220在接收此笔划数后,根据所述笔划数,从数据库210中选取属于所述部首且笔 划数符合的汉字。
检索装置220在选择汉字后,将所述汉字输出到显示装置230,并将所述汉字显示在 显示装置230上。由于本发明不需复杂的输入,输入装置可以是任何具有数字键的输入装 置,例如电话键盘、遥控器、音响的输入装置等等。使得汉字输入装置200可以实施在尺 寸较小的电子产品上,也使得汉字输入更简化。
根据本发明的一实施例,图3为一种汉字辨识方法的流程图300。步骤310为接收图形, 图形可包含待辨别的汉字。步骤320在接收图形后,判断图形是否具有汉字部首。如果辨 别的结果为图形确实具有汉字部首时,步骤330利用辨别出的部首(第一部首)从数据库 中,选取属于所述第一部首的汉字群,即第一数据码群组。接着,步骤340再根据接收的 图形,利用习知的辨别方式从选取的汉字群中筛选对应的汉字。最后在步骤350中显示所 述汉字。由于仅需从属于特定部首的汉字群中筛选,因此与现有技术须从上万个汉字中 筛选相比,可大幅提升处理性能和辨识率。如果辨别的结果为图形不具有汉字部首时, 步骤360则可显示空格。根据本发明的另一实施例,在步骤330中,还包括判断去除第一 部首后的图形是否具有第二部首,再利用辨别出的第一部首和第二部首从数据库中,选 取属于所述第一部首和第二部首的汉字群。
为更进一步解说图3中的步骤320和步骤330,请参考图4,其为步骤320和步骤330判 断汉字部首的流程A的详细流程图。步骤410为判断接收的图形是否具有上层图形,其目 的在于判断接收的图形是否属于上下堆叠型。如果是,则进行到流程B;如果否,则进行 到步骤420。步骤420为判断接收的图形是否具有最左图形,其目的在于确定接收的图形 不是上下堆叠型后,判断所述图形是否属于左右并列型。如果是,则进行到流程C;如果 否,则进行到步骤430。步骤430为判断是否具有方块周边型的部首。如果是,则判定接 收的图形具有汉字部首,且所述汉字部首即为方块周边型的所述部首;如果否,则进行 到步骤440。在判定所述图形不属于任何构型后,步骤440判断所述图形是否具有特殊汉
字部首。如果是,则判定接收的图形具有汉字部首,且所述汉字部首即为所述特殊汉字 部首;如果否,则判定接收的图形不具有汉字部首。
图5显示流程B的详细流程图。流程B为流程A中的步骤410,其判定所述接收的图形 具有上层图形。在确定所述图形为上下堆叠型后,由于汉字部首位于上层,因此步骤510 判断所述上层图形是否具有最左图形。如果是,则所述上层图形属于左右并列型,步骤 520以所述上层图形的最左图形为图形,进一步判定所述汉字的部首,进行到流程C。如 果否,则判定在流程A中所接收的图形具有汉字部首,且所述汉字部首即为所述上层图形 所表示的汉字部首。
图6显示流程C的详细流程图。流程C为流程A中的步骤420,其判定所述接收的图形 具有最左图形;或流程B中的步骤510,其判定所述接收的图形的上层图形具有最左图形, 利用最左图形判定接收的图形的部首。步骤610为判断最左图形是否具有单一汉字部首。 如果是,则判定在流程A中所接收的图形具有汉字部首,且所述汉字部首即为所述单一汉 字部首;如果否,则进行到步骤620。当最左图形不具有单一汉字部首时,步骤620判定 最右图形是否具有单一汉字部首。所述最右图形可为位于流程A中所接收的图形最右的图 形,或位于流程B中所述上层图形最右的图形。如果最右图形具有单一汉字部首时,则判 定在流程A中所接收的图形具有汉字部首,且所述汉字部首即为所述单一汉字部首;如果 否,则进行到步骤630。当最左和最右图形均不具有单一汉字部首时,仍以最左图形中的 汉字部首为部首,因此步骤630为判定在流程A中所接收的图形具有汉字部首,且所述汉 字部首即为所述最左图形的汉字部首。
本发明的另一实施例为汉字辨识装置。请参考图7,图7显示一种汉字辨识装置700, 其包括数据库710;判断装置720;辨识装置730以及输出装置740。使用者利用输入装 置将图形输入汉字辨识装置700。输入装置可为扫描装置、手写输入装置或照相装置。 汉字辨识装置700的判断装置720在接收所述图形后,判断出所述图形是否具有汉字部 首。判断方法则是先判断图形的构型,再以图形的构型判断部首的位置。构型可简单分 为上下堆叠型、左右并列型或二者混合。如果图形为上下堆叠型,则利用上层图形判断 部首;如果图形为左右并列型,则利用最左图形判断部首(请参考附件一)。如果所输入 的图形并不具有汉字部首时,则输出空格。
附件l
〈新部首检字说明〉
在「旧部首」里,部首可以在字上、字下、字左、字右、或字中间等五个位置出 现,譬如
字上瑟玉部癸A癸部竟立部客^部壹土部冕曰部
字下慕心部征巾部翡羽部盔皿部摩手部愁心部
字左稣革部琪玉部竦立部焊火部挥手部施方部
字右鸦鸟部难隹部则刀部锥隹部夥夕部献犬部
字中间直目部慶心部愛心部募大部嘗口部喪口部 可以出现部首的位置太多,无疑增加了取决部首时的难度,为何会这样呢? 当东汉许慎以小篆著成中国第一部字书「说文解字」时(公元121年),体例为分立 部首,以字相从,并依六书解说文字;其后多人训诂增补,直到明代嘉靖年间梅膺祚著 字汇,和其后张自烈著正字通,开始确立了现在的部首样貌;距今三百九十年前康熙字 典成书,康熙在谕文中曾明白指出「…增字汇之阙遗,删正字通之繁冗…」;可见康 熙字典的部首订定,仍遵守着过去的传统并未予以修正。
中文字的百分之八十属于形声字,其余百分之二十才属于会意、指事、象形等;譬 如暮、幕、墓三字都是形声字莫音,但这三字的部首不在廿部,却是字下的日、巾、 土部;至于慶、愛、慕、悲、闷等字都涉及内心的悲喜欢欣,就要在心部寻觅了。另外 以形声为字头的非部和麻部,非部仅剩非、靠、靡三字;麻部也只有麻、麼、麼、麾四 字,其他非头、麻头的字,全要在字下为部首的字形里去查了。除去以上的举例,可以 说凡是倒品字形的字,其部首都在字下,这些部首从刀、力、土、玉、石到言、车、金、 鱼、鸟等百多个部首都是;此外最难査的字莫过于以字中为部首的字以及酒、干、丛、 年……等字。
不论一万三四千字的辞典,或是八九千字的字典,较难检索的字约为总字数的五分 之一左右,正因有此困扰,大概从民国三十年代起,市面上不断推出新的查字法字典, 如四角号码字典、起笔字典、同音字典……等;经过时间的洗炼,至今坊间唯剩部首字 典屹立中流,足见部首字典虽多缺失,但确具甚多长处。
历经多年研究,发现以字的构型来订定部首位置,是最为简单可行的事,为此决定 以旧部首为基础从两方面修正
(一)首先确定各种构型的部首位置,和査字方法。
字的构型大致可分为六种(不必细分,以免自陷泥淖)
一、 方块周边型(图8-1至8-10)共二十八个部首
二、 三明治型 (图9-l至9-3)
三、 左、右并列型(图10-l至10-4)
四、 l.品字型(等于三明治型)
2.倒品字型(等于左、右并列型)(图ll-l至ll-3)
五、 l.田字l型(等于左、右并列型)
2.田字2型(左右都是混部首、另有专属选取部首规则)
六、 单一字型(审视字形,参照以上规则选取部首) 不同构型的部首位置与査字方法
第一类构型中文方块字的十种特殊构型,它的部首都环绕着方块的四周打转,所 以命名为方块周边型;这种型式有二十八个部首,不可更改,无法取代,只可接受,兹 以图型和例字对其说明
这二十八个部首,其所涵纳的字数为总字数的7.6%。
第二类构型是由两个以上不同的字形,像三明治样一层层堆砌而成,甚至有达五
层的,兹以图9-l至9-3和例字对其说明这类字的部首都在字的最上层,这类字约占总字 数的13.5%。
第三类构型是属于左、右双拼的字,当然也有少数为三拼或四拼的(如谢、毈… 等);这类字其部首多在字左,仅只l/4不到的部首会在字右,新部首因而规定,凡属于 图10-l至10-4的字,其部首不在字左,就在字右,如果左、右同是部首时,以左为部首的 规定。当看到一个左右双拼的字以后,首先须观察字的左右,看它在200部首中属于哪一 个部首的字,如图10-1情形,秋、酒、和、役,是属于左右同是部首的字,应即适用「以 左为部首」的规则。如属于10-2情况的,每个字的左半边都有多个部首或字形混在一起, 使人无法作出抉择,这种情形姑且命名为「混合部首」或「混部首」;此时的唯一选择 应是转向右边寻求单一字形作为部首,此单一字形可命名为「纯部首」。图10-3的情况
与图10-1相同。至于图10-4的毈字,最左与最右都是部首,最左字形^里多了一个点,成 为混部首,不应被选为部首,最右边的殳字是纯部首,所以应选殳为部首。 第四类构型可分为两种即品字型字、与倒品字型字。
l.品字型字,如晶、品、焱、覆、羲、羡、蠱、翕…;这类字可看作与图 9-l同类型的字,所以字上层的字形即为所述字的部首。2.倒品字型字数量较多,如堡、罵、婴、鴛、鹫、怨、桀、想、椠…;过 去这些字的部首都在字下,査字极为方便,如今「新部首」即已有部首在字上的规定, 等同于废止了字下和字中有部首的可能;所以倒品字型字可参照第三类构型,即图10-1 的各项规定决定部首。
以上第三、四类两项字数的和约占总字数的78.9%。 第五类构型极少数的字其构形呈田字状,有两种情况
1. 有如两个字上、下相迭状,如图12-1的溪与11,或如图12-2的籙字,此 类字的字上部分为左、右双拼状,且有一边为纯部时,应以图ll-l或图ll-2方式处理。
2. 另外有些字,是由两个完整的字一左一右合并而成,甚至左右都是混合 部首时,如图12-1中的举例
靉雨是部首、臻K是部首、糴入是部首、豔山是部首 前面第三、四类和第五类之一的图10-1、 10-2、 11-1、 11-2、 12-1和12-2等左、右双 并的字,不论左右那一边,至少有一边会是单一部首(纯部首);而今第五类的二所指 的呈田字形态的字,左右两边都是混合部首,以上的规则似乎全不适用,因此必须为这 些少数的字另立一项准则,其规则是字的左右两边都是混部首时,以字左边最上部(或 主要)字形为部首(如糴字是最左边的入字、賴字左边的木字即为主要字形)。
譬如巯一部號小部蔵斤部黻^部鋼乂部鹹古部虢一部驢川部馘一部斟甘 部懿土部難千部艷山部賴木部
第六类构型有少数单一的字,它不完全明显属于以上五类构型,它可能是一个单 一字形被多加了一两画,或是两个简单字形的混合体,乍看之下,既不可分上下,又不 可分左右,似乎也不全然符合十种特殊构形的字,这一类的字,只要字的某部分符合上 面五类规定的一部分,即可以认定是某类的字,不要被字形或笔划的沾连所蒙蔽,兹在 以下逐字举例对其说明,使读者遇到同样情况时,可以举一反三,有所帮助而找出字的 部首。如
武就整个字来看,应用「不在字左,便在字右」原则,弋是部首。 弗弓是整个字的主要部分,且在外围,弓是部首。 世应以左为先,七是部首。
帶是图9-l的字,最上层太复杂,「应以左为先」,力是部首。 坐是图9-l的字,不要被土中一直蒙骗了,两个小人是部首。
尤应是图9-l的字, 一是部首。
典应算是图9-l的字,门与A重迭在一起,门是部首。
曲由甲申是田部的附属部首,由是部首。
鬯 U属于十个特殊构型图8-8的部首,U是部首。
内门属于十个特殊构型图8-7的部首,门是字的主要部分,不要被入字头;
混了,
喪 來
木是主要字形,
喪应属于图9-l的字,虽然两个口字镶在土内,土仍是喪的部首。 来字勉强属于图9-l的字,也类似十个特殊构型图8-l,衣部与二部的字, 是部首。
又中文字的构成形式,常有横向或直向的重复字形迭在一起甚或三个、四个迭成 一簇,如果是横向重文,多属图9-l的字,如瑟、琴、習、哭、榮……,必然是部首; 如属直向,应是图10-1的字,不论在左、或在右也可能是部首,如封、能、協、琰、
俎等……。
重文可视为「加强、强调、或众多」等含义。或者将字上的重文不论是两个、三个
或四个,均将其看作单一字形;同样的也可将字左或字右的重文,不论是两个、三个或
四个,均将其看作单一字形,以方便决定其是否可以被选作部首。
举例歇桑又是部首、堯封土是部首、晶咒口是部首、协十是部首、俎坐人是 部首、歜欠是部首、梵麓爽木是部首、瞾田是部首、碥石是部首、夥够夕是部首、勰 脅力是部首、飙犬是部首、能匕是部首。
(二)次为增删改并旧部首。
新部首是在旧部首(二百一十四个部首)的基础上,予以增、删、改、并而成;增 删的原因有很多,主要是除了十种特殊构形的部首(二十八个部首)夕卜,依字的不同构 型,如堆叠、并列、品字、倒品字和田字型,而将部首仅限于字的最上层,或是字的左 右侧;至于过去字中间和字下层可以有部首的旧规,则予以废弃;为此,删除了二十个 个部首,合并十二个部首,简化九个部首,新创十八个部首,同时扩增了三十余个部首 的附属字形;兹将新旧部首增删改并过程详述于后
1. 删除二十个部首I 、、、 里、韭、飛、香、鬯、黍、鼎、龠
2. 合并十二个部首 入部并入人部成为人、入部
J 、儿、斗、比、玄、生、用、内、舛、辰、
匸部并入匚部成为匚、匸部
士部并入土部成为土、士部
久部并入久部成为久、久部
屮部并入^部成为卄,屮部
曰部并入曰部成为日、曰部
月部并入肉部成为肉、月部
4部并入片部成为片、y部
皿部并入网部成为网、皿部
隶部并入聿部成为聿、隶部
龍字去l并入音部成为音、青部 龟字并入黾部成为黾、龟部
某部首并入另一部首,等于两部首共有一个部首。(过去夂为字下部首,新部首 既己取消字下部首,夂己无实质用处)。
3.简化九个部首
爻部简化为乂部并增附力形,以容纳布、左、有、存、希、肴、盔、带……
老部简化为 至部简化为 色部简化为 ^
,-部以容纳老、考、孝、耆、耄、者、鸯、耋、煮、翥…' 云部并增附-力形,以容纳至、充、育、弃、.绖、臻……等字 并增附^、々形,以容纳久、欠、危、急、奂、兔、负、象…'

主乒
青部简化为丰部并增附T形,以容纳邦、毒、青、表、契、责、恝、素、
慧、静……等字。 首部简化为
高部简化为 卤部简化为
"部
古部 古部
井增附A形,以容纳并、前、首、酋、益、兼、普、奠、孳……
以容纳亨、京、哀、亭、亳、高、烹、禀、亶、豪、膏、舞…… 并增附占形,以容纳乩、克、卣、胡、故、卤、辜、鸪、粘、
國效'
黹部简化为业部以容纳芈、黹、业、紛、黻、叢、黼……等字。
4. 新创十八个部首
7部一个十分勉强的部首,字数极少,只有刁、巧、丑、司、€ 、 8等六个字。
厂部容纳反、卮、后、泉、卮、屋、展…等字。
7部并附了形,容纳承、丞、甬、承、勇、卺、蒸、瞀、恿…等字。 九部并附丸形,容纳^、炫、旭、旮、訄、虓、埶、执、孰、势、鸠、热、熟、 騖…等字。
乃部容纳和、厨、尕、盈、鼐…等字。
4部这个部首汇集了三种共八个字形于一部,附4"W"3等形,容纳正体、
简体四十余个字。
亡部容纳妄、邙、忘、肓、盲、望、氓、赢、羸、赢、臝、臝…等字。 中部容纳史、串、忠、盅、患、贵等字。
天部并附夫、夭、央形,容纳失、吞、郑、忝、蚕、规、替、乔、鴂、规……
等字、
^部容纳孛、索、蹇、橐、量、橐、囊、蠹…等字。 A部容纳奉、春、奏、泰、秦、舂、意、蠢…等字。 丘部容纳乒、乓、兵、岳、丘、妮等字。
A部容纳巻、券、蒂、眷、拳、眷、豢、鮝…等字。 吉部容纳劼、直、歆、喜、嘉、臺、颉、熹、鵠、嚭、囍…等字、
冇部并附^、产、产形,容纳帝、彦、旁、商、产、啻…等字。 卓部并附卓形,容纳桌、乾、朝、戟、榦、翰、韩、鶉…等字。
尚部容纳党、堂、敞、棠、常、掌、掌、當、尝、裳、赏、氅、党…等字。
幷部并附并、幵、升形,容纳刑、邢、瓶、型、艴、雅、鵜…等字。
5. 「新部首」既将二百一~h四个旧部首中的五十三个部首,予以增、删、改、并成 为三十九个新部首之后,结合所余的一百六十一个旧部首,并将其中部分部首的附属字 形予以扩增,使其合于新部首的功能所需,兹将200个新部首依序在后面列表
注部首总表第13部首冗部的附形冒,与第14部首用部的附形呙极为近似,读者不 免有混淆或重复的疑虑,其实冗部的冒是为冒、靜、冕、勖等字头而设;至于用部的呙,
则专为凸、呙、典、典等字所专有,正因为考虑到将其融于一部必导致混为一谈,因此 分置于两个部以使其有所区分。
凡事都有例外,偏偏有些字既有楚旁,又同时具有^头或竹头,如莲,蓬...等;也
有少数字具有穴,产、皿、户、尸、广、米、西...等字头,这类部首既可以是甲又可以 是乙的字,旧部首的处理方法是将大部分有是旁又同时有*头的字纳入*部与竹部,
却将其它部分具有同样情况的字仍滞留在楚部中,如邁、遂等;新部首的处理原则是
将所有楚旁又同时有^头与竹头的字,不论是莲、蓬或是邁、遂'等…,全接纳入"""部与
竹部,以维持以往的查字习惯;至于有是旁又同时具有穴,产、皿、户、尸、广、米、 西...等字头者,则全部留在是部,不予更改。
新部首也可以适用于「简化字」,为序号55的川部,须考虑增列55-l以容纳附属字
型'乂和听,因为站在简化字的立场仅和听应为图9-l的字,如果以字数不算太多,将収和
^看作倒品字形字而不另立部首,也无不可。
权利要求
1.一种汉字输入的方法,所述方法包括接收第一输入码,所述第一输入码代表第一数字;根据所述第一输入码,从数据库中选取所述第一输入码所对应的第一数据码群组;接收第二输入码;根据所述第二输入码,从所述第一数据码群组中选取所述第二输入码所对应的第一数据码;接收第三输入码;根据所述第一数据码和所述第三输入码从所述数据库中所对应的第二数据码群组中选取所对应的第二数据码;以及显示所述第二数据码所对应的汉字。
2. 根据权利要求l所述的方法,其中接收所述第一输入码、所述第二输入码以及所述 第三输入码是从具有数字键的输入装置接收的。
3. 根据权利要求2所述的方法,所述输入装置仅包括数字键。
4. 根据权利要求2所述的方法,所述输入装置为电话机的输入装置。
5. 根据权利要求2所述的方法,所述输入装置为移动电话的输入装置。
6. 根据权利要求2所述的方法,所述输入装置为遥控器。
7. 根据权利要求2所述的方法,所述输入装置为媒体播放器的输入装置。
8. 根据权利要求l所述的方法,其中所述第一数据码群组对应于具有相同笔划数的汉 字部首,其中所述笔划数等于所述第一数字。
9. 根据权利要求l所述的方法,其中所述第一输入码为单一键值或多个键值的组合。
10. 根据权利要求l所述的方法,其中所述第二输入码为单一键值或多个键值的组合。
11. 根据权利要求l所述的方法,其中所述第三输入码为单一键值或多个键值的组合。
12. 根据权利要求l所述的方法,其中所述第二数据码群组对应于具有相同汉字部首的 汉字,其中所述汉字部首对应于所述第一数据码。
13. 根据权利要求12所述的方法,其中所述第三输入码代表第二数字,且所述第二数据 码群组对应于具有相同汉字部首和相同总笔划数的汉字,其中所述第二数字等于所 述相同总笔划数减去所述第一数字。
14. 根据权利要求12所述的方法,其中所述第三输入码代表第二数字,且所述第二数据 码群组对应于具有相同汉字部首和相同总笔划数的汉字,其中所述第二数字等于所 述相同总笔划数。
15. 根据权利要求12所述的方法,其中所述第三输入码代表第二汉字部首的笔划数,且 所述第二数据码群组对应于具有相同第一汉字部首和相同第二汉字部首的汉字,其 中所述第一汉字部首对应于所述第一数据码。
16. 根据权利要求l所述的方法,其中根据所述第一数据码和所述第三输入码从所述数 据库中所对应的第二数据码群组中选取所对应的第二数据码,其进一步包括接收第四输入码;根据所述第四输入码从所述第二数据码群组中选取所对应的所述第二数据码。
17. 根据权利要求16所述的方法,所述第四输入码为单一键值或多个键值的组合。
18. 根据权利要求l所述的方法,其中将所述汉字显示在显示装置上。
19. 根据权利要求18所述的方法,其中所述显示装置为液晶屏幕。
20. —种存储于计算机中的计算机可读媒体,当执行所述计算机可读媒体时,使所述计 算机执行一方法,所述方法包括接收第一输入码,所述第一输入码代表第一数字;根据所述第一输入码,从数据库中选取所述第一输入码所对应的第一数据码群 组;接收第二输入码;根据所述第二输入码,从所述第一数据码群组中选取所述第二输入码所对应的第 一数据码;接收第三输入码;根据所述第一数据码和所述第三输入码从所述数据库中所对应的第二数据码群 组中选取所对应的第二数据码;以及 显示所述第二数据码所对应的汉字。
21. —种汉字输入系统,所述系统包括数据库;检索装置,其用以根据第一输入码选取第一数据码群组,根据第二输入码选取所 述第一数据码群组中所对应的第一数据码,并根据第三输入码和所述第一数据码从 所述数据库中所对应的第二数据码群组中选取所对应的第二数据码;显示装置,其用以显示所述第二数据码所对应的汉字; 其中所述第一输入码代表第一数字。
22. 根据权利要求21所述的系统,其中所述数据库至少包括代表汉字部首的数据码群 组。
23. 根据权利要求21所述的系统,其中所述检索装置包含缓冲装置,其用来接收所述第 一、第二输入码。
24. 根据权利要求21所述的系统,其中所述第一输入码为单一键值或多个键值的组合。
25. 根据权利要求21所述的系统,其中所述第二输入码为单一键值或多个键值的组合。
26. 根据权利要求21所述的系统,其中所述第三输入码为单一键值或多个键值的组合。
27. 根据权利要求25所述的系统,其中所述第一数据码群组对应于具有相同笔划数的汉 字部首,其中所述笔划数等于所述第一数字。
28. 根据权利要求21所述的系统,其中所述第二数据码群组对应于具有相同汉字部首的 汉字,其中所述汉字部首对应于所述第一数据码。
29. 根据权利要求28所述的系统,其中所述第三输入码代表第二数字,且所述第二数据 码群组对应于具有相同汉字部首和相同总笔划数的汉字,其中所述第二数字等于所 述相同总笔划数减去所述第一数字。
30. 根据权利要求28所述的系统,其中所述第三输入码代表第二数字,且所述第二数据 码群组对应于具有相同汉字部首和相同总笔划数的汉字,其中所述第二数字等于所 述相同总笔划数。
31. 根据权利要求21所述的系统,其中所述显示装置为液晶屏幕。
32. —种汉字辨识的方法,所述方法包括接收图形;判断所述图形是否具有第一汉字部首;根据所判断出的所述第一汉字部首,从数据库中选取所述第一汉字部首所对应的 第一数据码群组;根据所述图形,从所述第一数据码群组中选取所对应的数据码;以及 输出所述数据码所对应的汉字。
33. 根据权利要求32所述的方法,其中根据所述图形从所述第一数据码群组中选取所对 应的数据码,进一步包括判断去除所述第一部首后的图形是否具有第二汉字部首;根据所判断出的所述第二汉字部首,从所述第一数据码群组中选取所述第二汉字 部首所对应的第二数据码群组;根据所述图形,从所述第二数据码群组中选取所对应的数据码。
34. 根据权利要求32或33所述的方法,其中所述判断所述图形是否具有汉字部首的步骤 包括(a) 图形最上层的上层图形;(b) 如果所述图形具有上层图形,判断所述上层图形是否具有汉字部首(c) 如果所述图形不具有上层图形,判断所述图形是否具有位于所述图形最左的 最左图形,(d) 如果所述图形具有最左图形,判断所述图形是否具有汉字部首;(e) 如果所述图形不具有最左图形,判断所述图形是否具有位于所述图形周边的 汉字部首;(f) 如果所述图形具有位于所述图形周边的汉字部首,以所述图形周边的汉字部 首为所述图形的汉字部首;(g) 如果所述图形不具有位于所述图形周边的汉字部首,判断所述图形是否具 有特殊汉字部首。
35. 根据权利要求32或33所述的方法,其中如果所述图形具有最左图形,判断所述图形 是否具有汉字部首包括(h) 判断所述最左图形是否具有单一汉字部首;(i) 如果所述最左图形具有单一汉字部首,则判定所述图形具有汉字部首,且所 述汉字部首为所述单一汉字部首;(j)如果所述最左图形不具有单一汉字部首,则判断位于所述图形最右的最右图 形是否具有单一汉字部首;(k)如果所述最右图形具有单一汉字部首,则判定所述图形具有汉字部首,且 所述汉字部首为所述单一汉字部首;(I)如果所述最右图形不具有单一汉字部首,则判定所述图形具有汉字部首,且 所述汉字部首为所述最左图形。
36. 根据权利要求32或33所述的方法,其中判断所述上层图形是否具有汉字部首包括-(m)判断所述上层图形是否具有位于所述上层图形最左的最左图形; (n)如果所述上层图形具有最左图形,则重复步骤(h)至(1)判断所述上层图 形的最左图形的汉字部首,并以所述上层图形的最左图形所判断的所述汉字部首为 所述图形的所述汉字部首;(o)如果所述上层图形不具有最左图形,则判定所述图形具有汉字部首,且所述汉字部首为所述上层图形。
37. 根据权利要求32或33所述的方法,其中接收所述图形是从输入装置接收的。
38. 根据权利要求37所述的方法,其中所述输入装置为扫描装置。
39. 根据权利要求37所述的方法,其中所述输入装置为手写输入装置。
40. 根据权利要求37所述的方法,其中所述输入装置为照相装置。
41. 根据权利要求32或33所述的方法,其中所述第一数据码群组对应于具有所述汉字部 首的汉字。
42. 根据权利要求32或33所述的方法,其中将所述汉字输出到存储器中。
43. —种存储于计算机中的计算机可读媒体,当执行所述计算机可读媒体时,使所述计 算机执行一方法,所述方法包括接收图形;判断所述图形是否具有汉字部首;根据所判断出的汉字部首,从数据库中选取所述汉字部首所对应的第一数据码群 组;根据所述图形,从所述第一数据码群组中选取所对应的数据码;以及 输出所述数据码所对应的汉字。
44. 一种汉字辨识系统,所述系统包括-数据库,其中所述数据库至少包括代表汉字部首的第一数据码群组;判断装置,其用以接收图形,并判断所述图形是否具有汉字部首;辨识装置,其根据所判断出的汉字部首,从所述数据库中选取所述汉字部首所对应的第一数据码群组,并根据所述图形,从所述第一数据码群组中选取所对应的数据码;输出装置,其用以输出所述数据码所对应的汉字。
45. 根据权利要求44所述的系统,其中所述判断装置包含缓冲装置,其用来存储所述图 形。
46. 根据权利要求44所述的系统,其中所述判断装置包含处理器,其用来存储所述图形。
全文摘要
本发明提供一种汉字输入和辨识方法,其利用一种具有规则性的创新的汉字部首编排方式以输入和辨识汉字。根据本发明的汉字输入方法,克服了使用者需强记复杂的汉字部首或汉字拆字法的困难,也不需使用大键盘,且可让遍布于各地区的方言使用者所使用。根据本发明的汉字辨识方法,可克服取样比对需长时间且辨识率低的问题,能在短时间内,正确地辨认出汉字。
文档编号G06F3/023GK101359255SQ20071013803
公开日2009年2月4日 申请日期2007年8月2日 优先权日2007年8月2日
发明者索文蔚 申请人:索文蔚
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1