结合汉字部件与数字的检字方法及其相关系统的制作方法

文档序号:6501463阅读:181来源:国知局
结合汉字部件与数字的检字方法及其相关系统的制作方法
【专利摘要】本发明提供一种结合汉字部件与数字的检字方法,其包含:(a)输入一汉字的至少一部件于一汉字过滤模块;(b)扣除该汉字的该至少一部件,并计算该扣除汉字部件后剩余笔划数;(c)将该剩余笔划数输入于该汉字过滤模块,以筛选出至少一个或复数个候选汉字;及(d)透过一汉字显示模块显示欲搜寻的汉字。用户只需输入经常使用或熟悉的部件,并且计算剩余的笔划数目,不需依赖任何软硬件的查询,即可获得欲搜寻的汉字。
【专利说明】结合汉字部件与数字的检字方法及其相关系统

【技术领域】
[0001] 本发明涉及一种检字方法,特别地,其透过输入汉字部件与数字的方法获得欲搜 寻的汉字。

【背景技术】
[0002] 自许慎说文解字,汉字开始有"部首"的观念,明代的"字汇"首创部首(一级索引) 加笔划(二级索引)的检字方法,然而该检字方法的缺点在于部首难以判定,及"部首"与"笔 划"相同的字形相当多。以往的纸本字典只能用"形符"作分类,但同一"形符"的字往往较 多,如含有形符"木"就有上千字。
[0003] 另一方面,目前的汉字输入法主要分为两类,第一类是汉字拼音输入法,其较容易 记忆和使用,但需要按键的次数较多,且因重音字而造成重码率高,用户须透过按键选择重 音字,因此输入的输入较慢;而第二类是拆字输入法,其虽重字率很低,但所采用的拆字规 则较为复杂,用户需花费时间记忆汉字拆分的规则。若以键盘输入区作区分,汉字输入法主 要分为两类,一种是以英文字母键为输入键,这类输入主要是用于计算机设备;另一类是以 数字键作为输入键,这类输入主要是用在行动电话、PDA等便携式移动装置上。
[0004] 随着便携式移动装置的进步,智能型手机或个人电脑将逐渐发展为手写及语音输 入的模式;然而,艰深的汉字无法让用户实时获得正确的部首或拼音方式,进而无法获得欲 搜寻的汉字。


【发明内容】

[0005] 有鉴于过去汉字输入法的缺点,本发明的目的是提供一种快速搜寻汉字的方法, 用户只需输入经常使用或熟悉的部件,并且计算剩余的笔划数目,不需依赖任何软硬件的 查询,即可获得欲搜寻的汉字。
[0006] 因此,本发明提供一种合汉字部件与数字的检字方法,其包含以下步骤:(a)输入 一汉字的至少一部件于一汉字过滤模块;(b)扣除该汉字的该至少一部件,并计算该扣除 汉字部件后剩余笔划数;(c)将该剩余笔划数输入于该汉字过滤模块,以筛选出至少一个 或复数个候选汉字;及(d)透过一汉字显示模块显示欲搜寻的汉字。
[0007] 本发明中的汉字过滤模块连结下述组件,其包括:(i) 一部件数据库,其包括复数 个汉字部件形代码;(i i ) 一笔划数字数据库,其包括复数个数字代码;及(i i i ) 一检字演算 规则单元,其连结该汉字及部件数据库及该笔划数字数据库,该检字演算规则单元包含一 检字演算规则法,将输入的汉字部件形码及数字码透过该检字演算规则法演算后,筛选出 该复数个候选汉字。
[0008] 在一具体实施例中,该"部件"包含基本字码或汉字的一部分部件。本文中所述的 "基本字码"可为"撇"、"直"或"折",基本字码"撇"代表汉字的"撇"、"捺"、"点"及"提笔"; 基本字码"直"代表平直的汉字笔划"坚"及"横";基本字码"折"代表汉字所有的"折"和 "钩"。而本文中所述的"部分部件"指的是将一汉字拆分成若干部件,举例来说,如"想"字, 其是由"相" + "心"组成,"相"是由"木" + "目"组成,因此,"相、木、目、心"皆可作为"想" 的汉字的检索条件。
[0009] 本文中所述的汉字显示模块包含个人电脑、行动电话、个人数字助理或手持式计 算机(不限于此)。
[0010] 在一具体实施例中,本发明所使用的"检字演算规则法"包含一递归拆分方法及一 笔划库压缩方法。
[0011] 本文所述的递归拆分方法是利用一具有汉字基础结构的部件拆分表,其包含汉字 部件序列。针对拆分方法,其是将每个汉字进行穷尽拆分,或针对具有复合部件的汉字进行 拆分,举例来说,将"盟"字进行拆分,其部件可为"明、"日"、"月"或"皿"。
[0012] 另一方面,当用户输入一个部件时,本发明的系统直接扫描或查询该部件拆分表, 针对每一个部件列出所有含有此部件的汉字,举例来说,若扫描到"日"部件,该递归拆分方 法即可列出所有含有部件"日"的汉字列表,如昌、晶、明或盟等汉字(不限于此)。
[0013] 本发明所使用的递归拆分方法只需掌握少量的部件,即可搜寻大部分的汉字。举 例来说,当用户输入"口口人人"即获得"劍"字,使用者不需了解"僉"部件。经过运算后, 用户只要掌握最常使用的100个部件,即可获得函盖84%的汉字(约六万个汉字),若是掌握 200个部件,则可涵盖92%的汉字。
[0014] 本文所述的笔划库压缩法可结合递归拆分方法,该笔划库压缩法是以至少一万国 码(Unicode)按该汉字部件及笔划进行排序,并使用变动长度编码(Run-length encoding) 压缩的压缩方法。本发明利用该笔划库压缩法可将汉字的部件直接以数字代替,举例来说, 针对"義"字,由于"義"字上方并非汉字部件或部首,亦即"非字部件",其是"羊"字的变体, 故用户可于系统中直接输入部件"我"及数字"6"。
[0015] 本发明另提供一种根据汉字部件与笔划数字产生汉字的检字系统,其包含:(a) 一至少一汉字数据库,其用以提供汉字;(b) -汉字过滤模块,其与该汉字数据库耦合,根 据输入的一汉字部件及该扣除汉字部件的剩余笔划数字,透过该汉字过滤模块筛选出复数 个候选汉字;及(c) 一汉字显示模块,其与该汉字过滤模块耦合,用以显示欲搜寻的汉字。
[0016] 在一具体实施例中,该汉字显示模块可与一操作系统(Operating System) f禹合, 其中该操作系统可为 Windows、Mac、Linux BSD (Berkeley Software Distribution)、iOS 或Android操作系统。
[0017] 对于初学汉字的用户来说,本发明以笔划作为一种过滤方式,达成快速搜寻到目 标汉字,用户只需输入基本部件及笔划计算的规则,不需知道汉字的写法,即可快速搜寻到 汉字,同时亦解决非字部件无法在智能手机或电脑输入的问题。另一方面,本发明另一特殊 功效是可利用用户使用的部件频率及涵盖率,以统计的方法来决定用户学习汉字的顺序。
[0018] 本说明书及权利要求书中所用的词语"包含"、"具有"、"包括"或"含有"为包括在 内的或开放式的,且其不排除额外未引用的组件或方法步骤。
[0019] 本发明的上述及其它的优点,不难从下述所选用的实施例的详细说明与附图获得 深入了解。兹以下列具体实施态样以进一步例示说明本发明,其中该些实施态样仅提供作 为说明,而非用以限制本发明的范畴。

【专利附图】

【附图说明】
[0020] 图1显示本发明的检字系统。
[0021] 图2显示检字系统的操作流程及呈现汉字的方式。
[0022] 图3 (A)及(B)为本发明的一具体实施例。
[0023] 图4为本发明的另一具体实施例。
[0024] 符号说明 10检字系统 101汉字数据库 102汉字过滤模块 103汉字显示模块 104部件数据库 105笔划数字数据库 106检字演算规则单元 20用户 1031输入方块 1032搜寻方块 30网页 1033部件 1034汉字。

【具体实施方式】
[0025] 为能详细了解本发明的技术特征及实用功效,并可依照说明书的内容,兹进一步 以如附图所示的较佳实施例,详细说明如后。
[0026] 实施例1 :本发明的检字系统。
[0027] 图1为本发明的检字系统的各组件及应用实例。
[0028] 本发明是一种利用输入汉字部件与笔划数字以快速获得汉字的检字系统10,其包 含一至少一汉字数据库101,其用以提供汉字;一汉字过滤模块102,其与该汉字数据库101 耦合,根据输入的一汉字部件及该扣除汉字部件的剩余笔划数字,透过该汉字过滤模块102 筛选出复数个候选汉字;一汉字显示模块103,其与该汉字过滤模块102耦合,用以显示欲 搜寻的汉字。
[0029] 在一实施例中,本发明中的汉字过滤模块102连结一部件数据库104、一笔划数字 数据库105及一检字演算规则单元106,其中该检字演算规则单元106包含一检字演算规则 法,将输入的汉字部件形码及数字码透过该检字演算规则法演算后,筛选出该复数个候选 汉字。
[0030] 实施例2 :本发明的检字演算规则法。
[0031] 本发明的检字演算规则单元106提供一递归拆分方法及/或一笔划库压缩方法, 该些方法已于本说明书的
【发明内容】
定义。本发明的检字演算规则进一步可分为三种演算方 法: 第一种:当用户于本发明检字系统10输入一个部件时,该检字演算规则单元106连结 至该部件拆分表,而该部件直接返回部件拆分表,并针对该部件列出所有含有该部件的汉 字。
[0032] 第二种:当用户于本发明检字系统10输入两个部件时,该检字演算规则单元106 连结至该部件拆分表,而该些部件于检字演算规则单元做"交集"的统计运算,并针对该些 部件列出所有含有该些部件的汉字。
[0033] 第三种:当用户于本发明检字系统10输入部件与笔划时,该检字演算规则单元 106先计算输入部件的总笔划数目,举例来说,用户输入"皮6",其总笔划数为11 ;接着,该 检字演算规则单元排除非11的总笔划数,并列出所有具有总笔划数11的汉字。
[0034] 实施例3 :本发明的检字系统的操作流程。
[0035] 举例来说,当用户20欲于汉字显示模块103显示"邵"字,用户可于汉字显示模块 103输入四种部件笔划态样: 第一种:将"邵"进行穷尽拆分,并于汉字显示模块103的输入方块1031输入部件"刀 口 第二种:将"邵"进行"部分部件"拆分,于汉字显示模的输入方块1031输入"刀口",同 时计算部件"的笔划数,并于汉字显示模块输入数字"3" ; 第三种:将"邵"进行部分部件拆分,于汉字显示模块的输入方块1031输入"刀卩",同 时计算部件" 口"的笔划数,并于汉字显示模块输入数字"3" ;或 第四种:将"邵"进行部分部件拆分,于汉字显示模块的输入方块1031输入" 口卩",同 时计算部件"刀"的笔划数,并于汉字显示模块输入"2"。
[0036] 实施例4 :本发明的检字系统呈现汉字的方式。
[0037] 在本实施例中,用户20可透过汉字显示模块103,如个人电脑、行动电话、个人数 字助理或手持式计算机,将"口卩2"部件笔划输入于汉字过滤模块102以搜寻所有部件笔 划的汉字。
[0038] 而图2显示当用户20于输入方块1031输入"口 P 2"部件笔划后,并点选搜寻方 块1032,即可于网页30上列出(搜寻出)包含"口"、叩"及"口P 2"的所有部件1033及所 有包含"口"、叩"及"口P 2"部件的汉字1034。
[0039] 本发明可根据使用者的程度,提供"多重角度"的不同检索方式。举例来说,如图 3 (A)所示,若使用者只懂" 口"、"人",可透过本案的检字系统输入" 口人",并从216个字中 挑出"劎"字(第7个);如果使用者程度较佳,如图3 (B)所示,懂得"刀",只要输入"人刀", 结果只有5笔,第3个即是。又如图4所示,更进阶的使用者输入"僉"部件,甚至可以检出 意义相似的字族,因为声符有分类(classification)意义分群的功能(孳乳),比方说"青" 的孳乳有"清""晴""睛""菁""精""倩""靖""锖"都有光泽、明亮、去除了杂质的意思, "莫"(日没入草中,暮本字),"幕" "慕" "墓" "漠" "寞",都有"消失"的意思) 为了突破传统仅用一个"形符"的检字方式,本发明可用一个以上的"形符"或"声符" 快速收敛出字形,举例来说,输入"木申"则可得到"神"及"榊"。其中,"申"为"声符",一 般而言,声符的收敛能力比形符好。
[0040] 另一方面,对于不识汉字的使用者(如西方人),查字典是目前对汉字教学的最大 瓶颈,一般教学上须先学会如何念汉字,才能用拼音查,但掌握基本汉字的发音,要花非常 多的时间。因此,本发明的另一功效在于让初学汉字者(只需花几个小时,掌握基本部件及 笔划计算规则),就可以搜寻出所有汉字,学习越多部件,则检索效率越高,本发明提供了一 个"有趣""平缓学习曲线"的方法,从学习汉字的第一天起,不识汉字的使用者就可以开始 查字典。
[0041] 在本发明中叙述的具体实施例是为了说明及描述本发明,并不代表这些具体实施 例就已详述或局限本发明于一定的形式或内容。从上述教导中可做出许多可能的修改及变 化。
[0042] 选择上述的事实与例子仅为了用于解释本发明的原理及其实际用途,俾使熟悉本 领域或专业的人士能够运用或实施本发明,甚至于修改而适用于其它各种状况。熟悉本领 域或专业的人士亦可因而启发出另外的应用,只要不悖离本发明的宗旨,均属于本发明的 内容。因此本发明的范围是定义于权利要求书中,而非这些叙述及范例中。
【权利要求】
1. 一种结合汉字部件与数字的检字方法,其包含以下步骤: (a) 输入一汉字的至少一部件于一汉字过滤模块; (b) 扣除该汉字的该至少一部件,并计算该扣除汉字部件后剩余笔划数; (c) 将该剩余笔划数输入于该汉字过滤模块,以筛选出至少一个或复数个候选汉字; 及 (d) 透过一汉字显示模块显示欲搜寻的汉字。
2. 如权利要求1所述的检字方法,其中该汉字过滤模块另包含: (i) 一部件数据库,其包括复数个汉字部件形代码; (?) 一笔划数字数据库,其包括复数个数字代码;及 (iii) 一检字演算规则单元,其连结该汉字及部件数据库及该笔划数字数据库,该检 字演算规则单元包含一检字演算规则法,将输入的汉字部件形码及数字码透过该检字演算 规则法演算后,筛选出该复数个候选汉字。
3. 如权利要求1所述的检字方法,其中该至少一部件包含基本字码或汉字的一部分部 件。
4. 如权利要求2所述的检字方法,其中该汉字显示模块包含个人电脑、行动电话、个人 数字助理或手持式计算机。
5. 如权利要求2所述的检字方法,其中该检字演算规则法包含一递归拆分方法及一笔 划库压缩方法。
6. 如权利要求5所述的检字方法,其中该笔划库压缩方法是以至少一万国码按该汉字 部件及笔划进行排序,并使用变动长度编码压缩的压缩方法。
7. -种根据汉字部件与笔划数字产生汉字的检字系统,其包含: (a) -至少一汉字数据库,其用以提供汉字; (b) -汉字过滤模块,其与该汉字数据库耦合,根据输入的一汉字部件及该扣除汉字 部件的剩余笔划数字,透过该汉字过滤模块筛选出复数个候选汉字;及 (c) 一汉字显示模块,其与该汉字过滤模块耦合,用以显示欲搜寻的汉字。
8. 如权利要求7所述的检字系统,其中该汉字过滤模块进一步包含: (i) 一部件数据库,其包括复数个汉字部件形代码; (i) 一笔划数字数据库,其包括复数个数字代码;及 (?) 一检字演算规则单元,其连结该汉字及部件数据库及该笔划数字数据库,该检 字演算规则单元包含一检字演算规则法,将输入的汉字部件形码及数字码透过该检字演算 规则法演算后,筛选出该复数个候选汉字。
9. 如权利要求7所述的检字系统,其中该汉字部件包含基本字码或汉字的一部分部 件。
10. 如权利要求8所述的检字系统,其中该检字演算规则法为一递归拆分方法及一笔 划库压缩方法。
11. 如权利要求10所述的检字系统,其中该笔划库压缩方法以至少一万国码按该汉字 部件及笔划进行排序,并使用变动长度编码压缩的压缩方法。
12. 如权利要求7所述的检字系统,其中该汉字显示模块包含个人电脑、行动电话、个 人数字助理或手持式计算机。
13. 如权利要求7所述的检字系统,其中该汉字显示模块进一步可与一操作系统耦合。
14. 如权利要求13所述的检字系统,其中该操作系统系Windows、Mac、Linux、BSD、iOS 或Android操作系统。
【文档编号】G06F17/30GK104102641SQ201310114802
【公开日】2014年10月15日 申请日期:2013年4月3日 优先权日:2013年4月3日
【发明者】叶健欣 申请人:叶健欣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1