字符信息的计算机处理方法和系统的制作方法

文档序号:6501844阅读:251来源:国知局
字符信息的计算机处理方法和系统的制作方法
【专利摘要】一种字符信息的计算机处理方法或系统,其特征为:任一汉字的笔画只有“横、竖、撇、捺、折”五种,可分别对应于同一“米”中相应角度方向的线段,可对不同的笔画分别统一的、精确的进行“有理”即有规律的赋值、编码、转换、量化运算。
【专利说明】字符信息的计算机处理方法和系统
[0001] 本发明对本人2012年4月16日提出的申请号为201210121474. 2的名为"字符的 编码处理和输入输出方法"的中国发明专利申请要求优先权。

【技术领域】:
[0002] 本发明涉及字符信息的计算机处理领域,特别是计算机的输入、运算、存储、传输、 输出、显示等硬件系统中,字符信息均可结合、采用统一的"多米码"及"多米网"数学模型;

【背景技术】:
[0003]目前西方人发明的的计算机软硬件系统对字符的存储、显示、运算处理,一般有点 阵、矢量的方式,但是在2进制机器码与最终显示的自然字形之间的转换环节繁琐,浪费了 大量硬件资源和运算能力,尤其在移动设备如智能手机、嵌入式或简单电子设备上体现的 更明显。


【发明内容】

[0004] 发明目的:为克服【背景技术】的不足,本发明目的在于提供一种"统一采用'多米网' 状结构数学模型的矢量字符'多米码'编码方法和系统";多米码是最彻底的有理码,高度统 一的遵循字符原有的客观"多米"结构之"理"(规律);一本发明提供实现中文电脑、无 字库、多国统一操作系统等必须的基础技术。
[0005] 技术方案:
[0006] { 一 }总述:
[0007] [1]任一汉字的笔画只有"横、坚、撇、捺、折"五种,可分别对应于同一"米"中相应 角度方向的线段
[0008] --其中"折"可视为单笔相交连、组合于拐点;
[0009] -同理,其中可选增设其他角度的斜线,尤其如取整后的15°、30°、45°……; [0010] --多米网结构可类似数学上"分形(或全息)"结构,指宏观整体与微观局部笔 画结构类似,则如"?"内含的4个小正方形也可分别再细分成更小的" ? "结构,不含斜线 的"田"内部同理;
[0011] --多米网可容纳任意形状结构的新造汉字,同理可组成任意结构的不同字符、 图形,并进行"有理(有规律)"的分别赋值、编码或映射。
[0012] 同理,一个汉字中可含有多个交点,每个交点可能只有"米"中的部分笔划,若按标 准的完整情况,多个交点"米"或" "、或" 口"或"田"纵横依次排列,可组成"多米网"状结 构的数学模型"『如图33?35』,则反之任一笔画或部件都可映射或嵌入到模型中相应结 构、方位的线段上,所以还可对不同的笔画分别统一的、精确的进行赋值、编码、转换、量化 运算;
[0013] 不少外文语种、字母文字含有带弧度的曲线笔画,可将拐弯处的"圆角"转换为"尖 角"(称"尖角化")即可同理纳入数学模型,如^ 一门、」一」、L,或反之同理(称 "圆角化");或可用不同的线段夹角对应相应度数的弧线如『图50』、不同线段对应相应方 位及长度的弧线如『图51』;则多米网结构可扩展为含有相应曲线的模型,即图50、51重叠; 又如两条直角边夹着圆心角为90°的弧线,多拐、混拐同理;再如围笔可画圈输入,比逐笔 书写其各边更快;
[0014] 世界各国文字无非只有直线式、曲线式、混合式三种,因其所有笔段、所有结构的 线段组都能纳入多米网中相应的方位,从而得到赋值、转换为内码等,故本发明能统一处理 世界各国字符,如操作系统、网页的语言内码、字符集、字体字库,减少语种转换环节,具有 革命性技术意义;
[0015] [2]采用多米网结构的"多米码"矢量字符编码体系,对字符的"机器码一内码一 外码(输入码)一字符集一字库"常规流程,可以一致"有理"化编码处理、还可合并部分转 换环节,原理及典型例如:
[0016] (1)由"有理多米机器码"转换成"有理多米内码"
[0017] 每个"米"按其内部各线段上是/否映射有笔画,可用二进制1或0代表,同理,多 个"米"按各自在二维"多米网"平面中的行列位置赋予相应的不同数值做为机器码;
[0018] 可转换成或赋予八进制、十六进制等数值做为其内码:多米内码兼具交换码、区位 码的功能,只是"区、位"改为按字形特征取码和编排,可对单字按所含各"米"的数量、方位 结构、内部须笔数量等特征,分别采用不同的规则/方式/格式、赋予不同的编码/数值,使 得原来的加法式列举变为乘法式压缩,赋值方式不可能一一全部列举,但万变不离上述原 理。典型例如下:
[0019] ①逐点赋值:对每个"米"内部依次按其各个方向上是否有分支线段来赋值,可按 顺时针从0°线段开始,如该线段上映射有笔划则赋值"1"、然后45°线段上映射有笔划 则赋值"1"、……最后315°线段上映射有笔划则赋值"1",无笔画则赋值为0,如"才"= 10101011 ;同理,多米网中则从左到右、从上到下依次以类似逐行扫描的方式对各"米"重 复上述步骤;
[0020] ②跳跃赋值:循环的跳过或间隔一定的方位来赋值,如中两个交点间的线段, 逐点赋值时可能被重复赋值,可采用"直向跳跃赋值(或特殊规定重复赋值仍取最大值1), 将两个交点分别映射在两个相邻的困中心(其中第二个交点跳过了" _ "两个中心之间还 有一个交点,使得两个交点间的线段被切断、分开赋值),可赋值为10101010. 10101010 ;同 理,两个斜向紧邻的交点间的线段可能交叉,则可"斜向跳跃赋值"(或特殊规定自动忽略对 产生交叉的斜笔赋值、或允许交叉并按上文"多米网分形结构"算法进行赋值计算);
[0021] 跳跃赋值压缩了编码、比逐点赋值计算量小,但可能会出现字体映射受限、字体变 形的情况;
[0022] ③分类赋值:指按类别依次对不同特征的局部的线段组(可体现为多种形状结 构、不可能一一列举)赋值,这些线段组的形状可以循环,如,先对直向笔段赋值、再在对斜 向笔段赋值;又如,『图31』可分为9大块,其中每大块内部都可分为『图30』所示9小块代 表的"键位",单击每键代表相应方位的连线、复击代表相应方位的边线、3击同理......(按 『图32』所述的击键可代表『图31』相应大块中的黑粗线,如"击6"可代表右下角的大块区 域的第3、6、9块"像素"或矢量线段)--这说明击键输入时的键名序列,可等效转换为外 码并进行赋值编码处理;
[0023] (2)多米形码输入法的输入码一可以转换、扩充为"多米字形外码"
[0024] 例如:多米形码键盘输入法映射的不同键位名所组成的序列即"输入码"可做为 "简缩型人性化的外码"--而外码也可以不是使用4位26个英文字母,而是更少、或更多 种,以承载更多、准确的便于计算机处理的字符信息,故可以补充方位编码,且也代表该字 的偏移地址,甚至字体、字型及打印、网络传输格式信息,则将逐点描述的字形码变成了更 压缩的的矢量结构特征描述;
[0025] 所以多米外码一与多米内码又有对应关系,
[0026] -如Unicode字符集是一种"无理码",其为几十万字符编排、布局的字符地址 (编码)是随机的、无理的,而且"机器码一内码一外码(输入码)一字符集一字库"之间需 要层层转换、各国字符集间也需转换,带来巨大不便、硬件成本和资源浪费(如存储、运算、 硬件间或网络传输环节);如能遵循每个字符内部结构成分的规律,并且减少转换环节,将 能大大提_效率:
[0027] [3]所以,有理的各种形式的"多米码"与各种相应的硬件设备结合运行,具有"催 化剂"的技术效果,
[0028] (1)而且可以形成一套新格式、统一原理的计算机系统或各种数码电子设备,可以 是独立的、封闭的,正如它在常规计算机系统下的跨语种通用平台特性,多米码自身也可形 成不借助任何外来程序的中文式世界字符电脑系统和平台;
[0029] (2)其中各部分环节也可独立使用,形成独立的软、硬件系统设备:
[0030] ①"多米码"内码集合本身就承载了字库的全部信息、不需要到外部软或硬字库中 去调用,就可直接连接到显示系统进行显示;
[0031]使用多米码矢量图符显示模块以"多米网结构的矢量形式"来显示汉字和图形 (这样显示的汉字美观大方、没有点阵式显示的锯齿现象),其基本的"段式显示单元"可以 是"十"或"米"或" ? "中的部分线段(如"8"形布置的7段可改为".,形16段,如再增加 细均分角度的4条即8段斜线,则为24段),可多个聞相邻、在2维平面上展开;
[0032] -所述"段式显示单元"可以指普通(如液晶、等离子体、发光二极管)屏幕上 的单位区域,也可同理指物理硬件,如液晶显示板、发光管、灯管灯泡等;
[0033]每8个段组成1个字节,每个段用一个2进制位表示,存1的点显示时在屏上显示 1个亮点;存〇的点则在屏上不显示,则一个汉字一般用6行X6列共有36个"米(即閑)" =32个字节即可;通过字模提取软件按照先左后右,先上后下的方式对字符号进行字模提 取,则可获得字模对应的32个字节值,将这些字节按一定顺序写入(如液晶)控制器的显 示缓冲区,就可在(如液晶)屏上显示相应字符;
[0034] 程序通过多米内码计算出多米外码即可得出任一字的字模;同理从另一个方向来 说,用输入法输入编码也可以直接得出字模;字模用字符的各位信息来记载英文或汉字的 形状,而省去了字库的设置;
[0035] 在数字电路中,所有的数据都是以0和1保存的,对显示器控制器进行不同的数据 操作,可以得到不同的结果;段驱动器与采用"段式显示单元"的"多米网全矢量段式结构" 的显示装置(简称多米段式显示装置),可用来显示任意字符和矢量图形;
[0036] 采用该结构界面的硬件主要可用于简单电子设备如pos机、税控机、单片机、计算 器、学习机电子词典、翻译机,手持设备如遥控器、理货机、对讲机,嵌入式设备如地铁、商 店、电话亭的小型信息查询机,终端设备如物联网、仪器仪表上;
[0037] --输出、打印、传真、数据库等一切可能的设备和场合,可同理转化、使用多米码 格式的数据;
[0038] ②同理,在硬件、芯片、设备中存储、寄存、传输、运算运行,何种芯片集成、硬件组 合方式均需结合多米码技术核心,均属保护范围之列;
[0039] ③结合手写、键盘输入设备的运用,放在下面两大部分详述。
[0040] {二}手写输入法:
[0041] 多米码结合手写输入设备的实施例:多米码手写输入法,可做为一种独立使用的 输入法;
[0042] [1]手写输入系统可包括:
[0043] (1)获取装置:获取笔画信息的装置,如输入设备"手指、鼠标、手写笔"、感应接收 设备"触摸屏、手写板、白板"、甚至能主动获取手写、非写的笔画信息的"拍照镜头、扫描、读 卡设备"等工具;
[0044] (2)界面模块:在显示装置上呈现"多米网"结构;其中:标准的"多米网"结构图 形显示在屏幕上也可作为"软界面",可用鼠标移动并点击不同笔段、键盘不同键位映射不 同笔段等对其进行间接的操作;同理可显示在兼具有相应结构的感知器件或电路的显示设 备(如触摸屏)上用手指、手写笔等直接操作,则在多米网各位置的线段的"显示"和"输 入"可以同步、同位置进行;
[0045] (3)多米网数据库:用于储存每个字符所含各部件、笔画在多米网中的方位、种 类、结构关系信息;
[0046] --此时可记录字中的各笔划的"绝对的、标准的"结构、位置,如基本接近印刷宋 体;
[0047] --词甚至句数据库同理,可储存多字的相应信息;
[0048] (4)预处理模块:将获取的各手写笔画进行标准化处理:"吸附"、"取直"、及可选 的"正角" "对位":
[0049] 指人书写的笔画的曲直、方位、角度和结构不可能完全吻合标准的、唯一的多米网 格线中的字体原型,
[0050] 所述"取直"指单直笔手写时的小的起伏波动被忽略、处理为直线;可由程序主动 的在书写同时进行限位(如只获取和计算起点到终点的直连线,类似windows画图程序中 的"直线"工具)或书写后处理;
[0051] 所述"吸附"即将笔画移动至与"位置、角度最临近的网格线"重合的位置;
[0052] 所述"对位"指将各部件、笔画组即时移至与模版相同、最标准的统一位置;
[0053] 所述"正角"指拐笔、交笔的内部夹角度数、外部旋转朝向都取最接近的整数角 度;
[0054] --单字中不同位置的孤立笔画、交连笔画组或自然离散的部件,都可逐笔或逐 部件即时校正、并于同步屏幕显示,也可后台进行、跳过过程只显示结果;
[0055] --各国外文字符同理,标准化处理也可同理用于各国字符进行编码前的处理, 尤其如韩语字符,其中除了 "〇"大部分与相应汉字部件相同;
[0056] (5)处理模块:输入设备通过界面模块与处理模块连接,处理模块只需将已输入 的标准化处理后的"部分笔画的结构、方位"与多米网数据库中的相应完整信息进行比对或 识别;
[0057] 所述方位包括"绝对方位"、"相对方位",当书写者把汉字中几个部件都写在输入 装置(如触摸屏)的感知识别区域的一部分区域时,如把"背"的"北、月"都写在上半部,可 根据部件间隔或笔画组结构(尤其是部件间没有完全断开时)来判断方位信息,如标准的 "练"『图38』绞丝旁连拐在左上方、右上部有"十"形相交笔划、"小"在它们的右下方……;
[0058] 因为输入到多米网界面中的具体方位也直接与同样结构的多米网数据库比对,而 且细节结构比连笔精确,所以即使输入笔划不完整,仍可快速准确的得出完整的结果,而且 具体选用哪部分部件、哪几笔,有很大的选择自由度,相当于每个字都有多种"容错码";
[0059] --还可根据形码键盘输入方案、规则同理手写其码元,如各种码元可优选输入 骨架笔画而非须笔…都减少输入笔画数量、且提高识别准确率。
[0060]-单字宜跨不同部件输入部分笔画、可以离散编码,一般1?4笔即可得出结 果、不需输完;词的输入与字同理,可以词甚至句为单位输入,其中每字均可笔画不全,则处 理模块在相应的词句数据库中检索,如,图39、40的写法均可得出"练"字;图41?43输入 "预、付、款"3个字最少只需3笔;
[0061] [2]手写输入法与键盘输入法同理也可分取码、映射、输入步骤,只是体现方式有 所不同,其特征是:
[0062] 取码:选取字符中任意的部分笔画;
[0063]映射:将选取的部分笔画(相当于码元)按多米网界面的结构分别映射在各相应 不同位置(在屏幕上、相当于方位式键盘);
[0064] 输入:并且使用输入设备输入它们;
[0065] [3]可选的辅助方法有:
[0066] (1)连笔/非连笔兼容模式:由于本手写输入法要求书写者尽量书写规整笔画,对 全非连笔、全连笔、二者兼有的输入,如侦测到本识别模块无法识别的复杂手写连笔结构部 件,如超过2或3笔相连,可对接到类似普通手写输入法的"连笔识别模块"进行协同识别、 分别处理,或拒绝识别并提示报警;--益处是,在输入文字的部分时可随时提供反馈,校 正用户的输入、减少误输误识率、减少输入笔画数;
[0067] --同理对于只连笔书写单字中部分部件或笔画组,并采用"连笔识别模块"识别 时,也可结合其所在绝对或相对方位信息,也能提高识别准确率,又同理单字中连笔、非连 笔部件混合兼有的,则各自对接相应的识别模块和模型、并都可结合方位信息进行比对识 别;
[0068] (2)多余的牵连笔、"逆势"笔画尤其指向左或向左上运笔的线段可自动忽略或切 断;
[0069] (3) "去勾"主要指在书写者书写时每次抬起笔尖时、笔画末端带出的多余的弯钩, 可规定一定的长度和方向(如逆势的)、或弯曲度、弯曲形状的的尾勾自动忽略;
[0070] (4)可规定输入下一单字则前字上屏,还可设置分词键、选择键或分别确认键, 如输入一个词中每字的部分可分别设置确认键或由符合语句处理模块根据语料库智能判 断;
[0071] (5) "最符合的结果"可能不止一个,但重码一般是多米形码的形似、同族字,可在 其中进行选择;可据已识别单字在词库中检索以该单字开始的词语、甚至据已识别单词检 索联想词;;
[0072] (6)手写输入可与语音输入、拼音输入、键盘输入配合,尤其触摸屏上其界面可重 叠或互补;不会读的字、不会拆的字、只记得字中的一部分,可用手写输入,还可显示该字的 拆分取码示意图帮助学习;
[0073] (7)触摸屏可选用双指并拢擦除已输入的部分错误笔画,或规定另设键位来实 现;
[0074] [5]实例;
[0075] {三}多米码结合键盘的实施例:多米形码键盘输入法,可做为一种独立使用的形 码键盘输入法;
[0076]用到的术语有:
[0077] -基元:构字"基本码元"为"交",(与"多米网"的"米"近义);
[0078] -基组:多个基元"交"的组合为"交组",含"交"种类、数量较少的称"简单交组", 如基元相连成"枝"、围组成"块",含"交"种类、数量较多的称"复杂交组",如多个块、块与 交组合成"鱼";
[0079] -部件:指汉字中的自然形状/界限的具体笔画组,基本以国家标准汉字部件规 范为准;
[0080] -码元:指被纳入编码方案的某类部件,可用各种"母字"代表;每类码元中可能 包括主要特征抽象相同、次要特征具体不同的多个部件,称"同族字根";
[0081] [1]【背景技术】:以五笔字型为代表的多种形码输入法,均以笔画为基元、基元过小 使得取码覆盖面过小,进而导致取码并不整体象形和一致:
[0082] (1)近60%字根是根据前2笔映射其键位,未顾及后面的笔画,甚至有的字根连前 2笔的规律也没有遵循、生硬映射键位,如"木、西、耳"等多处,证明其"人为"多于"客观规 律";
[0083]具有统一基元基组特征的码元却按前2笔映射于不同键位、如"文又夂夂", "v八"、"厂厂"、"〈〈〈"等…有30处之多,这样徒增记忆负担、事倍功半;
[0084] (2)需拆交连:完整部件被拆散割裂,不少交连、交点、块也需拆分,如"上下猫存 不、平央、亚、丑甘、韦车五年民、追段、州、舞面两、片斤产、六火、乍奉"等大量难拆字;
[0085] (3)处理大字库大量需要识别码、处理大词库则重码率高;不能直接输入繁体中 文;
[0086] (4)无法在小键盘上高效输入,五笔数码输入法首部余部取码同样割裂思维、细碎 难用、技术指标落后;
[0087] [2]核心方法原理
[0088] 以"交"为构字"基本码元",相应多个"交"按不同的"数量/完整度、成分/种类, 结构/形状、方位/角度、范围/界限"特征尤其是部分特征,组合成各种类别、级次的"交 组"为构字"组合码元",将字符按拆取规则分解出的各部件分归特征相符的码元类别,再按 类别映射于相应不同键位、并按输入规则输入,即可组成想要的字符;
[0089]从多米网计算机处理方法角度来描述:汉字部件可能是由一个或多个"米"组成 的笔画组,又称"子网",即多米网模型的一部分,将汉字部件按各自内部所含"米"的结构、 方位精确分类,所选取出的各类码元如果分别映射于键盘上不同键位,并按书写顺序依次 击打一个字中不同码元各自映射的键位,可得到需要的文字一即成为键盘形码编码输入 法;
[0090] -所述"交"指"多直笔"相交一点,"多直笔"可也含微弧度笔、带微勾直笔在内; "交"点伸出一或多根发散的直笔称"须",交的"完整度"指所含须的数量多少、可细分不同 类别;
[0091] (1)核心方法所述"尤其是部分特征"指各种特征中可选按部分特征为主、而其他 特征为次甚至忽略:
[0092] ①"类别式"取码及相应映射、输入方案:主要按"类别、结构、成分、完整度"特征 为主,将多个"交"组成不同类别,而各交间的"相互方位"特征被视为次要并适当忽略(如 『附图2』中大量同类不同向的母字被合并,又如横向的"枝、鱼"较少、离散编码效果差,故 不必分设其键位),简称"类别式";
[0093] ②"方位式"取码及相应映射、输入方案:--但因为有些码元按方位特征离散编 码也有一定效果(如『附图2』中各码元),故与上段相反将码元按方位特征为主、类别特征 为次分类取码、映射也是可行方案;
[0094] "方位式/类别式"取码的比例可以调整(见实施例),且因基元组合的统一性而 具有灵活、代偿性;
[0095] a.码元的"方位"包括方向/朝向、位置、角度:
[0096]-"方向/朝向"指码元的特定部分或整体结构的指向,如拐角与其开口、鱼头与 鱼尾相反;
[0097] 一 "位置"指码元间的相对位置或码元在字符中的位置,如近闭码元"n"在"成" 的左下角(同理,印地语等外文字符中更有多个不同方位的闭码元需要分设相应的类键); [0098] 一 "角度"主要指码元所含笔画间的"夹角角度";
[0099] 外文同理,在同一数学模型中,"3"由2个左开口半圆上下连成、相当于圆角化后 的"彐",而"S"同理由右、左开口的2个半圆上下连成;
[0100]b.可按下述具有一定离散编码效果的方位特征对码元分类、并分不同键位映射:

【权利要求】
1. 一种字符信息的计算机处理方法或系统,其特征为:任一汉字的笔画只有"横、坚、 撇、捺、折"五种,可分别对应于同一"米"中相应角度方向的线段,可对不同的笔画分别统一 的、精确的进行"有理"即有规律的赋值、编码、转换、量化运算; -其中"折"可视为单笔相交连、组合于拐点; -同理,其中可选增设其他角度的斜线,尤其如取整后的15°、30°、45°……; --带弧度的曲线笔画,可将拐弯处的"圆角"转换为"尖角"纳入数学模型,反之同理; 或可用不同的线段夹角对应相应度数的弧线、不同线段对应相应方位及长度的弧线,则多 米网结构可扩展为含有相应曲线的模型。
2. 根据权利要求1所述的方法,其特征是,所述"有理"指采用多米网结构的"多米码" 矢量字符编码体系,对字符的"机器码一内码一外码(输入码)一字符集一字库"常规流程, 可以一致"有理"化编码处理、还可合并部分转换环节,原理及典型例如: (1) 由"有理多米机器码"转换成"有理多米内码" 每个"米"按其内部各线段上是/否映射有笔画,可用二进制1或〇代表,同理,多个 "米"按各自在二维"多米网"平面中的行列位置赋予相应的不同数值做为机器码; 可转换成或赋予八进制、十六进制等数值做为其内码:多米内码兼具交换码、区位码的 功能,只是"区、位"改为按字形特征取码和编排,可对单字按所含各"米"的数量、方位结 构、内部须笔数量等特征,分别采用不同的规则/方式/格式、赋予不同的编码/数值,使得 原来的加法式列举变为乘法式压缩;赋值方式不可能一一全部列举,但万变不离上述原理; 典型例如下: ① 逐点赋值:对每个"米"内部依次按其各个方向上是否有分支线段来赋值,可按顺时 针从0°线段开始,如该线段上映射有笔划则赋值"1"、然后45°线段上映射有笔划则赋值 "1"、……最后315°线段上映射有笔划则赋值"1",无笔画则赋值为0,如"才"=10101011 ; 同理,多米网中则从左到右、从上到下依次以类似逐行扫描的方式对各"米"重复上述步 骤; ② 跳跃赋值:循环的跳过或间隔一定的方位来赋值,如中两个交点间的线段,逐点 赋值时可能被重复赋值,可采用"直向跳跃赋值或特殊规定重复赋值仍取最大值1,将两个 交点分别映射在两个相邻的國中心,可赋值为10101010. 10101010 ;同理,两个斜向紧邻的 交点间的线段可能交叉,则可"斜向跳跃赋值"、或特殊规定自动忽略对产生交叉的斜笔赋 值、或允许交叉并按上文"多米网分形结构"算法进行赋值计算); ③ 分类赋值:指按类别依次对不同特征的局部的线段组赋值,这些线段组的形状可以 循环,如,先对直向笔段赋值、再在对斜向笔段赋值; (2) 多米形码输入法的输入码一可以转换、扩充为"多米字形外码" 例如:多米形码键盘输入法映射的不同键位名所组成的序列即"输入码"可做为"简缩 型人性化的外码"--而外码也可以不是使用4位26个英文字母,而是更少、或更多种,以 承载更多、准确的便于计算机处理的字符信息,故可以补充方位编码,且也代表该字的偏移 地址,甚至字体、字型及打印、网络传输格式信息,则将逐点描述的字形码变成了更压缩的 的矢量结构特征描述; 所以多米外码一与多米内码又有对应关系。
3. -种字符信息的计算机处理方法或系统,其特征为:有理的各种形式的"多米码"与 各种相应的硬件设备结合运行 (1) 可以形成一套新格式、统一原理的计算机系统或各种数码电子设备,可以是独立 的、封闭的,正如它在常规计算机系统下的跨语种通用平台特性,多米码自身也可形成不借 助任何外来程序的中文式世界字符电脑系统和平台; (2) 其中各部分环节也可独立使用,形成独立的软、硬件系统设备: ① "多米码"内码集合本身就承载了字库的全部信息,可直接连接到显示系统进行显 示; 使用多米码矢量图符显示模块以"多米网结构的矢量形式"来显示汉字和图形,其基本 的"段式显示单元"可以是"十"或"米"或"函"中的部分线段,可多个困相邻、在2维平面 上展开; --所述"段式显示单元"可以指普通(如液晶、等离子体、发光二极管)屏幕上的单 位区域,也可同理指物理硬件,如液晶显示板、发光管、灯管灯泡等; 每8个段组成1个字节,每个段用一个2进制位表示,存1的点显示时在屏上显示1 个亮点;存〇的点则在屏上不显示,则一个汉字一般用6行X6列共有36个"米(即困)" =32个字节即可;通过字模提取软件按照先左后右,先上后下的方式对字符号进行字模提 取,则可获得字模对应的32个字节值,将这些字节按一定顺序写入控制器的显示缓冲区, 就可在屏上显示相应字符; 程序通过多米内码计算出多米外码即可得出任一字的字模;同理从另一个方向来说, 用输入法输入编码也可以直接得出字模;字模用字符的各位信息来记载英文或汉字的形 状,而省去了字库的设置; 在数字电路中,所有的数据都是以〇和1保存的,对显示器控制器进行不同的数据操 作,可以得到不同的结果;段驱动器与采用"段式显示单元"的"多米网全矢量段式结构"的 显示装置(简称多米段式显示装置),可用来显示任意字符和矢量图形; 采用该结构界面的硬件主要可用于简单电子设备如pos机、税控机、单片机、计算器、 学习机电子词典、翻译机,手持设备如遥控器、理货机、对讲机,嵌入式设备如地铁、商店、电 话亭的小型信息查询机,终端设备如物联网、仪器仪表上; --输出、打印、传真、数据库等一切可能的设备和场合,可同理转化、使用多米码格式 的数据; ② 同理,在硬件、芯片、设备中存储、寄存、传输、运算运行,何种芯片集成、硬件组合方 式均需结合多米码技术核心,均属保护范围之列; ③ 结合手写、键盘输入设备的运用,放在下面两大部分详述。
4. 一种手写输入系统,其特征是:可包括: (1) 获取装置:获取笔画信息的装置; (2) 界面模块:在显示装置上呈现"多米网"结构;其中:标准的"多米网"结构图形显 示在屏幕上也可作为"软界面",可用鼠标移动并点击不同笔段、键盘不同键位映射不同笔 段等对其进行间接的操作;同理可显示在兼具有相应结构的感知器件或电路的显示设备上 用手指、手写笔等直接操作,则在多米网各位置的线段的"显示"和"输入"可以同步、同位 置进行; (3) 多米网数据库:用于储存每个字符所含各部件、笔画在多米网中的方位、种类、结 构关系信息; -此时可记录字中的各笔划的"绝对的、标准的"结构、位置,如基本接近印刷宋体; -词甚至句数据库同理,可储存多字的相应信息; (4) 预处理模块:将获取的各手写笔画进行标准化处理:"吸附"、"取直"、及可选的"正 角" "对位": 指人书写的笔画的曲直、方位、角度和结构不可能完全吻合标准的、唯一的多米网格线 中的字体原型, 所述"取直"指单直笔手写时的小的起伏波动被忽略、处理为直线;可由程序主动的在 书写同时进行限位或书写后处理; 所述"吸附"即将笔画移动至与"位置、角度最临近的网格线"重合的位置; 所述"对位"指将各部件、笔画组即时移至与模版相同、最标准的统一位置; 所述"正角"指拐笔、交笔的内部夹角度数、外部旋转朝向都取最接近的整数角度; --单字中不同位置的孤立笔画、交连笔画组或自然离散的部件,都可逐笔或逐部件 即时校正、并于同步屏幕显示,也可后台进行、跳过过程只显示结果; --各国外文字符同理,标准化处理也可同理用于各国字符进行编码前的处理; (5) 处理模块:输入设备通过界面模块与处理模块连接,处理模块只需将已输入的标 准化处理后的"部分笔画的结构、方位"与多米网数据库中的相应完整信息进行比对或识 别; 所述方位包括"绝对方位"、"相对方位",当书写者把汉字中几个部件都写在输入装置 的感知识别区域的一部分区域时,可根据部件间隔或笔画组结构来判断方位信息; --还可根据形码键盘输入方案、规则同理手写其码元,如各种码元可优选输入骨架 笔画而非须笔…都减少输入笔画数量、且提高识别准确率; --词的输入与字同理,可以词甚至句为单位输入,其中每字均可笔画不全,则处理模 块在相应的词句数据库中检索。
5. -种手写输入方法,其特征是:手写输入法与键盘输入法同理也可分取码、映射、输 入步骤,只是体现方式有所不同,其特征是: 取码:选取字符中任意的部分笔画; 映射:将选取的部分笔画按多米网界面的结构分别映射在各相应不同位置; 输入:并且使用输入设备输入它们。
6. 根据权利要求所述的一种手写输入方法,其特征是:可选的辅助方法有: (1) 连笔/非连笔兼容模式:由于本手写输入法要求书写者尽量书写规整笔画,对全非 连笔、全连笔、二者兼有的输入,如侦测到本识别模块无法识别的复杂手写连笔结构部件, 如超过2或3笔相连,可对接到类似普通手写输入法的"连笔识别模块"进行协同识别、分 别处理,或拒绝识别并提示报警; --同理对于只连笔书写单字中部分部件或笔画组,并采用"连笔识别模块"识别时, 也可结合其所在绝对或相对方位信息,也能提高识别准确率,又同理单字中连笔、非连笔部 件混合兼有的,则各自对接相应的识别模块和模型、并都可结合方位信息进行比对识别; (2) 多余的牵连笔、"逆势"笔画尤其指向左或向左上运笔的线段可自动忽略或切断; (3) "去勾"主要指在书写者书写时每次抬起笔尖时、笔画末端带出的多余的弯钩,可规 定一定的长度和方向、或弯曲度、弯曲形状的尾勾自动忽略; (4) 可规定输入下一单字则前字上屏,还可设置分词键、选择键或分别确认键,如输入 一个词中每字的部分可分别设置确认键或由符合语句处理模块根据语料库智能判断; (5) "最符合的结果"可能不止一个,但重码一般是多米形码的形似、同族字,可在其中 进行选择;可据已识别单字在词库中检索以该单字开始的词语、甚至据已识别单词检索联 想词;; (6) 手写输入可与语音输入、拼音输入、键盘输入配合,尤其触摸屏上其界面可重叠或 互补;不会读的字、不会拆的字、只记得字中的一部分,可用手写输入,还可显示该字的拆分 取码示意图帮助学习; (7) 触摸屏可选用双指并拢擦除已输入的部分错误笔画,或规定另设键位来实现。
7. -种形码键盘输入法,其特征是:核心方法是,以"交"为构字基本码元,和/或相应 多个"交"按不同的"数量/完整度、成分/种类,结构/形状、方位/角度、范围/界限"特 征尤其是部分特征,组合成各种类、级次的"交组"为构字组合码元,将字符按拆取规则分解 出的各种具体部件分归特征相符的码元类别,再映射于相应不同键位、并按输入规则输入, 即可组成想要的字符; --所述"交"包括"点"和从点伸出一或多根发散的直笔-称"须";所述交的"完整 度"指从"交点"发散伸出直笔"须"数量的多少;所述"直笔"可也含微弧度笔、带微勾直笔 在内; {1}运用核心方法可产生多种分类取码及相应的映射输入方案--宗码根据取码界限 及规则进行相应拆分、根据取码类别来映射相应键位、击相应键输入,则同理各级各类码元 类别的合并、分发、移动,或多个小码元组成大码元,则其映射的键位也可相应进行合并、分 设、移动或增减 [1] 其中按类别特征为主、适当忽略方位特征来分类取码形成的"类别式基本9键方 案"简称"基本方案"的各类码元及其与各键位的映射关系表为: W/1单笔键"一":丨,一y ; E/2交侧键"丁八":丄T卜人入"尸,仆,、,八人7 R/3交键"十木":十乂少弋 S/4三围键"n力":U",々]n,刀匕; D/5围笔键"口田":口日目,田毋; F/6块键"兀,,:I S d本丑=丑进 X/7枝键"丰上":丰中才册卅*,否飞戈,罜王工,主土手千,戶尹,上; C/8拐键"":厂L,v厶,,勹々!_广; V/9连拐键"乙了":i %乙,乡幺; --注:各码元映射表中,字母后为键名特征、引号中为"代表母字"、冒号后为该类具 体字根; [2] "类别式"映射表中部分被合并的不同方位的码元类别,或可按方位分不同键位映 射,见权项3 ; {2}对欲输入或处理的字符的基本拆分规则:散缝连交,拆分界限,大整近类,拆取优 先; -指拆分时"能散不缝、能缝不连、能连不交","取大优先、取整优先、近类优先";其 中所述"缝"指部件之间不仅分开书写、属不同小类甚至近类、且有小的缝隙;其余与公知五 笔字型同理; {3}选择相应键位进行输入:小键盘单字全码长为6、大键盘为4,取码可依次取码、或 取前n末一; --上述核心方法和基本小键盘方案,可进行推导或调整,形成多种衍生方案。
8. 根据权利要求5所述的一种形码键盘输入法,其特征是: {1}多个"交"组合、再组合成为"交组",则它们呈"分形"关系;交组中所含各"交"可 能完整或不完整,则各种交组同理也可能完整或不完整;交组的宏观基本种类主要有: --所述"分形"指宏观整体枝干与微观局部笔画结构类似、网状数学模型统一的直接 包含其中的各种"交、交组"码元,则它们呈数学上"分形"的形式,可体现为"交点分须"、"笔 /交分形",组合后同理"笔/枝分形"、"笔/拐/块分形",再组合也同理,如"鱼头的各边" 或"尾"亦由多个枝或笔组成,故也可同理细分"多须、少须"的情况;其中"笔枝分形"指"笔 或多笔"作为"无须"的枝干,上面加须,则成为相应类的"枝或多枝",反之同理; 平面上多个交之间按照交点的二维方位结构的排列组合,即交组的宏观基本种类主要 有: [1]开放式结构的交组,不含全封闭区域,相当于图论中的"树";主要是各种枝类; [1] 线性"1枝":按纯粹取数学特征的"数学法",指线性排列的> 2个完整或不完整的 "交",交间的连线为"枝干";在两端的交称"枝端点"、枝干中间的交称"节点"可伸出须; (2多个"交"按>1个方向组成不含闭合区域的开放结构,基本的有:拐枝、交枝、并枝: [2] 闭合式结构的交组,多个笔或交、枝从多方位围聚或连续同方向围拐组成完全闭合 区域"围", [3] 开放一闭合码元间,即兼含开闭结构的混合式结构的交组; --可再按微观上"须"的细节结构、数量完整度、方向位置特征细分类; {2}基本方案各键可选增加映射小型扩展码元,成为小型扩展方案:w/i 键或增" ii" : J y,ii i 多,、、; E/2键或增"-亿":人丨,小,、、 R/3键或增"小大木"士,,小大木; S/4键或增"山力JLiS"" :山3,力1?七# 1,力MP,爪,刃 决,我,,j ; D/5键或增且£/":▽ G,-m且皿T ,々; F/6键或增"月立":日廿甘份,*並开,月M円分待册,夕,妒;K ; X/7键或增"豸":++,,,為下; C/8键或增"正":寸,广升牛午生玍乍,正王止土止; ¥/9键或增"几我":广1,1_,了才、^^豕4,〇]几瓜儿,芍7与九,,己已弓,-1^ ;^。
9. 根据权利要求5所述的一种形码键盘输入法,其特征是:高级傻瓜小键盘输入法方 案如下 I = I :一键可映射 I J J、一、J 人、V、i| J、Il =彡4、、》、、,;、、、,、; 2. L :今键可映射厂L、勺々!_广、V今〈〈〈、毛壬T 、人入人,广; 3. Z:乙键可映射i V乙、/ ^乡幺1_、了子予2疒石豕4不才、、乃方万'弓专考亏、d几儿瓦TT 九、己已弓弗、 4. X :木键可映射丄Th f 卜、兑?…、十七寸少卞、乂、小+、大六 火米、术水; 5 = 〇 : 口键可映射口q、日目丑、田□、〇?且皿甘九毋舟 、:n:丑-mi3逊¢:丑、日廿 甘lit丑並世逊、▽▽立么豆玉巧; 6. E :山键可映射U"n]山彐雨门A、77:![力屮力閃七#兔、刀匕-1爪、巾由屮田田内、 JL丌4M :(说扣彡 苽兀、s 歹lx夜ifc刃找、w a也也卫; 7. H:宇来键可映射丰中夺册卅廿++3支戈1、主土手千戶尹少、罜王工上下省、未耒禾 天、半 ; 8. R:央艮键可映射又夂夂文只久六、女丈及、来夹、身尺艮民、只具央共#臾臾央夬夬、 当贝乐、貞;9 = A:冉键可映射尸尸I PP P于X耳母匈、月円升荇月用冊M舟甩冉夕氏 再书碑、由止ii*曲'田T尹歹尹于?^平本立也、中中由屮中肀警?# 、^戸句串:月。
10.根据权利要求5所述的一种形码键盘输入法,其特征是: U)核心方法中的所述"部分特征"也可指方位特征--与"类别式"相反,也可按方位 特征为主、类别特征为次分类取码、映射,"方位式/类别式"取码的比例可以调整,且因基元 组合的统一性而具有灵活、代偿性: [1] 码元的"方位"包括方向/朝向、相对位置/绝对位置、角度,外文同理; [2] 具体可按下述典型的方位特征对码元分类、分不同位映射: 一单笔、枝的方向;"n、月"甚至"拐笔、拐枝"的开口方向 一鱼的须/尾的位置:从块的角点向外伸出称"偏须/偏尾、从边中部伸出称"中须/ 中尾" 一鱼头的须尾的方向:上/下/左/右;--故可按"方向X位置X数量交叉细分 类; [3] 方位特征为主并且相同、仅次要特征不同的码元可合并类别及键位,可选再用单、 复击区分; [4] 方位码元映射还可选"键/类一致":主要按不同方位特征选取的码类、还可映射于 相应不同方位的键位上进行输入--还可局部调整; {2}典型的方位式码兀映射输入方案: [1] 以"2"键为起点布局的"笔势法"的方位码键盘映射、输入方案;【可增设0键(其 他小键盘9键方案同理也可),映射中须鱼、甚至"中、串"类,如"由,中弗,串2"】
[2] 以"5"键为中心布局的"辐射法"方位码键盘映射、输入方案,同理键位方案都可再 调整; (1)其中图26为12键方案,可合并各方向的拐、腾出键位映射右列三键,变成方位+类 别混合式9键方案;具体输入步骤同理; (2) 其中图27为15键方案; (3) 其中图53为26键方案。
11.根据权利要求1所述的方法,其特征是, { 一 } "核心方法"的取码方法可调整、推导,并直接与相应映射、输入相关联和一致,生 成多种多米形码输入法衍生方案,故本发明应保护"核心方法"作为侵权判定依据(总论部 分其他编码形式的多米码也同理)、而非从具体、僵化的某个静态方案的角度来保护,否则 保护范围可能被绕过,如下: [1] 特征调整推导:主要根据"具有相同/相近或相关特征"来进行码类调整,以更易 记、更高效率低重码, --可较灵活的理解运用"相关特征",如部分特征、交叉特征,如:马/书(忽略须), 书/弗(都含多拐骨架),王/五,韦/书(都含枝、忽略胖块),又如图46中"增边成块"如 "王尹五(多了重要的基本码元"块")"、同理"尹月","取交法"方案原本一般不合并它们, 仅在备选方案中可合并它们;; --如,图44图45按部件与阿拉伯数字键名、大写数字的结构、如骨架象形"来分类映 射; --可按"相关性"优化调整映射布局:如近类相邻,宏观大类对应不同键区、微观小类 对应各键区内每键位; --使用了核心方法的部分特征进行码元分类和设置,如" "符合"点侧"的结构特征 而可归"T"、但因兼含直斜笔也可归"大"; 他人方案的码元分类如有不同程度类似的"特征统一性"或部分特有的码元种类,即等 同侵权; [2] 界限调整推导:将简单基元按"核心方法"组成符合统一的多米网结构模型的各 种、各级基组,具有全息、分形性,故具体的组合结构、界限等有很大的灵活调整性,所映射 于键盘、组成的输入方案都可行; --如,单纯、小码元可以组合成大码元,则设置大码元可减少击键次数,只设一部分 或不设则可减少键位占用;甚至可以反之大码元包含小码元(见下文"宏观方案"); [3] 成分调整推导:编码特征的分类或其组合甚至交叉组合,按"类别+数量"分为{2/ 多拐笔和2/多拐枝},而按"数量+类别"分为{2拐笔/枝、多拐笔/枝}; --如,按方位式、类别式分类的码元的单独/综合/调整选用,如上文中(第1页尾、 及附图多个相关实施例)"方位式/类别式"码元的选用比例可调整;又如"各种尾"再按 位置"中尾或偏尾"交叉分设类键,以减少重码、形成新方案; [4] 码位调整推导:如"9键基本方案"内部的调整 (1) 合并:可选择部分相关类键进行合并:56或45、23、28、17、89键;多合并一对都会 增加重码; (2) 分设:与合并相反,可分设9键基本方案中因键位少而被迫合并的码元类别,以减 少重码、提高取码精度,如,"T、八","直笔丨一、斜笔y、","n、并笔须"等母字代表的小类; (3) 移动:部分母字代表的码元小类所映射键位位置的移动调整,如"尸"可以移入小 键盘"连拐"键(尸相当于封头的"几")【上偏尾"白"类可改为一律拆分输入,则腾出了大 键盘偏尾鱼键】;又如"2"键中的"t"因属直交的部分、故可移入3键; (4) 删减:甚至9键基本方案也可取消设置某些较大或组合类码元的键位,只留基本单 纯的码元类键、如"枝、多拐、胖块"改为拆成更小码元来组成,只留"一八十拐口 n"6种;同 理,可再减至5?2键,还可结合"相关类合并"等调整方法『例见图9?图14』;; (5) 增加:9键的基本方案可增设O键(在pc键盘上可用B键或空格等代替),也可算 上第1段"键类合并"所腾出的键位);新键位上可增加映射:第2段所述"分设"的码元小 类,或者常用的大码元、组合码元,以取大优先、减少拆分;如:粗枝,或某部分"简单鱼"种 类,如又、尸、由、甲、中,甚至复杂的"串鱼"; (6) 9键的基本方案整体映射于WERSDFXCV键,整体键位也可移动:如改映射于大键盘 "tyughjbnm"键,或"iopjklm,。"键,贝U便于右手操作、还能与做方向键的asdf键配合使用; [5]反向调整推导:五笔字型基本上未按类别、方向规律来映射码元、但也能有效的进 行输入,同理,只要使用了多米形码的各级尤其是基本码元、将它们较平均的随机分类、分 布映射在不同键位上,即使不同程度设置了不按多米网结构规律进行基元组合的码元键 位,也能有效输入; {二}衍生方案例: [1]傻瓜方案:(主要是小键盘方案)可将部分内容和规则进行简化、调整,可倾向较粗 拆、选用部分较大码元,减少拆分、但稍增加重码选择量、虽比专业方案稍牺牲输入速度,但 因更易学易用,所以用户更广;傻瓜方案可选用基本、小型扩展码元和部分的中型扩展码元 (详见『图25』); (1) 可将基本方案的6键并入5键:可将6键中"横向并偏须"的"月"类并入n键(则 如"五"?年& ;【立夂不可归粗枝】,其余并入5键;【傻瓜方案的大力度调整甚至 可全部并入5键】;高频的"又"及" ^ 可从"只"的键移至"月"键; (2) 优选可增设6键为"各种中须鱼"键:即母字"由、甲、中"代表的各同族字根、以避 免"先输须还是先输块"的拆分、辨别,--此时"串鱼"的输入也相应简化成傻瓜的复击6 键即可; (3) 【傻瓜方案还可选粗拆免"补八":如"木"与作为其部分的"十"(免补输斜须"八") 同样粗拆击"3"键、重码再选;甚至可将粗/细枝如"干/禾(免补八)"合并键类;粗细"拐 枝"同理,如"夂牛/矢失朱(尹先)"多拐枝"也同理……】; [2] 高级小键盘傻瓜方案:见『附图49』将码元种类进行合并,粗分类更能减少思考,是 更成熟的方案; [3] 中等键盘(11?15键)、大键盘(16?26键)典型方案: (1)大小键盘一体式方案:尤其在9键基本方案键区之外,可增设各级、各类组合大码 元键位,并可调整所映射的码元种类、数量、位置,形成一体式方案,此时可完美兼容上文所 述"码长可并"的输入; 如:可增加"QAZ"键组成"单手12键方案"、甚至再加"TGB"键组成"单手15键方 案"……,『图1』的方案设置了较多的码元种类; 【--同理也可调整,如低频的双偏头鱼" "可并入相关"串"类;"双头拐中尾鱼"可拆 分输入】; 大键盘包含小键盘键区的有益效果:减少记忆量、学习量;便于单、双手输入之间免切 换使用;便于一只手输入文字、操作键盘,另一只手翻看纸张资料、移动鼠标、上网玩游戏 等; (2) 大小码元混合调整方案,如『图I』所示"大小键盘一体式方案"中"偏尾/中尾"码 元:笔中尾/笔偏尾、须中尾/须偏尾、交中尾/交偏尾、拐中尾/拐偏尾,可合并或合并其 中部分,【又如,取消设置"串"类键,改拆成"头-尾-头"(或甲口)输入,或复击"中"、复 击"中须鱼"键输入】; --腾出的键位可映射被更细分设的部分小键盘码元如"拐枝、多拐枝"等『例见图 17、18、20』; (3) 微观化码元方案:9键"基本方案"内部各级各类码元,可再细分成更多细类映射于 大、中型键盘:尤其可分设:直笔/斜笔、十/ 乂、大交/小交、口 /块或笔/枝、n笔/n枝形 式等,『详见图13?17』 --由于微观小码元的取码范围较小,为了离散取码区域,可与五笔字型类似,依次取 码、前n末1,或采用前文所述"跳取"方式; (4) 【宏观化码元方案:与前文优先设置"低组合级别、简单码元"相反,(甚至小键盘) 也可侧重设置各类大码元、组合码元的键位,它可包括"所包含的相应单纯、小码元"-- 即取码时,部件只需符合该键代表的部分特征即可,如己6〈日、几〈尸;丨〈甲、八〈只,十 〈古、口〈古 】; 【--同键复击法:具有"相关特征的相关类"只有级别不同时,可并入同一键,并可用 复击区分,如:"串"类可选用复击"中"或"由"来输入;可不设"巨"键,而用双击"已"来输 入,又如可"复击补八",即交、枝、块等部件补输附加的各种方向的"八"形斜须时,可以复击 原来的相应键位】; (5) 扩展:同理键位可增加至26键以上,可映射更多更细、更大更复杂的码元类别,如 超线性码元。
12.根据权利要求1所述的方法,其特征是, {1}小、大键盘词组取码的典型方案分别为: 2字词:第一字前3码+第二字前3码;第一字前2码+第二字前2码; 3字词:第一字前2码+第二字前2码+第三字前2码;第一字前1码+第二字前1码+第二字前2码; 4字词:取每字前1码+有重码则补第4字第2、3码;取每个字的前1码; 5字词:取每个字前1码+有重码则补第5字第2码;第一二三字的前1码+末字的前 1码: 6字词:取每个字的前1码;同上; >6字词:第一?五字的各自前1码+末字的前1码;同上; {2}可选的,码长可调、可变、可并: 一可调:指单字全码长可增或减,词中每个字的取码数量也可调整, 一可并:指大小键盘的码元可混合并行输入 一可变:指字词或可不定码长、而由按分隔键如空格来确定、切分、分词; {3}可选的,甚至以"超短码"输入,如全码长一律为1或2、3、4,尤其可只对常用的"词、 词组、多词短语甚至整句"取超短码来输入,基本上依次取每字的首码、或前2码、或前3码, 而对不常用的字词则取标准码长输入 -一律超短码方式输入一般会遇到个别字词不是想要的,可进行选择或补码,或与 正常码混合并行输入,区分标准码与超短码,可通过"在不同位置击键分隔"的规则来切 分: 常见、不常见字词的区分: [1]常见字词: (1) 可按相关国家标准如常用词表为准,未收录的为不常用,或据用户常用度智能判 断;。 (2) 可配合超大、可自定义、自学习的"n次字词组合库、海量词句语料库、人工智能功 能模块":一比普通词库多收录有意义的各种非典型、及主谓、动宾、偏正、联合等词组或句 式; -同理可包括常用的句子结构辅助词、虚词,及助、副、介、代词,如"手中"的"中"; (3) 高频字词可取简码或超短码(如1字1码或一字2码)输入 [2]不常用字词:可主动选择或补码,如:库中未收录的不常用、生僻字词未被自动正 确识别、用户希望自行修改的字词或组合; {4}可选的"跳取方式":可按字中自然离断的部件区域为界限取码,则与"超短码"同 理,各区域的取码数量可以调整--不同区域取码可相同或不同、可跳过未取码的部分笔 画组/部件或区域,主要如: [1] 对各区域或前n末一区域各取1码,不足的依次取码、空格确认…; [2] 含1个部件或1个码能取完的区域则取1码,含有> 2个部件的区域取首2码、或 首码尾码; [3] 与"五笔数码"取首部、余部取码法同理,但可调整"首部、余部"的范围或位置、取 码数量,如首部取前2码、余部(剩余的可能是多个区域)取首尾码【或每区域的首码】,又 如调整为"前轻后重"前几个区域依次各取首码、如尾区域有剩余码位可继续取尾区域第2 码…… [4] 同理还可按宏观字体结构区域跳跃取各局部码,先取宏观结构区域、不足则取下级 微观区域; {5}并击输入方案:简单的例子是"平移复制法",如:两个"小键盘9键键区"映射于大 键盘不同区域、如左右手的无名、中、食指对应的部分键位,双手同步输入不同的相邻字词, --同理可调整码元、键位,生成多种新的并击方案,如左手3行4列12键、右手同样 12键; --除"类别式"外的其他方案,如"方位式"方案的类键也可同理复制、并击输入。
13.根据权利要求1所述的方法,其特征是,可选的、专业取拆规则、即"专业拆"法为: {1}长干无须,或连块边: "长干无须"指多枝中所含某笔上无须、但较长、影响结构,可视该笔为一根"枝干"; "或连块边"指枝、多枝中与块边有交连点的某笔,相当于以该块边为"须"的"少须枝" ⑵并笔合一,并须n肩: "并笔合一"指孤立并笔逢繁可皆合做1笔、逢简可细拆【或归"无枝干式1枝";又或归 9键】 "并须n肩"指并笔或"并丁"、"笔t"的顶端与其它部件相连,则取"n"码; ⑶块n拐先,框头补含: "块n拐先"指一般优先拆取块框、n,其次是多拐(如几、形)、拐,再次是多枝、枝、枝侧, 最后是交;优先级高的不宜先拆散; "框头补含"指完整、不完整的块若含有不与外框相交的内容,可一律先取外框、后取内 容,【或按〔笔顺拆〕】 {4} 口日目田,块须超边:闭合码元可据下述特征细分类、交叉分类:数量、有无外须、 胖瘦、均匀度、形状、是否离散、与外框相离/相交连; -->1个块逢繁时可皆取"1块"、逢中只需复击1块、逢简按数量微拆输入; "口日目田":围笔"口"是无须的块,内部可均分成多个; "块须超边":指有须的围笔则为"块" --"块"还可选包括"围块":指笔划组围成"各边之间有部分缝隙"的"块"【或改做 "粗枝"】:{5}n块单须,补纵舍横:(单设有"中须鱼"键的小键盘方案中可免此规则、一键输 入而不需拆分)专业拆"方案可规定n、块的单须细拆纵向的、(尤其逢繁)忽略横向的, 逢繁逢简一律先输块、后"补"须,此时允许"须"贯穿"块框"取1码(称贯穿法);【尤其逢 简也可依头尾界限切断取码(称界断法)】: {6}块头并须,方向顾全:块的各方向并须均影响取码或需要拆分【或也"补纵舍横"】: --逢简细拆时可按书写方位决定头部、并须的先后;逢繁粗拆时各方向须均忽略、取 "块"一键输入、但尤其下并须则一般需要补码【傻瓜方案可一律取块+选重码】 {7}逢繁粗拆,逢简细拆: [1] 宗码的小码元可组成大码元、只是组合量级不同而已,所以宗码的取码范围可调 整,基本码元方案可同理选取小、中、大型的扩展码元(分别指『附图2』中无括号、带小/中 /大括号的母字)组成相应新方案; --各级扩展码元中部分码元可做跨级甚至跨类优化调整,如"小型扩展码元方案"中 可选加部分"中级扩展码元",反之亦然;或在需要时选用部分,如逢繁粗拆时、傻瓜方案中、 较高频的更大码元; --另外,可扩充一些更大更复杂的、繁体的、复并元的字根,反之同理或可删改一些 字根; [2] "小、中、大"型的扩展码元不仅指取码范围的大小、还指优先级别,其分级依据主要 有:部件内部成分复杂度,部件交连离散程度:部件组字能力或使用频度,部件内部小类是 否典型或完整; [3] 上述几种基本和扩展码元取码方案均可选择配合下几种拆分规则之一: (1) 倾向细拆:标准方案,倾向于取基本码元或外加小型扩展码元(也可只选用部 分); (2) 倾向粗拆:傻瓜方案,倾向于取尽量较大的码元,粗拆为主; (3) 逢繁(字)粗拆、逢简(字)细拆:专业方案,即粗细结合取码,对复杂、成分多的 字,趋向粗拆取大码元或组合码元,反之对简单、成分少的字则趋向细拆取小码元; {8}交块补须,小类枝断:是专业细拆规则【傻瓜方案可免于细拆,只需击键名报户口、 遇重码再选】 "交补须":指"直交"带有斜须"八"或单根"逢简细拆可先输直后补斜;"块补须" 同理; "小类"指对含>2个交连基元的部件,若其内部能分解出相对较大的小类码元,则应尽 量按"先取大整、取码优先度"规则"逢中中拆"取码;若分解不出较大的码元,才按逢简细 拆、依次拆成更小码元,尤其可"枝断",指相交连的笔画组、部件,逢简需细拆时"宁断枝、不 拆交",宁可切断枝干、也尽量不拆交点处;甚至可"断枝、逐点细拆",即逐个交点、精确到每 点须的数量完整度来取码: -可优选的:各种"无角的枝、拐枝"逢简可按"补拆枝端封头T"法细拆输入; -"键名字、部件独立成字"及"需要细拆的部件"的区分输入,可采用:选重码/补 尾法/报户口/细拆法/识别码; 上述"专业拆"可调整拆法,也可配合取码、映射、输入步骤的调整、交叉组合形成多种 方案,优选的如:
-笔顺拆:可采用"笔顺拆"、部分兼容"按笔顺拆分"的方式、或参照笔顺划分拆分界 限、次序; -小类拆:与"小类枝断"节"逐点细拆"同理、只是改为逐小类细拆,简称"小类拆"; -可综合、结合"笔顺拆"、"小类拆"输入方案,形成混合方案。
14.根据权利要求1所述的方法,其特征是,可选的增补方法、及其他应用形式: {1}可选的增补方法: [1] 对重码、容错、联想的多个结果,可显示提示供选择:可"点选"即点击提示框中不 同结果对应的不同键位、"移选"方式即使用方向键或鼠标移动光标、"翻选"即n击翻查键; 也可进行补码: [2] 无论补码选重码,对不同类别的信息可在不同窗口中显示,无论点选、移选都可设 置相应不同的键免切换分别确认;如:多个重码字/多个重码词,当前字词的重码/多个联 想词字,常用字词超短码/不常用字标准码长的结果,确认当前字结果/确认联想结果; [3] 补码可按住组合键对当前需改词即时补码,或输完短句后按住组合键使用点选或 移选法(或触摸屏上直接点击)回退光标定位至需改词处、并补码;--所述组合键如 Alt、Shift,或改为击特设的某键; [4] 输入部分码时若有重码结果可随时提示用户确认/选择或补码,若用全码也取不 完整字、且有重码,可:由计算机进行提示、用户选择重码;或按住shift继续补码;或直接 击另设的"补码键"补码; [5] 可选设的特殊键位: (1) 空格键:手机小键盘高频使用的如确认键兼空格键,可优选设于5键;也可设于左 下角的*键(左撇子反之用右下角#键), (2) 重码翻选键:小键盘宜用O键,或与确认键合键、即确认后复击均为翻选; (3) 【补码键】:小键盘可选另外专设补码键1?9,可用它免切换直接补码、或选择重 码、或做功能键,其中补码可对字词补码或做小键盘"超短码"补码键--大键盘则也可用 字母键区上方的一排数字键; (4) 方向键:左、右为选择当前字光标在句中的位置,上为选当前的重码、下为选联想 的重码; 或:左、右为在当前行中移选重码,上、下为在"多个行"之间切换,可包括当前重码行 (一般只有一行)和联想字词的重码行(可有多行)『见图3』;(所述多行重码也可对应于 多行键位、进行点选) (5) 【可设"再制键"】:击打它代表复制前面1或2次甚至3次击键所代表的码元;-- 可与复元键、或联想键合并键位; (6) 【命令执行键】:与搜狗拼音设置一个图标来启动一键搜索不同,可将当前输入的 文字做为命令的名称,击命令执行键则由链接到系统层的相应的命令或"宏"、执行相应动 作一可预先设置或自定义多个自然词语、并如同"快捷键"那样分别对应相应由计算机执 行的程序语句指令或动作,如输入"搜索"并按"命令执行键"则使用浏览执行搜索、同理输 入"微博"链接到执行"打开微博"的程序、命令等; --在键位较多的键盘或触屏手机上上述键位可调整为详细分设、兼设;或者辅助键 位在"有/无待定输入时"可重叠映射不同键位、也不会混淆;同理,键盘空闲键位可选设本 节所述某些功能键; [6]其他可选补充方法: (1) "光标前进为在单字间移动、后退为在词间移动";"光标默认显示起点在一排重码 结果中间"; (2) 很多复杂字不需输完全码即得到无重码结果【可免空格自动上屏】,故可设置逐键 随时提示结果; (3) 各方案中的重码中可默认词【或字】优先;还可提示当前字的联想字词(尤其输完 全码时); (4) 输入时进行"击键码位提示",如所击字母可在"位数格子"中显示,如: -用户已输入"前n"该跳至"末一"时,如,字的全码为6、则在输第5码处提示、避免 仍在继续依次取码【依次取码的方案则免此规则】; 一词全码为6,则第4键的格子颜色不同或有分隔标记,提示输至此时用户不要仍在继 续输入第一字的第4码、而该输入下一字的第一码【超短码方式同理】; (5) 可按照使用频率安排在重码提示中的先后,使用频率高的可做为各级简码甚至键 名字; {2}其他应用形式: [1]配合拼音输入: (1) 与公知"五笔拼音输入法"同理,宗码可与各种拼音输入法无缝混打,还可并行显示 提示重码; (2) 拼音输入时,可按住组合键如Alt或击切换键,使用字母键开始小或大键盘补码或 /和输入; (3) 如已输入拼音字母、尚待选确某同音字,可补首码,此时只在当前字的同音字中检 索并过滤掉一部分同音字,剩下的同音字可进行选择或再补第2码,此时可规定如继续补 输第3码时,自动转为在全字库中检索、即程序判断为重新输入一个新的字;【或可对角取 补码,如左上、右下;或分区跳跃补首码】; [2]宗码对单个字体结构、整个字库的独创性方法和设计,相关软应用或软硬结合应 用,如: (1) 按将每个汉字中的不同取码种类分别以不同的方式呈现在屏幕或印刷品上,可形 成新的字体; (2) 同音字可按宗码分类布局、提示供选,如可先按整字结构(见前文)分类、再按各位 置的部件(尤其如首尾码元)是开放/闭合码元交叉分类,显示于提示框中; (3) 电子、纸质出版物如字典,可同理分类; [3]硬件应用:可应用于一切可能的硬件设备上,如PC、手持式、嵌入式、pos机、芯片、 单片机等。
【文档编号】G06F3/023GK104331173SQ201310130928
【公开日】2015年2月4日 申请日期:2013年4月16日 优先权日:2012年4月16日
【发明者】宗刚 申请人:宗刚
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1