分层首拼编码法_2

文档序号：8412110阅读：来源：国知局

。例如中”字，许码有效长码为“zjhs”，无I许码为“jhs”，假设某小朋友不知道这个字的发音，无法确定有效长码，但学习了本编码法后，知道应一拆为三，三部分是“门一竖”，即知道无I许码为“jhs”，则可在字典第一部分无I许码检字表中检索jhs，可查到“中”字在正文中的页码，再根根据页码查到“中”发音。假设这个小朋友，连“门”的发音也不知，他同样可将“门”一拆为二，知道“门”的无I许码为“sz”，则可在字典第一部分无I许码检字表中检索“sz”，可查到字“门”字在正文中的页码，再根据页码查到“门”字发音。
[0026]查了字后，接着可以查词语了，由于词语是建立在字的基础上，故一般不存在不认识发音的，故可接从第二部分查词了。例如，“中国”的许码为“zgjkhwsd”可直接从第二部分正文查到这个词，非常方便。
[0027]可见利用“汉语分层首拼编码词典”查字过程也是分层的，是有趣味的，查字过程也是学习汉字的过程。
[0028]分层首拼编码法存在u、1、v键未被利用(V键未被完全利用)情况，因而，u键可作为字、词、句编码的识别码，安排在第I层和第2层之间(u键可输入也可不输入，加入u键识别率高，可减少2层以上码长的输入)；i键作为数字切换键或备用键；￥键由于仅不出现第I层编码中，因而可作可作为中英文输入切换键。
[0029]分层首拼编码法拓展性强，可实现新造字、词、句的编码输入。多音字可有多个码都对应一个汉字。
【附图说明】
[0030]图1:1笔画基本字根及特别字根发音表。
[0031]图2:2笔画及以上基本字根及特别字根发音表I。
[0032]图3:2笔画及以上基本字根及特别字根发音表2。
[0033]图4:2笔画及以上基本字根及特别字根发音表3。
[0034]图5:汉字和词语拆分举例。
[0035]图6:典型汉字一拆为三的拆分方法。
【具体实施方式】
[0036]依据分层首拼编码法而形成的汉语字、词、句一套编码可叫做分层首拼码或许码，依据许码定义，为方便学习者撑握、查询不认识的汉字，特定义“无I层许码”(简称无I许码)，无I许码是许码的组成部分。可利用数据库技术将许码、无I许码存于计算机中，可利用许码制作输入法软件，以实现汉语字、词、句的快速输入，这些软件可用于电脑、手机、平板电脑、笔记本电脑及其他需要中文输入的地方。同理，可将将许码、无I许码应用于中文检索领域及其他相关领域。
【主权项】
1.分层首拼编码法，其特征是以汉语拼音为基础，取字、词、句及其拆分的字根汉语拼音首字母(以下简称首拼)组合编码。
2.分层首拼编码法以汉语每一个汉字首拼作为编码的基础，I笔画基本字根及特别字根发音表(图1)和2笔画及以上基本字根及特别字根发音表(图2、图3、图4)也作为本编码的基础。
3.分层首拼编码法引入“层”的概念，即字、词、句在没有拆分前取其首拼的字母皆归为第I层；字、词、句首次一拆为三后的汉字或字根首拼皆归为第2层，同样，字、词、句2次拆分后的字根首拼皆归为第3层，依次同理，字、词、句η-1次拆分后的字根首拼皆归为第η层，汉字拆分的终点是第η层字根皆由单笔画字根组成。
4.分层首拼编码法汉字拆分口诀可改笔顺、取多优先、一拆为三、若拆多三，取首次末”。
5.按照权利要求4，可改笔顺、取多优先指汉字拆分时，不必按照书写顺序拆分汉字，要取最多的笔画，即使不是连续的笔顺也可组成字根。
6.按照权利要求4，所谓一拆为三、若拆多三，取首次末，即任一大于或等于3画的汉字或字根一定要拆为三部分，这是最高的优先级(当汉字或字根只有2画时拆成2部分，只有I画时拆成I部分);若拆分字根总数大于3个时，只需取首次末字根编码即可，不必每个字根都要入编码。
7.按照权利要求4，一拆为三规则的优先级高于取多优先规则，两者有矛盾时，要首先满足一拆为三。
8.按照权利要求1~4，依据分层首拼编码法形成的编码可叫做分层首拼码或许码，许码对于字、词、句而言，可分为有效长码和最大长码；其中最大长码是依据本编码规则对汉字进行拆分到底的长码；有效长码长度是不确定的，有效长码以实现输入时无重码时的长度为有效长码，在设计有效长码时，可将高频汉字有效长码尽量短，低频汉字有效长码加长。
9.如同权利要求8，附加层码:为了防止以上规则全部用完后仍有重码的情况发生，取oyesfwlqbj (注:oyesfwlqbj为对应0~9的首拼)任意字母附加在以上最大长码或有效长码后面(仅当按以上规则输入出现重码时选用)。
10.按照权利要求8和9，最大长码=第I层首拼码+第2层首拼码+...+第η层首拼码+附加层码。
11.词、句编码规则，其特征:每一层皆按先组合后拆分的顺序编码(以下简称先组后拆)，比如:二字词语“ΧΥ”(假设其许码分别为abcd，AB⑶，那么，第I层组合首拼码就为aA，第二层先组后拆字根(首首次次末末)首拼码就为bBcCdD，二字词总的编码为aAbBcCdD(简称组合许码)。
12.如同权利要求1~11，分层首拼编码法不仅仅限于字的编码，还可实现二字词及以上词语、句子的编码，理论上可实现任意长度的句子的编码。
13.如同权利要求1~2，分层首拼编码法使用的是标准键盘(中文与英文通用键盘)，通过V键可实现中英文输入切换，不用依赖ctrl+shift即可进行切换，通过i键实现数字0~9也可用字母键进行输入，即当输入i切到数字功能时，ο代表0，y代表1，e代表2，s代表3，f (four是英文4的读音)代表4，w代表5，I代表6，q代表7，b代表8，j代表9。
14.如同权利要求1~2，分层首拼编码法是一简体中文为输入对象，同样适用繁体字。
15.依照权利要求1~2，分层首拼编码法可用于中文汉字检索，以分层首拼编码法为基础的检字法可看作汉语拼音检字方案和部首检字方案的优化，由此形成的词典名称可叫“汉语分层首拼编码词典”，词典分为两部分，第一部分为无I许码检字表(无I许码，故名字义，即许码是从第2层开始的按照分层首拼规则形成，去掉了第I层码，即无I许码)；第二部分(即词典正文)，字、词或字根排列顺序按许码英文字母顺序排列汉字，如果知道汉字或字根的发音，则可直接跳过无I许码检字表，直接在正文部分查找汉字或字根。
16.依照权利要求1~2，分层首拼编码法存在u、1、v键未被利用(V键未被完全利用)情况，因而u键可作为字、词、句编码的识别码，安排在第I层和第2层之间(u键可输入也可不输入，加入u键识别率高，可减少2层以上码长的输入);i键作为数字切换键或备用键；v键由于仅不出现第I层编码中，因而可作可作为中英文输入切换键。
17.依照权利要求1~2，分层首拼编码法可实现新造字、词、句的编码输入。
18.如同权利要求1~2，多音字可有多个码都对应一个汉字。
19.按照前述权利要求1一 18中的任一条，依据分层首拼编码法而形成的汉语字、词、句一套编码可叫做分层首拼码或许码，依据许码定义，为方便学习者撑握、查询不认识的汉字，特定义“无I层许码”(简称无I许码)，无I许码是许码的组成部分，可利用数据库技术将许码、无I许码存于计算机中，可利用许码制作输入法软件，以实现汉语字、词、句的快速输入，这些软件可用于电脑、手机、平板电脑、笔记本电脑及其他需要中文输入的地方，同理，可将将许码、无I许码应用于中文检索领域及其他相关领域。
【专利摘要】分层首拼编码法是依据人的语言发音特点、结合汉字构造原理和汉字来历而设计,以汉语拼音为基础，取汉字及其拆分的字根汉语拼音首字母（简称首拼）组合而成，只要撑握汉字及字根的音，即可学会本输入法，是首次实现字、词、句统一进行编码，且可实现无重码，是首次实现中英文输入不用依赖ctrl+shift即可进行切换，是首次实现数字0~9也可用字母键进行输入，预计是我国汉字自电脑、手机、平板等智能终端出现以来汉字编码输入领域一场新的革命，其有简单易学易记的特点，适合在中小学生中推广，适合大众人员，也适合专业打字员盲打。可广泛应用于中文电脑（含手机等智能设备）输入、中文检索等领域。
【IPC分类】G06F3-023
【公开号】CN104731360
【申请号】CN201510085396
【发明人】许晓敏
【申请人】许晓敏
【公开日】2015年6月24日
【申请日】2015年2月16日

完整全部详细技术资料下载

当前第2页1 2