一种地名词的计算机输入方案的制作方法

文档序号:6601613阅读:314来源:国知局
专利名称:一种地名词的计算机输入方案的制作方法
词组输入是汉字输入法中的一个重要方面,一般说来,它的输入速率比单字快得多,而且,可以分别使用单字输入自动联想方式和直接输入词组码方式。但明显地存在着两字词的重码和翻页量多的问题。
地名词组是国标通用词语集GB/T 15732-1995的一部分,它包含了世界各国及其首府的简名和我国省、地、县的简名及其行政名(小部分),约为2000余个。鉴于以地名为首词的联想词组不断增加(例如,国内重要的交通枢纽、旅游景点、高等院校以及全国的市辖区和乡镇等),从而导致使用频度提高。此外,多约40000的地名词,存在极其容易掌握的分级规则。如将其与通用词语分开并单独编成地名输入码,不仅可以方便输入,而且能使最大翻页次数不超过二。地名词独立编码的主要措施为(1)分离后的全部地名词,最大码长为五,且首码为“/”。
(2)地名词分为基础词和可附于其后的附属词。使基础词降至3000以下,从而大大减少附属词的重码翻页量。
(3)用词码输入法获得所需的基础词后,可通过自动联想方式逐步选择所用的联想词组。
(一)地名词主要是我国省、地、县、乡级行政名及各国国名及首府名;也包括与地名有关的我国各民族名;国内重要跨省地域名,如中华,华东,华南,华西,华北,华中,东北,东南,西北,西南,中央,长城,长江,黄河;还有国内重要交通、国家级景区和重要高校名。
(1)地名词的分类和优先级别①地名词的名称一种是通用名,如中国,北京,广西,平山;另一种是行政名,如中华人民共和国,北京市,广西壮族自治区,平山县。
②地名词的分类为使编码规则化和减少重码翻页量,特将一部分重要的简名用作基础词,其它的作附属词。
③地名词的优先级别可分三级。
一级中华,中国及我国省级简名(非简称)。
二级我国地级简名;跨省的重要地域名,如国家,华东,华南,华西,华北,华中,东北,东南,西南,西北,长城,长江,黄河等。
三级外国国名及其首府;我国县级通用名;我国民族。
(2)基础词是一种内涵不可拆分的地名词、地域词,它既可独立组词为独立词组,也可与附于其后的若干附属词构成联想词组。例如,各国及其首府的通用名,国内各省、地、县的通用名,国内各民族。此外,还有可表示我国重要跨省的地域名华东,华南,华西,华北,华中,中央,东北,东南,西北,西南,……等词。
(3)附属词是一种必须附于基础词之后且不能独立组词的附属地名词。例如,市辖区、办事处名及乡镇。此外,还包括其它各种功能词表示地名行政级别的省、市、地区、盟、县、旗以及自治区、州、县(含民族)及特别行政区;表示重要交通状况的机场名,铁路局及分局名;表示国家级景区地名;表示重要高等教育情况的211工程及部(省)直属的、本科以上的普通高等院校。
(4)独立词组和联想词组及优先权①基础词既可单独作独立词组,也可与位于其后的附属词合成联想词组。
②附属词不得单独为联想词组,只能附在基础词之后。
③全部独立词组优先于联想词组;同码词组可以按高频先见排序。
(二)词组编码的通用原则(1)基本码元26,最大码长5;任一组合码的一页最多可提示十个重码词组以供选择,多于十个(乡镇办)的重码词组,可翻页查找。
(2)独立词组①独立词组编码一律按通用词组规则编码。具体见下表
提醒操作者如能掌握此表的输入规则,即可顺利选择所需的联想词组。
②独立词组的等级分配最小码长为1,第一码提示十个词组;第二码最多可提示10×25词组;第三码最多可提示10×25×25词组;……。一般说来,省、地级的基础词最多为三码。
(3)联想词组1.联想词组的结构①联想词组以词为单位,由一个基础词(首词)和若干个附属词构成。
②各词的序号依次命名为首词,次词,三词。
2.联想词组的编码①首码为地名词组的通用码,其码元为“/”。
②第二、三码分别按基础词的首字和次字的首两笔编码。与之同码的附属词有省、市、县及其行政名;机场名,铁路局及分局名,国家级景区;省辖区异名地行政名;省直辖的县级市、区。
③四码为次词码。它按市辖区名的首字首两笔和县属镇、乡的尾字首两笔编码。此外,大学名为次词时,均以“学”字的首两笔为第四码。
④第五码为三词码。附属词为市辖区属办事处及乡、镇;它以“乡、镇、办”字的首两笔编码,但不显示“办事处”字样。
(三)两笔输入码及键盘(1)五种笔画各汉字均由以下五种基本笔画表述
基本笔画及其形状(2)两笔画的组合五种笔画的两两组合,构成25个基本码元,它们与键盘的对应与自然两笔输入法的键盘图完全相同,如下示
自然码键盘图(四)附加说明(1)独立词组编码举例各基础词一律按该词的等级,依次编入一码、一二码、一二三码、一二三四码、一二三四五码。例如
注一鄂尔多斯;注二吐鲁番(2)联想词组编码举例
(3)其它经试验,本方案不仅可直接与两笔码输入法配合使用,而且,在适当条件下,附加在某些输入法(如全拼输入法)中使用。
权利要求
1.一套可将30000以上地名词分为基础词和附属词的方案,其特征为(1)基础词具有两字以上的结构词,其内容为①各国国名及其首府名;国内省、地、县三级的地名通用名。②国内重要跨省地域名,如华东,华南,华西,华北,华中,东北,东南,西北,西南,中央,长江,黄河,长城等。③我国民族(含中华)名。(2)附属词①省、地级市的辖区,县(市)所属乡、镇。②表示地名行政名称的省、市、地区、盟、县、旗和自治区、州、县及特别行政区。③地区、自治州、盟名与其首府名相异(简称异名)的全部地级行政名。④表示重要交通状况的机场名,铁路局及分局名;表示国家级景区地名。⑤表示重要高等教育情况的211工程及部(省)直属的、本科以上的普通高等院校名。(3)独立词组和联想词组①基础词既可单独作独立词组,也可与位于其后的附属词合成联想词组。②附属词不得单独为联想词组,只能附在基础词之后。
2.一套联想词组的组成和编码方法,其特点为(1)联想词组的结构①联想词组以词为单位,由一个基础词(首词)和若干个附属词构成。②各词的序号依次命名为首词,次词,三词。(2)联想词组的编码①首码为地名词组的通用码,其码元为“/”。②第二、三码分别按基础词的首字和次字的首两笔编码。与其同码的附属词有省、市、县、地区、盟、旗名;自治区、州、县名;机场名,铁路局及分局名,国家级景区名;省辖区异名地级行政名;省直辖的县级市、区。③第四码为次词码。它按市辖区名的首字首两笔和县属镇、乡的尾字首两笔编码。此外,大学名为次词时,均以“学”字的首两笔为第四码。④第五码为三词码。附属词为市辖区属办事处及乡、镇;它以“乡、镇、办”字的首两笔编码,但不显示“办事处”字样。
全文摘要
本方案是一种单独处理全国乡级行政以上的全部地名和世界各国国名及其首都名的方案。它将地名词分为两类一是基础词,可作为独立词组和使用码长不超过五的词码输入;另一是附属词(市辖区和县辖乡、镇),它只能附加在基础词之后并与之共同组成可自动联想的联想词组。联想词组的编码以词组中的词(而不是字)为单位。从而保证最大码长不超过五。且联想结束后的翻页次数不超过二。
文档编号G06F3/023GK1444130SQ0310719
公开日2003年9月24日 申请日期2003年3月15日 优先权日2003年3月15日
发明者郭洪, 曾晓辉, 曾里岗, 曾建明, 曾建航, 禹清泉 申请人:曾建明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1