手印键盘及其大字符集的广义特征编码方法

文档序号:6604845阅读:317来源:国知局
专利名称:手印键盘及其大字符集的广义特征编码方法
申请号为98100688.4的发明中叙述了一种叫手印键盘及其编码技术的发明,在该发明中对一种具有真正自由风格的大字符集输入工具进行了详细说明。但仍存在如下不足1、按键标记的制作如采用导电片(或微型导电体)时,于说明书中给出了一个扫描电路的实例,但该实例由于需要检测电路的典型值故在实现时有一定的困难。我们在此将给出另一个实例。
2、按键标记的制作如采用图像标记时,标记感知器采用手持式微型专用带光导纤维的图像扫描仪或数字相机,并能与OCR文字识别连为一体。在前说明书中没有给出具体的例子,同时没有对活动标记的感知能力,使图像感知器的作用不能充分发挥。
3、在上发明申请的权利要求书中的第八条,即“从按键的操作序列集到字符集的映射方法的特征是采用手印语、手印标记、与模糊与非模糊的全息编码。”对全息编码方案没有详细论述,我们将再此对此具体实现方法进行详细论述。
一、对导电片式手印键盘扫描电路的设计举例。
按键标记的制作如采用导电片(或微型导电体)时,当有多于一个的按键互相接通后,即表示按键被按下。扫描电路以一定的频率依次向各导电片发出检测信号,然后再于其它的导电片上检测信号以判断那些按键被按下。发检测信号前可以先判断一下有无收到其它导电片发来的检测信号,如有可以跳过该导电片。在用导电片制作按键时,如果按键数不多,比如仅有两只手指带按键,此时佩戴非常简单可以不用固定装置,与机器间的连接可以直接用导线。按键可分为主动方与被动方,被动方的按键之间不能相互按,它们只需接受信号而不需发送信号。如导电片太易互相接触而造成误按键,此时可以在某些导电片周围加一圈具有弹性的防护圈,当按键相按时必须先把防护圈压下或压开方能相互接触而导通。
下面特别强调一下按键辅助物的设计。辅助物可以看成是手上按键的扩充,在其上以一定方位与形状分布着若干被动按键。辅助物除了作为按键外,它本身还可兼有其它功能。如笔的功能、工艺品的功能、茶杯的功能、稿纸架或书架的功能等等。辅助物形状的上下、左右方位还与字符的方位相连系。比如我们可以制成一个九宫格式的稿纸架。其正面放稿纸,反面为按九宫格的方位分布的按键。录入时手拿稿纸,一边录入。九宫格还可以变形,比如把传统的内外结构变成上下形,上面代表字的外面,下面代表字的里面,或把九宫格变为三个长方体,左、中、右放到长方体的前与左、右两侧上,把上中下与上中下三个长方体上对应。这样变形后九宫格即可放到如笔这样的一类物品上。辅助物上的被动式按键也可以制成点阵形式,比如分辨率为n×m,则x轴与y轴上的分布n与m键。键的形状为长条形,上有突触状按键(整个板面从外观上看也可以是平整的,以便于象“黑板”一样书写)。在用导电体制作阵列式按键时,x方向与y方向的键交织而放,相互间用绝缘层分开,就象多层印制板电路一样。由于这些键是被动键,一般它们不需要发送检测信号,可以用移位寄存器等通过定时采样它们的状态并移位截成一定长的串向机器发送来制成它们的扫描电路。这样的辅助物不仅可以起按键的作用,而且还可以起画笔与鼠标的作用。如果指上的导电体按键用软质的导电材料制成,它辅助物的接触面积与压力有关,则可以模仿毛笔、油画笔一类绘画工具。如果把画板辅助物的表面划分若干区域,让每一区域对应一定的信息,比如笔画、部首等还能让画板起特殊键盘的作用。
二、带图像摄录装置的手印键盘工作台。
我们于此所说的工作台包含台式计算机与手提式计算机两种。我们于此发明中需若干图像摄录头,作为输入装置。当然也可以用单个摄录头,此时会有一些不便之处。用于手印键盘的摄录头上须按一架子,架子与摄录头的距离根据摄录头焦距的需要设定。架子上须有若干眼孔,眼孔的大小与手指的指腹相应,眼孔上还可以有一个开关,如感应式开关,当手靠近时通知计算机按键已被按下,同时读取孔眼中手指上的图像信息。摄录头还可以同时扫入图像文字信息,通过OCR文字识别器输入文字。通过这样的方式计算机的使用方式可以很大地改进。改进方式如下让计算机显示的画面与计算机的外部空间(抱括计算机显示屏幕)的某些部分进行坐标对应。也就是说设立若干带特殊颜色或能反光或发光的标记,通过摄录头用以定位。另有一个可移动的发光标记(也可以是某种的特殊颜色的标记),该发光标记上可带若干控制开关,用于表示区分标记的作用或表明标记被起动或结束。该发光标记可以是一只光笔,当笔被按下(笔头上可有开关)后笔头即可发出若干颜色的光。该光坐标可被摄录头感知,既可用于当鼠标使用,又可以当手写的输入工具用,亦可用于绘画。这样的装置非常适合于在读书时作摘录,当对某段书中内容感兴趣时,只要用移动发光标记画一个圈,该段内容即可被图像摄录器录入并被OCR识别。如果显示器改为投影式的,此时整个计算机都可以被隐蔽起来。投影可投向桌上的一张普通纸或某种特制的屏幕。所有的工作都可以在干干净净的桌面上的一张投影画上进行了。工作环境大大改善。投影可以来自于画的正面也可以来自画的反面。
图像的信息量很大,如果每秒钟以几十副图像的信息量向计算机传送是有困难的。因此有必要把图像信息分为两大部分。第一是定位与移动标志信息,这些信息量很小,仅仅需要一些点的坐标即可,可以每秒数百次的向计算机传送;第二是图像信息,每幅图像都可能有数兆字节数据量,这些图像仅在必要的时候才向汁算机传输。这样在图像摄录器上必须带有信息过滤器,能在计算机控制下对这两种信息过滤。过滤的条件可以采用颜色、亮度或闪烁频率及形状等。
三、用于大字符集编码的广义特征方法及其在手印键盘上的应用大字符集的编码(比如汉字的编码)方法在现代信息技术中有极其广泛的应用。对汉字的编码目前已有几百种,新的编码方法还会不断出现。目前存在的问题是(1)、缺乏一种统一的理论指导编码,字符、字符的含义、字符的读音、字符的形态特征、以及特征的规则等信息不能得到充分利用;(2)、所有的编码都是手工操作,每设计一种新的编码都要化大量的精力,缺乏机器辅助工具;(3)、字符的结构特征无法在按键的分布上直观地表现出来。
我们提出了一种叫广义特征统一编码理论,它把字符、字符的含义、字符的读音、字符的形态特征、以及特征的规则等统一起来,从而用户的编码风格可以从按键上分布的特征、特征规则的使用次序与限度以及取码规则等反映出来。
我们通过引入模式识别技术来辅助字符编码。模式识别技术能自动计算各种形态特征,大大减轻编码的工作量,为自动半自动编码打开了道路。
手印键盘在操作时有极大的灵活性,可以使用大量的状态标志,使各种信息得到灵活应用。按键尤其是导电片式按键可以自由地分布于符助物上,符助物可以形象地表现字符形态等特征,使编码变得直观易记。
3.1编码方法广义特征统一编码技术是把模式识别技术、模糊数学、字的拆分技术、自适应技术、人工智能专家系统技术、以及人体工程学相结合的一种方法。
字的特征有三类1、音;2、义;3、形。
字音特征即为字的声母与韵母。
对字义特征我们把具有同义、反义联想带有大量成语的多文字字典引入字符输入。同义与反义词库采用网或树状的检索结构,从这种结构我们可以从一种文字联想到另一种文字,也可以通过属性依同义与反义或分类的线路,逐步细化到我们所要的词,比如从属性“金属”联想出一批词,在从“放射性”联想出“镭”,再比如从“风光描写”与“太阳”联想到“红彤彤”等。这种输入方式对写作者很有帮助。
通过模式识别技术我们将提供给用户极其自由的空间自己定义喜欢的字符编码。也就是说用户可以提供任意的有关字符的形状特征,比如笔画、偏旁、左右或上下拆分以及带方位信息的形状特征等,我们的模式识别技术能自动分析字符的特征对其进行编码。为了减化识别算法与提高识别精度,用矢量字库作为分析对象是一种极好的方法。
为了使广义特征统一编码技术能自动或半自动化,我们首先介绍一下广义特征全息理论。
广义特征全息理论是研究广义特征(定义见下)间的丛属、相交、互斥、转化以及相互组合的理论,它与申请号为98100688.4的发明中的全息编码方法相结合能辅助产生与按键数相对独立的多种风格的编码。
两特征间丛属关系即包含关系,如带a特征的子集是带b特征的集合的子集,则a丛属于b,记为a≤b。如带a特征的集合与带b特征的集合相交,则a与b相交,记为a≈b。如带a特征的集合是带b特征的集合的交集为空,则a与b互斥,记为a←b或b←a。
所谓转化为带某一特征的集合在某些规则下转化为其它特征的集合。
所谓组合是指多个特征相互按命题逻辑的方式组合成新的特征。
一种含义广泛的检索技术必须有足够大的特征空间与充分的分类法,以便给用户足够的选择余地。用户要做选择必须给出一些信息。如系统给出的描述越抽象,由于抽象本身必须由一种具体的特征来表征,从单一的抽象性到众多繁复的具体问题往往会有很大的距离,从而会使用户自定义系统增加很多麻烦,就好象用一个抽象的形式语言去给一具体的问题编程序一样;而另一方面如果我们把系统的具体内容规定与某一具体用户的要求很近,那么系统的广泛意义就有失去的可能,而如果我们把系统的具体内容规定很多,对用户来讲要在大量的内容中作选择也是很麻烦的。因此全自动的万能的编码法并非实用,我们只想给用户提供能作出一些风格不同的编码方案的辅助系统。我们先把问题抽象化然后再给出几个不同风格的具体化方向。
特征是一事物区别它事物的信息。规则描述提取特征的原则、特证间的关系和特征使用的方法。事物与事物的特征、特征与规则是两对辩证的矛盾,矛盾的双方相对而有可以相互转化。由于它们之间的对立统一的关系,当对事物与特征与规则的相对划分与取舍不一样时编码的风格就会不一样。因此需要对事物、特征与规则本质进行抽象的提升。这种本质上的一致性我们把它概括为广义特征。
广义特征广义特征是事物、事物的特征、特征的规则的本质与抽象化的表示。具体的讲检索对象的大字符集本身也可是视为是特征集,它是由基本特征如笔画等通过规则生成的具有层次关系的组合特征组成。更进一步生成规则也可以视为是特征。为什么?因为规则本身必须具有规定性,而规定性就是一种特征。反过来任何一种特征也可以视为是一条规则,只要把特征视为“具有…特征,则…的”规则即可。因此广义特征集是检索的最基本集。特征分为模糊与精确两种。以下所讲的所有特征都是模式识别程序能制动提取的,规则都是机器可操作的。
与广义特征对应的是广义检索。广义检索是一种最一般化的操作,它的作用时对广义特征集分类与区分主次(或对广义特征集增减)。
我们把具有对立与统一性的矛盾概念从抽象到具体逐步引入。每一步细化都是最抽象操作的结果,都把静止的对象分成为相对静与动的两部份。
1、静态广义特征集(包含具体内容最广的操作对象)。
动态广义检索(最抽象的操作)为从一个集合中分出特定子集的抽象操作。
2、第一检索,从广义特征中分出非时空广义特征(静)与时空(动)广义特征。时空必与运动有关故为动。
3、第二检索,从非时空广义特征中分出(静)非规则非时空广义特征,(动)规则广义特征。此时静态一分为二。
以下列举在上2、3种的广义特征具体种类。特征子集的集合称为类。
非规则非时空广义特征可以由以下的次序编排(a)、精确特征1、字符串子集类,字符串可以词、词组等,也可以是字典中某一字、词的解释。
2、字母组成的子集类(子集为各国的字母等)。
3、数字组成的子集类(阿拉伯数字、中文数字等)。
4、非表准的形状子集类(用户自定义)。
5、标点符号子集类(中文标点、外文标点等)。
6、操作控制子集类(如PgUp、PgDn、Ctrl-w、del等,由于手印键盘的操作大都在手上因此热键操作将比鼠标还重要)。
7、声母组成的子集类。
8、韵母组成的子集类。
9、笔画子集类。
10、偏旁子集类。
11、部首子集类。
12、汉字子集类。
13、其它。
(b)、模糊特征,每一模糊特征是其元素带模糊度的精确特征的子集。还可以定义模糊特征的模糊特征,此时带模糊度的精确特征变为带模糊度的模糊特征。大致的形状,如上凸、或下凸、或左凸、或左凹、右凹、上凹、下凹、上平整形、下平整形、左平整形、右平整形、某种或全部笔画的多少等等可视其为模糊特征。所谓凹凸即为看中间是否比左右或上下高,也可能出现半凹或半突或凹凸兼有的现象,更准确地讲,比如上部的凹凸是看从上到下第一条横线(倾斜时为撇或捺)及其以上部分的类似性,从下往上看时与此类似,左右看时,看竖线以左或右。也可以某一斜度的直线切下的字符部分的相似性,切的成度一般以对直线作垂线与切下部分的交点(重合部分比如线段与直线重合算一点)少于二为标准。对字符的组成部件,如从某一方向看去,部件于观察方向的垂直的直线上的投影不分裂(比如从上到下看,“画”字不分裂,“相”字分裂为二),还可以直接把看到的部分取下作为特征。比如从上往下看,此时看到的特征举例如下(1)、“一”,如“干”;(2)、“”,如“内”;(3)、“∧”,如“个”、“A”;(4)、“”,如“各”;(5)、“”,如“言”;(6)、“山”,如“山”;(7)、“)”,如“D”;(8)、“(”,如“C”;(9)、“”,如“米”;(10)、“”,如“草”;(11)、“”,如“牟”;(12)、“”,如“业”;(13)、“”,如“”;(14)、“”,如“”;(15)、“”,如“欠”等等。这种取特证法特别适合于片旁部首或字母的检索。该类特征也可以变为形状相似性规则。
注所有形状特征的特征的线条端点必须是标准笔画的端点或多个笔画的交点。用户提供的特征块的线段或拐点必须满足上要求。时空广义特征1、时间广义特征。
a、用于描述特征提取的时间序列,笔画次序b、用于描述规则相互作用次序的时间序列。
2、空间广义特征。
a、描述字符部位的空间特征,如朝上、朝下、朝左、朝右、…字头、…便旁等。
b、结构的空间特征,如上下型、左右型、内外型、单体型、复合型等等。当以连通性划分部件时,这些特征是精确的,当把这些连通部件组合成片旁部首等后去判别时,就可能出现同一字符可以属于不同类型的多义现象。
c、描述提取特征的方位及次序的空间特征,提取特征的次序如下(1)、依书写的笔画顺序或依书写的笔画逆顺序;(2)、一从上到下或从左到右的次序或从左上到右下、从右上到左下的次序;(3)、顺时针或逆时针的次序;(4)、从外到内与从内到外的次序;(5)、由前几种次序的组合。用户也可以自己给出一些异于上面的路线。比如用户先给出一小段线段,然后用鼠标拖着线段以用户自己的若干条线路线路和次序扫过字符,依次扫描到的笔画及其组合的位置次序即为提取的特征的路线,机器可以对路线自动记录并作容错化处理。提取特征的方位如下;左上、上中、右上、左中、右中、左下、右下、下中、内外。或由上方位的组合。在这里以采用某种坐标法定位,如汉字九宫格、米字格等方法定方位,有时从某一方位看去可以提取多于一个的特征,此时可以把这多个特征赋于不同的模糊值以便区分。
d、形态特征观测方向,一般只需八个即可,即东、南、西、北、东南、西南、东北、西北。
如前说明书中所讲的那样我们可以把字符的结构方位用手或辅助物的自然方位直观地表示出来。因此实际上我们一般情况下不需要规定取码顺序。即我们可以采用任意自由取码法。
规则广义特征,规则是建立各特证间关系的原则1、对非规则与非时空广义特征集分类与建立相互之间检索关系的规则。
A、近似关系规则,分音近似与形近似,相似的特征可用于分配到同一个表记手印上以便助记,如读音声母类似、偏旁、部首与用户自定义形状特征近似分类法。近似性原则如下(1)、上12类精确特征子集中的特征相似;(2)、名字相同的特征相似;(3)、声母相同的特征相似;(4)、形状相似的特征相似;(5)、含义相同的特征相似,含义比如草字头是植物草的象征,三点水是水的象征等等。
上第4条关于形状的相似是一十分复杂的问题,我们需要从简单到复杂从精确到近似给出一批原则。(1)、笔画相似,如横与提、点与提、点与捺、折与折弯钩等;(2)、带点与不带点类似,如宝盖头与宝盖头上缺点(平宝盖)类似;(3)、竖与斜类似,如“丨”与“/”,“\”类似;(4)、单交叉类似,如“×”与“+”;(5)、多交叉类似,如“≠”与“卄”;(6)交叉与相接类似,如”卄”与“丌”,“П”类似;(7)、封闭与半封闭类似,如“口”与“[”;(8)封闭与封闭类似,如“□”与“△”;(9)、旋转类似,如“
”与“”(10)、包含类似,如某一特征含于另一特征中,且所占的笔画数过半或所占的空间过半,则类似,如“凵”与“凶”;(11)提与撇类似,如“刀”与“刁”(12)、凹凸性相同的类似,有上类似、下类似、左类似、右类似等,分别如“”与“立”,如“丌”与“卄卅”,如“口”与“匚”,如“O”与“D”;(13)、多点与少点的类似,如两点水旁与三点水旁的类似;(12)、短笔画与长笔画的类似,如短横与长横、如“上”与“土”的类似。
同一对形态特征可能同时满足多条相似规则。每一条类似规则的反面是一条不类似规则。当用相似性规则所得的子集太大时可以用不相似性规则把它们分小。为了按键的特征子集便于记忆,我们常常需要对特征依相似性原则分类。注特征与规则、近似与精确是相对的,也就是说从不同角度看就会有不同的结果。比如上述各条近似规则完全可以变成准确的特征,只要对它们每一条安立一种表示形状或名字即可,比如第三条取名“非横”即变成一条精确特征,第五条取名“相连”也如此。指出这些辩证关系的目的是为了增加用户自己编码时可选风格的余地。与特征一样规则间也有丛属、相交、互斥、转化以及相互组合关系。
B、检索关系的规则是精确的关系规则主要有读音关系以及组合件与其部分的关系,我们在这里强调双向关系是因为检索是双向的,从部件可找到组合件,从组合件也可以找到部件,比如从偏旁部首可以找到字从字可以找到它的便旁与部首,这样把某一特征子集与某一组合特征如字相联系,如要把该特征子集赋于某一标记手印,则可以把该字作为助记,检索关系反应了特证间的从属关系。如果一特征子集在一定的按键拍数内能找到一大字符集中的每一个字符,则该特征子集称为该大字符集的精确定位特征子集,如仅能找到大字符集中大小不超过“n”的子集则称为“n”近似定位子集。检索关系的规则中还有一种关于字符或字符串开始或结束以及规定开始与结束间每拍的含义以及形状特征取码的路线的规则,称为取码规则。
2、关于规则运用的规则。上规则在运用时必需依照一定的规则,其目的是a、判定规则间相互关系的规则,规则间相互关系有无关、互斥、丛属三种。b、规定规则的使用次序以形成编码的风格;c、限定规则使用的限度,比如近似规则反复使用可能会出现使所有特征都相似的结果,故要限定其度,最基本的度是对相似特征集大小的限制。由于采用了广义特征的理论,使字典、句子、字、字的形特征、字的音特征、字的义都统一起来互相可以检索,它们间的关系可以视为是一种网的关系。从而用户的编码风格可以从广义的征集合的不同视角、特征规则的使用次序与限度以及取码规则反映出来。所谓视角就是编码者对近似规则的取舍及使用方法、特征集的取舍与对特征集的可视与隐含(可视部分由与按键相联系部分与检索结果部分两部分组成,隐含部分为检索中间过程中涉及的特征。)部分的划分以及对特征含义的理解有关。同一按键上不同编码所用的特征可以以不同的模糊值档区分开来,同一档内是同一编码的特征。第一档就是现在所用的编码。要改换编码只要换模糊值的档次即可。如要在使用过程中使用统计学习,只要把感兴趣的部分模糊值增加,不感兴趣的部份减少即可。编码的好坏与学习时的所需记忆量、平均输入一个字符的按键拍数与所需推理的量三大因数决定。比如所需推理的量由下决定(1)、从音到形推理量为0.5;(2)、从形到形的推理量由式(1-形状的相似度)决定,形状的相似度对旋转时小于0.5,在别的近似时为0.5到1。
有了评价函数,当用户给出了广义特征集后,我们就可以让系统自动枚举各种编码方案,并从中筛选出优秀编码。
如大字符集为汉字,则可以分解为笔画与部首。
笔画举例点、横、竖、撇、捺、提、折、钩。
折、钩带拐点可以视为由两笔划组成。
部首检字最早起源于东汉许慎编撰的《说文解字》,已有近两千年历史,它采取了以“部”相从的收字原则,把9543个汉字分成540个部首,首创了部首分类法。清张玉书等编撰《康熙字典》,突破了《说文解宇》以字义为依据的原则,改为以字形的笔画多寡为序,把540个部首较合理地归并为214个部首,是汉字发展史上的重大贡献。旧版《辞海》214部,1979年新编《辞海》250部,其中简化部首25个,附列部首22个,实际为203个。1978年《现代汉语词典》设188部。1979年《新华字典》设189部,它裁削了《康熙字典》中的58个部首,增列了19个简化部首,形成了一个共189部的反映汉字形体演变的部首体系。王竹溪的《新部首大字典》完成于1980年,它重新整理《康熙字典》,加人简体宇,共收字5万余,是国内第一部只按部首排列的大汉字集。1983年国家文改会、国家出版局颁布的《汉字统一部首表》(草案)设201部。
由于我们的编码采用模式识别作为辅助手段,偏旁部首可以任意增减,我们也可预装一些部首与部首名,如把1979年新编《辞海》250部或国家出版局颁布的《汉字统一部首表》(草案)设201部预装入输入方法,让用户根据自己的需要去增减。
一个好的自动编码辅助系统必须让用户的工作尽可能减少。主要的工作都在形状特征的提取与编码上。我们的模式识别系统能够自动把字分解为笔画、由笔画连成的连通部份、片旁、部首以及它们于九宫格或米字格等坐标系中的方位,并能自动与语音等信息联系建立笔画、连通部份、用户提供的特征、部首与字之间的多级检索表。这样当用户给出了某部首的主特征或起笔或未笔或读音后,系统即能把有关部首选出供用户挑选。
3.2按键上信息分布与全息编码技术当手印键盘用导电体制作按键时必须有两个以上的导电片相互接通才能表示按键被按下。这可以视为普通按键的特例,只要把某一导电片视为无意键仅起按的作用即可。对普通按键如把可按之处都视为按键的话也可以视为必须两件按下才能有按键下按信息,此时即与导电片按键一样了,故以下的讨论中我们都假定按键为导电片式的。
如果我们从人体工程学的角度看一下双手,我们的双手、双手的十个手指、手指的上下部位、手指的背与腹等,可以很自然地表示汉字的上下、左右、内外方位,或区分一些特征类,如形与声、声母与韵母、音与意等。还可以很方别的打出很多极其形象的手印去表示一些简单的汉字偏旁。
在申请号为98100688.4的发明中的全息编码方法中由于允许代表同一特征的手印组的嵌套、相交与重叠,某键被按下时的含义可能需要由其它键的状态共同决定。这里按键的相互影响需要有两种方式存在,第一是对某一个特征子集中元素的筛选,称之为过滤,所谓过滤即当一些键被按下后就形成了一个状态手印表记,状态手印表记给出了一个特征子集,称为状态特征子集或过滤器,它对以后的按键起信息过滤作用。也就是当新的一键或数键被按下后新的状态特征子集由被按下的键的组合特征子集与旧状态特征子集之交,新集特征元的模糊值为两对应模糊值的某函数值,比如取极小值。第二是两个特征子集间的特征元素间的逻辑“与”形成组合特征。可能有人会讲如果把子集的元素也看成是子集,即把特征也视为带该特征的字符子集,则特征相“与”即为字符子集的相交,反过来相交也可以视为对模糊值的改变,因此与模糊逻辑的“与”也是一致的,故这两种作用都可以视为是过滤作用。但此时必须视为对两种不同级别(子集与子集的集合)的集合的过滤,因此还是有必要区分过滤与组合两种涵义。任意键处于静态时的含义有二种1、为过滤含义;2、为组合含义。这两种涵义决定了一键对它键的影响方式。一般来讲一个键与它键的配合后的过滤含义应该预先规定好,因为一般情况下作为状态的标记手印不会太多。也可以用拼合的方式生成,比如甲键的静态过滤含义为“部首”,乙键的静态过滤含义为“…名字的声母”,甲乙二键相合即为“部首名字的声母”。
用于组合含义的子集可以由单个的字母或声母或韵母或形状特征,也可以由带模糊值的多个元素组成。它也是传递性的。所谓某一时刻数键同时按下后的组合特征子集是指这些键的特征子集与这些键被按下前的旧组合特征子集间的模糊逻辑之与,如在这以前没有键被按下则仅为这些键本身的特征子集的模糊逻辑之与。比如两键的特征子集为{9a,0.2),(b,0.3)}、{(c,0.1),(b,0.5)},如在这以前无键按下,这时他们的组合特征子集为{(ac,0.1),(ab,0.2),(bb,0.3),(bc,0.3)},字母排列的顺序可以预先规定。模糊值可以用多种计算方法只要满足新比旧小即可。请注意我们这里的模糊是指按键模糊地代表其字集中的各特征,并非指特征的模糊。模糊集也可以用粗糙集(Rough set)代替,这两者的区别在于前者模糊值必须归一化,后者子集元素的值只起比较相对大小的作用,不需归一化,在这里我们可以把它们统称为模糊值。在过滤的作用下任意按键的特征子集随过滤器的不同分成若干子集,比如同样是声母,随过滤器的不同分为笔画的声母、部首的声母、字的声母。特征子集中的特征本身也可以是组合的特征,比如“名字声母为R,起笔为横”这样的特征即为组合特征。
这样同一键肩负有两种作用,带有两种集合1、起过滤的集合“交”的作用,通过状态条件集合完成;2、起形成组合特征的“与”作用,通过组合条件集合完成。无论是相“交”还是相“与”都要定义一种全集的概念,起单位量的作用,与全集相交或相与后保持集合本身不变。这样有的键可以专门起过滤器的作用称为状态键。有的键专门起特征组合的作用,称为组合键。无论是起过滤用的状态特征子集与起组合用的特征子集都可以带上模糊值表示隶属度。不过前者主要是精确集。
如前所述在申请号为98100688.4的发明中的全息编码技术中同一字符特征用一组表记手印表示。手印组可以嵌套,相交与重叠。相交与重叠表现了一种特证间逻辑与的关系。这种相交与重叠性一般通过组合的特征子集的传递表现出来,当然也可以用静态的方法给某些键的组合特征子集赋予与逻辑“与”相连的组合特征来实现。嵌套时内层组同时也代表外层组所表示的特征。相交或重叠时公共部分的标记手印可以代表多个字符特征。当组内表记手印数减少时,由于全息性不会影响某种字符集的编码方案,仅会影响对字符集的定位精度。比如特征1同时赋予a、b二键,特征2赋予b键。这时a键的特征子集为{1},b键的特征子集为{2,1^2,1},b键的三个特征通过模糊值的不同来区分,当a键减少时仍能找到1但定位精度降低。
通过使各按键所带的非规则特征子集相交不为空的方法我们能实现全息编码技术。在按键与特征子集分配中,有时我们还须引入一个新概念,比如有一批键的特征子集中既有字母又有数字,当按下某些状态表记后,我们要使其中一些键变为字母键另一些变为数字键,也就是说过虑器在不同的地方能起不同的作用。但由于状态特征子集只有一个故无法完成该工作。为此我们需要引入状态地图的概念。所谓状态地图是个计算特征的特征值的一个函数,它的输入变量为按键所属的区域与特征值两个,输出为输入特征的新特征值。系统隐含的状态地图中新旧特征值是相等的。
由于手印键盘的按键数可以任意增减。按键越多信息容量越大,理论上对大字符集可以建立起一一对应,因此录入速度理论上可以达到一拍一个字符,但此时对熟悉键盘所需记忆的信息也会增大,同时操作时误差的可能性也大,配戴也麻烦一些。因此有必要给出一个让特征字符集在按键很多条件下分散(最多时两手可以有一百多个键,分布于指尖、指腹、指关节、手背、手心,加上辅助物的多个面,可以打出数万个手印。)在按键减少的条件下收拢的方法(按键最少时可减少到仅有若个手指带键)。从有按键的物(左右手、辅助物)到物的区域(如指尖、指腹、指关节、手背、手心等)部位到按键形成了一个地理成次。把按键通过地理层次分类可以帮助联想增加提示信息。全息编码技术的关键有二1、可相互嵌套的特征子集与大量的易于打出的手印标志的易记易用对应法;2、按键减少时的收缩法。
前面讲的十二类非规则非时空广义特征子集类中,用户只要给出一些自定义的形状特征或一些少见的笔画、部首外,大部份子集类系统都已预先给出,它们的父子关系与同类关系也可由系统预先计算完毕。自定义的形状特征中可以有关于书写的动态特征如起笔、未笔、中间笔等,也可以有根据九宫格等坐标系而定的方位特征,还可以有统计特征如带一横、带二横、带多横、带一竖、带多竖、带多交叉等,用户甚至还可以给出连通性与一笔画等信息。这些都是从汉字图像或矢量特征中很容易用模式识别的方式自动提取的。我们将给出一个辅助界面允许用户动态地画出特征,对近似规则用户需要枚举相互近似的元素或给出某些可变部位的变化范围。用户给出这些特征与名字后,系统能自动计算所有特征间的各种关系。
那么手印标志的硬资源可有哪些呢?按键可以分布于大拇指的指尖、指腹(第1与第2节各一个)、指侧(第1与第2节各一个)、指背或指关节上;在其余的各指上,指尖上有一个按键,指腹、指侧与指背上每一指节都有一个按键,于各指节的关节背上也可以有一只按键。这是指上全部按键装满时的情况。实际使用时用不了这么多的按键,可大为减少。比如于大拇指上仅保留第一指节处的若干键,食指上指背处的键可减去,其余各指只要保留第一指节上的键即可,第一指节上的键甚至可以减为只留下一只。
一般讲字符很多时输入一个字符需要取多个特征才行。假设对某一字符集输入一个字符需取a、b、c三种特征,每种特征各有n、m、l个分量,当按键数大于nxmxl时,可以采用如下全息编码法,把按键分为n个大区,每个大区分为m各小区,每个小区l键,分别分给三种特征。当按键数小于上数时就必须用状态标记手印区分三种特征。
按键减少时的收缩法如下如某一特征已分配到若干手印标志上了,当某键减少时如至少还剩一个手印标志,显然此时不会影响输入,反之需要把该键上所代表的特征子集移向它键。特征子集转移的方式有三种1、向邻近键转移;2、子集中各特征向其同类特征合并(如日与曰等);3、子集中各特征向其父类特征合并,所谓父类特征指比该特征意义更广泛的特征,如起笔为横的特征就比“王”字特征意义更广泛。如是状态标志按键减少,
按键可以从位于手上的地理位置分为若易记的区域,比如左右手、母指、中指、食指、无名指、小指、手心、手背、第一指节、第二指节、指腹、指背、指侧等。其次挑选适合于作状态手印表记的按键。一般讲大拇指的指腹或指端键与同手的手心或指腹或指侧的键配合当状态标记手印最好,当然也可以用左右手配合的方式,即一手先按下一些键作为状态表记,以控制另一手上的按键含义。大拇指每按一键其余各指的按键上显露出的特征含义也跟着变化。状态标志可以多重嵌套。尽管状态手印是传统键盘的“ctrl-、Alt-、shift-”等复合键的延伸,但是在传统的键盘上要同时按下两、三键是不容易的,而在手印键盘中却很容易,故我们需对状态手印的功能作详细的描述。一般讲状态按键与状态按键的操作的含义是用户必须给出的。其余的分配机器可以根据已计算好的特征子集间的关系自动分配。用户不满意以修改。因此整个编码过程是非常简单的。
总结上面所说,用户在生成自己的编码时只需做如下工作1、给出自己的特殊形状特征及名字(名字用于从拼音到形状的检索,一般为读音的声母)用户也可以在给出特征时同时限定其在字符中的部位,如“位于左部的耳朵旁”等;2、定出分配到按键上的特征子集;3、定出起过滤作用的状态子集和状态标志按键;4、设立近似规则并利用系统提供的工具对按键进行状态特征子集与组合特征子集的分配;5、用户给出自己的取码规则,如用户对已有的标准取特征路线不满意时还须给出用户自己的路线;6、当用户对系统自动给出的特征检索关系不满意时可以在系统使用前或使用中随时修改(由于特证间的从属与相交等关系的存在与近关系的原因,一个字划分为特征部件的方法常常不唯一,故对多种检索关系要确定其取舍或主从)。系统能对用户的编码自动计算定位精度并于必要时提出修改意见。
3.3一些具体的编码方案手印键盘的最大特点是可以有大量的状态表记手印与直观形象的表记手印。下面用非形式的方式给出一些标记手印。具体的编码方案中可以从中选取若干种。
3.3.1、字符集选择状态表记手印a、字母输入表记手印;b、数字输入表记手印;c、拼音输入表记手印(可进一步区分声母与韵母手印);d、字符的形码输入表记手印;e、字符输入开始或结束表记手印。
注取码规则利用上手印可以形成两种风格…固定式与自由式。固定式时,规则必须规定输入一个字符或字符串时特征子集种数及次序乃至输入一个字符所需的拍数都可以固定,比如先输入读音的声母,第二输入为起笔、第三输入为未笔,来定义一个汉字的输入。自由式时,特征子集种数可以不定,但是现在按下的输入的是什么(比如是读音还是形状)需要由状态特征手印确定,有时还需要有手印表示字输入开始或结束。如c、d可以实现音形混合输入,即当下输入的是音还是形可以通过c、d来分辨。在词组方式输入时c或d是否按下可以用于表示词组或字的输入开始或结束,前面说过字的结构可以通过按键的位置或辅助物的位置表示出来,由于同一字某一位置只可能有一个字符特征,我们可以通过规定同一部位输入的多个特征依次属于以后的字的方法来实现自由输入,即在词组输入时我们可以对字进行并行输入,只要我们所需的词组出现即可停止输入,加上自学习方法该自由式输入可使词组输入很快,在声母与韵母可以被区分时对声也可以实现并行输入,甚至还可以有声、形混合式并行输入。对词组的并行输入的另一种方法是用多个辅助物,比如左右手各一个,分别代表词组的第一个字与最后一个字。简化起见c、d也可以合并为一种,如汉字输入表记手印。同样对刚才输入的错误部分可以设置相应的删除手印删除。并行输入时需要有对输入特征的并行删除手印。并行删除法举例按下并行删除状态表记手印,只明字结构的部位或声韵母,指明删除地几个字的特征。在某些编码方案下需要设置词开始表记手印。
3.3.2、控制表记手印手印键盘的出现使热键控制变得容易,同时也变得更重要了。一般情况下需要设置控制状态表记手印,在该手印按下以后,所有的按键操作都起热键控制作用。举例如下a、Del、Ins删除操作;b、Pgup、pgDn换页操作c、Backspace操作;d、Home、end操作;e、Alt-w操作f、Ctrl-Tab操作;g、光标控制(鼠标操作)操作;h、画笔控制操作;i、Ctrl-c、v、w,o操作。
3.3.3、模仿汉字部首的形象手印举例如前所述按键可以分布于大拇指的指尖、指腹(第1与第2节各一个)、指侧(第1与第2节各一个)、指背或指关节上;在其余的各指上,指尖上有一个按键,指腹、指侧与指背上每一指节都有一个按键,于各指节的关节背上也可以有一只按键。
设指尖键表示“点”,指背键表示“竖”,指腹键表示“横”,指背关节键表示带弯的笔画(弯还可以分为左弯、右弯、带拐点与不带拐点四种),双边指侧分别表示“捺”与“撇”。
米字格、九宫格等的辅助物的横或竖部位的按键也可以表示横或竖的信息。
a、“口”同手大拇指的第一指节指端键按食指的第一指节指端键b、耳朵旁与尸字旁,同手大拇指的第一指节指端键按食指的第二指节腹键当食指的第一支节背键去按它键时为耳朵旁,侧键去按时为尸字旁;c、草字头或多竖与少横交叉,一手食指与中指的第二指节腹键去按另一手食指的两背键;d、绞丝旁,一手食指二腹键去按另一手食指与中指的指关节键;
e、撇、捺交叉,一手食指第二指节侧键按另一手食指的第二指节侧键;f、人字旁,一手食指第一指节侧键按另一手食指的第一指节侧键;g、少竖与多横交叉,一手食指与中指的第二指节背键被另一手食指的两腹键所按;h、刀字旁,一手食指第一指节侧键按另一手食指的第二指节侧键;i、厂字头,一手食指第一指节腹键按另一手食指的第一指节侧键;j、提手旁,一手食指第一指节腹键与中指的第一指节侧键按另一手食指的两背键;k、日字旁,同手大拇指的第一指节指端键按食指的第一指节指端键,同时另一手的食指第一与第二两腹键去按该手大拇指与食指的第二侧键;l、月字旁,同手大拇指的第一指节腹键按食指的第一指节指腹键,同时另一手的食指第一与第二两腹键去按该手大拇指与食指的第二侧键m、自字旁,同手大拇指的指端键按食指的指节腹键,同时另一手的食指第一与第二两腹键去按该手大拇指与食指的第二侧键;n、竖心旁,一手食指与母指的指端键按另一手食指的第二指节腹背二键,o、母指、食指、中指、无名指、小指分别代表“母”字旁、“食”字旁、“中”字部、“无”字部、“小”字部。
对大小写字母也可以用类似的方式用形象特征检索,取的形象特征可以是字母的关键部份,所为关键部分是指某字母的特征足以区分它字母的部分,比如“A”可以只取“∧”就足以区分其它字母,“B”有两个封闭的圈,“C”有一个右开口的弧,“E”有三横一竖,“D”有半弧加一竖,“F”有二横加一竖,“G”有一个右开口的半弧加一小竖,“H”有二竖加一横,“J”为一竖钩,“I”为一竖,“K”一撇一捺,“M”带一双“∧”一个和“∨”,“N”有二竖一捺或带一对“∧∨”,“O”为一圆,“Q”为一“O”加一点,“P”为一圆加一竖,“Z”为二横加一撇或带一“<”和“>”,等等。同样可以由形象手印描述或由起未等笔画方式描述。比如大写的“A”由“∧”加一横组成,可用一指的指关节键按另一指的指腹键代表等等,也可以用起未笔画,比如一手表示起笔,另一手(也可以是辅助物)表示未笔,通过两手互按输入字母。
3.3.4、绘画手印;a、放大镜手印;b、移动画面手印;c、笔与换笔手印;d、调色手印;e、橡皮手印;手写输入手印(用于用户自定义形态特征或在某些片旁、部首的按键输入法遗忘时作为临时辅助输入或用于OCR手写输入。
33.5、若干不同风格的编码方案1、左右手分别放韵母与声母,笔画的分配如上(也可以用部首或片旁的声母),可以用拼音输入或形码输入或形声、声形输入,也可以在表示字符的结构的辅助物进行配合下输入;2、仅单手的母指、食指与中指带键,母指按食指与中指的侧键、腹键或指端键为状态标志,如中指与食指各带十键,当中、食二指中有一指与母指相按后另一指既可以去按辅助物,状态标志至少有八十种足以放下任何编码方案
3、一手的拇指、食指、中指、无名指的指侧、指腹、指背、指尖、指关节都带键,食指、中指、无名指共有九节指节正好与九宫格的九个格对应,同一指节上的腹、背、侧键与另一手的按键配合可以表示笔画、部首、拼音等,另一手可以仅一食或中指带键,或再加一拇指用于形成状态标志。
4、左右手的拇、食、中、小四指都带键。拇指的第一支节带指端、指侧、指背键,食与中指的一、二指节与关节带键,小指仅指端带键,先打出模仿汉字部首的形象手印,再用小指去按辅助物的某一部位表示该部位有某部首,不断重复这一过程直到所需字符出现,也可以不断打出模仿汉字部首的形象手印,表示依书写次序排列的的部首,直到所需字符出现。
5、利用九宫格状的辅助物格子的横竖条上的键表示笔画“横、竖”,格子的角上的键表示笔画“弯、勾”,手指的第一指节的腹、侧、背与指尖分别表示“横、(撇、捺)、竖、点”,当手按辅助物时,如是同类相按,比如指腹按辅助物横条,则表示某部位有该笔画,如是异类相按,比如指腹按辅助物竖条,表示两种笔画相交。手指的个数可以表示笔画数。
6、根据广义特征理论笔画、片旁、部首、字母、字、词可以看成同一类的事物,都可以用同一种方式输入,只要能用状态区别它们即可。因此我们可以把手上的部位分为多阶区域来完成全息编码。在用形特征的输入时,比如我可以把五种笔画(点、横、竖、撇、捺)当作基本特征,依书写笔顺,取第一笔画,第二笔画,未笔或第三笔,当有多于125键时可以让每键都代表一类片旁、部首或字符,当按键数不足时需用状态标记手印,同时配合辅助物的方位进行输入。
7、双手带键。一手按键的特征子集为形状的结构特征,如笔画、偏旁或笔画等的交叉情况、连通情况等,另一手的特征子集为字符的方位特征。双手配和输入字符。
8、双手带键。一手按键的特征子集为形状的结构特征,如笔画、偏旁或笔画等的交叉双手带键。一手按键的特征子集为形状的结构特征,如笔画、偏旁或笔画等的交叉情况等,另一手的特征子集为语音特征,比如字符读音的声母、方位读音的声母等。
权利要求
1.手印键盘,部分按键可分布于辅助物上,其特征在于辅助物可制成画板、九宫格等,辅助物的几何方位与特征可以表示字符的方位与结构特征。
2.如权利要求1的辅助物制成画板时,其特征在于按键以点阵方式分布,按键用软质导电体制成时按键与辅助物的接触面积与压力有关,用以模仿毛笔等软头笔。
3.如权利要求1所述的手印键盘,其特征在于采用图像摄录仪感知按键的图像标记,则标记感知器采用手持式微型专用带光导纤维的图像扫描仪或数字相机,并能与OCR文字识别连为一体,并能感知可移动的颜色或发光标记用于当鼠标或画笔。
4.从按键的操作序列集到字符集的映射方法采用模式识别技术辅助的广义特征全息理论其特征是字符、字符的特征(形、声、意)以及规则同属于广义特征,它们之间可以相互辩证转化,编码的风格从广义的特征集合的不同视角(主要为分配于按键上的状态特征子集与组合特征子集)、精确特征规则的使用次序与近似规则使用限度以及取码规则反映出来。
5.如权利要求4所述的映射方法,其特征在于模式识别技术能对字符自动分解字符的笔画、连通部分、部首、用户提供的特殊特征及其方位,还能根据用户要求的角度与路线提取特征。
6.如权利要求4所述的映射方法,其特征在于在字符的输入时采用能形象代表字符组成部件之形状特征的标记手印。
7.如权利要求4所述的映射方法,在大字符集输入时可采用自由式取码法,其特征为通过选择字符集状态表记手印,字符输入时按键拍数与含义可以临时指定而不必完全预先规定,同时在词组输入时各词的特征可以在一定程度上并行输入。
8.如权利要求4所述的映射方法,字符的方位特征如九宫格方位可以由按键于手上的位置或辅助物上的位置表示,其特征为同一位置上可以有代表多种笔画的多个按键,通过主动与被动按键的配合可以表示出该部位上的笔画交叉情况。
9.如权利要求4所述的映射方法,字母的输入采用形态特征助记,其特征为助记的形态特征可以是字母的关键特征也可以是书写的笔画。
10.如权利要求4所述的映射方法,具有手写输入手印,能实现键盘输入与手写输入字符一体化,其特征为既可以用按键方式输入字符同时也可以通过手写字符以OCR方式输入字符并且可以随时添加按键输入时所需的片旁、部首。
全文摘要
本发明对申请号为98100688.4的发明的手印键盘进行了改进,使其增加了画笔功能,并详细论述了一种采用模式识别技术辅助的广义特征全息理论,它能极其方便地辅助人们对大字符集进行不同风格的编码。字符、字符的特征(形、声、意)以及规则同属于广义特征,它们之间可以相互辩证转化,编码的风格从广义的特征集合的不同视角、分配于按键上的状态特征子集与组合特征子集、精确特性规则的使用次序与近似规则使用限度以及取码规则反映出来。还提出了一些极具手印键盘特点的编码方案。
文档编号G06F3/02GK1199886SQ9810210
公开日1998年11月25日 申请日期1998年5月7日 优先权日1998年5月7日
发明者胡宏 申请人:胡宏
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1