多语种字词信息处理系统的制作方法

文档序号:6439442阅读:174来源:国知局
专利名称:多语种字词信息处理系统的制作方法
技术领域
本发明涉及多语种字词信息处理,特别是韩语、日语、越南语、蒙古语等等多语种字词信息处理系统,包括音(象)形演义系统、字词编码和字词处理器等。
背景技术
韩语、日语、越南语、蒙古语等等语种,语种不同,文字体系各异,字词信息复杂。通常,人们对字词的教学,对事物的认识,主要是通过人工方式进行的。人们逐个地、机械地记忆字词,至于事物有什么特点,语言、思维与事物是怎么联结的,一般并不领会。且现有的电子词典等学用工具,往往只是传统纸质词典的电子化翻版,并无新的信息处理体系。这使得人们对事物的认知和对字词信息的学习,既肤浅,又艰难。如何借助计算机等手段,在基本的语素或词素层次音形兼备地反映事物的基本特征,建立并显示语素、词素、词语和客观事物的逐级联系,并进行字词(包括不同语种或文种的字词)的信息处理呢?
发明内容
本发明的设计是以基本的音象元素(语音—现象单位)和形元素(形体类别和模型)为基础,以“事物(字词)=音(象)+形”为结构,借助图象、音响、计算机等手段,成片成族、音形兼备地进行韩语、日语、越南语、蒙古语等等诸语种字词信息处理,并演绎故事或游戏。


图1、图2表示基本的音象元素,即基本语音及其对应的现象单位——现象图或现象模型。图3表示形元素,即表示事物基本形体(包括质地、性状)类别的图象或模型。图4为音(象)形演义系统的一部分以音(象)族系和形元族系共同组成音象形族系,借助计算机多媒体系统,“以形演象”——以形模型作“演员”表演音象族系所揭示的事物或概念的现象特征——可谓“惚兮恍兮,其中有象;恍兮惚兮,其中有物。”(老子《道德经》),音(象)形具备地演示事物的普遍联系与区别。图5、图6为字词处理器示意图。
具体实施例方式
下面主要以韩语为例,作详细说明音(象)形演义系统一、基本字符(字母)。以拉丁字母或某民族字母(如韩文字母、日文假名、蒙古文字母等等)作为系统的基本字符。
二、音(象)元素。世事纷繁,但不失基本的现象特征。分析语言的语音和事物的现象特征,确定最基本的语音与现象单位,并将现象特征与语音挂钩,音为象的音值或名称,象为音所“鸣唤”的内容。这种语音与现象特征彼此对应的基本单位,称为音(象)元素。音(象)元素可以确定在音素层次,也可确定在音素组团层次。将音(象)元素制成图象、模型。参看图1。
根据音(象)元素的内在特征,可将其排成图谱,同行列或邻近行列的元素具有相似性、渐变性,显示出周期变化的特征。
基本的音(象)元素可以逐级合成音(象)素组,犹如原子团,如图2。
三、形元素。一切事物都有其赖以存在的基本形体(包括质地、性状等)。如吃、喝、哭、问等赖以存在的形体是“口”,父、兄、子、弟等赖以存在的形体是“人”,高、豪、亢等赖以存在的形体(性状)是“大”。确定世间万物赖以存在的形体(质地、性状等)类别,称为形元素,将其制成形体模型,并分别用字母表示,字母与形元素“一一对应”。见图3。
根据需要,形元也可进一步向下作明细分类,如动植物种类的明细分类等。
四、音(象)形演义1、音节(现象)族系图。以音(象)元素为基础,制作音节(现象)族系图,显示音节所揭示的各事物(词素)基本的、共同的现象特征。
2、形元族系。将形元(形模型)按一定顺序排列成形元族系。
3.音(象)形族系。将音节(现象)族系图作为平面坐标系,形元族系垂直于音节(现象)族系图。在音(象)坐标与形元坐标的交点,显示具体事物(字词)。即事物(字词)=音(象)+形。(记作“音.形”或“音形”形式。) 其中“音”为表音字母,揭示事物的现象特征;“形”为表形字母,表示事物的形体类别。
在音象形族系(图谱)中,音(象)坐标系显示事物的名称(字词的读音)和事物基本的、共同的现象特征;“形”则体现基本现象体现在什么形体上,表示字词所代表的事物赖以存在的躯体;音(象)与形的不同结合,就体现不同的事物、不同的字词。
4、音(象)形演义。在形元坐标与音(象)坐标的交点,形元(形模型)“表演”音(象)特征,显示事物(概念)的图象、声音、特征、意义等。若用f表示音(象)的合成规则,“*”号表示表演,则有函数事物(字词)=f(象元)*形元。
现以hon音节(词素有昏、婚、混、魂等)为例,作进一步说明。参看图4。
(1)、音(象)合成分别以 合成“hon”的现象图,即音(象) =h(化合)+on(吻,叠合)=“吻”似的化合、会合,水乳交融状,分不清。
(2)、“象-形”演义将形元族系的各有关形元与hon结合,并以形模型“表演”hon的特征——演示本音节各个事物的特征,显示词素的音义魂=hon.c=h(化合)+on(吻,叠合)+c(鬼) =昏暗的、如云似鬼的幻觉;与形体或分化或吻合的精神。昏=hon.h=h(化合)+on(吻,叠合)+h(日光) =日落前后,明暗“吻”似的化合、混合,分不清。
婚=hon.n=h(化合)+on(吻,叠合)+n(女人)
=男女“吻”似的化合、结合,合为一体。混=hon.s=h(化合)+on(吻,叠合)+s(水) =水与什么化合、吻合,分不清。
hon(“吻”似的化合、会合,犹如水乳交融状,分不清。)揭示了事物基本的现象特征,是本音节的灵魂。这些现象特征体现在“h(日)”、“n(女)”、“c(鬼)”、“s(氵)”等不同的形体上,即为具体不同的事物,从而成为不同的词素……可谓“惚兮恍兮,其中有象;恍兮惚兮,其中有物。”hon天生不是“昏”、“婚”、“魂”、“混”等,但是hon(“吻”似的化合、叠合,水乳交融状,分不清。)揭示了它们天生、共同的现象或特征;形元则揭示它们不同的形体类别。
5、以基本事物(词素)作为坐标族,建立反映一切事物和一门语言全部词汇的坐标系。在这一坐标系中,事物或词语=N维词素族系的交点。如魂魂灵、魂魄、魂怯;昏昏倒、昏迷、昏睡;婚婚期、婚姻、婚家;混混战、混棉、混纺。
6、表演剧情借助数学和计算机等工具,合成剧情。例如由现象s(§)——伸缩,an()——丫状分合,可合成“扇”(san)的现象特征图 用形体 (手)“表演” (扇),就可得到 再由事物 (他)、) (耳光),还可合成“他搧某人的耳光”这样的“剧情”来。
上述音象形元素和各表系(图谱),配以图象、音响、计算机等手段,即组成了音(象)形演义系统。
事物(字词)编码韩语、越南语、蒙古语等等,语音本身揭示了事物的现象特征,但未揭示事物的形体类别,且往往一个音节表示多个词素,音节难以清晰地表示具体的事物或概念。以上述音(象)元素、形元素作为基本信息单位,对事物(字词)进行编码,从而简明而声形兼备地表征事物特征和字词内涵。
1、编码表达式事物(字词)=音+形。
“音”即上文所述的表音字符;“形”即上文所述的表示事物形体类别的字符。
将编码记作“音.形”或“音形”形式。对于越南语等有声调的语种,声调也可记在“音后形上”,即“音调形”形式。
如“昏”、“混”的编码昏=音(hon)+形(火光或日光-h)=hon.h;混=音(hon)+形(水-s)=hon.s。
2、编码输入。音码可直接用键盘输入。形码有下列处理方法一是通过“.形元字母”输入;二是通过在键盘上设置单独的“形元字母键”输入。对于越南语等有声调的语种,可按“音+调+形”结构输入,声调符号与“.”号简并,即在形码前不再输“.”号。
3、编码的使用。
编码可直接按照“音(语音—现象)+形(形体类别)”结构进行拼读、解析。如上文“音(象)形演义系统”中对hon音节各词素的解读。
编码可作为字词的体例之一——“形声字母文字”形式存在;对于用民族字母作为字元的编码,可将其转写成拉丁字母,以ASCII形式储存、处理、传输;与其他文字相互转换。
以本编码为基础,建立有关事物或字词信息(不同语种的字词、字体、编码等等)的代码。如“音(象)+形+0”的编码代表事物图像,“音(象)+形+1”的编码代表韩语,“音(象)+形+2”的编码代表对应的汉语字词等等。从而进行各有关信息的记录、传输、解析、检索、转译。
字词处理器一种字词处理器,它以上述音(象)形演义系统、字词编码为基础,相应于计算机程序运行,用于多语种字词的读写、解析、学习、使用。它包括输入装置、输出装置、存储控制装置、解析(翻译)装置、声音图象合成装置、音象形词典等部分。见图5。其特征是1、根据音(象)形演义系统,借助声音、图象合成装置,逐级合成字词的读音和字词对应的事物的现象特征和形体特征。
2、音(象)形词典包括目录单元、音(象)元素表、形元族系图、音节(现象)族系图、音(象)形族系、释义字典、事物图库、词典等部分。它们相互链接,构成一个完整体系。
3、以音(象)形演义系统为基础,对字词在语音、现象、形体等各个方面和各个层次进行解析,展示字词的构造、音义、族系,显示事物特征,供用户查询、检索、解析,帮助人们简易、快捷而深入地认识事物或概念,学习字词。
4、基于韩语、日本语、越南语、汉语等等诸多语种字词的对应关系,通过输入输出装置和翻译装置,将不同语种的字词句相互转换,将字母文字与方块汉字进行彼此转换,揭示音义流变、跨语种的联系等,供人们使用、学习、对照、交流。
5、以音(象)形演义系统,或字词(编码)——事物(音像)的对应关系为基础,设计游戏软件,寓教学于娱乐。
字词信息处理的流程如下(参看图6)。
步骤1,开始,启动字词处理器。
步骤2,功能设置,选择“解读”或“翻译”(为某语种)功能。
步骤3,系统读取并显示音(象)形族系。
步骤4,通过输入装置(键盘、光电设备等)录入字词信息(或字词编码),或选中某字词信息的电子文档。
(如果输入或选择的是“.表形字母”,则读取以该形元为形体类别的所有字词,并按音节族系顺序显示,供进一步选择;如果输入或选择的是“某表音字母”+“?”+“.某形元字母”,或“?”+“某表音字母”+“某形元字母”则读取并显示相应的字词信息;如果输入输入或选择的是某个音节,则使凡是可以与该音节组合的形元闪烁,提示进一步输入或选择。)步骤5,通过音象形词典的目录单元,查找、判断是否存在对应的字词。如果是,则进入步骤8。
步骤6,如果否,则提示“无对应字词”,并读取、显示相近的字词,以供选取(或重新输入)字词信息,进入步骤4。
步骤7,如系统设置为解读,从与目录链接的各单元中读取音(象)、形解析信息和音(象)形演义信息等等,或利用基本的图象和声音,根据句法,合成、演示“剧情”,然后进入步骤9。
步骤8,如系统设置为翻译(或在设置“解读”的同时设置了“翻译”),则将不同语种的字词句相互转译,将字母文字与方块汉字进行彼此转换,并提供译文的语音,然后进入步骤9。
步骤9,将上述信息输出、显示。
以音(象)形演义系统、事物或字词编码(与事物音像的对应关系)为基础,设计游戏组件(如“看图说话”、“演绎剧情”等),寓教学于娱乐。
“看图说话”的程序要领是程序随机读取并显示某类事物的音像,参与者说出(输入)相应的字词——事物的名称或类别等,程序根据是否正确计分,最后算出总分。
“演绎剧情”的程序要领是设置虚拟“演员”和“剧情”范围,参与者输入设想的有关剧情的字词,程序读取“剧本”中的字词,根据字词编码与事物音像的对应关系演示剧情。
本系统在一定程度上揭示了语言、思维和事物的联系,显示语言冥冥的命名中蕴涵的远古人类对世间万物的深入观察和思考。系统是人们认知事物、学习和使用字词、虚拟演绎的先进工具。对事物和字词的认识,不宜无规则学习,可借助本系统,成片成族、音(象)形兼备、寓教于乐地学习,将汉、韩、日、越、蒙等诸语种对照学习。系统提供了一条不学而用汉字的隧道——不经过方块汉字,直接使用汉字。系统还提供了一种直接使用民族文字“书写”、阅读外文的途径。
对本发明中音象形元素的名称、字母、范围、模型、图象的更改,键盘中字母和符号位置的调整,字词(事物)的音象形诸要素解析或合成级次、步骤、图文的修改都不会脱离本
权利要求
1.一种涉及韩语、日语、越南语、蒙古语等等诸多语种字词信息的处理系统,包括音(象)形演义系统、字词编码和字词处理器三部分。其特征是将字词和事物蕴涵的特征分解为若干基本的音象元素(语音-现象单位)和形元素(事物的形体类别),将“象”与“形”制成模型,借助图象、音响、计算机等手段,按“音(象)+形”结构,逐级合成音(象)形族系——表征事物现象特征和形体特征的族系,就象地球仪显示地球上所有的点及其位置关系,并“以形演象”(形体模型“表演”现象特征),显示字词音义和事物的特征;同时按“音(象)+形”结构组成字词编码;在此基础上,建立并显示语素、词素、词语和客观事物的逐级联系,进行字词信息的读写、解析、转译、传输、学习、使用,演绎虚拟剧情或游戏。
2.一种按照权利要求1所述的字词信息处理系统,其特征是包含音(象)形演义系统1)将世间万物的特征分解为若干基本的现象单位(象元素),将象元素与基本语音挂钩,赋予音值或名称,称为音(象)元素。音(象)元素根据其特征可排列成周期表。音(象)元素可逐级合成音(象)素组。2)确定世间万物赖以存在的形体(质地、性状等)类别,称为形元素,将其制成模型,并用字母表示,字母与形元素“一一对应”。3)以音象元素(模型)为基础,逐级合成事物的现象图,显示事物的现象特征。4)以音(象)元素为基础,制作音—象族系图,反映基本事物的现象特征;将形元(形模型)按一定顺序排列成形元族系,反映事物的形体特征;以形元(形模型)“表演”音(象)特征,合成、展示事物(字词)的图象、声音、特征、意义等。5)以基本事物(词素)作为坐标族,建立反映一切事物和一门语言全部词汇的坐标系。系统可广泛地用于事物的表征和字词的编码、拼写、解读、训诂、编排、检索、教学以及语言与思维关系研究,人机语言的设计等方面。
3.一种以音(象)形演义系统为基础的字词编码方法,其特征在于编码表达式为“编码(字词)=音(象)+形。“音”表示语音(兼表事物现象特征),“形”表示事物的形体类别。编码可直接按照“音(语音—现象)+形(形体类别)”结构进行拼读、解析。
4.按照权利要求3所述的字词编码,其特征在于形码有两种处理方法一是通过“.形元字母”输入,二是通过在键盘上设置单独的“形元字母键”输入。
5.按照权利要求3所述的字词编码,其特征在于编码作为字词的体例之一——“形声字母文字”形式存在;以ASCII形式储存、处理、传输;与其他文字或音像信息相互转换。
6.一种以音(象)形演义系统和事物(字词)编码为基础的字词处理器,包括输入装置、输出装置、存储控制装置、解析(翻译)装置、音象形词典、声音图象处理装置等部分。其特征是根据音(象)形演义系统,按“音(象)”+“形”结构,借助声音、图象合成装置,解析、显示字词所对应事物或概念的音—象特征和形体特征,对字词(及其对应的事物或概念)在语音、现象、形体等各个方面和各个层次进行解析;揭示不同语种或文种的字词的区别和联系,并进行彼此的转译;演绎虚拟世界,设计游戏软件。
7.按照权利要求6所述的字词处理器,其特征在于音(象)形演义。即通过“语音—现象”的对应,演示事物或概念的现象特征;通过形元素(模型)显示事物的形体特征;并“以形演象”(形体模型“表演”现象特征),揭示音(象)形的对立统一,揭示事物(字词)的族系特征、语言和事物的联系等。
8.按照权利要求6所述的字词处理器,其特征在于根据字词编码和诸语种字词的对应关系,通过输入输出装置和解读(翻译)装置,将不同语种(文种)的字词信息相互转换,揭示音义流变、跨语种的联系等,方便人们对诸语种(文种)的学习和使用。
9.按照权利要求6所述的字词处理器,其特征在于以音(象)形演义系统,字词(编码)和事物(音像)的对应关系为基础,设计游戏组件。
全文摘要
一种涉及韩语、日语、越南语、蒙古语等等诸语种字词信息的处理系统,包括音(象)形演义系统、字词编码和字词处理器三部分。其特征是将语言和事物的特征分解为若干基本的音象元素(语音-现象单位)和形元素(事物的形体类别),将“象”与“形”制成模型,借助多媒体手段,按“音(象)+形”结构,逐级合成音(象)形族系系——表征事物现象特征和形体特征的族系,并“以形演象”(形体模型“表演”现象特征),显示字词音义和事物的特征;同时按“音(象)+形”结构组成字词编码;在此基础上,建立并逐级揭示语言和事物的联系,进行字词信息的读写、存储、解析、转译、传输、学习、使用,演绎故事或游戏等。
文档编号G06F3/023GK1773489SQ200410092740
公开日2006年5月17日 申请日期2004年11月10日 优先权日2004年11月10日
发明者王金根 申请人:王金根
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1