表意文字数据库系统及其处理方法

文档序号:6563787阅读:210来源:国知局

专利名称::表意文字数据库系统及其处理方法
技术领域
:汉字,一种典型的表意文字,现在所知的有13万字或更多,确切数目不得而知。此外,在使用汉字的大韩民国、中国、台湾和日本,他们独立地使用自己的汉字。因此,汉字的标准化和处理存在问题。此外,即使存在这样一种系统,例如电脑或移动电话,能够将所有汉字数据库化和输入,但是在13万汉字中查找和输入想要的汉字不是一件容易的任务。迄今为止大多数已公开的汉字输入方法中,汉字都是根据部首、总笔画和发音进行输入。与每一个笔数/总笔画/发音对应的汉字也是不计其数的。由于只有当知道了笔数/总笔画/发音才能输入汉字,所以有这样的问题,与笔数/总笔画/发音对应的是汉字列表,输入的汉字必须通过选择才能输入。作为另外一种输入汉字的方法,有一种区分汉字部首并且根据汉字的笔画顺序输入汉字的方法。但是,根据每个汉字中部首的顺序检索相应的汉字时,在列表窗中进行显示和选择,与根据笔数/总笔画/发音的输入方法是一样的,显示在列表窗中的汉字也是根据笔数或总笔画的顺序排列的。所以,有这样的问题,查找要输入的汉字是很困难的。在列表窗中,将所述表意文字数据库中表意文字以预定数字分开以便分组,并且如果由每个分组的第一个表意文字组成的列表窗生成,而且选择了一个分组的第一个表意文字,就在列表窗中显示由属于该选中分组的表意文字组成的列表窗。所述表意文字数据库处理方法还包括第三步,提供用户数据库,所述用户数据库具有字段,字段由具有数值的、包含在所述表意文字数据库中的表意文字组成;第四步根据所述表意文字数据库中表意文字的排列顺序对用户数据库进行排列或者搜索。此外,本发明能嚢括部分或者全部在韩国、中国、日本等使用的汉字。[34有益效果图5表示喃字的实例;图7表示西夏字的实例。(4)~1(C):以此汉字部首开始的汉字包括,例如"巳,弓,民"等等。[55(5)L(D):第五笔画用此部首的"役"和第四笔画用此部首的"冗"。[56(6),(E):以此汉字部首开始的汉字包括,例如司、卫、力、习等等,和第五笔画用此部首的"危"。(14)"(L):以此汉字笔画部首的汉字包括,例如"爿,戕,胖"。[65(15)L(M):第二笔画用此部首的"儿"和第五笔画用此部首的"兄"。[66(16)^(N):第二笔画用此部首的"马"和第四笔画用此部首的"鸟"。[67](17)J(0):以此汉字部首开始的汉字包括,例如"水,小"等等。[68(18p(P):第三笔用此部首的"豕"和第二笔画用此部首的"狂,狭"等等。以此汉字部首开始的汉字包括,例如"收",和第四笔画用此部首的衣"。(20):以此汉字部首开始的汉字包括,例如"手,香,斤,爱"等等。(21)/:以此汉字部首开始的汉字包括,例如"牛,竹,色,父"等等。(22)丄:以此汉字部首开始的汉字包括,例如"发",和第二笔画用此部首的互",和第六笔画用此部首的"私"。(23)〈:以此汉字部首开始的汉字包括,例如"女,巡,災"等等。(24)J:以此汉字部首开始的汉字包括,例如"月,凡,川"等等。(25)、:第二笔画用此部首的人和第二笔画用此部首的"公"。(26)、:第四笔画用此部首的代和第五笔画用此部首的"民"。(27)、:以此汉字部首开始的汉字包括,例如"齐,斗,洗,羊"等等。(28),:以此汉字部首开始的汉字包括,例如"心,自,血"等等。按照上述每个汉字部首描述,不能作为简化汉字第一笔画的笔画数目是八个上述编号为(3),(5),(7),(15),(17),(18),(25)和(26)的笔画。当七千汉字(现代汉语通用字表,收字7000个,中国政府制定)按照上述区分后汉字部首的顺序依次排列时,它们被排列成以下顺序"一二三丰彗慧匡砉贰契挈,,.…"(跳过).….."煌熄熄燠炎郯剡众燊,,。表意文字数据库也能有助于用于输入表意文字。在表意文字数据库中,表意文字被以预先指定的数字被分开并且形成组。将各分组的第一个表意文字显示到列表窗。图2表示了7000个简体汉字按每100个分成一组,并且处理每个分组的第一个表意文字。也就是说,数字0分配给"一",数字100分配给"环",......,数字6900分配给"悯"。卯"表"的笔画顺序是一(A),一(A),l(K),一(A),/(S),……,并且在笔画顺序为」(A),」(A),l(K),z(Bl),......的"环"之前,数字100分配给了"环"。因此,可以看出"表"存在于数字O到数字99之间。换句话说,这是因为根据字母表顺序对它们进行了排列,AAKAS...在AAKB1...之前。表格l表意文字数据库结构实例<table>tableseeoriginaldocumentpage19</column></row><table>网如果表意文字数据库具有上述结构,习惯于根据笔数/总笔画/发音等输入汉字的用户,也能使用表意文字数据库结构。一个或更多的笔数/总笔画/发音也能选择性的包括于表意文字数据库结构中。此外,在发音方面,图表l中列出了简化汉字的拼音。但是,因为在每个国家中与发音对应的汉字是不同的,数据库可根据每个国家的发音构建。当然,韩国、中国和日本的所有发音也能都包括。[100工业适用性[101如果采用本发明的表意文字数据库系统及其处理方法,汉字可以筒单地输入,并且其它包含表意文字的数据库也能被简单有效地处理。102尽管已示出和描述了本发明的优选实施例,可以设想,本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改。权利要求1.一种表意文字数据库系统,其包括表意文字数据库,所述表意文字数据库具有字段,在字段中构成表意文字的字形被分成由点和划组成的部首,上述部首由一个笔画组成,每个部首分配一个顺序,并且每种表意文字根据上述部首的顺序和每个表意文字的笔画顺序进行排列;和列表窗,用于根据表意文字的排列顺序在上述表意文字数据库中搜索表意文字。2.如权利要求1所述的表意文字数据库系统,还包括用户数据库,所述用户数据库具有字段,字段由具有数值的、包含在所述表意文字数据库中的表意文字所组成,其中,用户数据库根据所述表意文字数据库中表意文字的排列顺序进行排列或者搜索。3.如权利要求l所述的数据库系统,其特征在于,在列表窗中,将所述表意文字数据库中表意文字以预定数字分开从而分组,并且如果由每个分组的第一个表意文字所组成的列表窗生成,而且选择了一个分组的第一个表意文字,就在列表窗中显示由属于该选中分组的表意文字组成的列表窗。4.如权利要求l所述的数据库系统,其特征在于,在表意文字数据库中,一个或更多的信息,包括表意文字的笔数、发音和总笔画,可被指定为字段。5.如权利要求l所述的数据库系统,其特征在于,在表意文字数据库中,单独分配给每个表意文字的字符编码或者序列号可被指定为字段。6.如权利要求l所述的数据库系统,其特征在于,所述部首具有下列形状和排列顺序<formula>formulaseeoriginaldocumentpage3</formula><formula>formulaseeoriginaldocumentpage4</formula>7.如权利要求l所迷的数据库系统,其特征在于,所述表意数据库中的表意文字,"口、日、目、山"和"白"位于汉字的左边的汉字,如"味、時、目艮、峰"和"的",和"卄"位于汉字的上边的汉字,如"葜,,,分开排列。8.—种表意文字数据库处理方法,其特征在于包括第一步,提供表意文字数据库,所述表意文字数据库具有字段,在字段中构成表意文字的字形被分成由点和划组成的部首,上述部首由一个笔画组成;每个部首分配一个顺序,并且每种表意文字才艮据上述部首的顺序和每个表意文字的笔画顺序进行排列;和第二步,提供列表窗,用于根据表意文字的排列顺序在上述表意文字数据库中搜索表意文字。9.如权利要求8所述的方法,其特征在于还包括第三步,提供用户数据库,所述用户数据库具有字段,字段由具有数值的、包含在所述表意文字数据库中的表意文字组成,第四步,根据所述表意文字数据库中表意文字的排列顺序对用户数据库进行排列或者搜索。全文摘要本发明涉及一种表意文字数据库系统及其处理方法。表意文字数据库系统包括表意文字数据库和列表窗;所述表意文字数据库具有字段,在字段中构成表意文字的字形被分成由点和划组成的部首,上述部首由一个笔画组成,每个部首分配一个顺序,并且每种表意文字根据上述部首的顺序和每个表意文字的笔画顺序进行排列;所述列表窗,用于根据表意文字的排列顺序在上述表意文字数据库中搜索表意文字。表意文字数据库处理方法包括第一步,提供表意文字数据库,所述表意文字数据库具有字段,在字段中构成表意文字的字形被分成由点和划组成的部首,上述部首由一个笔画组成,每个部首分配一个顺序,并且每种表意文字根据上述部首的顺序和每个表意文字的笔画顺序进行排列;第二步,提供列表窗,用于根据表意文字的排列顺序在上述表意文字数据库中搜索表意文字。文档编号G06F17/30GK101517573SQ200780035438公开日2009年8月26日申请日期2007年9月27日优先权日2006年9月29日发明者朴仁基申请人:朴仁基
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1