音码语音输入法的制作方法

文档序号:6553172阅读:304来源:国知局
专利名称:音码语音输入法的制作方法
技术领域
本发明涉及一种计算机的汉字输入法,特别是一种汉语拼音中引入字根拼音,并通过字根或单字拼音进行语音输入的方法。
现有汉字输入多为键盘输入,对熟悉键盘的用户来说,用键盘输入自然是种好方法;但多数用户对熟悉和掌握键盘确实是件难事,要达到纯熟和盲打的程度,更是望而生畏。所以研究语音输入成为人们关注的一项课题。如仅按汉语拼音进行语音输入,显然重码率高、准确率低,不易于提高录入速度。
本发明的目的在于解决上述不足之处,提出一种集拼音与拼形于一体的音码语音输入法。该法简单直观,易学易记和易于提高录入速度,是一种以输入词语为主、单字为辅的汉字输入方法。
本发明是通过以下方式来实现的引入字根拼音,选择命名123个字根,称为“名字根”,与名字根相似的字根即“形似字根”和名字根同名,并分属在相应名字根之名下;字根或单字拼音的第一个字母为音码,按编码规则,依顺序把汉字或词语编码要取音码的字根或单字拼音用语音读入计算机,由计算机取音码组成编码查找相应的汉字或词语,从而实现汉字输入的目的。汉字拆分和编码方法如下1、在汉字拆分过程中,应遵循的原则可概括为“依笔顺拆分,能免交则免,直观大优先。”①依笔顺拆分,指依照笔画书写顺序,从左到右,从上到下,从外到内拆分,前面的笔画组成前字根,后面的笔画组成后字根,直到把整个汉字拆分完毕。
②能免交则免,指拆分出的字根,除交不可免外,则应避免交叉。这里的交叉是指字根间的交叉,包括(一)字根笔画间的交叉;二)字根笔画间虽不交叉,但一字根的笔画在另一字根笔画间穿过。
③直观大优先,指两个方面的含义,(一)依照笔顺可组成前字根,也可组成后字根的笔画,包括交不可免的情况,一般由前字根优先取作人字根,组成后字根较直观时例外。(二)违背笔顺的后笔画,若能与前笔画组成直观性较好的大字根,则应优先取作大字根。
2、字型码为字母u、i、v,分别表示左右型、上下型和混合型,用于二、三字根单字编简码。
3、汉字和词语设有根码语音输入法简称根码法和字码语音输入法简称字码法,前者又分四根码语音输入法和五根码语音输入法,取码长度分别为4和5,简称四根码法和五根码法,适合于不熟悉汉语拼音或不识汉字的人使用;后者又分四字码语音输入法和五字码语音输入法,取码长度分别为4和5,简称四字码法和五字码法,适合于有汉语拼音基础的人使用。
①单字和成字根的编码输入。
a、字根总数等于、大于4的单字,四、五根码法编码均依笔顺取一、二、三、末字根音码;四、五字码法编码均先取单字音码,再依笔顺取一、二、末字根音码。如“重”字的根码法编码为phrt;字码法编码为cpht。
b、字根总数等于、小于3的单字,四、五根码法编码均依笔顺取所有字根音码,再取单字音码;四、五字码法编码均先取单字音码,再依笔顺取所有字根音码。如“暗”字的根码法编码为rlra;字码法编码为arlr。
c、笔画数等于、大于3的成字根,四、五根码法编码均先取成字根音码,再依笔顺取一、二、末笔画字根音码;四、五字码法编码均先取成字根音码或单字音码,再依笔顺取一、二、末笔画字根音码。如“目”字的根码法编码为dczh;字码法编码为dczh或mczh。
d、一、二笔画的成字根,四、五根码法编码均先取成字根音码,再依笔顺取首、末笔画字根音码加v码;四、五字码法编码均先取成字根音码或单字音码,再依笔顺取首、末笔画字根音码(亦可加v码)。如“十”字的根码法编码为shcv;字码法编码为shc或shcv。
②词语的编码输入。
a、二字词语,四根码法编码取每字全码的一、二码;五根码法编码取前字全码的一、二码和后字全码的一、二、三码(当后字为二字根单字时,亦可取全码的一、二码加字型码)。四字码法编码先取每字的单字音码,再取每字的一字根音码;五字码法编码先取每字的单字音码,再取前字的一字根音码和后字的一、二字根音码。如“中国”、“人民”的四、五根码法编码分别为kcow、rpyq和kcowd、rpyqm或rpyqv;四、五字码法编码分别为zgko、rmpy和zgkow,rmpyq。
b、三字词语,四根码法编码取前两字全码的一码和后字全码的一、二码五根码法编码取前字全码的一码和后两字全码的一、二码。四字码法编码先取每字的单字音码,再取后字的一字根音码五字码法编码先取每字的单字音码,再取后两字的一字根音码。如“河南省”、“新阶段”的四、五根码法编码分别为qsxp、lefs和qsoxp、lerfs;四、五字码法编码分别为hnsx、xjdf和hnssx、xjdef。
c、四字词语,四根码法编码取每字全码的一码;五根码法编码取前三字全码的一码和末字全码的一、二码;四字码法编码取每字的单字音码;五字码法编码先取每字的单字音码,再取末字的一字根音码。如“技术革命”、“各级党委”的四、五根码法编码分别为lmar、wpxh和lmarh、wpxhn;四、五字码法编码分别为jsgm、gjdw和jsgmr、gjdwh。
d、多字词语,四根码法编码取前三字和末字全码的一码;五根码法编码取前四字和末字全码的一码。四字码法编码取前三字和末字的单字音码;五字码法编码取前四字和末字的单字音码。如中国共产党”、“人民代表大会”的四、五根码法编码分别为koax、rvfr和koalx、ryfqr;四、五字码法编码分别为zggd、rmdh和zggcd、rmdbh。
在字码法编码中,为符合读音习惯,与单字读音不一致的成字根“一、乙、目、石、马、士、己”等,作字根编码时取字根音码;作单字编码时取字根音码或单字音码;在词语中编码时取单字音码,即该成字根在词语中所读拼音的首码。
③单字简码输入。
根码法和字码法均设一、二三级常用单字简码(常简一、常简二常简三),根码法另加设二、三字根单字简码(字简二、字简三)。
a、根码法和字码法的常简一编码均为单字音码或单字音码加u、i、v码之一。如“D”键上的一级简码汉字“的、到、对、等”,根码法和字码法的一级简码均分别为d、du、di、dv。
b、根码法和字码法的常简二编码为各自单字全码的一、二码。如汉字“使”的根码法二级简码为fh;字码法二级简码为sf。
c、根码法和字码法的常简三编码为各自单字全码的一、二、三码。如汉字“输”的根码法三级简码为crh;字码法三级简码为scr。
d、字简二编码为二字根单字全码的一、二码加字型码。如汉字“茧”的字简码为aci(上下型)。
e、字简三编码为三字根单字全码的一、二、三码加字型码。如汉字“样”的字简码为mnmu(左右型)。
常简码主要定义常用单字,以配合词语使用,有利于提高录入速度。字简码定义二、三字根单字,用于不认识某单字时的编码输入。
与现有技术相比,上述技术方案是集拼音与拼形于一体的汉字录入技术,兼融了拼音、拼形输入的优点。该法采用语音输入,直观简便。字根少,有单音节名称,简明易读。所有字根均编入押韵的助记词,易记难忘。汉字拆分、编码规则简单,容易掌握。单字和词语除用四码外,还可用五码编码输入,使单字和词语间不发生重码,词语容量大,无识别码,重码少,输入速度快。该法好学好用,易于普及推广。
下面结合附图对本发明进一步说明。


图1是汉字字根及其拼音总表(一);图2是汉字字根及其拼音总表(二)。
图1、图2所示,字根是组成汉字的“部件”,它是汉字中形状相同或相似的笔画或笔画组合。字根可大可小。最小的字根是汉字的五种基本笔画,叫“笔画字根”。如果字根本身就是一个独立的汉字,这种字根就叫“成字根”。
依照汉语拼音原则,给字根选择一个单音节读音,作为字根名称,并用拼音标注,称为字根拼音。引入字根拼音,使字根象单字一样,具有拼音属性,便于称谓和进行语音输入。字根或单字拼音的第一个字母称作“音码”。音码分“字根音码”和“单字音码”。通过语音输入并取音码进行汉字词语编码的方法叫做“音码语音输入法”。
根据计算机汉字输入的需要,汉字音码语音输入法选择命名了123个字根,称为“名字根”。与名字根相似的字根即“形似字根”和名字根同名,并分属在相应名字根之名下。字根中大部份是成字根,其名称多数与该汉字拼音相同;非成字根则以其出处之汉字或“形”之音为其命名,使所有字根均具有相应的拼音名称。
上述“音码语音输入法”中的四字码法和五字码法全套编码方法同样适用于键盘输入,也用作已申请专利“音码汉字、词语输入法及其键盘(申请号99101498.7)”的补充方案。
权利要求
1.一种音码语音输入法。其特征是引入字根拼音,选择命名123个字根,称为“名字根”,与名字根相似的字根即“形似字根”和名字根同名,并分属在相应名字根之名下;字根或单字拼音的第一个字母为音码,按编码规则,依顺序把汉字或词语编码要取音码的字根或单字拼音用语音读入计算机,由计算机取音码组成编码查找相应的汉字或词语,从而实现汉字输入的目的。汉字拆分和编码方法如下①在汉字拆分过程中应遵循的原则为“依笔顺拆分,能免交则免,直观大优先”。②字型码为字母u、i、v,分别表示左右型、上下型和混合型,用于二、三字根单字编简码。③汉字和词语设有根码语音输入法简称根码法和字码语音输入法简称字码法,前者又分四根码语音输入法和五根码语音输入法,简称四根码法和五根码法,适合于不熟悉汉语拼音或不识汉字的人使用;后者又分四字码语音输入法和五字码语音输入法,简称四字码法和五字码法,适合于有汉语拼音基础的人使用。i、单字和成字根的编码输入。a、字根总数等于、大于4的单字,四、五根码法编码均依笔顺取一、二、三、末字根音码;四、五字码法编码均先取单字音码,再依笔顺取一、二、末字根音码。b、字根总数等于、小于3-的单字,四、五根码法编码均依笔顺取所有字根音码,再取单字音码;四、五字码法编码均先取单字音码,再依笔顺取所有字根音码。c、笔画数等于、大于3的成字根,四、五根码法编码均先取成字根音码,再依笔顺取一、二、末笔画字根音码;四、五字码法编码均先取成字根音码或单字音码,再依笔顺取一、二、末笔画字根音码。d、一、二笔画的成字根,四、五根码法编码均先取成字根音码,再依笔顺取首、末笔画字根音码加v码;四、五字码法编码均先取成字根音码或单字音码,再依笔顺取首、末笔画字根音码(亦可加v码)。ii、词语的编码输入。a、二字词语,四根码法编码取每字全码的一、二码;五根码法编码取前字全码的一、二码和后字全码的一、二、三码(当后字为二字根单字时,亦可取全码的一、二码加字型码)。四字码法编码先取每字的单字音码,再取每字的一字根音码;五字码法编码先取每字的单字音码,再取前字的一字根音码和后字的一、二字根音码。b、三字词语,四根码法编码取前两字全码的一码和后字全码的一、二码;五根码法编码取前字全码的一码和后两字全码的一、二码。四字码法编码先取每字的单字音码,再取后字的一字根音码;五字码法编码先取每字的单字音码,再取后两字的一字根音码。c、四字词语,四根码法编码取每字全码的一码;五根码法编码取前三字全码的一码和末字全码的一、二码;四字码法编码取每字的单字音码;五字码法编码先取每字的单字音码,再取末字的一字根音码。d、多字词语,四根码法编码取前三字和末字全码的一码;五根码法编码取前四字和末字全码的一码。四字码法编码取前三字和末字的单字音码;五字码法编码取前四字和末字的单字音码。在字码法编码中,为符合读音习惯,与单字读音不一致的成字根“一、乙、目、石、马、士、己”等,作字根编码时取字根音码;作单字编码时取字根音码或单字音码;在词语中编码时取单字音码,即该成字根在词语中所读拼音的首码。iii、单字简码输入。根码法和字码法均设一、二、三级常用单字简码(常简一、常简二、常简三),根码法另加设二、三字根单字简码(字简二、字简三)。a、根码法和字码法的常简一编码均为单字音码或单字音码加u、i、v码之一。b、根码法和字码法的常简二编码为各自单字全码的一、二码。c、根码法和字码法的常简三编码为各自单字全码的一、二、三码。d、字简二编码为二字根单字全码的一、二码加字型码。e、字简三编码为三字根单字全码的一、二、三码加字型码。
2.上述“音码语音输入法”中的四字码法和五字码法全套编码方法同样适用于键盘输入,也用作已申请专利“音码汉字、词语输入法及其键盘(申请号99101498.7)”的补充方案。
全文摘要
本发明是一种以词语为主,单字为辅的汉字输入法。该法集拼音与拼形于一体,引入字根拼音,命名字根,通过字根或单字拼音进行语音输入,由计算机取字根或单字拼音首码即音码组成编码查找相应的汉字或词语,直观简单。字根少,有单音节名称,易读易记。汉字拆分、编码规则简明,容易掌握。单字和词语除用四码外,还可用五码编码输入,使单字和词语间不发生重码,词语容量大,无识别码,重码少,输入速度快。该法好学好用,易于普及推广。
文档编号G06F3/023GK1335552SQ01112510
公开日2002年2月13日 申请日期2001年3月29日 优先权日2001年3月29日
发明者刘洪学 申请人:刘洪学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1