快速文字查找方法

文档序号:6417297阅读:376来源:国知局
专利名称:快速文字查找方法
技术领域
本发明涉及一种文字查找方法,特别是涉及一种利用对比内码排序序列与音序排序序列的快速文字查找方法。
以前的关键字序列,均是以内码序列来排序的,即,无论使用者利用何种输入法(例如注音输入法,仓颉输入法以及汉英拼音输入法)进行数据输入时,当对输入的关键字进行对比、查找以找出与输入关键字相对应的文字数据时,关键字总是按其内码而进行对比的,即便是处于输入法为拼音输入的状态时,相应关键字序列也是按内码排序的。若要求关键字按音序序列来排序,在查找关键字为多音字时,即,当一个字有不同的发音时,将遇到对于输入的多音字难以准确并快速对比的问题。对于多音字的查找对比,目前的方法是针对关键字里多音字的个数与读音进行排列组合,然后分别对各种组合进行对比。


图1所示,为现有技术的文字查找方法的查询过程程序。首先,于步骤11,使用者输入想查询的关键字,接着进到步骤12。
在步骤12中,得到输入的该关键字中多音字的个数和每个多音字的读音种类,进到步骤13。
在步骤13,根据由步骤12而来的该关键字中多音字的个数和每个多音字的读音种类,而求出多音字的个数与每个多音字读音种类的排列组合数,并将进到步骤14。
步骤14中将对由步骤13所得到的排列组合数,取出第一个排列组合数,接着进到步骤15。
步骤15,将由步骤14所得的排列组合数在音序序列里进行对比,以判断是否找到该排列组合数。若经判断后,在音序序列中能找到该排列组合数,则进到步骤18;若经判断后,在音序序列中未能找到该排列组合数,则进到步骤16。
在步骤16中,判断多音字的个数与每个多音字读音种类的排列组合数是否为0。若经判断后,多音字的个数与每个多音字读音种类的排列组合数为0,则进到步骤18;若经判断后,多音字的个数与每个多音字读音种类的排列组合数不为0,则进到步骤17。
步骤17中,将多音字的个数与每个多音字读音种类的排列组合数减一,并选取下一排列组合数,接着回到步骤14。
步骤18将结束此文字查找工作。
例如,若输入的关键字为“校对行数”四个字。在此,“对”的读音仅有一种(即ㄉㄨㄟ“四声”)、而“校”、“行”、“数”其读音的变化情形如下“校”字的读法有两种,即ㄐ一ㄠ“四声”(或以罗马拼音表示的Jiao(4),其中(4)表示第四声),以及ㄒ一ㄠ“四声”(或以马罗拼音表示Xiao(4),其中(4)表示第四声)。
“行”字的读法有两种,即ㄒ一ㄥ“二声”(或以罗马拼音表示Xing(2),其中(2)表示第二声),以及ㄏㄤ“二声”(或以罗马拼音表示Hang(2),其中(2)表示第二声)。
“数”字的读法有两种,即ㄕㄨ“四声”(或以罗马拼音表示Shu(4),其中(4)表示第四声),以及ㄕㄨ“三声”(或以罗马拼音表示Shu(3),其中(3)表示第三声)。
由此可知,“校对行数”四个字的排列组合数为8(2×1×2×2=8)种,而必须对这8种组合逐一进行对比,才能得出查询结果。而此类的对比、查找工作完成的快慢与多音字的个数及其读音的种类多少有密切的关系,并且是相当耗时与繁琐的工作。因为若关键字有二十个多音字,且每个多音字有两种读音,则这样的排列组合数将是2的20次方,而对如此大的组合数来做对比、查找将是非常耗时与繁琐。而若其间有些多音字有两种以上的发音时,则排列组合数将更行庞大,而使对比、查找工作更不易于完成。而且在输入时的每一时刻,关键字序列均要进行对比、查找工作,而如此,将导致定位查找文字速度的大幅减缓。所以如何寻求一种快速的多音字的查询定位查找方法,以大幅度地降低定位查找文字时的耗时、繁琐工作,而将其简化是需要解决的问题。
为了解决上述现有方法所产生的问题,以及现有方法的耗时、繁琐的对比工作,我们采用了一种快速文字查找方法,而能有效地克服上述存在的问题,并可大幅度地简化对比工作而快速查找文字。
本发明的目的在于提供一种快速文字查找方法,可应用于包括输入装置以及含有存储装置的主机装置系统中,而让使用者能快速的查找出相对应的文字。
本发明的另一目的在于提供一种快速文字查找方法,可应用于包括输入装置以及含有存储装置的主机装置的系统中,利用结合内码排序序列以及音序排序序列的对比方式,而让使用者能快速的查找出相对应的文字。
本发明的再一目的在于提供一种快速文字查找方法,可应用于包括输入装置以及含有存储装置的主机装置系统中,通过多音字具有相同的内码特点并经由对比存储装置中内码排序序列以及音序排序序列数据库的方式,而让使用者能快速的查找出相对应的文字。
本发明的又一目的在于提供一种快速文字查找方法,可应用于包括输入装置以及含有存储装置的主机装置系统中,不论输入关键字中的多音字的个数与读音的种类的排列组合数为何,而仅需进行一次文字查找,经由内码排序序列以及音序排序序列的一一对应关系,而可快速的查找出相对应的文字。
本发明的目的是这样实现的,即提供一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中,以查找出输入字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入字转换为内码;(2)在主机装置中将由输入字所得出的内码值与于存储装置中的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入字所对应的音序排序序列数据库中的音序序号地址,再经由该音序序号地址而找到所输入字在音序排序序列中的地址,以得到该输入字在音序排序序列中的位置;以及(4)再根据所得的音序序号地址而找出在存储装置中的音序排序序列中所对应的文字数据,而得以快速的查找到输入字所对应的文字数据。
本发明还提供一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中以查找出输入字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入字转换为内码;(2)根据多音字具有相同的内码值特点,进行内码排序序列查找,在主机装置中将由输入的字所得出的内码值与在存储装置中的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入字所对应的音序排序序列数据库中音序序号地址,再经由该音序序号地址而找到所输入的字句在音序排序序列中的地址,以得到该输入字在音序排序序列中的位置;以及(4)再根据所得的音序序号地址而找出在存储装置中音序排序序列中所对应的文字数据,而得以快速地查找到输入的字所对应的文字数据。
本发明还提供一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中以查找出输入关键字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入的关键字转换为内码;(2)在主机装置中将由输入的关键字所得出的内码值与在存储装置中的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入的关键字所对应的音序排序序列数据库中的音序序号地址,再经由该音序序号地址而找到所输入的关键字在音序排序序列中的地址,以得到该关键字在音序排序序列中的位置;以及(4)再根据所得的音序序号地址而找出在存储装置中音序排序序列中所对应的文字数据,而得以快速的查找到输入的关键字所对应的文字数据。
本发明还提供一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中以查找出输入关键字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入的关键字转换为内码,其中,音序排序序列数据库里面存放的是按音序排序的关键字所对应的文字数据,内码排序序列数据库里面所存放的是对应于按音序排序的关键字序列的音序序号地址;(2)根据多音字具有相同的内码值以及将输入关键字的由按音序排序序列的查找而转换为对内码排序序列查找的特点,在主机装置中将由输入的关键字所得出的内码值与在存储装置中以内码排序序列所建立的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入的关键字所对应的音序排序序列数据库中的音序序号地址,再经由该音序序号地址而找到所输入的关键字在音序排序序列中的地址,以得到该关键字在音序排序序列中的位置;以及(4)再根据由所得的音序序号地址而找出在存储装置中的音序排序序列中所对应的文字数据,而得以快速的查找到输入的关键字所对应的文字数据。
与现有方法中主机装置的文字查找的方式相比,均将关键字里多音字的个数和读音进行排列组合,然后分别对各种组合进行音序序列对比,以得出相对应的文字数据,但由于排列组合数的庞大,而使得现有的对比方法既花时间又繁琐,而无法达到快速文字查找的目标。而使用本发明的快速文字查找方法时,利用结合对比内码序列以及音序序列的方式,经由多音字具有相同的内码特点并通过对比存储装置中的内码序列以及音序序列数据库的程序,不论输入数据中的多音字的个数与读音种类的排列组合数如何,仅需进行一次文字查找,经由内码序列以及音序序列的一一对应关系,可快速的查找出相对应的文字数据。
利用本方法,无论使用者利用何种输入法,首先根据输入得到关键字,按内码对比得到该关键字所对应的音序排序序列中的地址,再通过该地址去定位找出所输入的关键字在音序排序序列中的位置,而得以快速的查找到输入数据所对应的文字数据。可适用于个人电脑上的辞典类产品、个人数字助理(PDA)辞典类及其相应卡片的音序排列的多音字的查找定位。
为让本发明的上述和其它目的,特征,优点能更明显易懂,将举一较佳实施例,并配合附图,详细说明本发明的实施例,其中图1为现有技术的文字查找运作流程图,其中显示应用现有技术的文字查找方式,先将关键字里多音字的个数和读音进行排列组合,然后分别针对各种组合进行音序序列对比,以得出相对应的文字数据流程程序;图2为一系统方块图,其中显示应用本发明快速文字查找方法的系统的基本系统组织结构;图3为一运作流程图,其中显示应用本发明快速文字查找方法,利用多音字具有相同内码的特点并透过存储装置中内码排序序列以及音序排序序列数据库,而仅需进行一次文字查找工作,经由内码排序序列以及音序排序序列的一一对应关系,可快速查找出相对应的文字数据的流程程序;图4为内码排序序列以及音序排序序列数据库的对应示意图,用以说明应用本发明快速文字查找方法的存储装置中的内码排序序列以及音序排序序列的对应关系。
请参阅图2,其中显示应用本发明快速文字查找方法的系统的基本系统组织结构。如图2所示,此系统1包括一输入装置2以及含有存储装置3的主机装置4。此系统1可为任何型式的个人电脑系统(例如为台式、笔记本型、或掌上型电脑系统)、个人数字助理、文字翻译机。
此系统1中,输入装置2耦合到主机装置4,存储装置3位于主机装置4中。
应用本发明的快速文字查找方法,首先在主机装置3的存储装置4中建立音序排序序列数据库,以及与此音序排序序列数据库一一对应的内码排序序列数据库,并将输入的关键字转换为内码。接着根据多音字具有相同的内码值以及将输入关键字的由按音序排序序列的查找而转换为对内码排序序列查找的特点,在主机装置4中先将由输入装置2而来的输入关键字所得出的内码值与在存储装置3中以内码排序序列方式所建立的数据库进行对比、查找,按内码对比以得到关键字所对应的音序排序序列数据库的音序序号地址。主机装置4再经由该音序序号地址而找到关键字在音序排序序列中的地址,并根据此地址而得以找出于存储装置3中音序排序序列中对应于输入关键字的文字数据。
图3为应用本发明快速文字查找方法的运作流程图,其中显示应用本发明快速文字查找方法利用多音字具有相同的内码特点并透过存储装置中内码排序序列以及音序排序序列数据库,仅需进行一次文字查找,经由内码排序序列以及音序排序序列的一一对应关系,可快速地查找出相对应文字数据的流程程序。
首先于步骤21,在存储装置3中建立音序排序序列LIST1数据库,以及与此音序排序序列LIST1数据库所一一对应的内码排序序列LIST2数据库,并将输入的关键字转换为内码,其中,LIST1里面存放的是按音序排序的关键字,LIST2里面所存放的是对应于按音序排序的关键字序列(LIST1)的音序序号地址,接着进到步骤22。
在步骤22中,根据多音字具有相同的内码值以及将输入关键字的由按音序排序序列的查找而转换为对内码排序序列查找的特点,在主机装置4中将由输入的关键字所得出的内码值与在存储装置3中的以内码排序序列所建立的LIST2数据库进行对比查找,并将进到步骤23。
步骤23,按步骤22所得的内码对比而得到输入的关键字所对应的音序排序序列LIST1数据库中的音序序号地址,再经由该音序序号地址而找到所输入的关键字在音序排序序列LIST1中的地址,以得到该关键字在LIST1中的位置,进到步骤44。
在步骤24中,再根据所得的音序序号地址而找出在存储装置3中的音序排序序列LIST1中所对应的文字数据,而得以快速的查找到输入的关键字所对应的文字数据。
图4为内码排序序列以及音序排序序列的对应示意图,用以说明应用本发明的快速文字查找方法的存储装置3中的内码排序序列以及音序排序序列的对应关系。在图中,可得知经由将音序排序序列以及内码排序序列结合,利用多音字具有相同的内码值的一特点,可经由一次对比、查找关键字内码的动作,而无需以分别各次寻找多音字的个数与每个多音字读音种类的排列组合数的方式,来快速查找出相对应的文字。利用本方法时,不论使用者利用何种输入法,首先根据输入得到关键字,按内码对比得到该关键字所对应的音序排序序列中的地址,再通过该地址去定位找出所输入的关键字在音序排序序列中的位置,从而快速查找到输入的关键字所对应的文字数据。
在此以“校对行数”四字为例,来说明应用本发明的快速文字查找方法的过程。由于我们首先是以对比关键字内码的方式,并利用多音字仍具有相同的内码特点。所以在此无需考虑关键字里有三个多音字“校”、“行”、“数”,只需将以内码表示的关键字“校对行数”在内码排序序列LIST2中进行对比、查找,然后再根据LIST2中所找到的对应于音序排序序列LIST1中的音序序号地址,可在LIST1中相对应于该音序序号地址的位置上得到关键字所对应的文字数据,此文字数据即为所要查询的关键字,可得到所对应的文字数据。
对于输入的关键字为“校”字而言,其注音的发音可为ㄐ一ㄠ“四声”(或以罗马拼音的Jiao(四声))。此时,在内码排序序列LIST2进行对比查找,在此,LIST2里存在相邻的二个“校”字,即拼音发音为ㄒ一ㄠ“四声”(或以罗马拼音的Xiao(四声))的“校”字以及拼音发音为ㄐ一ㄠ“四声”(或以罗马拼音的Jiao(四声))的“校”字,当查询到拼音发音为ㄒ一ㄠ“四声”(或以罗马拼音的Xiao(四声))的“校”字后,再以此拼音发音为ㄒ一ㄠ“四声”校字为基点,在前后查询具有相同内码的关键字,以达到对比“上校”的拼音发音为ㄐ一ㄠ“四声”(或以罗马拼音的Jiao(四声))的“校”字的目的,以此提高查询的准确性。
综合以上的实施例以及方法,我们可以得到本发明的快速文字查找方法,是利用结合对比内码序列以及音序序列的方式,经由多音字具有相同的内码特点并通过对比存储装置中内码序列以及音序序列数据库的程序,不论输入关键字中多音字的个数与读音种类的排列组合数为何,仅需进行一次文字查找,经由内码序列以及音序序列的一一对应关系,可快速地查找出相对应的文字,因而得以快速的文字查找。此快速文字查找方法的优点有1.提供一种快速文字查找方法,而让使用者能快速的查找出输入关键字所对应的文字数据。2.经由多音字具有相同的内码特点,并利用结合内码排序序列以及音序排序序列的对比方式,让使用者能快速的查找出关键字所对应的文字数据。3.无论输入关键字中多音字的个数与读音种类的排列组合数为何,仅需进行一次文字查找,经由内码排序序列以及音序排序序列的一一对应关系,可快速地查找出相对应的文字数据。
以上所述的仅为本发明的较佳实施例而已,并非用以限定本发明的范围;凡其它未脱离本发明所揭示的精神下所完成的等效改变或修饰,均应包含在所附的权利要求内。
权利要求
1.一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中,以查找出输入字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入字转换为内码;(2)在主机装置中将由输入字所得出的内码值与于存储装置中的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入字所对应的音序排序序列数据库中的音序序号地址,再经由该音序序号地址而找到所输入字在音序排序序列中的地址,以得到该输入字在音序排序序列中的位置;以及(4)再根据所得的音序序号地址而找出在存储装置中的音序排序序列中所对应的文字数据,而得以快速的查找到输入字所对应的文字数据。
2.如权利要求1所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一个人数字助理。
3.如权利要求1所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一个人电脑。
4.如权利要求1所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一电子翻译机。
5.一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中以查找出输入字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入字转换为内码;(2)根据多音字具有相同的内码值特点,进行内码排序序列查找,在主机装置中将由输入的字所得出的内码值与在存储装置中的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入字所对应的音序排序序列数据库中音序序号地址,再经由该音序序号地址而找到所输入的字句在音序排序序列中的地址,以得到该输入字在音序排序序列中的位置;以及(4)再根据所得的音序序号地址而找出在存储装置中音序排序序列中所对应的文字数据,而得以快速地查找到输入的字所对应的文字数据。
6.如权利要求5所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一个人数字助理。
7.如权利要求5所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置的系统可为一个人电脑。
8.如权利要求5所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一电子翻译机。
9.一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中以查找出输入关键字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入的关键字转换为内码;(2)在主机装置中将由输入的关键字所得出的内码值与在存储装置中的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入的关键字所对应的音序排序序列数据库中的音序序号地址,再经由该音序序号地址而找到所输入的关键字在音序排序序列中的地址,以得到该关键字在音序排序序列中的位置;以及(4)再根据所得的音序序号地址而找出在存储装置中音序排序序列中所对应的文字数据,而得以快速的查找到输入的关键字所对应的文字数据。
10.如权利要求9所述的一种快速文字查找方法,其中所述包含一输入装置以及一含有存储装置的主机装置系统可为一个人数字助理。
11.如权利要求9所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置的系统可为一个人电脑。
12.如权利要求9所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一电子翻译机。
13.一种快速文字查找方法,可运用于一种包括一输入装置以及一含有存储装置的主机装置系统中以查找出输入关键字所对应的文字数据,此快速文字查找方法包括以下程序(1)在主机装置的存储装置中建立音序排序序列数据库,以及与此音序排序序列数据库所一一对应的内码排序序列数据库,并将输入的关键字转换为内码,其中,音序排序序列数据库里面存放的是按音序排序的关键字所对应的文字数据,内码排序序列数据库里面所存放的是对应于按音序排序的关键字序列的音序序号地址;(2)根据多音字具有相同的内码值以及将输入关键字的由按音序排序序列的查找而转换为对内码排序序列查找的特点,在主机装置中将由输入的关键字所得出的内码值与在存储装置中以内码排序序列所建立的内码排序序列数据库进行对比查找;(3)按所得的内码对比而得到输入的关键字所对应的音序排序序列数据库中的音序序号地址,再经由该音序序号地址而找到所输入的关键字在音序排序序列中的地址,以得到该关键字在音序排序序列中的位置;以及(4)再根据由所得的音序序号地址而找出在存储装置中的音序排序序列中所对应的文字数据,而得以快速的查找到输入的关键字所对应的文字数据。
14.如权利要求13所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一个人数字助理。
15.如权利要求13所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一个人电脑。
16.如权利要求13所述的一种快速文字查找方法,其中所述包括一输入装置以及一含有存储装置的主机装置系统可为一电子翻译机。
全文摘要
一种快速文字查找方法,先在存储装置中建立音序排序序列数据库,并与此数据库对应的内码排序序列数据库将关键字转换为内码,再根据多音字相同的内码值及将关键字由按音序排序序列的查找转换为对内码排序序列查找的特点,在主机装置中先将内码值与在存储装置中以内码排序序列方式所建立的数据库进行对比、查找,按内码对比以得到关键字对应的音序序号地址。再经音序序号地址,找到关键字地址,以此找出对应于输入关键字的文字数据。
文档编号G06F17/30GK1294364SQ9912337
公开日2001年5月9日 申请日期1999年10月26日 优先权日1999年10月26日
发明者陈淮琰, 陈超 申请人:英业达集团(西安)电子技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1