依据字词类别筛选相近字词的查找系统及其查找方法

文档序号:6334107阅读:765来源:国知局
专利名称:依据字词类别筛选相近字词的查找系统及其查找方法
技术领域
本发明涉及一种字词查找系统及其方法,特别是指一种依据字词类别筛选相近字词的查找系统及其查找方法。
背景技术
使用者在学习语言时,往往会遇到无法理解某个字词的意义的情况,大部分的使用者在遇到这种情况时,通常会通过查找辞典的方式来取得字词的意义。而查找查询字词的释义数据的传统方式,是使用者以翻找纸本辞典的方式来进行。不过纸本辞典具有体积大、重量高、数据更新不便等困扰,于是,随着电子产品的普及、网络的发达,使用者查找辞典的行为也由查找数据纸本的辞典转变为使用可以查找字词的释义数据的辞典软件、电子翻译机或在线的辞典服务。在目前的英语系的辞典中,例如英汉/汉英辞典,若欲查找英文字词(查询数据) 的释义数据,则辞典软件/在线辞典服务会至字词库中,查找出该查询数据的释义数据后, 辞典软件/在线辞典服务会将该查询数据的释义数据显示出来,若字词库中没有该查询数据的释义数据,则有的辞典软件/在线辞典服务会尝试以拼写矫正的功能提供与查询数据相近的其他字词给使用者,藉以让使用者确认是否输入错误或是让使用者以相近的其他字词了解查询数据的涵义。不过,由于上述的拼写矫正功能仅能提供给英语系的查询数据使用,一旦使用者欲查找的查询数据不属于英语系,例如为中文的「俄文」,若字词库中没有查询数据「俄文」 的释义数据,但是却存在与查询数据「俄文」同义的字词「俄语」时,目前的辞典软件、电子翻译机或在线辞典服务都无法提供字词「俄语」的释义数据给使用者。综上所述,可知现有技术中长期以来一直存在与查询数据同义的字词的释义数据无法由查询数据查出的问题,因此有必要提出改进的技术手段,来解决此一问题。

发明内容
有鉴于现有技术存在与查询数据同义的字词的释义数据无法由查询数据查出的问题,本发明遂提供一种依据字词类别筛选相近字词的查找系统及其查找方法,其中本发明所提供的依据字词类别筛选相近字词的查找系统,至少包含储存模块,用以储存多个目标字词及分别与目标字词对应的释义数据,各目标字词属于至少一类别;输入模块,用以提供输入查询数据;查找模块,用以依据查询数据对目标字词进行模糊查找, 藉以查找出结果字词;字词过滤模块,用以依据结果字词的类别过滤结果字词;显示模块, 用以显示被保留的结果字词及被保留的结果字词所对应的释义数据。本发明所提供的依据字词类别筛选相近字词的查找方法,其步骤至少包括储存多个目标字词及分别与目标字词对应的释义数据;分类各目标字词为至少一类别;提供输入查询数据;依据查询数据对目标字词进行模糊查找,藉以查找出结果字词;依据结果字词所属的类别过滤结果字词;显示被保留的结果字词及被保留的结果字词所对应的释义数据。本发明所提供的系统与方法如上,与现有技术之间的差异在于本发明通过依据查询数据对目标字词进行模糊查找而取得结果字词后,依据结果字词所属的类别过滤结果字词,并显示被保留的结果字词及结果字词所对应的释义数据,藉以解决现有技术所存在的问题,并可以达成尽可能提供与查询数据相近的数据的技术功效。


图1为本发明所提的依据字词类别筛选相近字词的查找系统架构图。图2为本发明所提的依据字词类别筛选相近字词的查找方法流程图。图3为本发明实施例所提的使用者界面的示意图。主要组件符号说明110 储存模块120 输入模块130 查找模块150 字词过滤模块160 显示模块190 分类模块300 使用者界面 310 输入区域330 释义显示区域
具体实施例方式以下将配合图式及实施例来详细说明本发明的特征与实施方式,内容足以使任何熟习相关技艺者能够轻易地充分理解本发明解决技术问题所应用的技术手段并据以实施, 藉此实现本发明可达成的功效。本发明是依据查询数据进行模糊查找,藉以查找出与查询数据相似的结果字词, 之后,再依据结果字词的释义数据过滤结果字词,藉以筛选出可能可以说明查询数据的释义数据。其中,组成结果字词与查询字词的最小单位只有少数不同,或是结果字词与查询字词看起来相似,甚至结果字词与查询字词的发音相似,在本发明中,都可以称组成结果字词与查询字词相似,但本发明所提的结果字词与查询字词相似并不以此为限。本发明所提的查询数据为一连串文字数字与符号等语言单元的组合,但本发明所提的查询数据并不以此为限。一般而言,查询数据为一个完整的字词,但事实上,查询数据也可以为完整的字词的一部分。其中,本发明所提的语言单元随着查询数据所属的语系不同而有不同,例如,当查询数据所属的语系为中文时,语言单元为一个中文字,而当查询数据所属的语系为英文时,语言单元为一个英文字母等,但本发明所提的语言单元并不以上述为限。本发明所提的释义数据为可以让使用者理解结果字词的含义的数据,包含结果字词的发音符号、词性、解释文字、例句等,但本发明并不以此为限。以下先以「图1」本发明所提的依据字词类别筛选相近字词的查找系统的系统架构图来说明本发明的系统运作。如「图1」所示,本发明的系统含有储存模块110、输入模块 120、查找模块130、字词过滤模块150、显示模块160。储存模块110负责储存多个目标字词以及分别与各个目标字词对应的释义数据, 储存模块110所储存的目标字词为一连串文字数字与符号等语言单元的组合,一般而言,目标字词为一个完整的字词。储存模块110也储存目标字词所属的类别。值得一提的是,目标字词所属的类别可以在存入储存模块110时,一并将目标字词所属的类别储存在储存模块110中,或是可以由分类模块190分类各个目标字词。储存模块110可以使用数据库或档案来储存目标字词、相对应的释义数据以及目标字词所属的类别,但本发明并不以此为限。输入模块120负责提供输入查询数据。一般而言,使用者可以操作键盘、触控笔等外部的输入装置来输入查询数据,如此,输入装置便会产生相对应的输入信号,输入模块 120在接收到使用者操作输入装置进行查询数据的输入而产生的输入信号后,会将输入信号转换为相对应的查询数据,藉以提供查询数据给后续模块使用。查找模块130负责依据输入模块120所提供输入的查询数据,在储存模块110对储存模块110所储存的目标字词进行模糊查找,藉以查找出结果字词,查找模块130可能查找出一个结果字词,也可能查找出多个结果字词。另外,查找模块130在查找出结果字词时,可以一并查找出结果字词所对应的释义数据以及结果字词所属的类别。查找模块130可以由输入模块120所提供输入的查询数据的第一个语言单元或最后一个语言单元开始,删去一个语言单元或多个相邻的语言单元,并在储存模块110中查找包含已删去语言单元的字串的结果字词,藉以对目标字词进行模糊查找。例如,当查询数据为英文的「test」时,查找模块130可以由查询数据「test」的第一个语言单元(英文字母「t」)开始,分别删去一个语言单元、两个语言单元而得到字串「est」、「st」,或由查询数据「test」的最后一个语言单元开始,分别删去一个语言单元、两个语言单元而得到字串 「tes」、「te」后,至储存模块110中查找包含字串「est」、「st」、「tes」或「te」的目标字词, 被查找出的目标字词即为结果字词,但本发明所提的模糊查找并不以上述为限。查找模块130也负责依据输入模块120所提供输入的查询数据至储存模块110中查找与查询数据相同的目标字词,被查找出的目标字词即为结果字词。字词过滤模块150负责依据结果字词的类别过滤查找模块130所查找出的结果字词。一般而言,字词过滤模块150可以依据查找模块130所查找出的所有结果字词的多个类别所包含的结果字词的数量过滤结果字词,例如,查找模块130查找出六个结果字词,分别
为第一结果字词、第二结果字词.....以及第六结果字词,其中,第一结果字词属于第一类
别与第二类别、第二结果字词、第三结果字词都属于第三类别、第四结果字词属于第二类别与第三类别、第五结果字词属于第二类别、第六结果字词属于第四类别,则第一类别包含一个结果字词、第二类别包含三个结果字词、第三类别包含三个结果字词、第四类别包含一个结果字词,因此,字词过滤模块150可以过滤只属于包含较少结果字词的类别的结果字词, 也就是将仅属于只包含一个结果字词的第四类别的第六结果字词移除,而保留第一至第五结果字词。其中,虽然第一结果字词所属的第一类别也仅包含一个结果字词,但因为第一结果字词还属于包含三个结果字词的第二类别,因此,第一结果字词也会被字词过滤模块150 保留。但字词过滤模块150过滤结果字词的方式并不以上述为限。另外,字词过滤模块150还可以进一步依据结果字词的释义数据过滤查找模块 130所查找出的结果字词,例如,只保留包含相同段落或相似段落的释义数据所对应的结果字词,而删去没有相同段落或相似段落的释义数据所对应的结果字词。其中,计算段落相似
5度的方式已为公知,故不再特别说明。显示模块160负责显示被字词过滤模块150所保留的结果字词以及结果字词所对应的释义数据。此外,本发明更可以包含分类模块190,分类模块190负责依据各目标字词对应的释义数据所包含的特定关键字,将各个目标字词分类至相对应的类别。例如,将包含「计算机」或「网络」等关键字的释义数据所对应的目标字词分类至「计算机」类别、将以国家名称或简称开头并以「文」或「语」结尾的字词分类至「语言」以及该国家名称等两个类别、将以国家名称或简称分类至「国家」以及该国家名称等两个类别、将包含「快乐」或「悲伤」等情绪相关字词分类至「情绪」类别等,本发明所提的分类模块190分类目标字词的方式并不以上述为限,例如,分类模块190也可以依据目标字词的词性分类目标字词。另外,输入模块120更可以提供输入目标字词所属的类别,也就是说,目标字词所属的类别可以由输入模块120输入后,被储存模块110储存,使得分类模块190可以由储存于储存模块110中的目标字词所属的类别分类目标字词。接着以一个实施例来解说本发明的运作系统与方法,并请参照「图2」本发明所提的依据字词类别筛选相近字词的查找方法的方法流程图。不论本发明被应用在安装于计算机的辞典软件、电子翻译机、或是提供字词查找服务的网络服务器上,在使用者使用本发明之前,储存模块110中需要先储存目标字词以及与目标字词对应的释义数据(步骤201),例如储存包含多个目标字词以及释义数据的档案或数据库等。之后,分类模块190可以依据储存模块110中的释义数据所包含的特定关键字或是词性,将与各个释义数据对应的目标字词分类至适合的类别,或是由输入模块120 提供输入各个目标字词所属的类别,藉以将目标字词分类至正确的类别(步骤210),并由储存模块110储存各个目标字词所属的类别。在储存模块110储存目标字词、与目标字词对应的释义数据、以及目标字词所属的类别后,包含本发明的辞典软件、电子翻译机或是网络服务器可以提供如「图3」所示的使用者界面300给使用者,藉以让使用者通过输入模块120在输入区域310中输入查询数据,并取得与查询数据对应的释义数据。在本实施例中,假设输入模块120提供使用者输入至输入区域310的查询数据为「俄文」,但本发明并不以此为限。在输入模块120提供输入查询数据(步骤220)后,查找模块130可以依据查询数据,至储存模块110中对所有目标字词进行模糊查找,藉以查找出与查询数据对应的结果字词以及与结果字词对应的释义数据与结果字词所属的类别(步骤230)。在本实施例中, 假设查找模块130会由查询数据的开头以及最后逐一删去一个语言单元,直到无法在删除语言单元为止。由于查询数据为「俄文」,因此,查找模块130将有两笔进行查找的数据,也就是「俄」以及「文」,接着,查找模块130会查找出包含「俄」或包含「文」的目标字词、相对应的释义数据以及所属的类别,其中,被查找出的目标字词例如「俄顷」、「俄语」、「俄罗斯」 以及「中文」等字词,这些被查找出的目标字词即为本发明所称的「结果字词」。在实务上,在查找模块130依据查询数据对所有目标字词进行模糊查找,并查找出结果字词(步骤230)前,查找模块130更可以如公知的数据查找技术,依据查询数据至储存模块110中对所有目标字词进行完整查找,藉以查找出结果字词(步骤M0),此时查找模块130所查找出的结果字词即与查询数据相同,故不再多加描述。
若查找模块130以完整查找时即查找出结果字词以及相对应的释义数据,则查找模块130可以不再进行模糊查找,且显示模块160可以直接显示结果字词的释义数据。事实上,查找模块130也可以不论完整查找是否有查找出结果字词以及相对应的释义数据, 查找模块130都可以继续进行模糊查找(步骤230),本发明并不以此为限。在查找模块130依据查询数据对所有目标字词进行模糊查找,并查找出结果字词 (步骤230)后,字词过滤模块150可以依据结果字词所属的类别过滤结果字词(步骤250)。 在本实施例中,假设结果字词「俄顷」所属的类别为「时间副词」、结果字词「俄语」所属的类别为「名词」、「语言」以及「俄罗斯」、结果字词「俄罗斯」所属的类别为「名词」、「国家」以及 「俄罗斯」、结果字词「中文」所属的类别为「名词」、「语言」以及「中国」,则字词过滤模块150 可以统计出类别「时间副词」只包含结果字词「俄顷」,类别「名词」包含结果字词「俄语」、 结果字词「俄罗斯」以及结果字词「中文」、类别「语言」包含结果字词「俄语」以及结果字词 「中文」,类别「国家」只包含结果字词「俄罗斯」、类别「俄罗斯」包含结果字词「俄语」以及结果字词「俄罗斯」,类别「中国」只包含结果字词「中文」,因此,字词过滤模块150可以删去只包含一个结果字词的类别所属的结果字词,字词过滤模块150也可以保留包含两个结果字词的类别所属的结果字词,在本实施例中,不论字词过滤模块150是删去包含过少结果字词的类别所属的结果字词或是保留包含一定数量的结果字词的类别所属的结果字词, 结果字词「俄顷」会被字词过滤模块150过滤而删去,而结果字词「俄语」、结果字词「俄罗斯」以及结果字词「中文」会被字词过滤模块150保留。在字词过滤模块150依据结果字词所属的类别过滤结果字词(步骤250)后,显示模块160可以在使用者界面300的释义显示区域330中显示被字词过滤模块150保留的结果字词的释义数据(步骤270)。如此,即使无法由使用者所输入的查询数据直接查找出相对应的释义数据,本发明仍然可以由查询数据取得同义字词的释义数据。在上述的实施例中,字词过滤模块150更可以依据不同结果字词对应的释义数据中是否存在相同或相似的段落过滤结果字词,也就是说,字词过滤模块150可以保留包含相同段落或相似段落的释义数据所对应的结果字词(步骤沈0),而删去不存在相同段落或相似段落的释义数据所对应的结果字词。在本实施例中,由于结果字词「俄语」的释义数据为「Russiandanguage)」、结果字词「俄罗斯」的释义数据为「Russia」、结果字词「中文」的释义数据为「Chinese language ;Chinese」,因此,若字词过滤模块150只判断出结果字词 「俄语」的释义数据与结果字词「俄罗斯」的释义数据相似,则字词过滤模块150将保留结果字词「俄语」以及结果字词「俄罗斯」,也就是删去结果字词「中文」,并由显示模块160将结果字词「俄语」以及结果字词「俄罗斯」的释义数据显示于释义显示区域330(步骤270); 而若字词过滤模块150除了判断出结果字词「俄语」的释义数据与结果字词「俄罗斯」的释义数据相似之外,也判断出结果字词「俄语」的释义数据与结果字词「中文」的释义数据相似,则字词过滤模块150可以只保留结果字词「俄语」的释义数据,并由显示模块160将结果字词「俄语」的释义数据显示于释义显示区域330(步骤270)。综上所述,可知本发明与现有技术之间的差异在于具有依据查询数据对目标字词进行模糊查找而取得结果字词后,依据结果字词所属的类别过滤结果字词,并显示被保留的结果字词所对应的释义数据的技术手段,藉由此一技术手段可以解决现有技术所存在与查询数据同义的字词的释义数据无法由查询数据查出的问题,进而达成尽可能提供与查询数据相近的数据的技术功效。再者,本发明的依据字词类别筛选相近字词的查找方法,可实现于硬件、软件或硬件与软件的组合中,亦可在计算机系统中以集中方式实现或以不同元件散布于若干互连的计算机系统的分散方式实现。虽然本发明所提供的实施方式如上,惟所述的内容并非用以直接限定本发明的专利保护范围。任何本发明所属技术领域中的技术人员,在不脱离本发明所公开的精神和范围的前提下,对本发明的实施的形式上及细节上作些许的更动润饰,均属于本发明的专利保护范围。本发明的专利保护范围,仍须以所附的权利要求书所界定者为准。
权利要求
1.一种依据字词类别筛选相近字词的查找方法,其特征在于,该查找方法至少包含下列步骤储存多个目标字词及分别与各该目标字词对应的各释义数据; 分类各该目标字词为至少一类别; 提供输入一查询数据;依据该查询数据对该些目标字词进行模糊查找,藉以查找出至少一结果字词;依据各该结果字词所属的类别过滤各该结果字词;及显示被保留的各该结果字词及被保留的各该结果字词所对应的释义数据。
2.如权利要求1所述的依据字词类别筛选相近字词的查找方法,其特征在于,该查找方法于该显示被保留的各该结果字词及被保留的各该结果字词所对应的释义数据的步骤前,更包含保留包含相同段落或相似段落的该些释义数据所对应的结果字词的步骤。
3.如权利要求1所述的依据字词类别筛选相近字词的查找方法,其特征在于,该方法更包含依据该查询数据至该目标字词中查找一该结果字词的步骤。
4.如权利要求1所述的依据字词类别筛选相近字词的查找方法,其特征在于,该分类该些目标字词为各该类别的步骤是依据各该释义数据所包含的关键字分类对应的各该目标字词或依据各该目标字词的词性分类各该目标字词。
5.如权利要求1所述的依据字词类别筛选相近字词的查找方法,其特征在于,该依据各该结果字词的类别过滤各该结果字词的步骤是依据各该分类所包含的各该结果字词的数量过滤各该结果字词。
6.一种依据字词类别筛选相近字词的查找系统,其特征在于,该查找系统至少包含 一储存模块,用以储存多个目标字词及分别与各该目标字词对应的各释义数据,各该目标字词属于至少一类别;一输入模块,用以提供输入一查询数据;一查找模块,用以依据该查询数据对该些目标字词进行模糊查找,藉以查找出至少一结果字词;一字词过滤模块,用以依据各该结果字词的类别过滤各该结果字词;及一显示模块,用以显示被保留的各该结果字词及被保留的各该结果字词所对应的释义数据。
7.如权利要求6所述的依据字词类别筛选相近字词的查找系统,其特征在于,该查找模块更用以依据该查询数据至该目标字词中查找一该结果字词。
8.如权利要求6所述的依据字词类别筛选相近字词的查找系统,其特征在于,该字词过滤模块更用以保留包含相同段落或相似段落的该些释义数据所对应的结果字词。
9.如权利要求6所述的依据字词类别筛选相近字词的查找系统,其特征在于,该字词过滤模块是依据各该类别所包含的各该结果字词的数量过滤各该结果字词。
10.如权利要求6所述的依据字词类别筛选相近字词的查找系统,其特征在于,该查找系统更包含一分类模块,用以依据各该释义数据所包含的一关键字分类对应的各该目标字词或依据各该目标字词的词性分类各该目标字词。
全文摘要
本发明公开了一种依据字词类别筛选相近字词的查找系统及其查找方法,其通过依据查询数据进行模糊查找而取得结果字词后,依据结果字词所属的类别过滤结果字词,并显示被保留的结果字词及结果字词所对应的释义数据的技术手段,可以查找出与查询数据同义的字词的释义数据,并达成尽可能提供与查询数据相近的数据的技术功效。
文档编号G06F17/30GK102456006SQ20101051254
公开日2012年5月16日 申请日期2010年10月14日 优先权日2010年10月14日
发明者喻梅花, 邱全成 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1