检索过滤方法及其处理装置的制造方法

文档序号:9922031阅读:294来源:国知局
检索过滤方法及其处理装置的制造方法
【技术领域】
[0001]本发明是关于一种检索过滤方法,且特别是一种可对检索结果进行聚类并提供给使用者选择的检索过滤方法及使用其的处理装置。
【背景技术】
[0002]随着科技的发展与成长,互联网已成为生活中不可或缺的一部份。互联网的普及带动了信息的迅速流动与大量累积,信息的取得大多仰赖互联网。由于互联网信息的传递与累积快速成长,互联网信息所包括的内容也大幅增加。
[0003]为了从庞大的互联网信息中获取所需的数据,使用者通常会搭配Google、Yahoo奇摩或百度等公共搜寻引擎。使用者可于搜寻引擎提供的搜寻列中输入关键字词。透过数据的检索技术,对搜寻引擎数据库的内容进行检索,并将检索结果提供给使用者。
[0004]然而,目前的检索技术对于使用者来说还是有许多不方便的地方。其原因在于,现今互联网信息的数据量庞大,所涵盖的信息五花八门,导致使用者必须要精准地输入关键字词才能获得关联性高的搜寻结果。换句话说,若使用者输入的关键字词不够准确,搜寻引擎所检索出的检索结果将包含许多关联性低的内容文本或网页,导致使用者无法取得所欲的信息。此外,即使使用者输入的关键字词准确,也仍会因为检索出来的内容文本或网页过多而导致无法逐一浏览,且并不完全符合使用者所需,因此需要一种检索过滤方法,将初步检索得到的内容文本或网页来做进一步分类,让使用者可以容易找到其所需要的内容文本或网页。

【发明内容】

[0005]本发明实施例提供一种检索过滤方法。所述检索过滤方法适用于处理装置。所述检索过滤方法包括以下步骤:步骤A:接收关键字词;步骤B:根据关键字词,经由搜寻引擎于互联网上进行检索以得到初步检索结果,初步检索结果包含有多个网页,且搜寻与对应关键字词的至少一相关字词;步骤C:依据初步检索结果,对相关字词进行聚类,并产生聚类结果,聚类结果包括至少一聚类群组;步骤D:输出聚类结果以供使用者从其中选择一聚类群组;步骤E:依据被选择的聚类群组,对初步检索结果进行过滤以产生对应的检索过滤结果。
[0006]本发明实施例提供一种处理装置。所述处理装置包括相关字词产生模块以及聚类单元。相关字词产生模块用以接收使用者输入的关键字词,并经由搜寻引擎于互联网上进行检索以得到初步检索结果,且搜寻与对应该关键字词的至少一相关字词。初步检索结果包含有多个网页。聚类单元电性连接于相关字词产生模块。聚类单元用以依据初步检索结果对相关字词进行聚类,并产生聚类结果。聚类结果包括至少一聚类群组。聚类单元输出聚类结果至操作介面以供使用者从其中选择一聚类群组。处理装置依据被选择的聚类群组,对初步检索结果进行过滤以产生对应的检索过滤结果。
[0007]综上所述,本发明实施例所提供的检索过滤方法及使用其的处理装置可依据初步检索结果对相关字词进行聚类,以产生聚类结果。使用者可依需求从聚类结果中选择想要的聚类群组,使得初步检索结果可以进一步地被过滤,并产生使用者想要的检索过滤结果。
[0008]为使能更进一步了解本发明之特征及技术内容,请参阅以下有关本发明之详细说明与附图,但是此等说明与所附附图仅是用来说明本发明,而非对本发明的权利范围作任何的限制。
【附图说明】
[0009]图1A是本发明实施例之处理装置的示意图。
[0010]图1B是本发明另一实施例之处理装置的示意图。
[0011]图2是本发明实施例之检索过滤方法的流程图。
[0012]图3是本发明实施例之产生相关字词的流程图。
[0013]图4是本发明实施例之产生同义字词的流程图。
[0014]图5是本发明实施例之产生聚类结果的流程图。
【具体实施方式】
[0015]在下文将参看随附附图更充分地描述各种例示性实施例,在随附附图中展示一些例示性实施例。然而,本发明概念可能以许多不同形式来体现,且不应解释为限于本文中所阐述之例示性实施例。确切而言,提供此等例示性实施例使得本发明将为详尽且完整,且将向熟习此项技术者充分传达本发明概念的范畴。在诸附图中,可能为了清楚而夸大示层及区之大小及相对大小。类似数字始终指示类似组件。
[0016]应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件或信号等,但此等组件或信号不应受此等术语限制。此等术语乃用以区分一组件与另一组件,或者一信号与另一信号。另外,如本文中所使用,术语「或」视实际情况可能包括相关联之列出项目中之任一者或者多者之所有组合。
[0017]请参阅图1A,图1A是本发明一实施例之处理装置的示意图。处理装置I适用于任一搜寻引擎或推荐系统,例如G00gle、Yah00奇摩或百度等搜寻引擎的处理器。处理装置I包括相关字词产生模块10以及聚类单元111。相关字词产生模块10接收使用者输入的关键字词,并经由搜寻引擎2于互联网上进行检索以得到初步检索结果,且搜寻与对应关键字词的至少一相关字词。初步检索结果通常包含有多个网页等数据。聚类单元111电性连接于相关字词产生模块10,可依据初步检索结果对相关字词进行聚类,然后产生聚类结果。聚类结果可能包括一个或多个聚类群组。聚类单元111输出聚类结果至操作介面3进行显示,且提供给使用者从多个聚类群组中选择一聚类群组。处理装置I再依据被选择的聚类群组,对初步检索结果(亦即前述所检索到的多个网页)进行过滤,以产生对应的检索过滤结果。
[0018]图1B是本发明另一实施例之处理装置的示意图。在此实施例中,处理装置1、相关字词产生模块10以及聚类单元111如前所述,而相关字词产生模块10更包括可能关联字词产生单元101、关联字词产生单元102以及同义字词产生单元103。可能关联字词产生单元101电性连接于搜寻引擎2、关联字词产生单元102以及同义字词产生单元103。关联字词产生单元102电性连接于聚类单元111。同义字词产生单元103电性连接于聚类单元111。聚类单元111电性连接于操作介面3。
[0019]可能关联字词产生单元101用接收搜寻引擎产生的初步检索结果,初步检索结果包含了多个网页等数据。接着,可能关联字词产生单元101自多个网页中的多个内容文本中获得内容文本各自对应的至少一可能关联字词。前述的内容文本可以是在网页中的任何文字。
[0020]关联字词产生单元102用以根据使用者输入的关键字词与可能关联字词于内容文本中同时出现于同一句子的次数产生相关字词。当关键字词与可能关联字词同时出现于同一句子的次数大于第一阈值时,可能关联字词被列为相关字词。相关字词是指关键字词的同义字词、与关键字词相关的关联字词、或是同一内容文本中常共同出现于同一句子的字词。
[0021]同义字词产生单元103用以根据关键字词与可能关联字词于内容文本中同时出现于同一句子的次数产生候补字词。当关键字词与可能关联字词同时出现于同一句子的次数小于第二阈值、且大于第三阈值时,可能关联字词被判定为关键字词的候补字词。接着,同义字词产生单元103再进一步判断候补字词是否为关键
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1