通用搜索引擎的制作方法

文档序号:6583967阅读:235来源:国知局
专利名称:通用搜索引擎的制作方法
技术领域
本公开涉及通用搜索引擎,更具体说,涉及可以用于用若干种不同语言进行搜索的搜索引擎。
一般地,每个搜索引擎适用于用一种单独的语言对信息搜索。在用户希望用另一种语言进行搜索的地方,用户通常必须访问一个不同的搜索站点。为了方便地查找这样的一些搜索站点,若干现有的搜索站点提供到其他网络站点的连接,这些网络站点能把用户引导到一个适用于用其他语言执行搜索的搜索引擎。虽然给用户提供查找这样的一些搜索引擎装置,用户可以被迫通过若干网络站点导航直到最后到达所要求的搜索站为止。由于用户以后返回他或她在其处开始的原来站点会是困难的,这对于用户是不方便的,并且会引起失败。
在企图减轻这些问题时,现在某些服务提供方维持能进行不同语言数据库搜索的单独搜索站点。然而,不幸的是,这些安排需要额外的支持人员维持这些单独站点。另外,经常把不同站点对着从属于与个别语言不同的个别国家的信息,因此限制了潜在地有可能被用户访问的信息量。
从上述可以认识到,有一种能进行各种不同语言数据库搜索的通用搜索引擎是合乎希望的。
使用通用搜索引擎可以实现该方法,该引擎被配置为用若干种不同种语言中的任何一种进行搜索。在一个实施例中,通用搜索引擎包括用于同用户接口的装置和用于用若干种不同现有搜索语言的一种搜索若干不同现有语言数据库的一个的装置。
本公开还涉及搜索引擎软件。在一种安排中,该软件包括为把用户接口提供给用户而配置的逻辑,为接收个别搜索语言的标识而配置的逻辑,为使用用户接口接收搜索查询而配置的逻辑以及为搜索包含用该标识语言的信息的数据库而配置的逻辑。
在结合附图阅读下面的详细说明时,本发明的其他系统、方法、特征和优点将成为明显可见。


图1是通用搜索引擎的示意性操作环境的示意图。
图2是图1所示的计算方法的示意图。
图3是图1所示的网络服务器的示意图。
图4是表示图3所示通用搜索引擎操作例子的流程图。
图5是示意性通用搜索页的示意图。
图6是通用搜索引擎和多个不同语言数据库之间关系的示意表示。
现在参照附图。在这些附图中相同的数字都表示几个视图中的相应部分。图1表示在其中可以使用通用搜索引擎的例子性操作环境100。如该图所示,操作环境100可以包括一个或几个计算设备102,举例说,这可以包括一些个人计算机(PC)。如图1上进一步表示的,每个计算设备102可以连接到网络104上。网络104一般包括一个或几个子网络。这些子网络通信上互相连接。例如,这些网络可以包括一个或几个局域网络(LAN)和/或广域网络(WAN)。然而,网络104一般包括构成因特网一部分的一组网络。也如所示的,连接到网络104的是网络服务器106。该网络服务器106操作通用搜索引擎。虽然己说明和表示了网络服务器,但要认识到服务器只被看作一个例子,无意用于限制本公开的范围。
图2是一个表示计算设备102结构实例的示意图。如图2所示,每个计算设备102可以包括处理设备200、存储器202、一个或几个用户接口设备204、显示器206、一个或几个网络接口设备208以及每个其他组元电连接到其上的本机接口210。本机接口210可以有附加元件,例如,为能够进行通信的控制器、缓冲器(高速缓冲存储器)、驱动器、中继器和接收器,为简单起见被省略。另外,本机接口210还可以包括使适当的通信能够在上述组元间进行的地址、控制和/或数据连接。
处理设备200可以包括任何定制的或市场上买得到的处理器、中央处理单元(CPU)或与计算设备102有关的若干处理器中的辅助处理器、半导体基础的微处理器(以微芯片形式)或宏处理器。存储器202可以包括任何易失存储元件(例如,随机存取存储器(RAM、例如DRAM、SRAM等))和非易失存储元件(例如,ROM、硬磁盘驱动器、磁带、CDROM等)组合的存储器。
用户接口设备204一般包括通常同PC一起使用的用户接口设备。例如,用户接口设备204可以包括键盘和鼠标器。同样地,显示器206可以包括一般同PC一起使用的显示设备,例如计算机监视器。一个或几个网络接口设备208包括计算设备102用其发送和接收网络104上的信息的硬件。举例说,网络接口设备208包括即传递输入又传递输出的组元,例如调制器/解调器(例如调制解调器)、射频(RF)或其他收发信机、电话接口、桥接器、路由器等。
存储器202包括各种包含操作系统212和网络浏览程序214的软件程序。操作系统212控制其他软件,例如,网络浏览程序214的执行,并提供调度、输入输出控制、文件和数据管理、存储管理和通信控制及相关业务。网络浏览程序214是为使网络104的连接和导航有可能而被配置。举例说,网络浏览程序214可以包括网浏览程序,例如,出自Microsoft公司的因特网ExplorerTM(探测程序)或出自Netscape公司的Netscape NavigatorTM(导航程序)。虽然操作系统212和网络浏览程序214只是在存储器202中识别的程序,本专业技术人员会认识到,其他程序也可以储存在存储设备内,如果需要。
图3是表示网络服务器106结构实例的示意图。如图3上所示,网络服务器106可以有与计算设备102类似的配置。因此,网络服务器106可以包括处理设备300、存储器302、一个或几个用户接口设备304、显示器306、一个或几个网络接口设备308以及每个其他组元电连接到其上的本机接口310。处理设备300可以包括任何定制的或市场上买得到的处理器、中央处理单元(CPU)或若干与网络服务器106有关的服务器中的辅助服务器、半导体基础的微处理器(以微芯片形式)或宏处理器。存储器302可以包括任何易失存储元件(例如,随机存取存储器(RAM、例如DRAM、SRAM等))和非易失存储元件(例如,ROM、硬磁盘驱动器、磁带、CDROM等)组合的存储器。
如同计算设备102的情形一样,网络服务器106的用户接口设备304可以包括键盘和鼠标器;而显示器306可以包括计算机监视器。一个或几个网络接口设备308包括网络服务器106用其发送和接收网络104上的信息的硬件,还包括即传递输入又传递输出的组元,例如调制器/解调器(例如调制解调器)、射频(RF)或其他收发信机、电话接口、桥接器、路由器等。
存储器302包括各种包括操作系统312、通用搜索引擎314和语言翻译程序316的软件程序。操作系统312控制其他软件,例如,通用搜索引擎314和语言翻译程序316的执行,并提供调度、输入输出控制、文件和数据管理、存储管理和通信控制及相关业务。通用搜索引擎314是为接收搜索查询和来自计算设备102的其他输入以及根据这些查询进行搜索而被配置。语言翻译程序316的配置是为翻译用户通过通用搜索引擎314输入的搜索查询,以致先前的搜索查询能被用作在不同语言数据库进行的搜索的基础。通用搜索引擎314和语言翻译程序316的运作将参照图3在下面讨论。除了这些程序外,存储器302还可以包括数据库318。如下面要讨论的,数据库318可以包括若干不同语言数据库。每个数据库与用不同语言写的信息有关。
各种软件和/或固件程序已在这里说明。应该理解到,这些程序能被储存在任何计算机可读媒体上,为任何计算机有关系统或方法所使用或与它们连接使用。在本文件的情况下,计算机可读媒体是电子的、磁的、光的或其他的物理设备或装置,它们可以包含或储存计算机程序,为计算机有关系统或方法所使用或者与它们连接使用。这些程序可以配备在任何计算机可读媒体中,为指令执行系统、装置或设备,例如,计算机基础的系统、含有处理器的系统或者其它系统所使用或者与它们连接使用;它们能从指令执行系统、装置或设备取出这些指令并执行这些指令。在本文件的情况下,“计算机可读媒体”可以是任何能储存、传递、传送或传输为指令执行系统、装置或设备所使用或者与它们连接使用的程序的装置。
计算机可读媒体可以是例如但不限于电子的、磁的、光的、电磁的、红外的或半导体的系统、装置、设备或者传送媒体。计算机可读媒体的更具体例子(不详尽的列举)包括具有一个或几个线的电连接、便携计算机软盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM、EEPROM、或快闪存储器)、光纤以及便携光盘只读存储器(CDROM)。要注意计算机可读媒体甚至可以是在上面打印了程序的纸或另外的适当媒体。因为该程序可以通过,例如,该纸或其他媒体的光扫描被电子捕获,然后被编译、解释或者,如果需要,以适当的方式做另外处理,再然后被储存计算机的存储器中。
在上面己描述了一个通用搜索引擎314的操作环境100的实例。现在来讨论通用搜索引擎314的操作。在接着的讨论中,提供一个流程图。应该理解到,在显示的方框内的功能说明和流程图的其他单元代表包括用于实现具体逻辑功能或步骤的一个或几个可执行指令的编码模块、段或部分。本专业技术人员会认识到,另外方式的实现是可行的。此外,取决于所涉及的功能性,可以脱离表示或讨论的顺序执行功能或步骤,包括基本上同时或相反顺序。
现在参照图4A和4B,所图示的是一个通用搜索引擎314的操作例子。如方框400中所指示的,首先启动通用搜索引擎314。该启动通常包括用计算设备102通过一个地址(例如通用资源定位器(URL))输入的为用于同通用搜索引擎接口的通用搜索站点的通用搜索引擎314访问。一旦通用搜索引擎314被启动,例如用用户的计算设备102的显示器206就能把通用搜索站点提供给用户,如在方框402中所示。在图5上示意地表示了一个例子性通用搜索站点500。如在该图上所表示的,通用搜索站点500可以包括一个包装502和至少部分地为该包装所围绕的一个本体部分504。在包装502内可以提供一个边侧导航条506和一个顶部导航条508。虽然表示和描述了这样的导航条506、508,但将认识到,这些性能是任选的,并且如果需要可以被省略。在被提供的地方,导航条506和508能提供对其他用户希望访问的网站或网页的访问。如在下面更详细讨论的,通用搜索站点500的本体部分504被用于访问通用搜索引擎314。一般用默认语言(例如英语)把通用搜索站点500提供给用户,由用户或维持该通用搜索站点的服务提供方预选默认语言。
返回到图4A。一旦通用搜索站点500己被提供给用户,就可以确定用户是否愿意把搜索语言从默认语言改变到另一种语言,如判定单元404所示。如果用户不希望改变语言,流程继续向下到下面说明的方框410。另一方面,如果用户正希望改变语言,流程继续到方框406,在其处接收用户的选择。参照图5,通过下拉式菜单510可以接收用户选择。下拉式菜单510列出各种可供用户选择的现有语言的每一种。虽然在图5标识各种特定语言,但应该理解到,基本上任何语言都能在下拉式菜单510中被标识。此外,虽然表示和说明了下拉式菜单,但本专业技术人员会认识到,也能使用许多用于为用户选择提供选项的其他菜单。较可取的是,每种语言用那个特定语言标识,以便有助于用户查找所要求的语言。
在这时,通用搜索引擎314重配置通用搜索站点500,如方框408中所示。在一种优选的安排中,如此重配置通用搜索站点500,使得该站点的本体部分504被翻译成所选择的语言,而该站点的包装502保持不变。在这种情况下,用户会认识到,他或她仍在观察同一站点,在该站点他或她的语言选择已经进行。
一旦以上述方式重配置通用搜索站点500,通用搜索引擎314可以接收来自用户的搜索查询,如方框410所示。举例说,通用搜索站点500可以包括位于本体部分504内的数据段512,用户可以在这里输入搜索词和/或词组。如同常规搜索站点,通用搜索站点500可以通过另外的数据段514任选地允许用户选择将返回的搜索结果的数目。在己接收到搜索查询后,通用搜索引擎314进行可适用数据库的搜索,如方框412所示。由于为用若干种不同语言进行搜索而配置通用搜索引擎314,该通用搜索引擎一般有对若干不同的包含在数据库318内的语言数据库的访问。在图6上示意地表示这种关系。如该图所示,通用搜索引擎314连接到若干种不同语言数据库600。虽然在图6上标识特定语言,但应该理解到,通用搜索引擎314可以对用基本上是任何语言包含信息的数据库进行访问。
返回到图4A。一旦通用搜索引擎314己进行了搜索,就可以对用户提供搜索结果,如方框414所示。举例说,这些结果可以包括一个或几个网络站点(例如网点)的名称和/或简要说明、网络页(例如网页)、文件等。在这时,用户自由选择和/或观察这些结果的一个或几个,如果需要。参考图4B的判定单元416,则可以确定用户是否愿意提出不同搜索查询并因而进行当前数据库600的新搜索。如果愿意,流程返回到图4A的方框410,在此处通用搜索引擎314接收新查询。然而,如果不愿意,流程继续到判定单元418,在此处可以确定用户是否愿意进行不同语言数据库600的搜索。如果不愿意,流程终止。另一方面,如果用户愿意进行一个不同数据库600因而不同语言的搜索,接收用户的语言选择,如方框420所示。例如通过在上面标识的下拉式菜单510,用另一个下拉式菜单(未示出)或用某个其他选择便利的接口可以接收该选择。
一旦接收到语言选择,流程继续到方框422,在此处以上述方式把通用搜索站点500重配置成所选择的语言。然而,在这个情况下,先前使用的搜索查询也被翻译成所选择的语言。这种翻译可以通过语言翻译器316来实现。举例说,语言翻译器316参照语言转换图表或通过适用的语言翻译算法翻译搜索查询的词或词组。在这时,可以确定用户是否愿意用现在己翻译的先前查询进行搜索,如判定单元424所示,或者用户是否愿意用不同的查询进行新的搜索。在后者的情况下,流程返回到图4A的410,在此处用户可以用上述方式输入新的查询。然而,在前者的情况下,流程返回到图4A的412,在此处通用搜索引擎314进行搜索,但这时是在不同语言数据库600进行。在用户己完成他或她的适用数据库600的搜索后,用户可以任选地通过利用语言翻译器316或其他适当翻译装置选择翻译搜索结果的内容。
当经过以上述说明和用于举例目的附图详细地公开本发明的个别实施例时,本专业技术人员应该理解到,在不脱离在接着的权利要求中所述的本发明范围的情况下可以做出本发明的变化和改进。
权利要求
1.一种用于对储存信息进行搜索的方法,包括步骤把用户接口提供给用户(402);接收用其搜索的个别语言的标识;接收搜索查询(410);以及对包含用标识的语言写的信息的数据库进行搜索(412)。
2.权利要求1的方法,其中用户接口包括可以通过因特网访问的网点(500)。
3.权利要求1的方法,其中从一组若干种每种从属于不同语言数据库的不同现有语言中选择搜索语言。
4.权利要求1的方法,进一步包括接收对用其进行搜索的不同语言的选择的步骤(406)。
5.权利要求4的方法,进一步包括重配置用户接口提供不同的搜索语言的步骤(408)。
6.权利要求4的方法,进一步包括把搜索查询翻译成不同语言的步骤。
7.权利要求6的方法,进一步包括为翻译的搜索查询在包含用不同语言写的信息的数据库进行搜索的步骤。
8.权利要求1的方法,进一步包括在搜索被用户选择的语言期间翻译查找的结果。
9.一种通用搜索引擎,包括用于同用户接口的装置;用于用若干种不同现有搜索语言的一种搜索若干不同现有语言数据库的一个的装置;以及在选择不同搜索语言时重配置用于同用户接口的装置的装置。
10.权利要求9的搜索引擎,进一步包括用于把搜索查询翻译成不同语言的装置。
全文摘要
本公开涉及一种为用若干种不同语言中的任何一种进行搜索而配置的通用搜索引擎。因此该通用搜索引擎可以用在对储存信息进行搜索的方法中。该方法包括步骤把用户接口提供给用户(402);接收用其搜索的个别搜索语言的标识;接收搜索查询(410);以及进行包含用标识的语言写的信息的数据库的搜索(412)。
文档编号G06F17/30GK1399212SQ02126530
公开日2003年2月26日 申请日期2002年7月19日 优先权日2001年7月20日
发明者D·G·约翰逊, B·L·约翰逊, P·莱克莱尔克 申请人:惠普公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1