一种索引文件同步方法、索引服务器和搜索系统的制作方法

文档序号:6576657阅读:279来源:国知局
专利名称:一种索引文件同步方法、索引服务器和搜索系统的制作方法
技术领域
本发明涉及索引技术,更具体地说,涉及一种索引文件同步方法、索引服务器和搜
索系统。
背景技术
随着数字化信息存储技术的日渐成熟,信息的全文检索得到了广泛的应用。从互 联网搜索引擎,到图书馆图书搜索,信息全文检索技术的应用随处可见。 面对庞大的信息库,为提高全文检索的效率,往往需要对信息构建索引。以互联网 搜索引擎为例,搜索引擎公司必须对每天挖掘的大量网页数据构建索引,才能保障每日数 以千万计的网页搜索请求得到快速的响应。索引构建任务计算量大,需要配置专门的硬件 设备来完成。因此,在现有技术中,往往配置专门的索引服务器来执行索引构建任务。在这 种情况下,具体的搜索任务(即将输入的关键字与构建的索引进行匹配,以输出搜索结果) 将由专门的搜索服务器来完成。 由于索引文件经常更新,因此需要在索引服务器和搜索服务器之间同步索引文 件。现有技术通常采用FTP传送方式来同步索引文件。尽管可以完成索引文件的传送任 务,但FTP传送方式存在诸多缺陷。例如,首先,FTP传送方式需要进行较为复杂的FTP配 置。其次,在具体使用过程中,FTP传送方式需要进行一系列交互式的应用层操作。再次, FTP传送方式在每次传送过程开始前都需要进行密码验证,在验证成功后方可以开始传递, 如果FTP验证密码发生变化例如经过修改,则发送方无法再使用原有密码进行文件传送。 由此可见,FTP传送方式的操作过程十分复杂。 因此,需要一种索引文件同步方案,能够有效克服现有技术之中存在的上述缺陷。

发明内容
本发明要解决的技术问题在于,针对现有基于FTP传送方式的索引文件同步方案
操作过程相对复杂的缺陷,提供一种索引文件同步方法、索引服务器和搜索系统。 本发明解决其技术问题所采用的技术方案是 构造一种索引文件同步方法,用于在索引服务器和搜索服务器之间同步索引文 件,其中,所述索引文件存储在所述索引服务器中,所述搜索服务器上设置有索引文件存储 目录,所述方法包括,索引服务器执行将所述索引文件复制到通过SSHFS进程挂接到所述 索引文件存储目录的本地虚拟目录下的操作,以通过SSHFS进程将所述索引文件传送到所 述搜索服务器的索引文件存储目录下。 在本发明提供的索引文件同步方法中,所述方法具体包括,所述索引服务器基于 所述索引文件的生成时间戳,执行将所述索引文件复制到所述本地虚拟目录下由该生成时 间戳标识的子目录下的操作,以通过所述SSHFS进程将所述索引文件传送到所述搜索服务 器的索引文件存储目录下由该生成时间戳标识的子目录下。 在本发明提供的索引文件同步方法中,在所述索引文件复制完成之后,所述方法还包括,所述索引服务器向所述搜索服务器发出完成通知。 本发明还提供了一种索引服务器,与搜索服务器通信连接,其中,该搜索服务器上 设置有索引文件存储目录,该索引服务器中存储有索引文件,所述索引服务器包括
SSHFS模块,用于执行SSHFS进程,以将本地虚拟目录挂接到所述搜索服务器上的 索引文件存储目录; 同步模块,用于执行将所述索引文件复制到所述本地虚拟目录下的操作,以通过
所述SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下。 在本发明提供的索引服务器中,所述同步模块用于基于所述索引文件的生成时间
戳,执行将所述索引文件复制到所述本地虚拟目录下由该生成时间戳标识的子目录下的操
作,以通过所述SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下
由该生成时间戳标识的子目录下。 在本发明提供的索引服务器中,还包括 通知模块,用于在所述索弓I文件复制完成之后,向所述搜索服务器发出完成通知。
本发明还提供了一种搜索系统,包括
搜索服务器,其上设置有索引文件存储目录;
索引服务器,与搜索服务器通信连接,用于
存储索引文件;以及, 执行将所述索引文件复制到通过SSHFS进程挂接到所述索引文件存储目录的本 地虚拟目录下的操作,以通过SSHFS进程将所述索引文件传送到所述搜索服务器的索引文 件存储目录下。 在本发明提供的搜索系统中,
所述索引服务器包括 SSHFS模块,用于执行SSHFS进程,以将所述本地虚拟目录挂接到所述搜索服务器 上的索引文件存储目录; 同步模块,用于执行将所述索引文件复制到所述本地虚拟目录下的操作,以通过
所述SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下。 在本发明提供的搜索系统中,所述同步模块用于基于所述索引文件的生成时间
戳,执行将所述索引文件复制到所述本地虚拟目录下由该生成时间戳标识的子目录下的操
作,以通过所述SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下
由该生成时间戳标识的子目录下。 在本发明提供的搜索系统中, 所述索引服务器还包括 通知模块,用于在所述索引文件复制完成之后,向所述搜索服务器发出完成通知。
实施本发明的技术方案,具有以下有益效果在本发明提供的索引文件同步方法、 索引服务器和搜索系统中,索引服务器通过调用SSHFS进程,来将本地虚拟目录挂接到搜 索服务器上的索引文件存储目录。如此一来,索引服务器便可通过将索引文件复制到本地 虚拟目录的方式,来通过SSHFS进程将索引文件传送到搜索服务器。SSHFS只需要进行简 单的命令操作即可完成目录的挂接,且同步过程只需要进行简单的文件复制;由于SSHFS 传送方式是建立在SSH的基础之上的,因此一旦一台机器向另外一台机器授权,完成目录挂接,则后续的文件传递不受SSH账户密码被修改的影响。由此可见,本发明提供的基于 SSHFS方式的索引文件同步方案操作过程简单,易于上手,且传送效率高。


下面将结合附图及实施例对本发明作进一步说明,附图中 图1是依据本发明一较佳实施例的搜索系统应用环境的逻辑结构示意图; 图2是依据本发明一较佳实施例的索引服务器的逻辑结构示意图。
具体实施例方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。 本发明提供了一种索引文件同步方法、索引服务器和搜索系统,其中,索引服务器 通过调用SSHFS进程,来将本地虚拟目录挂接到搜索服务器上的索引文件存储目录。如此 一来,索引服务器便可通过将索引文件复制到本地虚拟目录的方式,来通过SSHFS进程将 索引文件传送到搜索服务器。SSHFS只需要进行简单的命令操作即可完成目录的挂接,且同 步过程只需要进行简单的文件复制;由于SSHFS传送方式是建立在SSH的基础之上的,因此 一旦一台机器向另外一台机器授权,完成目录挂接,则后续的文件传递不受SSH账户密码 被修改的影响。由此可见,本发明提供的基于SSHFS方式的索引文件同步方案操作过程简 单,易于上手,且传送效率高。下面就结合附图和具体实施例来对本发明提供的技术方案进 行详细描述。 图1是依据本发明一较佳实施例的搜索系统应用环境100的逻辑结构示意图。如
图1所示,其中示出了通信终端102、104和106,以及搜索系统110。其中,通信终端102、
104和106通过互联网108与搜索系统110通信连接,搜索系统110进一步包括搜索服务器
112和索引服务器114,其中,搜索服务器112和索引服务器114通信连接。 通信终端102可以是固定式通信终端,例如但不限于台式计算机。 通信终端104可以是移动式通信终端,例如但不限于智能手持机。 通信终端106可以是移动式通信终端,例如但不限于笔记本计算机。 索引服务器114和搜索服务器112通过执行SSHFS (Secure SHellFileSystem,安
全外壳文件系统)进程实现彼此之间特定目录的挂接。SSHFS进程运行于UNIX和Linux操
作系统之上。 搜索服务器112上设置有索引文件存储目录,索引服务器114则设有一本地虚拟 目录。该本地虚拟目录通过SSHFS进程挂接到搜索服务器112上的索引文件存储目录。在 具体实现过程中,本地虚拟目录仅为一虚拟目录,其实际上并不存在。 索引服务器114用于构建和存储索引文件,以及执行将索引文件复制到本地虚拟 目录下的操作。由于该本地虚拟目录通过SSHFS进程挂接到搜索服务器112上的索引文件 存储目录,因此,复制的索引文件将通过SSHFS进程传送到搜索服务器112的索引文件存储 目录下。 应注意,在具体实现过程中,通信终端102、 104和106还可采用其他方式与搜索系
6统110相连。 下面结合图2对索引服务器114的具体结构进行描述。 图2是依据本发明一较佳实施例的索引服务器200的逻辑结构示意图。如上文所 述,索引服务器200与搜索服务器通信连接,其中,该搜索服务器上设置有索引文件存储目 录,该索引服务器中存储有索引文件。如图2所示,索引服务器200进一步包括彼此通信连 接的SSHFS模块202和同步模块204。 SSHFS模块202用于执行SSHFS进程,以将本地虚拟目录挂接到搜索服务器上的索 引文件存储目录。 同步模块204用于执行将索引文件复制到本地虚拟目录下的操作,以通过SSHFS 模块202将索引文件传送到搜索服务器的索引文件存储目录下。 在具体实现过程中,同步模块204还可基于索引文件生成时的生成时间戳,执行 将索引文件复制到本地虚拟目录下由该生成时间戳标识的子目录下的操作,以通过SSHFS 模块202将索引文件传送到搜索服务器的索引文件存储目录下由该生成时间戳标识的子 目录下。 作为可选的,索引服务器200还可进一步包括通知模块206,用于在索引文件复制 完成之后,向搜索服务器发出完成通知。 由上文所述可知,本发明提供了一种索引文件同步方法,用于在索引服务器和搜 索服务器之间同步索引文件,其中,索引文件存储在索引服务器中,搜索服务器上设置有索 引文件存储目录。该方法包括,索引服务器执行将索引文件复制到通过SSHFS进程挂接到 索引文件存储目录的本地虚拟目录下的操作,以通过SSHFS进程将索引文件传送到搜索服 务器的索引文件存储目录下。 在具体实现过程中,本发明提供的索引文件同步方法具体包括,索引服务器基于 索引文件的生成时间戳,执行将索引文件复制到本地虚拟目录下由该生成时间戳标识的子 目录下的操作,以通过SSHFS进程将索引文件传送到搜索服务器的索引文件存储目录下由 该生成时间戳标识的子目录下。 此外,在索引文件复制完成之后,本发明提供的索引文件同步方法还包括,索引服 务器向搜索服务器发出完成通知。 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
一种索引文件同步方法,用于在索引服务器和搜索服务器之间同步索引文件,其中,所述索引文件存储在所述索引服务器中,所述搜索服务器上设置有索引文件存储目录,其特征在于,所述方法包括,索引服务器执行将所述索引文件复制到通过SSHFS进程挂接到所述索引文件存储目录的本地虚拟目录下的操作,以通过SSHFS进程将所述索引文件传送到所述搜索服务器的索引文件存储目录下。
2. 根据权利要求1所述的索引文件同步方法,其特征在于,所述方法具体包括,所述索 引服务器基于所述索引文件的生成时间戳,执行将所述索引文件复制到所述本地虚拟目录 下由该生成时间戳标识的子目录下的操作,以通过所述SSHFS进程将所述索引文件传送到 所述搜索服务器的索引文件存储目录下由该生成时间戳标识的子目录下。
3. 根据权利要求1或2所述的索引文件同步方法,其特征在于,在所述索引文件复制完 成之后,所述方法还包括,所述索引服务器向所述搜索服务器发出完成通知。
4. 一种索引服务器,与搜索服务器通信连接,其中,该搜索服务器上设置有索引文件存 储目录,该索引服务器中存储有索引文件,其特征在于,所述索引服务器包括SSHFS模块,用于执行SSHFS进程,以将本地虚拟目录挂接到所述搜索服务器上的索引 文件存储目录;同步模块,用于执行将所述索引文件复制到所述本地虚拟目录下的操作,以通过所述 SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下。
5. 根据权利要求4所述的索引服务器,其特征在于,所述同步模块用于基于所述索引 文件的生成时间戳,执行将所述索引文件复制到所述本地虚拟目录下由该生成时间戳标识 的子目录下的操作,以通过所述SSHFS模块将所述索引文件传送到所述搜索服务器的索引 文件存储目录下由该生成时间戳标识的子目录下。
6. 根据权利要求4或5所述的索引服务器,其特征在于,还包括通知模块,用于在所述索弓I文件复制完成之后,向所述搜索服务器发出完成通知。
7. —种搜索系统,其特征在于,包括 搜索服务器,其上设置有索引文件存储目录; 索引服务器,与搜索服务器通信连接,用于 存储索引文件;以及,执行将所述索引文件复制到通过SSHFS进程挂接到所述索引文件存储目录的本地虚 拟目录下的操作,以通过SSHFS进程将所述索引文件传送到所述搜索服务器的索引文件存 储目录下。
8. 根据权利要求7所述的搜索系统,其特征在于, 所述索引服务器包括SSHFS模块,用于执行SSHFS进程,以将所述本地虚拟目录挂接到所述搜索服务器上的 索引文件存储目录;同步模块,用于执行将所述索引文件复制到所述本地虚拟目录下的操作,以通过所述 SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下。
9. 根据权利要求7所述的搜索系统,其特征在于,所述同步模块用于基于所述索引文 件的生成时间戳,执行将所述索引文件复制到所述本地虚拟目录下由该生成时间戳标识的 子目录下的操作,以通过所述SSHFS模块将所述索引文件传送到所述搜索服务器的索引文件存储目录下由该生成时间戳标识的子目录下。
10.根据权利要求7至9中任一项所述的搜索系统,其特征在于,所述索引服务器还包括通知模块,用于在所述索引文件复制完成之后,向所述搜索服务器发出完成通知。
全文摘要
本发明涉及索引技术,针对现有基于FTP传送方式的索引文件同步方案操作过程相对复杂的缺陷,提供一种索引文件同步方法、索引服务器和搜索系统。索引文件同步方法包括,索引服务器执行将索引文件复制到通过SSHFS进程挂接到索引文件存储目录的本地虚拟目录下的操作,以通过SSHFS进程将索引文件传送到搜索服务器的索引文件存储目录下。本发明还提供了索引服务器和搜索系统。通过调用SSHFS进程来将本地虚拟目录挂接到搜索服务器上的索引文件存储目录,索引服务器通过将索引文件复制到本地虚拟目录来通过SSHFS进程将索引文件传送到搜索服务器,操作过程简单,易于上手,且传送效率高。
文档编号G06F17/30GK101702159SQ200910110348
公开日2010年5月5日 申请日期2009年10月28日 优先权日2009年10月28日
发明者刘克鸿, 刘飞, 杨丰, 杨旗, 王有为, 蒋铮, 马慧 申请人:卓望数码技术(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1