一种数据处理方法及搜索服务器、同步服务器的制造方法

文档序号:10655364
一种数据处理方法及搜索服务器、同步服务器的制造方法
【专利摘要】本发明实施例公开了一种数据处理方法,包括:搜索服务器接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的;所述搜索服务器根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息;所述搜索服务器根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。本发明实施例同时还公开了一种搜索服务器和同步服务器。
【专利说明】
一种数据处理方法及搜索服务器、同步服务器
技术领域
[0001]本发明涉及数据处理技术,尤其涉及一种数据处理方法及搜索服务器、同步服务器。
【背景技术】
[0002]现有分词器如mmSeg4j的词库文件通常会保存在搜索服务器本地,应用商店通过搜索服务器进行搜索,所以,搜索服务器需要及时更新自身的词库文件;但是,现有搜索服务器常为分布式集群,因此,应用商店均会通过安全文件传送协议(SFTP,Secure FileTransfer Protocol),或者文件传输协议(FTP,File Transfer Protocol)等类似的协议将更新指令发送至分布式集群所对应的多个搜索服务器,调用每个搜索服务器的更新接口,重载词库文件,以使新的词库文件生效;这样,由于每个搜索服务器都有与自身对应的一份词库文件,所以会造成词库文件不一致的问题,进而导致每个搜索服务器的分词效果不同。因此,亟需一种方法以至少解决上述问题。

【发明内容】

[0003]有鉴于此,本发明实施例提供了一种数据处理方法及搜索服务器、同步服务器,能够至少解决现有技术中所存在的问题。
[0004]本发明实施例的技术方案是这样实现的:
[0005]本发明实施例第一方面提供了一种数据处理方法,包括:
[0006]搜索服务器接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的;
[0007]所述搜索服务器根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息;
[0008]所述搜索服务器根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。
[0009]上述方案中,所述方法还包括:
[0010]所述搜索服务器基于更新后的自身对应的词库文件重建索引列表;
[0011]将重建的索引列表替换未更新前的索引列表。
[0012]上述方案中,所述方法还包括:
[0013]所述搜索服务器更新完成自身对应的词库文件后,向所述同步服务器发送更新响应信息;其中,所述更新响应信息用于控制所述同步服务器修改所述待更新词库文件所对应的状态,以将所述待更新词库文件的状态从待更新状态修改至更新完成状态。
[0014]本发明实施例第二方面提供了一种数据处理方法,包括:
[0015]同步服务器检测自身存储的与词库文件数据库对应的至少一个词库文件的状态是否处于待更新状态;
[0016]当确定出自身存储的与词库文件数据库对应的至少一个词库文件处于待更新状态时,所述同步服务器将处于待更新状态的至少一个词库文件作为待更新词库文件,生成与所述待更新词库文件对应的词库文件更新信息;
[0017]所述同步服务器将所述词库文件更新信息发送至搜索服务器。
[0018]上述方案中,所述方法还包括:
[0019]所述同步服务器获取所述词库文件数据库对应的至少一个词库文件的状态以及位置信息,并存储所述词库文件数据库对应的至少一个词库文件的状态以及位置信息;其中,所述状态至少包括待更新状态和更新完成状态。
[0020]上述方案中,所述方法还包括:
[0021 ]所述同步服务器接收所述搜索服务器发送的更新响应信息;
[0022]所述同步服务器根据所述更新响应信息,修改与所述更新响应信息所对应的待更新词库文件的状态,以将所述更新响应信息所对应的待更新词库文件的状态从待更新状态修改至更新完成状态。
[0023 ]本发明实施例第三方面提供了一种搜索服务器,包括:
[0024]第一信息接收单元,用于接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的;
[0025]信息获取单元,用于根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息;
[0026]数据更新单元,用于根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。
[0027]上述方案中,所述数据更新单元,还用于基于更新后的自身对应的词库文件重建索引列表;将重建的索引列表替换未更新前的索引列表。
[0028]上述方案中,所述搜索服务器还包括:
[0029]第一信息发送单元,用于更新完成自身对应的词库文件后,向所述同步服务器发送更新响应信息;其中,所述更新响应信息用于控制所述同步服务器修改所述待更新词库文件所对应的状态,以将所述待更新词库文件的状态从待更新状态修改至更新完成状态。
[0030]本发明实施例第四方面提供了一种同步服务器,包括:
[0031 ]检测单元,用于检测自身存储的与词库文件数据库对应的至少一个词库文件的状态是否处于待更新状态;
[0032]信息生成单元,用于当确定出自身存储的与词库文件数据库对应的至少一个词库文件处于待更新状态时,所述同步服务器将处于待更新状态的至少一个词库文件作为待更新词库文件,生成与所述待更新词库文件对应的词库文件更新信息;
[0033]第二信息发送单元,用于将所述词库文件更新信息发送至搜索服务器。
[0034]上述方案中,所述同步服务器还包括:
[0035]存储单元,用于获取所述词库文件数据库对应的至少一个词库文件的状态以及位置信息,并存储所述词库文件数据库对应的至少一个词库文件的状态以及位置信息;其中,所述状态至少包括待更新状态和更新完成状态。
[0036]上述方案中,所述同步服务器还包括:
[0037]第二信息接收单元,用于接收所述搜索服务器发送的更新响应信息;
[0038]信息调整单元,用于根据所述更新响应信息,修改与所述更新响应信息所对应的待更新词库文件的状态,以将所述更新响应信息所对应的待更新词库文件的状态从待更新状态修改至更新完成状态。
[0039]本发明实施例所述的数据处理方法及搜索服务器、同步服务器,通过搜索服务器接收同步服务器发送的词库文件更新信息,根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息,根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,如此,更新所述搜索服务器所对应的词库文件;这样,由于本发明实施例所述的方法中,所有词库文件均统一存储至词库文件数据库中,所以,确保了不同搜索服务器所获取到的词库文件的一致性,进而避免了词库文件不一致而导致的分词效果不一致的问题。
【附图说明】
[0040]图1为本发明实施例一数据处理方法所涉及到的各实体之间连接关系示意图;
[0041 ]图2为本发明实施例一数据处理方法的实现流程示意图;
[0042]图3为本发明实施例数据处理方法的具体应用示意图一;
[0043]图4为本发明实施例配置服务器所对应的配置界面示意图;
[0044]图5为本发明实施例数据处理方法的具体应用示意图二;
[0045]图6为本发明实施例搜索服务器的具体结构示意图;
[0046]图7为本发明实施例同步服务器的具体结构示意图。
【具体实施方式】
[0047]应当理解,此处所描述的具体实施例仅仅用以解释本发明的技术方案,并不用于限定本发明的保护范围。
[0048]实施例一
[0049]本发明实施例提供了一种数据处理方法;这里,如图1所示,为解决现有搜索服务器集群中多个搜索服务器词库文件不一致而导致的分词效果不一致的问题,本发明实施例引入了分布式文件系统(如词库文件数据库),以及同步系统(如同步服务器)对现有搜索服务器更新自身对应的词库文件的方式进行优化;具体地,所述分布式文件系统,也即词库文件数据库,用于存储所有搜索服务器对应的所有词库文件,并统一对词库文件进行管理,例如将所有词库文件统一存储至分布式存储系统hbase,并对所有词库文件进行统一管理(如通过分布式存储系统hbase对词库文件进行增、删、改、查)。所述同步系统,也即同步服务器,用于获取词库文件数据库所对应的所有词库文件的状态和位置信息;例如,利用分布式应用程序协调服务zookeeper保存所有词库文件的状态和位置信息;其中,所述位置信息表征词库文件在词库文件数据库中所对应的位置。
[0050]这样,由于将所有词库文件统一存储至词库文件数据库,所以,确保了不同搜索服务器所获取到的词库文件的一致性,进而避免了词库文件不一致而导致的分词效果不一致的问题。
[0051]在实际应用中,为便于对词库文件数据库中的词库文件的增、删、改等操作,还可以设置配置服务器,进而通过配置服务器对词库文件数据库中的词库文件进行增删改操作;进一步地,当配置服务器对词库文件数据库中的词库文件进行增删改操作后,还可以触发所述同步服务器,如触发所述同步服务器中的zookeeper,以修改增删改操作所对应的词库文件在所述同步服务器中的状态。
[0052]具体地,图2为本发明实施例一数据处理方法的实现流程示意图;如图2所示,所述方法包括:
[0053]步骤201:搜索服务器接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的;
[0054]在一实施例中,所述同步服务器检测自身存储的与词库文件数据库对应的至少一个词库文件的状态是否处于待更新状态;例如,所述同步服务器中设置zookeeper,通过zookeeper定时扫描自身存储的词库文件的状态,并根据词库文件的状态修改词库文件的路径(也即以下所述的位置信息),同时存储修改后的词库文件的路径;进一步地,当确定出自身存储的与词库文件数据库对应的至少一个词库文件处于待更新状态时,所述同步服务器将处于待更新状态的至少一个词库文件作为待更新词库文件,生成与所述待更新词库文件对应的词库文件更新信息,并将所述词库文件更新信息发送至搜索服务器,以便于触发所述搜索服务器执行词库文件更新流程。
[0055]在实际应用中,所述同步服务器获取所述词库文件数据库对应的至少一个词库文件的状态以及位置信息,并存储所述词库文件数据库对应的至少一个词库文件的状态以及位置信息;其中,所述状态至少包括待更新状态和更新完成状态;也就是说,所述同步服务器存储词库文件数据库中的所有词库文件的状态以及地址,这样,通过所述同步服务器去检测词库文件的状态是否发生了变化,是否需要触发搜索服务器去执行词库文件的更新流程,因此,与现有应用商店通过SFTP或FTP等协议去触发搜索服务器执行词库文件更新流程的方式相比,本发明实施例通过同步服务器去触发搜索服务器的更新流程,避免了使用SFTP或FTP等协议,进而避免了保存搜索服务器的账号密码,减少了被攻击的危险。而且,由于本发明实施例所述的同步服务器能够定时地、主动去触发自身检测词库文件的状态是否存在更新,进而主动去触发搜索服务器进行词库文件的更新,所以,本发明实施例实现了自动感知词库文件的变化,自动加载词库文件的目的。
[0056]进一步地,当通过配置服务器对词库文件数据库中的词库文件进行增删改操作时,所述配置服务器增删改操作结束后,还可以直接去触发同步服务器,告知同步服务器存在词库文件需要更新,此时,所述同步服务器修改需要更新的词库文件的状态,并修改为待更新状态;进一步地,所述同步服务器可以立即去触发所述搜索服务器执行词库文件的更新过程,或者,待定时时间到达后,再去触发所述搜索服务器执行词库文件的更新过程,在实际应用中,可以根据实际需求去选取触发机制。
[0057]步骤202:所述搜索服务器根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息;
[0058]步骤203:所述搜索服务器根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。
[0059]本实施例中,所述搜索服务器接收到所述同步服务器发送的词库文件更新信息后,向所述同步服务器去获取待更新词库文件所对应的位置信息,进而基于位置信息,向所述词库文件数据库去读取所述待更新词库文件,进而,实现词库文件的更新过程。
[0060]这里,值得注意的是,在实际应用中,所述同步服务器、配置服务器、搜索服务器可以具体为一台服务器,也可以具体为服务器集群,在实际应用中,可以根据实际数据规模而选择。
[0061]本发明实施例所述的方法,通过搜索服务器接收同步服务器发送的词库文件更新信息,根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息,根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,如此,更新所述搜索服务器所对应的词库文件;这样,由于本发明实施例所述的方法中,所有词库文件均统一存储至词库文件数据库中,所以,确保了不同搜索服务器所获取到的词库文件的一致性,进而避免了词库文件不一致而导致的分词效果不一致的问题。
[0062]实施例二
[0063]基于实施例一所述的方法,本实施例中,当所述搜索服务器更新完成词库文件后,所述搜索服务器还基于更新后的自身对应的词库文件重建索引列表,进而将重建的索引列表替换未更新前的索引列表。具体地,所述搜索服务器更新完成词库文件后,根据更新后的词库文件重建索引、并将新建立的索引替换旧索引,进而删除旧索引,这样,便于应用商店根据最新的索引去获取最新的词库文件。
[0064]实施例三
[0065]基于实施例一或实施例二所述的方法,为便于所述同步服务器检测到的词库文件的状态为最新状态,所述搜索服务器更新完成自身对应的词库文件后,向所述同步服务器发送更新响应信息;其中,所述更新响应信息用于控制所述同步服务器修改所述待更新词库文件所对应的状态,以将所述待更新词库文件的状态从待更新状态修改至更新完成状
??τ O
[0066]对应地,所述同步服务器接收所述搜索服务器发送的更新响应信息;
[0067]所述同步服务器根据所述更新响应信息,修改与所述更新响应信息所对应的待更新词库文件的状态,以将所述更新响应信息所对应的待更新词库文件的状态从待更新状态修改至更新完成状态。
[0068]在一具体实施例中,当所述搜索服务器更新完成词库文件后,将表征更新完毕的更新响应信息发送至同步服务器,以便于所述同步服务器根据所述更新响应信息修改与所述更新响应信息所对应的待更新词库文件的状态;同时,所述同步服务器告知配置服务器更新完毕的结果,进而通过配置服务器告知用户更新完成。
[0069]这样,本发明实施例所述的方法通过引入词库文件数据库,将所有词库文件统一存储至词库文件数据库,进而确保了不同搜索服务器所获取到的词库文件的一致性,避免了词库文件不一致而导致的分词效果不一致的问题。
[0070]而且,本发明实施例所述的方法通过同步服务器去触发搜索服务器执行词库文件的更新流程,所以,与现有应用商店通过SFTP或FTP等协议去触发搜索服务器执行词库文件更新流程的方式相比,本发明实施例避免了使用SFTP或FTP等协议,进而避免了保存搜索服务器的账号密码,减少了被攻击的危险。
[0071]同时,本发明实施例所述的方法,能够通过同步服务器去自动感知词库文件的变化,进而了实现自动加载词库文件的目的。
[0072]以下通过具体应用场景对本发明实施例做进一步详细说明:
[0073]应用场景一:如图3所示,
[0074]配置服务器读取分布式文件系统hbase的词库文件中目标词,并展示配置人员;
[0075]配置服务器接收配置人员的相关操作,对目标词进行增删改查操作;例如,配置人员通过如图4所示的配置界面对目标词进行增删改查操作;
[0076]配置服务器确定增删改查操作结束后,触发同步服务器更新所述目标词的状态,以将所述目标词的状态从更新完成状态调整至待更新状态,进而便于所述同步服务器去触发所述搜索服务器更新词库文件。
[0077]应用场景二:如图5所示,
[0078]同步服务器初始化zookeeper配置、hbase配置以及搜索服务器配置;
[0079]所述同步服务器实时或定时检测自身存储的词库文件的状态;如检测是否存在处于待更新状态的词库文件;
[0080]确定存在处于待更新状态的词库文件时,调用搜索服务器中更新接口,以使所述搜索服务器通过更新接口向词库文件数据库去获取待更新状态所对应的词库文件,以更新词库文件,并生成词典;
[0081]所述搜索服务器中词库文件更新后,根据更新后的词库文件新建一索引,待索引建立完成后,切换索引,以使用新的索引,删除旧索引。
[0082]实施例四
[0083]本发明实施例还提供了一种搜索服务器,如图6所示,所述搜索服务器包括:
[0084]第一信息接收单元61,用于接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的;
[0085]信息获取单元62,用于根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息;
[0086]数据更新单元63,用于根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。
[0087]在一实施例中,所述数据更新单元,还用于基于更新后的自身对应的词库文件重建索引列表;将重建的索引列表替换未更新前的索引列表。
[0088]在另一实施例中,所述搜索服务器还包括:
[0089]第一信息发送单元,用于更新完成自身对应的词库文件后,向所述同步服务器发送更新响应信息;其中,所述更新响应信息用于控制所述同步服务器修改所述待更新词库文件所对应的状态,以将所述待更新词库文件的状态从待更新状态修改至更新完成状态。
[0090]本发明实施例还提供了一种同步服务器,如图7所示,所述同步服务器包括:
[0091 ]检测单元71,用于检测自身存储的与词库文件数据库对应的至少一个词库文件的状态是否处于待更新状态;
[0092]信息生成单元72,用于当确定出自身存储的与词库文件数据库对应的至少一个词库文件处于待更新状态时,所述同步服务器将处于待更新状态的至少一个词库文件作为待更新词库文件,生成与所述待更新词库文件对应的词库文件更新信息;
[0093]第二信息发送单元73,用于将所述词库文件更新信息发送至搜索服务器。
[0094]在一实施例中,所述同步服务器还包括:
[0095]存储单元,用于获取所述词库文件数据库对应的至少一个词库文件的状态以及位置信息,并存储所述词库文件数据库对应的至少一个词库文件的状态以及位置信息;其中,所述状态至少包括待更新状态和更新完成状态。
[0096]在另一实施例中,所述同步服务器还包括:
[0097]第二信息接收单元,用于接收所述搜索服务器发送的更新响应信息;
[0098]信息调整单元,用于根据所述更新响应信息,修改与所述更新响应信息所对应的待更新词库文件的状态,以将所述更新响应信息所对应的待更新词库文件的状态从待更新状态修改至更新完成状态。
[0099]这里需要指出的是:以上服务器实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
[0100]应理解,说明书通篇中提到的“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一实施例中”或“在另一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0101]需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0102]在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0103]上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0104]另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0105]本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,R0M)、磁碟或者光盘等各种可以存储程序代码的介质。
[0106]或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
[0107]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1.一种搜索服务器,其特征在于,所述搜索服务器包括: 第一信息接收单元,用于接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的; 信息获取单元,用于根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息; 数据更新单元,用于根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。2.根据权利要求1所述的搜索服务器,其特征在于,所述数据更新单元,还用于基于更新后的自身对应的词库文件重建索引列表;将重建的索引列表替换未更新前的索引列表。3.根据权利要求1所述的搜索服务器,其特征在于,所述搜索服务器还包括: 第一信息发送单元,用于更新完成自身对应的词库文件后,向所述同步服务器发送更新响应信息;其中,所述更新响应信息用于控制所述同步服务器修改所述待更新词库文件所对应的状态,以将所述待更新词库文件的状态从待更新状态修改至更新完成状态。4.一种同步服务器,其特征在于,所述同步服务器包括: 检测单元,用于检测自身存储的与词库文件数据库对应的至少一个词库文件的状态是否处于待更新状态; 信息生成单元,用于当确定出自身存储的与词库文件数据库对应的至少一个词库文件处于待更新状态时,所述同步服务器将处于待更新状态的至少一个词库文件作为待更新词库文件,生成与所述待更新词库文件对应的词库文件更新信息; 第二信息发送单元,用于将所述词库文件更新信息发送至搜索服务器。5.根据权利要求4所述的同步服务器,其特征在于,所述同步服务器还包括: 存储单元,用于获取所述词库文件数据库对应的至少一个词库文件的状态以及位置信息,并存储所述词库文件数据库对应的至少一个词库文件的状态以及位置信息;其中,所述状态至少包括待更新状态和更新完成状态。6.根据权利要求5所述的同步服务器,其特征在于,所述同步服务器还包括: 第二信息接收单元,用于接收所述搜索服务器发送的更新响应信息; 信息调整单元,用于根据所述更新响应信息,修改与所述更新响应信息所对应的待更新词库文件的状态,以将所述更新响应信息所对应的待更新词库文件的状态从待更新状态修改至更新完成状态。7.一种数据处理方法,其特征在于,所述方法包括: 搜索服务器接收同步服务器发送的词库文件更新信息;所述词库文件更新信息是所述同步服务器在确定出存在待更新状态的待更新词库文件后而生成的; 所述搜索服务器根据所述词库文件更新信息,向所述同步服务器获取所述待更新词库文件所对应的位置信息; 所述搜索服务器根据所述待更新词库文件的位置信息,向词库文件数据库读取所述待更新词库文件,以更新所述搜索服务器所对应的词库文件。8.根据权利要求7所述的方法,其特征在于,所述方法还包括: 所述搜索服务器基于更新后的自身对应的词库文件重建索引列表; 将重建的索引列表替换未更新前的索引列表。9.根据权利要求7所述的方法,其特征在于,所述方法还包括: 所述搜索服务器更新完成自身对应的词库文件后,向所述同步服务器发送更新响应信息;其中,所述更新响应信息用于控制所述同步服务器修改所述待更新词库文件所对应的状态,以将所述待更新词库文件的状态从待更新状态修改至更新完成状态。10.一种数据处理方法,其特征在于,所述方法包括: 同步服务器检测自身存储的与词库文件数据库对应的至少一个词库文件的状态是否处于待更新状态; 当确定出自身存储的与词库文件数据库对应的至少一个词库文件处于待更新状态时,所述同步服务器将处于待更新状态的至少一个词库文件作为待更新词库文件,生成与所述待更新词库文件对应的词库文件更新信息; 所述同步服务器将所述词库文件更新信息发送至搜索服务器。11.根据权利要求10所述的方法,其特征在于,所述方法还包括: 所述同步服务器获取所述词库文件数据库对应的至少一个词库文件的状态以及位置信息,并存储所述词库文件数据库对应的至少一个词库文件的状态以及位置信息;其中,所述状态至少包括待更新状态和更新完成状态。12.根据权利要求11所述的方法,其特征在于,所述方法还包括: 所述同步服务器接收所述搜索服务器发送的更新响应信息; 所述同步服务器根据所述更新响应信息,修改与所述更新响应信息所对应的待更新词库文件的状态,以将所述更新响应信息所对应的待更新词库文件的状态从待更新状态修改至更新完成状态。
【文档编号】G06F17/30GK106021527SQ201610353312
【公开日】2016年10月12日
【申请日】2016年5月24日
【发明人】林桂泉
【申请人】努比亚技术有限公司
再多了解一些
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1