话单分布式检索引擎系统的制作方法

文档序号:7935616阅读:250来源:国知局
专利名称:话单分布式检索引擎系统的制作方法
技术领域
话单分布式检索引擎系统
技术领域
本实用新型是关于一种数据处理装置,特别是指一种电信运营商话单数 据的分布式检索引擎系统。背景技术
随着电信行业针对性营销的发展,从海量电信话单中找出满足特定业务 需求(如在指定时间段、地理区域,与特定商家发生通话)的用户号码,成 为开展该类业务的数据要求。
所谓检索引擎,是指该装置或驱动能够不停的抓取数据,同时根据一套 特定的算法,根据检索请求输出检索结果。
对于检索引擎,在索引量和检索量大到一定程度的时候,索引更新的效 率会逐渐降低,服务器的压力逐渐升高,整个检索引擎的利用率随之降低。
采用传统方法,需要建立集中的数据仓库;由于每月几十亿(省级)的 话单量,对传输能力、存储能力、计算能力的要求均较高。
近两年,分布式存储、检索,及"云存储"、"云计算",成为解决当前所 面临的数据量膨胀、单节点计算能力有限的有效解决方法。鉴此,将原始话 单按照业务需求进行索引并分布式存储,并以统一接口提供检索服务,是一 种有效的检索引擎装置。
实用新型内容
本实用新型所要解决的技术问题在于提供一种存储和^r索电信运营商海 量话单数据的分布式检索引擎装置。
本实用新型是通过以下技术方案解决上述技术问题的 一种话单分布式 检索引擎系统,包括用户机、客户端宿主机,还包括应用服务器、至少一台 的检索服务器组成的检索服务器集群、至少一台的索引服务器、至少一台的 话单釆集服务器,以及管理服务器,所述用户机以及客户端宿主机连接到应用服务器,所述管理服务器与应用服务器相连;所述应用服务器连接到检索 服务器集群上,所述检索服务器集群连接到每个索引服务器上,每个索引服 务器连接一话单采集服务器。 该实用新型可进一步具体为
其中用户机是便携式计算机或者工作站;客户端宿主机是第三方业务应 用的接口服务器。
使用时,首先话单采集服务器采集话单并输出统一格式话单文件;然后 索引服务器读取话单文件,建立索引并存储原始话单。用户机或客户端宿主 机的请求通过应用服务器发给检索服务器,检索服务器分解检索请求下发给 目标索引服务器,并收集合并结果数据,返回检索结果。
本实用新型电信运营商海量话单数据分布式4企索引擎装置的优点在于 分布的信息获取和计算以及对此进行的数据统一;数据处理后的分布存储和 管理;处理检索请求的任务分发和结果合并机制,及对大并发量的支持。

下面参照附图结合实例对本实用新型做进一步描述。 图l是本实用新型话单分布式检索引擎系统的装置连接图。
具体实施方式
请参阅图l所示,本实用新型电信运营商海量话单的数据分布式检索引 擎系统包括用户机10、客户端宿主机20、应用服务器30、至少一台的检索 服务器组成的检索服务器集群40、至少一台的索引服务器50、至少一台的话 单采集服务器60,以及管理服务器70。
其中用户机IO可以是便携式计算机、工作站;客户端宿主机20可以是 第三方业务应用的接口服务器。
所述用户机10以及客户端宿主机20连接到应用服务器30,所述管理服 务器70与应用服务器30相连;所述应用服务器30连接到检索服务器集群40 上,所述检索服务器集群40连接到每个索引服务器50上,每个索引服务器 50连接一话单采集服务器60,也可以一个以上的索引服务器50共用一个话 单采集服务器60。所述应用服务器30提供检索服务和话单检索域元数据管理的应用,并通 过软件技术将所有用户机IO或者客户端宿主机20的请求平均分配给检索服 务器集群40中的所有检索服务器。
所述管理服务器70提供系统运行状态、系统硬件资源的使用情况、对应 用服务器30进程的启、停等进行监控。
所述检索服务器集群40是整个分布式检索引擎系统的中心节点,将应用 服务器30下发的检索请求分解,并下发给索引服务器50;在收集合并索引服 务器50的结果后,回送给应用服务器30。
所述索引服务器50按照预先设置的话单划分网格MJ'J,对采集到的话单 进行整合并建立索引,并组成网格。
所述话单采集服务器60可扩展支持各接口协议,从语音业务单元获取话 单数据,并提供统一数据文件格式,供索引服务器50进行后续处理。
使用时,首先话单采集服务器60采集话单并输出统一格式话单文件;然 后索引服务器50读取话单文件,建立索引并存储原始话单。用户机10或者 客户端宿主机20的请求通过应用服务器30发给^^索服务器集群40,检索服 务器集群40分解检索请求下发给索引服务器50,并收集合并结果数据,返回 检索结果给应用服务器30。
权利要求1. 一种话单分布式检索引擎系统,包括用户机、客户端宿主机,其特征在于还包括应用服务器、至少一台的检索服务器组成的检索服务器集群、至少一台的索引服务器、至少一台的话单采集服务器,以及管理服务器,所述用户机以及客户端宿主机连接到应用服务器,所述管理服务器与应用服务器相连;所述应用服务器连接到检索服务器集群上,所述检索服务器集群连接到每个索引服务器上,每个索引服务器连接一话单采集服务器。
2. 如权利要求1所述的话单分布式检索引擎系统,其特征在于其中用户机是便携式计算机或者工作站;客户端宿主机是第三方业务应用的接口服务器。
专利摘要一种话单分布式检索引擎系统,包括用户机、客户端宿主机、应用服务器、至少一台的检索服务器组成的检索服务器集群、至少一台的索引服务器、至少一台的话单采集服务器,以及管理服务器。话单采集服务器采集话单并输出统一格式话单文件,然后索引服务器读取话单文件,建立索引并存储原始话单,用户机或客户端宿主机的请求通过应用服务器发给检索服务器;检索服务器分解检索请求下发给目标索引服务器,并收集合并结果数据,返回检索结果。管理服务器提供对应用服务器的监控。本实用新型的优点在于分布的信息获取和计算以及对此进行的数据统一;数据处理后的分布存储和管理;处理检索请求的任务分发和结果合并机制,及对大并发量的支持。
文档编号H04L29/08GK201307870SQ20082022930
公开日2009年9月9日 申请日期2008年12月10日 优先权日2008年12月10日
发明者刚 林, 禹 林, 维 王, 陈建皓, 聪 顾, 黄耀晖 申请人:福建讯盟软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1