一种用于实现Redis集群高可用的方法和代理中间件与流程

文档序号:30831676发布日期:2022-07-22 21:45阅读:144来源:国知局
一种用于实现Redis集群高可用的方法和代理中间件与流程
一种用于实现redis集群高可用的方法和代理中间件
技术领域
1.本发明涉及计算机技术领域,尤其涉及一种用于实现redis集群高可用的方法和代理中间件。


背景技术:

2.redis(remote dictionary server)作为当前流行的键-值存储系统,支持string,hash,set,zset,list等数据结构。开源的twemproxy为memcache以及redis的代理中间件,用户连接访问twemproxy,由twemproxy统一对其读写请求进行转发,分发后redis-server或者memcache。
3.基于现有的方案,当twemproxy所代理的redis服务器进程一旦因异常而退出,twemproxy将该异常节点剔除。然而,对于线上使用场景,特别是金融行业的方案是将redis当做数据库持久化存储,数据并非只做缓存,所以异常的redis服务器需要被健康的redis服务器替代。但twemproxy并不能感知redis服务器的切换事件,亦无法修改当前已有的redis拓扑,从而导致异常请求仍然被转发到异常的redis服务器,导致用户请求报错。


技术实现要素:

4.本发明的目的是提供一种用于实现redis集群高可用的方法和代理中间件。
5.根据本技术的实施例,提供了一种用于实现redis集群高可用的方法,其中,所述方法包括:
6.代理中间件生成子线程来建立与redis集群的哨兵模块之间的长连接,从而与哨兵模块进行交互;
7.如果与所述哨兵模块之间的长连接断开,则代理中间件确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
8.根据本技术的实施例,提供了一种用于实现redis集群高可用的代理中间件,其中,所述代理中间件和哨兵模块之间建立了长连接,所述代理中间件包括:
9.用于生成子线程来建立与redis集群的哨兵模块之间的长连接,从而与哨兵模块进行交互的单元;
10.用于如果与所述哨兵模块之间的长连接断开,则确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互的单元。
11.根据本技术的实施例,提供了一种用于实现redis集群高可用的系统,所述系统包括多个redis节点、哨兵模块、以及如本技术实施例所述的代理中间件
12.根据本技术的实施例,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现本技术实施例的方法。
13.根据本技术的实施例,提供了一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本技术实施例的方法。
14.与现有技术相比,本技术实施例具有以下优点:根据本技术实施例的代理中间件单独派生一个子线程和redis集群的哨兵模块进行通信,规避了代理中间件的主流程被阻塞的风险;并且,根据本技术实施例的代理中间件具有redis服务器异常退出后发生主从切换事件的感知能力,自动更新redis拓扑的高可用能力,以及进程异常退出能自动拉起的功能,进一步提升了redis集群的高可用性。
附图说明
15.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
16.图1示出了根据本技术实施例的用于实现redis集群高可用的方法流程图。;
17.图2示出了根据本技术实施例的一个实施例性的系统的结构示意图;
18.图3(a)示出了根据本技术实施例的示例性的redis集群的主从切换过程的示意图;
19.图3(b)示出了根据本技术实施例的示例性的redis集群的主从切换过程的示意图;
20.图4示出了根据本技术实施例的用于实现redis集群高可用的代理中间件的结构示意图。
21.附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
22.在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
23.在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由asic、fpga、dsp等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
24.所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、pda等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloud computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本技术,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本技术。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、vpn网络等。
25.需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本技术,也应包含在本技术保护范围以内,并以引
用方式包含于此。
26.后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
27.这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本技术的示例性实施例的目的。但是本技术可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
28.应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
29.应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
30.这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
31.还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
32.下面结合附图对本发明作进一步详细描述。
33.图1示出了根据本技术实施例的用于用于实现redis集群高可用的方法流程图。所述方法包括步骤s1、步骤s2和步骤s3。
34.参照图1,在步骤s1中,代理中间件生成子线程来建立与redis集群的哨兵模块之间的长连接,从而与哨兵模块进行交互。
35.在步骤s2中,如果与所述哨兵模块之间的长连接断开,则代理中间件确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
36.根据一个实施例,所述代理中间件为twemproxy,所述哨兵模块为redis集群的sentinel。并且,根据本实施例的redis集群所在的系统如图2所示,参照图2,该系统的redis集群包括3个redis分片(表示为shard-1至shard-3)、3个哨兵模块sentinel、以及3个代理中间件twemproxy。其中,每个redis分片包括一个主节点(表示为m-redis)和至少一个从节点(表示为s-redis)。
37.基于该系统,上游业务client通过domain来访问redis集群,其域名后面实际映射
的是redis服务器代理层的3个twemproxy。在redis实例的主从切换场景中,如果有m-redis异常退出,sentinel会感知到并将s-redis提升为主节点。
38.在如图2所示的系统中,为了防止阻塞twemproxy的主流程,twemproxy在步骤s1中解析访问sentinels集群所对应的域名,生成子线程来建立与sentinels集群中的一个sentinels模块的长连接,从而与所选择的sentinel进行交互。如果twemproxy和sentinel之间的连接断开,则twemproxy在步骤s2中采用轮询(round-robin)的方式获取下一个可用的sentinel的ip,从而与新的sentinel建立连接并进行交互。
39.根据一个实施例,代理中间件通过开启一个线程,在内部维护一个状态机。其中,所述状态机采用多个字段来指示哨兵模块的不同状态。
40.例如,在如图2所示的系统中,twemproxy单独开启一个线程,内部维护一个状态机,该状态机的字段包括但不限于:
41.1)sentinel_init_conn:用于表示状态机的初始状态,sentinel连接初始化;
42.2)sentinel_conn_send_req:用于表示sentinel初始化完毕后的下一个阶段,当路由服务器向sentinel发出info sentinel以及订阅+switch-master频道这两个命令后,便进入此状态;
43.3)sentinel_conn_ack_info:twemproxy向sentinel发出info sentinel后,变会进入到此状态;
44.4)sentinel_conn_ack_redirect_sub:用于表示sentinel_conn_ack_info的下一个状态,以下所示的三种情况会触发此状态机:
45.a)twemproxy对sentinel的探活结果返回;
46.b)接收到sentinel的推送消息(接收到redis-server主从切换的信息);
47.c)完成判断sentinel是否处于网络分区的流程结束;
48.5)sentinel_conn_disconnected:用于表示twemproxy和sentinel的通信处于连接断开的状态。
49.根据一个实施例,所述方法包括主从切换机制,主从切换机制的流程包括步骤s3(图未示)至步骤s5(图未示)。
50.在步骤s3中,代理中间件通过与哨兵模块之间的发布订阅机制,检测redis集群中是否发生了主从切换事件。
51.在步骤s4,如果检测到发生主从切换事件,则代理中间件更新自身存储的redis拓扑信息。
52.具体地,后端redis服务器完成主从切换后,代理中间件接收redis服务器推送的拓扑信息,以基于该拓扑信息更新自身存储的拓扑信息。
53.在步骤s5中,代理中间件在相应的配置信息中热更新redis拓扑信息。
54.图3(a)图3(b)分别示出了根据本技术实施例的示例性的redis集群的主从切换过程的示意图。
55.参照图3(a),twemproxy代理配置的redis节点(后端redis-server)包括一个主节点和一个从节点,分别表示为m-redis和s-redis,其ip地址分别表示为ip-1和ip-2。虚线框的部分表示twemproxy的redis集群拓扑配置(表示为map),包括该主节点的ip(master:ip-1)和从节点各自的ip(salve:ip-2)。并且,twemproxy通过domain方式连接了哨兵模块集群
sentinel。sentinel间歇性地向redis节点发送心跳包。如图3(a)所示,当redis主节点m-redis异常时,sentinel可实时感知到该异常。
56.参照图3(b),sentinel感知到该异常,把健康的redis从节点s-redis提升为主节点,并相应地将原先的redis主节点标记为从节点。后端redis-server切换完成后,sentinel将主从切换完成后的最新的redis拓扑信息推送给twemproxy,以供twemproxy将此拓扑信息同步更新内存中。twemproxy更新完内存中的拓扑之后,会热更新对应配置(map)中的redis拓扑信息,并将其持久化。
57.并且,图3(a)和3图(b)的twemproxy订阅了sentinel的+switch-master频道,使得在以下情况触发事件推送:
58.i)twemproxy所连接的sentinel主动产生了切换任务;
59.ii)twemproxy所连接的sentinel被动得知由其他sentinel发生了主从切换事件。
60.通过该+switch-master频道收到的事件推送,后端redis服务器完成主从切换后,twemproxy接收redis服务器推送的redis拓扑信息,以基于该拓扑信息更新自身存储的redis拓扑信息。
61.根据一个实施例,所述方法包括进程保活机制,进程保活机制的流程包括步骤s6(图未示)至步骤s7(图未示)。
62.在步骤s6中,启动后,代理中间件启动master进程,并在master进程中生成worker进程。
63.在步骤s7中,如果所述worker进程发生异常,则master进程生成新的worker进程。
64.根据一个实施例,在如图2所示的系统中,twemproxy先启动加载配置,接着将自身的进程名称修改为twemproxy_master,再派生出worker进程,将worker进程的名字修改为twemproxy_worker。master进程负责监听worker进程的存活状态,由worker进程来执行用户请求转发。如果master进程检测到worker进程异常退出,则在master进程中再派生出新的worker进程来接替原先的worker进程的工作。
65.根据一个实施例,所述方法包括探活及版本号监测机制,探活及版本号监测机制的流程包括步骤s8(图未示)至步骤s10(图未示)。
66.在步骤s8中,代理中间件周期性地向所连接的哨兵模块发出命令,用于获取哨兵模块返回的epoch数值。
67.在步骤s9中,基于接收到返回的epoch数值的时间,确定与哨兵模块的长连接的状态。
68.具体地,可基于预定的判断标准,根据接收到返回的epoch数值的时间长短,超时接收epoch数值的次数等条件,来确定长连接相应的健康状态。如果确定与哨兵模块的长连接是不健康的,则代理中间件确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
69.在步骤s10中,通过将返回的epoch数值和自身存储的epoch数值进行比较,确定是否需要更新redis拓扑信息。
70.根据一个实施例,在如图2所示的系统中,twemproxy和sentinel之间有探活机制,以确保和sentinel的socket长连接是健康的。具体地,在步骤s8中,twemproxy每三秒向所连接的sentinel发出getepoch命令,用于获取当前redis集群拓扑的版本号。其中,redis集
群每发生一次主从切换事件,则sentinel都会对redis集群拓扑的版本号进行加一操作。
71.sentinel正常返回的结果是sentinel当前的epoch数值。在步骤s9中,如果该结果在5秒内返回,则心跳符合预期,twemproxy确定socket长连接是健康的;如果超过5秒返回,则twemproxy在内存计数器当中记录一次超时并打印日志关键字样“sentinel communication timeout
…”
。如果连续四个周期均超时,则twemproxy确定socket长连接是不健康的,并主动关闭连接,并通过round-robin的方式获取新的可用的sentinel,从而与新的sentinel建立长连接。
72.在步骤s10中,twemproxy将sentinel返回的epoch数值和自身存储的epoch数值进行比较,如果二者相等,则无需更新redis拓扑信息;如果自身存储的epoch数值小于sentinel返回的epoch数值,则twemproxy当前维护的是旧版本的redis拓扑信息,需要从sentinel获取最新的redis拓扑信息来进行更新。
73.根据一个实施例,所述方法包括网络区分检测机制,网络区分检测机制的流程包括步骤s11(图未示)至步骤s13(图未示)。
74.在步骤s11中,代理中间件周期性地向所连接的哨兵模块发出命令,用于检测该哨兵模块是否处于网络区分状态。
75.其中,对于一个由n个节点构成的网络,如果节点之间两两互通则说明网络没问题,但如果因为网络异常导致切分成多个组,组内网络互通,但是组间网络不通,则为网络分区状态。
76.在步骤s12中,响应于该命令,哨兵模块基于哨兵模块之间的通信状况,检测该哨兵模块是否处于网络区分状态。
77.优选地,哨兵模块通过轮询所有分片的quorum,检测该哨兵模块是否处于网络区分状态。其中,所述quorum用于表示互通的哨兵模块的个数与哨兵模块个数的比值。例如,对于3个哨兵模块,如果该3个哨兵模块均互通,则相应的quorum为3/3,如果有一个哨兵模块不通,则quorum为2/3。
78.在步骤s13中,如果该哨兵模块处于网络区分状态,则代理中间件确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
79.根据一个实施例,在如图2所示的系统中,twemproxy每分钟向所连接的sentinel发出checksentinelstatus命令,来检测该sentinel是否处于网络分区状态。响应于该命令,sentinel自动轮询所有分片的quorum,如果任一分片的quorum少于半数,则该sentinel处于网络区分状态,twemproxy通过round-robin的方式获取新的可用的sentinel,从而与新的sentinel建立长连接。
80.根据一个实施例,所述方法包括配置回写机制,基于配置回写机制,代理中间件生成临时文件,将内存中原有的配置选型和更新后的redis拓扑信息格式化后写入到临时文件。并且,对临时文件进行格式校验,校验通过后基于临时文件替换旧的配置文件。
81.根据本技术实施例的方法,代理中间件单独派生一个子线程和redis集群的哨兵模块进行通信,规避了代理中间件的主流程被阻塞的风险;并且,根据本技术实施例的代理中间件具有redis服务器异常退出后发生主从切换事件的感知能力,自动更新redis拓扑的高可用能力,以及进程异常退出能自动拉起的功能,进一步提升了redis集群的高可用性。
82.图4示出了根据本技术实施例的用于实现redis集群高可用的代理中间件的结构
示意图。
83.所述代理中间件包括:用于生成子线程来建立与redis集群的哨兵模块之间的长连接,从而与哨兵模块进行交互的单元(以下简称“连接创建单元1”),用于如果与所述哨兵模块之间的长连接断开,则确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互的单元(以下简称“可用确定单元2”)。
84.参照图4,连接创建单元1生成子线程来建立与redis集群的哨兵模块之间的长连接,从而与哨兵模块进行交互。
85.如果与所述哨兵模块之间的长连接断开,则可用确定单元2确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
86.根据一个实施例,代理中间件通过开启一个线程,在内部维护一个状态机。其中,所述状态机采用多个字段来指示哨兵模块的不同状态。
87.根据一个实施例,所述代理中间件执行的操作包括主从切换机制,所述代理中间件包括切换检测单元(图未示)、拓扑更新单元(图未示)和配置更新单元(图未示)。
88.切换检测单元通过与哨兵模块之间的发布订阅机制,检测redis集群中是否发生了主从切换事件。
89.如果检测到发生主从切换事件,则拓扑更新单元更新自身存储的redis拓扑信息。
90.具体地,后端redis服务器完成主从切换后,代理中间件接收redis服务器推送的拓扑信息,以供拓扑更新单元基于该拓扑信息更新自身存储的拓扑信息。
91.接着,配置更新单元在相应的配置信息中热更新redis拓扑信息。
92.根据一个实施例,所述代理中间件执行的操作包括进程保活机制,所述代理中间件包括进程启动单元(图未示)和进程生成单元(图未示)。
93.启动后,进程启动单元启动master进程,并在master进程中生成worker进程。
94.如果所述worker进程发生异常,则进程生成单元生成新的worker进程。
95.根据一个实施例,所述代理中间件执行的操作包括探活及版本号监测机制,所述代理中间件包括第一发送单元(图未示)、状态确定单元(图未示)和比较单元(图未示)。
96.第一发送单元周期性地向所连接的哨兵模块发出命令,用于获取哨兵模块返回的epoch数值。
97.状态确定单元基于接收到返回的epoch数值的时间,确定与哨兵模块的长连接的状态。
98.具体地,可基于预定的判断标准,根据接收到返回的epoch数值的时间长短,超时接收epoch数值的次数等条件,来确定长连接相应的健康状态。如果确定与哨兵模块的长连接是不健康的,则状态确定单元确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
99.比较单元通过将返回的epoch数值和自身存储的epoch数值进行比较,确定是否需要更新redis拓扑信息。
100.根据一个实施例,所述代理中间件执行的操作包括网络区分检测机制,所述代理中间件包括第二发送单元(图未示)和区分确定单元(图未示),所述哨兵模块包括状态检测单元(图未示)。
101.第二发送单元周期性地向所连接的哨兵模块发出命令,用于检测该哨兵模块是否
处于网络区分状态。
102.其中,对于一个由n个节点构成的网络,如果节点之间两两互通则说明网络没问题,但如果因为网络异常导致切分成多个组,组内网络互通,但是组间网络不通,则为网络分区状态。
103.响应于该命令,状态检测单元基于哨兵模块之间的通信状况,检测该哨兵模块是否处于网络区分状态。
104.优选地,状态检测单元通过轮询所有分片的quorum,检测该哨兵模块是否处于网络区分状态。其中,所述quorum用于表示互通的哨兵模块的个数与哨兵模块个数的比值。例如,对于3个哨兵模块,如果该3个哨兵模块均互通,则相应的quorum为3/3,如果有一个哨兵模块不通,则quorum为2/3。
105.如果该哨兵模块处于网络区分状态,则区分确定单元确定可用的哨兵模块,从而与新的哨兵模块建立连接并进行交互。
106.根据一个实施例,所述代理中间件执行的操作包括配置回写机制,基于配置回写机制,代理中间件生成临时文件,将内存中原有的配置选型和更新后的redis拓扑信息格式化后写入到临时文件。并且,对临时文件进行格式校验,校验通过后基于临时文件替换旧的配置文件。
107.根据本技术实施例的装置,代理中间件单独派生一个子线程和redis集群的哨兵模块进行通信,规避了代理中间件的主流程被阻塞的风险;并且,根据本技术实施例的代理中间件具有redis服务器异常退出后发生主从切换事件的感知能力,自动更新redis拓扑的高可用能力,以及进程异常退出能自动拉起的功能,进一步提升了redis集群的高可用性。
108.本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路。
109.另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
110.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表
示名称,而并不表示任何特定的顺序。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1