Zookeeper

入门

Zookeeper是一个开源的分布式的,伪分布式框架提供协调服务的Apache项目。ZooKeeper是一个高可用的分布式数据管理和协调框架,并且能够很好的保证分布式环境中数据的一致性。 在越来越多的分布式系统(Hadoop、HBase、Kafka)中,Zookeeper都作为核心组件使用。

工作机制

设计模式角度理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的哪些观察者做出相应的反应。

Zookeeper = 文件系统 + 通知机制

特点

  1. 一个领导者,多个跟随者组成的集群
  2. 集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。所 以Zookeeper适合安装奇数台服务器
  3. 全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的
  4. 更新请求顺序执行,来自同一个Client的更新请求按其发送顺序依次执行
  5. 数据更新原子性,一次数据更新要么成功,要么失败
  6. 实时性,在一定时间范围内,Client能读到最新数据

数据结构

ZooKeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作是一棵树,每个节点称做一个 ZNode。每一个 ZNode 默认能够存储 1MB 的数据,每个 ZNode 都可以通过其路径唯一标识。

image-20241205104652615

应用场景

统一命名服务

在分布式环境下,经常需要对应用/服务进行统一命名,便于识别,例如:IP不容易记住,而域名容易记住。

image-20241205105134315

统一配置管理

  • 分布式环境下,配置文件同步非常常见

    1. 一般要求一个集群中,所有节点的配置信息是一致的,比如kafka集群
    2. 对配置文件修改后,能够快速同步到各个节点上
  • 配置管理可交友Zookeeper实现

    1. 将配置信息写入Zookeeper上的一个Znode
    2. 各个客户端服务器监听这个Znode
    3. 一旦Znode中的数据被修改,Zookeeper将通知各个客户端服务器

    image-20241205105434906

统一集群管理

  • 分布式环境中,实时掌握每个节点的状态,根据节点实时状态做出一些调整
  • Zookeeper可以实现监控节点状态变化
    1. 可将节点信息写入Zookeeper上的一个Znode
    2. 监听这个ZNode可获取它的实时状态的变化

服务器动态上下线

客户端能实时观察到服务器上下线的变化

软负载均衡

在Zookeeper中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求

结合项目

这里结合了一个rpc的项目,在此项目中使用Zookeeper作为服务注册中心

服务注册

  1. 构建一个ArrayList 存放的都是 RpcServiceInfo(服务名和版本信息)
  2. 再把这个ArrayList + 主机号 + 端口号 封装成一个rpcProtocol
  3. 使用Jackson进行序列化转换
  4. 使用Curator客户端创建Zookeeper节点(路径根据工具类中规定的)
  5. 给新创建的Zookeeper节点添加监听器
  6. 完成注册

服务发现

  1. 仍然是使用Curator客户端,读取节点数据
  2. 反序列化为RpcProtocol
  3. 读取服务地址,连接到不同的服务节点
  4. 这时会更新Zookeeper信息到本地,这样才能根据不同的节点实现负载均衡