Skip to content

Latest commit

 

History

History
273 lines (191 loc) · 14.3 KB

Eureka解析.md

File metadata and controls

273 lines (191 loc) · 14.3 KB

Eureka的核心代码

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-dependencies</artifactId>
    <version>Dalston.SR5</version>
    <type>pom</type>
</dependency>

从D版本的依赖查到依赖的 netflix 版本是 1.3.6

org.springframework.cloud » spring-cloud-netflix-dependencies   1.3.6.RELEASE

进而查到依赖的原生 eureka 版本是 1.6.2

com.netflix.eureka » eureka-client  1.6.2
com.netflix.eureka » eureka-core    1.6.2
com.netflix.ribbon » ribbon-eureka  2.2.2

源码重点

Eureka 是 Netflix 开源的服务注册发现组件,分成 Client 和 Server 两部分。

  • Eureka-Server :通过 REST 协议暴露服务,提供应用服务的注册和发现的功能。

  • Application Provider :应用服务提供者,内嵌 Eureka-Client ,通过它向 Eureka-Server 注册自身服务。

  • Application Consumer :应用服务消费者,内嵌 Eureka-Client ,通过它从 Eureka-Server 获取服务列表。

请注意下,Application Provider 和 Application Consumer 强调扮演的角色,实际可以在同一 JVM 进程,即是服务的提供者,又是服务的消费者。

1. eureka-client 项目:

  • com.netflix.appinfo 包:Eureka-Client 的应用配置。此处的应用指的就是上文提到的 Application Provider,Application Consumer
/**
 * 契约过期时间,单位:秒
 */
private static final int LEASE_EXPIRATION_DURATION_SECONDS = 90;
/**
 * 租约续约频率,单位:秒。
 */
private static final int LEASE_RENEWAL_INTERVAL_SECONDS = 30;
//getHeartbeatExecutorThreadPoolSize
static final int DEFAULT_EXECUTOR_THREAD_POOL_SIZE = 5;
//getHeartbeatExecutorExponentialBackOffBound
static final int DEFAULT_EXECUTOR_THREAD_POOL_BACKOFF_BOUND = 10;

//从 Eureka-Server 拉取注册信息频率,单位:秒
public int getRegistryFetchIntervalSeconds() {
    return configInstance.getIntProperty(
            namespace + REGISTRY_REFRESH_INTERVAL_KEY, 30).get();
}

//向 Eureka-Server 同步应用信息变化初始化延迟,单位:秒
public int getInstanceInfoReplicationIntervalSeconds() {
    return configInstance.getIntProperty(
            namespace + REGISTRATION_REPLICATION_INTERVAL_KEY, 30).get();
}
  • com.netflix.discovery.DiscoveryClient 类:注册发现客户端实现类。
/**
 * 注册信息的应用实例数
 */
private volatile int registrySize = 0;
/**
 * 最后成功从 Eureka-Server 拉取注册信息时间戳
 */
private volatile long lastSuccessfulRegistryFetchTimestamp = -1;
/**
 * 最后成功向 Eureka-Server 心跳时间戳
 */
private volatile long lastSuccessfulHeartbeatTimestamp = -1;

private boolean fetchRegistry(boolean forceFullRegistryFetch) {
  //从 Eureka-Server 获取注册信息( 根据条件判断,可能是全量,也可能是增量 )
  // 执行 全量获取
  /**
   * Gets the full registry information from the eureka server and stores it locally.
   * When applying the full registry, the following flow is observed:
   *
   * if (update generation have not advanced (due to another thread))
   *   atomically set the registry to the new registry
   * fi
   */
  getAndStoreFullRegistry();

  // 执行 增量获取

  getAndUpdateDelta(applications);
}

private void initScheduledTasks() {
  // 从 Eureka-Server 拉取注册信息执行器
  // 向 Eureka-Server 心跳(续租)执行器
  // 注册 应用实例状态变更监听器
}
  • com.netflix.discovery.shared 包:Eureka-Client 和 Eureka-Server 注册发现相关的共享重用的代码。

2. eureka-client-jersey2 项目:

Jersey 是 JAX-RS(JSR311)开源参考实现,用于构建 RESTful Web Service。

  • Eureka-Server 使用 Jersey Server 创建 RESTful Server 。

  • Eureka-Client 使用 Jersey Client 请求 Eureka-Server 。

3. eureka-core 项目:

eureka-core 模块为 Eureka-Server 的功能实现:

  • com.netflix.eureka.EurekaBootStrap 类:Eureka-Server 启动类。

  • com.netflix.eureka.cluster 包:Eureka-Server 集群数据复制相关的代码。

  • com.netflix.eureka.lease 包:应用注册后的租约管理( 注册 / 取消 / 续期 / 过期 )。

  • com.netflix.eureka.resousrces 包:资源,基于 Jersey Server 实现,相当于 Spring MVC 的控制层代码。

com.netflix.eureka.resources.ApplicationsResource处理所有应用的请求操作的 Resource ( Controller )

应用实例注册下线过期时不会很快刷新到 readWriteCacheMap 缓存里默认配置下最大延迟在 30 为什么可以使用缓存 CAP 的选择上Eureka 选择了 AP不同于 Zookeeper 选择了 CP
  • com.netflix.eureka.transport 包:Eureka-Server 对 Eureka-Server 的 RESTful HTTP 客户端,基于 com.netflix.discovery.shared.transport 封装实现。

4. eureka-server 项目:

eureka-server 模块,将 eureka-client + eureka-core + eureka-resources 三者打包成 Eureka-Server 的 war 包

// CircularQueues here for debugging/statistics purposes only
/**
 * 最近注册的调试队列
 * key :添加时的时间戳
 * value :字符串 = 应用名(应用实例信息编号)
 */
private final CircularQueue<Pair<Long, String>> recentRegisteredQueue;
/**
 * 最近取消注册的调试队列
 * key :添加时的时间戳
 * value :字符串 = 应用名(应用实例信息编号)
 */
private final CircularQueue<Pair<Long, String>> recentCanceledQueue;

多节点部署的Eureka Server必然涉及到不同节点之间的注册表信息的一致性,在CAP中,Eureka 注重的满足了AP,对C只满足的弱一致性(最终一致性),牺牲了强一致性保证了高可用性,但是Eureka Sever中依然有方式保证节点之间的注册表的信息的一致性。

register(注册)、cancel(下线)、renew(更新)、evict(剔除),这四个方法对应了Eureka Client与Eureka Server的交互行为相对应,是对注册表信息中的服务实例的租约管理方法。

在 PeerAwareInstanceRegistryImpl 中,对 Abstractinstanceregistry 中的register()、cancel()、renew()等方法都添加了同步到 PeerEurekaNode 的操作,使 Server 集群中的注册表信息保持最终一致性。

需要在意的是 Eureka Server 在接收到对应的同步复制请求后如何修改自身的注册表信息,以及反馈给发起同步复制请求的 Eureka Server:

  • 问题1:同步注册信息的时候,被同步的一方也同样存在相同服务实例的租约,如果被同步一方的 lastDirtyTimestamp 比较小,那么被同步一方的注册表中关于该服务实例的租约将会被覆,如果被同步的一方的 lastDirtyTimestamp 的比较大,那么租约将不会被覆盖(这部分在 AbstractInstanceRegistry.register())。但是这时发起同步的 Eureka Server 中的租约就是dirty的,该如何处理?

通过续租(心跳)同步,当 Eureka Client 与 Eureka Server 发起 renew() 请求的时候,接收 renew() 将持有最新的 lastDirtyTimestamp,通过同步心跳(续租)的方式,将该服务实例的最新 InstanceInfo 同步覆盖到 peer 节点的注册表中,维持 Server 集群注册表信息的一致性。

所以,我们发现整个 Eureka Server 的集群是通过续租(心跳)的操作来维持集群的注册表信息的最终一致性,但是由于网络延迟或者波动原因,无法做到强一致性。

  • 问题2:同步续约(心跳)信息的时候,被同步一方的租约不存在或者是 lastDirtyTimestamp 比较小(被同步一方的租约是dirty),如何处理?

如果是被同步一方 Eureka Server 的该服务实例的租约不存在或者是 lastDirtyTimestamp 比较小,那么它将在设置返回的 response status 为 404 ;发起同步的一方会将这个服务实例的信息通过同步注册的方式再次发送。在 Eureka Client 与 Eureka Server 之间的续租(心跳)就是这样一个流程。

  • 问题3:或者被同步一方的 lastDirtyTimestamp 比较大(发起同步的一方的租约是dirty),又如何处理?

如果被同步一方 Eureka Server 的该服务实例的租约的 lastDirtyTimestamp 比较大,那么它将在设置返回的 response status 为 409,同时将本地的该服务实例的 InstanceInfo 发到 response 中;发起同步的一方会将根据 409 的状态,抽取出 response 中的 InstanceInfo,将其注册到本地注册表中。

5. eureka-examples 项目:

eureka-examples 模块,提供 Eureka-Client 使用例子。

问题列表

1. Eureka Client 与 Eureka Server 是如何通信的?

Eureka-Client 获取注册信息,分成全量获取和增量获取。

Eureka-Client 启动时,首先执行一次全量获取进行本地缓存注册信息。

Eureka-Client 在初始化过程中,创建获取注册信息线程,固定间隔(30秒)向 Eureka-Server 发起增量获取注册信息( fetch ),刷新本地注册信息缓存( 非“正常”情况下会是全量获取,比如增量获取失败,Eureka-Client 重新和 Eureka-Server 全量获取应用集合 )。

Eureka-Client 本地应用实例与 Eureka-Server 的该应用实例状态不同的原因,因为应用实例的覆盖状态。

Eureka-Client 只会向 Eureka-Server 列表中的一个进行通信,除非该服务失效,才会选择下一个。

2. Eureka Server 之间是如何通信的?

Eureka-Server 内嵌 Eureka-Client,用于和 Eureka-Server 集群里其他节点通信交互。

Eureka-Server 多节点注册信息, P2P 同步。

一个 Eureka-Server 收到 Eureka-Client 注册(Register,还有 Renew,Cancel)请求后(replication=false),Eureka-Server 会自己模拟 Eureka-Client 发送注册请求(replication=true,从而避免重复的replicate)到其它的 Eureka-Server。

也就是说,Eureka-Server 之间的信息同步是推模式!

通过这种方式,Service Provider 只需要通知到任意一个 Eureka Server 后就能保证状态会在所有的 Eureka Server 中得到更新(前提是这些 Eureka Server 之间的最短路径为1,即两两互联)。

记住:Eureka 通过 Heartbeat 实现 Eureka-Server 集群同步的最终一致性。

3. Eureka Server 是怎么知道有多少 Peer 的呢?

Eureka Server在启动后会调用 EurekaClientConfig.getEurekaServerServiceUrls 来获取所有的 Peer 节点,并且会定期更新。定期更新频率可以通过 eureka.server.peerEurekaNodesUpdateIntervalMs 配置。

这个方法的默认实现是从配置文件读取,所以如果 Eureka Server 节点相对固定的话,可以通过在配置文件中配置来实现。

如果希望能更灵活的控制 Eureka Server 节点,比如动态扩容/缩容,那么可以 override getEurekaServerServiceUrls 方法,提供自己的实现。

4. Eureka Server 如何保证高可用?

只要 eureka server 之间存在一条互相可达的链路,则它们之间能互相通信,注册信息达到最终一致性。

意思是只有两两互联,才能保证高可用。

测试用例:

  • 首先搭建2节点集群,A->A,A->B,B->B,B->A,A/B节点相互注册。
  • 现在启动C,C->A,C->B,则C向A/B注册。
  • 如果只有C->A,而没有C->B,则C只向A同步数据!也就是说即使A/B互联,C同步给A的数据,A并不会同步给B!

解释:这是合理的,考虑以下场景:5节点两两互联,共有4X5=20条通信链。

  • 当其中某个节点有更新信息时,它会同步给其他4个节点,会有4次通信。
  • 如果这4个节点再次传播,则又有4X4=16次通信!当这些信息带有时间戳时,只有时间戳大于本地时才触发更新。
  • 如果可以继续传播,则直到集群中所有信息一致,该传播才会终止。好处就是最终一致,坏处就是带来额外的通信。
  • 如果只传播一次,好处就是只有直接与之关联的节点会更新,通信次数固定,坏处就是其他可达但未直接关联的节点不会更新,集群状态不一致!考虑到 Eureka 保证 AP 而不是 CP,这种方式可以接受。

5. Eureka 中 eureka.client.serviceUrl.defaultZone 的配置答疑

(1)客户端中配置多个服务器地址,则只使用其中某个地址(最后一个优先?)进行注册与发现操作;除非该地址失效,否则不会使用其他地址;如果所有地址失效,则客户端与服务器失联;

(2)服务端中配置多个服务器地址,每当客户端向其注册,续约,下线操作时,其广播到所配置的其他所有服务器;该广播只会传播一次,意味着收到该广播的其他服务器,不会再次广播;

(3)服务器之间是P2P复制的,除非服务器集群之间两两互联,否则会出现数据不一致的情况;所以Eureka不满足CP,只满足AP;

(4)客户端初始启动时全量,后续定时增量从服务器发现(获取)其他客户端的信息;客户端启动后,通过心跳(续约)主动向服务器同步自己的信息;

(5)由于缓存的存在,不管是客户端还是服务器,注册与发现的服务都不是实时的,存在不一致的情况。

6. Eureka 中 UP/DOWN/OUT_OF_SERVICE 的转化逻辑

  • UP: 应用正常且提供服务
  • DOWN:应用异常,一段时间后,服务器会清理
  • OUT_OF_SERVICE:应用正常,但不提供服务
  • ? -> DOWN ,状态一直为 DOWN
  • ? -> DELETE ,只要应用正常,还会复活,重新注册再续约,状态为 UP
  • ? -> OUT_OF_SERVICE ,状态一直为 OUT_OF_SERVICE

扩展阅读

1. Eureka 源码解析 —— 应用实例注册发现(六)之全量获取

http://www.iocoder.cn/Eureka/instance-registry-fetch-all/

2. 深入了解EurekaClient的注册过程

https://blog.csdn.net/weixin_40615418/article/details/78731080#itme1

3. Eureka REST operations

https://github.com/Netflix/eureka/wiki/Eureka-REST-operations

4. 深度剖析服务发现组件Netflix Eureka

https://blog.csdn.net/jek123456/article/details/74171039

5. Spring Cloud Eureka

https://xujin.org/categories/Spring-Cloud-Eureka/

6. Eureka Server之间的注册表信息同步

http://blueskykong.com/2018/02/09/eureka-instance-registry/

7. Eureka 源码解析

http://www.iocoder.cn/categories/Eureka/?github