restatedev · jackkleeman · Oct 7, 2024 · Oct 3, 2024 · Oct 4, 2024 · Oct 7, 2024
diff --git a/crates/local-cluster-runner/examples/two_nodes_and_metadata.rs b/crates/local-cluster-runner/examples/two_nodes_and_metadata.rs
@@ -25,7 +25,7 @@ async fn main() {
     let nodes = Node::new_test_nodes_with_metadata(
         base_config,
         BinarySource::CargoTest,
-        enum_set!(Role::Admin | Role::Worker),
+        enum_set!(Role::Worker),
         2,
     );
 

diff --git a/crates/local-cluster-runner/src/cluster/mod.rs b/crates/local-cluster-runner/src/cluster/mod.rs
@@ -52,6 +52,8 @@ fn default_cluster_name() -> String {
 pub enum ClusterStartError {
     #[error("Failed to start node {0}: {1}")]
     NodeStartError(usize, NodeStartError),
+    #[error("Admin node is not healthy after waiting 60 seconds")]
+    AdminUnhealthy,
     #[error("Failed to create cluster base directory: {0}")]
     CreateDirectory(io::Error),
     #[error("Failed to create metadata client: {0}")]
@@ -86,11 +88,17 @@ impl Cluster {
         );
 
         for (i, node) in nodes.into_iter().enumerate() {
-            started_nodes.push(
-                node.start_clustered(base_dir.as_path(), &cluster_name)
-                    .await
-                    .map_err(|err| ClusterStartError::NodeStartError(i, err))?,
-            )
+            let node = node
+                .start_clustered(base_dir.as_path(), &cluster_name)
+                .await
+                .map_err(|err| ClusterStartError::NodeStartError(i, err))?;
+            if node.admin_address().is_some() {
+                // admin nodes are needed for later nodes to bootstrap. we should wait until they are serving
+                if !node.wait_admin_healthy(Duration::from_secs(30)).await {
+                    return Err(ClusterStartError::AdminUnhealthy);
+                }
+            }
+            started_nodes.push(node)
         }
 
         Ok(StartedCluster {

diff --git a/crates/local-cluster-runner/src/node/mod.rs b/crates/local-cluster-runner/src/node/mod.rs
@@ -137,7 +137,7 @@ impl Node {
     }
 
     // Creates a group of Nodes with a single metadata node "metadata-node", and a given number
-    //  of other nodes ["node-1", ..] each with the provided roles. Node name, roles,
+    // of other nodes ["node-1", ..] each with the provided roles. Node name, roles,
     // bind/advertise addresses, and the metadata address from the base_config will all be overwritten.
     pub fn new_test_nodes_with_metadata(
         base_config: Configuration,
@@ -148,18 +148,22 @@ impl Node {
         let mut nodes = Vec::with_capacity((size + 1) as usize);
 
         {
+            let mut base_config = base_config.clone();
+            base_config.common.allow_bootstrap = true;
             nodes.push(Self::new_test_node(
                 "metadata-node",
-                base_config.clone(),
+                base_config,
                 binary_source.clone(),
                 enum_set!(Role::Admin | Role::MetadataStore),
             ));
         }
 
         for node in 1..=size {
+            let mut base_config = base_config.clone();
+            base_config.common.allow_bootstrap = false;
             nodes.push(Self::new_test_node(
                 format!("node-{node}"),
-                base_config.clone(),
+                base_config,
                 binary_source.clone(),
                 roles,
             ));

diff --git a/server/tests/cluster.rs b/server/tests/cluster.rs
@@ -16,7 +16,7 @@ async fn node_id_mismatch() {
     let nodes = Node::new_test_nodes_with_metadata(
         base_config.clone(),
         BinarySource::CargoTest,
-        enum_set!(Role::Admin | Role::Worker),
+        enum_set!(Role::Worker),
         1,
     );
 
@@ -64,7 +64,7 @@ async fn cluster_name_mismatch() {
     let nodes = Node::new_test_nodes_with_metadata(
         base_config.clone(),
         BinarySource::CargoTest,
-        enum_set!(Role::Admin | Role::Worker),
+        enum_set!(Role::Worker),
         1,
     );