Merge pull request #1102 from AI-Hypercomputer:fhzhang/rampup

PiperOrigin-RevId: 708497751
AI-Hypercomputer · Dec 21, 2024 · 6ec3368 · 6ec3368
2 parents 834b778 + 1df6662
commit 6ec3368
Show file tree

Hide file tree

Showing 3 changed files with 7 additions and 2 deletions.
diff --git a/MaxText/configs/base.yml b/MaxText/configs/base.yml
@@ -456,6 +456,8 @@ inference_microbenchmark_stages: "prefill,generate"
 inference_microbenchmark_loop_iters: 10
 inference_microbenchmark_log_file_path: ""
 inference_metadata_file: "" # path to a json file
+inference_server: "MaxtextInterleavedServer"  # inference server to start
+inference_benchmark_test: False
 enable_model_warmup: False
 
 # Stack prefill cache across the layer to reduce the

diff --git a/MaxText/max_utils.py b/MaxText/max_utils.py
@@ -219,6 +219,9 @@ def maybe_initialize_jax_distributed_system(raw_keys):
 
   For CPUs, we call jax.distributed.initialize() explicitly, with the specified arguments.
   """
+  if raw_keys["inference_benchmark_test"]:
+    # Disable initialization for inference benmark test.
+    return
   if raw_keys["compile_topology"]:
     # Don't initialize jax distributed with AOT compilation
     return
@@ -531,7 +534,7 @@ def create_device_mesh(config, devices=None):
   if devices is None:
     devices = jax.devices()
   num_devices = len(devices)
-  num_slices = config.num_slices
+  num_slices = 1 if config.inference_benchmark_test else config.num_slices
   num_devices_per_slice = num_devices // num_slices
 
   multi_slice_env = num_slices > 1

diff --git a/MaxText/maxengine_server.py b/MaxText/maxengine_server.py
@@ -37,7 +37,7 @@
 def main(config):
   # No devices for local cpu test. A None for prefill and a None for generate.
   devices = server_lib.get_devices()
-  server_config = maxengine_config.get_server_config("MaxtextInterleavedServer", config)
+  server_config = maxengine_config.get_server_config(config.inference_server, config)
 
   metrics_server_config: config_lib.MetricsServerConfig | None = None
   if config.prometheus_port != 0: