vllm-project · weireweire · Nov 11, 2025 · gemini-code-assist · Nov 7, 2025
@@ -397,7 +397,12 @@ def schedule(self) -> SchedulerOutput:
             while self.waiting and token_budget > 0:
                 if len(self.running) == self.max_num_running_reqs:
                     break
-
+                if len(scheduled_resumed_reqs) + len(scheduled_new_reqs) >= max(
+                    1,
+                    self.max_num_running_reqs
+                    // self.parallel_config.pipeline_parallel_size,
+                ):
+                    break
-                if len(scheduled_resumed_reqs) + len(scheduled_new_reqs) >= max(
-                    1,
-                    self.max_num_running_reqs
-                    // self.parallel_config.pipeline_parallel_size,
-                ):
-                    break
+                pp_size = self.parallel_config.pipeline_parallel_size
+                if pp_size <= 0:
+                    raise ValueError(
+                        "pipeline_parallel_size must be positive, but is "
+                        f"{pp_size}")
+
+                limit = max(1, self.max_num_running_reqs // pp_size)
+                if len(scheduled_resumed_reqs) + len(scheduled_new_reqs) >= limit:
+                    break
-                if len(scheduled_resumed_reqs) + len(scheduled_new_reqs) >= max(
-                    1,
-                    self.max_num_running_reqs
-                    // self.parallel_config.pipeline_parallel_size,
-                ):
-                    break
+                pp_size = self.parallel_config.pipeline_parallel_size
+                if pp_size <= 0:
+                    raise ValueError(
+                        "pipeline_parallel_size must be positive, but is "
+                        f"{pp_size}")
+
+                limit = max(1, self.max_num_running_reqs // pp_size)
+                if len(scheduled_resumed_reqs) + len(scheduled_new_reqs) >= limit:
+                    break
                 request = self.waiting.peek_request()
 
                 # KVTransfer: skip request if still waiting for remote kvs.